gee Archives - How IT

로짓 링크를 사용하여 3 수준의 불균형 데이터에서 GEE를 실행하고 있습니다. 혼합 효과 (GLMM) 및 로짓 링크가있는 GLM과 이것이 어떻게 다른지 (내가 그릴 수있는 결론과 계수의 의미 측면에서) 어떻게 다릅니 까?

자세한 내용은 단일 베르누이 시험입니다. 그들은 교실과 학교로 묶여 있습니다. R의 경우. NA의 Casewise 생략. 6 개의 예측 변수도 상호 작용 항입니다.

(나는 아이들이 착륙했는지 확인하기 위해 뒤집지 않습니다.)

계수를 확률 비로 지수화하는 경향이 있습니다. 이것은 둘 다에 동일한 의미가 있습니까?

GEE 모델의 “마진 적 수단”에 대해 마음 속에 숨어있는 것이 있습니다. 나에게 그 비트를 설명해야합니다.

감사.

답변

계수 해석의 관점에서, 이진 경우에 차이가 있습니다 (다른 것들 중에서). GEE와 GLMM의 차이점은 추론 의 대상입니다 : 인구 평균 또는 주제별 .

당신과 관련된 간단한 구성 예를 생각해 봅시다. 학교에서 남학생과 여학생 간의 실패율을 모델링하려고합니다. 대부분의 (초등) 학교와 마찬가지로 학생들의 인구는 교실로 나뉩니다. 당신은 바이너리 응답 관찰 에서 어린이 교실 (예 : 교실에 의해 클러스터 이진 응답), 학생의 경우 교실에서이 전달 및 그 / 그녀가 실패합니다. 그리고 학생의 경우 교실에서 다른 남성과 0. $Y$

와이

$Y$ $n_{i}$

엔_{나는}

$n_i$ $N$

엔

$N$ $\sum_{i = 1}^{N} n_{i}$

\sum_{나는 = 1}^{엔} 엔_{나는}

$\sum_{i=1}^{N}n_{i}$ $Y_{i j} = 1$

{와이}_{나는 j} = 1

$Y_{ij}=1$ $j$

j

$j$ $i$

나는

$i$ $Y_{i j} = 0$

{와이}_{나는 j} = 0

$Y_{ij}=0$ $x_{i j} = 1$

{엑스}_{나는 j} = 1

$x_{ij} =1$ $j$

j

$j$ $i$

나는

$i$

첫 번째 단락에서 사용한 용어를 가져 오기 위해 학교를 인구 로, 교실을 주제 로 생각할 수 있습니다 .

먼저 GLMM을 고려하십시오. GLMM은 혼합 효과 모델에 적합합니다. 고정 설계 매트릭스 (이 경우 성별에 대한 가로 채기 및 표시기로 구성됨)의 모델 조건과 모델에 포함하는 교실 간의 임의의 영향. 이 예에서 이제 임의의 절편을 포함 할 수 계정으로 교실 중 실패율의 기준 차이를 취할 것입니다. 모델링하고 있습니다 $b_{i}$

비_{나는}

$b_i$

$\log (\frac{P (Y_{i j} = 1)}{P (Y_{i j} = 0)} ∣ x_{i j}, b_{i}) = β_{0} + β_{1} x_{i j} + b_{i}$

로그 (\frac{피 ({와이}_{나는 j} = 1)}{피 ({와이}_{나는 j} = 0)} ∣ {엑스}_{나는 j}, 비_{나는}) = β_{0} + β_{1} {엑스}_{나는 j} + 비_{나는}

$\log \left(\frac{P(Y_{ij}=1)}{P(Y_{ij}=0)}\mid x_{ij}, b_i\right)=\beta_0+\beta_1 x_{ij} + b_i$

위의 모델에서 실패 확률의 확률 은 교실마다 다른 의 값에 따라 다릅니다 . 따라서 추정치는 주제에 따라 다릅니다 . $b_{i}$

비_{나는}

$b_i$

반면에 GEE는 한계 모델에 적합합니다. 이 모형 인구 평균 . 고정 설계 행렬에서만 조건을 예상하여 모델링합니다.

$\log (\frac{P (Y_{i j} = 1)}{P (Y_{i j} = 0)} ∣ x_{i j}) = β_{0} + β_{1} x_{i j}$

로그 (\frac{피 ({와이}_{나는 j} = 1)}{피 ({와이}_{나는 j} = 0)} ∣ {엑스}_{나는 j}) = β_{0} + β_{1} {엑스}_{나는 j}

$\log \left(\frac{P(Y_{ij}=1)}{P(Y_{ij}=0)}\mid x_{ij}\right)=\beta_0+\beta_1 x_{ij}$

이것은 위에서 설명한 고정 디자인 매트릭스와 랜덤 효과에 대한 혼합 효과 모델과 대조적입니다. 따라서 위의 한계 모델을 통해 “교실 간의 차이를 잊어 버릴 수 있습니다. 저는 인구 (학교 수준)의 실패율과 성별과의 연관성을 원합니다.” 모형을 적합시키고 성별과 관련된 모집단 평균 실패 확률 비율 인 승산 비율을 얻습니다 .

따라서 GEE 모델의 추정치가 GLMM 모델의 추정치와 다를 수 있으며 이는 동일한 것을 추정하지 않기 때문입니다.

(지수를 지수화하여 log-odds-ratio에서 odds-ratio로 변환하는 한, 인구 수준 또는 주제별 추정치에 관계없이 수행합니다)

참고 사항 / 문학 :

선형 사례의 경우 모집단 평균과 주제별 추정치가 동일합니다.

Zeger 등 1988 은 로지스틱 회귀 분석에서

$β_{M} \approx {[{(\frac{16 \sqrt{3}}{15 π})}^{2} V + 1]}^{- 1 / 2} β_{R E}$

β_{엠} \approx {[{(\frac{16 \sqrt{삼}}{15 π})}^{2} V + 1]}^{- 1 / 2} β_{아르 자형 이자형}

$\beta_M\approx \left[ \left(\frac{16\sqrt{3}}{15\pi }\right)^2 V+1\right]^{-1/2}\beta_{RE}$

$β_{M}$

β_{엠}

$\beta_M$ $β_{R E}$

β_{아르 자형 이자형}

$\beta_{RE}$ $V$

V

$V$

Molenberghs, Verbeke 2005 에는 한계 대 임의 효과 모델에 대한 전체 장이 있습니다.

나는 Diggle, Heagerty, Liang, Zeger 2002를 기반으로 한 과정에서 이것과 관련 자료에 대해 배웠습니다 .

How IT

언제든지 물어보세요.

태그 보관물: gee

일반화 된 추정 방정식과 GLMM의 차이점은 무엇입니까? 수있는 결론과 계수의 의미 측면에서) 어떻게

답변

답변