로짓 링크를 사용하여 3 수준의 불균형 데이터에서 GEE를 실행하고 있습니다. 혼합 효과 (GLMM) 및 로짓 링크가있는 GLM과 이것이 어떻게 다른지 (내가 그릴 수있는 결론과 계수의 의미 측면에서) 어떻게 다릅니 까?
자세한 내용은 단일 베르누이 시험입니다. 그들은 교실과 학교로 묶여 있습니다. R의 경우. NA의 Casewise 생략. 6 개의 예측 변수도 상호 작용 항입니다.
(나는 아이들이 착륙했는지 확인하기 위해 뒤집지 않습니다.)
계수를 확률 비로 지수화하는 경향이 있습니다. 이것은 둘 다에 동일한 의미가 있습니까?
GEE 모델의 “마진 적 수단”에 대해 마음 속에 숨어있는 것이 있습니다. 나에게 그 비트를 설명해야합니다.
감사.
답변
계수 해석의 관점에서, 이진 경우에 차이가 있습니다 (다른 것들 중에서). GEE와 GLMM의 차이점은 추론 의 대상입니다 : 인구 평균 또는 주제별 .
당신과 관련된 간단한 구성 예를 생각해 봅시다. 학교에서 남학생과 여학생 간의 실패율을 모델링하려고합니다. 대부분의 (초등) 학교와 마찬가지로 학생들의 인구는 교실로 나뉩니다. 당신은 바이너리 응답 관찰 에서 어린이 교실 (예 : 교실에 의해 클러스터 이진 응답), 학생의 경우 교실에서이 전달 및 그 / 그녀가 실패합니다. 그리고 학생의 경우 j는 교실에서 내가 다른 남성과 0.N I N Σ N 난 = 1 N 나 Y의 I의 J = 1 J 나 Y의 I의 J = 0 X I J = 1
첫 번째 단락에서 사용한 용어를 가져 오기 위해 학교를 인구 로, 교실을 주제 로 생각할 수 있습니다 .
먼저 GLMM을 고려하십시오. GLMM은 혼합 효과 모델에 적합합니다. 고정 설계 매트릭스 (이 경우 성별에 대한 가로 채기 및 표시기로 구성됨)의 모델 조건과 모델에 포함하는 교실 간의 임의의 영향. 이 예에서 이제 임의의 절편을 포함 할 수 계정으로 교실 중 실패율의 기준 차이를 취할 것입니다. 모델링하고 있습니다
위의 모델에서 실패 확률의 확률 은 교실마다 다른 의 값에 따라 다릅니다 . 따라서 추정치는 주제에 따라 다릅니다 .
반면에 GEE는 한계 모델에 적합합니다. 이 모형 인구 평균 . 고정 설계 행렬에서만 조건을 예상하여 모델링합니다.
이것은 위에서 설명한 고정 디자인 매트릭스와 랜덤 효과에 대한 혼합 효과 모델과 대조적입니다. 따라서 위의 한계 모델을 통해 “교실 간의 차이를 잊어 버릴 수 있습니다. 저는 인구 (학교 수준)의 실패율과 성별과의 연관성을 원합니다.” 모형을 적합시키고 성별과 관련된 모집단 평균 실패 확률 비율 인 승산 비율을 얻습니다 .
따라서 GEE 모델의 추정치가 GLMM 모델의 추정치와 다를 수 있으며 이는 동일한 것을 추정하지 않기 때문입니다.
(지수를 지수화하여 log-odds-ratio에서 odds-ratio로 변환하는 한, 인구 수준 또는 주제별 추정치에 관계없이 수행합니다)
참고 사항 / 문학 :
선형 사례의 경우 모집단 평균과 주제별 추정치가 동일합니다.
Zeger 등 1988 은 로지스틱 회귀 분석에서
Molenberghs, Verbeke 2005 에는 한계 대 임의 효과 모델에 대한 전체 장이 있습니다.
나는 Diggle, Heagerty, Liang, Zeger 2002를 기반으로 한 과정에서 이것과 관련 자료에 대해 배웠습니다 .