이 질문에 답하면서 John Christie는 로지스틱 회귀 모형의 적합도를 잔차를 평가하여 평가해야한다고 제안했습니다. OLS의 잔차를 해석하는 방법에 익숙합니다. DV와 같은 척도에 있으며 모형에서 예측 한 y와 y의 차이가 매우 명확합니다. 그러나 로지스틱 회귀 분석의 경우 과거에는 로지스틱 회귀 분석에서 잔차가 무엇을 의미하는지 알지 못했기 때문에 일반적으로 AIC와 같은 모형 적합도 추정치를 살펴 보았습니다. R의 도움말 파일 을 조금 살펴본 후 R에는 5 가지 유형의 glm 잔차가 있음을 알 수 있습니다 c("deviance", "pearson", "working","response", "partial")
. 도움말 파일은 다음을 참조합니다.
- Davison, AC 및 Snell, EJ (1991) 잔류 및 진단. 에서 : 통계 이론 및 모델링. FRS의 데이비드 콕스 경의 명예에 이어 . Hinkley, DV, Reid, N. 및 Snell, EJ, Chapman & Hall.
사본이 없습니다. 이러한 각 유형을 해석하는 방법을 설명하는 간단한 방법이 있습니까? 로지스틱 맥락에서 제곱 잔차의 합은 의미있는 모형 적합도를 제공합니까? 아니면 정보 기준을 사용하는 것이 더 낫습니까?
답변
로지스틱 회귀 분석은 제곱 편차 편차의 합이 최소화되도록 베타 값을 찾는 것과 유사합니다.
이것은 플롯으로 설명 할 수 있지만 업로드하는 방법을 모르겠습니다.
답변
Pearsons 잔차에서
피어슨 잔차는 관측 확률과 추정 확률의 차이를 추정 확률의 이항 표준 편차로 나눈 값입니다. 따라서 잔차를 표준화합니다. 큰 표본의 경우 표준화 잔차는 정규 분포를 가져야합니다.
스콧 메 나드 (2002). 로지스틱 회귀 분석 적용, 2 판. 캘리포니아 주 오크스 옥스 : Sage Publications. 시리즈 : 사회 과학의 정량적 적용, No. 106. First ed., 1995. 4.4 장 참조
답변
작업 잔차는 반복 가중 최소 자승법의 최종 반복 잔차입니다 . 모델 실행의 마지막 반복을 생각할 때 잔차를 의미한다고 생각합니다. 그것은 모델 러닝이 반복적 인 운동이라는 토론을 야기 할 수 있습니다.