태그 보관물: regression

regression

일반화 선형 모형의 가정 정수임)로 일반화 된 선형

단일 응답 변수 (연속 / 정규 분포)와 4 개의 설명 변수 (3 개는 요인이고 4 번째는 정수임)로 일반화 된 선형 모델을 만들었습니다. ID 링크 함수와 함께 가우스 오류 분포를 사용했습니다. 현재 모델이 일반화 선형 모델의 가정을 충족하는지 확인하고 있습니다.

  1. Y의 독립
  2. 올바른 링크 기능
  3. 설명 변수의 정확한 측정 척도
  4. 영향력있는 관찰 없음

내 질문은 : 모델이 이러한 가정을 충족시키는 지 어떻게 확인할 수 있습니까? 가장 좋은 시작점은 각 설명 변수에 대한 응답 변수를 그리는 것 같습니다. 그러나 설명 변수 중 3 개는 범주 형 (1-4 수준)이므로 플롯에서 무엇을 찾아야합니까?

또한 설명 변수 간의 다중 공선 성과 상호 작용을 확인해야합니까? 그렇다면 범주 설명 변수를 사용하여 어떻게해야합니까?



답변

나는 이것을 일반화 선형 모델 로 생각하는 것은 과잉 이라고 생각 합니다. 당신이 가진 것은 평범한 오래된 회귀 모델입니다. 더 구체적으로, 일부 설명 적 변수가 있고 지속적인 EV가 있지만 이들 사이에 상호 작용이 없기 때문에이를 고전적인 ANCOVA라고도합니다.

여기서 # 3은 실제로 여러분이 걱정해야하는 가정이 아니라고 말할 것입니다. 또한, 그 문제에 대해서는 # 2에 대해 정말로 걱정할 필요가 없습니다. 대신, 나는 이것을 두 가지 다른 가정으로 대체 할 것입니다.

2 ‘. 분산의 동질성
3 ‘. 잔차의 정규성

또한 # 4는 확인해야 할 중요한 사항이지만 실제로 는 그 자체를 가정 으로 생각하지 않습니다 . 가정을 어떻게 확인할 수 있는지 생각해 봅시다.

독립성 은 종종 데이터의 의미와 수집 방법에 대해 생각 함으로써 종종 ‘확인’됩니다 . 또한 테스트 , Durbin-Watson 테스트 또는 자기 상관 패턴 검사 등을 사용하여 확인할 수 있습니다 . 부분 자기 상관 도 볼 수 있습니다 . (이는 연속 공변량에 대해서만 평가할 수 있습니다.)

에프미디엄엑스

. (이 테스트는 위와 달리 범주 공변량에 적용될 수 있습니다.) 연속 EV의 경우 연속 공변량에 대해 잔차를 플로팅하고 시각적으로 검사하여 한쪽 또는 다른쪽으로 더 퍼져 있는지 확인하고 싶습니다.

잔차정규성은 Shapiro-Wilk 또는 Kolmogorov-Smirnov 테스트 와 같은 일부 테스트를 통해 평가할 수 있지만 종종 qq-lot을 통해 시각적으로 가장 잘 평가 됩니다. (이 가정은 일반적으로 세트 에서 가장 중요하지 않습니다. 설정이 충족되지 않으면 베타 추정치는 여전히 편중되지 않지만 p- 값은 정확하지 않습니다.)

개별 관측치 의 영향 을 평가하는 몇 가지 방법이 있습니다 . 이것을 색인하는 숫자 값을 얻을 수는 있지만, 내가 좋아하는 방법은 데이터를 jackknife하는 것입니다. 즉, 각 데이터 포인트를 차례로 삭제하고 모델을 다시 맞 춥니 다. 그런 다음 관측치가 데이터 세트의 일부가 아닌 경우 베타가 얼마나 많이 반송되는지 확인할 수 있습니다. 이 측정을 dfbeta 라고 합니다 . 여기에는 약간의 프로그래밍이 필요하지만 소프트웨어가 자동으로 계산할 수있는 표준 방법이 있습니다. 여기에는 레버리지쿡 거리가 포함 됩니다.

와이

“설명 변수의 정확한 측정 척도”와 관련하여 Steven의 측정 수준 (예 : 범주 형, 순서 형, 간격 및 비율)을 참조하도록하겠습니다 . 실현하기 위해 제일 먼저 할 (GLIM의 포함) 회귀 방법입니다 하지 설명 변수에 대한 가정을 대신, 당신은 당신의 모델에 설명 변수를 사용하는 방식은 반영 신념 그들에 대해합니다. 또한, 나는 Steven의 수준이 과장된 것으로 생각하는 경향이있다. 해당 주제에 대한보다 이론적 인 처리는 여기를 참조 하십시오 .


답변