시험 점수가 실제로 정규 분포를 따르고 있습니까? 모델링하는 데 좋을 수 있다고 말합니다. 다음

GLM에서 사용할 배포판을 배우려고 노력했으며 정규 배포판을 사용할 때 약간 혼란 스러웠습니다. 교과서의 한 부분에서 정규 분포가 시험 점수를 모델링하는 데 좋을 수 있다고 말합니다. 다음 부분에서는 자동차 보험 청구를 모델링하는 데 어떤 분포가 적합한 지 묻습니다. 이번에는 적절한 분포가 양수 값으로 만 연속적이므로 감마 또는 역 가우스가 될 것이라고 말했다. 시험 점수도 긍정적 인 값으로 만 지속될 것이라고 생각합니다. 왜 정규 분포를 사용합니까? 정규 분포가 음수 값을 허용하지 않습니까?



답변

예를 들어, 높이는 종종 정상적인 것으로 모델링됩니다. 어쩌면 남성의 키는 표준 편차가 2 인치 인 5 피트 10 정도입니다. 우리는 음의 높이가 물리적이지 않다는 것을 알고 있지만,이 모델에서 음의 높이를 관찰 할 확률은 본질적으로 0입니다. 우리는 어쨌든 충분히 근사하기 때문에 모델을 사용합니다.

모든 모델이 잘못되었습니다. 문제는 “이 모델은 여전히 ​​유용 할 수 있는가?”이며, 높이 및 테스트 점수와 같은 것을 모델링하는 경우 기술적으로 비 물리적 인 것을 허용하더라도 현상을 정상으로 모델링하는 것이 유용합니다.


답변

정규 분포가 음수 값을 허용하지 않습니까?

옳은. 상한도 없습니다.

교과서의 한 부분에서 정규 분포가 시험 점수를 모델링하는 데 좋을 수 있다고 말합니다.

그럼에도 불구하고, 이전의 진술에도 불구하고 때때로 그런 경우가 있습니다. 테스트 할 구성 요소가 많거나 너무 강하지 않은 경우 (예 : 본질적으로 수십 번 동일한 질문이 아니거나 각 부분이 이전 부분에 대한 정답을 요구하지 않음) 매우 쉽고 어렵지 않은 경우 ( 따라서 대부분의 마크는 중간 부근에 위치합니다. 그런 다음 마크는 보통 정규 분포에 의해 합리적으로 잘 추정 될 수 있습니다. 일반적인 분석이 거의 문제를 일으키지 않을 정도로 충분합니다.

우리는 그것이 정상적이지 않다는 것을 확실히 알고 있지만, 우리가 사용하는 절차의 행동이 우리의 목적에 맞아야하는 정도 (예 : 표준 오차, 신뢰 구간, 유의 수준)에 가깝다면 자동적으로 문제 가되지는 않습니다. 그리고 힘-필요한 것-우리가 기대하는 것에 가까이하십시오)

다음 부분에서는 자동차 보험 청구를 모델링하는 데 어떤 분포가 적합한 지 묻습니다. 이번에는 적절한 분포가 양수 값으로 만 연속적이므로 감마 또는 역 가우스가 될 것이라고 말했다.

그렇습니다. 그러나 그 이상은 크게 왜곡되는 경향이 있으며 평균이 커지면 변동성이 증가하는 경향이 있습니다.

차량 클레임에 대한 클레임 크기 분포의 예는 다음과 같습니다.

https://ars.els-cdn.com/content/image/1-s2.0-S0167668715303358-gr5.jpg

(Garrido, Genest & Schulz (2016)의 그림 5 : “보험 청구의 종속 주파수 및 심각도에 대한 일반화 된 선형 모델”, 보험 : 수학 및 경제, Vol 70, 9 월, p205-215. https : //www.sciencedirect. com / science / article / pii / S0167668715303358 )

이것은 전형적인 오른쪽으로 치우침과 두꺼운 오른쪽 꼬리를 보여줍니다. 그러나 이것은 한계 분포이기 때문에 매우 조심해야하며 조건부 분포에 대한 모델을 작성하고 있습니다 . 이는 일반적으로 훨씬 덜 치우칩니다 (임계 값을 혼합하여 클레임 크기의 히스토그램을 수행하는 경우 살펴 보는 한계 분포). 이러한 조건부 분포 중). 그럼에도 불구하고 예측 변수의 하위 그룹 (아마도 연속 변수 분류)에서 클레임 크기를 보면 분포가 여전히 매우 오른쪽으로 치우치고 오른쪽에 상당히 짙은 꼬리표가 감마 모델과 같은 것을 제안하는 경우입니다. 가우스 모델보다 훨씬 더 적합합니다.

가우시안보다 더 적합한 다른 분포가있을 수 있습니다. 역 가우시안은 또 다른 선택입니다. 로그 정규 또는 Weibull 모델은 GLM이 아닌 상태에서도 유용 할 수 있습니다.

[이러한 분포가 거의 완벽한 묘사 인 경우는 드물다. 그것들은 부정확 한 근사치이지만, 분석이 유용하고 원하는 특성에 가까울 정도로 많은 경우에 충분합니다.]

시험 점수도 긍정적 인 값으로 만 지속될 것이라고 생각합니다. 왜 정규 분포를 사용합니까?

(앞서 언급 한 조건-너무 의존적이지 않고 어렵거나 쉽지 않은 많은 구성 요소)에서 분포는 대칭, 단봉 형 및 두꺼운 꼬리에 상당히 가깝습니다.


답변

이항 분포로 시험 점수를 더 잘 모델링 할 수 있습니다. 매우 단순화 된 경우, 각각 1 점의 100 개의 참 / 거짓 질문이있을 수 있으므로 점수는 0과 100 사이의 정수가됩니다. 테스트 담당자의 문제와 문제의 정확성 사이의 상관 관계가 없다고 가정하는 경우 (의심스러운 가정) )에서 점수는 독립적 인 랜덤 변수의 합계이며 중앙 한계 정리가 적용됩니다. 질문 수가 증가함에 따라 올바른 문제의 일부가 정규 분포로 수렴됩니다.

0보다 작은 값에 대해 좋은 질문을합니다. 100 %보다 큰 값에 대해서도 같은 질문을 할 수 있습니다. 테스트 문제의 수가 증가함에 따라 합의 분산이 감소하므로 피크가 평균을 향해 끌어옵니다. 마찬가지로, 최적 적합 정규 분포는 분산이 더 작으며 [0, 1] 간격을 벗어난 pdf의 가중치는 항상 0이 아닌 경향이 있습니다. “fraction correct”의 가능한 값 사이의 간격도 줄어들 기 때문에 (100 개 질문의 경우 1/100, 1000 개 질문의 경우 1/1000 등) 비공식적으로 pdf는 점점 더 연속적인 pdf처럼 동작하기 시작합니다.


답변