Pearson ‘s Chi Squared Test의 작동 방식 분산입니다. 어느

최근의 다운 투표에 이어 Pearson Chi Squared 테스트에 대한 이해를 확인하려고 노력했습니다. 나는 보통 결과 제곱을 피팅하거나 확인하기 위해 카이 제곱 통계 (또는 감소 된 카이 제곱 통계)를 사용합니다. 이 경우 분산은 일반적으로 테이블 또는 히스토그램에서 예상되는 개수가 아니라 실험적으로 결정된 분산입니다. 어느 쪽이든, 나는 항상 테스트에서 다항식 PDF의 점근 적 정규성을 사용했다는 인상을 항상 받았다 (즉, 테스트 통계는

Q=(n−Nm)⊤V−1(n−Nm)

(n−Nm)

여기서 점근 multinormal이며

V

이다)의 공분산 행렬이다. 따라서

Q

n

이 큰 경우 카이 제곱 분포를 가지 므로 통계의 분모가 큰 유효 할 때 예상되는 개수를 사용합니다 . 이것은 히스토그램에만 해당 될 수 있습니다. 몇 년 동안 작은 데이터 테이블을 분석하지 않았습니다.

n

내가 놓친 더 미묘한 논쟁이 있습니까? 나는 참조에 관심이 있거나 짧은 설명이 더 좋습니다. (가능하더라도 나는 점근선이라는 단어를 생략 한 것으로 투표를 받았다.



답변

카이 제곱 검정은 범주 형 데이터를 분석하도록 설계되었습니다. 이는 데이터가 계산되어 범주로 나뉘어 졌음을 의미합니다. 파라 메트릭 또는 연속 데이터에서는 작동하지 않습니다. 따라서 모든 인스턴스에 적합한 결과를 결정하는 것은 효과가 없습니다.

출처 : http://www.ling.upenn.edu/~clight/chisquared.htm