최근의 다운 투표에 이어 Pearson Chi Squared 테스트에 대한 이해를 확인하려고 노력했습니다. 나는 보통 결과 제곱을 피팅하거나 확인하기 위해 카이 제곱 통계 (또는 감소 된 카이 제곱 통계)를 사용합니다. 이 경우 분산은 일반적으로 테이블 또는 히스토그램에서 예상되는 개수가 아니라 실험적으로 결정된 분산입니다. 어느 쪽이든, 나는 항상 테스트에서 다항식 PDF의 점근 적 정규성을 사용했다는 인상을 항상 받았다 (즉, 테스트 통계는
Q=(n−Nm)⊤V−1(n−Nm)
및
(n−Nm)여기서 점근 multinormal이며
V이다)의 공분산 행렬이다. 따라서
Q는
n이 큰 경우 카이 제곱 분포를 가지 므로 통계의 분모가 큰 유효 할 때 예상되는 개수를 사용합니다 . 이것은 히스토그램에만 해당 될 수 있습니다. 몇 년 동안 작은 데이터 테이블을 분석하지 않았습니다.
n내가 놓친 더 미묘한 논쟁이 있습니까? 나는 참조에 관심이 있거나 짧은 설명이 더 좋습니다. (가능하더라도 나는 점근선이라는 단어를 생략 한 것으로 투표를 받았다.
답변
카이 제곱 검정은 범주 형 데이터를 분석하도록 설계되었습니다. 이는 데이터가 계산되어 범주로 나뉘어 졌음을 의미합니다. 파라 메트릭 또는 연속 데이터에서는 작동하지 않습니다. 따라서 모든 인스턴스에 적합한 결과를 결정하는 것은 효과가 없습니다.