나는의 확장보고 싶은 이 논의 범위를 조금 확대, 오래된 카이 제곱 대 피셔의 정확한 테스트 논쟁을. 우발 사고 테이블에는 상호 작용에 대한 많은 테스트가있어서 머리를 돌리기에 충분합니다. 어떤 테스트를 언제 사용해야하는지에 대한 설명과 한 테스트가 다른 테스트보다 선호되어야하는 이유에 대한 설명을 얻고 싶습니다.
내 현재의 문제는 고전적인 사례이지만 적어도 진행 방법이 분명하지 않은 경우 R에서 다양한 솔루션을 구현하기위한 팁과 같이 더 높은 차원에 대한 답변을 환영합니다.
아래에 내가 아는 모든 테스트가 나열되어 있습니다. 내 오류를 수정하여 수정할 수 있기를 바랍니다.
-
. 이전 대기 여기에는 세 가지 주요 옵션이 있습니다.
- 2×2 테이블에 대해 R에 내장 된 수정 사항 : “반이 모든 차이 에서 뺍니다 .” 나는 항상 이것을해야합니까?
- ” ” χ 2 테스트, R에서이 작업을 수행하는 방법을 잘 모르겠습니다.
- 몬테카를로 시뮬레이션. 이것이 항상 최고입니까? 내가 이것을 할 때 R이 왜 df를 제공하지 않습니까?
- 2×2 테이블에 대해 R에 내장 된 수정 사항 : “반이 모든 차이 에서 뺍니다 .” 나는 항상 이것을해야합니까?
-
- 어떤 셀이 4보다 작을 것으로 예상되면 전통적으로 조언을 받았지만 분명히 일부 조언에 이의가 있습니다.
- 한계 값이 고정되었다고 가정하는 (보통 거짓) 가정이 실제로이 테스트에서 가장 큰 문제입니까?
-
- 내가 들어 본 적이없는 다른 정확한 테스트.
-
포아송 회귀
- glms에 대해 항상 혼란스러워하는 한 가지는이 중요성 테스트를 수행하는 방법과 정확히 일치하므로 도움이 될 것입니다. 중첩 모델 비교를 수행하는 것이 가장 좋습니까? 특정 예측 변수에 대한 Wald 검정은 어떻습니까?
- 정말 항상 포아송 회귀 분석을 수행해야합니까? 이 시험 과 시험 의 실제 차이점은 무엇입니까 ?
답변
좋은 질문이지만 큰 질문입니다. 나는 완전한 답을 줄 수는 없다고 생각하지만 생각할만한 음식을 버리겠다.
먼저, 맨 위의 글 머리 기호 아래에서 참조하는 수정을 Yates의 연속성 수정 이라고 합니다 . 문제는 불연속 추론 통계량을 계산한다는 것입니다 .
(우연성 표에 유한 한 수의 인스턴스 만 표시되므로이 통계가 취할 수있는 유한 한 수의 실현 가능한 값이 있기 때문에 불연속적입니다.)이 사실에도 불구하고, 이는연속참조 분포와 비교됩니다(즉,자유도(r–1)를갖는χ2분포(c–1
). 이것은 반드시 어떤 수준에서 불일치로 이어집니다. 특히 작은 데이터 세트의 경우 일부 셀의 예상 값이 5보다 작 으면 p- 값이 너무 작을 수 있습니다. 예이츠의 수정이 이에 맞게 조정됩니다.
아이러니하게도 동일한 근본적인 문제 (불연속 불일치)가 p- 값이 너무 높을 수 있습니다. 구체적으로 p- 값은 일반적 으로 극단적이거나 그 이상인 데이터를 얻을 확률로 정의됩니다.관찰 된 데이터보다. 지속적인 데이터를 사용하면 정확한 값을 얻을 확률이 거의 없기 때문에 데이터의 확률이 훨씬 더 높아집니다. 그러나 이산 데이터를 사용하면 자신과 마찬가지로 데이터를 얻을 가능성이 유한합니다. 데이터를 사용자보다 더 극단적으로 얻을 확률 만 계산하면 공칭 p- 값이 너무 낮아 (타입 I 오류 증가), 데이터를 사용자와 동일하게 얻을 확률을 포함하면 공칭 p- 값이 너무 높아집니다 (이로 인해 유형 II 오류가 증가합니다). 이러한 사실은 p- 값 중간 . 이 접근법에서 p- 값은 데이터보다 절반이 더 많을 확률이 절반입니다 데이터 확률은 귀하와 동일합니다.
지적했듯이 우발 사태 테이블 데이터를 테스트 할 가능성은 많습니다. 다양한 접근 방식의 장단점을 가장 포괄적으로 다루는 것은 여기에 있습니다 . 이 백서는 2×2 테이블에만 적용되지만 비상 테이블 데이터를 읽어 옵션을 통해 많은 정보를 얻을 수 있습니다.
또한 모델을 진지하게 고려할 가치가 있다고 생각합니다. 카이 제곱과 같은 오래된 테스트는 많은 사람들이 빠르고 쉽고 이해하기 쉬우나 적절한 모델을 구축 할 때 얻을 수있는 데이터에 대한 포괄적 인 이해를 제공하지는 않습니다. 우발성 테이블의 행 [열]을 반응 변수로 생각하고 열 [행]을 설명 / 예측 변수로 생각하는 것이 합리적이라면 모델링 방법은 아주 쉽게 따릅니다. 예를 들어, 행이 두 개인 경우 로지스틱 회귀 분석 모델을 . 여러 열이있는 경우 참조 셀 코딩 (더미 코딩)을 사용하여 ANOVA 유형 모델을 작성할 수 있습니다. 반면에 행이 두 개 이상인 경우 다항 로지스틱 회귀 을 동일한 방식으로 사용할 수 있습니다. 행에 본질적인 순서, 순서 로지스틱 회귀 분석이있는 경우 는 다항식보다 우수한 성능을 제공합니다. 로그 선형 모델 (Poisson regression)은 내 생각에 2 차원 이상의 우발성 테이블이 없다면 적절하지 않을 것입니다.
이와 같은 주제를 종합적으로 다루기 위해 가장 좋은 출처는 Agresti의 저서입니다. 그의 본격적인 대우 (보다 엄격한), 서적 서적 (더 쉽지만 여전히 포괄적이며 매우 좋음) 또는 서수 서적 입니다.
답변
본인의 관점에서 최대한 귀하의 질문 중 일부를 해결하려고 노력할 것입니다. 먼저 Fisher-Irwin Test는 Fisher의 정확한 테스트의 또 다른 이름입니다. 때로는 계산적으로 강렬하다는 사실을 제외하고는 일반적으로 Fisher 테스트를 사용하는 것을 선호합니다. 이 테스트에 문제가있는 경우 한계 총계에 대한 조정입니다. 이 테스트의 장점은 귀무 가설 하에서 관측 된 테이블과 동일한 한계 계수를 갖는 우발성 테이블 세트에 초기 하 분포가 있다는 것입니다. 일부 사람들은 동일한 총계가있는 테이블에 대한 고려를 제한한다는 이론적 근거를 보지 못한다고 주장합니다.
Pearson의 카이 제곱 검정은 우발성 표의 연관성을 검정하는 데 매우 일반적으로 사용됩니다. 다른 많은 테스트와 마찬가지로 근사치이므로 유의 수준이 항상 정확한 것은 아닙니다. Cochran은 일부 세포가 매우 드문 경우 (예 : 일부 세포에서 5 개 미만의 경우를 포함) 작은 표본에서 근사치가 나쁘다는 것을 보여주었습니다.
다른 많은 대략적인 테스트가 있습니다. 일반적으로 SAS를 사용하여 Fisher의 테스트를 적용 할 때 이러한 모든 테스트에서 결과를 얻으며 일반적으로 거의 동일한 결과를 제공합니다. 그러나 Fisher의 검정은 항상 한계 총계에 대한 정확한 조건입니다.
포아송 회귀와 관련하여 범주 형 변수를 셀 총계와 관련시키는 모형입니다. 다른 모델과 마찬가지로 일련의 가정에 의존합니다. 가장 중요한 것은 셀 개수가 포아송 분포를 따르는 것입니다. 즉, 평균 개수는 분산과 같습니다. 일반적으로 셀 수 분포에는 해당되지 않습니다. 과대 산포 (평균보다 큰 분산)의 경우 음 이항 모델이 더 적합 할 수 있습니다.