태그 보관물: categorical-data

categorical-data

다중 카이-제곱 검정 치수를 호출 response, A하고

2 x 2 x 6 테이블에서 교차 분류 된 데이터가 있습니다. 하자가 치수를 호출 response, A하고 B. 로지스틱 회귀 분석을 모형이있는 데이터에 적합합니다 response ~ A * B. 해당 모형의 이탈도 분석에 따르면 항과 교호 작용이 모두 중요합니다.

그러나 데이터의 비율을 살펴보면 2 개 정도의 수준만 B이 중요한 영향을 미치는 것으로 보입니다 . 어느 수준이 범인인지 테스트하고 싶습니다. 지금은 2 x 2 테이블에서 6 카이 제곱 테스트를 수행 response ~ A한 다음 다중 비교를 위해 해당 테스트에서 p- 값을 조정하는 것입니다 (홀름 조정 사용).

내 질문은이 문제에 대한 더 나은 접근 방식이 있는지 여부입니다. 보다 원칙적인 모델링 접근법 또는 다중 카이 제곱 테스트 비교 접근법이 있습니까?



답변

“파티셔닝 카이 제곱”을 살펴 봐야합니다. 이는 ANOVA에서 사후 테스트를 수행하는 것과 유사합니다. 중요한 전체 테스트가 주로 특정 범주 또는 범주 그룹의 차이에 기인하는지 여부를 결정할 수 있습니다.

빠른 구글이이 프리젠 테이션을 발표했는데, 마지막에 카이 제곱을 분할하는 방법에 대해 설명합니다.

http://www.ed.uiuc.edu/courses/EdPsy490AT/lectures/2way_chi-ha-online.pdf


답변

원칙에 맞지 않는 접근법은 불균형 데이터를 버리고 모형을 다시 맞추고 반응과 A에 대한 로짓 / 조건부 승산 비가 매우 다른지 확인하는 것입니다 (B에 대한 제어). 우려 할만한 이유가 있는지 알려줍니다. B 레벨을 모으는 것도 또 다른 방법입니다. 보다 원칙적으로 Simpson의 역설을 유도하는 상대적인 비율이 걱정된다면 응답 / A에 대한 조건부 및 한계 승산 비를 살펴보고 반대 방향인지 확인할 수 있습니다.

특히 다중 비교를 피하기 위해 나에게 일어나는 유일한 것은 레벨에 걸쳐 임의의 효과를 설명하는 계층 적 모델을 사용하는 것입니다.


답변

나는 당신의 목표가 무엇인지, 왜 그들이 목표인지 정확히 알지 못합니다. 그러나 가설 검정보다는 일반적으로 예측 및 신뢰 구간에주의를 집중하는 것이 좋습니다.


답변

사후 테스트는 문제에 적합 할 수 있습니다. R의 chisqPostHoc () 함수는 카이 제곱 검정에서 모든 모집단 쌍 간의 유의 한 차이를 검정합니다. 그럼에도 불구하고 나는 그것을 사용하지 않았지만이 링크가 유용 할 수 있습니다.
https://www.rforge.net/doc/packages/NCStats/chisqPostHoc.html

또 다른 대안은 EnQuireR 패키지의 chisq.desc () 함수일 수 있습니다.


답변