비교하려는 두 그룹 (예 : 샘플)에 대한 데이터가 있지만 총 샘플 크기는 작고 (n = 29) 불균형 (n = 22 대 n = 7)입니다.
이러한 데이터는 논리적으로 수집하기가 어렵고 비용이 많이 들기 때문에 확실한 솔루션 인 ‘더 많은 데이터 수집’은 도움이되지 않습니다.
여러 가지 변수 (출발일, 도착 일, 이동 기간 등)가 측정되었으므로 여러 테스트가 있으며, 그 중 일부는 매우 다릅니다 (분산이 큰 샘플 일수록).
처음에는 동료가이 데이터에 대해 t- 검정을 실행했으며 일부는 P <0.001에서 통계적으로 유의미했으며 일부는 P = 0.069에서 유의미하지 않았습니다. 일부 샘플은 정규 분포가되었지만 다른 샘플은 분산되지 않았습니다. 일부 테스트에는 ‘동일한’분산에서 크게 벗어난 것이 포함되었습니다.
몇 가지 질문이 있습니다.
- 여기서 t- 검정이 적절합니까? 그렇지 않다면 왜? 정규성 및 분산 평등의 가정이 충족되는 검정에만 적용됩니까?
- 적합한 대안은 무엇입니까? 아마도 순열 테스트입니까?
- 동일하지 않은 분산은 제 1 종 오류를 부풀립니다. 그러나 어떻게? 작은 불균형 표본 크기가 제 1 종 오류에 어떤 영향을 미칩니 까?
답변
두 모집단의 분산이 서로 다른 경우 두 모집단의 동일한 분산을 가정하는 T- 검정은 유효하지 않으며, 표본 크기가 다르면 더 나쁩니다. 가장 작은 표본 크기가 분산이 가장 큰 표본 인 경우 테스트에서 유형 I 오류가 부풀려집니다. 반면에 Welch-Satterthwaite 버전의 t- 검정은 동일한 분산을 가정하지 않습니다. Fisher-Pitman 순열 테스트에 대해 생각할 경우 동일한 분산을 가정합니다 (낮은 p- 값에서 다른 평균을 추론하려는 경우).
당신이 생각하고 싶은 다른 것들이 많이 있습니다 :
(1) 분산이 명확하게 다른 경우 평균 간의 차이에 여전히 관심이 있습니까?
(2) p- 값보다 효과 추정값이 더 유용 할 수 있습니까?
(3) 일련의 일 변량 비교를하는 것이 아니라 데이터의 다변량 특성을 고려하고 싶습니까?
답변
첫째, Scortchi가 이미 지적했듯이 T- 검정은 데이터 분포에 대한 가정 때문에 데이터에 적합하지 않습니다.
두 번째로, 나는 T- 테스트에 대한 대안을 제안 할 것입니다. 관심사가 사실에 관한 것이라면, 두 표본의 분포가 같거나 같지 않은 경우 양면 버전의 Wilcoxon 순위 합계 검정을 사용하려고 시도 할 수도 있습니다. Wilcoxon 순위 합계 테스트는 비모수 테스트입니다. 이러한 종류의 테스트는 데이터의 기본 분포에 대해 잘 모르는 경우 특히 유용합니다.
작은 표본 크기와 큰 집단에 대한 정확한 테스트 솔루션 이 있습니다 . 또한 Wilcoxon 순위 합계 테스트를 실현 하는 R 패키지 도 있습니다 .
매개 변수가없는 테스트이며 작은 샘플 크기도 처리하므로 테스트 사례에 적합해야합니다.