P- 값은 귀무 가설이 참이라고 가정 할 때 관찰 된 것 이상으로 검정 통계량을 얻을 확률을 정의합니다. 다시 말해,
그러나 검정 통계량이 분포에서 양봉이면 어떻게됩니까? p- 값이이 맥락에서 어떤 의미입니까? 예를 들어, R에서 일부 바이 모달 데이터를 시뮬레이션하려고합니다.
set.seed(0)
# Generate bi-modal distribution
bimodal <- c(rnorm(n=100,mean=25,sd=3),rnorm(n=100,mean=100,sd=5))
hist(bimodal, breaks=100)
그리고 검정 통계량 60을 관찰한다고 가정 해 봅시다. 그리고 여기서 우리 는이 값이 매우 드물다는 것을 그림에서 알 수 있습니다 . 그래서 이상적으로, 나는 이것을 밝히기 위해 사용하는 통계 절차 (예 : p- 값)를 원할 것입니다. 그러나 정의 된 p- 값을 계산하면 꽤 높은 p 값을 얻습니다.
observed <- 60
# Get P-value
sum(bimodal[bimodal >= 60])/sum(bimodal)
[1] 0.7991993
분포를 몰랐다면, 내가 관찰 한 것은 단순히 우연의 기회라는 결론을 내릴 것입니다. 그러나 우리는 이것이 사실이 아니라는 것을 알고 있습니다.
내가 가진 의문은 다음과 같습니다. 왜 p- 값을 계산할 때 관측 된 “적어도 극한”값에 대한 확률을 계산합니까? 그리고 위에서 시뮬레이션 한 것과 같은 상황이 발생하면 대체 솔루션은 무엇입니까?
답변
검정 통계량을 “극단적”으로 만드는 것은 샘플 공간에 순서 (또는 적어도 부분적 순서)를 부과하는 대안에 따라 다릅니다. 테스트 통계에 의해 측정되는 의미에서 가장 일관된 사례를 거부하려고합니다. 대안.
당신이 정말로하지 않는 경우 가 당신에게, 당신은 본질적으로 순서를 부여 할 가능성이 남아있어 대부분 일치 될 수있는 무언가를 제공 할 수있는 대안을 가장 자주 피셔의 정확한 시험에서 볼. 여기서 null 아래의 결과 확률 (2×2 테이블)은 검정 통계량을 정렬합니다 ( ‘극단’은 ‘낮은 확률’입니다).
바이 모달 널 분포의 맨 왼쪽 (또는 맨 오른쪽 또는 둘 다)이 관심있는 대안의 종류와 관련이있는 경우 테스트 통계량 60을 거부하지 않습니다. 당신은 당신이 그런 대안을 가지지 않는 상황에 처해 있다면, 60 은 좋지 않습니다 -그것은 가능성이 낮습니다; 값 60은 모델 과 일치하지 않으므로 거부 할 수 있습니다.
[이것은 Fisherian과 Neyman-Pearson 가설 검정의 한 가지 주요 차이점으로 볼 수 있습니다. 명시적인 대안과 가능성 의 비율 을 도입함으로써 null 아래의 가능성이 낮다고해서 반드시 Neyman-Pearson 프레임 워크 (거의 대안에 비해 상대적으로 잘 수행되는 한)에서 거부 할 필요는 없습니다. 당신은 실제로 대안이 없으며, 널 (NULL) 아래의 가능성은 당신이 관심있는 것입니다.]
나는 여기서 어떤 접근 방식이 옳고 그른지를 제안하지는 않는다. 당신은 어떤 대안이 특정 대안이든, 아니면 널 (null) 아래에서 충분하지 않은 어떤 대안에 대해 당신이 권력을 추구하는 어떤 종류의 대안을 스스로 스스로 해결해야한다. 원하는 것을 알고 나면 나머지 부분 ( ‘최소한 극단적 인 것’의 의미 포함)이 그로부터 거의 뒤 따릅니다.