누군가 Clopper-Pearson CI 이외의 직관에 대한 비율을 설명 할 수 있는지 궁금합니다.
내가 아는 한 모든 CI에는 차이가 있습니다. 그러나 비율의 경우 비율이 0 또는 1 (0 % 또는 100 %) 인 경우에도 Clopper-Pearson CI를 계산할 수 있습니다. 수식을 보려고 시도했는데 이항 분포의 백분위 수를 갖는 것으로 이해하고 CI를 찾는 데 반복이 포함된다는 것을 알고 있지만, 누군가가 “단순 단어”또는 최소한의 수학으로 논리와 합리성을 설명 할 수 있을지 궁금했습니다. ?
답변
분산에 대한 표현식을 포함하는 신뢰 구간에 익숙하다고 가정하면 모집단을 특징 짓는 두 매개 변수 (평균 및 분산)에 대한 정보가 표본으로 요약되는 가우시안 사례를 생각하게됩니다. 평균 및 표본 분산. 표본 평균은 모집단 평균을 추정하지만 그렇게하는 정밀도는 표본 분산에 의해 차례로 추정 된 모집단 분산에 따라 달라집니다. 반면 이항 분포는 하나의 매개 변수 (각 개별 시행에서 성공할 확률)와이 매개 변수에 대한 샘플에서 제공 한 모든 정보가 총계로 요약됩니다. 수많은 독립적 인 시도에서 성공. 모집단 분산과 평균은 모두이 매개 변수에 의해 결정됩니다.
이항 확률 질량 함수와 직접 작동 하는 매개 변수 대한 Clopper-Pearson 95 % (예 🙂 신뢰 구간을 얻을 수 있습니다 . 번의 시행 중 번의 성공 을 관찰한다고 가정합니다 . pmf는x n
πx
n
증가 의 확률까지 당신의 상한 것 : 이하의 성공 2.5 %로 떨어진다. 감소 의 확률까지 당신의 하한이다 : 이상의 성공이 2.5 %까지로 떨어진다. (실제로 읽지 못하는 경우이 작업을 실제로 시도하는 것이 좋습니다.) 여기서 수행하는 것은 null 가정으로 취했을 때 값을 찾는 것입니다. 5 %의 유의 수준에서 양측 검정. 장기적 으로이 방법으로 계산 된 경계 는 시간의 95 % 이상이 무엇이든간에 의 실제 값을 포괄합니다 .
πx
π
x
π
π