많은 곳에서 나는 우리가 귀무 가설을 “수락”한다고 결코 말할 수 없다는 것을 읽었습니다. 대신 우리는 귀무 가설을 “거부하지 못한다”고 말해야합니다.
그러나이 간단한 예를 통해 그 사각형이 어떻게 보이는지 알 수 없습니다. 24 시간 이내에 당뇨병을 완전히 치료해야하는 약물을 테스트한다고 가정 해 봅시다. 우리는 1000 명의 환자에게 시도하고, 약물을 복용 한 후에도 여전히 당뇨병을 앓고 있습니다.
이 약이 당뇨병을 치료하지 않는 것이 분명하지 않습니까? 즉, 우리는 귀무 가설을 받아들입니까?
나는 확실히이 약을 믿지 않을 것입니다.
귀무 가설 :이 약물은 환자에게 영향을 미치지 않습니다.
대체 가설 :이 약물은 당뇨병 치료
답변
가능성 1 : 약물은 매우 작은 영향을 미칩니다.
아마도 그것을 복용하는 사람들의 .0001 %를 치료할 것입니다. 설명한 테스트는 제안한 극적인 대안에 대한 충분한 증거가 없음을 나타냅니다.
가능성 2 :이 약물은 매우 강한 부정적인 영향을 미칩니다. (@ssdecontrol의 신용)
아마도이 약물은 효과가없고 모든 환자가 스스로 더 나아 졌을 것입니다. 그러나 약물 때문에 환자 중 아무도 회복되지 않았습니다.
사전 지식이 없으면 데이터는 이러한 가능성과 null이 참일 가능성과 일치합니다.
따라서 널을 거부하지 못한다고해서 널이 다른 가능성보다 더 사실이라는 것을 의미하지는 않습니다.
답변
여기에 좋은 대답이 있지만 핵심 문제는 어디에서나 명시 적으로 언급되지 않았습니다. 요컨대, 귀무 가설과 대립 가설의 구성이 유효하지 않습니다. 귀무 가설과 대립 가설은 상호 배타적 이어야합니다 (즉, 둘 다 참일 수는 없음). 당신의 공식은 그 기준을 충족시킵니다. 그러나 이들은 또한 전체적으로 철저 해야합니다 (즉, 그 중 하나는 사실이어야 함). 귀하의 공식이이 기준을 충족하지 않습니다.
약물이 당뇨병을 치료할 확률이 일 것이라는 귀무 가설과 약물이 당뇨병을 치료할 가능성이 가설을 가질 수는 없습니다 . 약물이 당뇨병을 치료할 확률이 라면 귀무 가설과 대립 가설이 모두 틀렸다고 상상해보십시오 . 그게 당신의 문제입니다.
프로토 타입 귀무 가설은 포인트 값입니다 (예 : 실수 라인 에서 , 또는 확률을 언급 할 때 가장 자주 이지만 이는 단지 규칙 임). 또한 경계 매개 변수 공간으로 작업중인 경우 (여기서 확률은 이내 여야 함 ) 일반적으로 한계 (예 : 또는 에있는 값을 테스트하는 것이 문제가됩니다. ). 포인트 값을 널 (거부하려는 값)로 선택한 경우, 이에 대한 증거는 얻을 수 있지만 데이터에서 증거 를 얻을 수는 없습니다 (@John의 통찰력있는 답변 참조 ). 이것을 더 이해하려면 여기에서 내 대답을 읽는 것이 도움이 될 수 있습니다.
통계 학자들은 왜 귀무 가설을 받아들이는 것과는 달리 중요하지 않은 결과가 귀무를 거부 할 수 없다는 것을 의미한다고 말합니까? 귀신이 (따라서 당신의 대안 가설이 ) 인 경우에도 그 아이디어를 상황에보다 구체적으로 적용 하기 위해 단일 환자없이 명의 환자에게 약물을 사용해 보았습니다 완치되면 귀무 가설을 받아 들일 수 없습니다. 데이터는 여전히 확률이 가능성과 일치합니다 ( 실패가없는 경우 실패 확률을 말하는 방법? ).
다른 한편으로는, 당신은하지 않습니다 이 점에 널 (null)을 가지고. 예를 들어 단측 (즉, ) 귀무 가설은 점수가 아닙니다. 그들은 무한 점의 집합입니다. 마찬가지로 범위 / 간격 가설을 가질 수도 있습니다 (예 : 매개 변수가 ). 이 경우 증거에 따라 널 (null)을 승인 할 수 있습니다. 이것이 동등성 테스트의 핵심입니다. (물론 여전히 유형 I 오류가 발생할 수 있습니다.)
답변
다른 사용자들이 언급했듯이, 귀무 가설을 받아들이는 문제는 그 효과가 정확히 0 이라는 결론을 내릴 충분한 증거가 없다는 것입니다. 수학적으로 가설 검정은 그러한 질문에 대답 할 수 없습니다. .
그러나 이것이 귀하의 질문의 의도가 유효한 것이 아님을 의미하지는 않습니다! 실제로, 이것은 일반적으로 약물 제네릭에 대한 임상 시험의 의도입니다. 목표는 귀하가보다 효과적인 약물을 생산했다는 것을 보여주는 것이 아니라, 귀하의 약물이 본질적으로 유명 브랜드만큼 효과적이라는 것입니다. 훨씬 저렴한 비용으로). 동등성은 일반적으로 귀무 가설로 간주됩니다.
가설 검정을 사용하여이 질문을 해결하기 위해 질문에 대한 답변과 같은 방식으로 질문이 재구성됩니다. 재 형식화 된 질문은 다음과 같습니다.
여기서 는 일반 효과이고 는 유명 브랜드 약품의 효과입니다. 따라서 귀무 가설을 기각하면 제네릭이 네임 브랜드만큼 효과적이라는 결론을 내릴 수 있습니다. 분명히 이것은 정확히 동등한 말 과 동일하지는 않지만 관심있는 질문 (및 수학적으로 더 합리적인 질문이라고 생각하는 방식)을 얻습니다.
비슷한 방식으로 귀하의 질문에 접근 할 수 있습니다. "우리는 효과가 0이라는 결론을 내릴 수있는 충분한 증거가 있습니까?"라고 말하기보다는 "증거가 주어 졌는데 결과가 너무 이례적이지 않은 최대 효과는 무엇입니까?"라고 물을 수 있습니다. 함께 0 성공, (피셔의 정확한 테스트를 기반으로 우리가 성공의 확률이 0.3 % 미만이라고 결론을 내릴 수있는 충분한 증거를 가지고 주장 할 수 ).
이 결과로부터, 당신은 여전히 이것이 당신이 믿는 약이 아니라는 결론을 내릴 수 있습니다.
답변
약물이 효과가 있지만 인구의 .00001 %에서만 효과가 있다고 가정하십시오. 약물은 효과가 있습니다. 통계적으로 10000 명의 표본으로 작동한다는 사실을 감지 할 확률은 무엇입니까? 100,000 명? 1,000,000 명?
답변
귀무 가설을 받아 들일 수 없다고 말하는 것은 잘못입니다. 교과서 정보를 문맥에서 벗어난 것입니다. 당신이 할 수없는 것은 그것을 받아들이 기 위해 귀무 가설 검정을 사용하는 것입니다. 검정은 가설을 기각하는 것입니다. 수락에 대한 자신의 주장은 테스트 결과와 거의 관련이 없습니다. 데이터에 관한 것입니다. 귀하의 예제에서 테스트를 전혀 실행하지 않는 것이 다소 어려울 것입니다. 데이터를 사용하여 귀무 가설을 수락한다고 주장 할 수 있습니다. 아무 문제가 없습니다. 테스트 결과를 사용하여 그렇게 할 수는 없습니다.
가설 검정을 단독으로 사용할 수없는 이유는 그렇게 설계되지 않았기 때문입니다. 교과서에서 그것을 이해하지 못하면 이해할 수 있습니다. 실제로 p- 값이 null이 true이지만 null이 true임을 나타내는 데 사용할 수없는 경우에만 실제로 의미하는 것은 흥미로운 역설입니다. 더 쉽게하려면 전력 감도를 고려하십시오. 항상 너무 적은 샘플을 수집하여 null을 거부하지 못할 수 있습니다. 그렇게 할 수 있기 때문에 테스트만으로도 null을 허용하는 유효한 이유는 아닙니다. 그러나 다시 그렇다고해서 널이 참이라고 절대 말할 수는 없습니다. 그것은 단지 테스트가 널이 참이라는 주장의 기초가 없다는 것을 의미합니다.
참고 : 거부하지 않으면 null을 허용해야한다는 Occam의 면도기 논쟁이 있습니다. 그러나 테스트는 null을 수락하도록 지시하지 않습니다. 당신이하고있는 일은 null을 기본값으로 받아들이고 테스트를 거부하지 않으면 기본 상태를 유지합니다. 따라서이 경우에도 테스트로 인해 null이 허용되지 않습니다.
답변
귀하의 의견을 통해, 나는 당신 이이 질문에 매우 관심이 있다고 생각합니다 : 왜 우리는 null 을 거부하기에 충분한 증거를 축적 할 수는 있지만 대안은 아닙니다 .
고려해야 할 매우 중요한 것은 어떤 값이 귀무 가설을 구성하는 것입니까? 귀하의 예에서는 단일 값일뿐입니다.
,
. 반대로, 대안은
.
우리는 동의 하나 모두 "합리적인 값"(우리의 신뢰 구간 내부 즉, 값이) 그 가설에 의해 주어진 범위에 완전히 떨어질 경우 가설을. 따라서 모든 합리적인 값이 0보다 크면 대안을 수락합니다. 반면에 귀무 가설은 단일 지점 0입니다! 따라서 null을 허용하려면 길이가 0 인 신뢰 구간을 가져야 합니다. (일반적으로 말하면) 길이 신뢰 구간은 다음과 같이 0에 접근합니다.
유한하지만 길이 0을 달성하지 못합니다.
추정치에 오차가 없다는 결론을 내려면 무한한 양의 데이터를 수집해야합니다.
그러나 귀무 가설을 단일 지점 이상으로 정의하는 경우 (예 :
실제로 귀무 가설을 받아 들일 수 있습니다 . 신뢰 구간이 (0.35, 0.45)라고 가정합니다. 이러한 모든 값은 귀무 가설 영역에있는 0.5 이하입니다. 이 경우 널을 승인 할 수 있습니다.
작은, 기술, 통계의 남용주의 : 하나의 점근 이론을 남용 정말 기꺼이 경우, 하나는 실제로 수 (하지만 ... 안) 귀하의 예제에서 널 (null)을 허용 : 점근 표준 오류가
. 따라서 점근 적 신뢰 구간은 (0,0)이며, 모두 귀무 가설에 속합니다. 그러나 이것은 단지 점근 적 결과를 남용합니다. 다음과 같은 경우에도 동일한 결론을 얻습니다.
= 1.
답변
나는 귀무 가설을 다루고 있다는 것을 알고 있지만 실제 문제는 주어진 예 또는 간단한 예에서 설명한 것과 같습니다. 1,000 명이 약물을 투여 받았는데 효과가 없습니다. 이 사람들이 가진 다른 질병들, 그들의 연령과 단계는 무엇입니까? 귀무 가설을 더 많은 정보를 선언하려면; 아마 자세한; 과학적인 환경에서이 작업을 수행하려면