태그 보관물: hypothesis-testing

hypothesis-testing

비모수 적 테스트는 정확히 무엇을 수행하며 결과로 무엇을합니까? 아닙니다. 비모수는 비교할 수단 대신

나는 이것이 다른 곳에서 요청되었을 수도 있지만 실제로 필요한 기본 설명 유형은 아닙니다. 비모수는 비교할 수단 대신 중간 값에 의존한다는 것을 알고 있습니다. 또한 표준 편차 대신 “자유도”(?)에 의존한다고 생각합니다. 그래도 내가 틀렸다면 정정하십시오.

나는 아주 좋은 연구를 해왔으며, 개념을 이해하려고 노력하고, 그 개념이 무엇인지, 테스트 결과가 실제로 무엇을 의미하는지, 그리고 테스트 결과로 무엇을 해야하는지 생각했습니다. 그러나 어느 누구도 그 영역에 투자하지 않는 것 같습니다.

간단하게하기 위해 Mann-Whitney U-test를 고수합시다. 제가 주목 한 것은 매우 인기가 있습니다 (또한 “정사각형 모델을 원형 구멍으로 만들기 위해 오용 및 남용 된 것 같습니다”). 다른 테스트를 자유롭게 설명하고 싶다면 자유롭게 느끼십시오. 한 번 이해하면 여러 가지 t 테스트와 비슷한 방식으로 다른 테스트를 이해할 수 있습니다.

내 데이터로 비모수 테스트를 실행 하고이 결과를 다시 얻는다고 가정 해 봅시다.

2 Sample Mann-Whitney - Customer Type

Test Information
H0: Median Difference = 0
Ha: Median Difference ≠ 0

Size of Customer    Large   Small
Count                    45    55
Median                    2     2

Mann-Whitney Statistic: 2162.00
p-value (2-sided, adjusted for ties):   0.4156

다른 방법에 익숙하지만 여기서 다른 점은 무엇입니까? p- 값이 .05보다 낮아야합니까? “맨-휘트니 통계”란 무엇을 의미합니까? 그것에 대한 사용이 있습니까? 여기서이 정보는 내가 보유하고 있거나 사용하지 않아야하는 특정 데이터 소스를 확인하거나 확인하지 않습니까?

나는 회귀와 기본에 대해 합리적인 경험을 가지고 있지만,이 “비 특수”비모수적인 것들에 대해 매우 궁금합니다.

제가 5 학년이라고 상상해 주시면 설명 해주시겠습니까?



답변

비모수는 평균이 아닌 중앙값에 의존한다는 것을 알고 있습니다.

비모수 적 테스트는 실제로 이러한 의미에서 중간 값에 의존하지 않습니다. 나는 커플에 대해서만 생각할 수 있습니다 … 그리고 당신이 아마 들어 본 것으로 예상되는 유일한 사람은 사인 테스트 일 것입니다.

비교하기 위해 … 무언가.

그들이 중앙값에 의존한다면 아마도 중앙값을 비교하는 것입니다. 그러나 많은 출처가 당신에게 말하려고 시도 함에도 불구하고-서명 된 순위 테스트, Wilcoxon-Mann-Whitney 또는 Kruskal-Wallis와 같은 테스트는 실제로 중앙값의 테스트가 아닙니다. 추가 가정을하는 경우 Wilcoxon-Mann-Whitney 및 Kruskal-Wallis를 중간 값 검정으로 간주 할 수 있지만 (분배 수단이 존재하는 한) 동일한 가정 하에서 동일하게 평균 검정법으로 간주 할 수 있습니다. .

부호있는 순위 검정과 관련된 실제 위치 추정치는 표본 내 쌍별 평균의 중앙값이며, Wilcoxon-Mann-Whitney (Kruskal-Wallis의 의미)는 표본 별 쌍별 평균의 중앙값입니다. .

또한 “자유도”에 의존한다고 생각합니다. 표준 편차 대신에. 그래도 틀렸다면 정정하십시오.

대부분의 비모수 검정에는 ‘자유도’가 없지만 표본 크기에 따른 많은 변화 분포는 표가 표본 크기에 따라 변화한다는 점에서 자유 도와 다소 유사하다고 생각할 수 있습니다. 샘플은 물론 그 속성을 유지하고 그 의미에서 n 자유도를 갖지만 테스트 통계 분포의 자유도는 일반적으로 우리가 관심있는 것이 아닙니다. 예를 들어, Kruskal-Wallis가 카이-제곱과 기본적으로 같은 의미에서 자유도를 가지고 있다는 주장을 할 수는 있지만 일반적으로 보지는 않습니다. 그런 식으로 (예를 들어 누군가가 Kruskal-Wallis의 자유도에 대해 이야기하는 경우 거의 항상 df를 의미합니다.

자유도에 대한 좋은 토론은 여기 에서 찾을 수 있습니다 /

나는 아주 좋은 연구를 해왔고, 개념을 이해하려고 노력하고, 그 개념이 무엇인지, 테스트 결과가 실제로 무엇을 의미하는지, 심지어 테스트 결과로 무엇을 해야하는지 생각했습니다. 그러나 아무도 그 영역에 뛰어 들지 않는 것 같습니다.

나는 이것이 무엇을 의미하는지 잘 모르겠습니다.

Conover ‘s Practical Nonparametric Statistics 와 같은 일부 책을 제안 할 수 있으며, 얻을 수 있다면 Neave and Worthington의 책 ( Distribution-Free Tests )이 있지만 Marascuilo & McSweeney, Hollander & Wolfe 또는 Daniel의 책과 같은 책이 많이 있습니다. 나는 당신에게 가장 잘 말하는 것 중 적어도 3 개 또는 4 개, 바람직하게는 다른 것을 설명하는 것들을 읽는 것이 좋습니다. (적어도 3 개나 7 개 정도의 책을 읽는 것이 적합하다고 말할 수 있습니다.)

단순화를 위해 Mann Whitney U 테스트를 계속 사용하도록하겠습니다.

그것은 “아무도 그 지역에 모험을 한 적이없는 것 같다”는 당신의 말에 대해 당황한 것입니다.이 시험을 사용하는 많은 사람들이 당신이 말한 ‘지역으로의 모험’을합니다.

-또한 겉으로는 잘못 사용되고 남용 된 것 같습니다

나는 비모수 테스트는 일반적으로 말할 것 활용도가 낮은 경우 (윌 콕슨 – 맨 – 휘트니 포함) 아무것도 – 심지어 내가 반드시 분쟁들이 자주 오용있는 것이다 (하지만 너무 파라미터 테스트는하지만 대부분의 특히 순열 / 무작위 검사, 더).

내 데이터로 비모수 테스트를 실행 하고이 결과를 다시 얻는다고 가정 해 봅시다.

[한조각]

다른 방법에 익숙하지만 여기서 다른 점은 무엇입니까?

다른 방법은 무엇입니까? 이것을 무엇과 비교하기를 원하십니까?

편집 : 나중에 회귀에 대해 언급합니다. 그렇다면 당신은 2- 표본 t- 검정에 익숙하다고 가정합니다 (실제로 특별한 회귀 분석이기 때문에).

일반적인 2- 표본 t- 검정에 대한 가정 하에서 귀무 가설은 분포 중 하나가 이동 한 대안에 대해 두 모집단이 동일하다는 것입니다. 아래의 Wilcoxon-Mann-Whitney에 대한 두 가지 가설 중 첫 번째를 보면, 테스트되는 기본 사항은 거의 동일합니다. 단지 t- 검정은 샘플이 동일한 정규 분포에서 나온다고 가정합니다 (위치 이동이 가능한 경우 제외). 귀무 가설이 참이고 수반되는 가정이 참이면 검정 통계량에는 t- 분포가 있습니다. 대립 가설이 참이면 검정 통계량은 귀무 가설과 일치하지 않지만 대안과 일치하는 값을 취할 가능성이 높아집니다.

상황은 Wilcoxon-Mann-Whitney와 매우 유사하지만 null과의 편차를 약간 다르게 측정합니다. 실제로, t- 검정의 가정이 사실 * 인 경우, 가능한 최상의 검정 (t- 검정)만큼이나 좋습니다.

* (실제로는 결코 들리지 않지만 실제로는 큰 문제가 아닙니다)

널과 대안의 밑에 wmw

실제로 Wilcoxon-Mann-Whitney는 데이터의 등급에 대해 수행 된 “t- 검정”으로 효과적으로 간주 할 수 있지만 t- 분포는 없습니다. 통계량은 데이터 순위에서 계산 된 2- 표본 t- 통계량의 단조 함수이므로 표본 공간에서 동일한 순서 ** (즉, 순위에서 “t- 검정”)를 유도합니다. Wilcoxon-Mann-Whitney와 동일한 p- 값을 생성하므로 정확히 동일한 경우를 거부합니다.

** (엄격히, 부분적인 주문이지만, 따로 남겨 두자)

[순위를 사용하는 것만으로도 많은 정보를 버릴 것이라고 생각할 수 있지만, 데이터가 동일한 분산을 갖는 일반 모집단에서 가져온 경우 위치 이동에 대한 거의 모든 정보가 순위 패턴에 있습니다. 실제 데이터 값 (순위에 따라 다름)은 추가 정보를 거의 추가하지 않습니다. 평상시보다 무겁다면 Wilcoxon-Mann-Whitney 검정이 더 나은 검정력을 갖기까지, 그리고 명목상의 유의 수준을 유지하기까지 늦지 않습니다. 따라서 순위 이상의 ‘추가’정보는 결국 정보가 아닌 정보가됩니다. 오해의 소지가 있습니다. 그러나 거의 대칭적인 두꺼운 꼬리는 드문 상황입니다. 실제로 자주 보는 것은 왜도입니다.]

기본 아이디어는 상당히 유사합니다. p- 값은 해석이 동일합니다 (귀무 가설이 참인 경우 결과의 확률 또는 더 극단적 일 경우). 필요한 가정 (이 게시물의 끝 부분에 대한 가설에 대한 논의 참조).

t- 테스트에 대해 위의 플롯에서와 동일한 시뮬레이션을 수행하면 플롯이 매우 유사하게 보입니다 .x 축 및 y 축의 스케일은 다르게 보이지만 기본 모양은 비슷합니다.

p- 값이 .05보다 낮아야합니까?

거기에 “원하는 것”이 ​​없어야합니다. 아이디어는 샘플이 특정 결과를 ‘소망’하지 않고 우연히 설명 할 수있는 것보다 위치 감지가 더 다른지 알아내는 것입니다.

내가 말한다면 “당신은 색상 주권의 차를 바랍니다 무엇인지 볼 갈 수 있을까?”, 나는 그것의 공정한 평가를 원한다면 난 당신이 남자, 정말, 정말 푸른 희망 “가고 싶지 않아! 그것은 단지 될 푸른”. ‘나는 무언가가 필요하다’고 생각하기보다는 상황이 무엇인지 보는 것이 가장 좋습니다.

선택한 유의 수준이 0.05이면 p- 값이 0.05 미만일 때 귀무 가설을 기각합니다. 그러나 샘플 크기가 크면 관련 효과 크기를 거의 항상 감지 할 수있을 때 거부하지 않는 것은 존재하는 차이가 적기 때문에 적어도 흥미 롭습니다.

“맨 위 틀리”숫자는 무엇을 의미합니까?

Mann-Whitney 통계 .

귀무 가설이 참일 때 취할 수있는 값의 분포와 비교할 때 실제로 의미가 있습니다 (위의 다이어그램 참조). 특정 프로그램에서 사용할 수있는 몇 가지 특정 정의에 따라 다릅니다.

그것에 대한 사용이 있습니까?

일반적으로 정확한 값은 신경 쓰지 않지만 null 분포에있는 위치 (널 가정이 참인지 또는 더 극단적인지 여부에 대해 일반적인 값인지 여부)

(엑스<와이)

여기서이 데이터는 내가 보유하고 있거나 사용하지 않아야하는 특정 데이터 소스를 확인하거나 확인하지 않습니까?

이 테스트는 "내가 가지고 있거나 사용해서는 안되는 특정 데이터 소스"에 대해 아무 말도하지 않습니다.

아래 WMW 가설을 보는 두 가지 방법에 대한 나의 논의를보십시오.

나는 회귀와 기본에 대한 합리적인 경험을 가지고 있지만,이 "비 특수"비모수적인 것들에 대해 매우 궁금합니다.

가설 검정을 실제로 이해하는 한 비모수 검정에 대해서는 특별히 특별한 것은 없습니다 ( '표준'시험은 일반적인 모수 검정보다 훨씬 더 기본적이라고 말하고 싶습니다).

그러나 그것은 아마도 다른 질문에 대한 주제 일 것입니다.


Wilcoxon-Mann-Whitney 가설 검정을 보는 두 가지 주요 방법이 있습니다.

i) 하나는 "위치 이동에 관심이 있습니다. 즉, 귀무 가설 하에서 두 모집단은 동일한 (연속) 분포를 가지지 만 , 하나는 다른"

Wilcoxon-Mann-Whitney는 이러한 가정을한다면 매우 효과적입니다 (대안이 단지 위치 이동이라는 것)

이 경우, Wilcoxon-Mann-Whitney는 실제로 중간 값에 대한 검정입니다. 그러나 마찬가지로 평균에 대한 검정이나 다른 위치 등가 통계량 (예 : 90 번째 백분위 수 또는 트림 된 수단 또는 임의의 수)에 대한 검정입니다. 위치 이동에 의해 모두 동일한 방식으로 영향을 받기 때문에 다른 것).

이것에 대한 좋은 점은 해석하기가 매우 쉽고이 위치 이동에 대한 신뢰 구간을 생성하기 쉽다는 것입니다.

위치 이동

그러나 Wilcoxon-Mann-Whitney 테스트는 위치 이동과는 다른 종류의 차이에 민감합니다.

12

12

1/2에서 P (X <Y)로 이동


답변

당신과 내가 트랙 팀을 코치한다고 가정 해보십시오. 우리 운동 선수는 같은 학교에서 왔으며 나이가 비슷하고 성별이 동일합니다 (예 : 같은 인구에서 추첨 됨). 그러나 나는 팀원이보다 빠르게 달리는 혁신적인 새로운 훈련 시스템을 발견했다고 주장합니다. 당신 것. 그것이 실제로 작동한다는 것을 어떻게 확신시킬 수 있습니까?

레이스가 있습니다.

그 후, 나는 앉아서 팀원의 평균 시간과 팀원의 평균 시간을 계산합니다. 선수들의 평균 시간이 당신의 평균 시간보다 빠를뿐만 아니라 결과의 "산란"또는 표준 편차와 비교할 때 그 차이가 크다면 승리를 주장 할 것입니다.



"하지만 매트", "이것은 상당히 공평하지 않습니다. 우리 팀은 꽤 비슷하지만, 우연한 기회로 인해 당신은이 지역에서 가장 빠른 주자로 끝났습니다. 그는 모든 사람과 같은 리그에 있지 않습니다. 그는 실제로 자연의 괴물입니다. 그는 다음으로 가장 빠른 피니셔 3 분 전에 마무리하여 평균 시간을 많이 줄 였지만 나머지 경쟁자들은 균등하게 혼합되어 있습니다. 대신 마무리 순서를 살펴 보겠습니다. 정말 효과적입니다. 초기 피니셔는 대부분 팀원이되어야하지만, 피니시 순서가 그렇지 않으면 매우 무작위 적이어야합니다. 이것은 슈퍼 스타에게 과도한 무게를주지 않습니다! "



답변

잘못된 경우 수정을 요청했습니다. @Peter Flom의 긍정적 인 제안을 보완하기 위해이 제목 아래에 몇 가지 의견이 있습니다.

  • "비모수는 평균이 아닌 중앙값에 의존합니다": 실제로는 실제로 정의가 아닙니다. 여러 비모수 적 테스트 (예 : 카이-제곱)는 중간 값과 관련이 없습니다.

  • 표준 편차 대신 자유도에 의존합니다. 매우 혼란 스러워요. 자유도에 대한 아이디어는 표준 편차에 대한 대안이 아닙니다. 아이디어로서의 자유도는 통계에 바로 적용됩니다.

  • "내가 가지고 있거나 사용하지 않아야 할 특정 데이터 소스":이 질문은 적용한 유의성 테스트와 아무 관련이 없습니다. 이는 데이터의 하위 집합 간의 차이에 관한 것이며 중간 값의 차이로 표현됩니다.


답변

다른 테스트에서 원하는 p- 값과 동일한 것을 "원합니다".

U 통계량은 t 통계량, 승산 비, F 통계량 또는 사용자 통계와 같은 계산 결과입니다. 수식은 많은 곳에서 찾을 수 있습니다. 매우 직관적이지는 않지만 익숙해지기 전까지는 다른 테스트 통계도 아닙니다 (우리는 항상 2를 볼 수 있기 때문에 중요한 범위에있는 것으로 인식합니다).

블록 텍스트의 나머지 출력은 명확해야합니다.

비모수 적 테스트에 대한보다 일반적인 소개를 위해 @NickCox를 에코합니다. 좋은 책을 얻으십시오. 비모수는 단순히 "매개 변수 없음"을 의미합니다. 광범위한 목적을위한 많은 비모수 적 테스트 및 통계가 있습니다.


답변

에 대한 응답으로 최근에 닫은 질문 이 주소 위뿐만 아니라. 아래는 Bradley의 고전적인 Distribution-Free Statistical Tests (1968, p.15–16) 의 인용문 인데, 조금 길지만 꽤 명확한 설명입니다.

비모수 및 분포가없는 용어는 동의어가 아니며, 어느 용어도 참조하려는 통계 클래스에 대해 완전히 만족스러운 설명을 제공하지 않습니다. 분포가없는 테스트는 표본 모집단의 정확한 형태에 대한 가정이없는 테스트입니다. 정의는 상호 배타적이지 않으며 테스트는 분포가없고 모수 일 수 있습니다. 샘플링 된 인구; (b) 시험에서 실제로 사용 된 관찰-특성의 것; (c) 검정 통계량. 검정이 "무료"인 분포는 (a) 표본 모집단의 분포입니다. 그리고 그들이 즐기는 자유는 일반적으로 상대적입니다.…하지만 가정이 완전히 구체화 된 모집단을 암시 할 정도로 정교하지는 않습니다. 그 이유는 ... 매우 간단합니다. 크기는 [비모수 적] 테스트에서와 같이 사용되지 않습니다. 또한 변이의 강하게 연결된 인구 속성도 없습니다. 대신에 또한 변이의 강하게 연결된 인구 속성도 없습니다. 대신에 또한 변이의 강하게 연결된 인구 속성도 없습니다. 대신에샘플 의 charachteristics -linked 얻어진 관찰 시험 통계로 사용 informatikon을 제공한다. ... ... 모두 파라 비모수 테스트 F 형태해야 따라서 동안 관측과 연관된 분포가 완전히 알려진, 지식, 파라 경우, 따라서 요구되는 크기 분포 는 대략 또는 불완전한 정보에 기초하여 "가정"되거나 추론되어야한다. 비모수 적 경우, 다른 한편으로는 관찰 특성 의 분포일반적으로 사전 고려 사항에서 정확하게 알려져 있으므로 "가정"될 필요는 없습니다. 따라서 차이점은 요구 사항 중 하나가 아니라 요구 사항이 충족 될 것이라는 점과 요구 사항의 확실성입니다.


답변