동일하지 않은 분산에 대한 Welch t- 검정 (Welch-Satterthwaite 또는 Welch-Aspin이라고도 함)은 일반적으로 정수 가 아닌 자유도를 갖습니다 . 테스트 결과를보고 할 때 이러한 자유도를 어떻게 인용해야합니까?
다양한 소스 *에 따르면 “표준 t 테이블을 컨설팅하기 전에 가장 가까운 정수로 내림하기 위해 기존의 것입니다.”- 보수적 라운딩이 방향으로 의미가 ** 일부 오래된 통계 소프트웨어 (예 :도 이런 짓을 했을까 그래프 패드 프리즘 버전 전에 6 ) 일부 온라인 계산기는 여전히 작동합니다. 이 절차를 사용한 경우, 반올림 자유도를 보고하는 것이 적절 해 보입니다. 더 나은 소프트웨어를 사용하는 것이 더 적합 할 수도 있습니다!
그러나 현대 패키지의 대다수는 분수 부분을 사용 하므로이 경우 분수 부분을 인용해야합니다. 자유도의 천분의 일이 p- 값 에 무시할만한 영향을 미치기 때문에 소수점 이하 두 자리 이상을 인용하는 것이 적절하다는 것을 알 수 없습니다 .
Google 학자 주변을 살펴보면 df를 정수로 인용 한 논문을 소수점 이하 한 자리 또는 소수점 이하 두 자리로 인용 한 것을 볼 수 있습니다. 사용 정확도에 대한 지침이 있습니까? 소프트웨어 전체 소수부를 사용하는 경우에도, 상기 반올림 df라고 인용한다 아래 (예를 들어 도면의 원하는 개수 1 DP 또는 → 7 보수 계산을 적절한 있다는 정수 등) 나에게 더 합리적인 것 같이, 또는, (통상적으로 반올림 가장 가까운에 있도록) 7.5845 … → 7.6 1 DP하거나 → 8
7.5845…→7.5→7
7.5845…→7.6
→8
가장 가까운 정수로?
편집 : 정수가 아닌 df를보고하는 이론적으로 가장 건전한 방법을 아는 것 외에도 사람들이 실제로하는 일 을 아는 것도 좋습니다 . 아마도 저널과 스타일 가이드에는 자체 요구 사항이 있습니다. APA와 같은 영향력있는 스타일 가이드에 필요한 것이 궁금합니다. 내가 알 수있는 것 (매뉴얼은 온라인에서 자유롭게 구할 수 없음)에서 APA는 p- 값 (2 ~ 3 dp 일 수 있음)과 백분율 ( 가장 가까운 퍼센트)-회귀 기울기, t 통계, F 통계,
χ2통계 등. 이것은 소수점 이하 둘째 자리가 매우 다른 중요한 수치를 차지하고 982.47과 2.47에서 매우 다른 정밀도를 제안하지만 비과학적인 표본에서 본 소수점 이하 두 자리 로 Welch df 의 수를 설명 할 수 있음을 염두에두고 상당히 비논리적입니다. .
예 : Ruxton, GD 불일치 분산 t- 검정은 학생의 t- 검정 및 Mann-Whitney U 검정 , 행동 생태학 (2006 년 7 월 / 8 월) 17 (4) : 688-690 doi : 10.1093 / beheco / 방주 016
∗Welch-Satterthwaite 근사 자체는 보수적 일 수도 있고 보수적이지 않을 수도 있지만 보수적이지 않은 경우 자유도를 반올림한다고해서 전체적인 보상을 보장 할 수는 없습니다.
∗∗답변
나는 실제 연습을 연구하지 않았 으므로이 답변은 질문의 그 측면을 해결할 수 없습니다. 일반적인 원칙으로서 나는 자유도 (df)를보고 할 때 유효 숫자를 처리하는 것이 유효 숫자와 관련된 판단에 기초 할 것으로 기대합니다.
원칙은 일관 되어야합니다. 다른 것과 관련하여 사용되는 정밀도에 적합한 한 수량의 정밀도를 사용하십시오. 특히, x 가 작은 값 h 의 가장 가까운 배수 (예 : h = 1 ) 에 x 값을보고 할 때 및 y = f ( x )
xy=f(x)
x
h
소수점 이하 6 자리에 대해 2 ×10−6),함수f에 의해 매개되는y의 상대 정밀도
h=12×10−6y
f
는 다음과 같습니다.
가 구간 [ x – h , x + h ] 에서 연속적으로 미분 가능한 경우 근사값이 적용됩니다 .
f[x−h,x+h]
본 출원에서, 은 IS 피의 -value는, X는 자유의 도인 ν
yp
x
ν
이고,
여기서 는 Welch-Satterthwaite 통계이고 F ν 는 자유도 가 ν 인 스튜던트 t 분포 의 CDF입니다 .
tFν
t
ν
상대적으로 높은 안양를 들어 정수로 반올림 벌금 그래서 종종 소수점 첫째 자리에 변화가, (보고 정밀도 수준) 모두에서 p 값이 변경되지 것 ( H = (1) / 2 만 시간 |
νh=1/2
매우 작습니다). 통계량t의 매우 낮은 df 및 극단 값의 경우 미분 값| ∂
h|ddxf(x)|t
초과 할0.01되도록 경우 시사ν는보다 적은 하나의 소수 자리로보고되어야P자체.
|∂∂νFν(t)|0.01
ν
p
자신에 대한 참조 가장 낮은 (합리적인) DF 및 범위에 대한 파생 상품의 크기의이 표시된 등고선 플롯으로 p- 값이 낮아질 수 있기 때문에 관심을 가질 것입니다.
|t|레이블은 도함수의 밑이 10 인 로그를 나타냅니다. 따라서 간의 점 및 – ( K + 1 ) 이 플롯에서의보고 DF 변경 J에게 번째 가능성 만에보고 된 p- 값을 바꿀 소수점 이후 장소 ( J + K ) 회 이상 및 장소. 예를 들어, 당신이 P 값을 반올림하는 가정 (10) – (6) (여섯 개 소수점 장소). 통계 ν = 2.5 및 t = 8을 고려하십시오 . 이들은 근처에 위치하고 있습니다
−k−(k+1)
jth
(j+k)th
10−6
ν=2.5
t=8
−3
ν
6+(−3)=3
k
ν
4
30
ν
p
ν
답변
표준 t 테이블을 참조하기 전에 가장 가까운 정수로 내림하는 것이 일반적입니다.
규칙이 된 이유는 테이블에 정수가 아닌 df가 없기 때문입니다. 달리 할 이유가 없습니다.
이 조정은 보수적이므로 의미가 있습니다.
음, 통계는 실제로 t- 분포를 갖지 않습니다. 왜냐하면 그는 제곱 분모에 실제로 스케일 된 카이-제곱 분포가 없기 때문입니다. 특정 인스턴스에서 보수적이거나 그렇지 않을 수있는 근사치입니다. 특정 인스턴스에서 통계의 정확한 분포를 고려할 때 df를 반올림하는 것이 보수적 인 것은 아닙니다.
(보간 또는 실제로 df로 t- 분포의 숫자를 크 런칭하여?)
t- 분포의 p- 값 (cdf를 t- 통계량에 적용)은 다양한 매우 정확한 근사값으로 계산할 수 있으므로 보간보다는 효과적으로 계산됩니다.
소수점 이하 두 자리 이상을 인용하는 것이 적절하지 않습니다.
나는 동의한다.
사용 정확도에 대한 지침이 있습니까?
한 가지 가능성은 p- 값에 대한 Welch-Satterthwaite 근사가 분산 비율의 일반적인 영역에 얼마나 정확한지 조사하고 df에 제안 된 것보다 실질적으로 더 정확한 상대 인용을 인용하지 않는 것입니다. 분모 제곱의 카이 제곱은 어쨌든 카이 제곱이 아닌 것에 근사합니다.)