실제로 선형 회귀 계수의 중요성을 확인하기 위해 표준 T- 검정을 사용하는 것이 일반적입니다. 계산의 역학이 나에게 의미가 있습니다.
선형 회귀 가설 검정에 사용되는 표준 검정 통계량을 모델링하는 데 T- 분포를 사용할 수있는 이유는 무엇입니까? 표준 테스트 통계 여기서는 다음을 참조합니다.
답변
우리는 t- 분포를 사용하는 이유를 이해하려면 기본 배포 무엇인지 알 필요가 β 와 사각형의 잔류 합 (의 R S S 당신에게 t- 분포를 줄 것이다이 두 넣어 함께 같은).
β^아르 자형에스에스
쉬운 부분의 분포 β 정규 분포 인 – 메모를 표시하는 β = ( X T X ) – 1 X T Y 는의 선형 함수이다되도록 Y 여기서 Y ~ N ( X β , σ 2 I n ) . 그 결과 또한 일반적 분포 β ~ N ( β , σ (2) ( X T X ) –
β^β^
(엑스티엑스)−1엑스티와이
와이
와이∼엔(엑스β,σ2나는엔)
– 당신의 분포 파생 도움이 필요하면 알려 β를 .
β^∼N(β,σ2(XTX)−1)β^
또한 . 여기서 n 은 관측치 수이고 p 는 회귀 분석에 사용 된 매개 변수 수입니다. 이것의 증거는 조금 더 복잡하지만 파생하기도 간단합니다 ( RS가 카이 제곱 시간 np를 분배하는 이유는 여기에 있습니다 ).
RSS∼σ2χn−p2n
p
이 점까지 내가 다 행렬 / 벡터 표기로 간주했지만, 단순 사용하자 최대 β 내가 하고 정규 분포를 사용하는 우리를 줄 것이다
: β 난 – β 난을
또한, 의 카이 제곱 분포에서 우리는 다음을 갖습니다 :
( n − p ) s 2
이것은 단순히 첫 번째 카이 제곱 표현의 재배치였으며
N(0,1)s2=RSSn−p
σ2
tn−p χ2(s)/s
s(XTX)ii−1=SE(β^i)
말이되는지 알려주세요.
답변
대답은 실제로 매우 간단합니다. t- 분포는이 목적을 위해 특별히 설계 되었기 때문에 사용합니다.
뉘앙스는 선형 회귀를 위해 특별히 설계되지 않았다는 것입니다. 거셋 came up with distribution of sample that was drawn from the population. For instance, you draw a sample
엑스1,엑스2,…,엑스엔, and calculate its mean
엑스¯=∑나는=1엔엑스나는/엔. 표본 평균의 분포는 무엇입니까
엑스¯?
실제 (인구) 표준 편차를 알고 있다면
σ그러면 변수가
ξ=(엑스¯−μ)엔/σ표준 정규 분포에서
엔(0,1). 문제는 일반적으로 모르는 것입니다
σ을 추정 할 수 있습니다.
σ^. 그래서 Gosset은 당신이 대체 할 때 분포를 알아 냈습니다.
σ와
σ^분모에서, 그리고 배포판은 이제 그의 의사 “학생 t”에 따라 호출됩니다.
선형 회귀 기술은 표준 오차를 추정 할 수있는 상황으로 이어집니다.
σ^β계수 추정치
β^그러나 우리는 진실을 모른다
σ따라서 학생 t 분포도 여기에 적용됩니다.