์ค์ ๋ก ์ ํ ํ๊ท ๊ณ์์ ์ค์์ฑ์ ํ์ธํ๊ธฐ ์ํด ํ์ค T- ๊ฒ์ ์ ์ฌ์ฉํ๋ ๊ฒ์ด ์ผ๋ฐ์ ์ ๋๋ค. ๊ณ์ฐ์ ์ญํ์ด ๋์๊ฒ ์๋ฏธ๊ฐ ์์ต๋๋ค.
์ ํ ํ๊ท ๊ฐ์ค ๊ฒ์ ์ ์ฌ์ฉ๋๋ ํ์ค ๊ฒ์ ํต๊ณ๋์ ๋ชจ๋ธ๋งํ๋ ๋ฐ T- ๋ถํฌ๋ฅผ ์ฌ์ฉํ ์์๋ ์ด์ ๋ ๋ฌด์์ ๋๊น? ํ์ค ํ ์คํธ ํต๊ณ ์ฌ๊ธฐ์๋ ๋ค์์ ์ฐธ์กฐํฉ๋๋ค.
๋ต๋ณ
์ฐ๋ฆฌ๋ t- ๋ถํฌ๋ฅผ ์ฌ์ฉํ๋ ์ด์ ๋ฅผ ์ดํดํ๋ ค๋ฉด ๊ธฐ๋ณธ ๋ฐฐํฌ ๋ฌด์์ธ์ง ์ ํ์๊ฐ ฮฒ ์ ์ฌ๊ฐํ์ ์๋ฅ ํฉ (์ R S S ๋น์ ์๊ฒ t- ๋ถํฌ๋ฅผ ์ค ๊ฒ์ด๋ค์ด ๋ ๋ฃ์ด ํจ๊ป ๊ฐ์).
ฮฒ^์๋ฅด ์ํ์์ค์์ค
์ฌ์ด ๋ถ๋ถ์ ๋ถํฌ ฮฒ ์ ๊ท ๋ถํฌ ์ธ โ ๋ฉ๋ชจ๋ฅผ ํ์ํ๋ ฮฒ = ( X T X ) โ 1 X T Y ๋์ ์ ํ ํจ์์ด๋ค๋๋๋ก Y ์ฌ๊ธฐ์ Y ~ N ( X ฮฒ , ฯ 2 I n ) . ๊ทธ ๊ฒฐ๊ณผ ๋ํ ์ผ๋ฐ์ ๋ถํฌ ฮฒ ~ N ( ฮฒ , ฯ (2) ( X T X ) โ
ฮฒ^ฮฒ^
(์์คํฐ์์ค)โ1์์คํฐ์์ด
์์ด
์์ดโผ์(์์คฮฒ,ฯ2๋๋์)
โ ๋น์ ์ ๋ถํฌ ํ์ ๋์์ด ํ์ํ๋ฉด ์๋ ค ฮฒ๋ฅผ .
ฮฒ^โผN(ฮฒ,ฯ2(XTX)โ1)ฮฒ^
๋ํ . ์ฌ๊ธฐ์ n ์ ๊ด์ธก์น ์์ด๊ณ p ๋ ํ๊ท ๋ถ์์ ์ฌ์ฉ ๋ ๋งค๊ฐ ๋ณ์ ์์ ๋๋ค. ์ด๊ฒ์ ์ฆ๊ฑฐ๋ ์กฐ๊ธ ๋ ๋ณต์กํ์ง๋ง ํ์ํ๊ธฐ๋ ๊ฐ๋จํฉ๋๋ค ( RS๊ฐ ์นด์ด ์ ๊ณฑ ์๊ฐ np๋ฅผ ๋ถ๋ฐฐํ๋ ์ด์ ๋ ์ฌ๊ธฐ์ ์์ต๋๋ค ).
RSSโผฯ2ฯnโp2n
p
์ด ์ ๊น์ง ๋ด๊ฐ ๋ค ํ๋ ฌ / ๋ฒกํฐ ํ๊ธฐ๋ก ๊ฐ์ฃผํ์ง๋ง, ๋จ์ ์ฌ์ฉํ์ ์ต๋ ฮฒ ๋ด๊ฐ ํ๊ณ ์ ๊ท ๋ถํฌ๋ฅผ ์ฌ์ฉํ๋ ์ฐ๋ฆฌ๋ฅผ ์ค ๊ฒ์ด๋ค
: ฮฒ ๋ โ ฮฒ ๋์
๋ํ, ์ ์นด์ด ์ ๊ณฑ ๋ถํฌ์์ ์ฐ๋ฆฌ๋ ๋ค์์ ๊ฐ์ต๋๋ค :
( n โ p ) s 2
์ด๊ฒ์ ๋จ์ํ ์ฒซ ๋ฒ์งธ ์นด์ด ์ ๊ณฑ ํํ์ ์ฌ๋ฐฐ์น์์ผ๋ฉฐ
N(0,1)s2=RSSnโp
ฯ2
tnโp ฯ2(s)/s
s(XTX)iiโ1=SE(ฮฒ^i)
๋ง์ด๋๋์ง ์๋ ค์ฃผ์ธ์.
๋ต๋ณ
๋๋ต์ ์ค์ ๋ก ๋งค์ฐ ๊ฐ๋จํฉ๋๋ค. t- ๋ถํฌ๋์ด ๋ชฉ์ ์ ์ํด ํน๋ณํ ์ค๊ณ ๋์๊ธฐ ๋๋ฌธ์ ์ฌ์ฉํฉ๋๋ค.
๋์์ค๋ ์ ํ ํ๊ท๋ฅผ ์ํด ํน๋ณํ ์ค๊ณ๋์ง ์์๋ค๋ ๊ฒ์ ๋๋ค. ๊ฑฐ์ came up with distribution of sample that was drawn from the population. For instance, you draw a sample
์์ค1,์์ค2,โฆ,์์ค์, and calculate its mean
์์คยฏ=โ๋๋=1์์์ค๋๋/์. ํ๋ณธ ํ๊ท ์ ๋ถํฌ๋ ๋ฌด์์ ๋๊น
์์คยฏ?
์ค์ (์ธ๊ตฌ) ํ์ค ํธ์ฐจ๋ฅผ ์๊ณ ์๋ค๋ฉด
ฯ๊ทธ๋ฌ๋ฉด ๋ณ์๊ฐ
ฮพ=(์์คยฏโฮผ)์/ฯํ์ค ์ ๊ท ๋ถํฌ์์
์(0,1). ๋ฌธ์ ๋ ์ผ๋ฐ์ ์ผ๋ก ๋ชจ๋ฅด๋ ๊ฒ์ ๋๋ค
ฯ์ ์ถ์ ํ ์ ์์ต๋๋ค.
ฯ^. ๊ทธ๋์ Gosset์ ๋น์ ์ด ๋์ฒด ํ ๋ ๋ถํฌ๋ฅผ ์์ ๋์ต๋๋ค.
ฯ์
ฯ^๋ถ๋ชจ์์, ๊ทธ๋ฆฌ๊ณ ๋ฐฐํฌํ์ ์ด์ ๊ทธ์ ์์ฌ โํ์ tโ์ ๋ฐ๋ผ ํธ์ถ๋ฉ๋๋ค.
์ ํ ํ๊ท ๊ธฐ์ ์ ํ์ค ์ค์ฐจ๋ฅผ ์ถ์ ํ ์์๋ ์ํฉ์ผ๋ก ์ด์ด์ง๋๋ค.
ฯ^ฮฒ๊ณ์ ์ถ์ ์น
ฮฒ^๊ทธ๋ฌ๋ ์ฐ๋ฆฌ๋ ์ง์ค์ ๋ชจ๋ฅธ๋ค
ฯ๋ฐ๋ผ์ ํ์ t ๋ถํฌ๋ ์ฌ๊ธฐ์ ์ ์ฉ๋ฉ๋๋ค.