ํƒœ๊ทธ ๋ณด๊ด€๋ฌผ: hypothesis-testing

hypothesis-testing

๊ฐ€์„ค ๊ฒ€์ •์— ์„ ํ˜• ํšŒ๊ท€ ๊ณ„์ˆ˜๋ฅผ ํ…Œ์ŠคํŠธํ•˜๋Š” ๋ฐ T ๋ถ„ํฌ๊ฐ€ ์‚ฌ์šฉ๋˜๋Š” ์ด์œ ๋Š” ๋ฌด์—‡์ž…๋‹ˆ๊นŒ? ๊ณ„์ˆ˜์˜ ์ค‘์š”์„ฑ์„

์‹ค์ œ๋กœ ์„ ํ˜• ํšŒ๊ท€ ๊ณ„์ˆ˜์˜ ์ค‘์š”์„ฑ์„ ํ™•์ธํ•˜๊ธฐ ์œ„ํ•ด ํ‘œ์ค€ T- ๊ฒ€์ •์„ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์ด ์ผ๋ฐ˜์ ์ž…๋‹ˆ๋‹ค. ๊ณ„์‚ฐ์˜ ์—ญํ•™์ด ๋‚˜์—๊ฒŒ ์˜๋ฏธ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.

์„ ํ˜• ํšŒ๊ท€ ๊ฐ€์„ค ๊ฒ€์ •์— ์‚ฌ์šฉ๋˜๋Š” ํ‘œ์ค€ ๊ฒ€์ • ํ†ต๊ณ„๋Ÿ‰์„ ๋ชจ๋ธ๋งํ•˜๋Š” ๋ฐ T- ๋ถ„ํฌ๋ฅผ ์‚ฌ์šฉํ•  ์ˆ˜์žˆ๋Š” ์ด์œ ๋Š” ๋ฌด์—‡์ž…๋‹ˆ๊นŒ? ํ‘œ์ค€ ํ…Œ์ŠคํŠธ ํ†ต๊ณ„ ์—ฌ๊ธฐ์„œ๋Š” ๋‹ค์Œ์„ ์ฐธ์กฐํ•ฉ๋‹ˆ๋‹ค.

ํ‹ฐ0=ฮฒ^โˆ’ฮฒ0์—์Šค์ด์žํ˜•(ฮฒ^)



๋‹ต๋ณ€

์šฐ๋ฆฌ๋Š” t- ๋ถ„ํฌ๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ์ด์œ ๋ฅผ ์ดํ•ดํ•˜๋ ค๋ฉด ๊ธฐ๋ณธ ๋ฐฐํฌ ๋ฌด์—‡์ธ์ง€ ์•Œ ํ•„์š”๊ฐ€ ฮฒ ์™€ ์‚ฌ๊ฐํ˜•์˜ ์ž”๋ฅ˜ ํ•ฉ (์˜ R S S ๋‹น์‹ ์—๊ฒŒ t- ๋ถ„ํฌ๋ฅผ ์ค„ ๊ฒƒ์ด๋‹ค์ด ๋‘ ๋„ฃ์–ด ํ•จ๊ป˜ ๊ฐ™์€).

ฮฒ^

์•„๋ฅด ์žํ˜•์—์Šค์—์Šค

์‰ฌ์šด ๋ถ€๋ถ„์˜ ๋ถ„ํฌ ฮฒ ์ •๊ทœ ๋ถ„ํฌ ์ธ โ€“ ๋ฉ”๋ชจ๋ฅผ ํ‘œ์‹œํ•˜๋Š” ฮฒ = ( X T X ) โ€“ 1 X T Y ๋Š”์˜ ์„ ํ˜• ํ•จ์ˆ˜์ด๋‹ค๋˜๋„๋ก Y ์—ฌ๊ธฐ์„œ Y ~ N ( X ฮฒ , ฯƒ 2 I n ) . ๊ทธ ๊ฒฐ๊ณผ ๋˜ํ•œ ์ผ๋ฐ˜์  ๋ถ„ํฌ ฮฒ ~ N ( ฮฒ , ฯƒ (2) ( X T X ) โ€“

ฮฒ^

ฮฒ^

(์—‘์Šคํ‹ฐ์—‘์Šค)โˆ’1์—‘์Šคํ‹ฐ์™€์ด

์™€์ด

์™€์ดโˆผ์—”(์—‘์Šคฮฒ,ฯƒ2๋‚˜๋Š”์—”)

โ€“ ๋‹น์‹ ์˜ ๋ถ„ํฌ ํŒŒ์ƒ ๋„์›€์ด ํ•„์š”ํ•˜๋ฉด ์•Œ๋ ค ฮฒ๋ฅผ .

ฮฒ^โˆผN(ฮฒ,ฯƒ2(XTX)โˆ’1)

ฮฒ^

๋˜ํ•œ . ์—ฌ๊ธฐ์„œ n ์€ ๊ด€์ธก์น˜ ์ˆ˜์ด๊ณ  p ๋Š” ํšŒ๊ท€ ๋ถ„์„์— ์‚ฌ์šฉ ๋œ ๋งค๊ฐœ ๋ณ€์ˆ˜ ์ˆ˜์ž…๋‹ˆ๋‹ค. ์ด๊ฒƒ์˜ ์ฆ๊ฑฐ๋Š” ์กฐ๊ธˆ ๋” ๋ณต์žกํ•˜์ง€๋งŒ ํŒŒ์ƒํ•˜๊ธฐ๋„ ๊ฐ„๋‹จํ•ฉ๋‹ˆ๋‹ค ( RS๊ฐ€ ์นด์ด ์ œ๊ณฑ ์‹œ๊ฐ„ np๋ฅผ ๋ถ„๋ฐฐํ•˜๋Š” ์ด์œ ๋Š” ์—ฌ๊ธฐ์— ์žˆ์Šต๋‹ˆ๋‹ค ).

RSSโˆผฯƒ2ฯ‡nโˆ’p2

n

p

์ด ์ ๊นŒ์ง€ ๋‚ด๊ฐ€ ๋‹ค ํ–‰๋ ฌ / ๋ฒกํ„ฐ ํ‘œ๊ธฐ๋กœ ๊ฐ„์ฃผํ–ˆ์ง€๋งŒ, ๋‹จ์ˆœ ์‚ฌ์šฉํ•˜์ž ์ตœ๋Œ€ ฮฒ ๋‚ด๊ฐ€ ํ•˜๊ณ  ์ •๊ทœ ๋ถ„ํฌ๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ์šฐ๋ฆฌ๋ฅผ ์ค„ ๊ฒƒ์ด๋‹ค
: ฮฒ ๋‚œ โ€“ ฮฒ ๋‚œ์„

ฮฒ^i

ฮฒ^iโˆ’ฮฒiฯƒ(XTX)iiโˆ’1โˆผN(0,1)

๋˜ํ•œ, ์˜ ์นด์ด ์ œ๊ณฑ ๋ถ„ํฌ์—์„œ ์šฐ๋ฆฌ๋Š” ๋‹ค์Œ์„ ๊ฐ–์Šต๋‹ˆ๋‹ค :
( n โˆ’ p ) s 2

RSS

(nโˆ’p)s2ฯƒ2โˆผฯ‡nโˆ’p2

์ด๊ฒƒ์€ ๋‹จ์ˆœํžˆ ์ฒซ ๋ฒˆ์งธ ์นด์ด ์ œ๊ณฑ ํ‘œํ˜„์˜ ์žฌ๋ฐฐ์น˜์˜€์œผ๋ฉฐ

N(0,1)

s2=RSSnโˆ’p

ฯƒ2

tnโˆ’p

ฯ‡2(s)/s

ฮฒ^iโˆ’ฮฒis(XTX)iiโˆ’1โˆผtnโˆ’p

s(XTX)iiโˆ’1=SE(ฮฒ^i)

๋ง์ด๋˜๋Š”์ง€ ์•Œ๋ ค์ฃผ์„ธ์š”.


๋‹ต๋ณ€

๋Œ€๋‹ต์€ ์‹ค์ œ๋กœ ๋งค์šฐ ๊ฐ„๋‹จํ•ฉ๋‹ˆ๋‹ค. t- ๋ถ„ํฌ๋Š”์ด ๋ชฉ์ ์„ ์œ„ํ•ด ํŠน๋ณ„ํžˆ ์„ค๊ณ„ ๋˜์—ˆ๊ธฐ ๋•Œ๋ฌธ์— ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.

๋‰˜์•™์Šค๋Š” ์„ ํ˜• ํšŒ๊ท€๋ฅผ ์œ„ํ•ด ํŠน๋ณ„ํžˆ ์„ค๊ณ„๋˜์ง€ ์•Š์•˜๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๊ฑฐ์…‹ came up with distribution of sample that was drawn from the population. For instance, you draw a sample

์—‘์Šค1,์—‘์Šค2,โ€ฆ,์—‘์Šค์—”

, and calculate its mean

์—‘์Šคยฏ=โˆ‘๋‚˜๋Š”=1์—”์—‘์Šค๋‚˜๋Š”/์—”

. ํ‘œ๋ณธ ํ‰๊ท ์˜ ๋ถ„ํฌ๋Š” ๋ฌด์—‡์ž…๋‹ˆ๊นŒ

์—‘์Šคยฏ

?

์‹ค์ œ (์ธ๊ตฌ) ํ‘œ์ค€ ํŽธ์ฐจ๋ฅผ ์•Œ๊ณ  ์žˆ๋‹ค๋ฉด

ฯƒ

๊ทธ๋Ÿฌ๋ฉด ๋ณ€์ˆ˜๊ฐ€

ฮพ=(์—‘์Šคยฏโˆ’ฮผ)์—”/ฯƒ

ํ‘œ์ค€ ์ •๊ทœ ๋ถ„ํฌ์—์„œ

์—”(0,1)

. ๋ฌธ์ œ๋Š” ์ผ๋ฐ˜์ ์œผ๋กœ ๋ชจ๋ฅด๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค

ฯƒ

์„ ์ถ”์ • ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

ฯƒ^

. ๊ทธ๋ž˜์„œ Gosset์€ ๋‹น์‹ ์ด ๋Œ€์ฒด ํ•  ๋•Œ ๋ถ„ํฌ๋ฅผ ์•Œ์•„ ๋ƒˆ์Šต๋‹ˆ๋‹ค.

ฯƒ

์™€

ฯƒ^

๋ถ„๋ชจ์—์„œ, ๊ทธ๋ฆฌ๊ณ  ๋ฐฐํฌํŒ์€ ์ด์ œ ๊ทธ์˜ ์˜์‚ฌ โ€œํ•™์ƒ tโ€์— ๋”ฐ๋ผ ํ˜ธ์ถœ๋ฉ๋‹ˆ๋‹ค.

์„ ํ˜• ํšŒ๊ท€ ๊ธฐ์ˆ ์€ ํ‘œ์ค€ ์˜ค์ฐจ๋ฅผ ์ถ”์ • ํ•  ์ˆ˜์žˆ๋Š” ์ƒํ™ฉ์œผ๋กœ ์ด์–ด์ง‘๋‹ˆ๋‹ค.

ฯƒ^ฮฒ

๊ณ„์ˆ˜ ์ถ”์ •์น˜

ฮฒ^

๊ทธ๋Ÿฌ๋‚˜ ์šฐ๋ฆฌ๋Š” ์ง„์‹ค์„ ๋ชจ๋ฅธ๋‹ค

ฯƒ

๋”ฐ๋ผ์„œ ํ•™์ƒ t ๋ถ„ํฌ๋„ ์—ฌ๊ธฐ์— ์ ์šฉ๋ฉ๋‹ˆ๋‹ค.


๋‹ต๋ณ€