์ด ์ฌ์ดํธ ์๋ OLS ์์ฐจ๊ฐ ์ ์ง์ ์ผ๋ก ์ ๊ท ๋ถํฌ ๋์ด ์๋์ง ํ์ธ ํ๋ ๋ฐฉ๋ฒ ์ ๋ํด ์ค๋ช ํ๋ ์ฌ๋ฌ ์ค๋ ๋๊ฐ ์์ต๋๋ค . R ์ฝ๋๋ก ์์ฐจ์ ์ ๊ท์ฑ์ ํ๊ฐํ๋ ๋ ๋ค๋ฅธ ๋ฐฉ๋ฒ์ด์ด ํ๋ฅญํ ๋ต๋ณ์ ์ ๊ณต๋ฉ๋๋ค . ์ด๊ฒ์ ํ์คํ ์์ฐจ์ ๊ด์ธก ์์ฐจ์ ์ค์ ์ ์ธ ์ฐจ์ด์ ๋ํ ๋ ๋ค๋ฅธ ๋ ผ์ ์ ๋๋ค.
๊ทธ๋ฌ๋์ด ์์ ์์์ฒ๋ผ ์์ฐจ๊ฐ ํ์คํ ์ ๊ท ๋ถํฌ๊ฐ ์๋๋ผ๊ณ ๊ฐ์ ํด ๋ด ์๋ค . ์ฌ๊ธฐ์๋ ์์ฒ ๊ฐ์ ๊ด์ธก์น๊ฐ ์์ผ๋ฉฐ ์ ๊ท ๋ถํฌ ์์ฐจ ๊ฐ์ ์ ๋ถ๋ช ํ ๊ฑฐ๋ถํด์ผํฉ๋๋ค. ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ํ ๊ฐ์ง ๋ฐฉ๋ฒ์ ๋ต๋ณ์ ์ค๋ช ๋๋๋ก ๊ฐ๋ ฅํ ํํ์ ์ถ์ ๊ธฐ๋ฅผ ์ฌ์ฉํ๋ ๊ฒ์ ๋๋ค. ๊ทธ๋ฌ๋ ๋๋ OLS์ ๊ตญํ๋์ง ์์ผ๋ฉฐ ์ค์ ๋ก ๋ค๋ฅธ glm ๋๋ ๋น์ ํ ๋ฐฉ๋ฒ๋ก ์ ์ด์ ์ ์ดํดํ๊ณ ์ถ์ต๋๋ค.
์์ฐจ์ OLS ์ ๊ท์ฑ ๊ฐ์ ์ ์๋ฐํ๋ ๋ฐ์ดํฐ๋ฅผ ๋ชจ๋ธ๋งํ๋ ๊ฐ์ฅ ํจ์จ์ ์ธ ๋ฐฉ๋ฒ์ ๋ฌด์์ ๋๊น? ๋๋ ์ ์ด๋ ์ฌ๋ฐ๋ฅธ ํ๊ท ๋ถ์ ๋ฐฉ๋ฒ๋ก ์ ๊ฐ๋ฐํ๊ธฐ์ํ ์ฒซ ๋ฒ์งธ ๋จ๊ณ๋ ๋ฌด์์ ๋๊น?
๋ต๋ณ
๋ณดํต ์ต์ ์ ๊ณฑ ์ถ์ ์ ๋น์ ๊ท ์ค์ฐจ์ ์ง๋ฉดํด๋ ์ฌ์ ํ ํฉ๋ฆฌ์ ์ธ ์ถ์ ๊ฐ์ ๋๋ค. ํนํ, Gauss-Markov Theorem ์ ์ผ๋ฐ์ ์ธ ์ต์ ์ ๊ณฑ ์ถ์ ๊ฐ์ด ์ค๋ฅ๊ฐ์๋ ํ ํ๊ท ๊ณ์์ ์ต๊ณ ์ ํ ๋น ํธํฅ ์ถ์ ๋ (BLUE) ( ํ๊ท ์ ๊ณฑ ์ค์ฐจ ๋ฅผ ์ต์ํํ๋ ๋ฐ ์ต์ ์ธ โ์ต์์โ )์ด๋ผ๊ณ ์ค๋ช ํฉ๋๋ค.
(1) ํ๊ท ์ด 0์ด๋ค
(2) ์๊ด์ด ์๋ค
(3) ๋ถ์ฐ์ด ์ผ์ ํ๋ค
์ฌ๊ธฐ์๋ ์ ๊ท ์กฐ๊ฑด์ด ์์ต๋๋ค (๋๋ ์ค๋ฅ๊ฐ IID ์ธ ์กฐ๊ฑด ).
์ ๋ขฐ ๊ตฌ๊ฐ ๋ฐ / ๋๋ ๊ฐ์ ์ป์ผ๋ ค๊ณ ํ ๋ ์ ๊ท์ฑ ์กฐ๊ฑด์ด ์ ์ฉ๋ฉ๋๋ค . (์ฐ๋ฆฌ๊ฐ ๋ ผ์ ๋ ๋ฐ์ ๊ฐ์ด, ์๋ฅผ ๋ค๋ฉด โ @MichaelChernick ๋น์ ์ ์ค๋ซ๋์ ์ ์์์ ์ถ๋ฐ์ด ๋ฐฉ๋ฒ์ผ๋ก ์ฒ๋ฆฌ ํ ์์๋๋งํผ ์ค๋ฅ๊ฐ ์๋ ์ผ๋ฐ์ ์ธ ๊ฒฝ์ฐ ๊ฐ๋ ฅํ ์ถ๋ก ์ ์ฌ์ฉํ ์ ์์ต๋๋ค (BTW ์ผ์) ์ธ๊ธ์ผ๋ก ์ด ์ค๋ ๋) ํ๋ฒ -estimator๋ ์ค์ ์ค์ฐจ ๋ถํฌ๊ฐ ์ ๊ท ๋ถํฌ์ ๊ธด ๊ผฌ๋ฆฌ ๋ถํฌ (์ : ๋ชจ์) ์ฌ์ด์ ํผํฉ์ด์ง๋ง ๋ค๋ฅธ ์ ๊ท ๋ถํฌ๋ฅผ ๋ฒ์ด๋๋ ๋ฐ ๋์์ด๋์ง ์์ ๋ ๊ฐ๋ ฅํ ์ถ๋ก ์ ์ ๊ณต ํ ์ ์์ต๋๋ค. Michael์ด ์์ํ๋ ํ ๊ฐ์ง ํฅ๋ฏธ๋ก์ด ๊ฐ๋ฅ์ฑ ์ OLS ์ถ์ ์น์ ๋ํ ์ ๋ขฐ ๊ตฌ๊ฐ์ ์ป๊ธฐ ์ํด ๋ถํธ ์คํธ๋ฉ ํ๊ณ ์ด๊ฒ์ด Huber ๊ธฐ๋ฐ ์ถ๋ก ๊ณผ ๋น๊ต๋๋ ๋ฐฉ์์ ๋ณด๋ ๊ฒ์ ๋๋ค.M
p Mํธ์ง : ๋๋ ์ข ์ข ๋น์ ํ ์ค๋ฅ๋ฅผ ์ฒ๋ฆฌํ๊ธฐ ์ํด ์ค์ ์ ํ ์ ๋ฆฌ์ ์์กด ํ ์ ์๋ค๊ณ ๋ค์์ต๋๋ค. ํญ์ ์ฌ์ค์ด ์๋๋๋ค (์ ๋ฆฌ๊ฐ ์คํจํ๋ ๋ฐ๋ก์ ๋ํด์๋ง ๋งํ๋ ๊ฒ์ด ์๋๋๋ค). ์์ ์ค์ ๋ฐ์ดํฐ ์๋ฅผ ๋ค์ด ๋น์ ์ ๋ฐ๋์ ์ ๊ณตํ๊ธฐ ์ํด ์ค์ฌ ๊ทนํ ์ ๋ฆฌ์ ์์กด ํ ์ ์๋ค, ๋น์ ์ ์ค๋ ์ค๋ฅ๋ฅผ ๊ผฌ๋ฆฌ ํ ์ํฉ์์ โ ์์ ๊ฐ ์ฐธ์กฐ, ์ฐ๋ฆฌ๋ ํฐ ์ํ ํฌ๊ธฐ๋ฅผ ๊ฐ์ง๊ณ ์์ง๋ง ๊ธด ๊ผฌ๋ฆฌ ์ค๋ฅ ๋ถํฌ์ ์ฆ๊ฑฐ๋ฅผ ๋ณผ ์ ์์ต๋๋ค ํ์ค์ ์ธ ์ ํ ์ํ ํฌ๊ธฐ์ ๋ํ ๋๋ต์ ์ธ ํธํฅ ์ถ๋ก . ์๋ฅผ ๋ค์ด, ์ค์ฐจ ๊ฐ ์์ ๋๋ก ๋ถํฌ๋ฅผ ๋ฐ๋ฅด๋ ๊ฒฝ์ฐ ( ๋ ๋ช ํํ์ง๋ ์์)2.01
t2.01
OP์ ๋ฐ์ดํฐ์์ ๋ณผ ์์๋ ์ค์ฐจ๋ณด๋ค ๊ธด ๊ผฌ๋ฆฌ), ๊ณ์ ์ถ์ ๊ฐ์ ๋ฌด ์ ๊ท ์ ๊ท ๋ถํฌ์ด์ง๋ง ๋ค๋ฅธ ์งง์ ๊ผฌ๋ฆฌ ๋ถํฌ๋ณด๋ค โ์ฐจ์งโํ๋ ๋ฐ ํจ์ฌ ์ค๋ ๊ฑธ๋ฆฝ๋๋ค.
์ดํ, I๋์ ์กฐ ์๋ฎฌ๋ ์ด์
๋ณด์ฌ R
๊ทธ ๋ ์ฌ๊ธฐ์ ์ ์ํ๋ง ๋ถํฌ ํ๋ณธ ํฌ๊ธฐ๊ฐ ๊ฒฝ์ฐ์๋ ์ ์ฌ์ ํ โโ๋งค์ฐ ๊ธด ๊ผฌ๋ฆฌ์
๋๋ค .ฮต I ~ t 2.01 ฮฒ 1 N = 4000
ฮตiโผt2.01
ฮฒ^1
n=4000
set.seed(5678)
B = matrix(0,1000,2)
for(i in 1:1000)
{
x = rnorm(4000)
y = 1 + 2*x + rt(4000,2.01)
g = lm(y~x)
B[i,] = coef(g)
}
qqnorm(B[,2])
qqline(B[,2])
๋ต๋ณ
์์ฐจ์ ๋ชจ๋ ์์ฑ์๋ณด๊ณ ์ถ๋ค๊ณ ์๊ฐํฉ๋๋ค.
- ์ ๊ท์ฑ
- ์ผ์ ํ ๋ถ์ฐ
- ๊ณต๋ณ๋๊ณผ ์๊ด ๊ด๊ณ๊ฐ ์์ต๋๋ค.
- ์์ ์กฐํฉ
์ด ๊ฐ์ด 1์ ๋ถ๊ณผํ๊ณ ํ๋์ ๋๊บผ์ด ๊ผฌ๋ฆฌ๋ก ์ธํ ๋๊บผ์ด ๊ผฌ๋ฆฌ ๋๋ ์๊ณก์ผ๋ก ์ธํด ๊ฐ๋ ฅํ ํ๊ท๊ฐ ์ข์ ์ ๊ทผ ๋ฐฉ๋ฒ์ด๊ฑฐ๋ ์ ๊ท์ฑ์ผ๋ก ๋ณํ ๋ ์ ์์ต๋๋ค. ์ผ์ ํ์ง ์์ ๋ถ์ฐ ์ธ ๊ฒฝ์ฐ ๋ถ์ฐ ์์ ํ ๋ณํ์ ์๋ํ๊ฑฐ๋ ๋ถ์ฐ ํจ์๋ฅผ ๋ชจ๋ธ๋งํ์ญ์์ค. ๊ณต๋ณ๋๊ณผ ๊ด๋ จ๋ ๋ค๋ฅธ ํํ์ ๋ชจํ์ ์ ์ํ๋ ๊ฒ์ด ๋จ์ง 3์ด๋ผ๋ฉด. ๋ฒกํฐ ๋ ๋ฆฌ๋์ ๋ถํธ ์คํธ๋ฉ ๋ฌธ์ ๋ ํญ์ ์ต์ ์ ๋๋ค.
๋ต๋ณ
๋ด ๊ฒฝํ์ Michael Chernick๊ณผ ์์ ํ ์ผ์นํฉ๋๋ค. ๋๋๋ก ๋ฐ์ดํฐ ๋ณํ์ ์ ์ฉํ๋ฉด ๋ชจ๋ธ๋ง ์ค๋ฅ๊ฐ ์ ์์ ์ผ๋ก ๋ถํฌ ๋ ๋ฟ๋ง ์๋๋ผ ์ด๋ถ์ฐ์ฑ์ ์์ ํ ์๋ ์์ต๋๋ค.
๋ฏธ์ํ์ง๋ง, ์ ์๊ฐ์๋์ด ๊ณผํ / ์์ ์ ์ค์ฒํ๋ ๊ฒ์ ๋ฏธ์น๋ฏํ ์์ ๋ฐ์ดํฐ๋ฅผ ์์งํ๊ฑฐ๋ ๋ ํจ์จ์ ์ธ ๋ก๋ฒ ์คํธ ํ๊ท ๋ฐฉ๋ฒ์ ์ฌ์ฉํ๋ ๊ฒ๊ณผ ๊ฐ์ด ์ ์ํ๋ ๊ฒ์ ์๋ชป๋ ๊ฒ์ ๋๋ค.
๋ต๋ณ
๋งคํฌ๋ก (์์ ๋ด์ฉ)๊ฐ ์ ๋ต์ ๋งํ์ต๋๋ค. ๊ฐ์ ์ง๋ฌธ์ด ์์๊ธฐ ๋๋ฌธ์ ์ฝ๊ฐ์ ์ ํ์ฑ
์์ฐจ์ ์ ๊ท์ฑ ์กฐ๊ฑด์ ์์ฐจ๊ฐ ๊ท ์ผ ํ ๊ฒฝ์ฐ์๋ ์ ์ฉํฉ๋๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก OLS๋ ๋ชจ๋ ์ถ์ ๊ธฐ (์ ํ ๋๋ ๋น์ ํ) ์ฌ์ด์ ํธ์ฐจ๊ฐ ๊ฐ์ฅ ์์ต๋๋ค .
ํ์ฅ ๋ OLS ๊ฐ์ :
E(u|Xi=x)=0
(Xi,Yi),i=1,โฆ,n,- ํฐ ํน์ด ์น๋ ๋๋ฌผ๋ค
- ๋๋ ๋์ํ๋ค
- u๊ฐ ๋ถํฌ ๋จ
N(0,ฯ2)
1-5๊ฐ ๊ฒ์ฆ๋๋ฉด OLS๋ ๋ชจ๋ ์ถ์ ๊ธฐ (์ ํ ๋๋ ๋น์ ํ) ์ฌ์ด์์ ๊ฐ์ฅ ์์ ๋ถ์ฐ์ ๊ฐ์ต๋๋ค .
Gauss-Markov๊ฐ 1 ~ 4 ๊ฐ๋ง ํ์ธํ ๊ฒฝ์ฐ OLS๊ฐ ์ต๊ณ ์ ์ ํ (!) ์ถ์ ๊ธฐ (BLUE)์ ๋๋ค.
์ถ์ฒ : ์ฃผ์ ๋ฐ ์์จ, ๊ณ๋ ๊ฒฝ์ ํ + ๋ด ์ฝ์ค (EPFL, ๊ณ๋ ๊ฒฝ์ ํ)
๋ต๋ณ
๋น์ ๊ท ์กฐ๊ฑด์ ๊ฒฝ์ฐ , ํนํ ๋ฐฉ๋ฒ์ ๋ํ ๋งํฌ๋ฅผ ์ฌ์ฉํ์ฌ ๊ฐ๋ ฅํ ํ๊ท์ ์์กดํ๋ ๊ฒฝ์ฐ ๊ฐ ์์ต๋๋ค .
๋น์ ๊ท์ฑ์ ๋ํ ๋งฅ๋ฝ์ ์ ์ํ๊ธฐ ์ํด ์ ํ OLS ํ๊ท์ ๋ํ ๊ฐ์ ์ ๊ฒํ ํ๋ ๋ฐ ๋์์ด ๋ ์ ์์ต๋๋ค.
- ์ธ ์์ฑ์ด ์ฝํ๋ค . ์ด๋ ๋ณธ์ง์ ์ผ๋ก ์์ธก ๋ณ์ x ๊ฐ ๋๋ค ๋ณ์๊ฐ ์๋ ๊ณ ์ ๋ ๊ฐ์ผ๋ก ์ทจ๊ธ ๋ ์ ์์์ ์๋ฏธ ํฉ๋๋ค. ์๋ฅผ ๋ค์ด ์์ธก ๋ณ์์๋ ์ค๋ฅ๊ฐ์๋ ๊ฒ์ผ๋ก ๊ฐ์ ํฉ๋๋ค. ์ฆ, ์ธก์ ์ค๋ฅ๋ก ์ค์ผ๋์ง ์์ต๋๋ค. ์ด ๊ฐ์ ์ ๊ฐ์ฅ ์์ฃผ ์๋ฐ๋๋ ๊ฒ์ผ๋ก ๊ฐ์ ๋๋ฉฐ์ด ๊ฐ์ ๋ชฉ๋ก์ ๋ฐ๋ผ ์ค๋ฅ๊ฐ ๋ฐ์ํฉ๋๋ค.
- ์ ํ์ฑ. ์ด๋ ๋ฐ์ ๋ณ์์ ํ๊ท ์ด ๋ชจ์ (ํ๊ท ๊ณ์)์ ์์ธก ๋ณ์์ ์ ํ ์กฐํฉ์์ ์๋ฏธํฉ๋๋ค. ์ด ๊ฐ์ ์ ์ฒ์์ ๋ณด์ด๋ ๊ฒ๋ณด๋ค ํจ์ฌ ๋ ์ ํ์ ์ ๋๋ค. ์์ธก ๋ณ์๋ ๊ณ ์ ๋ ๊ฐ์ผ๋ก ์ฒ๋ฆฌ๋๋ฏ๋ก (์ ์ฐธ์กฐ) ์ ํ์ฑ์ ์ค์ ๋ก ๋งค๊ฐ ๋ณ์์ ๋ํ ์ ํ ์ผ๋ฟ์ ๋๋ค. ์์ธก ๋ณ์ ์์ฒด๋ ์์๋ก ๋ณํ ๋ ์ ์์ผ๋ฉฐ, ์ค์ ๋ก ๋์ผํ ๊ธฐ๋ณธ ์์ธก ๋ณ์์ ์ฌ๋ฌ ๋ณต์ฌ๋ณธ์ด ์ถ๊ฐ ๋ ์ ์์ผ๋ฉฐ, ๊ฐ ๋ณต์ฌ๋ณธ์ ๋ค๋ฅด๊ฒ ๋ณํ๋ฉ๋๋ค.
- ์ผ์ ํ ๋ถ์ฐ (์ผ๋ช ๋์ฑ์ ). ์ด๋ ์์ธก ๋ณ์์ ๊ฐ์ ๊ด๊ณ์์ด ๋ฐ์ ๋ณ์์ ๋ค๋ฅธ ๊ฐ์ด ์ค์ฐจ์์ ๋์ผํ ๋ถ์ฐ์ ๊ฐ์์ ์๋ฏธํฉ๋๋ค. ์ค์ ๋ก ์๋ต ๋ณ์๊ฐ ๊ด๋ฒ์ํ๊ฒ ๋ณํ ์์๋ ๊ฒฝ์ฐ์ด ๊ฐ์ ์ ์ ํจํ์ง ์์ต๋๋ค (์ฆ, ์ค๋ฅ๊ฐ ์ด๋ถ๋ฒ์ ์). ์ด๊ธฐ์ข ์ค์ฐจ ๋ถ์ฐ์ ํ์ธํ๊ธฐ ์ํด ๋๋ ์์ฐจ ํจํด์ด ๋์ง์ฑ ๋ชจํ ๊ฐ์ ์ ์๋ฐํ๋ ๊ฒฝ์ฐ ( x ๋ ๋ชจ๋ ์ ์ โ์ต์ ํฉ์ โ์์ ์ค์ฐจ๊ฐ ๋์ผ), ์์ฐจ ์ค์ฐจ์ ์์ธก๊ฐ ์ฌ์ด์ โํจ๋ ํจ๊ณผโ๋ฅผ ์ฐพ๋ ๊ฒ์ด ์ข์ต๋๋ค. ์ด๊ฒ์ ์์ธก ๋ณ์์ ๋ํด ํ๋กฏ ํ ๋ ์ ๋ ๋๋ ์ ๊ณฑ ์์ฐจ์ ์ฒด๊ณ์ ์ธ ๋ณํ๊ฐ์์ ๊ฒ์ ๋๋ค. ํ๊ท์ ์ ์ค๋ฅ๊ฐ ๊ณ ๋ฅด๊ฒ ๋ถํฌ๋์ง ์์ต๋๋ค. ์ด๋ถ์ฐ์ฑ (heteroscedasticity)์ ์ ์ฃผ์์ ๊ตฌ๋ณ ๊ฐ๋ฅํ ๋ถ์ฐ์ ํ๊ท ํํ์ฌ ์ ์ ๋ชจ๋ ๋ถ์ฐ์ ๋ถ์ ํํ๊ฒ ๋ํ๋ด๋ ๋จ์ผ ๋ถ์ฐ์ ์ป์ต๋๋ค. ์ค์ ๋ก, ์์ฐจ๋ ์ ํ ํ๊ท์ ์ ๋ฐ๋ผ ์ ์ ๋ํ ๋ ํฌ๊ณ ์์ ๊ฐ์ ๋ํ ์์ธก ๋ ๊ทธ๋ฆผ์์ ๊ตฐ์ง๋์ด ๋ถ์ฐ๋์ด ๋ํ๋๋ฉฐ ๋ชจํ์ ํ๊ท ์ ๊ณฑ ์ค์ฐจ๊ฐ ์๋ชป๋ฉ๋๋ค.
- ์ค๋ฅ์ ๋ ๋ฆฝ์ฑ. ์ด๊ฒ์ ์๋ต ๋ณ์์ ์ค๋ฅ๊ฐ ์๋ก ๊ด๋ จ์ด ์๋ค๊ณ ๊ฐ์ ํฉ๋๋ค. (์ค์ ํต๊ณ์ ๋ ๋ฆฝ์ฑ์ ๋จ์ํ ์๊ด ๊ด๊ณ๊ฐ์๋ ๊ฒ๋ณด๋ค ๋ ๊ฐ๋ ฅํ ์กฐ๊ฑด์ด๋ฉฐ, ๋ณด์ ํ๊ณ ์๋ค๊ณ ์๋ ค์ง ๊ฒฝ์ฐ ์ ์ฉ ๋ ์ ์์ง๋ง ์ข ์ข ํ์ํ์ง๋ ์์ต๋๋ค. ํ์๋ ๊ตฐ์ง ๋ถ์ ๋ฐ ์ํธ ์์ฉ์ ๋ํ ์์ ์ผ๋ก ๊ฒ์ฌ ํ ์ ์์ต๋๋ค.) ์ผ๋ถ ๋ฐฉ๋ฒ (์ : ์ผ๋ฐํ) ์ต์ ์ ๊ณฑ)์ ์๊ด ์ค๋ฅ๋ฅผ ์ฒ๋ฆฌ ํ ์ โโ์์ง๋ง, ์๊ด๋์ง ์์ ์ค๋ฅ๋ฅผ ๊ฐ์ ํ์ฌ ๋ชจ๋ธ์ ํธํฅ์ํค๋ ๋ฐ ์ผ์ข ์ ์ ๊ทํ๋ฅผ ์ฌ์ฉํ์ง ์๋ ํ ์ผ๋ฐ์ ์ผ๋ก ํจ์ฌ ๋ ๋ง์ ๋ฐ์ดํฐ๊ฐ ํ์ํฉ๋๋ค. ๋ฒ ์ด์ง์ ์ ํ ํ๊ท๋์ด ๋ฌธ์ ๋ฅผ ์ฒ๋ฆฌํ๋ ์ผ๋ฐ์ ์ธ ๋ฐฉ๋ฒ์ ๋๋ค.
-
์ค์ฐจ ํญ๊ณผ ํ๊ท ๋ณ์ ๊ฐ์ ํต๊ณ์ ๊ด๊ณ๋ ์ถ์ ์ ์ฐจ๊ฐ ํธํฅ๋์ง ์๊ณ ์ผ๊ด์ฑ์๋ ๊ฒ๊ณผ ๊ฐ์ ๋ฐ๋์งํ ์ํ๋ง ํน์ฑ์ ๊ฐ๋์ง ์ฌ๋ถ๋ฅผ ๊ฒฐ์ ํ๋ ๋ฐ ์ค์ํ ์ญํ ์ํฉ๋๋ค.
-
์์ธก ๋ณ์ x์ ๋ฐฐ์ด ๋๋ ํ๋ฅ ๋ถํฌ๋ ฮฒ ์ถ์ ์ ์ ๋ฐ๋์ ํฐ ์ํฅ์ ๋ฏธ์นฉ๋๋ค. ์คํ์ ์ํ๋ง ๋ฐ ์ค๊ณ๋ ฮฒ์ ์ ํํ ์ถ์ ์น๋ฅผ ๋ฌ์ฑํ๋ ๋ฐฉ์์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ์์งํ๊ธฐ์ํ ์ง์นจ์ ์ ๊ณตํ๋ ๊ณ ๋๋ก ๊ฐ๋ฐ ๋ ํต๊ณ์ ํ์ ํ๋์ ๋๋ค.
์ด ๊ฐ์ด ์๋ต์ด ๋์, ์๋ฎฌ๋ ์ด์ Studentโs- ๋ถํฌ ๊ธฐ์ธ๊ธฐ์ ์ ํธ ๊ทธ ์์ ๋๋ก์ ๋ํํ (์ํ ์ ๋ขฐ ๊ตฌ๊ฐ๊ณผ OLS ํ๊ท ๋ผ์ธ ๊ด๊ณ ๋ฆฌ๋์์ ์๋ฌ๋ฅผ ์ด๋์ํด์ผ๋ก์จ ํํ๋ค ) ๊ฐ์ํ๋ค. ๋ค๋ฉด , Studentโs- ์ฝ์ ๋ถํฌ์ด๋ฉฐ, ๊ฒฝ์ฌ์ ๋ํ ์ ๋ขฐ ๊ตฌ๊ฐ์ด๋๊ณ .
ty
df
df=1
t
(โโ,+โ)
๋ฐ์ ์ค์ฐจ๊ฐ Cauchy ๋ถํฌ ์ผ ๋, ๋ฐ์ดํฐ๋ฅผ ํตํ ์คํจ๋ฆฌ์ด์ค ๋ผ์ธ์ผ๋ก๋ถํฐ์ OLS ์์ฐจ๋ ์ ๋ขฐ์ฑ์ด ๋จ์ด์ง ์ ์๋ค๋ ์ ์์ ์์กด๋ฌผ์ ๋ํด Cauchy ๋ถํฌ๋ฅผ ํธ์ถํ๋ ๊ฒ์ ์์์ ์ ๋๋ค. ์ด ๊ฒฝ์ฐ Theil-Sen ํ๊ท ๋ถ์์ ์ฌ์ฉํ ์ ์์ต๋๋ค . Theil-Sen์ ๋น์ ๊ท ์์ฐจ์ ๋ํด OLS๋ณด๋ค ํ์คํ ๊ฐ๋ ฅํฉ๋๋ค. ์๋ฅผ ๋ค์ด, Cauchy ๋ถ์ฐ ์ค์ฐจ๋ ์ ๋ขฐ ๊ตฌ๊ฐ์ ์ ํ์ํค์ง ์์ผ๋ฉฐ OLS์๋ ๋ฌ๋ฆฌ ์ด๋ณ ๋ ํ๊ท์ ๋ฌ๋ฆฌ ์ด๋ณ ๋์ ๊ฒฝ์ฐ ์ฌ์ ํ ํธํฅ๋ฉ๋๋ค. ํต๊ณผ -Bablok ํ๊ท ๋ ํธํฅ๋์ง ์์ ์ด๋ณ ๋์ผ ์ ์์ง๋ง ์์ ํ๊ท ๊ธฐ์ธ๊ธฐ์ ์ ์ฉ๋์ง ์์ต๋๋ค. ๋ฐฉ๋ฒ ๋น๊ต ์ฐ๊ตฌ์ ๊ฐ์ฅ ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ฉ๋ฉ๋๋ค. ๋ฐ๋ฐ ํ๊ท๋ฅผ ์ธ๊ธํด์ผํ๋ค์ฌ๊ธฐ์ Theil-Sen ๋ฐ Passing-Bablok ํ๊ท์ ๋ฌ๋ฆฌ ์ดํญ ๋ฌธ์ ์ ๋ํ ์ค์ ์๋ฃจ์ ์ด์ง๋ง ๋ค๋ฅธ ํ๊ท์ ๊ฒฌ๊ณ ์ฑ์ด ๋ถ์กฑํฉ๋๋ค. ๋ณด๋ค ์ค์ฌ์ ์ธ ๊ฐ์ ํฌํจํ๋๋ก ๋ฐ์ดํฐ๋ฅผ ์๋ผ๋ด์ด ๊ฒฌ๊ณ ์ฑ์ ๋์ผ ์ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, ๋๋ค ์ํ ํฉ์ (RANSAC) ๋ ํน์ด ์น๋ฅผ ํฌํจํ๋ ๊ด์ธก ๋ ๋ฐ์ดํฐ ์ธํธ์์ ์ํ์ ๋ชจ๋ธ์ ๋งค๊ฐ ๋ณ์๋ฅผ ์ถ์ ํ๋ ๋ฐ๋ณต์ ๋ฐฉ๋ฒ์ ๋๋ค.
์ด๋ณ ๋ ํ๊ท๋ ๋ฌด์์ ๋๊น? ๋ฌธ์ ์ ์ด๋ณ ๋ ํน์ฑ์ ๋ํ ํ ์คํธ ๋ถ์กฑ์ OLS ํ๊ท ํฌ์ ์ ๊ฐ์ฅ ํํ ์์ธ์ด๋ฉฐ์ด ์ฌ์ดํธ์ ๋ค๋ฅธ ๊ณณ ์์ ํ๋ฅญํ๊ฒ ์ ์๋์์ต๋๋ค . ์ด๋ฌํ ๋งฅ๋ฝ์์ OLS ๋ฐ์ด์ด์ค์ ๊ฐ๋ ์ ์ ์๋ ค์ ธ ์์ง ์์ต๋๋ค. ์๋ฅผ ๋ค์ด Longford et al. (2001), ๋ ์๋ฅผ ๋ค๋ฅธ ๋ฐฉ๋ฒ์ผ๋ก ์ฐธ์กฐํ์ฌ ํ๊ท ๋ชจ๋ธ์ ํ์ฅํ์ฌ ๋ณ์ ์ ๋ณ๋์ฑ์ ์ธ์ ํ๋ฏ๋ก ๋ฐ์ด์ด์ค๊ฐ ๋ฐ์ํ์ง ์์ต๋๋ค . ์ฆ, ์ ๋ชจ๋์์ ๋ ์ด๋ณ ๋ ๋์ ๋ฌธ์ ํ๊ท๋ฅผ ๋ฌด์ํ ์์๋ ๊ฒฝ์ฐ๊ฐ ์์ต๋๋ค.
x1 x y x y y 2 x y x y = f ( x )
1x
y
๊ฐ์ ๋ฌด์์๋ก ๋ถ๋ฐฐ๋ฉ๋๋ค. ์ด๋ณ ๋ ํ๊ท์ ํ์์ฑ์ OLS ํ๊ท์ ์ ๋ฐ์ดํฐ์ OLS ํ๊ท์ ์์ฐจ์ ๋ง์ถ๋ ๊ฒ์ผ๋ก ํ ์คํธ ํ ์ ์์ต๋๋ค. ๊ทธ๋ฐ ๋ค์ OLS ์์ฐจ๊ฐ 0์ด ์๋ ๊ธฐ์ธ๊ธฐ๋ฅผ ๊ฐ๋ ๊ฒฝ์ฐ ๋ฌธ์ ๋ ์ด๋ณ ๋์ด๋ฉฐ ๋ฐ์ดํฐ์ OLS ํ๊ท๋ ๋๋ฌด ์์ ๊ธฐ์ธ๊ธฐ ํฌ๊ธฐ์ ํจ์ ๊ด๊ณ๋ฅผ ๋ํ๋ด๊ธฐ์๋ ๋๋ฌด ํฐ ์ ํธ์ ๊ฐ์ต๋๋ค. ๊ฐ ๋ฐ . ์ด ๊ฒฝ์ฐ ๊ฐ์ ์ต์ ์ค์ฐจ ์ ํ ์ถ์ ๊ธฐ๋ ์ค์ ๋ก ์ฌ์ ํ OLS ํ๊ท์์ ๋น๋กฏ๋๋ฉฐ R ๊ฐ์ ๊ฐ๋ฅํ ์ต๋ ๊ฐ์ด๋์ง๋ง OLS ํ๊ท์ ์ ์ค์ ๊ด๋ จ ํจ์๋ฅผ ๋ํ๋ด์ง ์์ต๋๋ค. ๋ฐ
xy
y
2
x
y
๋๋ค ๋ณ์. ๋ฐ๋์ ์๋ก์, ๋ฑ๊ฑฐ๋ฆฌ ๊ฐ๋ ์๊ณ์ด์์ ๋ค๋ฅธ ๋ฌธ์ ๋ค ์ฌ์ด์์ ๋ฐ์ํ๋ ๊ฒ์ฒ๋ผ , ๋ฏธ๊ฐ๊ณต ๋ฐ์ดํฐ์ OLS๊ฐ ํญ์ ๋ถ์ ์ ํ์ง๋ ์์ง๋ง ์ต๊ณ ์ ๋ผ์ธ์ ๋ํ๋ผ ์ ์์ง๋ง ์ฌ์ ํ ๋ณ์ ๋ณํ, ์๋ฅผ ๋ค์ด ์นด์ดํธ ๋ฐ์ดํฐ์ ๊ฒฝ์ฐ, ํฌ์์ก ๋ถ์ฐ ์ค์ฐจ์ ์ค๋ฅ๋ฅผ๋ณด๋ค ์ผ๋ฐ์ ์ธ ์กฐ๊ฑด์ผ๋ก ๋ณํํ๊ธฐ ์ํด ์นด์ดํธ์ ์ ๊ณฑ๊ทผ์ ์ทจํ๊ณ 0์ด ์๋ ์์ฐจ ๊ธฐ์ธ๊ธฐ๋ฅผ ์ฌ์ ํ ์ ๊ฒํด์ผํฉ๋๋ค.
xy=f(x)
- NT, ๋กฑ ํฌ๋ (2001). โํต์ โ. ์๋ฆฝ ํต๊ณ ํํ์ง, ์๋ฆฌ์ฆ A. 164 : 565. doi : 10.1111 / 1467-985x.00219