ํƒœ๊ทธ ๋ณด๊ด€๋ฌผ: quantile-regression

quantile-regression

ํšŒ๊ท€ ๋ถ„์„์€ ์–ด๋–ป๊ฒŒ ์ž‘๋™ํ•ฉ๋‹ˆ๊นŒ? . ์ž…๋‹ˆ๊นŒ ฮฒฮฒ\beta ๊ฐ’์€ ๋‹จ์ˆœํžˆ ์ฃผ๋ฌธ ๋ฐœ๊ฒฌ yyy

Quantile ํšŒ๊ท€์— ๋Œ€ํ•œ ์ง๊ด€์ ์ด๊ณ  ์ ‘๊ทผ ๊ฐ€๋Šฅํ•œ ์„ค๋ช…์„ ์–ป๊ณ  ์‹ถ์Šต๋‹ˆ๋‹ค.

๊ฒฐ๊ณผ ๋Œ€ํ•œ ๊ฐ„๋‹จํ•œ ๋ฐ์ดํ„ฐ ์„ธํŠธ ์™€ ์˜ˆ์ธก ๋ณ€์ˆ˜ X 1 , X 2 ๊ฐ€ ์žˆ๋‹ค๊ณ  ๊ฐ€์ • ํ•ด ๋ด…์‹œ๋‹ค .

Y

X1,X2

์˜ˆ๋ฅผ ๋“ค์–ด, ๋‚˜๋Š” .25, .5, .75์—์„œ Quantile ํšŒ๊ท€๋ฅผ ์‹คํ–‰ํ•˜๊ณ 

ฮฒ0,.25,ฮฒ1,.25...ฮฒ2,.75

.

์ž…๋‹ˆ๊นŒ

ฮฒ

๊ฐ’์€ ๋‹จ์ˆœํžˆ ์ฃผ๋ฌธ ๋ฐœ๊ฒฌ

y

๊ฐ’์„ ์ฃผ์–ด์ง„ ๋ถ„์œ„์ˆ˜ ๊ทผ์ฒ˜ /์—์žˆ๋Š” ์‹ค์‹œ ์˜ˆ์— ๊ธฐ์ดˆํ•œ ์„ ํ˜• ํšŒ๊ท€ ๋ถ„์„์„ ์ˆ˜ํ–‰?

๋˜๋Š” Quantile๋กœ๋ถ€ํ„ฐ์˜ ๊ฑฐ๋ฆฌ๊ฐ€ ์ฆ๊ฐ€ํ•จ์— ๋”ฐ๋ผ ๋ชจ๋“  ์ƒ˜ํ”Œ์ด

ฮฒ

์ถ”์ •๊ฐ’์— ๊ธฐ์—ฌ ํ•ฉ๋‹ˆ๊นŒ?

์•„๋‹ˆ๋ฉด ์™„์ „ํžˆ ๋‹ค๋ฅธ ๊ฒƒ์ž…๋‹ˆ๊นŒ? ์•„์ง ์ ‘๊ทผ ๊ฐ€๋Šฅํ•œ ์„ค๋ช…์„ ์ฐพ์ง€ ๋ชปํ–ˆ์Šต๋‹ˆ๋‹ค.



๋‹ต๋ณ€

๋‚˜๋Š” Koenker & Hallock (2001, Journal of Economic Perspectives) ๊ณผ Koenker์˜ ์‹œ์ธ ๊ต๊ณผ์„œ๋ฅผ ์ถ”์ฒœ ํ•ฉ๋‹ˆ๋‹ค.

  1. ์‹œ์ž‘์ ์€ ๋ฐ์ดํ„ฐ ์„ธํŠธ์˜ ์ค‘์•™๊ฐ’์ด ์ ˆ๋Œ€ ์˜ค์ฐจ์˜ ํ•ฉ์„ ์ตœ์†Œํ™” ํ•œ๋‹ค๋Š” ๊ด€์ฐฐ์ž…๋‹ˆ๋‹ค . ์ฆ‰, 50 % Quantile์€ ํŠน์ • ์ตœ์ ํ™” ๋ฌธ์ œ์— ๋Œ€ํ•œ ์†”๋ฃจ์…˜์ž…๋‹ˆ๋‹ค (์ ˆ๋Œ€ ์˜ค๋ฅ˜์˜ ํ•ฉ๊ณ„๋ฅผ ์ตœ์†Œํ™”ํ•˜๋Š” ๊ฐ’ ์ฐพ๊ธฐ).
  2. ์ด๋กœ๋ถ€ํ„ฐ ๋ชจ๋“  quantile์ด ํŠน์ • ์ตœ์†Œํ™” ๋ฌธ์ œ์— ๋Œ€ํ•œ ํ•ด๊ฒฐ์ฑ…, ์ฆ‰ ฯ„์— ์˜์กดํ•˜๋Š” ๊ฐ€์ค‘์น˜ ๋กœ ๋น„๋Œ€์นญ ์ ์œผ๋กœ ๊ฐ€์ค‘ ๋œ ์ ˆ๋Œ€ ์˜ค์ฐจ ์˜ ํ•ฉ์„ ์ตœ์†Œํ™”ํ•˜๋Š” ๊ฒƒ์ด ์‰ฝ๋‹ค๋Š” ๊ฒƒ์„ ์‰ฝ๊ฒŒ ์•Œ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
    ฯ„

    ฯ„

  3. ๋งˆ์ง€๋ง‰์œผ๋กœ ํšŒ๊ท€ ๋‹จ๊ณ„๋ฅผ ๋งŒ๋“ค๊ธฐ ์œ„ํ•ด ์˜ˆ์ธก ๋ณ€์ˆ˜์˜ ์„ ํ˜• ์กฐํ•ฉ์œผ๋กœ์ด ์ตœ์†Œํ™” ๋ฌธ์ œ์— ๋Œ€ํ•œ ์†”๋ฃจ์…˜์„ ๋ชจ๋ธ๋งํ•˜๋ฏ€๋กœ ์ด์ œ ๋ฌธ์ œ๋Š” ๋‹จ์ผ ๊ฐ’์ด ์•„๋‹ˆ๋ผ ํšŒ๊ท€ ๋งค๊ฐœ ๋ณ€์ˆ˜ ์ง‘ํ•ฉ์„ ์ฐพ๋Š” ๊ฒƒ ์ค‘ ํ•˜๋‚˜์ž…๋‹ˆ๋‹ค.

๋”ฐ๋ผ์„œ ์ง๊ฐ์€ ๋งค์šฐ ์ •ํ™•ํ•ฉ๋‹ˆ๋‹ค. ๋ชจ๋“  ํ‘œ๋ณธ ์€ ์šฐ๋ฆฌ๊ฐ€ ๋ชฉํ‘œ๋กœ ํ•˜๋Š” Quantile ฯ„ ์— ๋”ฐ๋ผ ๋น„๋Œ€์นญ ๊ฐ€์ค‘์น˜๋กœ ์ถ”์ •์— ๊ธฐ์—ฌํ•ฉ๋‹ˆ๋‹ค .

ฮฒ

ฯ„

๋‹ต๋ณ€

Quantile ํšŒ๊ท€ ๋ถ„์„์˜ ๊ธฐ๋ณธ ์•„์ด๋””์–ด๋Š” ๋ถ„์„๊ฐ€๊ฐ€ ๋‹จ์ง€ ๋ฐ์ดํ„ฐ๊ฐ€ ์•„๋‹ˆ๋ผ ๋ฐ์ดํ„ฐ ๋ฐฐํฌ์— ๊ด€์‹ฌ์ด ์žˆ๋‹ค๋Š” ์‚ฌ์‹ค์—์„œ ๋น„๋กฏ๋ฉ๋‹ˆ๋‹ค. ํ‰๊ท ๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค.

y=Xฮฒ

E(Y|X=x)=xฮฒ

argโกminฮฒ(yโˆ’xฮฒ)โ€ฒ(yโˆ’Xฮฒ)

argโกminฮฒ|yโˆ’Xฮฒ|

|.|

ฮฑ

Q- ํšŒ๊ท€๋Š” ๋ฐ์ดํ„ฐ์˜ Quantile์„ ์ฐพ์€ ๋‹ค์Œ ํ•ด๋‹น ํ•˜์œ„ ์ง‘ํ•ฉ (๋˜๋Š” ๋” ์–ด๋ ค์šด ๊ฒฝ๊ณ„)์— ์„ ์„ ๋งž์ถ”๋Š” ๊ฒƒ๊ณผ๋Š” ์กฐ๊ธˆ ๋‹ค๋ฆ…๋‹ˆ๋‹ค.

ฮฑ

ฮฒ^ฮฑ=argโกminฮฒ{ฮฑ|yโˆ’Xฮฒ|I(y>Xฮฒ)+(1โˆ’ฮฑ)|yโˆ’Xฮฒ|I(y<Xฮฒ)}.

๋ณด์‹œ๋‹ค์‹œํ”ผ์ด ์˜๋ฆฌํ•œ ๋Œ€์ƒ ํ•จ์ˆ˜๋Š” Quantile์„ ์ตœ์ ํ™” ๋ฌธ์ œ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๊ฒƒ ์ด์ƒ์ž…๋‹ˆ๋‹ค.

ฮฒฮฑ

๋‹ต๋ณ€


์ด ๊ธ€์€ stats ์นดํ…Œ๊ณ ๋ฆฌ์— ๋ถ„๋ฅ˜๋˜์—ˆ๊ณ  ํƒœ๊ทธ๊ฐ€ ์žˆ์œผ๋ฉฐ ๋‹˜์— ์˜ํ•ด ์— ์ž‘์„ฑ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.