ํƒœ๊ทธ ๋ณด๊ด€๋ฌผ: kernel-smoothing

kernel-smoothing

ํ‰์‹ ๋„์˜ ๊ด€์ ์—์„œ Parzen ์ฐฝ (์ปค๋„) ๋ฐ€๋„ ์ถ”์ •์„ ์„ค๋ช… ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ? ํ™•๋ฅ  ๋ฐ€๋„ , ํŒŒ์  

Parzen ์ฐฝ ๋ฐ€๋„ ์ถ”์ •์€ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์„ค๋ช…๋ฉ๋‹ˆ๋‹ค

p(x)=1nโˆ‘i=1n1h2ฯ•(xiโˆ’xh)

์—ฌ๊ธฐ์„œ, ๋ฒกํ„ฐ์˜ ์š”์†Œ ์ˆ˜์ด๊ณ , ๋ฒกํ„ฐ์ด๋ฉฐ, ์˜ ํ™•๋ฅ  ๋ฐ€๋„ , ํŒŒ์   ์œˆ๋„์šฐ์˜ ์‚ฌ์ด์ฆˆ์ด๊ณ , ์œˆ๋„์šฐ ํ•จ์ˆ˜์ด๋‹ค.x p ( x ) x h ฯ•

n

x

p(x)

x

h

ฯ•

๋‚ด ์งˆ๋ฌธ์€ :

  1. Parzen Window Function๊ณผ Gaussian Function ๋“ฑ๊ณผ ๊ฐ™์€ ๋‹ค๋ฅธ ๋ฐ€๋„ ๊ธฐ๋Šฅ์˜ ๊ธฐ๋ณธ ์ฐจ์ด์ ์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

  2. ์˜ ๋ฐ€๋„๋ฅผ ์ฐพ๋Š” ๋ฐ ์œˆ๋„์šฐ ํ•จ์ˆ˜ ( ) ์˜ ์—ญํ• ์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ ?x

    ฯ•

    x
  3. ์™œ Window ํ•จ์ˆ˜ ๋Œ€์‹  ๋‹ค๋ฅธ ๋ฐ€๋„ ํ•จ์ˆ˜๋ฅผ ์—ฐ๊ฒฐํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ?

  4. ์˜ ๋ฐ€๋„๋ฅผ ์ฐพ๋Š” ๋ฐ์žˆ์–ด ์˜ ์—ญํ• ์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ ?x

    h

    x


๋‹ต๋ณ€

Parzen ์ฐฝ ๋ฐ€๋„ ์ถ”์ • ์€ ์ปค๋„ ๋ฐ€๋„ ์ถ”์ •์˜ ๋˜ ๋‹ค๋ฅธ ์ด๋ฆ„์ž…๋‹ˆ๋‹ค . ๋ฐ์ดํ„ฐ์—์„œ ์—ฐ์† ๋ฐ€๋„ ํ•จ์ˆ˜๋ฅผ ์ถ”์ •ํ•˜๊ธฐ์œ„ํ•œ ๋น„๋ชจ์ˆ˜ ์  ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค.

์ผ๋ฐ˜์ ์œผ๋กœ ์•Œ๋ ค์ง€์ง€ ์•Š์€, ์•„๋งˆ๋„ ์—ฐ์†์ ์ธ ๋ถ„ํฌ ์—์„œ ๋‚˜์˜จ ๋ฐ์ดํ„ฐ ํฌ์ธํŠธ ์žˆ๋‹ค๊ณ  ๊ฐ€์ • ํ•ฉ๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ๊ฐ€ ์ฃผ์–ด์ง„ ๋ถ„ํฌ๋ฅผ ์ถ”์ •ํ•˜๋Š” ๋ฐ ๊ด€์‹ฌ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋‹น์‹ ์ด ํ•  ์ˆ˜์žˆ๋Š” ํ•œ ๊ฐ€์ง€ ์ผ์€ ๋‹จ์ˆœํžˆ ๊ฒฝํ—˜์  ๋ถ„ํฌ๋ฅผ๋ณด๊ณ  ๊ทธ๊ฒƒ์„ ์‹ค์ œ ๋ถ„ํฌ์™€ ๋™๋“ฑํ•œ ํ‘œ๋ณธ์œผ๋กœ ์ทจ๊ธ‰ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๋ฐ์ดํ„ฐ๊ฐ€ ์—ฐ์†์ ์ด๋ผ๋ฉด ๊ฐ ๊ฐ€ ํ‘œ์‹œ ๋  ๊ฒƒ์ž…๋‹ˆ๋‹ค.

x1,โ€ฆ,xn

f

xi

์ ์€ ๋ฐ์ดํ„ฐ ์„ธํŠธ์— ํ•œ ๋ฒˆ๋งŒ ๋‚˜ํƒ€๋‚˜๋ฏ€๋กœ์ด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ฐ ๊ฐ’์˜ ํ™•๋ฅ ์ด ๋™์ผํ•˜๋ฏ€๋กœ ๋ฐ์ดํ„ฐ๊ฐ€ ๊ท ์ผ ํ•œ ๋ถ„ํฌ์—์„œ ๋‚˜์˜จ ๊ฒƒ์œผ๋กœ ๊ฒฐ๋ก ์„ ๋‚ด๋ฆด ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฐ”๋ผ๊ฑด๋Œ€, ๋‹น์‹ ์€ ์ด๊ฒƒ๋ณด๋‹ค ๋” ์ž˜ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค : ๋‹น์‹ ์€ ์ผ์ •ํ•œ ๊ฐ„๊ฒฉ์œผ๋กœ ๋ช‡ ๊ฐœ์˜ ๊ฐ„๊ฒฉ์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ํฌ์žฅํ•˜๊ณ  ๊ฐ ๊ฐ„๊ฒฉ์— ํ•ด๋‹นํ•˜๋Š” ๊ฐ’์„ ๊ณ„์‚ฐํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ๋ฐฉ๋ฒ•์€ ํžˆ์Šคํ† ๊ทธ๋žจ ์ถ”์ •์„ ๊ธฐ๋ฐ˜์œผ๋กœํ•ฉ๋‹ˆ๋‹ค . ๋ถˆํ–‰ํžˆ๋„, ํžˆ์Šคํ† ๊ทธ๋žจ์„ ์‚ฌ์šฉํ•˜๋ฉด ์—ฐ์† ๋ถ„ํฌ๊ฐ€ ์•„๋‹Œ ๋ช‡ ๊ฐœ์˜ ๋นˆ์œผ๋กœ ๋๋‚˜๋ฏ€๋กœ ๋Œ€๋žต์ ์ธ ๊ทผ์‚ฌ์น˜ ์ผ๋ฟ์ž…๋‹ˆ๋‹ค.

์ปค๋„ ๋ฐ€๋„ ์ถ”์ • ์ด ์„ธ ๋ฒˆ์งธ ๋Œ€์•ˆ์ž…๋‹ˆ๋‹ค. ์ฃผ์š” ์•„์ด๋””์–ด๋Š” ๋ฐ์ดํ„ฐ ํฌ์ธํŠธ๋ฅผ ์ค‘์‹ฌ์œผ๋กœํ•˜๊ณ  (์Šค์ผ€์ผ ( ๋Œ€์—ญํญ )) ๊ฐ€์žˆ๋Š” ์ปค๋„ ์ด๋ผ๋Š” ์—ฐ์† ๋ถ„ํฌ (๋…ธํ…Œ์ด์…˜ ์‚ฌ์šฉ) ์˜ ํ˜ผํ•ฉ ์— ์˜ํ•ด ๋ฅผ ๊ทผ์‚ฌํ•œ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค .

f

K

ฯ•

x i h

xi

h

fh^(x)=1nhโˆ‘i=1nK(xโˆ’xih)

์ด๊ฒƒ์€ ์•„๋ž˜ ๊ทธ๋ฆผ์— ๋‚˜์™€ ์žˆ์Šต๋‹ˆ๋‹ค. ์ •๊ทœ ๋ถ„ํฌ๋Š” ์ปค๋„ ๋กœ ์‚ฌ์šฉ๋˜๋ฉฐ ๋Œ€์—ญํญ ๋Œ€ํ•œ ์„œ๋กœ ๋‹ค๋ฅธ ๊ฐ’ ์€ 7 ๊ฐœ์˜ ๋ฐ์ดํ„ฐ ํฌ์ธํŠธ (ํ”Œ๋กฏ ์ƒ๋‹จ์— ํ™”๋ คํ•œ ์„ ์œผ๋กœ ํ‘œ์‹œ)๊ฐ€ ์ฃผ์–ด์ง€๋ฉด ๋ถ„ํฌ๋ฅผ ์ถ”์ •ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. ํ”Œ๋กฏ์˜ ๋‹ค์ฑ„๋กœ์šด ๋ฐ€๋„๋Š” ํฌ์ธํŠธ๋ฅผ ์ค‘์‹ฌ์œผ๋กœํ•˜๋Š” ์ปค๋„ ์ž…๋‹ˆ๋‹ค. ๊ณต์ง€ ์‚ฌํ•ญ ๊ฒƒ์„ A๋Š” ์ƒ๋Œ€ ๋งค๊ฐœ ๋ณ€์ˆ˜, ๊ทธ๊ฒƒ์˜ ๊ฐ’์ด ํ•ญ์ƒ ๋ฐ์ดํ„ฐ์™€ ๋™์ผํ•œ ๊ฐ’์— ๋”ฐ๋ผ ์„ ํƒ ์„œ๋กœ ๋‹ค๋ฅธ ๋ฐ์ดํ„ฐ ์„ธํŠธ์— ๋Œ€ํ•œ ์œ ์‚ฌํ•œ ๊ฒฐ๊ณผ๋ฅผ ์ œ๊ณตํ•˜์ง€ ์•Š์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

K

h

xi

h

h

h

์ปค๋„ ๋Š” ํ™•๋ฅ  ๋ฐ€๋„ ํ•จ์ˆ˜๋กœ ์ƒ๊ฐํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ ๋‹จ์ผ์„ฑ๊ณผ ํ†ตํ•ฉํ•ด์•ผํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ ๋ฐ ๊ทธ ๋’ค์— ์˜ค๋Š” 0์ด ์ค‘์‹ฌ ์ด๋˜๋„๋ก ๋Œ€์นญ์ด์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ปค๋„์— ๊ด€ํ•œ Wikipedia ๊ธฐ์‚ฌ ์—๋Š” Gaussian (์ •๊ทœ ๋ถ„ํฌ), Epanechnikov, ์ง์‚ฌ๊ฐํ˜• (๊ท ์ผ ๋ถ„ํฌ) ๋“ฑ๊ณผ ๊ฐ™์€ ๋„๋ฆฌ ์‚ฌ์šฉ๋˜๋Š” ๋งŽ์€ ์ปค๋„์ด ๋‚˜์—ด๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ๊ธฐ๋ณธ์ ์œผ๋กœ ์ด๋Ÿฌํ•œ ์š”๊ตฌ ์‚ฌํ•ญ์„ ์ถฉ์กฑํ•˜๋Š” ๋ชจ๋“  ๋ฐฐํฌ๋Š” ์ปค๋„๋กœ ์‚ฌ์šฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

K

K(x)=K(โˆ’x)

๋ถ„๋ช…ํžˆ, ์ตœ์ข… ์ถ”์ •์น˜๋Š” ์„ ํƒํ•œ ์ปค๋„ (๋งŽ์€ ๊ฒƒ์€ ์•„๋‹˜)๊ณผ ๋Œ€์—ญํญ ๋งค๊ฐœ ๋ณ€์ˆ˜ ์— ๋‹ฌ๋ ค ์žˆ์Šต๋‹ˆ๋‹ค . ๋‹ค์Œ ์Šค๋ ˆ๋“œ
์ปค๋„ ๋ฐ€๋„ ์ถ”์ •์—์„œ ๋Œ€์—ญํญ ๊ฐ’์„ ํ•ด์„ํ•˜๋Š” ๋ฐฉ๋ฒ•์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ? ๋Œ€์—ญํญ ๋งค๊ฐœ ๋ณ€์ˆ˜ ์‚ฌ์šฉ์— ๋Œ€ํ•ด ์ž์„ธํžˆ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค.

h

์ด๊ฒƒ์„ ํ‰๋ฒ”ํ•œ ์˜์–ด๋กœ ๋งํ•˜๋ฉด, ์—ฌ๊ธฐ์—์„œ ๊ฐ€์ •ํ•˜๋Š” ๊ฒƒ์€ ๊ด€์ธก ๋œ ์  ๋Š” ๋‹จ์ง€ ํ‘œ๋ณธ์ด๋ฉฐ ์ถ”์ • ํ•  ๋ถ„ํฌ ๋ฅผ ๋”ฐ๋ฆ…๋‹ˆ๋‹ค . ๋ถ„ํฌ๊ฐ€ ์—ฐ์†์ ์ด๊ธฐ ๋•Œ๋ฌธ์— ํฌ์ธํŠธ ๊ทผ์ฒ˜ ๋ถ€๊ทผ์— ์•Œ๋ ค์ง€์ง€ ์•Š์•˜์ง€๋งŒ 0์ด ์•„๋‹Œ ๋ฐ€๋„๊ฐ€ ์žˆ๋‹ค๊ณ  ๊ฐ€์ •ํ•˜๊ณ  (์ด์›ƒ์€ ๋งค๊ฐœ ๋ณ€์ˆ˜ ๋กœ ์ •์˜ ๋จ ) ์ปค๋„ ๋ฅผ ์‚ฌ์šฉ ํ•˜์—ฌ์ด๋ฅผ ๊ณ„์‚ฐํ•ฉ๋‹ˆ๋‹ค. ์ด์›ƒ์— ํฌ์ธํŠธ๊ฐ€ ๋งŽ์„์ˆ˜๋ก์ด ์˜์—ญ ์ฃผ๋ณ€์— ๋” ๋งŽ์€ ๋ฐ€๋„๊ฐ€ ๋ˆ„์ ๋˜๋ฏ€๋กœ ์˜ ์ „์ฒด ๋ฐ€๋„๊ฐ€ ๋†’์•„์ง‘๋‹ˆ๋‹ค . ๊ฒฐ๊ณผ ํ•จ์ˆ˜ ๋Š” ์ด์ œ ๋ชจ๋“  ํฌ์ธํŠธ ๋Œ€ํ•ด ํ‰๊ฐ€ ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค

xi

f

xi

h

K

fh^

fh^

x ^ f h ( x ) f ( x )

x

๋ฐ€๋„ ์ถ”์ •๊ฐ’์„ ๊ตฌํ•˜๊ธฐ ์œ„ํ•ด ์ด๊ฒƒ์€ ๋ฏธ์ง€์˜ ๋ฐ€๋„ ํ•จ์ˆ˜ ์˜ ๊ทผ์‚ฌ์น˜ ์ธ ํ•จ์ˆ˜ ๋ฅผ ์–ป์€ ๋ฐฉ๋ฒ• ์ž…๋‹ˆ๋‹ค.

fh^(x)

f(x)

์ปค๋„ ๋ฐ€๋„์˜ ์ข‹์€ ์ ์€ ํžˆ์Šคํ† ๊ทธ๋žจ๊ณผ ๋‹ฌ๋ฆฌ ์—ฐ์† ํ•จ์ˆ˜์ด๋ฉฐ ์œ ํšจํ•œ ํ™•๋ฅ  ๋ฐ€๋„์˜ ํ˜ผํ•ฉ์ด๊ธฐ ๋•Œ๋ฌธ์— ์œ ํšจํ•œ ํ™•๋ฅ  ๋ฐ€๋„๋ผ๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋งŽ์€ ๊ฒฝ์šฐ์— ์ด๊ฒƒ์€ ์— ๊ทผ์‚ฌ ํ•  ์ˆ˜์žˆ๋Š” ํ•œ ๊ฐ€๊น์Šต๋‹ˆ๋‹ค .

f

์ •๊ทœ ๋ถ„ํฌ๋กœ์„œ ์ปค๋„ ๋ฐ€๋„์™€ ๋‹ค๋ฅธ ๋ฐ€๋„์˜ ์ฐจ์ด์ ์€ โ€œ์ผ๋ฐ˜์ ์ธโ€๋ฐ€๋„๋Š” ์ˆ˜ํ•™ ํ•จ์ˆ˜์ด๊ณ , ์ปค๋„ ๋ฐ€๋„๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ถ”์ • ๋œ ์‹ค์ œ ๋ฐ€๋„์˜ ๊ทผ์‚ฌ์น˜์ด๋ฏ€๋กœ โ€œ๋…๋ฆฝํ˜•โ€๋ถ„ํฌ๋Š” ์•„๋‹™๋‹ˆ๋‹ค.

Silverman (1986)๊ณผ Wand and Jones (1995)์˜์ด ์ฃผ์ œ์— ๊ด€ํ•œ ๋‘ ๊ฐ€์ง€ ํ›Œ๋ฅญํ•œ ์†Œ๊ฐœ ์ฑ…์„ ์ถ”์ฒœํ•ฉ๋‹ˆ๋‹ค.


BW ์‹ค๋ฒ„ ๋งจ (1986). ํ†ต๊ณ„ ๋ฐ ๋ฐ์ดํ„ฐ ๋ถ„์„์„์œ„ํ•œ ๋ฐ€๋„ ์ถ”์ •. CRC / Chapman & Hall.

Wand, MP and Jones, MC (1995). ์ปค๋„ ์Šค๋ฌด๋”ฉ. ๋Ÿฐ๋˜ : ์ฑ„ํ”„๋จผ & ํ™€ / CRC.


๋‹ต๋ณ€

1) ๋‚ด ์ดํ•ด๋Š” ์‚ฌ์šฉ์ž๊ฐ€ ์— ์‚ฌ์šฉํ•  ํ•จ์ˆ˜๋ฅผ ์„ ํƒํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ ๊ฐ€์šฐ์‹œ์•ˆ ํ•จ์ˆ˜๋Š” ๋งค์šฐ ์ผ๋ฐ˜์ ์ธ ์„ ํƒ์ด๋ผ๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

ฯ•

2)์—์„œ์˜ ๋†๋„ ์„œ๋กœ ๋‹ค๋ฅธ ๊ฐ’์˜ ํ‰๊ท ์ด๋‹ค ์—์„œ . ์˜ˆ๋ฅผ ๋“ค์–ด, , ๋ฐ ๋Œ€ํ•ด ๊ฐ€์šฐ์Šค ๋ถ„ํฌ๋ฅผ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ๊ฒฝ์šฐ์—์„œ, ๋†๋„ ๋  .ฯ• h ( x i โ€“ x ) x x 1 = 1 x 2 = 2 ฯƒ = 1 ฯ• h x N 1 , 1 ( x ) + N 2 , 1 ( x )

x

ฯ•h(xiโˆ’x)

x

x1=1

x2=2

ฯƒ=1

ฯ•h

x

N1,1(x)+N2,1(x)2

3) ์œˆ๋„์šฐ ๊ธฐ๋Šฅ์œผ๋กœ ์›ํ•˜๋Š” ๋ฐ€๋„ ๊ธฐ๋Šฅ์„ ์—ฐ๊ฒฐํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

4) ๋Š” ์„ ํƒํ•œ ์œˆ๋„์šฐ ๊ธฐ๋Šฅ์˜ ๋„ˆ๋น„๋ฅผ ๊ฒฐ์ •ํ•ฉ๋‹ˆ๋‹ค.

h

๋‹ต๋ณ€