ํƒœ๊ทธ ๋ณด๊ด€๋ฌผ: chi-squared

chi-squared

์€ VS -test ๋ถ„ ๋™์•ˆ ๋ถ™๋“ค์–ด

๋ฐฉ๊ธˆ ์กด๊ฒฝ๋ฐ›๋Š” (์ธ๊ธฐ์žˆ๋Š”) ๊ณผํ•™ ์žก์ง€ (๋…์ผ PM, 02/2013, p.36)์—์„œ ํฅ๋ฏธ๋กœ์šด ์‹คํ—˜์— ๋Œ€ํ•ด ์ฝ์—ˆ์Šต๋‹ˆ๋‹ค (๋ถˆํ–‰ํžˆ๋„ ์†Œ์Šค๊ฐ€ ์—†์Œ). ์ง๊ด€์ ์œผ๋กœ ๊ฒฐ๊ณผ์˜ ์ค‘์š”์„ฑ์„ ์˜์‹ฌํ–ˆ๊ธฐ ๋•Œ๋ฌธ์— ์ฃผ๋ชฉ์„ ๋ฐ›์•˜์ง€๋งŒ ์ œ๊ณต๋œ ์ •๋ณด๋Š” ํ†ต๊ณ„ ํ…Œ์ŠคํŠธ๋ฅผ ์žฌํ˜„ํ•˜๊ธฐ์— ์ถฉ๋ถ„ํ–ˆ์Šต๋‹ˆ๋‹ค.

์—ฐ๊ตฌ์›๋“ค์€ ์ถ”์šด ๋‚ ์”จ์— ์ถ”์›Œ์ง€๋ฉด ๊ฐ๊ธฐ์— ๊ฑธ๋ฆด ํ™•๋ฅ ์ด ๋†’์•„์ง€๋Š” ์ง€ ๊ถ๊ธˆํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ž˜์„œ ๊ทธ๋“ค์€ ๋ฌด์ž‘์œ„๋กœ 180 ๋ช…์˜ ํ•™์ƒ ๊ทธ๋ฃน์„ ๋‘ ๊ทธ๋ฃน์œผ๋กœ ๋‚˜๋ˆ•๋‹ˆ๋‹ค. ํ•œ ๊ทธ๋ฃน์€ ๋ฐœ์„ ์ฐฌ๋ฌผ์— 20 ๋ถ„ ๋™์•ˆ ๋ถ™๋“ค์–ด ์•ผํ–ˆ์Šต๋‹ˆ๋‹ค. ๋‹ค๋ฅธ ์‚ฌ๋žŒ์€ ์‹ ๋ฐœ์„ ์‹ ์—ˆ์Šต๋‹ˆ๋‹ค. ๋‚˜๋Š” ์žฌ๋ฏธ์žˆ๋Š” ์กฐ์ž‘์˜ ์ข…๋ฅ˜๋ผ๊ณ  ์ƒ๊ฐํ•˜์ง€๋งŒ, ๋‹ค๋ฅธ ํ•œํŽธ์œผ๋กœ๋Š” ๋‚˜๋Š” ์˜์‚ฌ๊ฐ€ ์•„๋‹ˆ๊ณ  ์•„๋งˆ๋„ ์˜์‚ฌ๋“ค์€ ์žฌ๋ฏธ ์žˆ๋‹ค๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค. ์œค๋ฆฌ์  ์ธ ๋ฌธ์ œ๋Š” ์ œ์ณ๋‘๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์–ด์จŒ๋“ , 5 ์ผ ํ›„, ์น˜๋ฃŒ ๊ทธ๋ฃน์˜ ํ•™์ƒ 13 ๋ช…์€ ๊ฐ๊ธฐ์— ๊ฑธ๋ ธ์ง€ ๋งŒ ๊ทธ๋ฃน์—์„œ 5 ๋ช…๋งŒ์ด ์‹ ๋ฐœ์„ ์‹ ์—ˆ์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ์ด ์‹คํ—˜์˜ ์Šน์‚ฐ ๋น„๋Š” 2.87์ž…๋‹ˆ๋‹ค.

๋‹ค์†Œ ์ž‘์€ ํ‘œ๋ณธ ํฌ๊ธฐ๋ฅผ ๊ฐ์•ˆํ•  ๋•Œ์ด ์ฐจ์ด๊ฐ€ ์ค‘์š”ํ•œ์ง€ ๊ถ๊ธˆํ•ด์ง€๊ธฐ ์‹œ์ž‘ํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ž˜์„œ ๋‘ ๊ฐ€์ง€ ํ…Œ์ŠคํŠธ๋ฅผ ์ˆ˜ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค.

๋จผ์ € ์ •๊ทœ ๊ทผ์‚ฌ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋น„์œจ์ด ๋™์ผํ•œ ์ง€ ๊ฐ„๋‹จํ•œ ํ…Œ์ŠคํŠธํ•ฉ๋‹ˆ๋‹ค. ์ด ํ…Œ์ŠคํŠธ๋Š” ์ด๊ณ  p = 0.0468 ์ž…๋‹ˆ๋‹ค. ์ œ ์ƒ๊ฐ ์—” ์ด๊ฒƒ์ด ์—ฐ๊ตฌ์›๋“ค์ด ํ…Œ์ŠคํŠธ ํ•œ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด๊ฒƒ์€ ์‹ค์ œ๋กœ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜์ด z ํ…Œ์ŠคํŠธ๋Š” ์ •์ƒ์ ์ธ ๊ทผ์‚ฌ๋กœ ์ธํ•ด ์‹ค์ˆ˜ํ•˜์ง€ ์•Š์€ ๊ฒฝ์šฐ ํฐ ์ƒ˜ํ”Œ์—์„œ๋งŒ ์œ ํšจํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ ์œ ๋ณ‘๋ฅ ์€ ๋‹ค์†Œ ์ž‘์œผ๋ฉฐ ์ด๊ฒƒ์ด ํšจ๊ณผ์˜ ์‹ ๋ขฐ ๊ตฌ๊ฐ„์˜ ์ ์šฉ๋ฅ ์— ์˜ํ–ฅ์„ ๋ฏธ์น˜์ง€ ์•Š์„์ง€ ๊ถ๊ธˆํ•ฉ๋‹ˆ๋‹ค.

z=1.988

p=0.0468

๊ทธ๋ž˜์„œ ๋‘ ๋ฒˆ์งธ ์‹œ๋„๋Š” Monte-Carlo ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ํ‘œ์ค€ Pearson Chi-square๋ฅผ ์‚ฌ์šฉํ•œ ์นด์ด ์ œ๊ณฑ ๋…๋ฆฝ ํ…Œ์ŠคํŠธ์˜€์Šต๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์— ์— ๋Œ€ํ•œ p- ๊ฐ’์ด ์žˆ์Šต๋‹ˆ๋‹ค .

p=.082

์ด์ œ๋Š” ๊ฒฐ๊ณผ์— ๋Œ€ํ•ด ๋ชจ๋‘ ์•ˆ์‹ฌํ•  ์ˆ˜๋Š” ์—†์Šต๋‹ˆ๋‹ค. ์ด ๋ฐ์ดํ„ฐ๋ฅผ ํ…Œ์ŠคํŠธํ•˜๋Š” ์˜ต์…˜์ด ๋” ์žˆ๊ณ  ๋‘ ํ…Œ์ŠคํŠธ์— ๋Œ€ํ•œ ๊ท€ํ•˜์˜ ์ƒ๊ฐ์ด ๋ฌด์—‡์ธ์ง€ ๊ถ๊ธˆํ–ˆ์Šต๋‹ˆ๋‹ค (ํŠนํžˆ ์ฒซ ๋ฒˆ์งธ, ์ค‘์š”ํ•œ ํ…Œ์ŠคํŠธ์˜ ๊ฐ€์ •).



๋‹ต๋ณ€

์ •๊ทœ ๊ทผ์‚ฌ ๋˜๋Š” ์นด์ด ์ œ๊ณฑ ๋Œ€์‹  ์ˆœ์—ด ํ…Œ์ŠคํŠธ ๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค . ์ˆœ์—ด ํ…Œ์ŠคํŠธ๋Š” ๋ฐ์ดํ„ฐ์— ๋”ฐ๋ผ ์ •ํ™•ํ•˜๊ณ  ๊ฐ€์žฅ ๊ฐ•๋ ฅํ•ฉ๋‹ˆ๋‹ค.

์ด ๊ฒฝ์šฐ ๊ทธ๋ฃน์˜ ๋ชจ๋“  ์ˆœ์—ด์„ ๊ณ„์‚ฐํ•  ์ˆ˜๋Š” ์—†์ง€๋งŒ ๋ฐ์ดํ„ฐ์˜ ์ž„์˜ ์ˆœ์—ด์„ ๋งŽ์ด ์ƒ์„ฑํ•˜๊ณ  ๋งค์šฐ ์ •ํ™•ํ•œ ๊ฐ’์„ ์–ป์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

group <- c(rep("A",90),rep("B",90))
n_a <- rep(0,100000)
for (i in 1:length(n_a)) {
   temp <- sample(group, size=18)
   n_a[i] <- sum(temp == "A")
}
> mean(n_a >= 13)
[1] 0.03904

์ด๋Š” p- ๊ฐ’์ด 0.039์ž„์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.

๊ทธ๋Ÿฌ๋‚˜, ๊ทธ๋Ÿฌ๋‚˜ ์ด๊ฒƒ์€ ํฌ์ง€ ๋งŒ ๊ฐ๊ธฐ์— ๊ฑธ๋ฆฌ๋Š” ๋Œ€์ƒ์ด ๋…๋ฆฝ์  ์ธ ์‚ฌ๊ฑด์ด๋ผ๋Š” ๊ฐ€์ •์ด ์œ„๋ฐ˜๋œ๋‹ค๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค. ์ด ์‚ฌ๋žŒ๋“ค์€ ์•„๋งˆ๋„ ๊ฐ™์€ ํ•™๊ต์—์žˆ๋Š” ํ•™์ƒ ์ผ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๊ทธ๋“ค ์ค‘ ๋‘ ๋ช…์ด ์ˆ˜์—…, ๊ธฐ์ˆ™์‚ฌ, ๋˜๋Š” ๋‹ค๋ฅธ ํ™œ๋™, ์‹๋‹น (๋‹ค์–‘ํ•œ ์‹๋‹น์ด์žˆ๋Š” ํ•™๊ต์—์„œ)์„ ๊ณต์œ ํ•œ๋‹ค๊ณ  ์ƒ์ƒํ•ด๋ณด์‹ญ์‹œ์˜ค. โ€œ# 1 ๊ฐ๊ธฐโ€์ด๋ฒคํŠธ์™€ โ€œ# 2 ๊ฐ๊ธฐโ€์ด๋ฒคํŠธ๋Š” ๋…๋ฆฝ์ ์ด์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ํ•œ ํ•™์ƒ์ด โ€œ์ด ์‹คํ—˜์— ๋“ฑ๋กํ•˜์ž!โ€๋ผ๊ณ  ๋งํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฃธ๋ฉ”์ดํŠธ ๋‚˜ ์นœ๊ตฌ์—๊ฒŒ; ๊ต์ˆ˜๋“ค์ด ๊ฐ€๋ฅด์นœ ์ˆ˜์—…์—์„œ ํ•™์ƒ๋“ค์ด ๋ชจ์ง‘๋˜์—ˆ๋‹ค๊ณ  ์ƒ์ƒํ•  ์ˆ˜์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ๋…๋ฆฝ์˜ ๊ฐ€์ •์ด ์œ„๋ฐ˜๋˜๋Š” ๋งŽ์€ ๋ฐฉ๋ฒ•์„ ์ƒ์ƒํ•  ์ˆ˜์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ์•„๋งˆ ๋‚ด๊ฐ€ ์ฝ์ง€ ์•Š์€ ๋…ผ๋ฌธ์€ ์ด๊ฒƒ๋“ค ์ค‘ ์ผ๋ถ€๋ฅผ ๋‹ค๋ฃจ๊ณ  ์žˆ์ง€๋งŒ, ๊ทธ๊ฒƒ๋“ค์ด ์–ด๋–ป๊ฒŒ ๊ทธ๊ฒƒ๋“ค์„ ๋‹ค๋ฃฐ ์ˆ˜ ์žˆ๋Š”์ง€๋Š”๋ณด๊ธฐ ํž˜๋“ค์ง€๋งŒ,


๋‹ต๋ณ€

z

ฯ‡2

z

z

z

t

t

z

z

N

91ร—91=1,729

N=180

z

ฯ‡2

ฯ‡2

ฯ‡2

z

ฯ‡2

ฯ‡2

z

z

z

ฯ‡2

๋‹ต๋ณ€