νƒœκ·Έ 보관물: standard-deviation

standard-deviation

ν‘œμ€€ 편차λ₯Ό μ¦κ°€μ‹œν‚€λŠ” κ°€μΉ˜ 인 값을

λ‚˜λŠ” λ‹€μŒ μ§„μˆ μ— λ‹Ήν™©ν–ˆλ‹€.

β€œμˆ«μž μ§‘ν•©μ˜ ν‘œμ€€ 편차λ₯Ό 증가 μ‹œν‚€λ €λ©΄ ν‰κ· μ—μ„œ 두 개 μ΄μƒμ˜ ν‘œμ€€ 편차 인 값을 μΆ”κ°€ν•΄μ•Όν•©λ‹ˆλ‹€.”

κ·Έ 증거 λŠ” λ¬΄μ—‡μž…λ‹ˆκΉŒ ? λ¬Όλ‘  ν‘œμ€€ 편차λ₯Ό μ •μ˜ν•˜λŠ” 방법을 μ•Œκ³  μžˆμ§€λ§Œ κ·Έ 뢀뢄은 μ–΄λ–»κ²Œ λ“  κ·Έλ¦¬μ›Œν•©λ‹ˆλ‹€. λ‹€λ₯Έν•˜μ‹€ 말씀 μžˆλ‚˜μš”?



λ‹΅λ³€

λ“€λ©΄ λͺ¨λ“  번호 평균이
ν•¨μœΌλ‘œμ¨, λΆ„μ‚° μ£Όμ–΄μ§„λ‹€

적용 쀑 μ£Όμ–΄μ§„ 숫자 집합에
λŒ€ν•΄ 평균 μ΄λΌλŠ” λ°•λžŒνšŒμ˜ 편의λ₯Ό μœ„ν•΄ μ·¨ ν•©λ‹ˆλ‹€.
y 1 , y 2 , … , y N Λ‰ y = 1

N

y1,y2,…,yN

Οƒ 2

yΒ―=1Nβˆ‘i=1Nyi

(1)nx1,x2,…xnΛ‰x=0Οƒ2=1

Οƒ2=1Nβˆ’1βˆ‘i=1N(yiβˆ’yΒ―)2=1Nβˆ’1βˆ‘i=1N(yi2βˆ’2yiyΒ―+yΒ―2)=1Nβˆ’1[(βˆ‘i=1Nyi2)βˆ’2N(yΒ―)2+N(yΒ―)2](1)Οƒ2=1Nβˆ’1βˆ‘i=1N(yi2βˆ’(yΒ―)2)

(1)

n

x1,x2,…xn

xΒ―=0

Οƒ2=1nβˆ’1βˆ‘i=1n(xi2βˆ’(xΒ―)2)=1nβˆ’1βˆ‘i=1nxi2


이제이 데이터 μ„ΈνŠΈμ— μƒˆλ‘œμš΄ κ΄€μΈ‘ κ°’ 을 μΆ”κ°€ν•˜λ©΄ 데이터 μ„ΈνŠΈμ˜ μƒˆλ‘œμš΄ 평균은

λ™μ•ˆ μƒˆ 뢄산은

λ”°λΌμ„œλ³΄λ‹€ μ»€μ•Όν•œλ‹€

xn+1

1n+1βˆ‘i=1n+1xi=nxΒ―+xn+1n+1=xn+1n+1

Οƒ^2=1nβˆ‘i=1n+1(xi2βˆ’xn+12(n+1)2)=1n[((nβˆ’1)Οƒ2+xn+12)βˆ’xn+12n+1]=1n[(nβˆ’1)Οƒ2+nn+1xn+12]>Οƒ2 only if xn+12>n+1nΟƒ2.

|xn+1|

Οƒ1+1n


λ˜λŠ”λ³΄λ‹€ 일반적으둜 은 μ΄μƒμœΌλ‘œ μ›λž˜ 데이터 μ„ΈνŠΈ 의 평균 와 보강 된 데이터 μ„ΈνŠΈκ°€ μ›λž˜ 데이터 μ„ΈνŠΈλ³΄λ‹€ 더 큰 뢄산을 가지도둝 . μƒˆλ‘œμš΄ νŽΈμ°¨κ°€λ³΄λ‹€ 크닀고 지적 레이 μΏ ν”„μ˜ λŒ€λ‹΅μ€, λ™μΌν•˜κ±°λ‚˜λ³΄λ‹€ μž‘μ€, 일본어 λΆ„μ‚°λΏλ§Œμžˆμ–΄μ„œ μ°Έμ‘°
미만 μ΄μƒμœΌλ‘œ 평균 상이을 μ •ν™•νžˆ λ˜λŠ” .

xn+1

xΒ―

Οƒ1+1n

xn+1

Οƒ1+1n


λ‹΅λ³€

수수께끼 μ§„μˆ μ€ ν‘œμ€€ νŽΈμ°¨κ°€ μ¦κ°€ν•˜κΈ° μœ„ν•΄ ν•„μš”ν•˜μ§€λ§Œ λΆˆμΆ©λΆ„ ν•œ 쑰건을 μ œκ³΅ν•©λ‹ˆλ‹€. 이전 μƒ˜ν”Œ 크기이면 , 기쑴의 평균은 μ΄μ „μ˜ ν‘œμ€€ 편차이고, , μƒˆλ‘œμš΄ ν¬μΈνŠΈλŠ” , μƒˆλ‘œμš΄ ν‘œμ€€ νŽΈμ°¨λŠ” λ™μΌν•˜κ±°λ‚˜λ³΄λ‹€ 큰,보닀 될 데이터에 μΆ”κ°€ ν•­ 둜 보닀 μž‘κ±°λ‚˜ κ°™μŠ΅λ‹ˆλ‹€ .

n

m

s

x

s

|xβˆ’m|

s1+1/n

λ‹΅λ³€

λŒ€μˆ˜λ₯Ό μ œμ™Έν•˜κ³  (이것도 μž‘λ™ν•©λ‹ˆλ‹€) λ‹€μŒκ³Ό 같이 μƒκ°ν•˜μ‹­μ‹œμ˜€. ν‘œμ€€ νŽΈμ°¨λŠ” λΆ„μ‚°μ˜ μ œκ³±κ·Όμž…λ‹ˆλ‹€. 뢄산은 ν‰κ· μ—μ„œ 제곱 거리의 ν‰κ· μž…λ‹ˆλ‹€. 이보닀 평균에 κ°€κΉŒμš΄ 값을 μΆ”κ°€ν•˜λ©΄ 뢄산이 쀄어 λ“­λ‹ˆλ‹€. 이 값보닀 ν‰κ· μ—μ„œ 더 큰 값을 μΆ”κ°€ν•˜λ©΄ 값이 μ»€μ§‘λ‹ˆλ‹€.

이것은 μŒμˆ˜κ°€ μ•„λ‹Œ λͺ¨λ“  평균 값에 ν•΄λ‹Ήλ©λ‹ˆλ‹€. 평균보닀 높은 값을 μΆ”κ°€ν•˜λ©΄ 평균이 μ¦κ°€ν•©λ‹ˆλ‹€. 더 μž‘μ€ 값을 μΆ”κ°€ν•˜λ©΄ κ°μ†Œν•©λ‹ˆλ‹€.


λ‹΅λ³€

λ‚˜λŠ” 당신이 λŒ€μˆ˜ν•™μ„ μ‹œμž‘ν•˜κ²Œ ν•  κ²ƒμ΄μ§€λ§Œ, 그것을 μ™„μ „νžˆ λ°›μ•„λ“€μ΄μ§€λŠ” μ•Šμ„ κ²ƒμž…λ‹ˆλ‹€. λ¨Όμ € 평균을 λΉΌκ³  ν‘œμ€€ 편차 ( λ‚˜λˆ„μ–΄ 데이터λ₯Ό ν‘œμ€€ν™”ν•˜μ‹­μ‹œμ˜€ κ°€ ν‰κ· μ˜ ν•˜λ‚˜μ˜ ν‘œμ€€ 편차 내에 있으면 λŠ” -1κ³Ό 1 μ‚¬μ΄μž…λ‹ˆλ‹€. κ°€ μ •ν™•νžˆ ν‰κ· μ—μ„œ sd λ–¨μ–΄μ§„ 경우 ZλŠ” 1 μž…λ‹ˆλ‹€. 그런 λ‹€μŒ, ν‘œμ€€ νŽΈμ°¨μ— λŒ€ν•œ λ°©μ •μ‹μ—μ„œ 보면 : μ–΄λ–»κ²Œλ©λ‹ˆκΉŒ 경우 사이 -1 그리고 1?xZxΟƒ=√

Z=xβˆ’ΞΌΟƒ.

x

Z

x

ΟƒZN

Οƒ=βˆ‘i=1NZi2Nβˆ’1

Οƒ

ZN


λ‹΅λ³€