νƒœκ·Έ 보관물: descriptive-statistics

descriptive-statistics

λ²”μœ„μ™€ ν‘œμ€€ 편차의 관계 의 ν‘œμ€€ νŽΈμ°¨μ— λŒ€ν•œ

κΈ°μ‚¬μ—μ„œ ν‘œλ³Έ 크기 의 ν‘œμ€€ νŽΈμ°¨μ— λŒ€ν•œ 곡식을 μ°Ύμ•˜μŠ΅λ‹ˆλ‹€.

N

Οƒ=RΒ―2.534

μ—¬κΈ°μ„œ 은 κΈ°λ³Έ μƒ˜ν”Œ 의 ν•˜μœ„ μƒ˜ν”Œ (크기 ) 의 평균 λ²”μœ„μž…λ‹ˆλ‹€ . 숫자 λŠ” μ–΄λ–»κ²Œ κ³„μ‚°λ©λ‹ˆκΉŒ? 이것은 μ •ν™•ν•œ μˆ«μžμž…λ‹ˆκΉŒ?

RΒ―

6

2.534


λ‹΅λ³€

μƒ˜ν”ŒκΈ°λ‘œμ—μ„œ 의 λΆ„ν¬λ‘œλΆ€ν„° 독립 κ°’ 의 PDF와 , κ·Ήλ‹¨μ˜ 쑰인트 뢄포 PDF κ³Ό 에 λΉ„λ‘€n F f min ( x ) = x [ 1 ] μ΅œλŒ€ ( x ) = x [ n ]

x

n

F

f

min(x)=x[1]

max(x)=x[n]

f(x[1])(F(x[n])βˆ’F(x[1]))nβˆ’2f(x[n])dx[1]dx[n]=HF(x[1],x[n])dx[1]dx[n].

(λΉ„μœ¨ μƒμˆ˜λŠ” 닀항식 κ³„μˆ˜ 의 μ—­μˆ˜μž…λ‹ˆλ‹€ . μ§κ΄€μ μœΌλ‘œμ΄ 쑰인트 PDFλŠ” λ²”μœ„μ—μ„œ κ°€μž₯ μž‘μ€ 값을 찾을 κ°€λŠ₯성을 λ‚˜νƒ€λƒ…λ‹ˆλ‹€. , λ²”μœ„μ—μ„œ κ°€μž₯ 큰 κ°’ 및 λ²”μœ„ λ‚΄ μ—μ„œ 쀑간 κ°’ μž…λ‹ˆλ‹€. κ°€ 연속적 일 λ•Œ , μš°λ¦¬λŠ” κ·Έ 쀑간 λ²”μœ„λ₯Ό λŒ€μ²΄ ν•˜μ—¬ β€œλ¬΄ν•œβ€ν™•λ₯  만 λ¬΄μ‹œν•  수 μžˆμŠ΅λ‹ˆλ‹€. μžˆλŠ”[x[1],x[1]+dx[1])[x[n],x[n]+dx[n])nβˆ’2[x[1]+dx[

(n1,nβˆ’2,1)=n(nβˆ’1)

[x[1],x[1]+dx[1])

[x[n],x[n]+dx[n])

nβˆ’2

F( x [ 1 ] , x [ n ] ]f( x [ 1 ] )d x [ 1 ] ,f( x [ n ] )d x [ n ] ,

[x[1]+dx[1],x[n])

F

(x[1],x[n]]

f(x[1])dx[1],

f(x[n])dx[n],

및 , 이제 κ³΅μ‹μ˜ 좜처λ₯Ό μ•Œ 수 μžˆμŠ΅λ‹ˆλ‹€.)

F(x[n])βˆ’F(x[1]),

λ²”μœ„λ₯Ό μ˜ˆμƒν•˜λ©΄ ν‘œμ€€ 편차 및 μ •κ·œ 뢄포에 λŒ€ν•΄ 제곡 λ©λ‹ˆλ‹€. 의 배수둜 μ˜ˆμƒλ˜λŠ” λ²”μœ„ λŠ” μƒ˜ν”Œ 크기 에 따라 λ‹€λ¦…λ‹ˆλ‹€ . 2.53441 Οƒ Οƒ N = 6 Οƒμ˜ N

x[n]βˆ’x[1]

2.53441Β Οƒ

Οƒ

n=6

Οƒ

n

μ΄λŸ¬ν•œ 값은 λ₯Ό 에 수치 적으둜 ν†΅ν•©ν•˜μ—¬ κ³„μ‚°λ˜μ—ˆμŠ΅λ‹ˆλ‹€. 와 ν‘œμ€€ μ •κ·œ CDF으둜 μ„€μ •ν•˜κ³  ν‘œμ€€ 편차둜 λ‚˜λˆˆ (κ·Έλƒ₯ ).{(x,y)∈R2| x≀y}FF1

(n1,nβˆ’2,1)(yβˆ’x)HF(x,y)dxdy

{(x,y)∈R2|x≀y}

F

F

1

μ˜ˆμƒ λ²”μœ„μ™€ ν‘œμ€€ 편차 μ‚¬μ΄μ˜ μœ μ‚¬ν•œ κ³±μ…ˆ κ΄€κ³„λŠ” λΆ„ν¬μ˜ ν˜•νƒœ λ§ŒμœΌλ‘œλ„ νŠΉμ„±μ΄ 있기 λ•Œλ¬Έμ— λͺ¨λ“  μœ„μΉ˜ 규λͺ¨ 뢄포에 λŒ€ν•΄ μœ μ§€λ©λ‹ˆλ‹€ . 예λ₯Ό λ“€μ–΄, 균일 뢄포에 λŒ€ν•œ 비ꡐ κ°€λŠ₯ν•œ λ„ν‘œλŠ” λ‹€μŒκ³Ό κ°™μŠ΅λ‹ˆλ‹€.

μ§€μˆ˜ 뢄포 :

μ•žμ˜ 두 λ„ν‘œμ˜ 값은 μˆ«μžκ°€ μ•„λ‹Œ μ •ν™•ν•œ 적뢄에 μ˜ν•΄ μ–»μ–΄μ‘ŒμœΌλ©°, μ΄λŠ” 각각의 κ²½μš°μ— 비ꡐ적 κ°„λ‹¨ν•œ λŒ€μˆ˜ ν˜•νƒœμ˜ 와 둜 인해 κ°€λŠ₯ν•©λ‹ˆλ‹€ . 균일 λΆ„ν¬μ˜ 경우 와 κ°™κ³  μ§€μˆ˜ λΆ„ν¬μ˜ 경우 μ—¬κΈ°μ„œ λŠ” 였일러 μƒμˆ˜μ΄κ³  λŠ” 였일러 감마 ν•¨μˆ˜μ˜ 둜그 νŒŒμƒ 인 β€œν΄λ¦¬ κ°λ§ˆβ€ν•¨μˆ˜μž…λ‹ˆλ‹€.F n – 1

f

F

nβˆ’1(n+1)12

Ξ³+ψ(n)=Ξ³+Ξ“β€²(n)Ξ“(n)

Ξ³

ψ

그것듀은 (이 뢄포가 넓은 λ²”μœ„μ˜ λͺ¨μ–‘을 λ‚˜νƒ€ λ‚΄κΈ° λ•Œλ¬Έμ—) λ‹€λ₯΄μ§€λ§Œ, 3은 λŒ€λž΅ λ™μ˜ ν•˜λ©°, κ³±μ…ˆκΈ° λŠ” λͺ¨μ–‘에 크게 μ˜μ‘΄ν•˜μ§€ μ•ŠμœΌλ―€λ‘œ ν‘œμ€€ νŽΈμ°¨μ— λŒ€ν•œ μ˜΄λ‹ˆλ²„μŠ€, κ°•λ ₯ν•œ ν‰κ°€λ‘œ μž‘μš©ν•  수 μžˆμŒμ„ λ³΄μ—¬μ€λ‹ˆλ‹€ μž‘μ€ μ„œλΈŒ μƒ˜ν”Œμ˜ λ²”μœ„κ°€ μ•Œλ €μ§„ 경우. (사싀, μžμœ λ„κ°€ 3 인 맀우 λ‘κΊΌμš΄ κΌ¬λ¦¬κ°€μžˆλŠ” 슀튜던트 λΆ„ν¬λŠ” μ—¬μ „νžˆ μ—μ„œ λ©€μ§€ μ•Šμ€ λŒ€ν•΄ 의 배수 μ§‘λ‹ˆλ‹€.)

n=6

2.5

t

2.3

n=6

2.5

λ‹΅λ³€

이 κ·Όμ‚¬λŠ” μ‹€μ œ ν‘œλ³Έ ν‘œμ€€ νŽΈμ°¨μ— 맀우 κ°€κΉμŠ΅λ‹ˆλ‹€. λ‚˜λŠ” 그것을 μ„€λͺ…ν•˜κΈ° μœ„ν•΄ λΉ λ₯Έ R 슀크립트λ₯Ό μž‘μ„±ν–ˆμŠ΅λ‹ˆλ‹€.

x = sample(1:10000,6000,replace=TRUE)

B = 100000
R = rep(NA,B)
for(i in 1:B){
    samp = sample(x,6)
    R[i] = max(samp)-min(samp)
}

mean(R)/2.534

sd(x)

κ²°κ³ΌλŠ” λ‹€μŒκ³Ό κ°™μŠ΅λ‹ˆλ‹€.

> mean(R)/2.534
[1] 2819.238
>
> sd(x)
[1] 2880.924

이제 μ™œ 이것이 μž‘λ™ν•˜λŠ”μ§€ 잘 λͺ¨λ₯΄κ² μ§€λ§Œ 적어도 근사값이 (μ•‘λ©΄κ°€) λΉ„μŠ·ν•΄ λ³΄μž…λ‹ˆλ‹€.

νŽΈμ§‘ : μ™œ 이것이 μž‘λ™ν•˜λŠ”μ§€μ— λŒ€ν•œ @Whuber의 μ˜ˆμ™Έμ  인 μ˜κ²¬μ„ μ°Έμ‘°ν•˜μ‹­μ‹œμ˜€


λ‹΅λ³€