descriptive-statistics Archives - Page 3 of 5

기사에서 표본 크기 의 표준 편차에 대한 공식을 찾았습니다. $N$

$σ = \frac{\bar{R}}{2.534}$

σ=R¯2.534

여기서 은 기본 샘플 의 하위 샘플 (크기 ) 의 평균 범위입니다 . 숫자 는 어떻게 계산됩니까? 이것은 정확한 숫자입니까? $\bar{R}$

R¯

$6$

$2.534$

2.534

답변

샘플기로에서 의 분포로부터 독립 값 의 PDF와 , 극단의 조인트 분포 PDF 과 에 비례 $x$

$n$

$F$

$f$

$min (x) = x_{[1]}$

min(x)=x[1]

$max (x) = x_{[n]}$

max(x)=x[n]

f (x [1]) (F (x [n]) - F (x [1])) n - 2 f (x [n]) d x [1] d x [n] = H F (x [1], x [n]) d x [1] d x [n] .

(비율 상수는 다항식 계수 의 역수입니다 . 직관적으로이 조인트 PDF는 범위에서 가장 작은 값을 찾을 가능성을 나타냅니다. , 범위에서 가장 큰 값 및 범위 내 에서 중간 값 입니다. 가 연속적 일 때 , 우리는 그 중간 범위를 대체 하여 “무한”확률 만 무시할 수 있습니다. 있는 $(\binom{n}{1, n - 2, 1}) = n (n - 1)$

(n1,n−2,1)=n(n−1)

$[x_{[1]}, x_{[1]} + d x_{[1]})$

[x[1],x[1]+dx[1])

$[x_{[n]}, x_{[n]} + d x_{[n]})$

[x[n],x[n]+dx[n])

$n - 2$

n−2

$[x_{[1]} + d x_{[1]}, x_{[n]})$

[x[1]+dx[1],x[n])

$F$

$(x_{[1]}, x_{[n]}]$

(x[1],x[n]]

$f (x_{[1]}) d x_{[1]},$

f(x[1])dx[1],

$f (x_{[n]}) d x_{[n]},$

f(x[n])dx[n],

및 , 이제 공식의 출처를 알 수 있습니다.) $F (x_{[n]}) - F (x_{[1]}),$

F(x[n])−F(x[1]),

범위를 예상하면 표준 편차 및 정규 분포에 대해 제공 됩니다. 의 배수로 예상되는 범위 는 샘플 크기 에 따라 다릅니다 . $x_{[n]} - x_{[1]}$

x[n]−x[1]

$2.53441 σ$

2.53441 σ

$σ$

$n = 6$

n=6

$σ$

$n$

이러한 값은 를 에 수치 적으로 통합하여 계산되었습니다. 와 표준 정규 CDF으로 설정하고 표준 편차로 나눈 (그냥 ). $(\binom{n}{1, n - 2, 1}) (y - x) H_{F} (x, y) d x d y$

(n1,n−2,1)(y−x)HF(x,y)dxdy

${(x, y) \in R^{2} | x \leq y}$

{(x,y)∈R2|x≤y}

$F$

$1$

예상 범위와 표준 편차 사이의 유사한 곱셈 관계는 분포의 형태 만으로도 특성이 있기 때문에 모든 위치 규모 분포에 대해 유지됩니다 . 예를 들어, 균일 분포에 대한 비교 가능한 도표는 다음과 같습니다.

지수 분포 :

앞의 두 도표의 값은 숫자가 아닌 정확한 적분에 의해 얻어졌으며, 이는 각각의 경우에 비교적 간단한 대수 형태의 와 로 인해 가능합니다 . 균일 분포의 경우 와 같고 지수 분포의 경우 여기서 는 오일러 상수이고 는 오일러 감마 함수의 로그 파생 인 “폴리 감마”함수입니다. $f$

$F$

$\frac{n - 1}{(n + 1)} \sqrt{12}$

n−1(n+1)12

$γ + ψ (n) = γ + \frac{Γ^{'} (n)}{Γ (n)}$

γ+ψ(n)=γ+Γ′(n)Γ(n)

$γ$

$ψ$

그것들은 (이 분포가 넓은 범위의 모양을 나타 내기 때문에) 다르지만, 3은 대략 동의 하며, 곱셈기 는 모양에 크게 의존하지 않으므로 표준 편차에 대한 옴니버스, 강력한 평가로 작용할 수 있음을 보여줍니다 작은 서브 샘플의 범위가 알려진 경우. (사실, 자유도가 3 인 매우 두꺼운 꼬리가있는 스튜던트 분포는 여전히 에서 멀지 않은 대해 의 배수 집니다.) $n = 6$

n=6

$2.5$

2.5

$t$

$2.3$

2.3

$n = 6$

n=6

$2.5$

2.5

답변

이 근사는 실제 표본 표준 편차에 매우 가깝습니다. 나는 그것을 설명하기 위해 빠른 R 스크립트를 작성했습니다.

x = sample(1:10000,6000,replace=TRUE)

B = 100000
R = rep(NA,B)
for(i in 1:B){
    samp = sample(x,6)
    R[i] = max(samp)-min(samp)
}

mean(R)/2.534

sd(x)

결과는 다음과 같습니다.

> mean(R)/2.534
[1] 2819.238
>
> sd(x)
[1] 2880.924

이제 왜 이것이 작동하는지 잘 모르겠지만 적어도 근사값이 (액면가) 비슷해 보입니다.

편집 : 왜 이것이 작동하는지에 대한 @Whuber의 예외적 인 의견을 참조하십시오

답변

Exit mobile version

How IT

언제든지 물어보세요.

태그 보관물: descriptive-statistics

범위와 표준 편차의 관계 의 표준 편차에 대한

답변

답변

답변