카테고리 보관물: stats

stats

데이터 샘플이 감마 분포 제품군에 적합한 지 테스트하는 방법은 무엇입니까? X의 분포가

연속 랜덤 변수 X에서 생성 된 데이터 샘플이 있습니다. R을 사용하여 그린 막대 그래프에서 X의 분포가 특정 감마 분포를 따르는 것 같습니다. 그러나 나는이 감마 분포의 정확한 매개 변수를 모른다.

내 질문은 X 분포가 감마 분포 군에 속하는지 테스트하는 방법입니다. Kolmogorov-Smirnov 검정, Anderson-Darling 검정 등과 같은 적합도 검정이 있지만 이러한 검정을 사용할 때의 제한 중 하나는 이론적 분포의 매개 변수를 미리 알아야한다는 것입니다. 누구 든지이 문제를 해결하는 방법을 알려주시겠습니까?



답변

이 질문은 히스토그램 비교가 아니라 정확한 통계 테스트를 요구한다고 생각합니다. 사용시 추정 파라미터와 콜 모고 로프 – 스 미르 노프 테스트를 전혀 추정 파라미터의 경우와 달리, 귀무 하의 테스트 통계 분포는 테스트 분포에 의존한다. 예를 들어 (R에서)

x <- rnorm(100)
ks.test(x, "pnorm", mean=mean(x), sd=sd(x))

~으로 이끌다

        One-sample Kolmogorov-Smirnov test

data:  x
D = 0.0701, p-value = 0.7096
alternative hypothesis: two-sided

우리가 얻는 동안

> ks.test(x, "pnorm")

        One-sample Kolmogorov-Smirnov test

data:  x
D = 0.1294, p-value = 0.07022
alternative hypothesis: two-sided

동일한 샘플 x에 대해. 따라서 유의성 수준 또는 p- 값은 null 하에서 Monte Carlo 시뮬레이션에 의해 결정되어야하며, 추정 된 분포 하에서 시뮬레이션 된 표본에서 Kolmogorov-Smirnov 통계의 분포를 생성해야합니다 (관찰 된 표본이 주어진 경우 결과에 약간의 근사치가 있음) null 아래에서도 다른 분포에서 비롯됩니다.


답변

데이터에 대한 감마 분포를 가정하고 매개 변수의 MLE을 계산하고 이론 밀도를 데이터의 히스토그램과 비교하십시오. 둘이 매우 다른 경우 감마 분포는 데이터의 근사치입니다. 공식적인 검정의 경우, 가장 적합한 감마 분포를 경험적 분포 및 유의성 검정과 비교하여 Kolmogorov-Smirnoff 검정 통계량을 계산할 수 있습니다.


답변