태그 보관물: data-visualization

data-visualization

QQ 플롯 해석 코드 및 출력을

다음 코드 및 출력을 고려하십시오.

  par(mfrow=c(3,2))
  # generate random data from weibull distribution
  x = rweibull(20, 8, 2)
  # Quantile-Quantile Plot for different distributions
  qqPlot(x, "log-normal")
  qqPlot(x, "normal")
  qqPlot(x, "exponential", DB = TRUE)
  qqPlot(x, "cauchy")
  qqPlot(x, "weibull")
  qqPlot(x, "logistic")

여기에 이미지 설명을 입력하십시오

로그 노멀에 대한 QQ 플롯은 weibull에 대한 QQ 플롯과 거의 같은 것으로 보입니다. 어떻게 구별 할 수 있습니까? 또한 점이 두 개의 외부 검은 선으로 정의 된 영역 내에있는 경우 지정된 분포를 따른다는 것을 나타 냅니까?



답변

여기에 몇 가지 이야기가 있습니다.

  1. 의 CDF의 모양 로그 정상은 의 CDF의 모양과 유사 충분하다 이블 그들이 열심히 이블과 다른 사람 사이의 유사성의 수준보다 구별 할 수 있도록.
  2. 바깥 쪽 검은 색 선은 신뢰 대역을 형성합니다 . 추론에서 신뢰 구간을 사용하는 것은 다른 표준 형식의 Frequentist 통계 추론과 동일합니다. 즉, 값이 대역 내에 속할 때 우리는 위치 분포가 올바른 분포라는 귀무 가설을 기각 할 수 없습니다. 이것은 우리 가 posited 분포가 올바른 것임을 알고 있다는 것과 다릅니다 . (이것은 제가 다른 답변에서 논의 된 것의 좋은 예입니다 것을 참고 여기 가설 검정에 Fisherian 관점은 Neyman – 피어슨 것이 바람직 할 것입니다 상황의이.)

  3. N


답변

로그 노멀에 대한 QQ 플롯은 weibull에 대한 QQ 플롯과 거의 같은 것으로 보입니다.

예.

어떻게 구별 할 수 있습니까?

그 샘플 크기에서는 그렇지 않을 것입니다.

또한 점이 두 개의 외부 검은 선으로 정의 된 영역 내에있는 경우 지정된 분포를 따른다는 것을 나타 냅니까?

아니요. 데이터 분포가 해당 분포와 다르다는 것을 알 수 없음을 나타냅니다. 차이의 증거가 아니라 차이의 증거가 없습니다.

당신은 데이터가 당신이 생각했던 것들 중 하나를하지 않은 분포 것을 거의 확신 할 수 있습니다 (왜 것 바로 그의에서?).


답변