태그 보관물: hypothesis-testing

hypothesis-testing

경험적 베이는 어떻게 유효합니까? 책인 Empirical Bayes를 읽었습니다

그래서 나는 훌륭한 책인 Empirical Bayes를 읽었습니다 . 나는 그 책이 훌륭하다고 생각했지만, 데이터로부터 사전 구축은 잘못되었다고 느꼈다. 분석 계획을 세우고 데이터를 수집 한 다음 분석 계획에서 이전에 결정한 가설을 테스트하도록 훈련했습니다. 이미 수집 한 데이터에 대한 분석을 수행 할 때 “유의 한”항목에 ​​대해 훨씬 더 엄격해야하는 선택 후 추론을 수행 할 수 있습니다 ( 여기 참조) . 머신 러닝에는 “체리 피킹”이라고하는 비슷한 것이 있는데, 이는 테스트 및 트레이닝 세트를 설정하기 전에 예측자를 선택하는 것을 의미합니다 ( 통계학 학습 ).

내가 이전에 배운 것을 감안할 때, 경험적 베이 즈는 약한 기초를 기반으로하는 것 같습니다. 사람들이 데이터를 수동적으로 생성 한 설정에서만 사용합니까? 그렇다면, 이것은 타당 할 수 있지만 엄격한 실험 설계를 할 때 그것을 사용하는 것이 옳지 않은 것처럼 보이지만 Brad Efron은 생물 통계학, 특히 NHST 분야에 대해 경험적 베이를 사용한다는 것을 알고 있습니다.

내 질문은 :

  1. 경험적 베이는 어떻게 유효합니까?
  2. 어떤 상황에서 사용됩니까?
  3. 어떤 상황에서 경험적인 Bayes 접근 방식을 사용하지 말아야하며 그 이유는 무엇입니까?
  4. 사람들이 생물 통계학 이외의 분야에서 사용하고 있습니까? 그렇다면 어떤 상황에서 사용하고 있습니까?


답변

저는 다른 방법들이 다른 것들에 좋다는 것을 기억하는 것이 중요하다고 생각합니다. 그리고 유의성 테스트가 통계 세계에있는 것은 아닙니다.

1과 3) EB는 아마도 유효한 가설 검정 절차는 아니지만 의도하지도 않습니다.

유효성은 여러 가지 일 수 있지만 엄격한 실험 설계에 대해 이야기하고 있으므로 특정 장기 빈도로 올바른 결정을 내리는 데 도움이되는 가설 테스트에 대해 논의하고 있습니다. 이것은 엄격하게 이분법적인 예 / 아니오 정권이며, 예 / 아니오 유형 결정을 내려야하는 사람들에게 주로 유용합니다. 매우 똑똑한 사람들에 의해 이것에 관한 많은 고전적인 작업이 실제로 있습니다. 이러한 방법은 모든 가정이 적용되는 것으로 가정하고 한계에 대한 이론적 타당성이 우수합니다. & c. 그러나 EB는 확실히 이것을위한 것이 아닙니다. 고전적인 NHST 방법의 기계를 원한다면 고전적인 NHST 방법을 고수하십시오.


2) EB는 유사하고 다양한 수량을 추정하는 문제에 가장 적합합니다.

Efron 은 통계 역사의 세 가지 뚜렷한 시대를 나열한 책 ‘ 대규모 추론 ‘을 열었습니다 .

[과학] 대량 생산 시대, 마이크로 어레이로 대표되는 새로운 기술은 단일 과학자 팀이 Quetelet이 부러워 할만한 크기의 데이터 세트를 생성 할 수 있도록합니다. 그러나 이제 데이터의 홍수는 통계학자가 함께 답변해야한다는 수천 가지 추정 또는 가설 테스트와 같은 많은 질문을 동반합니다. 클래식 마스터가 생각한 것은 아닙니다.

그는 계속한다 :

본질적으로 경험적인 Bayes 논증은 반복적 인 구조의 문제를 분석하는 데 빈번한 요소와 Bayesian 요소를 결합합니다. 반복 된 구조는 과학적 대량 생산이 예를 들어, 마이크로 어레이를 통해 동시에 수천 개의 유전자에 대한 병든 건강한 대상을 비교하는 발현 수준에서 탁월합니다.

아마도 가장 성공적인 최신 EB 응용 프로그램은 Bioconductorlimma 에서 구할 수 있습니다 . 이것은 수만 개의 유전자에 걸친 두 연구 그룹 사이의 차등 발현 (즉, 마이크로 어레이)을 평가하기위한 방법을 갖는 R- 패키지이다. Smyth는 EB 분석법이 일반적인 유전자 별 t- 통계량을 계산하는 것보다 자유도가 더 높은 t- 통계량을 산출 함을 보여줍니다. 여기서 EB를 사용하는 것은 “추정 된 표본 분산이 풀링 된 추정치로 축소되어 배열 수가 적을 때 훨씬 더 안정적인 추론을 초래하는 것과 같습니다”라고 종종 말합니다.

Efron이 위에서 지적했듯이 이것은 고전적인 NHST가 개발 된 것과는 다르며 일반적으로 확인보다 설정이 더 탐색 적입니다.


4) 일반적으로 EB를 수축 방법으로 볼 수 있으며 수축이 유용한 모든 곳에서 유용 할 수 있습니다

limma위 의 예는 수축을 언급합니다. Charles Stein은 세 가지 이상의 평균을 추정 할 때 관측 된 평균 사용하는 것보다 더 나은 추정기가 있다는 놀라운 결과를 우리에게 제공했습니다 . 제임스 – 스타 추정기 형태를 갖는다 와 및 상수. 이 추정기는 관측 된 평균을 0으로 , 를 균일하게 낮은 위험도로 사용하는 것보다 낫습니다 .

엑스1,...,엑스케이

θ^나는J에스=(1−기음/에스2)엑스나는,

에스2=∑j=1케이엑스j,

기음

엑스나는

Efron과 Morris는 합동 평균 로 축소 한 결과도 비슷한 결과를 보 였으며 이는 EB 추정치입니다. 아래는 EB 방법으로 여러 도시에서 범죄율을 줄인 예입니다. 보시다시피 더 극단적 인 추정치는 평균을 향하여 공평한 거리로 축소됩니다. 더 많은 분산을 기대할 수있는 더 작은 도시는 더 큰 축소를받습니다. 검은 점은 큰 도시를 나타내며 기본적으로 축소되지 않았습니다. 이러한 추정치가 실제로 관찰 된 MLE 범죄율을 사용하는 것보다 위험이 낮다는 것을 보여주는 일부 시뮬레이션이 있습니다.

엑스¯,

추정되는 양이 비슷할수록 수축이 유용 할 가능성이 높습니다. 당신이 말하는 책은 야구에서 적중률을 사용합니다. Morris (1983)는 소수의 다른 응용 프로그램을 지적합니다.

  • 수익 분배 —- 인구 조사국. 여러 지역에 대한 1 인당 인구 조사 소득 추정치.
  • 품질 보증 — 벨 실험실. 다른 기간 동안의 실패 횟수를 추정합니다.
  • 보험료율 피보험자 그룹 또는 다른 지역의 노출 당 위험을 추정합니다.
  • 로스쿨 입학. 다른 학교의 GPA를 기준으로 LSAT 점수의 가중치를 추정합니다.
  • 화재 경보 — NYC. 다른 알람 박스 위치에 대한 잘못된 알람 비율을 추정합니다.

이것들은 모두 병행 추정 문제이며, 내가 아는 한, 예 / 아니오 결정을 결정하는 것보다 특정 수량이 무엇인지에 대해 잘 예측하는 것에 관한 것입니다.


일부 참조

  • 에프론, 비. (2012). 대규모 추론 : 추정, 테스트 및 예측을위한 경험적 Bayes 방법 (Vol. 1). 케임브리지 대학 출판부. 시카고
  • Efron, B., & Morris, C. (1973). 스타 인의 추정 규칙과 경쟁사-경험적인 베이 접근 방식. 미국 통계 협회 저널, 68 (341), 117-130. 시카고
  • James, W., & Stein, C. (1961 년 6 월). 2 차 손실에 의한 추정. 수학적 통계와 확률에 관한 네 번째 버클리 심포지움의 절차 (Vol. 1, No. 1961, pp. 361-379). 시카고
  • CN 모리스 (1983). 파라 메트릭 경험적 베이 즈 추론 : 이론 및 응용. 미국 통계 협회 저널, 78 (381), 47-55.
  • Smyth, GK (2004). 마이크로 어레이 실험에서 차등 발현을 평가하기위한 선형 모델 및 경험적 베이 즈 방법. 유전학 및 분자 생물학 제 3 권, 제 1 호, 제 3 조의 통계적 응용

답변