태그 보관물: methodology

methodology

통계 도구를 부적절하게 사용하여 비용이 많이 드는 결과의 예 가장 자주

통계 도구를 사용하는 대부분의 사용자는 보조 사용자 (정식에 대한 공식 교육이 거의 없거나 아예없는 사람들) 인 것 같습니다. 동료 검토 논문, 회색 문헌, 웹 또는 회의에서“이전에 완료된”것을 보았 기 때문에 연구자와 다른 전문가들이 데이터에 통계적 방법을 적용하는 것은 매우 유혹적입니다. 그러나 필요한 가정과 통계 도구의 한계에 대한 명확한 이해없이 그렇게하면 잘못된 결과가 발생할 수 있습니다. 오류는 종종 승인되지 않습니다!

학부생 (특히 사회 과학 및 자연 과학)은 통계적 함정을 알지 못하거나 이러한 함정을 중요하지 않은 것으로 발견합니다 (후자가 가장 자주 발생 함). 통계 도구를 부적절하게 사용하는 예는 많은 초급 수준의 교과서, 웹 또는 StackExchange에서 찾을 수 있지만 해로운 결과를 초래 한 실제 사례 (예 : $, 생활에 영향을 미치고 경력 손실)를 찾는 데 어려움을 겪고 있습니다. . 이를 위해 다음과 같은 통계적 방법의 오용을 강조하는 실제 사례를 찾고 있습니다.

  1. 사용 된 통계 방법은 일반적으로 입문 통계 과정 (예 : 추론 통계, 회귀 등) 에서 다룹니다.
  2. 최종 결과는 값 비싼 결과를 초래했습니다 (달러 손실, 삶에 영향을 미치고, 경력이 산산조각 나는 등…)
  3. 데이터를 쉽게 사용할 수 있습니다 과정에서 예를 작업로 사용하기 위해 (목적은 실제 결과가 있었 실제 사례를 통해 학생들의 작업을하는 것입니다.)

연구 프로젝트에서 유닛을 올바르게 정의하는 것의 중요성을 논의 할 때 학생들에게 제시하고자하는 비 통계적 예 는 1 억 2 천 5 백만 달러의 위성이 손실 되는 “메트릭 사고” 입니다! 이것은 보통 학생들의 : -o 요소를 불러 일으키며 (적어도 짧은 학업 기간 동안) 지속적인 인상을 남길 것 같습니다.



답변

데이터 가용성에 대해서는 잘 모르겠지만 폐경기 여성의 호르몬 대체 요법 (HRT) 효과에 대한 하버드 간호사의 연구는 잘못된 통계의 좋은 예 (올바른 단어 인 경우)입니다.

일반적인 아이디어는 무엇입니까? 간호사의 연구에 따르면 HRT는 폐경기 이후 여성들에게 유익했습니다. 대조군이 처리 군과 매우 다르고 이러한 차이가 분석에서 고려되지 않았기 때문에이 결과가 발생 함을 알 수 있습니다. 후속 무작위 시험에서, HRT는 암, 심장 마비, 뇌졸중 및 혈병과 관련이있다. 적절한 교정을 통해 간호사의 연구에서 이러한 패턴도 밝혀졌습니다.

HRT와 관련된 미국 사망에 대한 추정치를 찾을 수 없지만 그 규모는 수만 명에 달합니다. 한 기사 는 영국에서 1,000 명의 사망자를 HRT와 연결합니다.

New York Times Magazine 기사는 연구에 존재하는 혼란스러운 문제에 대한 좋은 통계적 배경을 제공합니다.

American Journal of Epidemiology의 이번 호 에는 학술 토론 있습니다. 이 기사는 무작위 간호사 시험을 기반으로 관찰 간호사의 연구 결과와 여성 건강 이니셔티브의 결과를 비교합니다.

Biometrics 의 이슈에서 (동일한 많은 개인에 의한) 토론도 있습니다. Freedman과 Petitti의 의견은 특히 [ prepub version ]을 참조하십시오.


답변

1933 년 호레이스 세크리스트의 사업 중개 법 ( Triumph of Mediocrity in Business) 의 간행물을 통해 놀라운 역사적 사례를 얻을 수 있습니다. 당시 Secrist는 잘 정립 된 통계 학자였으며 교과서 (1919 년경 참조)의 저자이며 미국 통계 협회에 잘 연결되어 있으며 노스 웨스턴 대학의 통계 연구 그룹 책임자입니다. 그와 그의 직원들은 이전 10 년 동안 시계열의 비즈니스 데이터를 수집했으며,이 데이터는이 책에서 재생산되고 힘들게 분석되었습니다. 그것은 야심 찬 통계 학자에 의해 요리사 d’ oeuvre 가 되어야했다 .

그 해 후반에 JASA에 실린 해롤드 호텔 링의이 책에 대한 검토는 Secrist가 평균에 대한 수백 가지의 회귀 사례 (오늘날 입문 통계 과정의 기본 주제, 질문 # 1)를 문서화 한 것이라고 지적했다. Secrist는 게시 된 답변에 반대했습니다. 이에 대한 Hotelling의 답변은 고전입니다.

값 비싸고 연장 된 수치 연구에 의해 그러한 수학적 결과를 “증명”하는 것은 코끼리들을 행과 열로 배열 한 다음, 다른 많은 종류의 동물들에 대해서도 동일한 방식으로 곱셈 테이블을 증명하는 것과 유사합니다. 아마도 재미 있고 특정 교육 학적 가치가있는 성과는 동물학이나 수학에 중요한 기여가 아닙니다.

[JASA v. 29 # 186, 1934 년 6 월, p. 199.]

Secrist는 그 직후 통계적 장면에서 빨리 사라진 것 같습니다 ( “경력이 망가졌습니다”). 그의 책은 여전히 ​​유효합니다. (몇 년 전에 나는 Interlibrary Loan을 통해 아주 깔끔한 사본을 얻었습니다.)

스티븐 스티 글러 (Steven Stigler)는이 이야기 를 1933 년의 통계와 역사 에 관한 책과 논문에서 설명합니다 .


답변

나에게 보인다 유선의 테이크 2008 년 주식 시장 충돌에이 정보를 예 수 있습니다. 결론이 올바른지 여부에 대해서는 언급 할 수 없지만 대표 샘플이 아닌 데이터에 대해 상관 관계를 사용한다는 아이디어는 제안하는 환경에 적합한 것으로 보입니다. 또한 최신 정보이므로 계속 관심을 가질 수 있습니다.