카테고리 보관물: stats

stats

어려운 통계 개념에 대해 가장 좋아하는 평신도의 설명은 무엇입니까? 듣는 것이 정말 좋습니다. 어려운 통계 개념을

복잡한 문제에 대한 간단한 설명을 듣는 것이 정말 좋습니다. 어려운 통계 개념을 설명하는 가장 좋아하는 유추 나 일화는 무엇입니까?

내가 가장 좋아하는 것은 술취한 개와 그녀의 개를 이용한 머레이의 설명이다. 머레이는 두 가지 무작위 과정 (방랑하는 음주와 그녀의 개, 올리버)이 어떻게 단위근을 가질 수는 있지만, 그들의 첫 번째 차이가 고정되어 있기 때문에 여전히 관련 (공적분) 될 수 있는지 설명합니다.

술 취한 사람은 술집에서 출발하여 무작위로 걷는 방식으로 목표없이 방황합니다. 그러나 그녀는 주기적으로 “올리버, 어디 있니?” 그는 그녀의 말을 듣습니다. 그녀는 그를 듣는다. 그는 “아, 나는 그녀를 너무 멀리 내버려 둘 수 없다. 그녀는 “아, 나는 그를 너무 멀리 내버려 둘 수 없다. 그는 한밤중에 짖는 소리로 나를 깨울 것이다.” 각각은 상대방이 얼마나 멀리 떨어져 있는지 평가하고 그 격차를 부분적으로 닫으려고 움직입니다.



답변

p 값은 데이터를 난처하게 만드는 귀무 가설에 대한 척도입니다.

Nicholas Maxwell, 데이터 문제 : 무작위 세계에 대한 개념적 통계 Emeryville CA : Key College Publishing, 2004.


답변

  1. 분포 (히스토그램)를 목재로 조각하고 손가락으로 균형을 잡으려고하면 분포의 모양에 관계없이 균형점이 평균이됩니다.

  2. 산점도 중간에 막대를 넣고 스프링을 사용하여 각 데이터 점에 막대를 부착하면 막대의 정지 점이 회귀선이됩니다. [1]

[1] 이것은 기술적으로 주요 구성 요소 회귀입니다. 스프링을 “수직으로”최소 제곱으로 만 움직 이도록 강요해야하지만 예제는 어느 쪽이든 예시입니다.


답변

나는 이전에 술 취한 사람의 산책을 무작위로 걸었고, 술에 취한 사람과 그녀의 개를 함께 사용했습니다. 그들은 매우 유용합니다 (부분적으로 재미 있기 때문에).

내가 가장 좋아하는 일반적인 예 중 하나는 생일 패러독스 ( wikipedia entry )인데, 몇 가지 중요한 확률 개념을 보여줍니다. 사람들로 가득 찬 방에서 이것을 시뮬레이션 할 수 있습니다.

또한 통계 개념을 가르치는 창의적인 방법에 대한 예제는 Andrew Gelman의 “Teaching Statistics : A Bag of Tricks” 를 강력히 권장 합니다 (목차 참조 ). 또한 그가 교수 통계에 대해 가르치는 과정에 대한 그의 논문을보십시오 : “대학 수준의 교수 통계에 관한 과정” . 그리고에 “정치학, 사회학, 보건, 교육, 경제학 대학원 학생에 대한 교육 베이 즈, …” .

베이지안 방법을 설명 할 때 불공평 한 동전을 사용하고 여러 번 뒤집는 것은 매우 일반적이고 효과적인 방법입니다.


답변

나는 “동급”실습을 통해 표본 변동과 본질적으로 중심 한계 정리를 보여주고 싶습니다. 수업 시간에 100 명 정도의 학생들은 자신의 나이를 종이에 씁니다. 평균을 계산 한 후 모든 용지 조각이 같은 크기이고 같은 방식으로 접 힙니다. 이것은 인구이며 평균 연령을 계산합니다. 그런 다음 각 학생은 무작위로 10 장의 종이를 선택하고 나이를 기록하고 가방에 반환합니다. (S) 그는 평균을 계산하고 가방을 다음 학생에게 전달합니다. 결국 우리는 각 인구 평균을 추정하는 10 명의 학생들로 구성된 100 개의 표본이 히스토그램 및 일부 기술 통계량을 통해 설명 할 수 있습니다.

우리는 이번 여론 조사에서 몇 가지 예 / 아니오 질문을 모방 한 100 개의 “의견”을 사용하여 이번 시위를 반복합니다. 예를 들어 (영국 총선) 선거가 내일 소집되면 영국 국회에 투표하는 것을 고려해보십시오. 학생들은이 의견 중 10 개를 추출합니다.

마지막으로 연속 및 이진 데이터를 사용하여 샘플링 변동, 중앙 제한 정리 등을 시연했습니다.


답변


답변

1) 특정 사건의 확률을 계산하기 위해 “무작위”를 어떻게 정의해야하는지에 대한 좋은 설명 :

원을 가로 질러 그려진 임의의 선이 반지름보다 길 확률은 얼마입니까?

문제는 전적으로 선을 그리는 방법에 달려 있습니다. 지상에 그려진 원에 대해 실제 방식으로 설명 할 수있는 가능성은 다음과 같습니다.

원 안에 임의의 두 점을 그리고이를 통해 선을 그립니다. (두 파리 / 돌이 떨어지는 곳을보십시오 …)

원주에서 고정 점을 선택한 다음 원의 다른 곳에서 임의의 점을 선택하고 결합하십시오. (실제로 이것은 주어진 지점과 돌이 떨어지는 임의의 지점을 통해 가변 각도로 원을 가로 질러 막대기를 놓는 것입니다.)

직경을 그립니다. 무작위로 점을 선택하고 그 점을 수직으로 그립니다. (스틱을 직선을 따라 구르면 원을 가로 질러 놓입니다.)

지오메트리를 수행 할 수있는 사람 (통계는 아님)을 나타내는 사람은 질문에 대한 답변이 상당히 광범위 할 수 있음 (약 2/3에서 약 0.866 정도)을 나타내는 것이 상대적으로 쉽습니다.

2) 리버스 엔지니어링 동전 던지기 : 10 번 던지고 결과를 기록하십시오. 이 정확한 시퀀스 의 확률을 계산하십시오 . 작은 기회이지만, 당신은 방금 자신의 눈으로 일어나는 것을 보았습니다! … 열 개의 머리를 포함하여 모든 시퀀스 가 나타날 수 있지만, 평신도 사람들이 머리를 감는 것은 어렵습니다. 앙코르로서 다른 조합과 마찬가지로 1에서 6까지의 복권 당첨 확률이 높다고 확신 시키십시오.

(1210)

3) 의학적 진단이 실제로 결함이있는 이유를 설명합니다. 질병 foo에 대한 테스트는 99.9 %의 정확성을 보였지만 .1 %는 실제로 그렇지 않은 사람들을 거짓 양성으로 진단하여 질병의 유병률이 매우 낮을 때 실제로 너무 자주 잘못 보일 수 있습니다. 예를 들어 1000 명 중 1 명), 많은 환자들이 검사를받습니다.

이것은 실제 숫자로 가장 잘 설명되는 것입니다-백만 명의 사람들이 테스트를 받았고 1000 명이 질병에 걸렸고 999가 올바르게 식별되었지만 999,000의 0.1 %는 999가 있지만 999가 아니라고 말합니다. 따라서 높은 수준의 정확성 (99.9 %)과 낮은 수준의 오 탐지율 (0.1 %)에도 불구하고 실제로 말한 사람들의 절반은 실제로 그렇지 않습니다. 두 번째 (이상적으로 다른) 테스트는 이러한 그룹을 분리합니다.

[실수로, 나는 숫자가 작업하기 쉽기 때문에 선택했습니다. 물론 정확도 / 가양 성 비율은 테스트에서 독립적 인 요인이므로 최대 100 %를 더할 필요는 없습니다.]


답변

Sam Savage의 책 Flaw of Averages 는 통계 개념에 대한 평신도의 설명으로 가득 차 있습니다. 특히 젠슨의 불평등에 대해 잘 설명하고있다. 투자 수익률 그래프가 볼록한 경우 (예 : “스마일 미소”) 임의성이 선호됩니다. 평균 수익률이 평균 수익률보다 큽니다.