나는 통계학자는 아니지만 연구 작업에는 통계 (데이터 분석, 문학 읽기 등)가 포함됩니다. 나는 여기 에 게시 된 내 질문 중 하나에 대한 의견에서 통계 분야에서 잘 연습 한 사람들에게 특히 특별한 의미 또는 의미가있는 몇 가지 일반적인 단어가 있음을 상기 시켰습니다 .
그러한 단어의 목록을 갖는 것이 도움이 될 것이며 주석과 함께 구가 될 수 있습니다.
답변
” 중요한 “-여기서 단어의 일반적인 언어 사용은 ‘중요한’또는 ‘의미있는’과 같은 것을 의미합니다. 통계적 의미는 비공식적으로 “null에 대한 임의의 변화로부터 식별 될 수있다”; 차이가 충분히 크다는 것을 의미하지는 않습니다.
다음은 이러한 구별이 혼란의 원인 일 수있는 몇 가지 예입니다. 1 2
‘ 모수 ‘-종종 과학 실험에서 ‘모수’라는 단어는 통계학자가 ‘가변’이라는 단어를 사용하는 방식으로 사용되는 것으로 보입니다. Wikipedia는 다음과 같이 말합니다.
통계 모수는 확률 분포 패밀리를 색인화하는 모수입니다. 모집단 또는 모형의 수치 적 특성으로 간주 될 수 있습니다.
이것이 문제가 될 수있는 예 : 1- 아마도이 질문을했던 게시물 일 것입니다. (최근에 다른 것을 보았지만 지금은 찾을 수 없습니다)
답변
“오류”-통계에서 종종 관측 값과 예측값 사이의 편차를 의미합니다. 실제로는 실수를 의미합니다.
답변
2010 년부터이 질문에 대한 참고 논문을 찾았습니다.
앤더슨 쿡 CM. 숨겨진 전문 용어 : 통계에 특정한 의미를 갖는 매일의 단어. ICOTS8, 2010 년 7 월 11-17 일 슬로베니아 류블 랴나, 교육 통계 국제 회의.
이 논문은 온라인으로 무료로 제공되므로 저자가 논의하는 용어의 일부만 제공합니다.
confounding, control, factor, independent, random, uniform
답변
나는 “가설을 위조하는”에서와 같이 “위조”를 사용하는 문제를 겪었지만 다른 사람들은 “데이터 구성”을 언급하고 있다고 생각했다. 또한 ” 바이어스 드 (bias) “는 혼동을 일으키지 않고 언급하는 것이 거의 불가능합니다.
답변
“normal” -일반적인 말로, normal은 평범하지 않은 것으로 예상되는 것을 의미합니다. 통계에서 변수가 정규 분포 인 경우 가우시안 분포를 나타냅니다. 나는 일반적인 단어의 의미와 구별하기 위해 “정상”이라는 단어를 대문자로 표기하는 것이 표준이 아니라고 생각합니다.
“정규화 / 표준화” -통계에서 변수를 정규화하면 평균을 빼고 표준 편차로 나눕니다.
“표준 편차 대 표준 오류” -표준 편차는 일반적으로 전체 모집단을 사용하여 계산되는 반면 표준 오류는 표본을 사용하여 계산됩니다.
답변
“파라 메트릭”대 “비 파라 메트릭”: “정상”또는 “정상이 아닌”데이터가 필요한 테스트 범주. 비모수 적 테스트보다 모수 적 테스트가 선호됩니다.
일반적인 테스트 : T- 테스트 (페어링), Mann-Whitney U, ANOVA, Anderson-Darling 등
다른 용어에는 “유의 한”이 포함됩니다. 이는 데이터가 귀하의 가설이 유효한지 여부를 나타내는 척도입니다. 가설을 어느 정도의 가능성 (보통 95 %)으로 테스트 할 때 “p- 값”이 0.05보다 작 으면 “널 가설”을 기각하고 (데이터 세트가 다르지 않음) ” 대립 가설 “(즉, 데이터 세트가 다름).
답변
통계에 치우친 것은 분포가 비대칭임을 의미합니다.
평범한 언어로, 심지어 과학 내에서도, “왜냐하면 많은 농구 선수를 포함시켜 평균 키에 대한 결과가 왜곡된다”와 같이, 통계적 사람들이 일반적으로 편향 이라고 부르는 것을 의미하기 위해 종종 기울어 짐 (및 점점 더?)이 사용됩니다 .