통계 소프트웨어 사용에서 수학 방정식 이해로의 전환? 읽는 방법을 이해해야합니다.

문맥:

저는 심리학 박사 과정 학생입니다. 많은 심리학 박사 과정 학생들과 마찬가지로 저는 통계 소프트웨어를 사용하여 PCA, 분류 트리 및 군집 분석과 같은 기술까지 다양한 통계 분석을 수행하는 방법을 알고 있습니다. 그러나 분석을 한 이유와 지표의 의미를 설명 할 수는 있지만 기술이 어떻게 작동하는지 설명 할 수 없기 때문에 실제로 만족스럽지 않습니다.

실제 문제는 통계 소프트웨어 마스터 링이 쉽지만 제한적이라는 것입니다. 기사에서 새로운 기술을 배우려면 수학 방정식을 읽는 방법을 이해해야합니다. 현재 고유 값 또는 K- 평균을 계산할 수 없습니다. 방정식은 나에게 외국어와 같습니다.

질문:

  • 저널 기사의 방정식을 이해하는 데 도움이되는 포괄적 인 가이드가 있습니까?

편집하다:

나는 그 질문이 더 자명 할 것이라고 생각했다. 특정한 복잡성보다 통계적 표기법은 나에게 횡설수설이된다. 기술을 이해하기 위해 R 또는 C ++로 자신의 함수를 코딩하고 싶지만 장벽이 있다고 가정 해 봅시다. 방정식을 프로그램으로 변환 할 수 없습니다. 그리고 실제로 : 나는 미국 박사 과정의 상황을 알지 못하지만, 나의 프랑스 (프랑스)에서 내가 따라갈 수있는 유일한 코스는 약 16 세기 문학 운동입니다 …



답변

개요 :

  • 제 경험은 당신의 경험이 사회 과학에 많은 학생들에게 공통적이라는 것입니다.
  • 출발점은 학습 동기입니다.
  • 독학 또는 공식 교육 경로 로 내려갈 수 있습니다 .

공식 교육 :

이와 관련하여 많은 옵션이 있습니다. 통계학 석사 또는 통계 부서에서 몇 과목을 고려할 수 있습니다. 그러나 필요한 수학적 배경이 있는지 확인하고 싶을 것입니다. 과정에 따라 대학 수준의 수학적으로 엄격한 통계 과목을 다루기 전에 미적분 수학과 수학 및 선형 대수와 같은 자료를 다시 방문해야 할 수도 있습니다.

독학

또는 자율 학습 경로를 내려갈 수도 있습니다. 인터넷에는 훌륭한 자료가 많이 있습니다. 특히 수학 교과서에서 읽고 연습하는 것이 중요하지만 아마도 충분하지는 않습니다. 수학에 대해 이야기하는 강사의 말을 듣고 문제를 해결하는 것을 보는 것이 중요합니다.

또한 수학 목표와 이러한 목표를 달성하는 데 필요한 수학 전제 조건에 대해 생각하는 것이 중요합니다. 방정식이 외국어와 같다면 먼저 초등 수학을 공부해야 할 수도 있습니다.

통계 소프트웨어 사용에서 기초 수학 이해로 전환하는 사람들을 돕기위한 몇 가지 리소스를 준비했습니다.

  • 비디오 : 무료 온라인 수학 비디오 목록 -이 게시물은 미적분학에서 시작하여 미적분학, 선형 대수학, 확률 및 수학 통계를 통해 작업하는 적절한 수학 시퀀스가 ​​무엇인지에 대한 지침을 제공합니다. 또한 수학 통계 비디오 에 대한이 질문을 참조하십시오 .
  • 읽기와 발음 -첫 번째 과제 중 하나는 수학 방정식을 발음하고 읽는 방법을 배우는 것입니다. 나는 비 수학자를위한 수학을 읽기위한 팁발음 에 관한 두 개의 글을 썼습니다 .
  • 작문 -수학 쓰기 학습은 수학 읽기에 도움이 될 수 있습니다. LaTeX를 배우고 LaTeX의 수학에 대한 가이드를 확인하십시오
  • : 수학 학습에 관해서는 좋은 교과서에 투자 할 가치가 있다고 생각합니다. 그러나 요즘 에는 무료 온라인 옵션 이 많이 있습니다.

답변

R 또는 C ++로 프로그래밍하여 통계 방정식에 대한 통찰력을 얻을 수 있다고 생각합니다. 당신은 할 수 없습니다. 통계 방정식을 이해하려면 각 장 끝에 방정식이 포함 된 숙제 문제가 많은 “학부생”교과서를 찾은 다음 방정식이 포함 된 장 끝에 숙제를 수행하십시오.

예를 들어 PCA를 이해하려면 선형 대수, 특히 특이 값 분해에 대한 이해가 필요합니다. Michael Nielsen의 책을 통해 양자 컴퓨팅을 배우는 동안 선형 대수학을 검토해야한다는 것이 분명해졌습니다. 나는 Gilbert Strang의 비디오를 보았고 개념에 대한 기본적인 이해를 확립하는 데 큰 도움이되었습니다. 그러나 자료의 뉘앙스는 많은 숙제 문제가 포함 된 선형 대수 서적을 발견 한 다음까지해야했습니다.


답변

나는 통계에서 새로운 것을하려고 할 때 비슷한 문제가 있기 때문에 어려움을 이해합니다 (저는 또한 대학원생이지만 다른 분야에 있습니다). R 코드를 검사하면 무언가 계산 방법에 대한 아이디어를 얻는 데 매우 유용하다는 것을 알았습니다. 예를 들어, 최근에 kmeans클러스터링 을 사용하는 방법을 배우고 있으며 개념과 구현 방법에 대한 많은 기본적인 질문이 있습니다. 사용하여 R설치 (I 추천 R Studio, http://www.rstudio.org/ , 그러나 어떤 설치가 작동)을 바로 입력 kmeans명령 줄에 로그인합니다. 다음은 출력 의 일부 예입니다 .

x <- as.matrix(x)
    m <- nrow(x)
    if (missing(centers))
        stop("'centers' must be a number or a matrix")
    nmeth <- switch(match.arg(algorithm), `Hartigan-Wong` = 1,
        Lloyd = 2, Forgy = 2, MacQueen = 3)
    if (length(centers) == 1L) {
        if (centers == 1)
            nmeth <- 3
        k <- centers
        if (nstart == 1)
            centers <- x[sample.int(m, k), , drop = FALSE]
        if (nstart >= 2 || any(duplicated(centers))) {
            cn <- unique(x)
            mm <- nrow(cn)
            if (mm < k)
                stop("more cluster centers than distinct data points.")
            centers <- cn[sample.int(mm, k), , drop = FALSE]
        }
    }

매번 소스를 조사하는 것이 얼마나 실용적인지 잘 모르겠지만 구문에 익숙하다고 가정하면 실제로 진행 상황을 파악하는 데 도움이됩니다.

내가 stackoverflow 에 대해 물었던 이전 질문 은이 방향으로 나를 지적했지만 코드에 대한 의견이 때로는 여기에 포함되어 있다고 나에게 도움이 되었다 .


좀 더 일반적으로, 통계 소프트웨어 저널은 이론과 구현 사이의이 연결을 보여 주지만, 종종 고급 주제 (개인적으로 이해하기 어려운)에 관한 것이지만, 예로서 유용합니다.