군집 분석에 대한 추천 도서 또는 기사? 코퍼스 텍스트를 작업 중입니다. 클러스터

작은 (200M) 코퍼스 텍스트를 작업 중입니다. 클러스터 분석으로 탐색하고 싶습니다. 그 주제에 관해 어떤 책이나 기사를 추천 하시겠습니까?



답변

MW Berry의 책을 살펴볼 가치가 있습니다.

  1. 텍스트 마이닝 I 조사 : 클러스터링, 분류 및 검색 (2003)
  2. 텍스트 마이닝 II 조사 : 클러스터링, 분류 및 검색 (2008)

일련의 신청 및 검토 논문으로 구성됩니다. 최신 주소는 http://bit.ly/deNeiy 주소에서 PDF로 제공되는 것 같습니다 .

다음은 텍스트 마이닝에 적용되는 CA 관련 링크입니다.

Latent Semantic Analysis 도 볼 수 있지만 클러스터링 문제를 통해 작업하는 응답을 참조하십시오 .


답변

데이터에서 그룹 찾기. Leonard Kaufman 교수와 Peter J. Rousseeuw 교수의 클러스터 분석 소개

나는 책을 읽고 있으며 다음과 같은 이유로 매우 유용하다고 생각합니다.

  • 서문에서 저자가 언급 한 바와 같이 :

우리의 목적은 일반 사용자에게 적용되는 책을 작성하는 것이 었습니다. 우리는 수학적 또는 통계적 배경이 강한 사람들에게 클러스터 분석을 제공하고자했습니다.

  • R패키지 클러스터 에서 사용 가능한 기능을 이해하기 위해 이론적 인 내용을 제공합니다 .

  • 관심있는 클러스터 방법에 따라 장을 개별적으로 읽을 수 있습니다.
    2 장에 구축 된 3 장은 예외입니다.

이 책의 장은 다음과 같습니다.

  1. 소개
  2. 메도 이드 주변 분할 (프로그램 PAM).
  3. 대규모 응용 프로그램 클러스터링 (프로그램 CLARA).
  4. 퍼지 분석 (프로그램 재미).
  5. 응집 중첩 (프로그램 AGNES).
  6. 분할 분석 (프로그램 DIANA).
  7. 단일 해석 (프로그램 MONA).

참고 문헌 :

Kaufman, L., & Rousseeuw, PJ (2005). 데이터에서 그룹 찾기. 군집 분석 소개 (p. 342). 존 와일리 & 선즈

Maechler, M. (2013). Cluster Analysis Extended Rousseeuw et al. 크랜.


답변

데이터 마이닝 소개 의이 장은 온라인으로 제공되며 유용한 개요를 제공합니다.


답변

Brian S. Everitt의 Cluster Analysis는 Cluster Analysis에 적용되는 훌륭한 책 길이입니다.


답변

특히 텍스트 마이닝에 대한 것이 아니라 Martinez와 Martinez의 “MATLAB을 사용한 탐색 데이터 분석”이 마음에 들었습니다 .