PCA에서 정확히 “주요 구성 요소”란 무엇입니까? 분산을 최대화하는 벡터 라고 가정

가 설계 행렬 데이터 투영의 분산을 최대화하는 벡터 라고 가정 합니다.

u

X

이제, 를 데이터의 (제 1) 주요 구성 요소로 지칭하는 재료를 보았습니다 . 이는 또한 고유 값이 가장 큰 고유 벡터입니다.

u

그러나 데이터의 주요 구성 요소가 것을 보았습니다 .

Xu

분명히 와 는 다른 것입니다. 누구든지 여기에서 나를 도울 수 있고 주성분에 대한이 두 정의의 차이점이 무엇인지 말해 줄 수 있습니까?

u

Xu


답변

(공분산 행렬의 고유 벡터 중 하나, 예를 들어 첫 번째 행렬) 및 (1 차원에 데이터 투영 ) 에도 불구하고 절대적으로 정확 합니다. 된 부분 공간은 서로 다른 두 가지로, 둘 다 종종 “주요 구성 요소”라고하며 때로는 같은 텍스트로 표시됩니다.

u

Xu

u

대부분의 경우 문맥에서 정확히 의미하는 것이 분명합니다. 일부 드문 경우에, 그러나, 그것은 참으로 (예 : 스파 스 PCA 또는 CCA 등) 몇 가지 관련 기술은 서로 다른 방향으로, 여기서 논의 할 때 매우, 예를 혼동 할 수있다 직교 할 필요가 없습니다. 이 경우 “컴포넌트는 직교 형”이라는 표현은 축 또는 투영을 나타내는 지 여부에 따라 매우 다른 의미를 갖습니다.

ui

나는 를 “주축”또는 “주 방향” 이라고 부르고 를 “주성분” 이라고 옹호 합니다.

u

Xu

또한 “mathcipal component vector”라고 불리는 보았습니다 .

u

대체 규칙은 “주요 구성 요소”및 “주요 구성 요소 점수” 를 호출하는 것 입니다.

u

Xu

두 규칙의 요약 :

Convention 1Convention 2u{principal axisprincipal directionprincipal component vectorprincipal componentXuprincipal componentprincipal component scores


참고 : 0이 아닌 고유 값에 해당하는 공분산 행렬의 고유 벡터 만 주 방향 / 구성 요소라고 할 수 있습니다. 공분산 행렬이 낮은 순위이면 하나 이상의 고유 값을 갖습니다. 대응하는 고유 벡터 (및 일정한 영 (0) 인 투영)는 주요 방향 / 구성 요소라고 해서는 안됩니다 . 내 답변에서 토론을 참조하십시오.