특정 데이터 세트에서 PCA를 실행할 때 솔루션이 고유합니까?
즉, 인터 포인트 거리를 기반으로 2D 좌표 세트를 얻습니다. 이러한 제약 조건을 충족하는 포인트의 배열을 하나 이상 찾을 수 있습니까?
대답이 예라면 어떻게 다른 해결책을 찾을 수 있습니까?
답변
아니요, 답은 고유하지 않습니다. 이것을 보여주는 많은 방법이 있습니다. 하나의 가능성은 행렬 의한 제곱 의 스펙트럼 분해 가 의 볼록 함수의 최대화 에 대한 해결책이라는 것을 알 수있다 . 첫 번째 고유 벡터 / 값을 고려하십시오.
pp
X
w
λ1=maxw∈Rp:||w||=1w′Xw
여기서 은 첫 번째 고유 값이고 는 첫 번째 고유 벡터입니다.
λ1w∗
이러한 문제의 해결책 (예 : 값 그 최대 달성)는 일반적으로 고유하지 않다.
w그러나 이러한 솔루션을 계산하는 알고리즘은 결정론 적이므로 수치가 큰 경우 절약 할 수있는 솔루션이 동일해야합니다.
이러한 수치 적 코너 사례의 예 : 여러 고유 값이 (숫자 적으로) 동일한 경우, 가 순위가 부족한 경우 …
X답변
아직 눈치 채지 못한 것은 단순히 PC의 부호를 바꾸면 다른 해결책이 나온다는 것입니다. 즉, 가 번째 기본 구성 요소이면 는 번째 기본 구성 요소에 대한 솔루션 입니다. 이것은 특히 컴퓨터가 PC를 번갈아 출력 할 때 혼란을 야기했습니다. 이 질문을 참조하십시오 .
wn
−w
n