태그 보관물: clustering

clustering

거리 (유클리드)를 유사성 점수로 변환하는 방법 발생합니다. 이

사용하여 스피커 음성을 클러스터링한다는 의미입니다. 발화를 클러스터 된 스피커 데이터와 비교하면 (유클리드 거리 기반) 평균 왜곡이 발생합니다. 이 거리는 범위에있을 수 있습니다 . 이 거리를 유사성 점수 로 변환하고 싶습니다 . 내가 어떻게 이것을 달성 할 수 있는지 안내해주세요.

k

[0,∞]

[0,1]


답변

경우 점에서 유클리드 거리를 나타내는 점에 ,

d(p1,p2)

p1

p2

11+d(p1,p2)

일반적으로 사용됩니다.


답변

당신은 또한 사용할 수 있습니다 : 어디에원하는 거리의 함수이다.

1edist

dist


답변

유사성을 코사인하는 것과 비슷한 것을 원할 것 같습니다. 이는 단위 간격의 유사성 점수입니다. 사실, 유클리드 거리와 코사인 유사성 사이에는 직접적인 관계가 있습니다!

||x−x′||2=(x−x′)T(x−x′)=||x||+||x′||−2||x−x′||.

f(x,x′)=xTx′||x||||x′||=cos⁡(θ)

θ

x

x′

||x||=||x′||=1,

||x−x′||2=2(1−f(x,x′))

f(x,x′)=xTx′,

그래서

1−||x−x′||22=f(x,x′)=cos⁡(θ)

계산 관점에서 유클리드 거리보다는 코사인을 계산 한 다음 변환을 수행하는 것이 더 효율적일 수 있습니다.


답변

방법에 대한 가우시안 커널 ?

K(x,x′)=exp⁡(−‖x−x′‖22σ2)

거리지수에 사용됩니다. 커널 값의 범위는 입니다. 하나의 튜닝 매개 변수 있습니다. 기본적으로 가 높으면 는 대해 1에 가까워집니다 . 경우 낮은로부터 약간의 거리 에 대한 로 이어질 0에 가까운 인.[ 0 , 1 ] σ σ K ( x , x ) x , x σ x x K ( x , x )

‖x−x′‖

[0,1]

σ

σ

K(x,x′)

x,x′

σ

x

x′

K(x,x′)

답변

Hellinger 거리와 같이 자연스럽게 0과 1 사이의 거리 메트릭을 사용하는 경우 그런 다음 1-거리를 사용하여 유사성을 얻을 수 있습니다.


답변