사용하여 스피커 음성을 클러스터링한다는 의미입니다. 발화를 클러스터 된 스피커 데이터와 비교하면 (유클리드 거리 기반) 평균 왜곡이 발생합니다. 이 거리는 범위에있을 수 있습니다 . 이 거리를 유사성 점수 로 변환하고 싶습니다 . 내가 어떻게 이것을 달성 할 수 있는지 안내해주세요.
k[0,∞]
[0,1]
답변
경우 점에서 유클리드 거리를 나타내는 점에 ,
d(p1,p2)p1
p2
11+d(p1,p2)
일반적으로 사용됩니다.
답변
당신은 또한 사용할 수 있습니다 : 어디에원하는 거리의 함수이다.
1edistdist
답변
유사성을 코사인하는 것과 비슷한 것을 원할 것 같습니다. 이는 단위 간격의 유사성 점수입니다. 사실, 유클리드 거리와 코사인 유사성 사이에는 직접적인 관계가 있습니다!
||x−x′||2=(x−x′)T(x−x′)=||x||+||x′||−2||x−x′||.
f(x,x′)=xTx′||x||||x′||=cos(θ)
θ
x
x′
||x||=||x′||=1,
||x−x′||2=2(1−f(x,x′))
f(x,x′)=xTx′,
그래서
1−||x−x′||22=f(x,x′)=cos(θ)
계산 관점에서 유클리드 거리보다는 코사인을 계산 한 다음 변환을 수행하는 것이 더 효율적일 수 있습니다.
답변
방법에 대한 가우시안 커널 ?
K(x,x′)=exp(−‖x−x′‖22σ2)
거리지수에 사용됩니다. 커널 값의 범위는 입니다. 하나의 튜닝 매개 변수 있습니다. 기본적으로 가 높으면 는 대해 1에 가까워집니다 . 경우 낮은로부터 약간의 거리 에 대한 로 이어질 0에 가까운 인.[ 0 , 1 ] σ σ K ( x , x ′ ) x , x ′ σ x x ′ K ( x , x ′ )
‖x−x′‖[0,1]
σ
σ
K(x,x′)
x,x′
σ
x
x′
K(x,x′)
답변
Hellinger 거리와 같이 자연스럽게 0과 1 사이의 거리 메트릭을 사용하는 경우 그런 다음 1-거리를 사용하여 유사성을 얻을 수 있습니다.