kullback-leibler Archives

다음 질문에 대한 직관적 인 설명을 찾고 있습니다.

통계 및 정보 이론에서 Bhattacharyya 거리와 KL 발산의 차이는 두 개의 이산 확률 분포의 차이를 측정하는 방법으로 무엇입니까?

그들은 전혀 관계가 없으며 두 확률 분포 사이의 거리를 완전히 다른 방식으로 측정합니까?

Bhattacharyya 계수 로 정의 및 거리로 전환 할 수있는 로서 호출된다Hellinger 거리. 이Hellinger 거리와Kullback-Leibler 발산간의 연결은

D B (p, q) = \int p (x) q (x) - - - - - - - \sqrt d x

$d_{H} (p, q)$

dH(p,q)

d H (p, q) = {1 - D B (p, q)} 1 / 2

d K L (p ∥ q) \geq 2 d 2 H (p, q) = 2 {1 - D B (p, q)} .

d B (p, q) = def - log D B (p, q),

d B (p, q) = - log D B (p, q) = - log \int p (x) q (x) - - - - - - - \sqrt d x = def - log \int h (x) d x = - log \int h ( x ) p ( x ) p (x) d x \leq \int - log {h ( x ) p ( x )} p (x) d x = \int - 1 2 log {h 2 ( x ) p 2 ( x )} p (x) d x = \int - 1 2 log {q ( x ) p ( x )} p (x) d x = 1 2 d K L (p ∥ q)

d K L (p ∥ q) \geq 2 d B (p, q) .

- l o g (x) \geq 1 - x 0 \leq x \leq 1,

d K L (p ∥ q) \geq 2 d B (p, q) \geq 2 d H (p, q) 2 .

나는 두 사람 사이의 명시적인 관계를 알지 못했지만 내가 찾을 수있는 것을보기 위해 그들에게 빠른 찌르기를하기로 결정했습니다. 따라서 이것은 많은 대답이 아니라 관심의 대상입니다.

간단하게하기 위해, 이산 분포에 대해 작업 해 봅시다. BC 거리를 다음과 같이 쓸 수 있습니다.

디 기원전 (p, q) = - ln \sum 엑스 (p (x) q (x)) 1 2

KL 발산

디 KL (p, q) = \sum 엑스 p (x) ln p ( x ) 큐 ( x )

이제 우리는 합계에 로그를 넣을 수 없습니다. $BC$

기원전

거리를 벗어나서 통나무 바깥쪽으로 통나무를 당겨 봅시다 $KL$

분기:

디 KL (p, q) = - ln \prod 엑스 (q ( x ) p ( x )) p (x)

때 그들의 행동을 고려하자 $p$

피

균일 한 분포로 고정 $n$

엔

가능성 :

디 KL (p, q) = - ln n - ln (\prod 엑스 큐 (x)) 1 엔 디 기원전 (p, q) = - ln 1 엔 - - \sqrt - ln \sum 엑스 큐 (x) - - - - \sqrt

왼쪽에는 기하 평균 과 형태가 비슷한 로그가 있습니다 . 오른쪽에는 산술 평균 의 로그와 비슷한 것이 있습니다 . 내가 말했듯이, 이것은 많은 대답이 아니지만 BC 거리와 KL 발산이 사이의 편차에 어떻게 반응하는지에 대한 깔끔한 직감을 제공한다고 생각합니다 $p$

피

과 $q$

큐

How IT