변형 베이와 EM의 관계 수 있다고 생각했습니다.

Variational Bayes 방법이 EM 알고리즘의 일반화라는 것을 읽었습니다. 실제로 알고리즘의 반복 부분은 매우 유사합니다. EM 알고리즘이 Variational Bayes의 특수 버전인지 테스트하기 위해 다음을 시도했습니다.

는 데이터이고 는 잠재 변수의 모음이며 는 매개 변수입니다. 변분 베이 즈에서 우리는 근사 할 수 있도록이되도록 . 어디 S는 간단하고 다루기 쉬운 배포판입니다. $Y$
$Y$
$Y$ $X$
$X$
$X$ $Θ$
$Θ$
$\Theta$ $P (X, Θ | Y) \approx Q_{X} (X) Q_{Θ} (Θ)$
$P (X, Θ | Y) \approx Q_{X} (X) Q_{Θ} (Θ)$
$P(X,\Theta|Y) \approx Q_X(X)Q_\Theta(\Theta)$ $Q$
$Q$
$Q$
EM 알고리즘은 MAP 포인트 추정치를 찾기 때문에 델타 함수를 사용하면 Variational Bayes가 EM으로 수렴 할 수 있다고 생각했습니다. . 은 EM에서 일반적으로 수행되는 모수에 대한 첫 번째 추정치입니다. $Q_{Θ}^{1} (Θ) = δ_{Θ^{1}} (Θ)$
$Q_{Θ}^{1} (Θ) = δ_{Θ^{1}} (Θ)$
$Q^1_\Theta(\Theta)=\delta_{\Theta^1}(\Theta)$ $Θ_{1}$
$Θ_{1}$
$\Theta_1$
경우 부여, KL 발산을 최소화하는 수식에 의해 발견된다 $Q_{Θ}^{1} (Θ) = δ_{Θ^{1}} (Θ)$
$Q_{Θ}^{1} (Θ) = δ_{Θ^{1}} (Θ)$
$Q^1_\Theta(\Theta)=\delta_{\Theta^1}(\Theta)$ $Q_{X}^{1} (X)$
$Q_{X}^{1} (X)$
$Q^1_X(X)$
위 식은단순화단계는 EM 알고리즘의 기대 단계와 동일합니다!
$Q_{X}^{1} (X) = \frac{\exp (E_{δ_{Θ^{1}}} [\ln P (X, Y, Θ)])}{\int \exp (E_{δ_{Θ^{1}}} [\ln P (X, Y, Θ)]) d X}$
$Q^1_X(X)=\frac{\exp(E_{\delta_{\Theta^1}}[\ln P(X,Y,\Theta)])}{\int\exp(E_{\delta_{\Theta^1}}[\ln P(X,Y,\Theta)])dX}$ $Q_{X}^{1} (X) = P (X | Θ^{1}, Y)$
$Q_{X}^{1} (X) = P (X | Θ^{1}, Y)$
$Q^1_X(X)=P(X|\Theta^1,Y)$

그러나 나는 이것을 계속하는 것으로 최대화 단계를 도출 할 수 없습니다. 다음 단계에서 를 계산해야 하고 Variational Bayes 반복 규칙에 따라 다음과 같습니다. $Q_{Θ}^{2} (Θ)$

Q_{Θ}^{2} (Θ)

$Q^2_\Theta(\Theta)$

Q_{Θ}^{2} (Θ) = \frac{\exp (E_{P (X | Θ^{1}, Y)} [\ln P (X, Y, Θ)])}{\int \exp (E_{P (X | Θ^{1}, Y)} [\ln P (X, Y, Θ)]) d Θ}

$Q^2_\Theta(\Theta)=\frac{\exp(E_{P(X|\Theta^1,Y)}[\ln P(X,Y,\Theta)])}{\int\exp(E_{P(X|\Theta^1,Y)}[\ln P(X,Y,\Theta)])d\Theta}$

VB 및 EM 알고리즘이 실제로 이런 방식으로 연결되어 있습니까? 변형 베이의 특별한 사례로 EM을 도출 할 수있는 방법은 무엇입니까?

답변

$Θ$

Θ

$\Theta$ $Θ^{*}$

Θ^{*}

$\Theta^*$

Q_{Θ} (Θ) = δ (Θ - Θ^{*})

$Q_\Theta(\Theta) = \delta(\Theta - \Theta^*)$

K L (Q | | P) = \int \int Q_{X} (X) Q_{Θ} (Θ) \ln \frac{Q_{X} (X) Q_{Θ} (Θ)}{P (X, Y, Θ)} d X d Θ = \int Q_{X} (X) \ln \frac{Q_{X} (X) Q_{Θ} (Θ^{*})}{P (X, Y, Θ^{*})} d X

$KL(Q||P)=\int \int Q_X(X) Q_\Theta(\Theta) \ln \frac{Q_X(X) Q_\Theta(\Theta)}{P(X,Y,\Theta)} dX d\Theta \\ = \int Q_X(X) \ln \frac{Q_X(X) Q_\Theta(\Theta^*)}{P(X,Y,\Theta^*)} dX$ $Q_{X} (X)$

Q_{X} (X)

$Q_X(X)$ $Θ^{*}$

Θ^{*}

$\Theta^*$

물론 KL 발산을 실제로 평가한다면 그것은 무한대 일 것입니다. 그러나 델타 함수를 제한으로 생각하면 문제가되지 않습니다.

How IT

언제든지 물어보세요.

변형 베이와 EM의 관계 수 있다고 생각했습니다.

답변

답변