새로운 데이터로 베이지안 업데이트 한 후 이전의 N ~ (a,

n 개의 데이터 포인트를 관찰 한 후 이전의 N ~ (a, b)로 후방을 계산하는 방법은 무엇입니까? 데이터 포인트의 샘플 평균과 분산을 계산하고 사후를 이전과 결합하는 일종의 계산을 수행해야한다고 가정하지만 조합 수식의 모양은 확실하지 않습니다.



답변

베이지안 업데이트의 기본 아이디어는 일부 데이터 와 이전 의 관심있는 매개 변수 가 주어지면 데이터와 매개 변수의 관계가 우도 함수를 사용 하여 설명되는 경우 Bayes 정리를 사용하여 사후를 얻는 것입니다

X

θ

p(θX)p(Xθ)p(θ)

이것은 첫 번째 데이터 점을 본 후 위치를 순차적으로 수행 할 수 있습니다

x1

이전

θ

업데이트된다 후방

θ

당신이 두 번째 데이터 포인트 걸릴 수 옆에

x2

및 사용을 후방 전에 얻은

θ

당신으로 이전에 다시 한 번 등을 업데이트하기 위해, .

예를 들어 보겠습니다. 정규 분포의 평균 \ mu 를 추정

μ

하고

σ2

를 알고 있다고 상상해보십시오 . 이 경우 정상 정규 모델을 사용할 수 있습니다. 하이퍼 파라미터가 \ mu_0, \ sigma_0 ^ 2 인 \ mu에 대해 보통 이전으로 가정합니다 .

μ

μ0,σ02:

XμNormal(μ, σ2)μNormal(μ0, σ02)

정규 분포는 정규 분포의 에 대한 켤레 이전켤레 이므로 , 우리는 이전 형태를 업데이트하는 폐쇄 형 솔루션을 가지고 있습니다.

μ

E(μx)=σ2μ+σ02xσ2+σ02Var(μx)=σ2σ02σ2+σ02

불행히도, 이러한 단순한 폐쇄 형 솔루션은 더 복잡한 문제에 사용할 수 없으며 최적화 알고리즘 ( 최대 사후 접근 방식을 사용하는 포인트 추정 ) 또는 MCMC 시뮬레이션 에 의존해야 합니다.

아래에서 데이터 예를 볼 수 있습니다.

n <- 1000
set.seed(123)
x     <- rnorm(n, 1.4, 2.7)
mu    <- numeric(n)
sigma <- numeric(n)

mu[1]    <- (10000*x[i] + (2.7^2)*0)/(10000+2.7^2)
sigma[1] <- (10000*2.7^2)/(10000+2.7^2)
for (i in 2:n) {
  mu[i]    <- ( sigma[i-1]*x[i] + (2.7^2)*mu[i-1] )/(sigma[i-1]+2.7^2)
  sigma[i] <- ( sigma[i-1]*2.7^2                  )/(sigma[i-1]+2.7^2)
}

결과를 플로팅하면 새 데이터가 누적 될 때 후방 이 추정 값에 도달하는 방법 (실제 값은 빨간색 선으로 표시됨)을 볼 수 있습니다.

정규 정규 모형에서 후속 단계에서 이전에 업데이트

자세한 내용 은 Kevin P. Murphy의 슬라이드가우시안 배포판의 Conjugate Bayesian 분석을 확인할 수 있습니다 . 또한 베이지안 이전의 표본이 큰 표본 크기와 관련이 없습니까? 당신은 또한 확인할 수 있습니다 그 노트이 블로그 항목 베이지안 추론에 액세스 단계별 도입을.


답변

이전 및 우도 함수 다음을 사용하여 사후를 계산할 수 있습니다.P ( X | θ )

P(θ)

P(xθ)

P(θx)=θP(xθ)P(θ)P(x)

이후 하나 메이크업 확률의 합과 단지 정규화 상수, 당신은 쓸 수 있습니다 :

P(x)

P(θ엑스)θ(엑스θ)(θ)

여기서 은 “비례합니다”를 의미합니다.

켤레 이전의 경우 (종종 멋진 닫힌 양식 수식을 얻는 경우)

켤레 이전에 관한이 Wikipedia 기사는 유익 할 수 있습니다. 하자 당신의 매개 변수의 벡터합니다. 하자 당신의 매개 변수를 통해 전합니다. 하자 가능성 함수 파라미터 주어진 데이터의 확률 될. 선행 와 사후 가 같은 패밀리에있는 경우 우도는 우도 함수 이전의 결합체 입니다 (예 : 둘 다 가우시안).

θ

(θ)

(엑스θ)

(θ)

P(θx)

켤레 분포 표는 직관을 세우는 데 도움이 될 수 있습니다 (또한 자신을 통해 작동하는 몇 가지 유용한 예를 제공함).


답변

이것은 베이지안 데이터 분석의 중심 계산 문제입니다. 실제로 관련된 데이터 및 배포에 따라 다릅니다. 모든 것이 닫힌 형태로 표현 될 수있는 간단한 경우 (예를 들어, 켤레 사전), 베이 즈 정리를 직접 사용할 수 있습니다. 더 복잡한 경우에 가장 많이 사용되는 기술은 Markov chain Monte Carlo입니다. 자세한 내용은 베이지안 데이터 분석에 대한 입문 교과서를 참조하십시오.


답변