나는 칼만 필터를 매우 표준적인 방법으로 사용하고 있습니다. 시스템은 상태 방정식 및 관측 방정식 됩니다.
xt+1=Fxt+vt+1yt=Hxt+Azt+wt
교과서는 Kalman 필터를 적용하고 “일단 예측” (또는 “필터링 된 추정치”)을 얻은 후에이를 사용하여 우도 함수를 계산해야한다고 가르칩니다 .
x^t|t−1fyt|It−1,zt(yt|It−1,zt)=det[2π(HPt|t−1H′+R)]−12exp{−12(yt−Hx^t|t−1−Azt)′(HPt|t−1H′+R)−1(yt−Hx^t|t−1−Azt)}
내 질문은 다음과 같습니다. 왜 우도 함수 는 “평활 추정” \ hat {x} _ {t | T}이 아닌 “필터링 된 추정”
x^t|t−1하여 계산 됩니까? 아니다 \ 모자 {X} _ {t | T} 상태 벡터의 더 나은 추정?
x^t|Tx^t|T
답변
질문에 대답하기 위해 : 평활 밀도를 사용할 수 있습니다. 그러나 당신은 할 필요가 없습니다. Jarle Tufto의 답변에는 사용중인 분해가 있습니다. 그러나 다른 사람들이 있습니다.
칼만 재귀 사용
여기에서는
그러나 평균과 분산이 일반적으로 확률 분포를 완전히 정의하는 것은 아닙니다. 다음은 분포 에서 조건부 우도 필터링 분포를 이동하는 데 사용하는 분해입니다. :f ( y i | y 1 , … , y i – 1 )
에프(엑스나는−1|와이1,…,와이나는−1)에프(와이나는|와이1,…,와이나는−1)
여기서 은 모델의 상태 전이 밀도 … 일부이고 는 다시 모델의 관찰 밀도입니다. 귀하의 질문에 이것을 및 로 작성하십시오. 그건 같은거야.f ( y i | x i ) x t + 1 = F x t + v t + 1 y t = H x t + A z t + w t
에프(엑스나는|엑스나는−1)에프(와이나는|엑스나는)
엑스티+1=에프엑스티+V티+1
와이티=H엑스티+ㅏ지티+승티
한 단계 앞선 상태 예측 분포를 얻으면 그것은 . 다시 통합하면 (1)을 완전히 얻습니다. 당신은 당신의 질문에 그 밀도를 완전히 기록합니다. 같은 것입니다.
∫에프(엑스나는|엑스나는−1)에프(엑스나는−1|와이1,…,와이나는−1)디엑스나는−1여기서는 확률 분포의 분해와 모형에 대한 가정 만 사용합니다. 이 가능성 계산은 정확한 계산입니다. 이 작업을 더 나쁘게 수행하는 데 사용할 수있는 재량은 없습니다.
EM 알고리즘 사용
내 지식으로는, 이런 종류의 상태 공간 모델에서 가능성을 직접 평가하는 다른 방법은 없습니다. 그러나 다른 기능을 평가하여 최대한 가능성 추정을 수행 할 수 있습니다. EM 알고리즘을 사용할 수 있습니다. 기대 단계 (E-Step)에서
여기f ( y 1 , … , y n , x 1 , … , x n )
에프(와이1,…,와이엔,엑스1,…,엑스엔)
“완전한 데이터”일 가능성이 있으며, 조인트 평활 밀도와 관련하여 그 로그를 기대하고 있습니다. 이 완전한 데이터 가능성에 대한 로그를 취하고, 용어를 합계로 나누고, 기대 연산자의 선형성 때문에 한계 평활 분포 (예 : 평활도 분포)에 대한 기대치를 얻는 경우가 종종 발생합니다. 당신은 당신의 질문에 언급).
다른 것들
나는 EM이 가능성을 극대화하기위한 “보다 안정적인”방법이라는 곳에서 읽었지만,이 점이 실제로 잘 논증되는 것을 본 적이없고이 단어 “stable”이 전혀 정의 된 것도 본 적이 없지만 실제로 이것을 더 조사하지 않았습니다. 이 알고리즘들 중 어느 것도 로컬 / 글로벌 최대치 문제를 해결하지 못합니다. 나는 개인적으로 칼만을 습관적으로 더 자주 사용하는 경향이 있습니다.
평활화 된 상태 추정치가 일반적으로 필터링보다 작은 분산을 갖는 것이 사실이므로 이에 대해 약간의 직관을 갖는 것이 옳지 만 실제로 상태를 사용하지는 않습니다. 최대화하려는 가능성은 상태의 기능이 아닙니다.
답변
일반적으로 제품 규칙에 따라 정확한 가능성은
상태 공간 모델의 가정 에서 과거 관측치에 대한 각 의 기대 벡터 및 분산 행렬은 로 표현 될 수 있습니다.
및
y i E ( y i | y 1 , … , y i – 1 )
와이나는
V a r ( y i | y 1 , … , y i – 1 )
따라서 이것은 평활화 된 추정값을 계산하지 않고도 정확한 가능성을 제공합니다.
물론 미지의 상태에 대한 더 나은 추정치 인 평활화 된 추정치를 사용할 수 있지만, 이것은 우도 함수를 제공하지 않습니다. 실제로 의 관측 값을 사용하여 자체 예상 값을 추정하므로 결과 추정치에 약간의 편차가 생길 수 있습니다.
와이나는답변
스무딩 분포가 사용되지 않는 (일반적으로) 효율성에 대한 “왜”에 대한 더 나은 대답은 생각합니다. 원칙적으로 (매끄러운) 한계 가능성을 다음과 같이 탈퇴 식으로 계산하는 것이 간단합니다. 관측치 j를 삭제하고 나머지 데이터에 대해 Kalman을 더 부드럽게 실행하십시오. 그런 다음 보이지 않는 y (j)의 가능성을 평가하십시오. 모든 j에 대해 이것을 반복하십시오. 로그 우도를 요약하십시오. 이보다 빠른 버전은 (랜덤 화) 보류 샘플 블록 (예 : k- 폴드 CV)과 함께 작동합니다. 이 체계에는 필요에 따라 측정 업데이트를 임의로 건너 뛸 수있는보다 일반적인 칼만 필터 / 스무더 구현이 필요합니다. 역방향 / 스무딩 패스는 측정 (RTS 알고리즘)에 액세스하지 않으며 동일하게 유지됩니다.
시계열이 “충분히 긴”경우 필터링 가능성이 초기 과도 현상을 “번 오프”하므로이 작업을 수행하는 데 유용한 이점이 거의 없습니다. 그러나 데이터 집합이 짧으면 값 비싼 평활 가능성이 그만한 가치가 있습니다. 고정 지연이 더 매끄러 울수록 중간 솔루션이 될 수 있습니다.