확률 표기법의 의미 일반적으로 사용되는 표기법 와

많은 책과 논문에서 일반적으로 사용되는 표기법 와 의미 차이는 무엇입니까?

P(z;d,w)

P(z|d,w)


답변

나는 이것의 기원이 가능성 패러다임이라고 생각합니다 (아래의 실제 역사적 정확성을 확인하지는 않았지만 iot가 어떻게 생겼는지 이해하는 합리적인 방법입니다).

회귀 설정에서 분포는 p (Y | x, beta)입니다. 즉, x 및 베타 값을 알고있는 경우 조건부로 Y의 분포를 의미합니다.

베타를 추정하려면 가능성을 최대화하려고합니다. L (beta; y, x) = p (Y | x, beta) 본질적으로 이제 p (Y | x, beta) 식을보고 있습니다. 베타 기능이지만, 그 외에는 차이가 없습니다 (수학적으로 올바른 표현을 위해서는 올바르게 도출 할 수 있지만 실제로는 귀찮게하지 않아도됩니다).

그런 다음 베이지안 설정에서 매개 변수와 다른 변수의 차이가 곧 사라져서 두 표기법을 혼합하여 사용하기 시작했습니다.

따라서 본질적으로 실제 차이는 없습니다. 둘 다 왼쪽에있는 것의 조건부 분포를 나타내며 오른쪽에있는 것 (들)을 조건부로 나타냅니다.


답변

랜덤 변수의 밀도 X 점에서 X θ는 분포의 매개 변수 인. f ( x , θ ) 는점 ( x , θ ) 에서 X Θ 의 접합 밀도이며 Θ 가 임의 변수 인경우에만 의미가있습니다. f ( x | θ ) Θ가 주어진 X 의 조건부 분포이며, 다시 한 번만 의미가 있습니다.

f(x;θ)

X

x

θ

f(x,θ)

X

Θ

(x,θ)

Θ

f(x|θ)

X

Θ

는 랜덤 변수입니다. 책에 더 들어가서 베이지안 분석을 살펴보면 훨씬 명확 해집니다.

Θ

답변

f(x;θ)

f(x|θ)

와 동일합니다. 단순히

θ

는 고정 된 매개 변수이고 함수

f

x

의 함수입니다.

f(x,Θ)

, OTOH는 함수의 패밀리 (또는 세트)의 요소이며, 요소는

Θ

로 색인화됩니다. 미묘한 차이 일 수도 있지만 중요한 것은 esp. 알려진 데이터 x에 기초하여 알려지지 않은 파라미터

θ

를 추정 할 때가되었을 때; 그때, θ 변하고 x

x

θ

x

고정되어 “우도 함수”가됩니다. 통계 학자들 사이 에서

사용법 이 더 일반적이지만

;

수학자들 사이에서.


답변

항상 이런 식으로 된 것은 아니지만 요즘 는 일반적으로 d , w 가 임의의 변수가 아닌 경우 (이것은 반드시 알려진 것으로 말할 필요는 없음)입니다. P ( z | d , w )d , w의 값에 대한 컨디셔닝을 나타냅니다 . 컨디셔닝은 임의의 변수에 대한 작업이며 d , w 가 임의의 변수가 아닌 경우이 표기법을 사용하여 혼란스럽고 비극적입니다.

P(z;d,w)

d,w

P(z|d,w)

d,w

d,w

@Nick Sabbe가 지적했듯이 는 관측 된 데이터 y 의 샘플링 분포에 대한 일반적인 표기법입니다 . 일부 빈번한 사람들은이 표기법을 사용하지만 Θ 는 임의의 변수가 아니며, 이는 남용 IMO 라고 주장합니다 . 그러나 그들은 독점권이 없다. 조건부 끝에서 고정 하이퍼 파라미터를 사용하여 베이지안도 그렇게하는 것을 보았습니다.

p(y|X,Θ)

y

Θ