가능성에 대한 위키 백과 입장은 모호해 보인다 분포를 가진 확률 변수 일 수

“조건부 확률”과 “가능성”에 관한 간단한 질문이 있습니다. (나는 이미이 질문을 조사했다 여기 지만 아무 소용에.)

Wikipedia 페이지에서 시작합니다 . 그들은 이렇게 말합니다.

가능성 파라미터 값들의 세트는 , 소정의 결과 이며, 이러한 파라미터 값 주어진 이러한 관찰 결과의 확률 같다

θ

x

L(θ∣x)=P(x∣θ)

큰! 따라서 영어, I 같이 숙지 “세타 같게 변수의 우도 데이터 X = X (좌측면) 부여, X와 동일하고, 데이터 X의 확률로 동일한 특정 매개 변수 그 세타와 같습니다 ” ( 굵은 글씨는 강조하기위한 것입니다 ).

그러나 같은 페이지에서 3 줄 이상을 지나면 Wikipedia 항목은 다음과 같이 말합니다.

하자 이산 확률 분포를 가진 확률 변수 일 수
파라미터에 따라 . 그런 다음 기능

X

p

θ

L(θ∣x)=pθ(x)=Pθ(X=x),

의 함수로 간주되는 확률 함수 ( 임의 변수 의 결과 가
주어지면 의 함수)라고합니다 . 때때로 값의 확률 의 파라미터 값 로 기록된다 ; 이것은 종종 로 작성되어 이것이 조건부 확률이 아닌 과 다르다는
것을 강조하기 위해 입니다. 는 임의의 변수가 아니라 매개 변수 이기 때문 입니다.

θ

θ

x

X

x

X

θ

P(X=x∣θ)

P(X=x;θ)

L(θ∣x)

θ

( 굵은 글씨는 강조하기위한 것입니다 ). 그래서 첫 번째 인용에서, 우리는 문자 그대로 의 조건부 확률에 대해 말하지만, 그 직후에는 이것이 실제로 조건부 확률이 아니며 실제로 ?

P(x∣θ)

P(X=x;θ)

그래서 어느 쪽입니까? 가능성은 실제로 첫 번째 인용문 인 조건부 확률을 의미합니까? 아니면 두 번째 인용문과 비슷한 단순한 확률을 의미합니까?

편집하다:

지금까지받은 모든 도움이되고 통찰력있는 답변을 바탕으로 내 질문과 내 이해를 요약했습니다.

  • 에서 영어 “가능성이 관측 된 데이터을 부여한 매개 변수의 함수이다.”우리는 말 에서는 수학 : 우리 다 쓰고 .
    L(Θ=θ∣X=x)

  • 가능성은 확률이 아닙니다.
  • 가능성은 확률 분포가 아닙니다.
  • 가능성은 확률 질량이 아닙니다.
  • 우도 그러나이다 영어 “어디에서 확률 분포의 곱 (연속 케이스) 또는 확률 질량의 곱 (이산 경우) 및 파라미터 로 . ” 에서는 수학 , 우리는 다음과 같은 것이 해주기 (연속적인 경우, 는 PDF 임) 및 (이 경우 는 확률 질량 임) 여기서의 테이크 아웃은 어떤 시점에서도Θ = θ L ( Θ = θ X = x ) = f ( X = x ; Θ = θ ) f L ( Θ = θ X = x ) = P ( X = x ; Θ = θ ) P
    X=x

    Θ=θ

    L(Θ=θ∣X=x)=f(X=x;Θ=θ)

    f


    L(Θ=θ∣X=x)=P(X=x;Θ=θ)

    P

    조건부 확률은 전혀 작용하지 않습니다.
  • 베이 즈 정리에서, 우리는 : . 구어체로, 우리는 이야기되는 ” 가능성이다”, 그러나 이것은 사실이 아니다 이후, 될 가능성이있는 실제 랜덤 변수. 그러나 우리가 올바르게 말할 수있는 것은이 용어 는 단순히 가능성과 “유사하다”는 것입니다. (?) [이건 확실하지 않습니다.] P(X=xΘ=θ)ΘP(X=xΘ=θ)
    P(Θ=θ∣X=x)=P(X=x∣Θ=θ) P(Θ=θ)P(X=x)

    P(X=x∣Θ=θ)

    Θ

    P(X=x∣Θ=θ)

편집 II :

@amoebas 답변을 바탕으로 그의 마지막 의견을 작성했습니다. 나는 그것이 분명히 설명하고 있다고 생각하며, 내가 가지고 있었던 주요 논쟁을 해결한다고 생각합니다. (이미지에 대한 의견).

여기에 이미지 설명을 입력하십시오

편집 III :

@amoebas 의견을 Bayesian 사례로 확장했습니다.



답변

나는 이것이 불필요하게 헤어를 분할한다고 생각합니다.

조건부 확률 의 주어진 두 개의 랜덤 변수의 정의 및 값을 가지고 및 . 그러나 우리는 또한 확률에 대해 이야기 할 수 의 주어진 곳 하지 임의의 변수 만 매개 변수입니다.x y X Y x y P ( x θ ) x θ θ

P(x∣y)≡P(X=x∣Y=y)

x

y

X

Y

x

y

P(x∣θ)

x

θ

θ

두 경우 모두 동일한 용어 “주어진”및 동일한 표기법 사용할 수 있습니다. 다른 표기법을 발명 할 필요가 없습니다. 또한 “매개 변수”와 “무작위 변수”는 철학에 따라 달라질 수 있지만 수학은 바뀌지 않습니다.

P(⋅∣⋅)

Wikipedia의 첫 번째 인용문은 로 정의되어 있습니다. 여기서 는 매개 변수 라고 가정합니다 . 두 번째 인용문은 이 조건부 확률 이 아니라고 말합니다 . 이것은 주어진 의 조건부 확률이 아님을 의미합니다 . 는 여기서 매개 변수로 간주 되기 때문에 실제로는 불가능합니다 .θ L ( θ x ) θ x θ

L(θ∣x)=P(x∣θ)

θ

L(θ∣x)

θ

x

θ

베이 즈 정리 하여 와 는 모두 랜덤 변수입니다. 그러나 우리는 여전히 호출 할 수 있습니다 (의 “가능성” ), 지금은 또한이다 선의 (의 조건부 확률 ). 이 용어는 베이지안 통계에서 표준입니다. 아무도 그것이 가능성에 “유사한”것이라고 말하지 않습니다. 사람들은 단순히 그것을 가능성이라고 부릅니다.abP(ba)ab

P(a∣b)=P(b∣a)P(a)P(b),

a

b

P(b∣a)

a

b

참고 1 : 마지막 단락에서 는 분명히 의 조건부 확률입니다 . 가능성 로서 ; 하지만의 확률 분포 (또는 조건부 확률)하지 ! 이상 자사의 통합 반드시 동일하지 않습니다 . ( 보다 적분이있는 반면 )b L ( a b ) a a a 1 b

P(b∣a)

b

L(a∣b)

a

a

a

1

b

참고 2 : 때때로 가능성은 @MichaelLew에 의해 강조되는 것처럼 임의의 비례 상수까지 정의됩니다 (대부분 사람들이 가능성 비율에 관심이 있기 때문에 ). 이것은 유용 할 수 있지만 항상 수행되는 것은 아니며 필수적인 것은 아닙니다.


참조 “가능성”과 “가능성”의 차이점은 무엇입니까? 특히 @whuber의 답변이 있습니다.

이 스레드에서 @Tim의 답변에 완전히 동의합니다 (+1).


답변

당신은 이미 두 가지 좋은 답변을 얻었지만 여전히 명확하지 않기 때문에 하나를 제공해 드리겠습니다. 가능성 은 다음과 같이 정의됩니다

L(θ|X)=P(X|θ)=∏ifθ(xi)

데이터 주어지면 매개 변수 값 가있을 가능성 이 있습니다 . 그것은 확률 질량 (분리 된 경우), 또는 밀도 (연속 케이스)의 제품 기능과 동일하다 의 에 의해 매개 변수화 . 가능성은 데이터가 주어진 매개 변수의 함수입니다. 공지 사항 것을 우리가 최적화되어있는 매개 변수입니다 하지 그것에 할당 된 확률이없는, 그래서 임의의 변수입니다. 이것이 Wikipedia가 조건부 확률 표기법을 사용하는 것이 임의의 변수에 의존하지 않기 때문에 모호 할 수 있다고 말하는 이유입니다. 다른 한편으로는, 베이지안에서 설정 ISX f X θ θ θ

θ

X

f

X

θ

θ

θ

임의의 변수에 분포가 있으므로 다른 임의의 변수와 마찬가지로 변수를 사용할 수 있으며 Bayes 정리를 사용하여 사후 확률을 계산할 수 있습니다. 베이지안 우도는 모수에 대한 데이터의 우도에 대해 알려주기 때문에 여전히 우도입니다. 유일한 차이점은 모수가 임의 변수로 간주된다는 것입니다.

프로그래밍을 알고 있다면 프로그래밍에서 오버로드 된 함수 로 우도 함수를 생각할 수 있습니다 . 일부 프로그래밍 언어를 사용하면 다른 매개 변수 유형을 사용하여 호출 할 때 다르게 작동하는 기능을 가질 수 있습니다. 이와 같은 가능성을 생각하면 기본적으로 if는 일부 매개 변수 값을 인수로 사용 하고이 매개 변수가 주어진 데이터의 가능성을 반환합니다. 다른 한편으로, 매개 변수가 임의 변수 인 베이 지안 설정에서 이러한 기능을 사용할 수 있습니다. 이는 기본적으로 동일한 출력으로 이어지지 만 임의 변수를 조건화하기 때문에 조건부 확률로 이해할 수 있습니다. 두 경우 모두 기능이 동일하게 작동하므로 사용하고 조금 다르게 이해하면됩니다.

// likelihood "as" overloaded function
Default Likelihood(Numeric theta, Data X) {
    return f(X, theta); // returns likelihood, not probability
}

Bayesian Likelihood(RandomVariable theta, Data X) {
    return f(X, theta); // since theta is r.v., the output can be
                        // understood as conditional probability
}

게다가 베이 즈 정리를 다음과 같이 쓰는 베이지안을 찾지 못할 것입니다.

P(θ|X)∝L(θ|X)P(θ)

… 이것은 매우 혼란 스러울 것 입니다. 첫째, 방정식의 양쪽에 가 있고 의미가 없습니다. 둘째, 우리는 주어진 데이터의 주어진 확률에 대해 알 수 있는 사후 확률 집니다 (즉, 가능성 론 프레임 워크에서 알고 싶은 것이지만, 가 랜덤 변수가 아닌 경우는 아닙니다). 셋째, 는 랜덤 변수이므로 조건부 확률로 작성합니다. θ θ

θ|X

θ

θ

L

θ

L

-표기는 일반적으로 가능성 설정을 위해 예약되어 있습니다. 이름 가능성은 두 가지 접근 방식 모두에서 관례에 따라 비슷한 것을 나타냅니다. 모델과 매개 변수에서 이러한 데이터 변경을 관찰하는 확률.


답변

혼동을 유발하는 방식으로 세부 사항이 부정확하거나 생략 된 가능성에 대한 일반적인 설명에는 몇 가지 측면이 있습니다. Wikipedia 항목이 좋은 예입니다.

첫째, 우도는 비례 상수까지만 정의되므로 모수는 일반적으로 모수 값이 주어진 데이터의 확률 과 같을 수 없습니다 . 피셔는 처음 가능성을 공식화했을 때 그 점에 대해 명백했다 (Fisher, 1922). 그 이유는 우도 함수의 적분 (또는 합)에 대한 제한이 없으며, 모수의 값이 주어지면 통계 모델 내에서 데이터 를 관측 할 확률 이 크게 영향을 받기 때문입니다. 데이터 값의 정밀도 및 매개 변수 값 지정의 입도

x

둘째, 개별 가능성보다 가능성 기능에 대해 생각하는 것이 더 도움이됩니다. 우도 함수는 우도 함수의 그래프에서 알 수 있듯이 모형 모수 값의 함수입니다. 이러한 그래프는 또한 가능성이 모델이 매개 변수 값으로 설정 될 때 모델이 데이터를 얼마나 잘 예측하는지에 따라 매개 변수의 다양한 값의 순위를 매길 수 있음을 쉽게 알 수있게합니다. 가능성 함수의 탐구는 원래의 질문에 주어진 다양한 공식의 동요보다 데이터의 역할과 매개 변수 값을 훨씬 더 명확하게 만듭니다.

모수 값 (모형 내)에 대해 관측 된 데이터가 제공하는 상대적인 지지도는 비율이 상쇄되므로 알 수없는 비례 상수의 문제를 해결할 수 있으므로 우도 함수 내에서 우도 쌍의 비율을 사용하십시오. 상수가 별도의 우도 함수 (예 : 다른 통계 모델)에서 비롯된 우도 비율에서 반드시 취소되는 것은 아니라는 점에 유의해야합니다.

마지막으로, 가능성은 통계 모델과 데이터에 의해 결정되므로 통계 모델의 역할에 대해 명시 적으로 설명하는 것이 유용합니다. 다른 모형을 선택하면 다른 우도 함수를 얻게되며 다른 알려지지 않은 비례 상수를 얻을 수 있습니다.

따라서, 원래의 질문에 대답하기 위해, 가능성은 어떤 종류의 가능성도 아니다. 그들은 Kolmogorov의 확률 공리에 순종하지 않으며 다양한 유형의 확률에 의해 수행되는 역할과 추론을 통계적으로 뒷받침하는 데 다른 역할을합니다.

  1. Fisher (1922) 통계의 수학적 기초 http://rsta.royalsocietypublishing.org/content/222/594-604/309

답변

위키가 있다고해야 의 조건부 확률 아니다 일부 지정된 세트에있는,도의 확률 밀도 . 무한히 많은 값이있는 경우 실제로 파라미터 공간에서 사용자가 가질 수

가짐으로써, 예를 들어 의 값에 관계없이 매개 변수 공간 에 표준 측정 값 가있는 경우와 동일한 방식으로 가질 수 있습니다

이 기사에서 강조해야 할 핵심은

L(θ)

θ

θ

θ

∑θL(θ)=∞,

L(θ)=1

θ

Θ

∫ΘL(θ)dθ=∞.

L

함수

θ↦P(x∣θ) and NOT x↦P(x∣θ).


답변

“나는 이것을 다음과 같이 읽었다 :”데이터 X = x, (왼쪽)의 세타와 같은 파라미터의 가능성은 데이터 X가 x와 같을 가능성이 같다. 세타 “(굵게 강조)

그것은 관찰 세트의 확률이다 주어진 매개 변수 세타입니다. 를 쓴 다음 을 작성하기 때문에 혼란 스러울 수 있습니다.

P(x|θ)

L(θ|x)

객관적인 설명은 가 임의의 변수가 아니라는 것을 암시 합니다. 예를 들어, 베이지안 설정에서 사전 분포가있는 임의 변수 일 수 있습니다. 그러나 요점 은 구체적인 가치 인 가정 한 다음 관측 가능성에 대해 진술하는 것입니다. 우리가 관심있는 시스템 에는 값이 하나뿐이기 때문 입니다.

θ

θ=θ

θ