frequentist Archives - Page 6 of 7

배경 : 나는 베이지안 통계에 대한 공식적인 교육을받지 못했지만 (더 많은 것을 배우는 데 관심이 있지만) 많은 사람들이 왜 자주 통계보다 선호하는 것처럼 느끼는지에 대한 요지를 알 수 있습니다. 내가 가르치는 입문 통계 (사회 과학) 수업의 학부조차도 베이지안 접근 방식이 매력적이라는 것을 발견했다. “왜 우리는 널 (null)을 고려할 때 데이터의 확률을 계산하는 데 관심이 있는가? ? 귀무 가설 또는 대체 가설은 그리고 나는 또한 읽은 스레드 와 같은 이들 뿐만 아니라 베이지안 통계의 경험적인 혜택을 입증, 그러나 나는 Blasco는하여 견적을 통해 온 (2001; 강조 추가). :

동물 육종가 유도와 관련된 철학적 문제에 관심이 없지만 문제를 해결하는 도구에 관심이 있다면 베이지안과 빈번한 추론 학교가 잘 확립되어 있으며 왜 다른 학교가 선호되는지 정당화 할 필요가 없습니다. 어느 학교 나 다른 학교를 선택하는 것은 한 학교에 다른 학교가 제공하지 않는 솔루션 이 있는지, 문제가 얼마나 쉽게 해결 되는지에 관한 것이어야합니다. 특정 표현 방식으로 과학자가 얼마나 편안하게 느끼는지

질문 : Blasco 인용문은 빈번한 접근 방식이 실제로 베이지안 접근 방식보다 선호되는 경우가 있다고 제안하는 것 같습니다. 그래서 궁금합니다. 베이 즈 접근 방식보다 잦은 접근 방식이 언제 선호됩니까? 나는 개념적으로 (즉, 귀무 가설에 근거한 데이터의 확률이 특히 유용합니까?) 그리고 경험적으로 (즉, Frequentist 방법이 어떤 조건 하에서 Bayesian과 비교 되는가)?

답변이 가능한 한 쉽게 전달 될 수 있다면 좋을 것입니다. 학생들과 공유하기 위해 수업에 다시 응답하는 것이 좋습니다 (일부 기술 수준이 필요하다는 것을 이해하지만).

마지막으로, Frequentist 통계를 정기적으로 사용하고 있음에도 불구하고 실제로 Bayesian이 전반적으로 승리 할 가능성이 있습니다.

답변

잦은 방법이 선호되는 5 가지 이유는 다음과 같습니다.

더 빠릅니다. Bayesian 통계가 종종 잦은 답변에 거의 동일한 답변을 제공한다는 점을 감안할 때 (그렇지 않은 경우 Bayesian이 항상 가는 길이 라는 것이 100 % 명확하지 않음 ), 잦은 통계가 종종 몇 배 더 빨리 얻어 질 수 있다는 사실은 다음과 같습니다. 강력한 논쟁. 마찬가지로, 잦은 방법은 결과를 저장하는 데 많은 메모리가 필요하지 않습니다. 이러한 데이터는 특히 작은 데이터 세트에서 다소 사소한 것처럼 보일 수 있지만, 베이지안 및 빈번 주의자가 일반적으로 결과에 동의한다는 사실 (특히 많은 정보가있는 데이터가있는 경우)은 관심이있는 경우 덜 중요하게 신경을 쓸 수 있음을 의미합니다. 소지품. 물론 빅 데이터 세계에 살면 전혀 사소한 것이 아닙니다.
비모수 통계. 나는 베이지안 통계에는 비모수 통계가 있다는 것을 알고 있지만,이 분야의 빈번한 측면에는 경험적 분포 함수와 같은 부인할 수없는 실용적인 도구가 있다고 주장한다. EDF 나 Kaplan Meier 곡선 등을 세계 어느 방법으로도 대체 할 수는 없습니다 (물론 분석이 끝났다고 말할 수는 없습니다).
덜 진단. 베이지안 모델을 피팅하는 가장 일반적인 방법 인 MCMC 방법은 일반적으로 빈번한 카운터 부품보다 사용자가 더 많은 작업을 요구합니다. 일반적으로 MLE 추정에 대한 진단은 너무 간단하여 모든 우수한 알고리즘 구현이 자동으로 수행합니다 (사용 가능한 모든 구현이 좋은 것은 아닙니다 …). 따라서 빈번한 알고리즘 진단은 일반적으로 “모델을 피팅 할 때 빨간색 텍스트가 없는지 확인”입니다. 모든 통계는 대역폭을 제한 한 것으로,이 같은 질문을하는 데 더 많은 시간을 확보 감안할 때 “내 데이터는 정말 약 정상?” 또는 “이러한 위험이 실제로 비례합니까?”등
모델 오 사양에서 유효한 추론. 우리는 모두 “모든 모델이 잘못되었지만 일부는 유용하다”는 말을 들었지만, 다른 연구 영역에서이 문제를 다소 심각하게 생각합니다. 빈번한 문헌은 모델이 잘못 지정되었을 때 추론을 고치기위한 방법들로 가득 차 있습니다 : 부트 스트랩 추정기, 교차 검증, 샌드위치 추정기 (링크는 모델 오 사양에서 일반 MLE 추론에 대해 설명합니다), 일반화 된 추정 방정식 (GEE), 준우 도법, 등 내가 아는 한, 모델의 잘못된 사양에 따른 추론에 대한 베이지안 문헌에는 거의 없다 (모델 점검, 즉 사후 예측 점검에 대한 논의는 많지만). 나는 이것을 우연히 생각하지는 않는다. 평가자가 반복 된 시도에 대해 어떻게 행동하는지 평가하는 것은 평가자가 “진정한”모델을 기반으로 할 필요는 없지만 Bayes 정리를 사용하는 것은 아니다!
이전의 자유 (이것은 아마도 사람들이 베이지안 방법을 모든 것에 사용하지 않는 가장 일반적인 이유 일 것입니다). 베이지안 관점의 강점은 종종 이전의 사용으로 선전됩니다. 그러나 내가 일한 모든 응용 분야에서 분석 이전의 유익한 아이디어는 고려되지 않았습니다. 비 통계 전문가로부터 선행을 이끌어내는 방법에 대한 문헌을 읽으면 이에 대한 합리적인 추론이 이루어집니다. 나는 (나와 같은 잔인한 밀짚 꾼이 내 자신을 역설하는 것과 같은) 논문을 읽었다. 통계를 이해하는 데 어려움을 겪기 때문에 당신을 고용 한 연구원에게 물어보십시오. 이 범위는 일반적으로 너무 좁을 수 있으므로 임의로 범위를 넓히도록 시도하십시오. 그들의 믿음이 감마 분포처럼 보이는지 물어보십시오. 아마도 감마 분포를 그려야하고 모양 매개 변수가 작은 경우 꼬리가 어떻게 무거울 수 있는지 보여야합니다. 여기에는 PDF가 무엇인지 설명하는 것도 포함됩니다. “(참고 : 통계 학자조차도 실제로 정확하게 말할 수 있다고 생각하지 않습니다.효과 크기가 범위 내에 있는지 여부가 90 %인지 95 %인지에 대한 선험적 이며,이 차이는 분석에 상당한 영향을 줄 수 있습니다!). 진실은, 나는 매우 불친절하고 사전을 도출하는 것이 조금 더 간단한 상황이있을 수 있습니다. 그러나 이것이 어떻게 웜 캔인지 알 수 있습니다. 정보가없는 사전으로 전환하더라도 여전히 문제가 될 수 있습니다. 매개 변수를 변환 할 때 정보가없는 사전에 쉽게 착각하는 것이 갑자기 매우 유익한 것으로 보일 수 있습니다! 이것의 또 다른 예는 내가 말하지 않은 몇몇 연구원들과 이야기를 나 that다는 것입니다다른 전문가의 데이터 해석이 경험적으로 다른 전문가가 지나치게 자신감을 갖고 있기 때문에 듣고 싶어합니다. 오히려 다른 전문가의 데이터에서 유추 할 수있는 내용을 알고 자신의 결론을 내릴 수 있습니다. 어디서 들었는지 기억 나지 않지만 어딘가에서 “만약 당신이 베이지안이라면 모든 사람이 빈번 주의자가되기를 원합니다”라는 문구를 읽었습니다. 이론적으로, 만약 당신이 베이지안이고 누군가 분석 결과를 묘사한다면, 당신은 먼저 그들의 이전의 영향을 제거하고 당신이 자신의 것을 사용했을 때 그 영향이 무엇인지 알아 내야한다는 것을 의미합니다. 그들이 당신에게 믿을만한 간격이 아닌 신뢰 구간을 주면이 작은 운동은 단순화 될 것입니다!

물론, 당신이 유익한 사전을 포기하더라도, 베이지안 분석에는 여전히 유용성이 있습니다. 개인적으로, 나는 이것이 가장 높은 유용성이 있다고 믿는 곳입니다. MLE 방법을 사용하면 어떤 대답도하기 어려운 문제가 있지만 MCMC로 쉽게 해결할 수 있습니다. 그러나 이것이 베이지안의 가장 큰 유용성에 대한 나의 견해는 나 자신의 강한 우선 순위 때문이므로 소금 한 덩어리로 가져 가십시오.

답변

잦은 통계의 몇 가지 구체적인 장점 :

빈번한 문제에 대한 폐쇄 형 솔루션이 종종 있지만 베이지안 아날로그에서 폐쇄 형 솔루션을 사용하려면 켤레가 필요합니다. 이것은 여러 가지 이유로 유용합니다. 그 중 하나는 계산 시간입니다.
희망은 결국 사라질 이유 : 평신도들은 빈번한 통계를 배웁니다. 많은 사람들이 이해하기를 원한다면 자주 말하는 사람이 필요합니다.
NHST (Null Hypothesis Significance Testing) 접근 방식은 목표가 누군가를 잘못 증명하는 데 유용 할 때 유용합니다. 예, 베이지안에는 NHST 유사체가 있지만, 잦은 주의자 버전이 훨씬 더 간단하고 해석 가능하다는 것을 알았습니다.
없다 같은 것은 A와 진정으로 어떤 사람들을 불편하게 가치가없는 이전은.

답변

놀랍게도 아직 언급되지 않은 Frequentist 접근법을 사용하는 가장 중요한 이유는 오류 제어입니다. 종종 연구는 이분법적인 해석으로 이어집니다 (이에 대해 연구를해야합니까, 그렇지 않습니까? 개입을 구현해야합니까? 상용 접근 방식을 사용하면 유형 1 오류율을 엄격하게 제어 할 수 있습니다. 베이지안 접근법은 그렇지 않습니다 (일부는 가능성 접근법에서 보편적 인 경계를 물려 받지만 그럼에도 불구하고 작은 표본에서는 상대적으로 낮은 임계 값으로 오차율이 상당히 높을 수 있습니다 (예 : BF> 3). 베이 즈 요인 (예 : http://papers.ssrn.com/sol3/papers.cfm?abstract_id=2604513) 그러나 그것은 여전히 빈번한 접근 방식입니다. 나는 종종 연구자들이 증거 자체를 정량화하는 것 (일부 특정 가설과 관련하여)보다 오류 제어에 더 관심을 가지고 있으며, 적어도 모든 사람들이 오류 제어에 어느 정도 관심을두기 때문에 두 가지 접근법을 사용해야한다고 생각합니다. 보완 적으로.

답변

통계 학자로서 가장 큰 질문 중 하나는 가능성 원칙을 믿거 나 고수할지 여부를 스스로에게 물어봐야한다고 생각합니다. 만약 당신이 우도 원리를 믿지 않는다면 통계에 대한 빈번한 패러다임은 매우 강력 할 수 있다고 생각합니다. 그러나 우도 원리를 믿으면 베이지안 패러다임을 위반하지 않습니다.

익숙하지 않은 경우 가능성 원칙에 따라 다음과 같이 알려줍니다.

$θ$

θ

$\theta$ $x$

x

$\mathbf{x}$

ℓ (θ; x) = p (x | θ)

$\ell(\theta;\mathbf{x})=p(\mathbf{x}|\theta)$ $x$

x

$\mathbf{x}$

$x$

x

$\mathbf{x}$ $y$

y

$\mathbf{y}$ $ℓ (θ; x)$

ℓ (θ; x)

$\ell(\theta;\mathbf{x})$ $ℓ (θ; y)$

ℓ (θ; y)

$\ell(\theta;\mathbf{y})$ $C (x, y)$

C (x, y)

$C(\mathbf{x},\mathbf{y})$

ℓ (θ; x) = C (x, y) ℓ (θ; y) for all θ,

$\ell(\theta;\mathbf{x})=C(\mathbf{x},\mathbf{y})\ell(\theta;\mathbf{y})\hspace{.1in}\text{for all }\theta,$

$x$

x

$\mathbf{x}$ $y$

y

$\mathbf{y}$

$C (x, y)$

C (x, y)

$C(\mathbf{x},\mathbf{y})$ $(x, y)$

(x, y)

$(\mathbf{x},\mathbf{y})$ $C (x, y)$

C (x, y)

$C(\mathbf{x},\mathbf{y})$ $θ$

θ

$\theta$

$C (x, y) = 1$

C (x, y) = 1

$C(\mathbf{x},\mathbf{y})=1$ $θ$

θ

$\theta$ $θ$

θ

$\theta$

이제 베이지안 통계의 장점 중 하나는 적절한 사전에 베이지안 패러다임이 우도 원칙을 위반하지 않는다는 것입니다. 그러나 빈번주의 패러다임이 가능성 원칙을 위반하는 매우 간단한 시나리오가 있습니다.

다음은 가설 검정에 기반한 매우 간단한 예입니다. 다음을 고려하세요:

12 개의 베르누이 (Beroulli) 시험이 실시되었고 3 회의 성공이 관찰 된 실험을 고려하십시오. 중지 규칙에 따라 데이터를 다음과 같이 특성화 할 수 있습니다.

$X | θ \sim Bin (n = 12, θ)$
$Y | θ \sim NegBin (k = 3, θ)$

따라서 다음과 같은 우도 함수를 얻을 수 있습니다.

이는

, 따라서 우도 원리에 의해, 우리는 우도에서 동일한 에 대한 추론을 얻어야합니다 .

\begin{aligned} ℓ_{1} (θ; x = 3) & = (\binom{12}{3}) θ^{3} (1 - θ)^{9} \\ ℓ_{2} (θ; y = 12) & = (\binom{11}{2}) θ^{3} (1 - θ)^{9} \end{aligned}

$\begin{align} \ell_1(\theta;x=3)&=\binom{12}{3}\theta^3(1-\theta)^9\\ \ell_2(\theta;y=12)&=\binom{11}{2}\theta^3(1-\theta)^9\\ \end{align}$

ℓ_{1} (θ; x) = C (x, y) ℓ_{2} (θ, y)

$\ell_1(\theta;x)=C(x,y)\ell_2(\theta,y)$ $θ$

θ

$\theta$

이제 빈번주의 패러다임

H_{o} : θ \geq \frac{1}{2} versus H_{a} : θ < \frac{1}{2}

$H_o:\theta\geq\frac{1}{2}\hspace{.2in}\text{versus}\hspace{.2in}H_a:\theta<\frac{1}{2}$

이항 모델의 경우 다음이 있습니다.

\begin{aligned} p-value & = P (X \leq 3 | θ = \frac{1}{2}) \\ = (\binom{12}{0}) {(\frac{1}{2})}^{12} + (\binom{12}{1}) {(\frac{1}{2})}^{12} + (\binom{12}{2}) {(\frac{1}{2})}^{12} + (\binom{12}{3}) {(\frac{1}{2})}^{12} = 0.0723 \end{aligned}

$\begin{align} \text{p-value}&=P\left(X\leq 3|\theta=\frac{1}{2}\right)\\ &=\binom{12}{0}\left(\frac{1}{2}\right)^{12}+\binom{12}{1} \left(\frac{1}{2}\right)^{12}+ \binom{12}{2}\left(\frac{1}{2}\right)^{12}+\binom{12}{3}\left(\frac{1}{2}\right)^{12}=0.0723 \end{align}$

알 그러나 다른 조건 할 가능성 원칙을 만족시키지 않습니다. $(\binom{12}{3}) {(\frac{1}{2})}^{12} = ℓ_{1} (\frac{1}{2}; x = 3)$

(\binom{12}{3}) {(\frac{1}{2})}^{12} = ℓ_{1} (\frac{1}{2}; x = 3)

$\binom{12}{3}\left(\frac{1}{2}\right)^{12}=\ell_1(\frac{1}{2};x=3)$

음 이항 모델의 경우 다음과 같습니다.

\begin{aligned} p-value & = P (Y \geq 12 | θ \frac{1}{2}) \\ = (\binom{11}{2}) {(\frac{1}{2})}^{12} + (\binom{12}{2}) {(\frac{1}{2})}^{12} + (\binom{13}{2}) {(\frac{1}{2})}^{12} + . . . = 0.0375 \end{aligned}

$\begin{align} \text{p-value}&=P\left(Y\geq 12|\theta\frac{1}{2}\right)\\ &=\binom{11}{2}\left(\frac{1}{2}\right)^{12}+\binom{12}{2}\left(\frac{1}{2}\right)^{12}+ \binom{13}{2}\left(\frac{1}{2}\right)^{12}+...=0.0375 \end{align}$

위의 p- 값 계산에서 이항 모형에서는 를 기각 못하지만 음수 이항 모형을 사용하면 기각 . 따라서 p- 값과 이러한 p- 값에 따른 결정이 와 일치하더라도 일치하지 않습니다. 이 p- 값 인수는 베이지 안에서 Frequentist p- 값 사용에 대해 자주 사용하는 것입니다. $H_{o}$

H_{o}

$H_o$ $H_{o}$

H_{o}

$H_o$ $ℓ_{1} (θ; x) \propto ℓ_{2} (θ; y)$

ℓ_{1} (θ; x) \propto ℓ_{2} (θ; y)

$\ell_1(\theta;x)\propto\ell_2(\theta;y)$

이제 다음 가설을 다시 테스트하는 것이 그러나 베이지안 패러다임

H_{o} : θ \geq \frac{1}{2} versus H_{a} : θ < \frac{1}{2}

$H_o:\theta\geq\frac{1}{2}\hspace{.2in}\text{versus}\hspace{.2in}H_a:\theta<\frac{1}{2}$

이항 모델의 경우 다음이 있습니다.

\begin{aligned} P (θ \geq \frac{1}{2} | x) = \int_{1 / 2}^{1} π (θ | x) d x = \int_{1 / 2}^{1} θ^{3} (1 - θ)^{9} π (θ) d θ / \int_{0}^{1} θ^{3} (1 - θ)^{9} π (θ) d θ \end{aligned}

$\begin{align} P\left(\theta\geq\frac{1}{2}|x\right)=\int_{1/2}^1\pi(\theta|x)dx=\int_{1/2}^1\theta^3(1-\theta)^9\pi(\theta)d\theta \bigg/\int_{0}^1\theta^3(1-\theta)^9\pi(\theta)d\theta \end{align}$

마찬가지로, 이항 이항 모형의 경우 다음이 있습니다.

\begin{aligned} P (θ \geq \frac{1}{2} | y) = \int_{1 / 2}^{1} π (θ | x) d x = \int_{1 / 2}^{1} θ^{3} (1 - θ)^{9} π (θ) d θ / \int_{0}^{1} θ^{3} (1 - θ)^{9} π (θ) d θ \end{aligned}

$\begin{align} P\left(\theta\geq\frac{1}{2}|y\right)=\int_{1/2}^1\pi(\theta|x)dx=\int_{1/2}^1\theta^3(1-\theta)^9\pi(\theta)d\theta \bigg/\int_{0}^1\theta^3(1-\theta)^9\pi(\theta)d\theta \end{align}$

이제 베이지안 결정 규칙을 사용하여 (또는 다른 임계 값) 인 경우 선택 하고 대해 유사하게 반복하십시오 . $H_{o}$

H_{o}

$H_o$ $P (θ \geq \frac{1}{2} | x) > \frac{1}{2}$

P (θ \geq \frac{1}{2} | x) > \frac{1}{2}

$P(\theta\geq\frac{1}{2}|x)>\frac{1}{2}$ $y$

y

$y$

그러나 그래서 우리는 동일한 결론과 따라서이 접근법은 가능성 원칙을 만족시킨다. $P (θ \geq \frac{1}{2} | x) = P (θ \geq \frac{1}{2} | y)$

P (θ \geq \frac{1}{2} | x) = P (θ \geq \frac{1}{2} | y)

$P\left(\theta\geq\frac{1}{2}|x\right)=P\left(\theta\geq\frac{1}{2}|y\right)$

그리고 결론을 내릴 수 있도록, 만약 당신이 가능성 원칙에 관심이 없다면, 자주주의하는 것이 좋습니다! (당신이 말할 수 없다면, 나는 베이지안입니다 :))

답변

당신과 나는 과학자이며 과학자로서 주로 증거 문제에 관심이 있습니다. 따라서 가능한 경우 베이지안 접근 방식이 바람직하다고 생각합니다.

베이지안 접근법은 우리의 질문에 대답합니다 : 한 가설에 대한 증거의 강도는 무엇입니까? 반면에 빈번한 접근 방식은 그렇지 않습니다. 하나의 가설이 주어지면 데이터가 이상한지 여부 만보고합니다.

즉, 베이지안의 주목할만한 Andrew Gelman은 p- 값 (또는 p- 값과 같은 그래픽 검사)을 모델 사양의 오류 검사로 사용하지 않는 것으로 보입니다. 이 블로그 게시물 에서이 접근 방식에 대한 암시를 볼 수 있습니다 .

내가 이해 한 그의 접근 방식은 2 단계 프로세스와 비슷하다. 첫째, 그는 베이지안에게 한 모델의 다른 모델에 대한 증거가 무엇인지 질문한다. 두 번째로, 그는 선호 모델이 실제로 데이터가 주어진 모든 그럴듯하게 보이는지에 대해 Frequentist 질문을합니다. 그것은 나에게 합리적인 하이브리드 접근법처럼 보입니다.

답변

개인적으로 베이직 응답보다 잦은 응답이 선호되는 상황을 생각하기가 어렵습니다. 내 생각은 여기 와 pharrell.com의 다른 블로그 기사에서 p- 값 및 귀무 가설 테스트 문제에 대해 자세히 설명 합니다 . 빈번한 사람들은 몇 가지 근본적인 문제를 무시하는 경향이 있습니다. 다음은 샘플입니다.

분산 이 일정 하고 다른 몇 가지 경우 가있는 가우시안 선형 모형 외부에서 계산 된 p- 값은 데이터 세트 및 모형에 대해 알려지지 않은 정확도입니다.
실험이 순차적이거나 적응적일 때, 종종 p- 값을 계산할 수없고 달성하기 위해 전체 수준 만 설정할 수있는 경우가 종종 있습니다 $α$
빈번한 전문가들은 제 1 종 오류가 아래로 떨어지지 않도록 기뻐합니다.
다중성 보정이 어떻게 형성되는지에 대한 빈번한 처방은 없으며, 방법의 임시 피지가 발생합니다.

첫 번째 요점과 관련하여 일반적으로 사용되는 모델은 이진 로지스틱 모델입니다. 로그 가능성은 매우 이차적이지 않으며, 이러한 모델에 대해 계산 된 대부분의 신뢰 한계 및 p- 값은 매우 정확하지 않습니다. 정확한 추론을 제공하는 베이지안 로지스틱 모델과는 대조적입니다.

다른 사람들은 빈번한 추론을 사용하는 이유로 오류 제어 를 언급했습니다 . 나는 이것이 참조 하는 오류 가 장기 오류 이기 때문에 수천 개의 통계 테스트가 실행되는 프로세스를 계획 하기 때문에 이것이 논리적이라고 생각하지 않습니다 . "법정에서 장기적인 거짓 유죄 판결 확률은 0.03에 불과하다"고 판사는 금지되어야합니다. 그녀는 현재 피고인을 위해 올바른 결정을 내릴 가능성이 가장 높다고 주장한다 . 반면에 효과에서 사후 확률을 뺀 값은 영 또는 후진 효과의 영아이며 실제로 필요한 오차 확률입니다.

답변

많은 사람들은 제 3의 철학적 학교 인 가능성주의를 인식하지 못하는 것 같습니다. AWF Edwards의 저서 인 Likelihood는 아마도이 책을 읽을 수있는 가장 좋은 곳일 것입니다. 여기 그가 쓴 짧은 기사가 있습니다.
우도 론은 베이지안과 같은 p- 값을 피할뿐 아니라 베이지안의 종종 모호한 사전을 피합니다. 여기에도 소개 치료 가 있습니다.

How IT

언제든지 물어보세요.

태그 보관물: frequentist

Bayesian보다 잦은 접근 방식이 실질적으로 더 좋은 경우는 언제입니까? 온 (2001; 강조 추가). :

답변

답변

답변

답변

답변

답변

답변