태그 보관물: computational-statistics

computational-statistics

플립의 수가 증가함에 따라 꼬리와 같은 수의 머리를 뒤집을 가능성이 적은 이유를 설명하는 통계 개념? 시뮬레이션하는 동안 나는

저는 몇 권의 책을 읽고 코드를 작성하여 확률과 통계를 배우고 있습니다. 동전 뒤집기를 시뮬레이션하는 동안 나는 순진한 직관에 약간 반하는 것으로 나타났습니다. 공정한 동전을 번 뒤집 으면 머리와 꼬리의 비율 은 예상 대로 증가함에 따라 1로 수렴 합니다. 그러나 다른 한편으로, 증가함에 따라 꼬리와 같은 수의 머리를 뒤집을 가능성 이 줄어들어 정확히 1 의 비율을 얻습니다 .

n

n

n

예를 들어 (내 프로그램의 일부 출력)

For 100 flips, it took 27 experiments until we got an exact match (50 HEADS, 50 TAILS)
For 500 flips, it took 27 experiments until we got an exact match (250 HEADS, 250 TAILS)
For 1000 flips, it took 11 experiments until we got an exact match (500 HEADS, 500 TAILS)
For 5000 flips, it took 31 experiments until we got an exact match (2500 HEADS, 2500 TAILS)
For 10000 flips, it took 38 experiments until we got an exact match (5000 HEADS, 5000 TAILS)
For 20000 flips, it took 69 experiments until we got an exact match (10000 HEADS, 10000 TAILS)
For 80000 flips, it took 5 experiments until we got an exact match (40000 HEADS, 40000 TAILS)
For 100000 flips, it took 86 experiments until we got an exact match (50000 HEADS, 50000 TAILS)
For 200000 flips, it took 96 experiments until we got an exact match (100000 HEADS, 100000 TAILS)
For 500000 flips, it took 637 experiments until we got an exact match (250000 HEADS, 250000 TAILS)
For 1000000 flips, it took 3009 experiments until we got an exact match (500000 HEADS, 500000 TAILS)

내 질문은 이것입니다 : 이것을 설명하는 통계 / 확률 이론에 개념 / 원리가 있습니까? 그렇다면 어떤 원칙 / 개념입니까?

내가 이것을 어떻게 생성했는지보고 싶은 사람이 있다면 코드에 연결 하십시오.

— 편집하다 —

그만한 가치를 위해 여기에 이것을 나 자신에게 설명하는 방법이 있습니다. 공정한 동전을 번 번 머리 수를 기본적으로 임의의 숫자가 생성됩니다. 마찬가지로 같은 일을하고 꼬리를 세면 난수도 생성됩니다. 따라서 둘 다 계산하면 실제로 두 개의 난수를 생성하고 이 커질수록 난수가 커집니다. 그리고 생성하는 난수가 클수록 서로 “누락”할 가능성이 높아집니다. 이 흥미로운 점은 두 숫자가 실제로 어떤 의미로 연결되어 있고, 각 숫자가 분리되어 있어도 비율이 더 커질수록 비율이 1로 수렴한다는 것입니다. 어쩌면 나일지도 모르지만 그런 종류의 깔끔한 것을 발견했습니다.



답변

헤드 수와 테일 수가 동일한 경우는 “헤드를 정확히 얻을 수있는 시간의 절반”과 같습니다. 따라서 헤드 수를 세어 토스 수의 절반인지 또는 헤드의 비율을 0.5와 동일하게 비교하는지 확인하십시오.

더 많이 뒤집을수록 가능한 수의 헤드 수가 많아집니다. 분포가 더 넓어집니다 (예 : 확률의 95 %를 포함하는 헤드 수의 간격은 토스 수가 증가함에 따라 더 커집니다) 우리가 더 많이 던질수록 정확히 절반의 머리가 나올 확률이 줄어 듭니다.

이에 따라 헤드 비율은 더 많은 가능한 값을 갖습니다. 100 토스에서 200 토스로 이동하는 여기를 참조하십시오.

100 토스로 우리는 0.49 헤드 또는 0.50 헤드 또는 0.51 헤드의 비율을 관찰 할 수 있지만 (그 값 사이에는 아무것도 없지만) 200 토스로 0.49 또는 0.495 또는 0.50 또는 0.505 또는 0.510을 관찰 할 수 있습니다. 확률은 더 많은 가치를 가짐으로써 각각이 더 작은 점유율을 얻는 경향이 있습니다.

당신이보다 고려 어떤 확률로 토스를 P 나는 점점 내가 (우리가 이러한 확률을 알고 있지만,이 부분에 대한 중요하지의) 머리를, 그리고 당신이 더 토스를 추가합니다. 에서는 2 개 N 토스, N 헤드 가장 가능성있는 결과이다 ( P , N > P N ± 1 및 거기에서 아래로 이동).

2엔

pi

i

2n

n

pn>pn±1

2 n + 2 토스 에서 헤드 를 가질 확률은 얼마입니까?

n+1

2n+2

(이 확률을 와 함께 표시하여 이전과 혼동하지 말고 다음 두 번의 토스에서 P (HH)가 “Head, Head”의 확률이되도록하십시오)

q

qn+1=pn−1P(HH)+pn(P(HT)+P(TH))+pn+1P(TT)

<pnP(HH)+pn(P(HT)+P(TH))+pnP(TT)=pn

즉, 두 개의 코인-토스를 더 추가하면 중간 값의 확률이 자연스럽게 줄어 듭니다.

그래서 한 너가 이렇게 편안 피크가 중간에있을 것 (위해 로), 정확히 절반 헤드의 확률이 감소한다 n이 올라갑니다.

2n=2,4,6,...

n

실제로 우리는 큰 에 대해 p n1에 비례하여 감소 함을 보여줄 수 있습니다.

n

pn

(의외로, 표준화 된 헤드 수의 분포가 정규에 접근하고 헤드 비율의 분산이n에따라 감소하기 때문에).

1n

n

요청에 따라 위의 플롯과 비슷한 것을 생성하는 R 코드가 있습니다.

 x1 = 25:75
 x2 = 50:150
 plot(x1 / 100, dbinom(x1, 100, 0.5), type = "h",
       main = "Proportion of heads in 100 and 200 tosses",
       xlab = "Proportion of heads",
       ylab = "probability")
 points(x2 / 200, dbinom(x2, 200, 0.5), type = "h", col = 3)

답변

큰 숫자법칙은 실험의 첫 번째 결론, 즉 공정한 동전을 번 뒤집 으면 머리와 꼬리의 비율이 n이 증가함에 따라 1로 수렴 한다는 것을 알고 있습니다 .

n

n

아무 문제가 없습니다. 그러나이 시나리오에서는 모든 대수 법칙에 대해 알려줍니다.

그러나 이제이 문제에 대해보다 직관적으로 생각해보십시오. 동전을 조금씩 뒤집는 것을 고려하십시오 (예 : .

n=2,4,8,10

동전을 두 번 뒤집을 때 (즉, ) 두 플립의 가능한 시나리오를 생각해보십시오. 여기서 H 는 머리를, T 는 꼬리를 나타냅니다. 주먹 플립에서 당신은 H 를 얻을 수 있었고 두 번째 플립에서 당신은 T를 얻을 수있었습니다 . 그러나 그것은 두 번의 플립이 일어날 수있는 한 가지 방법입니다. 첫 번째 플립 T 와 두 번째 플립 H 와 다른 모든 가능한 조합에서도 얻을 수 있습니다. 하루가 끝나면 동전 2 개를 뒤집을 때 두 손가락으로 볼 수있는 조합은
S = { H H , H T ,

n=2

H

T

H

T

T

H


그리고 n = 2 코인을 뒤집기위한 4 가지 가능한 시나리오가있습니다.

S={HH,HT,TH,TT}

n=2

4 개의 코인을 뒤집 으면 S = { H H H H , H H H T , H H T H , H T H H , T H H H , H H T T 가 될 수있는 가능한 조합의 수
, H T T H , T T H H , T H H T , T H T H ,
그리고 n = 4 코인을 뒤집는 시나리오는 16 가지가 있습니다.

S={HHHH,HHHT,HHTH,HTHH,THHH,HHTT,HTTH,TTHH,THHT,THTH,HTHT,HTTT,THTT,TTHT,TTTH,TTTT}

n=4

코인을 뒤집 으면 256 개의 조합으로 이어집니다.

n=8

동전을 뒤집 으면 1,024 개의 조합으로 이어집니다.

n=10

특히, 숫자 뒤집기 코인 리드 2 개 N 가능한 조합을.

n

2n

n=2

Pr(Ratio of exactly 1)=24=0.5

n=4

Pr(Ratio of exactly 1)=616=0.375

n

n→∞

Pr(Ratio of exactly 1)→0

따라서 귀하의 질문에 대답하십시오. 실제로 당신이 관찰하고있는 것은 머리와 꼬리의 수가 동일한 조합의 수와 비교하여 머리와 꼬리의 수가 동일하지 않은 훨씬 더 많은 동전 플립 조합이 있다는 사실의 결과입니다.



@Mark L. Stone이 제안한 것처럼 이항 수식과 이항 랜덤 변수에 익숙한 경우이를 사용하여 동일한 인수를 표시 할 수 있습니다.

X

n

X

X∼Bin(n,p=0.5)

p=0.5

Pr(Ratio of exactly 1)=Pr(X=n2)=(nn/2)0.5n/2(0.5)n−n/2=(nn/2)0.5n

n

(nn/2)0.5n→0

n→∞

답변

파스칼의 삼각형을 참조하십시오 .

동전 뒤집기 결과의 가능성은 맨 아래 줄의 숫자로 표시됩니다. 같은 머리와 꼬리의 결과는 중간 수입니다. 나무가 커질수록 (즉, 더 많은 플립) 중간 숫자는 맨 아래 줄의 합계의 작은 비율이됩니다.


답변

아마도 이것이 아크 사인 법칙과 관련이 있다는 것을 설명하는 데 도움이 될 것입니다. 그것은 말한다위한 하나 개의 결과의 경로 양 또는 음의 영역에서 대부분의 시간에 대한 경로 숙박이 훨씬 높은이 올라가고 것을보다 아래보다 확률 이 직관에 기대 . 다음은 몇 가지 링크입니다.

http://www.math.unl.edu/~sdunbar1/ProbabilityTheory/Lessons/BernoulliTrials/ExcessHeads/excessheads.shtml

https://ko.wikipedia.org/wiki/Arcsine_law


답변

머리와 꼬리의 비율은 1로 수렴하지만 가능한 수의 범위는 더 넓어집니다. (나는 숫자를 만들고있다). 100 번의 던지기에 대해 45 %에서 55 %의 헤드를 가질 확률이 90 %라고 가정하십시오. 45 ~ 55 개의 헤드를 얻는 것은 90 %입니다. 헤드 수에 대한 11 가지 가능성. 대략 9 %는 머리와 꼬리 수가 같습니다.

10,000 던에 대해 49 %에서 51 %의 헤드를 얻을 확률이 95 %라고 가정하십시오. 따라서 비율은 1에 훨씬 더 가깝습니다. 그러나 이제 4,900에서 5,100 개의 헤드가 있습니다. 201 가능성. 같은 수의 확률은 약 0.5 %에 불과합니다.

그리고 백만 번의 던지기로 49.9 %에서 50.1 % 사이의 헤드를 확보 할 수 있습니다. 그것은 499,000에서 501,000 헤드의 범위입니다. 2,001 가능성. 기회는 이제 0.05 %로 떨어졌습니다.

자, 수학이 완성되었습니다. 그러나 이것은 "왜"에 대한 아이디어를 제공해야합니다. 비율이 1에 가까워 지더라도 가능성의 수는 더 커지므로 정확히 반 머리, 반 꼬리 를 치는 것이 점점 줄어들게됩니다.

또 다른 실질적인 효과 : 실제로 머리를 던질 확률이 정확히 50 % 인 동전을 가지고있을 가능성은 거의 없습니다 . 정말 좋은 동전을 가지고 있다면 49.99371 % 일 것입니다. 드로우 수가 적더라도 차이가 없습니다. 많은 수의 경우 헤드 비율이 50 %가 아닌 49.99371 %로 수렴됩니다. 던지기 횟수가 충분히 크면 50 % 이상의 머리 던지기는 매우 드물게 진행됩니다.


답변

한 가지 주목할 점은 짝수 번의 뒤집기 (동일한 머리와 꼬리 뒤집기의 확률은 물론 정확히 0 임) 일 때 가장 가능성있는 결과는 항상 꼬리가 뒤집히는만큼 머리가 많이 뒤집히는 결과 일 것입니다.

n

(1+엑스2)엔.


그래서 심지어

확률은

피엔=2−엔(엔엔/2).

스털링 근사법을 사용하여

엔!

, 당신은 뭔가에 도착

피≈1π엔/2


정확히 확률

엔/2

머리 (및 상응하는 꼬리)가 뒤집 힙니다.

전반적인 뒤집기. 따라서이 결과의 절대 확률은 0으로 수렴하지만 다른 결과의 대부분보다 훨씬 느리며 극단적 인 경우 헤드 0 (또는 꼬리 0)이 뒤집 힙니다.

2−엔

.


답변

동전을 두 번 뒤집 었다고 가정하십시오. HH, HT, TH 및 TT의 네 가지 가능한 결과가 있습니다. 이 중 두 개는 머리와 꼬리 수가 동일하므로 같은 수의 머리와 꼬리를 얻을 확률이 50 %입니다.

이제 동전을 4,306,492,102 번 뒤집어 봅시다. 정확히 2,153,246,051 개의 머리와 2,153,246,051 개의 꼬리 로 50 % 확률로 감칠 수 있습니까?