기차가 오기 전에 시간을 모델링하는 데 사용할 분포는 무엇입니까? 사용하고 싶습니다 .

기차 도착 시간에 대한 일부 데이터를 모델링하려고합니다. “기다리는 시간이 길수록 열차가 나타날 가능성이 높다”는 내용 의 배포판을 사용하고 싶습니다 . P (train show up | 60 분 기다림)가 1에 가까워 지도록 그러한 분포가 CDF처럼 보일 것 같습니다. 여기서 사용하기에 적합한 분포는 무엇입니까?



답변

두 확률의 곱셈

tt + d t (대기 시간) 사이의 시간에 처음 도착할 확률 은

t

t+dt

  • t

    t+dt

    사이에 도달 할 확률 ( 시간 t에 도착률 s(t)

    과 관련 될 수 있음 ) t

  • 시간
    t

    전에 도착하지 않을 확률 (또는 그렇지 않으면 첫 번째가 아닐 것).

후자의 용어는 다음과 관련이 있습니다.

P(n=0,t+dt)=(1−s(t)dt)P(n=0,t)

또는

∂P(n=0,t)∂t=−s(t)P(n=0,t)

기부:

P(n=0,t)=e∫0t−s(t)d티

대기 시간에 대한 확률 분포는 다음과 같습니다.

f(t)=s(t)e∫0t−s(t)dt

누적 분포의 유도.

또는 시간이 t 인 조건부 에서 하나 미만의 도착 확률에 대한 표현식을 사용할 수 있습니다.

t

P(n<1|t)=F(n=0;t)

시간

t

t+dt

사이에 도달 할 확률 은 도함수와 같습니다.

farrival time(t)=−ddtF(n=0|t)

이러한 접근법 / 방법은 예를 들어 포아송 프로세스에서 n 번째 도착을위한 대기 시간으로서 감마 분포를 도출하는데 유용하다. ( 포아송 프로세스 시간-감마-분포 대기 시간 )


두 가지 예

이것을 대기 역설과 관련시킬 수 있습니다 (대기 역설을 설명하십시오 ).

  • 지수 분포 : 도착이 포아송 프로세스와 같이 임의 인 경우

    s(t)=λ

    는 일정합니다. 다음 도착 확률은 도착하지 않은 이전 대기 시간과 무관합니다 (예를 들어 6없이 공정한 주사위를 여러 번 굴리면 다음 롤의 경우 갑자기 6에 대한 확률이 더 높지 않습니다. 도박꾼의 오류를 참조하십시오 ) . 지수 분포를 얻게되고 대기 시간에 대한 pdf는 다음과 같습니다.

    f(t)=λe−λt

  • T

    t

    s(t)=1/(T−t)

    f(t)=e∫0t−1T−tdtT−t=1T

    0

    T

    사이의 모든 시간이 첫 번째 도착과 동일한 확률을 가져야하기때문에 의미가 있습니다.


따라서 두 번째 경우입니다. "그러면 누군가가 이미 일정 시간 동안 기다렸을 때 도착 확률이 높아지고 있습니다"는 귀하의 질문과 관련이 있습니다.

상황에 따라 약간의 조정이 필요할 수 있습니다. 더 많은 정보 를 가지고 기차가 특정 순간에 도착할 확률

s(t)dt

는 더 복잡한 기능 일 수 있습니다.


StackExchangeStrike에 의해 작성


답변

대기 시간을 모델링하기위한 고전적인 분포는 지수 분포 입니다.

지수 분포는 균일 한 포아송 프로세스에서 도착 간 시간의 길이를 설명 할 때 자연스럽게 발생합니다.