간의 명시 적 차이가 있는 샘플 예측 및 의사 밖으로의 샘플 예측 . 둘 다 예측 모델 평가 및 비교와 관련이 있습니다.
답변
당신은 데이터가 있다고 가정 , H ∈ { 1 , 2 , … } , 당신의 목표는 모델을 구축하는 것입니다 (예를 들어, F ( X t – 시간 ) ) 예측하는 Y의 t 주어진 X의 t – 시간을 . 구체적으로 데이터가 매일이고 T 가 오늘에 해당 한다고 가정합니다 .
{Yt,Xt−h}t=h+1Th∈{1,2,…},
f^(Xt−h)
Yt
Xt−h
T
표본 내 분석은 최대 포함하여 사용 가능한 모든 데이터를 사용하여 모형을 추정 한 다음 모형의 적합치를 실제 실현과 비교하는 것입니다. 그러나이 절차는 일반적인 피팅 알고리즘 (예 : 제곱 오차 또는 가능성 기준 사용)이 큰 예측 오차를 피하기 위해 어려움을 겪는 경향이 있기 때문에 모델의 예측 능력에 대해 지나치게 낙관적 인 그림을 그리는 것으로 알려져 있습니다. 데이터 신호.
TYT+1
eT+1≡YT+1−f^(XT+1−h),
YT+2
{eT+l}l=1L
T0<T
T
{et}t=T0+1T
표본의 표본 추출 분석이 모형의 표본 추출 성능을 추정하는 유일한 방법은 아닙니다. 대안으로는 교차 검증 및 정보 기준이 있습니다.
이 모든 문제에 대한 아주 좋은 논의는 7 장에서 제공됩니다.
http://www.stanford.edu/~hastie/local.ftp/Springer/OLD/ESLII_print4.pdf