태그 보관물: hypothesis-testing

hypothesis-testing

자기 상관 테스트 : Ljung-Box와 Breusch-Godfrey 또 다른 테스트, 즉 Breusch-Godfrey

원시 데이터 또는 모델 잔차에서 자기 상관을 테스트하기 위해 Ljung-Box 테스트가 자주 사용되는 것을 보았습니다. 나는 자기 상관에 대한 또 다른 테스트, 즉 Breusch-Godfrey 테스트가 있다는 것을 거의 잊었다.

질문 : Ljung-Box와 Breusch-Godfrey 테스트의 주요 차이점과 유사점은 무엇이며 언제 다른 테스트보다 선호되어야합니까?

(참고 문헌은 환영합니다. 어떻게 든 몇 가지 교과서를보고 온라인으로 자료를 검색했지만 두 테스트에 대한 비교 를 찾을 수 없었습니다 . 각 테스트에 대한 설명을 개별적 으로 찾을 수 있었지만 관심이있는 것은 둘 의 비교 .)



답변

Econometrics 커뮤니티 에는 자기 회귀 모델의 잔차 (즉, 회귀 행렬의 지연된 종속 변수)를 기반으로하는 자기 상관 검정에 대한 Ljung-Box Q 통계 의 유효성에 대한 강한 목소리가 있습니다 (특히 Maddala (2001) 참조 ). “ 생태계 소개 (3d 판), ch 6.7 및 13. 5 p 528. Maddala는 말 그대로이 테스트의 광범위한 사용을 애도하고 대신 Breusch와 Godfrey의”Langrange Multiplier “테스트를 적절하게 고려합니다.

Q

Ljung-Box 테스트에 대한 Maddala의 주장은 다른 전 방향 자기 상관 테스트 인 “Durbin-Watson”에 대해 제기 된 것과 동일합니다. 회귀 행렬에 지연된 종속 변수가 있으면 검정의 귀무 가설을 유지하기 위해 편향됩니다. “자가 상관 관계 없음”(@javlacalle에서 얻은 Monte-Carlo 결과는이 사실을 암시합니다). Maddala는 또한 테스트의 저전력을 언급합니다 (예 : Davies, N., & Newbold, P. (1979) 참조). 시계열 모델 사양의 포트만 토 테스트에 대한 일부 전력 연구. Biometrika, 66 (1), 153-155] .

하야시 (2000) , ch. 2.10 “직렬 상관 테스트” 는 통합 된 이론적 분석을 제시하며 문제를 명확히합니다. 하야시는 0에서 시작합니다. Ljung-Box 통계량을 카이 제곱으로 점근 적으로 분포시키려면 통계에 제공하는 표본 자기 상관이 다음과 같은 프로세스 { z t } ( z 는무엇이든) 인 경우에 해당합니다. 자기 상관이 없다는 귀무 가설 하에서, 마틴 게일-차이 서열, 즉 그것이 만족하는 것

Q

{zt}

z

E(zt∣zt−1,zt−2,...)=0

또한 “자신의”조건부 동요 성을 나타냅니다.

E(zt2∣zt−1,zt−2,...)=σ2>0

이러한 조건 하에서 Ljung-Box 통계 (원래 Box-Pierce Q- 통계 의 유한-검정-샘플 변형 )는 무정형 적으로 카이-제곱 분포를 가지며, 그 사용은 점근 적으로 정당화됩니다.

Q

Q

이제 자기 회귀 모델 (지연 종속 변수뿐만 아니라 독립 회귀 분석도 포함)을 지정했다고 가정합니다.

yt=xt′β+ϕ(L)yt+ut

여기서 은 지연 연산자에서 다항식이며 추정의 잔차를 사용하여 연속 상관 관계를 테스트하려고합니다. 그래서 여기 Z tU t .

ϕ(L)

zt≡u^t

Hayashi는 잔차의 표본 자기 상관에 기초한 Ljung-Box 통계량이 자기 상관이 없다는 귀무 가설 하에서 점근 적 카이-제곱 분포를 갖기 위해서는 모든 회귀자가 “엄격히 외생 적”인 경우 에 해당함을 보여줍니다 은 다음과 같은 의미에서 오류 용어입니다.

Q

E(xt⋅us)=0,E(yt⋅us)=0∀t,s

t,s

s=t−1

E[ytut−1]=E[(xt′β+ϕ(L)yt+ut)ut−1]=

E[xt′β⋅ut−1]+E[ϕ(L)yt⋅ut−1]+E[ut⋅ut−1]≠0

X

E[ϕ(L)yt⋅ut−1]

Q

엄격한 외인성보다 약한 조건, 즉

E(ut∣xt,xt−1,...,ϕ(L)yt,ut−1,ut−2,...)=0

X

{u^t}

R2

이 통계는 우리가 “직렬 상관 관계에 대한 Breusch-Godfrey 검정”이라고하는 것에 사용됩니다 .

회귀 변수가 지연 종속 변수를 포함 할 때 (그리고 모든 경우에 자기 회귀 모델도 포함), Ljung-Box 테스트는 Breusch-Godfrey LM 테스트를 위해 포기 해야합니다 . “더 나쁘게 수행하기”때문이 아니라 점근 적 정당성을 갖지 않기 때문입니다. 특히 전자의 유비쿼터스 존재와 적용으로 판단 할 때 상당히 인상적인 결과입니다.

x


답변

어림짐작

이 테스트를 비교 한 연구에 대해서는 모르겠습니다. 설명 변수가 종속 변수보다 느린 ARIMA 모델과 같은 시계열 모델의 맥락에서 Ljung-Box 테스트가 더 적합하다는 의혹이있었습니다. Breusch-Godfrey 검정은 일반적인 가정이 충족되는 일반적인 회귀 모델 (특히 외인 회귀 분석)에 더 적합 할 수 있습니다.

내 생각은 Breusch-Godfrey 검정의 분포 (일반 최소 제곱에 의해 회귀 된 잔차에 의존 함)는 설명 변수가 외생 적이 지 않다는 사실에 영향을받을 수 있다는 것입니다.

나는 이것을 확인하기 위해 작은 시뮬레이션 연습을했고 그 결과는 반대를 제안합니다 : Breusch-Godfrey 테스트는 자기 회귀 모델의 잔차에서 자기 상관을 테스트 할 때 Ljung-Box 테스트보다 성능이 우수합니다. 운동을 재현하거나 수정하는 세부 사항 및 R 코드는 다음과 같습니다.


작은 시뮬레이션 연습

Ljung-Box 테스트의 일반적인 적용은 피팅 된 ARIMA 모델의 잔차에서 직렬 상관 관계를 테스트하는 것입니다. 여기에서는 AR (3) 모델에서 데이터를 생성하고 AR (3) 모델에 적합합니다.

잔차는 자기 상관이 없다는 귀무 가설을 충족하므로, 균일하게 분포 된 p- 값을 기대합니다. 귀무 가설은 선택한 유의 수준에 가까운 경우 (예 : 5 %)에서 기각되어야합니다.

융 박스 테스트 :

## Ljung-Box test
n <- 200 # number of observations
niter <- 5000 # number of iterations
LB.pvals <- matrix(nrow=niter, ncol=4)
set.seed(123)
for (i in seq_len(niter))
{
  # Generate data from an AR(3) model and store the residuals
  x <- arima.sim(n, model=list(ar=c(0.6, -0.5, 0.4)))
  resid <- residuals(arima(x, order=c(3,0,0)))
  # Store p-value of the Ljung-Box for different lag orders
  LB.pvals[i,1] <- Box.test(resid, lag=1, type="Ljung-Box")$p.value
  LB.pvals[i,2] <- Box.test(resid, lag=2, type="Ljung-Box")$p.value
  LB.pvals[i,3] <- Box.test(resid, lag=3, type="Ljung-Box")$p.value
  LB.pvals[i,4] <- Box.test(resid, lag=4, type="Ljung-Box", fitdf=3)$p.value
}
sum(LB.pvals[,1] < 0.05)/niter
# [1] 0
sum(LB.pvals[,2] < 0.05)/niter
# [1] 0
sum(LB.pvals[,3] < 0.05)/niter
# [1] 0
sum(LB.pvals[,4] < 0.05)/niter
# [1] 0.0644
par(mfrow=c(2,2))
hist(LB.pvals[,1]); hist(LB.pvals[,2]); hist(LB.pvals[,3]); hist(LB.pvals[,4])

결과는 귀무 가설이 매우 드문 경우에 기각됨을 보여줍니다. 5 % 수준의 경우 거부율이 5 %보다 훨씬 낮습니다. p- 값의 분포는 널을 거부하지 않는쪽으로의 편향을 보여줍니다.


원칙적으로 편집 원칙 fitdf=3을 설정해야합니다. 이는 잔차를 얻기 위해 AR (3) 모델을 피팅 한 후 손실되는 자유도를 설명합니다. 그러나 4보다 낮은 차수의 경우 음의 자유도 또는 0의 자유도가 발생하여 테스트를 적용 할 수 없게됩니다. 설명서에 따르면 ?stats::Box.test: 이 테스트는 종종 참조 설정함으로써 얻어지는 널 가설 분포 나은 근사치를 제안하는 경우에 ARMA (P, Q) 착용감에서 잔차에 적용되는 fitdf = p+q것을 물론 제공 lag > fitdf.

Breusch-Godfrey 테스트 :

## Breusch-Godfrey test
require("lmtest")
n <- 200 # number of observations
niter <- 5000 # number of iterations
BG.pvals <- matrix(nrow=niter, ncol=4)
set.seed(123)
for (i in seq_len(niter))
{
  # Generate data from an AR(3) model and store the residuals
  x <- arima.sim(n, model=list(ar=c(0.6, -0.5, 0.4)))
  # create explanatory variables, lags of the dependent variable
  Mlags <- cbind(
    filter(x, c(0,1), method= "conv", sides=1),
    filter(x, c(0,0,1), method= "conv", sides=1),
    filter(x, c(0,0,0,1), method= "conv", sides=1))
  colnames(Mlags) <- paste("lag", seq_len(ncol(Mlags)))
  # store p-value of the Breusch-Godfrey test
  BG.pvals[i,1] <- bgtest(x ~ 1+Mlags, order=1, type="F", fill=NA)$p.value
  BG.pvals[i,2] <- bgtest(x ~ 1+Mlags, order=2, type="F", fill=NA)$p.value
  BG.pvals[i,3] <- bgtest(x ~ 1+Mlags, order=3, type="F", fill=NA)$p.value
  BG.pvals[i,4] <- bgtest(x ~ 1+Mlags, order=4, type="F", fill=NA)$p.value
}
sum(BG.pvals[,1] < 0.05)/niter
# [1] 0.0476
sum(BG.pvals[,2] < 0.05)/niter
# [1] 0.0438
sum(BG.pvals[,3] < 0.05)/niter
# [1] 0.047
sum(BG.pvals[,4] < 0.05)/niter
# [1] 0.0468
par(mfrow=c(2,2))
hist(BG.pvals[,1]); hist(BG.pvals[,2]); hist(BG.pvals[,3]); hist(BG.pvals[,4])

Breusch-Godfrey 테스트 결과가 더 합리적으로 보입니다. p- 값은 균일하게 분포되어 있으며 기각 률은 귀무 가설 하에서 예상 한대로 유의 수준에 더 가깝습니다.


답변

녹색 (경제 분석, 7 판, 963 페이지, 섹션 20.7.2) :

“Godfrey-Breusch [GB]와 Box-Pierce [BP] 테스트의 근본적인 차이점 은 전자와 후자의 상관 관계에서 부분 상관 관계 ( 및 기타 변수에 대한 제어 )를 사용하는 것입니다. 귀무 가설 아래 에 아무런 자기 상관 없다 및 상관 관계 및 두 시험 점근 동일하므로, 어떠한 이벤트가. 한편, 온 상태가 없기 때문에 상기 [BP] 시험은보다 강력 [GB] 직관에서 알 수 있듯이 귀무 가설이 거짓 일 때 테스트합니다. “

X

et

xt

es

xt

(Ljung-Box에 대한 질문은 위의 Box-Pierce를 의미하지만 전자는 후자를 간단하게 수정하므로 GB와 BP 간의 비교는 GB와 LB 간의 비교에도 적용됩니다.)

다른 답변이 이미보다 엄격한 방식으로 이미 설명했듯이 Greene은 Ljung-Box와 Godfrey-Breusch를 사용하여 얻을 수는 없지만 계산 능력이 아닌 다른 것 (테스트의 유효성)을 얻을 수는 없다고 제안합니다.


답변

Box-Pierce 및 Ljung-Box 테스트는 주로 일 변량 테스트 인 것으로 보이지만 시계열 회귀 잔차 (MA 또는 AR 프로세스)에 선형 구조가 남아 있는지 테스트 할 때 Breusch-Godfrey 테스트 뒤에 몇 가지 가정이 있습니다.

토론 링크는 다음과 같습니다.

http://www.stata.com/meeting/new-orleans13/abstracts/materials/nola13-baum.pdf


답변

테스트의 주요 차이점은 다음과 같습니다.

  • Breusch-Godfrey 검정은 (올바르게 지정된) 우도 함수 (따라서 첫 번째 원칙)에서 파생 된 Lagrange Multiplier 검정입니다.

  • Ljung-Box 테스트는 고정 프로세스 잔차의 두 번째 순간 (따라서 상대적으로 임시적인 특성)을 기반으로합니다.

Breusch-Godfrey 테스트는 Lagrange Multiplier 테스트로서 가장 균일하고 가장 강력한 테스트와 동일합니다. 그것이 될 수 있듯이, 생략 된 회귀 변수의 대체 가설 (무효 변수인지 여부에 관계없이)은 무의식적으로 가장 강력합니다. Ljung-Box 검정의 장점은 광범위한 대립 가설에 대한 검정력 일 수 있습니다.


답변