나는 계량 경제학자가 아닌 이해하기 위해 고심하고있는 일부 데이터 분석 코드를 물려 받았습니다. 한 모델은 다음 Stata 명령을 사용하여 도구 변수 회귀 분석을 실행합니다.
ivreg my_dv var1 var2 var3 (L.my_dv = D2.my_dv D3.my_dv D4.my_dv)
이 데이터 세트는이 변수 세트에 대한 여러 순차적 관측치가있는 패널입니다.
이 코드가 DV의 지연된 값을 계측기로 사용하는 이유는 무엇입니까? 내가 그것을 이해하기 때문에 (오래된 교과서로 파기에서), 회귀자가 오류 항과 상관되어 문제가있을 때 IV 추정이 사용됩니다. 그러나 DV 지연을 계측기로 선택하는 것은 언급되지 않았습니다.
이 코드 줄에 대한 설명은 “인과성”을 언급합니다. 여기서 목표가 무엇인지 알아내는 데 도움이되는 것이 가장 환영받을 것입니다.
답변
편집 : 아래 Andy W가 제공 한 stata 코드에 대한 설명이 주어지면 질문에 더 잘 맞도록 답변을 변경했습니다. 내 답변의 이전 버전은 현재 답변 아래에 있습니다.
귀하의 코드는 Arellano-Bond 추정기를 DIY에 서투른 시도로 보입니다 (ivreg 추정치를 2SOLS로 가정). 당신은 A / B 추정의 사용과 논리에 대한 자세한 내용은 찾을 수 이 좋은 리뷰 논문에서 뿐만 아니라에서 이 광범위한 소개.
간단히 말해서 3 줄 이내 : A / B 추정기는 실제로 (일반화 된) IV 추정기이지만 인과성 문제를 해결하는 데 사용되지는 않습니다. 이러한 맥락에서 IV는 패널 데이터의 맥락에서 AR 계수의 효율적인 추정을 제공하는 데 사용됩니다.
여기서 바퀴를 다시 발명하지 말고 대신 준비된 도구 상자를 사용하여 그러한 추정을 수행하는 것이 좋습니다. stata의 경우 XTABOND2 (또는 STAT11을 실행중인 경우 XTABOND) 패키지를 사용할 수 있습니다.
오래된 응답 :
간단한 예가 여기에 도움이 될 것입니다. 시간에 따라 두 개의 변수 및 y t가 샘플링되어 x t 와 y t 간의 상관 관계 가 매우 높다고 가정합니다. 당신은에 대한 주장하고 싶습니다 X t 의 원인이 Y t을 하지만 불행히도 어떤에서 아주 좋은 경쟁하고 신뢰할 수있는 이론이 Y t이 발생 X t는 .
xtyt
xt
yt
xt
yt
yt
xt
yt
xt−1
xt
yt←xt−1
xt−1←yt
x
y
yt
xt−1
I(0)
답변
Stata를 모르므로 특정 모델에 대해서는 언급 할 수 없습니다. 그러나 지연 변수를 사용하는 것은 일반적으로 동시 편향을 다루고 특히 도구 변수를 만들 때 상당히 일반적인 접근 방식입니다.
모델의 두 변수 인 독립 변수 (예 : 가격)와 종속 변수 (예 : 수량) 사이에 피드백이 있다고 가정하십시오. 그런 다음 둘 다 내생 적이며 (그 원인은 모델 내에서 발생합니다) 오류 항에 대한 섭동은 두 변수에 영향을 미칩니다 .
이 문제를 해결하기 위해 오류의 변동이 종속 변수 (수량)에만 영향을 미치도록 독립 변수 (가격)를 외생 적으로 만들려고합니다. 이는 가격에 따라 모델의 다른 외생 변수를 회귀하여 새로운 외생 변수를 생성함으로써 달성됩니다. 이 새로운 외생 변수는 도구 변수 (IV)입니다. IV는 외생 용어에서 파생되므로 오류와 상관이 없습니다.
그러나이를 위해서는 외인성이 어떤 변수인지 파악하여 IV를 도출하는 데 사용할 수 있어야합니다. 지연된 변수는 과거에 “발생”하여 현재의 오류와 상관 될 수 없습니다. 지연된 변수는 외인성이므로 IV를 도출하기위한 편리한 후보가된다. 그러나 오류가 자동 상관되면 앞의 인수가 실패합니다.
이에 대한 좋은 소개와 참고 자료는 소개 에코 노 메트릭스 : Wooldridge 의 현대적인 접근 방식 입니다.
답변
Stata의 다음 코드 스 니펫에 익숙하지 않은 사람들을 위해 OP가 제공했습니다.
ivreg my_dv var1 var2 var3 (L.my_dv = D2.my_dv D3.my_dv D4.my_dv)
이 방정식은 다음과 같이 읽을 수 있습니다
와이티=α+β1(Vㅏ아르 자형1)+β2(Vㅏ아르 자형1)+β삼(Vㅏ아르 자형1)+β4(와이~티−1)
와이~티−1
와이~티−1=α+지1(Δ2와이티)+지2(Δ삼와이티)+지삼(Δ4와이티)
(즉, IV 방정식의 첫 번째 단계는 Stata 코드의 괄호 안에 있습니다)
델타는 2 차, 3 차 및 4 차 차이를 나타내며 종속 변수의 지연을 추정하기 위해 제외 된 도구로 사용됩니다.
L.
D.
D2.
처음에 나는 누군가가 이것을하는 논리적 인 추론을 생각할 수 없었다. 그러나 Kwak은 Arellano-Bond 방법이 모형의 자동 회귀 성분을 추정하기위한 도구로 차이점을 사용한다고 지적했습니다 (이 논문 참조 ). (또한 초기에 나는 시리즈가 비정규적인 경우에만 차이가 영향을 미칠 것이라고 가정했는데, 그 링크드 페이퍼에서 본드 상태는 시리즈가 무작위 보행 일 경우 21 페이지에서 차이가 약한 도구 일 것이라고 본다. )
도구 변수에 대한 소개로서 추가 자료에 대한 제안으로,
이 답변 (Charlie)의 또 다른 포스터는 내가 좋아하고 제안할만한 슬라이드 와 관련이 있으며 도구 변수에 대한 소개를 살펴볼 가치가 있습니다. 나는 또한이 파워 포인트 를 내 교수가 워크샵을위한 소개서로 준비 할 것을 제안 한다. 도구 변수에 대해 더 배우고 자하는 사람에게는 마지막 제안으로 Joshua Angrist의 연구를 찾아보아야합니다.
여기 내 초기 답변이 있습니다
L.
D.
D2.
내가 본 모든 응용에서, 사람들은 독립 변수 의 지연을 도구로 사용하여 종속 변수의 지연을 추정합니다 (ars가 이야기하는 이유로). 그러나 이것은 지연 독립 변수가 적용되는 시간 동안 오류 항에 대해 외인성이라는 가정에 근거합니다.
나는 종속 변수의 차이점이 외생 적 인 것으로 간주되는 추론을 모른다. 내가 아는 한, 방정식의 한 쪽만 차이를내는 관행은 받아들이지 않으며 오히려 비논리적 인 결과를 낳을 것입니다 ( 여기서는 누군가에게 변수 수준을 예측 변수로 포함시킨 역 상황에 대해 비판하는 논문이 있습니다) IV 계열의 항을 재정렬하면 실제로 Dickey Fuller (증가 된 Dickey Fuller) 검정과 유사하게 보입니다.
가장 간단한 대답은 코드를 작성한 사람에게 물어 보는 것이지만 누구나이 절차를 수용 할 수있는 예 또는이 절차가 의미있는 결과를 반환하는 상황을 설명 할 수 있습니까? 마찬가지로 시리즈가 비정상적이지 않은 경우를 제외하고 차이가 레벨에 영향을 미치는 논리적 인 추론은 생각할 수 없습니다.