간단한 선형 회귀 분석법 에서 최소 제곱 추정량 같은 당신이 알 필요가 없다는 추정하는β 1 = Σ ( X I – ˉ X ) ( Y I – ˉ Y )
y=β0+β1xβ 0 β 1
β^1=∑(xi−x¯)(yi−y¯)∑(xi−x¯)2β^0
β^1
내가 가진 가정 내가 파생 어떻게, 추정하지 않고 ? 아니면 불가능합니까?β 1 β 2
y=β1x1+β2x2β^1
β^2
답변
행렬 표기법의 유도
에서 시작 정말와 동일
y=Xb+ϵ[y1y2⋮yN]=[x11x12⋯x1Kx21x22⋯x2K⋮⋱⋱⋮xN1xN2⋯xNK]∗[b1b2⋮bK]+[ϵ1ϵ2⋮ϵN]
그것은 모두 minimzing 로 귀착 .
e′eϵ′ϵ=[e1e2⋯eN][e1e2⋮eN]=∑i=1Nei2
따라서 를 최소화 하면 다음과 같이됩니다.
e′e′e ′ e = ( y − X b ) ′ ( y − X b )
minbe′e=(y−Xb)′(y−Xb)
E ‘ E = Y ‘ (Y) – (2) B ‘ X ‘ , Y + B ‘ X ‘ X B
minbe′e=y′y−2b′X′y+b′X′Xb
∂(e′e)∂b=−2X′y+2X′Xb=!0
X′Xb=X′y
b=(X′X)−1X′y
마지막 수학적 하나 인 최소의 2 차 조건은 행렬 가 양의 한정 이어야합니다 . 가 전체 순위를 가진 경우이 요구 사항이 충족됩니다 .X
X′XX
더 큰 단계의 모든 단계를 거치는보다 정확한 파생은 http://economictheoryblog.com/2015/02/19/ols_estimator/ 에서 찾을 수 있습니다 .
답변
다른 회귀를 추정하지 않고 다중 회귀 분석에서 하나의 계수 만 추정 할 수 있습니다.
의 추정치는 다른 변수에서 의 영향을 제거한 다음 의 잔차에 대해 의 잔차를 회귀하여 . 이것은 하나의 변수를 어떻게 정확하게 제어합니까? 및 방법 (A) 회귀 계수를 정상화? . 이 접근법의 장점은 미적분학, 선형 대수학, 2 차원 기하학을 사용하여 시각화 할 수 있고 수치 적으로 안정적이며 다중 회귀에 대한 하나의 기본 아이디어를 취한다는 것입니다. ) 단일 변수의 효과.x 2 y x 1
β1x2
y
x1
이 경우 다중 회귀는 세 가지 일반적인 회귀 단계를 사용하여 수행 할 수 있습니다.
-
를 회귀합니다 (상수항 없이). 적합 값을 합니다. 추정치는 따라서 잔차는 기하학적으로, 는 투영을 뺀 후에 남은 것입니다 .x 2 y = α y , 2 x 2 + δ α y , 2 = ∑ i y i x 2 i
yx2
y=αy,2x2+δ
δ=y–αy,2x2입니다. δyx2
αy,2=∑iyix2i∑ix2i2.δ=y−αy,2x2.δ
y
x2
-
을 회귀 합니다 (상수 항 없음). BE 착용감하자 . 추정치는잔차는기하학적으로, 는 투영을 뺀 후 남은 것입니다 .x 2 x 1 = α 1 , 2 x 2 + γ α 1 , 2 = ∑ i x 1 i x 2 i
x1x2
x1=α1,2x2+γ
γ=x1–α1,2x2입니다. γx1x2
α1,2=∑ix1ix2i∑ix2i2.γ=x1−α1,2x2.γ
x1
x2
-
에서 를 회귀 합니다 (상수 용어 없음). 추정치는적합은 입니다. 기하학적 의 요소이다 (대표 함께 꺼내어) (나타내는 방향 가진 취출은).γ β 1 = Σ I δ I γ I
δγ
β^1=∑iδiγi∑iγi2.β 1 δ Y X 2 γ X 1 , X 2
δ=β^1γ+εβ^1
δ
y
x2
γ
x1
x2
것을 알 수 추정되지 않았습니다.
β2그것은 쉽게 지금까지 (단지로 획득 된 내용에서 복구 할 수 있습니다 일반 회귀 경우 쉽게 기울기 추정치에서 얻을 수있다 ). 의 변량 회귀의 잔차이다 에 및 .
β^0β^1
ε
y
x1
x2
일반적인 회귀와의 병행은 강력합니다. 단계 (1)과 (2)는 일반적인 공식에서 평균을 빼는 것과 유사합니다. 당신이 할 경우 사람의 벡터 수, 당신은 실제로 일반적인 공식을 복구합니다.
x2이것은 두 가지 이상의 변수로 회귀하는 명백한 방식으로 일반화됩니다. 을 추정 하고 , 와 다른 모든 변수 와 별도로 회귀시킨 다음 잔차를 서로 회귀시킵니다. 그 시점에서, 유료 의 회귀의 다른 계수의 아직 추정되었다.
β^1y
x1
y
답변
의 일반적인 최소 제곱 추정값은 반응 변수의 선형 함수입니다
β. 간단히 말해, 계수의 OLS 추정값 인 는 종속 변수 ( ‘s)와 독립 변수 ( ‘s) 만 사용하여 작성할 수 있습니다 .
βYi
Xki
일반적인 회귀 모형에 대해이 사실을 설명하려면 약간의 선형 대수를 이해해야합니다. 다중 회귀 모형에서 계수 를 추정한다고 가정합니다 .
(β0,β1,...,βk)
여기서 입니다 . 설계 행렬 는 행렬이며, 여기서 각 열에 는 종속 변수 의 관측치가 포함 됩니다. 추정 된 계수 를 계산하는 데 사용되는 공식에 대한 많은 설명과 도출을 여기 에서 찾을 수 있습니다. 이며내가 = 1 , . . . , n X n × k n k t h X k
ϵi∼iidN(0,σ2)i=1,...,n
X
n×k
n
kth
Xk β^=(β^0,β^1,...,β^k)
역 이 있다고 가정 합니다. 추정 계수는 다른 추정 계수가 아닌 데이터의 함수입니다.
(X′X)−1
답변
이론과 실습에 관한 작은 사소한 참고 사항. 수학적으로 은 다음 공식으로 수 있습니다.
β0,β1,β2...βn
여기서 는 원래 입력 데이터이고 는 추정하려는 변수입니다. 이는 오류를 최소화하는 것입니다. 나는 작은 실용적인 점을 만들기 전에 이것을 증명할 것이다.
XY
선형 회귀가 점에서 만드는 오류라고 하자 . 그때:
eii
우리가 만드는 총 제곱 오류는 다음과 같습니다.
우리는 선형 모델을 가지고 있기 때문에
다음과 같이 행렬 표기법으로 다시 작성할 수 있습니다.
우리는 알고
총 제곱 오차를 최소화하여 다음식이 가능한 작아야합니다.
이것은 다음과 같습니다.
재 작성은 혼란스러워 보일 수 있지만 선형 대수에서 나옵니다. 행렬은 몇 가지 측면에서 변수를 곱할 때 변수와 유사하게 작동합니다.
이 표현이 가능한 한 작게되도록 값을 찾고 싶습니다 . 미분을 미분하고 0으로 설정해야합니다. 여기서는 체인 규칙을 사용합니다.
β
이것은 다음을 제공합니다.
마지막으로
수학적으로 우리는 해결책을 찾은 것 같습니다. 그래도 한 가지 문제가 있으며 , 행렬 가 매우 큰 경우 을 계산하기가 매우 어렵다는 것 입니다. 이로 인해 수치 정확도 문제가 발생할 수 있습니다. 이 상황에서 에 대한 최적의 값을 찾는 또 다른 방법 은 그래디언트 디센트 유형의 방법을 사용하는 것입니다. 우리가 최적화하고자하는 함수는 제한이없고 볼록하므로 실제로 필요한 경우 그래디언트 방법도 사용합니다.
(X′X)−1X
β
답변
LR의 기하학적 해석을 사용하여 간단한 파생을 수행 할 수 있습니다.
선형 회귀는 열 공간 에 대한 의 투영으로 해석 될 수 있습니다 . 따라서 오류 는 의 열 공간과 직교합니다 .
YX
ϵ^
X
따라서 와 오차 사이의 내부 곱은 0이어야합니다. 즉,
X′<X′,y−Xβ^>=0
X′y−X′Xβ^=0
X′y=X′Xβ^
그 말은
(X′X)−1X′y=β^
입니다.
이제 다음과 같이 할 수 있습니다.
(1) 투영 (오류 ), ,
YX2
δ=Y−X2D^
D^=(X2′X2)−1X2′y
(2) 을 투영 (오류 ), ,
X1X2
γ=X1−X2G^
G^=(X1′X1)−1X1X2
그리고 마지막으로,
(3) 를 , 투영
δγ
β^1