model Archives - Page 4 of 9

대학에서 기계 학습 과정을 수강했습니다. 퀴즈 중 하나 에서이 질문을 받았습니다.

모델 1 :
$y = θ x + ϵ$
$y = \theta x + \epsilon$
모델 2 :
$y = θ x + θ^{2} x + ϵ$
$y = \theta x + \theta^2 x + \epsilon$

위의 모델 중 어느 것이 데이터에 더 적합합니까? (선형 회귀를 사용하여 데이터를 모델링 할 수 있다고 가정)

정답은 (교수에 따르면) 두 모델 모두 똑같이 잘 작동한다는 것입니다. 그러나 첫 번째 모델이 더 적합 할 것이라고 생각합니다.

이것이 내 대답의 이유입니다. , 로 다시 쓸 수있는 두 번째 모델 은 첫 번째 모델과 동일하지 않습니다. 사실 포물선이며, 따라서 최소 값 갖는 ( 이 경우에는). 이 때문에 첫 번째 모델에서 의 범위는 의 범위보다 큽니다. $α x + ϵ$

α x + ϵ

$\alpha x + \epsilon$ $α = θ + θ^{2}$

α = θ + θ^{2}

$\alpha = \theta + \theta^2$ $α$

α

$\alpha$ $- 0.25$

- 0.25

$-0.25$ $θ$

θ

$\theta$ $α$

α

$\alpha$ 는 두 번째 모델 . 데이터가 가장 적합한보다 경사 덜했다하도록했다 따라서 경우 , 두 번째 모델은 매우 저조한 첫 번째에 비해 수행 할 것입니다. 그러나 가장 적합한 기울기가보다 큰 경우 $- 0.25$

- 0.25

$-0.25$ 이면 두 모델 모두 동일하게 작동합니다. $- 0.25$

- 0.25

$-0.25$

첫 번째 것이 더 좋습니까, 아니면 둘 다 동일합니까?

답변

모델 2는 로 쓸 수 있습니다

이것은 하이퍼 파라미터 ( )에 대해 다른 표기법 만 사용하여 모델 1과 유사 해 보입니다 . 그러나, 모델 1 우리가 쓸 수

y = (θ + θ^{2}) x + ϵ = β x + ϵ .

$y=(\theta + \theta^{2}) x+\epsilon=\beta x+\epsilon.$ $θ, β$

θ, β

$\theta, \beta$

\hat{θ} = (X^{^{'}} X)^{- 1} X^{^{'}} y .

$\hat{\theta}=(X^{'}X)^{-1}X^{'}y.$

모델 2에서 우리가 갖고 있기 때문에 그러나

당신이 실제로 언급 한 바와 같이 다음의 범위 에 속해야 에 대한 . 이 두 모델의 차이로 이어질 것입니다.

β = θ + θ^{2},

$\beta=\theta + \theta^{2},$ $\hat{β}$

\hat{β}

$\hat{\beta}$ $[- 0.25, + \infty]$

[- 0.25, + \infty]

$[-0.25,+\infty]$ $θ \in R$

θ \in R

$\theta \in R$

따라서 모델 2는 모델 1과는 달리 당신의 계수 추정치를 제약하는 것은이 모델 주목해야한다,이보다 명확하게하기 제곱 손실 함수 최소화를 통해 얻을 수있다
$\hat{θ}$

\hat{θ}

$\hat{\theta}$
그러나 모델 2 추정치를 통해 얻어진

\hat{θ} = \arg min_{θ \in R} (y - X θ)^{^{'}} (y - X θ) = (X^{^{'}} X)^{- 1} X^{^{'}} y .

$\hat{\theta}=\arg\min_{\theta\in{R}} \ \ (y-X\theta)^{'}(y-X\theta)=(X^{'}X)^{-1}X^{'}y.$
다른 결과를 초래할 수있는.

\hat{β} = \arg min_{β \geq - 0.25} (y - X β)^{^{'}} (y - X β)

$\hat{\beta}=\arg\min_{\beta\geq-0.25} \ \ (y-X\beta)^{'}(y-X\beta)$

답변

당신의 추론을 이해하지 못합니다. 당신이 복용하는 경우 :

와이 = α 엑스 + ϵ

$y = \alpha x+\epsilon$ 과

와이 = θ 엑스 + ϵ

$y = \theta x + \epsilon$

그리고 추정 $α$

α

$\alpha$ 과 $θ$

θ

$\theta$ 간단한 선형 회귀를 사용하면 $α$

α

$\alpha$ = $θ$

θ

$\theta$ . 더욱이, 방법론이 정확히 동일하기 때문에 $R^{2}$

{아르 자형}^{2}

$R^2$ 어느 방정식에서나 얻을 수있는 가치. 기본 가치 $θ$

θ

$\theta$ 첫 번째 방정식에서 당연히 다를 것입니다. $α = θ + θ^{2}$

α = θ + θ^{2}

$\alpha = \theta + \theta^2$ 그러나 이것은 적합과 관련이 없습니다.

How IT

언제든지 물어보세요.

태그 보관물: model

두 개의 선형 회귀 모델이 주어지면 어떤 모델이 더 잘 수행됩니까? : y=θx+θ2x+ϵy=θx+θ2x+ϵ y = \theta x

답변

답변

답변