능선 회귀가 처음입니다. 선형 융기 회귀를 적용하면 다음과 같은 결과가 나타납니다.
>myridge = lm.ridge(y ~ ma + sa + lka + cb + ltb , temp, lamda = seq(0,0.1,0.001))
> select(myridge)
modified HKB estimator is 0.5010689
modified L-W estimator is 0.3718668
smallest value of GCV at 0
질문 :
- 0을 얻는 것이 괜찮
GCV
습니까? - 정확히 무엇을 의미합니까?
- 내 모델에 문제가 있습니까?
- 의 값을 어떻게 찾을 수 있습니까?
myridge
답변
불이익을받은 패키지 나 glmnet 패키지를 사용하는 것이 좋습니다 . 둘 다 올가미 또는 탄성 그물을 구현하므로 올가미의 특성 (기능 선택)과 능선 회귀 (공동 변수 처리)를 결합합니다. 형벌 도 능선을한다. 이 두 패키지는 훨씬 더 완벽하게보다 선보입니다 lm.ridge()
에서 매스 와 같은 것들에 대한 패키지.
어쨌든 페널티가 의미하므로 최소 제곱 추정값은 GCV (일반 교차 검증) 점수가 가장 낮다는 점에서 최적입니다. 그러나 충분히 큰 벌점을 허용하지 않았을 수 있습니다. 다시 말해, 가장 작은 제곱 추정값은 사용자가 본 작은 값 집합에 가장 적합 했습니다. 능선 경로 ( 의 함수로 계수 값을 하고 트레이스가 안정화되었는지 여부를 확인합니다. 그렇지 않은 경우 평가 된 값 의 범위를 늘리십시오 .
답변
0 GCV를 얻는 이유는 다음을 사용했기 때문입니다.
myridge = lm.ridge (y ~ ma + sa + lka + cb + ltb , temp, lamda = seq (0,0.1,0.001))
대신에
myridge = lm.ridge (y ~ ma + sa + lka + cb + ltb , temp, lambda = seq (0,0.1,0.001))