나는 sklearn 문서를 살펴 보았지만 로지스틱 회귀의 맥락에서 이러한 기능의 목적을 이해할 수 없습니다. 들어 decision_function
그것이라고 그 초평면과 테스트 인스턴스 사이의 거리. 이 특정 정보는 어떻게 유용합니까? 방법이 어떤 관련이 있습니까 predict
및 predict-proba
방법?
답변
로지스틱 회귀의 기능적 형태는
에프(엑스)=11+이자형−(β0+β1엑스1+⋯+β케이엑스케이)
이것이에 의해 반환됩니다 predict_proba
.
지수 내부의 용어
디(엑스)=β0+β1엑스1+⋯+β케이엑스케이
에 의해 반환되는 것 decision_function
입니다. 설명서에 언급 된 “하이퍼 플레인”은
β0+β1엑스1+⋯+β케이엑스케이=0
이 용어는 문자 그대로 분리 초평면을 추정하는 서포트 벡터 머신의 용어입니다. 로지스틱 회귀 분석의 경우이 초평면은 약간 인공적인 구성이며, 모형이 두 대상 클래스가 똑같이 가능하다고 결정한 등가의 평면입니다.
이 predict
함수는 규칙을 사용하여 클래스 결정을 반환합니다.
에프(엑스)>0.5
soapboxing의 위험이있는이 predict
기능은 합법적 인 사용이 거의 없으며 다른 작업을 검토 할 때이 기능을 오류의 표시로 사용합니다. 나는 그것을 sklearn 자체에서 디자인 오류라고 부를 정도로 충분히 나아갈 것입니다 ( predict_proba
함수는 호출 되어야 predict
하고 , 무엇이든 predict
호출되어야 predict_class
합니다).