로지스틱 회귀 문제에 대한 decision_function, predict_proba 및 예측 함수의 차이점은 무엇입니까? 로지스틱 회귀의 맥락에서 이러한 기능의 목적을 이해할

나는 sklearn 문서를 살펴 보았지만 로지스틱 회귀의 맥락에서 이러한 기능의 목적을 이해할 수 없습니다. 들어 decision_function그것이라고 그 초평면과 테스트 인스턴스 사이의 거리. 이 특정 정보는 어떻게 유용합니까? 방법이 어떤 관련이 있습니까 predictpredict-proba방법?



답변

로지스틱 회귀의 기능적 형태는

에프(엑스)=11+이자형(β0+β1엑스1++β케이엑스케이)

이것이에 의해 반환됩니다 predict_proba.

지수 내부의 용어

(엑스)=β0+β1엑스1++β케이엑스케이

에 의해 반환되는 것 decision_function입니다. 설명서에 언급 된 “하이퍼 플레인”은

β0+β1엑스1++β케이엑스케이=0

이 용어는 문자 그대로 분리 초평면을 추정하는 서포트 벡터 머신의 용어입니다. 로지스틱 회귀 분석의 경우이 초평면은 약간 인공적인 구성이며, 모형이 두 대상 클래스가 똑같이 가능하다고 결정한 등가의 평면입니다.

predict함수는 규칙을 사용하여 클래스 결정을 반환합니다.

에프(엑스)>0.5

soapboxing의 위험이있는이 predict기능은 합법적 인 사용이 거의 없으며 다른 작업을 검토 할 때이 기능을 오류의 표시로 사용합니다. 나는 그것을 sklearn 자체에서 디자인 오류라고 부를 정도로 충분히 나아갈 것입니다 ( predict_proba함수는 호출 되어야 predict하고 , 무엇이든 predict호출되어야 predict_class합니다).


답변