로지스틱 회귀 모델 (R의 glm)에서 내 예측은 예상 한대로 0과 1 사이로 제한되지 않습니다. 로지스틱 회귀 분석에 대한 나의 이해는 입력 및 모델 매개 변수가 선형으로 결합되고 로짓 링크 함수를 사용하여 반응이 확률로 변환된다는 것입니다. 로짓 함수는 0과 1 사이에 경계가 있기 때문에 예측이 0과 1 사이에 경계가있을 것으로 예상했습니다.
그러나 R에서 로지스틱 회귀를 구현할 때 표시되는 것은 아닙니다.
data(iris)
iris.sub <- subset(iris, Species%in%c("versicolor","virginica"))
model <- glm(Species ~ Sepal.Length + Sepal.Width, data = iris.sub,
family = binomial(link = "logit"))
hist(predict(model))
만약 predict (model)의 출력이 나에게 평범 해 보인다면. 내가 얻는 가치가 확률이 아닌 이유를 나에게 설명 할 수 있습니까?
답변
predict.glm
기본적으로 방법은 선형 예측의 규모에 예측을 반환합니다. 즉, 아직 링크 기능을 거치지 않았습니다.
시험
hist(predict(model, type = "response"))
대신에