카테고리 보관물: stats

stats

로지스틱 회귀 분석의 예측 이해 확률로 변환된다는 것입니다. 로짓

로지스틱 회귀 모델 (R의 glm)에서 내 예측은 예상 한대로 0과 1 사이로 제한되지 않습니다. 로지스틱 회귀 분석에 대한 나의 이해는 입력 및 모델 매개 변수가 선형으로 결합되고 로짓 링크 함수를 사용하여 반응이 확률로 변환된다는 것입니다. 로짓 함수는 0과 1 사이에 경계가 있기 때문에 예측이 0과 1 사이에 경계가있을 것으로 예상했습니다.

그러나 R에서 로지스틱 회귀를 구현할 때 표시되는 것은 아닙니다.

data(iris)
iris.sub <- subset(iris, Species%in%c("versicolor","virginica"))
model    <- glm(Species ~ Sepal.Length + Sepal.Width, data = iris.sub, 
                family = binomial(link = "logit"))
hist(predict(model))

여기에 이미지 설명을 입력하십시오

만약 predict (model)의 출력이 나에게 평범 해 보인다면. 내가 얻는 가치가 확률이 아닌 이유를 나에게 설명 할 수 있습니까?



답변

predict.glm기본적으로 방법은 선형 예측의 규모에 예측을 반환합니다. 즉, 아직 링크 기능을 거치지 않았습니다.

시험

hist(predict(model, type = "response"))

대신에

여기에 이미지 설명을 입력하십시오


답변