로지스틱 회귀 분석에서 적합치에 대한 표준 오차는 어떻게 계산됩니까? 회귀 모형에서 적합치를 예측할 때 표준

로지스틱 회귀 모형에서 적합치를 예측할 때 표준 오차는 어떻게 계산됩니까? I는 평균에 대한 피팅 값 (피셔 정보 행렬을 포함하는)이 아닌 계수들에 대한.

난 단지와 번호를 얻는 방법을 발견 R(예를 여기에 , 또는 R-도움에 여기 스택 오버플로),하지만 난 공식을 찾을 수 없습니다.

pred <- predict(y.glm, newdata= something, se.fit=TRUE)

온라인 소스를 제공 할 수 있다면 (바람직하게는 대학교 웹 사이트에서) 환상적입니다.



답변

예측은 추정 된 계수의 선형 조합 일뿐입니다. 계수는 무정형 정규이므로 이러한 계수의 선형 조합도 무정형 정규입니다. 따라서 모수 추정값에 대한 공분산 행렬을 얻을 수 있으면 해당 추정값의 선형 조합에 대한 표준 오차를 쉽게 얻을 수 있습니다. 공분산 행렬을 로 나타내고 벡터에 내 선형 조합에 대한 계수를 C 로 쓰면 표준 오차는 √입니다.

Σ

C

C′Σ기음
# Making fake data and fitting the model and getting a prediction
set.seed(500)
dat <- data.frame(x = runif(20), y = rbinom(20, 1, .5))
o <- glm(y ~ x, data = dat)
pred <- predict(o, newdata = data.frame(x=1.5), se.fit = TRUE)

# To obtain a prediction for x=1.5 I'm really
# asking for yhat = b0 + 1.5*b1 so my
# C = c(1, 1.5)
# and vcov applied to the glm object gives me
# the covariance matrix for the estimates
C <- c(1, 1.5)
std.er <- sqrt(t(C) %*% vcov(o) %*% C)

> pred$se.fit
[1] 0.4246289
> std.er
          [,1]
[1,] 0.4246289

우리가 보여주는 ‘수동’방법은 다음을 통해보고 된 것과 동일한 표준 오류를 나타냅니다. predict