μΌλΆ λͺ¨λΈ λ§€κ° λ³μκ° μΌλΆ κ·Έλ£Ήν μμΈμ λ°λΌ 무μμλ‘ λ³νλ€κ³ μκ°ν λ μμ ν¨κ³Ό (λλ νΌν© ν¨κ³Ό) λͺ¨λΈμ μ¬μ©νλ€λ κ²μ μκ³ μμ΅λλ€. μλ΅μ΄ μ κ·νλκ³ κ·Έλ£Ήν μμ μ 체μμ μ€μ¬μ΄ (μλ²½νμ§λ μμ§λ§ κ½€ κ°κΉμ΅λλ€) λͺ¨λΈμ λ§μΆκ³ μΆμ§λ§ λ
립 λ³μ x
λ μ΄λ€ μμΌλ‘λ μ‘°μ λμ§ μμμ΅λλ€. μ΄λ‘ μΈν΄ λ€μκ³Ό κ°μ ν
μ€νΈ ( μ μ‘° λ λ°μ΄ν° μ¬μ©)λ₯Ό ν΅ν΄ μ€μ λ‘ μνλ κ²½μ° λ΄κ° μ°Ύμ ν¨κ³Όλ₯Ό μ°Ύμ μ μλμ§ νμΈνμ΅λλ€. λλ€ μΈν°μ
νΈ (λ‘ μ μ λ κ·Έλ£Ή κ°)κ°μλ νΌν© ν¨κ³Ό λͺ¨λΈ νλ μ μμΈ fλ₯Ό κ³ μ ν¨κ³Ό μμΈ‘ λ³μλ‘ μ¬μ© f
νλ λ λ²μ§Έ κ³ μ ν¨κ³Ό λͺ¨λΈμ μ€ννμ΅λλ€. lmer
νΌν© ν¨κ³Ό λͺ¨λΈκ³Ό κΈ°λ³Έ κΈ°λ₯μ R ν¨ν€μ§ λ₯Ό μ¬μ©νμ΅λλ€.lm()
κ³ μ ν¨κ³Ό λͺ¨λΈμ κ²½μ° λ€μμ λ°μ΄ν°μ κ²°κ³Όμ
λλ€.
κ³΅μ§ μ¬ν y
μ κ΄κ³μμ΄ κ·Έλ£Ήμ μ£Όμ 0 λ€λ¦
λλ€ κ·Έλ¦¬κ³ κ·Έκ²μ, x
ν¨κ» μ§μμ μΌλ‘ λ³ν y
λ³΄λ€ κ·Έλ£Ήμμ λ λ§μ κ·Έλ£Ή λ΄μμ, κ·Έλ¬λ λ³νy
> data
y x f
1 -0.5 2 1
2 0.0 3 1
3 0.5 4 1
4 -0.6 -4 2
5 0.0 -3 2
6 0.6 -2 2
7 -0.2 13 3
8 0.1 14 3
9 0.4 15 3
10 -0.5 -15 4
11 -0.1 -14 4
12 0.4 -13 4
λ°μ΄ν° μμ
μ κ΄μ¬μ΄ μλ€λ©΄ λ€μκ³Ό κ°μ΄ dput()
μΆλ ₯λ©λλ€.
data<-structure(list(y = c(-0.5, 0, 0.5, -0.6, 0, 0.6, -0.2, 0.1, 0.4,
-0.5, -0.1, 0.4), x = c(2, 3, 4, -4, -3, -2, 13, 14, 15, -15,
-14, -13), f = structure(c(1L, 1L, 1L, 2L, 2L, 2L, 3L, 3L, 3L,
4L, 4L, 4L), .Label = c("1", "2", "3", "4"), class = "factor")),
.Names = c("y","x","f"), row.names = c(NA, -12L), class = "data.frame")
νΌν© ν¨κ³Ό λͺ¨λΈ λ§μΆκΈ° :
> summary(lmer(y~ x + (1|f),data=data))
Linear mixed model fit by REML
Formula: y ~ x + (1 | f)
Data: data
AIC BIC logLik deviance REMLdev
28.59 30.53 -10.3 11 20.59
Random effects:
Groups Name Variance Std.Dev.
f (Intercept) 0.00000 0.00000
Residual 0.17567 0.41913
Number of obs: 12, groups: f, 4
Fixed effects:
Estimate Std. Error t value
(Intercept) 0.008333 0.120992 0.069
x 0.008643 0.011912 0.726
Correlation of Fixed Effects:
(Intr)
x 0.000
μ νΈ λΆμ° μ±λΆμ 0μΌλ‘ μΆμ λλ©°, μ€μν κ²μ λμκ² x
μ€μν μμΈ‘ λ³μκ° μλλΌλ μ μ μ μνμμμ€ y
.
λ€μ f
μΌλ‘ μμμ μ νΈμ λν κ·Έλ£Ήν μμ λμ μμΈ‘ ν¨κ³Όλ‘ κ³ μ ν¨κ³Ό λͺ¨λΈμ λ§ μΆ₯λ λ€ .
> summary(lm(y~ x + f,data=data))
Call:
lm(formula = y ~ x + f, data = data)
Residuals:
Min 1Q Median 3Q Max
-0.16250 -0.03438 0.00000 0.03125 0.16250
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.38750 0.14099 -9.841 2.38e-05 ***
x 0.46250 0.04128 11.205 1.01e-05 ***
f2 2.77500 0.26538 10.457 1.59e-05 ***
f3 -4.98750 0.46396 -10.750 1.33e-05 ***
f4 7.79583 0.70817 11.008 1.13e-05 ***
---
Signif. codes: 0 β***β 0.001 β**β 0.01 β*β 0.05 β.β 0.1 β β 1
Residual standard error: 0.1168 on 7 degrees of freedom
Multiple R-squared: 0.9484, Adjusted R-squared: 0.9189
F-statistic: 32.16 on 4 and 7 DF, p-value: 0.0001348
μ΄μ μμ νλλ‘ x
μ μ€μν μμΈ‘ λ³μλΌλ κ²μ μμμ΅λλ€ y
.
λ΄κ° μ°Ύκ³ μλ κ²μμ΄ μ°¨μ΄μ μ κ΄ν μ§κ΄μ
λλ€. λ΄ μκ°μ΄ μ΄λ»κ² μλͺ» λμλμ? μμ΄ x
λ λͺ¨λΈμμ μ€μν λ§€κ° λ³μλ₯Ό μ°Ύμ κ²μΌλ‘ μμ νμ§λ§ μ€μ λ‘ κ³ μ ν¨κ³Ό λͺ¨λΈμμλ§ λ³Ό μ μμ΅λκΉ?
λ΅λ³
μ¬κΈ°μλ λͺ κ°μ§ μΌμ΄ μμ΅λλ€. μ΄λ€μ ν₯λ―Έλ‘μ΄ λ¬Έμ μ΄μ§λ§μ΄λ₯Ό λͺ¨λ μ€λͺ νλ €λ©΄ μλΉν μκ° / 곡κ°μ΄ νμν©λλ€.
μ°μ , μ°λ¦¬ κ° λ°μ΄ν°λ₯Ό νλ‘―νλ©΄ μ΄ λͺ¨λ κ²μ μ΄ν΄νκΈ°κ° ν¨μ¬ μ¬μμ§λλ€ . λ€μμ λ°μ΄ν° ν¬μΈνΈκ° κ·Έλ£Ήλ³λ‘ μμμ΄ μ§μ λ μ°μ λμ λλ€. λν κ° κ·Έλ£Ήλ§λ€ λ³λμ κ·Έλ£Ή λ³ νκ·μ κ³Ό κ·Έλ£Ήμ 무μνλ κ°λ¨ν νκ·μ μ΄ κ΅΅μ μ²΄λ‘ νμλ©λλ€.
plot(y ~ x, data=dat, col=f, pch=19)
abline(coef(lm(y ~ x, data=dat)), lwd=3, lty=2)
by(dat, dat$f, function(i) abline(coef(lm(y ~ x, data=i)), col=i$f))
κ³ μ ν¨κ³Ό λͺ¨λΈ
μμ€
μμ€
μμ€
μμ€
μμ€
μμ€
μμ€
μμ΄
ν°
μμ€
μμ€
μμ€
lm()
νΌν© λͺ¨λΈ
μμ€
μμ€
μμ€
μμ€
μμ€
λ€μμ λ¨μ νκ· λͺ¨νμ λν κ³μμ λλ€ (νλ‘―μμ κ΅΅μ μ μΌλ‘ νμ).
> lm(y ~ x, data=dat)
Call:
lm(formula = y ~ x, data = dat)
Coefficients:
(Intercept) x
0.008333 0.008643
보μλ€μνΌ, μ¬κΈ°μ κ³μλ νΌν© λͺ¨λΈμμ μ»μ κ²κ³Ό λμΌν©λλ€. μ΄λ―Έ μΈκΈνλ―μ΄ λλ€ μΈν°μ νΈμ λν λΆμ°μ΄ 0μΌλ‘ μΆμ λμ΄ μμμ μΈκΈ ν λΉμ¨ / ν΄λμ€ λ΄ μκ΄ κ΄κ³λ₯Ό 0μΌλ‘ λ§λλλ€.μ΄ κ²½μ° νΌν© λͺ¨ν μΆμ μΉλ κ°λ¨ν μ ν νκ· μΆμ μΉμ΄λ©°, νλ‘―μμ λ³Ό μ μλ―μ΄ μ¬κΈ°μ κΈ°μΈκΈ°λ ν΄λ¬μ€ν° λ΄ κΈ°μΈκΈ°λ³΄λ€ ν¨μ¬ λ λλλ¬μ§λλ€.
μ΄κ²μ μ°λ¦¬μκ² νλμ λ§μ§λ§ κ°λ λ¬Έμ λ₯Ό κ°μ Έμ΅λλ€ β¦
λλ€ μ νΈμ λΆμ°μ΄ 0μΌλ‘ μΆμ λλ μ΄μ λ 무μμ λκΉ?
μ΄ μ§λ¬Έμ λν λ΅μ μ½κ° κΈ°μ μ μ΄κ³ μ΄λ €μ μ§ κ°λ₯μ±μ΄ μμ§λ§, κ°λ₯ν ν λ¨μνκ³ λΉ κΈ°μ μ μΌλ‘ μ μ§νλ €κ³ λ Έλ ₯ν κ²μ λλ€ (λ κ°μ§ λͺ¨λλ₯Ό μν΄!). κ·Έλ¬λ κ·Έκ²μ μ¬μ ν ββμ½κ° κΈ΄ λ°λ μΌ κ²μ λλ€.
ν΄λμ€ λ΄ μκ΄ κ΄κ³μ κ°λ μ μμ μΈκΈνμ΅λλ€. μ΄κ²μ μ μμ‘΄μ±μ λν΄ μκ°νλ λ λ€λ₯Έ λ°©λ²μ λλ€.
μμ΄ν΄λ¬μ€ν°λ§ ꡬ쑰μ μν΄ μ λ λ (λλλ³΄λ€ μ ννκ²λ λͺ¨λΈμ μ€λ₯) ν΄λμ€ λ΄ μκ΄ κ΄κ³λ λ°μ΄ν° μ§ν©μ μ΄λ κ³³μμλ λ κ°μ μ€λ₯μ νκ· μ μ¬μ± (μ¦, λμΌν ν΄λ¬μ€ν°μ μκ±°λ μμ μ μμ)κ³Ό λΉκ΅νμ¬ λμΌν ν΄λ¬μ€ν°μμ κ°μ Έμ¨ λ κ°μ μ€λ₯κ° νκ· μ μΌλ‘ μΌλ§λ λΉμ·ν μ§ μλ €μ€λλ€. ν΄λμ€ λ΄λΆμ μμ μκ΄ κ΄κ³λ λμΌν κ΅°μ§μ μ€λ₯κ° μλμ μΌλ‘ λ μ μ¬ν κ²½ν₯μ΄ μμμ λνλ λλ€. ν΄λ¬μ€ν°μμ νλμ μ€λ₯λ₯Ό λ°μμν€κ³ κ°μ΄ λμΌλ©΄ λμΌν ν΄λ¬μ€ν°μμ λ€μμ λ°μνλ μ€λ₯λ λμ κ°μ κ°μ§ κ°λ₯μ±μ΄ λμ΅λλ€. λ€μ λ μΌλ°μ μ΄μ§λ§ ν΄λμ€ λ΄ μκ΄λ μμ μΌ μ μμ΅λλ€. λμΌν ν΄λ¬μ€ν°μμ λ°μνλ λ κ°μ§ μ€λ₯λ μΌλ°μ μΌλ‘ λ°μ΄ν° μ§ν© μ 체μμ μμλλ κ²λ³΄λ€ λ μ μ¬ν©λλ€ (μ¦, κ°μ΄ λ λ¨μ΄μ Έ μμ).
μ°λ¦¬κ° κ³ λ €νκ³ μλ νΌν© λͺ¨λΈμ λ°μ΄ν°μ μμ‘΄μ±μ λνλ΄λ ν΄λμ€ λ΄ μκ΄ λ°©λ²μ μ¬μ©νμ§ μμ΅λλ€. λμ λΆμ° μ±λΆ μ λν μμ‘΄μ±μ μ€λͺ ν©λλ€ . ν΄λμ€ λ΄ μκ΄ κ΄κ³κ° κΈμ μ μΈ νμ΄ λͺ¨λ κ²μ΄ μ’μ΅λλ€. μ΄λ¬ν κ²½μ°, ν΄λμ€ λ΄ μκ΄ κ΄κ³λ λΆμ° μ±λΆμ κ΄μ μμ μ½κ² μμ±ν μ μμ΅λλ€. ꡬ체μ μΌλ‘ μμμ μΈκΈ ν λλ€ μΈν°μ νΈ λΆμ°κ³Ό μ΄ λΆμ°μ λΉμ¨μ λλ€. ( ν΄λμ€ λ΄ μκ΄ κ΄κ³μ λν μν€ νμ΄μ§ μ°Έμ‘°κ·Έλ¬λ λΆννλ λΆμ° μ±λΆ λͺ¨λΈμ ν΄λμ€ λ΄μμ μμ μκ΄ κ΄κ³κ°μλ μν©μ μ²λ¦¬νλ λ° μ΄λ €μμ κ²ͺμ΅λλ€. κ²°κ΅, λΆμ° μ±λΆ μΈ‘λ©΄μμ ν΄λμ€ λ΄ μκ΄ κ΄κ³λ₯Ό μμ±νλ €λ©΄μ΄λ₯Ό λΆμ°μ λΉμ¨λ‘ μμ±ν΄μΌνλ©°, λΉμ¨μ μμκ° λ μ μμ΅λλ€.
μμ΄
μμ΄
μμ΄
κ·Έλ¬λ λ€λ₯Έ κ΅°μ§μμ λ°μνλ μ€λ₯λ λ μ€κ° μ λμ μ°¨μ΄κ°μλ κ²½ν₯μ΄ μμ΅λλ€. λ°λΌμ νΌν© λͺ¨νμ μ€μ λ‘μ΄ κ²½μ° μ’ μ’ νΌν© λͺ¨νμ΄ μννλ μμ μ μνν©λλ€. μ΄λ ν΄λμ€ λ΄ μμ μκ΄ κ΄κ³μ μΌμΉνλ μΆμ μΉλ₯Ό μ 곡ν©λλ€. μμ§ ν μλ μμ§λ§ νν 0μμ λ© μΆ₯λ λ€ (μ΄ κ΅¬μ 쑰건μ μΌλ°μ μΌλ‘ λͺ¨λΈ νΌν μκ³ λ¦¬μ¦μ νλ‘κ·Έλλ°λ©λλ€). κ·Έλμ μ°λ¦¬λ 0μΌλ‘ μΆμ λ λλ€ μΈν°μ νΈ λΆμ° (random intercept variance)μΌλ‘ λλ©λλ€. μ΄κ²μ μ¬μ ν ββμ’μ μΆμ μΉκ° μλμ§λ§,μ΄ λΆμ° μ±λΆ μ νμ λͺ¨λΈλ‘ μ»μ μμλλ§νΌ κ°κΉμ΅λλ€.
κ·Έλμ μ°λ¦¬κ° λ ν μ μμ§?
μμ€
μμ€
μμ€
μμ€λΉ
μμ€
μμ€μΉ
μμ€
> dat <- within(dat, x_b <- tapply(x, f, mean)[paste(f)])
> dat <- within(dat, x_w <- x - x_b)
> dat
y x f x_b x_w
1 -0.5 2 1 3 -1
2 0.0 3 1 3 0
3 0.5 4 1 3 1
4 -0.6 -4 2 -3 -1
5 0.0 -3 2 -3 0
6 0.6 -2 2 -3 1
7 -0.2 13 3 14 -1
8 0.1 14 3 14 0
9 0.4 15 3 14 1
10 -0.5 -15 4 -14 -1
11 -0.1 -14 4 -14 0
12 0.4 -13 4 -14 1
>
> mod <- lmer(y ~ x_b + x_w + (1|f), data=dat)
> mod
Linear mixed model fit by REML
Formula: y ~ x_b + x_w + (1 | f)
Data: dat
AIC BIC logLik deviance REMLdev
6.547 8.972 1.726 -23.63 -3.453
Random effects:
Groups Name Variance Std.Dev.
f (Intercept) 0.000000 0.00000
Residual 0.010898 0.10439
Number of obs: 12, groups: f, 4
Fixed effects:
Estimate Std. Error t value
(Intercept) 0.008333 0.030135 0.277
x_b 0.005691 0.002977 1.912
x_w 0.462500 0.036908 12.531
Correlation of Fixed Effects:
(Intr) x_b
x_b 0.000
x_w 0.000 0.000
μμ€μΉ
μμ€λΉ
μμ΄
μμ€
μμ€
μμ€λΉ
ν°
ν΅κ³κ° λ ν½λλ€. λ¨μ νΌν© νκ· λͺ¨νμ΄ μ²λ¦¬ν΄μΌνλ λΆμ°μ λ§μ΄ μ°¨μ§νλ λλ€ κ·Έλ£Ή ν¨κ³Όλ‘ μΈν΄μ΄ νΌν© λͺ¨νμμ μμ°¨ λΆμ°μ΄ ν¨μ¬ λ μκΈ° λλ¬Έμ μ΄λ λλΌμ΄ μΌμ΄ μλλλ€.
λ§μ§λ§μΌλ‘, μ΄μ μ μμ μμΈν μ€λͺ
ν μ΄μ λ‘ μΈν΄ μμ μ νΈμ λΆμ°μ λν μΆμ μΉλ μ¬μ ν 0μ
λλ€. λλ λ€λ₯Έ μννΈμ¨μ΄λ‘ λ°κΎΈμ§ μκ³ μ μ΄λ νλμ λν΄ μ°λ¦¬κ° 무μμ ν μ lmer()
μλμ§ μ λͺ¨λ₯΄κ² μΌλ©°,μ΄ μ΅μ’
νΌν© λͺ¨λΈμ μΆμ μΉμ μ¬μ ν μ
μν₯μ λ―ΈμΉ μ λκ° νμ€νμ§ μμ΅λλ€. μ΄μ©λ©΄ λ€λ₯Έ μ¬μ©μ κ°μ΄ λ¬Έμ μ λν λͺ κ°μ§ μκ°μ ν μ μμ΅λλ€.
μ°Έκ³ λ¬Έν
λ΅λ³
μλΉν μκ³ λμ, λλ λ΄ μμ μ λ΅μ μ°Ύμλ€ κ³ λ―Ώλλ€. λλ κ³λ κ²½μ νμκ° λ΄ λ 립 λ³μλ₯Ό λ΄μΈμ±μΌλ‘ μ μνμ¬ λ 립 λ³μ μ μ’ μ λ³μ λͺ¨λμ μκ΄ κ΄κ³κ° μλ€κ³ μκ° ν©λλ€. μ΄ κ²½μ° ν΄λΉ λ³μλ μλ΅ λκ±°λ κ΄μ°°λμ§ μμ΅λλ€ . κ·Έλ¬λ μλ΅ λ λ³μκ° λ¬λΌμΌνλ κ·Έλ£Ήνλ₯Ό κ΄μ°°ν©λλ€.
λλ κ³λ κ²½μ νμκ° κ³ μ ν¨κ³Ό λͺ¨λΈμ μ μ ν κ²μ΄λΌκ³ λ―Ώλλ€ . μ¦,μ΄ κ²½μ° λͺ¨λ κ·Έλ£Ήν λ 벨μ λν λλ―Έ (λλ λ§μ κ·Έλ£Ήν μΈνμ΄ νμνμ§ μλλ‘ λͺ¨λΈμ μ‘°μ νλ λλ±ν μ¬μ)κ° ν¬ν¨ λ λͺ¨λΈμ λλ€. κ³ μ ν¨κ³Ό λͺ¨λΈμ μ¬μ©νλ©΄ κ·Έλ£Ή μ 체 (λλ κ°λ³) λ³λμ μ‘°μ νμ¬ κ΄μ°°λμ§ μκ³ μκ°μ΄ λ³νμ§ μλ λͺ¨λ λ³μλ₯Ό μ μ΄ ν μ μμ΅λλ€. μ€μ λ‘, μ μ§λ¬Έμ λ λ²μ§Έ λͺ¨λΈμ μ νν κ³ μ ν¨κ³Ό λͺ¨λΈμ΄λ©°, λ°λΌμ λ΄κ° κΈ°λνλ μΆμ μΉλ₯Ό μ 곡ν©λλ€.
μ΄ μν©μ λμ± λ°κ² ν΄μ€ μ견μ νμν©λλ€.