μΌλΆ λͺ¨λΈ λ§€κ° λ³μκ° μΌλΆ κ·Έλ£Ήν μμΈμ λ°λΌ 무μμλ‘ λ³νλ€κ³  μκ°ν  λ μμ ν¨κ³Ό (λλ νΌν© ν¨κ³Ό) λͺ¨λΈμ μ¬μ©νλ€λ κ²μ μκ³  μμ΅λλ€. μλ΅μ΄ μ κ·νλκ³  κ·Έλ£Ήν μμ μ μ²΄μμ μ€μ¬μ΄ (μλ²½νμ§λ μμ§λ§ κ½€ κ°κΉμ΅λλ€) λͺ¨λΈμ λ§μΆκ³  μΆμ§λ§ λ
립 λ³μ xλ μ΄λ€ μμΌλ‘λ μ‘°μ λμ§ μμμ΅λλ€. μ΄λ‘ μΈν΄ λ€μκ³Ό κ°μ ν
μ€νΈ ( μ μ‘° λ λ°μ΄ν° μ¬μ©)λ₯Ό ν΅ν΄ μ€μ λ‘ μνλ κ²½μ° λ΄κ° μ°Ύμ ν¨κ³Όλ₯Ό μ°Ύμ μ μλμ§ νμΈνμ΅λλ€. λλ€ μΈν°μ
νΈ (λ‘ μ μ λ κ·Έλ£Ή κ°)κ°μλ νΌν© ν¨κ³Ό λͺ¨λΈ νλ μ μμΈ fλ₯Ό κ³ μ  ν¨κ³Ό μμΈ‘ λ³μλ‘ μ¬μ© fνλ λ λ²μ§Έ κ³ μ  ν¨κ³Ό λͺ¨λΈμ μ€ννμ΅λλ€. lmerνΌν© ν¨κ³Ό λͺ¨λΈκ³Ό κΈ°λ³Έ κΈ°λ₯μ R ν¨ν€μ§ λ₯Ό μ¬μ©νμ΅λλ€.lm()κ³ μ  ν¨κ³Ό λͺ¨λΈμ κ²½μ° λ€μμ λ°μ΄ν°μ κ²°κ³Όμ
λλ€.
κ³΅μ§ μ¬ν yμ κ΄κ³μμ΄ κ·Έλ£Ήμ μ£Όμ 0 λ€λ¦
λλ€ κ·Έλ¦¬κ³  κ·Έκ²μ, xν¨κ» μ§μμ μΌλ‘ λ³ν yλ³΄λ€ κ·Έλ£Ήμμ λ λ§μ κ·Έλ£Ή λ΄μμ, κ·Έλ¬λ λ³νy
> data
      y   x f
1  -0.5   2 1
2   0.0   3 1
3   0.5   4 1
4  -0.6  -4 2
5   0.0  -3 2
6   0.6  -2 2
7  -0.2  13 3
8   0.1  14 3
9   0.4  15 3
10 -0.5 -15 4
11 -0.1 -14 4
12  0.4 -13 4
λ°μ΄ν° μμ
μ κ΄μ¬μ΄ μλ€λ©΄ λ€μκ³Ό κ°μ΄ dput()μΆλ ₯λ©λλ€.
data<-structure(list(y = c(-0.5, 0, 0.5, -0.6, 0, 0.6, -0.2, 0.1, 0.4,
-0.5, -0.1, 0.4), x = c(2, 3, 4, -4, -3, -2, 13, 14, 15, -15,
-14, -13), f = structure(c(1L, 1L, 1L, 2L, 2L, 2L, 3L, 3L, 3L,
4L, 4L, 4L), .Label = c("1", "2", "3", "4"), class = "factor")),
.Names = c("y","x","f"), row.names = c(NA, -12L), class = "data.frame")
νΌν© ν¨κ³Ό λͺ¨λΈ λ§μΆκΈ° :
> summary(lmer(y~ x + (1|f),data=data))
Linear mixed model fit by REML
Formula: y ~ x + (1 | f)
   Data: data
   AIC   BIC logLik deviance REMLdev
 28.59 30.53  -10.3       11   20.59
Random effects:
 Groups   Name        Variance Std.Dev.
 f        (Intercept) 0.00000  0.00000
 Residual             0.17567  0.41913
Number of obs: 12, groups: f, 4
Fixed effects:
            Estimate Std. Error t value
(Intercept) 0.008333   0.120992   0.069
x           0.008643   0.011912   0.726
Correlation of Fixed Effects:
  (Intr)
x 0.000 
μ νΈ λΆμ° μ±λΆμ 0μΌλ‘ μΆμ λλ©°, μ€μν κ²μ λμκ² xμ€μν μμΈ‘ λ³μκ° μλλΌλ μ μ μ μνμμμ€ y.
λ€μ fμΌλ‘ μμμ μ νΈμ λν κ·Έλ£Ήν μμ λμ  μμΈ‘ ν¨κ³Όλ‘ κ³ μ  ν¨κ³Ό λͺ¨λΈμ λ§ μΆ₯λ λ€ .
> summary(lm(y~ x + f,data=data))
Call:
lm(formula = y ~ x + f, data = data)
Residuals:
     Min       1Q   Median       3Q      Max
-0.16250 -0.03438  0.00000  0.03125  0.16250
Coefficients:
            Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.38750    0.14099  -9.841 2.38e-05 ***
x            0.46250    0.04128  11.205 1.01e-05 ***
f2           2.77500    0.26538  10.457 1.59e-05 ***
f3          -4.98750    0.46396 -10.750 1.33e-05 ***
f4           7.79583    0.70817  11.008 1.13e-05 ***
---
Signif. codes:  0 β***β 0.001 β**β 0.01 β*β 0.05 β.β 0.1 β β 1
Residual standard error: 0.1168 on 7 degrees of freedom
Multiple R-squared: 0.9484, Adjusted R-squared: 0.9189
F-statistic: 32.16 on 4 and 7 DF,  p-value: 0.0001348 
μ΄μ  μμ νλλ‘ xμ μ€μν μμΈ‘ λ³μλΌλ κ²μ μμμ΅λλ€ y.
λ΄κ° μ°Ύκ³ μλ κ²μμ΄ μ°¨μ΄μ μ κ΄ν μ§κ΄μ
λλ€. λ΄ μκ°μ΄ μ΄λ»κ² μλͺ» λμλμ? μμ΄ xλ λͺ¨λΈμμ μ€μν λ§€κ° λ³μλ₯Ό μ°Ύμ κ²μΌλ‘ μμ νμ§λ§ μ€μ λ‘ κ³ μ  ν¨κ³Ό λͺ¨λΈμμλ§ λ³Ό μ μμ΅λκΉ?
λ΅λ³
μ¬κΈ°μλ λͺ κ°μ§ μΌμ΄ μμ΅λλ€. μ΄λ€μ ν₯λ―Έλ‘μ΄ λ¬Έμ μ΄μ§λ§μ΄λ₯Ό λͺ¨λ μ€λͺ νλ €λ©΄ μλΉν μκ° / 곡κ°μ΄ νμν©λλ€.
μ°μ , μ°λ¦¬ κ° λ°μ΄ν°λ₯Ό νλ‘―νλ©΄ μ΄ λͺ¨λ κ²μ μ΄ν΄νκΈ°κ° ν¨μ¬ μ¬μμ§λλ€ . λ€μμ λ°μ΄ν° ν¬μΈνΈκ° κ·Έλ£Ήλ³λ‘ μμμ΄ μ§μ λ μ°μ λμ λλ€. λν κ° κ·Έλ£Ήλ§λ€ λ³λμ κ·Έλ£Ή λ³ νκ·μ κ³Ό κ·Έλ£Ήμ 무μνλ κ°λ¨ν νκ·μ μ΄ κ΅΅μ μ²΄λ‘ νμλ©λλ€.
plot(y ~ x, data=dat, col=f, pch=19)
abline(coef(lm(y ~ x, data=dat)), lwd=3, lty=2)
by(dat, dat$f, function(i) abline(coef(lm(y ~ x, data=i)), col=i$f))
κ³ μ  ν¨κ³Ό λͺ¨λΈ
μμ€
μμ€
μμ€
μμ€
μμ€
μμ€
μμ€
μμ΄
ν°
μμ€
μμ€
μμ€
lm()
νΌν© λͺ¨λΈ
μμ€
μμ€
μμ€
μμ€
μμ€
λ€μμ λ¨μ νκ· λͺ¨νμ λν κ³μμ λλ€ (νλ‘―μμ κ΅΅μ μ μΌλ‘ νμ).
> lm(y ~ x, data=dat)
Call:
lm(formula = y ~ x, data = dat)
Coefficients:
(Intercept)            x
   0.008333     0.008643  
보μλ€μνΌ, μ¬κΈ°μ κ³μλ νΌν© λͺ¨λΈμμ μ»μ κ²κ³Ό λμΌν©λλ€. μ΄λ―Έ μΈκΈνλ―μ΄ λλ€ μΈν°μ νΈμ λν λΆμ°μ΄ 0μΌλ‘ μΆμ λμ΄ μμμ μΈκΈ ν λΉμ¨ / ν΄λμ€ λ΄ μκ΄ κ΄κ³λ₯Ό 0μΌλ‘ λ§λλλ€.μ΄ κ²½μ° νΌν© λͺ¨ν μΆμ μΉλ κ°λ¨ν μ ν νκ· μΆμ μΉμ΄λ©°, νλ‘―μμ λ³Ό μ μλ―μ΄ μ¬κΈ°μ κΈ°μΈκΈ°λ ν΄λ¬μ€ν° λ΄ κΈ°μΈκΈ°λ³΄λ€ ν¨μ¬ λ λλλ¬μ§λλ€.
μ΄κ²μ μ°λ¦¬μκ² νλμ λ§μ§λ§ κ°λ  λ¬Έμ λ₯Ό κ°μ Έμ΅λλ€ β¦
λλ€ μ νΈμ λΆμ°μ΄ 0μΌλ‘ μΆμ λλ μ΄μ λ 무μμ λκΉ?
μ΄ μ§λ¬Έμ λν λ΅μ μ½κ° κΈ°μ μ μ΄κ³ μ΄λ €μ μ§ κ°λ₯μ±μ΄ μμ§λ§, κ°λ₯ν ν λ¨μνκ³ λΉ κΈ°μ μ μΌλ‘ μ μ§νλ €κ³ λ Έλ ₯ν κ²μ λλ€ (λ κ°μ§ λͺ¨λλ₯Ό μν΄!). κ·Έλ¬λ κ·Έκ²μ μ¬μ ν ββμ½κ° κΈ΄ λ°λ μΌ κ²μ λλ€.
ν΄λμ€ λ΄ μκ΄ κ΄κ³μ κ°λ μ μμ μΈκΈνμ΅λλ€. μ΄κ²μ μ μμ‘΄μ±μ λν΄ μκ°νλ λ λ€λ₯Έ λ°©λ²μ λλ€.
μμ΄ν΄λ¬μ€ν°λ§ ꡬ쑰μ μν΄ μ λ λ (λλλ³΄λ€ μ ννκ²λ λͺ¨λΈμ μ€λ₯) ν΄λμ€ λ΄ μκ΄ κ΄κ³λ λ°μ΄ν° μ§ν©μ μ΄λ κ³³μμλ λ κ°μ μ€λ₯μ νκ· μ μ¬μ± (μ¦, λμΌν ν΄λ¬μ€ν°μ μκ±°λ μμ μ μμ)κ³Ό λΉκ΅νμ¬ λμΌν ν΄λ¬μ€ν°μμ κ°μ Έμ¨ λ κ°μ μ€λ₯κ° νκ· μ μΌλ‘ μΌλ§λ λΉμ·ν μ§ μλ €μ€λλ€. ν΄λμ€ λ΄λΆμ μμ μκ΄ κ΄κ³λ λμΌν κ΅°μ§μ μ€λ₯κ° μλμ μΌλ‘ λ μ μ¬ν κ²½ν₯μ΄ μμμ λνλ λλ€. ν΄λ¬μ€ν°μμ νλμ μ€λ₯λ₯Ό λ°μμν€κ³ κ°μ΄ λμΌλ©΄ λμΌν ν΄λ¬μ€ν°μμ λ€μμ λ°μνλ μ€λ₯λ λμ κ°μ κ°μ§ κ°λ₯μ±μ΄ λμ΅λλ€. λ€μ λ μΌλ°μ μ΄μ§λ§ ν΄λμ€ λ΄ μκ΄λ μμ μΌ μ μμ΅λλ€. λμΌν ν΄λ¬μ€ν°μμ λ°μνλ λ κ°μ§ μ€λ₯λ μΌλ°μ μΌλ‘ λ°μ΄ν° μ§ν© μ 체μμ μμλλ κ²λ³΄λ€ λ μ μ¬ν©λλ€ (μ¦, κ°μ΄ λ λ¨μ΄μ Έ μμ).
μ°λ¦¬κ° κ³ λ €νκ³ μλ νΌν© λͺ¨λΈμ λ°μ΄ν°μ μμ‘΄μ±μ λνλ΄λ ν΄λμ€ λ΄ μκ΄ λ°©λ²μ μ¬μ©νμ§ μμ΅λλ€. λμ λΆμ° μ±λΆ μ λν μμ‘΄μ±μ μ€λͺ ν©λλ€ . ν΄λμ€ λ΄ μκ΄ κ΄κ³κ° κΈμ μ  μΈ νμ΄ λͺ¨λ κ²μ΄ μ’μ΅λλ€. μ΄λ¬ν κ²½μ°, ν΄λμ€ λ΄ μκ΄ κ΄κ³λ λΆμ° μ±λΆμ κ΄μ μμ μ½κ² μμ±ν μ μμ΅λλ€. ꡬ체μ μΌλ‘ μμμ μΈκΈ ν λλ€ μΈν°μ νΈ λΆμ°κ³Ό μ΄ λΆμ°μ λΉμ¨μ λλ€. ( ν΄λμ€ λ΄ μκ΄ κ΄κ³μ λν μν€ νμ΄μ§ μ°Έμ‘°κ·Έλ¬λ λΆννλ λΆμ° μ±λΆ λͺ¨λΈμ ν΄λμ€ λ΄μμ μμ μκ΄ κ΄κ³κ°μλ μν©μ μ²λ¦¬νλ λ° μ΄λ €μμ κ²ͺμ΅λλ€. κ²°κ΅, λΆμ° μ±λΆ μΈ‘λ©΄μμ ν΄λμ€ λ΄ μκ΄ κ΄κ³λ₯Ό μμ±νλ €λ©΄μ΄λ₯Ό λΆμ°μ λΉμ¨λ‘ μμ±ν΄μΌνλ©°, λΉμ¨μ μμκ° λ μ μμ΅λλ€.
μμ΄
μμ΄
μμ΄
κ·Έλ¬λ λ€λ₯Έ κ΅°μ§μμ λ°μνλ μ€λ₯λ λ μ€κ° μ λμ μ°¨μ΄κ°μλ κ²½ν₯μ΄ μμ΅λλ€. λ°λΌμ νΌν© λͺ¨νμ μ€μ λ‘μ΄ κ²½μ° μ’ μ’ νΌν© λͺ¨νμ΄ μννλ μμ μ μνν©λλ€. μ΄λ ν΄λμ€ λ΄ μμ μκ΄ κ΄κ³μ μΌμΉνλ μΆμ μΉλ₯Ό μ 곡ν©λλ€. μμ§ ν μλ μμ§λ§ νν 0μμ λ© μΆ₯λ λ€ (μ΄ κ΅¬μ 쑰건μ μΌλ°μ μΌλ‘ λͺ¨λΈ νΌν μκ³ λ¦¬μ¦μ νλ‘κ·Έλλ°λ©λλ€). κ·Έλμ μ°λ¦¬λ 0μΌλ‘ μΆμ  λ λλ€ μΈν°μ νΈ λΆμ° (random intercept variance)μΌλ‘ λλ©λλ€. μ΄κ²μ μ¬μ ν ββμ’μ μΆμ μΉκ° μλμ§λ§,μ΄ λΆμ° μ±λΆ μ νμ λͺ¨λΈλ‘ μ»μ μμλλ§νΌ κ°κΉμ΅λλ€.
κ·Έλμ μ°λ¦¬κ° λ ν μ μμ§?
μμ€
μμ€
μμ€
μμ€λΉ
μμ€
μμ€μΉ
μμ€
> dat <- within(dat, x_b <- tapply(x, f, mean)[paste(f)])
> dat <- within(dat, x_w <- x - x_b)
> dat
      y   x f x_b x_w
1  -0.5   2 1   3  -1
2   0.0   3 1   3   0
3   0.5   4 1   3   1
4  -0.6  -4 2  -3  -1
5   0.0  -3 2  -3   0
6   0.6  -2 2  -3   1
7  -0.2  13 3  14  -1
8   0.1  14 3  14   0
9   0.4  15 3  14   1
10 -0.5 -15 4 -14  -1
11 -0.1 -14 4 -14   0
12  0.4 -13 4 -14   1
>
> mod <- lmer(y ~ x_b + x_w + (1|f), data=dat)
> mod
Linear mixed model fit by REML
Formula: y ~ x_b + x_w + (1 | f)
   Data: dat
   AIC   BIC logLik deviance REMLdev
 6.547 8.972  1.726   -23.63  -3.453
Random effects:
 Groups   Name        Variance Std.Dev.
 f        (Intercept) 0.000000 0.00000
 Residual             0.010898 0.10439
Number of obs: 12, groups: f, 4
Fixed effects:
            Estimate Std. Error t value
(Intercept) 0.008333   0.030135   0.277
x_b         0.005691   0.002977   1.912
x_w         0.462500   0.036908  12.531
Correlation of Fixed Effects:
    (Intr) x_b
x_b 0.000
x_w 0.000  0.000
μμ€μΉ
μμ€λΉ
μμ΄
μμ€
μμ€
μμ€λΉ
ν°
ν΅κ³κ° λ ν½λλ€. λ¨μ νΌν© νκ· λͺ¨νμ΄ μ²λ¦¬ν΄μΌνλ λΆμ°μ λ§μ΄ μ°¨μ§νλ λλ€ κ·Έλ£Ή ν¨κ³Όλ‘ μΈν΄μ΄ νΌν© λͺ¨νμμ μμ°¨ λΆμ°μ΄ ν¨μ¬ λ μκΈ° λλ¬Έμ μ΄λ λλΌμ΄ μΌμ΄ μλλλ€.
λ§μ§λ§μΌλ‘, μ΄μ  μ μμ μμΈν μ€λͺ
ν μ΄μ λ‘ μΈν΄ μμ μ νΈμ λΆμ°μ λν μΆμ μΉλ μ¬μ ν 0μ
λλ€. λλ λ€λ₯Έ μννΈμ¨μ΄λ‘ λ°κΎΈμ§ μκ³  μ μ΄λ νλμ λν΄ μ°λ¦¬κ° 무μμ ν  μ lmer()μλμ§ μ λͺ¨λ₯΄κ² μΌλ©°,μ΄ μ΅μ’
 νΌν© λͺ¨λΈμ μΆμ μΉμ μ¬μ ν μ
μν₯μ λ―ΈμΉ  μ λκ° νμ€νμ§ μμ΅λλ€. μ΄μ©λ©΄ λ€λ₯Έ μ¬μ©μ κ°μ΄ λ¬Έμ μ λν λͺ κ°μ§ μκ°μ ν  μ μμ΅λλ€.
μ°Έκ³ λ¬Έν
λ΅λ³
μλΉν μκ³ λμ, λλ λ΄ μμ μ λ΅μ μ°Ύμλ€ κ³ λ―Ώλλ€. λλ κ³λ κ²½μ νμκ° λ΄ λ 립 λ³μλ₯Ό λ΄μΈμ±μΌλ‘ μ μνμ¬ λ 립 λ³μ μ μ’ μ λ³μ λͺ¨λμ μκ΄ κ΄κ³κ° μλ€κ³ μκ° ν©λλ€. μ΄ κ²½μ° ν΄λΉ λ³μλ μλ΅ λκ±°λ κ΄μ°°λμ§ μμ΅λλ€ . κ·Έλ¬λ μλ΅ λ λ³μκ° λ¬λΌμΌνλ κ·Έλ£Ήνλ₯Ό κ΄μ°°ν©λλ€.
λλ κ³λ κ²½μ νμκ° κ³ μ  ν¨κ³Ό λͺ¨λΈμ μ μ ν κ²μ΄λΌκ³ λ―Ώλλ€ . μ¦,μ΄ κ²½μ° λͺ¨λ κ·Έλ£Ήν λ 벨μ λν λλ―Έ (λλ λ§μ κ·Έλ£Ήν μΈνμ΄ νμνμ§ μλλ‘ λͺ¨λΈμ μ‘°μ νλ λλ±ν μ¬μ)κ° ν¬ν¨ λ λͺ¨λΈμ λλ€. κ³ μ  ν¨κ³Ό λͺ¨λΈμ μ¬μ©νλ©΄ κ·Έλ£Ή μ 체 (λλ κ°λ³) λ³λμ μ‘°μ νμ¬ κ΄μ°°λμ§ μκ³ μκ°μ΄ λ³νμ§ μλ λͺ¨λ λ³μλ₯Ό μ μ΄ ν μ μμ΅λλ€. μ€μ λ‘, μ  μ§λ¬Έμ λ λ²μ§Έ λͺ¨λΈμ μ νν κ³ μ  ν¨κ³Ό λͺ¨λΈμ΄λ©°, λ°λΌμ λ΄κ° κΈ°λνλ μΆμ μΉλ₯Ό μ 곡ν©λλ€.
μ΄ μν©μ λμ± λ°κ² ν΄μ€ μ견μ νμν©λλ€.