다음과 같이 구성된 실험에서 수집 한 데이터가 있습니다.
각각 30 그루의 나무가있는 두 곳. 15 개가 치료되고 15 개가 각 현장에서 통제됩니다. 각 나무에서 우리는 줄기 세 조각과 뿌리 세 조각을 샘플링하므로 나무 당 6 레벨 1 샘플이 두 요소 수준 (뿌리, 줄기) 중 하나로 표시됩니다. 그런 다음 줄기 / 뿌리 샘플에서 샘플 내 다른 조직을 해부하여 두 개의 샘플을 채취합니다.이 샘플은 조직 유형 (조직 유형 A, 조직 유형 B)의 두 가지 요인 수준 중 하나로 표시됩니다. 이 샘플은 연속 변수로 측정됩니다. 총 관측치 수는 720입니다. 2 개 사이트 * 30 그루의 나무 * (3 개의 줄기 샘플 + 3 개의 루트 샘플) * (1 개의 조직 A 샘플 + 1 개의 조직 B 샘플). 데이터는 다음과 같습니다.
ï..Site Tree Treatment Organ Sample Tissue Total_Length
1 L LT1 T R 1 Phloem 30
2 L LT1 T R 1 Xylem 28
3 L LT1 T R 2 Phloem 46
4 L LT1 T R 2 Xylem 38
5 L LT1 T R 3 Phloem 103
6 L LT1 T R 3 Xylem 53
7 L LT1 T S 1 Phloem 29
8 L LT1 T S 1 Xylem 21
9 L LT1 T S 2 Phloem 56
10 L LT1 T S 2 Xylem 49
11 L LT1 T S 3 Phloem 41
12 L LT1 T S 3 Xylem 30
R과 lme4를 사용하여 혼합 효과 모델을 맞추려고하지만 혼합 모델이 처음입니다. 두 레벨 내에 중첩 된 특정 샘플에 대해 임의의 효과를 사용하여 처리 + 레벨 1 요인 (줄기, 뿌리) + 레벨 2 요인 (조직 A, 조직 B)으로 반응을 모델링하고 싶습니다.
R에서는 다음과 같이 lmer을 사용 하여이 작업을 수행하고 있습니다.
fit <- lmer(Response ~ Treatment + Organ + Tissue + (1|Tree/Organ/Sample))
내 이해에서 (… 확실하지 않으며 왜 게시하고 있는지!)
(1|Tree/Organ/Sample)
‘샘플’이 트리 내에 중첩 된 오르간 샘플 내에 중첩되도록 지정합니다. 이런 종류의 중첩은 관련성이 있고 유효합니까? 이 질문이 명확하지 않다면 죄송합니다. 정교화 할 수있는 곳을 지정하십시오.
답변
나는 이것이 맞다고 생각한다.
(1|Tree/Organ/Sample)
확장(1|Tree)+(1|Tree:Organ)+(1|Tree:Organ:Sample)
(:
또는 상호 작용을 나타냄)- 고정 요인
Treatment
,Organ
그리고Tissue
자동으로 올바른 수준에서 처리 얻을. Site
고정 된 효과로 포함시켜야 합니다 (개념적으로는 임의의 효과이지만 두 사이트만으로 사이트 간 차이를 추정하는 것은 실용적이지 않습니다). 이렇게하면 트리 간 차이가 약간 줄어 듭니다.- 데이터 프레임 내에 모든 데이터를 포함
lmer
시키고data=my.data.frame
인수 를 통해 명시 적으로 전달해야합니다 .
glmm FAQ가 도움 이 될 것입니다 (GLMM에 중점을두고 있지만 선형 혼합 모델과 관련된 내용도 있습니다).
답변
이 질문과 Bolker 박사의 답변을 읽고 데이터를 복제하려고했습니다 (솔직히 말해서 생물학적 용어 또는 단위로 “길이”가 무엇을 나타내는 지에 대해 신경 쓰지 않고 위와 같이 모델에 적합합니다. 여기에 결과를 게시합니다.) 오해의 가능성이있는 부분에 대한 의견을 공유하고 구합니다.
이 가상의 데이터를 생성하는 데 사용한 코드는 here 에서 찾을 수 있으며 데이터 세트는 OP의 내부 구조를 갖습니다.
site tree treatment organ sample tissue length
1 L LT01 T root 1 phloem 108.21230
2 L LT01 T root 1 xylem 138.54267
3 L LT01 T root 2 phloem 68.88804
4 L LT01 T root 2 xylem 107.91239
5 L LT01 T root 3 phloem 96.78523
6 L LT01 T root 3 xylem 88.93194
7 L LT01 T stem 1 phloem 101.84103
8 L LT01 T stem 1 xylem 118.30319
구조는 다음과 같습니다.
'data.frame': 360 obs. of 7 variables:
$ site : Factor w/ 2 levels "L","R": 1 1 1 1 1 1 1 1 1 1 ...
$ tree : Factor w/ 30 levels "LT01","LT02",..: 1 1 1 1 1 1 1 1 1 1 ...
$ treatment: Factor w/ 2 levels "C","T": 2 2 2 2 2 2 2 2 2 2 ...
$ organ : Factor w/ 2 levels "root","stem": 1 1 1 1 1 1 2 2 2 2 ...
$ sample : num 1 1 2 2 3 3 1 1 2 2 ...
$ tissue : Factor w/ 2 levels "phloem","xylem": 1 2 1 2 1 2 1 2 1 2 ...
$ length : num 108.2 138.5 68.9 107.9 96.8 ...
데이터 세트는 다음과 같이 “리깅”되었습니다 (여기서 피드백을 환영합니다).
- 의 경우
treatment
, 치료 대 대조군 (100
대70
)에 대한 두 가지 뚜렷한 절편으로 고정 효과가 있으며 임의의 효과는 없습니다. - 나는 대 ( 와 )에
tissue
대한 매우 다른 절편으로 눈에 띄는 고정 효과로 값을 설정하고 a로 임의 효과를 설정했습니다 .phloem
xylem
3
6
sd = 3
organ
sd = 3
6
root
stem
- 들어
tree
우리는 단지 랜덤 효과를sd = 7
. - 들어
sample
난 만 임의 효과를 설정하기 위해 노력했다sd = 5
. - 에 대한 위해
site
도 무작위 EFF와 함께입니다sd = 3
.
변수의 범주 특성으로 인해 기울기가 설정되지 않았습니다.
혼합 효과 모델의 결과 :
fit <- lmer(length ~ treatment + organ + tissue + (1|tree/organ/sample), data = trees)
있었다 :
Random effects:
Groups Name Variance Std.Dev.
sample:(organ:tree) (Intercept) 9.534e-14 3.088e-07
organ:tree (Intercept) 0.000e+00 0.000e+00
tree (Intercept) 4.939e+01 7.027e+00
Residual 3.603e+02 1.898e+01
Number of obs: 360, groups: sample:(organ:tree), 180; organ:tree, 60; tree, 30
Fixed effects:
Estimate Std. Error df t value Pr(>|t|)
(Intercept) 79.8623 2.7011 52.5000 29.567 < 2e-16 ***
treatmentT 21.4368 3.2539 28.0000 6.588 3.82e-07 ***
organstem 0.1856 2.0008 328.0000 0.093 0.926
tissuexylem 3.1820 2.0008 328.0000 1.590 0.113
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
어떻게 작동 했습니까?
- 의 경우
treatment
치료없이 차단했다79.8623
(I는 평균 설정70
), 그리고 그것이 치료79.8623 + 21.4368 = 101.2991
(우리의 평균 설정100
. - 에 대한 요격
tissue
에 대한3.1820
기여 가 있었기 때문에 와 의xylem
차이를 설정했습니다 . 랜덤 효과는 모델의 일부가 아닙니다.phloem
xylem
3
- 를 들어
organ
,로부터 샘플stem
로 절편을 증가0.1856
– 나는 사이의 고정 효과에 차이 설정할 수 없었다stem
과root
. 무작위 효과로 사용하고 싶었던 표준 편차는 반영되지 않았습니다. tree
의 SD와 임의 효과7
로 잘 떠올랐다7.027
.- 에 관해서는
sample
, 초기sd
의이5
같은 강조해도 지나치지했다3.088
. site
모델의 일부가 아니 었습니다.
따라서 전반적으로 모델이 데이터의 구조와 일치하는 것처럼 보입니다.