설명 변수 중 하나에 2 차 및 3 차 항이있을 때 설명 변수 간의 상호 작용을 어떻게 모델링해야합니까? 다른 3 가지 처리

본인은이 질문에 명확하게 답변 할 수있는 방식으로이 질문에 대한 답변을 드리겠습니다. 그렇지 않은 경우 알려 주시면 다시 시도하겠습니다! 또한 이러한 분석에 R을 사용할 것입니다.

나는 여러 조치가 plant performance (Ys)나는 imposed– 네 치료에 의해 영향을받은 것으로 의심을 flower thinning (X1), fertilization (X2), leaf clipping (X3)하고 biased flower thinning (X4). 가능한 모든 Y에 대해 N은 242 이상이므로 샘플 크기가 큽니다. 모든 플롯은 얇아 ​​지든 아니든, 각각의 플롯은 다른 3 가지 처리 중 하나 (그리고 하나만)에 적용되었습니다 (또는 제어 플롯도 없었습니다). 이 디자인의 아이디어는 다른 세 가지 처리가 희석 효과를 “마스킹”또는 “강화”할 수 있는지 테스트하는 것이 었습니다. 따라서 설계 상 후자의 세 가지 치료 (X2-X4)는 교차하지 않았기 때문에 서로 상호 작용할 없었지만 각각 꽃이 얇아지는 것과 상호 작용할 수 있습니다 .

나의 명백한 가설은 1) 개화 숱이 중요하고 2) X1*X2, X1*X3, and X1*X4,꽃 숱과 다른 3 가지 치료 사이 의 상호 작용 항 또한 중요하다는 것입니다. 즉, 꽃 가늘게하는 것이 중요해야하지만 중요한 세 가지 치료법에 따라 중요한 방법이 크게 바뀌어야합니다.

이 모든 정보를 혼합 모델에 포함하고 싶습니다.

Y ~ X0 + X1 + X2 + X3 + X4 + X1*X2 + X1*X3 + X1*X4 + (Up to three random effects)

그러나 한 가지 끊기가 있습니다. Y에 대한 희석 효과가 비선형이라고 믿을만한 충분한 이유가 있습니다. 그것들은 아마도 이차적이지만 어떤 경우에는 입방체 일 수도 있습니다. 성능에 대한 희석 효과가 더 높은 수준의 희석 효과에서 더 빠르게 증가 할 수 있기 때문입니다. X1에 2 차 및 3 차 항을 추가하여 위의 방정식을 통해이 비선형 관계를 모델링하려고하면 상호 작용 항을 모델링하는 방법을 확신 할 수 없습니다. 가능한 모든 X1 조합을 포함해야합니다. 2, (X1) ^ 3 * X2, X3 및 X4? 그것은 내가 가지고있는 데이터 포인트의 수에 관계없이 추정하려고 많은 매개 변수처럼 보이기 때문에 얻을 결과를 해석하는 방법을 잘 모르겠습니다. 즉, 이것이 상황을 모델링하는 데 부적절한 방법이라고 생각할 생물학적 이유는 없습니다.

따라서이 문제를 해결하는 방법에 대한 세 가지 생각이 있습니다.

  1. 예를 들어 Y ~ X1 + X1^2 + X^3 + Random effects, 씨닝과 Y 사이의 관계가 선형, 2 차 또는 3 차 관계인지 파악하려는 유일한 목적으로 더 작은 모델을 먼저 적합시킨 다음, 제곱근 또는 제곱근을 통해 희석을 변환하여 관계를 적절하게 선형화하십시오. 여기에서 상호 작용 항은 변환 된 변수를 사용하여 위와 같이 모델링 될 수 있습니다.
  2. 중요한 상호 작용이 발생하는 경우 X1 항 중 하나 (즉, 선형, 2 차 또는 3 차 항)에만 영향을주고 그에 따라 상호 작용을 모델링한다고 가정하십시오. 이 접근법이 의미가 있는지조차 확실하지 않습니다.
  3. 위에서 설명한 것처럼 희석 용어와 다른 처리 사이의 가능한 모든 상호 작용 항에 “전체 모델”을 맞추십시오. 그런 다음 중요하지 않은 상호 작용 항을 정리하고 그래프 및 기타 기술을 사용하여 결과를 해석하십시오.

모델 선택이 아닌 가설 검정에 관심이 있다는 점을 고려할 때 이러한 접근 방식 중 가장 적합한 방법은 무엇입니까? 특히, 위의 1 번 경우 하지 않습니다 이해 할 수 있도록, 그 이유는? 나는 읽고 이 문서이 문서를 나를 위해 그들의 뜻을 모른 무슨 소화하려고 노력하지만, 추가 읽기를위한 어떤 소스도 많이 주시면 감사하겠습니다!



답변

이러한 접근 방식 중 어느 것도 제대로 작동하지 않습니다. 접근법 3이 가까워졌지만 중요하지 않은 용어를 제거 할 것이라고 말했습니다. 공선 성으로 인해 제거 할 항을 찾을 수 없기 때문에 문제가되며, 제 1 종 오류를 유지하려는 경우 가설 검정에서 잘못된 자유도를 제공하기 때문에 문제가됩니다.

효과적인 표본 크기와 신호에 따라 문제의 노이즈 비율 : 모든 제품 및 주 효과 항에 모형을 적합시키고 도표와 “청크 테스트”(관련 용어에 대한 다중 df 검정, 즉 전체 상호 작용에 대한 테스트, 비선형 상호 작용에 대한 테스트, 주요 효과 + 상호 작용 등 전체 효과에 대한 테스트 등) R rms패키지를 사용하면 가 다변량 법선 인 표준 일 변량 모델 및 종 방향 모델에 대해이 작업을 쉽게 수행 할 수 있습니다 . 예:

Y
# Fit a model with splines in x1 and x2 and tensor spline interaction surface
# for the two.  Model is additive and linear in x3.
# Note that splines typically fit better than ordinary polynomials
f <- ols(y ~ rcs(x1, 4) * rcs(x2, 4) + x3)
anova(f)   # get all meaningful hypothesis tests that can be inferred
           # from the model formula
bplot(Predict(f, x1, x2))    # show joint effects
plot(Predict(f, x1, x2=3))   # vary x1 and hold x2 constant

당신이 볼 때 anova표를 당신은 표시 줄 볼 수 있습니다 All Interactions전체 모델의 결합 된 영향 테스트 의 모든 상호 작용 조건을. 개별 예측 변수의 경우 예측 변수가 둘 이상의 변수와 상호 작용할 때만 유용합니다. 이 print방법 anova.rms에는 테이블에서 각 행을 표시하여 0에 대해 테스트중인 매개 변수를 정확하게 표시 하는 옵션이 있습니다 . 이 모든 것은 범주 형 예측 변수와 연속 형 예측 변수의 혼합으로 작동합니다.

일반 다항식을 사용하려면 pol대신을 사용하십시오 rcs.

불행히도 혼합 효과 모델을 구현하지 않았습니다.


답변

나는 비모수 적 평활 회귀 분석을 사용하여 종속 변수와 예측 변수 사이의 관계 함수 형태를 평가하는 팬입니다. 비선형 관계를 자주 찾았지만 주요 효과가 비선형 인 경우에도 비선형 상호 작용 상호 작용 항을 찾지 못했습니다. 나의 집으로 가기 : 상호 작용 효과는 그것들이 구성되는 예측 자와 동일한 기능적 형태로 구성 될 필요는 없다.