태그 보관물: negative-binomial

negative-binomial

음 이항 GLM의 “정수가 아닌”경고를 처리하는 방법은 무엇입니까? dpois(y, mu, log

부정적인 이항 모델을 사용하여 R의 숙주에 영향을 미치는 기생충의 평균 강도를 모델링하려고합니다. 다음과 같은 경고가 계속 50 개 이상 나타납니다.

In dpois(y, mu, log = TRUE) : non-integer x = 251.529000

이 문제를 어떻게 처리 할 수 ​​있습니까? 내 코드는 다음과 같습니다

mst.nb = glm.nb(Larvae+Nymphs+Adults~B.type+Month+Season, data=MI.df)



답변

음 이항은 카운트 데이터의 분포이므로 반응 변수가 카운트 (음수가 아닌 정수)가 되기를 원합니다 . 즉, “다른 샘플링 노력”을 설명하는 것이 적절합니다 (나는 당신이 무엇을 말하는지 정확히 알지 못하지만 그 요지를 얻습니다). 그러나 카운트를 다른 숫자로 나누어서 시도하지 마십시오. 대신, 다른 숫자를 오프셋 으로 사용해야합니다 . CV에 오프셋이 무엇인지에 대한 멋진 토론이 있습니다 : 포아송 회귀에서 오프셋을 언제 사용해야합니까? 내 생각에 당신의 모델은 다음과 같아야합니다.

mst.nb = glm.nb(Larvae+Nymphs+Adults~B.type+Month+Season + offset(log(num.hosts)), 
                data=MI.df)


답변

치명적인 오류가 아니라 경고입니다. glm.nb ()는 정수인 결과 변수로 계산합니다. 귀하의 데이터는 정수가 아닙니다 : 251.529.

R은 “흠 … 당신은 이것을보고 그것을 확인하고 싶을 수도 있습니다. 그것이 옳지 않은 것처럼 보일 수도 있기 때문입니다.” 내 기억이 정확하다면 SPSS는 그런 경고를하지 않습니다.

정수가 없어도 올바른 모델을 사용하고 있다고 확신하면 무시하고 계속 진행하십시오.


답변

나는 생태학적인 기생충 학자입니다. 이것을 처리하는 방법은 기생 한 숙주와 그렇지 않은 숙주를 묶고 이항 분포를 사용하는 것입니다. 아래 코드를 참조하십시오.

나는 또한 하나 이상의 y 변수를 가진 glm을 사용한 적이 없다. 그래서 기생충 유충을보고 싶다고하자. 건강에 좋은 유충 수와 # 기생충이있을 것이다.

말할 수 있습니다 : Lh and Lp

예를 들어

parasitizedL = cbind (Lp, Lh) hist (parasitized) # glm과 함께 정규 이항 분포를 사용할 수 있다고 생각합니다. 네가티브 이항 분포가 필요하지 않을 수도 있습니다. PLarvae1 = glm (parasitizedL ~ B.type + Month + Season, 가족 = 이항, 데이터 = MI.df)

다음 단계적 모델 축소를 수행하여 어떤 요소가 기생충에 크게 영향을 미치는지 확인하십시오. 아래 링크 참조

http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html

그러나 반복적 인 샘플링을 설명하기 위해 임의의 효과가 필요한 것 같습니다. 따라서 임의의 효과는 (1 | Season / Month) 일 것입니다.


답변