랜덤 효과 모델에서 정규화 기법을 사용할 수 있습니까? 경우, 기준

정규화 기술에서는 올가미, 능선 회귀, 탄성 그물 등을 말합니다.

입원 환자 체류 기간이 예측되는 인구 통계 학적 및 진단 데이터를 포함하는 건강 관리 데이터에 대한 예측 모델을 고려하십시오. 일부 개인의 경우, 기준 기간 동안 상관 된 다수의 LOS 관찰 (즉, 하나 이상의 IP 에피소드)이 존재한다.

예를 들어 각 개인에 대한 랜덤 효과 절편 항을 포함하는 탄력적 순 예측 모델을 구축하는 것이 합리적입니까?



답변

이 질문에 관한 몇 가지 논문이 있습니다. 나는 특별한 순서로 찾지 않을 것입니다 :

  1. 펜 LME : Howard D Bondell, Arun Krishna 및 Sujit K Ghosh. 선형 혼합 방정식 모델에서 고정 및 랜덤 효과에 대한 결합 변수 선택. 생체 인식, 66 (4) : 1069-1077, 2010.

  2. GLMMLASSO : Jurg Schelldorfer, Peter Buhlmann, Sara van de Geer. L1- 벌칙을 사용한 고차원 선형 혼합 효과 모델에 대한 추정. 스칸디나비아 통계 저널, 38 (2) : 197-214, 2011.

온라인에서 찾을 수 있습니다.

나는 이제 혼합 모델 (LMMEN)에 탄력적 순 벌금을 적용하는 것에 관한 논문을 마무리하고 다음 달에 저널 검토를 위해 보낼 계획입니다.

  1. LMMEN : Sidi, Ritov, Unger. Elastic Net Penalty를 통한 선형 혼합 모델의 정규화 및 분류

전반적으로, 정상이 아니거나 자격 증명 링크가없는 데이터를 모델링하는 경우 GLMMLASSO를 사용합니다 (하지만 많은 RE를 처리 할 수는 없음). 그렇지 않으면 고정 또는 임의 효과에 상관없이 상관 관계가 높은 데이터가없는 경우 Pen.LME를 사용하는 것이 좋습니다. 후자의 경우 우편으로 보내 주시면 코드 / 종이를 기꺼이 보내 드리겠습니다 (곧 가까운 곳에 크랜에 넣겠습니다).

오늘 CRAN에 올렸습니다 . 고정 효과와 무작위 효과에 대한 탄성 그물 유형 페널티와 함께 ​​선형 혼합 모델 문제를 해결합니다.

lmmlassoglmmLasso 패키지에 대한 패키지 cv 함수도 있습니다.


답변

나는 능선 회귀를 단일 범주 형 변수에 한정되지 않고 (상관적인 상관 행렬이없는) 경험적 랜덤 효과 모델로 항상 보았습니다. 능선 페널티를 교차 검증하고 간단한 임의 효과를 피팅 / 추정하는 경우 거의 항상 동일한 예측을 얻을 수 있습니다. 예를 들어, 데모 / 다이어그램 기능과 환자 표시기의 다른 릿지 페널티를 가질 수 있습니다 (팬티 스케일링 계수의 라인을 사용 glmnet). 또는 사람별로 시간 상관 효과가있는 멋진 임의 효과를 포함 할 수 있습니다. 이러한 가능성 중 어느 것도 옳고 그른 것이 아니며 단지 유용합니다.


답변

나는 현재 비슷한 질문에 대해 생각하고 있습니다. 나는 응용 프로그램에서 생각하고 그것이 작동하고 이것을 사용하는 것이 합리적이라고 생각하면 할 수 있다고 생각합니다. 랜덤 효과의 일반적인 설정 (즉, 각 그룹에 대해 측정을 반복했다는 의미) 인 경우 추정 기법에 관한 것이므로 논란의 여지가 적습니다. 실제로 대부분의 그룹에 대해 반복되는 측정이 많지 않은 경우 일반적인 랜덤 효과 모델의 경계선에있을 수 있으며 일반적인 방법으로 제안하려는 경우 방법론 관점에서 유효성을 신중하게 정당화 할 수 있습니다 방법.