다중 대치 후 교정 플롯 / 통계 풀링에 대한 조언을 원합니다. 미래 사건을 예측하기 위해 통계 모델을 개발하는 설정에서 (예를 들어, 병원 기록의 데이터를 사용하여 퇴원 후 생존 또는 사건을 예측하는 경우), 누락 된 정보가 많이 있다고 상상할 수 있습니다. 다중 대치는 이러한 상황을 처리하는 방법이지만 고유 한 대치 불확실성으로 인한 추가 변동성을 고려하여 각 대치 데이터 세트에서 테스트 통계를 풀링해야합니다.
풀링에 대한 ‘일반적인’Rubin의 규칙이 적용될 수있는 여러 가지 교정 통계 (hosmer-lemeshow, Harrell ‘s Emax, 추정 교정 지수 등)가 있음을 이해합니다.
그러나 이러한 통계는 종종 모델의 특정 미스 교정 영역을 나타내지 않는 전체 교정 측정치입니다. 이런 이유로 보정 플롯을보고 싶습니다. 안타깝게도 나는 음모 또는 그 뒤에있는 데이터를 ‘풀링’하는 방법 (개인마다 예측 된 확률과 개별 결과를 관찰하는 방법)에 대해 우연이 없으며 생물 의학 문헌 (내가 익숙한 분야)에서 많이 찾을 수 없습니다. 또는 여기 CrossValidated에서. 물론 각 대치 데이터 세트의 캘리브레이션 플롯을 보는 것이 답이 될 수 있지만 많은 대치 세트가 만들어 질 때 상당히 귀찮게 될 수 있습니다.
따라서 여러 대치 후 풀링 된 교정 플롯을 만드는 기술이 있는지 묻고 싶습니다 (?)
답변
[…] n이 1,000이고 5 개의 MI 데이터 세트가있는 경우 5000에서 단일 캘리브레이션 플롯을 생성하고 5,000에서 원하는 방식으로 관찰 / 예상을 비교해보십시오.
참고 문헌에 관하여 :
우리는 최근에 우리가 부트 스트랩 표준 오류와 이러한 방식으로 함께 풀링하여 다중 대치에 대한 추론을 얻었음을 증명하지 않고 진술 한 논문을 발표했습니다. 분석의 목적은 기대 / 관찰 비율 또는 차이가 정규 분포 범위 내에 있고 Quantile 추정값이 표본 크기에 대해 변하지 않는다는 것을 0.05 수준에서 테스트하고 있다고 95 % CI를 기반으로 테스트 풀링의 영향을받지 않습니다.