Imputation multiple

 

L’imputation multiple (IM) est une approche devenue populaire pour traiter le problème biostatistique général des données manquantes. De nombreux ensembles de données ont cependant une structure à plusieurs niveaux ou au moins en clusters. Les méthodes d’imputation qui ignorent ce regroupement conduisent à une sous-estimation des erreurs standards, même si l’analyse ne permet pas de structure en cluster.

Il existe donc un besoin pour des méthodes d’imputation qui permettent de telles structures. Nous proposons de nouveaux algorithmes d’imputation multiniveaux pouvant gérer les données en cluster soit pour les données continues ou catégoriques.

Nous avons développé une méthode pour les covariables manquantes systématiquement (15). Nous avons ensuite étudié le traitement des données manquantes dans le cadre de modèles d’inférence causale et en présence de risques concurrents (compétitifs).