Reconstruction automatique de formulaires d’enquête médicale sur la culture de sécurité des patients par une méthode de factorisation matricielle bayésienne
Résumé
Certaines enquêtes de santé publique souffrent d’un problème d’acceptabilité auprès des personnes interrogées, en particulier à cause de la longueur des questionnaires. Pour aborder ce problème, nous proposons de réduire délibérément les questionnaires en les individualisant de manière randomisée. Afin de compléter automatiquement les questionnaires incomplets générés par cette procédure, nous considérons un modèle de factorisation matricielle bayésienne. Pour estimer les paramètres de ce modèle, nous proposons un algorithme combinant un échantillonneur de Gibbs et une approche variationnelle. En utilisant les résultats d’une enquête portant sur la culture de sécurité des patients réalisée au centre hospitalier universitaire de Grenoble auprès de 3888 travailleurs médicaux, nous comparons les performances de notre méthode à plusieurs approches classiques en santé publique, à la méthode des forêts aléatoires, ainsi qu’à trois autres méthodes de factorisation matricielle. L’erreur de reconstruction de notre algorithme est inférieure à celle des autres algorithmes lorsque la proportion d’items supprimés est supérieure à 40%. Lorsque la proportion d’items supprimés est moins élevée, les histogrammes des lois marginales sont reconstruits de manière satisfaisante. Pour ce second critère, la méthode des forêts aléatoires est la plus performante. En général, nos résultats suggèrent que des enquêtes médicales similaires à celle réalisée pour cet article pourraient réduire substantiellement le nombre de questions posées à chaque travailleur avec une perte d’information limitée pour l’interprétation des résultats.