Séminaire
Nom intervenant
Marie Chion
Résumé
Dans ce séminaire, nous aborderons le problème des valeurs manquantes dans les données issues de protéomique quantitative par spectrométrie de masse. Une façon de remédier à ce problème est d’imputer les valeurs manquantes, à savoir les remplacer par une valeur définie par l’utilisateur ou un algorithme. Ainsi, l’imputation multiple permet d’itérer plusieurs fois le processus d’imputation pour obtenir plusieurs jeux de données complets. Ceux-ci sont ensuite combinés avant d’appliquer les outils statistiques classiques. Toutefois, les logiciels usuels pour l’analyse statistique des données de protéomique utilisent le jeu de données complet moyen et ignorent l’incertitude induite par le processus aléatoire d’imputation.
Nous présentons donc une méthode rigoureuse d’imputation multiple à l’aide des règles de Rubin, ainsi qu’une variante du test t-modéré prenant en compte la variabilité issue à la fois du jeu de données initial et du processus d’imputation multiple. Le test t-modéré reposant sur un modèle hiérarchique bayésien, nous proposons également un cadre entièrement bayésien pour l’analyse protéomique différentielle et discuterons de la place de l’imputation multiple dans un tel cadre.
Nous présentons donc une méthode rigoureuse d’imputation multiple à l’aide des règles de Rubin, ainsi qu’une variante du test t-modéré prenant en compte la variabilité issue à la fois du jeu de données initial et du processus d’imputation multiple. Le test t-modéré reposant sur un modèle hiérarchique bayésien, nous proposons également un cadre entièrement bayésien pour l’analyse protéomique différentielle et discuterons de la place de l’imputation multiple dans un tel cadre.
Lieu
Amphi C2.0.037
Date du jour
Date de fin du Workshop