Thèses en cours et soutenues dans l'unité
2027
Cohen Jean : Modélisation de la niche écologique des pollinisateurs et des causes de leur variabilité spatio-temporelle à partir de données issues des sciences participatives et des méthodes d’intelligence artificielle générative (Thèse) - -
Le programme Spipoll (Suivi photographique des insectes pollinisateurs), porté par le Muséum
d’Histoire naturelle et L’Office pour les insectes et leur environnement (OPIE) permet la collecte
d’interactions plantes-pollinisateurs à travers le territoire de France hexagonale par des participants
volontaires, et cela depuis 2010. Depuis cette date, plus de 80 000 collections d’insectes floricoles
ont été réalisées en suivant un protocole standardisé. Cette base de données sans égal permet
d’envisager de mettre à jours les déterminants des variations spatio-temporelles des communautés
de pollinisateurs.
L’analyse d’une telle base de données nécessite cependant de prendre en compte divers biais
inhérents aux programmes de suivi de biodiversité participatifs. L’un de ces biais provient de la
multiplicité des observateurs ayant d’une part des comportements propres et d’autre part faisant
preuve d’apprentissage au cours de leur participation. La prise en compte de ces biais dans
l’analyse des données collectées est nécessaire pour mettre en lumière les déterminants
écologiques des variations spatio-temporelles des communautés de pollinisateurs. A cette fin, le
développement de méthodes d’apprentissage statistique apparaît comme pertinent. Des travaux en
cours montrent en effet que si les observateurs gagnent en compétences au cours de leurs
participations, ce biais peut être pris en compte par des modèles statistiques basés sur le principe
de « fairness ». Il s’agira d’étendre ces développements méthodologiques pour prendre en compte
d’autres biais possibles tels que le type de matériel photographique.
Une fois ces biais pris en compte, il s’agira de relier les variations spatio-temporelles des
communautés de pollinisateurs aux facteurs influençant leur présence, notamment la composition et
la configuration du paysage, ainsi que les conditions météorologiques. A ces facteurs seront ajoutés
des pressions telles que l’utilisation de produits phytopharmaceutiques et des actions de
conservation telles que la présence de réserves ou d’agriculture biologique. Les analyses
développées viseront à dépasser les simples corrélations pour se rapprocher de relations de
causalité en utilisant et développant des méthodes d’attribution. Elles conduiront à des prédictions
sur la présence ou non de certains taxons et/ou à des cartes de répartition de certaines espèces,
avec une éventuelle prise en compte d’une évolution temporelle
Directeur.trice : Romain Julliard - Encadrant(s) : Colin Fontaine, Pierre Barbillon - Equipe(s) : SOLsTIS
FRANCHETERRE Blanche : Interpretable Methods in Unsupervised and Supervised Learning for Multisource ana- lysis of Exposome Data and Prediction of cancer outcomes (Thèse) - EDMH -
Blanche’s thesis deals with variable selection and dimension reduction methods for pan cancer data with multiple outcomes and observed through multiple omics, including exposome data. It is supported by the H2020 project DISCERN and co-supervised with Marc Chadeau-Hyam at Imperial College.
Directeur.trice : Julien Chiquet - Encadrant(s) : Marc Chadeau-Hyam - Equipe(s) : SOLsTIS
LACOSTE Louis : Comparaison de structures de réseaux. Applications à des réseaux écologiques (Thèse) - EDMH -
Les réseaux sont un objet d’intérêt en écologie pour représenter les interactions entre espèces (pollinisation, prédation, co-occurrence,...). Comparer les réseaux est une façon de comparer les fonctionnement des écosystèmes qu'ils représentent. Jusqu'à ce jour, leur comparaison s’est faite principalement au travers de métriques qui ont le défaut d’être axées sur des caractéristiques particulières des réseaux et qui ne permettent pas d’identifier les nœuds jouant les mêmes rôles dans les différents réseaux.
L’utilisation de modèles probabilistes à variables latentes a fait ses preuves pour la comparaison de réseaux simples. L’extension à des réseaux bipartites s’intéressant à des interactions entre groupes d’entités distinctes (plantes – pollinisateurs par exemple) demandent des développements techniques additionnels qui pourront être valorisés par des applications ambitieuses en écologie.
L’utilisation de techniques modernes d’apprentissage profond impliquant des projections dans des espaces de représentations de dimension réduite telles que les auto-encodeurs variationnels constitue une piste novatrice pour la comparaison de réseaux. Elles permettront de plus de passer à l’échelle sur des réseaux de plus grande taille tels que ceux que l’on rencontre en écologie microbienne. La prise en compte de l’incertitude dans la construction des réseaux sur leur comparaison sera également explorée dans un dernier axe de la thèse. Cet axe sera exploré dans un cadre d’écologie microbienne.
Directeur.trice : Pierre Barbillon, Sophie Donnet - Encadrant(s) : Julie Aubert - Equipe(s) : SOLsTIS
Soleimani Negar : Sélection de modèle en quantification d’incertitude (Thèse) - EDMH -
Face aux exigences concurrentielles et économiques actuelles dans le secteur industriel, les outils de simulation numérique sont de plus en plus largement appliqués aux problèmes de conception des systèmes réels complexes et à l’évaluation des risques afférents. Ces simulations numériques fournissent alors des données synthétiques pouvant pallier un manque de données expérimentales trop coûteuses, voire impossibles à acquérir dans certaines conditions. Il reste toutefois nécessaire de valider les simulations numériques en les confrontant aux données expérimentales disponibles (Bayarri et al, 2007). Cette étape s’appelle la validation et rend alors envisageable de substituer des simulations numériques à des expériences réelles afin de tester certaines hypothèses. Pour ce faire, les données expérimentales disponibles sont liées au simulateur dans un modèle statistique rendant compte des différentes sources d’incertitude existante : incertitude sur les paramètres du modèle à caler, bruit d’observation et éventuellement un terme dit de discrépance modélisant l’erreur du simulateur. Des travaux ont proposé dans un cadre simplifié (Damblin et al, 2016 ; Kamary et al, 2019) d’utiliser une procédure de choix de modèle bayésien afin de décider si oui ou non le terme de discrépance était significatif dans le modèle réduisant ainsi.
la validation du modèle numérique à une décision statistique sur la nécessité ou non d’adjoindre un terme correctif au modèle. Un des objectifs principaux de cette thèse est de conduire cette analyse dans un cadre général qui demandera de faire appel à un métamodèle qui a pour but de fournir une approximation rapide en temps de calcul du simulateur bien souvent très coûteux en temps de calcul, car modélisant des phénomènes complexes. L’ajout de tels métamodèles sont alors responsables d’une source d’incertitude supplémentaire qui sera prise en compte dans les méthodes développées.
Un second objectif sera d’être capable d’identifier des domaines de validité du modèle. En effet, le simulateur peut fournir une modélisation correcte de la réalité dans certains régimes ou conditions, mais s’avérer défaillant ailleurs. Il peut alors être important pour le modélisateur l’ayant développé d’obtenir des zones de validité du modèle. Cette recherche pourra s’appuyer également sur des méthodes bayésiennes de sélection de modèles. Afin d’affiner les résultats, des stratégies séquentielles d’appel au simulateur (type actif learning) seront envisagées. Finalement, les méthodes développées dans cette thèse seront appliquées à des simulateurs et des données réelles issus d’études de cas en hydrologie et en agronomie.
Directeur.trice : Pierre Barbillon - Encadrant(s) : Kaniav Kamary - Equipe(s) : SOLsTIS
VICTOR François : Développement de méthodes d’apprentissage statistique et d’apprentissage par transfert pour la caractérisation du potentiel agro-écologique et le screening des ressources génétiques (Thèse) - EDMH -
François’ thesis focuses on the development of hybrid statistical and deep learning models for domain transfer in plant genetics. It is financed by the CoBreeding project of the PEPR Agroécologie-Numérique and co-supervised with Tristan Mary-Huard, Jean-Benoist Léger adn Alain Charcosset.
Directeur.trice : Julien Chiquet, Tristan Mary-Huard - Encadrant(s) : Jean-Benoist Léger, Alain Charcosset - Equipe(s) : SOLsTIS
2026
ALLYNDREE Joseph : Développement de méthodes de caractérisation du comportement et des interactions sociales des bovins pour l'évaluation de la santé et du bien-être dans le cadre de la transition agro-écologique (Thèse) - VAAME -
Directeur.trice : - Encadrant(s) : Antoine Cornuéjols, Christine Martin - Equipe(s) : EkINocs
BRICOUT Barbara : Imputation models for biodiversity and ecological science (Thèse) - Sorbonne Univeristé -
Directeur.trice : - Encadrant(s) : Sophie Donnet, Stéphane Robin - Equipe(s) : SOLsTIS
COGNOT Caroline : Modélisation stochastique multisites de séries temporelles de variables météorologiques (Thèse) - EDMH -
Directeur.trice : Liliane Bel - Encadrant(s) : Sylvie Parey - Equipe(s) : SOLsTIS
HERSERANT Tanguy : Métriques pour le résumé automatique (Thèse) - STIC -
Directeur.trice : - Encadrant(s) : Vincent Guigue - Equipe(s) : EkINocs
RENAULT Aurélien : Prise de décision précoce en environnement non stationnaire (Thèse) - STIC -
Directeur.trice : - Encadrant(s) : Antoine Cornuejols - Equipe(s) : EkINocs