Laboratoire d’accueil : Equipe Géostatistique, Centre de Géosciences, Mines Paris PSL, Fontainebleau
et MIA Paris Saclay
Encadrants : Lucia Clarotto (AgroParisTech), Mike Pereira et Thomas Romary (Mines Paris)
Durée : 3 mois (à partir de Mai 2024)
Compétences recherchées : Statistiques, statistiques spatiales, deep learning, programmation
informatique (Python et/ou Julia)
Gratification : Selon les conditions actuelles de rémunération légale des stagiaires (environ 600
euros/mois)
Contexte
En géostatistique, les processus gaussiens sont couramment utilisés pour modéliser les données spatiales et spatio-temporelles, car ils permettent de prédire simplement la variable d’intérêt en des sites non mesurés tout en quantifiant l’incertitude de prédiction. Dans ce cadre, les données sont considérées étant issues d’une réalisation particulière d’un champ aléatoire gaussien dont la fonction de covariance doit être estimée à partir des données. Une approche classique pour l’estimation des paramètres consiste à choisir une famille paramétrée de fonctions de covariance, puis à choisir les paramètres qui maximisent la vraisemblance associée aux données. Dans la pratique, cette approche représente souvent un goulot d’étranglement, car la seule évaluation de la fonction de vraisemblance peut rapidement devenir coûteuse d’un point de vue informatique quand la quantité de données devient importante, notamment en spatio-temporel. Il est donc souhaitable de disposer de méthodes permettant de déduire les paramètres d’un modèle de covariance sans passer par la fonction de vraisemblance.
Récemment, plusieurs méthodes utilisant des réseaux de neurones (notamment CNN et GNN) ont été proposées pour répondre à ce problème. Deux principales approches peuvent être mentionnées.
La première vise à former un réseau neuronal capable d’identifier les paramètres d’une fonction de covariance, à partir d’une réalisation d’un champ aléatoire gaussien avec cette covariance [2, 3, 6, 4].
La seconde vise plutôt à obtenir une approximation de la vraisemblance en fonction des paramètres et des observations, ce qui permet d’obtenir un proxy facile à calculer [5]. La surface de vraisemblance neuronale peut alors être maximisée pour un ensemble fixe d’observations afin d’obtenir un estimateur des paramètres du modèle associé à ces observations.
Objectifs
Ce stage vise à développer et valider des architectures adaptées au contexte spatio-temporel. Un enjeu de cette généralisation est l’estimation d’un plus grand nombre de paramètres, qui n’a jamais été mise en œuvre pour l’instant. Une première étape consistera à identifier et comparer les différentes stratégies mises en avant dans la littérature, dans un premier temps sur des jeux de données simulées.
Dans un second temps, on cherchera à adapter une ou plusieurs de ces approches au cas spatio-temporel, notamment dans les modèles issus des équations aux dérivées partielles stochastiques [1]. L’approche retenue sera validée sur un jeu de données réelles de mesures du rayonnement solaire.
Comment postuler ?
Pour postuler ou si vous avez des questions, veuillez contacter Lucia Clarotto (lucia.clarotto@agroparistech.fr),
Mike Pereira (mike.pereira@minesparis.psl.eu) et Thomas Romary (thomas.romary@minesparis.psl.eu).
Merci de nous envoyer un CV ainsi qu’une lettre de motivation.
Références
[1] Lucia Clarotto, Denis Allard, Thomas Romary, and Nicolas Desassis. The spde approach for spatio-temporal datasets with advection and diffusion. arXiv preprint arXiv:2208.14015, 2022.
[2] Florian Gerber and Douglas Nychka. Fast covariance parameter estimation of spatial gaussian process models using neural networks. Stat, 10(1):e382, 2021.
[3] Amanda Lenzi, Julie Bessac, Johann Rudi, and Michael L Stein. Neural networks for parameter estimation in intractable models. Computational Statistics & Data Analysis, 185:107762, 2023.
[4] Matthew Sainsbury-Dale, Jordan Richards, Andrew Zammit-Mangion, and Rapha¨el Huser. Neural bayes estimators for irregular spatial data using graph neural networks. arXiv preprint arXiv:2310.02600, 2023.
[5] Julia Walchessen, Amanda Lenzi, and Mikael Kuusela. Neural likelihood surfaces for spatial processes with computationally intensive or intractable likelihoods. arXiv preprint arXiv:2305.04634, 2023.
[6] Christopher K Wikle and Andrew Zammit-Mangion. Statistical deep learning for spatial and spatio-temporal data. arXiv preprint arXiv:2206.02218, 2022.