Thèse de doctorat : “Contributions à la conception, l’étude et la mise en œuvre de méthodes de Monte Carlo par chaîne de Markov appliquées à l’inférence bayésienne”
Publié le 12 juillet 2022Télécom SudParis
L'Ecole doctorale : Mathématiques Hadamard et le Laboratoire de recherche SAMOVAR - Services répartis, Architectures, MOdélisation, Validation, Administration des Réseaux présentent l’AVIS DE SOUTENANCE de M. Aurélien ENFROY, autorisé à présenter ses travaux en vue de l’obtention du Doctorat de l'Institut Polytechnique de Paris, préparé à Télécom SudParis en : Mathématiques.
« Contributions à la conception, l'étude et la mise en oeuvre de méthodes de Monte Carlo par chaîne de Markov appliquées à l'inférence bayésienne »
Le VENDREDI 15 JUILLET 2022 à 14h00
Amphithéâtre 2 (0.C02)
Télécom SudParis - Institut Mines-Télécom
19, place Marguerite Perey 91123 Palaiseau Cedex
Lien visio : https://webconf.imt.fr/frontend/aur-shr-sqo-myp
Membres du jury :
- M. Randal DOUC, Professeur, Télécom SudParis, FRANCE - Directeur de thèse
- M. Florent MALRIEU, Professeur des universités, Université de Tours, FRANCE - Rapporteur
- M. Yves ATCHADE, Professeur, Boston University, ETATS-UNIS - Rapporteur
- M. Tony LELIEVRE, Professeur, Ecole des Ponts ParisTech, FRANCE - Examinateur
- Mme Dasha LOUKIANOVA, Maîtresse de conférences, Université d'Évry Val d'Essonne, FRANCE - Examinatrice
- M. Nicolas CHOPIN, Professeur, ENSAE, FRANCE - Examinateur
Résumé :
Cette thèse s'intéresse à l'analyse et la conception de méthodes de Monte Carlo par chaine de Markov (MCMC) utilisées dans l'échantillonnage en grande dimension. Elle est constituée de trois parties. La première introduit une nouvelle classe de chaînes de Markov et méthodes MCMC.
Celles-ci permettent d'améliorer des méthodes MCMC à l'aide d'échantillons visant une restriction de la loi cible originale sur un domaine choisi par l'utilisateur. Cette procédure donne naissance à une nouvelle chaîne qui tire au mieux parti des propriétés de convergences des deux processus qui lui sont sous-jacents.
En plus de montrer que cette chaîne vise toujours la mesure cible originale, nous établissons également des propriétés d’ergodicité sous des hypothèses faibles sur les noyaux de Markov mis en jeu. La seconde partie de ce document s'intéresse aux discrétisations de la diffusion de Langevin sous-amortie. Cette diffusion ne pouvant être calculée explicitement en général, il est classique de considérer des discrétisations.
Cette thèse établie pour une large classe de discrétisations une condition de minoration uniforme en le pas de temps. Avec des hypothèses supplémentaires sur le potentiel, cela permet de montrer que ces discrétisations convergent géométriquement vers leur unique mesure de probabilité invariante en V-norme.
La dernière partie étudie l'algorithme de Langevin non ajusté dans le cas où le gradient du potentiel est connu à une erreur uniformément bornée près. Cette partie fournie des bornes en V-norme et en distance de Wasserstein entre les itérations de l'algorithme avec le gradient exact et celle avec le gradient approché.
Pour ce faire il est introduit une chaine de Markov auxiliaire qui borne la différence. Il est établi que cette chaîne auxiliaire converge en loi vers un processus dit collant déjà étudié dans la littérature pour la version continue de ce problème.