Transport optimal en science des données

Title - HTML

Transport optimal en science des données

Nom de l'orateur
Jérémie Bigot
Etablissement de l'orateur
Institut de Mathématiques de Bordeaux
Date et heure de l'exposé
31-03-2026 - 16:00:00
Lieu de l'exposé
salle 3
Résumé de l'exposé

De nombreux jeux de données peuvent être modélisés comme des réalisations aléatoires de mesures de probabilité, par exemple sous forme d’histogrammes ou de nuages de points. Dans ce contexte, les distances de Wasserstein issues du transport optimal offrent un cadre particulièrement naturel pour comparer et analyser des distributions de probabilité. Dans cet exposé, nous proposons une synthèse de travaux récents à l’interface entre statistiques, transport optimal et science des données. Nous illustrerons ces idées à travers plusieurs applications. Nous mettrons notamment en évidence l’intérêt des notions de barycentre de Wasserstein et d’analyse en composantes principales géodésiques dans l’espace de Wasserstein pour apprendre les principaux modes de variation géométrique d’un ensemble de distributions. Nous discuterons également de travaux récents en statistique consacrés à la définition de quantiles multivariés pour des vecteurs aléatoires, qui généralisent la notion classique de quantile pour des mesures de probabilité à support sur la droite réelle. Enfin, nous évoquerons des liens récents entre transport optimal et apprentissage statistique, notamment via l’étude de flots de gradient dans l’espace de Wasserstein, qui fournissent un cadre analytique pour comprendre certaines dynamiques d’apprentissage et les performances de réseaux de neurones à deux couches.

comments