De nombreux jeux de données peuvent être modélisés comme des réalisations aléatoires de mesures de probabilité, par exemple sous forme d’histogrammes ou de nuages de points. Dans ce contexte, les distances de Wasserstein issues du transport optimal offrent un cadre particulièrement naturel pour comparer et analyser des distributions de probabilité. Dans cet exposé, nous proposons une synthèse de travaux récents à l’interface entre statistiques, transport optimal et science des données. Nous illustrerons ces idées à travers plusieurs applications. Nous mettrons notamment en évidence l’intérêt des notions de barycentre de Wasserstein et d’analyse en composantes principales géodésiques dans l’espace de Wasserstein pour apprendre les principaux modes de variation géométrique d’un ensemble de distributions. Nous discuterons également de travaux récents en statistique consacrés à la définition de quantiles multivariés pour des vecteurs aléatoires, qui généralisent la notion classique de quantile pour des mesures de probabilité à support sur la droite réelle. Enfin, nous évoquerons des liens récents entre transport optimal et apprentissage statistique, notamment via l’étude de flots de gradient dans l’espace de Wasserstein, qui fournissent un cadre analytique pour comprendre certaines dynamiques d’apprentissage et les performances de réseaux de neurones à deux couches.
Colloquium
Responsables : Joackim Bernier Marco Golla
Le colloquium a lieu environ une fois par mois, généralement le jeudi à 17h, mais parfois aussi le vendredi à 17h en salle de séminaires. Pour toute information supplémentaire veuillez contacter son responsable.
- Cliquez ici pour retrouver l'ensemble des colloquiums achevés (archives).
- Vous trouverez ci-dessous les colloquiums à venir.