La détection et la localisation des modes d'une densité de probabilité (i.e., les points où la densité atteint un maximum local) constituent un problème classique de statistique non paramétrique. L’estimation du mode global, lorsqu’il est unique, en particulier pour les densités unimodales, a longtemps concentré l’attention, conduisant à la fois à la conception d’algorithmes efficaces et à une caractérisation précise des vitesses minimax sous différentes hypothèses sur la densité sous-jacente. Le problème plus général de l’estimation de l’ensemble des modes est plus difficile. Plusieurs approches ont été proposées, notamment les méthodes de type mean-shift, qui donnent des résultats satisfaisants en pratique, mais dont les performances restent peu comprises théoriquement. Dans cette présentation, nous proposerons une alternative fondée sur un outil central de l’analyse topologique des données (TDA) : l’homologie persistante et sa représentation pratique via les diagrammes de persistance. Nous présenterons plusieurs résultats sur la consistance de cette approche, pour de larges classes de densités pouvant admettre des discontinuités (y compris en les modes) ainsi que son optimalité au sens minimax. Au-delà de l’estimation des modes, nous discuterons également du problème de l’estimation des diagrammes de persistance pour de telles densités.
Title : Estimation of Multiple Modes and Persistent Homology.
Abstract : Detecting and localizing the modes of a probability density (i.e., the points where the density attains a local maximum) is a classical problem in nonparametric statistics. Estimating the global mode, when it is unique, particularly for unimodal densities, has long attracted attention, leading both to the design of efficient algorithms and to a precise characterization of minimax rates under various assumptions on the underlying density. The more general problem of estimating the set of all modes is considerably more challenging. Several approaches have been proposed, notably mean-shift methods, which perform well in practice but whose theoretical properties remain poorly understood. In this talk, we will propose an alternative approach based on a central tool from topological data analysis (TDA): persistent homology and its practical representation through persistence diagrams. We will present several results on the consistency of this method for broad classes of densities, including those that may have discontinuities (even at the modes), as well as its minimax optimality. Beyond mode estimation, we will also discuss the problem of estimating persistence diagrams for such densities.
comments