Adaptation au comparateur et application à un problème d'apprentissage en ligne distribué.

Nom de l'orateur
Hedi Hadiji
Etablissement de l'orateur
University of Amsterdam
Date et heure de l'exposé
Lieu de l'exposé
Salle des séminaires

L’optimisation convexe en ligne (Online Convex Optimization) est le cadre abstrait standard permettant d’étudier les problèmes d’apprentissage où les données sont traitées de façon séquentielle. Je décrirai une version distribuée de cadre. Dans ce problème, des agents formant les noeuds d’un graphe coopèrent pour minimiser leurs pertes cumulées. A chaque tour, l’environnement sélectionne un agent qui devra choisir une action avant d’observer la fonction de perte subie, puis de communiquer avec ses voisins. Je présenterai une classe d’algorithmes dits ‘adaptatif au comparateur’, qui ont reçu beaucoup d’attention ces dernières années, et qui nous seront utiles pour obtenir des garanties satisfaisantes à notre problème. En ajustant ces méthodes à notre cadre distribué (et en particulier aux délais induits par la transmission de l’information), je décrirai un algorithme s’adaptant de façon optimale à la structure du graphe, en un sens que je préciserai.