Séminaire Science des Données, 13 décembre 2018

Le séminaire s'articulera autour de l'exposé de Jean-Michel Poggi intitulé : Forêts aléatoires: importance et sélection de variables.

Pour des raisons d'organisation, l’inscription à cette demi-journée est obligatoire.

Information et inscription

Lieu :
Université de Nantes
Campus Lombarderie
UFR Sciences et techniques
Bâtiment 2, Amphi Pasteur

Programme :

14h15 - 15h15 : Jean-Michel Poggi : Forêts aléatoires: importance et sélection de variables.
La méthode des forêts aléatoires, introduite par Leo Breiman en 2001, est désormais largement utilisée tant en classification qu'en régression avec un succès spectaculaire. Après avoir rappelé la source et les principes des méthodes d'arbres, on présente les forêts aléatoires, l'erreur Out-of-Bag et le score d'importance des variables par permutation. On esquisse ensuite une stratégie de sélection de variables en deux étapes : le classement des variables basé sur les scores d'importance suivie d'une procédure d'introduction ascendante séquentielle des variables.

15h15 -16h00 : Discussions

16h00 - 16h30 : Pot de clôture