Le séminaire s'articulera autour de l'exposé de Jean-Michel Poggi intitulé : Forêts aléatoires: importance et sélection de variables.
Pour des raisons d'organisation, l’inscription à cette demi-journée est obligatoire.
Lieu :
Université de Nantes
Campus Lombarderie
UFR Sciences et techniques
Bâtiment 2, Amphi Pasteur
Programme :
14h15 - 15h15 : Jean-Michel Poggi : Forêts aléatoires: importance et sélection de variables.
La méthode des forêts aléatoires, introduite par Leo Breiman en 2001, est désormais largement utilisée tant en classification qu'en régression avec un succès spectaculaire. Après avoir rappelé la source et les principes des méthodes d'arbres, on présente les forêts aléatoires, l'erreur Out-of-Bag et le score d'importance des variables par permutation. On esquisse ensuite une stratégie de sélection de variables en deux étapes : le classement des variables basé sur les scores d'importance suivie d'une procédure d'introduction ascendante séquentielle des variables.
15h15 -16h00 : Discussions
16h00 - 16h30 : Pot de clôture