Séminaire inter-établissements en Science des Données, 7 septembre 2017

Cette après-midi s'articulera autour de l'exposé de Gilbert Saporta intitulé : Expliquer ou prédire ? Les nouveaux défis.

Pour des raisons d'organisation, l’inscription à cette première 1/2 journée est obligatoire.

Information et Inscription

Lieu
Laboratoire de Mathématiques Jean Leray
UFR Sciences et techniques
Bâtiment 10, Salle des séminaires

Programme
14h00 - 14h15 : Ouverture du séminaire : Présentations des laboratoires nantais

14h15 - 15h15 : Gilbert SAPORTA : Expliquer ou prédire ? Les nouveaux défis
Le développement de la Data Science suscite fréquemment des controverses entre statistique et machine learning et conduit à repenser le débat entre expliquer et prédire initié par Leo BREIMAN en 2001. BREIMAN distinguait deux cultures dans la modélisation statistique : celle dominante jusqu’alors des modèles génératifs qui suppose que les données ont été engendrées par un modèle probabiliste qu’il faut ajuster et estimer, et la culture des modèles algorithmiques ou prédictifs qui ne se préoccupe que d’obtenir des prévisions précises et fiables et que les statisticiens avaient eu tort de négliger. Comme l’écrit David DONOHO qui a récemment repris ce thème, l’hypothèse implicite dans la première culture est qu’il existe un modèle «vrai», ce qu’a contesté George BOX avec sa phrase célèbre «Essentially, all models are wrong, but some are useful». Dans l’intervalle, le débat a fait l’objet de plusieurs publications : cf. Gilbert SAPORTA qui relevait l’ambigüité du terme de modèle utilisé aussi bien comme une représentation de la réalité que comme un algorithme et Galit SHUMUELI qui analysait la dualité explicatif/prédictif.

15h15 -16h00 : Discussions

16h00 - 16h30 : Pot de clôture