Ouvrage ...

Bellanger L., Tomassone R. (2014)
Exploration de Données et Méthodes Statistiques : data analysis & data mining (avec R).
Collection Références Sciences, Editions Ellipses
, Paris. 480 pages.

Résumé de l'ouvrage

Les auteurs présentent les méthodes statistiques d’analyse des données ou de data mining (analyses factorielles, classification, régression et discrimination). Ils associent à cette présentation le traitement de nombreux corpus de données à l’aide du logiciel libre R. Ils insistent sur la démarche scientifique sous-jacente et sur l’analyse critique indispensable des résultats : un ouvrage scientifique et un ouvrage de réflexion pour tous ceux qui veulent avoir la maîtrise du traitement de corpus de données de taille importante.
Mots clés : pré-traitement des données, analyses factorielles, régression, analyse de variance, classification, discrimination, classement, data-mining, logiciel libre R.

Scripts R

Instructions

Scripts : chapitre 2, chapitre 3, chapitre 4, chapitre 5, chapitre 6, chapitre 7, chapitre 8, chapitre 9, chapitre 10, chapitre 11, chapitre 12, chapitre 13.

Données

Liste des fichiers utilisés par chapitre

Répertoire contenant les données : data-Ellipses-LB&RT

Erratum


Commentaire sur l'ouvrage : A consommer sans modération. Il ménera loin., 5 février 2016
10 mois que je pratique et il m'est toujours aussi utile. Mélange pédagogique de théorie (de très bon niveau ...) et d'exemples concrets aisément reproductibles avec le logiciel libre et gratuit R.
Cet ensemble permet de passer de la théorie à la mise en œuvre concrète à tout moment et inversement. Quelques erreurs (à la marge) dans les scripts émoustillent le lecteur qui est obligé de relever les manches pour les corriger, un vrai plaisir car lorsque l'on trouve non seulement on a appris mais on a compris par une pratique un peu inattendue mais redoutablement efficace ... à se demander si les auteurs ne l'ont pas fait exprès !). Autre qualité, il aborde plusieurs bibliothèques de stat sans se cantonner aux trucs à la mode clic/clic comme factom ... ou autres. Enfin dernier élément que je souhaitais évoquer, la décomposition d'algorithme en étapes très élémentaires. En pratique, cela permet de démystifier les fonctions R de haut niveau et de comprendre vraiment les tenants et aboutissant des outils utilisés.
L'ensemble à un niveau de qualité inégalé. Donc théorie et pratique entremêlée avec une pédagogie extrême. Bon cela demande quand même un peu de travail perso ; mais ce bouquin ne vous lâche jamais. Un bol d'air pur dans la débauche de pavés indigestes et marketing qui actuellement fleurissent sur le sujet. Rapport qualité/prix exceptionnel.