Ouvrage ...
Bellanger L., Tomassone R. (2014)
Exploration de Données et
Méthodes Statistiques : data analysis & data mining (avec R).
Collection Références Sciences, Editions Ellipses, Paris. 480 pages.
Résumé de l'ouvrage
Les auteurs présentent les méthodes statistiques d’analyse des données ou de data mining
(analyses factorielles, classification, régression et discrimination).
Ils associent à cette présentation le traitement de nombreux corpus de données
à l’aide du logiciel libre
R. Ils insistent sur la démarche scientifique sous-jacente
et sur l’analyse critique indispensable des résultats : un ouvrage scientifique et
un ouvrage de réflexion pour tous ceux qui veulent avoir la maîtrise du traitement
de corpus de données de taille importante.
Mots clés : pré-traitement des données, analyses factorielles, régression, analyse de variance, classification, discrimination, classement, data-mining, logiciel libre
R.
Scripts R
Instructions
Scripts : chapitre 2,
chapitre 3,
chapitre 4,
chapitre 5,
chapitre 6,
chapitre 7,
chapitre 8,
chapitre 9,
chapitre 10,
chapitre 11,
chapitre 12,
chapitre 13.
Données
Liste des fichiers utilisés par chapitre
Répertoire contenant les données : data-Ellipses-LB&RT
Commentaire sur l'ouvrage :
A consommer sans modération. Il ménera loin., 5 février 2016
10 mois que je pratique et il m'est toujours aussi utile. Mélange pédagogique de théorie (de très bon niveau ...) et d'exemples concrets aisément reproductibles avec le logiciel libre et gratuit R.
Cet ensemble permet de passer de la théorie à la mise en œuvre concrète à tout moment et inversement.
Quelques erreurs (à la marge) dans les scripts émoustillent le lecteur qui est obligé de relever les manches pour les corriger, un vrai plaisir car lorsque l'on trouve non seulement on a appris mais on a compris par une pratique un peu inattendue mais redoutablement efficace ... à se demander si les auteurs ne l'ont pas fait exprès !). Autre qualité, il aborde plusieurs bibliothèques de stat sans se cantonner aux trucs à la mode clic/clic comme factom ... ou autres.
Enfin dernier élément que je souhaitais évoquer, la décomposition d'algorithme en étapes très élémentaires. En pratique, cela permet de démystifier les fonctions R de haut niveau et de comprendre vraiment les tenants et aboutissant des outils utilisés.
L'ensemble à un niveau de qualité inégalé. Donc théorie et pratique entremêlée avec une pédagogie extrême. Bon cela demande quand même un peu de travail perso ; mais ce bouquin ne vous lâche jamais. Un bol d'air pur dans la débauche de pavés indigestes et marketing qui actuellement fleurissent sur le sujet.
Rapport qualité/prix exceptionnel.