Accueil Publimath  Aide à la recherche   Recherche Avancée   Aidez-nous à améliorer cette fiche 
Certification IDDN Valid HTML 4.01 Transitional
Auteur(s) : Lemberger Pirmin ; Morel Médéric ; Batty Marc ; Raffaëlli Jean-Luc ; Géron Aurélien. Préf.

Titre : Big Data et machine Learning.

Editeur : Dunod Paris, 2016 Collection : InfoPro - Management des systèmes d'information 2e éd.
Format : 17,5 cm x 25 cm, 272 p. ISBN : 2-10-075463-7 EAN : 9782100754632

Type : ouvrage (au sens classique de l'édition) Langue : Français Support : papier

Résumé :

Le Big Data s'est imposé comme une innovation majeure pour toutes les entreprises qui cherchent à construire un avantage concurrentiel grâce à l'exploitation de leurs données clients, fournisseurs, produits, processus, machines, etc.
Ce livre est un guide pour comprendre les enjeux d'un projet Big Data, en appréhender les concepts sous-jacents (en particulier le machine learning) et acquérir les compétences nécessaires à la mise en place d'un data lab.
Il combine la présentation de notions théoriques (traitement statistique des données, calcul distribué...), d'outils (écosystème Hadoop, Storm...) et d'exemples de machine Learning.
Cette deuxième édition comporte des ajouts sur le deep learning et les réseaux de neurones, ainsi que des compléments et des mises à jour sur les moteurs de recommandations et Spark. Les compléments en ligne seront enrichis de nouveaux jeux de données pour un début de mise en pratique.


sommaire :

Première partie - Les fondements du Big Data
Chapitre 1 - Les origines du Big Data : 1.1 La perception de la donnée dans le grand public ; 1.2 Des causes économiques et technologiques ; 1.3 La donnée et l'information ; 1.4 La valeur ; 1.5 Les ressources nécessaires ; 1.6 De grandes opportunités
Chapitre 2 - Le Big Data dans les organisations : 2.1 La recherche de l'Eldorado ; 2.2 L'avancée par le cloud ; 2.3 La création de la valeur ; 2.4 Les « 3V » du Big Data ; 2.5 Un champ immense d'applications ; 2.6 Exemples de compétences à acquérir ; 2.7 Des impacts à tous les niveaux ; 2.8 « B » comme Big Data ou Big Brother ?
Chapitre 3 - Le mouvement NoSQL : 3.1 Bases relationnelles, les raisons d'une domination ; 3.2 Le dogme remis en question ; 3.3 Les différentes catégories de solutions ; 3.4 Le NoSQL est-il l'avenir des bases de données ?
Chapitre 4 - L'algorithme MapReduce et le framework Hadoop : 4.1 Automatiser le calcul parallèle ; 4.2 Le pattern MapReduce ; 4.3 Des exemples d'usage de MapReduce ; 4.4 Le framework Hadoop ; 4.5 Au-delà de MapReduce

Deuxième partie - Le métier de data scientist
Chapitre 5 - Le quotidien du data scientist : 5.1 Data scientist : licorne ou réalité ? ; 5.2 Le data scientist dans l'organisation ; 5.3 Le workflow du data scientist
Chapitre 6 - Exploitation et préparation de données : 6.1 Le déluge des données ; 6.2 L'exploitation de données ; 6.3 La préparation de données ; 6.4 Les outils de préparation de données
Chapitre 7 - Le Machine Learning : 7.1 Qu'est-ce que Le Machine Learning ? ; 7.2 Les différents types de Machine Learning ; 7.3 Les principaux algorithmes ; 7.4 Réseaux de neurones et Deep Learning ; 7.5 Illustrations numériques ; 7.6 Systèmes de recommandation
Chapitre 8 - La visualisation des données : 8.1 Pourquoi visualiser l'information ? ; 8.2 Quels graphes pour quels usages ? ; 8.3 Représentation de donnée complexes

Troisième partie - Les outils du Big Data
Chapitre 9 - L'écosystème Hadoop : 9.1 La jungle de l'éléphant ; 9.2 Les composants d'Apache Hadoop ; 9.3 Les principales distributions Hadoop ; 9.4 Spark ou la promesse du traitement Big Data in-memory ; 9.5 Les briques analytiques à venir ; 9.6 Les librairies de calcul
Chapitre 10 - Analyse de logs avec Pig et Hive : 10.1 Pourquoi analyser des logs ? ; 10.2 Pourquoi choisir Pig ou Hive ? ; 10.3 La préparation des données ; 10.4 L'analyse des parcours clients
Chapitre 11 - Les architectures gamma : 11.1 Les enjeux du temps réel ; 11.2 Rappels sur MapReduce et Hadoop ; 11.3 Les architectures gamma
Chapitre 12 - Apache Storm : 12.1 Qu'est-ce que Storm ? ; 12.2 Positionnement et intérêt dans les architectures gamma ; 12.3 Principes de fonctionnement ; 12.4 Un exemple très simple

Notes : Attention ! Cette fiche est incomplète, aidez-nous à la compléter. Votre contribution

Cet ouvrage est l'objet d'une présentation sous la rubrique "Notes de lecture" de la revue Tangente n° 173.

Mots clés :


© ADIREM-APMEP -2003- ISSN 1292-8054 Mise à jour 10/01/2018
Accueil Publimath  Aide à la recherche   Recherche Avancée   Aidez-nous à améliorer cette fiche 
Certification IDDN