Big Data : Informatique pour les données et calculs massifs

2ème année du cursus Supélec - Campus de Metz

Stéphane Vialle 

TD : Stéphane Vialle & Patrick Mercier


  


Supports de cours (slides et polycopié)

Chapitre 1 : Définitions et objectifs du cours Notes de cours 2spp Notes de cours 3spp Notes de cours 6spp
Poly : chapitre 1



Partie I - Notions de base d'informatique distribuée
Chapitre 2 : Terminologie d'architecture Notes de cours 2spp Notes de cours 3spp Notes de cours 6spp
Poly : chapitre 2



Chapitre 3 : Métriques de performance Notes de cours 2spp Notes de cours 3spp Notes de cours 6spp
Poly : chapitre 3




Partie II - Distribution et parallélisation de traitements de données    
Chapitre 4 : Schémas de parallélisation
Notes de cours 2spp Notes de cours 3spp Notes de cours 6spp
Poly : chapitre 4



Chapitre 5 : Technologie d'Hadoop Notes de cours 2spp Notes de cours 3spp Notes de cours 6spp
Poly : chapitre 5



Chapitre 6 : Algorithmique Map-Reduce Notes de cours 2spp Notes de cours 3spp Notes de cours 6spp
Poly : chapitre 6



Chapitre 7 : Technologie de Spark
Notes de cours 2spp Notes de cours 3spp Notes de cours 6spp







Partie III - Bases de données NoSQL                                                              

Chapitre 8 : Emergence et principes du NoSQL
Notes de cours 2spp Notes de cours 3spp Notes de cours 6spp
Poly : chapitre 8




Chapitre 9 : Technologies des moteurs NoSQL Notes de cours 2spp Notes de cours 3spp Notes de cours 6spp
Poly : chapitre 9




Chapitre 10 : Utilisation de MongoDB
(chapitre technique - préparation du TD sur machine)
Notes de cours 2spp Notes de cours 3spp Notes de cours 6spp







Partie IV - Introduction au Machine Learning   
Chapitre 11 : Exploration et préparation des données Notes de cours 2spp Notes de cours 3spp Notes de cours 6spp






Chapitre 12 : Objectifs et principes du Machine Learning Notes de cours 2spp Notes de cours 3spp Notes de cours 6spp






Chapitre 13 : Algorithmes de clustering Notes de cours 2spp Notes de cours 3spp Notes de cours 6spp






Chapitre 13 : Algorithmes d'arbres de décision et de forêts aléatoires Notes de cours 2spp Notes de cours 3spp Notes de cours 6spp







Enoncés de TD
TD 1 : Analyse de passage à l'échelle et bases d'algorithmique Map-Reduce Enoncé
TD 2 : Algorithmique Map-Reduce Enoncé
TD 3-4 : MongoDBEnoncé

Bibliographie

Big Data & Data Science (ouvrages généraux) :

BdD NoSQL :
Hadoop & Map-Reduce :
Spark :
Machine Learning :
Concepts et outils du calcul parallèle et distribué :
Base de données SQL :