Stockage et Acces à de Gros VOlumes de Données ("STAGVOD")

(Storage and Access to Big Data)

Electif de 2ème année à Supélec

Organisateur : Stéphane Vialle


Le volume de données disponibles et apparaissant chaque jour ne cesse de croitre. Stocker, accéder et gérer des données et des flux de données sont devenus des problématiques de plus en plus complexes (bien au-delà de la simple base de données relationnelle). De nouveaux outils et savoir-faire sont apparus. A travers des expériences pratiques (industrielles et académiques), ce module présente les technologies récentes de stockage et d’accès aux données (data centers, systèmes de fichiers, BdD en mémoire, clouds…) et propose quelques mises en œuvre pratiques.

Volume of existing and new emerging data is always increasing. Store, access and manage data and data flow are problems with increasing complexities (beyond complexity of classic relational databases). New tools and knowledge have appeared. This course introduces modern technologies for data storage and data access. It is based on real experiments and use cases (both academic and industrial), and includes some labs and analysis of real systems.
Traiter de gros volumes de données nécessite de gros moyens de calculs. Or, les architectures des coeurs, des processeurs multi-coeurs, puis des clusters de calcul, sont devenu très complexes (parfois associés à des "accélérateurs matériels"). Leur programmation efficace nécessite une formation spécifique, avec une connaissance des aspects matériels sousjacents. Cette partie du cours dresse un panorama de ces architectures, de leur marché, et de leur impact sur le développement des applications distribuées et réalisant des traitements intensifs.
Data Centers:
Joseph Rabita (France Telecom)
Supports à diffusion restreinte. Voir plate-forme Moodle
Data management in computing centers:
Patrice Lucas & Jacques-Charles Lafoucrière (CEA)
Supports à diffusion restreinte. Voir plate-forme Moodle
Storage systems and supports:
Patrick Mercier (CentraleSupélec)
Supports à diffusion restreinte. Voir plate-forme Moodle
Cloud architectures:
Wilfried Kirschenmann (ANEO)
Supports à diffusion restreinte. Voir plate-forme Moodle
Programmation Map-Reduce en Hadoop:
Stéphane Genaud (ENSIIE)
Supports à diffusion restreinte. Voir plate-forme Moodle
Introduction to intensive computing:
Stéphane Vialle (CentraleSupélec)
Supports à diffusion restreinte. Voir plate-forme Moodle
TD "MapReduce - Hadoop"Supports à diffusion restreinte. Voir plate-forme Moodle