NoSQL avec Cassandra

Domaine de la formation :
  • IT
    Base de données
Durée de la formation :
  • 3 jours
Référence de la formation :
  • CI10-126

Mise en œuvre de NoSQL avec Cassandra. NoSQL est un Système de Gestion de Base de Données (SGBD) qui ne se base pas sur l’architecture traditionnelle du monde relationnel. Le Big data, ou données volumineuses, apparu avec les géants d’internet, tels que Amazon, Google, Facebook, nécessite de nouveaux outils. Cassandra est un SGBD NoSQL, initié par Facebook, projet de la fondation Apache, qui permet de gérer des quantités massives de données réparties sur plusieurs serveurs, en assurant une disponibilité maximale de ces données.

Objectifs pédagogiques

Connaître les apports de Cassandra, savoir l’installer et le configurer.

Cibles

Chefs de projet, architectes, gestionnaires de bases de données.

Pré-requis

Connaissances générales sur les bases de données.

Modalités

  • Un tour d’horizon complet de la solution Cassandra, progressivement.
  • Des manipulatons pour mieux appréhender ces nouveaux modèles.

Programme

  • Historique, fonctionnalités de Cassandra, licence
  • Format des données, « key-value »,
  • Traitement de volumes importants, haute disponibilité,
  • Système réparti de base de données …
  • Pré requis
  • Plateformes supportées.
  • Etude du fichier de configuration : conf/cassandra.yaml
  • Répertoire de travail, de stockage des données, gestion de la mémoire.
  • Démarrage d’un nœud et test de l’interface cassandra-cli.
  • Commandes de base :
    • connexion au système de base de données,
    • création de colonnes,
    • insertion, modification recherche.
  • Le CQL : Cassandra Query Language.
  • Exécution de scripts.
  • Principe.
  • Préparation du premier nœud : adresse d’écoute.
  • Configuration de nouveaux nœuds.
  • Notion de bootstrapping et de token.
  • Paramètres listen_address et rpc_address.
  • Réplication : topologie du réseau et EndpointSnitch
  • Stratégie de réplication.
  • Ajout de nœuds, suppression.
  • Cassandra dans un cloud.
  • Mise en œuvre avec OpenStack.
  • Sauvegardes.
  • Import/export au format JSON.
  • Supervision avec nodetool cfstats, ou export JXM vers des outils de supervision comme Nagios.
  • Principe de MapReduce.
  • Implémentation Hadoop.
  • Mise en œuvre depuis Cassandra.
N.B. Cette formation fait partie de notre famille « Data, Cloud et Intelligence Artificielle » incluant tous les concepts, techniques et outils en rapport : Big Data, Machine Learning, Data Analyse, Hadoop, NoSQL, AWS, Décisionnel (BO, Cognos, Hyperion…), Infrastructure, Virtualisation, SGBD (SQL, DB2, MySQL, Oracle, SQLServer) …