Chp4-Bases de Données NOSQL
Chp4-Bases de Données NOSQL
Chp4-Bases de Données NOSQL
2
Bases de Données NOSQL
Atouts
• Principaux atouts
§ Évolutivité
§ Disponibilité
§ Tolérance aux fautes
• Caractéristiques
§ Modèle de données sans schéma
§ Architecture distribuée
§ Utilisation de langages et interfaces qui ne sont pas uniquement du SQL
3
Bases de Données NOSQL
NOSQL et Big Data
4
Bases de Données NOSQL
Types
• Types des bases de données NOSQL
§ Clef/valeur
§ Orientées colonnes
§ Orientées documents
§ Orientées graphes
5
Types de Bases de Données NOSQL
1. Clef/Valeur (Key/Value Store )
6
Types de Bases de Données NOSQL
1. Clef/Valeur (Key/Value Store )
Valeur
Clef
Nom_$#_Stella~~Humeur_$#_Heureuse
Chien_12 ~~Date_naissance_$#_2007-04-01…
7
Types de Bases de Données NOSQL
2. Orientée Documents (Document Database )
8
Types de Bases de Données NOSQL
2. Orientée Documents (Document Database )
Document (V2)
{
type : « Chien »,
nom : « Stella »,
Document (V1) humeur : « Heureuse »,
date_naissance : 2007-04-01
{ aboiement : [
{ texte : « j’ai mangé de la pâtée »
Clef type : « Chien », commentaires : [
nom : « Stella », { id_chien : « chien_4 »,
Chien_12 humeur : « Heureuse », texte : « on s’en fout! »
}
date_naissance : 2007-04-01 ]
}
]
} }
9
Types de Bases de Données NOSQL
3. Orientées Colonnes (Column Store )
• Évolution de la BD clef/valeur
• Ressemble aux SGBDR, mais avec un nombre de colonnes dynamique,
différent d’un enregistrement à un autre (pas de colonnes portant les
valeurs NULL)
• Offrent de très hautes performances et une architecture hautement
évolutive
• Exemples : Hbase (Hadoop), Cassandra (Facebook, Twitter), BigTable
(Google)
A B C D E
1 A Foo B Bar C Hello
1 Foo Bar Hello
2 B Tom
2 Tom
3 C Java D Scala E Cobol
3 Java Scala Cobol
10
Types de Bases de Données NOSQL
3. Orientées Colonnes (Column Store )
Colonnes
Famille Titre Temps
Valeur
Chien Date_naissance 15 2007-04-01
Chien Humeur 11 En Colère
Clef Chien Humeur 45 Heureuse
Chien Nom 25 Stella
Chien_12
Chien Couleur 34
Noire
11
Types de Bases de Données NOSQL
3. Orientées Colonnes (Column Store )
12
Types de Bases de Données NOSQL
4. Orienté Graphes (Graph Database )
13
Types de Bases de Données NOSQL
4. Orienté Graphes (Graph Database )
Id Nom Humeur Date_naissance Couleur
12 Stella Heureuse 2007-04-01 NULL
13 Wimma Faim NULL Noire
9 Ninja NULL NULL NULL
Chien_4
commente
Chien Commentaire_
83
14
Types de Bases de Données NOSQL
Comparaison
Clef/Valeur Variable
Théorie des
Orienté Graphes
Graphes
15
Chp4 – Bases de Données NOSQL
16
NOSQL et BDR
Comparaison (1/3)
• Choix de NOSQL en opposition aux bases de données relationnelles conduits
par les contraintes du marché et les besoins techniques
• BigData
§ Adaptation des BD NOSQL au BigData
o Vitesse ( Velocity ) : beaucoup de données qui arrivent rapidement, à partir de
plusieurs sources
o Variété ( Variety ) : données structurées, semi-structurées ou non-structurées
o Volume ( Volume ) : données très nombreuses (To et Po)
o Complexité ( Complexity ) : données stockées et gérées à plusieurs endroits et data
centers.
• Disponibilité continue des données
§ Le manque de disponibilité peut être fatal pour une entreprise
§ BD NOSQL utilisent une architecture hautement distribuée : pas de SPOF
§ Redondance des données et traitements : tolérance aux fautes
§ D’où : disponibilité continue à travers les data centers, et le cloud
§ Toute mise à jour ou modification est faite sans déconnecter la base
17
NOSQL et BDR
Comparaison (1/3)
• Indépendance de l’e mplacement
§ Possibilité de consulter et modifier une BD sans savoir où est-ce que ces
opérations ont réellement lieu
§ Toute fonctionnalité d’écriture propagée à partir d’un emplacement, pour être
disponible aux utilisateurs à partir d’autres sites
§ Difficile à appliquer aux BDR, surtout pour l’écriture
• Modèles de données flexibles
§ Une des raisons majeures
§ Dans le modèle relationnel, les relations entre les tables sont prédéfinies, fixes
et organisées dans un schéma strict et uniforme
o Problèmes d’évolutivité et de performance en gérant de grands volumes de données
§ Les BD NOSQL peuvent accepter tout type de données (structurées, semi-
structurées ou non-structurées) plus facilement
§ Dans les BDR, les performances posent problème, surtout quand des lignes
« larges » sont utilisées et les actions de modification sont nombreuses
18
NOSQL et BDR
Comparaison (3/3)
19
NOSQL et BDR
Propriétés ACID
• Propriétés ACID : Atomicité, Consistance, Isolation et Durabilité
§ Propriétés des transactions des BDR
§ Atomicité : Soit toutes les instructions sont exécutées, soit aucune
§ Consistance : toute transaction amène la BD d’un état valide à un autre è
renforcée par les contraintes d’intégrité et les clefs étrangères
§ Isolation : Même si plusieurs transactions peuvent être exécutées par un
ou plusieurs utilisateurs simultanément, une transaction ne devrait pas
voir les effets des autres transactions concurrentes
§ Durabilité : Une fois la transaction enregistrée dans la base ( commit ), ces
changements sont persistants.
• Toutes les BDR supportent les transactions ACID
• Mais :
§ Données de plus en plus volumineuses + Besoin de systèmes évolutifs
§ Besoin de BD distribuées sur le réseau, pour une évolutivité horizontale
20
NOSQL et BDR
Théorème CAP
• Destiné à évaluer les systèmes de stockage
distribués
• Théorème CAP : « Il est impossible de satisfaire les
trois propriétés CAP en même temps »
• Propriétés CAP : Consistency, Availability, Partition
tolerance
§ Consistance : Si j’é cris une donnée dans un nœud et
que je la lis à partir d’un autre nœud dans un
système distribué, je retrouve ce que j’ai écris sur le
premier.
§ Haute disponibilité : à tout moment, pour chaque
requête, la réponse est garantie. Même en cas de
panne, les données restent accessibles
§ Tolérance au partitionnement : les données peuvent
être partitionnées sur différents supports sans
souci de localisation. Les activités continuent sans
interruption lors de la modification du système (en
cas d’ajout ou suppression de nœuds) et en cas de
chute du réseau
21
NOSQL et BDR
Théorème CAP
• Pourquoi est-il impossible de satisfaire les 3 propriétés CAP en même
temps?
• Soit un système distribué. On est entrain de modifier une donnée sur le
nœud N1 et d’e ssayer de la lire à partir du nœud N2
§ N2 peut retourner la dernière bonne valeur dont il dispose, ce qui viole la
Consistance
§ N2 attend que la nouvelle valeur lui parvienne. Comme c’est un système
distribué, les chances d’un échec de transmission sont assez importantes, ce
qui provoquera une attente infinie de N2. D’où une violation de la Disponibilité
§ Si on veut satisfaire à la fois la consistance et la disponibilité, le système de
stockage ne doit pas être partitionné. D’où violation de la Tolérance au
partitionnement.
• Pour les BD NOSQL, il n’y a plus de jointures
§ è La propriété de consistance n’est plus assurée de la même manière
• Consistance dans NOSQL: consistance immédiate et éventuelle des données
à travers les nœuds de la base distribuée
22
NOSQL et BDR
Propriétés BASE
23
NOSQL et BDR
Récapitulatif
BRD NOSQL
Consistance forte vs Consistance éventuelle
SQL vs Map-Reduce
24
NOSQL et BDR
Synthèse
• Bases de données NOSQL
§ Performances sur de gros volumes de données
§ Performances sur des données non structurées
§ Evolutivité très importante, même pour de faibles volumes
• Cependant:
§ Technologie assez jeune è Manque d’outils la supportant
§ Encore en évolution, pas de standards
§ Pas de langage de requêtage commun comme SQL, mais divers:
o Requêtes spécifiques au langage (Java, Python…)
o Requêtes spéciale pour la base (Cassandra Query Language)
o API basée sur Map Reduce, ou sur graphes d’objets
§ On doit faire plus de travail au niveau du code, ce qui peut influer sur la
performance
25
NOSQL et BDR
Quand utiliser NOSQL?
26
Chp4 – Bases de Données NOSQL
CASSANDRA
27
Cassandra
Présentation
• Base de données :
§ Distribuée
§ À haute performance
§ Extrêmement évolutive
§ Tolérante aux fautes (pas de SPOF)
§ Non-relationnelle
• Peut être utilisée à la fois comme :
§ Base de données temps réel
§ Base de données pour une lecture intensive pour les systèmes décisionnels
• À la base, c’est une combinaison de BigTable de Google et DynamoDB de
Amazon, incubée dans Facebook, et hébergée comme solution open
source dans Apache.
28
Cassandra
Architecture (1/2)
• Système distribué, P2P
• Composés de plusieurs nœuds identiques
§ Pas de notion de NameNode ou nœud maître…
• Les données sont partitionnées par défaut à travers
les différents nœuds du cluster
• Les données sont répliquées pour assurer une
tolérance aux fautes maximale
§ L’utilisateur contrôle le nombre de répliques qu’il
désire avoir pour ses données
• Lecture et écriture à partir de n’importe quel nœud,
indépendamment de l’e mplacement des données
• Utilisation du protocole Gossip pour la
communication entre les différents nœuds du
cluster
§ Échange de données entre les nœuds chaque
seconde
29
Cassandra
Architecture (2/2)
• Structure orientée colonnes, à l’image de
BigTable
• Vocabulaire:
§ Keyspace (équivalent de database )
§ Column Family (équivalent de table )
Keyspace : Portfolio
o Dans la nouvelle version du langage CQL,
appelée Table Column Family : Client
ID Nom Adresse Tel
o Schéma plus flexible et dynamique qu’une
table
§ Colonne (équivalent à enregistrement )
o Indexée par une clef
o D’autres champs peuvent être également
indexés, mais à la demande
30
Cassandra
Partitionnement (1/2)
de la base de données
• Les données sont insérées par l’utilisateur
dans une famille de colonnes
1
• Elles sont ensuite placées sur un nœud, Donnée
5 2
selon sa clef de colonne
4 3
31
Cassandra
Partitionnement (2/2)
• Stratégies de partitionnement
§ Partitionnement aléatoire
o Par défaut, recommandé
o Données partitionnée le plus équitablement
possible à travers les différents nœuds Keyspace : Portfolio
o Utilisation de MD5 (ou Murmur3) pour le hachage Column Family : Client
de chaque clef de famille de colonnes ID Nom Adresse Tel
§ Partitionnement ordonné
o Sauvegarde les clefs de familles de colonnes par
ordre à travers les nœuds d’un cluster
o Peut provoquer des problèmes, surtout pour la
répartition des charges (des nœuds avec des 1
données plus volumineuses que d’autres) Donnée
5 2
• Stratégie spécifiée dans un fichier de
configuration cassandra.yaml
4 3
• Si la stratégie d’u ne base est modifiée, il faut
recharger toutes les données
32
Cassandra
Réplication (1/3)
• Pour assurer la tolérance aux fautes et pas
de SPOF, il est possible de créer une ou
plusieurs copie(s) de chaque colonne à
travers les nœuds participants Keyspace : Portfolio
Column Family : Client
• L’utilisateur spécifie le facteur de réplication
ID Nom Adresse Tel
désiré à la création du keyspace
• Les données sont insérées par l’utilisateur
dans une famille de colonnes
1
• La colonne est répliquée dans les nœuds du Donnée
Facteur de réplication = 2
33
Cassandra
Réplication (2/3)
• Stratégies de réplication
§ Stratégie Simple :
o La colonne originelle est placée sur un nœud
déterminé par le partitionneur 1
Donnée
o La réplique est placée sur le nœud suivant de 5 2
l’anneau (clockwise)
o Pas de considération pour l’emplacement dans
un data-center ou dans une baie (approprié
4 3 Copie de la
Donnée
pour les déploiement sur un seul datacenter)
§ Stratégie par topologie du réseau
o Plus sophistiquée
Copie de la
o Plus de contrôle sur l’emplacement des Baie1 Donnée
répliques de colonnes 1 1
o Parcourt le cluster (clockwise) à la recherche Donnée
d’un nœud dans une baie différente. Si 5 2 5 2
introuvable, stocker la colonne dans un nœud
de la même baie 4 3 4 3
o Un groupe de réplication est spécifié, pour Copie de la
Donnée Baie2
distinguer entre plusieurs datacenters
34
Cassandra
Réplication (3/3)
• Mécanisme de réplication
§ Utilisation de SNITCH:
o Définition de la manière dont les nœuds sont groupés dans un réseau
o Répartition des nœuds entre baies et datacenters
§ Plusieurs types de SNITCH
o Simple SNITCH : utilise la stratégie simple
o Rack-Inferring SNITCH : détermine la topologie du réseau en analysant les
adresses IP:
1. Second octet de l’adresse IP: Data Center
2. Troisième octet de l’adresse IP: Baie
o Property File SNITCH : se base sur une description de l’utilisateur pour
déterminer l’emplacement des nœuds ( cassandra-topology.properties )
o EC2 SNITCH : pour déploiement dans Amazon EC2. Utilise l’API AWS pour
déterminer la topologie
§ Défini dans le fichier de configuration cassandra.yaml
35
Cassandra
Consistance
36
Cassandra
Consistance
• Écriture :
§ Données écrites d’abord dans un commit log pour la durabilité
§ Ensuite, écriture en mémoire dans une MemTable
§ Une fois la MemTable pleine, les données sont sauvegardées dans le disque,
dans une SSTable ( Sorted Strings Table )
§ Même si les transactions relationnelles (commits et rollbacks) ne sont pas
supportées, les écritures sont atomiques au niveau des colonnes
o Soit toutes les colonnes sont modifiées, soit aucune ne l’est
• Cassandra est la base de données NOSQL la plus rapide en écriture
37
Cassandra
Consistance
• Consistance : à quel point est-ce qu’u ne donnée est à jour et synchronisée
sur toutes ses répliques.
• Choix possible entre une consistance forte ou éventuelle selon les besoins
• Ce choix est fait par opération, ce n’e st pas une stratégie globale pour la
base de données (ex, pour changer la stratégie de lecture en quorum )
§ SELECT * FROM users USING CONSISTENCY QUORUM WHERE state=‘TX’;
38
Cassandra
Stratégies d’Écriture
• Niveau de consistance : combien de répliques doivent être écrites avec
succès avant de retourner un acquittement au client
§ Any : une écriture doit réussir sur n’importe quel nœud, au moins un.
o Offre la plus haute disponibilité, mais la plus basse consistance
§ One (défaut dans CQL) : une écriture doit réussir sur le commit log et la
memtable d’au moins une réplique
§ Quorum : une écriture doit réussir sur un certain pourcentage de répliques
(pourcentage = (facteur de réplication/2)+1)
o Meilleure alternative en terme de consistance et de disponibilité
§ Local-Quorum : une écriture doit réussir sur un certain pourcentage de
nœuds répliques sur le même datacenter que le nœud coordinateur
§ Each-Quorum : une écriture doit réussir sur un certain pourcentage de
nœuds répliques sur tous les datacenters.
§ All : une écriture doit réussir sur tous les nœuds répliques d’une colonne
o Offre la plus haute consistance, mais la plus basse disponibilité
39
Cassandra
Stratégies d’Écriture
40
Cassandra
Stratégies de Lecture
• Niveau de consistance : combien de répliques doivent répondre avant de
retourner le résultat à l’a pplication cliente
• Cassandra vérifie le nombre de répliques pour la donnée la plus récente
pour satisfaire une demande de lecture (basée sur le temps)
§ One (défaut dans CQL) : obtention d’une réponse à partir de la réplique la plus
proche selon le SNITCH
o Offre la plus faible consistance, mais la plus haute disponibilité
§ Quorum : obtention du résultat le plus récent à partir d’un certain pourcentage
de nœuds répliques (pourcentage = (facteur de réplication /2)+1)
o Meilleure alternative en terme de consistance et de disponibilité
§ Local-Quorum : obtention du résultat le plus récent à partir d’un certain
pourcentage de nœuds répliques sur le même datacenter que le nœud
coordinateur
o Évite la latence due à la communication inter-datacenters
§ Each-Quorum : : obtention du résultat le plus récent à partir d’un certain
pourcentage de nœuds répliques sur tous les datacenters.
§ All : obtention du résultat le plus récent à partir de tous les nœuds répliques
o Offre la plus haute consistance, mais la plus basse disponibilité
41
Cassandra
Stratégies de Lecture
• Read Repair
§ Cassandra assure que les données fréquemment lues soient consistantes
§ À la lecture d’une donnée, le nœud coordinateur compare toutes ses
répliques en arrière plan.
§ Si ces données ne sont pas consistantes, envoie une demande d’écriture
aux nœuds réplicas pour mettre à jour leur donnée et afficher la donnée la
plus récente 1
§ Read Repair peut être configuré par famille de colonnes et est
5 activé 2parRéplique1
défaut.
4 3
Réplique3 Réplique2
42
Cassandra
Gestion des Données et Objets
• CLI
§ Interface originelle conçue pour créer des objets, entrées et manipuler les
données
• CQL
§ Utilisée pour créer/manipuler des données en utilisant un langage proche
de SQL
43
Cassandra
Gestion des Données et Objets
• CQL
§ Objets tels que les keyspaces, familles de colonnes et index sont créés,
modifiés et supprimés avec les requêtes usuelles: CREATE, ALTER et DROP
§ Données insérées, modifiées et supprimées avec INSERT, UPDATE et DELETE
§ Données lues avec SELECT
§ Mais
o Ne supporte pas des opérations telles que GROUP BY, ORDER BY (sauf pour les
clefs composées, et ordonnées seulement selon la deuxième clef primaire)…
§ Utiliser la clause USING CONSISTENCY pour déterminer le type de consistance
forte pour chaque opération de lecture et l’écriture (Any, One, Quorum…)
44
Cassandra
Récapitulatif (1/2)
45
Cassandra
Récapitulatif (2/2)
46
Chp4 – Bases de Données NOSQL
MONGODB
47
MongoDB
Introduction
• Écrit en C++
48
MongoDB
Structure de Données
• Données représentées dans un schéma flexible
• Données stockées sous forme de documents (paires clef/valeur) JSON-
like
• La structure du document n’est pas fixée à sa création
§ Mais en général, les documents d’une même collection ont une structure
similaire (homogénéité)
• Les documents sont organisés sous forme de collections
§ Groupe de documents reliés par des indexes en commun
49
MongoDB
Terminologie
50
MongoDB
Document
• Structure de données JSON-like, composée de paires clef/valeur
• Stocké sur le disque sous forme de document BSON
§ Documents BSON (Binary JSON) : représentation binaire sérialisées d’une
document JSON
§ Supporte plus de types de données que JSON
§ La partie valeur peut avoir n’importe quel type supporté par BSON, dont
d’autres documents, des tableaux, et des tableaux de documents
51
MongoDB
Document
• Le champ _id
§ Seul champ obligatoire, utilisé comme clef primaire dans une collection
§ Peut être de tout type autre que Tableau
• Les champs indexés ont une taille limite (1Mo)
• Les noms des champs ne peuvent pas commencer par un $, contenir le
caractère « . » ou le caractère « null »
52
MongoDB
Document
• Limites
§ Taille max d’un document : 16Mo
o Utilisation de l’API GridFS pour stocker des documents plus larges que la taille
autorisée
o GridFS permet de diviser les documents en chunks de même taille, et les stocke
sous forme de documents séparés
§ MongoDB préserve l’ordre des champs du document, comme défini à leur création,
sauf:
o Que le champs _id doit toujours figurer en premier
o Les opérations de update qui incluent le renommage d’un champs peut entraîner
le changement de l’ordre des champs dans le document
§ Champs _id
o Création d’un index unique à la création d’une collection
o Utilisation conseillée d’un ObjectId: objets petits (12o), uniques et rapides à
générer
53
MongoDB
Structure de Documents
• Deux manières des relations entre les données: Références et Données
Imbriquées
• Références
§ Inclusion de liens ou références d’un document à un autre
§ C’est à l’application de résoudre ces références pour accéder aux données
associées
§ On dit qu’on utilise des Modèles de Données Normalisés
54
MongoDB
Structure de Documents
• Données Imbriquées ( Embedded Data )
§ Sauvegarde des données associées dans la même structure de documents
§ Il est possible d’inclure des documents dans un champ ou un tableau
§ Permet aux applications d’extraire et manipuler plusieurs niveaux de
hiérarchie en une seule instruction
§ Ce sont les Modèles de Données Dénormalisés
55
MongoDB
Structure de Documents
• Comment choisir entre Références et Données Imbriquées ?
• On choisit les références quand:
§ L’imbrication va produire des données dupliquées sans grands avantages en
terme de performance de lecture
§ On veut représenter des relations many-to-many complexes
§ On veut modéliser de larges ensembles de données hiérarchiques
• On choisit les données imbriquées quand:
§ On a des relations contains entre les éléments (modèles one-to-one )
o Exemple : personne et adresse
§ On a des relations one-to-many , où les documents fils ( many ) apparaissent
toujours dans le contexte des documents parents ( one )
o Exemple : personne et plusieurs emails
56
MongoDB
Opération de Lecture
• Lecture
§ Cible une unique collection spécifique de documents
§ Cible un critère ou des conditions spécifiques, pour identifier le document à
retourner
§ Peut inclure une projection sur les champs du document à retourner
§ Peut définir des Modificateurs pour imposer des limites, un ordre, un filtre…
57
MongoDB
Opération de Lecture
• MongoDB fournit une méthode db.collection.find() pour l’extraction de
données
§ Accepte les critères de la requête, ainsi que les projections
§ Retourne un curseur vers les documents correspondants
• Fournit également une méthode db.collection.findOne() retournant un
seul document
Équivalent SQL
58
MongoDB
Opération de Lecture
• Projections
§ Deuxième argument de la méthode find()
§ Peuvent spécifier la liste des champs à afficher ou à exclure
§ Mis à part pour exclure le champ _id (qui est affiché par défaut), il est
interdit de mixer les projections inclusives et exclusives
59
MongoDB
Opération d’Ecriture
• Modification
§ Création, mise à jour ou suppression de données
§ Ces opérations modifient les données d’une seule collection
§ Définition de critères pour sélectionner les documents à modifier ou
supprimer
60
MongoDB
Opération d’Ecriture
• Insertion de document
§ Si vous ajoutez un document sans champ _id , le système l’ajoute lui-même
en générant un champ de type ObjectId
61
MongoDB
Opération d’Ecriture
• Mise à jour de documents
§ Méthode update peut accepter des critères de sélection des documents à
modifier, et des options qui affectent son comportement.
§ Une opération update modifie un seul document par défaut (plusieurs docs
si multi:true)
§ Existence de l’option upsert: si true , et que le document à modifier n’existe
pas dans la collection, il est automatiquement inséré
62
MongoDB
Opération d’Ecriture
• Suppression de documents
§ La méthode remove supprime des documents d’une collection
§ Accepte des critères de sélection des documents à supprimer
§ Supprime par défaut tous les documents correspondant aux critères de
sélection (sauf indication du contraire dans un flag approprié)
63
MongoDB
Opération d’Ecriture
• Les opérations d’écriture sont atomiques au niveau d’un document
§ Aucune opération d’écriture ne peut affecter atomiquement plus qu’un seul
document ou collection
§ L’utilisation des données imbriquées facilite l’écriture
§ La normalisation des données (référence vers données dans d’autres
collections) implique plusieurs opérations d’écriture qui ne sont pas
atomiques.
• Certaines modifications (un push dans des tableaux, ou bien un ajout
d’un champ) augmentent la taille des documents
§ Pour le moteur de stockage MMAPv1, si la taille d’un document dépasse la
taille autorisée pour ce document, MongoDB le réalloue sur le disque
§ Si votre application nécessite plusieurs modifications qui augmentent la
taille des documents, considérer plutôt l’utilisation des références
64
MongoDB
Architecture: Sharding
65
MongoDB
Architecture: Sharding
• Shards
§ Stockent les données
§ Les données sont distribuées et
répliquées sur les shards
• Query Routers
§ Instances mongos
§ Interfaçage avec les applications clientes
§ Redirige les opérations vers le shard
approprié et retourne le résultat au client
§ Plusieurs QR pour la répartition des
tâches
• Config Servers
§ Stockent les méta-données du cluster
§ Définissent le mapping entre les data et
les shards
§ Dans les env. de prod., 3 CS doivent être
définis
66
MongoDB
Partitionnement des Données
• Partitionnement des données au niveau des collections, via la
shard key
§ Champ simple ou composé indexé qui existe dans chaque document de la
collection
• MongoDB divise les valeurs de la clef en morceaux (chunks)
et les distribuent de manière équitable entre les shards
• La répartition des clefs suit l’une de ces deux méthodes de
partitionnement:
§ Basée sur le rang
§ Basée sur le Hash
§ Basée sur les tags
67
MongoDB
Partitionnement des Données
• Paritionnement basé sur le rang
§ Définition d’intervalles qui ne se chevauchent pas, dans lesquelles les
valeurs de la shard key peuvent se trouver
§ Permet aux documents avec des clefs proches de se trouver dans le même
shard
§ Plus facile de retrouver le shard pour une donnée
§ Risque de distribution non équitable des données (par exemple si la clef
est le temps, alors toutes les requêtes dans un même intervalle de temps
sont sur le même serveur, d’où une grande différence selon les heures de
grande ou de faible activité)
68
MongoDB
Partitionnement des Données
• Paritionnement basé sur le hash
§ Calcul de la valeur du hash d’un champ, puis utilise ces hash pour créer des
parittions
§ Deux documents ayant des clefs proches ont peu de chance de se trouver
dans le même shard
§ Distribution aléatoire d’une collection dans le cluster, d’où une distribution
plus équitable
§ Moins efficace, car le temps de recherche de la donnée est plus grand
§ Dans le cas d’une requête portant sur des données se trouvant dans un
intervalle défini, le système doit parcourir plusieurs shards
69
MongoDB
Partitionnement des Données
70
MongoDB
Maintien d’une Distribution Équitable
• L’ajout de nouvelles données ou nouveaux serveurs peut rendre la
distribution des données déséquilibrée
• Splitting:
§ Évite d’avoir des chunks trop larges
§ Quand la taille d’un chunk augmente au delà d’une valeur prédéfinie ( chunk
size ), MongoDB divisie cet ensemble de données en deux sur le même shard
§ Les insertions et les modifications déclenchent les splits
§ Un split change les méta-données, mais ne fait pas migrer les données ni
n’affecte le contenu des shards
71
MongoDB
Maintien d’une Distribution Équitable
• Balancing:
§ Balancer : processus en arrière plan, gérant les migrations de chunks
§ Peut être lancé à partir de n’importe quel query router
§ Quand la distribution des données est déséquilibrée, le balancer fait migrer
des chunks du shard ayant le plus de chunks vers celui qui en a le moins,
jusqu’à ce que la collection devienne équitablement répartie
§ Étapes
o Le shard destination reçoit tous les documents du chunk à migrer
o Le shard destination applique tous les changements faits aux données durant le
processus de migration
o Finalement, les métadonnées concernant l’emplacement du chunk sur le config
server sont modifiées
72
MongoDB
Ajout ou Suppression de Shards
73
MongoDB
Stratégies de Réplication
74
MongoDB
Stratégies de Réplication
• Primaire
§ Seul membre qui reçoit les opérations d’écriture
§ MongoDB applique les opérations d’écriture sur le
primaire, puis les enregistre dans son log
(oplog)
§ Les membres secondaires dupliquent ce log et
appliquent les opérations sur leurs données
§ Tous les membres d’un replicat set peuvent
accepter une opération de lecture
o Par défaut, une application dirige ces opérations
vers le primaire
§ Un replicat set a au plus un primaire
§ Si le primaire tombe en panne, une élection a lieu
pour en choisir un autre
75
MongoDB
Stratégies de Réplication
• Secondaires
§ Maintiennent une copie des données du primaire
§ Pour répliquer les données, un secondaire applique les opérations du oplog du
primaire sur ses propres données, de manière asynchrone
§ Un replicat set peut avoir un ou plusieurs secondaires
§ Même si les clients ne peuvent pas écrire des données sur les secondaires, ils
peuvent en lire
§ Un secondaire peut devenir un primaire, suite à une élection
§ Il est possible de configurer un secondaire :
o L’empêcher d’être élu pour devenir primaire, lui permettant de rester toujours comme
un backup
o Empêcher les applications de lire à partir de lui, lui permettant ainsi de se consacrer
à certaines applications nécessitant un trafic séparé
o Exécuter des snapshots périodiques pour garder un historique
76
MongoDB
Stratégies de Réplication
• Arbitre
§ N’a pas de copie des données et ne peut pas devenir un
primaire
§ Permet de voter pour un primaire
§ Doit être défini pour les replicat sets avec un nombre pair de
membres
• Élections
§ Ont lieu à la création d’un replicat set, ou bien quand un
primaire devient indisponible
§ Processus qui prend du temps, et qui rend le replicat set en
readonly
§ Chaque membre a une priorité déterminant son éligibilité à
devenir primaire
o L’élection ch oisit le membre ayant la plus h aute priorité comme
p rimaire
o Par défaut, tous les membres ont la même priorité (1)
o Il est p ossible de modifier la p riorité d’un membre ou group e,
selon leur position géograph ique par exemple
§ Chaque membre a la possibilité de voter pour un seul autre
membre
§ Le membre recevant le plus grand nombre de votes devient
primaire
77
MongoDB
Write Concern
78
MongoDB
Write Concern : Niveaux (1/4)
• Unacknowledged
§ Similaire à « Errors Ignored »
§ MongoDB n’envoie pas d’acquittement après une opération d’écriture
§ Le driver tentera de gérer les erreurs réseau tant que possible, selon la
configuration du système
§ Avant, c’était le niveau par défaut
79
MongoDB
Write Concern : Niveaux (2/4)
• Acknowledged
§ Niveau par défaut
§ Mongod confirme la réception de l’opération d’écriture et applique les
changements à la vue in-memory des données
§ Permet aux clients de détecter les erreurs dues au réseau, aux clefs
dupliquées…
§ Elle ne confirme pas que les données
§ sont correctement écrites sur le disque !
80
MongoDB
Write Concern : Niveaux (3/4)
• Journaled
§ MongoDB valide les opérations d’écriture uniquement après avoir réalisé l’opération
d’écriture sur le Journal (Log permettant de sauvegarder les transactions et
évènements)
§ MongoDB peut ainsi récupérer les données à la suite d’un shutdown ou d’une panne
électrique
§ Le Journaling doit être activé pour utiliser cette option
§ Pour réduire la latence de ces opérations,
§ MongoDB augmente la fréquence des commit
§ La journalisation est requise uniquement pour la donnée
§ primaire (pas les répliques)
81
MongoDB
Write Concern : Niveaux (4/4)
• Replica Acknowledged
§ Garantit que l’opération d’écriture
s’est propagée à un nombre spécifié
de répliques
§ Exemple:
o La méthode retourne seulement si
l’écriture se propage à la donnée
primaire et au moins à une réplique
o sinon la méthode lance un timeout
au bout de 5s.
82
MongoDB
Read Isolation
83
MongoDB
Read Preference
• Décrit comment les clients MongoDB routent les opérations de lecture vers
les répliques
• Par défaut, une application oriente ses opérations de lecture vers la donnée
primaire
§ Donne une garantie de fraicheur, car les opérations d’écriture par défaut
opèrent sur la donnée primaire
• Pour une application qui ne nécessite pas des données de toute fraîcheur, il
est possible d’a méliorer la latence de lecture en distribuant certaines
opérations de lecture vers les répliques
84
Sources
• Sites (consultés en février 2014)
§ Planet Cassandra : www.planetcassandra.org
§ NOSQL : 5 minutes pour comprendre : http://blog.neoxia.com/nosql-5-minutes-pour-
comprendre/ NEOXIA
§ NOSQL Europe : Bases de données orientées colonnes et Cassandra
http://blog.xebia.fr/2010/05/04/nosql-europe-bases-de-donnees-orientees-colonnes-et-
cassandra/ XEBIA
§ Une base NOSQL, Cassandra : http://www-igm.univ-mlv.fr/~dr/XPOSE2010/Cassandra IGM
§ Why NOSQL – Part 1 – CAP Theorem : http://bigdatanerd.wordpress.com/2011/12/08/why-
nosql-part-1-cap-theorem/ DATANERD
§ DataStax Cassandra Tutorials : http://www.datastax.com/resources/tutorials/cassandra-
overview DataStax
§ Documentation officielle MongoDB : http://docs.mongodb.org/ MongoDB
• Présentations
§ Harri Kauhanen, « NOSQL Databases », Futurice, Septembre 2010
• Rapports
§ Mouna Laroussi, « Etude et mise en place de la technologie Big Data pour la
télécommunication », Projet de fin d’é tudes, INSAT, 2013
• Livres Blancs
§ Top 5 Considerations when evaluating NOSQL Databases, MongoDB White Paper, Juin 2013
85