QCM Inf 356
QCM Inf 356
QCM Inf 356
1
(b) Ensemble des données ayant une grande taille.
(c) Ensembles de données volumineux, complexes et en constante aug-
mentation qui ne peuvent pas être gérés et manipuler avec des logi-
ciels et techniques classiques.
7. En quoi le Big Data est-il utile ?
(a) Il permet aux entreprises de comprendre le comportement de leurs
clients et les aide à tirer des conclusions à partir de grands ensembles
de données collectées.
(b) Il permet de faire des prévisions.
(c) Il permet de vivre en sécurité.
(d) Il permet de se cacher.
8. Quelle est la différence entre Variété et Volume ?
(a) La variété signifie gérer la complexité de plusieurs types de données et
de schémas structurés ou non structurés tandis que le volume signifie
gérer de volumes de données croissants de tous types.
(b) La variété signifie gérer plusieurs types de données individuellement
tandis que le volume signifie gérer de volumes de données croissants
de l’ordre du Giga ou du Tera.
9. Facebook s’attaque au Big Data avec.......basé sur Hadoop
(a) Projet Prism
(b) Prisme
(c) Projet ”Données”
(d) Projet ”Offre”
10. Sous quelle licence Hadoop est-il distribué ?
(a) Licence Apache 2.0
(b) Mozilla
(c) Shareware
(d) Middleware
11. En quelle langage de programmation Hadoop est-il écrit ?
(a) C
(b) C++
(c) Java
(d) JSP
12. Au-dessus des systèmes de fichiers se trouve le...... qui consiste en un Job
Tracker, auquel les applications clientes soumettent des travaux MapRe-
duce.
(a) MapReduce
(b) Google
2
(c) Programmation fonctionnelle
(d) Facebook
13. ...... possède le plus grand cluster Hadoop du monde.
(a) Apple
(b) Datamatics
(c) Facebook
(d) Aucune des réponses
14. Un ...... nœud agit en tant qu’esclave et est responsable de l’exécution
d’une tâche qui lui est assignée par le JobTracker.
(a) MapReduce
(b) Mapper
(c) TaskTracker
(d) JobTracker
15. Indiquez l’affirmation correcte
(a) La tâche Map dans MapReduce est réalisée à l’aide de la fonction
Mapper().
(b) La tâche de réduction dans MapReduce est effectuée à l’aide de la
fonction Map().
(c) Tous les éléments mentionnés sont correctes.
(d) MapReduce essaie de placer les données et les calculs le plus près
16. ......,partie de MapReduce est chargée de traiter un ou plusieurs morceaux
de données et de produire les résultats de sortie.
(a) Maptask
(b) Mapper
(c) Exécution des tâches
(d) Toutes les réponses
17. ........est chargée de consolider les résultats produits par chacune des fonc-
tions/tâches Map().
(a) Map
(b) Reduce
(c) Reducer
(d) Reduced
18. Pointez la mauvaise déclaration
(a) Une tâche MapReduce divise généralement l’ensemble des données
d’entrée en morceaux indépendants qui sont traités par les tâches
Map de manière totalement parallèle.
(b) Le cadre MapReduce fonctionne exclusivement sur des paires.
3
(c) Les applications implémentent généralement les interfaces Mapper et
Reducer pour fournir les méthodes de map et de reduce.
(d) Aucune des réponses n’est correcte.
19. ......met en correspondance les paires clé/valeur d’entrée avec un ensemble
de paires clé/valeur intermédiaires.
(a) Mapper
(b) Réducteur
(c) Mapper et Reducer
(d) Aucune des réponses mentionnées
20. Indiquez l’affirmation correcte
(a) Les applications peuvent utiliser le rapporteur pour rendre compte
de l’avancement des travaux.
(b) Le cadre Hadoop MapReduce génère une tâche map pour chaque
InputSplit généré par le InputFormat de la tâche.
(c) Les sorties intermédiaires triées sont toujours stockées dans un format
simple (key-len, key, value-len, value).
(d) Toutes les réponses mentionnées
21. Pointez du doigt la mauvaise déclaration
(a) Le réducer a 2 phases primaires.
(b) L’augmentation du nombre de réduces accroı̂t les frais généraux du
cadre, mais améliore l’équilibrage des charges et réduit le coût des
défaillances.
(c) Il est légal de fixer le nombre de tâches réduce à zéro si aucune
réduction n’est souhaitée.
(d) Le cadre regroupe les entrées du réducers par clé (puisque différents
mappeurs peuvent avoir produit la même clé) dans une étape de tri.
22. Lesquelles des phases suivantes se produisent simultanément ?
(a) Réduire et Sort
(b) Shuffle et Sort
(c) Shuffle et Map
(d) Toutes les réponses mentionnées
23. MapReduce a été conçu par
(a) Apple
(b) Google
(c) Facebook
(d) Samsung
24. Qu’est ce qu’une base de données ?
(a) c’est un logiciel
4
(b) c’est une collection d’informations structurées
(c) c’est un module à valider
25. Quels sont les avantages liés à l’utilisation des systèmes de gestion de bases
de données
(a) l’utilisation d’un langage de requête déclaratif
(b) une plus grande indépendance par rapport au système d’exploitation
(c) une description unique et globale des données manipulées
26. Qu’est ce que la sécurité offerte par un SGBD
(a) l’identification des utilisateurs par un mot de passe et l’association
de droits aux utilisateurs
(b) des mécanismes de résistance aux pannes limitant l’impact de celles-
ci.
(c) des mécanismes matériels interdisant les pannes.
27. Qu’est ce qu’une contrainte d’intégrité
(a) c’est ce qui permet de spécifier qu’un utilisateur est intégre
(b) c’est une propriété qui doit être respectée par les données pour que
la base de données soit cohérente.
28. Qu’est ce qu’une transaction pour un SGBD ?
(a) c’est échange entre une banque et un client (par exemple une tran-
saction boursière)
(b) c’est l’unité d’exécution d’un SGBD.
(c) c’est un programme qui fait des lectures et/ou écritures sur une base
de données en respectant certaines propriétés
29. Que veut dire l’acronyme ACID associé aux transactions.
(a) Actif, Combatif, Intrépide, Déterminé
(b) Atomicity, Consistency, Isolation, Durability
(c) Anatole Conrad et Isidore Dubay, les inventeurs de la notion de tran-
saction.
30. Qu’est-ce qu’un schéma relationnel ?
(a) Un schéma qui représente logiquement les tables d’une base de données.
(b) Une représentation d’un ensemble de relations ayant des liens entre
elles.
(c) Un schéma qui représente le flux de données entre les acteurs.
(d) Un schéma qui explique les interactions entres les utilisateurs.
31. MySQL est un système de gestion de base de données.......... ?
(a) Orienté objet
(b) Hiérarchique
(c) Relationnel
5
(d) Réseau
32. À quoi correspondent les données d’une base de données MySQL ?
(a) Objets
(b) Tables
(c) Réseaux
(d) Systèmes de fichiers
33. Le NoSQL c’est une base de données qui :
(a) Permet la tolérance aux pannes
(b) Permet la gestion des transactions concurrentielles
(c) Permet la distribution des données et des requêtes
(d) Permet de distribuer des calculs lourds
34. Lequel de ces couples est faux :
(a) MongoDB − orienté document
(b) Neo4j − orienté graphe
(c) Redis − orienté clé/valeur
(d) Cassandra − orienté colonnes
35. Laquelle de ces propriétés de type BASE n’est pas associée aux bases
NoSQL :
(a) Eventually consistent
(b) Soft-state
(c) Scalability
(d) Basically Available
36. Laquelle de ces propriétés ne fait pas partie du théorème de CAP :
(a) Partition Tolerance
(b) Consistency
(c) Atomicity
(d) Availability
37. Parmi les techniques suivantes, lesquelles sont utilisées pour faire du Shar-
ding :
(a) DHT
(b) Clustered Index
(c) Map/Reduce
(d) HDFS
38. La propriété Consistency signifie que :
(a) Une donnée n’a qu’un seul état visible quel que soit le nombre de
réplicas
6
(b) Tous les nœuds du système voient exactement les mêmes données au
même moment.
(c) aucune réponse n’est correcte.
39. La technique de sharding :
(a) permet aux bases de données NoSQL d’améliorer un serveur en ajou-
tant sa capacité de stockage
(b) permet aux bases de données NoSQL d’ajouter d’autre machine sans
que l’utilisateur sache qu’on l’a fait.
(c) est l’extensibilité horizontale
40. Les SGBD ”NoSQL” sont des systèmes qui satisfont les propriétés :
(a) Consistance et Disponibilité
(b) Disponibilité et résistant au partitionnement
(c) Cohérence et réesistant au partitionnement
(d) aucune de ces réponses
41. Les caractéristiques d’une base NoSQL sont les suivantes :
(a) Existance d’un schéma pour les données
(b) Données de structures complexes
(c) Difficulté de réplication des données sur plusieurs nœuds.
(d) Privilégie la disponibilité à la cohérence
(e) Transactions sûr et cohérent.
42. Le modèle relationnel a été créé par E.F. Codd.
(a) Vrai
(b) Faux
43. Les bases NoSQL ne peuvent pas assurer la cohérence et la haute dispo-
nibilité ensemble
(a) Vrai
(b) Faux
44. Le théorème CAP est également appelé théorème de Brewer stipule que :
(a) nous ne pouvons obtenir que deux garanties sur trois au maximum
pour une base de données : cohérence, disponibilité et tolérance de
partition.
(b) nous ne pouvons obtenir qu’une garantie sur trois pour une base de
données : cohérence, disponibilité et tolérance de partition.
(c) nous ne pouvons obtenir que deux garanties sur trois au minimum
pour une base de données : cohérence, disponibilité et tolérance de
partition.
45. Choisir la ou les mauvaise(s) réponses :
La Cohérence signifie que :
7
(a) chaque client doit avoir une vue cohérente ou identique des données
(b) Les données doivent rester cohérentes même après l’exécution d’une
opération.
(c) une fois les données écrites, toute requête de lecture doit contenir ces
données
(d) aucune mauvaise réponse.
46. Choisir la ou les mauvaise(s) réponses :
La Disponibilité signifie que :
(a) les données doivent être disponibles pour tous les clients pour les
opérations de lecture et d’écriture.
(b) la base de données doit toujours être disponible et réactive.
(c) Il peut y avoir un léger temps d’arrêt.
(d) aucune mauvaise réponse.
47. Choisir la ou les mauvaise(s) réponses :
La Tolérance de partition signifie que :
(a) le système doit bien fonctionner sur les réseaux distribués.
(b) le système peut continuer son service lorsque certaines de ses grappes
(clusters) deviennent indisponibles.
(c) le système fonctionne bien même si les données ne sont pas par-
tionnées.
(d) aucune mauvaise réponse.
48. Choisir parmi les éléments suivants celle ou ceux qui peuvent être considéré(s)
comme avantages de NoSQL :
(a) Capable de gérer un volume important de données structurées, semi-
structurées et non structurées.
(b) Programmation orientée objet facile à utiliser et flexible.
(c) Réplication difficile.
(d) Il offre des performances rapides et une évolutivité horizontale.
(e) Il peut servir de source de données principale pour les applications
en ligne.
(f) Excelle dans les opérations de bases de données distribuées et multi-
data center.
49. Différence clé entre SQL et NoSQL :
(a) Les bases de données SQL sont évolutives horizontalement, tandis
que les bases de données NoSQL sont évolutives verticalement.
(b) Les bases de données SQL ont un schéma prédéfini alors que les bases
de données NoSQL ont un schéma dynamique pour les données non
structurées.
8
(c) Les bases de données NoSQL conviennent parfaitement à l’environ-
nement exigeant de nombreuses requêtes, tandis que les bases SQL
ne conviennent pas aux requêtes complexes.
(d) Les bases de données SQL ne conviennent pas au stockage de données
hiérarchique. Cependant, la base de données NoSQL convient mieux
au stockage de données hiérarchique.
50. SQL protège activement l’intégrité de votre base de données en fournissant
la conformité ACID tant dis que NoSQL gagne en popularité en vous
permettant de stocker différents types de données ensemble et vous pouvez
facilement évoluer en répartissant plusieurs serveurs.
(a) Vrai
(b) Faux
51. Quels sont les principaux composants du Big Data ?
(a) HDFS
(b) MapReduce
(c) YARN
(d) Tout ce qui précède
52. Sur laquelle des plates-formes suivantes Hadoop s’exécute-t-il ?
(a) Debian
(b) De type Unix
(c) Multiplateforme
53. Les données d’une taille de .....octets sont appelées données volumineuses
(a) Méga
(b) Giga
(c) Téra
(d) Peta
54. Une Transaction de données de la banque est un type de.
(a) Données structurées
(b) Données non structurées
(c) Les deux
(d) aucune de ces réponses
55. Les données volumineux sont de plusieurs formes
(a) Non structurées, structurées et semi-structurées
(b) Non structurées, structurées
(c) Structurées, semi-structurées
(d) Non structurées, semi-structurées.
56. Identifiez les technologies Big Data incorrectes.
(a) Apache kafka
9
(b) Apache Hadoop
(c) Apache Pytorch
(d) Apache Spark
57. Dans quelle langue Hadoop est-il écrit ?
(a) C++
(b) Java
(c) Python
(d) Rust
58. ........ est une collection de données qui est utilisée en volume, mais qui
croı̂t de façon exponentielle avec le temps.
(a) Grande base de données
(b) Grand SGBD
(c) Grand ensemble de données
(d) Big data
59. Identifier les différentes fonctionnalités de Big Data Analytics.
(a) Open source
(b) Récupération des données
(c) Évolutivité
(d) Tout les réponses sont justes.
60. Parmi les options suivantes, choisissez celle qui décrit la raison exacte pour
laquelle l’analyse de données volumineuses est difficile à optimiser.
(a) La technologie pour extraire les données
(b) Le Big data n’est pas difficile à optimiser
(c) À la fois les données et les moyens rentables d’extraire des données
pour en tirer un sens commercial.
(d) Aucunes de ces réponses
61. Tous les éléments suivants décrivent avec précision Hadoop, sauf :
(a) Open source
(b) Basé sur Java
(c) Temps réel
(d) Approche informatique distribuée
62. Lesquels des éléments suivants sont les avantages du traitement du Big
Data ?
(a) Améliorer le service client
(b) Meilleure efficacité opérationnelle
(c) Les entreprises peuvent utiliser des renseignements extérieurs lors de
la prise de décision.
10
(d) Tout ce qui précède.
63. L’analyse de données volumineuses fait ce qui suit, sauf ?
(a) Diffuse les données
(b) Analyse des données
(c) Organise les données
(d) Collecter les données
64. Laquelle des affirmations suivantes est vraie concernant le Big Data ?
(a) Les mégadonnées peuvent être traitées à l’aide de techniques tradi-
tionnelles.
(b) Les mégadonnées font référence à des ensembles de données dont la
taille est d’au moins un pédaoctet.
(c) L’analyse de données volumineuses n’implique pas de techniques de
reporting et d’exploration des données.
(d) Les mégadonnées ont une faible vitesse, ce qui signifie qu’elles sont
générées lentement.
65. Lequel des éléments suivants peut généralement être utilisé pour nettoyer
et préparer le Big Data.
(a) Pandas
(b) U-SQL
(c) Data warehouse
(d) Data lake
66. La classe Mapper est :
(a) Type statique
(b) Genre générique
(c) Type abstrait
(d) Final
67. Parmi les éléments suivants, lequel contrôle le Job dans Hadoop ?
(a) Task class
(b) Mapper class
(c) Job class
(d) Reducer class
68. Les morceaux de taille fixe du travail MapReduce sont connus sous le nom
de...........
(a) Splits
(b) Tasks
(c) Map
(d) Records
69. Identifiez le nœud esclave parmi les suivants.
11
(a) Job node
(b) Data node
(c) Task node
(d) Name node
70. ....... sont des données sur les données.
(a) HDFS
(b) MapReduce
(c) YARN
(d) tous les réponses précédentes sont correctes.
71. A quoi sert le nettoyage des données ?
(a) Pour supprimer les données bruyantes
(b) Transformations pour corriger les mauvaises données
(c) Corriger les incohérences dans les données
(d) Tout ce qui précède.
72. Quelle est la quantité minimale de données qu’un disque peut lire ou écrire
dans HDFS ?
(a) Taille en octets
(b) Taille de bloc
(c) Heap
(d) Aucune de ces réponses n’est correcte.
73. De grandes...... de données sont considérées comme des mégadonnées.
(a) volume
(b) Véracité
(c) Variété
(d) Aucun des éléments mentionnés ci-dessus
74. La véracité garantit que les données sont........
(a) Précis
(b) Incohérence
(c) Une variante
(d) Aucun des éléments mentionnés ci-dessus
75. La validité fait référence à la précision et à l’exactitude des données pour
l’utilisation prévue.
(a) Vrai
(b) Faux
76. Chaque jour, le monde produit des quintillions d’octets de données.
(a) Vrai
(b) Faux
12
77. Le volume, la vélocité et la variété sont........ pour le Big Data,
(a) Intrinsèque
(b) Extrinsèque
(c) Les deux réponses précédentes sont justes,
(d) Aucun des éléments mentionnés ci-dessus.
78. Le pourcentage global des données totales du monde a été créé juste au
cours des deux dernières années est ?
(a) 80%
(b) 85%
(c) 90%
(d) 95%
79. Comment Hadoop a-t-il été nommé ?
(a) Le numéro de cirque préféré du créateur Doug Cutting
(b) Le groupe de rock du lycée Cuttings
(c) L’éléphant en peluche du fils de Cutting
(d) Un son de l’ordinateur portable de Cutting réalisé pendant le développement
de Hadoop.
80. ........possède le plus grand cluster Hadoop au monde.
(a) Google
(b) Linkedin
(c) Facebook
(d) IBM
81. Facebook s’attaque au Big Data avec....... basé sur Hadoop.
(a) le ”Prism project”
(b) ”Prism”
(c) le ”project Big”
(d) le ”Project data”
13