Bienvenue sur Scribd !

0% ont trouvé ce document utile (0 vote)

36 vues

TP Map Red

Transféré par

Ce document décrit un atelier sur Hadoop et MapReduce. Il présente des commandes Hadoop pour travailler avec des fichiers dans HDFS et explique brièvement le fonctionnement de MapReduce.

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

TP Map Red

Transféré par

Oumayma Tajir

0% ont trouvé ce document utile (0 vote)

36 vues3 pages

Ce document décrit un atelier sur Hadoop et MapReduce. Il présente des commandes Hadoop pour travailler avec des fichiers dans HDFS et explique brièvement le fonctionnement de MapReduce.

Titre original

TP MAP RED

Copyright

Formats disponibles

PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Ce document décrit un atelier sur Hadoop et MapReduce. Il présente des commandes Hadoop pour travailler avec des fichiers dans HDFS et explique brièvement le fonctionnement de MapReduce.

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Télécharger au format pdf ou txt

0% ont trouvé ce document utile (0 vote)

36 vues3 pages

TP Map Red

Transféré par

Oumayma Tajir

Ce document décrit un atelier sur Hadoop et MapReduce. Il présente des commandes Hadoop pour travailler avec des fichiers dans HDFS et explique brièvement le fonctionnement de MapReduce.

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Télécharger au format pdf ou txt

Passer à la page

Vous êtes sur la page 1sur 3

Rechercher à l'intérieur du document

ATELIER BIG DATA

INITIATION A HADOOP ET MAP-REDUCE

Objectif : Installation de Hadoop Ecosystème et découverte de quelques

composantes

1. Déplacez-vous sous le répertoire ~/TP/data, et y importer le fichier

purchases.txt fourni avec cet atelier

Toutes les commandes interagissant avec le système Hadoop commencent par hadoop
fs. Ensuite, les options rajoutées sont très largement inspirées des commandes Unix
standard.

1. Créer un répertoire dans HDFS, appelé myinput. Pour cela, taper:

hadoop fs –mkdir myinput

2. Pour copier le fichier purchases.txt dans HDFS sous le répertoire myinput, taper
la commande:

hadoop fs –put purchases.txt myinput/

3. Pour afficher le contenu du répertoire myinput, la commande est:

hadoop fs –ls myinput

On obtiendra alors le résultat suivant :

4. Pour visualiser les dernières lignes du fichier, taper:

hadoop fs –tail purchases.txt

Dans le tableau suivant, nous résumons les commandes les plus utilisées dans
Hadoop:

Afficher le contenu du répertoire

hadoop fs –ls racine

Upload un fichier dans hadoop (à partir

hadoop fs –put file.txt
du répertoire courant linux)
Download un fichier à partir de hadoop
hadoop fs –get file.txt
sur votre disque local
hadoop fs –tail file. txt Lire les dernières lignes du fichier
hadoop fs –cat file.txt Affiche tout le contenu du fichier
hadoop fs –mv file.txt newfile.txt Renommer le fichier
hadoop fs –rm newfile.txt Supprimer le fichier
hadoop fs –mkdir myinput Créer un répertoire
hadoop fs –cat file.txt | less Lire le fichier page par page

II. MapReduce

MapReduce est un patron d’architecture de développement permettant de traiter les

données volumineuses de manière parallèle et distribuée. Il se compose
principalement de deux types de programmes:
• Les Mappers : permettent d’extraire les données nécessaires sous forme de
clef/valeur, pour pouvoir ensuite les trier selon la clef
• Les Reducers : prennent un ensemble de données triées selon leur clef, et
effectuent le traitement nécessaire sur ces données (somme, moyenne,
total…)

Exercice 1
Nous continuons à travailler avec le même fichier en entrées (purchases.txt), mais
pour obtenir des résultats différents. Le but est donc d’écrire des Mappers et
Reducers.

1. Donner la liste des ventes par catégorie de produits.

2. Quelle est la valeur des ventes pour la catégorie Toys?
3. Et pour la catégorie Consumer Electronics?

Exercices 2

1. Donnez la liste des ventes par catégorie de produits.

2. Quelle est la valeur des ventes pour la catégorie Toys ?
3. Et pour la catégorie Consumer Electronics ?
4. Donnez le montant de la vente le plus élevé pour chaque magasin
5. Quelle est cette valeur pour les magasins suivants : Reno ? Toledo ?
Chandler ?
6. Quel est le nombre total des ventes et la valeur totale des ventes de tous
magasins confondus ?
7. Quelle est la somme des ventes par jour de la semaine?
8. Quelle est la moyenne des ventes par jour de la semaine?

Vous aimerez peut-être aussi

TP 3 - Exercices Map Reduce
Document3 pages
TP 3 - Exercices Map Reduce
ines
80% (5)
TP Linux
Document43 pages
TP Linux
ABBASSI RABAH
Pas encore d'évaluation
TP MapReduce Python
Document5 pages
TP MapReduce Python
nour elislem
Pas encore d'évaluation
TP1 BigDataAnalytics Initiation Hadoop
Document9 pages
TP1 BigDataAnalytics Initiation Hadoop
Souley
Pas encore d'évaluation
tp1 Initiationahadoopetmapreduce 140428050032 Phpapp02
Document9 pages
tp1 Initiationahadoopetmapreduce 140428050032 Phpapp02
syslinux2000
100% (1)
ABL Cloud
Document9 pages
ABL Cloud
DeBoub Moez
100% (1)
tp1 Enrichie 2018
Document5 pages
tp1 Enrichie 2018
Rania Benamara
Pas encore d'évaluation
Application 1 - Hadoop - MapReduce
Document10 pages
Application 1 - Hadoop - MapReduce
mahmoud rim
Pas encore d'évaluation
tp1 IRS
Document7 pages
tp1 IRS
Zohra CHANNOUF
100% (1)
tp1 Hadoop Mapreduce 2023
Document5 pages
tp1 Hadoop Mapreduce 2023
mohamedfarouk.hamadi
100% (3)
TP1 Hadoop
Document2 pages
TP1 Hadoop
Manel Hkimi
Pas encore d'évaluation
TP1 - HDFS VF
Document9 pages
TP1 - HDFS VF
Chaymae
Pas encore d'évaluation
Atelier 2-Mapreduce
Document3 pages
Atelier 2-Mapreduce
Chorale Voix D'Anges Tunis
Pas encore d'évaluation
tp1 Mapreduce
Document15 pages
tp1 Mapreduce
Ivan003
Pas encore d'évaluation
tp2 Designpatternsdanshadoop 140428050218 Phpapp02
Document6 pages
tp2 Designpatternsdanshadoop 140428050218 Phpapp02
chebinega
Pas encore d'évaluation
Fascicule TP - Hdfs Et Mapreduce
Document5 pages
Fascicule TP - Hdfs Et Mapreduce
Ahmed Kartassi
Pas encore d'évaluation
Big Data
Document16 pages
Big Data
Rima CHEMENGUI
Pas encore d'évaluation
Lab 2
Document3 pages
Lab 2
Hammami Mélek
Pas encore d'évaluation
Big Data tp1
Document6 pages
Big Data tp1
hajrikoussay03
Pas encore d'évaluation
Traitement Du Big Data: TP1 Apache Hadoop: Installation Et Prise en Main
Document24 pages
Traitement Du Big Data: TP1 Apache Hadoop: Installation Et Prise en Main
Hmad SADAQ
Pas encore d'évaluation
CBD TP
Document6 pages
CBD TP
zemer
Pas encore d'évaluation
td01 Hadoop
Document6 pages
td01 Hadoop
aissamemi
Pas encore d'évaluation
Apache Hadoop Installation On Ubuntu (Multi-Node Cluster) .
Document11 pages
Apache Hadoop Installation On Ubuntu (Multi-Node Cluster) .
Hanane Nadi
Pas encore d'évaluation
TP5Bigdata INDIA 2023 2024
Document5 pages
TP5Bigdata INDIA 2023 2024
Zn
Pas encore d'évaluation
Installation Cloudera HDFS
Document5 pages
Installation Cloudera HDFS
noussa79
Pas encore d'évaluation
tp1 Hdfs
Document7 pages
tp1 Hdfs
Raja Bs
Pas encore d'évaluation
tp1 BigData
Document9 pages
tp1 BigData
Haitam Laaouini
Pas encore d'évaluation
Atelier 2 - 3 - 4
Document30 pages
Atelier 2 - 3 - 4
sbai.hanae.uh2
Pas encore d'évaluation
Lab1 Hadoop
Document14 pages
Lab1 Hadoop
Chaima Belhedi
Pas encore d'évaluation
Chapitre2 Hadoop MapReduce
Document28 pages
Chapitre2 Hadoop MapReduce
Amen Mhamdi
Pas encore d'évaluation
Atelier Framework Big Data PDF
Document21 pages
Atelier Framework Big Data PDF
Zohra CHANNOUF
Pas encore d'évaluation
TP1 Initiation Linux
Document6 pages
TP1 Initiation Linux
Mouloud ADDA
Pas encore d'évaluation
Semaine 3
Document63 pages
Semaine 3
benben08
Pas encore d'évaluation
Lab2 Hdfs
Document9 pages
Lab2 Hdfs
Maryâm Bôuch
Pas encore d'évaluation
Mooc Fun Big Data Semaine 9 Hadoop
Document84 pages
Mooc Fun Big Data Semaine 9 Hadoop
MONTCHO Wesley
Pas encore d'évaluation
Travaux Pratique N 1 - 3
Document4 pages
Travaux Pratique N 1 - 3
واحد تونسي
Pas encore d'évaluation
TP #1: Le Traitement Batch Avec Hadoop, Hdfs Et Mapreduce
Document11 pages
TP #1: Le Traitement Batch Avec Hadoop, Hdfs Et Mapreduce
Rim Hancha
Pas encore d'évaluation
TP3 Pig
Document4 pages
TP3 Pig
montaest100
Pas encore d'évaluation
Mickaelbaron-Hadoopinstallation Part4
Document2 pages
Mickaelbaron-Hadoopinstallation Part4
satmania
Pas encore d'évaluation
Resumer Colle TP
Document4 pages
Resumer Colle TP
rizlane korichi
Pas encore d'évaluation
Lab 3
Document15 pages
Lab 3
Maryâm Bôuch
Pas encore d'évaluation
Hive Installation
Document37 pages
Hive Installation
Sana Bakrim
100% (1)
Linux Et Infrastructures 17 01 2022
Document10 pages
Linux Et Infrastructures 17 01 2022
Claude Dongmo
Pas encore d'évaluation
TP2 - HDFS - Etudiants (Copy)
Document4 pages
TP2 - HDFS - Etudiants (Copy)
haha
Pas encore d'évaluation
Exo 1 Avec Commande
Document36 pages
Exo 1 Avec Commande
Kevin Bocko Michel
Pas encore d'évaluation
Hadoop 3.3.6 On Ubuntu 22.04 LTS 1
Document13 pages
Hadoop 3.3.6 On Ubuntu 22.04 LTS 1
ﺟﻮﺍﻫﺮ ﻣﻮﺳى
Pas encore d'évaluation
TP-3 Corrigé
Document5 pages
TP-3 Corrigé
Chaima Benabdallah
Pas encore d'évaluation
TP1 Initiation Linux
Document7 pages
TP1 Initiation Linux
md
Pas encore d'évaluation
Hadoop TP MSBG
Document7 pages
Hadoop TP MSBG
zemer
Pas encore d'évaluation
Fonctionnement Du Système de Fichiers Distribués Hadoop (HDFS)
Document5 pages
Fonctionnement Du Système de Fichiers Distribués Hadoop (HDFS)
Hanane Nadi
Pas encore d'évaluation
TP Hadoop
Document11 pages
TP Hadoop
Jas Min
Pas encore d'évaluation
Atelier HDFS
Document5 pages
Atelier HDFS
Fredj Kriaa
Pas encore d'évaluation
Atelier HDFS
Document6 pages
Atelier HDFS
Samy Hassine
Pas encore d'évaluation
Activité 5.0
Document3 pages
Activité 5.0
bolmanesoukaina9
Pas encore d'évaluation
Installation Des Packages Sous Linux - pptx-1
Document20 pages
Installation Des Packages Sous Linux - pptx-1
elolo-nelsam.gumedzoe
Pas encore d'évaluation
Transcription Organiser Des Fichiers Sous Linux
Document4 pages
Transcription Organiser Des Fichiers Sous Linux
lotokiw465
Pas encore d'évaluation
TP N°1 - Installation Via Paquets
Document6 pages
TP N°1 - Installation Via Paquets
Ferdaous Hd
Pas encore d'évaluation
Gestion de Données Avec HDFS
Document7 pages
Gestion de Données Avec HDFS
z.essiddiqi
Pas encore d'évaluation
LINUX Le Guide des commandes
D'Everand
LINUX Le Guide des commandes
Anna Shellerman
Pas encore d'évaluation
Maitrisez Les Commandes Shell Sous Linux
D'Everand
Maitrisez Les Commandes Shell Sous Linux
Urko Galen
Pas encore d'évaluation
Programme GI4.0 CONFERENCE 2e Edition - 11
Document4 pages
Programme GI4.0 CONFERENCE 2e Edition - 11
mic68hc11
Pas encore d'évaluation
Cours Robotique0
Document21 pages
Cours Robotique0
KOUASSI SALOMON
Pas encore d'évaluation
DM All in One
Document23 pages
DM All in One
Adel Guizani
Pas encore d'évaluation
Logarithmes Exercices de Maths en Terminale Corriges en PDF
Document3 pages
Logarithmes Exercices de Maths en Terminale Corriges en PDF
Maimouna CISSE
Pas encore d'évaluation
Thomas
Document76 pages
Thomas
Hajer Ouled Ahmed
Pas encore d'évaluation
Pieghevole Axone Nemo 2 FR FR v2
Document20 pages
Pieghevole Axone Nemo 2 FR FR v2
Abdelhadi Houssin
Pas encore d'évaluation
Réforme Des Programmes D'ingénieur en Informatique V1
Document88 pages
Réforme Des Programmes D'ingénieur en Informatique V1
MOHAMED NAOUAI
Pas encore d'évaluation
Cadre Enroulé - Tutoriel Photoshop - Ajouter Un Cadre Avec Des Filtres
Document4 pages
Cadre Enroulé - Tutoriel Photoshop - Ajouter Un Cadre Avec Des Filtres
Danie HOLANDE
Pas encore d'évaluation
Comment Créer Un Logiciel Portable
Document7 pages
Comment Créer Un Logiciel Portable
Boussad Nait Messaoud
Pas encore d'évaluation
Cours Liste Chainees
Document10 pages
Cours Liste Chainees
Wa Sim
Pas encore d'évaluation
Terraform
Document49 pages
Terraform
Chaieb Oussema
Pas encore d'évaluation
Transactions - ch3
Document51 pages
Transactions - ch3
sara
Pas encore d'évaluation
Projet 1 Tp-Virtualisation-Et-Parametrage-Ip-1
Document7 pages
Projet 1 Tp-Virtualisation-Et-Parametrage-Ip-1
w2k2nkrr24
Pas encore d'évaluation
Quizz Sur Les Réseaux Informatiques 2
Document9 pages
Quizz Sur Les Réseaux Informatiques 2
kaci
Pas encore d'évaluation
Cours Tableaux Langage C
Document12 pages
Cours Tableaux Langage C
Augustin Tadiamba Pambi
Pas encore d'évaluation
1NB Algèbre Relationnelle (SQL)
Document24 pages
1NB Algèbre Relationnelle (SQL)
Mohammed Laalou
100% (1)
1 TEL01-Introduction v104c PDF
Document10 pages
1 TEL01-Introduction v104c PDF
Pax
Pas encore d'évaluation
Chapitre 1 - Protocoles Mpls Sur WDM
Document25 pages
Chapitre 1 - Protocoles Mpls Sur WDM
ludovic vedrine
Pas encore d'évaluation
Corrigé BDA-TD3-2022-2023
Document8 pages
Corrigé BDA-TD3-2022-2023
Cheriguene Hanene
Pas encore d'évaluation
Tuto-Gpu 2
Document4 pages
Tuto-Gpu 2
ramzi ayadi
Pas encore d'évaluation
5 - Le Pupitre Eleve
Document6 pages
5 - Le Pupitre Eleve
PALO
Pas encore d'évaluation
Bourasse Ilyas 1
Document1 page
Bourasse Ilyas 1
Mohamed Moustaquimi
Pas encore d'évaluation
QCM Vba Excel
Document2 pages
QCM Vba Excel
Onar Gyaf
33% (3)
Présenté Par: BENMGUIRIDA Issam
Document181 pages
Présenté Par: BENMGUIRIDA Issam
KARIMA HADDI
Pas encore d'évaluation
Chapitre 01 Intoduction A La
Document5 pages
Chapitre 01 Intoduction A La
naime pc
Pas encore d'évaluation
Annexe I
Document5 pages
Annexe I
ilyasosiraj
Pas encore d'évaluation
TABLES DE CONVERSION Et TABLE ASCII
Document3 pages
TABLES DE CONVERSION Et TABLE ASCII
KEMBOU Danielle Staelle
Pas encore d'évaluation
TP Access Formation Qualifiante
Document7 pages
TP Access Formation Qualifiante
Makhlouf yamina
Pas encore d'évaluation
Allocation Dynamique de Mémoire
Document43 pages
Allocation Dynamique de Mémoire
ebelle harry
Pas encore d'évaluation
Cours Java MR Niang
Document47 pages
Cours Java MR Niang
Awa Ndione Wade
Pas encore d'évaluation