Hadoop

Cargado por

Este documento describe Hadoop y MapReduce. Hadoop es una estructura de software de código abierto para almacenar grandes cantidades de datos y ejecutar aplicaciones en clústeres. MapReduce es un software que se utiliza para procesar grandes cantidades de datos de forma distribuida.

Copyright:

Formatos disponibles

Descargue como PPTX, PDF, TXT o lea en línea desde Scribd

Hadoop

Cargado por

Pool Guzmán Chacón

0% encontró este documento útil (0 votos)

8 vistas19 páginas

Descripción original:

Hadoop

Título original

hadoop

Derechos de autor

Formatos disponibles

PPTX, PDF, TXT o lea en línea desde Scribd

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Descargue como PPTX, PDF, TXT o lea en línea desde Scribd

Descargar como pptx, pdf o txt

0% encontró este documento útil (0 votos)

8 vistas19 páginas

Hadoop

Cargado por

Pool Guzmán Chacón

Copyright:

Formatos disponibles

Descargue como PPTX, PDF, TXT o lea en línea desde Scribd

Descargar como pptx, pdf o txt

Saltar a página

Está en la página 1de 19

Buscar dentro del documento

Integrantes:

Delvis Pool Gusmán Chacón

Emerson Jim Vásquez Sandoval
Jafert Frank Rabines Escorza
Roller Elias Meza Geri

MapReduce
HADOOP
Hadoop es una estructura de software de código
abierto para almacenar datos y ejecutar aplicaciones en
clústeres de hardware comercial. Proporciona almacenamiento
masivo para cualquier tipo de datos, enorme
poder de procesamiento y la capacidad de procesar tareas o
trabajos concurrentes virtualmente ilimitados.
Características
•Capacidad para almacenar y procesar cantidades grandes de cualquier tipo de datos, y además de forma
rápida: Con volúmenes y variedades de datos en constante aumento, especialmente desde las redes sociales y el Internet de
las cosas (IoT), esa es una consideración clave.
•Cuenta con Poder computacional: El modelo de computación distribuida de Hadoop es capaz de procesar grandes
cantidades de datos rápidamente. Cuantos más nodos de computación use, más poder de procesamiento tendrá.
•Tolerante a fallos: El procesamiento de aplicaciones y datos está protegido contra fallas del hardware. Si un nodo se cae,
los trabajos se redirigen de forma automática a otros nodos para asegurarse de que la informática distribuida no falle. Varias
copias de todos los datos se almacenan automáticamente.
•Es muy Flexible: A diferencia de las bases de datos tradicionales, no es necesario procesar previamente los datos antes de
almacenarlos. Puede almacenar tantos datos como usted guste y decidir cómo usarlos más adelante. Eso incluye datos no
estructurados como imágenes, textos o vídeos.
•Es de bajo costo: El marco de código abierto es totalmente gratuito y utiliza hardware básico para almacenar grandes
cantidades de datos.
•Es escalable: Puede hacer crecer fácilmente su sistema para manejar más datos simplemente agregando nodos. Se requiere
poca administración.
MapReduce
Es un software escrito en Java que se utiliza para crear aplicaciones que pueden
procesar grandes cantidades de datos. Aunque está escrito en Java, hay otros idiomas
disponibles para escribir una aplicación MapReduce. Al igual que con HDFS, está
diseñado para ser tolerante a fallas y para trabajar en entornos de clúster a gran
escala. El marco tiene la capacidad de dividir los datos de entrada en tareas más
pequeñas (tareas de mapeo) que se pueden ejecutar en procesos paralelos. La salida de
las tareas del mapa se reduce (reduce la tarea) y generalmente se guarda en el sistema
de archivos.
Para el siguiente ejemplo tomaremos un archivo de texto como entrada, el programa
“WordCount” lo divide en partes más pequeñas y luego cuenta cada palabra y genera un
archivo con un recuento de todas las palabras dentro del archivo.
Iniciamos los servicios
Consola
Creamos directorio
Creamos un directorio en el sistema de archivos hadoop
Copiamos el archivo de prueba

Copiamos el archivo libros.txt al Sistema de

archivos de HADOOP
Ejecutamos el comando mapreduce
Archivos generados

Verificamos la salida del commando anterior

Usando el comando hdfs dfs -cat /user/hadoop/output/part-r-00000

Se muestra el
contenido
del archivo
de resultados
donde se
verá el Resultado
conteo de
palabras.
Flujo MapReduce (WordCount)
Código del archivo hadoop-mapreduce-examples-3.2.1.jar

Código
Archivos generados
Directorio de archivos
Archivos
GRACIAS

También podría gustarte

La Cocina de Los Postres de Oriol Balaguer
Documento125 páginas
La Cocina de Los Postres de Oriol Balaguer
César Chávez Arias
100% (1)
Apache Hadoop
Documento14 páginas
Apache Hadoop
Mauricio Alberto Arce Bolados
0% (1)
Matematicas para Economia Primer Semestre
Documento20 páginas
Matematicas para Economia Primer Semestre
Alex Aguayo
Aún no hay calificaciones
Diagrama de Bloques - Frutas en Almíbar
Documento3 páginas
Diagrama de Bloques - Frutas en Almíbar
Nelly Sofía Vásquez Villacorta
Aún no hay calificaciones
Hadoop
Documento15 páginas
Hadoop
emerson vs
Aún no hay calificaciones
Guia IngenieriaProcesadoMasivoDatos
Documento10 páginas
Guia IngenieriaProcesadoMasivoDatos
Roberto López
Aún no hay calificaciones
Teoria M4
Documento41 páginas
Teoria M4
Luis Molina Reinoso
Aún no hay calificaciones
big data 3
Documento18 páginas
big data 3
fotosg719
Aún no hay calificaciones
Spark para Dummies
Documento6 páginas
Spark para Dummies
jesusdaa1
Aún no hay calificaciones
Ponentes Core
Documento21 páginas
Ponentes Core
Guillermo Rambla
Aún no hay calificaciones
Resumen
Documento4 páginas
Resumen
alex hepburn
Aún no hay calificaciones
Big Data Fundamentals - Ma Afq6e2s
Documento6 páginas
Big Data Fundamentals - Ma Afq6e2s
ALEX ALBERT ZUÑIGA MANRIQUE
Aún no hay calificaciones
01 Hadoop A
Documento36 páginas
01 Hadoop A
RONALD NICOLAS SAENZ CHUQUI
Aún no hay calificaciones
1. Ecosistema Hadoop
Documento19 páginas
1. Ecosistema Hadoop
Luis Angel Alfonso Zamora
Aún no hay calificaciones
4 - HDFS
Documento8 páginas
4 - HDFS
kinyo12
Aún no hay calificaciones
Big Data WorkShop
Documento81 páginas
Big Data WorkShop
Soledad Llashag
Aún no hay calificaciones
Ensayo Hadoop y Spark
Documento4 páginas
Ensayo Hadoop y Spark
Karen Jazmín Jiménez Rodríguez
Aún no hay calificaciones
Herramientas Big Data
Documento31 páginas
Herramientas Big Data
Daniel Parra
Aún no hay calificaciones
INTEGRANTES
Documento6 páginas
INTEGRANTES
Joel Guillen Iparraguirre
Aún no hay calificaciones
Práctica 2.1 Investigación Sobre Hadoop
Documento6 páginas
Práctica 2.1 Investigación Sobre Hadoop
fredosanzz1999
Aún no hay calificaciones
Hadoop Taller PDF
Documento48 páginas
Hadoop Taller PDF
jorgeaponte
Aún no hay calificaciones
Apache Hadoop
Documento27 páginas
Apache Hadoop
Marcelo Espinoza
Aún no hay calificaciones
04 Lab1 - Ejercicios de Prolog
Documento58 páginas
04 Lab1 - Ejercicios de Prolog
Gol D Roger
Aún no hay calificaciones
Whitepaper Hadoop
Documento5 páginas
Whitepaper Hadoop
beto24
Aún no hay calificaciones
Actividad de Transferencia - Procesando Grandes Volúmenes de Datos
Documento5 páginas
Actividad de Transferencia - Procesando Grandes Volúmenes de Datos
Jose Angel Gonzalez
Aún no hay calificaciones
BIGDATA
Documento26 páginas
BIGDATA
nokiaverde23
Aún no hay calificaciones
Examen BIG
Documento6 páginas
Examen BIG
jan carlo hernandez reyes
Aún no hay calificaciones
Procesos - Hilos - Multihilos en La Programación Paralela 2018-7241
Documento9 páginas
Procesos - Hilos - Multihilos en La Programación Paralela 2018-7241
DJUZ Management
Aún no hay calificaciones
Hadoop
Documento36 páginas
Hadoop
Javier Hurtado
Aún no hay calificaciones
Práctico de Hadoop
Documento12 páginas
Práctico de Hadoop
charly.papa.2022
Aún no hay calificaciones
CIPAS Paso3 19 Junio 2
Documento32 páginas
CIPAS Paso3 19 Junio 2
Edupo Palacio
Aún no hay calificaciones
Estrategias para La Migración de Bases de Datos
Documento34 páginas
Estrategias para La Migración de Bases de Datos
Leticia Gómez
Aún no hay calificaciones
1.1.5.PPT Ecosistema Hadoop
Documento22 páginas
1.1.5.PPT Ecosistema Hadoop
16183743-1 MARCELO ANDRES
0% (1)
Base de Datos Transaccional Usando Hive Sobre Hadoop
Documento8 páginas
Base de Datos Transaccional Usando Hive Sobre Hadoop
fjmerchan21
Aún no hay calificaciones
2 - HDFS
Documento19 páginas
2 - HDFS
Angel Pérez Souffront
Aún no hay calificaciones
Apache Hadoop: Introducción 2024 - Aprender BIG DATA
Documento1 página
Apache Hadoop: Introducción 2024 - Aprender BIG DATA
pfidalgo
Aún no hay calificaciones
Actividad 5. Investigación Hadoop
Documento22 páginas
Actividad 5. Investigación Hadoop
Beatriz C.Flores
Aún no hay calificaciones
1 - Hadoop v2
Documento41 páginas
1 - Hadoop v2
LUCY SAMAYRA LUCY SAMAYRA MENDEZ/SANTIAGO
Aún no hay calificaciones
CD - M8 AE1 Contenidos - 2023
Documento12 páginas
CD - M8 AE1 Contenidos - 2023
li_sisay
Aún no hay calificaciones
A1 - Mod2 - Unid1 - Hadoop Almacenamiento y Procesamiento Distribuido
Documento27 páginas
A1 - Mod2 - Unid1 - Hadoop Almacenamiento y Procesamiento Distribuido
Gabriel Vargas Peña
Aún no hay calificaciones
1.2.1 Ecosistema Hadoop
Documento33 páginas
1.2.1 Ecosistema Hadoop
Italo Garrido A
Aún no hay calificaciones
Big Data WorkShop
Documento74 páginas
Big Data WorkShop
Soledad Llashag
Aún no hay calificaciones
Introducciòn Al Big Data Con Apache Hadoop PDF
Documento8 páginas
Introducciòn Al Big Data Con Apache Hadoop PDF
Diego Ruiz
Aún no hay calificaciones
Modulo 4 - Caso Practico B
Documento4 páginas
Modulo 4 - Caso Practico B
sacuanjochenica2021
Aún no hay calificaciones
Evidencia 1 - Grupo 10
Documento16 páginas
Evidencia 1 - Grupo 10
ALEXANDRA CRISTOBAL GUTARRA
Aún no hay calificaciones
Ensayo Hadoop
Documento6 páginas
Ensayo Hadoop
ARVEY RODRIGUEZ GONZALEZ
Aún no hay calificaciones
HDFS
Documento7 páginas
HDFS
Valentina Arana
100% (1)
Hadoop Vs Spark
Documento21 páginas
Hadoop Vs Spark
Jamil Cerezo
Aún no hay calificaciones
Hadoop
Documento8 páginas
Hadoop
Jesus Edwardo Martinez Rodriguez
Aún no hay calificaciones
Mineria de Datos - DataWarehouse Sesion 3
Documento43 páginas
Mineria de Datos - DataWarehouse Sesion 3
Lüiis Mattos
Aún no hay calificaciones
Installing Hadoop
Documento14 páginas
Installing Hadoop
Juan Carlos VC
Aún no hay calificaciones
Introducción a Apache Hadoop
Documento26 páginas
Introducción a Apache Hadoop
rafa.mellado.g
Aún no hay calificaciones
Investigacion
Documento7 páginas
Investigacion
matzhu14
Aún no hay calificaciones
Nucleo de Hadoop
Documento2 páginas
Nucleo de Hadoop
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Arquitectura de La Información
Documento18 páginas
Arquitectura de La Información
javier
Aún no hay calificaciones
Hadoop
Documento105 páginas
Hadoop
Pame Pineda
Aún no hay calificaciones
Sqoop
Documento4 páginas
Sqoop
jhonny ps
Aún no hay calificaciones
Big Data Con Hadoop
Documento10 páginas
Big Data Con Hadoop
Lexx Skyfall
Aún no hay calificaciones
Actividad 5. Investigación Hadoop
Documento18 páginas
Actividad 5. Investigación Hadoop
Beatriz C.Flores
Aún no hay calificaciones
Curso Big Data (Tema 1)
Documento32 páginas
Curso Big Data (Tema 1)
CORAL ALONSO JIMÉNEZ
Aún no hay calificaciones
18-Big Data
Documento3 páginas
18-Big Data
miasitik
Aún no hay calificaciones
Alta Disponibilidad de Hadoop Con Linux
Documento9 páginas
Alta Disponibilidad de Hadoop Con Linux
Nina
Aún no hay calificaciones
Sistemas Operativos: Implantación de Sistemas Operativos (CFGS ASIR)
De Everand
Sistemas Operativos: Implantación de Sistemas Operativos (CFGS ASIR)
Josep Garcia Garcia
Aún no hay calificaciones
Física General III P1F1 Ivonne Bolaños 2019390590
Documento9 páginas
Física General III P1F1 Ivonne Bolaños 2019390590
Ivonne Bolaños
Aún no hay calificaciones
Excel Tablas Dinamicas UTN
Documento15 páginas
Excel Tablas Dinamicas UTN
Diego F Zavala
Aún no hay calificaciones
Fichas Tecnicas Reacciones Quimicas
Documento5 páginas
Fichas Tecnicas Reacciones Quimicas
Jhon Estiben Rodríguez
Aún no hay calificaciones
Ensayo de Flexión Estática en Madera
Documento13 páginas
Ensayo de Flexión Estática en Madera
juanyGT
50% (2)
DILOGÚN
Documento4 páginas
DILOGÚN
Juan Carlos CB
100% (3)
Determinación de Pi Experimento Laboratorio
Documento5 páginas
Determinación de Pi Experimento Laboratorio
sebastian meriño jimenez
Aún no hay calificaciones
Problemario Preparacion de Estandares
Documento3 páginas
Problemario Preparacion de Estandares
ethan pamatz
Aún no hay calificaciones
Aqua
Documento12 páginas
Aqua
Jaime Olmos
Aún no hay calificaciones
Barro 1990 - Gasto Publico y Crecimiento - Notas de Clase
Documento5 páginas
Barro 1990 - Gasto Publico y Crecimiento - Notas de Clase
Guadalupe Vazquez
Aún no hay calificaciones
Aritmética Semana 5 2
Documento5 páginas
Aritmética Semana 5 2
jeyson
50% (2)
Zoometria General
Documento13 páginas
Zoometria General
Joel Cabrera
0% (1)
Sesión de Clase #02
Documento16 páginas
Sesión de Clase #02
Anderson Guevara Chumioque
Aún no hay calificaciones
Logico 2020
Documento269 páginas
Logico 2020
Anonymous 5qFxWAM82L
Aún no hay calificaciones
3m Petrifilm Cuadro Comparativo
Documento1 página
3m Petrifilm Cuadro Comparativo
api-3697331
Aún no hay calificaciones
Informe de Biofisica n2
Documento5 páginas
Informe de Biofisica n2
Ana Margarita Pérez Granados
Aún no hay calificaciones
Datasheet - Milton Roy LMI - PD741-925SI
Documento3 páginas
Datasheet - Milton Roy LMI - PD741-925SI
Frank Rodriguez
Aún no hay calificaciones
Ficha Tecnica Aqua-Liverprot
Documento3 páginas
Ficha Tecnica Aqua-Liverprot
Diego Fernando Rodriguez Zarate
Aún no hay calificaciones
9 Tomografia 141117230739 Conversion Gate01
Documento26 páginas
9 Tomografia 141117230739 Conversion Gate01
Michael Abel Espinoza Salvatierra
Aún no hay calificaciones
Documento Sin Título-1
Documento4 páginas
Documento Sin Título-1
dayomar28
Aún no hay calificaciones
Solucionario Geometría 5º
Documento78 páginas
Solucionario Geometría 5º
laplace2000
75% (4)
SRG - EJ - 10-Espacio Interior (1) - Removed
Documento10 páginas
SRG - EJ - 10-Espacio Interior (1) - Removed
Sol Abt
Aún no hay calificaciones
Lab-Barras de Longitud Infinita
Documento12 páginas
Lab-Barras de Longitud Infinita
Freddy Ayala
Aún no hay calificaciones
Informe Bimestral General Primaria - 2023 - III Bimestre
Documento11 páginas
Informe Bimestral General Primaria - 2023 - III Bimestre
Dionio Sullon Chero
Aún no hay calificaciones
Hemoglobina Glicosilada
Documento2 páginas
Hemoglobina Glicosilada
Andrea Clemente Cevallos de Cabrera
100% (1)
Guía 4 - Termodinámica Grado 11
Documento23 páginas
Guía 4 - Termodinámica Grado 11
Richard Benavides López
Aún no hay calificaciones
Mapa Mental Arquitectura
Documento1 página
Mapa Mental Arquitectura
David Steven ZAMUDIO RAMIREZ
Aún no hay calificaciones
Bus de Datos Del Microprocesador 8086
Documento4 páginas
Bus de Datos Del Microprocesador 8086
Ernesto Ezequiel Lamby Delgado
Aún no hay calificaciones