Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

HDFS

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 7

Big Data:

HDFS
TANYA VALENTINA ARANA GONZÁLEZ
¿Qué es ?
HDFS es un sistema de archivos
distribuido que maneja grandes
conjuntos de datos que se ejecutan en
hardware básico. Se utiliza para
escalar un solo clúster de Apache
Hadoop a cientos (e incluso miles) de
nodos. HDFS es uno de los
componentes principales de Apache
Hadoop, siendo los otros MapReduce
y YARN.

HDFS no debe
confundirse ni
reemplazarse por
Apache HBase , que es
un sistema de
administración de
bases de datos no
relacionales orientado
a columnas que se
encuentra en la parte
superior de HDFS y
puede soportar mejor
las necesidades de
datos en tiempo real
con su motor de
procesamiento en
memoria.
01 03
Recuperación Alojamiento de
rápida de fallas de grandes conjuntos
hardware de datos

Acceso a la
02 transmisión de
datos
04 Portabilidad

Objetivos de los HDFS


En el año 2003, Google publica un
artículo científico en el que detalla
el Google File System (GFS),1​ un
sistema de ficheros distribuido que
ellos mismos diseñan e
implementan, para satisfacer sus
necesidades de almacenar grandes
cantidades de datos, para
posteriormente ejecutar sobre ellos
aplicaciones con una carga
intensiva de procesado de datos.
GFS asienta la arquitectura en la
que posteriormente se basaría
HDFS, que se liberaría como un
proyecto de software libre en la
Apache Software Foundation.

HISTORIA
HDFS
Características

01 02 03 04

HDFS proporciona
HDFS, es un sistema de HDFS no se comporta Como se ha comentado, el redundancia, es decir,
ficheros que está especialmente bien hecho de que el sistema de almacena los ficheros varias
especialmente diseñado cuando lo que se ficheros sea distribuido veces y en varios equipos
para funcionar bien pretende es realizar proporciona ventajas, pues distintos, para evitar que si uno
cuando se almacenan accesos aleatorios a los se pueden almacenar de ellos falla, los datos se
archivos grandes, que archivos, ni cuando muchos más datos que los pierdan. Esto además, permite
posteriormente se estos se actualizan que se podrían almacenar que se pueda emplear
leerán de forma frecuentemente. en una sola máquina. hardware relativamente
secuencial. económico para desplegar
Hadoop, puesto que el sistema
es tolerante de fallos.
ALMACENAMIENTO
Hadoop proporciona una
interfaz para leer y escribir
en HDFS a través de
comandos de consola. Estos
comandos pueden ejecutarse
en cualquier máquina que
tenga instalada Hadoop,
PUNTO PARTIDA
indistintamente de que sea El punto de partida principal
máster o esclavo, siempre para interactuar con HDFS es el
que ejecute el servicio de comando hadoop fs. Ejecutando
HDFS. esta instrucción podemos ver en
pantalla las diferentes
operaciones que podemos
realizar. Esta sección enumera
algunas de las principales.
Bibliografías
GRACIAS POR SU ATENCIÓN

¿Qué es HDFS? Sistema de archivos distribuido Apache


Hadoop. (n.d.). Ibm.com. Retrieved February 23, 2023, from
https://www.ibm.com/es-es/topics/hdfs
Wikipedia contributors. (n.d.). Hadoop Distributed File
System. Wikipedia, The Free Encyclopedia.
https://es.wikipedia.org/w/index.php?
title=Hadoop_Distributed_File_System&oldid=143658228

También podría gustarte