¡Te damos la bienvenida a Scribd!

0% encontró este documento útil (0 votos)

24 vistas

Crear Cluster Google Cloud Storage

Cargado por

El documento describe los pasos para crear un bucket en Google Cloud Storage y un clúster Hadoop en Google Cloud, así como cargar y acceder a datos.

Copyright:

Formatos disponibles

Descargue como PDF, TXT o lea en línea desde Scribd

Crear Cluster Google Cloud Storage

Cargado por

jhon hernandez

0% encontró este documento útil (0 votos)

24 vistas10 páginas

El documento describe los pasos para crear un bucket en Google Cloud Storage y un clúster Hadoop en Google Cloud, así como cargar y acceder a datos.

Título original

crear-cluster-google-cloud-storage

Derechos de autor

Formatos disponibles

PDF, TXT o lea en línea desde Scribd

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

El documento describe los pasos para crear un bucket en Google Cloud Storage y un clúster Hadoop en Google Cloud, así como cargar y acceder a datos.

Copyright:

Formatos disponibles

Descargue como PDF, TXT o lea en línea desde Scribd

Descargar como pdf o txt

0% encontró este documento útil (0 votos)

24 vistas10 páginas

Crear Cluster Google Cloud Storage

Cargado por

jhon hernandez

El documento describe los pasos para crear un bucket en Google Cloud Storage y un clúster Hadoop en Google Cloud, así como cargar y acceder a datos.

Copyright:

Formatos disponibles

Descargue como PDF, TXT o lea en línea desde Scribd

Descargar como pdf o txt

Saltar a página

Está en la página 1de 10

Buscar dentro del documento

Creación de Bucket Google Cloud Storage

Wilder Ramírez Delgado

El propósito de esta guía es proporcionar un paso a paso detallado para crear un clúster Hadoop en
la plataforma de Google y llevar a cabo operaciones con PySpark y HDFS sobre él. Se mostrará
cómo crear un bucket en Google Cloud Storage, activar la API necesaria, crear el clúster Hadoop,
cargar un archivo CSV, verificar los productos de administración del clúster y finalmente ejecutar
algunos comandos en HDFS. Se utilizará la prueba gratuita ofrecida por Google, lo que nos
permitirá realizar pruebas iniciales y de concepto sin costo.

1- Crear el Bucket
Inicialmente seleccionamos la opción data storage, del menú lateral:

Seleccionamos la opción “Crear” lo despliega la interfaz de captura de datos del Bucket:

Una vez finalizada esta componente ya se cuenta con un Bucket para almacenar los datos del
proyecto

2 - Activar la API dataproc

Para activar los servicios de Google, es necesario realizar la activación de la API correspondiente.
Para ello, nos dirigimos a la sección "APIs & Servicios" y procedemos con la activación. Al
completar el proceso, debería visualizarse de la siguiente manera:

3 – Crear Clúster
Una vez surgidos los pasos anteriores se procede a crear el clúster, para que exista concordancia con
la guía de la actividad se generará con la consola de Google, y un script predeterminado.
Inicialmente debemos tener claro los detalles del proyecto sobre el cual estamos generando la
actividad según se observa:
Luego se activa la consola de Google mediante la opción de la esquina superior derecha:

Con mas detalle:

El script que va a utilizarse para el proceso es el siguiente:

gcloud beta dataproc clusters create unircluster \

--enable-component-gateway \
--bucket unirbucket-01 \
--region europe-west1 \
--zone europe-west1-c \
--master-machine-type n1-standard-1 \
--master-boot-disk-size 500 \
--num-workers 2 \
--worker-machine-type n1-standard-1 \
--worker-boot-disk-size 500 \
--image-version 1.4-debian10 \
--properties spark:spark.jars.packages=org.apache.spark:spark-sql-kafka-0-
10_2.11:2.4.0 \
--optional-components ANACONDA,JUPYTER,ZOOKEEPER \
--max-age 14400s \
--project unirproject-418920

Una vez en la consola se procede a ejecutar el script anterior tomando en cuenta: el nombre del
clúster, el nombre del Bucket y el id del proyecto:
Una vez ejecutada la acción se observará el clúster “En ejecución”:

Sobre el clúster mencionado pueden observarse las diferentes opciones de monitoreo y gestión,
como son:

DASHBOARD GENERAL:
DETALLE DE LOS NODOS:

DETALLES GENERALES DEL CLÚSTER:

INTERFACES WEB:

YARN RESOURCE MANAGER

MAPREDUCE JOB HISTORY

SPARK HISTORY SERVER

HDFS NAMENODE
HDFS BROWSE FILESYSTEM

JUPYTER

JUPYTER LAB
4- CARGUE DE ARCHIVOS AL CLÚSTER
Una vez en jupyterlab se procede a cargar la información en el clúster, utilizando las opciones
mostradas:

Es posible que al cargar el archivo csv, debido al tamaño del mismo se generen errores de cargue,
por tal razón se recomienda el cargue de manera comprimida (archivo .zip)

Para descomprimir el archivo de clic en la opción “terminal” el cual es el shell del entorno de
trabajo del clúster:

Genere la descompresión del archivo .zip, utilizando el comando “unzip” del linux:
No olvidar que pese a que ella archivo csv ya se encuentra en el clúster aun no ha sido incorporado
al Hdfs, lo cual deberá realizarse mediante las ordenes especificas de Hdfs (ayuda: ver uso del
comando “put”)

De igual manera realice el cargue del Notebook en el clúster:

5 - ejemplos de comandos Hdfs

Reporte HDFS:
Listado de archivos del clúster:

Búsqueda recursiva de archivos:

También podría gustarte

Tarea 2 Calidad en La Industria
Documento10 páginas
Tarea 2 Calidad en La Industria
CARMEN
100% (1)
Aprender Docker, un enfoque práctico
De Everand
Aprender Docker, un enfoque práctico
José Juan Sánchez Hernández
Calificación: 5 de 5 estrellas
5/5 (3)
Examen Final Multimedia Completo
Documento7 páginas
Examen Final Multimedia Completo
Ing. angel yariel
Aún no hay calificaciones
Actividad de Aprendizaje 4 Implantación de Sistemas de Software Libre
Documento26 páginas
Actividad de Aprendizaje 4 Implantación de Sistemas de Software Libre
elmer villagran
Aún no hay calificaciones
19-+Prácticas-Dockerfile Nginx Bueno
Documento6 páginas
19-+Prácticas-Dockerfile Nginx Bueno
Brando Jahir Toma la Vinces
Aún no hay calificaciones
Guía Facil de Penetración de Directorio Activo Nivel Principiante
Documento28 páginas
Guía Facil de Penetración de Directorio Activo Nivel Principiante
Emanuel Rodriguez
Aún no hay calificaciones
Tutorials
Documento8 páginas
Tutorials
Juanca
Aún no hay calificaciones
C3.AP.14. Componente de Presentación - CORS e Introducción A Vue
Documento13 páginas
C3.AP.14. Componente de Presentación - CORS e Introducción A Vue
Cristian Camilo Sandoval
Aún no hay calificaciones
UD 3.05.04 - Caso Practico 02 - Balanceo de Carga Con HAProxy
Documento7 páginas
UD 3.05.04 - Caso Practico 02 - Balanceo de Carga Con HAProxy
Esther Nieto Medina
Aún no hay calificaciones
Instalación de PHP 8.1 - Windows - Scriptcase Manual
Documento21 páginas
Instalación de PHP 8.1 - Windows - Scriptcase Manual
Miguel
Aún no hay calificaciones
Practicas Docker Alumnos
Documento8 páginas
Practicas Docker Alumnos
Ángela Chica
Aún no hay calificaciones
AWStats Ref Windows ApacheYPerl
Documento9 páginas
AWStats Ref Windows ApacheYPerl
Rocío Quiliano
Aún no hay calificaciones
22 Práctica Docker Compose Mean Stack
Documento12 páginas
22 Práctica Docker Compose Mean Stack
Brando Jahir Toma la Vinces
Aún no hay calificaciones
Anexos Instalación
Documento30 páginas
Anexos Instalación
Henry Mayorga
Aún no hay calificaciones
Servidor de Aplicaciones-Glassfish PDF
Documento24 páginas
Servidor de Aplicaciones-Glassfish PDF
onominoooo
Aún no hay calificaciones
Instalar Oracle 10g Release 2 en Ubuntu Edgy
Documento12 páginas
Instalar Oracle 10g Release 2 en Ubuntu Edgy
hocv88
Aún no hay calificaciones
03 - Configurar El Servidor
Documento7 páginas
03 - Configurar El Servidor
Diego Santibañez
Aún no hay calificaciones
SL - 013 Contenido Especializado - Instalacion y Uso de Ocs Inventory
Documento45 páginas
SL - 013 Contenido Especializado - Instalacion y Uso de Ocs Inventory
Jetsimar Alessandro
100% (1)
BigData Tools
Documento10 páginas
BigData Tools
Camilo Alexander Calderón
Aún no hay calificaciones
Pasos para Crear y Desplegar Un Contenedor de Docker Con FastAPI
Documento4 páginas
Pasos para Crear y Desplegar Un Contenedor de Docker Con FastAPI
Héctor Argumedo
Aún no hay calificaciones
Servidor de Aplicaciones-Glassfish (Preinforme 2) PDF
Documento18 páginas
Servidor de Aplicaciones-Glassfish (Preinforme 2) PDF
onominoooo
Aún no hay calificaciones
Actividad de Aprendizaje 4 Implantacion de Sistemas de Software Libre
Documento26 páginas
Actividad de Aprendizaje 4 Implantacion de Sistemas de Software Libre
Bruce Wayne
Aún no hay calificaciones
B Azargado Computacionnube
Documento15 páginas
B Azargado Computacionnube
Bastian Azargado
Aún no hay calificaciones
Despliegue de Poc en Cluster Eks
Documento10 páginas
Despliegue de Poc en Cluster Eks
carlosdataphone
Aún no hay calificaciones
Instalacion IceScrum Ubuntu10.04
Documento7 páginas
Instalacion IceScrum Ubuntu10.04
Juan Diego
Aún no hay calificaciones
Lpic 2
Documento9 páginas
Lpic 2
Henry Wilson
Aún no hay calificaciones
#Sudo Apt Install y Virtualbox Virtualbox-Ext-Pack
Documento25 páginas
#Sudo Apt Install y Virtualbox Virtualbox-Ext-Pack
Nicolas Polo
Aún no hay calificaciones
FacturaloPeru - Manual de Instalación - 10-18
Documento11 páginas
FacturaloPeru - Manual de Instalación - 10-18
UnPocoDeTodo Peru
Aún no hay calificaciones
Actividad 4. Implantación de Sistemas de Software Libre.
Documento27 páginas
Actividad 4. Implantación de Sistemas de Software Libre.
juan
100% (2)
Proyecto Docker Php-Apache
Documento25 páginas
Proyecto Docker Php-Apache
netcat72984
Aún no hay calificaciones
Apache Directory Studio - Admin Is Trac Ion Grafica de OpenLDAP
Documento14 páginas
Apache Directory Studio - Admin Is Trac Ion Grafica de OpenLDAP
davids223
Aún no hay calificaciones
Nginx
Documento9 páginas
Nginx
culo
Aún no hay calificaciones
Curso Liquibase - Configuración de Ambiente
Documento10 páginas
Curso Liquibase - Configuración de Ambiente
raul oregel
Aún no hay calificaciones
Facturalo Perú - Guía Acceso A Base de Datos
Documento3 páginas
Facturalo Perú - Guía Acceso A Base de Datos
UnPocoDeTodo Peru
Aún no hay calificaciones
Docker Apache Container
Documento4 páginas
Docker Apache Container
VectorySigma
Aún no hay calificaciones
Actividad 4 Implantacion de Sistemas de Software Libre
Documento27 páginas
Actividad 4 Implantacion de Sistemas de Software Libre
Luis Gerardo Sanchez
Aún no hay calificaciones
Bulma 441
Documento3 páginas
Bulma 441
אהבה אהבה
Aún no hay calificaciones
Instalacion y Configuracion de Servidor Web Apache
Documento4 páginas
Instalacion y Configuracion de Servidor Web Apache
alberto
Aún no hay calificaciones
Laboratorio No. 3
Documento12 páginas
Laboratorio No. 3
Jair Campos
Aún no hay calificaciones
SEGURIDAD EN SISTEMAS OPERATIVOS - PEC1 - Manuel Berto
Documento10 páginas
SEGURIDAD EN SISTEMAS OPERATIVOS - PEC1 - Manuel Berto
Manuel Berto
Aún no hay calificaciones
Manual Instalacion Quipux 2
Documento11 páginas
Manual Instalacion Quipux 2
Jm Néjer
Aún no hay calificaciones
Guillermo Swenson T1 M1 Base Datos
Documento13 páginas
Guillermo Swenson T1 M1 Base Datos
Lynch
Aún no hay calificaciones
Leccion 6_Google Cloud Platform
Documento11 páginas
Leccion 6_Google Cloud Platform
claudeuniversidad
Aún no hay calificaciones
Como Instalar SQL Server en Ubuntu 20 04
Documento9 páginas
Como Instalar SQL Server en Ubuntu 20 04
vitry
Aún no hay calificaciones
Práctica Docker
Documento8 páginas
Práctica Docker
navajasgarciagonzalo
Aún no hay calificaciones
Odoo Adrian Silva Boceta
Documento24 páginas
Odoo Adrian Silva Boceta
Jefferson Salvador
Aún no hay calificaciones
OWNCLOUD Instalacion Paso A Paso Ubuntu 18.04
Documento5 páginas
OWNCLOUD Instalacion Paso A Paso Ubuntu 18.04
josue medina
Aún no hay calificaciones
DESPLIEGUES DE APLICACIONES WEB Practica 6
Documento26 páginas
DESPLIEGUES DE APLICACIONES WEB Practica 6
Fernanda González
Aún no hay calificaciones
UD 08.3 - Actividades - Software para Administración Gráfica de Linux
Documento5 páginas
UD 08.3 - Actividades - Software para Administración Gráfica de Linux
love.darkness.life
Aún no hay calificaciones
Kubernetes
Documento6 páginas
Kubernetes
coroline24
Aún no hay calificaciones
Spark Apache Ejemplo
Documento15 páginas
Spark Apache Ejemplo
jose abner giraldo herrera
Aún no hay calificaciones
Erick - Vazquez - ACTIVIDAD 4 - Sistemas Abiertos de Software
Documento31 páginas
Erick - Vazquez - ACTIVIDAD 4 - Sistemas Abiertos de Software
Erick Vázquez
Aún no hay calificaciones
DAW03 Tarea
Documento7 páginas
DAW03 Tarea
AlbertoMartín
Aún no hay calificaciones
Instalacion de Nextcloud
Documento9 páginas
Instalacion de Nextcloud
clopez5556
Aún no hay calificaciones
Cypress Intro WHIZ
Documento19 páginas
Cypress Intro WHIZ
Andrés Arévalo
Aún no hay calificaciones
Práctica 1 de Laboratorio BD 2 - Instalacion de La Base de Datos Oracle 12c, Mysql y PostGRESQL - Alvaro Mejia - 2018
Documento9 páginas
Práctica 1 de Laboratorio BD 2 - Instalacion de La Base de Datos Oracle 12c, Mysql y PostGRESQL - Alvaro Mejia - 2018
Open Eyes
Aún no hay calificaciones
Nstalar Oracle 10g Release 2 en Ubuntu
Documento38 páginas
Nstalar Oracle 10g Release 2 en Ubuntu
David Delapava
Aún no hay calificaciones
Manual Instalação AXPOT V4.3.0
Documento10 páginas
Manual Instalação AXPOT V4.3.0
gabrinando
Aún no hay calificaciones
Data University - Laboratorio 1 WORD
Documento8 páginas
Data University - Laboratorio 1 WORD
nachoguiradozuriaga
Aún no hay calificaciones
Actividad 2.2
Documento15 páginas
Actividad 2.2
Jordan Gonzalez
Aún no hay calificaciones
Aprende a Programar para Android
De Everand
Aprende a Programar para Android
Ángel Arias
Calificación: 5 de 5 estrellas
5/5 (3)
Programación Java - Una Guía para Principiantes para Aprender Java Paso a Paso
De Everand
Programación Java - Una Guía para Principiantes para Aprender Java Paso a Paso
Troy Dimes
Calificación: 3.5 de 5 estrellas
3.5/5 (8)
Tema 2. INTRODUCCIÓN AL DISEÑO DE LAS BASES DE DATOS RELACIONALES
Documento24 páginas
Tema 2. INTRODUCCIÓN AL DISEÑO DE LAS BASES DE DATOS RELACIONALES
jhon hernandez
Aún no hay calificaciones
Tema 3. BASES DE DATOS RELACIONALES
Documento16 páginas
Tema 3. BASES DE DATOS RELACIONALES
jhon hernandez
Aún no hay calificaciones
Instalacion Hadoop Maquina Virtual Version VERSION - 1 - 0
Documento13 páginas
Instalacion Hadoop Maquina Virtual Version VERSION - 1 - 0
jhon hernandez
Aún no hay calificaciones
Instalación Hadoop
Documento11 páginas
Instalación Hadoop
jhon hernandez
Aún no hay calificaciones
Introducción Al Free Pascal
Documento7 páginas
Introducción Al Free Pascal
Larios Wilson
Aún no hay calificaciones
Arquitectura y Mantenimiento de Computadores
Documento3 páginas
Arquitectura y Mantenimiento de Computadores
juancarlosvesga
100% (2)
Practica 1 Zigbee
Documento17 páginas
Practica 1 Zigbee
Efrén Sinh
Aún no hay calificaciones
Eclipse
Documento29 páginas
Eclipse
gdejon
Aún no hay calificaciones
Funciones Con Cadenas de Caracteres
Documento12 páginas
Funciones Con Cadenas de Caracteres
Marce Lopez
Aún no hay calificaciones
Tarea - Protocolo de Comunicacion FireWire
Documento3 páginas
Tarea - Protocolo de Comunicacion FireWire
Sofia Gonzalez
Aún no hay calificaciones
Arquitectura ARM
Documento5 páginas
Arquitectura ARM
diegoalbertocobos
Aún no hay calificaciones
IT Infrastructure - INTUNE CONFIG IOS ESPAÑOL
Documento27 páginas
IT Infrastructure - INTUNE CONFIG IOS ESPAÑOL
santiago gil
Aún no hay calificaciones
Winox L R - Es
Documento8 páginas
Winox L R - Es
pep
Aún no hay calificaciones
Actividad de Puntos Evaluables - Escenario 2 - SEGUNDO BLOQUE-TEORICO - PENSAMIENTO ALGORITMICO
Documento5 páginas
Actividad de Puntos Evaluables - Escenario 2 - SEGUNDO BLOQUE-TEORICO - PENSAMIENTO ALGORITMICO
Jinna Hernandez
Aún no hay calificaciones
Tipos de Programación
Documento3 páginas
Tipos de Programación
Jg Apps y mas
Aún no hay calificaciones
U3. Ensamblaje
Documento9 páginas
U3. Ensamblaje
James Williams
Aún no hay calificaciones
Pérez Panduro, Martín Humberto (Ok)
Documento1 página
Pérez Panduro, Martín Humberto (Ok)
Mauro Arroyo
Aún no hay calificaciones
Estructuras de Control PSeInt
Documento6 páginas
Estructuras de Control PSeInt
Dana Gomez
Aún no hay calificaciones
Fundamentos de Programación Estructuras de Repetición Semana 4 Tema 6
Documento22 páginas
Fundamentos de Programación Estructuras de Repetición Semana 4 Tema 6
David Nagato
Aún no hay calificaciones
Lab 03 Lenguajes de Programación
Documento7 páginas
Lab 03 Lenguajes de Programación
P T R
Aún no hay calificaciones
05 EspecificacionPackTmenu v1.0
Documento11 páginas
05 EspecificacionPackTmenu v1.0
Proli sac
Aún no hay calificaciones
Planificación, Programación y Gestión de Proyectos
Documento3 páginas
Planificación, Programación y Gestión de Proyectos
m3talmaniaco
Aún no hay calificaciones
Historia de Delphi
Documento10 páginas
Historia de Delphi
joseph chavez
Aún no hay calificaciones
PRÁCTICA Nº19 Análisis de Las Tablas ARP
Documento2 páginas
PRÁCTICA Nº19 Análisis de Las Tablas ARP
Marcos Medina
Aún no hay calificaciones
Cómo Ser Un Buen Codificador de Software
Documento7 páginas
Cómo Ser Un Buen Codificador de Software
Rodolfo Gonzalez
Aún no hay calificaciones
Código Malicioso
Documento27 páginas
Código Malicioso
Hugo Tinoco
Aún no hay calificaciones
Redes Con Plcs S7-200 Y LA RED PPI: Facultad de Ingeniería Universidad Mayor de San Andrés
Documento16 páginas
Redes Con Plcs S7-200 Y LA RED PPI: Facultad de Ingeniería Universidad Mayor de San Andrés
Cristian Apaza Flores
Aún no hay calificaciones
Contenido Semana 8
Documento26 páginas
Contenido Semana 8
Alex Labraña Rojo
Aún no hay calificaciones
M3-Programación Orientada A Objetos PDF
Documento26 páginas
M3-Programación Orientada A Objetos PDF
Carmen castillo lopez
Aún no hay calificaciones
Esap Abap Programacion Dialogo-Table Control y Mas
Documento88 páginas
Esap Abap Programacion Dialogo-Table Control y Mas
Kensai Kenshin Ryokuda
Aún no hay calificaciones
CVClaudia Ivonne Campos Zuñiga
Documento2 páginas
CVClaudia Ivonne Campos Zuñiga
Yair AC
Aún no hay calificaciones
Características MongoDB
Documento4 páginas
Características MongoDB
paul
100% (1)