HADOOP
HADOOP
HADOOP
ESPECIALIZACIÓN
EN
HADOOP
PRESENTACIÓN
Social
Data
Consulting
S.A.C
es
una
empresa
orientada
a
brindar
servicios
de
capacitación
y
consultoría
en
herramientas
analíticas
y
metodologías.
Hemos
contribuido
a
desarrollar
analistas
de
datos
en
el
sector
público
y
privado.
Nuestros
programas
y
cursos
de
especialización
se
caracterizan
por
el
método
de
enseñanza
orientado
a
la
resolución
de
casos
reales,
que
final-
mente
contribuyen
a
fortalecer
el
óptimo
aprendizaje
y
a
poner
en
práctica
los
conocimientos
adquiridos.
MISIÓN
Proveer
herramientas
metodológicas,
servicios
de
consultoría
y
capacitaciones
para
que
nues-
tros
clientes
logren
decisiones
exitosas.
VISIÓN
Convertirnos
en
la
empresa
líder
en
capacita-
ciones
y
consultorías
en
el
país,
desarro-
llando
servicios
que
fortalezcan
los
conoci-
mientos
en
metodologías
y
herramientas
analíticas.
SOCIAL
DATA
CONSULTING
PROGRAMA
DE
ESPECIALIZACIÓN
EN
HADOOP
PROGRAMACIÓN ¿A
QUIÉNES
ESTÁ
DIRIGIDO?
INICIO FIN
El
curso
esta
dirigido
a
estudiantes
y
profe-
Sábado Sábado sionales
que
desean
conocer
el
entorno
de
>>
22/08/2020 >>
28/11/2020 Big
Data,
tanto
a
nivel
teórico
y
exploración
de
datos.
SDC
se
reserva
el
derecho
de
realizar
cambios
en
la
fecha
de
inicio
OBJETIVOS
HORARIO
DE
CLASES
Crear
su
máquina
virtual
desde
cero
en
Sabatino Hadoop.
Entender
los
conceptos
princi-
>>
3:00
p.m.
a
7:00
p.m. pales
de
Big
Data
y
las
diferentes
fases
de
su
arquitectura,
también
el
uso
espe-
cífico
de
los
diferentes
componentes
de
Hadoop.
Utilizar
los
diferentes
componen-
tes
en
los
diferentes
laboratorios.
DURACIÓN
15
sesiones PERFIL
DEL
EGRESADO
>>
100
hrs.
académicas
*60
hrs
de
clases
en
los
3
niveles
+
12
hrs
de
evaluación
+
3
hrs
de
laboratorio
=
76
hrs
El
egresado
será
capaz
de
comprender
su
cronológicas
que
hacen
100
hrs
académicas
funcionamiento
y
el
uso
de
Big
Data
con
la
de
45
min. herramienta
Hadoop
como
sus
diferentes
componentes
de
la
Plataforma
Pig,
Sqoop,
Kafka,
Spark,
etc.
También
tendrá
conoci-
mientos
sobre
la
administración
de
los
EVALUACIÓN
ONLINE componentes
y
el
control
de
costos
tanto
localmente
como
en
la
nube.
.
Evaluación
al
termino
de
cada
nivel.
REQUERIMIENTOS
Conocimientos
de
SQL
mínimos.
LABORATORIO Línux
(básico)
Requisitos
mínimos
de
la
PC:
El
curso
contará
con
6
Procesaron
Intel
Core
Procesador
I5
laboratorios. (6M
Cache,3.80
GHz)
Disco
duro
con
500
gb.
Windows
8
en
adelante.
Memoria
Ram:
8gb
SOCIAL
DATA
CONSULTING
HADOOP
SOLUCIONES
BIG
DATA
100
horas
académicas
Hadoop
es
un
marco
de
software
de
código
abierto
para
almacenar
datos
y
ejecutar
aplicaciones
en
clústeres
de
hardware
básico.
Proporciona
almacenamiento
masivo
para
cualquier
tipo
de
datos,
un
enorme
poder
de
proce-
samiento
y
la
capacidad
de
manejar
tareas
o
trabajos
concurrentes
prácticamente
ilimitados.
Aprenda
los
prin-
cipios
fundamentales
detrás
de
él
y
cómo
puede
usar
su
poder
para
dar
sentido
a
su
Big
Data.
En
el
mundo
actual
se
usa
por
el
bajo
costo
de
almacena-
miento
de
bajo
costo
y
archivos
de
datos
de
diferentes
fuentes
para
ejecutar
algoritmos
analíticos
que
ayudar
a
su
organización
a
operar
de
manera
más
eficiente,
descu-
brir
nuevas
oportunidades
y
obtener
la
ventaja
competi-
tiva
del
siguiente
nivel.
El
programa
contará
con
tres
niveles
donde
en
el
nivel
básico
se
presentará
la
teoría
de
Big
data,
la
plataforma
de
Hadoop
y
sus
diferentes
componentes.
En
el
segundo
nivel
veremos
la
aplicación
de
cada
una
de
los
componen-
tes,
entender
el
procesamiento
por
lotes,
en
tiempo
real
y
la
ingesta
de
datos
cada
uno.
Finalmente,
en
el
tercer
nivel
podrá
conocer
la
administración
y
seguridad
de
los
diferentes
componentes
de
Hadoop
y
la
diferencia
entre
una
Infraestructura
de
Computación
de
On
Premise
y
Cloud.
BENEFICIOS
SOCIAL
DATA
CONSULTING
Ahora,
Social
Data
Consulting
será
referencia
en
tu
Curriculum
Vitae.
Culminar
tu
Programa
o
Curso
de
Especialización
exitosamente.
Es
decir,
haber
asistido
a
un
80%
de
las
clases
y
contar
con
una
nota
mínima
de
14
en
promedio
de
las
evaluaciones
realizadas.
Pasado
las
24hrs.
Gerencia
evaluará
y
confirmará
su
solicitud
de
referencia,
proporcionando
todos
los
datos
que
deberá
incluir
en
su
Curriculum
Vitae.
Adicionalmente
a
los
datos
proporcionados
que
incluirá
como
refe-
rencia
en
su
Curriculum
Vitae,
se
emitirá
una
“Constancia
de
Reco-
mendación”
sobre
sus
conocimientos
en
la
herramienta
que
haya
cursado
en
Social
Data
Consulting.
La
Gerencia
se
contactará
con
la
institución
a
la
cual
postulas,
para
proporcionar
las
referencias
profesionales
requeridas.
CONTENIDO
MÓDULO
I
:
BÁSICO
CAPÍTULO
Nº
01:
Introducción
al
Big
Data Principales
componentes
que
conforma
la
plataforma
de
Hadoop
(Apache
Hive,
Apache
Las
Características
de
Big
Data.
Pig,
Apache
Impala,
Apache
Hbase
,Apache
Las
V's
del
Big
Data.
Sqoop,
Apache
Kafka,
Apache
Flume,
Apache
El
impacto
del
Big
Data
en
los
negocios.
Spark).
El
Contexto
de
Big
Data.
El
Ecosistema
de
Big
Data.
CAPÍTULO
Nº
03:
Sistemas
de
Archivos
Desafíos
y
Soluciones
de
Big
Data. Distribuido
y
Procesamiento
Las
Aplicaciones
de
Big
Data.
Principales
Componente
del
núcleo
de
Apache
Hadoop
HDFS.
CAPÍTULO
Nº
02:
Ecosistema
y
Entender
los
componentes
principales
Arquitectura
de
Big
Data
de
Hadoop
como
son
HDFS
y
YARN.
Fuentes
de
Big
Data
Entender
La
replicación
de
los
datos.
Capas
de
la
Arquitectura
de
Big
Data.
Zookeeper
como
servicio
de
configuración
Arquitecturas
para
Ecosistema
de
Big
Data.
distribuido
de
los
diferentes
servicios
de
Ecosistema
de
Hadoop
para
de
Big
Data
Hadoop.
MÓDULO
II:
INTERMEDIO
CAPÍTULO
Nº
04:
Organización
de
los
La
diferencia
entre
Pig
vs
Hive
datos
y
Procesamiento
en
Paralelo Procesamiento
con
Pig
Hbase Hue
y
sus
características
La
diferencia
entre
HDFS
vs
HBase Sqoop
La
diferencia
entre
HBase
vs
RDBMS Como
se
transfiere
datos
entre
Hadoop
y
otras
La
diferencia
entre
SQL
vs
NoSQL Base
de
datos
(Oracle,
Teradata,
SQL
Server,
Arquitectura
de
HBASE Postgress,
MySql,
etc)
Coordinación
del
Zookeeper. Funciones
Sqoop:
Sqoop
Export,
Sqoop
Import,
Comparacion
entre
RDBMS
(Databases)
Sqoop-import-all-tables,
Sqoop
Jobs,
Sqoop
eval,
tables
to
HBase
tables Sqoop-list-databases,
Sqoop-list-tables.
Hadoop
MapReduce
y
Arquitectura
MapReduce.
MapReduce
Job
(tareas
y
características
CAPÍTULO
Nº
06:
Procesamiento
en
avanzadas)
tiempo
real
Spark
CAPÍTULO
Nº
05:
Procesamiento
en
lotes La
diferencia
entre
Spark
Hadoop
Hive Porque usar Spark
La
diferencia
entre
Hive
y
RDBMS
(Databases)
Arquitectura
de
Spark
Lenguajes
de
Spark
(Python,
Scala,
Java,
R)
Arquitectura
de
Hive
Spark
RDD-Resilient
Distributed
Dataset
(RDD),
Hive's
Metastore
–
Hcatalog
Dataframes,
Datasets
Client
Access
(Hive
CLI,
beeline,
Hue)
SOCIAL
DATA
CONSULTING
CONTENIDO
Operaciones
de
Spark
RDD Procesamiento
Real
Time
/
Near
Real
Time
Parte
Spark
SQL Que
es
Kafka
Parte
Spark
Streaming Arquitectura
de
Kafka
Parte
Spark
MLib
(Machine
Learning) Partes
principales
del
Sistema
Kafka
(Producers,
Modul0
Spark
GraphX
(graph) Brokers
,Consumers
,Topics
,Partitions)
•C
onsideración
de
sus
usos.
CAPÍTULO
Nº
07:
Ingesta
de
datos
Apache
Flume
(funcionalidades
e
integración
para
la
ingesta
de
datos).
MÓDULO III: AVANZADO
CAPÍTULO
Nº
08:
Infraestructura
de
Administrando
y
asegurando
los
datos
Computación
On
Premise
y
Cloud
Hadoop.
Modelo
de
responsabilidad
compartida
on
Administrando
y
asegurando
las
aplicaciones
Premise
y
Cloud. Hadoop.
Hadoop
on
Premise
vs.
Hadoop
on
Cloud.
Health
Check
de
Hadoop
TCO
de
Bare-metal
Hadoop. Configuraciones
y
parámetros
TCO
de
Cloud
Hadoop. Distribuciones
Hadoop
para
administración
Ventajas
y
Desventajas
de
On
Premise
y
Cloud
Hadoop.
CAPÍTULO
Nº
10:
Certificaciones
de
Big
Data
CAPÍTULO
Nº
09:
Administración
de
Big
Data
Certifications
Hadoop
y
Seguridad
en
Hadoop
Big
Data
Hadoop
Certifications
Administrando
y
asegurando
el
Cluster
Hadoop.
.
SOCIAL
DATA
CONSULTING
DOCENTE
Prof.
M.Sc.
(c)
MANUEL
SIGÜEÑAS
Data
Scientist
and
SCRUMStudy
Trainer
Profesor
en
Métodos
Computacionales
y
Estadísticos
con
estudios
de
Maestría
en
Esta-
dística
Aplicada
en
la
Universidad
Nacional
Agraria
La
Molina,
Perú.
Agile
Data
Scientist
y
SCRUMstudy
trainer
certificado.
Ha
sido
profesor
invitado
por
el
Departamento
de
Estadística
e
Informática
de
la
UNALM
para
dictar
el
Curso
de
“Text
Mining”.
Profesor
invitado
para
formar
parte
del
Curso
de
Comunicación
Política
en
el
módulo
“Encuestas
Electorales”
organizado
por
ALICE.
Además,
ha
integrado
el
staff
de
profesores
de
la
“Escuela
de
Herramientas
Metodológicas”
organi-
zada
por
ALACIP
en
las
ediciones
de
Uruguay
y
México
dictando
el
curso
“Análisis
Computa-
cional
de
Textos”.
Actualmente,
es
profesor
principal
de
los
Programas
de
Especialización
en
R,
Python
y
Big
Data.
Se
desempeña
como
especialista
en
Big
Data
y
brinda
consultoría
en
Opinión
Pública
y
Metodologías
Cuantitativas
en
Social
Data
Consulting
S.A.C.
Desde
lo
académico,
ha
liderado
investigaciones
en
metodologías
aplicadas
a
Text
Analysis
y
Social
Networks
Analysis
para
el
Fondo
Editorial
de
la
PUCP.
Actualmente
viene
trabajando
en
el
proyecto
“Latin
America
Congress”
en
el
Data
Lab
de
la
PUCP,
espacio
para
desarrollo
de
proyectos
en
ciencia
de
datos.
Posee
diferentes
certificaciones
internacionales,
dentro
de
las
que
podemos
destacar:
Machine
Learning
(UCU),
Metodología
de
Encuestas
(UCU),
Diseños
Experimentales
de
Encuesta
(UCU),
Big
Data
Professional
Certificate
(CertiProf),
Scrum
Developer
Certified
(SDC),
Scrum
Master
Certified
(SMC),
Scrum
Product
Owner
Certified
(SPOC),
SCRUM-
study
Agile
Master
Certified
(SAMC),
SCRUMstudy
Certified
Trainer
(SCT),
Scaled
Scrum
Master
Certified,
entre
otras.
Cuenta
con
más
de
8
años
de
experiencia
en
proyectos
de
investigación
de
mercados,
data
science
y
Business
Intelligence.
SOCIAL
DATA
CONSULTING
NUESTRA
PLATAFORMA
SOCIAL
DATA
CONSULTING
PROGRAMACIÓN
Sesión
1:
22
de
agosto Sesión
2:
29
de
agosto
MÓDULO
I Sesión
3:
05
de
septiembre Sesión
4:
12
de
septiembre
Sesión 1: 19 de septiembre Sesión 2: 26 de septiembre
Sesión
3:
03
de
octubre Sesión
4:
10
de
octubre
MÓDULO
II
Sesión
3:
17
de
octubre Sesión
4:
24
de
octubre
Sesión 5: 31 de octubre
Sesión
1:
07
de
noviembre Sesión
2:
14
de
noviembre
MÓDULO
III Sesión
3:
21
de
noviembre Sesión
4:
28
de
noviembre
CERTIFICACIÓN
Certificado
entregado
a
nombre
de
Social
Data
Consulting
S.A.C.
Empresa
de
capacita-
ción
en
metodologías
y
herramientas
analíticas,
en
colaboración
con
Open
Data
Institute
y
por
ultimo,
será
certificado
por
CertiProf.
Programa
de
Especialización
en
Hadoop:
Soluciones
Big
Data
–
SDC
Learning
Especialista
en
Big
Data
con
Hadoop
-
Open
Data
Institute
Big
Data
Professional
Certificate
(BDPC)
de
CertiProf
SOCIAL
DATA
CONSULTING
NUESTROS
CLIENTES
NUESTROS PARTNERS
SOCIAL
DATA
CONSULTING
Psje.
Los
Pinos
156,
Of.
608
Miraflores,
Lima
Central
telefónica:
(01)
309
0307
946
344
583
999
001
462
cursos@socialdataperu.com
www.socialdataperu.com/learning