Informe Pentaho Data Integration - Torrejon Kevin
Informe Pentaho Data Integration - Torrejon Kevin
Informe Pentaho Data Integration - Torrejon Kevin
TEMA:
PROFESOR:
ALUMNO:
2022
INDICE:
1. Software…………………………………………………………....(2)
2. Empresa encargada………………………………………………...(5)
3. Versiones…………………………………………………………..(7)
4. Costo……………………………………………………………….(9)
5. Cursos y Certificaciones…………………………………………...(9)
6. Ejemplo Practico…………………………………………………(11)
7. Bibliografía……………………………………………………….(20)
2
1. Software:
• ¿Qué es?:
Pentaho Data Integration (PDI) también se conoce como Kettle. La cual es una poderosa
independiente de BI, Matt Custer, fue quien diseño y publico este Software con código
abierto en 2005. Posteriormente fue adquirida por la empresa Hitachi Vantara en 2006 y
rebautizada como Pentaho Data Integration. Dentro de este tipo de Software hay muchos
componentes como Spoon, Pan, Kitchen, Carte - todos estos nombres son metáforas
toma de decisiones a partir del análisis de datos, además forma parte de la suite
• Funcionalidad:
Incluye todo tipo de herramientas que están dirigidas principalmente a mejorar el proceso
Con el paso de los años, la tecnología ha ido avanzando de tal forma que los datos
que recolectan diariamente las empresas a través de sus ERP o cualquier otro tipo
3
realmente útil para tomar decisiones. A esta técnica se le ha llamado Business
Por lo tanto, al usar este software de gestión avanzada de datos, que utiliza técnicas ETL
(Extract, Transform y Load) podemos analizar y extraer un gran volumen de datos con el
• Características:
➢ Software multiplataforma.
➢ Diseño liviano.
➢ Intuitivo
➢ Flexibilidad y escalabilidad
➢ Potente.
4
• Herramientas integradas en Pentaho Data Integration:
En Pentaho Data Integration está conformado por una serie de componentes que nos
permiten aplicar técnicas ETL de una forma sencilla. Los principales componentes de
PDI son:
➢ Spoon: es la interfaz gráfica de usuario (GUI) que permite diseñar todo tipo de
➢ Carte: un sencillo servidor web utilizado para ejecutar y supervisar las tareas de
integración de datos.
2. EMPRESA ENCARGADA:
de tecnologías de la información que colabora con negocios para mejorar los costos
extraer perspectivas viables. Los datos son la clave de nuevos flujos de ingresos,
5
costos de la actividad. Sin embargo, hasta ahora no ha surgido una oferta completa
• Datos de la Empresa:
Tel +52-55-52-58-39-70
Fax +52-55-52-92-81-91
• Sedes:
➢ Mexico:
6
➢ JAPON:
➢ USA:
3. Versiones:
• Modelo de negocio con respecto a las versiones:
Pentaho sigue un modelo de negocio de núcleo abierto. Ofrece dos ediciones diferentes de
Pentaho Business Analytics: una edición comunitaria y una edición empresarial. La edición
soporte, servicios y mejoras del producto a través de una suscripción anual. La edición enterprise
está disponible bajo una licencia comercial. La licencia empresarial va acompañada de 3 niveles
7
CUADRO DE VERSIONES MAS RECIENTES:
8
4. Costos:
Carga (ETL) hecha por Pentaho. La herramienta es similar a Safe FME en el sentido de
que proporciona los medios para extraer y transformar datos de una variedad de fuentes
de datos como MySQL, PostgreSQL, Oracle, SQL Server, una variedad de NoSQL, APIs,
Todos los nuevos usuarios obtienen una prueba ilimitada de 14 días. Los planes estándar
oscilan entre 100 y 1.250 dólares al mes, dependiendo de la escala, con descuentos por
pagar anualmente. Los planes de empresa para organizaciones más grandes y casos de
5. Cursos y Certificaciones:
Uso de la herramienta Pentaho Data Integration para ETL y Data warehousing. Hacer el
almacenamiento en la nube
9
o Gestión de bases de datos SQL con PDI
Server
datos
automatizada
10
6. Ejemplo Práctico:
o Ejercicio de procesos ETL (Extract, Transform and Load) con Pentaho Data
Integration:
Para poder poner en practica la herramienta PDI, usaremos en este ejercicio la
transformación de la tabla Clientes perteneciente a la Base de datos Northwind,
implementando la condicional “if field value is null”, el cual nos ayuda a evaluar si el valor
de algún campo en la tabla es “NULL”, reemplazando ello por un valor que nosotros
predefinamos. Y a su vez transfiriendo los datos transformados a otra tabla perteneciente a
una nueva BD.
11
• Conexión al BD “Northwind” y “Prueba” de SQL Server y completamos los datos:
12
• Testeamos la conexión sea exitosa:
13
• Nombramos la conexión, y seleccionamos la conexión de la bd y damos click a “get
SQL select statement”, y elegimos la tabla que usaremos.
• Seleccionamos la condicional “if field value is null” para reemplazar los valores null
dentro de la tabla.
14
• Configuramos esta condicional:
15
• Usamos ahora “Select values” :
16
• Usamos la opción tabla de salida:
17
• Dentro de la bd de destino revisamos la tabla que recibirá los datos este vacía para
recibir los datos de Northwind:
18
• Si se realizó correctamente todo el proyecto debería salir de esta manera:
TABLA NORTHWIND:
19
TABLA PRUEBA:
7. Bibliografía:
➢ Entel Community (2022) ¿Qué es y para qué sirve Pentaho Data Integration? Entel.
Recuperado de: https://ce.entel.cl/grandes-empresas/articulos/pentaho-data-integration/
➢ Source Forge (2022) Pentaho from Hitachi Vantara Files. Recuperado de:
https://sourceforge.net/projects/pentaho/files/
20