Examen
Examen
Examen
1. Escenario 1: Está trabajando en una empresa que tiene muchos puntos de venta y la
información distribuida en estos puntos de venta en bases de datos relacionales. Se
requiere consolidar la información cada hora, procesarla para que el comité de dirección
pueda visualizarla en un dashboards y tomar decisiones respecto a las diferentes
campañas. Diseñe una solución para la necesidad planteada. ¿Qué herramientas usaría?
Justifique los motivos que lo llevaron a definirse por esa solución y las herramientas.
2. La empresa XYZ tiene tres aplicaciones y cada una tiene su propia base de datos
transaccional (Oracle, SQL, SERVER, MySQL). Cada aplicación tiene su propia base de
datos de clientes. Diseñe una solución para crear y centralizar la información de los
clientes y proporcionar una única fuente de información de los clientes. No se olvide de
la calidad. ¿Qué herramientas usaría? Justifique los motivos que los llevaron a definirse
por esa solución y las herramientas.
Para resolver el problema planteado utilizando AWS (Amazon Web Services) y GCP
(Google Cloud Platform), seguiremos un enfoque detallado paso a paso. El objetivo es
centralizar la información de los clientes que provienen de múltiples bases de datos
transaccionales (Oracle, SQL Server, MySQL) y proporcionar una única fuente de verdad
que garantice la calidad de los datos.
• AWS Glue:
• Servicio de ETL (Extract, Transform, Load) totalmente administrado.
• Permite conectarse a diversas bases de datos (Oracle, SQL Server, MySQL)
mediante conectores JDBC.
• Realiza la extracción de los datos de cada base de datos transaccional.
2. Almacenamiento centralizado
• Amazon Redshift:
• Un almacén de datos (Data Warehouse) que centraliza toda la información en un
formato analítico.
• Los datos de cada base de datos transaccional se cargan en tablas específicas en
Redshift.
• Amazon QuickSight:
• Plataforma de inteligencia de negocios (BI) para visualizar la información
consolidada de los clientes.
• Facilita la generación de reportes en tiempo real.
• Cloud Dataflow:
• Plataforma de procesamiento de datos basada en Apache Beam.
• Realiza las tareas de extracción, transformación y carga desde las bases de datos
Oracle, SQL Server y MySQL hacia un almacenamiento centralizado.
2. Almacenamiento centralizado
• BigQuery:
• Un almacén de datos de GCP que centraliza y almacena los datos integrados de
todas las fuentes.
• Permite consultas rápidas en grandes volúmenes de datos.
• Dataplex:
• Herramienta para gobernanza de datos en GCP.
• Facilita la aplicación de políticas de calidad, seguridad y catalogación de datos de
forma centralizada.
4. Visualización de los datos
• Looker:
• Herramienta de BI en GCP que permite la creación de dashboards e informes.
• Conecta directamente con BigQuery para generar reportes en tiempo real.
Justificación de la Solución
Conclusión
Ambas soluciones, tanto con AWS como con GCP, resuelven el problema al:
Para resolver el problema de diseño de un data warehouse utilizando AWS y GCP, te daré un
paso a paso sobre cómo implementarlo en ambos entornos. Esto permitirá integrar y consolidar
datos provenientes de diversas fuentes (clientes, productos, puntos de venta, canales, facturas,
geografía) para obtener inteligencia de negocios.
Paso 1: Definición del Modelo de Datos
Primero, identificamos las tablas necesarias y sus relaciones:
Diseñaremos un modelo estrella o snowflake para la base de datos del data warehouse, con
una tabla hecho (fact)principal que registra las transacciones, y varias dimensiones (clientes,
productos, canales, etc.).
Flujo en AWS:
Flujo en GCP:
Flujo:
Flujo:
5. La Fintech FFF dispuso un formulario en su App para que clientes actuales o potenciales
hagan una solicitud de crédito. El formato de la solicitud llega en formato JSON y además
el cliente anexa documentación en formatos PDF, gif y jpeg. La información debe ser
almacenada y procesada a través de una API ya desarrollada y luego enviar una
respuesta al cliente de la aprobación o rechazo de la solicitud a través de una
notificación push en un máximo de tres minutos. Diseñe una solución para este caso de
uso. ¿Qué herramientas usaría? Justifique los motivos que lo llevaron a definirse por
esta solución y las herramientas seleccionadas.
1. Amazon API Gateway: Exponer la API existente al cliente para recibir solicitudes.
2. AWS Lambda: Procesar la lógica de negocio y realizar validaciones en tiempo real.
3. Amazon S3: Almacenar los documentos adjuntos.
4. Amazon DynamoDB: Almacenar datos temporales o resultados de las solicitudes.
5. Amazon SNS (Simple Notification Service): Enviar notificaciones push al cliente.
6. Amazon CloudWatch: Monitorear tiempos de procesamiento y fallos.
Flujo en AWS
1. Recepción de la Solicitud:
a. El cliente envía la solicitud en JSON y los archivos adjuntos mediante la API
expuesta con API Gateway.
2. Almacenamiento de Archivos:
a. La API carga los archivos en un bucket de S3.
3. Procesamiento con Lambda:
a. Una función AWS Lambda valida la solicitud y los documentos, además de
consultar otros sistemas si es necesario para aprobar o rechazar el crédito.
4. Almacenamiento del Resultado:
a. Se guarda temporalmente el resultado en DynamoDB para trazabilidad.
5. Notificación al Cliente:
a. SNS envía una notificación push al cliente con el resultado de su solicitud.
6. Monitoreo del Sistema:
a. CloudWatch verifica que todas las solicitudes se procesen en menos de tres
minutos.
Flujo en GCP
1. Recepción de la Solicitud:
a. La API expuesta mediante Google API Gateway recibe la solicitud en formato
JSON con archivos adjuntos.
2. Almacenamiento de Archivos:
a. Los archivos se guardan en Cloud Storage para asegurar su disponibilidad.
3. Procesamiento con Cloud Functions:
a. Una Cloud Function valida la solicitud y consulta bases de datos para determinar
si el crédito es aprobado o rechazado.
4. Almacenamiento del Resultado:
a. El resultado se guarda en Firestore o Cloud SQL para futuras referencias.
5. Notificación Push:
a. Firebase Cloud Messaging (FCM) envía una notificación push con el resultado al
cliente.
6. Monitoreo del Sistema:
a. Cloud Monitoring verifica que cada solicitud se procese en menos de tres
minutos.
Comparación de Herramientas
Criterio AWS GCP
Lambda simplifica la ejecución de Cloud Functions es ágil para
Facilidad de Uso
lógica lógica
Almacenamiento S3 para archivos Cloud Storage para archivos
Notificaciones
SNS Firebase Cloud Messaging
Push
DynamoDB y SNS escalan sin
Escalabilidad Firestore y FCM escalan bien
problemas
Conclusión
Ambas plataformas ofrecen soluciones rápidas y escalables. La elección entre AWS y GCP
dependerá de:
7.
9.