Dama BOOK Cap. 8
Dama BOOK Cap. 8
Dama BOOK Cap. 8
Interoperabilidad
Capacitación
Bluetab
Definición
Motivadores de negocio:
• necesidad de gestionar los datos de manera
eficiente
• las adquisiciones de nuevos software en vez
de desarrollos de aplicaciones propias
• la administración de los costos
Metas
CONCEPTOS GENERALES
• EXTRAER, TRASNFORMAR, y CARGAR.
1. Extracción: proceso de seleccionar los datos requeridos y
extraerlos desde su origen,
2. Transformación: proceso que hace que los datos
seleccionados de origen sean compatibles con la estructura del
almacén de los datos de destino.
3. Carga: es almacenar físicamente o presentar los resultados
de las transformaciones en el sistema de destino.
4. ELT: permite que las transformaciones ocurran después de la
carga al sistema de destino.
5. Mapeo: es tanto el proceso de desarrollo de la matriz de
búsqueda desde el origen hacia las estructuras de destino,
como el resultado de ese proceso en desarrollo
CONCEPTOS GENERALES
• LATENCIA: es la diferencia de tiempo entre la generación de los datos del sistema de origen y cuando están
disponibles para su uso en el sistema de destino.
1. Lote: es el movimiento de datos entre aplicaciones y organizaciones en grupo de archivos.
2. Captura de datos de cambio: Es un método para reducir el ancho de banda utilizado, mediante
un filtrado que solo incluye los datos que se han cambiado dentro de un lapso definido.
3. Casi tiempo real e impulsada por eventos: los datos se procesan en conjuntos mas
pequeños distribuidos a lo largo del día de acuerdo con una cronología definida, o bien los datos son
procesados cuando ocurre un evento, como una actualización de datos.
4. Asincrónico: el sistema que proporciona datos no espera a que el sistema receptor acuse de recibida la
actualización, antes de continuar el procesamiento
5. En tiempo Real, Sincrónico: Es cuando los datos de origen y de destino deben estar sincronizados.
6. Baja latencia o transmisión: grandes avances en el desarrollo de soluciones de integración de
datos extremadamente rápidas.
CONCEPTOS GENERALES
• REPLICACION: sirve para proporcionar un mejor tiempo de respuesta a los usuarios ubicados
alrededor del mundo, algunas aplicaciones mantienen copias exactas de conjuntos de datos en múltiples
ubicaciones físicas
• ARCHIVADO: los datos que se utilizan con poca frecuencia o que no se utilizan de forma activa, se
pueden mover a una estructura de datos o solución de almacenamiento alternativo, que sea menos
costosa para la organización
1. Punto a punto: Los sistemas se pasan los datos directamente entre si.
2. Modelo de rueda (concentrado en radios): consolida los datos compartidos en un
nodo de datos que muchas aplicaciones pueden usar. Todos los sistemas que quieran intercambiar datos
lo hacen a través de sistema central común de control de datos y no directamente entre si (punto a
punto).
3. Publicar – Suscribir: es un modelo que implica sistemas que empujan datos hacia afuera
(publican) y otros que jalan estos datos (suscribirse).
CONCEPTOS GENERALES
• Conceptos de arquitectura
1. Acoplamiento de la aplicación: describe el grado en que dos sistemas se entrelazan.
1. Orquestación y controles de procesos: es el termino utilizado para describir como se organiza y ejecuta múltiples procesos en un sistema.
2. Integración empresarial de aplicaciones (EAI): es un modelo en donde los módulos de software interactúan entre si solo a través de llamadas de interfaz bien
definidas (interfaz de programación de aplicaciones -API).
3. Bus de servicio empresarial (ESB): es un sistema que actúa como intermediario entre sistemas, pasando mensajes entre ellos.
1. Arquitectura orientada a servicios: es una idea donde la funcionalidad de proporcionar datos o actualizar datos puede ser provista a través de llamadas de servicios
bien definidas entre aplicaciones
2. Procesamiento de eventos complejos (CEP): es un método de seguimiento y análisis de flujos de información sobre cosas que suceden(eventos), para derivar una
conclusión a partir de ellos.
3. Federación de datos y virtualización: la federación de datos proporciona acceso a una combinación de almacenes de datos individuales, independientemente de la
estructura. La virtualización de datos permite que las bases de datos distribuidas, así como múltiples almacenes de datos heterogéneos, se accedan y se vean como una sola base de datos.
4. Datos-como-un-servicio (DaaS): son los datos licenciados de un proveedor y proporcionados bajo demanda, en lugar de ser almacenados y mantenidos en el centro de
datos de la organización que este licenciando.
5. Integración basada en la nube(IpaaS: es una forma de integración de sistemas entregada como servicio en la nube que se ocupa de los datos, procesos, arquitectura
orientada a servicios (SOA) y casos de uso de integración de aplicaciones
2. ACTIVIDADES
1. Planificar y Analizar:
1.1 Definir los Requerimientos de la Integración de Datos y del Ciclo de Vida:
Implica entender los objetivos de negocio de la organización, así como los datos necesarios y las iniciativas tecnológicas
propuestas para alcanzar esos objetivos.
1.2 Realizar el Descubrimiento de Datos:
El descubrimiento de datos debe realizarse antes de la fase de diseño. El objetivo del descubrimiento de datos es
identificar posibles fuentes de datos para el esfuerzo de integración de datos.
1.3 Documentar Linaje de Datos:
El proceso de descubrimiento de datos también revelará información sobre cómo fluyen los datos a través de una
organización. Esta información se puede usar para documentar el linaje de datos a alto nivel: cómo la organización
adquiere o crea los datos que se están analizando, a dónde se mueven y dónde se modifican dentro de la organización,
y cómo la organización utiliza los datos para el análisis, la toma de decisiones o la activación de eventos.
1.4 Perfilar los Datos:
Entender el contenido y la estructura de los datos es esencial para la integración exitosa de los datos. La elaboración
de perfiles de datos contribuye a este fin. La estructura y contenidos reales de los datos siempre difieren de lo que se
supone. A veces las diferencias son pequeñas; otras veces son lo suficientemente grandes como para descarrilar un
esfuerzo de integración.
1.5 Recopilar Reglas de Negocio:
Las reglas de negocio son un subconjunto crítico de los requerimientos. Una regla de negocio es una declaración que
define o acota un aspecto del procesamiento de negocio. Las reglas de negocio tienen el propósito de reafirmar la
estructura del negocio, o de controlar o influir el funcionamiento del negocio.
2. ACTIVIDADES
2. Diseñar Soluciones de Integración de Datos:
2.1 Arquitectar el Diseño de la Integración de Datos:
Las soluciones de integración de datos deben especificarse tanto a nivel empresarial como a nivel de solución
individual. Al establecer estándares empresariales, la organización ahorrará tiempo en la implementación de soluciones
individuales, porque las evaluaciones y las negociaciones se han realizado antes de ser necesarias.
4. Implementar y Monitorear:
Se deben activar los servicios de datos que se han desarrollado y probado. El procesamiento de datos en tiempo real requiere
monitoreo en tiempo real para encontrar los problemas. Se deben establecer parámetros que indican posibles cuestiones con
el procesamiento, así como la notificación directa de los problemas. Debe establecerse un seguimiento, tanto automatizado
como humano, de los problemas, especialmente a medida que aumenta la complejidad y el riesgo de las respuestas
desencadenadas.
3. HERRAMIENTAS
Para medir el alcance y los beneficios de implementar soluciones de Integración de Datos, se debenincluir métricas de disponibilidad,
volumen, velocidad, costo y uso:
• Disponibilidad de Datos.
• Disponibilidad de los datos requeridos.
• Volúmenes de Datos y Velocidad.
• Volúmenes de datos transportados y transformados.
• Volúmenes de datos analizados.
• Velocidad de transmisión.
• Latencia entre actualización y disponibilidad de datos.
• Latencia entre el evento y la acción desencadenada.
• Tiempo de disponibilidad de nuevas fuentes de datos.
• Costos y Complejidad de la Solución.
• Costo de desarrollo y de gestión de soluciones
• Facilidad para adquirir nuevos datos
• Complejidad de soluciones y operaciones
• Número de sistemas que utilizan soluciones de integración de datos
Ahora, pongamos a prueba lo aprendido…
3
2
1
Gracias…