Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Data Warehouse

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 4

UNIVERSIDAD AUTONOMA GABRIEL

RENE MORENO

DATA WAREHOUSE
Estudiante: Jhonny Sanchez Taquichiri
Registro: 218049544
Materia: Sistemas de Soporte a la Toma de Decisiones
Docente: Ing. Miguel Jesus Peinado

SANTA CRUZ - BOLIVIA


Estructura
La estructura tradicional de data warehouse emplea una estructura de tres
niveles compuesta por los siguientes niveles.

 Nivel inferior: este nivel contiene el servidor de base de datos que se


utiliza para extraer datos de muchas fuentes diferentes, como las bases
de datos transaccionales que se utilizan para aplicaciones de front-end.
 Nivel medio: El nivel medio alberga un servidor OLAP, que transforma los
datos en una estructura más adecuada para análisis y consultas
complejas. El servidor OLAP puede funcionar de dos maneras: ya sea
como un sistema de administración de base de datos relacional extendido
que mapea las operaciones en datos multidimensionales a operaciones
relacionales estándar (OLAP relacional), o usando un modelo OLAP
multidimensional que implementa directamente los datos y operaciones
multidimensionales.
 Nivel superior: el nivel superior es la capa del cliente. Este nivel contiene
las herramientas utilizadas para el análisis de datos de alto nivel, la
consulta de informes y la minería de datos.
En los últimos años, los almacenes de datos se están trasladando a la nube. Los
nuevos almacenes de datos basados en la nube no se adhieren a la arquitectura
tradicional; cada oferta de almacenamiento de datos tiene una arquitectura
única.

Dos de los almacenes basados en la nube más populares son Amazon Redshift y
Google BigQuery.

Elementos que los componen


Un almacén de datos típico tiene cuatro componentes principales: una base de
datos central, herramientas ETL (extraer, transformar, cargar), metadatos y
herramientas de acceso. Todos estos componentes están diseñados para la
velocidad, de modo que se puedan obtener resultados rápidamente y analizar
datos sobre la marcha.
Base de datos central
Una base de datos sirve como base del almacén de datos. Tradicionalmente,
han sido bases de datos relacionales estándar que se ejecutan en las
instalaciones o en la nube. Pero debido a Big Data, la necesidad de un
rendimiento en tiempo real y una reducción drástica en el coste de la RAM, las
bases de datos en memoria están ganando popularidad rápidamente.

Metadatos
Los metadatos son datos sobre tus datos. Especifica la fuente, el uso, los valores
y otras características de los conjuntos de datos en tu almacén de datos. Hay
metadatos comerciales, que agregan contexto a tus datos, y metadatos
técnicos, que describen cómo acceder a los datos, incluido dónde residen y
cómo están estructurados.

Middleware
Las herramientas de acceso permiten a los usuarios interactuar con los datos de
su almacén de datos. Entre los ejemplos de herramientas de acceso se incluyen:
herramientas de consulta y generación de informes, herramientas de desarrollo
de aplicaciones, herramientas de minería de datos y herramientas OLAP.

Funciones ETL
Los datos se extraen de los sistemas de origen y se modifican para alinear la
información para un consumo analítico rápido utilizando una variedad de
enfoques de integración de datos como ETL (extraer, transformar, cargar), así
como replicación de datos en tiempo real, carga masiva servicios de
procesamiento, transformación de datos y calidad y enriquecimiento de datos.

Tipos de data warehouse


Hay tres tipos principales de almacenamiento de datos. Cada uno tiene su
función específica en las operaciones de gestión de datos.
Almacén de datos empresariales
El almacén de datos empresarial (EDW) sirve como base de datos central o clave
para facilitar la toma de decisiones en toda la empresa. Los principales
beneficios de tener un EDW incluyen el acceso a información entre
organizaciones, la capacidad de ejecutar consultas complejas y la habilitación de
conocimientos enriquecidos y con visión de futuro para decisiones basadas en
datos y evaluación temprana de riesgos.

ODS (almacén de datos operativos)


En ODS, el almacén de datos se actualiza en tiempo real. Por lo tanto, a menudo
se usa para actividades empresariales de rutina, como almacenar registros de
los empleados. Se utiliza como fuente para proporcionar datos al almacén de
datos empresarial.

Data Mart
Es un subconjunto de un almacén de datos destinado a brindar soporte a un
departamento, región o unidad comercial en particular. Considera esto: tienes
varios departamentos, incluidos ventas, marketing, desarrollo de productos, etc.
Cada departamento tendrá un depósito central donde almacena datos. Este
repositorio se llama despensa de datos.

Los datos del data mart se almacenan en el ODS diariamente / semanalmente (o


según se configure). El ODS actúa como un área de preparación para la
integración de datos. Luego envía los datos a la EDW, donde se almacenan y se
utilizan para fines de BI.

También podría gustarte