Data Warehouse
Data Warehouse
Data Warehouse
Contenido
INTRODUCCION................................................................................................... 2
DEFINICION......................................................................................................... 3
DATAWAREHOUSE Y SUS PRINCIPALES CARACTERSTICAS.....................................3
ESTRUCTURA DEL DATA WAREHOUSE....................................................................4
VENTAJAS......................................................................................................... 8
DESVENTAJAS................................................................................................... 8
Esquemas de un Data Warehouse.......................................................................9
Esquema estrella............................................................................................. 9
Esquema copo de nieve................................................................................. 10
ARQUITECTURA DE UN DATAWAREHOUSE.........................................................11
Usos.................................................................................................................. 12
Formas de acceso de los usuarios..................................................................12
Uso de los datos............................................................................................. 13
Las consultas de los usuarios accedan a cantidades grandes de datos.........13
Ejemplo....................................................................................................... 15
CONSIDERACIONES ADICIONALES.....................................................................17
EJEMPLO DE UN DATA WAREHOUSE..............................................................19
EXCEPCIONES EN EL DATA WAREHOUSE......................................................20
Conclusiones..................................................................................................... 22
Referencias....................................................................................................... 23
1 | Pgina
INTRODUCCION
Mejores decisiones de negocio es la clave es el xito en el mercado competitivo de hoy,
para lo cual las organizaciones buscan que sus tomas de decisiones sean entendibles. Para
facilitar estos datos a una amplia audiencia de usuarios.
Para lo cual muchas organizaciones escogen construir un Data Warehouse para liberar la
informacin en sus sistemas operativos y entender los verdaderos problemas del mundo de
los negocios. El Data Warehouse es un almacenamiento integrado de informacin obtenido
de otros sistemas, que provee soporte de decisiones, disponibilidad y manipulacin de
informacin para el anlisis de datos. Clientes deslumbrados, mejores rendimientos, mayor
participacin en el mercado son las bases de los negocios en una dcada competitiva como
la actual y para lograr ella una de las respuestas es el Data Warehouse.
El Data Warehouse representa el proceso de reunir la informacin histrica de una
organizacin en un depsito central, y se ha convertido en una tecnologa comn y
fundamental. Est es la tecnologa que finalmente puede llevar al sueo que perseguan los
tericos del tema desde la dcada de los setenta.
En donde el proceso del Data Warehouse es complejo, y costoso que consume tiempo, sin
embargo, con el paso de los ao se ha venido trabajando en esta industria para crear una
plataforma que sea consistente
y de liderazgo de
productos, los cuales pueden ser utilizados para reducir los costos e impulsar a las
empresas a crear, administrar y utilizar un Data Warehouse.
2 | Pgina
DEFINICION
Las definiciones anteriores se centran en los datos en s mismos. Sin embargo,
los medios para obtener y analizar esos datos, para extraerlos, transformarlos
y cargarlos, as como las diferentes formas para realizar la gestin de datos son
componentes esenciales de un almacn de datos. Muchas referencias a un
almacn de datos utilizan esta definicin ms amplia. Por lo tanto, en esta
definicin se incluyen herramientas para la inteligencia empresarial,
herramientas para extraer, transformar y cargar datos en el almacn de datos,
y herramientas para gestionar y recuperar los metadatos.
en
la
El trmino Datawarehouse
fue acuado por primera
vez por Bill Inmon, y se traduce literalmente como almacn de datos. No
3 | Pgina
5 | Pgina
6 | Pgina
El detalle de ventas antiguas son las que se encuentran antes de 1992. Todos
los detalles de ventas desde 1982 (o cuando el diseador inici la coleccin de
los archivos) son almacenados en el nivel de detalle de datos ms antiguo.
El
detalle actual contiene informacin desde 1992 a 1993 (suponiendo que 1993 es el ao actual). En
general, el detalle de ventas no se ubica en el nivel de detalle actual hasta que haya pasado, por lo
menos, veinticuatro horas desde que la informacin de ventas llegue a estar disponible en el
ambiente operacional.
En otras palabras, habra un retraso de tiempo de por lo menos veinticuatro horas, entre el tiempo
en que en el ambiente operacional se haya hecho un nuevo ingreso de la venta y el momento
cuando la informacin de la venta haya ingresado al data warehouse.
El detalle de las ventas son resumidas semanalmente por lnea de subproducto y por regin, para
producir un almacenamiento de datos ligeramente resumidos.
El detalle de ventas semanal es adicionalmente resumido en forma mensual, segn una gama de
lneas, para producir los datos completamente resumidos.
La metadata contiene (al menos):
La estructura de los datos
7 | Pgina
VENTAJAS
Hay muchas ventajas por las que es recomendable usar un almacn de datos.
Algunas de ellas son:
Los almacenes de datos hacen ms fcil el acceso a una gran variedad de
datos a los usuarios finales
Facilitan el funcionamiento de las aplicaciones de los sistemas de apoyo a la
decisin tales como informes de tendencia', por ejemplo: obtener los items con
la mayora de las ventas en un rea en particular dentro de los ltimos dos
aos; informes de excepcin, informes que muestran los resultados reales
frente a los objetivos planteados a priori.
Los almacenes de datos pueden trabajar en conjunto y, por lo tanto, aumentar
el valor operacional de las aplicaciones empresariales, en especial la gestin de
relaciones con clientes.
DESVENTAJAS
Utilizar almacenes de datos tambin plantea algunos inconvenientes, algunos
de ellos son:
A lo largo de su vida los almacenes de datos pueden suponer altos costos. El
almacn de datos no suele ser esttico. Los costos de mantenimiento son
elevados.
Los almacenes de datos se pueden quedar obsoletos relativamente pronto.
A veces, ante una peticin de informacin estos devuelven una informacin
subptima, que tambin supone una prdida para la organizacin.
A menudo existe una delgada lnea entre los almacenes de datos y sistemas
operativos. Hay que determinar qu funcionalidades de estos se pueden
aprovechar y cules se deben implementar en el data warehouse, resultara
8 | Pgina
Esquema estrella
9 | Pgina
10 | P g i n a
11 | P g i n a
ARQUITECTURA DE UN DATAWAREHOUSE
Elementos dentro de la arquitectura Data Warehouse (que es una forma de
representar la estructura global de los datos, la comunicacin, los procesos y la
presentacin del usuario final). Como ya sabemos la construccin del data
warehouse se establece como elemento crtico en el proceso de implantacin
de una herramienta Business Intelligence y por lo tanto resulta interesante
recordar todos estos conceptos:
Base de datos operacional/nivel de base de datos externos: hace referencia a
los sistemas operacionales/transaccionales de la organizacin y a fuentes que
forman parte del proceso de Data Warehousing.
Nivel de acceso a la informacin: es la capa de interaccin del usuario cuya
finalidad es la conversin de los datos almacenados en informacin fcil y
transparente para las herramientas de los usuarios finales.
Nivel de acceso a los datos: comunica el nivel de acceso a la informacin con el
nivel operacional de forma universal.
Nivel de directorio de datos (metadatos): repositorio de metadatos de los datos
almacenados que proporcionan informacin sobre el origen y sobre la
transformacin de los mismos en el proceso de Data Warehousing.
Nivel de gestin de procesos: planificacin de las tareas y procesos para la
construccin y mantenimiento actualizado del Data Warehouse.
Nivel de mensaje de la aplicacin: determina el transporte de informacin a lo
largo del entorno de computacin de la organizacin a modo de middleware
pero ms all de meramente protocolos de red.
Nivel Data Warehouse (fsico): es el repositorio central altamente flexible de
informacin donde residen copias de los datos operacionales y/o externos
optimizados para su acceso para la consulta.
Nivel de organizacin de datos: incluye todos los procesos necesarios para
seleccionar, editar, resumir (normalmente sumarizar), combinar y cargar en el
Data Warehouse y en la capa de acceso a la informacin los datos
operacionales y/o externos.
Usos
Formas de acceso de los usuarios
Uso de Base de Datos Operacionales
Muchos usuarios concurrentes
12 | P g i n a
14 | P g i n a
Ejemplo
Preparacin de un reporte complejo
Considere un problema bastante tpico en una compaa de fabricacin grande
en el que se pide una informacin (un reporte) que no est disponible.
15 | P g i n a
16 | P g i n a
CONSIDERACIONES ADICIONALES
Hay algunas consideraciones adicionales que deben tenerse en cuenta al
construir y administrar el data warehouse.
La primera consideracin es respecto al ndice. La informacin de los niveles
de esquematizacin ms altos pueden ser libremente indexados, mientras que
las de los niveles ms bajos de detalle, por ser tan voluminosa, pueden ser
indexados moderadamente.
Por lo mismo, los datos en los niveles ms altos de detalle pueden ser
reestructurados fcilmente, mientras que el volumen de datos en los niveles
17 | P g i n a
18 | P g i n a
19 | P g i n a
22 | P g i n a
Conclusiones
Resumiendo los beneficios de la arquitectura del DWH :
Provee un esquema de organizacin cules son los componentes que la
forman, cmo ellos se interrelacionan, quin es el dueo de cada parte y cules
son las prioridades.
Mejora la flexibilidad permite que rpidamente se aadan nuevas fuentes de
datos.
Desarrollo rpido y reuso los desarrolladores de DWH son ms capaces de
comprender el proceso de DWH , los contenidos de las bases de datos y las
reglas del negocio ms rpidamente.
Herramientas de comunicaciones define y comunica la direccin y el alcance
de las expectativas , identifica los roles y responsabilidades y comunica los
requerimientos al proveedor.
En general, podemos plantear que el Datawarehouse representa una
oportunidad para estrechar las relaciones de las empresas con los clientes.
23 | P g i n a
Referencias
http://www.exa.unicen.edu.ar/catedras/dwhouse/
http://www.sqlmax.com/dataw1.asp
http://informationmanagement.wordpress.com/2007/06/03/arquitecturade-un-datawarehouse/
http://es.wikipedia.org/wiki/Almac%C3%A9n_de_datos#Ventajas
http://es.wikipedia.org/wiki/Almac
%C3%A9n_de_datos#Una_definici.C3.B3n_m.C3.A1s_amplia_de_almac.C
3.A9n_de_datos
http://www.ongei.gob.pe/publica/metodologias/Lib5084/14.HTM
http://www.google.com.pe/#hl=es&q=datawarehouse+estructura&meta
=&aq=f&aqi=g1&aql=&oq=&gs_rfai=&fp=b613da276d1a7f
http://egkafati.bligoo.com/content/view/302166/Datawarehouse-y-susprincipales-caracteristicas.html
http://es.wikipedia.org/wiki/Almac%C3%A9n_de_datos
http://dmi.uib.es/~bbuades/datawarehouse/datawarehouse.ppt
http://www.google.com.pe/search?hl=es&client=firefoxa&hs=hYj&rlz=1R1GGLL_es___PE370&q=filetype
%3Appt+datawarehouse+aplicacion&meta=&aq=f&aqi=&aql=&oq=&gs
_rfai=
24 | P g i n a