Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Arquitectura de Datos Empresariales - Actividad 2

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 4

UNIVERSIDAD CATÓLICA DE CUENCA

COMUNIDAD EDUCATIVA AL SERVICIO DEL PUEBLO


EXTENSION CAÑAR

CARRERA:
TECNOLOGIAS DE LA INFORMACIÓN

CÁTEDRA:

ARQUITECTURA DE DATOS EMPRESARIALES

CATEDRÁTICO:
ING. ANONIO CAJAMARCA

ESTUDIANTE:
CARLOS TENELEMA

CICLO:
SEXTO

CAÑAR – ECUADOR
Data Warehouse

El Data Warehouse normalmente se nutre de herramientas como OLAP (Online


Analitical Processing), o DARTs (data access and repoding tools) y técnicas de Data
Mining para obtener información útil para la toma de decisiones. Las bases de datos
operativas de una empresa (facturación, compras, ventas, producción, personal, finanzas,
márketing, etc) son alimentadas por los llamados sistemas OLTP (Online Transactional
Processing), entendiendo como tales el concepto tradicional que manejamos de bases de
datos relacionales con las que las distintas unidades empresariales van trabajando
diariamente. Las bases de datos que conforman un Data Warehouse tienen que estar
integradas, ser temáticas, de carácter histórico y no volátiles77
Cada vez más estos sistemas de almacenamiento y gestión de datos hacen la
búsqueda y recuperación usando modelos de metainformación. Por esta razón gran parte
del software comercial de metadatos está dirigido a este sector. Así, uno de los problemas
con el que pueden encontrarse los usuarios de un Data

Warehouse es saber lo que hay en él y cómo se puede acceder a la información.


Otro componente elemental de un Data Warehouse son las herramientas de acceso
(business infelligence tool), su misión consiste en transformar los datos capturados en
información útil para el negocio. Cada usuario final debe seleccionar la más idónea para
sus necesidades. A las técnicas que posibilitan la extracción coherente de información las
conocemos como minería de datos o Data Mining.
En todo caso, se pretende integrar la información para permitir a los usuarios
localizar y recuperarla dentro de toda la información que una compañía posee. De esta
forma se garantiza que la información adecuada llegue al usuario idóneo, en tiempo y con
el formato exacto para favorecer la toma de decisiones en la organización. (González,
2005)

Extracción de conocimiento en bases de datos y minería de datos

El descubrimiento de conocimiento en bases de datos (KDD) se define como el


proceso de identificar patrones significativos en los datos que sean válidos, novedosos,
potencialmente útiles y comprensibles para un usuario [4,8,10,12]. El proceso global
consiste en transformar información de bajo nivel en conocimiento de alto nivel. El
proceso KDD es interactivo e iterativo conteniendo los siguientes pasos:
1. Comprender el dominio de aplicación: este paso incluye el conocimiento relevante
previo y las metas de la aplicación.
2. Extraer la base de datos objetivo: recogida de los datos, evaluar la calidad de los
datos y utilizar análisis exploratorio de los datos para familiarizarse con ellos.
3. Preparar los datos: incluye limpieza, transformación, integración y reducción de
datos. Se intenta mejorar la calidad de los datos a la vez que disminuir el tiempo
requerido por el algoritmo de aprendizaje aplicado posteriormente.
4. Minería de datos: como se ha señalado anteriormente, este es la fase fundamental
del proceso. Está constituido por una o más de las siguientes funciones,
clasificación, regresión, clustering, resumen, recuperación de imágenes, extracción
de reglas, etc.
5. Interpretación: explicar los patrones descubiertos, así como la posibilidad de
visualizarlos.
6. Utilizar el conocimiento descubierto: hacer uso del modelo creado.

El paso fundamental del proceso es el señalado con el número 4. A continuación


se comentan brevemente las tareas más comunes de la minería de datos, con un ejemplo
de uso.
• Clasificación: clasifica un dato dentro de una de las clases categóricas predefinidas.
Responde a preguntas tales como, ¿Cuál es el riesgo de conceder un crédito a este
cliente? ¿Dado este nuevo paciente qué estado de la enfermedad indican sus
análisis?
• Regresión: el propósito de este modelo es hacer corresponder un dato con un valor
real de una variable. Responde a cuestiones como ¿Cuál es la previsión de ventas
para el mes que viene? ¿De qué depende?
• Clustering: se refiere a la agrupación de registros, observaciones, o casos en clases
de objetos similares. Un cluster es una colección de registros que son similares entre
sí, y distintos a los registros de otro cluster. ¿Cuántos tipos de clientes vienen a mi
negocio? ¿Qué perfiles de necesidades se dan en un cierto grupo de pacientes?
• Generación de reglas: aquí se extraen o generan reglas de los datos. Estas reglas
hacen referencia al descubrimiento de relaciones de asociación y dependencias
funcionales entre los diferentes atributos. ¿Cuánto debe valer este indicador en
sangre para que un paciente se considere grave? ¿Si un cliente de un hipermercado
compra pañales también compra cerveza?
• Resumen o sumarización: estos modelos proporcionan una descripción compacta de
un subconjunto de datos. ¿Cuáles son las principales características de mis clientes?
Análisis de secuencias: se modelan patrones secuenciales, como análisis de series
temporales, secuencias de genes, etc. El objetivo es modelar los estados del proceso, o
extraer e informar de la desviación y tendencias en el tiempo. ¿El consumo de energía
eléctrica de este mes es similar al del año pasado? Dados los niveles de contaminación
atmosférica de la última semana cuál es la previsión para las próximas 24 horas. (José C.
Riquelme, 2006)

Los Sistemas de Gestión de Información

Parece un simple juego de palabras, pero en este caso se trata de gerenciar la


información en sí. Gerenciar aquella información generada dentro y fuera de la
organización que posibilita mejorar directamente la posición competitiva de la
organización, alterando inclusive la naturaleza, el comportamiento o la orientación de los
negocios. Es el Sistema de Información que forma parte de la estrategia de los negocios,
no se trata simplemente de apoyar la estrategia o tributar a ella, sino que el impacto
potencial de los SGI constituya un ingrediente fundamental en el proceso de desarrollo de
la estrategia en el momento mismo de formularla. Se pretende adoptar perspectivas más
creativas, a partir de las aportaciones del SGI, ver las nuevas oportunidades para los
negocios y mejorar la posición competitiva. Esta nueva orientación supone dos momentos
indisolubles. En primer lugar, una apertura de la organización hacia el entorno,
convirtiendo a los competidores, clientes, proveedores etc. en el elemento instigador para
utilizar de diferente manera los SGI, ya sean para obtener ventajas o para evitar incurrir
en desventajas. En segundo lugar, una orientación para que el primer nivel de dirección
se involucre más en el SGI antes, incluso, de proyectar las estrategias, porque la búsqueda
de oportunidades de forma inteligente y ordenadas brotan del SGI. Los SGI permiten:
➢ Comprender la marcha de las organizaciones desde un enfoque analítico (donde
queremos estar), evaluador (donde estamos) y creativo (donde podríamos estar),
➢ Develar oportunidades que merezcan ser explotadas y contrarrestar amenazas,
➢ Establecer los factores que resulten críticos y las necesidades asociadas al SGI,
➢ Estudiar el impacto de los SGI en la posición del negocio y buscar nuevas
oportunidades.
Este enfoque integral del proceso de negocio basadas en la información, requiere que la
organización sea vista como un sistema de flujos de información entre las diferentes áreas
o departamentos y sus subsistemas de información y parte de la premisa de que los
procesos y subprocesos de las organizaciones tienen que estar interrelacionados entre sí y
con su entorno, esta interrelación se plasma en los flujos de información tratados
sistémicamente.
El tratamiento sistémico y sistemático de la información interna que brota de los procesos
de las organizaciones es capaz de revelar el retrabajo, el desperdicio y las islas de
información, en resumen, la ineficacia de los procesos internos de las organizaciones.
(Lara, 1998)

También podría gustarte