Un repositorio es un sitio centralizado para almacenar información digital de forma accesible a través de Internet. La información se almacena sin restricciones pero se elimina si no es consultada dentro de un margen de tiempo. Existen repositorios especializados en diferentes campos como aeronáutica, agricultura y bibliotecología.
Copyright:
Attribution Non-Commercial (BY-NC)
Formatos disponibles
Descargue como DOCX, PDF, TXT o lea en línea desde Scribd
0 calificaciones0% encontró este documento útil (0 votos)
5K vistas4 páginas
Un repositorio es un sitio centralizado para almacenar información digital de forma accesible a través de Internet. La información se almacena sin restricciones pero se elimina si no es consultada dentro de un margen de tiempo. Existen repositorios especializados en diferentes campos como aeronáutica, agricultura y bibliotecología.
Un repositorio es un sitio centralizado para almacenar información digital de forma accesible a través de Internet. La información se almacena sin restricciones pero se elimina si no es consultada dentro de un margen de tiempo. Existen repositorios especializados en diferentes campos como aeronáutica, agricultura y bibliotecología.
Copyright:
Attribution Non-Commercial (BY-NC)
Formatos disponibles
Descargue como DOCX, PDF, TXT o lea en línea desde Scribd
Descargar como docx, pdf o txt
0 calificaciones0% encontró este documento útil (0 votos)
Un repositorio es un sitio centralizado para almacenar información digital de forma accesible a través de Internet. La información se almacena sin restricciones pero se elimina si no es consultada dentro de un margen de tiempo. Existen repositorios especializados en diferentes campos como aeronáutica, agricultura y bibliotecología.
Copyright:
Attribution Non-Commercial (BY-NC)
Formatos disponibles
Descargue como DOCX, PDF, TXT o lea en línea desde Scribd
Descargar como docx, pdf o txt
Está en la página 1de 4
Definición:
Deposito o archivo es un sitio centralizado donde se amacena y
mantiene información digital, habitualmente base de datos o archivos informáticos.
Tambien conocidos como Archivos de Acceso Abierto, son archivos
digitales accesibles a traves de internet.Los depositos pueden contar con sistemas Backup y mantenimiento preventivo y correctivo lo que hace q nuestra informacion se pueda recuperar en le caso que nuestra maquina o pc quede utilizable. El usuario localiza documentos y objetos haciendo una descripcion de ellos. Un usuario que busca informacion en un repositorio describe de manera breve el documento que quiere obtener como respuesta.el result. El usuario que el usuario navega en el repositorio realizado consultas y refinando resultados hasta que queda satisfecho.
La informacion contenida en los repositorios es volatil, y por este motivo
no es posible definir una estructura, aun cuando en principio seria posible utlizar una b.d. relacional.
La informacion se almacena sin restricciones pero de la misma manera se
desecha la unica manera de controlar los datos almacenados dentro de un repositorio , es mediante su tiempo de permanencia .; es decir cuando llega informacion y no es consultada dentro de un margen de tiempo se borra.
Ejemplos de repositorios de datos.
REPOSITORIO ESPECIALIDAD
NACA (National Advisory Committee for Aeronautics) Aeronaútica
Organic Eprints Agricultura
@rchivSIC Bibliotecología y Ciencias de la Información
Caltech Library System Papers and Publications DLIST (Digital Library of
Information Science and Technology) E-LIS (Eprints for Library an Information Science) LDL - Librarians' Digital Library mémSIC (Memorias en Ciencias de la Información y de la Comunicación) http://www.biologia- en-internet.com/ Biología, Ciencias Experimentales y de la Salud
Centro Rajiv Gandhi para Biotecnología Biotecnología
Computer Science Teaching Center Ciencias de la Computación
DATAWAREHOUSE
Un Datawarehouse es una base de datos corporativa que se caracteriza
por integrar y depurar información de una o más fuentes distintas, para luego procesarla permitiendo su análisis desde infinidad de pespectivas y con grandes velocidades de respuesta.
La ventaja principal de este tipo de bases de datos radica en las
estructuras en las que se almacena la información (modelos de tablas en estrella, en copo de nieve, cubos relacionales... etc). Este tipo de persistencia de la información es homogénea y fiable, y permite la consulta y el tratamiento jerarquizado de la misma (siempre en un entorno diferente a los sistemas operacionales).
El término Datawarehouse fue acuñado por primera vez por Bill Inmon
Según definió el propio Bill Inmon, un datawarehouse se caracteriza por
ser:
Integrado: los datos almacenados en el datawarehouse deben
integrarse en una estructura consistente, por lo que las inconsistencias existentes entre los diversos sistemas operacionales deben ser eliminadas. La información suele estructurarse también en distintos niveles de detalle para adecuarse a las distintas necesidades de los usuarios.
Temático: sólo los datos necesarios para el proceso de generación del
conocimiento del negocio se integran desde el entorno operacional. Los datos se organizan por temas para facilitar su acceso y entendimiento por parte de los usuarios finales. Por ejemplo, todos los datos sobre clientes pueden ser consolidados en una única tabla del datawarehouse. De esta forma, las peticiones de información sobre clientes serán más fáciles de responder dado que toda la información reside en el mismo lugar.
alicia
Histórico: el tiempo es parte implícita de la información contenida en un
datawarehouse. En los sistemas operacionales, los datos siempre reflejan el estado de la actividad del negocio en el momento presente. Por el contrario, la información almacenada en el datawarehouse sirve, entre otras cosas, para realizar análisis de tendencias. Por lo tanto, el datawarehouse se carga con los distintos valores que toma una variable en el tiempo para permitir comparaciones.
No volátil: el almacén de información de un datawarehouse existe
para ser leído, pero no modificado. La información es por tanto permanente, significando la actualización del datawarehouse la incorporación de los últimos valores que tomaron las distintas variables contenidas en él sin ningún tipo de acción sobre lo que ya existía.
Otra característica del datawarehouse es que contiene metadatos, es
decir, datos sobre los datos.
Los metadatos serán los que permiten simplificar y automatizar la
obtención de la información desde los sistemas operacionales a los sistemas informacionales.
Para poder entender que es Datawarehouse es importante saber cual es
el proceso de construcción de este, denominado ETL (Extracción, Transformación y Carga), a partir de los sistemas operaciones de una compañía:
Extracción: obtención de información de las distintas fuentes tanto
internas como externas.
Transformación: filtrado, limpieza, depuración, homogeneización y
agrupación de la información.
Carga: organización y actualización de los datos y los metadatos en la
base de datos.
Una de las claves del éxito en la construcción de un datawarehouse es el
desarrollo de forma gradual, seleccionando a un departamento usuario como piloto y expandiendo progresivamente el almacén de datos a los demás usuarios
Principales aportaciones de un datawarehouse
Proporciona una herramienta para la toma de decisiones en cualquier
área funcional, basándose en información integrada y global del negocio.
Facilita la aplicación de técnicas estadísticas de análisis y modelización
para encontrar relaciones ocultas entre los datos del almacén; obteniendo un valor añadido para el negocio de dicha información.
Proporciona la capacidad de aprender de los datos del pasado y de
predecir situaciones futuras en diversos escenarios.
Simplifica dentro de la empresa la implantación de sistemas de gestión
integral de la relación con el cliente.
Supone una optimización tecnológica y económica en entornos de
Centro de Información, estadística o de generación de informes con retornos de la inversión espectaculares.