Apuntes de Bases de Datos
Apuntes de Bases de Datos
Apuntes de Bases de Datos
Una Base de Datos es una coleccin de archivos, datos, informacin; ordenada, organizada, y relacionada, con la finalidad de permitir el manejo de la informacin para su procesamiento. Cada uno de los archivos representan una coleccin de registros y cada registro est compuesto de una coleccin de campos. Cada uno de los campos de cada registro permite llevar informacin de alguna caracterstica o atributo de alguna entidad del mundo real. El DBMS es un conjunto de programas que se encargan de manejar la creacin y todos los accesos a las bases de datos. Se compone de un Lenguaje de Definicin de Datos (DDL: Data Definition Languaje), de un Lenguaje de Manipulacin de Datos (DML: Data Manipulation Languaje), y de un Lenguaje de Consulta (SQL: Structured Query Languaje). Sistema de Administracin de Base de Datos (DBMS). Es el nivel de software que provee el acceso a la informacin a un alto nivel de abstraccin. En lugar de manipular archivos, registros, ndices, el programa de aplicacin opera en trminos de clientes, cuentas, saldos, etc. Acceso a la Base de Datos La secuencia conceptual de operaciones que ocurren para accesar cierta informacin que contiene una base de datos es la siguiente:
El usuario solicita cierta informacin contenida en la base de datos. El DBMS intercepta este requerimiento y lo interpreta. DBMS realiza las operaciones necesarias para accesar y/o actualizar la informacin solicitada
Para ver el grfico seleccione la opcin "Descargar" del men superior Proceso para Accesar Informacin de Bases de Datos. Unidad I. Funciones del Administrador de la Base de Datos. 1. Conceptos Generales.
Administrador de la Base de Datos. Es la persona encargada de definir y controlar las bases de datos corporativas, adems proporciona asesora a los desarrolladores, usuarios y ejecutivos que la requieran. Es la persona o equipo de personas profesionales responsables del control y manejo del sistema de base de datos, generalmente tiene(n) experiencia en DBMS, diseo de bases de datos, Sistemas operativos, comunicacin de datos, hardware y programacin. Un Administrador de Base de Datos de tiempo completo normalmente tiene aptitudes tcnicas para el manejo del sistema en cuestin a dems, son cualidades deseables nociones de administracin, manejo de personal e incluso un cierto grado de diplomacia. La caracterstica ms importante que debe poseer es un conocimiento profundo de las polticas y normas de la empresa, as como el criterio de la empresa para aplicarlas en un momento dado. La responsabilidad general del DBA es facilitar el desarrollo y el uso de la Base de Datos dentro de las guas de accin definidas por la administracin de los datos. El Administrador de Bases de Datos es responsable primordialmente de:
Administrar la estructura de la Base de Datos. Administrar la actividad de los datos. Administrar el Sistema Manejador de Base de Datos. Establecer el Diccionario de Datos. Asegurar la confiabilidad de la Base de Datos. Confirmar la seguridad de la Base de Datos.
Esta responsabilidad incluye participar en el diseo inicial de la base de datos y su puesta en practica as como controlar, y administrar sus requerimientos, ayudando a evaluar alternativas, incluyendo los DBMS a utilizar y ayudando en el diseo general de la bases de datos. En los casos de grandes aplicaciones de tipo organizacional, el DBA es un gerente que supervisa el trabajo del personal de diseo de la BD. Una vez diseada las bases de datos, es puesta en prctica utilizando productos del DBMS, procedindose entonces a la creacin de los datos (captura inicial). El DBA participa en el desarrollo de procedimientos y controles para asegurar la calidad y la alta integridad de la BD. Los requerimientos de los usuarios van modificndose, estos encuentran nuevas formas o mtodos para lograr sus objetivos; la tecnologa de la BD se va modificando y los fabricantes del DBMS actualizan sus productos. Todas las modificaciones en las estructuras o procedimientos de BD requieren de una cuidadosa administracin. Administracin de la Actividad de Datos. El DBA no es usuario del sistema, no administra valores de datos; sino la actividad de datos; protege los datos, no los procesa. Dado que la base de datos es un recurso compartido, el DBA debe proporcionar estndares, guas de accin, procedimientos de control y la documentacin necesaria para garantizar que los usuarios trabajen en forma cooperativa y complementaria al procesar datos en la bases de datos. Administrar el Sistema Manejador de Base de Datos. Existe una gran actividad al interior de un DBMS. La concurrencia de mltiples usuarios requiere la estandarizacin de los procesos de operacin; el DBA es responsable de stas especificaciones y de asegurarse que estas lleguen a quienes concierne. Todo el mbito de la base de datos se rige por estndares, desde la forma de como se captura la informacin (tipo de dato, longitud, formato), como es procesada y presentada. El nivel de estandarizacin alcanza hasta los aspectos ms internos de la base de datos; como s accesa a un archivo, como se determinan los ndices primarios y auxiliares, registros, etc. El DBA debe procurar siempre que los estndares que sern aplicados beneficien tambin a los usuarios, privilegiando siempre la optimizacin en la operacin del DBMS y el apego de las polticas de la empresa. Entre las funciones del DBA se encuentra la de revisar los estndares peridicamente para determinar su operatividad, ajustarlos, ampliarlos o cancelarlos y hacer que stos se cumplan. Establecer el Diccionario de Datos. Cuando se definen estndares sobre la estructura de la base de datos, se deben de registrarse en una seccin del diccionario de datos a la que todos aquellos usuarios relacionados con ese tipo de proceso pueden acceder. Este metadato debe precisar informacin que nos indique con claridad el tipo de datos que sern utilizados, sus mbitos de influencia y sus limitantes de seguridad. Asegurar la Confiabilidad de la Base de Datos Se trata de realizar un sistema de bases de datos lo suficientemente robusto para que sea capaz de recuperarse frente a errores o usos inadecuados. Se deben utilizar gestores con las herramientas necesarias para la reparacin de los posibles errores que las bases de datos pueden sufrir, por ejemplo tras un corte inesperado de luz. Confirmar la Seguridad de la Base de Datos. Coordinar las nuevas propuestas para realizar ajustes en los derechos de acceso a datos compartidos y aplicaciones especficamente propuestas seran analizados en conjunto con los supervisores o directivos de las reas involucradas para determinar si procede pudieran aparecer problemas cuando dos o ms grupos de usuarios quedan autorizados para notificar los mismos datos. Uno de tales conflictos es el de la actualizacin perdida; este ocurre cuando el trabajo de un usuario queda sobrescrito sobre por el de un segundo usuario. El DBA queda responsabilizado para identificar la posible ocurrencia de dichos problemas as como de crear normas y procedimientos para su eliminacin. Se obtendrn este tipo de garantas cuando el DBMS sea capaz de implementar las restricciones aplicables al acceso concurrente, y este sea utilizado adecuadamente por programadores y usuarios;
para borrar lo anterior, se hace indispensable el apego a los estndares el seguimiento de instructivos y manuales y las reglas establecidas para los diversos procesamientos y procedimientos que se llevan acabo. Entre las alternativas ms utilizadas por el DBA para tratar de resolver o minimizar este problema se encuentran las siguientes:
Restringir el acceso a los procedimientos para ciertos usuarios. Restringir al acceso a los datos para ciertos usuarios procedimientos y/o datos. Evitar la coincidencia de horarios para usuarios que comparten.
Las tcnicas de recuperacin son otra funcin esencial del DBA al administrar la actividad de datos. A pesar de que el DBMS lleva a cabo una parte del proceso de recuperacin, los usuarios determinan en forma critica la operatividad de esos sistemas de proteccin. El DBA debe anticipar fallas y definir procedimientos estndares de operacin; los usuarios deben saber qu hacer cuando el sistema este cado y que es lo primero que debe realizarse cuando el sistema este puesto en marcha nuevamente. El personal de operacin deber saber cmo iniciar el proceso de recuperacin de la BD que copias de seguridad utilizar; como programar la reejecucin del tiempo perdido y de las tareas pendientes; es importante tambin establecer un calendario para llevar a cabo estas actividades sin afectar a otros sistemas dentro de la organizacin que hagan uso de los mismos recursos de computo. Destacan por su importancia en el proceso de recuperacin y a su vez en la atencin que prestan a otros sectores de la organizacin. Los dispositivos de comunicacin remota, los sistemas de interconexin y otros accesorios de uso compartido. El DBA es el responsable de la publicacin y mantenimiento de la documentacin en relacin con la actividad de los datos, incluyendo los estndares de la BD, los derechos de recuperacin y de acceso a la BD, los estndares para la recuperacin de cadas y el cumplimiento de las polticas establecidas. Los productos DBMS ms populares que se encuentran en el mercado proporcionan servicios de utileras para ayudar al DBA en la administracin de los datos y su actividad. Algunos sistemas registran en forma automtica los nombres de los usuarios y de las aplicaciones a las que tienen acceso as como a otros objetos de la BD. Incorpora tambin utileras que permitan definir en el diccionario de datos las restricciones para que determinadas aplicaciones o mdulos de ellas solo tengan acceso a segmentos especficos de la BD. Objetivos del Administrador de la Base de Datos. Mantener la Integridad de los Datos. Una base de datos debe protegerse de accidentes tales como los errores en la entrada de los datos o en la programacin, del uso mal intencionado de la base de datos y de los fallos del hardware o del software que corrompen los datos. La proteccin contra accidentes, que ocasiona inexactitudes en los datos, es parte del objetivo de garantizar la integridad de los datos. Estos accidentes incluyen los fallos durante el procesamiento de las transacciones, los errores lgicos que infringen la suposicin de que las transacciones preservan las restricciones de consistencia de la base de datos y las anomalas debido al acceso concurrente en la base de datos (acceso concurrente). La integridad, se encarga de asegurar que las operaciones ejecutadas por los usuarios sean correctas y mantengan la consistencia de la base de datos. Mantener la Seguridad de los Datos. La proteccin de la base de datos de usos mal intencionados o no autorizados se denomina seguridad de los datos. La seguridad se encarga de limitar a los usuarios a ejecutar nicamente las operaciones permitidas. Mantener la Disponibilidad de los Datos. La posibilidad de fallos de hardware o de software requiere procedimientos de recuperacin de la base de datos. Tiene que proporcionar medios para el restablecimiento de las bases de datos que se hayan corrompido por desperfectos del sistema, a un estado uniforme. Funciones Bsicas del Administrador de la Bases de Datos. Creacin de Bases de Datos y Tablas. Creando Bases de Datos:
Creando Tablas:
Seleccionando tipos de datos. Tablas fragmentadas o no fragmentadas. Localizacin de la tabla. Determinacin del espacio en disco. Modo de aseguramiento de candados.
Especificacin de las Restricciones de Integridad de los Datos. Las restricciones de integridad se mantienen en una estructura especial del sistema que consulta el gestor de la base de datos cada vez que se tiene lugar una actualizacin en el sistema. Estos son algunos mtodos para asegurar la integridad de los datos:
o o o
Privilegios: Base de datos. Tabla. Columna Integridad de identidad, semntica y referencial. Vistas.
Administrar la Concurrencia. La administracin de la concurrencia involucra como los datos son consultados y actualizados en un ambiente multiusuario. Existen dos tipos de control de la concurrencia:
Concurrencia de Lectura: (Instruccin SELECT) Administrada a travs de los niveles de aislamiento. Concurrencia de Actualizacin: Instrucciones INSERT, DELETE y UPDATE.
Definir el Esquema Conceptual. Es tarea del administrador de datos decidir con exactitud cual es la informacin que debe mantenerse en la base de datos, una vez identificado los datos a almacenar en un nivel abstracto, el dba debe crear a continuacin el esquema conceptual correspondiente, empleando el DDL conceptual. Definir el Esquema Interno. El dba debe definir la representacin de la informacin en la base de datos almacenada (diseo fsico). Debe crear la definicin de estructura de almacenamiento correspondiente (esquema interno) con el DDL interno y definir la correspondencia entre los esquemas interno y conceptual. Vincularse con los Usuarios. El dba debe encargarse de la comunicacin con los usuarios, garantizar la disponibilidad de los datos que requieren y escribir y/o ayudar a los usuarios a escribir los esquemas externos necesarios, empleando el DDL externo aplicable. Procedimientos de Respaldo y Recuperacin. El dba debe definir un plan de recuperacin adecuado que incluya descarga o vaciado peridico de la base de datos en un medio de almacenamiento de respaldo, y procedimientos para cargar otra vez la base de datos a partir del vaciado ms reciente cuando sea necesario. Supervisar el Desempeo y Responder a cambios en los Requerimientos. El dba debe organizar el sistema de modo que se obtenga el desempeo que sea "el mejor para la empresa", y realizar los ajustes apropiados cuando cambien los requerimientos. Concesin de Autorizacin para el Acceso a los Datos. La concesin de diferentes tipos de autorizacin, permite al administrador de la base de datos regular que partes de la base de datos van a poder ser accedidas por varios usuarios.
Definicin de esquema. Es el esquema original de la base de datos se crea escribiendo un conjunto de definiciones que son traducidas por el compilador de DDL a un conjunto de tablas que son almacenadas permanentemente en el diccionario de datos. Definicin de la estructura de almacenamiento del mtodo de acceso. Estructuras de almacenamiento y de acceso adecuados se crean escribiendo un conjunto de definiciones que son traducidas por e compilador del lenguaje de almacenamiento y definicin de datos. 1. Funciones Especficas del DBMS
El sistema manejador de bases de datos es la porcin ms importante del software de un sistema de base de datos. Un DBMS es una coleccin de numerosas rutinas de software interrelacionadas, cada una de las cuales es responsable de alguna tarea especfica. El DBMS es un conjunto de programas que coordina y controla la creacin y los accesos a la base de datos. Se compone de un Lenguaje de Definicin de Datos (DDL), que es la parte esttica en donde se define la estructura de la base de datos; de un Lenguaje de Manipulacin de Datos (DML) que es la parte dinmica y de un Lenguaje de Consulta (SQL). A dems de administrar la actividad de datos y la estructura de la base de datos, el DBA debe administrar el DBMS mismo. Deber compilar y analizar estadsticas relativas al rendimiento del sistema e identificar reas potenciales del problema. Dado que la BD est sirviendo a muchos grupos de usuarios, el DBA requiere investigar todas las quejas sobre el tiempo de respuesta del sistema, la precisin de los datos y la facilidad de uso. Si se requieren cambios el DBA deber planearlos y ponerlos en prctica. El DBA deber vigilar peridica y continuamente las actividades de los usuarios en la base de datos. Los productos DBMS incluyen tecnologas que renen y publican estadsticas. Estos informes pudieran indicar cules fueron los usuarios activos, que archivos y que elementos de datos han sido utilizados, e incluso el mtodo de acceso que se ha aplicado. Pueden capturarse y reportarse las tasas de error y los tipos de errores. El DBA analizar estos datos para determinar si se necesita una modificacin en el diseo de la BD para manejar su rendimiento o para facilitar las tareas de los usuarios; de ser as, el DBA la llevar a cabo. El DBA deber analizar las estadsticas de tiempo de ejecucin sobre la actividad de la BD y su rendimiento. Cuando se identifique un problema de rendimiento, ya sea mediante una queja o un informe, el DBA deber determinar si resulta apropiada una modificacin a la estructura de la base de datos o al sistema. Casos como la adicin de nuevas claves o su eliminacin, nuevas relaciones entre los datos y otras situaciones tpicas debern ser analizadas para determinar el tipo de modificacin procedente. Cuando el fabricante del DBMS en uso anuncie una nueva versin del producto, debe realizarse un anlisis de las caractersticas que esta incorpora y sopesarlas contra las necesidades de la comunidad de usuarios. Si se decide la adquisicin del producto, los usuarios deben ser notificados y capacitados en su uso. El DBA deber administrar y controlar la migracin tanto de las estructuras, como de los datos y las aplicaciones. El software de soporte y otras caractersticas de hardware pueden implicar tambin modificaciones de las que el DBA es responsable ocasionalmente, estas modificaciones traen como consecuencia cambios en la configuracin o en algunos parmetros de operacin del DBMS. Las Funciones Principales de un DBMS son: Manejo de un Diccionario de Datos. Definiciones y relaciones entre los datos. Administracin de los Datos Almacenados. Creacin de estructuras complejas requeridas para el almacenamiento de los datos, descargando al usuario de definir y programar las caractersticas fsicas de los datos. Transformacin y Presentacin de los Datos. Transformacin de los datos nuevos para que satisfaga la estructura ya definida. Seguridad. Fortalece la seguridad y la privacidad. Control de Concurrencia. Controla el acceso multiusuario. Consiste en controlar la interaccin entre los usuarios concurrentes para no afectar la inconsistencia de los datos.
Integridad de Datos. Minimiza la redundancia y maximiza la consistencia. Consiste en contar con mecanismos que permitan el control de la consistencia de los datos evitando que estos se vean perjudicados por cambios no autorizados o previstos. Lenguaje de Acceso a la Base de Datos. (Interfaz para la programacin de aplicaciones). Provee acceso a los datos va lenguaje de consulta SQL y va lenguaje procedimental (pascal, c, etc.). Interfaz de Comunicacin de Datos. Permite el requerimiento de usuarios en ambiente de red. Crear y organizar la Base de datos. Establecer y mantener las trayectorias de acceso a la base de datos de tal forma que los datos puedan ser accesados rpidamente. Manejar los datos de acuerdo a las peticiones de los usuarios. Registrar el uso de las bases de datos. Interaccin con el manejador de archivos. Esto a travs de las sentencias en DML al comando de el sistema de archivos. As el Manejador de base de datos es el responsable del verdadero almacenamiento de los datos. Respaldo y recuperacin. Consiste en contar con mecanismos implantados que permitan la recuperacin fcilmente de los datos en caso de ocurrir fallas en el sistema de base de datos. Manejador de Bases de Datos. Su propsito es definir una arquitectura que sirva como referencia. Esta tambin es llamada arquitectura referencial a tres niveles, consta de tres niveles: Nivel Interno: Es el ms cercano al almacenamiento fsico; es decir, es el que se ocupa de la forma como se almacena fsicamente los datos. Nivel Externo: Es el ms cercano a los usuarios; es decir, es el que se ocupa de la forma como los usuarios individuales perciben los datos. Nivel Conceptual: Es el nivel de mediacin entre los dos anteriores. En este se trabaja con informacin; esto es, con datos suficientes para provocar acciones. La vista conceptual es la representacin de toda la informacin contenida en la base de datos, tambin una forma un tanto abstracta si se compara con el almacenamiento fsico de los datos. La informacin es una esencia nueva y no redundante por lo que su adquisicin aumenta el conocimiento. El Sistema Administrador de la Base de Datos. Un sistema de base de datos, es la combinacin de programas y archivos que se utilizan conjuntamente. Un conjunto integrado de programas para dar apoyo en una base de datos puede formar un sistema de manejo de bases de datos y sirve adems para supervisar y mantener la vista lgica global de los datos. El DBMS es conocido tambin como Gestor de Base de datos. Para ver el grfico seleccione la opcin "Descargar" del men superior Sistema Gestor de Base de Datos. El DBMS sirve como interface entre la base de datos fsica y las peticiones del usuario. El DBMS interpreta las peticiones de entrada/salida del usuario y las manda al sistema operativo para la transferencia de datos entre la unidad de memoria secundaria y la memoria principal. En s, un sistema manejador de base de datos es el corazn de la base de datos ya que se encarga del control total de los posibles aspectos que la puedan afectar. Unidad II. Implementacin del esquema Conceptual (Nivel Lgico Global) El nivel conceptual describe la estructura lgica global de la base de datos mediante un modelo abstracto de datos comprensible por el SGBD. Se definen la descripcin de atributos, de entidades, las conexiones y las restricciones de integridad asociadas a la semntica (significado). Podemos decir que describe que datos son almacenados realmente en la base de datos y las relaciones que existen entre los mismos, describe la base de datos completa en trminos de su estructura de diseo. El nivel conceptual de abstraccin lo usan los administradores de bases de datos, quienes deben decidir qu informacin se va a guardar en la base de datos.
El esquema conceptual representa la visin organizacional de la base de datos que se obtiene al integrar los requerimientos de todos los usuarios en una empresa; y es totalmente independiente de las estructuras fsicas de almacenamiento y de la representacin final de los datos que los usuarios manejan. La implantacin de este esquema es responsabilidad del DBA. Para ver el grfico seleccione la opcin "Descargar" del men superior Diagrama del esquema conceptual. El esquema conceptual consta de las siguientes definiciones: Definicin de los datos: Se describen el tipo de datos y la longitud de campo todos los elementos direccionables y precisin de la informacin que ser guardada en la base de datos. Los elementos por definir incluyen artculos elementales (atributos), totales de datos y registros conceptuales (entidades). Relaciones entre datos: Se definen las relaciones entre datos para enlazar tipos de registros relacionados para el procesamiento de archivos mltiples para obtener informacin compuesta y procesos complejos. En el nivel conceptual la base de datos aparece como una coleccin de registros lgicos, sin descriptores de almacenamiento. En realidad los archivos conceptuales no existen fsicamente. La transformacin de registros conceptuales a registros fsicos para el almacenamiento se lleva a cabo por el sistema y es transparente al usuario. Elementos en la Definicin de Datos. Atributos.- Identificador que permite manipular en forma individual las caractersticas de un objeto (entidades). Representan las propiedades bsicas de las entidades y de las relaciones. Cada atributo tiene un conjunto de valores asociados denominado dominio. El dominio define todos los valores posibles que puede tomar un atributo. Existen diferentes tipos de atributos:
Atributo simple: Este atributo tiene un solo componente, que no se puede dividir en partes mas pequeas que tengan un significado propio. Atributo Compuesto: Es un atributo con varios componentes, cada uno con un significado por s mismo. Un grupo de atributos se representa mediante un atributo compuesto cuando tienen afinidad en cuanto a su significado, o en cuanto a su uso. Se representa grficamente mediante un valo. Atributo Monovalente: es aqul que tiene un solo valor para cada ocurrencia de la entidad o relacin a la que pertenece. Atributo Polivalente: Es aqul que tiene varios valores para cada ocurrencia de la entidad o relacin a la que pertenece. tambin se les denominamultivaluados, y pueden tener un nmero mximo y un nmero mnimo de valores dada por la cardinalidad.
Llaves.- Atributos o conjuntos de atributos mediante los cuales pueden hacerse referencia a una entidad especfica, que deben reconocerse y definirse con claridad:
Sper-llaves: Es un conjunto de uno o ms atributos que, tomados colectivamente, permiten identificar de forma nica una entidad en el conjunto de entidades. Es un conjunto de atributos mediante los cuales es posible reconocer a una entidad. Este tipo de llaves contiene comnmente atributos ajenos; es decir, atributos que no son indispensables para llevar a cabo el reconocimiento del registro. Llaves candidato: Las llaves candidatas son subconjuntos mnimas de las sper claves, ya que el concepto de sper clave no es suficiente, puede contener atributos innecesarios. Son aquellas sper llaves que no contienen atributos ajenos; es decir, aquellos conjuntos de atributos que no tienen un subconjunto menor que pueda considerarse como sper llave Llave primaria: Es aquel atributo el cual consideramos clave para la identificacin de los dems atributos que describen a la entidad. Es aquella llave que el diseador de la base de datos selecciona entra las llaves candidatos encontradas.
Entidades Fuertes y Dbiles.- Una entidad es un objeto que existe y se distingue de otros objetos de acuerdo a sus caractersticas llamadas atributos. Existen conjuntos de entidades que no poseen los atributos necesarios para conformar una llave primaria; a estos se les conoce como entidades dbiles. Cuando existen los atributos necesarios para formar una llave primaria, se denominan entidades fuertes. Las entidades dbiles se subordinan a las entidades fuertes. Especializacin y Generalizacin.- La generalizacin es el resultado de la unin de 2 o ms conjuntos de entidades (de bajo nivel) para producir un conjunto de entidades de ms alto nivel. Se usa para hacer resaltar los parecidos entre tipos de entidades de nivel ms bajo y ocultar sus diferencias. En otras palabras, consiste en identificar todos aquellos atributos iguales de un conjunto de entidades para formar una entidad(es) global(es) con dichos atributos semejantes, dicha entidad(es) global(es) quedara a un nivel ms alto al de las entidades origen. Trata de eliminar la redundancia (repeticin) de atributos, al englobar los atributos semejantes. La Especializacin es el resultado de tomar un subconjunto de entidades de alto nivel para formar un conjunto de entidades de ms bajo nivel. Particin de entidades con el objeto de optimizar el espacio de almacenamiento. Dependencias de Existencias.- Debe especificarse con precisin si la existencia de una o ms entidades o conjuntos de entidades- estn supeditadas a la existencia de otras; es decir, si la entidad A depende de la existencia de la entidad B, entonces A es dependiente de existencia por B, si eliminamos a B tendramos que eliminar por consecuente la entidad A, en este caso B es la entidad Dominante y A es la entidad subordinada. Elementos en la Definicin de las Relaciones. El establecimiento de conexiones entre las entidades y conjuntos de entidades que conforman una base de datos, deben especificarse en forma precisa de la siguiente manera: Para cada relacin:
Nombre de las Relaciones.- Generalmente es una etiqueta que indica la funcin que desempea la relacin; a esta relacin se le denomina papel. En los modelos donde se requiere una mayor precisin en la definicin de los componentes, se recomienda indicar los papeles en ambos sentidos. Cardinalidad de las Relaciones.- Debe definirse en forma muy precisa si las entidades de cada conjunto de entidades tendrn interaccin con solo una o varias entidades del conjunto a relacionar. Debe verificarse que la cardinalidad tenga validez para todos los casos que puedan presentarse en el manejo de la BD; es decir, si son validas para cualquier instancia. Opcionalidad de las Relaciones.- Permiten definir con mayor claridad aquellos casos en los que una relacin puede no establecerse. Las especificaciones de estas situaciones nos permitirn definir estructuras ms precisas, consistentes y de baja redundancia.
Consideraciones de Agregacin. Es la agrupacin dos o ms conjuntos de entidades relacionados para conformar un solo conjunto lgico de entidades. El objetivo primordial en la agregacin ser el establecer relaciones entre conjuntos de entidades agrupadas. Metodologa del Diseo Conceptual Se construyen varios esquemas conceptuales, cada uno para representar las distintas visiones que los usuarios tienen de la informacin. Cada una de las visiones suelen corresponder a las diferentes reas funcionales de la empresa. A los esquemas conceptuales correspondientes a cada vista de usuario se les denomina esquemas conceptuales locales. Cada uno de estos esquemas se compone de entidades, relaciones, atributos, dominios de atributos e identificadores. El esquema conceptual tambin tendr una documentacin, que se ir produciendo durante su desarrollo. Las tareas a realizar en el diseo conceptual son las siguientes: 1. 2. Identificar las entidades. 3. Identificar las relaciones. 4. Identificar los atributos y asociarlos a entidades y relaciones.
5. 6. 7. 8. 9.
Determinar los dominios de los atributos. Determinar los identificadores. Determinar las jerarquas de generalizacin (si las hay). Dibujar el diagrama entidad-relacin. Revisar el esquema conceptual local con el usuario.
2.1 Estructura de la Base de Datos. Esquema de base de datos: Es la estructura por la que esta formada la base de datos, se especifica por medio de un conjunto de definiciones que se expresa mediante un lenguaje especial llamado lenguaje de definicin de datos. (DDL). Adems de la definicin de las propiedades de los datos y de las relaciones debe especificarse el formato que guardaran las siguientes estructuras: Diccionario de datos. Contiene la informacin referente a la estructura de la base de datos. Informacin que nos indique con claridad el tipo de datos que sern utilizados, sus mbitos de influencia y sus limitantes de integridad. ndices. Permiten un rpido acceso a registros que contienen valores especficos. Son estructuras, se definen para un atributo o conjunto de atributos asociados, que nos permiten simular una secuencia lgica para las entidades. La principal cualidad de un ndice reside en la capacidad para acelerar el acceso a un dato especfico. Formatos de Captura y Presentacin: Las aplicaciones debern proveer interfaces amigables y eficientes entre el usuario y la BD. Para esto se definirn, formatos y pantallas de captura, de consulta y de reporte. La informacin resultante ser procesada y direccionada cada vez que se active la captura o la consulta, el formato de tal captura o consulta, el formato de tal captura o consulta podr almacenarse para su reutilizacin. La etapa de normalizacin debe refinar los detalles del modelo resultante, de tal forma que la estructura de las tablas proporcione un bajo nivel de redundancia, minimice hasta donde sea posible la inconsistencia y sea capaz de proporcionar acceso eficiente a los datos. Ocasionalmente ser preferible llevar la normalizacin hasta un nivel no ptimo si se obtiene a cambio eficiencia en el acceso a los datos u otros beneficios que eleven en forma significativa el desempeo del sistema. 2.2 Esquema de Integridad. Integridad: Consiste en conservar la seguridad en un sistema que se permite a mltiples usuarios el acceso al sistema y compartir la base de datos. Tiene como funcin proteger la base de datos contra operaciones que introduzcan inconsistencias en los datos. Se habla de integridad en el sentido de correccin, validez o precisin de los datos. Un control de integridad o restricciones es aquel que nos permite definir con precisin el rango de valores validos para un elemento y/o las operaciones que sern consideraciones validas en la relacin de tale elementos. El objetivo primordial de un control de integridad es la reduccin de la inconsistencia en la BD. Las restricciones de integridad normalmente se aplican en tres niveles:
Un Atributo Simple: Se define un dominio del atributo que es totalmente independiente del resto del entorno de la Base de Datos. Es un atributo que tiene un solo componente, que no se puede dividir en partes mas pequeas que tengan un significado propio(valor nico). Se identifica por la letra inicial en mayscula. Un Atributo Dependiente de Otro: Se definen subconjuntos de dominios posibles para un atributo X segn el valor que previamente a sido asignado al atributo W. Tambin es conocido como atributos de grupo y se representa por medio de corchetes. Relaciones entre Tuplas de una o varias Tablas: Se especifican valores posibles para registros completos segn los valores acumulados registros previos o por valores existentes en registros de otras tablas. Tambin es conocido como objeto simtrico y se representa con un rectngulo sombreado y todo con mayscula.
Reglas de Integridad.
Integridad de referencial. Se aplica a las claves ajenas: si en una relacin hay alguna clave ajena, sus valores deben coincidir con valores de la clave primaria a la que hace referencia, o bien, deben ser completamente nulo. Se enmarca en trminos de estados de la base de datos indica lo que es un estado ilegal pero no dice como puede evitarse. Existen 2 opciones rechazar la operacin o bien aceptar la operacin y realizar operaciones adicionales compensatorias que conduzcan a un estado legal. Por lo tanto, para cada clave ajena de la base de datos habr que contestar a tres preguntas: Reglas de los nulos: tiene sentido que la clave ajena acepte nulos? Regla de borrado: Qu ocurre si se intenta borrar la tupla referenciada por la clave ajena?
Restringir: no se permite borrar la tupla referenciada. Propagar: se borra la tupla referenciada y se propaga el borrado a las tuplas la referencia mediante la clave ajena. Anular: se borra la tupla referenciada y las tuplas que la reverenciaba ponen a nulo la clave ajena (solo si acepta nulos).
Reglas de modificacin: Qu ocurre si se intenta modificar el valor de la clave primaria de la tupla referenciada por la clave ajena?
Restringir: no se permite modificar el valor de la clave primaria de la tupla referenciada. Propagar: se modifica el valor de la clave primaria de la tupla referenciaba y se propaga la modificacin a las tuplas que la referencia mediante clave ajena. Anular: se modifica la tupla referenciada y las tuplas que la referenciaban ponen a nulo la clave ajena (solo si acepta nulos).
Reglas de Integridad de Dominio. Un dominio de valores posibles puede estar asociado con cada atributo. Los lmites de dominio son la forma ms elemental de restricciones de integridad. Son fciles de probar por el sistema siempre que se introduce un nuevo dato en la base de datos. Tipos de dominios: Es posible que varios atributos tengan el mismo dominio. Podemos ver que una definicin adecuada de restricciones de dominio no solo nos permite probar consultas para asegurar que la comparacin que se hace tiene sentido. El principio que hay detrs de los dominios de atributo es similar al que hay detrs de la asignacin de tipos a variables en los lenguajes de programacin. Los lenguajes de programacin fuertemente tipiados permiten que el compilador el programa con mayor detalle. Integridad de relaciones. Esta regla se aplica a las claves primarias de las relaciones base: ningn atributo que forme parte de una llave primaria puede aceptar valores nulos. Por definicin, una clave primaria es irreducible que se utiliza para identificar de modo nico las tuplas. Irreducible significa que ningn subconjunto de la clave primaria sirve para identificar las tuplas de modo nico. Si se permite que parte de la clave primaria sea nula, se est diciendo que no todos sus atributos son necesarios para distinguir las tuplas, con lo que se contradice la irreducibilidad. Esta regla solo se aplica a las relaciones base y a las claves primarias, no a las claves alternativas. Nulos: Ningn atributo que forme parte de una llave primaria puede aceptar valores nulos. Un valor nulo es un valor que esta fuera de la definicin de cualquier dominio el cual permite dejar el valor del atributo "latente"; en otras palabras, un valor nulo no representa el valor cero, ni una cadena vaca, stos son valores que tienen significado; implica ausencia de informacin porque se desconoce el valor del atributo o simplemente no tiene sentido. Reglas de negocio: Los usuarios o los administradores de la base de datos pueden imponer ciertas restricciones especficas sobre los datos, a esto se le conoce como reglas de negocio. 2.3 Esquema de Seguridad y Autorizacin. Seguridad: El objetivo es proteger la Base de Datos contra accesos no autorizados. Se le conoce tambin como privacidad. Incluye aspectos de:
10
Aspectos legales, sociales y ticos. Polticas de la empresa, niveles de informacin pblica y privada. Controles de tipo fsico, acceso a las instalaciones. Identificacin de usuarios: voz, retina del ojo, etc. Controles de sistema operativo.
En relacin al SGBD, debe mantener informacin de los usuarios, su tipo y los accesos y operaciones permitidas a stos. El problema de la seguridad consiste en lograr que los recursos de un sistema sean, bajo toda circunstancia, utilizados para los fines previstos. Para eso se utilizan mecanismos de proteccin. Un aspecto importante de la seguridad es el de impedir la prdida de informacin, la cual puede producirse por diversas causas: fenmenos naturales, guerras, errores de hardware o de software, o errores humanos. La solucin es una sola: mantener la informacin respaldada, de preferencia en un lugar lejano Otro aspecto importante de la seguridad, es el que tiene que ver con el uso no autorizado de los recursos:
Lectura de datos. Modificacin de datos. Destruccin de datos. Uso de recursos: ciclos de CPU, impresora, almacenamiento.
Otras amenazas y ataques posibles: Virus. Un virus es parecido a un gusano, en cuanto se reproduce, pero la diferencia es que no es un programa por s slo, si no que es un trozo de cdigo que se adosa a un programa legtimo, contaminndolo. Cuando un programa contaminado se ejecuta, ejecutar tambin el cdigo del virus, lo que permitir nuevas reproducciones, adems de alguna accin (desde un simple mensaje inocuo hasta la destruccin de todos los archivos). Caballo de troya. Un caballo de troya es un programa aparentemente til que contiene un trozo de cdigo que hace algo no deseado. Puerta trasera. Una puerta trasera es un punto de entrada secreto, dejado por los implementadores del sistema para saltarse los procedimientos normales de seguridad. La puerta trasera puede haberse dejado con fines maliciosos o como parte del diseo; en cualquier caso, son un riesgo. Caza claves. Dejar corriendo en un terminal un programa que pida "login:" y luego "password:", para engaar a los usuarios de modo que estos revelen su clave. Solicitar recursos como pginas de memoria o bloques de disco, y ver qu informacin contienen; muchos sistemas no los borran cuando se liberan, de modo que se puede encontrar informacin "interesante". Sobornar o torturar al administrador para que suelte la clave. Principios bsicos para la seguridad:
Suponer que el diseo del sistema es pblico. El defecto debe ser: sin acceso. Chequear permanentemente. Los mecanismos de proteccin deben ser simples, uniformes y construidos en las capas ms bsicas del sistema. Los mecanismos deben ser aceptados sicolgicamente por los usuarios.
Tipos de usuarios: Podemos definir a los usuarios como toda persona que tenga todo tipo de contacto con el sistema de base de datos desde que este se disea, elabora, termina y se usa.
11
DBA, estn permitidas todas las operaciones, conceder privilegios y establecer usuarios. Usuario con derecho a crear, borrar y modificar objetos y que adems puede conceder privilegios a otros usuarios sobre los objetos que ha creado. Privilegios sobre los objetos, aadir nuevos campos, indexar, alterar la estructura de los objetos, etc. Programadores de aplicaciones. Los profesionales en computacin que interactan con el sistema por medio de llamadas en DML (Lenguaje de Manipulacin de Datos), las cuales estn incorporadas en un programa escrito en un lenguaje de programacin (Por ejemplo, Cobol, PL/I, Pascal, C, etc.). Usuarios sofisticados. Los usuarios sofisticados interactan con el sistema sin escribir programas. En cambio escriben sus preguntas en un lenguaje de consultas de base de datos. Usuarios especializados. Algunos usuarios sofisticados escriben aplicaciones de base de datos especializadas que no encajan en el marco tradicional de procesamiento de datos. Usuarios ingenuos. Los usuarios no sofisticados interactan con el sistema invocando a uno de los programas de aplicacin permanentes que se han escrito anteriormente en el sistema de base de datos, podemos mencionar al usuario ingenuo como el usuario final que utiliza el sistema de base de datos sin saber nada del diseo interno del mismo por ejemplo: un cajero.
Los SGBD tienen opciones que permiten manejar la seguridad, tal como GRANT, REVOKE, etc. Tambin tienen un archivo de auditora en donde se registran las operaciones que realizan los usuarios. Medidas de Seguridad Fsicas: Controlar el acceso al equipo. Tarjetas de acceso, etc. Personal: Acceso slo del personal autorizado. Evitar sobornos, etc. SO: Seguridad a nivel de SO. SGBD: Uso herramientas de seguridad que proporcione el SGBD. Perfiles de usuario, vistas, restricciones de uso de vistas, etc. Un SMBD cuenta con un subsistema de seguridad y autorizacin que se encarga de garantizar la seguridad de porciones de la BD contra el acceso no autorizado:
Identificar y autorizar a los usuarios: uso de cdigos de acceso y palabras claves, exmenes, impresiones digitales, reconocimiento de voz, barrido de la retina, etc. Autorizacin: usar derechos de acceso dados por el terminal, por la operacin que puede realizar o por la hora del da. Uso de tcnicas de cifrado: para proteger datos en Base de Datos distribuidas o con acceso por red o internet. Diferentes tipos de cuentas: en especial del ABD con permisos para: creacin de cuentas, concesin y revocacin de privilegios y asignacin de los niveles de seguridad. Manejo de la tabla de usuarios con cdigo y contrasea, control de las operaciones efectuadas en cada sesin de trabajo por cada usuario y anotadas en la bitcora, lo cual facilita la auditoria de la Base de Datos.
Identificacin y Autentificacin. En un SGBD existen diversos elementos que ayudan a controlar el acceso a los datos. En primer lugar el sistema debe identificar y autentificar a los usuarios utilizando alguno de las siguientes formas:
Cdigo y contrasea. Identificacin por hardware. Caractersticas bioantropomtricas. Conocimiento, aptitudes y hbitos del usuario. Informacin predefinida (Aficiones, cultura, etc.)
Adems, el administrador deber especificar los privilegios que un usuario tiene sobre los objetos:
12
Actualizar datos. Crear o actualizar objetos. Ejecutar procedimientos almacenados. Referenciar objetos. Indexar objetos. Crear identificadores.
Mecanismos de Autentificacin. La autentificacin, que consiste en identificar a los usuarios que entran al sistema, se puede basar en posesin (llave o tarjeta), conocimiento (clave) o en un atributo del usuario (huella digital). Claves: El mecanismo de autentificacin ms ampliamente usado se basa en el uso de claves o passwords; es fcil de entender y fcil de implementar. Sin embargo, una proporcin demasiado grande de las claves escogidas por los usuarios son fciles de adivinar, pues la idea es que sean tambin fciles de recordar. La clave tambin se puede descubrir mirando (o filmando) cuando el usuario la digita, o si el usuario hace login remoto, interviniendo la red y observando todos los paquetes que pasan por ella. Por ltimo, adems de que las claves se pueden descubrir, stas tambin se pueden "compartir", violando las reglas de seguridad. En definitiva, el sistema no tiene ninguna garanta de que quien hizo login es realmente el usuario que se supone que es. Identificacin fsica: Un enfoque diferente es usar un elemento fsico difcil de copiar, tpicamente una tarjeta con una banda magntica. Para mayor seguridad este enfoque se suele combinar con una clave (como es el caso de los cajeros automticos). Otra posibilidad es medir caractersticas fsicas particulares del sujeto: huella digital, patrn de vasos sanguneos de la retina, longitud de los dedos. Incluso la firma sirve. Algunas medidas bsicas:
Demorar la respuesta ante claves errneas; aumentar la demora cada vez. Alertar si hay demasiados intentos. Registrar todas las entradas. Cada vez que un usuario entra, chequear cundo y desde dnde entr la vez anterior. Hacer chequeos peridicos de claves fciles de adivinar, procesos que llevan demasiado tiempo corriendo, permisos errneos, actividades extraas (por ejemplo cuando usuario est de vacaciones).
Matriz de Autorizacin. Autorizaciones. Para facilitar la administracin los SGBD suele incorporar el concepto de perfil, rol o grupo de usuarios que agrupa a una serie de privilegios por lo que el usuario que se asigna a un grupo hereda todos los privilegios del grupo. El mecanismo de control de acceso se encarga de denegar o conceder el acceso a los usuarios. En un SGBD pueden existir diferentes tipos de autorizacin: Una primera distincin puede hacerse entre: Autorizacin explcita. Normalmente usada en los sistemas tradicionales. Consiste en almacenar que sujetos pueden accesar a ciertos objetos con determinados privilegios para lo que suele utilizarse una matriz de control de accesos. Autorizacin implcita. Consiste en que una autorizacin definida sobre un objeto puede deducirse a partir de otras (por ejemplo si se puede acceder a una clase en un SGBD se puede tambin acceder a todas las instancias de esa clase). Los usuarios pueden tener varios tipos de autorizacin para diferentes partes de la base de datos. Entre ellas estn las siguientes:
La autorizacin de lectura permite la lectura de los datos, pero no su modificacin La autorizacin de insercin permite la insercin de datos nuevos, pero no la modificacin de los existentes. La autorizacin de actualizacin permite la modificacin de los datos, pero no su borrado. La autorizacin de borrado permite el borrado de los datos.
13
Los usuarios pueden recibir todos los tipos de autorizacin o ninguno de ellos, o una combinacin determinada de los mismos. Adems de estas formas de autorizacin para el acceso a los datos los usuarios pueden recibir autorizacin para modificar el esquema de la base de datos:
La autorizacin de ndices permite la creacin y borrado de ndices. La autorizacin de recursos permite la creacin de las relaciones nuevas. La autorizacin de alteracin permite el aadido o el borrado de atributos de las relaciones. La autorizacin de eliminacin permite el borrado de relaciones.
Las autorizaciones de eliminacin y de borrado se diferencian en que la autorizacin de borrado solo permite el borrado de tuplas. Si un usuario borra todas las tuplas de una relacin, la relacin sigue existiendo, vaca. Si se elimina una relacin, deja de existir. La capacidad de crear nuevas relaciones queda regulada mediante la autorizacin de recursos. El usuario con la autorizacin de recursos que crea una relacin nueva recibe automticamente todos los privilegios sobre el sistema. La autorizacin de ndices puede parecer innecesaria, dado que la creacin o borrado de un ndice no afecta a los datos de las relaciones. Ms bien, los ndices son una estructura para las mejoras de rendimiento. Sin embargo, los ndices tambin ocupan espacio y se exige que las modificaciones de las bases de datos actualicen los ndices , los que llevaran a cabo actualizaciones estaran tentados de borrar los ndices , los que llevan a cabo actualizaciones estaran tentados de borrar los ndices, mientras que los que formulara consultas estaran tentados de crear numeroso ndices. La forma superior de autoridad es la concebida al administrador de la base de datos. El administrador de la base de datos puede autorizar usuarios nuevos, reestructurar la base de datos, etc. Esta forma de autorizacin es anloga a la proporcionada al sper usuario u operador del sistema operativo. Riesgos para la Seguridad de la Informacin. Riesgos en la Implantacin. Cuando se esta instalando o actualizando un sistema, los principales factores de riesgo son aquellos relacionados con el ajuste de formatos, dominios y otros parmetros que pueden verse afectados por la conversin del sistema; ya sea manual-automatizado o automatizado-automatizado. Cuando el sistema que se implanta ha de recibir nueva informacin, es importante el establecimiento de cdigos que permitan validar la captura para minimizar los riesgos de informacin no confiable. Riesgos en la Operacin. Mientras el sistema se encuentra en uso, se dice que las operaciones se realizan en lnea; es decir, la informacin se afecta por medio de los procedimientos definidos en el sistema. La proteccin ms comn para reducir estos riesgos consiste en el establecimientos de claves de operacin (password) tanto para accesar a la aplicacin como a las diversas operaciones que esta desempea. Las claves pueden asignarse:
Genrico Por niveles de seguridad Por tipos de acceso a los datos. Criterios para la seleccin de las claves de acceso:
No informacin que pueda asociarse al usuario. Fcil de recordar, difcil de adivinar. Debe utilizar un parmetro variable o algoritmo
Algunos sistemas que manejan claves fijas pueden incluir controles sobre el usuario que lo obliguen a modificar su clave de acceso con cierta regularidad. Es importante que el cdigo que mantiene la tabla de claves de usuarios en el sistema se encuentre codificada o encriptada.
14
Riesgos en Tiempos Muertos. Cuando el sistema no se encuentra en operacin la informacin est expuesta a ser alterada fuera de lnea; es decir, sin utilizar los programas de aplicacin diseados para este fin. Algunas de las tcnicas ms utilizadas para evitar y en algunos casos solo para ejecutar modificaciones fuera de lnea son:
Encriptamiento.- Consiste en convertir la informacin de la BD a un formato que resulte ilegible sino se dispone del algoritmo de conversin. Aplicacin de Totales de Control.- Consiste en generar registros ficticios que son agregados a la BD y que permitirn detectar la insercin, eliminacin o modificacin de datos en la gran mayora de los casos. Los registros ficticios son creados con informacin que se obtiene de acumulados o valores estadsticos de los registros reales. Dgitos de Control.- son caracteres que se anexan a las claves o a los datos que sern manejados con el objeto de autentificar su validez. Su aplicacin se extiende a procesos en lnea y proteccin fuera de lnea.
Consideraciones en Ambiente Multiusuario. Precauciones adicionales a las anteriores, deben ser tomadas en cuenta para elevar el nivel de seguridad en redes de usuarios. Las ms comunes son:
Validar no contraseas repetidas. Eliminar claves de acceso de usuarios deshabilitados. Establecer polticas y sanciones por desatender estaciones desconectadas (con acceso). Restringir procesos de alto riesgo a terminales con mayor nivel de seguridad y/o vigilancia. Establecer controles dial-up/call-back para el acceso validado a las terminales; es decir, implementar sistemas electrnicos de autenticacin de terminal. Establecer polticas para denegar el acceso despus de una cantidad determinada de intentos fallidos de un tiempo transcurrido.
Controles Genricos de Acceso. Debe considerarse la posibilidad de controles alternos cuando el sistema maneja informacin o recursos altamente privilegiados para la organizacin. Las formas ms comunes para autentificar la identidad del usuario son:
Algo que el usuario conoce.- Password, contrasea, algoritmos de acceso. Algo que el usuario tiene.- Tarjetas de acceso, bandas magnticas etc. Identificacin de aspectos fsicos del usuario.- Huellas digitales, examen de la retina, voz etc.
2.4 Herramientas. El esquema conceptual se construye utilizando la informacin que se encuentra en la especificacin de los requisitos de usuario. El diseo conceptual es completamente independiente de los aspectos de implementacin, como pueden ser el SGBD que se va a usar, los programas de aplicacin, los lenguajes de programacin, el hardware disponible o cualquier otra consideracin fsica. Durante todo el proceso de desarrollo del esquema conceptual ste se prueba y se valida con los requisitos de los usuarios. El esquema conceptual es una fuente de informacin para el diseo lgico de la base de datos. Unidad III. Implementacin del Esquema Interno (Nivel Fsico). Es el nivel ms bajo de abstraccin, describe que datos son almacenados realmente en la base de datos y las relaciones que existen entre los mismos, describe la base de datos completa en trminos de su estructura de diseo. El diseo fsico es el proceso de producir la descripcin de la implementacin de la base de datos en memoria secundaria: estructuras de almacenamiento y mtodos de acceso que garanticen un acceso eficiente a los datos. Entre el diseo fsico y el diseo lgico hay una realimentacin, ya que alguna de las decisiones que se tomen durante el diseo fsico para mejorar las prestaciones, pueden afectar a la estructura del esquema lgico. Para ver el grfico seleccione la opcin "Descargar" del men superior
15
Diagrama del Esquema Fsico. El propsito del diseo fsico es describir cmo se va a implementar fsicamente el esquema lgico obtenido en la fase anterior. Concretamente en el modelo relacional, consiste en:
Obtener un conjunto de relaciones (tablas) y las restricciones que se deben cumplir sobre ellas. Determinar las estructuras de almacenamiento y los mtodos de acceso que se van a utilizar para conseguir unas prestaciones ptimas. Disear el modelo de seguridad del sistema.
Estrategias de Almacenamiento:- Asignacin de espacio de almacenamiento para el conjunto de datos. Estrategias de Emplazamiento de los Datos:- Para optimizar los recursos a la hora de exportar la base de datos (tiempo de respuesta, disco, memoria, etc.). Caminos de Acceso:- Se incluye la especificacin de claves como la de ndices y punteros. El administrador debe especificar dispositivos de memoria, tamao de pgina, nmero de pginas asignadas a cada rea de almacenamiento, tamao de buffer, correspondencia entre esquemas y organizaciones fsicas, agrupamiento, ndices, y dependiendo del SGDB podr tambin definir punteros entre registros.
Ventajas:
Aplicaciones Independientes del Nivel Interno:- Un cambio en la estrategia en los accesos a datos, no cambia el esquema conceptual. Transportabilidad para cambiar el SGDB a otro Entorno:- Basta rescribir la correspondencia interna/fsica. Aplicaciones Independientes del Nivel Conceptual:- Se puede modificar sin que afecte a las aplicaciones. Esto garantiza la confidencialidad de los datos.
3.1 Estructura de Datos. Un sistema de base de datos se encuentra dividido en mdulos cada uno de los cuales controla una parte de la responsabilidad total de sistema. En la mayora de los casos, el sistema operativo proporciona nicamente los servicios ms bsicos y el sistema de la base de datos debe partir de esa base y controlar adems el manejo correcto de los datos. As el diseo de un sistema de base de datos debe incluir la interfaz entre el sistema de base de datos y el sistema operativo. Los componentes funcionales de un sistema de base de datos, son: Gestor de Archivos. Gestiona la asignacin de espacio en la memoria del disco y de las estructuras de datos usadas para representar informacin. Manejador de Base de Datos. Sirve de interfaz entre los datos y los programas de aplicacin. Procesador de Consultas. Traduce las proposiciones en lenguajes de consulta a instrucciones de bajo nivel. Adems convierte la solicitud del usuario en una forma ms eficiente. Compilador de DDL. Convierte las proposiciones DDL en un conjunto de tablas que contienen metadatos, estas se almacenan en el diccionario de datos. Archivo de Datos. En l se encuentran almacenados fsicamente los datos de una organizacin. Diccionario de Datos. Contiene la informacin referente a la estructura de la base de datos. Informacin que nos indique con claridad el tipo de datos que sern utilizados, sus mbitos de influencia y sus limitantes de integridad. ndices. Permiten un rpido acceso a registros que contienen valores especficos. Son estructuras, se definen para un atributo o conjunto de atributos asociados, que nos permiten simular una secuencia lgica para las entidades. La principal cualidad de un ndice reside en la capacidad para acelerar el acceso a un dato especfico.
16
Datos Estadsticos. Almacenan informacin estadstica sobre los datos en la base de datos. El procesador de consultas usa esta informacin para seleccionar las formas eficientes para ejecutar una consulta. Diseo Fsico de una Base de Datos. El diseo fsico es el proceso de escoger las estructuras de almacenamiento en disco y mtodos de acceso a los datos ms adecuada para lograr un buen rendimiento de la base de datos. En el momento del diseo fsico es importante conocer la carga de trabajo (combinacin de consultas y actualizaciones) que la base de datos debe soportar y los requerimientos del usuario. Es importante tambin que el diseador conozca las tcnicas de procesamiento de consultas e indexacin soportadas por el SGBD. La clave de un buen diseo fsico es una correcta descripcin de la carga de trabajo: lista de consultas y actualizaciones, indicando sus frecuencias de operacin y el resultado esperado. Para cada consulta es necesario indicar las relaciones a las que se accede, los atributos de salida y los que intervienen en filtros y condiciones. Igualmente para las actualizaciones deben conocerse los atributos sobre los que se expresan condiciones y el tipo de actualizacin y la relacin y atributos actualizados. Durante el diseo fsico es necesario realizar importantes decisiones:
Que ndices crear. Las consultas y actualizaciones pueden beneficiarse de la presencia de ndices. Sin embargo las actualizaciones requieren de un tiempo adicional para mantener los ndices sobre atributos modificados.
Aspectos para realizar cambios en el esquema conceptual: Esquemas normalizados alternativos. En general existen diferentes alternativas para descomponer esquemas en una forma normal. Desnormalizacin. Podemos reconsiderar las descomposiciones realizadas durante la normalizacin para la mejora de consultas aplicadas sobre atributos de varias relaciones. Particionamiento vertical. En ocasiones puede resultar de inters dividir una relacin en ms relaciones para la mejora de consultas que afectan slo a ciertos atributos. Vistas. Aadir vistas para ocultar a los usuarios los cambios en el esquema conceptual. 3.2 Mtodos de Acceso. Organizacin de Ficheros. La organizacin de ficheros es la forma de situar los registros cuando se almacenan en disco. La eficiencia en las operaciones de manipulacin de registros depende de una correcta organizacin de ficheros. Los gestores soportan diferentes tcnicas de organizacin de ficheros y es una tarea importante del administrador de la base de datos elegir la opcin en funcin del patrn de uso. Existen tres organizaciones bsicas de archivos: a) Ficheros Heap. Sus registros estn colocados en forma aleatoria, este tipo de organizacin resulta adecuada cuando la forma de acceso ms frecuente es la recuperacin de todos los registro. b) Ficheros Ordenados. Sus registros estn ordenados segn los valores de una secuencia de campos (denominada clave de bsqueda). ste tipo resulta adecuado cuando los registros se recuperan en un cierto orden o cuando se recupera sobre un cierto rango de registro. c) Ficheros Hash. El hashing consiste en convertir el valor de un campo (o conjunto de campos) en una posicin dentro del archivo aplicndole una funcin denominada funcin de randomizacin o hash. 3.3 Herramientas. Herramientas CASE.
17
Una de las herramientas para llevar a cabo el resto de tareas del modo ms eficiente y efectivo posible en la primera etapa del ciclo de vida de las aplicaciones de bases de datos, es hacer uso de la herramienta CASE (Computer-Aided Software Engineering). La tecnologa CASE supone la automatizacin del desarrollo del software, contribuyendo a mejorar la calidad y la productividad en el desarrollo de sistemas de informacin. Una herramienta CASE suele incluir:
Un diccionario de datos para almacenar informacin sobre los datos de la aplicacin de la base de datos. Herramienta de diseo para dar apoyo al anlisis de datos. Herramientas que permitan desarrollar el modelo de datos corporativo, as como los esquemas conceptual y lgico. Herramientas para desarrollar los prototipos de las aplicaciones.
El uso de las herramientas CASE puede mejorar la productividad en el desarrollo de una aplicacin de base de datos. Y por productividad se entiende tanto la eficiencia en el desarrollo, como la efectividad del sistema desarrollado. La eficiencia se refiere al coste, tanto en tiempo como en dinero, de desarrollar la aplicacin. La efectividad se refiere al grado en que el sistema satisface las necesidades de los usuarios. Para tener una buena productividad, subir el nivel de efectividad puede ser ms importante que aumentar la eficiencia. Unidad IV. Implementaciones de los Esquemas Externos (Vistas) 4.1 Estructura de Datos. Es el nivel ms alto de abstraccin, es lo que el usuario final puede visualizar del sistema terminado, describe slo una parte de la base de datos al usuario acreditado para verla. El sistema puede proporcionar muchas visiones para la misma base de datos. Para ver el grfico seleccione la opcin "Descargar" del men superior Esquema del nivel de Vistas. Las Vistas:- Son una especie de tablas virtuales; es decir no existen fsicamente sino que forman mediante la seleccin y/o filtrado de los componentes de otras tablas, una vista puede ser definida en base a una lista previa. Esto significa que pueden crearse dependencia entre las vistas. Cuando una vista es definida en base a otra, se dice que es dependiente de esta por lo tanto, se suprimir automticamente la vista dependiente si se suprime la vista original. La eliminacin de una tabla provoca tambin la eliminacin automtica de todas las vistas que se hayan definido haciendo referencia a ella. Las vistas son una forma lgica de ver los datos fsicos ubicados en tablas. Cuando creamos una vista, seleccionamos un formato que incluye datos que pueden ser tomados de una o ms tablas. La vista queda almacenada en forma permanente, si bien los datos grabados permanecen inalterados en las tablas correspondientes. Una vista slo es una ventana a los datos almacenados. Una vista es el resultado dinmico de una o varias operaciones relacionales realizadas sobre las relaciones base. Una vista es una relacin virtual que se produce cuando un usuario la consulta. Al usuario le parece que la vista es una relacin que existe y la puede manipular como si se tratara de una relacin base, pero la vista no est almacenada fsicamente. El contenido de una vista est definido como una consulta sobre una o varias relaciones base. Cualquier operacin que se realice sobre la vista se traduce automticamente a operaciones sobre las relaciones de las que se deriva. Las vistas son dinmicas porque los cambios que se realizan sobre las tablas base que afectan a una vista se reflejan inmediatamente sobre ella. Cuando un usuario realiza un cambio sobre la vista (no todo tipo de cambios estn permitidos), este cambio se realiza sobre las relaciones de las que se deriva. El nivel ms alto de abstraccin describe slo parte de la base de datos completa. A pesar del uso de estructuras ms sencillas en el nivel conceptual, permanece algo de complejidad debido al gran tamao de la base de datos. Muchos usuarios del sistema de bases de datos no se interesarn por toda la informacin. En cambio, dichos
18
usuarios slo necesitan una parte de la base de datos. Para simplificar su interaccin con el sistema, se define el nivel de abstraccin de visin. El sistema puede proporcionar muchas visiones de la misma base de datos. La fase concluyente en el diseo de aplicaciones es la generacin de las interfaces que la aplicacin proporcionara para establecer comunicacin con el usuario. Tradicionalmente estas interfaces han sido escritas y/o capturadas, de tal forma que el usuario revisa informacin desplegada en pantalla o impresa en papel y responde introduccin de datos por el teclado y/o con el auxilio del ratn. Objetivos y Ventajas de las Vistas. El objetivo primordial de la utilizacin de esquemas externos es facilitar al usuario la percepcin que este tiene de la base de datos as como el trabajo que van a desarrollar sobre sta. Las principales ventajas que se obtienen al utilizar vistas son:
Perspectivas Directas.- Proporcionarse diversos modelos de informacin basados en los mismos datos, enfocndolos hacia distintos usuarios con necesidades especficas. El mostrar la informacin desde distintos ngulos nos ayuda a crear ambientes de trabajo y operacin acordes a los objetivos de la empresa. Debe evaluarse el perfil y requerimientos de informacin de los usuarios destino de la vista. Transparencias en las Modificaciones.- El usuario final no se vera afectado por el diseo o alteraciones que se realicen en el esquema conceptual de la base de datos. Si el sistema requiere una modificacin en su funcionamiento interno, podrn afectarse diversas estructuras que proveen el desempeo de este; se pretende que los usuarios finales no adviertan tales alteraciones. Seguridad.- Las vistas proporcionan de manera natural un medio para ocultar y proteger datos, dado que solo se presenta al usuario una seleccin de lo atributos existentes.
4.2 Control de Acceso. Una vista es una forma de proporcionar al usuario un modelo personalizado de la base de datos. Aunque es imposible impedir que un usuario tenga acceso directo a una relacin, puede permitrsele acceso a parte de esa relacin por medio de una vista. En una vista pueden implementarse controles que restrinjan los valores de entrada salida al dominio vlido de los atributos, mejorando as el nivel de integridad de la BD. De igual manera, el nivel de seguridad se incrementa al incluir en la vista slo los elementos que sean considerados al alcance del usuario. Actualmente los Sistemas Administradores de Bases de Datos (DBMS) soportan generalmente uno o ambos enfoques con respecto a la seguridad de los datos. Estos enfoques son conocidos como Control Discrecional y Control Obligatorio.
Control Discrecional, un usuario especfico tendr generalmente diferentes derechos de acceso (conocidos como privilegios) sobre diferentes objetos; adems, existen muy pocas limitaciones sobre que usuarios pueden tener que derechos sobre que objetos. Control Obligatorio, cada objeto de datos est etiquetado con un nivel de clasificacin determinado y a cada usuario se le da un nivel de acreditacin.
Las vistas utilizadas como mecanismo de seguridad, restringen el acceso de un usuario a determinadas columnas de la tabla. Si la columna excluida es la clave de la fila, tambin se est impidiendo que el usuario pueda relacionar dos tablas. La vista deber ser propiedad del mismo usuario que posea objetos subyacentes. Las vistas son tiles por varias razones:
Proporcionan un poderoso mecanismo de seguridad, ocultando partes de la base de datos a ciertos usuarios. El usuario no sabr que existen aquellos atributos que se han omitido al definir una vista. Permiten que los usuarios accedan a los datos en el formato que ellos desean o necesitan, de modo que los mismos datos pueden ser vistos con formatos distintos por distintos usuarios. Se puede simplificar operaciones sobre las relaciones base que son complejas. Por ejemplo, se puede definir una vista como la concatenacin de dos relaciones. El usuario puede hacer restricciones y proyecciones sobre la vista, que el SGBD traducir en las operaciones equivalentes sobre la concatenacin.
19
4.3 Herramientas. La tecnologa nos permite ahora establecer una comunicacin ms eficiente por medios auditivos, tctiles y hasta de realidad virtual. Dentro de las aplicaciones que procesan informacin podemos encontrar diversas alternativas mediante las que el usuario indica al sistema las acciones a realizar:
Mens de opciones Secuencia preestablecida (con opcin a interrumpirla) Comunicacin con la interfase directa de comando.
Elementos Relevantes de una Vista. Adems de la informacin particular que la vista presenta o requiere, debe contener informacin referente a: Tiempo. Deben especificarse los periodos en los que debe considerarse esta informacin como vigente posibles fechas de caducidad o actualizacin as como fechas en que se genera la informacin presentada. Origen. Debe contener informacin precisa de las fuentes utilizadas para generar la informacin; de los responsables directos o indirectos de esta generacin y de los medios utilizados para ello. Destino. Se describe a los departamentos y/o personas para quienes la informacin es til o valida; de igual forma, deben especificarse destinatarios indirectos o afectados por la informacin presentada en la vista. Especificaciones Particulares. En casos especiales, pueden incluirse valores o datos que permitan la toma de decisiones o la aplicacin de un criterio sobre la informacin contenida en la vista. Estos datos adicionales pueden ser utilizados para completar procesos, clculos o delimitar reas de accin. Unidad V. Diccionario de Datos. 5.1 Definicin. El primer paso en el diseo de una base de datos es recolectar informacin acerca de la empresa, que es, acerca de su uso, relaciones y significado de datos. Como el diseo de procesos es progresivo, es necesario depositar informacin acerca de la opinin lgica, interna y externa del modelo en la localizacin central. Una herramienta que facilita el control y manejo de la informacin acerca de datos en el diseo, implementacin, operacin y expansin de fases de una base de datos es llamado diccionario de datos. El diccionario de datos es un lugar dnde se deposita informacin acerca de datos como origen, descripcin, relaciones y otros datos, es decir el diccionario de datos es una base de datos misma, la cual deposita datos acerca de los datos, el diccionario de datos es una gua y contiene "mapas guas" para la base de datos en vez de "nuevos datos", es decir es un lugar en dnde se almacena o se mantiene un conjunto de estados (controles), informacin relacionada con los diferentes tipos de registros (tablas) privilegios de los usuarios y estadsticas (cuantos registros tiene cada tabla, ndices, etc.) Los diccionarios de datos de los Sistemas de Base de datos (DBMS) no son iguales, aunque mantienen los mismos lineamientos o las mismas caractersticas. En otras palabras, es un catlogo, un depsito, de los elementos en un sistema. Contiene las caractersticas lgicas de los sitios donde se almacenan los datos del sistema, incluyendo nombre, descripcin, alias, contenido y organizacin. Identifica los procesos donde se emplean los datos y los sitios donde se necesita el acceso inmediato a la informacin, se desarrolla durante el anlisis de flujo de datos y auxilia a los analistas que participan en la determinacin de los requerimientos del sistema, su contenido tambin se emplea durante el diseo. En un diccionario de datos se encuentra la lista de todos los elementos que forman parte del flujo de datos en todo el sistema. Los elementos ms importantes son flujos de datos, almacenes de datos y procesos. El diccionario guarda los detalles y descripciones de todos estos elementos.
20
Si los analistas desean conocer cuntos caracteres abarca un determinado dato o qu otros nombres recibe en distintas partes del sistema, o dnde se utiliza, encontrarn las respuestas en un diccionario de datos desarrollado en forma apropiada. 5.2 Explotacin. Razones para la utilizacin de los diccionarios de datos: 1. 2. Para manejar los detalles en sistemas muy grandes, ya que tienen enormes cantidades de datos, aun en los sistemas ms chicos hay gran cantidad de datos. Los sistemas al sufrir cambios continuos, es muy difcil manejar todos los detalles. Por eso se registra la informacin, ya sea sobre hoja de papel o usando procesadores de texto. Los analistas mas organizados usan el diccionario de datos automatizados diseados especficamente para el anlisis y diseo de software. 3. Para asignarle un solo significado a cada uno de los elementos y actividades del sistema. Los diccionarios de datos proporcionan asistencia para asegurar significados comunes para los elementos y actividades del sistema y registrando detalles adicionales relacionados con el flujo de datos en el sistema, de tal manera que todo pueda localizarse con rapidez. 4. Para documentar las caractersticas del sistema, incluyendo partes o componentes as como los aspectos que los distinguen. Tambin es necesario saber bajo qu circunstancias se lleva a cabo cada proceso y con qu frecuencia ocurren. Produciendo una comprensin ms completa. Una vez que las caractersticas estn articuladas y registradas, todos los participantes en el proyecto tendrn una fuente comn de informacin con respecto al sistema. 5. Para facilitar el anlisis de los detalles con la finalidad de evaluar las caractersticas y determinar donde efectuar cambios en el sistema. Determina si son necesarias nuevas caractersticas o si estn en orden los cambios de cualquier tipo. Se abordan las caractersticas:
Naturaleza de las transacciones: las actividades de la empresa que se llevan a cabo mientras se emplea el sistema. Preguntas: solicitudes para la recuperacin o procesamiento de informacin para generar una respuesta especfica. Archivos y bases de datos: detalles de las transacciones y registros maestros que son de inters para la organizacin. Capacidad del sistema: Habilidad del sistema para aceptar, procesar y almacenar transacciones y datos. 1. Localizar errores y omisiones en el sistema, detectan dificultades, y las presentan en un informe. Aun en los manuales, se revelan errores.
Contenido de un Registro de un Diccionario de Datos. El diccionario tiene dos tipos de descripciones para el flujo de datos del sistema, son los elementos datos y estructura de datos. Elementos Datos: Son los bloques bsicos para todos los dems datos del sistema, por si mismos no le dan un significado suficiente al usuario. Se agrupan para formar una estructura de datos.
Descripcin: Cada entrada en el diccionario consiste de un conjunto de detalles que describen los datos utilizados o producidos por el sistema.
Un nombre: para distinguir un dato de otro. Descripcin: indica lo que representa en el sistema. Alias: porque un dato puede recibir varios nombres, dependiendo de quien uso este dato. Longitud: porque es de importancia de saber la cantidad de espacio necesario para cada dato.
21
Valores de los datos: porque en algunos procesos solo son permitidos valores muy especficos para los datos. Si los valores de los datos estn restringidos a un intervalo especifico, esto debe estar en la entrada del diccionario.
Estructura de Datos: Es un grupo de datos que estn relacionados con otros y que en conjunto describen un componente del sistema.
Descripcin: Se construyen sobre cuatro relaciones de componentes. Se pueden utilizar las siguientes combinaciones ya sea individualmente o en conjuncin con alguna otra. Relacin secuencial: Define los componentes que siempre se incluyen en una estructura de datos. Relacin de seleccin: (uno u otro), define las alternativas para datos o estructuras de datos incluidos en una estructura de datos. Relacin de iteracin: (repetitiva), define la repeticin de un componente. Relacin opcional: los datos pueden o no estar incluidos, o sea, una o ninguna iteracin. Notacin: Los analistas usan smbolos especiales con la finalidad de no usar demasiada cantidad de texto para la descripcin de las relaciones entre datos y mostrar con claridad las relaciones estructurales. En algunos casos se emplean trminos diferentes para describir la misma entidad (alias) estos se representan con un signo igual (=) que vincula los datos.
Diccionario de Datos y las Interfases. El diccionario de datos puede componerse bsicamente de dos interfases as:
La interfase con la gente involucrada, por ejemplo, el administrador de la base de datos, programador de sistemas, programador de aplicaciones, manejadores, y finalmente usuarios y observadores. La interfase con el software por ejemplo, sistema de manejo de bases de datos, libreras, sistemas operativos y generador de reportes.
El diccionario de datos puede ser usado como una herramienta efectiva para la funcin de administrador de base de datos en el diseo, implementacin y fase de operaciones en la base de datos. Es responsabilidad del DBMS proteger el diccionario de datos por refuerzos estndar, seguridad y obligaciones privadas. Un diccionario de datos es el lugar ideal para encontrar respuestas a las preguntas como " dnde se usa ", " quin usa ", " cuando se usa". Estas interfases muestran que existen dos tipos de usos del diccionario de datos, un tipo de uso es por la gente que tiene funciones como administrador de base de datos, programador de sistemas, analista de sistemas, programador de aplicaciones, usuarios. Y el otro tipo de uso es por el software en reas semejantes como manejadores de base de datos, sistemas, libreras, sistemas operativos y generador de reportes. Estos dos tipos de interfase enlazan al manejador y control del medio de la base de datos como un resultado de la eficiente comunicacin entre las partes involucradas. Diccionario de Datos Ideal: Sus requerimientos y su Organizacin. La siguiente es una lista de requerimientos convenientes de un diccionario de base de datos para describir los datos, no quiere decir que cualquier paquete de diccionario de datos particular abarca ahora todos estos requerimientos. Modelo Conceptual.- la informacin acerca de los datos necesaria en el proceso de diseo del modelo conceptual incluye entidades, campos o atributos y las relaciones entre campos, atributos, tambin incluye informacin acerca de cuales departamentos y usuarios estn usando o intentan usar que atributos y con que frecuencia estos datos son usados, conjuntamente con las descripciones textuales y con significados y propsitos. Las entidades y relaciones deberan tener ttulos apropiados, versiones, estados, los membership (campo de una entidad el cual va ha servir de referencia). Modelo Lgico.- la informacin siguiente acerca del modelo lgico de la base de datos debera ser almacenada en el diccionario de datos: el campo de agrupacin con su llave (estos grupos pueden ser los subgrupos de los grupos especificados en el modelo conceptual), el fundamento del modelo de datos, la relaciones de los grupos basados en el
22
modelo de datos, el modelo externo soportado por el modelo lgico, las transacciones lgicas, los programas y los mdulos, la referencia cruzada de la informacin entre las transacciones, tambin deberan ser almacenados. Otra informacin necesaria es el lenguaje de programacin y el tipo de programa (bath o en lnea) para los programas y transacciones. Modelo Interno.- la informacin fsica acerca de los atributos como por ejemplo: longitud (caracteres), modo (cadena de caracteres, decimales, datos de simple precisin, empaquetados), justificacin (derecha izquierda), formas de presentacin, reglas de edicin (constantes, rango de valores), derivacin algortmica, secuencia o posicin secuencial que un atributo particular ocupa en una ocurrencia, seguridad (cdigos de seguridad para leer, actualizar), medio de almacenamiento (tarjetas, discos, cintas, video), el control de acceso a la informacin debera ser almacenado en el diccionario de datos. Un diccionario de datos ideal debera ser una parte integral de todo el medio ambiente de la base de datos y el administrador de la base de datos es el responsable de la entrada al diccionario de datos, sealando que un diccionario de datos tiene que ser salvado en copias de respaldo para evitar efectos desastrosos debido a un mal funcionamiento del sistema o cualquier destruccin no intencional de la versin producida del diccionario de datos, la funcin del administrador de base de datos lleva la gran responsabilidad de proteger la parte vital del medio de la base de datos "el diccionario de datos". Sistemas Ideales del Diccionario de Datos. 1. 2. 3. 4. 5. El diccionario de datos debe soportar los modelos conceptual, lgico, interno y externo. El diccionario de datos debe ser integrado con el manejador del sistema de base de datos. El diccionario de datos debe soportar varias versiones de documentacin (historial) El diccionario de datos debe apoyar la transferencia eficiente de informacin al manejador del sistema de base de datos. Idealmente la conexin entre los modelos interno y externo debe ser realizada en tiempo de ejecucin. 6. Un diccionario de datos debera comenzar con la reorganizacin de versiones de produccin de la base de datos como un resultado de los cambios para la descripcin de la base de datos. Similarmente, cualquier cambio a la descripcin de programas debe ser reflejado automticamente en la librera de descripcin de programas con la ayuda del diccionario de datos. Unidad VI. Herramientas del Sistema. 1. Afinacin, Medicin del Desempeo, Reorganizacin Fsica y Lgica. 7. El diccionario de datos para ser eficiente deber ser almacenado en un medio de almacenamiento con acceso directo para la fcil recuperacin de informacin. Afinacin. La afinacin se refiere a ajustes y cambios en la organizacin del almacn de datos despus de que el sistema ha entrado en servicio y se han aclarado suficientemente las pautas de uso. Este proceso de ajuste de la base de datos se llama afinacin (Tunning). El uso de la base de datos evoluciona continuamente, a medida que ms personas se van familiarizando con ella y se van creando ms programas de aplicacin. Los ajustes en la organizacin del almacn para el ptimo desempeo se convierten en un proceso continuo. El responsable de realizar la afinacin de la base de datos es el administrador de o su grupo, y es importante que este tenga libertad para introducir los cambios que sean necesarios, sin hacer estragos en los programas de aplicacin. Requisitos para una correcta afinacin:
Independencia fsica de los datos. Es la capacidad de modificar el esquema interno sin alterar el esquema conceptual, ni los programas de aplicacin.
23
Medios: Para supervisar automticamente el uso de la base de datos con el fin de que puedan hacerse los ajustes necesarios. Los manejadores actuales de bases de datos ya incorporan medios para la afinacin automtica.
Medicin del Desempeo. Es responsabilidad del DBA organizar el sistema de modo que se obtenga el desempeo que sea "mejor para la empresa", y realizar los ajustes apropiados cuando cambien los requerimientos. Es necesario reorganizar la base de datos (descargarla y volverla a cargar) en forma peridica con el fin de garantizar que los niveles de desempeo sigan siendo aceptables. Los datos obtenidos del desempeo se comparan con aquellos datos esperados. esta razn proporciona los factores de multiprogramacin, Mn, para cada uno de los procesos bsicos h que son parte de los clculos de la base de datos. En la prctica estos factores pueden variar de 1 a 0.1. Para ver la frmula seleccione la opcin "Descargar" del men superior Tales pruebas no requieren la existencia de la base de datos completa y puede ser que ni siquiera exista el estudio piloto, que consiste en la ejecucin de una secuencia adecuada de operaciones aleatorias o secuenciales de lectura o escritura, junto con una cantidad equivalente del uso del CPU. Es posible escribir y ejecutar un programa que imite la operacin propuesta, en el sistema real que se va a utilizar, con el costo del esfuerzo de unos cuantos das. Reorganizacin Fsica y Lgica. La reorganizacin consiste en leer el archivo en forma en que se utilizara al realizar el procesamiento serial y escribir los registros nuevos y viejos en el archivo nuevo, dejando fuera todos los registros marcados como eliminados lgicamente; y se crearn nuevos ndices con base a los nuevos valores. La frecuencia de reorganizacin depende de la actividad de insercin dentro del archivo; y se debe de realizar antes de que el archivo est realmente lleno para evitar problemas en tiempos de mucha actividad. Las reorganizaciones fsicas son necesarias para mejorar el rendimiento, aadir una nueva estructura de acceso, agilizar las operaciones de obtencin y actualizacin, disminuir los tiempos de respuesta, minimizar el espacio de almacenamiento y optimizar el consumo de recursos. Las reorganizaciones lgicas pueden modificar el esquema conceptual, pero no alterar el esquema externo ni los programas de aplicacin; puede ser un orden de visualizacin en las vistas. 1. Auditoria.
Para asegurar la calidad de la informacin contenida en el sistema, es necesario tener un experto que est involucrado en el ajuste o hacer uso de un sistema que examine la informacin para asegurar su confiabilidad. Existen dos tipos de auditores:
Internos. Trabajan para la misma organizacin, duea del sistema. Externos. Contratados del exterior de la organizacin que auditan el sistema para asegurar la legalidad de los estados financieros. 1. Respaldo y Recuperacin.
El DBA debe definir y poner en prctica un plan de recuperacin adecuado que incluya una descarga o vaciado peridico de la base de datos en un medio de almacenamiento de respaldo y procedimientos para volver a cargar la base de datos a partir del vaciado ms reciente. El respaldo y recuperacin consiste en contar con un mecanismo que permiten la fcil recuperacin de los datos en caso de ocurrir fallos en el sistema de la base de datos.
24
El objetivo del concepto de recuperacin es el de proteger la base de datos contra fallas lgicas y fsicas que destruyan los datos en todo o en parte independientemente de la naturaleza de las fallas estas pueden afectar los aspectos de almacenamiento de la base de datos como son:
Fallas que provocan la prdida de la memoria voltil. Fallas que provocan la prdida del contenido de la memoria secundaria.
En un sistema de base de datos, recuperacin significa, restaurar la base de datos a un estado que se sabe que es correcto, despus de una falla que provoca que se considere que el estado actual es incorrecto. Podemos tener la seguridad de que la base de datos es recuperable, si aseguramos que cualquier parte de la informacin que contiene, puede ser reconstruida, a partir de otra informacin que se encuentra almacenada redundantemente en algn lugar del sistema. Pasos para recuperar la informacin:
Deteccin del error.- El proceso de recuperacin se inicia al detectar la existencia de un error. Es posible distinguir una variedad de puntos de entrada en el proceso de recuperacin. Se considerarn fallas de sistemas detectadas por falta de accin del sistema o por verificaciones irrecuperables de redundancia y salida incorrecta observada por un usuario. Determinacin de la fuente del error.- para decidir cul es la mejor accin correctora es necesario determinar la extensin del dao. Desde luego este esfuerzo es muy relacionado con la determinacin del tiempo y la causa del error. Despus de una cada o cuando el procesamiento sea interrumpido debido a una seal de error, es necesario determinar tantos aquellas reas del archivo de datos que sean sospechosas como cul fue la transaccin que no se concluyo. Ubicacin de errores secundarios.- cuando se ha detectado un error que provoc una modificacin inadecuada a un archivo un rastreo a travs de las listas de actividad encontrara aquellas transacciones que emplearon el bloque correcto. Entonces es posible volver a introducir automticamente el bloque correcto de las transacciones afectadas y producir resultados correctos. Si se actualizaron bloques mediante transacciones que leyeron bloques incorrectos antes de existir es necesario restaurar a un ms el archivo. Aplicacin de correcciones. Si la extensin del dao es limitada, puede utilizarse un proceso de volver a enrollar. Las porciones daadas del archivo se restauran aplicando primero aquellas imgenes anteriores a los bloques en error reemplazando despus de las transacciones incompletas. La salida proveniente de estas transacciones se suprime de ser posible, para evitar duplicar resultados que previamente se hayan enviado a los usuarios. 1. Migracin de Datos.
Es conveniente mudar un conjunto de datos dentro del almacn de datos a posiciones accesibles de acuerdo con su actividad. En algunos sistemas se hace automticamente, en otros, los hacen los programadores del sistema o el DBA. El DBA se encarga de supervisar y mantener la vista lgica global de los datos. Es deseable almacenar los datos de uso frecuente de manera que resulte fcil y rpido de acceder a ellas. Otra forma de migrar datos es cuando se migra de una versin anterior del SGBD a otra versin ms actualizada (se trabaja con la versin 8i de Oracle y se desea actualizar esta versin a la 9i, por lo que se tiene que respaldar la informacin y migrarlo a la versin 9i de Oracle) o cuando se cambia de un manejador a otro (supongamos que actualmente se trabaja con S QL Server y se desea migrar a otro manejador como Oracle, entonces, se tiene que migrar la tablas de la base de datos de SQL a tablas de Oracle). Unidad VII. Implicaciones de Bases de datos Distribuidas. La evolucin de los sistemas de informacin y el crecimiento no planeado de la informacin dentro de las organizaciones, ha trado dispersin de los datos en sitios local o geogrficamente dispersos. La necesidad de integrar y compartir dicha informacin implica el nacimiento de una nueva tecnologa capaz de conformar de
25
manera consistente la informacin de las organizaciones. Una de las tecnologas que trabaja en el problema de integracin de informacin, es la de bases de datos distribuidas (BDD). Para ver el grfico seleccione la opcin "Descargar" del men superior Evolucin de las bases de datos. Base de datos centralizada:- Los equipos estn conectados a un servidor centralizado, donde esta almacenada la base de datos. Para ver el grfico seleccione la opcin "Descargar" del men superior La interaccin con el usuario como la aplicacin residen en el cliente, siendo el servidor el depositario de los datos. En un sistema centralizado, la cada o desconexin del servidor, provoca la cada total del sistema. Base de datos distribuidos:- Una base de datos est dividida en fragmentos, almacenados en diferentes sitios de la red. Todas las operaciones realizadas en los sitios se ven reflejadas en la base de datos que esta almacenada en el servidor. Para ver el grfico seleccione la opcin "Descargar" del men superior El cliente debe conocer la topologa de la red, as como la disposicin y ubicacin de los datos. Se delega parte de la gestin de la base de datos a los clientes. Arquitectura Cliente-Servidor:- Es la integracin distribuida en un sistema de red, con los recursos, medios y aplicaciones, que definidos modularmente en los servidores, administran, ejecutan y atienden a las solicitudes de los clientes; todos interrelacionados fsica y lgicamente. En un esquema cliente-servidor, se denomina cliente a la mquina que solicita un determinado servicio, y servidor a aquella que proporciona tal servicio. Para ver el grfico seleccione la opcin "Descargar" del men superior Arquitectura Cliente-Servidor. Objetivos de un Sistema Distribuido. Un sistema distribuido debe aparecer al usuario como un sistema centralizado.
Optimizacin en el procesamiento de preguntas. Propagacin de actualizaciones. Mayor problema con los accesos concurrentes.
Autonoma local
o o
Cada grupo es responsable de sus datos. El tratamiento local es ms rpido. Capacidad y Crecimiento incremental. Se pueden abordar proyectos de ms envergadura. Se puede ampliar la informacin sin cambiar todo el sistema. Fiabilidad y Disponibilidad.
o o
26
o o
Los fallos suelen ser locales. Se admite un cierto nivel de redundancia. Eficiencia y Flexibilidad.
7.1 Distribucin de Datos. El problema de diseo de bases de datos distribuidos se refiere, a hacer decisiones acerca de la ubicacin de datos y programas a travs de los diferentes sitios de una red de computadoras. Consideraciones para la base de datos distribuidos:
Diseo de la fragmentacin, este se determina por la forma en que las relaciones globales se subdividen en fragmentos horizontales, verticales o mixtos. Diseo de la asignacin de los fragmentos, esto se determina en la forma en que los fragmentos se mapean a las imgenes fsicas, en esta forma, tambin se determina la solicitud de fragmentos.
Objetivos del Diseo de la Distribucin de datos. En el diseo de la distribucin de los datos, se deben de tomar en cuenta los siguientes objetivos:
Procesamiento local. La distribucin de los datos, para maximizar el procesamiento local corresponde al principio simple de colocar los datos tan cerca como sea posible de las aplicaciones que los utilizan. Se puede realizar el diseo de la distribucin de los datos para maximizar el procesamiento local agregando el nmero de referencias locales y remotas que le corresponden a cada fragmentacin candidata y la localizacin del fragmento, que de esta forma se seleccione la mejor solucin de ellas. Distribucin de la carga de trabajo. La distribucin de la carga de trabajo sobre los sitios, es una caracterstica importante de los sistemas de cmputo distribuidos. Esta distribucin de la carga se realiza para tomar ventaja de las diferentes caractersticas (potencia) o utilizaciones de las computadoras de cada sitio, y maximizar el grado de ejecucin de paralelismo de las aplicaciones. Sin embargo, la distribucin de la carga de trabajo podra afectar negativamente el procesamiento local deseado. Costo de almacenamiento y disponibilidad. La distribucin de la base de datos refleja el costo y disponibilidad del almacenamiento en diferentes sitios. Para esto, es posible tener sitios especializados en la red para el almacenamiento de datos. Sin embargo el costo de almacenamiento de datos no es tan relevante si ste se compara con el del CPU, I/O y costos de transmisin de las aplicaciones.
Requerimientos de Informacin. Con el fin de realizar una fragmentacin adecuada, es necesario proporcionar informacin que ayude a realizarla. Esta informacin normalmente debe ser proporcionada por el usuario y tiene que ver con cuatro tipos:
Informacin sobre el significado de los datos. Informacin sobre las aplicaciones que lo usan. Informacin acerca de la red de comunicaciones. Informacin acerca de los sistemas de cmputo.
Fragmentacin horizontal primaria. Consiste del particionamiento en tuplas de una relacin R en subconjuntos, donde cada subconjunto puede contener datos que tienen propiedades comunes y se puede definir expresando cada fragmento como una operacin de seleccin sobre la relacin R. Fragmentacin horizontal derivada. Se define partiendo de una fragmentacin horizontal. En esta operacin se requiere de semi-junta(semi-join) el cual nos sirve para derivar las tuplas o registros de dos relaciones.
27
1. 2. Fragmentacin vertical. Una relacin R produce fragmentos R1,R2,...,Rn; cada fragmento contiene subconjuntos de atributos Pr as como la clave primaria de R. Cada atributo debe encontrarse al menos en un fragmento. 3. Fragmentacin hbrida (mixta). La relacin R se divide en una serie de fragmentos R1,R2,...,Rn. Cada fragmento se obtiene como resultado de la aplicacin del esquema de fragmentacin horizontal o vertical a la relacin R, o un fragmento de R obtenido con anterioridad. Resultado de la combinacin de las dos fragmentaciones anteriores. Asignacin. Encontrar la distribucin ptima de los fragmentos F en los nodos S.
Mnimo coste:
o o o
almacenamiento. modificacin de un fragmento en toda sede. coste de comunicacin. Rendimiento: minimizar tiempos de respuesta. maximizar la capacidad de procesamiento del sistema en cada nodo
o o
7.2 Seguridad y Control de Concurrencia. La proteccin de los datos deber llevarse a cabo contra fallos fsicos, fallos lgicos y fallos humanos (intencionados o no). Estos fallos alteran indebidamente los datos, los corrompen con lo que la base de datos ya no puede servir a los fines para los que fue creada. El SGBD facilita normalmente mecanismos para prevenir los fallos (subsistema de control), para detectarlos una vez que se han producido (subsistema de deteccin) y para corregirlos despus de haber sido detectados (subsistema de recuperacin). Aspectos fundamentales de la seguridad:
Confidencialidad. No desvelar datos a usuarios no autorizados. Comprende tambin la privacidad (proteccin de datos personales). Accesibilidad. La informacin debe estar disponible. Integridad. Permite asegurar que los datos no han sido falseados.
Cuestiones ticas y legales relativas al derecho a tener acceso a cierta informacin. Cuestiones de poltica en el nivel gubernamental, institucional o corporativo relacionadas con la informacin que no debe estar disponible para el pblico. Cuestiones relacionadas con el sistema. Necesidad en algunas organizaciones de identificar mltiples niveles de seguridad y de clasificar los datos y los usuarios segn estos niveles.
El SGBD debe proveer tcnicas que permitan a ciertos usuarios tener acceso a porciones selectas de una base de datos sin tener acceso al resto. Por lo regular un SGBD cuenta con un subsistema de seguridad de autorizacin de la base de datos que se encarga de garantizar la seguridad de porciones de la base de datos contra el acceso no autorizado. Existen dos tipos de mecanismos de seguridad:
28
Discrecionales, se usan para otorgar privilegios a los usuarios. Obligatorios, sirven para imponer seguridad de mltiples niveles clasificando los datos y los usuarios en varias clases de seguridad e implementando despus la poltica de seguridad apropiada de la organizacin.
Otro problema de seguridad es el acceso a una base de datos estadstica, la cual sirve para proporcionar informacin estadstica a partir de diversos criterios. Los usuarios de bases de datos estadsticas estn autorizados para usarlas para obtener informacin estadstica sobre una poblacin pero no para tener acceso a informacin confidencial detallada sobre individuos especficos. La seguridad en bases de datos estadsticas debe cuidar que la informacin sobre individuos no sea accesible. En ocasiones es posible deducir ciertos hechos relativos a los individuos a partir de consultas, esto tampoco debe permitirse. Otra tcnica de seguridad es el cifrado de datos que sirve para proteger datos confidenciales que se transmiten por satlite o algn tipo de red de comunicaciones. Asimismo el cifrado puede proveer proteccin adicional a secciones confidenciales de una base de datos. Los datos se codifican mediante algn algoritmo de codificacin. Un usuario no autorizado tendr problemas para descifrar los datos codificados, pero un usuario autorizado contar con algoritmos para descifrarlos. Entre las obligaciones del DBA est otorgar privilegios a los usuarios y clasificar los usuarios y los datos de acuerdo con la poltica de la organizacin. Las rdenes privilegiadas del DBA incluyen los siguientes tipos de acciones:
1.
2. 3. 4. 5. Creacin de cuentas Concesin de privilegios. Revocacin de privilegios. Asignacin de niveles de seguridad.
La accin 1 de la lista sirve para controlar el acceso al SGBD en general, la 2 y la 3 para controlar las autorizaciones discrecionales y la 4 controla la autorizacin obligatoria. Para ver el grfico seleccione la opcin "Descargar" del men superior Amenazas a la seguridad. Un sistema de manejo de bases de datos confiable es aquel que puede continuar procesando las solicitudes de usuario an cuando el sistema sobre el que opera no es confiable. En otras palabras, aun cuando los componentes de un sistema distribuido fallen, un DDMBS confiable debe seguir ejecutando las solicitudes de usuario sin violar la consistencia de la base de datos. El control de concurrencia trata con los problemas de aislamiento y consistencia del procesamiento de transacciones. El control de concurrencia distribuido de una DDBMS asegura que la consistencia de la base de datos se mantiene en un ambiente distribuido multiusuario. Si las transacciones son internamente consistentes, la manera ms simple de lograr este objetivo es ejecutar cada transaccin sola, una despus de otra. Sin embargo, esto puede afectar grandemente el desempeo de un DDBMS dado que el nivel de concurrencia se reduce al mnimo. El nivel de concurrencia, el nmero de transacciones activas, es probablemente el parmetro ms importante en sistemas distribuidos. Por lo tanto, los mecanismos de control de concurrencia buscan encontrar un balance entre el mantenimiento de la consistencia de la base de datos y el mantenimiento de un alto nivel de concurrencia. Si no se hace un adecuado control de concurrencia, se pueden presentar dos anomalas. En primer lugar, se pueden perder actualizaciones provocando que los efectos de algunas transacciones no se reflejen en la base de datos. En segundo trmino, pueden presentarse recuperaciones de informacin inconsistentes. Bibliografa.
29
Tutorial de: Administracin de Bases de Datos. Instituto Tecnolgico de La Paz. http://www.itl.edu.mx/tutoriales/ Tutorial de: Administracin de Bases de Datos. Instituto Tecnolgico de Veracruz. http://www.itver.edu.mx/tutoriales/ Tutorial de: Ingeniera de Software. http://www.monografias.com/trabajos5/inso/inso2.shtml Fundamentos de Bases de Datos Silberschatz, Abraham;F. Korth, Henry Tercera Edicion Ricardo Garca
30