Introducción
Introducción
Introducción
Bases de Datos.
Una base de datos es un conjunto de datos almacenados y ordenados, entre los cuales
existen relaciones lógicas. Normalmente, el contenido de una Base de Datos, engloba la
información concerniente de una organización, de tal manera que los datos estén
disponibles para satisfacer los requerimientos de la organización y sus usuarios.
La base de datos es un gran almacén de datos que se define una sola vez y usualmente es
utilizada por muchos usuarios concurrentes. En lugar de trabajar con archivos
desconectados e información redundante, todos los datos se integran con una mínima
cantidad de duplicidad (redundancia). La base de datos no sólo contiene los datos de la
organización, sino que también almacena una descripción de dichos datos. Esta descripción
es lo que se denomina metadatos, se almacena en el diccionario de datos o catálogo y es lo
que permite que exista independencia de datos lógica-física.
El modelo seguido por los sistemas de bases de datos, en donde se separa la definición de
los datos de los programas de aplicación, es muy similar al modelo que se sigue en la
actualidad para el desarrollo de programas, en donde se da una definición interna de un
objeto y una definición externa separada. Los usuarios del objeto sólo ven la definición
externa y no se deben preocupar de cómo se define internamente el objeto y cómo funciona.
Una ventaja de este modelo, conocido como abstracción de datos, es que se puede cambiar
la definición interna de un objeto sin afectar a sus usuarios ya que la definición externa no
se ve alterada. Del mismo modo, los sistemas de bases de datos separan la definición de la
estructura de los datos, de los programas de aplicación y almacenan esta definición en la
base de datos. Si se añaden nuevas estructuras de datos o se modifican las ya existentes, los
programas de aplicación no se ven afectados ya que no dependen directamente de aquello
que se ha modificado.
Sistemas Manejadores de Bases de Datos.
El sistema manejador de base de datos (DBMS, Data Base Manager System) es una
aplicación que permite a los usuarios definir, crear y mantener la base de datos, y
proporciona acceso controlado a la misma.
El DBMS es la aplicación que interacciona con los usuarios de los programas de aplicación
y la base de datos. En general, un DBMS proporciona los siguientes servicios:
o Permite la definición de la base de datos mediante el lenguaje de definición de datos
(DDL, Data Definition Language). Este lenguaje permite especificar la estructura y
el tipo de los datos, así como las restricciones sobre los datos. Todo esto se
almacenará en la base de datos.
o Permite la inserción, actualización, eliminación y consulta de datos mediante el
lenguaje de manejo de datos (DML, Data Manager Language). El hecho de disponer
de un lenguaje para realizar consultas reduce el problema de los sistemas de
archivos, en los que el usuario tiene que trabajar con un conjunto fijo de consultas, o
bien, dispone de un gran número de programas de aplicación costosos de gestionar.
Hay dos tipos de lenguajes de manejo de datos: los procedurales y los no
procedurales. Estos dos tipos se distinguen por el modo en que acceden a los datos.
Los lenguajes procedurales manipulan la base de datos registro a registro, mientras
que los no procedurales operan sobre conjuntos de registros. En los lenguajes
procedurales se especifica qué operaciones se deben realizar para obtener los datos,
mientras que en los lenguajes no procedurales se especifica qué datos deben
obtenerse sin decir cómo hacerlo. El lenguaje no procedural más utilizado es el SQL
(Structured Query Language) que, de hecho, es un estándar y es el lenguaje de los
DBMS relacionales.
o Proporciona un acceso controlado a la base de datos mediante:
un sistema de seguridad, de modo que los usuarios no autorizados no puedan
acceder a la base de datos;
un sistema de integridad que mantiene la integridad y la consistencia de los
datos;
un sistema de control de concurrencia que permite el acceso compartido a la
base de datos;
un sistema de control de recuperación que restablece la base de datos
después de que se produzca un fallo del hardware o del software;
un diccionario de datos o catálogo accesible por el usuario que contiene la
descripción de los datos de la base de datos.
A diferencia de los sistemas de archivos, el DBMS gestiona la estructura física de los datos
y su almacenamiento. Con esta funcionalidad, el DBMS se convierte en una herramienta de
gran utilidad. Sin embargo, desde el punto de vista del usuario, se podría discutir que los
DBMS han hecho las cosas más complicadas, ya que ahora los usuarios ven más datos de
los que realmente quieren o necesitan, puesto que ven la base de datos completa.
Ventajas e inconvenientes de los sistemas de bases de datos.
Ventajas por la existencia de los DBMS.
o Integridad de datos. La integridad de la base de datos se refiere a la validez y la
consistencia de los datos almacenados. Normalmente, la integridad se expresa
mediante restricciones o reglas que no se pueden violar. Estas restricciones se
pueden aplicar tanto a los datos, como a sus relaciones, y es el DBMS quien se debe
encargar de mantenerlas.
o Seguridad. La seguridad de la base de datos es la protección de la base de datos
frente a usuarios no autorizados. Sin unas buenas medidas de seguridad, la
integración de datos en los sistemas de bases de datos hace que éstos sean más
vulnerables que en los sistemas de archivos. Sin embargo, los DBMS permiten
mantener la seguridad mediante el establecimiento de claves para identificar al
personal autorizado a utilizar la base de datos. Las autorizaciones se pueden realizar
a nivel de operaciones, de modo que un usuario puede estar autorizado a consultar
ciertos datos pero no a actualizarlos, por ejemplo.
o Accesibilidad a los datos. Muchos DBMS proporcionan lenguajes de consultas o
generadores de informes que permiten al usuario hacer cualquier tipo de consulta
sobre los datos, sin que sea necesario que un programador escriba una aplicación
que realice tal tarea.
o Productividad. El DBMS proporciona muchas de las funciones estándar que el
programador necesita escribir en un sistema de archivos. A nivel básico, el DBMS
proporciona todas las rutinas de manejo de archivos típicas de los programas de
aplicación. El hecho de disponer de estas funciones permite al programador
centrarse mejor en la función específica requerida por los usuarios, sin tener que
preocuparse de los detalles de implementación de bajo nivel. Muchos DBMS
también proporcionan un entorno de cuarta generación consistente en un conjunto
de herramientas que simplifican, en gran medida, el desarrollo de las aplicaciones
que acceden a la base de datos. Gracias a estas herramientas, el programador puede
ofrecer una mayor productividad en un tiempo menor.
o Mantenimiento e independencia de datos. En los sistemas de archivos, las
descripciones de los datos se encuentran inmersas en los programas de aplicación
que los manejan. Esto hace que los programas sean dependientes de los datos, de
modo que un cambio en su estructura, o un cambio en el modo en que se almacena
en disco, requiere cambios importantes en los programas cuyos datos se ven
afectados. Sin embargo, los DBMS separan las descripciones de los datos de las
aplicaciones. Esto es lo que se conoce como independencia de datos, gracias a la
cual se simplifica el mantenimiento de las aplicaciones que acceden a la base de
datos.
o Concurrencia. En algunos sistemas de archivos, si hay varios usuarios que pueden
acceder simultáneamente a un mismo fichero, es posible que el acceso interfiera
entre ellos de modo que se pierda información o, incluso, que se pierda la
integridad. La mayoría de los DBMS gestionan el acceso concurrente a la base de
datos y garantizan que no ocurran problemas de este tipo.
o Servicios de copias de seguridad y de recuperación ante fallos. Muchos sistemas de
archivos dejan que sea el usuario quien proporcione las medidas necesarias para
proteger los datos ante fallos en el sistema o en las aplicaciones. Los usuarios tienen
que hacer copias de seguridad cada día, y si se produce algún fallo, utilizar estas
copias para restaurarlos. En este caso, todo el trabajo realizado sobre los datos desde
que se hizo la última copia de seguridad se pierde y se tiene que volver a realizar.
Sin embargo, los DBMS actuales funcionan de modo que se minimiza la cantidad
de trabajo perdido cuando se produce un fallo.
Inconvenientes de los DBMS.
o Complejidad. Los DBMS son conjuntos de programas muy complejos con una gran
funcionalidad. Es preciso comprender muy bien esta funcionalidad para poder sacar
un buen partido de ellos.
o Tamaño. A parte de complejos, los DBMS son programas muy extensos que
requieren una gran cantidad de espacio en disco y de memoria para trabajar de
forma eficiente.
o Costo. El costo de un DBMS varía dependiendo del entorno y de la funcionalidad
que ofrece. Por ejemplo, un DBMS para una computadora personal puede costar
500 dólares, mientras que un DBMS para un sistema multiusuario que dé servicio a
cientos de usuarios puede costar entre 10,000 y 100,000 dólares. Además, hay que
pagar una cuota anual de mantenimiento que suele ser un porcentaje del precio del
DBMS.
o Costo del equipo adicional. Tanto el DBMS, como la propia base de datos, pueden
hacer que sea necesario adquirir más espacio de almacenamiento. Además, para
alcanzar las prestaciones deseadas, es posible que sea necesario adquirir una
máquina más grande o una máquina que se dedique solamente al DBMS. Todo esto
hará que la implantación de un sistema de bases de datos sea más cara.
o Costo de la conversión. En algunas ocasiones, el costo del DBMS y el costo del
equipo informático que sea necesario adquirir para su buen funcionamiento, es
insignificante comparado al costo de convertir la aplicación actual en un sistema de
bases de datos. Este costo incluye la capacitación a los usuarios para utilizar estos
sistemas y, probablemente, el costo del personal especializado para ayudar a realizar
la conversión y poner en marcha el sistema. Este costo es una de las razones
principales por las que algunas empresas y organizaciones se resisten a cambiar su
sistema actual de archivos por un sistema de bases de datos.
o Prestaciones. Un sistema de archivos está escrito para una aplicación específica, por
lo que sus prestaciones suelen ser muy buenas. Sin embargo, los DBMS están
escritos para ser más generales y ser útiles en muchas aplicaciones, lo que puede
hacer que algunas de ellas no sean tan rápidas como antes.
o Vulnerable a los fallos. El hecho de que todo esté centralizado en el DBMS hace
que el sistema sea más vulnerable ante los fallos que puedan producirse.
Modelos de datos.
Una de las características fundamentales de los sistemas de bases de datos es que
proporcionan cierto nivel de abstracción de datos, al ocultar las características sobre el
almacenamiento físico que la mayoría de usuarios no necesita conocer. Los modelos de
datos son el instrumento principal para ofrecer dicha abstracción. Un modelo de datos es un
conjunto de conceptos que sirven para describir la estructura de una base de datos: los
datos, las relaciones entre los datos y las restricciones que deben cumplirse sobre los datos.
Los modelos de datos contienen también un conjunto de operaciones básicas para la
realización de consultas (lecturas) y actualizaciones de datos (escrituras). Además, los
modelos de datos más modernos incluyen conceptos para especificar comportamiento,
permitiendo especificar un conjunto de operaciones definidas por el usuario.
Los modelos de datos se pueden clasificar dependiendo de los tipos de conceptos que
ofrecen para describir la estructura de la base de datos. Los modelos de datos de alto nivel,
o modelos conceptuales, disponen de conceptos muy cercanos al modo en que la mayoría
de los usuarios percibe los datos, mientras que los modelos de datos de bajo nivel, o
modelos físicos, proporcionan conceptos que describen los detalles de cómo se almacenan
los datos en la computadora. Los conceptos de los modelos físicos están dirigidos al
personal informático, no a los usuarios finales. Entre estos dos extremos se encuentran los
modelos lógicos, cuyos conceptos pueden ser entendidos por los usuarios finales, aunque
no están demasiado alejados de la forma en que los datos se organizan físicamente. Los
modelos lógicos ocultan algunos detalles de cómo se almacenan los datos, pero pueden
implementarse de manera directa en una computadora.
Los modelos conceptuales utilizan conceptos como entidades, atributos y relaciones. Una
entidad representa un objeto o concepto del mundo real como, por ejemplo, un empleado de
la empresa inmobiliaria o una oficina. Un atributo representa alguna propiedad de interés de
una entidad como, por ejemplo, el nombre o el salario del empleado. Una relación describe
una interacción entre dos o más entidades, por ejemplo, la relación de trabajo entre un
empleado y su oficina.
Cada DBMS soporta un modelo lógico, siendo los más comunes el relacional, el de red y el
jerárquico. Estos modelos representan los datos valiéndose de estructuras de registros, por
lo que también se denominan modelos orientados a registros. Hay una nueva familia de
modelos lógicos, son los modelos orientados a objetos, que están más próximos a los
modelos conceptuales.
Los modelos físicos describen cómo se almacenan los datos en la computadora: el formato
de los registros, la estructura de los archivos (desordenados, ordenados, etc.) y los métodos
de acceso utilizados (índices, etc.).
A la descripción de una base de datos mediante un modelo de datos se le denomina
esquema de la base de datos. Este esquema se especifica durante el diseño, y no es de
esperar que se modifique a menudo. Sin embargo, los datos que se almacenan en la base de
datos pueden cambiar con mucha frecuencia: se insertan datos, se actualizan, etc. Los datos
que la base de datos contiene en un determinado momento se denominan estado de la base
de datos u ocurrencia de la base de datos.
La distinción entre el esquema y el estado de la base de datos es muy importante. Cuando
definimos una nueva base de datos, sólo especificamos su esquema al DBMS. En ese
momento, el estado de la base de datos es el “estado vacío”, sin datos. Cuando se cargan
datos por primera vez, la base datos pasa al “estado inicial”. De ahí en adelante, siempre
que se realice una operación de actualización de la base de datos, se tendrá un nuevo
estado. El DBMS se encarga, en parte, de garantizar que todos los estados de la base de
datos sean estados válidos que satisfagan la estructura y las restricciones especificadas en el
esquema. Por lo tanto, es muy importante que el esquema que se especifique al DBMS sea
correcto y se debe tener muchísimo cuidado al diseñarlo. El DBMS almacena el esquema
en su catálogo o diccionario de datos, de modo que se pueda consultar siempre que sea
necesario.
Arquitectura de los sistemas de Bases de Datos.
Hay tres características importantes inherentes a los sistemas de bases de datos: la
separación entre los programas de aplicación y los datos, el manejo de múltiples vistas por
parte de los usuarios y el uso de un catálogo para almacenar el esquema de la base de datos.
En 1975, el comité ANSI-SPARC (American National Standard Institute - Standards
Planning and Requirements Committee) propuso una arquitectura de tres niveles para los
sistemas de bases de datos, que resulta muy útil a la hora de conseguir estas tres
características.
El objetivo de la arquitectura de tres niveles es el de separar los programas de aplicación de
la base de datos física. En esta arquitectura, el esquema de una base de datos se define en
tres niveles de abstracción distintos:
o En el nivel interno se describe la estructura física de la base de datos mediante un
esquema interno. Este esquema se especifica mediante un modelo físico y describe
todos los detalles para el almacenamiento de la base de datos, así como los métodos
de acceso.
o En el nivel conceptual se describe la estructura de toda la base de datos para una
comunidad de usuarios (todos los de una empresa u organización), mediante un
esquema conceptual. Este esquema oculta los detalles de las estructuras de
almacenamiento y se concentra en describir entidades, atributos, relaciones,
operaciones de los usuarios y restricciones. En este nivel se puede utilizar un
modelo conceptual o un modelo lógico para especificar el esquema.
o En el nivel externo se describen varios esquemas externos o vistas de usuario. Cada
esquema externo describe la parte de la base de datos que interesa a un grupo de
usuarios y oculta a ese grupo el resto de la base de datos. En este nivel se puede
utilizar un modelo conceptual o un modelo lógico para especificar los esquemas.
La mayoría de los DBMS no distinguen del todo los tres niveles. Algunos incluyen detalles
del nivel físico en el esquema conceptual. En casi todos los DBMS que se manejan vistas
de usuario, los esquemas externos se especifican con el mismo modelo de datos que
describe la información a nivel conceptual, aunque en algunos se pueden utilizar diferentes
modelos de datos en el nivel conceptual y externo.
Hay que destacar que los tres esquemas no son más que descripciones de los mismos datos
pero con distintos niveles de abstracción. Los únicos datos que existen realmente están a
nivel físico, almacenados en un dispositivo como puede ser un disco. En un DBMS basado
en la arquitectura de tres niveles, cada grupo de usuarios hace referencia exclusivamente a
su propio esquema externo. Por lo tanto, el DBMS debe transformar cualquier petición
expresada en términos de un esquema externo a una petición expresada en términos del
esquema conceptual, y luego, a una petición en el esquema interno, que se procesará sobre
la base de datos almacenada. Si la petición es de una obtención de datos (consulta), será
preciso modificar el formato de la información extraída de la base de datos almacenada,
para que coincida con la vista externa del usuario. El proceso de transformar peticiones y
resultados de un nivel a otro se denomina correspondencia o transformación. Estas
correspondencias pueden requerir bastante tiempo, por lo que algunos DBMS cuentan con
vistas externas.
Lenguajes de los Sistemas Manejadores de Bases de Datos.
Los DBMS deben ofrecer lenguajes e interfaces apropiadas para cada tipo de usuario:
administradores de la base de datos, diseñadores, programadores de aplicaciones y usuarios
finales
a) Lenguaje de definición de datos.
Una vez finalizado el diseño de una base de datos y escogido un DBMS para su
implementación, el primer paso consiste en especificar el esquema conceptual y el
esquema interno de la base de datos, y la correspondencia entre ambos. En muchos
DBMS no se mantiene una separación estricta de niveles, por lo que el
administrador de la base de datos y los diseñadores utilizan el mismo lenguaje para
definir ambos esquemas, es el lenguaje de definición de datos (DDL). El DBMS
posee un compilador de DDL cuya función consiste en procesar las sentencias del
lenguaje para identificar las descripciones de los distintos elementos de los
esquemas y almacenar la descripción del esquema en el catálogo o diccionario de
datos. Se dice que el diccionario contiene metadatos: describe los objetos de la base
de datos.
Cuando en un DBMS hay una clara separación entre los niveles conceptual e
interno, el DDL sólo sirve para especificar el esquema conceptual. Para especificar
el esquema interno se utiliza un lenguaje de definición de almacenamiento (SDL).
Las correspondencias entre ambos esquemas se pueden especificar en cualquiera de
los dos lenguajes. Para tener una verdadera arquitectura de tres niveles sería
necesario disponer de un tercer lenguaje, el lenguaje de definición de vistas (VDL),
que se utilizaría para especificar las vistas de los usuarios y su correspondencia con
el esquema conceptual.
b) Lenguaje de manejo de datos.
Una vez creados los esquemas de la base de datos, los usuarios necesitan un
lenguaje que les permita manipular los datos de la base de datos: realizar consultas,
inserciones, eliminaciones y modificaciones. Este lenguaje es el que se denomina
lenguaje de manejo de datos (DML).
Hay dos tipos de DML: los procedurales y los no procedurales. Con un DML
procedural el usuario (normalmente será un programador) especifica qué datos se
necesitan y cómo hay que obtenerlos. Esto quiere decir que el usuario debe
especificar todas las operaciones de acceso a datos llamando a los procedimientos
necesarios para obtener la información requerida. Estos lenguajes acceden a un
registro, lo procesan y basándose en los resultados obtenidos, acceden a otro
registro, que también deben procesar. Así se va accediendo a registros y se van
procesando hasta que se obtienen los datos deseados. Las sentencias de un DML
procedural deben estar embebidas en un lenguaje de alto nivel, ya que se necesitan
sus estructuras (bucles, condicionales, etc.) para obtener y procesar cada registro
individual. A este lenguaje se le denomina lenguaje anfitrión. Las bases de datos
jerárquicas y de red utilizan DML procedurales.
Un DML no procedural se puede utilizar de manera independiente para especificar
operaciones complejas sobre la base de datos de forma concisa. En muchos DBMS
se pueden introducir interactivamente instrucciones del DML desde un terminal o
bien embeberlas en un lenguaje de programación de alto nivel. Los DML no
procedurales permiten especificar los datos a obtener en una consulta o los datos
que se deben actualizar, mediante una sola y sencilla sentencia. El usuario o
programador especifica qué datos quiere obtener sin decir cómo se debe acceder a
ellos. El DBMS traduce las sentencias del DML en uno o varios procedimientos que
manipulan los conjuntos de registros necesarios. Esto libera al usuario de tener que
conocer cuál es la estructura física de los datos y qué algoritmos se deben utilizar
para acceder a ellos. A los DML no procedurales también se les denomina
declarativos. Las bases de datos relacionales utilizan DML no procedurales, como
SQL (Structured Query Language) o QBE (Query-By-Example). Los lenguajes no
procedurales son más fáciles de aprender y de usar que los procedurales, y el
usuario debe realizar menos trabajo, siendo el DBMS quien hace la mayor parte.
La parte de los DML no procedurales que realiza la obtención de datos es lo que se
denomina un lenguaje de consultas. En general, las órdenes tanto de obtención
como de actualización de datos de un DML no procedural se pueden utilizar
interactivamente, por lo que al conjunto completo de sentencias del DML se le
denomina lenguaje de consultas, aunque es técnicamente incorrecto
c) Lenguajes de cuarta generación.
No existe consenso sobre lo que es un lenguaje de cuarta generación (4GL). Lo que
en un lenguaje de tercera generación (3GL) como COBOL requiere cientos de líneas
de código, tan solo necesita diez o veinte líneas en un 4GL. Comparado con un
3GL, que es procedural, un 4GL es un lenguaje no procedural: el usuario define qué
se debe hacer, no cómo debe hacerse. Los 4GL se apoyan en unas herramientas de
mucho más alto nivel denominadas herramientas de cuarta generación. El usuario no
debe definir los pasos a seguir en un programa para realizar una determinada tarea,
tan sólo debe definir una serie de parámetros que estas herramientas utilizarán para
generar un programa de aplicación. Se dice que los 4GL pueden mejorar la
productividad de los programadores en un factor de 10, aunque se limita el tipo de
problemas que pueden resolver. Los 4GL abarcan:
o Lenguajes de presentación, como lenguajes de consultas y generadores de
informes.
o Lenguajes especializados, como hojas de cálculo y lenguajes de bases de
datos.
o Generadores de aplicaciones que definen, insertan, actualizan y obtienen
datos de la base de datos.
o Lenguajes de muy alto nivel que se utilizan para generar el código de la
aplicación.
Los lenguajes SQL y QBE son ejemplos de 4GL. Hay otros tipos de 4GL:
o Un generador de formularios es una herramienta interactiva que permite
crear rápidamente formularios de pantalla para introducir o visualizar datos.
Los generadores de formularios permiten que el usuario defina el aspecto de
la pantalla, qué información se debe visualizar y en qué lugar de la pantalla
debe visualizarse. Algunos generadores de formularios permiten la creación
de atributos derivados utilizando operadores aritméticos y también permiten
especificar controles para la validación de los datos de entrada.
o Un generador de informes es una herramienta para crear informes a partir de
los datos almacenados en la base de datos. Se parece a un lenguaje de
consultas en que permite al usuario hacer preguntas sobre la base de datos y
obtener información de ella para un informe. Sin embargo, en el generador
de informes se tiene un mayor control sobre el aspecto de la salida. Se puede
dejar que el generador determine automáticamente el aspecto de la salida o
se puede diseñar ésta para que tenga el aspecto que desee el usuario final.
o Un generador de gráficos es una herramienta para obtener datos de la base
de datos y visualizarlos en un gráfico mostrando tendencias y relaciones
entre datos. Normalmente se pueden diseñar distintos tipos de gráficos:
barras, líneas, etc.
o Un generador de aplicaciones es una herramienta para crear programas que
funcionen como interfaz entre el usuario y la base de datos. El uso de un
generador de aplicaciones puede reducir el tiempo que se necesita para
diseñar un programa de aplicación. Los generadores de aplicaciones constan
de procedimientos que realizan las funciones fundamentales que se utilizan
en la mayoría de los programas. Estos procedimientos están escritos en un
lenguaje de programación de alto nivel y forman una librería de funciones
entre las que escoger. El usuario especifica qué debe hacer el programa y el
generador de aplicaciones es quien determina cómo realizar la tarea.
Clasificación de los DBMS.
El criterio principal que se utiliza para clasificar los DBMS es el modelo lógico en que se
basan. Los modelos lógicos empleados con mayor frecuencia en los DBMS comerciales
actuales son el relacional, el de red y el jerárquico. Algunos DBMS más modernos se basan
en modelos orientados a objetos.
El modelo relacional se basa en el concepto matemático denominado “relación”, que
gráficamente se puede representar como una tabla. En el modelo relacional, los datos y las
relaciones existentes entre los datos se representan mediante estas relaciones matemáticas,
cada una con un nombre que es único y con un conjunto de columnas.
En el modelo relacional la base de datos es percibida por el usuario como un conjunto de
tablas. Esta percepción es sólo a nivel lógico (en los niveles externo y conceptual de la
arquitectura de tres niveles), ya que a nivel físico puede estar implementada mediante
distintas estructuras de almacenamiento.
En el modelo de red los datos se representan como colecciones de registros y las relaciones
entre los datos se representan mediante conjuntos, que son punteros en la implementación
física. Los registros se organizan como un grafo: los registros son los nodos y los arcos son
los conjuntos. El DBMS de red más popular es el sistema IDMS.
El modelo jerárquico es un tipo de modelo de red con algunas restricciones. De nuevo los
datos se representan como colecciones de registros y las relaciones entre los datos se
representan mediante conjuntos. Sin embargo, en el modelo jerárquico cada nodo puede
tener un solo padre. Una base de datos jerárquica puede representarse mediante un árbol:
los registros son los nodos, también denominados segmentos, y los arcos son los conjuntos.
El DBMS jerárquico más importante es el sistema IMS.
La mayoría de los DBMS comerciales actuales están basados en el modelo relacional,
mientras que los sistemas más antiguos estaban basados en el modelo de red o el modelo
jerárquico. Estos dos últimos modelos requieren que el usuario tenga conocimiento de la
estructura física de la base de datos a la que se accede, mientras que el modelo relacional
proporciona una mayor independencia de datos. Se dice que el modelo relacional es
declarativo (se especifica qué datos se han de obtener) y los modelos de red y jerárquico
son navegacionales (se especifica cómo se deben obtener los datos).
El modelo orientado a objetos define una base de datos en términos de objetos, sus
propiedades y sus operaciones. Los objetos con la misma estructura y comportamiento
pertenecen a una clase, y las clases se organizan en jerarquías o grafos acíclicos. Las
operaciones de cada clase se especifican en términos de procedimientos predefinidos
denominados métodos. Algunos DBMS relacionales existentes en el mercado han estado
extendiendo sus modelos para incorporar conceptos orientados a objetos. A estos DBMS se
les conoce como sistemas objeto-relacionales
Un segundo criterio para clasificar los DBMS es el número de usuarios a los que da
servicio el sistema. Los sistemas monousuario sólo atienden a un usuario a la vez, y su
principal uso se da en las computadoras personales. Los sistemas multiusuario, entre los
que se encuentran la mayor parte de los DBMS, atienden a varios usuarios al mismo
tiempo.
Un tercer criterio es el número de sitios en los que está distribuida la base de datos. Casi
todos los DBMS son centralizados: sus datos se almacenan en un solo computador. Los
DBMS centralizados pueden atender a varios usuarios, pero el DBMS y la base de datos en
sí residen por completo en una sola máquina. En los DBMS distribuidos la base de datos
real y el propio software del DBMS pueden estar distribuidos en varios sitios conectados
por una red. Los DBMS distribuidos homogéneos utilizan el mismo DBMS en múltiples
sitios. Una tendencia reciente consiste en crear software para tener acceso a varias bases de
datos autónomas preexistentes almacenadas en DBMS distribuidos heterogéneos. Esto da
lugar a los DBMS federados o sistemas multibase de datos en los que los DBMS
participantes tienen cierto grado de autonomía local. Muchos DBMS distribuidos emplean
una arquitectura cliente-servidor.
Un cuarto criterio es el costo del DBMS. La mayor parte de los paquetes de DBMS cuestan
entre 10,000 y 100,000 dólares. Los sistemas monousuario más económicos para
microcomputadores cuestan entre 100 y 3,000 dólares. En el otro extremo, los paquetes más
completos cuestan más de 100,000 dólares.
Por último, los DBMS pueden ser de propósito general o de propósito específico. Cuando el
rendimiento es fundamental, se puede diseñar y construir un DBMS de propósito especial
para una aplicación específica, y este sistema no sirve para otras aplicaciones. Muchos
sistemas de reservas de líneas aéreas son DBMS de propósito especial y pertenecen a la
categoría de sistemas de procesamiento de transacciones en línea (OLTP), que deben
atender un gran número de transacciones concurrentes sin imponer excesivos retrasos
El modelo relacional.
En 1970, el modo en que se veían las bases de datos cambió por completo cuando E. F.
Codd introdujo el modelo relacional. En aquellos momentos, el enfoque existente para la
estructura de las bases de datos utilizaba punteros físicos (direcciones de disco) para
relacionar registros de distintos archivos. Si, por ejemplo, se quería relacionar un registro A
con un registro B, se debía añadir al registro A un campo conteniendo la dirección en disco
del registro B. Este campo añadido, un puntero físico, siempre señalaría desde el registro A
al registro B. Codd demostró que estas bases de datos limitaban en gran medida los tipos de
operaciones que los usuarios podían realizar sobre los datos. Además, estas bases de datos
eran muy vulnerables a cambios en el entorno físico. Si se añadían los controladores de un
nuevo disco al sistema y los datos se movían de una localización física a otra, se requería
una conversión de los archivos de datos. Estos sistemas se basaban en el modelo de red y el
modelo jerárquico, los dos modelos lógicos que constituyeron la primera generación de los
DBMS.
El modelo relacional representa la segunda generación de los DBMS. En él, todos los datos
están estructurados a nivel lógico como tablas formadas por filas y columnas, aunque a
nivel físico pueden tener una estructura completamente distinta. Un punto fuerte del
modelo relacional es la sencillez de su estructura lógica. Pero detrás de esa simple
estructura hay un fundamento teórico importante del que carecen los DBMS de la primera
generación, lo que constituye otro punto a su favor.
Dada la popularidad del modelo relacional, muchos sistemas de la primera generación se
han modificado para proporcionar una interfaz de usuario relacional, con independencia del
modelo lógico que soportan (de red o jerárquico). Por ejemplo, el sistema de red IDMS ha
evolucionado a IDMS/R e IDMS/SQL, ofreciendo una visión relacional de los datos.
En los últimos años, se han propuesto algunas extensiones al modelo relacional para
capturar mejor el significado de los datos, para disponer de los conceptos de la orientación
a objetos y para disponer de capacidad deductiva.
El modelo relacional, como todo modelo de datos, tiene que ver con tres aspectos de los
datos:
o Estructura de datos.
o Integridad de datos.
o Manejo de datos.
Estructura de datos relacional.
En este apartado se presenta la estructura de datos del modelo relacional: la relación.
Relaciones.
El modelo relacional se basa en el concepto matemático de relación, que gráficamente se
representa mediante una tabla. Codd, que era un experto matemático, utilizó una
terminología perteneciente a las matemáticas, en concreto de la teoría de conjuntos y de la
lógica de predicados.
Una relación es una tabla con columnas y filas. Un DBMS sólo necesita que el usuario
pueda percibir la base de datos como un conjunto de tablas. Esta percepción sólo se aplica a
la estructura lógica de la base de datos (en el nivel externo y conceptual de la arquitectura
de tres niveles ANSI-SPARC). No se aplica a la estructura física de la base de datos, que se
puede implementar con distintas estructuras de almacenamiento.
Un atributo es el nombre de una columna de una relación. En el modelo relacional, las
relaciones se utilizan para almacenar información sobre los objetos que se representan en la
base de datos. Una relación se representa gráficamente como una tabla bidimensional en la
que las filas corresponden a registros individuales y las columnas corresponden a los
campos o atributos de esos registros. Los atributos pueden aparecer en la relación en
cualquier orden.
Por ejemplo, la información de las oficinas de la empresa inmobiliaria se representa
mediante la relación “oficina”, que tiene columnas para los atributos Onum (número de
oficina), Calle, Población, Teléfono y Fax.