Lectura Fundamental 2
Lectura Fundamental 2
Lectura Fundamental 2
Lectura fundamental
Contenido
1 Introducción
Palabras clave: bases de datos, NoSQL, accesibilidad, crecimiento, Web 2.0, SGBD.
1. Introducción
Las bases de datos tradicionales, a partir de 2004, con el nacimiento de la Web 2.0
como fenómeno social colaborativo, se vienen enfrentando a nuevos retos, tales como
manejar miles de usuarios concurrentes, con millones de consultas diarias sobre datos
semi-estructurados -que no se ajustan a un modelo formal de bases de datos-, también
conocidos como estructura autodescriptiva o tipos de datos polimórficos -aquellos que
contienen al menos un elemento cuyo tipo no está formalmente especificado, según afirma
Peter (2002)-.
Un ejemplo de lo anteriormente mencionado es YouTube, que aparece en 2005 y hoy ya
cuenta con casi mil millones de vistas a sus videos que equivale a un tercio de los usuarios
de internet, con más de 70 millones de horas de reproducción. Otro ejemplo puede ser el
instituto del colisionador de partículas CERN -Organización Europea para la Investigación
Nuclear- que almacena más de 200 Petabytes – 204800 Terabytes en sus discos duros.
• El tercero asociado a las nuevas tendencias tecnológicas, según afirma Oliva (2017), que están
adoptando las empresas es utilizar de código abierto, servidores especializados (commodity
server) y procesamiento en la nube (cloud computing) en lugar de usar los grandes servidores
con inmensas unidades de almacenamiento que generalmente son las soluciones de las bases de
datos relacionales.
POLITÉCNICO GRANCOLOMBIANO 2
• El cuarto es la reducción de los tiempos de ciclos de desarrollo para las aplicaciones en internet
usando metodologías ágiles (sprints), en donde los tipos de datos están cambiando, desde
totalmente estructurados a no estructurados e inclusive llegando a datos polimórficos, lo
anterior muy enfocado al tipo de audiencia que ha surgido de la Web 2.0. Mientras que las
bases de datos relacionales exigen que el modelo tenga definidas las estructuras de datos antes
de ingresarlos con el fin de minimizar el impacto en el desarrollo que tiene las modificaciones a
dichas estructuras.
En síntesis...
»» La tecnología de las bases de datos ha cambiado de informatizar los sistemas de
archivos manuales.
»» Era una buena solución cuando cada área de negocio de la empresa era
responsable de sus propios datos y accedía a ellos con sus propios programas.
Con el fin de solucionar estos problemas surgen los modelos alternativos para gestionar las
bases de datos que son las NoSQL, Cloud o no relacionales, donde los conceptos básicos
sobre los cuales se operan estos sistemas consisten en: librerías utilitarias o Common utilities
que generalmente son de código abierto, un gestor de recursos para manejar los nodos
(máquinas) que componen el sistema distribuido, un sistema manejador de los archivos
físicamente distribuidos que debe estar instalado en cada nodo y dependiendo.
POLITÉCNICO GRANCOLOMBIANO 3
3. Clasificación de bases de datos NoSQL
Las bases de datos NoSQL se diferencian de las relacionales en tres aspectos fundamentales:
el primero es el tipo de datos que almacenan, el segundo es cómo están construidas y el
tercero es cómo se almacenan dichos datos permitiéndoles manejar volúmenes gigantescos.
Según afirma Castro-Zamora (2015), también se incluyen características tales como las
APIs simples, para el manejo de la base, cuentan con esquemas libres, el soporte permite una
replicación libre de las bases, los lenguajes más comunes para interactuar con ellas son Java,
C++, PHP, PHYTON y no todas garantizan consistencia de los datos (punto débil).
Generalmente la clasificación de estas bases de datos se hace de acuerdo con el primer
aspecto mencionado, o sea la forma en que almacenan los datos, donde las más populares
son: bases de datos de almacenes de mapeo de columnas, bases de datos de almacén
documental, bases de datos de grafos, bases de datos de almacén de llave-valores, bases de
datos XML.
Sin embargo, actualmente se acepta que hay 15 clasificaciones, de las cuales se muestran las
diferentes tecnologías utilizadas, ordenadas alfabéticamente y resaltando en amarillo las más
utilizadas en el mercado actualmente:
POLITÉCNICO GRANCOLOMBIANO 4
» Grafos (Graph Databases)
Aerospike, allegro-C, Azure Table Storage, BangDB, Berkeley DB, BinaryRage, BoltDB,
Cachelot, Chordless, Chronicle Map, DBreeze, DynamoDB, Dynomite, Elliptics, Faircom
C-Tree, filejson, GenieDB, Genomu, Hibari, HyperDex, InfinityDB, KAI, KitaroDB, LevelDB,
LightCloud, LSM, Maxtable, MemcacheDB, Mnesia, NCache, nessDB, OpenLDAP,
PickleDB, Pincaster, quasardb, RaptorDB, Redis, Riak, RocksDB, Scalaris, Scalien, SCR
Siemens Common Repository, Serenety, SharedHashFile, Sophia, STSdb, Symas LMDB,
Tarantool/Box, TayzGrid, TIBCO Active Spaces, Tokyo Cabinet / Tyrant, TreodeDB,
upscaledb, Voldemort.
BaseX, Berkeley DB XML, EMC Documentum xDB, eXist, JEntigrator, Qizx, Sedna.
POLITÉCNICO GRANCOLOMBIANO 5
» Multidimensionales (Multidimensional Databases)
ESENT, jBASE, Model 204 Database, OpenInsight, OpenQM, Reality, Tieto TRIP,
TigerLogic PICK, U2.
Axibase, eXtremeDB, Informix Time Series Solution, influxdata, pipelinedb, kdb+, Riak TS.
BayesDB, GPUdb.
POLITÉCNICO GRANCOLOMBIANO 6
4. Ventajas de las bases de datos NoSQL
Las ventajas más predominantes, y por lo cual fueron creadas, son:
• Como no requieren mucho procesamiento, se pueden ejecutar en máquinas de bajo costo que
utilizan pocos recursos, debido a que no necesitan transcribir cada sentencia (requerimiento)
para poder ser ejecutadas.
• Se reducen los costos de los ciclos de desarrollo -al hacerlos más cortos- y utilizando software
de código abierto, aprovechando de esa manera el esfuerzo de equipos de trabajo distribuidos
por todo el mundo.
• La falta de generación de un lenguaje estándar de manejo para estas bases (como es el SQL), ya
que los desarrollos o soluciones de software existentes tienen inconvenientes para migrar de una
base a otra, o inclusive presentan problemas entre versiones de la misma base.
POLITÉCNICO GRANCOLOMBIANO 7
• Existen pocas herramientas de seguimiento, como los reportes de análisis o de rendimiento o
seguimiento a esas bases.
En síntesis...
Aunque existen muchas ventajas de estas nuevas tecnologías de manejo
de bases de datos, no significa que vayan a volver obsoletas las bases de
datos relacionales, sino que se complementan, ya que las bases de datos
relacionales siguen teniendo importancia en la industria, sobre todo por el
manejo de la seguridad, consistencia y disponibilidad de los datos.
POLITÉCNICO GRANCOLOMBIANO 8
» Lenguaje de manipulación de datos o Data Manipulation Language –DML-: como su nombre lo
indica es el conjunto de operaciones que responde a las solicitudes de los usuarios tales como
consulta, inserción, modificación y eliminación de los datos que estén contenidos en la base de
datos.
Más adelante se tratará este tema a fondo cuando estemos aplicando el SQL en los ejercicios.
POLITÉCNICO GRANCOLOMBIANO 9
Referencias
Castro-Zamora, C. y Flores-Valdés, E. (2015). Capacidad de Orquestación de Servicios Web en
las Herramientas MULE ESB y Oracle Service Bus. Recuperado el 11 de noviembre de 2017 de
https://login.loginbiblio.poligran.edu.co/login?url=http://search.ebscohost.com/login.aspx?dir
ect=true&db=fua&AN=110618637&lang=es&site=eds-live
Oliva, D. (2017). Propuesta de herramientas para la integración de datos en un entorno
empresarial. La Habana, CU: D - Instituto Superior Politécnico José Antonio Echeverría.
Recuperado el 4 de noviembre de 2017 de
http://site.ebrary.com.loginbiblio.poligran.edu.co:2048/lib/bibliopoligransp/detail.
action?docID=10609169&p00=enterprise+service+bus+esb
Peter, R. y Coronel, C. (2002). Sistemas de Bases de Datos: diseño, implementación y
administración (quinta edición). Stamford: Thomson.
POLITÉCNICO GRANCOLOMBIANO 10
INFORMACIÓN TÉCNICA
POLITÉCNICO GRANCOLOMBIANO 11