Granular I Dad
Granular I Dad
Granular I Dad
información sobre el negocio que se esté analizando. Por ejemplo, los datos referentes
a ventas o compras realizadas por una empresa, pueden registrarse día a día, en cambio,
los datos pertinentes a pagos de sueldos o cuotas de socios, podrán almacenarse a nivel
de mes.
Mientras mayor sea el nivel de detalle de los datos, se tendrán mayores posibilidades
analíticas, ya que los mismos podrán ser resumidos o agregados. Es decir, los datos que
posean granularidad fina (nivel de detalle) podrán ser resumidos hasta obtener una
granularidad media o gruesa. NO sucede lo mismo en sentido contrario, ya que por
ejemplo, los datos almacenados con granularidad media podrán resumirse, pero NO
podrán ser analizados a nivel de detalle. O sea, si la granularidad con que se guardan los
registros es a nivel de día, estos datos podrán agregarse por semana, mes, semestre y
año, en cambio, si estos registros se almacenan a nivel de mes, podrán agregarse por
semestre y año, pero NO lo podrán hacer por día y semana.
La granularidad trabaja conjuntamente con la agregación, que en bases de datos es un
cálculo que se realiza a varias filas y produce un único resultado, por ejemplo una
sumatoria. Las agregaciones son cálculos NO reversibles, con la sumatoria es fácil de
comprender, tenemos una serie de números que sumamos y obtenemos como
resultado un nuevo número que representa el total, teniendo el total NO podemos
obtener nuevamente los números de origen.
Granularidad[editar]
Una característica importante que define a una tabla de hechos es el nivel
de granularidad de los datos que en ella se almacenan, entendiéndose por
'granularidad' el nivel de detalle de dichos datos, es decir, la granularidad de la
tabla de hechos representa el nivel más atómico por el cual se definen los datos.
Por ejemplo, no es lo mismo contar el tiempo por horas (grano fino) que por
semanas (grano grueso); o en el caso de los productos, se puede considerar
cada variante de un mismo artículo como un producto (por ejemplo, en una
empresa textil, cada talla y color de pantalón podría ser un producto) o agrupar
todos los artículos de una misma familia considerándolos como un único
producto (por ejemplo, el producto pantalón genérico).
Como se puede observar, la granularidad afecta a la cardinalidad, tanto de las
dimensiones como de la tabla de hechos, a mayor granularidad (grano más fino)
mayor será el número de registros final de la tabla de hechos.
Cuando la granularidad es mayor, es frecuente que se desee disponer de
subtotales parciales, es decir, si tenemos una tabla de hechos con las ventas por
días, podría interesar disponer de los totales semanales o mensuales, estos
datos se pueden calcular haciendo sumas parciales, pero es frecuente añadir a
la tabla de hechos registros donde se almacenan dichos cálculos para no tener
que repetirlos cada vez que se requieran y mejorar así el rendimiento de la
aplicación. En este caso se dispondrá en la misma tabla de hechos de datos de
grano fino y de grano más grueso aumentando aún más la cardinalidad de la
tabla.
Agregación[editar]
La agregación es un proceso de cálculo por el cual se resumen los datos de los
registros de detalle. Esta operación consiste normalmente en el cálculo de totales
dando lugar a medidas de grano grueso. Cuando se resumen los datos, el detalle
ya no está directamente disponible para el analista, ya que este se elimina de la
tabla de hechos.
Esta operación se realiza típicamente con los datos más antiguos de la empresa
con la finalidad de seguir disponiendo de dicha información (aunque sea
resumida) para poder eliminar registros obsoletos de la tabla de hechos para
liberar espacio.