Jimenez MJ
Jimenez MJ
Jimenez MJ
Rights info:eu-repo/semantics/openAccess
Autores
Asesor
2
Agradecimientos
3
Resumen Ejecutivo
4
Abstract
The main purpose of this project is the implementation of usage and design guidelines
based on a preview investigation of forty Data Visualization techniques. Taking this into
consideration, validate the guidelines through concept tests using a Business Intelligence
and Data Visualization tool, applying a proposed process for the guidelines usage. Finally,
as a continuity measure, a roadmap of future projects that explore de field of this
investigation.
This project initiates based on the need to help the user make their decisions faster and
easier, taking action from the moment in which those related to the Data Visualization
tools, such as developers and functional users, make use of these. The use of data
visualization techniques in a software tool without taking into account its purpose (what is
its use and how they should be used), affects the user, since, by using these solutions with
basic functionalities and not necessarily well applied, limit their capacity for analysis and
decision making.
The structure of this document is distributed in seven chapters:
Chapter one describes the general aspects of the project, the enunciation of the problem, the
main purpose of the project, as well as the proposed solutions and success indicators, with
the ones it can be judged the fulfillment of the project, and also, the detailed plans in
relation of the project management.
Chapter two describes the achievements made throughout the project through the Student
Results of the Engineering Commission and the Computer Commission of ABET.
The third chapter includes four important points, the concept of data visualization, what are
the data visualization techniques, the concept of guidelines and additional concepts like
Business Intelligence and Gartner Methodology.
In chapter four we found a review of the literature referring to the definition of the State of
the Art of the project and the cases of study of Visualization of data and its techniques,
where the contribution of each author and their conclusions are detailed.
Chapter five presents the research of the forty data visualization techniques, and the process
followed for the elaboration of the guidelines, including the benchmarking of Business
5
Intelligence and Data Visualization tools, the architecture of the evaluated tools and finally
the concept tests where the guidelines are validated and implemented.
Chapter six presents, as the result of the project, the usage and design Guidelines of data
visualization techniques, with a proposed process for its optimums application and a
roadmap of futures projects as a continuity measure.
Chapter seven details the management of the development of the project aligned with the
PMBOK guidelines.
6
Tabla de contenidos
Introducción .......................................................................................................................... 18
CAPITULO 1 Descripción del Proyecto .............................................................................. 20
1.1 Objeto de Estudio ..................................................................................................... 21
1.2 Dominio del Problema .............................................................................................. 21
1.3 Planteamiento de la Solución ................................................................................... 23
1.4 Objetivos del Proyecto ............................................................................................. 23
1.5 Indicadores de Éxito ................................................................................................. 24
1.6 Planificación del Proyecto ........................................................................................ 24
1.6.1 Alcance ............................................................................................................. 25
1.6.2 Plan de Gestión del Tiempo ............................................................................. 26
1.6.3 Plan de Gestión de Recursos Humanos ............................................................ 30
1.6.4 Plan de Comunicaciones ................................................................................... 33
1.6.5 Plan de Gestión de Riesgos .............................................................................. 33
CAPÍTULO 2 Logros por student outcomes ...................................................................... 36
2.1 Student Outcomes ....................................................................................................... 37
2.2 Acreditación EAC (Engineering Accreditation Commission of ABET).................... 37
2.2.1 Student Outcome A ............................................................................................. 37
2.2.2 Student Outcome B.............................................................................................. 42
2.2.3 Student Outcome C.............................................................................................. 50
2.2.4 Student Outcome D ............................................................................................. 52
2.2.5 Student Outcome E .............................................................................................. 54
2.2.6 Student Outcome F .............................................................................................. 55
2.2.7 Student Outcome G ............................................................................................. 57
2.2.8 Student Outcome H ............................................................................................. 59
2.2.9 Student Outcome I ............................................................................................... 61
2.2.10 Student Outcome J ............................................................................................. 67
2.2.11 Student Outcome K ........................................................................................... 68
2.3 Acreditación CAC (Computing Accreditation Commission of ABET) ..................... 71
2.3.1 Student Outcome J ............................................................................................... 71
7
CAPÍTULO 3 Marco Teórico ............................................................................................ 73
3.1 Data Visualization .................................................................................................... 74
3.2 Técnicas de data visualization .................................................................................. 76
3.2.1 Concepto .............................................................................................................. 76
3.3 Lineamientos de Uso y Diseño ................................................................................. 83
3.3.1 Lineamiento de Uso ............................................................................................. 83
3.3.2 Lineamientos de diseño ....................................................................................... 84
3.4 Business Intelligence ................................................................................................ 85
3.4.1 Concepto .............................................................................................................. 85
3.5 Metodología de Gartner ............................................................................................ 86
3.5.1 Metodologías ....................................................................................................... 86
CAPÍTULO 4 Estado del Arte ........................................................................................... 91
4.1 Revisión de la Literatura........................................................................................... 92
4.2 Casos de estudio de Data Visualization.................................................................... 94
4.2.1 Técnicas de Data Visualization ........................................................................... 94
4.2.2 Framework de estrategias de diseño .................................................................. 118
4.2.3 Modelos y métodos según los tipos de datos ..................................................... 122
CAPÍTULO 5 Desarrollo del Proyecto ............................................................................ 126
5.1 Entregables del proyecto .......................................................................................... 127
5.2 Investigación de las técnicas de data visualization ................................................. 127
5.2.1 Estructura de los lineamientos ........................................................................... 127
5.3 Benchmarking de las Herramientas de data visualization ...................................... 239
5.3.1 Introducción ....................................................................................................... 239
5.3.2 Consideraciones base ......................................................................................... 240
5.3.3 Descripción de las herramientas ........................................................................ 243
5.3.4 Criterios de Evaluación ..................................................................................... 251
5.3.5 Evaluación de Herramientas .............................................................................. 252
5.3.6 Conclusiones...................................................................................................... 266
5.4 Arquitecturas de las herramientas........................................................................... 268
5.4.1 Arquitectura de Power BI .................................................................................. 268
5.4.2 Arquitectura de Tableau Server ......................................................................... 285
8
5.4.1 Arquitectura de Qlik Sense Enterprise .............................................................. 298
5.5 Pruebas de Concepto .............................................................................................. 310
5.5.1 Proceso de elaboración ...................................................................................... 310
CAPÍTULO 6 Resultado del Proyecto ............................................................................. 316
6.1 Lineamientos de Uso y diseño .................................................................................. 317
6.1.1 Estructura de trabajo ....................................................................................... 317
6.1.2 Enfoques y Lineamientos de Uso y Diseño .................................................... 317
6.1.3 Proceso de aplicación de los lineamientos propuestos ...................................... 336
6.2 Roadmap de proyectos ............................................................................................. 337
6.2.1 Propuesta 1: Investigación de Interactive Visualization en dispositivos móviles
.................................................................................................................................... 338
6.2.2 Propuesta 2: Investigación de técnicas de visualización con Streaming Analytics
.................................................................................................................................... 342
CAPÍTULO 7 Gestión del Proyecto ................................................................................. 346
6.1 Producto Final .......................................................................................................... 347
6.2 Registro de interesados ............................................................................................. 348
6.3 Matriz de trazabilidad de requerimientos ................................................................. 351
6.4 Matriz de asignacion de responsabilidades .............................................................. 353
6.5 Plan de gestión de Calidad ....................................................................................... 355
6.5.1 Roles y Responsabilidades ................................................................................ 355
6.5.2 Procedimientos .................................................................................................. 356
6.6 Plan de gestión de Riesgos ....................................................................................... 360
6.7 Plan de gestión de Tiempo........................................................................................ 363
Conclusiones....................................................................................................................... 364
Recomendaciones ............................................................................................................... 366
Glosario .............................................................................................................................. 367
Anexo 1 - Plan de Gestión de Comunicaciones ................................................................. 368
Anexo 2 – Matriz de Riesgos ............................................................................................. 369
Referencas Bibliografícas ................................................................................................... 371
9
Índice de Tablas
10
Tabla 30 : Lineamientos de uso y diseño por enfoque de Patrones .................................... 330
Tabla 31 : Lineamientos de uso y diseño por enfoque de Tendencias ............................... 333
Tabla 32 : Registro de interesados del proyecto DATAVIZ .............................................. 348
Tabla 33 : Matriz de Trazabilidad de Requerimientos del proyecto DATAVIZ................ 351
Tabla 34 : Matriz de responsabilidades de los involucrados del proyecto DATAVIZ ...... 353
Tabla 35 : Análisis del control de calidad y auditorías del proyecto DATAVIZ ............... 357
Tabla 36 : Análisis de los riesgos del proyecto DATAVIZ ............................................... 360
Tabla 37 : Estrategias de respuesta y monitoreo de riesgos del proyecto DATAVIZ ....... 361
Tabla 38 : Gestión del tiempo de las fases del proyecto DATAVIZ .................................. 363
11
Índice de Figuras
12
Figura 30. Cuadrante Mágico de Gartner Business Intelligence y Analytics Platorms 2016
...................................................................................................................................... 63
Figura 31. Tabla de requerimientos técnicos de las herramientas del Benchmarking ......... 64
Figura 32. Tabla de precios y ediciones de las herramientas de Data Visualization ............ 65
Figura 33. Tabla de descripción de herramientas ................................................................. 66
Figura 34. Tabla de técnicas de Data Visualization vs Herramientas .................................. 67
Figura 35. Lineamientos de uso y diseño ............................................................................. 68
Figura 36. Guías de instalación de las herramientas del Benchmarking .............................. 69
Figura 37. Documento de pruebas funcionales de la herramienta de Power BI ................... 70
Figura 38. Benchmarking de herramientas de Data Visualization ....................................... 70
Figura 39. Plan de Continuidad ............................................................................................ 72
Figura 40. Ejemplo de infografía .......................................................................................... 74
Figura 41. Ejemplo de Data Visualization ........................................................................... 75
Figura 42. Ejemplo de dashboard ......................................................................................... 75
Figura 43. Ejemplo de Data Visualization ........................................................................... 76
Figura 44. Cuadrante de Gartner .......................................................................................... 89
Figura 45. Ideas generales de las técnicas de análisis y representación ............................... 95
Figura 46. Lecciones aprendidas de proyectos de diseño de tableros de visualización para
empresas ....................................................................................................................... 98
Figura 47. Visualizaciones del dashboard de Youneeq ...................................................... 100
Figura 48. Propuesta para proveer una visión del uso de la visualización de información 103
Figura 49. Mortalidad del Ejército Británico por Florence Nightingale ............................ 105
Figura 50. Proceso de periodismo de datos ........................................................................ 106
Figura 51. Proceso de visualización y técnicas descritas ................................................... 108
Figura 52. Diez Directrices Para Una Efectiva Visualización de Data en Publicaciones
Científicas ................................................................................................................... 113
Figura 53. Valor codificado frente al atributo .................................................................... 115
Figura 54. Paleta de Visualizaciones Presets ..................................................................... 119
Figura 55. Grupos de Métodos para la Visualización de Datos en las ciencias políticas ... 123
Figura 56. Grupos de Métodos para la Visualización de Datos en las ciencias políticas ... 128
Figura 57. Ventas realizadas en cada cuarto de año ........................................................... 129
13
Figura 58. Gráfico de barras: Densidad de metales ............................................................ 130
Figura 59. Gráfico de Barras Radial ................................................................................... 132
Figura 60. Pirámide de Población....................................................................................... 133
Figura 61. Formas de Pirámides de Población ................................................................... 134
Figura 62. Pirámide de Población 1961.............................................................................. 136
Figura 63. Mapa Choropleth............................................................................................... 137
Figura 64. Mapa Choropleth............................................................................................... 139
Figura 65. Mapa de Burbujas ............................................................................................. 140
Figura 66. Inversiones Internacionales de China................................................................ 142
Figura 67. Gráfico Nightingale Rose .................................................................................. 143
Figura 68. Gráfico Nightingale Rose acerca de los Simpsons ........................................... 145
Figura 69. Gráfico de Columnas Radial ............................................................................. 146
Figura 70. Gráfico de Columnas Radial ............................................................................. 147
Figura 71. Gráfico Radar .................................................................................................... 148
Figura 72. Gráfico Radar .................................................................................................... 150
Figura 73. Gráfico Span ..................................................................................................... 151
Figura 74. Gráfico de Barra Multi Set ................................................................................ 153
Figura 75. Gráfico de anillos .............................................................................................. 155
Figura 76. Muertes relacionadas al VIH en Sub Saharan África 2013............................... 157
Figura 77. Gráfico Marimekko ........................................................................................... 158
Figura 78. Gráfico Marimekko ........................................................................................... 160
Figura 79. Gráfico Pie ........................................................................................................ 161
Figura 80. Gráfico de barras apiladas ................................................................................. 163
Figura 81. Gráfico de barras apiladas ................................................................................. 165
Figura 82. Gráfico de Área Proporcional ........................................................................... 166
Figura 83. Gráfico de Área Proporcional ........................................................................... 168
Figura 84. Gráficos de líneas .............................................................................................. 169
Figura 85. Porcentaje de crecimiento de la población de África desde 1970 hasta 2015 .. 170
Figura 86. Sets Paralelos .................................................................................................... 173
Figura 87. Sets Paralelos – How Fan Loyalty Change During the World Cup .................. 174
Figura 88. Diagrama de Caja .............................................................................................. 175
14
Figura 89. PBI 1991 - 2001 Perú ........................................................................................ 177
Figura 90. Gráfico de Tallo y Hoja..................................................................................... 179
Figura 91. Ejemplo del uso de un diagrama Tallo y Hoja .................................................. 180
Figura 92. Histograma ........................................................................................................ 181
Figura 93. Salario de Trabajos de TI de los últimos tres meses hasta el 28 de mayo del 2016
en Inglaterra ................................................................................................................ 182
Figura 94. Histograma de Riesgo de parto por cesárea por edad de la madre en Estados
Unidos en el 2013 ....................................................................................................... 183
Figura 95. Diagrama de árbol ............................................................................................. 185
Figura 96. Árbol Interactivo de Nadal ................................................................................ 186
Figura 97. Mapa de Conexiones ......................................................................................... 187
Figura 98. Mapa de Rutas de vuelos de Vienna International ............................................ 188
Figura 99. Mapa Interactivo Cyber ataques........................................................................ 189
Figura 100. Diagrama de arco ............................................................................................ 190
Figura 101. Diagrama de Arco - Gráfico para visualizar personajes de Los Miserables ... 191
Figura 102. Representación de la canción Für Elise de Beethoven en un diagrama de arco
.................................................................................................................................... 192
Figura 103. Diagrama de acorde......................................................................................... 193
Figura 104. Ejemplo Diagrama de Arco ............................................................................. 194
Figura 105. Rutas de Uber por Vecindario ......................................................................... 195
Figura 106. Diagrama de acorde sin cinta .......................................................................... 196
Figura 107. Vecinos de cada país de América ................................................................... 197
Figura 108. Diagrama Sankey ............................................................................................ 198
Figura 109. Lluvia de ideas ................................................................................................ 200
Figura 110. Diagrama Venn ............................................................................................... 202
Figura 111. Twitter Venn ................................................................................................... 203
Figura 112. Gráfico de matriz de puntos ............................................................................ 205
Figura 113. Pictograma ...................................................................................................... 206
Figura 114. Pictograma de la vida de Darth Vader ............................................................ 207
Figura 115. Mapa de árbol.................................................................................................. 209
Figura 116. Exportadores de uva 2014 ............................................................................... 210
15
Figura 117. Mapa de árbol circular .................................................................................... 212
Figura 118. Estructura de Macro a micronutrientes ........................................................... 213
Figura 119. Gráfico de Burbujas ........................................................................................ 214
Figura 120. Expectativa de vida vs PBI per Cápita en el 2007 .......................................... 215
Figura 121. Interactive bubble plot .................................................................................... 217
Figura 122. Mapa de Flujo ................................................................................................. 219
Figura 123. Mapa de flujo de comercio de petróleo y derivados ....................................... 219
Figura 124. Mapa Global del Tráfico 2010 ........................................................................ 221
Figura 125. Mapa de Puntos ............................................................................................... 222
Figura 126. Población hispana en Estados Unidos ............................................................. 224
Figura 127. Gráficos de Áreas Apiladas ............................................................................. 225
Figura 128. Sectores de edad de la población de Japón desde 1980 hasta 2010 ................ 226
Figura 129. Diagrama de Dispersión .................................................................................. 229
Figura 130. Diagrama de Dispersión .................................................................................. 231
Figura 131. Espiral de Caracol ........................................................................................... 232
Figura 132. Árbol de la vida ............................................................................................... 233
Figura 133. Línea de tiempo ............................................................................................... 235
Figura 134. Gráficos de área............................................................................................... 237
Figura 135. Encarcelamientos en Estados Unidos 1920 - 2006 ......................................... 238
Figura 136. Cuadrante Mágico de Gartner Business Intelligence y Analytics Platorms 2016
.................................................................................................................................... 243
Figura 137. Descripción General de los Productos ............................................................ 245
Figura 138. Requerimientos Técnicos de las Herramientas ............................................... 250
Figura 139. Precios y Ediciones de las Herramientas ........................................................ 252
Figura 140. Evaluación TCO Power BI.............................................................................. 253
Figura 141. Evaluación TCO Tableau Server .................................................................... 254
Figura 142. Evaluación TCO Qlik Sense ........................................................................... 254
Figura 143. Cuadro de Cantidad de Gráficos soportados por cada herramienta ................ 256
Figura 144. Flujo de autenticación de usuarios Power BI parte I....................................... 261
Figura 145. Flujo de autenticación de usuarios Power BI parte II ..................................... 262
Figura 146. Seguridad de Tableau ...................................................................................... 264
16
Figura 147. Extracto del Product/Service Rating on Critical Capabilities ......................... 266
Figura 148. Arquitectura Lógica de Power BI ................................................................... 270
Figura 149. Arquitectura Lógica de Power BI Desktop ..................................................... 270
Figura 150. Arquitectura Física de Power BI ..................................................................... 275
Figura 151. Diagrama de Componentes de Power BI ........................................................ 278
Figura 152. Diagrama de Despliegue de Power BI ............................................................ 283
Figura 153. Arquitectura Lógica de Tableau Server .......................................................... 286
Figura 154. Arquitectura Física de Tableau Server ............................................................ 290
Figura 155. Diagrama de Componentes de Tableau Server ............................................... 292
Figura 156. Diagrama de Despliegue de Tableau Server ................................................... 297
Figura 157. Arquitectura Lógica de Qlik Sense Enterprise ................................................ 300
Figura 158. Arquitectura Física de Qlik Sense Enterprise ................................................. 303
Figura 159. Diagrama de Componentes de Qlik Sense Enterprise..................................... 305
Figura 160. Diagrama de Despliegue Qlik Sense Enterprise ............................................. 308
Figura 161. Dashboard – Ventas ........................................................................................ 310
Figura 162. Dashboard – Ventas Canales ........................................................................... 311
Figura 163. Dashboard - Productos .................................................................................... 311
Figura 164. Dashboard - Marketing ................................................................................... 312
Figura 165. Dashboard - Logística ..................................................................................... 312
Figura 166. Dashboard - Regiones ..................................................................................... 313
Figura 167. Proceso de Aplicación de los Lineamientos.................................................... 336
Figura 168. Caraterísticas ergonómicas.............................................................................. 340
17
Introducción
18
En el capítulo cinco se presenta la investigación de las cuarenta técnicas de Data
Visualization, y el proceso que se siguió para la elaboración de los lineamientos,
incluyendo el benchmarking de herramientas de Business Intelligence y Data Visualization,
la arquitectura de las herramientas evaluadas y finalmente las pruebas de concepto donde se
validan e implementan los lineamientos.
En el capítulo seis se presentan los Lineamientos de uso y diseño de las técnicas de Data
Visualization acompañados de un proceso propuesto para su óptima aplicación como
resultado del proyecto, y un roadmap de futuros proyectos como medida de continuidad.
En el capítulo siete se detalla la gestión del desarrollo del proyecto bajo los lineamientos
del PMBOK.
19
CAPITULO 1 Descripción del Proyecto
20
1.1 Objeto de Estudio
El sector que es objeto de estudio en el presente proyecto es el que abarca a todas
aquellas personas relacionadas al desarrollo y uso de soluciones de Data
Visualization. En el contexto actual, se tiene conocimiento de la existencia de las
técnicas de Data Visualization, pero estas sólo son consideradas simples gráficos
que contribuyen con la visualización de información, y no como un tipo de gráfico
estructurado que posee mejores prácticas, las cuales te indican como implementar
de manera óptima el tipo de técnica seleccionada teniendo en consideración
aspectos como diseño y funcionalidad, sin perder el enfoque de como representar la
data de un manera clara y ordenada1. A su vez, el proyecto también incluye el
estudio de las herramientas de Data Visualization, que son consideradas líderes en el
mercado.
Actualmente existen diversas técnicas que ayudan a mostrar la data en gráficas, que
permiten comprender y procesar la información2, no obstante, no sólo depende de la
utilización de dichos gráficos para una mayor comprensión de la data, la manera en
la que se muestra la información influye mucho en la percepción que logra tener el
usuario. Si al usuario se le dificulta comprender los gráficos que se le presenten,
elaborados con la data que él necesita para tomar decisiones sobre un punto
1
Cfr. SAS Institute Inc (2014)
2
Cfr. Kelleher, Wagener (2011)
21
relevante del negocio, no llegara al nivel de análisis esperado, lo que podría
ocasionar la toma de malas decisiones que afecten la estrategia del negocio.
Tomando esto en cuenta, el problema no necesariamente radica en el usuario, un
punto muy importante que influye es la decisión que se toma al elegir la técnica a
utilizar, con la cual se pueda explotar dichos gráficos y la información que
contienen. Se necesita que aquellos orientados al desarrollo y uso de soluciones de
Data Visualization, tengan conocimiento de las mejores prácticas de uso y diseño de
las técnicas para que, cuando las apliquen, se vea reflejado en el software y, como
consecuencia, se le brinde al usuario final no sólo un conjunto de gráficos como una
herramienta básica para su análisis, si no gráficos con una estructura que le permita
identificar lo que le sea relevante desde un plano general hasta el más específico.
En el siguiente cuadro se detalla el problema y sus causas.
Problema Causas
Dentro de la elaboración de
soluciones de Business Intelligence,
Utilizar técnicas de Data Visualization en una
el enfoque principal recae en el
herramienta software sin tomar en cuenta su
proceso de extracción,
propósito (para que sirven y como deben ser
transformación y carga de la data
usadas), impacta al usuario, ya que, al usar
dejando de lado la visualización
estas soluciones con funcionalidades básicas y
final.
no necesariamente bien aplicadas, limitan su
capacidad de análisis y de toma de decisiones,
Uso de las técnicas de Data
independientemente de que la data mostrada
Visualization enfocadas al diseño,
sea relevante para ser utilizada.
sin considerar el tipo de dato.
22
1.3 Planteamiento de la Solución
La solución que el proyecto plantea es la definición de lineamientos de uso y
diseño, que serán elaborados tomando en cuenta las mejores prácticas de las
técnicas de Data Visualization, y que posteriormente serán implementados a
través de pruebas de concepto en una herramienta software, con el fin de
brindarle a todos aquellos orientados al uso y desarrollo de soluciones de
Data Visualization, una base estructurada de cómo aplicar dichas prácticas,
garantizando a su vez que el usuario logre captar y asimilar visualmente lo
que se busca transmitir y que es relevante dentro de la organización en la que
se encuentra.
23
1.5 Indicadores de Éxito
Los indicadores de éxito definidos para medir el logro de cada uno de los
objetivos específicos previamente planteados, son los siguientes:
Indicador Objetivo
Indicador de Éxito
de éxito Específico
Aprobación, por parte del cliente y profesor Gerente, del OE1, OE2,
IE1
Project Charter del proyecto. OE3, OE4
24
detallaran los siguientes planes: Plan de Gestión de Alcance, Plan de Gestión
de Tiempo, Plan de Gestión de Recursos Humanos, Plan de Comunicaciones
y por último Plan de Gestión de Riesgos.
1.6.1 Alcance
El presente proyecto abarca la investigación, diseño y posterior
implementación de lineamientos orientados al uso y diseño de las
técnicas de Data Visualization, basados en las mejores prácticas y
aplicadas a soluciones de este rubro.
El alcance del proyecto está conformado por cuatro fases y se ha
contemplado para ser desarrollado en los ciclos académicos 2016-1 y
2016-2.
Para la primera fase, inicio del proyecto, se ha establecido el
siguiente entregable:
Project Charter
Diccionario EDT
Matriz de Comunicaciones
Matriz de Riesgos
Matriz RAM
25
Plan de Gestión de Riesgos
Registro de Interesados
Pruebas de concepto
Artículo de investigación
Lecciones aprendidas
26
Tabla 3 : Plan de Gestión del Tiempo
Fase del Fecha
Hito del proyecto Entregables incluidos Prioridad
Proyecto Estimada
Cronograma
Diccionario EDT
Descripción de Roles y
Responsabilidades
Registro de Interesados
Plan de Gestión del
Cronograma
Plan de Gestión de
Aprobación, por parte
Alcance
del cliente, de la
Planificación 07/04/2016 Plan de Gestión de Alta
planificación del
Comunicaciones
proyecto.
Matriz de Comunicaciones
Matriz de Riesgos
Matriz de Trazabilidad de
Requerimientos
Matriz RAM
Plan de Gestión de Calidad
Plan de Gestión de Riesgos
Plan de Gestión de RRHH
27
Fase del Fecha
Hito del proyecto Entregables incluidos Prioridad
Proyecto Estimada
28
Fase del Fecha
Hito del proyecto Entregables incluidos Prioridad
Proyecto Estimada
(Paper)
29
1.6.3 Plan de Gestión de Recursos Humanos
Este plan tiene como propósito identificar a todos los involucrados en
el proyecto, incluye a la organización, el equipo de trabajo y los
recursos internos o externos que contribuirán al cumplimiento de las
actividades. A su vez, se definen cuáles serán sus roles y
responsabilidades a lo largo del proyecto.
30
Comité de proyectos: Rol correspondiente al grupo conformado
por la Directora de la EISC y los coordinadores de las carreras de
ISI, ISW y CC, encargados de evaluar que el alumno cumpla con
los outcomes pertenecientes a su carrera. Con respecto a la
participación en el proyecto, el comité realizará las siguientes
funciones:
Aprobar proyectos profesionales.
31
Gerente Alumno Innova TI: Rol correspondiente al gerente
alumno de la empresa virtual Innova TI, Henry Paulett, encargado
de apoyar en el desarrollo y seguimiento de los proyectos; con
respecto a la participación en el proyecto. El gerente alumno
realizará las siguientes funciones:
Apoyar en el monitoreo y control de las actividades
programadas del proyecto.
32
aseguramiento de la calidad. Con respecto a la participación en el
proyecto, el analista de QA realizará las siguientes funciones:
Realizar tareas de validación y verificación que permitan
asegurar la calidad de los entregables del proyecto.
Ver el anexo:
Anexo 1- Plan de Gestión de Comunicaciones
33
criticidad de los mismos, y a su vez, plantear estrategias de
mitigación ante la posible materialización del riesgo.
La siguiente tabla detalla los riesgos identificados, su probabilidad y
su impacto en el proyecto.
Incumplimiento de las
actividades asignadas No asignar tareas críticas que cubran
5 a los recursos de las Media Medio más tiempo del que dispone el
empresas virtuales de recurso para el curso.
la EISC
34
herramientas que se herramientas open source, y en caso
ajusten al proyecto se requiera, optar por la adquisición
de alguna herramienta paga.
Nota. Elaboración propia
Para mayor detalle, revisar: Anexo 2- Matriz de Riesgos.
35
CAPÍTULO 2 Logros por student
outcomes
Este capítulo tiene por objetivo describir los logros alcanzados a lo largo del
proyecto a través de los Student Outcomes de la Comisión de Ingeniería y de la
Comisión de Computación, de ABET.
36
2.1 Student Outcomes
Los student outcomes son competencias que se evalúan en un Ingeniero de Sistemas
de Información de la Universidad Peruana de Ciencias Aplicadas.
Estos outcomes, son evaluados por una de las más reconocidas e importantes
acreditadoras a nivel mundial, ABET, la cual cuenta con doce outcomes para la
carrera de Sistemas de Información, entre ellas se encuentra la Engineering
Accreditation Commission (EAC), la cual se enfoca en los estándares en ingeniería
y, por otra parte, la Computing Accreditation Commision (CAC) que se enfoca en el
cumplimiento de los estándares que debe alcanzar un ingeniero a nivel de
conocimientos en computación.
En los siguientes puntos a desarrollarse, se detalla cómo se logró el cumplimiento
de cada uno de dichos outcomes en el transcurso de este proyecto, comenzando por
los 11 Student Outcomes EAC (a-k) y finalmente con el Student Outcome CAC (j)
que determina la continuidad del proyecto.
37
En relación a las ciencias y matemáticas, en el Benchmarking de
herramientas de Data Visualization, se elaboró un TCO3 para cada una de las
herramientas que estaban siendo analizadas, los resultados se muestran en las
tablas 5, 6 y 7.
3
Total Cost of Ownership. Análisis que cubre todos los costos por los que se puede incurrir al adquirir un software durante su ciclo de
vida.
38
Personal administrador 174000 174000 174000
Total 185574.65 180923.6 180923.6
Nota. Elaboración propia
39
Figura 2. Arquitectura Lógica de Power BI
Nota. Elaboración propia
40
Figura 4. Diagrama de despliegue de Power BI
Nota. Elaboración propia
41
2.2.2 Student Outcome B
Descripción:
42
Nota. Elaboración propia
43
Figura 8. Lineamientos de uso y diseño por enfoque de Comparación
Nota. Elaboración propia
44
Figura 9. Lineamientos de uso y diseño por enfoque de Composición
Nota. Elaboración propia
45
Figura 10. Lineamientos de uso y diseño por enfoque de Tendencia
Nota. Elaboración propia
46
Figura 12. Lineamientos de uso y diseño por enfoque de Relación
Nota. Elaboración propia
47
Figura 13. Lineamientos de uso y diseño por enfoque de Distribución
Nota. Elaboración propia
48
Figura 15. Base de Datos Contoso – Pruebas de Concepto
Nota. Elaboración propia
49
Figura 17. Prueba de Concepto
Nota. Elaboración propia
50
Figura 18. Lineamientos de uso y diseño
Nota. Elaboración propia
51
Figura 19. Tabla de precios y ediciones de las herramientas de Data Visualization
Nota. Elaboración propia
52
documentación de las herramientas evaluadas (Power BI, Tableau, Qlik
Sense), permitiéndonos del mismo modo corroborar las arquitecturas
elaboradas, los cuales muestran el funcionamiento de dichas herramientas.
Asimismo, para la elaboración de las pruebas de concepto se realzaron KPI’s
los cuales también fueron revisados por el especialista a fin de mostrar
indicadores que realmente sean usados en el mundo laboral actualmente.
53
Figura 21. Arquitectura Lógica de Tableau Server
Nota. Elaboración propia
54
Es por dicha problemática que el proyecto establece objetivos que deberán
ser cumplidos a través de indicadores de éxito, los cuales buscan ayudar a
solucionar la problemática identificada y así aportar valor a la sociedad.
Todos los puntos antes mencionados, problemática y propuesta de solución,
están plasmados en diversos entregables del proyecto, tales como: Project
Charter, Memoria y Perfil del Proyecto.
55
elaboró los lineamientos de uso y diseño, benchmarking y pruebas de concepto,
además de conseguir la aprobación de nuestro asesor, se tomó en consideración
las observaciones y recomendaciones de otros especialistas que se encuentren
relacionados a Data Visualization a nivel de las técnicas como de las
herramientas, siendo ellos los expertos en dichos campos y que pueden revisar de
una forma más detallada el aporte y trabajo realizado. Por otro lado, otros
principios aplicados, son aquellos relacionados con el juicio y producto. Al
elaborar el benchmarking se evaluaron las herramientas con objetividad tomando
como refuerzo y base el cuadrante mágico de Gardner para determinar las
herramientas a considerar y luego la documentación respectiva de cada una de
ellas siendo siempre de las páginas oficiales.
56
Figura 24. Benchmarking de herramientas de Data Visualization
Nota. Elaboración propia
57
de los entregables y anexos que se elaboraron para cumplir a cabalidad los
objetivos.
En segundo lugar, el artículo académico de nuestro proyecto enfocado a los
lineamientos de uso y diseño, elaborado con la asesoría del profesor David
Mauricio, el cual sigue estándares y formatos definidos por un Congreso
Internacional.
58
Figura 26. Articulo académico del proyecto DATAVIZ
Nota. Elaboración propia
59
tomó como referencia el Cuadrante Mágico de Gardner de Business
Intelligence y Analytics, el cual evalúa diferentes herramientas de empresas
a nivel mundial. Por otro lado, en cuanto el aspecto económico, uno de los
criterios de evaluación fue los precios por ediciones de las tres herramientas
consideradas (Power BI, Tableau y Qlik Sense). Finalmente, en el aspecto
sociedad, otro criterio que se tomó en cuenta dentro de la evaluación fue un
TCO (Total Cost Ownership), el cual permite conocer todos los costos que
implica hacer uso de dichas herramientas en un entorno de negocio.
60
Figura 28. Benchmarking de herramientas de Data Visualization
Nota. Elaboración propia
61
Figura 29. Project Charter del proyecto DATAVIZ
Nota. Elaboración propia
Diccionario EDT
Lecciones aprendidas
Matriz de Riesgos
Matriz RAM
62
Plan de Gestión de RRHH
Registro de Interesados
Figura 30. Cuadrante Mágico de Gartner Business Intelligence y Analytics Platorms 2016
Nota. Recuperado de Gartner Inc., 2016
TCO
63
Cantidad de técnicas soportadas
Customización
Seguridad
64
Figura 32. Tabla de precios y ediciones de las herramientas de Data Visualization
Nota. Elaboración propia
65
Figura 33. Tabla de descripción de herramientas
Nota. Elaboración propia
66
Figura 34. Tabla de técnicas de Data Visualization vs Herramientas
Nota. Elaboración propia
67
Intelligence y es por ello que este proyecto muestra los resultados de un
análisis de lo que puede ofrecer Data Visualization, reflejado por la parte de
las técnicas en los Lineamientos de Uso y Diseño y por el lado de las
herramientas en el Benchmarking.
68
Power BI
Tableau Desktop
Qlik Sense Desktop
SQL Server 2014
SQL Server 2016
Microsoft Office 2016 (Word, Excel, Power Point, Project, Visio)
SAP Power Designer
Etc.
Toda la documentación acerca del uso, pruebas e investigación de las
herramientas anteriormente listadas se encuentra en los siguientes
entregables: Benchmarking de herramientas, guías de instalación y
documento de pruebas funcionales.
69
Figura 37. Documento de pruebas funcionales de la herramienta de Power BI
Nota. Elaboración propia
70
2.3 Acreditación CAC (Computing Accreditation
Commission of ABET)
A continuación, se explica de manera detallada a través de qué entregables y/o
actividades se ha logrado cumplir con lo establecido en el Student Outcome J de la
Acreditación CAC, criterio específico de la carrera de Ingeniería de Sistemas de
Información.
71
vistas en este proyecto pueden soportar dicha tendencia y a su vez abrir paso
hacia otros tipos de visualización además de la ya vista.
72
CAPÍTULO 3 Marco Teórico
73
3.1 Data Visualization
De acuerdo con Vitaly Friedman (2008), editor de la revista Smashing,
especializada para diseñadores y desarrolladores, el principal objetivo de
Data Visualization es transmitir de forma clara y efectiva información a
través de representaciones gráficas, esto implica que no necesita ser
funcionalmente aburrido o extremadamente sofisticado para que sea
agradable a la vista. Para lograr transmitir lo que se desea al usuario, se
necesita que vaya relacionada la forma estética como funcional, de esta
manera se podrá llegar a comunicar los puntos importantes de la información
de forma intuitiva. No obstante, diseñadores tienden a fallar al momento de
balancear estos dos aspectos, pues crean espectaculares gráficos, pero fallan
en el propósito final, comunicar la información4.
Data Visualization se debe enfocar desde la perspectiva del usuario, que
recibe la información. Si sólo se presentan resultados analíticos en una hoja,
este enfoque podría fallar al momento de comunicar la información y su
comportamiento5.
4
Cfr. Friedman (2008)
5
Polyvista
74
Figura 41. Ejemplo de Data Visualization
Nota. Recuperado de Visualizing Data, 2010
75
Figura 43. Ejemplo de Data Visualization
Nota. Recuperado de FlowingData, 2016
3.2.1 Concepto
De acuerdo con la Real Academia Española, una técnica, es definida como
un conjunto de procedimientos y recursos6. Esta idea aplicada al concepto de
Data Visualization, puede ser descrita como el conjunto de procedimientos y
recursos que permiten mostrar la información de diferentes perspectivas a
través de la elaboración de gráficos.
Existen diversas técnicas que hoy en día se utilizan, cada una de ellas tienen
diferentes aspectos que sirven para analizar distintos valores y hasta qué
6
Cfr. RAE (2014)
76
punto pueden ser utilizados, evitando caer en una sobrecarga de información
que, como consecuencia, dificulta el análisis del usuario.
Tomando como referencia base The Data Visualization Catalogue (2016), a
continuación, se pasará a listar y describir brevemente algunas técnicas de
Data Visualization que serán consideradas para la elaboración de este
proyecto.
1. Gráfico Marimekko (Marimekko Chart)
Posee dos ejes, (X e Y) en los cuales se distinguen dos gráficos
apilados hasta el 100%, todas las barras son de igual longitud y
son divididos en segmentos. Cada eje representa una variable con
una escala que determinan la longitud y ancho de cada segmento.
Esto hace posible detectar la relación entre categorías y
subcategorías (si es que existen) a través de las dos variables.
77
Es una técnica que permite detectar patrones espaciales o la
distribución de data sobre un espacio geográfico. Consiste en
distribuir puntos del mismo tamaño en un espacio geográfico.
7
Cfr. Sawada (2002)
78
9. Gráficos de área (Area Graphs)
Los gráficos de área son una variación de los gráficos de líneas, ya
que el área por debajo de la línea se rellena con un determinado
color o textura.
79
15. Gráfico de anillos (Donut Chart)
Esta técnica guarda la esencia de un gráfico de pie con la
diferencia de no contar con la parte central de este.
80
21. Pictograma (Pictogram Chart)
Una de sus principales características es que utiliza íconos para
poder dar una vista más participativa de pequeños sets y data
discreta.
81
extremos, mínimo y máximo, no se especifica los valores
intermedios.
29. Gráfico de Tallo y Hoja (Stem and Leaf plot/ Stemplot/ Setm &
Leaf Display)
Es una técnica que permite organizar data tomando en cuenta su
lugar de valor para mostrar su distribución.
82
35. Histograma (Histogram)
Un histograma muestra la distribución de datos a través de un
período de tiempo de intervalo.
36. Pirámide de población (Population Pyramid)
Esta técnica también conocida como pirámide de edad y sexo es
un estilo espalda con espalda, conformado por un par de
histogramas (para cada sexo) que muestra la distribución de la
población en todos los grupos de edad y en ambos sexos.
83
Por ejemplo, un caso que represente este tipo de lineamientos es el siguiente:
“Utiliza líneas cuando se quiera conectar data secuencial en gráficos de
series de tiempo” (Kelleher y Wagener, 2011).
En este caso explícitamente el lineamiento indica cuando debe ser utilizado y
sobre que técnica.
Otra directriz mencionada es la siguiente: “Enfócate en visualizar patrones o
detalles dependiendo el propósito del gráfico” (Kelleher y Wagener, 2011).
En este caso, dicha directriz nos guía a considerar dos escenarios: en caso lo
que queramos es identificar patrones, elegir el tipo de técnica que ayude a
lograr esa tarea y los valores que sean relevantes para la visualización o en
caso si se quiere ver los detalles elegir las técnicas más convenientes para
ello. Con esta directriz nos abre la posibilidad de analizar el tipo de técnica a
utilizar dependiendo el uso que le vaya a dar.
84
finalidad de poder distinguir y apoyar el propósito del gráfico, sobre todo
dependiendo el tipo de data a mostrar, ya sea cuantitativa o categórica.
3.4.1 Concepto
Según The Data Warehouse Institute (TDWI), Business Intelligence se
define como la unión de datos, tecnología, análisis y conocimiento humano
para optimizar las decisiones del negocio y conducir al éxito de la empresa.
Gartner lo define como:
"Business intelligence (BI) is an umbrella term that includes the
applications, infrastructure and tools, and best practices that enable
access to and analysis of information to improve and optimize
decisions and performance." (Gartner, 2016)
Asimismo, otros autores lo definen como:
85
“Business intelligence (BI) is the process of transforming raw data
into useful information for more effective strategic, operational
insights and decision-making purposes so that it yields real business
benefits.” (Lian & Li, 2012)
Desde distintos enfoques, los autores convergen en una misma idea, afirman
que el propósito de Business Intelligence es convertir datos en información
valiosa que permita y colabore en la toma de decisiones en beneficio del
negocio, brindándole así una ventaja estratégica frente a sus competidores.
Dentro de los principales productos de Business Intelligence están incluidos
los Cuadros de Mando Integrales (CMI) también conocidos como Balanced
Scorecard o dashboards, las cuales son herramientas de control empresarial
que permiten establecer y monitorear los objetivos de una empresa a través
de indicadores. Aquí reside la relación entre Data Visualization y Business
Intelligence, puesto que estos dashboards buscan expresar la información a
través de manera gráfica, haciendo uso de las técnicas de Data Visualization.
3.5.1 Metodologías
8
Cfr. About Gartner (2016)
86
Gartner Inc. desarrolló nueve metodologías de investigación propias,
basadas en sus años de experiencia y en los avances de la tecnología. El
éxito de sus metodologías radica en la visión clara y precisa que les brindan
a sus clientes del estado de su negocio y que les permite a los mismos
establecer planes y estrategias, así como tomar decisiones con mayor nivel
de confianza9. Las nueve metodologías son:
Magic Quadrant
Critical Capabilities
Hype Cycle
IT Market Clock
Market Guide
Vendor Rating
ITScore
Market Share
Market Forecast
9
Cfr. Research Methodologies (2016)
10
Es el proceso continuo de medir productos, servicios y prácticas contra los competidores más duros o
aquellas compañías reconocidas como líderes en la industria. (Kearns 1979)
87
evidencia de manera gráfica la situación del mercado en un momento
determinado para un producto tecnológico en específico.11 A su vez
proporciona el posicionamiento competitivo de los principales proveedores
de dicho producto, generándose así puntos de referencia para los clientes de
aquellos proveedores mejores valorados. Es utilizado como primer paso para
elegir un proveedor y evaluar las oportunidades y amenazas de incurrir en
una inversión para el negocio.
Este Cuadrante posee dos ejes, el eje X llamado Completeness of visión
(Integridad de visión), representa el conocimiento de los proveedores para
aprovechar el momento actual del mercado para generar valor a sus clientes
y para ellos mismos. Asimismo, el eje Y, llamado Ability to execute
(Capacidad de Ejecución), está orientado a medir la habilidad de los
proveedores ante cambios en las tendencias del mercado, es decir, la agilidad
con la que se adapta a nuevas situaciones. En esta categoría también se
analizan las características propias del producto.
Según lo mencionado por Gartner Inc. (2016) el cuadrante está dividido en
cuatro grandes grupos: Leaders, Visionaries, Niche Players y Challengers.
11
Cfr. Research Methodologies (2016)
88
Figura 44. Cuadrante de Gartner
Nota. Recuperado de Gartner Inc., 2016
89
no llegan a obtener suficientes puntos en ninguno de los dos ejes ya antes
mencionados, suelen ser proveedores nuevos en el mercado, y debido a esto
sus canales de distribución y clientes son limitados.
90
CAPÍTULO 4 Estado del Arte
91
4.1 Revisión de la Literatura
Con el propósito de abarcar diferentes aspectos relacionados a Data
Visualization se ha recopilado un conjunto de papers relevantes para la
elaboración de este proyecto. Para ello, se han agrupado de acuerdo a la
similitud de los temas y a partir de ahí el desarrollo de cada uno. El primer
grupo, llamado Técnicas de Data Visualization, abarca los papers
relacionados al uso de diferentes técnicas considerando en qué momento
utilizarlas, por ejemplo “Técnicas de Visualización orientadas a la
presentación” establece una marcada diferencia entre dos tipos de técnicas,
por un lado, las técnicas orientadas a la presentación y por el otro las
orientadas al análisis (Kozara, 2016). Por otro lado, en “Lecciones
aprendidas del diseño de los tableros de visualización”, se toca este tema
desde otra perspectiva, ya que se discuten las lecciones aprendidas
resultantes de proyectos de diseño de aplicaciones para pequeñas empresas y
startups. (Froese & Tory, 2016) A partir de ello hace mención de las
diferentes técnicas utilizadas de acuerdo al caso implementado.
El Paper “Contar Historias Con Visualización de Datos” se enfoca en cómo
poder hacer uso de las técnicas de Data Visualization para narrar la
información que se obtiene de la data procesada y lograr que el usuario
pueda entenderlo (Rodríguez, Nunes, & Devezas, 2015). Otro trabajo es el
de “Datos, métodos de visualización de la información y mecanismos
interactivos: Encuesta”, donde el principal propósito de los autores es
investigar acerca de la visualización, las etapas del proceso de visualización,
cuales son los retos a enfrentar y la categorización de sus técnicas,
centrándose específicamente en las técnicas de Data Visualization (Khan &
Shah Khan, 2011).
El ultimo paper que se incluye en el presente trabajo con respecto a las
técnicas de Data Visualization es el de “Diez Directrices Para Una Efectiva
Visualización de Data en Publicaciones Científicas”, en el cual, la
motivación de los autores se basa en poder ayudar a disminuir esa dificultad
que se tiene al momento de procesar información científica proponiendo
92
diez directrices a considerar como medida correctiva (Kelleher & Waneger,
2011).
En el segundo grupo, llamado Framework de estrategias de diseño, se
encuentra los papers relacionados a las consideraciones a tomar durante la
fase de diseño. Esta sección se enfocará en todos aquellos papers
relacionados a marcos de trabajos, guías de referencias, pautas estructuradas
que aborden este tipo de información. Un ejemplo de ello es el trabajo
“Generación y exploración de diseño basada en visualizaciones
preestablecidas”, en el cual el propósito del autor es poder mostrar y crear
una nueva forma de generar representaciones visuales, proponiendo una
forma de construir nuevos diseños de visualización, juntando un número de
representaciones visuales existentes llamados presets. (Schulz & Hadlak,
2015).
Finalmente, en el tercer grupo, Modelos y métodos según los tipos de datos,
se abarcará todos aquellos trabajos relacionados a modelos o métodos que
permitan identificar de acuerdo al tipo de dato a trabajar cual es la técnica
más conveniente que pueda permitir una eficiente visualización. En esta
sección se presenta el paper “Visualización de Datos en Ciencias Políticas y
Sociales”, cuyo propósito es poder mostrar y crear una nueva forma de
generar representaciones visuales, proponiendo una forma de construir
nuevos diseños de visualización y juntando un número de representaciones
visuales existentes llamados presets. (Zinovyev, 2010).
93
4.2 Casos de estudio de Data Visualization
A continuación, se presenta el estado del arte de una serie de artículos
relacionados a Data Visualization, se detalla la motivación y los aportes de
los autores que brindan diversos enfoques relacionados a temas en
específico. Para permitir una mayor comprensión de estos temas, los
artículos están subdividos en tres tópicos: Técnicas de Data Visualization,
Framework de estrategias de diseño y Modelos y métodos según los tipos de
datos.
94
Técnicas de análisis Técnicas de Presentación
Suelen utilizarse siempre las mismas Tipo de técnicas que poseen formas
técnicas pues se tiene la certeza de memorables, o que incluyen iconos
que estas siempre funcionan. en la presentación de los datos.
Como sostiene Kozara (2016), en primer lugar, se debe tener en cuenta las
expectativas que se tienen con respecto a la relación entre la presentación de
los datos y como son comunicados a través de estas técnicas. En el análisis,
se tiende a utilizar las mismas técnicas porque se tiene certeza de que casi
siempre funcionan. Los gráficos de barras, diagramas de dispersión, etc., son
excelentes herramientas para tal fin, pero la presentación de nuevos y
95
diferentes datos con las mismas técnicas no lograra tener en el usuario una
impresión duradera.
Lograr que el usuario posea recuerdos de un tipo de gráfico en específico,
está relacionado con los objetivos de las técnicas de presentación. Las
técnicas más inusuales que crean formas memorables, o que incluyan el uso
de iconos para representar los datos, serán más fácil de recordar. A
diferencia con las técnicas de presentación, para las de análisis no es
relevante que el usuario recuerde un gráfico en especial, este tipo de técnicas
se enfocan en el contenido que se muestra, es decir, en la opinión final con la
que se queda el usuario luego de haber visualizado un gráfico.
Un punto en común en el que convergen estas técnicas, es que ambas buscan
que la audiencia frente a la cual están expuestas preste atención a lo que se
muestra, para esto se debe buscar un punto de equilibrio entre lo relevante y
atractivo en un gráfico. La facilidad de aprendizaje también es parte de esto,
especialmente para las técnicas inusuales. Si la forma en que funciona la
visualización no puede ser captada rápidamente, los posibles espectadores se
sentirán frustrados.12
A continuación, Kozara (2016) menciona una serie de técnicas de
presentación, resaltando sus características y beneficios.
En primer lugar, se hace mención del System of Typographic Picture
Education (ISOTYPE)13, creada en 1930 por Otto y Marie Neurath con el
principal fin de comunicar conocimiento a través de los datos. Lo resaltante
de este sistema en relación a la visualización, son las unit charts o como su
traducción lo indica, cuadro de unidades, donde se apilan objetos en la parte
superior o al lado de otro objeto representando cantidades. Lo beneficioso de
este tipo de gráficos es en primer lugar, que, al utilizar objetos, estos son
reconocibles, es decir, son fáciles y entendibles para el usuario. Si bien se
resalta que este tipo de gráfico es visualmente atractivo y fácil de leer, su uso
para el análisis no es recomendado.
12
Cfr. Kozara (2016)
13
También conocida como Isotipo por su traducción al español.
96
En segundo lugar, se hace referencia a The Connected Scatterplot o
Diagrama de dispersión conectado. Es una técnica sencilla en su núcleo,
pero puede ser visualmente interesante y eficaz. Como su nombre lo sugiere,
la técnica consiste en un diagrama de dispersión con los puntos conectados
en una secuencia. El atractivo de este tipo de grafico reside en la forma en la
que invita al usuario a que preste un poco más de atención a los detalles de
lo que se muestra. Recientes estudios arrojaron que los usuarios fueron
capaces de leer y entender las tablas con facilidad. Dicho esto, la técnica a
menudo falla, debido a la gran cantidad de información o al gran número de
líneas que se cruzan unas con otras, generando confusión.
Se concluye con la idea de que la creación de nuevos tipos de
visualizaciones no siempre trae consigo resultados positivos, pero que aun
así el experimento de crearlo sigue aportando valor. Se debe a su vez
prestarle una mayor importancia al factor de presentación y equilibrarlo con
el análisis y exploración de datos.
El autor brinda como recomendación el desarrollo de nuevas herramientas y
criterios para lograr comprender este tipo de técnicas y cuáles serían sus
casos de uso, lograr entender el cómo y cuándo funciona aplicarlas y cuando
no, de esta forma, aquellas personas interesadas en utilizarlas o
implementarlas, tendrían una serie de criterios bajo los cuales regirse para la
presentación de sus datos, esto a su vez sería un valioso aporte al campo de
la visualización.
14
Cfr. Froese & Tory (2016)
97
En el presente artículo, las autoras Maria-Elena Froese y Melanie Tory,
discuten las lecciones aprendidas resultantes de proyectos de diseño de
aplicaciones para pequeñas empresas y startups.
Youneeq
Lecciones aprendidas del diseño de los tableros de visualización
Trusterra Technologies
Empresas involucradas
Tutela Technologies
Lecciones aprendidas
Dificultad al elegir el tipo de gráfico más
eficaz.
98
Tal como lo mencionan, cada uno de los proyectos de diseño empieza con
una vaga descripción de las necesidades y requisitos propios de la empresa,
que deberían estar plasmados en la solución, a partir de esto se plantearon
una serie de soluciones propuestas en estrecha colaboración con los key
users de las empresas.
El proceso incluyó la recopilación y documentación de los requisitos, la
creación de wireframes15 estáticos, que se fueron mejorando de forma
iterativa con los comentarios de los key users, la implementación de
prototipos funcionales y por último, la realización de las pruebas de
usabilidad.
Se expone los casos de Youneeq, compañía que ofrece un motor de
recomendación para los editores de medios en línea; Trusterra Technologies,
compañía que creó una plataforma para la documentación de los eventos de
seguridad; Tutela Technologies, empresa preocupada por el rendimiento de
la red de telecomunicaciones; y Ocean Networks Canada (ONC), una
compañía sin ánimo de lucro, que recoge y analiza el océano y los datos
sísmicos.16
El primer caso es acerca de la empresa Youneeq, la cual tenía como
principal necesidad un dashboard o panel de control donde se mostrarán
todos los datos del monitoreo que realizaba sobre el tráfico de los sitios web
de sus clientes, estos datos expresados mediante indicadores de rendimiento
(KPI's). Se incluyeron diversos tipos de técnicas tales como histogramas,
diagramas de flujos interactivos y mapas de calor.
15
También llamados prototipos. Son bocetos donde se representa visualmente la estructura de una página
web. En este caso, la estructura del dashboard a desarrollarse. (Cfr. Centelles, 2015)
16
Cfr. Froese & Tory (2016)
99
Figura 47. Visualizaciones del dashboard de Youneeq
Nota. Recuperado de IEEE Computer Society (2016)
100
El segundo caso es de Trusterra, empresa que desarrolla un sistema de
seguimiento que es utilizado por sus clientes para reportar las inspecciones
de seguridad en el lugar de trabajo. Los datos recogidos se utilizan para
identificar problemas y poder idear acciones correctivas o preventivas. El
principio de diseño para este tablero era permitir que los usuarios se
centrarán solo en la elección de los datos que querían ver. Se definieron
reglas para que el sistema sólo permitiera mostrar gráficos que eran
apropiadas para los datos seleccionados. Por ejemplo, se permite un
histograma sólo cuando los datos se componen de un elemento numérico.
Una tabla está recomendada cuando se tiene dos cuadros de selección con
varios artículos. Cuando el usuario selecciona un máximo de cinco medidas,
se recomienda una línea de tiempo. Para cubrir todos los casos posibles, se
creó una extensa lista de reglas de gráficos.17
El cuarto y último caso es en relación a ONC, empresa que opera una red de
sensores para detectar eventos sísmicos, tanto en tierra como bajo la
superficie del océano. Ellos tenían como necesidad un panel de control para
mostrar cuándo y dónde sus sensores habían detectado eventos sísmicos. Se
incluyó en su tablero un mapa con la ubicación geográfica de los terremotos;
una tabla con la magnitud del terremoto, los datos, y la ubicación.
Se concluye mencionando los puntos por mejorar o que presentaron
dificultades durante el desarrollo de estos proyectos, entre los puntos más
críticos el proceso de diseño.
Durante el desarrollo de los proyectos, se pudo evidenciar que cada empresa
en particular poseía un nivel de complejidad en relación al diseño de las
visualizaciones a incluir en los paneles. Un caso frecuente que se presentaba
era que se establecía una idea de cómo sería el diseño retratado en
wireframes estáticos, pero al momento de interactuar con los datos reales se
presentaban problemas o no se obtenía el resultado deseado, como
17
Cfr. Froese & Tory (2016)
101
consecuencia, la etapa de diseño se alargaba ya que se realizaban
modificaciones en los diseños iniciales.
Aunque se encontró que era fácil para los usuarios elegir qué KPI querían
explorar, elegir el tipo más eficaz de gráfico era lo dificultoso.
Investigaciones anteriores habían demostrado que los usuarios a menudo
eligen los gráficos con los que ya están familiarizados, y se señaló de
manera similar una petición frecuente para los gráficos circulares.18
Para lograr la selección de visualizaciones adecuadas durante el proceso de
diseño, se incluyó a diseñadores de visualizaciones, personal dedicado a
escoger y diseñar el mejor tipo de visualización de acuerdo a las necesidades
del cliente, los cuales se encargaron de crear prototipos que interactuaban
con la data real. Se hizo uso de herramientas de software tales como
Tableau, R o Matlab.
La comunidad de visualización19 ha desarrollado una gran cantidad de
conocimientos de diseño, juegos de herramientas y técnicas para la
construcción de herramientas de visualización interactiva. Sin embargo, para
los profesionales de la analítica visual, es importante conocer no sólo las
últimas técnicas de visualización, sino también los retos a los que se pueden
encontrar durante el proceso de diseño y la implementación de una
herramienta de análisis visual.
18
Cfr. Froese & Tory (2016)
19
Las autoras hacen referencia a todos aquellos profesionales que han brindado sus aportes al tema de
visualización de la información.
102
una investigación más profunda de los conceptos de data visualization
relacionados a la narrativa.
Mostrar Modelo
Detectar
el Ajuste de ajuste
patrón
panorama mental
Figura 48. Propuesta para proveer una visión del uso de la visualización de
información
Nota. Elaboración propia
103
visualización de la información, estadística, minería de datos y cartografía
pueden juntarse como un enfoque unificado para el manejo efectivo de data
compleja.
Del mismo modo, otro sustento mostrado es el de Colin Ware (2013),
renombrado experto en el campo de la psicología de percepciones, el cual
habla del importante rol que tiene la visualización en los sistemas
cognitivos, comentando que el término visualización se ha vuelto más que
sólo una simple imagen de algo en la mente, sino un artefacto externo que
ayuda a la toma de decisiones.
Proveer una visión es considerado como el principal objetivo al momento de
utilizar la visualización de la información, pero es importante entender de
qué trata. La propuesta consiste en cuatro fases:
1. Mostrar el panorama: Permite a la persona comprender a groso modo
de qué trata el conjunto de datos, permitiéndole entender la
información conocida y no conocida.
2. Ajuste: Consiste en la exploración del conjunto de datos ajustando el
nivel de abstracción, permitiendo a la persona cambiar de perspectiva
con respecto a la data.20
3. Detectar patrón: En esta etapa la persona normalmente encuentra lo
que estaba buscando y gana nuevo conocimiento encontrando
tendencias, frecuencias y estructuras en el conjunto de datos.
4. Modelo de ajuste mental: es una metáfora para hacer referencia a que
las personas pueden hacer un match de la representación visual con
el modelo mental del conjunto de datos.
Como siguiente punto, los autores muestran con algunos ejemplos cómo
haciendo uso de Data Visualization se puede llegar a contar un evento. Para
esto muestra un ejemplo en la que se fusiona la narrativa con la
visualización, el proyecto Gapminder. Es un tipo de visualización de
20
Cfr. Rodriguez, Nunes y Devezas (2015)
104
información que fue creado con la finalidad de mostrar y explicar ciertos
eventos a través de la historia. (Ejemplo mostrado en la ilustración 1)
105
Composición de la historia desde el análisis que se hizo después de la
visualización.
21
Cfr. Rodriguez, Nunes y Devezas (2015)
106
Bajo esta premisa, la motivación de los autores es investigar acerca de la
visualización, las etapas del proceso de visualización, cuales son los retos a
enfrentar y la categorización de sus técnicas, centrándose específicamente en
las técnicas de Data Visualization.
Los autores en primer lugar buscan establecer el significado de que es
visualización, y lo definen como una representación gráfica que transmite las
ideas complicadas de manera clara, precisa y eficiente, es decir, estas
representaciones son fáciles de entender e interpretar. A su vez, establecen
que el objetivo principal de la visualización es analizar, explorar, descubrir,
ilustrar y comunicar información en forma totalmente comprensible.
Para el proceso de visualización, los autores se basan en trabajos previos
para presentar y describir brevemente los seis pasos de este proceso.
1. Primer paso: Mapeo, como se transformarán los datos o la
información en formas graficas bajo determinadas características
visuales.
2. Segundo paso: Selección, hace referencia a la selección de la
información necesaria según el propósito del gráfico. Es el paso más
importante del proceso, una mala elección de la información a incluir
podría conllevar a malas decisiones por parte del usuario.
3. Tercer paso: Presentación, como organizar la información en el
espacio disponible de manera efectiva.
4. Cuarto paso: Interactividad, incluye las facilidades que tendrá la
visualización para ser explorada, de esta forma, el usuario podrá
comprender e interpretar mejor la información.
5. Quinto paso: Factor Humano, abarca la facilidad de uso y los
factores de accesibilidad de la visualización.
6. Sexto paso: Evaluación, el último paso es evaluar la visualización
creada, si esta es eficaz o no y si cumple el propósito para el que fue
creada.
107
Paso 1: Mapeo
Paso 2: Selección
Paso 3: Presentación
Proceso de
Visualización
Paso 4: Interactividad
Gráfico de barras
Histograma
Técnicas descritas
Gráfico de Líneas
Gráfico de Áreas
Diagrama de Dispersión
Diagrama de burbujas
108
Con respecto a los desafíos de la visualización22, se establecen puntos
críticos a tener en cuenta, tales como la usabilidad, donde debe haber un
equilibro entre eficiencia y la facilidad de usar; la comprensión de las tareas
perceptivo-cognitivas que está relacionada a la capacidad de percepción de
los humanos; el conocimiento previo que una persona debe tener antes de
utilizar una técnica; la educación y formación que se requiere y deben tener
todos los profesionales relacionados a la rama de la visualización y por
último, la escalabilidad del gráfico es uno de la más grandes desafíos,
especialmente ante la presencia de los dispositivos móviles y sus pantallas
de menor dimensión.23
En relación a Data Visualization, se define como el estudio de la
representación de los datos de una forma sistemática, incluyendo atributos y
variables para la unidad de información (Khan & Shah Khan, 2011), en otras
palabras, representa los datos de tal forma que simplifica la interpretación de
los mismos y su relación.
A continuación, se presentan las técnicas de Data Visualization que el
presente artículo abarca y se hace una breve descripción del aporte de los
autores con respecto a cada una de las técnicas.
Tabla
Es la técnica de representación de datos más simple, fácil de entender
e interpretar. Tabla es un formato estructurado, organizado por filas y
columnas que transmiten las relaciones. La tabla cumple el papel
principal en la investigación y análisis de datos.
Diagrama de Pie
También llamado diagrama circular, está dividido en un número de
sectores, donde se agrupan datos que poseen características comunes,
cada uno describe una proporción de la cantidad total. La
visualización de este gráfico es eficaz si comparamos un segmento
22
Estos desafíos agrupan problemas desde la perspectiva del usuario y desafíos técnicos.
23
Cfr. Khan & Shah Khan (2011)
109
con el resto de segmentos que conforma el pie, pero es difícil
comparar diferentes diagramas de pie entre sí.
Gráfico de barras
Una de las técnicas de Data Visualization más comunes. Es
comúnmente usado para representar datos discretos, pero no
continuos y posee variaciones, es decir, es representado tanto de
manera vertical como horizontal. El uso de colores en las barras
ayuda a que estas sean más visibles y comprensibles.
Histograma
Técnica de vital importancia en el campo de la estadística y análisis
de datos, fue por primera vez presentada por Karl Pearson, representa
la distribución de datos continuos.
Gráfico de Líneas
Representación visual usualmente usada para mostrar información en
puntos de datos conectados entre sí a través de una línea continua o
recta. Es una extensión del Diagrama de Dispersión. El gráfico de
líneas a menudo se utiliza para visualizar una tendencia en los datos a
través de un intervalo de tiempo, es decir, es utilizado para ilustrar el
comportamiento de un conjunto de datos con el paso del tiempo o
durante un intervalo de tiempo específico.
Gráfico de Áreas
Es utilizado para representar datos cuantitativos en un área
delimitada. Dicha área delimitada está basada en el gráfico de líneas,
anteriormente mencionado. Una vez generada la línea en el Gráfico
de líneas, el área de abajo resultante es sombreada con colores o
diferentes texturas.
Diagrama de Dispersión
Es la visualización gráfica de un conjunto de datos en coordenadas
cartesianas, se muestra la relación entre dos variables, una variable
representa la distancia horizontal y la segunda variable la distancia
vertical del punto de datos desde el eje de coordenadas. Es de utilidad
110
para determinar la tendencia en los datos e identificar valores
atípicos.24
Diagrama de burbujas
Se definen tres parámetros numéricos diferentes para este gráfico, un
valor determina su posición en el eje x, otro en el eje Y, y el tercero
representa el tamaño de la burbuja. Las burbujas son diferenciadas en
términos de su tamaño y posición. El diagrama de burbujas es en
realidad una variación del Gráfico de dispersión, en el que un punto
de datos está representado gráficamente por un punto y este es
sustituido por una burbuja.
24
Valor atípico es un elemento de observación donde un dato se comporta de forma diferente a los demás
miembros del conjunto de datos.
111
cantidad de data se requiere formas efectivas de analizar y comunicar
información con formatos fáciles de entender.
112
• Crea el gráfico más simple que muestre la información que
Directriz n°1
se quiera transmitir
113
Nota. Elaboración propia
Los autores proponen diez directrices que representan un listado general de
sugerencias que mejoran la efectividad de las visualizaciones científicas a lo
largo de un rango de disciplinas. Estas directrices tienen como propósito
indicar cuáles son esas dificultades y/ dar ideas a utilizar por investigadores
para cuando se realicen estos gráficos.
Directriz n° 1: Crea el gráfico más simple que muestre la
información que se quiera transmitir
La razón para incluir un gráfico en una publicación científica es para
explicar algo o para apoyar un argumento. Atributos redundantes o
exceso de texto puede volver más tediosa la comprensión de lo que se
quiere mostrar y confundir la información. Por ello, para simplificar
la visualización se recomienda remover la redundancia, con ello se
asegura que el lector pueda distinguir entre las diferentes propiedades
de visualización como forma, color, grosor. Asimismo, la simplicidad
del gráfico puede ser mejorado minimizando la cantidad de texto para
mostrar información no relevante frente al total de texto mostrado.
Directriz n° 2: Considera el tipo de objeto y atributo codificado
utilizado para crear un gráfico
La codificación de los objetos gráficos (puntos, líneas y barras) y sus
atributos de valor de codificación (posición del punto, longitud, la
longitud de la línea, color)25 son utilizados para mostrar diferentes
piezas de información de un conjunto de datos. Seleccionar los
atributos a utilizar es importante, debido a que los humanos pueden
cuantificar ciertos atributos gráficos mejor que otros.
Directriz n°3: Enfócate en los patrones de visualización o en detalles
de la visualización, dependiendo el propósito del gráfico.
Una opción básica al momento de seleccionar un gráfico es mostrar
patrones o detalles. Esa opción requiere la selección de un tipo de
25
Cfr. Kelleher y Wagener (2011)
114
gráfico como también los objetos utilizados para codificar los
valores. Cuando se busca patrones, puede ser efectivo mapas de calor
o gráficos de burbujas aun a pesar de que la extracción de las
diferencias entre valores sea un poco difícil. Por otro lado, los
gráficos de barras o líneas se deben utilizar cuando los valores
individuales sean importantes, como la longitud y la posición, ya que
son fácilmente percibidos cuantitativamente.
Un mapa de calor representa los conjuntos de datos individuales o
múltiples utilizando una secuencia de cuadrados, donde cada
cuadrado representa un valor de datos y color representa la magnitud
del punto de datos. Una alternativa a los mapas de calor son los
gráficos horizontales que muestran múltiples series de tiempo en
paralelo. Los gráficos horizontales son similares a los gráficos de
series de tiempo, pero utiliza colores para resaltar diferencias y
valores extremos dentro y a través de series de tiempo. Si bien los
gráficos horizontales pueden expresar más información, son mejor
utilizados para el análisis de datos y comparaciones ya que su uso
eficaz requiere un nivel de familiaridad con este tipo de gráfico.
115
Directriz n°4: Selecciona rangos de ejes significativos
Seleccionar un rango para el eje vertical depende del objetivo y tipo
de gráfico. Cuando las magnitudes absolutas son importantes, el eje
vertical debe empezar en cero. Mostrar los datos a lo largo de un eje
vertical que no incluye cero, distorsiona el rango de datos y exagera
la magnitud relativa entre los valores.
Directriz n°5: Las transformaciones de data y elecciones cuidadosas
de los aspectos de los ratios gráficos pueden ser utilizadas para
enfatizar tazas de variación para datos de series de tiempo.
La tasa de variación de visualización de una serie de tiempo, que se
refiere a las diferencias de valores entre los intervalos de tiempo, se
puede mejorar u obstaculizar por transformaciones en el eje vertical.
La decisión de usar una transformación debe depender del conjunto
de datos y el objetivo del gráfico, como transformaciones puede
cambiar la impresión de un gráfico y por lo tanto la información
transmitida. El trazado sobre un eje vertical logarítmica puede
eliminar la asimetría en los conjuntos de datos con rangos que
incluyen valores grandes y pequeños.
Directriz n°6: Trazar puntos superpuestas de manera que las
diferencias de densidad sean evidentes en los gráficos de dispersión.
En los gráficos de dispersión donde los puntos son opacos, las
diferencias de densidad son oscuras o incluso invisibles como
múltiples puntos ubicados en un mismo lugar que se muestran como
un mismo punto. Cambiar puntos trazados de opaco a transparente
resalta la información mostrada mediante la visualización de las
diferencias de densidad.
Otra alternativa para lograr un efecto parecido es trazar los círculos
sin rellenar. Para grandes conjuntos de datos, la densidad puede ser
mejor visualizado por la disminución de tamaño de punto.
Directriz n°7: Utiliza líneas cuando use data secuencial en gráficos
de series de tiempo.
116
Gráficos que conectan data no secuencial o valores en cada lado de
un periodo de data perdida con una línea implica un cambio lineal
entre puntos.
Directriz n° 8: Agrega conjuntos de datos más grandes de manera
significante
La simplicidad puede ser dificultosa de alcanzar en muestras con
grandes conjuntos de data cuantitativa o categórica. Grandes
conjuntos de datos cuantitativos pueden ser simplificados vía gráficos
resumen como los gráficos de cajas o estrategias de Kernel. Las
características de los conjuntos de datos, pueden ser mostradas
utilizando gráficos de puntos Cleveland o gráficos de micro mapas
que presenta data referenciada a un mapa o locación, aunque el orden
de esa data puede influenciar la percepción de puntos individuales26.
Directriz n°9: Mantén los rangos de ejes lo más similares posibles
para comparar variables.
Mostrar variables por sub gráficos con diferentes rangos de ejes
propicia comparación de rangos y variabilidad a lo largo de los
conjuntos de datos. Manteniendo los mismos rangos de ejes, los
conjuntos de datos pueden ser comparados más fácilmente.
Directriz n°10: Selecciona un apropiado color de esquema basado en
el tipo de data.
Utiliza un esquema de color que coincide con el tipo de data. Esto
soportaría el propósito del gráfico.
Finalmente, como conclusión se deja en claro que el objetivo de cualquier
gráfico en el contexto de publicaciones científicas y presentaciones es el de
proporcionar efectivamente la información27.
26
Cfr. Kelleher y Wagener (2011)
27
Cfr. Kelleher y Wagener (2011)
117
4.2.2 Framework de estrategias de diseño
Un aspecto importante de la visualización de datos es la etapa de
creación, momento en donde se definen las consideraciones a tomar para
la fase de diseño, de tal modo que se pueda encontrar un criterio que
ayude a mostrar una visualización “correcta” de una determinada data,
esto implica ciertas pautas para lograrlo, es por ello que esta sección se
enfocará en todos aquellos papers relacionados a marcos de trabajos,
guías de referencias, pautas estructuradas que aborden este tipo de
información.
118
Figura 54. Paleta de Visualizaciones Presets
Nota. Recuperado de Hans-Jörg Schulz y Steffen Hadlak, 2014
119
identificados. Estos son divididos en enfoques enumerados, constructivos y
descriptivos.
Enfoque enumerado
Tienen como objetivo describir el espacio de visualización de los diseños a
través de una recopilación entendible de las visualizaciones individuales
existentes que lo constituyen. Los ejemplos más comunes sobre los enfoques
enumerativos son directorios de visualización y referencias de visualización
que listan diversas técnicas de visualización existentes en un orden que
ayuda en la localización de las técnicas individuales - por ejemplo, en un
orden alfabético o mediante el uso de un esquema para tipos de data y tareas
de visualización. Espacios más complejos de diseños de visualización se
describen en visualizaciones taxonómicas y tipologías de visualización.
Enfoque constructivo
Si bien los métodos enumerativos consideran una visualización en su
conjunto, este enfoque se desarrolla de abajo hacia arriba a través de
bloques. Los autores entienden el espacio de visualización de diseños como
el reino de todas las posibles combinaciones de estos bloques. A diferencia
del enfoque enumerativo, no sólo puede capturar visualizaciones existentes,
sino también las visualizaciones hasta ahora no existentes que resultan de
nuevas combinaciones de estos bloques. Ejemplos de enfoques constructivos
que utilizan elementos gráficos y sus propiedades visuales como bloques son
notaciones algebraicas.
Enfoque descriptivo
Este tipo de enfoque no considera una visualización en su totalidad, sino que
tienen por objetivo especificarlo, detallando un número de características de
diseño independientes. En contraste con los enfoques constructivos, el
espacio de diseños de visualización no es un resultado emergente formado
de abajo hacia arriba por las diversas disposiciones posibles de los diferentes
bloques. En cambio, es una caracterización de arriba hacia abajo que ya
120
comienza con una visión de diversidad que tiene como objetivo captar a
través del diseño de diversas características. A diferencia de la ruptura
categórica de los enfoques taxonómicos, estas características son lo
suficientemente específicas para describir y generar visualizaciones
concretas existentes y diseños nuevos por igual. Un ejemplo de este tipo de
enfoques descriptivos son espacios de diseño de visualización
Luego de esta explicación, como segundo paso, los autores pasan a hacer
mención de las tramas que existen entre elegir y crear visualizaciones.
Por ejemplo, mencionan que los enfoques descritos anteriormente permiten a
un usuario elegir una visualización como un todo a partir de una
enumeración de tipos de gráficos existentes o permite crear visualizaciones
personalizadas desde cero de abajo hacia arriba construyéndolos a partir de
una variedad de bloques de construcción o de arriba hacia abajo mediante la
descripción de sus diversas propiedades.
Por otro lado, el enfoque propuesto es para capturar representaciones
visuales a través de un conjunto de parámetros y datos numéricos. Por
ejemplo, para los casos de visualizaciones de árboles y plots, se construiría
tales conjuntos de parámetros. En ese caso, se detalló las dos interfaces para
esta forma de configuración visual, la paleta y la mesa de mezclas. Luego se
detalla su utilidad para la generación de diseños de visualización por
preajustes de la remezcla (es exhibido brevemente por dos ejemplos y un
estudio de usuarios).
En conclusión, los autores afirman que el uso continuo de espacios de
parámetros para describir clases enteras de visualizaciones es un modelo de
gran alcance, extensible y flexible para unificar visualizaciones existentes
bajo un sentido común y para desarrollar nuevas mezclas de visualización.
Esto con interfaces de usuario adecuadas, como la paleta y el mezclador,
permite la creación rápida de prototipos de diseño de visualización
121
personalizada. Es esta combinación continua de diseños amoldables de
visualización e interfaces de usuario que dará acceso directo a ellos.28
28
Cfr. Schulz y Hadlak (2015)
122
Agrupaciones de métodos para la Visualización de
Gráficos Uni variables
Gráficos Multi
Sistemas de información variables
geográfica (GIS)
Datos
Visualización de gráficos o
mapas de la red
Cartografía de datos
Figura 55. Grupos de Métodos para la Visualización de Datos en las ciencias políticas
Nota. Elaboración propia
123
Gráficos estadísticos e infografías con amplio uso del color, la forma,
el tamaño, la forma y estilo de superponer muchas variables
cuantitativas en la misma tabla o diagrama
29
Cfr. Zinovyev (2010)
124
En conclusión, a pesar del innegable rol que tiene la visualización de datos,
en proveer una eficiente herramienta para analizar sobre data cuantitativa
aún existen problemas relacionados a falta de uso de muestra de data
gráfica30. No obstante, los métodos mencionados dan una luz inicial de lo
que constituye el enfoque y propósito de esta investigación.
30
Cfr. Zinovyev (2010)
125
CAPÍTULO 5 Desarrollo del
Proyecto
126
5.1 Entregables del proyecto
A lo largo del desarrollo del proyecto se han ido elaborando diferentes entregables
para poder cumplir con los objetivos iniciales, estos son:
Lineamientos de Uso y Diseño
Pruebas de Concepto
Propuesta de proyectos
Tipos de Variables
Ejemplo de Aplicación
127
Herramientas en las que se puede elaborar
Ejemplos de uso
5.2.1.1.1.1 Definición
128
Figura 57. Ventas realizadas en cada cuarto de año
Nota. Telerik. Recuperado de
http://docs.telerik.com/devtools/winforms/chart/understanding-radchart-
types/bar-charts
129
5.2.1.1.1.4 Cuando no utilizarlo
5.2.1.1.1.6 Herramientas
D3
DataHero
130
Datamatic
Datawrapper
Infogr.am
OnlineChartTool.com
Protovis
Slemma
Vega
5.2.1.1.2.1 Definición
Es un gráfico de barras mostrado en un sistema de coordenadas polar y no en
un sistema cartesiano.
El problema de mostrarlo bajo este sistema es que puede llegar a ser
malinterpretado, ya que por lo general la última barra hacia afuera tiende a
ser el más largo, incluso si es que representan el mismo valor. Esto se debe a
que cada barra debe estar en un radio diferente para que cada uno puede ser
analizado independientemente. Es una variante del gráfico de barras
131
modificado como medida estética, es más notorio para la vista, pero poco
entendible.
132
5.2.1.1.1.4 Herramientas
Actualmente se desconoce en qué herramientas se puede elaborar dicha
técnica.
5.2.1.1.3.1 Definición
Una pirámide de población, también conocida como pirámide de edad y sexo
es un estilo espalda con espalda, conformado por un par de histogramas
(para cada sexo) que muestra la distribución de la población en todos los
grupos de edad y en ambos sexos. El eje X se utiliza para trazar los números
de población y el eje Y muestra los grupos de edad.
133
Figura 61. Formas de Pirámides de Población
Nota.US Census Bureau International Programs, 2011.
Recuperado de:
http://2012books.lardbucket.org/books/regional-geography-
of-the-world-globalization-people-and-places/s04-03-
population-and-culture.html
134
población con altas tasas de fecundidad y mortalidad.
Considerando que, una pirámide con una parte superior más
ancha y base más estrecha sugiere una población que envejece
con bajas tasas de fertilidad.
135
Figura 62. Pirámide de Población 1961
Nota. Regional School District 17. Recuperado
de
http://www.rsd17.org/TeacherWebPage/HighS
chool/JAnderson/A/introduction/graphic%20or
ganizers/Pop%20Pyramid%20&%20Climograp
h%20DEFINITION.htm
5.2.1.1.3.5 Herramientas
Se puede elaborar dicha técnica en herramientas como:
D3
Vega
ZingChart
136
5.2.1.1.4 Mapa Choropleth (Choropleth Map)
5.2.1.1.4.1 Definición
Esta técnica es una representación que realza las diferencias en la distribución
geográfica de la data por unidad espacial, además de hacer uso de límites como
países, ciudades, regiones, etc. (Robinson, 1982). Permite identificar distintos
patrones, comportamientos a lo largo de una determinada región. Las variables
de la data son los que determinan una progresión de las tonalidades en cada
región determinada.
Por lo general se toma un color de referencia y se utiliza sus diferentes
tonalidades desde opacos hasta tonalidades transparentes.
Los tamaños de algunas regiones son más pronunciados que otros por lo cual
puede provocar la malinterpretación de la información, que como consecuencia
puede afectar en la percepción del usuario.
137
5.2.1.1.4.2 Tipo de Variables
138
5.2.1.1.4.5 Ejemplos de aplicación
En la Figura 9 se muestra las diferentes tonalidades de cada país dependiendo de
la cantidad de letras de los nombres de cada uno. Como se puede observar en la
leyenda, la asignación de colores dependerá de los intervalos, mientras menos
letras tengan el nombre del país, la tonalidad del color será menos intensa y
mientras más letras tengan, el color será más intenso.
5.2.1.1.4.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
CartoDB
Datavisual
Infogr.am
Mbostock’s blocks
R Graph Gallery
139
5.2.1.1.4.7 Ejemplos de Uso
La página web “Vision of Humanity” muestra el índice de paz del Reino
Unido desde el 2013 hasta el 2012, haciendo uso de elementos
complementarios para la optimizar la visualización como una leyenda y
clasificación de indicadores como homicidios, crímenes violentos, crímenes
con armas, desorden público, etc.
http://www.visionofhumanity.org/#page/indexes/uk-peace-index/2012
5.2.1.1.5.1 Definición
Esta técnica, también conocida como Cartograma, es un tipo de gráfico de
burbujas que permite ver tres dimensiones de la data, siendo los dos primeros la
locación geográfica de un evento en particular y la tercera, una variable
cuantitativa de interés.
140
5.2.1.1.5.2 Tipos de Variables
141
Figura 66. Inversiones Internacionales de China
Nota. Financial Times, 2010. Recuperado de http://www.improving-
visualisation.org/vis/id=314
5.2.1.1.5.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
CartoDB
Datavisual
Google Docs
Polymaps
142
5.2.1.1.6 Gráfico Nightingale Rose (Coxcomb Chart/ Polar Area Diagram)
5.2.1.1.6.1 Definición
Esta fue una técnica bastante utilizada por el estadístico y médico Florence
Kigthingale con la intención de mostrar las muertes prevenibles de los soldados
durante la guerra de Crimea. Cada categoría o intervalo de los datos se dividen
en segmentos iguales en un gráfico radial. Para poder determinar qué tanto se
extiende los segmentos en proporción al valor que representa, se toma en cuenta
el eje polar.
143
5.2.1.1.6.2 Tipos de Variables
144
Figura 68. Gráfico Nightingale Rose acerca de los Simpsons
Nota. CNN, 2009. Recuperado de
http://edition.cnn.com/2009/SHOWBIZ/TV/12/14/s
idebar.simpsons.influence/index.html
5.2.1.1.6.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
Datamatic
Infogr.am
5.2.1.1.7.1 Definición
También es conocido como gráfico de columnas circular o gráfico estrella. Es
una técnica que utiliza una grilla para concentrar círculos y con ello mostrar
barras. Cada círculo en el gráfico representa un valor en una escala, mientras
145
que los divisores radiales son utilizados por cada categoría o intervalo (en caso
sea un histograma).
Por lo general, los valores bajos en la escala empiezan del centro e incrementan
con cada círculo, no obstante, también se puede mostrar valores negativos si es
que el 0 no se encuentra en el centro, sino a partir de los siguientes divisores.
Las barras tienden a empezar desde el centro y de ahí extenderse hacia afuera.
146
En caso se desee tener otra vista del valor de cada variable.
5.2.1.1.7.5 Herramientas
Se puede elaborar dicha técnica en herramientas como:
147
jChartFX (JavaScript plugin)
5.2.1.1.8 Gráfico Radar (Radar Chart/ Spider Chart/ Web Chart/ Polar Chart/
Star Plots)
5.2.1.1.8.1 Definición
Es una forma de comparar cantidades múltiples de variables. Son útiles para
visualizar qué variables tienen similares valores o si es que existen valores
atípicos en cada variable. Son útiles para visualizar qué están calificadas de
forma alta o baja por cada dataset, ideal para verificar el rendimiento mostrado.
Cada variable tiene asignado un eje, que comienza desde el centro. Ada eje se
encuentra ubicado radialmente, con distancias iguales. También se muestran
líneas que unen los ejes como método referencial o guía al momento de mostrar
la data. Cada valor es mostrado en cada eje y distinguida por un punto, al unir
cada punto forma un polígono, forma final a mostrar.
148
Note. Data Visualization Catalogue.
Recuperado de
http://www.datavizcatalogue.com/me
thods/radar_chart.html
149
La página Coffee Analysts utiliza el gráfico radar para comparar visualmente y
contrastar muestras como un punto de referencia para el desarrollo de nuevos
productos o sabores, es decir, "Quiero que mi café tenga esto o aquello". Se
puede observar que la escala indica la cantidad de cada fragancia (sabor) y
cada eje son los distintos tipos de fragancias.
5.2.1.1.8.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
Amcharts
Google Docs
Zing Chart
150
5.2.1.1.8.7 Ejemplos de Uso
Para obtener otros ejemplos nos podemos dirigir a la página de Data Viz
Project, en el siguiente enlace:
http://datavizproject.com/data-type/radar-diagram/
5.2.1.1.9 Gráfico Span (Range Bar/ Column Graph/ Floating Bar Graph/
Difference Graph, High-Low Graph)
5.2.1.1.9.1 Definición
Es utilizado para mostrar un conjunto de data desde un rango de valor mínimo
hasta un valor máximo. Muestra sólo los valores extremos, mínimo y máximo,
no se especifica los valores intermedios.
151
5.2.1.1.9.3 Cuando utilizarlo
5.2.1.1.9.5 Herramientas
Se puede elaborar dicha técnica en herramientas como:
ZingChart
152
5.2.1.1.10 Gráfico de Barras Multi Set (Multi-set Bar Chart/ Grouped/ Clustered
Bar Charts)
5.2.1.1.10.1 Definición
También son conocidos como Gráfico de barras agrupados. Estos son agrupados
uno al costado del otro diferenciados por categorías ubicados en el mismo eje.
El tamaño de las barras permite ver las comparaciones numéricas discretas de
las cantidades que representan a través de categorías. Cada una de estas
agrupaciones se encuentra separadas.
Su mayor aporte es el de permitir comparar entre los conjuntos de data, cada uno
de ellos distribuidos en las mismas variables o categorías. También este tipo de
técnica realiza comparaciones de mini histogramas.
153
Cuando se desea comparar dos a más data sets por
categorías/variables.
Se puede asignar diferentes colores por cada subgrupo (data set), los
cuales permite identificarlos en cada categoría.
5.2.1.1.10.5 Herramientas
Se puede elaborar dicha técnica en herramientas como:
D3
DataHero
Datavisual
Datawrapper
Infogr.am
NVD3.js (code)
Slemma
Vega (code)
Visage
154
Para obtener otros ejemplos nos podemos dirigir a la página de Plotly, en el
siguiente enlace:
https://plot.ly/matlab/bar-charts/
5.2.1.1.11.1 Definición
Esta técnica guarda la esencia de un gráfico de pie con la diferencia de no contar
con la parte central de este.
A diferencia del diagrama de pie es más claro distinguir las diferencias de cada
variable/categoría a diferencia del diagrama de pie, el cual tienden a criticar por
los tamaños relativos de las categorías. En ese caso se tiende a evaluar el largo
del arco.
155
http://www.datavizcatalogue.com/me
thods/donut_chart.html
156
Figura 76. Muertes relacionadas al VIH en Sub Saharan África 2013
Nota. AVERT. Recuperado de http://www.avert.org/professionals/hiv-around-
world/sub-saharan-africa/overview
5.2.1.1.11.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
D3 (Single) o D3 (Multiple)
DataHero
Datamatic
Datavisual
Datawrapper
Google Docs
Infogr.am
Protovis
Slemma
Visage
ZingChart
157
5.2.1.1.11.7 Ejemplos de Uso
Esta técnica fue utilizada por el diario el Comercio en el 2015 para mostrar la
composición del PBI en el Perú, la información fue obtenida de la INEI y de la
Guía de Negocios e Inversión 2015-2016 de Ernst & Young. Para ver el
ejemplo dirigirse a la página del Comercio en el siguiente enlace:
http://elcomercio.pe/economia/peru/grafico-dia-cuanto-pesa-cada-sector-pbi-
peru-noticia-1825899
5.2.1.1.12.1 Definición
Esta técnica posee dos ejes, (X e Y) en los cuales se distinguen dos gráficos
apilados hasta el 100%, todas las barras son de igual longitud y son divididos en
segmentos. Cada eje representa una variable con una escala que determinan la
longitud y ancho de cada segmento. Esto hace posible detectar la relación entre
categorías y subcategorías (si es que existen) a través de las dos variables.
Tiene similitud con el gráfico apilado en 2D, no obstante, además de distribuir la
data en niveles de acuerdo a las variables, también agregan como factor a
observar, el grosor de las columnas.
158
Nota. Data Visualization Catalogue. Recuperado de
http://www.datavizcatalogue.com/methods/marimekko
_chart.html
159
muestra los sistemas operativos y en el eje Y los grupos de edades y por cada
uno el porcentaje respectivo.
5.2.1.1.12.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
D3
5.2.1.1.13.1 Definición
160
Es una de las técnicas más utilizadas y conocidas. Cada arco representa una
proporción de cada categoría lo cual al ser sumado se obtiene el 100% de la
data.
161
Se recomienda utilizarlo cuando se quiere comparar un segmento o
categoría frente al total, para identificar la relación que guarda.
5.2.1.1.13.5 Herramientas
Se puede elaborar dicha técnica en herramientas como:
MS Excel or Apple Numbers
D3
DataHero
Datamatic
Datavisual
Datawrapper
Infogr.am
Protovis
OnlineChartTool.com
162
Slemma
ZingChart
5.2.1.1.14.1 Definición
Esta técnica segmenta las barras en porciones de distintos tamaños. Cada
porción es una categoría. Es utilizado para mostrar las sub categorías de una
categoría y cuál es su relación cuantitativamente con respecto al total. Existen
dos tipos: simples y al 100%.
Simples: muestra cada valor al costado del otro y el total es la suma de los
valores mostrados.
100%: muestra el porcentaje de cada sub segmento, el cual en total completan el
100%.
163
http://www.datavizcatalogue.com/methods/s
tacked_bar_graph.html
164
Figura 81. Gráfico de barras apiladas
Nota. Tableau, 2010. Recuperado de
http://www.tableau.com/blog/gartner-vendors-bi-
activities
En la imagen de arriba, se puede apreciar el porcentaje de clientes que utilizan el
producto de uno de las ocho diferentes actividades de BI. Cada barra apilada
representa la suma de esos. Puesto que un cliente puede utilizar un producto
para múltiples funciones, la barra apilada llega a más de 100%.
5.2.1.1.14.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
MS Excel & Apple Numbers
Datavisual
Datawrapper
Infogr.am
Slemma
ZingChart
165
5.2.1.1.14.7 Ejemplos de Uso
Para obtener otros ejemplos nos podemos dirigir a la página de Mekko
Graphics, en el siguiente enlace:
http://www.mekkographics.com/resources/charts-by-type/bar/
5.2.1.1.15.1 Definición
Por lo general esta técnica se muestra en círculos o en cuadrados. El objetivo es
comparar valores para dar una rápida vista de los tamaños relativos de la data,
sin el uso de escalas.
También es posible mostrarlo haciendo uso de otro tipo de forma además de
circulo o cuadrados. Al final, es importante que se pueda mostrar de alguna
forma la data.
Variables cuantitativas.
166
Cuando se desea comparar valores para dar una rápida vista de los
tamaños relativos de la data, sin el uso de escalas.
167
Figura 83. Gráfico de Área Proporcional
Nota. Undullify. Recuperado de http://undullify.com/data-
visualization-101-visualize-common-simple-data-points/
5.2.1.1.15.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
D3 (Bubbles/Circles)
Datamatic
Datavisual
Infogr.am
168
5.2.1.1.16 Gráficos de líneas (Line Graph)
5.2.1.1.16.1 Definición
Los gráficos de líneas se dibujan partiendo de puntos de datos de trazado en un
plano de coordenadas cartesianas y luego se conecta una línea entre los puntos.
Típicamente, el eje Y tiene un valor cuantitativo, mientras que el eje X tiene
una escala categórica o secuenciada. Los valores negativos se pueden mostrar
por debajo del eje X.
169
Se utiliza con mayor frecuencia para mostrar tendencias y relaciones
(cuando se agrupan con otras líneas).
Los gráficos de líneas ayudan a dar una "visión global " sobre un
intervalo, para ver cómo se ha desarrollado a lo largo de un período
determinado.
170
Nota. Knoema, 2015. Recuperado de
http://knoema.es/UNWPP2015R/world-
population-prospects-the-2015-revision
5.2.1.1.16.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
MS Excel or Apple Numbers
DataHero
Datamatic
Datawrapper
Envision.js
Infogr.am
OnlineChartTool.com
Slemma
Vega
171
http://knoema.es/UNWPP2015R/world-population-prospects-the-2015-
revision
5.2.1.1.17.1 Definición
Son similares a los diagramas Sankey en la forma como muestra el flujo y
proporciones de la data, sin embargo, esta técnica no utiliza flechas y se dividen
el flujo del camino en cada set de línea mostrado.
Combina las ventajas de técnicas basadas en la frecuencia, en este caso de
categorías en coordenadas paralelas.
Su objetivo principal es mostrar data categórica, su creación se dio
principalmente por ello. Cada línea corresponde a una dimensión o dataset que
son valores/ categorías que se representan en cada línea. El grosor de cada línea
y los caminos de los flujos son determinados por la fracción proporcional de la
categoría total. Cada camino de flujo puede ser distinguido por diferentes
colores para mostrar y comparar la distribución entre categorías.
Esta técnica de visualización consta de ejes que no se encuentran
ortogonalmente posicionados, si no que se encuentran colocados uno al lado del
otro, de tal forma que permite mostrar data en alta dimensión, ya que los ejes
son visualmente independientes.(Bendix, Kosara & Hauser, 2005)
172
Figura 86. Sets Paralelos
Nota. Data Visualization Catalogue.
Recuperado de
http://www.datavizcatalogue.com/met
hods/parallel_sets.html
Variables cualitativas
173
5.2.1.1.17.4 Ejemplos de aplicación
Un análisis de la actividad de Facebook revela cómo cambió apoyo de los
aficionados durante el torneo.
Figura 87. Sets Paralelos – How Fan Loyalty Change During the World Cup
Nota. New York Times. Recuperado de
http://www.nytimes.com/interactive/2014/07/12/upshot/how-fan-
loyalty-changed-during-the-world-cup.html
5.2.1.1.17.5 Herramientas
Se puede elaborar dicha técnica en herramientas como:
SankeyMATIC
EagerEyes: ParallelSets
174
Para obtener otros ejemplos nos podemos dirigir a la página de Data Viz
Project, en el siguiente enlace:
http://datavizproject.com/data-type/parallel-sets/
5.2.1.1.18.1 Definición
Esta técnica es una representación que permite conocer cinco valores concisos
acerca de la distribución de un conjunto de datos, estos son el valor mínimo,
máximo, cuartil superior, inferior y la mediana. (Potter, 2006, p.98) Por lo
general, también tienen líneas que se extienden en paralelo de las cajas
(barbas) que indican la variabilidad fuera de los cuartiles superior e inferior.
Los valores atípicos a veces se representan como puntos individuales que están
en línea con las barbas.
A pesar de que puedan parecer primitivos en comparación con un histograma o
gráfico de densidad, tienen la ventaja de ocupar menos espacio.
Dos de las variaciones más comúnmente utilizadas del diagrama de caja son:
diagramas de caja ancho variable y gráficos de caja con muescas.
175
Nota. Data Visualization Catalogue.
Recuperado de
http://www.datavizcatalogue.com/meth
ods/box_plot.html
Variables cuantitativas.
176
5.2.1.1.18.5 Ejemplos de aplicación
Este tipo de gráficos es comúnmente utilizado en el ámbito estadístico, por
ejemplo el Centro de Investigación y Desarrollo realizó en el 2002 ,un gráfico
de diagrama de caja del PBI del Perú en el cual se muestra cada caja por cada
mes desde 1991 hasta el 2001 con la finalidad de comparar por cada mes la
mediana, la cual es representada por una línea horizontal al interior de cada
caja, la dispersión de los valores mediante la longitud de la caja y las
prolongaciones conocidos como “bigotes”. Como resultado, se puede
visualizar que en los primeros y últimos meses se presentan los menores
niveles de producción, mientras que el mes de mayo es el que registra mayor
nivel de producción
5.2.1.1.18.6 Herramientas
177
Se puede elaborar dicha técnica en herramientas como:
D3
Protovis
R Graph Gallery
ZingChart
5.2.1.1.19 Gráfico de Tallo y Hoja (Stem and Leaf plot/ Stemplot/ Stem & Leaf
Display)
5.2.1.1.19.1 Definición
Es una técnica que permite organizar data tomando en cuenta su lugar de valor
para mostrar su distribución. Los valores son ubicados ascendentemente hacia
abajo en una columna “tallo”. La data que se encuentra asociada con cada valor
ubicado en el tallo se lista por los costados, llamados “hojas”.
Los valores ubicados en la columna “tallo” representarán la parte decena de los
números, mientras que los números mostrados en las hojas serán la parte de la
unidad de tal forma que si se quiere mostrar los valores: 3, 4, 12, 14, 16, 22, 34,
con el gráfico se representaría así:
Tallo Hojas
0 3,4
1 2,4,6
178
2 2
3 4
Variables cuantitativas.
179
5.2.1.1.19.4 Cuando no utilizarlo
5.2.1.1.19.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
ZingChart
180
5.2.1.1.19.7 Ejemplos de Uso
Para obtener otros ejemplos nos podemos dirigir a la página Bitesize de la
BBC, en el siguiente enlace:
http://www.bbc.co.uk/education/guides/zvybkqt/revision/7
5.2.1.1.20.1 Definición
Un histograma muestra la distribución de datos a través de un período de
tiempo de intervalo. Este es la principal diferencia con la representación de
barras. Cada barra representa un histograma de la frecuencia tabulada en cada
intervalo / bin. El área total del histograma es igual al número de datos.
Los histogramas ayudan a dar una estimación de cuánto y en dónde se
concentran los valores, lo que los extremos encuentran y si hay lagunas o
valores inusuales.
181
http://www.datavizcatalogue.com/
methods/histogram.html
Figura 93. Salario de Trabajos de TI de los últimos tres meses hasta el 28 de mayo
del 2016 en Inglaterra
Nota. ITJobsWatch, 2016. Recuperado de
http://www.itjobswatch.co.uk/jobs/uk/python.do
182
5.2.1.1.20.4 Cuando no utilizarlo
183
5.2.1.1.20.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
MS Excel and Apple Numbers
D3
Datavisual
Datamatic
Google Docs
Infogr.am
OnlineChartTool.com
Protovis
Slemma
R Graph Gallery
5.2.1.1.21.1 Definición
Esta técnica permite visualizar la data jerárquica en forma de una estructura de
árbol. Parte de un nodo principal padre, el cual no depende de nadie, a partir de
este se originan nodos hijos que a su vez se relacionan a través de conectores
(Ramas). Finalmente, los últimos nodos serán considerados así cuando ya no
existan ramificaciones hijas debajo de estas.
184
Figura 95. Diagrama de árbol
Variable Cualitativa
185
5.2.1.1.21.4 Ejemplos de aplicación
En el año 2013, el MIT Sloan Sports Analytics Conference, publicó un juego
interactivo que celebraba la histórica temporada de Rafael Nadal. Este juego
consistía en un árbol que permitía a los usuarios explorar visualmente como
Nadal ganó, con dificultad o fácilmente, cada uno de sus 666 servicios en los
torneos de Masters 1000 Tournaments, Grand Slams and World Tour Finals.
Para poder interactuar con el juego, ingresar al siguiente link:
http://gamesetmap.com/nadalgametree/
5.2.1.1.21.5 Herramientas
Se puede elaborar dicha técnica en herramientas como:
Datamatic
Google Charts
Google Docs
Giffy
186
5.2.1.1.21.6 Ejemplos de Uso
Para obtener otros ejemplos nos podemos dirigir a la página de Wiki Tree, en el
siguiente enlace:
http://www.wikitree.com/printable/family-tree-diagram.html
5.2.1.1.22.1 Definición
Consiste en asociar puntos distribuidos por el mapa con líneas curvas o rectas.
Tal como menciona su nombre, sirven para poder mostrar las conexiones y
relaciones geográficas. Asimismo, son utilizados para mostrar rutas a través de
una cadena de enlaces.
187
Figura 98. Mapa de Rutas de vuelos de Vienna
International
Nota. Anita Gracer, 2011. Recuperado de
https://anitagraser.com/2011/08/20/visualizing-global-
connections/
188
que se realizó dicho mapa, de los cuales en su mayoría provenían de China. A
raíz de la publicación de esta información el gobierno estableció un Centro
Nacional de Cyber defensa para poder lidiar con este tipo de acontecimientos.
5.2.1.1.22.5 Herramientas
Se puede elaborar dicha técnica en herramientas como:
CartoDB
Datavisual
Infogr.am
Mbostock’s blocks
R Graph Gallery
189
5.2.1.1.22.6 Ejemplos de Uso
La página Flight Connections permite conocer las diferentes salidas que tiene
los aeropuertos hacia otros aeropuertos en todo el mundo, para ello han
utilizado esta técnica ingresando el aeropuerto del cual se desea conocer sus
conexiones. Enlace: http://www.flightconnections.com/
Otro ejemplo muestra las migraciones de distintos países hacia Estados
Unidos. Para visualizarlo puede ingresar la página de MigrationaMap.net en el
siguiente enlace: http://migrationsmap.net/#/USA/arrivals
5.2.1.1.23.1 Definición
Los diagramas de arco son una forma alternativa de representar gráficos
bidimensionales. Está compuesto por nodos, los cuales son lugares a lo largo
de un eje de línea / unidimensional y por arcos, los cuales se utilizan para
mostrar las conexiones entre los nodos. El grosor de las líneas de arco puede
ser usado para representar la frecuencia de la fuente al nodo de destino.
190
Figura 101. Diagrama de Arco - Gráfico para visualizar personajes de Los Miserables
Nota. Revolutions, 2013. Recuperado de http://www.r-bloggers.com/arc-diagrams-in-r-
les-miserables/
Variable Cualitativa.
191
5.2.1.1.23.5 Ejemplos de aplicación
El primer ejemplo, el cual fue una investigación de IBM, se trata de la
representación de la estructura de la canción Für Elise de Beethoven. Lo que se
desea mostrar es la concurrencia en la que se presentan las mismas notas y en
donde se producen los acordes (en ese caso sólo se consideran las notas más
altas).
192
5.2.1.1.23.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
Protovis
D3
5.2.1.1.24.1 Definición
Es un conjunto de puntos distribuidos en un círculo en sentido antihorario que
permite visualizar las conexiones internas entre entidades. (Sawada, 2002) Las
conexiones indican que existe algo en común entre las entidades, por tanto, en
caso quiera comparar un conjunto de data o diferentes grupos de data, se puede
hacer uso de esta técnica. Está compuesto por tres partes fundamentales: El nodo,
la curva del arco de conexión y los valores asignados en el punto de conexión.
Los colores pueden ser utilizados en cada grupo de datos para distinguir
categorías o grupos y los valores asignados son proporcionalmente equivalentes
al tamaño de cada arco.
193
Nota. Data Visualization
Catalogue. Recuperado de
http://www.datavizcatalog
ue.com/methods/chord_dia
gram.html
Variables cualitativas.
194
Esta técnica no suele ser claro cuando lo que se quiere es analizar gran
cantidad de variables al punto de que ya no se pueda visualizar los
nombres de estos.
5.2.1.1.24.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
Circos
195
D3
R Graph
Zing Chart
Power Bi
5.2.1.1.25.1 Definición
Haciendo uso de la técnica, en este ejemplo se muestra los países de América
(representados en cada punto) y cuáles son los países vecinos a ellos
(conexiones).
196
Nota. Data Visualization
Catalogue. Recuperado de
http://www.datavizcatalogue.co
m/methods/non_ribbon_chord_d
iagram.html
Variable cualitativa.
197
Nota. Visualign, 2016. Recuperado de
https://visualign.wordpress.com/tag/mathematica/
5.2.1.1.25.5 Herramientas
Se puede elaborar dicha técnica en herramientas como:
Circos
5.2.1.1.26.1 Definición
Esta técnica muestra principalmente flujos y sus cantidades en proporción a cada
uno. Provee una vista resumida del camino involucrado en un proceso (Tiwari,
2016). El grosor de las flechas o líneas permiten ver sus magnitudes, entonces,
mientras más grande la flecha, más grande el flujo. Las flechas de flujo o líneas
pueden combinarse o dividirse por diferentes caminos. También se puede
utilizar diferentes colores para distinguir categorías en caso las tuviera o para
mostrar la transición de un estado al otro.
198
http://www.datavizcatalogue.com/methods
/sankey_diagram.html
5.2.1.1.26.4 Herramientas
Se puede elaborar dicha técnica en herramientas como:
RAW (Under Alluvial Diagram)
SankeyMATIC
Tamc
199
5.2.1.1.27 Lluvia de ideas/ Mapa mentales (Brainstorm/ Mind-Maps)
5.2.1.1.27.1 Definición
También conocido como mapa mental. Es un diagrama para asociar ideas,
palabras y conceptos. Se suelen utilizar como una herramienta para la
generación de ideas, la búsqueda de asociaciones, la clasificación de las ideas, la
organización de la información, la visualización de la estructura y ayuda a
estudiar. La estructura de un mapa de una lluvia de ideas / mente es el siguiente:
las categorías principales se extienden hacia fuera desde un nodo central. Cada
rama son categorías, que también pueden desarrollar sus propias subcategorías.
200
Nota. Data Visualization Catalogue.
Recuperado de
http://www.datavizcatalogue.com/me
thods/brainstorm.html
Variable Cualitativa.
5.2.1.1.27.5 Herramientas
Se puede elaborar dicha técnica en herramientas como:
Coggle
MindMup
201
permitiendo la colaboración de distintos usuarios. Tal es el caso de la
herramienta bubbl.us tal como se muestra en el siguiente enlace:
https://bubbl.us/#06145779895013146
5.2.1.1.28.1 Definición
Este tipo de diagrama representa la data como conjuntos de datos,
englobándolos en círculos, los cuales dependiendo si es que tienen data en
común o relacionada se muestran en la intersección de dichos círculos.
Variable Cualitativa.
202
Se utiliza cuando se quiere conocer la relación entre data de diferentes
conjuntos.
203
En este ejemplo, el gran círculo de la izquierda contiene un gran número de
pequeños círculos rojos que representan mensajes (tweets) que contienen la
palabra "chocolate" pero que no contienen "leche". El gran círculo de la
derecha tiene círculos azules que representan los mensajes que contienen
"leche", pero no "chocolate". El área de intersección tiene círculos de color
púrpura que indican el número de los tweets contienen ambos términos.
5.2.1.1.28.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
Datamatic
R Graph Gallery
ZingChart
Gliffy
5.2.1.1.29.1 Definición
Esta técnica se asemeja al gráfico de matriz el cual muestra la relación entre dos
o más variables en un formato de filas y columnas. Se divide en categorías X e
Y. Si existen otros factores, se distingue mediante colores. Lo que lo diferencia
es que en vez de mostrarse en rectángulos se muestran en puntos.
204
Figura 112. Gráfico de matriz de puntos
Nota. Data Visualization Catalogue.
Recuperado de
http://www.datavizcatalogue.com/methods
/dot_map.html
Variable Cualitativa.
Cuando sólo se tiene una variable o una sola categoría, ya que este
pasaría a funcionar como un gráfico de área proporcional.
5.2.1.1.29.5 Herramientas
Actualmente se desconoce en qué herramientas se puede elaborar dicha técnica.
205
5.2.1.1.29.6 Ejemplos de Uso
Para obtener otros ejemplos nos podemos dirigir a la página de Behance, en el
siguiente enlace:
https://www.behance.net/gallery/16809363/Do-You-Speak-Chinese
5.2.1.1.30.1 Definición
Es una técnica de Data Visualization el cual tiene como una de sus
características principales, la utilización de íconos para poder dar una vista más
participativa de pequeños sets y data discreta. Los íconos representan el objeto a
evaluar o categoría (Ejemplo: Si lo que se quiere mostrar es población se tomará
como ícono de presentación un gráfico de personas). Cada uno de estos
representan o bien una unidad o un número de unidades, para poder comparar
cada categoría entre ellas.
Variable Cualitativa.
206
5.2.1.1.30.3 Cuando utilizarlo
207
Nota. Feel Desain, 2011. Recuperado de
http://www.feeldesain.com/historical-
pictogram-posters-html
5.2.1.1.30.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
Infogr.am
5.2.1.1.31.1 Definición
Este tipo de representación fue creado ante la problemática de mostrar
información compacta, reduciendo el espacio. Originalmente fue utilizado en los
90’s para visualizar el contenido de los discos duros y cómo es que están
distribuidos 10 mil archivos de cinco a diez niveles de directorios.
Es una forma alternativa de visualizar una estructura jerárquica como la del
diagrama de árbol mientras que al mismo tiempo se puede mostrar cantidades
por nivel jerárquico a través del tamaño que ocupa el área de cada rectángulo.
Cada categoría es asignada a un rectángulo con sus sub categorías representadas
también en esta forma. Cuando una cantidad es asignada a una categoría, su área
es mostrada en proporción a la cantidad designada y tomando en cuenta el
208
tamaño del rectángulo padre. Cuando no es agregado el atributo cantidad, las
áreas de los rectángulos son distribuidos igualitariamente.
Con respecto a la forma como son divididos y ordenados depende del algoritmo
utilizado. Para poder mantener los rectángulos, el algoritmo mayormente
utilizado es el algoritmo squarified.
209
En caso que cada categoría tenga una cantidad asociada.
210
Nota. The Atlas of Economic Complexity, 2016. Recuperado de
http://atlas.cid.harvard.edu/explore/tree_map/export/show/all/2204
/2014/
5.2.1.1.31.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
CartoDB
Datavisual
Google Docs
Polymaps
5.2.1.1.32.1 Definición
Esta técnica es una variación del Mapa de árbol el cual utiliza círculos para
distinguir los niveles jerárquicos. Cada círculo contenedor representa un nivel
dentro jerarquía, en el caso de un mapa de árbol cada rama es representada por
un círculo y sus sub ramas serian círculos dentro de este. El área de cada círculo
también puede ser utilizado como un atributo arbitrario como cantidad o tamaño
211
del objeto a analizar. Los colores utilizados también pueden ser un atributo para
para distinguir categorías.
212
5.2.1.1.32.5 Ejemplos de aplicación
Bodbot es un sitio web, el cual brinda información para realizar ejercicios y
llevar una vida sana, esto implica una sección de alimentación, para mostrar la
información nutricional hizo uso de esta técnica para mostrar la jerarquía de
macro a micronutrientes, incluyendo compuestos de aminos ácidos, tipos de
grasa, fibra y azúcar al igual que vitaminas.
5.2.1.1.32.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
D3
D3 Zoomable
RAW
213
5.2.1.1.33 Gráfico de burbujas (Bubble Chart)
5.2.1.1.33.1 Definición
Un gráfico de burbujas es un gráfico de múltiples variables. Es una
combinación de un gráfico de dispersión y un gráfico proporcional de la zona.
Al igual que un gráfico de dispersión, el cuadro de burbujas utiliza un sistema
de coordenadas cartesianas para trazar puntos a lo largo de una cuadrícula en
los ejes X e Y son variables independientes, sin embargo, a diferencia de un
gráfico de dispersión, cada punto se le asigna una etiqueta o categoría (ya sea
que aparecen al lado o en una leyenda). Cada punto representa una tercera
variable por la zona de su círculo. Los colores también se pueden utilizar para
distinguir entre categorías o se utiliza para representar una variable de datos
adicional. Como también puede brillo y opacidad. El tiempo puede ser
mostrado ya sea por tener como variable sobre uno de los ejes o por la
animación de las variables de datos cambiando con el tiempo.
214
Figura 120. Expectativa de vida vs PBI per Cápita en el 2007
Nota. Plotly, 2016. Recuperado de http://help.plot.ly/make-a-bubble-
chart/
215
Es útil cuando se desea analizar data sobre el tiempo, esto permite
evaluar posibles patrones.
216
Figura 121. Interactive bubble plot
Nota. Hans Rosling, 2008. Recuperado de
http://www.nytimes.com/interactive/2014/07/12/upshot/how-fan-loyalty-
changed-during-the-world-cup.html
5.2.1.1.33.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
Google Charts
Google Docs
Infogr.am
jChartFX
RAW
Slemma
Visage
ZingChart
217
5.2.1.1.33.7 Ejemplos de Uso
Un ejemplo encontrado en la página de Anychart muestra el gráfico con data
de los mejores deportistas, para visualizarlo se puede dirigir al siguiente
enlace:
http://www.anychart.com/products/anychart/gallery/Marker_and_Bubble_Char
ts/Multi-Series_Bubble_Chart.php
Del mismo modo, otro ejemplo es el realizado por Hans Rosling, el cual puede
ser presentado de forma interactiva tal como lo muestra en el video realizado
por la BBC, “Hans Rosling's 200 Countries, 200 Years, 4 Minutes - The Joy of
Stats” y el cual se encuentra en la página Youtube en el siguiente enlace:
https://www.youtube.com/watch?v=jbkSRLYSojo).
5.2.1.1.34.1 Definición
Geográficamente muestran los movimientos de la información u objetos de una
locación a otra y la cantidad que viaja.
Los flujos se inician desde un punto de origen y a partir de ello se distribuyen en
diferentes direcciones. En estos casos son utilizadas las flechas para especificar
hacia dónde se dirigen estos flujos. Con las flechas, se puede visualizar el
comportamiento del flujo, no obstante, se recomienda evitar los cruces para
mantener el orden de los flujos.
218
Figura 122. Mapa de Flujo
Nota. Data Visualization
Catalogue. Recuperado de
http://www.datavizcatalogue.com/
methods/flow_map.html
219
5.2.1.1.34.3 Cuando utilizarlo
220
Figura 124. Mapa Global del Tráfico 2010
Nota. TeleGeography, 2010. Recuperado de
https://www.telegeography.com/telecom-maps/global-traffic-map.1.html
5.2.1.1.34.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
QGis
221
5.2.1.1.35 Mapa de Puntos (Dot Map/ Dot Distribution Map/ Dot Density Map)
5.2.1.1.35.1 Definición
También es conocido como Mapa de distribución de puntos, es una técnica que
permite detectar patrones espaciales o la distribución de data sobre un espacio
geográfico. Consiste en distribuir puntos del mismo tamaño en un espacio
geográfico. Existen dos tipos de mapas de puntos, uno a uno, el cual un punto
representa una sola unidad y uno a muchos, el cual un punto representa una
cantidad en particular, por ejemplo, un punto puede equivaler a 5, 10, 12 objetos
a especificar.
222
Es útil cuando se quiere tener una visión general de la data a visualizar.
Se debe tener en cuenta que tiene que estar claro qué es lo que se desea
mostrar para poder visualizar la distribución de la data y sus densidades.
Con ello, se podrá realizar una correcta comparación de densidades.
223
Figura 126. Población hispana en Estados Unidos
Nota. John A. Dutton e-Education Institute, 2016. Recuperado de
https://www.eeducation.psu.edu/geog160/c3_p14.html
5.2.1.1.35.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
CartoDB
Datavisual
Infogr.am
Mbostock’s blocks
R Graph Gallery
224
realizado por Anderson es similar al que se encuentra en el siguiente enlace,
con la diferencia que se puede observar la población por condición racial
(Blancos, Afroamericanos, Hispanos, asiáticos, multirracial).
Para visualizarlo, se puede dirigir a la página Demographics en el siguiente
enlace: http://demographics.coopercenter.org/DotMap/
5.2.1.1.36.1 Definición
Trabaja de la misma forma que lo hacen los gráficos de áreas, excepto por el
uso de varias series de datos, cada punto inicia desde el último punto de la
serie de datos anterior.
Todo el gráfico representa el total de todos los datos. Los gráficos de áreas
apiladas también utilizan el área para transmitir números enteros, por lo que no
funciona para los valores negativos.
225
5.2.1.1.36.2 Tipos de Variables
226
https://www.packtpub.com/books/content
/line-area-and-scatter-charts
5.2.1.1.36.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
MS Excel and Apple's Numbers
DataHero
Datavisual
Google Docs
Infogr.am
OnlineChartTool
Slemma
Vega
ZingChart
227
5.2.1.1.37 Gráfico de Dispersión (Scatterplot/ Scatter Graph/ Point Graph/ X-Y
Plot/ Scatter Chart/ Scatter gram)
5.2.1.1.37.1 Definición
Se utiliza esta técnica cuando se desea analizar una data que dependen de dos
variables. Esto se realiza sobre un plano cartesiano con coordenadas cada una en
un eje X e Y.
El diagrama de dispersión tradicional representa cada objeto en un conjunto de
datos con un punto (u otra marca), posicionado en dos dimensiones ortogonales
continuas. (Sarikaya & Gleicher, 2018)
Al asignar una variable en cada eje respectivamente se puede establecer un
punto y abarcar las dos variables, con ello se puede detectar su relación.
Muchas correlaciones pueden ser interpretadas a través de los patrones
mostrados en el gráfico de dispersión. Algunos de estos son:
Positivo: Los valores incrementan formando una línea que inicia de abajo
hacia arriba
Negativo: Los valores decrecen formando una línea que inicia de arriba
hacia abajo
228
Figura 129. Diagrama de Dispersión
Nota. Data Visualization
Catalogue. Recuperado de
http://www.datavizcatalogue.c
om/methods/scatterplot.html
Se utiliza esta técnica cuando se desea analizar una data que dependen de
dos variables.
229
Cuando se desee identificar patrones de comportamiento de la data
analizada.
Agregar una línea de tendencia permite que se pueda tener una mayor
claridad del gráfico.
Se puede variar los tamaños de los puntos en caso se quiera mostrar una
variable de la data.
31
Cfr. Sarikaya & Gleicher, 2018
230
Figura 130. Diagrama de Dispersión
Nota. Washington Post, 2012. Recuperado de
http://www.washingtonpost.com/wp-srv/special/health/healthy-life-
expectancy/
5.2.1.1.37.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
RAW (Under Alluvial Diagram)
SankeyMATIC
Tamc
231
5.2.1.1.38 Espiral de Caracol (Spiral plot /Time Series Spiral)
5.2.1.1.38.1 Definición
Este tipo de visualización comienza desde el centro de la espiral y se desarrolla
hacia afuera. Toma la forma de un espiral de Arquímedes. Se utiliza con barras,
líneas o puntos.
Se puede hacer uso de colores para asignar a un periodo, y de ese modo
distinguirlo.
232
El gráfico espiral es de ayuda cuando se quiere mostrar patrones
periódicos.
233
raphic-of-the-day/worlds-largest-tree-of-life-
visualizes-50000-species-across-time
5.2.1.1.38.5 Herramientas
Se puede elaborar dicha técnica en herramientas como:
ZingChart
5.2.1.1.39.1 Definición
Es una técnica que permite mostrar una lista de eventos que sucedieron de forma
cronológica. En algunos casos se diagraman en cascada como también en
algunos casos se muestra lineal.
234
Figura 133. Línea de tiempo
Nota. Data Visualization Catalogue.
Recuperado de
http://www.datavizcatalogue.com/methods/tim
eline.html
Variable Ordinal.
Si se basa en escalas, las líneas de tiempo pueden ser utilizados para ver
cosas que ocurren o van a ocurrir, permitiendo al usuario evaluar los
intervalos de tiempo entre eventos.
235
Permiten acercar o alejar la línea de tiempo para poder ver desde un
plano general como más específico los datos, ayuda a que se pueda
realizar un análisis más profundo de los datos.
5.2.1.1.39.4 Herramientas
Se puede elaborar dicha técnica en herramientas como:
Google Charts
Timeline.js
Tiki- Toki
Vega
5.2.1.1.40.1 Definición
Los gráficos de área son una variación de los gráficos de líneas, ya que el área
por debajo de la línea se rellena con un determinado color o textura. Para
elaborarlos, primero se trazan los puntos de datos en un plano de coordenadas
cartesianas y luego se unen a través de una línea entre los puntos. Finalmente, se
rellena el espacio debajo de la línea completa.
Existen dos variantes populares de los gráficos de áreas: agrupados y gráficos de
áreas apiladas. Los gráficos de áreas agrupadas comienzan desde el mismo eje
cero. En el caso de los gráficos de áreas apiladas, cada serie de datos inicia
desde el punto izquierdo de la serie de datos anterior.
236
Figura 134. Gráficos de área
237
5.2.1.1.40.4 Cuando no utilizarlo
5.2.1.1.40.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
MS Excel & Apple Numbers
238
D3 (code)
DataHero
Datamatic
Google Charts
Google Docs
Infogr.am
Protovis
Slemma
Vega
OnlineChartTool.com
5.3.1 Introducción
Existen herramientas relacionadas a la representación gráfica de la información
con el objetivo de ayudar a los usuarios a poder entender con mayor claridad
grandes cantidades de data y con ello, tomar decisiones con mayor precisión.
No obstante, hoy en día se cuenta con diferentes proveedores que, en algunos
casos centran su atención únicamente en el concepto de Business Intillegence,
dejando de lado conceptos complementarios.
239
Esto trae como consecuencia que no se encuentra una referencia o evaluación
enfocada netamente en las funcionalidades de herramientas de Data
Visualization sino de Business Intelligence y Analytics.
Metodología de Gartner
240
cuales los proveedores son evaluados para conocer qué tanto dan soporte en
estos aspectos. Estos tipos de evaluación son los siguientes:
Casos de uso:
Análisis Descentralizado:
Se evalúa el soporte de un flujo de trabajo a partir de datos hasta el análisis
detallado de autoservicio.
BI Embebido:
Implica que la herramienta pueda soportar un flujo de trabajo desde la data hasta
qué tanto pueda ser el contenido embebido en un proceso o aplicación.
Despliegue Extranet:
Implica el soporte a un flujo de trabajo similar al aprovisionamiento ágil BI
centralizado para el cliente externo, o en un sector público, el acceso de los
ciudadanos al contenido analítico.
241
este proyecto permite distinguir ciertas características que se toman en cuenta
para la elección de las herramientas a evaluar. Estos son:
Infraestructura
6. Gestión de Plataforma BI
7. BI Cloud
8. Gestión de seguridad y usuarios
9. Conectividad de fuentes de datos
Gestión de Datos
10. Gestión de Gobierno y Metadata
11. Extracción, transformación y carga (ETL) y Almacenamiento de Datos
12. Auto preparación de Data
Bajo este tipo de criterios los resultados del cuadrante mágico de Gartner fueron los
siguientes:
242
Figura 136. Cuadrante Mágico de Gartner Business Intelligence y Analytics Platorms 2016
Nota. Recuperado de Gartner Inc., 2016
243
consta de datos generales de las empresas proveedoras y una breve reseña de las
características de las herramientas y empresas que lo utilizan actualmente.
244
Figura 137. Descripción General de los Productos
Nota. Elaboración propia
245
Power BI32
Esta herramienta de Microsoft cuenta con diferentes presentaciones en
diferentes plataformas. Los productos que conforman Power BI son:
Power BI Cloud
Esta versión de Power BI es un servicio soportado en la nube y se puede
acceder a través de una cuenta Office 365. Está conformado por tres pilares
los cuales son Paneles, Informes y Conjunto de datos.
Power BI Desktop
Esta versión de Power BI es compatible para escritorio. No varía de gran
forma con respecto a la versión cloud. Desktop tiene todas las funciones
necesarias para conectar la información sobre los datos, darle forma,
visualizarla y compartirla de forma rápida a través de Power BI (Cloud).
Power BI Mobile
Esta versión se encuentra disponible en los sistemas operativos Android, IOS
y Windows Phone. A diferencia de las versiones cloud y desktop, esta
aplicación no soporta la edición de algún informe, reporte, no obstante, se
enfoca en la visualización, compartir e interacción con los iconos de los
paneles e informes, además de permitir la visualización de los paneles a
través del Apple Watch.
32
Cfr. Microsoft Power BI, 2016.
246
Power Map: permite visualizar data en 3D a nivel geográfico.
Tableau33
Tableau Software presenta la herramienta mostrando tres principales productos.
Tableau Online
Una de sus características principales es que se encuentra soportada bajo la
plataforma de Tableau Server, lo cual hace que también tenga la velocidad,
disponibilidad y seguridad de dicho producto sin la necesidad de tener un
hardware. Permite la colaboración y visualización distribuida de dashboards.
Tableau Server
Es una plataforma de análisis de negocio el cual tiene un soporte para grandes
cantidades de usuarios. Su principal enfoque es a nivel corporativo, tiene alta
disponibilidad, se ejecuta en ambas máquinas físicas y virtuales y provee
integración en cluster. Permite compartir modelo de datos, definir las fuentes
de datos, incluir metadata para usarlo de forma colaborativa con la seguridad
correspondiente. Por otro lado, resalta la colaboración entre usuarios por lo
que también se puede acceder de forma móvil, disponible en los sistemas
operativos Android y IOS.
Tableau Desktop
33
Cfr. Tableau Software, 2016
247
Esta versión de Tableau permite crear y publicar vistas, reportes y dashboards
en Tableau Server. Permite conectar un reporte a distintas fuentes de datos,
ver relaciones entre la data, crear dashboard, modificar metadata y finalmente
publicarlo en Tableau Server.
Qlik Sense34
Esta herramienta se presenta en distintas plataformas las cuales se encuentran
conectadas entre sí. Los productos son:
34
Cfr. Qlik Sense, 2016
248
integrados, todo dentro de un framework de gobierno que proporciona
escalabilidad empresarial.
249
Figura 138. Requerimientos Técnicos de las Herramientas
Nota. Elaboración propia
250
5.3.4 Criterios de Evaluación
Para lograr evaluar dichas herramientas nos enfocaremos en determinados
criterios que para el propósito de este proyecto son relevantes. A continuación,
explicaremos cuales son:
Costo: En este criterio se evaluarán los precios de las licencias por las
ediciones que posee cada herramienta de forma anual. En caso no exista algún
costo por licencia, se tomará en consideración algún otro costo por requisitos
previos.
TCO: Total Cost of Ownership es un análisis que cubre todos los costos por los
que se puede incurrir al adquirir un software durante su ciclo de vida.
Para dicho análisis se evalúen diferentes criterios, los cuales se agrupan en
distintas categorías:
Hardware, Plataformas
Aplicaciones, Salarios
Cargos de servicios
252
tomaremos en cuenta la siguiente consideración y bajo esa premisa se
determinarán los costos:
Para la implementación, uso y mantenimiento de la herramienta se contará
con 3 miembros.
253
Tableau Año 1 Año 2 Año 3
Hardware
Computadora 1265,63
Software
Windows Server
1209
2012 R2
Tableau server 3000
Google Chrome 0
Gastos operativos
Luz 5576.69 5576.69 5576.69
Internet 596.91 596.91 596.91
Actualizaciones y
750 750
soporte
Personal
174000 174000 174000
administrador
Total 185648,23 180923.6 180923.6
Figura 141. Evaluación TCO Tableau Server
Nota. Elaboración propia
254
cloud y realizar publicaciones, esto quiere decir que los costos incurridos en
dicha herramienta cubren tanto implementar indistintamente la versión
Desktop y Cloud, a diferencia de Tableau y Qlik Sense que sólo cubren una
sola versión de cada una, puesto que, si se quisiera considerar la versión cloud,
los costos serían mayores.
255
Figura 143. Cuadro de Cantidad de Gráficos soportados por cada herramienta
Nota. Elaboración propia
Customización
Sobre este punto se evaluará qué tanto la herramienta tiene la capacidad para
poder amoldarse. Tomaremos en cuenta características en base al desarrollo que
se pueda realizar y API’s disponibles (cuantos y cuales).
256
Power BI
Obtener grupos
257
Tableau
A diferencia de Power BI, esta herramienta provee dos tipos de API:
Javascript API y REST API.
Javascript API: permite integrar vistas en aplicaciones web.
REST API: Algunas funciones que permite realizar son:
Gestión de aprovisionamiento
Permisos
Publicar en Tableau Server o Tableau Online vía HTTP.
Otorga accesos a las funcionalidades detrás de las fuentes de
datos, proyectos, libros de trabajo, usuarios del sitio y sitios.
Estos accesos permiten crear aplicaciones customizadas o
interacciones via script con los recursos del servidor.
Por otro lado, con respecto al grado de flexibilidad de la herramienta a
través de los recursos de desarrollo, Tableau cuenta con lo siguiente:
Tableau SDK: Haciendo uso de los lenguajes de programación C,
C++, Java o Python se puede crear extractos de cualquier data y
luego publicarlos.
Qlik Sense
258
cada una de ellas permite realizar diversas actividades de acuerdo a cómo
se vaya a proceder. Si bien se encuentran distribuidos de esa forma, son del
tipo Javascript, REST y .NET.
En el caso de aquellos del tipo Javascript, estos son con los que se cuenta:
Extension API
Backend API
Root API
App API
Bookmark API
Field API
Global API
Navigation API
Selection API
Table API
Variable API
Visualization API
Esta relación de APIs son utilizados cuando es del tipo REST. En ese caso
permite administrar data, configurar información y autenticación. Estos
son:
Qlik Sense Proxy Service API
259
Construcción de aplicaciones en Windows: Qlik Sense ofrece el
.NET SDK con el propósito de integrar la herramienta a
aplicaciones Windows (.NET).
Seguridad
Para esta sección se tomará en consideración las formas de autenticación por los
que un usuario puede ingresar tanto a la herramienta como a las fuentes de
datos.
Power BI
Autenticación de usuarios:
Se encuentra basado en una serie de solicitudes, respuestas y reenvíos
entre el navegador del usuario y el servicio de Power BI o de los
servicios de Azure utilizados por Power BI. Esa secuencia describe el
proceso de autenticación de usuarios en la herramienta. Dicha secuencia
se muestra a continuación.
260
servicio de Power BI utiliza HTTPS. La solicitud se envía al Azure
Traffic Manager.
2. El Azure Traffic Manager comprueba registro DNS del usuario para
determinar el centro de datos más cercano donde se despliega Power
BI, y responde al DNS con la dirección IP del cluster WFE a la que
el usuario debe ser enviada.
3. El WFE (Cluster dentro de la arquitectura de Power BI) luego re
direcciona al usuario a la página de inicio de sesión del servicio de
Microsoft online.
261
AAD, el clúster WFE consulta al Servicio Global de Power BI, que
mantiene una lista de los “tenants” y las ubicaciones de los cluster Back
End de Power BI, y determina qué cluster del servicio de Power BI
contiene el “tenant” del usuario. Luego, el cluster WFE, indica al
usuario el cluster de Power BI donde reside el “tenant” y devuelve un
conjunto de artículos al navegador del usuario:
Token de seguridad de AAD
Información de la sesión
La dirección web del cluster Back End del usuario.
7. El navegador del usuario contacta el Azure CDN específico con el fin de
descargar la colección de archivos comunes especificados necesarios
para permitir la interacción del navegador con el servicio de Power BI.
La página del navegador incluye entonces el token AAD, la información
de la sesión, la ubicación de la agrupación asociada Back End, y la
colección de archivos descargados de la agrupación Azure CDN y WFE,
durante la duración de la sesión del navegador del servicio de Power BI.
262
Autenticación de usuario a nivel de fuentes de datos:
Sobre este punto, es importante recalcar que una vez que las
visualizaciones son dependientes de que las fuentes de datos soporten el
Role Level Security (RLS).
Si una fuente de datos soporta el Role Level Security (RLS), el servicio de
Power BI aplicará la seguridad a nivel de roles y los usuarios que no tengan
suficientes credenciales para acceder no podrá ver dicha data.
Tableau
263
Opciones de Conexión a Base de Datos Preguntas sobre seguridad a nivel de datos
¿Los filtros
¿Es posible
de usuarios
seguridad a ¿Son
son la única
Cuenta de inicio de nivel de base compartidos
forma de
sesión a la base de Modo autenticación de datos por entre usuarios
restringir
datos utiliza… usuario en los caches
qué data
Tableau Web?
cada usuario
Server?
puede ver?
Credenciales
embebidos: El libro de
trabajo o el editor de
fuente de datos puede No Sí Sí
Usuario y contraseña incrustar sus
credenciales de base
de datos.
Aquellas respuestas marcadas con asterisco indican que la razón por la cual se
menciona que no es debido a que puede crear resultados inesperados, por lo
cual Tableau no recomienda esta modalidad.
264
Qlik Sense
Al igual que Power BI, Qlik Sense tiene una secuencia para la
autenticación, el cual consiste en:
20. El módulo de autenticación obtiene la identidad del usuario y
credenciales.
21. El módulo de autenticación solicita un sistema externo para verificar las
credenciales utilizadas por la identidad del usuario.
22. El usuario accede a Qlik Sense utilizando el Ticket API, Session API,
cabeceras HTTP o SAML.
265
Atributo Basado en Control de Accesos (ABAC): Este método
consiste en que el usuario solicita realizar acciones en recursos y se les
es concedido en la medida que cuente con los atributos
correspondientes. Atributos de Active Directory, LDAP y fuentes de
datos son cagados en Qlik Sense.
Reglas de Seguridad: Son los que definen las capacidades del usuario
en los recursos de la herramienta. Estas reglas están asociadas a los
atributos asignados al usuario. El acceso es dado si por lo menos una
regla de seguridad es verdadera de los atributos del usuario.
5.3.6 Conclusiones
Para llegar a un resultado que nos permita escoger la herramienta a utilizar en
nuestro proyecto, tomaremos en cuenta dos grandes premisas desarrolladas: las
consideraciones base y los criterios de evaluación.
Como ya se ha detallado al inicio de este documento, el cuadrante mágico clasificó
a distintas herramientas en los cuatro cuadrantes, para ello tomaron en cuenta
capacidades críticas. Los resultados cuantitativos de la evaluación realizada por
Gartner fueron los siguientes:
266
Como se puede observar en el extracto de los resultados de las capacidades críticas
de Gartner, Microsoft es quien obtiene mayor calificación a diferencia de los
demás.
Por otro lado, con respecto a los criterios de evaluación, se había hecho mención
que la capacidad de gráficos soportados en cada herramienta tendría un gran peso al
momento de la evaluación. Tomando eso en cuenta, quien obtuvo mayor cantidad
de gráficos soportados fue Tableau. Esto nos permite ver que la primera opción
estaría entre Power BI y Tableau.
Si evaluamos las herramientas en un rango del 1 al 5, tomando en cuenta todos los
aspectos mencionados anteriormente, la priorización de las tres herramientas como
resultado de la evaluación final del benchmarking, es el siguiente:
267
5.4 Arquitecturas de las herramientas
268
A través del Back End cluster, el cliente puede interactuar con el servicio de Power
BI, se encarga de gestionar las visualizaciones, dashboards de los usuarios, datasets,
reportes, almacenamiento de datos, conexiones con la data, actualización de la data
y otros aspectos. Dentro de sus componentes se encuentra el Gateway role, es una
compuerta por donde se canaliza las solicitudes del usuario y las respuestas del
servicio de Power BI. Sólo es a través de este componente que el usuario puede
interactuar. Asismismo, el Azure API Management es un componente que contará
con las mismas capacidades del Gateway role eventualmente y son estos dos los
que pueden verificar la autenticación, autorización, protección DDoS, balance de
carga, routing y otras funcionalidades.
Como se puede visualizar en la arquitectura más adelante, bajo el Gateway role y
Azure API Management , se encuentran los compomentes Presentation Role, Data
Role, BJP Role (Background Job Processing Role) y el Data M Role (Data
Movement Role). Cada uno de estos son llamados respectivamente dependiento el
tipo de solicitud que haga el cliente, si el cliente solicita visualizar un dashboard el
Gateway role recibe y acepta dicha solicitud y se lo envía al Presentation Role para
poder obtener la data que se visualizaría en el dashboard.
En cuanto al almacenamiento de data, el servicio de Power BI tiene dos grandes
repositorios, Azure Blob y Azure SQL Database. En el caso de la data que es
actualizada por los usuarios se almacena en el Azure Blob, mientras que la
metadata y artefactos del sistema mismo son almacenadas en Azure SQL Database.
En cuanto a las conexiones a distintas fuentes de datos, Power BI tiene
compativilidad con 60 servicios, los se han podido agrupar bajo dos categorías:
Cloud y On premise. Los que son almacenados en la nube se encuentran divididos
en aquellos servicios que son de Office 365, Azure y Non Azure. En el caso de
algunos servicios, se requiere un puente el cual ayude a tener una transferencia
segura de los datos y para ello, en el caso de todos los servicios que se conecten al
servicio de Power BI, deben conectarse con el Enterprise Gateway.
Finalmente, Power BI cuenta con una versión Desktop, el cual sólo tiene conexión
a los servicios on premise y puede publicar los informes en el servicio de Power BI
en la nube. También existe una versión de Gateway Personal de mejora la
tranferencia segura de datos, no obstante sólo aplica para ciertos servicios on
premise.
269
Figura 148. Arquitectura Lógica de Power BI
Nota. Elaboración propia
270
Tabla 9 : Descripción de la arquitectura de Power BI
Información de
Modulo Responsabilidad
Implementación
271
Información de
Modulo Responsabilidad
Implementación
Contiene la colección de
archivos comunes
especificados necesarios para
Azure CDN Servicio
permitir la interacción del
navegador con el servicio de
Power BI.
272
Información de
Modulo Responsabilidad
Implementación
Es un requisito para la
.Net 4.5 Framework instalación del Power BI
Desktop
Es un requisito para la
Internet Explorer instalación del Power BI Navegador
Desktop
Versión Desktop de la
Power BI Desktop Desktop
herramienta Power BI
273
Información de
Modulo Responsabilidad
Implementación
274
caso de los que son on premise, se encontrarán almacenados en un servidor, por el
cual se tiene un fácil acceso a través de la versión Desktop de la herramienta.
Información de
Componente Responsabilidad
Implementación
275
Información de
Componente Responsabilidad
Implementación
Server accesos.
Power BI
Servidor donde aloja el Gateway
Gateway Servicio
Enterprise
Enterprise
Azure
Database Grupo de servicios de Azure Servicio de Base de Datos
Server
Non Azure
Database Grupo de servcios no azure Servicio de Base de Datos
server
Office 365
Database Grupo de servicios de Office 365 Servicio de Base de Datos
Server
276
Información de
Componente Responsabilidad
Implementación
Azure Blob
Base de Datos donde se aloja
Database Base de Datos
metadata del servicio Power BI
Server
Power BI
Se aloja Power BI Desktop
Workstation
On premise
Grupo de servicios/bases de datos on
database
premise
server
Nota. Elaboración propia
Diagrama de Componentes
277
Figura 151.1Diagrama de Componentes de Power BI
Ilustración -
Nota. Elaboración propia
Componente Responsabilidad
Azure Traffic Comprueba el registro DNS del usuario para determinar el centro
Back End Cluster Cluster que contiene los componentes del servicio de Power BI
Azure Blob Base de datos que contiene data de los informes, dashboards
278
Componente Responsabilidad
279
Componente Responsabilidad
Microsoft Dynamics
Base de datos cloud Non Azure
CRM
Registros de
Base de datos cloud Azure
Auditoría de Azure
280
Componente Responsabilidad
Engagement
Microsoft Dynamics
Base de datos cloud Azure
NAV
Spark en HDInsight de
Base de datos cloud Azure
Azure
Almacenamiento de
Base de datos cloud Azure
Blobs de Azure
Microsoft Dynamics
Base de datos cloud Azure
Marketing
Almacenamiento de
Base de datos cloud Azure
tablas de Azure
Almacenamiento de
Base de datos cloud Azure
datos SQL de Azure
281
Componente Responsabilidad
Auditoría de Base de
Base de datos on premise
Datos SQL
282
Tabla 12 : Descripción los conectores del diagrama de componentes de Power BI
Conector Responsabilidad
Use Indica que un componente hace uso de los recursos del otro
Diagrama de Despliegue
283
Tabla 13 : Descripción del diagrama de despliegue de Power BI
Componente Responsabilidad
Servidor de
Aloja el servicio Azure Traffic Manager
Aplicaciones
Base de Datos Blob Base de Datos donde se aloja metadata del servicio Power BI
Base de Datos SQL Base de Datos donde se aloja datos de los informes, dashboards
Servidor de Base de
Aloja las bases de Datos On premise
Datos On premise
Servidor de Base de
Aloja las bases de Datos cloud Non Azure
Datos Non Azure
Servidor de Base de
Aloja las bases de Datos cloud Azure
Datos Azure
Servidor de Base de
Aloja las bases de Datos cloud Office 365
Datos Office 365
Nota. Elaboración propia
284
5.4.2 Arquitectura de Tableau Server
285
live, los conectores de datos de Tableau envían sentencias SQL o MDX a las bases
de datos directamente. Mientras que, si se opta por una conexión In memory
permite extraer la data solicitada.
Finalmente, con el propósito de dar a conocer las restricciones, se agrupó las bases
de datos con las que puede conectarse Tableau Server según el tipo de conexión que
requieren, esto son: Bases de datos con conexión ODBC, Base de datos con
conexión Nativa, Base de Datos con conexión JDBC y Conexión a Web Service.
Información de
Modulo Responsabilidad
Implementación
286
Información de
Modulo Responsabilidad
Implementación
Proceso encargado de la
navegación y los permisos en
Application Server Proceso
las interface web y mobile de
Tableau Server
287
Información de
Modulo Responsabilidad
Implementación
288
Información de
Modulo Responsabilidad
Implementación
Tableau Server.
289
Figura 154. Arquitectura Física de Tableau Server
Nota. Elaboración propia
Información de
Componente Descripción
Implementación
290
Información de
Componente Descripción
Implementación
Server accesos.
291
Información de
Componente Descripción
Implementación
Diagrama de Componentes
Componente Responsabilidad
292
Componente Responsabilidad
Gateway/ Load
Encargado de enviar todas las solicitudes a los componentes
Balancer
Amazon Elastic
Base de Datos con conexión ODBC
MapReduce
Cisco Information
Base de Datos con conexión ODBC
Server
293
Componente Responsabilidad
Pivotal Greenplum
Base de Datos con conexión ODBC
Database
ParAccel Analytics
Base de Datos con conexión ODBC
Database
294
Componente Responsabilidad
Amazon Elastic
Base de Datos con conexión JDBC
Mapreduce
Conexión Web
Conexión a Web Service
Service
Nota. Elaboración propia
295
Tabla 17 : Descripción los conectores del diagrama de componentes de Tableau
Conector Responsabilidad
Diagrama de Despliegue
296
Figura 156. Diagrama de Despliegue de Tableau Server
Nota. Elaboración propia
Componente Responsabilidad
Equipo que aloja Tableau Desktop, Internet Explorer y
Computadora
navegadores compatibles.
297
Componente Responsabilidad
Datos de Tableau
Servidor de Base de
Datos con conexión Aloja las bases de Datos con conexión ODBC
ODBC
Servidor de Base de
Datos con conexión Aloja las bases de Datos con conexión Nativa
Nativa
Servidor de Base de
Datos con conexión Aloja las bases de Datos con conexión JDBC
JDBC
Servidor de Base de
Datos con conexión a Aloja las bases de datos y servicios con conexión a web service
Web Service
Nota. Elaboración propia
298
módulo en el proxy solicita a un sistema externo para verificar la identidad y
credenciales recibidas, ya sea al Hub o al QMC (Qlik Management Console). Esta
tranferencia la puede realizar utilizando el Ticket API, Session API, cabeceras
HTTP o SAML. Posee integración con proveedores de autenticación como por
ejemplo Active Directory.
Cuando el usuario accede, el proxy se conecta con el Engine, el cual es el motor
indexado para data en memoria. Permite visualizaciones auto servicio, búsqueda y
cálculos en tiempo de ejecución. Este puede conectarse con el Qlik Sense Scheduler
el cual es el componente que coordina las actualizaciones de la data. Este
planificador admite recargas de aplicaciones basadas en el tiempo, dependencias,
etc. Este componente al igual que el Engine puede conectarse con el Qlik Sense
Repository el cual es el almacén centralizado de configuración y gestión de la
información de la plataforma. Este componente gestiona definiciones de usuario, la
seguridad y muchos otros elementos de la plataforma. Por otro lado el Qlik Sense
Applications se componen de datos, un modelo de datos, y la capa de presentación.
Estas aplicaciones se almacenan persistentemente en un sistema de archivos y se
cargan en la memoria por el Qlik Sense Engine conforme los usuarios lo soliciten.
Finalmente, Al igual que en la arquitectura de Tableau Server, con el propósito de
dar a conocer las restricciones, se agrupó las bases de datos con las que puede
conectarse Qlik Sense según el tipo de conexión que requieren, esto son: bases de
datos con conexión ODBC, conexión Salesforce, bases de datos con conexión
SAPSQL y Conexión REST y bases de datos con conexión Nativa.
299
Figura 157. Arquitectura Lógica de Qlik Sense Enterprise
Nota. Elaboración propia
Información de
Modulo Responsabilidad Implementación
Navegadores Cliente
300
Información de
Modulo Responsabilidad Implementación
búsqueda y cálculos en tiempo
de ejecución
Almacén centralizado de
Qlik Sense Repository configuración y gestión de la Repositorio
información de la plataforma
Se componen de datos, un
Qlik Sense Applications modelo de datos, y la capa de Archivos
presentación
301
Información de
Modulo Responsabilidad Implementación
Qlik Sense
Permite la conexión a
Conexión Salesforce
Salesforce
302
Figura 158. Arquitectura Física de Qlik Sense Enterprise
Nota. Elaboración propia
Información de
Componente Responsabilidad Implementación
Mobile
Navegadores en dispositivos móviles
Browser
303
Información de
Componente Responsabilidad Implementación
Database
Server Servidor donde se aloja Salesforce Servidor de Base de Datos
Salesforce
304
Diagrama de Componentes
Componente Responsabilidad
305
Componente Responsabilidad
Directory la herramienta y sus respectivos permisos
MySQL Enterprise
Base de Datos con conexión ODBC
Edition
306
Componente Responsabilidad
Conector Responsabilidad
Indica que un componente se conecta con otro componente,
Connect
para el intercambio de información
Use Indica que un componente hace uso de los recursos del otro
Diagrama de Despliegue
307
Figura 160. Diagrama de Despliegue Qlik Sense Enterprise
Nota. Elaboración propia
Componente Responsabilidad
Servidor de Base de
Aloja el repositorio
Datos
Servidor de Base de
Datos con conexión Aloja las bases de Datos con conexión ODBC
ODBC
308
Componente Responsabilidad
Servidor de Base de
Datos con conexión Aloja las bases de Datos con conexión SAPSQL
SAPSQL
Servidor de Base de
Datos con conexión Aloja las bases de Datos con conexión REST
REST
Servidor de Base de
Datos con conexión Aloja las bases de Datos con conexión Nativa
Nativa
Servidor de Base de
Datos con conexión Aloja las bases de Datos con conexión Salesforce 13.0
Salesforce
Nota. Elaboración propia
309
5.5 Pruebas de Concepto
Para la elaboración de las pruebas de concepto, se hizo uso de lo siguiente:
Dashboard 01 – Ventas
310
Dashboard 02 – Ventas Canales
Dashboard 03 – Productos
311
Dashboard 04 – Marketing
Dashboard 05 – Logística
312
Dashboard 06 – Regiones
313
Monto de Ventas por Categoria de Diagrama Sankey (Sankey
Producto y Canal Diagram)
314
Monto de Ventas vs Monto de Ventas Gráfico de barras apiladas (Stacked
Planificado por Canal Bar Graph)
315
CAPÍTULO 6 Resultado del Proyecto
En este capítulo se presentan los Lineamientos de uso y diseño de las técnicas de Data
Visualization acompañados de un proceso propuesto para su óptima aplicación.
316
6.1 Lineamientos de Uso y diseño
Los lineamientos están basados en cuarenta (40) técnicas de Data Visualization.
Para la elección de dichas técnicas se tomó como referencia la página web Data
Visualization Catalogue, elaborado por Severino Ribecca35, el cual se encuentra
especializado en el tema.
Ejemplo de Aplicación
Ejemplos de uso
35
Véase: http://www.severinoribecca.one/
317
enfoques principales que permiten englobar el propósito de cada una de las
técnicas.
Estos enfoques son utilizados por herramientas de visualización de datos como Qlik
eazyBI y de otro enfoque como Hubspot. Nacen del conocido gráfico elaborado por
Andrew Abela, PhD, “Choosing a Good Chart” (2006), el cual a su vez fue
inspirado del libro Saying It With Charts de Gene Zelazny. No obstante, dicho
gráfico sólo agrupa cuatro grupos de presentación: Comparación, Composición,
Distribución y Relación. Bajo ese esquema, el gráfico se encuentra distribuido y por
cada uno de ellos existen subgrupos como la cantidad de variables, en el tiempo,
cambiante o estático, identificando en su totalidad, veintiún (21) técnicas. En esta
ocasión, debido a que la cantidad de técnicas investigadas es cuarenta, se tomaron
en cuenta dichas agrupaciones, agregando tres más bajo la necesidad de hacer notar
el enfoque principal de cada técnica.
A continuación se presentan los lineamientos de uso y diseño clasificados en
enfoques y tomando en cuenta el tipo de variable que utilizan.
318
6.1.2.1 Comparación
Este enfoque permite comparar las magnitudes de los valores entre sí y puede ser utilizado para hallar de manera sencilla los valores
máximos y mínimos de la data. De la misma forma permite comparar valores actuales versus valores anteriores o planificados36.
Técnicas de Lineamientos
Tipo de
Data
Variable Lineamientos de Uso Lineamientos de Diseño
Visualization
Escala
Gráfico de -Se debe considerar el valor cero en el eje (Y) numérico como valor -Se recomienda hacer uso de un color para mostrar las barras. En caso se
nominal con
Barras (Bar inicial, para que al usarlo la gráfica se entienda. [7] quiera asignar distintos colores puede apoyarse de una leyenda. [62]
valores
Chart)
discretos -Tomar en cuenta la forma en la que desee mostrar las barras, pues su
alteración (adornos) impacta en que tan bien pueda comunicarse o verse
la data en la gráfica. [137]
-Evitar hacer uso de barras 3D. Este gráfico será más efectivo en la
-Permite conocer cuántos datos existen por distintas categorías. [70]
medida que sea conciso y simple para su rápido entendimiento. [61]
Gráfico de Escala de -Permite visualizar rápidamente las variables. [72] Su diseño puede ser de dos formas, partiendo del eje Y o del eje X.
36
Cfr. Lundblad, 2016
Barras Radial intervalos Ambos casos son confusos de interpretar por lo cual no se recomienda
(Spiral Plot) con valores -Evitar su uso cuando se desconoce la forma de interpretar dicha utilizarlo. [125]
discretos técnica. Por lo general tiende a ser malinterpretado debido a que la
última barra hacia afuera sobresale pese a que pueda tener el mismo
valor que los demás. [25] Utilizarlo implica una mala práctica [125].
Este gráfico dificulta identificar aspectos de periodicidad y serie de
manera efectiva.[138]
320
-No utilizarlo si lo que se ingresa es data cruda como por ejemplo
cantidad de población. (Primero se debe normalizar las cantidades
con el espacio de la región, de este modo, por ejemplo, se podría
calcular la densidad de población de cada región). [74]
321
Spider Chart/ valores -Es útil cuando se quiere conocer qué variables tienen valores [87]
Web Chart/ discretos similares o si es que existen valores atípicos en cada variable. [26]
Polar Chart/ Star Las variables que puedan ser analizadas deben encontrarse en iguales
Plots) términos de comparación, es decir normalizados de acuerdo al tipo
de escala a utilizarse. [142]
Gráfico de -Es útil cuando se desea comparar dos a más data sets por
Barras Multi Set Escala categorías/variables. [83]
(Multi-set Bar nominal y Se puede asignar diferentes colores por cada subgrupo (data set), los
Chart/ Grouped/ valores cuales permite identificarlos en cada categoría. [83]
Clustered Bar discretos -Es útil cuando se quiere realizar comparaciones entre mini
Charts) histogramas.[83]
322
6.1.2.2 Composición
Este tipo de enfoque permite visualizar un conjunto de datos y cómo es que se pueden dividir por partes. Tiende a mostrar data a nivel de
porcentajes o cantidades totales.
Técnicas de Lineamientos
Tipo de
Data
Variable
Visualization Lineamientos de Uso Lineamientos de Diseño
Escala
Gráfico de
nominal y -En caso lo que se quiera distinguir es la diferencia entre las proporciones -Toma en cuenta el largo del arco , pues su alteración afecta la
anillos (Donut
valores de las variables/ categorías.[96] perspectiva del usuario incurriendo en una mala interpretación.[146]
Chart)
discretos
-Es utilizado para visualizar data en categorías, haciendo uso de un par de
Gráfico variables.[25]
Si los segmentos (Categorías) no se encuentran alineados
Marimekko Intervalos y -Si lo que se desea es obtener una vista panorámica de la data.[97] continuamente como si se tratase de un gráfico de barras, se
(Marimekko valores
Chart/ Mosaic continuos -En caso se desconozca cómo interpretar este tipo de gráfico, se recomienda no utilizarlo, pues se dificulta realizar las comparaciones
Plot) recomienda no utilizarlo, debido a que no son tan fáciles de interpretar entre estos.[25]
sobre todo si es que son muchos segmentos.[97]
-Es útil cuando lo que se quiere analizar son proporciones y porcentajes -Cuando existen muchos valores, se vuelve más dificultoso
de determinadas categorías a considerar dentro del gráfico, divididos por entenderlo.[99] Se recomienda mantener menos de seis partes
segmentos en un círculo.[98] divididas [67]
Gráfico Pie -Se recomienda utilizarlo cuando se quiere comparar un segmento o - Se recomienda mantener un orden al mostrar las partes, desde el
Cuantitativa
(Pie Chart) categoría frente al total, para identificar la relación que guarda.[8] más grande hasta el más pequeño [67]
-Evita cambiar el radio de las partes divididas del pie, ya sea por la
proporción de la data o como impacto visual, esto puede influenciar
en la percepción del usuario [146]
323
-No se recomienda su uso, cuando se pretende comparar diferentes
conjuntos de datos en distintos gráficos de pie.[99]
Gráfico de Escala de -En caso de los gráficos de barras apiladas simples, se utiliza cuando se -No se recomiendo su uso en caso hay una gran cantidad de
barras apiladas intervalos y desea mostrar el total de las cantidades considerando las barras.[101] segmentos a mostrar en la barra. Esto dificulta realizar
(Stacked Bar valores comparaciones cuando posee distintas cantidades de segmentos y/o
Graph) continuos cuando no tiene la misma base de categorías.[100]
-En caso de los gráficos de barras apiladas al 100%, se utiliza cuando lo
que se desea es visualizar las diferencias relativas cuantitativamente de
cada segmento.[101]
-Es útil cuando se desea comparar valores para dar una rápida vista de los
Gráfico de tamaños relativos de la data, sin el uso de escalas.[102]
Área -No hacer uso de la longitud de la figura a utilizar, lo que se debería
Proporcional Cuantitativa realizar es calcular el espacio para determinar el tamaño, de lo
-Es útil cuando su uso es netamente para comunicar la información, no
(Proportional contrario se mostraría incrementos y bajas exponencialmente.[103]
para análisis.[103]
Area Chart)
-Es útil cuando lo que se desea es estimar valores.[103]
324
6.1.2.3 Distribución
Este tipo de enfoque engloba a todas aquellas técnicas que permiten ver cómo los valores cuantitativos están distribuidos a lo largo de los
ejes o agrupaciones del menor a mayor valor. Permite distinguir a través de la forma, características como el rango de valores, tendencia
central, forma, valores dispersos, etc.37.
Técnicas de Lineamientos
Tipo de
Data
Variable
Visualization Lineamientos de Uso Lineamientos de Diseño
-Mantener una cierta cantidad de líneas (5-7)(Ley de Miller), si el
gráfico se recarga o tiene muchas líneas, es más dificultoso para el
Cuantitativa - -Se utiliza con mayor frecuencia para mostrar tendencias y relaciones
usuario captar la información.[21] En caso de tener más líneas se
Gráficos de Escala de (cuando se agrupan con otras líneas).[104]
recomienda distinguir la línea con mayor relevancia y asignar otro
líneas (Line intervalos y
color neutro a los demás [68]
Graph) valores
-Los gráficos de líneas ayudan a dar una "visión global " sobre un
continuos -Utilizar distintos colores para diferenciar las líneas y agregar una
intervalo, para ver cómo se ha desarrollado a lo largo de un período
leyenda para ello .[68]
determinado.[105]
Sets paralelos Su diseño visual discreto permite manejar la frecuencia de categorías y
Cualitativo -Se utiliza cuando se quiere mostrar data categórica.[50]
(Parallel Sets) la relación entre estas[50]
Diagrama de
-Es utl cuando se pretende mostrar la data distribuida de forma Es útil cuando se comparan las distribuciones entre muchos grupos o
caja (Box and Cuantitativa
resumida.[51] conjuntos de datos (ocupa poco espacio).[114]
Whisker Plot)
Gráfico de -Es útil cuando se quiere tener una vista general de la distribución de la Cuando se tiene dos conjuntos de datos, se puede graficar a través de
Cuantitativo
Tallo y Hoja data.[114] una variación de la técnica (doble tallo) para poder comparar los
37
Cfr. Lundblad, 2016
325
(Stem and valores de los dos conjuntos de datos.[114]
Leaf plot/ -Es útil si se quiere saber si es que se tiene valores atípicos.[114]
Stemplot/
Setm & Leaf
Display) -Si es que se cuenta con mucha data en el conjunto, se vuelve
complicado de analizar, por el contrario, si es que se cuenta con muy
poca data, no tiene sentido utilizar la técnica .[114]
326
6.1.2.4 Relación
Este tipo de enfoque permite visualizar las relaciones, dispersión o agrupaciones que pueda presentar la data.
327
-Si lo que se quiere conocer es una vista general que permita la
interpretación, mas no el detalle de éste.[118]
-Es útil si lo que se quiere es identificar las relaciones entre grupos
o entidades.[119] La asignación de colores es importante para diferenciar las
Diagrama de acorde categorías, no obstante se recomienda que sólo se muestren una
Cualitativa -Es utilizado en el campo de ciencias biológicas.[120]
(Chord Diagram) cantidad reducida de categorías, de tal modo que las relaciones no
-Esta técnica no suele ser claro cuando lo que se quiere es analizar se vean cargadas, causando poca claridad en la gráfica. (**)
gran cantidad de data.[120]
Diagrama de acorde sin Al igual que el diagrama de acorde es importante asignar colores
Es útil cuando se desea mostrar las relaciones que existe en un
cinta (Non-ribbon Chord Cualitativa por categorías, si son varios nodos, agruparlos y asignar un color
conjunto de datos. [121]
Diagram) y descripción(***)
-Es útil cuando se desea mostrar la transferencia/desplazamiento de
Escala de
un objeto en particular (Ej: Energía, dinero, materiales, etc).[53] -En caso se tenga categorías, se puede hacer uso de esta técnica
Diagrama Sankey nominal con
-Es útil cuando lo que se quiere mostrar es el mapeo de diferentes tomando en cuenta la asignación de colores para lograr la
(Sankey Diagram) valores
distinción de las categorías.[122]
discretos. dominios o el mapeo de distintos caminos involucrados en un
proceso [53]
Lluvia de ideas/ Mapa
-A menudo es útil en la fase inicial de un proyecto y el trabajo -No es útil en caso se tenga valores numéricos, pues esta técnica
mentales (Brainstorm/ Cualitativa
como una forma de toma de notas.[27] se enfoca en mostrar premisas, valores del tipo cualitativo.[27]
Mind-Maps)
-Considerar el espacio a utilizar para la la visualización de la
-Se utiliza cuando se desea realizar comparaciones entre la data de
técnica. No se recomienda usarlo en caso el espacio donde se
diferentes conjuntos.[123]
quiera mostrar es pequeño.[123]
Diagrama de Venn (Venn
Cualitativa
Diagram/ Set Diagram) -En caso se requiera manejar de forma más flexible la data no es
-Se utiliza cuando se quiere conocer la relación entre data de
recomendable su uso pues es limitante (comparaciones/
diferentes conjuntos.[124]
contrastes).[123]
328
6.1.2.5 Proporción
Este tipo de enfoque resalta la magnitud o cantidad de un determinado conjunto de datos frente a otros. Es decir, se agrupan métodos de
visualización que utilizan el tamaño o el área para mostrar diferencias o similitudes entre los valores o un conjunto38.
38
Cfr. Ribecca, 2016
329
6.1.2.6 Patrones
Este conjunto de técnicas tiene como principal enfoque mostrar formas de comportamiento dentro de la data, los cuales cuentan con un
significado.
330
-No se recomienda utilizarlo cuando la cantidad de data produce que
existan demasiadas burbujas, ya que pueden hacer que el gráfico se vuelva
difícil de entender. [87] un caso particular sería agregar el tiempo como
una variante más, el cual apoyado de una animación permitiría ver cómo
los datos han cambiado a través del tiempo [142] por tanto el
comportamiento de los datos sería el enfoque principal y no la cantidad a
mostrarse.
331
-Si no se tiene claro cómo proceder a realizar este gráfico (cálculo
de los puntos a mostrar, cuánto equivaldrán, densidad) es posible
que la información que se llegue a mostrar no sea la correcta o no
sea la que se quiere mostrar en un principio. [90]
332
6.1.2.7 Tendencia
Este enfoque agrupa a todas aquellas técnicas que permiten visualizar data en intervalos o periodos de tiempo. Es importante considerarlo
debido a que simulaciones tempo-dependientes y data variante en el tiempo se encuentran en casi toda disciplina científica. Este tipo de data
es dinámica naturalmente y puede ser categorizada como un comportamiento diferente39. Tomando esto en cuenta, a diferencia del esquema
inicial, elaborada por Andrew Abela, en el cual dicha característica es contemplada dentro de los grupos Comparación y Composición, en
esta ocasión se opta por separarlos de dichos enfoques para juntarlos en éste.
Técnicas de Lineamientos
Tipo de
Data
Variable
Visualization Lineamientos de Uso Lineamientos de Diseño
39
Wang, Yu & Ma, 2008
333
-Se utiliza esta técnica cuando se desea analizar una data que -Agregar una línea de tendencia permite que se pueda tener una mayor
dependen de dos variables o dimensiones.[54] claridad del gráfico.[107]
Gráfico de -Es útil cuando se desee identificar patrones de comportamiento de -Se puede variar los tamaños de los puntos en caso se quiera mostrar una
Dispersión la data analizada.[107] variable de la data.[107]
(Scatterplot/ Escala de
Scatter Graph/ intervalos con -Es útil cuando se pretende analizar data numérica y lo que se
Point Graph/ valores quiere conocer es si una variable impacta a la otra. Sin embargo, la
-En caso se quiera agregar más variables al gráfico también se puede hacer
X-Y Plot/ continuos correlación que se muestra no es casualidad, por lo que abre la
uso de la asignación de colores.[107]
Scatter Chart/ posibilidad de verificar otras variables no visibles, las cuales
Scattergram) pueden ser que influyan en el resultado.[108]
-Para una mayor comprensión del gráfico el valor del eje Y debe
-No es recomendable comparar más de dos líneas de tendencias.[108]
empezar desde cero.[107]
-Es ideal para mostrar un gran conjunto de datos, por lo general -Si los colores asignados no permiten evidenciar qué es lo que representan
para mostrar tendencias a lo largo de un periodo de tiempo.[110] es importante considerar una leyenda [110]
Espiral de Escala de
Caracol (Spiral intervalos con - Toma en cuenta mostrar de forma clara las locaciones dentro de un
plot /Time valores -Es útil cuando se quiere detectar ciclos que permitan comparar espiral. Estos dependen del tipo de data a mostrar, es decir, si se tratara de
Series Spiral) continuos conjuntos de datos periódicos [110] horas, un ciclo podría representar 24 horas y las escalas deberían mostrar
qué ángulos representan qué horas [110]
Línea de -Si se basa en escalas, las líneas de tiempo pueden ser utilizados -Permiten acercar o alejar la línea de tiempo para poder ver desde un plano
Tiempo Ordinal para ver cosas que ocurren o van a ocurrir, permitiendo al usuario general como más específico los datos. Esto ayuda a que se pueda realizar
(Timeline) evaluar los intervalos de tiempo entre eventos.[8] un análisis más profundo de los datos.[111]
Gráficos de Cuantitativa - -Los gráficos de área se utilizan para mostrar el desarrollo de -No es recomendable tratar de sobreponer las áreas, pues visualmente
área (Area Escala de valores cuantitativos durante un período de tiempo.[112] origina que el usuario pueda confundirse y malinterpretar los datos
334
Graphs) intervalos y (aparece nuevas áreas producto de la sobre posición de dos a más áreas.)
-Se utilizan normalmente para mostrar tendencias y relaciones, en
valores En ese caso se hace uso del gráfico de áreas apiladas. [113]
lugar de transmitir valores específicos.[112]
continuos
335
6.1.3 Proceso de aplicación de los lineamientos propuestos
Al elaborar los lineamientos se consideró que no sólo bastaba con que estos fueran
distribuidos según su enfoque, sino también que puedan ser entendidos de forma coherente
y utilizados bajo un orden efectivo, es por ello que se propuso los siguientes pasos a seguir
para su aplicación.
Enfoque
Técnica
Lineamientos
337
6.2.1 Propuesta 1: Investigación de Interactive Visualization en
dispositivos móviles
6.2.1.1 Introducción
La representación de datos es una forma que permite visualizar con mayor facilidad
información de lo que se podría conocer a través de grandes registros y por tanto es una
solución que ayuda a conocer información de importancia para cualquiera, sea empresa o
persona común, no obstante la presentación de este puede incluso mejorar más
dependiendo de las diferentes formas y opciones que se le pueda ofrecer al usuario para
facilitar su interpretación y experiencia de usuario. El manejo de la tecnología como parte
de nuestra vida cotidiana y organizacional va en aumento continuo, lo cual abre puertas a
que nuevas tecnologías sean utilizadas, sin embargo no se cuenta con la suficiente
investigación realizada para generar nuevas herramientas y formas en el país, como para
lograr dicho objetivo.
6.2.1.2 Problema
No se cuenta con las suficientes investigaciones que permitan emprender la realización de
nuevas soluciones tecnológicas, aplicando dispositivos móviles que aseguren nuevas
formas de visualizar información a través de la interactividad que se pueda tener con
dichos dispositivos y la presentación de la data mediante técnicas de Data Visualization,
los cuales son recursos gráficos que proporcionan una vista e interpretación fácil de la
información, todo ello con el propósito de no sólo mejorar la visualización de la
información sino incluso mejorar la experiencia del usuario.
6.2.1.3 Objetivo
Diseñar un modelo de visualización de datos aplicando Interactive Visualization en
dispositivos móviles.
338
que se puede tener con ello a través de los dispositivos móviles y sus restricciones, las
diferentes formas en las que se podría mostrar la información agrandando las posibilidades
de presentación de los gráficos y con ello mejorar la experiencia del usuario.
339
Figura 168. Caraterísticas ergonómicas
Nota. Elaborado por: Katrin Wolf, Robert Schleicher y Michael Rohs (2014)
Data Visualization
De acuerdo con Vitaly Friedman (2008), editor de la revista Smashing,
especializada para diseñadores y desarrolladores, el principal objetivo de Data
Visualization es transmitir de forma clara y efectiva información a través de
representaciones gráficas, esto implica que no necesita ser funcionalmente aburrido
o extremadamente sofisticado para que sea agradable a la vista. Para lograr que se
logre transmitir lo que se desea al usuario, se necesita que vaya relacionado la
forma estética como funcional, de esta manera se podrá llegar a comunicar los
puntos importantes de la información de forma intuitiva. No obstante, diseñadores
tienden a fallar al momento de balancear estos dos aspectos, pues crean
espectaculares gráficos, pero fallan en el propósito final, comunicar la información
340
Data Visualization se debe enfocar desde la perspectiva del usuario, que recibe la
información. Si sólo se presentan resultados analíticos en una hoja, este enfoque
podría fallar al momento de comunicar la información y su comportamiento.
Tomando en cuenta los diferentes lineamientos de uso y diseño propuestos en este
proyecto, se espera su consideración al momento de ser empleados en la aplicación
propuesta.
6.2.1.4.2 Funcionalidades
No aplica.
6.2.1.5 Requerimientos
No aplica.
6.2.1.6 Costos
No aplica.
341
6.2.2 Propuesta 2: Investigación de técnicas de visualización con
Streaming Analytics
6.2.2.1 Introducción
Los sistemas de Business Intelligence (BI), que se basan únicamente en datos
estáticos y archivados no pueden seguir el ritmo de un entorno de negocios que
exige acciones rápidas y precisas en el momento. Los negocios actuales necesitan
una nueva generación de BI, que incluya datos dinámicos, que consuma diversas
fuentes operacionales en tiempo real para exponer patrones relevantes y permitir
tomar decisiones con agilidad. A este nuevo enfoque de BI se le llama Streaming
Analytics (SA).
A diferencia del BI tradicional, que se basa en un modelo de "almacenar primero,
luego analizar", SA posee un diseño de latencia mínimo que analiza e informa
sobre eventos empresariales a medida que ocurren, permitiéndole a las
organizaciones detectar, evaluar y reaccionar ante situaciones críticas del negocio
con un tiempo prudente. Los datos que consume pueden provenir de "n" número de
fuentes tales como dispositivos de Internet of Things (IoT), smartphones y
dispositivos móviles como iPads, datos del mercado, sensores, estadísticas de una
página web, transacciones entre otras.
Asimismo, las herramientas orientadas a la visualización de datos están incluyendo
este nuevo enfoque de BI, por tanto, se debe tener siempre presente que la efectiva
visualización de cualquier tipo de gráfico, elaborado con fuentes de datos
convencionales o que actualicen en tiempo real, contribuye a darle un valor
agregado al usuario.
En el presente documento se presentará la propuesta de una investigación de
técnicas de visualización con Streaming Analytics.
6.2.2.2 Problema
Las herramientas actuales de Visualización de Datos están empezando a incluir
Streaming Analytics como una capacidad diferenciadora, no obstante, estas no le
ofrecen al usuario una mayor variedad de visualizaciones que se ajusten a la
información creciente y actualizada que este demanda para tomar decisiones ante
situaciones críticas con agilidad y beneficiar al negocio.
342
6.2.2.3 Objetivo
Diseñar un modelo de visualización de datos, considerando diversos campos de
visualización que sean factibles de usar con Streaming Analytics, abriendo nuevas
oportunidades de visualización al usuario bajo la demanda de grandes flujos de
información en tiempo real.
Streaming Analytics
Forrester (2016) define Streaming Analytics como un software que puede filtrar,
agregar, enriquecer y analizar con alto rendimiento múltiples fuentes de datos en
vivo e identificar patrones simples y complejos para proporcionar esta información
a las aplicaciones necesarias, de esta forma estas pueden detectar situaciones
oportunas, automatizar acciones inmediatas y adaptarse dinámicamente.
Business Intelligence
Gartner (2016) define Business Intelligence como un término que agrupa
aplicaciones, infraestructura y herramientas, y las mejores prácticas que te permiten
acceder y analizar información para optimizar las decisiones y el rendimiento del
negocio. A su vez, Lian y Li (2012) lo definen como el proceso de transformación
de data cruda en información valiosa para establecer estrategias efectivas, tener una
visión de la parte operativa y poder tomar mejores decisiones que sean
beneficiosas.
343
Desde distintos enfoques, los autores convergen en una misma idea, afirman que el
propósito de Business Intelligence es brindarle una ventaja estratégica al negocio
frente a sus competidores.
Internet of Things
El departamento de Investigación orientado a Internet de las Cosas (IERC),
encargado del desarrollo de proyectos financiados por los estados europeos que
tengan que ver con IoT, define Internet of Things de la siguiente manera:
“IoT es una infraestructura de redes global y dinámica, con la capacidad de ser
auto-configurada basada en estándares y protocolos de comunicación entre
plataformas, donde las “cosas” físicas y virtuales tienen identidades, atributos
físicos, personalidades virtuales y usan interfaces inteligentes que pueden ser
integradas en esta red de Información.” (IERC, 2014)
6.2.2.4.2 Funcionalidades
No aplica.
6.2.2.5 Requerimientos
No aplica.
6.2.2.6 Costos
No aplica.
344
6.2.2.8 Entregable Final
El entregable final del proyecto es un modelo de visualización de datos
provenientes de diversos campos de visualización que soporten Streaming
Analytics.
345
CAPÍTULO 7 Gestión del Proyecto
En este capítulo se explica a detalle la gestión del desarrollo del proyecto bajo los
lineamientos del PMBOK.
346
6.1 Producto Final
Para el presente proyecto se establecieron determinados entregables, los cuales se listan a
continuación.
Investigación enfocada a los conceptos, técnicas y herramientas de Data
Visualization.
Pruebas de concepto.
Roadmap de proyectos.
El producto final del proyecto son los lineamientos de uso y diseño elaborados, cuyo
principal objetivo es ser un apoyo al momento de decidir qué tipo de técnica utilizar para
representar cierto tipo de información.
347
6.2 Registro de interesados
En este documento se presenta la información de todos los interesados, así como su influencia e impacto en el desarrollo del proyecto. A
continuación, se presenta el registro de interesados.
349
lineamientos y posterior
aplicación mediante
pruebas de concepto
Universidad Teléfono: -
Memoria del
Miguel Peruana de Email: Avance, corrección de
Profesor Revisor ☐ ☐ ☐ ☒ ☐ 4 4
Ayllón Ciencias pcsimayl@upc.edu.pe la Memoria proyecto
Aplicadas
Nota. Elaboración propia
350
6.3 Matriz de trazabilidad de requerimientos
A continuación, se muestra un análisis de la matriz de trazabilidad de requerimientos, esta matriz vincula los requerimientos del proyecto
con los objetivos y entregables a desarrollar.
351
Elaborar un benchmarking
OE3: Implementar
Se requiere elaborar de la herramientas para
pruebas de concepto en la
un benchmarking de conocer sus beneficios y
DATAVIZ – herramienta previamente
las herramientas del cuales se amoldarían a las Alta 1.6.4.5 Presencial No cumplido Activo 07/09/2016
REQ004 definida, aplicando cada
rubro de Data necesidades del proyecto
uno de los lineamientos
Visualization en base a los lineamientos
gráficos propuestos.
propuestos
Se requiere la
OE3: Implementar
instalación de la
Instalación de la pruebas de concepto en la
herramienta
DATAVIZ – herramienta seleccionada herramienta previamente
seleccionada y todos Alta 1.6.9.3 Presencial No cumplido Diferido 12/10/2016
REQ005 para poder llevar a cabo definida, aplicando cada
los software
las pruebas de concepto uno de los lineamientos
requisitos para su
gráficos propuestos.
funcionamiento
Se requiere elaborar
Elaboración del entregable OE1: Analizar los
la arquitectura de las
DATAVIZ – para conocer las conceptos, técnicas y
herramientas de Data Alta 1.4.11.9 Presencial No cumplido Diferido 02/07/2016
REQ006 dependencias de las distintas herramientas de
Visualization
herramientas definidas. Data Visualization.
seleccionadas
OE3: Implementar
Se requiere elaborar Elaborar pruebas de pruebas de concepto en la
DATAVIZ – pruebas de concepto concepto para comprobar herramienta previamente
Alta 1.6.9.3 Presencial No cumplido Diferido 12/10/2016
REQ007 de los lineamientos la efectividad de los definida, aplicando cada
propuestos lineamientos propuestos uno de los lineamientos
gráficos propuestos.
Elaborar dos propuestas de OE4: Proponer dos
Se requiere elaborar proyectos en base a la proyectos profesionales
DATAVIZ –
dos propuestas de investigación realizada y a Alta alineados a la 1.7.1.2 Presencial No cumplido Diferido 08/11/2016
REQ008
proyectos. la elaboración de investigación y resultados
lineamientos. de este proyecto.
Nota. Elaboración propia
352
6.4 Matriz de asignacion de responsabilidades
A continuación, se presenta la matriz de asignación de responsabilidades de todos los involucrados del proyecto, estas responsabilidades son
designadas en función al entregable respectivo.
Función que realiza el rol en el entregable:
R (Es el responsable del entregable), C (Coordina actividades del entregable), P (Participa en la construcción/elaboración del entregable), A
(Aprueba entregable), V (Participa en el control de calidad del entregable), F (El entregable requiere su firma).
353
Matriz de Trazabilidad de
1.3.2.1.4 R,P A,C,F A,F A C V
Requerimientos
1.3.2.1.5 Matriz RAM R,P A,C,F A,F A C V
1.3.2.1.6 Matriz de Riesgos R,P A,C,F A,F A C V
1.3 Ejecución [R]
Lineamientos gráficos de
1.4.11.1 R,P A,C,F A,F A,C,F C
Data Visualization
Benchmarking herramientas
1.6.4.5 R,P A,C,F A,F A,C,F C V
de Data Visualization
Arquitecturas de las
1.4.11.9 Herramientas de Data R,P A,C,F A,F A,C,F C
Visualization
1.6.9.9 Pruebas de concepto R,P A,C,F A,F A,C,F C V
1.4 Cierre [R]
Propuestas de proyectos
1.7.1.2 R,P A,C,F A,F A,C,F C
profesionales
1.7.1.11 Memoria Final del Proyecto R,P A,C,F A,F A C A,V,F
1.7.2.5 Paper de Investigación R,P,V,F A,C,F A,F A C R,P,V,F
1.7.2.4 Poster R,P A,C,F A,F A,C,F C
Nota. Elaboración propia
354
6.5 Plan de gestión de Calidad
Se estableció un Plan de Gestión de Calidad para asegurar la calidad del proyecto
durante todas sus fases, a continuación, se detallan algunos puntos descritos en el
plan.
Cliente
Evaluar y dar seguimiento a los avances del proyecto
Aprobar los resultados del proyecto
Asesorar a los jefes de proyecto
Jefe de Proyecto
Gestionar el proyecto
Gestionar los recursos
Definir el alcance del proyecto
Coordinar con las autoridades involucradas en el proyecto
Jefe de Investigación
Cumplir con el cronograma
Realizar las investigaciones necesarias a lo largo del proyecto
Validar los avances del proyecto
6.5.2 Procedimientos
1. Procedimiento para la Planificación de la Calidad
Definir aquellos entregables que deberán pasar por el control de calidad, los
responsables de este control y como se realizara dicho proceso.
Definir aquellos certificados con los que deberá contar el proyecto para
validar que ha pasado por un proceso de control de calidad.
Definir los recursos necesarios para las pruebas de control de calidad.
Definir las fechas en el cronograma de cuando se realizarán estas pruebas de
calidad.
356
4. Procedimiento para Mejora Continua
El Jefe de Proyecto junto al Jefe de Investigación, definirán aquellas
mejoras que se podrían incluir en el proyecto en base a lecciones
aprendidas.
Gestión del
1 proyecto
DATAVIZ
1.2 Inicio
Validación y/o
Entregable pasa Entregables
Aprobación por parte
por un proceso de enviados para su Semana 5 Ciclo
1.2.2.1 Project Charter del Comité de
validación y/o validación y/o 2016-1
Proyectos, Cliente, y
aprobación aprobación
Gerente Profesor
1.3 Planificación
Validación y/o
Entregables
Entregables pasan Aprobación por parte
enviados para su Semana 4 Ciclo
1.3.1.2.1 EDT por un proceso de del Comité de
validación y/o 2016-1
QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Validación y/o
Entregables
Entregables pasan Aprobación por parte
enviados para su Semana 4 Ciclo
1.3.1.2.2 Diccionario EDT por un proceso de del Comité de
validación y/o 2016-1
QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Validación y/o
Entregables
Descripción de Entregables pasan Aprobación por parte
enviados para su Semana 4 Ciclo
1.3.1.2.4 Roles y por un proceso de del Comité de
validación y/o 2016-1
Responsabilidades QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Validación y/o
Entregables
Entregables pasan Aprobación por parte
enviados para su Semana 4 Ciclo
1.3.2.1.6 Matriz de Riesgos por un proceso de del Comité de
validación y/o 2016-1
QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Matriz de Entregables pasan Entregables Validación y/o
Semana 4 Ciclo
1.3.2.1.4 Trazabilidad de por un proceso de enviados para su Aprobación por parte
2016-1
Requerimientos QA validación y/o del Comité de
357
aprobación Proyectos, Cliente,
Gerente Profesor y QS
Validación y/o
Entregables
Entregables pasan Aprobación por parte
enviados para su Semana 4 Ciclo
1.3.2.1.5 Matriz RAM por un proceso de del Comité de
validación y/o 2016-1
QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Validación y/o
Entregables
Entregables pasan Aprobación por parte
Plan de Gestión de enviados para su Semana 4 Ciclo
1.3.2.1.2 por un proceso de del Comité de
Calidad validación y/o 2016-1
QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Validación y/o
Entregables
Entregables pasan Aprobación por parte
Plan de Gestión del enviados para su Semana 4 Ciclo
1.3.1.2.6 por un proceso de del Comité de
Alcance validación y/o 2016-1
QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Validación y/o
Entregables
Entregables pasan Aprobación por parte
Plan de Gestión de enviados para su Semana 4 Ciclo
1.3.1.2.7 por un proceso de del Comité de
Comunicaciones validación y/o 2016-1
QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Validación y/o
Entregables
Entregables pasan Aprobación por parte
Matriz de enviados para su Semana 4 Ciclo
1.3.2.1.7 por un proceso de del Comité de
Comunicaciones validación y/o 2016-1
QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Validación y/o
Entregables
Entregables pasan Aprobación por parte
Plan de Gestión de enviados para su Semana 4 Ciclo
1.3.2.1.1 por un proceso de del Comité de
Riesgo validación y/o 2016-1
QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Validación y/o
Entregables
Entregables pasan Aprobación por parte
Plan de Gestión de enviados para su Semana 4 Ciclo
1.3.2.1.3 por un proceso de del Comité de
RRHH validación y/o 2016-1
QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Validación y/o
Entregables
Entregables pasan Aprobación por parte
Plan de Gestión de enviados para su Semana 4 Ciclo
1.3.1.2.5 por un proceso de del Comité de
Cronograma validación y/o 2016-1
QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Validación y/o
Entregables
Entregables pasan Aprobación por parte
Registro de enviados para su Semana 4 Ciclo
1.3.1.2.3 por un proceso de del Comité de
Interesados validación y/o 2016-1
QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Ejecución
1.4
(2016-1)
Presentación Entregables Validación y/o
Parcial con el Punto de control enviados para su Aprobación por parte Semana 5 Ciclo
1.4.1.7
Comité de del proyecto validación y/o del Comité de 2016-1
Proyecto aprobación Proyectos, Cliente, y
358
Gerente Profesor
Validación y/o
Entregable pasa Entregables
Arquitectura de Aprobación por parte
por un proceso de enviados para su Semana 16
1.4.11.9 herramientas de del Comité de
validación y/o validación y/o Ciclo 2016-1
Data Visualization Proyectos, Cliente, y
aprobación aprobación
Gerente Profesor
Validación y/o
Entregable pasa Entregables
Aprobación por parte
Lineamientos de por un proceso de enviados para su Semana 16
1.4.11.1 del Comité de
uso y diseño validación y/o validación y/o Ciclo 2016-1
Proyectos, Cliente, y
aprobación aprobación
Gerente Profesor
Validación y/o
Entregables
Presentación Final Aprobación por parte
Punto de control enviados para su Semana 16
1.4.12.1 con el Comité de del Comité de
del proyecto validación y/o Ciclo 2016-1
Proyecto Proyectos, Cliente, y
aprobación
Gerente Profesor
Ejecución
1.6
(2016-2)
Validación y/o
Entregables
Benchmarking de Entregables pasan Aprobación por parte
enviados para su Semana 4 Ciclo
1.6.4.5 herramientas de por un proceso de del Comité de
validación y/o 2016-2
Data Visualization QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Entregable pasa Entregables
Validación y/o
Pruebas de por un proceso de enviados para su Semana 10
1.6.9.3 Aprobación por parte
Concepto validación y/o validación y/o Ciclo 2016-2
del Cliente
aprobación aprobación
1.7 Cierre
Entregable pasa Entregables Validación y/o
Propuestas de por un proceso de enviados para su Aprobación por parte Semana 13
1.7.1.2
proyectos validación y/o validación y/o Cliente y Gerente Ciclo 2016-2
aprobación aprobación Profesor
Nota. Elaboración propia
359
6.6 Plan de gestión de Riesgos
A continuación, se presenta un cuadro resumen de los riesgos establecidos para el proyecto y su análisis en relación a la probabilidad e impacto en
el desarrollo del proyecto.
Retrasos en la elaboración y
DATAVIZ- Int - Equipo de Incumplimiento en las tareas
07/04/2016 presentación de los 70%-Alta 22 4 Alta 15.40 15.4
R001 trabajo establecidas en el cronograma
entregables del proyecto
DATAVIZ- Int - El Cambio del alcance del Reuniones con Cliente / Gerente
07/04/2016 70%-Alta 22 4 Alta 15.40 15.4
R003 proyecto proyecto Profesor / Comité de Proyectos
El siguiente cuadro representa las estrategias de respuesta y monitoreo de los riesgos antes presentados.
361
reuniones en casos de Proyectos
no disponibilidad en
fechas acordadas.
Evaluación del
Validación con Cliente
Restructuración del Angela impacto del
/ Gerente Profesor /
proyecto y del Camavilca / cambio en los Incurrido
DATAVIZ-R003 Mitigar Jefe Cerrado Comité de Proyectos de 14/06/2016
cronograma planteado Jocelyn documentos ya (Problema)
los cambios en el
previamente. Jimenez definidos del
proyecto
proyecto
Búsqueda de
información en Angela Búsqueda de Acceso a fuentes
diversas fuentes Camavilca / información en bibliográficas fuera de No
DATAVIZ-R004 Mitigar Jefe No iniciado N/A
confiables que aporten Jocelyn fuentes brindadas las opciones brindadas Incurrido
al desarrollo del Jimenez por la UPC por la UPC
proyecto.
No asignar tareas
Angela Capacitar a los
críticas que cubran
Camavilca / recursos para Solicitar cambio de No
DATAVIZ-R005 Mitigar más tiempo del que Jefe No iniciado N/A
Jocelyn optimizar su recursos Incurrido
dispone el recurso
Jimenez tiempo de trabajo
para el curso.
Priorizar la búsqueda
de herramientas open Angela Búsqueda de
source, y en caso se Camavilca / herramientas Adquirir una No
DATAVIZ-R006 Mitigar Jefe No iniciado N/A
requiera, optar por la Jocelyn open source y herramienta paga Incurrido
adquisición de alguna Jimenez pagas
herramienta paga.
Nota. Elaboración propia
362
6.7 Plan de gestión de Tiempo
El Plan de Gestión de Tiempo tiene como objetivo principal colaborar en la estimación del
tiempo necesario para el desarrollo de las actividades planificadas del proyecto.
A continuación, se muestra un cuadro resumen de los tiempos planificado por cada fase del
proyecto distribuido por semanas.
364
Nuestra propuesta de lineamientos de uso y diseño no se limita a una herramienta de
visualización de datos o entorno a utilizar, pues se enfoca netamente en cómo aplicar la
técnica.
365
Recomendaciones
El usuario que requiera utilizar los lineamientos de uso y diseño debe hacerlo usando el
proceso de aplicación propuesto, de tal forma que sea efectiva la tarea de encontrar la
técnica que más se adecue a lo que necesite mostrar.
Es importante acotar que el usuario debe aplicar los lineamientos sin tener una
predisposición de la técnica que utilizará, ya que esto significaría forzar la aplicación
de una técnica que no necesariamente sea acorde con el tipo de dato que va a mostrar o
el enfoque que quiera visualizar como resultado.
366
Glosario
Total Cost Ownership: Análisis que cubre todos los costos por los que se puede incurrir
al adquirir un software durante su ciclo de vida.
367
Anexo 1 - Plan de Gestión de Comunicaciones
El Plan de Gestión de Comunicaciones deberá ser revisado y actualizado cada vez
que:
Hay una solicitud de cambio aprobada o acción correctiva que impacte los
requerimientos o necesidades de información de los Stakeholders.
Cada nueva versión de un documento debe ser subida en la misma carpeta del
documento origen.
368
Anexo 2 – Matriz de Riesgos
Tabla 39
estrategia planteada
Fecha de cambio de
Acciones realizadas
Categoría - Origen
Tipo de Estrategia
Descripción de la
Descripción del
Situación de la
Impacto (HH)
Exp al Riesgo
Exp al Riesgo
Contingencia
Probabilidad
Responsable
Cód. Riesgo
Disparador
(Costo S/.)
estrategia
Impacto
Nombre
(Horas)
Plan de
Estado
Riesgo
estado
Establecer fechas con
determinados tiempos Iniciar a tiempo
Retrasos en la
Int - Incumplimiento de holgura, que Angela la realización
elaboración y No
DATAVI Equipo en las tareas 70%- permitan cumplir con Camavilca / de los No
presentación de 22 4 Alta 15.40 15.4 Evitar iniciad N/A
Z-R001 de establecidas en el Alta las actividades Jocelyn entregables y Incurrido
los entregables o
trabajo cronograma definidas incluso de Jimenez documentos de
del proyecto
presentarse alguna gestión
eventualidad.
Establecer
Contactar a los
Reuniones fechas fijas
miembros del comité
Avances del Falta de reuniones constantes con de reuniones
o al cliente para Angela
proyecto no con Cliente / Cliente / No semanales
DATAVI Int - El 70%- presentar avances del Camavilca / No
validados a Gerente Profesor / 22 4 Alta 15.40 15.4 Mitigar Gerente iniciad con Cliente / N/A
Z-R002 proceso Alta proyecto y re-agendar Jocelyn Incurrido
tiempo por el Comité de Profesor / o Gerente
reuniones en casos de Jimenez
cliente y comité Proyectos Comité de Profesor /
no disponibilidad en
Proyectos Comité de
fechas acordadas.
Proyectos
Validación
con Cliente /
Evaluación del
Gerente
Reuniones con Restructuración del Angela impacto del
Cambio del Profesor /
DATAVI Int - El Cliente / Gerente 70%- proyecto y del Camavilca / cambio en los Cerrad Incurrido 14/06
alcance del 22 4 Alta 15.40 15.4 Mitigar Comité de
Z-R003 proyecto Profesor / Comité Alta cronograma planteado Jocelyn documentos ya o (Problema) /2016
proyecto Proyectos de
de Proyectos previamente. Jimenez definidos del
los cambios
proyecto
en el
proyecto
Acceso a
Búsqueda de
Falta de Investigación de Búsqueda de fuentes
información en Angela
Int - La información las buenas información en No bibliográficas
DATAVI 70%- 3 diversas fuentes Camavilca / No
tecnologí relacionada al prácticas de las 16 11.20 11.2 Mitigar fuentes iniciad fuera de las N/A
Z-R004 Alta Media confiables que aporten Jocelyn Incurrido
a tema del técnicas de Data brindadas por o opciones
al desarrollo del Jimenez
proyecto Visualization la UPC brindadas por
proyecto.
la UPC
Incumplimiento
de las Revisión de
No asignar tareas Capacitar a los
Int - actividades documentos de Angela
críticas que cubran recursos para No Solicitar
DATAVI Equipo asignadas a los gestión y 70%- 3 Camavilca / No
16 11.20 11.2 Mitigar más tiempo del que optimizar su iniciad cambio de N/A
Z-R005 de recursos de las entregables del Alta Media Jocelyn Incurrido
dispone el recurso tiempo de o recursos
trabajo empresas proyecto por parte Jimenez
para el curso. trabajo
virtuales de la de QS
EISC
Priorizar la búsqueda
No encontrar Implementación de herramientas open Angela Búsqueda de
Int - La No Adquirir una
DATAVI herramientas de las pruebas de 70%- 3 source, y en caso se Camavilca / herramientas No
tecnologí 16 11.20 11.2 Mitigar iniciad herramienta N/A
Z-R006 que se ajusten concepto de los Alta Media requiera, optar por la Jocelyn open source y Incurrido
a o paga
al proyecto lineamientos adquisición de alguna Jimenez pagas
herramienta paga.
Nota. Elaboración propia
370
Referencas Bibliografícas
Kelleher, C. & Wagener, T. (2011). Ten guidelines for effective data visualization in
scientific publications. Environmental Modelling & Software, 822 - 827.
Khan, M. & Shah Khan, S. (2011). Data and Information Visualization Methods, and
Interactive Mechanisms: A Survey. International Journal of Computer Applications, 1-14.
Lian, D. & Li, D. (2012). Business Intelligence for Enterprise Systems: A Survey. IEEE
Transactions on Industrial Informatics.
Ramos, S. (2011). Microsoft Business Intelligence: vea el cubo medio lleno. Alicante:
SolidQ Press.
Real Academia Española. (2014). Recuperado de http://dle.rae.es/?id=ZIkyMDs
Rodríguez, M., Nunes, S. & Devezas, T. (2015). Telling Stories with Data Visualization.
Proceedings of the 2015 Workshop on Narrative & Hypertext, 7 - 11.
Zinovyev, A. (2010). Data visualization in political and social sciences. Journal of Visual
Languages & Computing.
372
Magazine, E. (05 de 06 de 2012). Scribble Live. Recuperado el 20 de Mayo de 2016, de
http://www.scribblelive.com/blog/2012/06/05/cartesian-vs-radial-charts/
Gartner Inc. (2016). Critical Capabilities for Business Intelligence and Analytics
Platforms.
Gartner Inc. (2016). Magic Quadrant for Business Intelligence and Analytics Platforms.
O. V., & P. F. (2014). Internet of Things – From Research and Innovation to Market
Deployment. River Publishers Series in Communication. Obtenido de IERC’s River
Publishers Series in Communication.
373
R. C., & M. G. (30 de Marzo de 2016). The Forrester Wave™: Big Data Streaming
Analytics. Obtenido de Forrester Research, Inc: https://go.forrester.com/
Wolf K., Schleicher R., Rohs M. (2014) Ergonomic Characteristics of Gestures for Front-
and B
Robinson, A. H., Early Thematic Mapping in the History of Cartography. Chicago, Il.:
University of Chicago Press, (1982)
Walker, C. & Warren Rogers Associates (2016). Put Your Data on the Map: Using the
GEOCODE and GMAP Procedures to Create Bubble Maps in SAS®. SAS Global Forum
2016.
Bendix, F., Kosara, R. & Hauser, H. (2005). Parallel Sets: Visual Analysis of Categorical
Data. INFOVIS 2005.
Potter, K. (2006). Methods for Presenting Statistical Information: The Box Plot.
Visualization of Large and Unstructured Data Sets, 98-106.
Tiwari, A., Accenture & Netherlands (2016). Sankey Diagram- A Compelling, Convenient,
and Informational Path Analysis with SAS® Visual Analytics.
Sarikaya, A. & Gleicher M. (2018). Scatterplots: Tasks, Data, and Designs. IEEE
Transactions on Visualization and Computer Graphics, 402-412.
374
Ribecca, S. (2018) Recuperado de http://www.severinoribecca.one/.
Wang, C.; Yu, H.; Ma, KL. Importance-driven time-varying data visualization. IEEE
Transactions on Visualization and Computer Graphics, Vol. 14, No. 6, pp. 1547-1554
(2008).
Lundblad, P.: Dissecting How to Choose the Right Chart. Qlik Blog.
http://global.qlik.com/uk/blog/posts/patrik-lundblad/dissecting-how-to-choose-the-right-
chart (2015). August 2016.
Segel, E.; Heer, J.: Narrative Visualization: Telling Stories with Data. IEEE Transactions
on Visualization and Computer Graphics, Vol. 16, No. 6, pp. 1139-1148 (2010).
Vande, A.; Tomitsch, M.; Wimmer, C.; Boesch, C.; Grechenig, T.: Evaluating the Effect of
Style in Information Visualization. IEEE Transactions on Visualization and Computer
Graphics, Vol. 18, No. 12, pp. 2739-2748 (2012).
Pandey, A.; Manivannan, A.; Nov, O.; Satterthwaite, M.; Bertini, E.: The Persuasive
Power of Data Visualization. IEEE Transactions on Visualization and Computer Graphic,
Vol. 20, No. 12, pp. 2211-2220 (2014)
Xiaoyan Bai, X.; White, D.; Sundaram, D.: A Flexible Approach for Visualization
Development. 2010 Sixth International Conference on Signal-Image Technology and
Internet-Based Systems (SITIS), pp. 315-322 (2010).
375
Ribecca, S.: What do you want to show? The Data Visualization Catalogue.
http://www.datavizcatalogue.com/search.html. May 2016.
Hardin, M.; Hom, D.; Perez, R.; Williams, L.: Which chart or graph is right for you?
Tableau Software.
http://www.tableau.com/sites/default/files/media/which_chart_v6_final_0.pdf. June 2016.
376
Selecting the right chart type for your data. Fusion Charts.
http://www.fusioncharts.com/charting-best-practices/selecting-the-right-chart/. August
2016.
Miller, G.: The Magical Number Seven, Plus or Minus Two Some Limits on Our Capacity
for Processing Information. Phychological Review, Vol. 101, No 2, pp. 43-352 (2003).
Amidu, E.: Advantages and Disafvantages of Dot Maps. Africa Geography Blog.
http://geographymaterials.blogspot.pe/2015/07/advantages-and-disadvantages-of-dot-
maps.html (2015). May 2016.
377
Ribecca, S.: Circle Packing. The Data Visualization Catalogue.
http://www.datavizcatalogue.com/methods/circle_packing.html. May 2016.
378
Starr, B.: How to design Scatter plots. Visage. https://visage.co/data-visualization-101-
scatter-plots/ (2015). September 2016.
Ribecca, S.: Stem and Leaf Plot. The Data Visualization Catalogue.
379
Ribecca, S.: Chord Diagram. The Data Visualization Catalogue.
http://www.datavizcatalogue.com/methods/chord_diagram.html. August 2016.
Ribecca, S.: Non Ribbon Chord Diagram. The Data Visualization Catalogue.
http://www.datavizcatalogue.com/methods/non_ribbon_chord_diagram.html. May 2016.
Google Books: Say It With Charts: The Executive’s Guide to Visual Communication.
https://books.google.com.pe/books/about/Say_It_With_Charts_The_Executive_s_Guide.ht
ml?id=9WnzStbbffcC&redir_esc=y. August 2016.
Wulf, M. Migrations maps: Where are migrans coming from? Where have migranst left?
http://migrationsmap.net/#/USA/arrivals (2007) June 2017.
380
Farmer, C. Chord flow diagram with time slider. http://bl.ocks.org/carsonfarmer/11478345
(2015). June 2017.
Skau, D., Harrison, L. & Kosara R. (2015). An Evaluation of the Impact of Visual
Embellishments in Bar Charts, Eurographics Conference on Visualization, Volume 34.
Weber, M., Alexa, M. & Müller, W (2001). Visualizing Time-Series on Spirals, INFOVIS.
MacInnes, J., Riffe, T. & Spijker, J. (2013). Decomposing and recomposing the population
pyramid by remaining years of life, Population Association of Amercia 2014 Annual
Meeting Program.
Peña Aguilar J., Valencia L., Pastrana A., Nava E., Martinez A., Vivanco M. & Castañeda
A. (2014). Radar Charts Analysis to Compare the Level of Innovation in Mexico with
Most Innovative Countries in Triple Helix Schema Economic and Human Factor
Dimension, Engineering and Technology International Journal of Humanities and Social
Sciences, Vol. 8, No. 4.
Robertson, G., Fernandez, R., Fisher, D., Lee, B. & Stasko J. (2008). Effectiveness of
Animation in Trend Visualization, IEEE Transactions on Visualization and Computer
Graphics, Volume 14.
Phan D., Xiao L., Yeh R., Hanrahan P. & Winograd, T. (2005). Flow Map Layout,
Proceedings of Information Visualization.
Turner E. & Allen J. (2010) Issues in Depicting Population Change with Dot Maps,
Cartography and Geographic Information Science, 189-197.
Fischer F., Fuchs J. & Mansmann F. (2012). ClockMap: Enhancing Circular Treemaps
with Temporal Glyphs for Time-Series Data, Eurographics Conference on Visualization.
381
Skau Dr. & Kosara R. (2016). Arcs, Angles, or Areas: Individual Data Encodings in Pie
and Donut Charts, Eurographics Conference on Visualization, Volume 35.
Szigeti, S., Patrasc, J., Schnitman, D. & Diamond S. (2015). The Stacked-Stacked Bar
Graph: A new twist on an old visualization.
Guha, S., Koudas N. & Shim K. (2006). Approximation and Streaming Algorithms for
Histogram Construction Problems, ACM Transactions on Database Systems, Volume 31,
396 - 438.
Imágenes
Cohen, B. & Nightingale (s.f). F. Scienti_c American [Ilustración]. Recuperado
de http://nht.ecs.soton.ac.uk/2015/papers/2-mrodriguez.pdf
GCN Technology (2016) Tools and Tactics for Public Sector IT. Map of Foreign
Assistance [Ilustración] Recuperado de https://gcn.com/articles/2015/08/19/mission-data-
visualization.aspx?m=1
Visualizing Data (2010) How The Goverment Spends your money [Ilustración]
Recuperado de http://www.visualisingdata.com/2010/10/guardian-interactive-you-make-
the-cuts/
382
Microsoft (2014) Adding muscle to data visualization: new Power BI features [Ilustración]
Recuperado de https://blogs.microsoft.com/iot/2014/12/19/adding-muscle-to-data-
visualization-new-power-bi-features/
Dataprix (2014) Consideraciones procesos ETL en entornos Big Data: Caso Hadoop.
[Ilustración] Recuperado de http://www.dataprix.com/blog-it/big-data/consideraciones-
procesos-etl-entornos-big-data-caso-hadoop
Gartner Inc. (2016) Magic Quadrant for Business Intelligence and Analytics Platforms
[Ilustración]. Recuperado de https://www.gartner.com/doc/reprints?id=1-
2XXKCD7&ct=160204&st=sb
383
Wolf K., Schleicher R., Rohs M. (2014) Gesture vectors (grey) and median for front
(orange) and back (black, see-through view) of a tablet, drawn to scale of a tablet screen of
1280x742 pixels. [Ilustración] http://katrinwolf.info/wp-
content/uploads/2014/06/mobileHCI2014_poster_gestureCharacteristics_cameraReady.pdf
384