Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Jimenez MJ

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 385

Lineamientos de uso y diseño para

soluciones de data visualization

Item Type info:eu-repo/semantics/bachelorThesis

Authors Camavilca Rodriguez, Angela Vanesa; Jimenez Merino, Jocelyn


Alejandra

Citation [1] C. Rodriguez, A. Vanesa, J. Merino, and J. Alejandra,


“Lineamientos de uso y diseño para soluciones de data
visualization,” Universidad Peruana de Ciencias Aplicadas (UPC),
Lima, Perú, 2018.

Publisher Universidad Peruana de Ciencias Aplicadas (UPC)

Rights info:eu-repo/semantics/openAccess

Download date 15/05/2024 03:15:59

Item License http://creativecommons.org/licenses/by-nc-sa/4.0/

Link to Item http://hdl.handle.net/10757/623027


Facultad de Ingeniería

Escuela de Ingeniería de Sistemas y Computación


Carrera de Ingeniería de Sistemas de Información

LINEAMIENTOS DE USO Y DISEÑO PARA


SOLUCIONES DE DATA VISUALIZATION

Memoria del Proyecto Profesional para la obtención del Título Profesional de


Ingeniero de Sistemas de Información

Autores

U201110502, Angela Vanesa Camavilca Rodriguez


U201210250, Jocelyn Alejandra Jimenez Merino

Asesor

Perez Pichis, Roy

Lima, Marzo 2018


A nuestros padres que desde un principio han realizado muchos esfuerzos
para criarnos y educarnos, y nos han brindado su amor día a día . Les
dedicamos el resultado de nuestros años univer sitarios y los honramos por
ser nuestros padres.

2
Agradecimientos

A Dios, por bendecirnos siempre.


A nuestros padres, por su esfuerzo, guía y amor incondicional.
A nuestras hermanas, por apoyarnos infinitamente en todo momento de nuestras vidas.
A nuestros amigos, con quienes hemos estudiado, trabajado, reído y compartido momentos
únicos de nuestra vida universitaria pero sobre todo con quienes hemos forjado una amistad
sincera.
Finalmente a nuestro cliente de proyecto, Alfredo Barrientos, gracias por tu tiempo y
dedicación, y todos nuestros profesores de la carrera, de quienes nos llevamos su mentoría,
conocimiento y apoyo.

3
Resumen Ejecutivo

La visualización de datos, como medio para comprender de forma resumida y gráfica


grandes cantidades de datos, es un campo que es utilizado en diferentes sectores
empresariales, sin embargo, su principal objetivo es permitir al usuario final analizar los
datos que le permitan llegar a una conclusión o, en el caso de los negocios, tomar
decisiones estratégicas. En ese sentido, el proyecto consiste en la implementación de
lineamientos de uso y diseño basados en técnicas de Data Visualization para dar a
conocer, a aquellos usuarios que requieren estructurar y analizar data, los diferentes
aspectos que se deben tener en cuenta al momento de elegir el tipo de gráfico a utilizar para
representar un conjunto de datos, tomando en consideración las pautas a seguir para lograr
su correcta aplicación y sobre todo, permitiendo que el usuario final pueda decidir de forma
rápida y acorde a lo que requiere.
Para el desarrollo del proyecto se realiza una investigación previa de cuarenta técnicas de
visualización de datos, con la finalidad de poder conocer la utilidad de cada uno de ellos,
los tipos de datos que permiten mostrar y el contexto en los que se pueden aplicar.
A partir de ello, se desarrolla los lineamientos por cada técnica investigada,
diferenciándolos en dos grandes tipos, de uso y de diseño, agrupados en siete enfoques que
facilitan la tarea de encontrar la técnica más adecuada a lo que se necesita. Para su uso se
diseña un proceso de aplicación que ayuda al usuario a encontrar la técnica más óptima.
Los lineamientos son validados a través de pruebas de concepto. Para ello, se investiga
distintas herramientas de Business Intelligence y Data Visualization hasta encontrar y
evaluar, a través de un benchmarking, la que más se adapten a las necesidades del proyecto.
Se cuenta con una base de datos de una empresa Retail de Microsoft y con ello se utiliza el
proceso de aplicación propuesto para encontrar las técnicas que mejor se ajusten a los
indicadores establecidos con los respectivos lineamientos a considerar.
Finalmente, como medida de continuidad se elabora un roadmap de futuros proyectos que
tienen como finalidad profundizar el estudio de la visualización de datos en otros campos
similares al de Data Visualization enfocados en lograr una mayor interacción del usuario
con los gráficos para la explotación de los datos y la visualización en tiempo real.

4
Abstract

The main purpose of this project is the implementation of usage and design guidelines
based on a preview investigation of forty Data Visualization techniques. Taking this into
consideration, validate the guidelines through concept tests using a Business Intelligence
and Data Visualization tool, applying a proposed process for the guidelines usage. Finally,
as a continuity measure, a roadmap of future projects that explore de field of this
investigation.
This project initiates based on the need to help the user make their decisions faster and
easier, taking action from the moment in which those related to the Data Visualization
tools, such as developers and functional users, make use of these. The use of data
visualization techniques in a software tool without taking into account its purpose (what is
its use and how they should be used), affects the user, since, by using these solutions with
basic functionalities and not necessarily well applied, limit their capacity for analysis and
decision making.
The structure of this document is distributed in seven chapters:
Chapter one describes the general aspects of the project, the enunciation of the problem, the
main purpose of the project, as well as the proposed solutions and success indicators, with
the ones it can be judged the fulfillment of the project, and also, the detailed plans in
relation of the project management.
Chapter two describes the achievements made throughout the project through the Student
Results of the Engineering Commission and the Computer Commission of ABET.
The third chapter includes four important points, the concept of data visualization, what are
the data visualization techniques, the concept of guidelines and additional concepts like
Business Intelligence and Gartner Methodology.
In chapter four we found a review of the literature referring to the definition of the State of
the Art of the project and the cases of study of Visualization of data and its techniques,
where the contribution of each author and their conclusions are detailed.
Chapter five presents the research of the forty data visualization techniques, and the process
followed for the elaboration of the guidelines, including the benchmarking of Business

5
Intelligence and Data Visualization tools, the architecture of the evaluated tools and finally
the concept tests where the guidelines are validated and implemented.
Chapter six presents, as the result of the project, the usage and design Guidelines of data
visualization techniques, with a proposed process for its optimums application and a
roadmap of futures projects as a continuity measure.
Chapter seven details the management of the development of the project aligned with the
PMBOK guidelines.

6
Tabla de contenidos

Introducción .......................................................................................................................... 18
CAPITULO 1 Descripción del Proyecto .............................................................................. 20
1.1 Objeto de Estudio ..................................................................................................... 21
1.2 Dominio del Problema .............................................................................................. 21
1.3 Planteamiento de la Solución ................................................................................... 23
1.4 Objetivos del Proyecto ............................................................................................. 23
1.5 Indicadores de Éxito ................................................................................................. 24
1.6 Planificación del Proyecto ........................................................................................ 24
1.6.1 Alcance ............................................................................................................. 25
1.6.2 Plan de Gestión del Tiempo ............................................................................. 26
1.6.3 Plan de Gestión de Recursos Humanos ............................................................ 30
1.6.4 Plan de Comunicaciones ................................................................................... 33
1.6.5 Plan de Gestión de Riesgos .............................................................................. 33
CAPÍTULO 2 Logros por student outcomes ...................................................................... 36
2.1 Student Outcomes ....................................................................................................... 37
2.2 Acreditación EAC (Engineering Accreditation Commission of ABET).................... 37
2.2.1 Student Outcome A ............................................................................................. 37
2.2.2 Student Outcome B.............................................................................................. 42
2.2.3 Student Outcome C.............................................................................................. 50
2.2.4 Student Outcome D ............................................................................................. 52
2.2.5 Student Outcome E .............................................................................................. 54
2.2.6 Student Outcome F .............................................................................................. 55
2.2.7 Student Outcome G ............................................................................................. 57
2.2.8 Student Outcome H ............................................................................................. 59
2.2.9 Student Outcome I ............................................................................................... 61
2.2.10 Student Outcome J ............................................................................................. 67
2.2.11 Student Outcome K ........................................................................................... 68
2.3 Acreditación CAC (Computing Accreditation Commission of ABET) ..................... 71
2.3.1 Student Outcome J ............................................................................................... 71

7
CAPÍTULO 3 Marco Teórico ............................................................................................ 73
3.1 Data Visualization .................................................................................................... 74
3.2 Técnicas de data visualization .................................................................................. 76
3.2.1 Concepto .............................................................................................................. 76
3.3 Lineamientos de Uso y Diseño ................................................................................. 83
3.3.1 Lineamiento de Uso ............................................................................................. 83
3.3.2 Lineamientos de diseño ....................................................................................... 84
3.4 Business Intelligence ................................................................................................ 85
3.4.1 Concepto .............................................................................................................. 85
3.5 Metodología de Gartner ............................................................................................ 86
3.5.1 Metodologías ....................................................................................................... 86
CAPÍTULO 4 Estado del Arte ........................................................................................... 91
4.1 Revisión de la Literatura........................................................................................... 92
4.2 Casos de estudio de Data Visualization.................................................................... 94
4.2.1 Técnicas de Data Visualization ........................................................................... 94
4.2.2 Framework de estrategias de diseño .................................................................. 118
4.2.3 Modelos y métodos según los tipos de datos ..................................................... 122
CAPÍTULO 5 Desarrollo del Proyecto ............................................................................ 126
5.1 Entregables del proyecto .......................................................................................... 127
5.2 Investigación de las técnicas de data visualization ................................................. 127
5.2.1 Estructura de los lineamientos ........................................................................... 127
5.3 Benchmarking de las Herramientas de data visualization ...................................... 239
5.3.1 Introducción ....................................................................................................... 239
5.3.2 Consideraciones base ......................................................................................... 240
5.3.3 Descripción de las herramientas ........................................................................ 243
5.3.4 Criterios de Evaluación ..................................................................................... 251
5.3.5 Evaluación de Herramientas .............................................................................. 252
5.3.6 Conclusiones...................................................................................................... 266
5.4 Arquitecturas de las herramientas........................................................................... 268
5.4.1 Arquitectura de Power BI .................................................................................. 268
5.4.2 Arquitectura de Tableau Server ......................................................................... 285

8
5.4.1 Arquitectura de Qlik Sense Enterprise .............................................................. 298
5.5 Pruebas de Concepto .............................................................................................. 310
5.5.1 Proceso de elaboración ...................................................................................... 310
CAPÍTULO 6 Resultado del Proyecto ............................................................................. 316
6.1 Lineamientos de Uso y diseño .................................................................................. 317
6.1.1 Estructura de trabajo ....................................................................................... 317
6.1.2 Enfoques y Lineamientos de Uso y Diseño .................................................... 317
6.1.3 Proceso de aplicación de los lineamientos propuestos ...................................... 336
6.2 Roadmap de proyectos ............................................................................................. 337
6.2.1 Propuesta 1: Investigación de Interactive Visualization en dispositivos móviles
.................................................................................................................................... 338
6.2.2 Propuesta 2: Investigación de técnicas de visualización con Streaming Analytics
.................................................................................................................................... 342
CAPÍTULO 7 Gestión del Proyecto ................................................................................. 346
6.1 Producto Final .......................................................................................................... 347
6.2 Registro de interesados ............................................................................................. 348
6.3 Matriz de trazabilidad de requerimientos ................................................................. 351
6.4 Matriz de asignacion de responsabilidades .............................................................. 353
6.5 Plan de gestión de Calidad ....................................................................................... 355
6.5.1 Roles y Responsabilidades ................................................................................ 355
6.5.2 Procedimientos .................................................................................................. 356
6.6 Plan de gestión de Riesgos ....................................................................................... 360
6.7 Plan de gestión de Tiempo........................................................................................ 363
Conclusiones....................................................................................................................... 364
Recomendaciones ............................................................................................................... 366
Glosario .............................................................................................................................. 367
Anexo 1 - Plan de Gestión de Comunicaciones ................................................................. 368
Anexo 2 – Matriz de Riesgos ............................................................................................. 369
Referencas Bibliografícas ................................................................................................... 371

9
Índice de Tablas

Tabla 1: Definición del problema y sus causas .................................................................... 22


Tabla 2 : Descripción de los indicadores de éxito del proyecto ........................................... 24
Tabla 3 : Plan de Gestión del Tiempo .................................................................................. 27
Tabla 4 : Descripción de los riesgos ..................................................................................... 34
Tabla 5 : Evaluación TCO Power BI .................................................................................... 38
Tabla 6 : Evaluación TCO Tableau Server ........................................................................... 38
Tabla 7 : Evaluación TCO Qlik Sense.................................................................................. 39
Tabla 8 : Resultado final del Benchmarking ...................................................................... 267
Tabla 9 : Descripción de la arquitectura de Power BI ........................................................ 271
Tabla 10 : Descripción de la arquitectura física de Power BI ............................................ 275
Tabla 11 : Descripción del diagrama de componentes de Power BI .................................. 278
Tabla 12 : Descripción los conectores del diagrama de componentes de Power BI .......... 283
Tabla 13 : Descripción del diagrama de despliegue de Power BI ...................................... 284
Tabla 14 : Descripción de la arquitectura de Tableau ........................................................ 286
Tabla 15 : Descripción de la arquitectura física de Tableau............................................... 290
Tabla 16 : Descripción del diagrama de componentes de Tableau .................................... 292
Tabla 17 : Descripción los conectores del diagrama de componentes de Tableau ............. 296
Tabla 18 : Descripción del diagrama de despliegue de Tableau ........................................ 297
Tabla 19 : Descripción de la arquitectura de Qlik Sense .................................................... 300
Tabla 20 : Descripción de la arquitectura física de Qlik Sense .......................................... 303
Tabla 21 : Descripción del diagrama de componentes de Qlik Sense ................................ 305
Tabla 22 : Descripción los conectores del diagrama de componentes de Qlik Sense ........ 307
Tabla 23 : Descripción del diagrama de despliegue de Qlik Sense .................................... 308
Tabla 24 : Indicadores de Dashboards planteados en las pruebas de concepto .................. 313
Tabla 25 : Lineamientos de uso y diseño por enfoque de Comparación ............................ 319
Tabla 26 : Lineamientos de uso y diseño por enfoque de Composición ............................ 323
Tabla 27 : Lineamientos de uso y diseño por enfoque de Distribución ............................. 325
Tabla 28 : Lineamientos de uso y diseño por enfoque de Relación ................................... 327
Tabla 29 : Lineamientos de uso y diseño por enfoque de Proporción ................................ 329

10
Tabla 30 : Lineamientos de uso y diseño por enfoque de Patrones .................................... 330
Tabla 31 : Lineamientos de uso y diseño por enfoque de Tendencias ............................... 333
Tabla 32 : Registro de interesados del proyecto DATAVIZ .............................................. 348
Tabla 33 : Matriz de Trazabilidad de Requerimientos del proyecto DATAVIZ................ 351
Tabla 34 : Matriz de responsabilidades de los involucrados del proyecto DATAVIZ ...... 353
Tabla 35 : Análisis del control de calidad y auditorías del proyecto DATAVIZ ............... 357
Tabla 36 : Análisis de los riesgos del proyecto DATAVIZ ............................................... 360
Tabla 37 : Estrategias de respuesta y monitoreo de riesgos del proyecto DATAVIZ ....... 361
Tabla 38 : Gestión del tiempo de las fases del proyecto DATAVIZ .................................. 363

11
Índice de Figuras

Figura 1. Organigrama del Proyecto .................................................................................... 30


Figura 2. Arquitectura Lógica de Power BI ......................................................................... 40
Figura 3. Arquitectura Física de Power BI ........................................................................... 40
Figura 4. Diagrama de despliegue de Power BI ................................................................... 41
Figura 5. Diagrama de componentes de Power BI ............................................................... 41
Figura 6. Lineamientos de Uso y Diseño ............................................................................. 42
Figura 7. Lineamientos de uso y diseño por enfoque de Patrones ....................................... 43
Figura 8. Lineamientos de uso y diseño por enfoque de Comparación ................................ 44
Figura 9. Lineamientos de uso y diseño por enfoque de Composición ................................ 45
Figura 10. Lineamientos de uso y diseño por enfoque de Tendencia ................................... 46
Figura 11. Lineamientos de uso y diseño por enfoque de Proporción ................................. 46
Figura 12. Lineamientos de uso y diseño por enfoque de Relación ..................................... 47
Figura 13. Lineamientos de uso y diseño por enfoque de Distribución ............................... 48
Figura 14. Técnicas de Data Visualization por enfoque ....................................................... 48
Figura 15. Base de Datos Contoso – Pruebas de Concepto .................................................. 49
Figura 16. Resumen de Pruebas de Concepto ..................................................................... 49
Figura 17. Prueba de Concepto ............................................................................................ 50
Figura 18. Lineamientos de uso y diseño ............................................................................. 51
Figura 19. Tabla de precios y ediciones de las herramientas de Data Visualization............ 52
Figura 20. Arquitecturas Lógicas de Power BI, Tableau y Qlik Sense ................................ 53
Figura 21. Arquitectura Lógica de Tableau Server .............................................................. 54
Figura 22. Perfil del proyecto DATAVIZ ............................................................................ 55
Figura 23. Lineamientos de uso y diseño ............................................................................. 56
Figura 24. Benchmarking de herramientas de Data Visualization ....................................... 57
Figura 25. Memoria del proyecto DATAVIZ ...................................................................... 58
Figura 26. Articulo académico del proyecto DATAVIZ ...................................................... 59
Figura 27. Herramientas presentes en el Benchmarking ...................................................... 60
Figura 28. Benchmarking de herramientas de Data Visualization ....................................... 61
Figura 29. Project Charter del proyecto DATAVIZ ............................................................. 62

12
Figura 30. Cuadrante Mágico de Gartner Business Intelligence y Analytics Platorms 2016
...................................................................................................................................... 63
Figura 31. Tabla de requerimientos técnicos de las herramientas del Benchmarking ......... 64
Figura 32. Tabla de precios y ediciones de las herramientas de Data Visualization ............ 65
Figura 33. Tabla de descripción de herramientas ................................................................. 66
Figura 34. Tabla de técnicas de Data Visualization vs Herramientas .................................. 67
Figura 35. Lineamientos de uso y diseño ............................................................................. 68
Figura 36. Guías de instalación de las herramientas del Benchmarking .............................. 69
Figura 37. Documento de pruebas funcionales de la herramienta de Power BI ................... 70
Figura 38. Benchmarking de herramientas de Data Visualization ....................................... 70
Figura 39. Plan de Continuidad ............................................................................................ 72
Figura 40. Ejemplo de infografía .......................................................................................... 74
Figura 41. Ejemplo de Data Visualization ........................................................................... 75
Figura 42. Ejemplo de dashboard ......................................................................................... 75
Figura 43. Ejemplo de Data Visualization ........................................................................... 76
Figura 44. Cuadrante de Gartner .......................................................................................... 89
Figura 45. Ideas generales de las técnicas de análisis y representación ............................... 95
Figura 46. Lecciones aprendidas de proyectos de diseño de tableros de visualización para
empresas ....................................................................................................................... 98
Figura 47. Visualizaciones del dashboard de Youneeq ...................................................... 100
Figura 48. Propuesta para proveer una visión del uso de la visualización de información 103
Figura 49. Mortalidad del Ejército Británico por Florence Nightingale ............................ 105
Figura 50. Proceso de periodismo de datos ........................................................................ 106
Figura 51. Proceso de visualización y técnicas descritas ................................................... 108
Figura 52. Diez Directrices Para Una Efectiva Visualización de Data en Publicaciones
Científicas ................................................................................................................... 113
Figura 53. Valor codificado frente al atributo .................................................................... 115
Figura 54. Paleta de Visualizaciones Presets ..................................................................... 119
Figura 55. Grupos de Métodos para la Visualización de Datos en las ciencias políticas ... 123
Figura 56. Grupos de Métodos para la Visualización de Datos en las ciencias políticas ... 128
Figura 57. Ventas realizadas en cada cuarto de año ........................................................... 129

13
Figura 58. Gráfico de barras: Densidad de metales ............................................................ 130
Figura 59. Gráfico de Barras Radial ................................................................................... 132
Figura 60. Pirámide de Población....................................................................................... 133
Figura 61. Formas de Pirámides de Población ................................................................... 134
Figura 62. Pirámide de Población 1961.............................................................................. 136
Figura 63. Mapa Choropleth............................................................................................... 137
Figura 64. Mapa Choropleth............................................................................................... 139
Figura 65. Mapa de Burbujas ............................................................................................. 140
Figura 66. Inversiones Internacionales de China................................................................ 142
Figura 67. Gráfico Nightingale Rose .................................................................................. 143
Figura 68. Gráfico Nightingale Rose acerca de los Simpsons ........................................... 145
Figura 69. Gráfico de Columnas Radial ............................................................................. 146
Figura 70. Gráfico de Columnas Radial ............................................................................. 147
Figura 71. Gráfico Radar .................................................................................................... 148
Figura 72. Gráfico Radar .................................................................................................... 150
Figura 73. Gráfico Span ..................................................................................................... 151
Figura 74. Gráfico de Barra Multi Set ................................................................................ 153
Figura 75. Gráfico de anillos .............................................................................................. 155
Figura 76. Muertes relacionadas al VIH en Sub Saharan África 2013............................... 157
Figura 77. Gráfico Marimekko ........................................................................................... 158
Figura 78. Gráfico Marimekko ........................................................................................... 160
Figura 79. Gráfico Pie ........................................................................................................ 161
Figura 80. Gráfico de barras apiladas ................................................................................. 163
Figura 81. Gráfico de barras apiladas ................................................................................. 165
Figura 82. Gráfico de Área Proporcional ........................................................................... 166
Figura 83. Gráfico de Área Proporcional ........................................................................... 168
Figura 84. Gráficos de líneas .............................................................................................. 169
Figura 85. Porcentaje de crecimiento de la población de África desde 1970 hasta 2015 .. 170
Figura 86. Sets Paralelos .................................................................................................... 173
Figura 87. Sets Paralelos – How Fan Loyalty Change During the World Cup .................. 174
Figura 88. Diagrama de Caja .............................................................................................. 175

14
Figura 89. PBI 1991 - 2001 Perú ........................................................................................ 177
Figura 90. Gráfico de Tallo y Hoja..................................................................................... 179
Figura 91. Ejemplo del uso de un diagrama Tallo y Hoja .................................................. 180
Figura 92. Histograma ........................................................................................................ 181
Figura 93. Salario de Trabajos de TI de los últimos tres meses hasta el 28 de mayo del 2016
en Inglaterra ................................................................................................................ 182
Figura 94. Histograma de Riesgo de parto por cesárea por edad de la madre en Estados
Unidos en el 2013 ....................................................................................................... 183
Figura 95. Diagrama de árbol ............................................................................................. 185
Figura 96. Árbol Interactivo de Nadal ................................................................................ 186
Figura 97. Mapa de Conexiones ......................................................................................... 187
Figura 98. Mapa de Rutas de vuelos de Vienna International ............................................ 188
Figura 99. Mapa Interactivo Cyber ataques........................................................................ 189
Figura 100. Diagrama de arco ............................................................................................ 190
Figura 101. Diagrama de Arco - Gráfico para visualizar personajes de Los Miserables ... 191
Figura 102. Representación de la canción Für Elise de Beethoven en un diagrama de arco
.................................................................................................................................... 192
Figura 103. Diagrama de acorde......................................................................................... 193
Figura 104. Ejemplo Diagrama de Arco ............................................................................. 194
Figura 105. Rutas de Uber por Vecindario ......................................................................... 195
Figura 106. Diagrama de acorde sin cinta .......................................................................... 196
Figura 107. Vecinos de cada país de América ................................................................... 197
Figura 108. Diagrama Sankey ............................................................................................ 198
Figura 109. Lluvia de ideas ................................................................................................ 200
Figura 110. Diagrama Venn ............................................................................................... 202
Figura 111. Twitter Venn ................................................................................................... 203
Figura 112. Gráfico de matriz de puntos ............................................................................ 205
Figura 113. Pictograma ...................................................................................................... 206
Figura 114. Pictograma de la vida de Darth Vader ............................................................ 207
Figura 115. Mapa de árbol.................................................................................................. 209
Figura 116. Exportadores de uva 2014 ............................................................................... 210

15
Figura 117. Mapa de árbol circular .................................................................................... 212
Figura 118. Estructura de Macro a micronutrientes ........................................................... 213
Figura 119. Gráfico de Burbujas ........................................................................................ 214
Figura 120. Expectativa de vida vs PBI per Cápita en el 2007 .......................................... 215
Figura 121. Interactive bubble plot .................................................................................... 217
Figura 122. Mapa de Flujo ................................................................................................. 219
Figura 123. Mapa de flujo de comercio de petróleo y derivados ....................................... 219
Figura 124. Mapa Global del Tráfico 2010 ........................................................................ 221
Figura 125. Mapa de Puntos ............................................................................................... 222
Figura 126. Población hispana en Estados Unidos ............................................................. 224
Figura 127. Gráficos de Áreas Apiladas ............................................................................. 225
Figura 128. Sectores de edad de la población de Japón desde 1980 hasta 2010 ................ 226
Figura 129. Diagrama de Dispersión .................................................................................. 229
Figura 130. Diagrama de Dispersión .................................................................................. 231
Figura 131. Espiral de Caracol ........................................................................................... 232
Figura 132. Árbol de la vida ............................................................................................... 233
Figura 133. Línea de tiempo ............................................................................................... 235
Figura 134. Gráficos de área............................................................................................... 237
Figura 135. Encarcelamientos en Estados Unidos 1920 - 2006 ......................................... 238
Figura 136. Cuadrante Mágico de Gartner Business Intelligence y Analytics Platorms 2016
.................................................................................................................................... 243
Figura 137. Descripción General de los Productos ............................................................ 245
Figura 138. Requerimientos Técnicos de las Herramientas ............................................... 250
Figura 139. Precios y Ediciones de las Herramientas ........................................................ 252
Figura 140. Evaluación TCO Power BI.............................................................................. 253
Figura 141. Evaluación TCO Tableau Server .................................................................... 254
Figura 142. Evaluación TCO Qlik Sense ........................................................................... 254
Figura 143. Cuadro de Cantidad de Gráficos soportados por cada herramienta ................ 256
Figura 144. Flujo de autenticación de usuarios Power BI parte I....................................... 261
Figura 145. Flujo de autenticación de usuarios Power BI parte II ..................................... 262
Figura 146. Seguridad de Tableau ...................................................................................... 264

16
Figura 147. Extracto del Product/Service Rating on Critical Capabilities ......................... 266
Figura 148. Arquitectura Lógica de Power BI ................................................................... 270
Figura 149. Arquitectura Lógica de Power BI Desktop ..................................................... 270
Figura 150. Arquitectura Física de Power BI ..................................................................... 275
Figura 151. Diagrama de Componentes de Power BI ........................................................ 278
Figura 152. Diagrama de Despliegue de Power BI ............................................................ 283
Figura 153. Arquitectura Lógica de Tableau Server .......................................................... 286
Figura 154. Arquitectura Física de Tableau Server ............................................................ 290
Figura 155. Diagrama de Componentes de Tableau Server ............................................... 292
Figura 156. Diagrama de Despliegue de Tableau Server ................................................... 297
Figura 157. Arquitectura Lógica de Qlik Sense Enterprise ................................................ 300
Figura 158. Arquitectura Física de Qlik Sense Enterprise ................................................. 303
Figura 159. Diagrama de Componentes de Qlik Sense Enterprise..................................... 305
Figura 160. Diagrama de Despliegue Qlik Sense Enterprise ............................................. 308
Figura 161. Dashboard – Ventas ........................................................................................ 310
Figura 162. Dashboard – Ventas Canales ........................................................................... 311
Figura 163. Dashboard - Productos .................................................................................... 311
Figura 164. Dashboard - Marketing ................................................................................... 312
Figura 165. Dashboard - Logística ..................................................................................... 312
Figura 166. Dashboard - Regiones ..................................................................................... 313
Figura 167. Proceso de Aplicación de los Lineamientos.................................................... 336
Figura 168. Caraterísticas ergonómicas.............................................................................. 340

17
Introducción

El objetivo de este proyecto es implementar lineamientos de uso y diseño basados en una


investigación previa de cuarenta técnicas de Data Visualization. En base a eso, validar los
lineamientos a través de pruebas de concepto utilizando una herramienta de Business
Intelligence y Data Visualization, aplicando el proceso propuesto para el uso de los
lineamientos, y finalmente, como medida de continuidad, un roadmap de proyectos a futuro
que se asocien a la investigación.
Este proyecto se inicia en base a la necesidad de ayudar al usuario a tomar sus decisiones
más rápidas y fáciles, tomando acción desde el momento en que aquellos relacionados a las
herramientas de Data Visualization, tales como desarrolladores y usuarios funcionales,
hacen uso de estas. El uso de técnicas de visualización de datos en una herramienta de
software sin tener en cuenta su propósito (cuál es su uso y cómo deben usarse), afecta al
usuario, ya que, al usar estas soluciones con funcionalidades básicas y no necesariamente
bien aplicadas, limitan su capacidad para el análisis y la toma de decisiones
La estructura de este documento se encuentra distribuida en siete capítulos:
En el capítulo uno se describen los aspectos generales del proyecto, se enuncia la
problemática, el objetivo del proyecto, así como cuál es la solución propuesta junto a los
indicadores de éxito, con los que se medirá el cumplimiento del proyecto, también se
detallan los planes elaborados en relación a la gestión del proyecto.
En el capítulo dos se describe los logros alcanzados a lo largo del proyecto a través de los
Student Outcomes de la Comisión de Ingeniería y de la Comisión de Computación, de
ABET.
El tercer capítulo comprende cuatro puntos importantes, el concepto de Data Visualization,
qué son las técnicas de Data Visualization, el concepto de lineamiento y conceptos
adicionales como Business Intelligence y Metodología de Gartner.
En el capítulo cuatro se presenta una revisión de la literatura referida a la definición del
Estado del Arte del proyecto y diversos casos de estudio de Data Visualization y de sus
técnicas, donde se detalla el aporte de cada autor y las conclusiones obtenidas.

18
En el capítulo cinco se presenta la investigación de las cuarenta técnicas de Data
Visualization, y el proceso que se siguió para la elaboración de los lineamientos,
incluyendo el benchmarking de herramientas de Business Intelligence y Data Visualization,
la arquitectura de las herramientas evaluadas y finalmente las pruebas de concepto donde se
validan e implementan los lineamientos.
En el capítulo seis se presentan los Lineamientos de uso y diseño de las técnicas de Data
Visualization acompañados de un proceso propuesto para su óptima aplicación como
resultado del proyecto, y un roadmap de futuros proyectos como medida de continuidad.
En el capítulo siete se detalla la gestión del desarrollo del proyecto bajo los lineamientos
del PMBOK.

19
CAPITULO 1 Descripción del Proyecto

En este capítulo se describen los aspectos generales del proyecto, se enuncia la


problemática, el objetivo del proyecto, así como cuál es la solución propuesta junto a los
indicadores de éxito, con los que se medirá el cumplimiento del proyecto, también se
detallan los planes elaborados en relación a la gestión del proyecto.

20
1.1 Objeto de Estudio
El sector que es objeto de estudio en el presente proyecto es el que abarca a todas
aquellas personas relacionadas al desarrollo y uso de soluciones de Data
Visualization. En el contexto actual, se tiene conocimiento de la existencia de las
técnicas de Data Visualization, pero estas sólo son consideradas simples gráficos
que contribuyen con la visualización de información, y no como un tipo de gráfico
estructurado que posee mejores prácticas, las cuales te indican como implementar
de manera óptima el tipo de técnica seleccionada teniendo en consideración
aspectos como diseño y funcionalidad, sin perder el enfoque de como representar la
data de un manera clara y ordenada1. A su vez, el proyecto también incluye el
estudio de las herramientas de Data Visualization, que son consideradas líderes en el
mercado.

1.2 Dominio del Problema


Hoy en día los diferentes sectores empresariales, académicos y de salud a nivel
mundial dependen de la toma de buenas decisiones para llevar a cabo actividades
que les permitan operar fructíferamente en el mercado. Las organizaciones cuentan
con gran cantidad de data de las diferentes operaciones que realizan diariamente, la
cual crece exponencialmente y puede ser aprovechada de la mejor forma si es que es
procesada adecuadamente para que los gerentes y líderes puedan tomar mejores
decisiones.

Actualmente existen diversas técnicas que ayudan a mostrar la data en gráficas, que
permiten comprender y procesar la información2, no obstante, no sólo depende de la
utilización de dichos gráficos para una mayor comprensión de la data, la manera en
la que se muestra la información influye mucho en la percepción que logra tener el
usuario. Si al usuario se le dificulta comprender los gráficos que se le presenten,
elaborados con la data que él necesita para tomar decisiones sobre un punto

1
Cfr. SAS Institute Inc (2014)
2
Cfr. Kelleher, Wagener (2011)

21
relevante del negocio, no llegara al nivel de análisis esperado, lo que podría
ocasionar la toma de malas decisiones que afecten la estrategia del negocio.
Tomando esto en cuenta, el problema no necesariamente radica en el usuario, un
punto muy importante que influye es la decisión que se toma al elegir la técnica a
utilizar, con la cual se pueda explotar dichos gráficos y la información que
contienen. Se necesita que aquellos orientados al desarrollo y uso de soluciones de
Data Visualization, tengan conocimiento de las mejores prácticas de uso y diseño de
las técnicas para que, cuando las apliquen, se vea reflejado en el software y, como
consecuencia, se le brinde al usuario final no sólo un conjunto de gráficos como una
herramienta básica para su análisis, si no gráficos con una estructura que le permita
identificar lo que le sea relevante desde un plano general hasta el más específico.
En el siguiente cuadro se detalla el problema y sus causas.

Tabla 1: Definición del problema y sus causas

Problema Causas
 Dentro de la elaboración de
soluciones de Business Intelligence,
Utilizar técnicas de Data Visualization en una
el enfoque principal recae en el
herramienta software sin tomar en cuenta su
proceso de extracción,
propósito (para que sirven y como deben ser
transformación y carga de la data
usadas), impacta al usuario, ya que, al usar
dejando de lado la visualización
estas soluciones con funcionalidades básicas y
final.
no necesariamente bien aplicadas, limitan su
capacidad de análisis y de toma de decisiones,
 Uso de las técnicas de Data
independientemente de que la data mostrada
Visualization enfocadas al diseño,
sea relevante para ser utilizada.
sin considerar el tipo de dato.

Nota. Elaboración propia

22
1.3 Planteamiento de la Solución
La solución que el proyecto plantea es la definición de lineamientos de uso y
diseño, que serán elaborados tomando en cuenta las mejores prácticas de las
técnicas de Data Visualization, y que posteriormente serán implementados a
través de pruebas de concepto en una herramienta software, con el fin de
brindarle a todos aquellos orientados al uso y desarrollo de soluciones de
Data Visualization, una base estructurada de cómo aplicar dichas prácticas,
garantizando a su vez que el usuario logre captar y asimilar visualmente lo
que se busca transmitir y que es relevante dentro de la organización en la que
se encuentra.

1.4 Objetivos del Proyecto


 Objetivo General
Implementar dos tipos de lineamientos: uso y diseño, basados en las
técnicas de Data Visualization, validados en la herramienta software
Power BI a través de pruebas de concepto, y la propuesta de una cartera
de proyectos que permita el uso de los lineamientos en nuevos campos.
 Objetivos Específicos
Para que se logre el cumplimiento del objetivo general propuesto, se
establecieron cuatro objetivos específicos, los cuales están enfocados a
cada fase del proyecto.
 OE1: Analizar cuarenta técnicas y tres herramientas de Data
Visualization.

 OE2: Diseñar dos tipos de lineamientos: uso y diseño, tomando como


referencia las técnicas de Data Visualization.

 OE3: Validar las pruebas de concepto en la herramienta Power BI


aplicando los lineamientos gráficos propuestos.

 OE4: Proponer una cartera de proyectos que permita aplicar los


lineamientos en nueva tecnologías y campos de estudio.

23
1.5 Indicadores de Éxito
Los indicadores de éxito definidos para medir el logro de cada uno de los
objetivos específicos previamente planteados, son los siguientes:

Tabla 2 : Descripción de los indicadores de éxito del proyecto

Indicador Objetivo
Indicador de Éxito
de éxito Específico

Aprobación, por parte del cliente y profesor Gerente, del OE1, OE2,
IE1
Project Charter del proyecto. OE3, OE4

Aprobación, por parte del cliente, de los lineamientos de uso OE2


IE2
y diseño.

Aprobación, por parte del cliente, de las herramientas a


IE3 incluirse en el Benchmarking y el desarrollo de sus OE1
arquitecturas.

Aprobación, por parte del cliente, de la herramienta de Data


IE4 Visualization elegida para la implementación de los OE3
lineamientos propuestos.

Aprobación, por parte del cliente, de las pruebas de concepto OE3


IE5
de los lineamientos planteados.

Aprobación, por parte del cliente y profesor Gerente, de las OE4


IE6
propuestas de proyectos profesionales.

Nota. Elaboración propia

1.6 Planificación del Proyecto


Elaborar un Plan de Gestión del Proyecto está orientado a realizar una
gestión eficiente del mismo, teniendo en cuenta el tiempo estimado para las
actividades del proyecto, los recursos que se necesitarán, humanos y
materiales, limitaciones del proyecto, riesgos, entre otros. Con el fin de
brindar una visión más amplia de los aspectos que cubre el proyecto, se

24
detallaran los siguientes planes: Plan de Gestión de Alcance, Plan de Gestión
de Tiempo, Plan de Gestión de Recursos Humanos, Plan de Comunicaciones
y por último Plan de Gestión de Riesgos.

1.6.1 Alcance
El presente proyecto abarca la investigación, diseño y posterior
implementación de lineamientos orientados al uso y diseño de las
técnicas de Data Visualization, basados en las mejores prácticas y
aplicadas a soluciones de este rubro.
El alcance del proyecto está conformado por cuatro fases y se ha
contemplado para ser desarrollado en los ciclos académicos 2016-1 y
2016-2.
Para la primera fase, inicio del proyecto, se ha establecido el
siguiente entregable:
 Project Charter

Para la segunda fase, planificación del proyecto, se han establecido


los siguientes entregables, relacionados a la administración del
proyecto:
 Cronograma

 Descripción de Roles y Responsabilidades

 Diccionario EDT

 Matriz de Comunicaciones

 Matriz de Riesgos

 Matriz de Trazabilidad de Requerimientos

 Matriz RAM

 Plan de Gestión de Alcance

 Plan de Gestión de Calidad

 Plan de Gestión de Comunicaciones

25
 Plan de Gestión de Riesgos

 Plan de Gestión de RRHH

 Plan de Gestión del Cronograma

 Registro de Interesados

La tercera fase, ejecución del proyecto, se encuentra compuesta de


los entregables propios de la investigación y solución del proyecto:
 Lineamientos de uso y diseño de las técnicas de Data
Visualization

 Arquitectura de las herramientas de Data Visualization

 Benchmarking herramientas de Data Visualization

 Pruebas de concepto

La cuarta fase, cierre del proyecto, se encuentra compuesta de los


entregables finales del proyecto:
 Roadmap de proyectos

 Acta de aceptación y cierre

 Memoria final del proyecto

 Poster del proyecto

 Artículo de investigación

 Lecciones aprendidas

1.6.2 Plan de Gestión del Tiempo


El Plan de Gestión del Tiempo se encuentra orientado a gestionar el
tiempo estimado para el proyecto de tal forma que se logre el
cumplimiento de todas las actividades estipuladas en el cronograma.
A continuación, se detallan las fechas de entrega planificadas para los
entregables del proyecto, de acuerdo a sus fases.

26
Tabla 3 : Plan de Gestión del Tiempo
Fase del Fecha
Hito del proyecto Entregables incluidos Prioridad
Proyecto Estimada

Aprobación, por parte


del cliente y profesor
Inicio 07/04/2016 Project Charter Alta
Gerente, del Project
Charter del proyecto.

Cronograma
Diccionario EDT
Descripción de Roles y
Responsabilidades
Registro de Interesados
Plan de Gestión del
Cronograma
Plan de Gestión de
Aprobación, por parte
Alcance
del cliente, de la
Planificación 07/04/2016 Plan de Gestión de Alta
planificación del
Comunicaciones
proyecto.
Matriz de Comunicaciones
Matriz de Riesgos
Matriz de Trazabilidad de
Requerimientos
Matriz RAM
Plan de Gestión de Calidad
Plan de Gestión de Riesgos
Plan de Gestión de RRHH

Aprobación, por parte


Lineamientos de uso y
del cliente, de los
Ejecución 28/06/2016 diseño de las técnicas de Alta
lineamientos de uso y
Data Visualization
diseño propuestos.

27
Fase del Fecha
Hito del proyecto Entregables incluidos Prioridad
Proyecto Estimada

Aprobación, por parte


del cliente, del
Arquitectura de las
documento de
28/06/2016 herramientas de Data Alta
arquitectura de las
Visualization
herramientas del
Benchmarking.

Aprobación, por parte


del cliente, de la
herramienta de Data Benchmarking de
Visualization elegida 13/09/2016 herramientas de Data Alta
para la implementación Visualization
de los lineamientos
propuestos.

Aprobación, por parte


del cliente, de las
pruebas de concepto de 29/10/2016 Pruebas de concepto Alta
los lineamientos
planteados.

Aprobación, por parte


del cliente y profesor
Gerente, de las 21/11/2016 Roadmap de proyectos Alta
propuestas de

Cierre proyectos profesionales

Aprobación por parte Memoria Final del


del comité, de los Proyecto
22/11/2016 Alta
entregables finales del Poster
proyecto. Artículo de Investigación

28
Fase del Fecha
Hito del proyecto Entregables incluidos Prioridad
Proyecto Estimada

(Paper)

Nota. Elaboración propia

29
1.6.3 Plan de Gestión de Recursos Humanos
Este plan tiene como propósito identificar a todos los involucrados en
el proyecto, incluye a la organización, el equipo de trabajo y los
recursos internos o externos que contribuirán al cumplimiento de las
actividades. A su vez, se definen cuáles serán sus roles y
responsabilidades a lo largo del proyecto.

A continuación, se detalla el organigrama del proyecto, y


posteriormente sus roles y responsabilidades:

Figura 1. Organigrama del Proyecto


Nota. Elaboración propia

30
Comité de proyectos: Rol correspondiente al grupo conformado
por la Directora de la EISC y los coordinadores de las carreras de
ISI, ISW y CC, encargados de evaluar que el alumno cumpla con
los outcomes pertenecientes a su carrera. Con respecto a la
participación en el proyecto, el comité realizará las siguientes
funciones:
 Aprobar proyectos profesionales.

 Evaluar el avance del proyecto.

 Decidir continuidad de proyectos.

Cliente: Rol correspondiente al Cliente del proyecto, Alfredo


Barrientos, encargado de aprobar los resultados a lo largo del
proyecto; con respecto a la participación en el proyecto, el comité
realizará las siguientes funciones:
 Evaluar y dar seguimiento a los avances del proyecto.

 Aprobar los resultados del proyecto.

 Asesorar a los jefes de proyecto.

Gerente Profesor Innova TI: Rol correspondiente al gerente


profesor de la empresa virtual Innova TI, Roy Perez, encargado de
establecer y cumplir los objetivos principales de la empresa; con
respecto a la participación en el proyecto. El gerente profesor
realizará las siguientes funciones:
 Realizar un seguimiento del proyecto con el fin de evaluar si
se cumple con lo estipulado de acuerdo al cronograma
establecido.

 Brindar comentarios y observaciones de los entregables


realizados para su mejora y levantamiento antes de la
presentación de estos al cliente y comité.

31
Gerente Alumno Innova TI: Rol correspondiente al gerente
alumno de la empresa virtual Innova TI, Henry Paulett, encargado
de apoyar en el desarrollo y seguimiento de los proyectos; con
respecto a la participación en el proyecto. El gerente alumno
realizará las siguientes funciones:
 Apoyar en el monitoreo y control de las actividades
programadas del proyecto.

 Brindar las facilidades para la asignación de recursos


requeridos.

Jefe de Proyecto: Rol correspondiente al jefe de proyecto, Angela


Camavilca, responsable de la gestión y resultados del proyecto, con
respecto a la participación en el proyecto está realizará las
siguientes funciones:
 Gestionar el proyecto

 Gestionar los recursos

 Coordinar con las autoridades involucradas en el proyecto

Jefe de Investigación: Rol correspondiente al jefe de investigación,


Jocelyn Jimenez, responsable de la gestión y resultados de la
investigación del proyecto, con respecto a la participación en el
proyecto, esta será responsable de las siguientes funciones:
 Realizar las investigaciones necesarias a lo largo del
proyecto

 Validar los avances del proyecto

 Documentar los resultados de las investigaciones.

Recursos de QS: Rol correspondiente al recurso analista de QA de


la empresa Quality Services, encargado de revisar y analizar la
documentación de los proyectos, pasando estas por un proceso de

32
aseguramiento de la calidad. Con respecto a la participación en el
proyecto, el analista de QA realizará las siguientes funciones:
 Realizar tareas de validación y verificación que permitan
asegurar la calidad de los entregables del proyecto.

Diseñador Gráfico: Rol correspondiente al recurso de diseño,


encargado de construir y diseñar gráficos para los jefes de proyecto.
Con respecto a la participación en el proyecto, el diseñador realizará
las siguientes funciones:
 Apoyar en el diseño de representaciones visuales
utilizando técnicas de Data Visualization.

1.6.4 Plan de Comunicaciones


El Plan de Comunicaciones tiene como objetivo establecer los
lineamientos para la comunicación, interna y externa, del proyecto,
con el fin de mantener a los involucrados informados del avance del
proyecto, así como de cualquier eventualidad que pueda suceder.

Busca estandarizar las formas de comunicación, de esta forma, será


de libre conocimiento por parte del equipo de proyecto, los
procedimientos y medios de comunicación que deben utilizarse para
determinados fines.

Ver el anexo:
 Anexo 1- Plan de Gestión de Comunicaciones

1.6.5 Plan de Gestión de Riesgos


El Plan de Gestión de Riesgos permite identificar los posibles riesgos
inherentes al desarrollo del proyecto, establecer el impacto y la

33
criticidad de los mismos, y a su vez, plantear estrategias de
mitigación ante la posible materialización del riesgo.
La siguiente tabla detalla los riesgos identificados, su probabilidad y
su impacto en el proyecto.

Tabla 4 : Descripción de los riesgos


# Riesgo Probabilidad Impacto Estrategia de mitigación

Retrasos en la Establecer fechas con determinados


elaboración y tiempos de holgura, que permitan
1 presentación de los Media Alto cumplir con las actividades definidas
entregables del incluso de presentarse alguna
proyecto eventualidad.

Contactar a los miembros del comité


Avances del proyecto o al cliente para presentar avances
2 no validados a tiempo Baja Alto del proyecto y re-agendar reuniones
por el cliente y comité en casos de no disponibilidad en
fechas acordadas.

Cambio del alcance Restructuración del proyecto y del


3 Media Alto
del proyecto cronograma planteado previamente.

Falta de información Búsqueda de información en diversas


4 relacionada al tema del Baja Medio fuentes confiables que aporten al
proyecto desarrollo del proyecto.

Incumplimiento de las
actividades asignadas No asignar tareas críticas que cubran
5 a los recursos de las Media Medio más tiempo del que dispone el
empresas virtuales de recurso para el curso.
la EISC

6 No encontrar Baja Medio Priorizar la búsqueda de

34
herramientas que se herramientas open source, y en caso
ajusten al proyecto se requiera, optar por la adquisición
de alguna herramienta paga.
Nota. Elaboración propia
Para mayor detalle, revisar: Anexo 2- Matriz de Riesgos.

35
CAPÍTULO 2 Logros por student
outcomes

Este capítulo tiene por objetivo describir los logros alcanzados a lo largo del
proyecto a través de los Student Outcomes de la Comisión de Ingeniería y de la
Comisión de Computación, de ABET.

36
2.1 Student Outcomes
Los student outcomes son competencias que se evalúan en un Ingeniero de Sistemas
de Información de la Universidad Peruana de Ciencias Aplicadas.
Estos outcomes, son evaluados por una de las más reconocidas e importantes
acreditadoras a nivel mundial, ABET, la cual cuenta con doce outcomes para la
carrera de Sistemas de Información, entre ellas se encuentra la Engineering
Accreditation Commission (EAC), la cual se enfoca en los estándares en ingeniería
y, por otra parte, la Computing Accreditation Commision (CAC) que se enfoca en el
cumplimiento de los estándares que debe alcanzar un ingeniero a nivel de
conocimientos en computación.
En los siguientes puntos a desarrollarse, se detalla cómo se logró el cumplimiento
de cada uno de dichos outcomes en el transcurso de este proyecto, comenzando por
los 11 Student Outcomes EAC (a-k) y finalmente con el Student Outcome CAC (j)
que determina la continuidad del proyecto.

2.2 Acreditación EAC (Engineering Accreditation


Commission of ABET)
A continuación, se explica de manera detallada a través de qué entregables y/o
actividades se ha logrado cumplir con lo establecido en los once outcomes A-K de
la Acreditación EAC.

2.2.1 Student Outcome A


 Descripción:
Propone soluciones en sistemas de información aplicando principios de
matemática, ciencias, computación e ingeniería.

 Evidencia del cumplimiento:


Para el desarrollo del presente proyecto y para el cumplimiento de este
outcome en específico, empleamos los conocimientos adquiridos en diversos
cursos de nuestra currícula.

37
En relación a las ciencias y matemáticas, en el Benchmarking de
herramientas de Data Visualization, se elaboró un TCO3 para cada una de las
herramientas que estaban siendo analizadas, los resultados se muestran en las
tablas 5, 6 y 7.

Tabla 5 : Evaluación TCO Power BI


Power BI Año 1 Año 2 Año 3
Hardware
Computadora 1192.05
Software
Windows 8.1 115
Power BI pro 359.64 359.64 359.64
Office 365 e5 1260 1260 1260
.net 4.5 0
Google Chrome 0
Gastos operativos
Luz 5576.69 5576.69 5576.69
Internet 596.91 596.91 596.91
Personal Administrador 174000 174000 174000
Total 183100.29 181793.24 181793.24
Nota. Elaboración propia

Tabla 6 : Evaluación TCO Tableau Server


Tableau Año 1 Año 2 Año 3
Hardware
Computadora 1192.05
Software
Windows Server 2012
1209
R2
Tableau server 3000
Google Chrome 0
Gastos operativos
Luz 5576.69 5576.69 5576.69
Internet 596.91 596.91 596.91
Actualizaciones y
750 750
soporte

3
Total Cost of Ownership. Análisis que cubre todos los costos por los que se puede incurrir al adquirir un software durante su ciclo de
vida.

38
Personal administrador 174000 174000 174000
Total 185574.65 180923.6 180923.6
Nota. Elaboración propia

Tabla 7 : Evaluación TCO Qlik Sense


Qlik Sense Año 1 Año 2 Año 3
Hardware
Computadora 1192.05
Software
Windows Server 2012
R2 1209
Qlik Sense Enterprise 4500
Google Chrome 0
Gastos operativos
Luz 5576.69 5576.69 5576.69
Internet 596.91 596.91 596.91
Personal administrador 174000 174000 174000
Total 187074.65 180173.6 180173.6
Nota. Elaboración propia

Otro punto importante, son los conocimientos referentes al diseño de


arquitecturas, estos han sido contemplados en el desarrollo de cada una de
las arquitecturas de las herramientas presentes en el Benchmarking, Tableau,
Power BI y Qlik Sense. Para cada una de estas herramientas se desarrolló su
arquitectura lógica, arquitectura física, diagrama de componentes y diagrama
de despliegue.

39
Figura 2. Arquitectura Lógica de Power BI
Nota. Elaboración propia

Figura 3. Arquitectura Física de Power BI


Nota. Elaboración propia

40
Figura 4. Diagrama de despliegue de Power BI
Nota. Elaboración propia

Figura 5. Diagrama de componentes de Power BI


Nota. Elaboración propia

Todas las arquitecturas y sus detalles se encuentran presentes en el capítulo


6 de la presente memoria.

41
2.2.2 Student Outcome B
 Descripción:

Diseña y conduce experimentos en base al análisis e interpretación de datos


relevantes en la implementación de sistemas de información.

 Evidencia del cumplimiento:


El cumplimiento de este outcome se refleja a lo largo de la elaboración de
los lineamientos de uso y diseño hasta su validación a través de las pruebas
de concepto, el cual fue el resultado de un análisis de la información
recopilada de las cuarenta técnicas de Data Visualization investigadas y los
aspectos encontrados para poder estructurarlos en base al enfoque de lo que
cada uno de ellos muestra. A partir de la elaboración de estos, se continuó
con las pruebas de concepto los cuales, del mismo modo requirió de un
análisis para determinar los KPI que serían convenientes y se ajusten no sólo
a mostrar los lineamientos, sino también, considerando el tipo de
información de acuerdo la base de datos escogida y los dashboards a
mostrar.

Figura 6. Lineamientos de Uso y Diseño

42
Nota. Elaboración propia

Figura 7. Lineamientos de uso y diseño por enfoque de Patrones


Nota. Elaboración propia

43
Figura 8. Lineamientos de uso y diseño por enfoque de Comparación
Nota. Elaboración propia

44
Figura 9. Lineamientos de uso y diseño por enfoque de Composición
Nota. Elaboración propia

45
Figura 10. Lineamientos de uso y diseño por enfoque de Tendencia
Nota. Elaboración propia

Figura 11. Lineamientos de uso y diseño por enfoque de Proporción


Nota. Elaboración propia

46
Figura 12. Lineamientos de uso y diseño por enfoque de Relación
Nota. Elaboración propia

47
Figura 13. Lineamientos de uso y diseño por enfoque de Distribución
Nota. Elaboración propia

Figura 14. Técnicas de Data Visualization por enfoque


Nota. Elaboración propia

48
Figura 15. Base de Datos Contoso – Pruebas de Concepto
Nota. Elaboración propia

Figura 16. Resumen de Pruebas de Concepto


Nota. Elaboración propia

49
Figura 17. Prueba de Concepto
Nota. Elaboración propia

2.2.3 Student Outcome C


 Descripción:
Diseña sistemas, componentes o procesos para encontrar soluciones en la
atención de necesidades teniendo en cuenta restricciones económicas,
sociales, políticas, éticas, de salud y seguridad y otras propuestas del
entorno empresarial.
 Evidencia del cumplimiento:
Todo proyecto está enfocado en resolver una necesidad, en este caso, la
necesidad que abordamos, está enfocada en el uso que se le da a las técnicas
de Data Visualization, es por eso que la solución que se plantea es la
definición de lineamientos de uso y diseño, que fueron elaborados tomando
en cuenta las mejores prácticas de las técnicas de Data Visualization, y que
posteriormente fueron implementados a través de pruebas de concepto en
una herramienta software, con el fin de brindarle a todos aquellos orientados
al desarrollo de soluciones de Data Visualization, una base estructurada de
cómo aplicar dichas prácticas, garantizando a su vez que el usuario logre
captar y asimilar visualmente lo que se busca transmitir y que es relevante
dentro de la organización en la que se encuentra.

50
Figura 18. Lineamientos de uso y diseño
Nota. Elaboración propia

En relación al tipo de restricciones, estas son abordadas en el desarrollo del


Benchmarking de herramientas donde se definieron criterios de evaluación,
entre ellos los precios y ediciones de las herramientas, así como se llevó a
cabo la elaboración del TCO, anteriormente mencionado.

51
Figura 19. Tabla de precios y ediciones de las herramientas de Data Visualization
Nota. Elaboración propia

2.2.4 Student Outcome D


 Descripción:

Participa en equipos multidisciplinarios liderando o desarrollando sus


tareas eficientemente con profesionales de diferentes especialidades o
dominios de aplicación.

 Evidencia del cumplimiento:


Como parte del desarrollo de nuestro proyecto contamos con la colaboración
de diversos interesados en campos como: arquitectura de software, diseño
gráfico, Business Intelligence, UX y UI, entre otros.
Para el desarrollo y elaboración del benchmarking, se contó con la asesoría
de un especialista en herramientas de Business Intelligence, el cual nos
ayudó a corroborar e interpretar la información encontrada en la

52
documentación de las herramientas evaluadas (Power BI, Tableau, Qlik
Sense), permitiéndonos del mismo modo corroborar las arquitecturas
elaboradas, los cuales muestran el funcionamiento de dichas herramientas.
Asimismo, para la elaboración de las pruebas de concepto se realzaron KPI’s
los cuales también fueron revisados por el especialista a fin de mostrar
indicadores que realmente sean usados en el mundo laboral actualmente.

Figura 20. Arquitecturas Lógicas de Power BI, Tableau y Qlik Sense


Nota. Elaboración propia

Del mismo modo, para la elaboración de las arquitecturas de las


herramientas de Data Visualization (arquitectura lógica, arquitectura física,
diagrama de componentes y diagrama de despliegue), contamos con la
asesoría de un especialista en Arquitecturas de Software.
Por otro lado, un especialista en UX y UI, nos apoyó revisando los
lineamientos de uso y diseño elaborados a fin de corroborar que la
información plasmada sea el más útil.
Finalmente, uno de los principales entregables del presente proyecto es el
Poster que resume todo el trabajo realizado, elaborado en conjunto con un
alumno de la carrera de Diseño Gráfico. También contamos con su apoyo
para la elaboración de la versión final de las Arquitecturas de las
herramientas.

53
Figura 21. Arquitectura Lógica de Tableau Server
Nota. Elaboración propia

En la imagen de arriba, se evidencia la asesoría del especialista en


Arquitectura de Software, así como el aporte del Diseñador Gráfico.

2.2.5 Student Outcome E


 Descripción:
Identifica y analiza problemas de negocio o tecnológicos dentro del ciclo de
vida de un sistema de información con alcance empresarial o inter
empresarial.
 Evidencia del cumplimiento:
La primera parte del presente proyecto consistió en poder identificar una
problemática del mundo real y formular una posible solución de la misma.

Se identificó que aquellas personas orientadas al desarrollo de soluciones de


Data Visualization, hacen uso de técnicas establecidas, sin tomar en
consideración las mejores prácticas, el no utilizarlas puede crear no solo
fallas al momento de transmitir la información, sino que puede ser
malinterpretada por el usuario, llegando a limitar su capacidad de análisis e
incluso pueden hacer que éste incurra en una mala toma de decisiones.

54
Es por dicha problemática que el proyecto establece objetivos que deberán
ser cumplidos a través de indicadores de éxito, los cuales buscan ayudar a
solucionar la problemática identificada y así aportar valor a la sociedad.
Todos los puntos antes mencionados, problemática y propuesta de solución,
están plasmados en diversos entregables del proyecto, tales como: Project
Charter, Memoria y Perfil del Proyecto.

Figura 22. Perfil del proyecto DATAVIZ


Nota. Elaboración propia

2.2.6 Student Outcome F


 Descripción:
Propone soluciones en sistemas de información con responsabilidad
profesional y ética.
 Evidencia del cumplimiento:
Cada uno de los pasos que se han realizado a lo largo del proyecto se han
efectuado siguiendo criterios de responsabilidad profesional y ética.
Tomando en cuenta el código de ética y práctica profesional de la ACM
(Association for Computing Machinary), a lo largo de este proyecto se ejerció
distintos principios, por ejemplo, aquellos relacionados con el cliente. Cuando se

55
elaboró los lineamientos de uso y diseño, benchmarking y pruebas de concepto,
además de conseguir la aprobación de nuestro asesor, se tomó en consideración
las observaciones y recomendaciones de otros especialistas que se encuentren
relacionados a Data Visualization a nivel de las técnicas como de las
herramientas, siendo ellos los expertos en dichos campos y que pueden revisar de
una forma más detallada el aporte y trabajo realizado. Por otro lado, otros
principios aplicados, son aquellos relacionados con el juicio y producto. Al
elaborar el benchmarking se evaluaron las herramientas con objetividad tomando
como refuerzo y base el cuadrante mágico de Gardner para determinar las
herramientas a considerar y luego la documentación respectiva de cada una de
ellas siendo siempre de las páginas oficiales.

Figura 23. Lineamientos de uso y diseño


Nota. Elaboración propia

56
Figura 24. Benchmarking de herramientas de Data Visualization
Nota. Elaboración propia

2.2.7 Student Outcome G


 Descripción:
Comunica ideas o resultados orales o escritos con claridad y efectividad a
públicos de diferentes especialidades y niveles jerárquicos.

 Evidencia del cumplimiento:


El cumplimiento de este outcome a nivel oral, se logró con las continuas
presentaciones acerca del avance de nuestras actividades al Comité, Cliente
y Profesor Gerente.
En relación a la parte escrita, dos entregables principales resumen este punto.
En primer lugar, la memoria del proyecto donde se encuentra plasmado todo
el desarrollo del proyecto, desde su concepción, hasta el detalle de cada uno

57
de los entregables y anexos que se elaboraron para cumplir a cabalidad los
objetivos.
En segundo lugar, el artículo académico de nuestro proyecto enfocado a los
lineamientos de uso y diseño, elaborado con la asesoría del profesor David
Mauricio, el cual sigue estándares y formatos definidos por un Congreso
Internacional.

Figura 25. Memoria del proyecto DATAVIZ


Nota. Elaboración propia

58
Figura 26. Articulo académico del proyecto DATAVIZ
Nota. Elaboración propia

2.2.8 Student Outcome H


 Descripción:
Identifica el impacto de las soluciones en sistemas de información en el
contexto global, económico y del entorno en la sociedad.
 Evidencia del cumplimiento:
Para la elaboración de las pruebas de concepto se procuró primero realizar
una evaluación de las herramientas existentes con respecto a la visualización
de datos, es por ello que primero se realizó un benchmarking tomando en
cuenta el impacto de estos y cómo es que podrían afectar en nuestro
proyecto. En cuanto al contexto global, se tomó en consideración buscar las
herramientas que actualmente son reconocidos y, para poder saber esto, se

59
tomó como referencia el Cuadrante Mágico de Gardner de Business
Intelligence y Analytics, el cual evalúa diferentes herramientas de empresas
a nivel mundial. Por otro lado, en cuanto el aspecto económico, uno de los
criterios de evaluación fue los precios por ediciones de las tres herramientas
consideradas (Power BI, Tableau y Qlik Sense). Finalmente, en el aspecto
sociedad, otro criterio que se tomó en cuenta dentro de la evaluación fue un
TCO (Total Cost Ownership), el cual permite conocer todos los costos que
implica hacer uso de dichas herramientas en un entorno de negocio.

Figura 27. Herramientas presentes en el Benchmarking


Nota. Elaboración propia

60
Figura 28. Benchmarking de herramientas de Data Visualization
Nota. Elaboración propia

2.2.9 Student Outcome I


 Descripción:
Actualiza los conocimientos en metodologías, técnicas, herramientas por ser
necesarios para mantener la vigencia en el desarrollo de sistemas de
información.
 Evidencia del cumplimiento:
Al ser un proyecto orientado a investigación, los conocimientos obtenidos a
lo largo de estos casi diez meses han sido amplios y variados, hemos
reforzado conceptos ya adquiridos como la metodología de Gestión de
Proyectos – PMBOK, la cual nos ha permitió realizar la gestión del proyecto
en su totalidad, esto se ve reflejado en los documentos de gestión elaborados
en la etapa de planificación del proyecto.

61
Figura 29. Project Charter del proyecto DATAVIZ
Nota. Elaboración propia

Documentos de Gestión elaborados en el proyecto:


 Descripción de Roles y Responsabilidades

 Diccionario EDT

 Lecciones aprendidas

 Matriz de Riesgos

 Matriz de Trazabilidad de Requerimientos

 Matriz RAM

 Plan de Gestión de Alcance

 Plan de Gestión de Calidad

 Plan de Gestión de Comunicaciones

 Plan de Gestión de Riesgo

62
 Plan de Gestión de RRHH

 Plan de Gestión de Cronograma

 Registro de Interesados

Con respecto a los entregables realizados, el Benchmarking nos permitió


conocer y aplicar una de las metodologías de Gartner, el Magic Cuadrant.
Dicha metodología ayuda a la selección de productos de la industria de las
tecnologías de información, donde se evidencia de manera gráfica la
situación del mercado en un momento determinado para un producto
tecnológico en específico. Es así como se logró determinar las herramientas
líderes que serían analizadas.

Figura 30. Cuadrante Mágico de Gartner Business Intelligence y Analytics Platorms 2016
Nota. Recuperado de Gartner Inc., 2016

Estas tres herramientas fueron evaluadas bajo cinco criterios:


 Costos

 TCO

63
 Cantidad de técnicas soportadas

 Customización

 Seguridad

Esta investigación nos permitió conocer a detalle cada una de las


herramientas, desde sus funcionalidades, requerimientos técnicos, precios,
ediciones, seguridad, entre otros.

Figura 31. Tabla de requerimientos técnicos de las herramientas del Benchmarking


Nota. Elaboración propia

64
Figura 32. Tabla de precios y ediciones de las herramientas de Data Visualization
Nota. Elaboración propia

65
Figura 33. Tabla de descripción de herramientas
Nota. Elaboración propia

66
Figura 34. Tabla de técnicas de Data Visualization vs Herramientas
Nota. Elaboración propia

2.2.10 Student Outcome J


 Descripción:
Analiza hechos del mundo contemporáneo identificando el impacto en el
desempeño profesional del ingeniero de sistemas de información.

 Evidencia del cumplimiento:


Data Visualization nació hace miles de años, cuando Rene Descartes realizó
la primera ilustración y ha sufrido una serie de variaciones a lo largo de los
siglos, hoy lo necesitamos más que nunca para poder llegar a analizar,
visualizar y sobre todo entender los datos que almacenamos día a día y nos
permiten conocer información relevante para la toma de decisiones. Su
importancia se ve resaltada a partir del avance de la tecnología de Business

67
Intelligence y es por ello que este proyecto muestra los resultados de un
análisis de lo que puede ofrecer Data Visualization, reflejado por la parte de
las técnicas en los Lineamientos de Uso y Diseño y por el lado de las
herramientas en el Benchmarking.

Figura 35. Lineamientos de uso y diseño


Nota. Elaboración propia

2.2.11 Student Outcome K


 Descripción:
Utiliza técnicas y herramientas de última generación en el desarrollo de
sistemas de información.

 Evidencia del cumplimiento:

El cumplimiento se ve claramente reflejado en el uso de las herramientas


que se incluyeron a lo largo del avance del proyecto, las cuales se listan a
continuación:
 Power BI Desktop

68
 Power BI
 Tableau Desktop
 Qlik Sense Desktop
 SQL Server 2014
 SQL Server 2016
 Microsoft Office 2016 (Word, Excel, Power Point, Project, Visio)
 SAP Power Designer
 Etc.
Toda la documentación acerca del uso, pruebas e investigación de las
herramientas anteriormente listadas se encuentra en los siguientes
entregables: Benchmarking de herramientas, guías de instalación y
documento de pruebas funcionales.

Figura 36. Guías de instalación de las herramientas del Benchmarking


Nota. Elaboración propia

69
Figura 37. Documento de pruebas funcionales de la herramienta de Power BI
Nota. Elaboración propia

Figura 38. Benchmarking de herramientas de Data Visualization


Nota. Elaboración propia

70
2.3 Acreditación CAC (Computing Accreditation
Commission of ABET)
A continuación, se explica de manera detallada a través de qué entregables y/o
actividades se ha logrado cumplir con lo establecido en el Student Outcome J de la
Acreditación CAC, criterio específico de la carrera de Ingeniería de Sistemas de
Información.

2.3.1 Student Outcome J


 Descripción:
Comprende y brinda soporte para el uso, entrega y gestión de sistemas de
información dentro de un entorno de sistemas de información.
 Evidencia del cumplimiento:
La continuidad de este proyecto está conformada por un Roadmap de
proyectos, fruto del resultado de la investigación y trabajo realizado. Dichos
proyectos conforman el plan de continuidad y abarcan dos aspectos
importantes, los cuales forman parte del avance en cuanto a Data
Visualización. Por un lado, como parte de la búsqueda constante de la
mejora y optimización en la experiencia de usuario se propone una
investigación de Interactive Visualization con dispositivos móviles que
permita conocer y ahondar en nuevas formas de visualización e interacción
con las diferentes técnicas de Data Visualization que permitan un fácil
manejo de la exploración de la información. Por otro lado, como resultado
de las pruebas de concepto realizadas, se obtuvo que en una gran parte las
técnicas utilizadas para realizar los diferentes dashboards fueron factibles
para los datos que se estaban mostrando, no obstante esto nos llevó a
considerar como parte de lo que sería la segunda propuesta, en llevar a cabo
una investigación de técnicas de visualización con Straming Analytics, el
cual es una tendencia cercana que implica soportar grandes cantidades de
flujo de información de diversas fuentes en tiempo real y para lo cual se
pueda conocer y poner en cuestionamiento hasta qué punto las técnicas

71
vistas en este proyecto pueden soportar dicha tendencia y a su vez abrir paso
hacia otros tipos de visualización además de la ya vista.

Figura 39. Plan de Continuidad


Nota. Elaboración propia

72
CAPÍTULO 3 Marco Teórico

Este capítulo comprende cuatro puntos importantes, el concepto de Data


Visualization, qué son las técnicas de Data Visualization, el concepto de
lineamiento y conceptos adicionales como Business Intelligence y Metodología de
Gartner.

73
3.1 Data Visualization
De acuerdo con Vitaly Friedman (2008), editor de la revista Smashing,
especializada para diseñadores y desarrolladores, el principal objetivo de
Data Visualization es transmitir de forma clara y efectiva información a
través de representaciones gráficas, esto implica que no necesita ser
funcionalmente aburrido o extremadamente sofisticado para que sea
agradable a la vista. Para lograr transmitir lo que se desea al usuario, se
necesita que vaya relacionada la forma estética como funcional, de esta
manera se podrá llegar a comunicar los puntos importantes de la información
de forma intuitiva. No obstante, diseñadores tienden a fallar al momento de
balancear estos dos aspectos, pues crean espectaculares gráficos, pero fallan
en el propósito final, comunicar la información4.
Data Visualization se debe enfocar desde la perspectiva del usuario, que
recibe la información. Si sólo se presentan resultados analíticos en una hoja,
este enfoque podría fallar al momento de comunicar la información y su
comportamiento5.

Figura 40. Ejemplo de infografía


Nota. Recuperado de GCN Technology, Tools and Tactics for Public Sector IT, 2016

4
Cfr. Friedman (2008)
5
Polyvista

74
Figura 41. Ejemplo de Data Visualization
Nota. Recuperado de Visualizing Data, 2010

Figura 42. Ejemplo de dashboard


Nota. Recuperado de Microsoft, 2014

75
Figura 43. Ejemplo de Data Visualization
Nota. Recuperado de FlowingData, 2016

3.2 Técnicas de data visualization


Para la elaboración de este proyecto se tomará como base, técnicas que en la
actualidad existen de Data Visualization, no obstante, para poder entender qué es
una técnica, en esta sección se pasará a describir un concepto conciso de éste, para
luego pasar a explicar brevemente algunas de las técnicas que tomaremos en
consideración para el desarrollo de este proyecto.

3.2.1 Concepto
De acuerdo con la Real Academia Española, una técnica, es definida como
un conjunto de procedimientos y recursos6. Esta idea aplicada al concepto de
Data Visualization, puede ser descrita como el conjunto de procedimientos y
recursos que permiten mostrar la información de diferentes perspectivas a
través de la elaboración de gráficos.
Existen diversas técnicas que hoy en día se utilizan, cada una de ellas tienen
diferentes aspectos que sirven para analizar distintos valores y hasta qué

6
Cfr. RAE (2014)

76
punto pueden ser utilizados, evitando caer en una sobrecarga de información
que, como consecuencia, dificulta el análisis del usuario.
Tomando como referencia base The Data Visualization Catalogue (2016), a
continuación, se pasará a listar y describir brevemente algunas técnicas de
Data Visualization que serán consideradas para la elaboración de este
proyecto.
1. Gráfico Marimekko (Marimekko Chart)
Posee dos ejes, (X e Y) en los cuales se distinguen dos gráficos
apilados hasta el 100%, todas las barras son de igual longitud y
son divididos en segmentos. Cada eje representa una variable con
una escala que determinan la longitud y ancho de cada segmento.
Esto hace posible detectar la relación entre categorías y
subcategorías (si es que existen) a través de las dos variables.

2. Gráficos de áreas apiladas (Stacked Area Graphs)


Trabaja de la misma forma que lo hacen los gráficos de áreas,
excepto por el uso de varias series de datos, cada punto inicia
desde el último punto de la serie de datos anterior.

3. Diagrama de caja (Box and Whisker Plot)


Esta técnica es una representación que permite conocer cinco
valores concisos acerca de la distribución de un conjunto de datos,
estos son el valor mínimo, máximo, cuartil superior, inferior y la
mediana. (Potter, 2006, p.98) Por lo general, también tienen líneas
que se extienden en paralelo de las cajas (barbas) que indican la
variabilidad fuera de los cuartiles superior e inferior. Los valores
atípicos a veces se representan como puntos individuales que están
en línea con las barbas. Los diagramas de caja se pueden sacar ya
sea vertical u horizontalmente.

4. Mapa de Puntos (Dot Map/ Dot Distribution Map/ Dot


Density Map)

77
Es una técnica que permite detectar patrones espaciales o la
distribución de data sobre un espacio geográfico. Consiste en
distribuir puntos del mismo tamaño en un espacio geográfico.

5. Mapa Choropleth (Choropleth Map)


Es una representación que permite resaltar diferencias en la
distribución geográfica de un conjunto de datos por unidad
espacial, tomando en cuenta diferentes niveles de límites (Por
continentes, países, ciudades). (Robinson, 1982) Estas diferencias
se resaltan a través del uso de colores, que varían en tonalidades
en base a una variable de la data.

6. Mapa de Conexiones (Connection Mapp/ Link Map/ Ray


Map)
Consiste en asociar puntos distribuidos por el mapa con líneas
curvas o rectas.

7. Mapa de flujo (Flow Map)


Los flujos se inician desde un punto de origen y a partir de ello se
distribuyen en diferentes direcciones. Geográficamente muestran
los movimientos de la información u objetos de una locación a
otra y la cantidad que viaja.

8. Diagrama de acorde (Chord Diagram)


Es un conjunto de puntos distribuidos en un círculo en sentido
antihorario7 que permiten visualizar las conexiones internas entre
entidades. Las conexiones indican que existe algo en común entre
las entidades, por tanto, en caso quiera comparar un conjunto de
data o diferentes grupos de data, se puede hacer uso de esta
técnica.

7
Cfr. Sawada (2002)

78
9. Gráficos de área (Area Graphs)
Los gráficos de área son una variación de los gráficos de líneas, ya
que el área por debajo de la línea se rellena con un determinado
color o textura.

10. Diagrama de acorde sin cinta (Non-ribbon Chord Diagram)


Esta técnica es una variante del diagrama de cinta, sólo cuenta
con nodos los cuales se conectan entre sí mediante líneas. Esta
técnica refleja la conexión entre la data.

11. Lluvia de ideas/ Mapa mentales (Brainstorm/Mind-Maps)


Es un diagrama para asociar ideas, palabras y conceptos. Se
suelen utilizar como una herramienta para la generación de ideas,
la búsqueda de asociaciones, la clasificación de las ideas, la
organización de la información, la visualización de la estructura
y ayuda a estudiar.

12. Mapa de burbujas (Bubble Map)


Esta técnica muestra círculos proporcionales al valor de los
conjuntos de datos en un mapa geográfico ubicándolos en
distintas partes dependiendo al lugar que pertenece dicho
conjunto.

13. Mapa de árbol (Tree Map)


Es una forma alternativa de visualizar una estructura jerárquica
como la del diagrama de árbol mientras que al mismo tiempo se
puede mostrar cantidades por nivel jerárquico a través del
tamaño que ocupa el área de cada rectángulo.

14. Mapa de árbol circular (Circular Treemap/ Circle Packing)


Esta técnica es una variación del Mapa de árbol el cual utiliza
círculos para distinguir los niveles jerárquicos.

79
15. Gráfico de anillos (Donut Chart)
Esta técnica guarda la esencia de un gráfico de pie con la
diferencia de no contar con la parte central de este.

16. Gráfico de Matriz de puntos (Dot Matrix Chart)


Esta técnica se asemeja al gráfico de matriz el cual muestra la
relación entre dos o más variables en un formato de filas y
columnas.

17. Gráfico de barras apiladas (Stacked Bar Graph)


Esta técnica segmenta las barras en porciones de distintos
tamaños. Cada porción es una categoría. Es utilizado para
mostrar las sub categorías de una categoría y cuál es su relación
cuantitativamente con respecto al total. Existen dos tipos:
simples y al 100%.

18. Gráfico de Barras Multi Set (Multi-set Bar Chart)


También son conocidos como Gráfico de barras agrupados. Son
utilizados cuando se tiene dos a más data sets, estos son
agrupados uno al costado del otro diferenciados por categorías
ubicados en el mismo eje.

19. Gráfico Nightingale Rose (Nightingale Rose Chart)


Esta es una técnica para poder determinar qué tanto se extiende
los segmentos en proporción al valor que representa.
20. Sets paralelos (Parallel Sets)
Son similares a los diagramas Sankey en la forma como muestra
el flujo y proporciones de la data, sin embargo, esta técnica no
utiliza flechas y se dividen el flujo del camino en cada set de
línea mostrado. Esta vista permite mostrar datos de alta
dimensión, porque los ejes son visualmente independientes de
cada uno. (Bendix, Kosara & Hauser, 2005).

80
21. Pictograma (Pictogram Chart)
Una de sus principales características es que utiliza íconos para
poder dar una vista más participativa de pequeños sets y data
discreta.

22. Gráfico Pie (Pie Chart)


Es una de las técnicas más utilizadas y conocidas. Es útil cuando
lo que se quiere analizar son proporciones y porcentajes de
determinadas categorías a considerar dentro del gráfico,
divididos por segmentos en un círculo.

23. Gráfico de Área Proporcional (Proportional Area Chart)


Por lo general esta técnica se muestra en círculos o en cuadrados.
El objetivo es comparar valores para dar una rápida vista de los
tamaños relativos de la data, sin el uso de escalas.

24. Gráfico Radar (Radar Chart)


Es una forma de comparar cantidades múltiples de variables. Son
útiles para visualizar qué variables tienen similares valores o si
es que existen valores atípicos en cada variable.

25. Gráfico de Columnas Radial (Radial Column Chart)


Es un gráfico de barras que no se encuentra sobre un sistema
cartesiano, si no en un sistema de coordenadas polar.

26. Gráfico de Dispersión (Scatterplot)


Se utiliza esta técnica cuando se desea analizar data que depende
de dos variables. Esto se realiza sobre un plano cartesiano con
coordenadas cada una en un eje X e Y.

27. Span Chart (Range Bar/Column Graph, Floating Bar Graph,


Difference Graph, High-Low Graph)
Es utilizado para mostrar un conjunto de data desde un rango de
valor mínimo hasta un valor máximo. Muestra sólo los valores

81
extremos, mínimo y máximo, no se especifica los valores
intermedios.

28. Espiral de Caracol (Spiral plot /Time Series Spiral)


Este tipo de visualización comienza desde el centro de la espiral
y se desarrolla hacia afuera. Toma la forma de un espiral de
Arquímedes. Se utiliza con barras, líneas o puntos.

29. Gráfico de Tallo y Hoja (Stem and Leaf plot/ Stemplot/ Setm &
Leaf Display)
Es una técnica que permite organizar data tomando en cuenta su
lugar de valor para mostrar su distribución.

30. Línea de Tiempo (Timeline)


Es una técnica que permite mostrar una lista de eventos que
sucedieron de forma cronológica.

31. Diagrama de Árbol (Tree Diagram/Organizational Chart


Linkage Tree)
Esta técnica permite visualizar la data jerárquica en forma de una
estructura de árbol.

32. Diagrama de Venn (Venn Diagram/ Set Diagram)


Este tipo de diagrama representa la data como conjuntos de
datos, englobándolos en círculos, los cuales dependiendo si es
que tienen data en común o relacionada se muestran en la
intersección de dichos círculos.

33. Diagrama de Arco (Arc Diagram)


Los diagramas de arco son una forma alternativa de representar
gráficos bidimensionales.

34. Gráfico de Barras (Bar Chart)


Es una de las técnicas más utilizadas, las cuales se pueden
presentar de forma vertical como horizontal.

82
35. Histograma (Histogram)
Un histograma muestra la distribución de datos a través de un
período de tiempo de intervalo.
36. Pirámide de población (Population Pyramid)
Esta técnica también conocida como pirámide de edad y sexo es
un estilo espalda con espalda, conformado por un par de
histogramas (para cada sexo) que muestra la distribución de la
población en todos los grupos de edad y en ambos sexos.

37. Gráfico de burbujas (Bubble Chart)


Un gráfico de burbujas es un gráfico de múltiples variables. Es
una combinación de un gráfico de dispersión y un gráfico
proporcional de la zona.

38. Gráficos de líneas (Line Graph)


Los gráficos de líneas se dibujan partiendo de puntos de datos de
trazado en un plano de coordenadas cartesianas y luego se
conecta una línea entre los puntos.

3.3 Lineamientos de Uso y Diseño


Con el propósito de dejar en claro a qué se hace referencia cuando se hace mención
de los términos “Lineamiento de uso y Lineamiento de diseño”, en esta sección se
describirá sus respectivos conceptos, los cuales son importantes para la comprensión
del presente proyecto y, adicionalmente, se describirá ejemplos con la finalidad de
facilitar la comprensión y distinción entre estos.

3.3.1 Lineamiento de Uso


Un lineamiento de uso es una recomendación o directriz que brinda un
enfoque funcional de cómo utilizar las técnicas de Data Visualization. De
acuerdo con el SAS Institute Inc. (2014), se tomaría en cuenta factores como
la cantidad o tipo de información con la que se trabaja, sin perder el enfoque
de cómo representar la data de una manera clara y ordenada.

83
Por ejemplo, un caso que represente este tipo de lineamientos es el siguiente:
“Utiliza líneas cuando se quiera conectar data secuencial en gráficos de
series de tiempo” (Kelleher y Wagener, 2011).
En este caso explícitamente el lineamiento indica cuando debe ser utilizado y
sobre que técnica.
Otra directriz mencionada es la siguiente: “Enfócate en visualizar patrones o
detalles dependiendo el propósito del gráfico” (Kelleher y Wagener, 2011).
En este caso, dicha directriz nos guía a considerar dos escenarios: en caso lo
que queramos es identificar patrones, elegir el tipo de técnica que ayude a
lograr esa tarea y los valores que sean relevantes para la visualización o en
caso si se quiere ver los detalles elegir las técnicas más convenientes para
ello. Con esta directriz nos abre la posibilidad de analizar el tipo de técnica a
utilizar dependiendo el uso que le vaya a dar.

3.3.2 Lineamientos de diseño


Consideramos un lineamiento de diseño a la sugerencia o directriz que ayuda
a realzar la efectividad de las visualizaciones a través de un rango de
disciplinas. De acuerdo con Kelleher y Wagener (2011), están destinadas a
abordar problemas comunes o proporcionar ideas simples para ser utilizados
por investigadores cuando crean gráficos para publicaciones o presentaciones.
En este caso cuando se habla de lineamientos de diseño se toma en
consideración factores de forma, tamaño, color, dimensión, etc.
Por ejemplo, un caso que represente este tipo de lineamientos es el siguiente:
“Ubica puntos superpuestos de tal forma que las diferencias de densidad se
puedan visualizar proporcionalmente en los gráficos de dispersión” (Kelleher
y Wagener, 2011). En este caso se puede categorizar como lineamiento de
diseño, porque implica modificar el gráfico para poder lograr que se vea un
resultado en particular.
Otro ejemplo, es el siguiente: “Selecciona un apropiado esquema de color
basado en el tipo de data” (Kelleher y Wagener, 2011). Esto es con la

84
finalidad de poder distinguir y apoyar el propósito del gráfico, sobre todo
dependiendo el tipo de data a mostrar, ya sea cuantitativa o categórica.

3.4 Business Intelligence


El concepto de Data Visualization actualmente va más allá de los simples
gráficos que son tan comúnmente utilizados por todos, ahora hay maneras
más sofisticadas de representar la información, a través de infografías,
mapas, y una infinidad de técnicas de Data Visualization. Si bien la parte
gráfica está tomando relevancia, la información con la que se construye esta
visualización sigue siendo de vital importancia. Por eso, ante la creciente
necesidad de expresar información relevante de manera gráfica, la gran
mayoría de proveedores de software de Business Intelligence (Inteligencia
de Negocios) ha decidido incluir herramientas de Data Visualization en sus
productos, ya sea, por desarrollo propio o por alianzas con otras empresas
especialistas en visualización. Bajo esta premisa, se procede a definir qué es
Business Intelligence y otros conceptos relacionados.

3.4.1 Concepto
Según The Data Warehouse Institute (TDWI), Business Intelligence se
define como la unión de datos, tecnología, análisis y conocimiento humano
para optimizar las decisiones del negocio y conducir al éxito de la empresa.
Gartner lo define como:
"Business intelligence (BI) is an umbrella term that includes the
applications, infrastructure and tools, and best practices that enable
access to and analysis of information to improve and optimize
decisions and performance." (Gartner, 2016)
Asimismo, otros autores lo definen como:

85
“Business intelligence (BI) is the process of transforming raw data
into useful information for more effective strategic, operational
insights and decision-making purposes so that it yields real business
benefits.” (Lian & Li, 2012)
Desde distintos enfoques, los autores convergen en una misma idea, afirman
que el propósito de Business Intelligence es convertir datos en información
valiosa que permita y colabore en la toma de decisiones en beneficio del
negocio, brindándole así una ventaja estratégica frente a sus competidores.
Dentro de los principales productos de Business Intelligence están incluidos
los Cuadros de Mando Integrales (CMI) también conocidos como Balanced
Scorecard o dashboards, las cuales son herramientas de control empresarial
que permiten establecer y monitorear los objetivos de una empresa a través
de indicadores. Aquí reside la relación entre Data Visualization y Business
Intelligence, puesto que estos dashboards buscan expresar la información a
través de manera gráfica, haciendo uso de las técnicas de Data Visualization.

3.5 Metodología de Gartner


Gartner Inc. es la compañía líder en investigación de tecnologías de la
información y consultoría, reconocida a nivel mundial. Fue fundada en 1979,
con sede en Stamford, Connecticut, Estados Unidos. Actualmente cuenta con
7600 asociados, entre ellos, analistas de investigación, consultores y
aproximadamente 10 000 empresas clientes en más de 90 países alrededor
del mundo. Su objetivo principal es el de brindar información de vanguardia
a sus clientes para que estos tomen las decisiones correctas en relación a la
tecnología y procesos de TI, teniendo en cuenta su ámbito de negocio y el
complejo entorno que los rodea.8

3.5.1 Metodologías

8
Cfr. About Gartner (2016)

86
Gartner Inc. desarrolló nueve metodologías de investigación propias,
basadas en sus años de experiencia y en los avances de la tecnología. El
éxito de sus metodologías radica en la visión clara y precisa que les brindan
a sus clientes del estado de su negocio y que les permite a los mismos
establecer planes y estrategias, así como tomar decisiones con mayor nivel
de confianza9. Las nueve metodologías son:
 Magic Quadrant

 Critical Capabilities

 Hype Cycle

 IT Market Clock

 Market Guide

 Vendor Rating

 ITScore

 Market Share

 Market Forecast

Para el presente proyecto se hará uso de la metodología Magic Quadrant, o


como su traducción lo indica, Cuadrante Mágico, para la elaboración de un
Benchmarking10 de herramientas de Data Visualization, en donde se
evaluarán diversos aspectos de aquellas herramientas que se encuentren en el
cuadrante de Leaders. A continuación, se detallará más a fondo esta
metodología.

3.5.1.1 Magic Quadrant


El Cuadrante Mágico de Gartner es una herramienta que ayuda a la selección
de productos de la industria de las tecnologías de información, donde se

9
Cfr. Research Methodologies (2016)
10
Es el proceso continuo de medir productos, servicios y prácticas contra los competidores más duros o
aquellas compañías reconocidas como líderes en la industria. (Kearns 1979)

87
evidencia de manera gráfica la situación del mercado en un momento
determinado para un producto tecnológico en específico.11 A su vez
proporciona el posicionamiento competitivo de los principales proveedores
de dicho producto, generándose así puntos de referencia para los clientes de
aquellos proveedores mejores valorados. Es utilizado como primer paso para
elegir un proveedor y evaluar las oportunidades y amenazas de incurrir en
una inversión para el negocio.
Este Cuadrante posee dos ejes, el eje X llamado Completeness of visión
(Integridad de visión), representa el conocimiento de los proveedores para
aprovechar el momento actual del mercado para generar valor a sus clientes
y para ellos mismos. Asimismo, el eje Y, llamado Ability to execute
(Capacidad de Ejecución), está orientado a medir la habilidad de los
proveedores ante cambios en las tendencias del mercado, es decir, la agilidad
con la que se adapta a nuevas situaciones. En esta categoría también se
analizan las características propias del producto.
Según lo mencionado por Gartner Inc. (2016) el cuadrante está dividido en
cuatro grandes grupos: Leaders, Visionaries, Niche Players y Challengers.

11
Cfr. Research Methodologies (2016)

88
Figura 44. Cuadrante de Gartner
Nota. Recuperado de Gartner Inc., 2016

El primer grupo, Leaders (Líderes), esta categoría es la mejor del cuadrante.


Se puede afirmar que aquellos productos tecnológicos que se encuentren
situados aquí, suelen ser soluciones completas y maduras, que evolucionan y
se adecuan según la demanda del mercado.
El segundo grupo, Visionaries (Visionarios), en esta categoría están situados
aquellos proveedores con una puntuación considerable en el eje X, pero no el
eje Y. Usualmente aquí se encuentran empresas con una visión acertada del
mercado, pero que no logran tener la capacidad de desarrollar e implantar un
buen producto tecnológico.
El tercer grupo, Challengers (Retadores), representan el caso opuesto a los
Visionaries. Estamos hablando de proveedores que ofrecen altos porcentajes
de éxito al momento de implantar su solución, pero no poseen la variedad de
productos suficientes para lograr variar la demanda del mercado a su favor.
El cuarto y último grupo, Niche Players (Jugadores de Nicho), situados en la
categoría menos favorable del cuadrante, aquí hayamos a proveedores que

89
no llegan a obtener suficientes puntos en ninguno de los dos ejes ya antes
mencionados, suelen ser proveedores nuevos en el mercado, y debido a esto
sus canales de distribución y clientes son limitados.

90
CAPÍTULO 4 Estado del Arte

En este capítulo se presenta una revisión de la literatura referida a la


definición del Estado del Arte del proyecto y diversos casos de estudio de
Data Visualization y de sus técnicas, donde se detalla el aporte de cada autor
y las conclusiones obtenidas.

91
4.1 Revisión de la Literatura
Con el propósito de abarcar diferentes aspectos relacionados a Data
Visualization se ha recopilado un conjunto de papers relevantes para la
elaboración de este proyecto. Para ello, se han agrupado de acuerdo a la
similitud de los temas y a partir de ahí el desarrollo de cada uno. El primer
grupo, llamado Técnicas de Data Visualization, abarca los papers
relacionados al uso de diferentes técnicas considerando en qué momento
utilizarlas, por ejemplo “Técnicas de Visualización orientadas a la
presentación” establece una marcada diferencia entre dos tipos de técnicas,
por un lado, las técnicas orientadas a la presentación y por el otro las
orientadas al análisis (Kozara, 2016). Por otro lado, en “Lecciones
aprendidas del diseño de los tableros de visualización”, se toca este tema
desde otra perspectiva, ya que se discuten las lecciones aprendidas
resultantes de proyectos de diseño de aplicaciones para pequeñas empresas y
startups. (Froese & Tory, 2016) A partir de ello hace mención de las
diferentes técnicas utilizadas de acuerdo al caso implementado.
El Paper “Contar Historias Con Visualización de Datos” se enfoca en cómo
poder hacer uso de las técnicas de Data Visualization para narrar la
información que se obtiene de la data procesada y lograr que el usuario
pueda entenderlo (Rodríguez, Nunes, & Devezas, 2015). Otro trabajo es el
de “Datos, métodos de visualización de la información y mecanismos
interactivos: Encuesta”, donde el principal propósito de los autores es
investigar acerca de la visualización, las etapas del proceso de visualización,
cuales son los retos a enfrentar y la categorización de sus técnicas,
centrándose específicamente en las técnicas de Data Visualization (Khan &
Shah Khan, 2011).
El ultimo paper que se incluye en el presente trabajo con respecto a las
técnicas de Data Visualization es el de “Diez Directrices Para Una Efectiva
Visualización de Data en Publicaciones Científicas”, en el cual, la
motivación de los autores se basa en poder ayudar a disminuir esa dificultad
que se tiene al momento de procesar información científica proponiendo

92
diez directrices a considerar como medida correctiva (Kelleher & Waneger,
2011).
En el segundo grupo, llamado Framework de estrategias de diseño, se
encuentra los papers relacionados a las consideraciones a tomar durante la
fase de diseño. Esta sección se enfocará en todos aquellos papers
relacionados a marcos de trabajos, guías de referencias, pautas estructuradas
que aborden este tipo de información. Un ejemplo de ello es el trabajo
“Generación y exploración de diseño basada en visualizaciones
preestablecidas”, en el cual el propósito del autor es poder mostrar y crear
una nueva forma de generar representaciones visuales, proponiendo una
forma de construir nuevos diseños de visualización, juntando un número de
representaciones visuales existentes llamados presets. (Schulz & Hadlak,
2015).
Finalmente, en el tercer grupo, Modelos y métodos según los tipos de datos,
se abarcará todos aquellos trabajos relacionados a modelos o métodos que
permitan identificar de acuerdo al tipo de dato a trabajar cual es la técnica
más conveniente que pueda permitir una eficiente visualización. En esta
sección se presenta el paper “Visualización de Datos en Ciencias Políticas y
Sociales”, cuyo propósito es poder mostrar y crear una nueva forma de
generar representaciones visuales, proponiendo una forma de construir
nuevos diseños de visualización y juntando un número de representaciones
visuales existentes llamados presets. (Zinovyev, 2010).

93
4.2 Casos de estudio de Data Visualization
A continuación, se presenta el estado del arte de una serie de artículos
relacionados a Data Visualization, se detalla la motivación y los aportes de
los autores que brindan diversos enfoques relacionados a temas en
específico. Para permitir una mayor comprensión de estos temas, los
artículos están subdividos en tres tópicos: Técnicas de Data Visualization,
Framework de estrategias de diseño y Modelos y métodos según los tipos de
datos.

4.2.1 Técnicas de Data Visualization


Si bien existe un vasto conocimiento y numerosas investigaciones con
respecto al campo de la Visualización, aún existen dificultades al momento
de saber elegir cual es la técnica más óptima a utilizar para lograr transmitir
lo que se desea, teniendo en cuenta la información con la que se trabajará;
esto con el fin principal de que el usuario pueda entender lo que visualiza y
realizar un análisis posterior, es por ello, que esta sección se enfocará en
todos aquellos papers relacionados a las técnicas de Data Visualization
abordando temas como cuál es su clasificación, como utilizarlas para
determinados fines, las problemáticas y desafíos que presenta su uso, entre
otros.

a. Técnicas de Visualización orientadas a la presentación


Robert Kosara
La motivación de Kozara (2016) está enfocada en aquellas técnicas de Data
Visualization que la gente usualmente utiliza para representar datos, es decir,
gráficos de barras, gráficos de líneas, entre otros, las cuales a su vez son
utilizadas para el análisis de los mismos. El autor establece una marcada
diferencia entre estos dos tipos de técnicas, por un lado, las técnicas
orientadas a la presentación y por el otro las orientadas al análisis.

94
Técnicas de análisis Técnicas de Presentación

Tipo de ténicas enfocadas en que el


Tipo de técnicas enfocada en el
usuario mantenga un recuerdo del
contenido de lo que se muestra.
gráfico mostrado.

Suelen utilizarse siempre las mismas Tipo de técnicas que poseen formas
técnicas pues se tiene la certeza de memorables, o que incluyen iconos
que estas siempre funcionan. en la presentación de los datos.

Este tipo de técnicas deben ser de


Este tipo de técnicas no logra tener fácil aprendizaje para evitar que el
un impacto durarero en el usuario. usuario se sienta frustrado al
visualizarlas.

Algunas técnicas orientadas al Algunas técnicas orientadas a la


análisis: gráficos de barras, diagramas presentación: Isotipo, diagrama de
de dispersión, etc. dispersión conectado, etc.

Figura 45. Ideas generales de las técnicas de análisis y representación


Nota. Elaboración propia

Como sostiene Kozara (2016), en primer lugar, se debe tener en cuenta las
expectativas que se tienen con respecto a la relación entre la presentación de
los datos y como son comunicados a través de estas técnicas. En el análisis,
se tiende a utilizar las mismas técnicas porque se tiene certeza de que casi
siempre funcionan. Los gráficos de barras, diagramas de dispersión, etc., son
excelentes herramientas para tal fin, pero la presentación de nuevos y

95
diferentes datos con las mismas técnicas no lograra tener en el usuario una
impresión duradera.
Lograr que el usuario posea recuerdos de un tipo de gráfico en específico,
está relacionado con los objetivos de las técnicas de presentación. Las
técnicas más inusuales que crean formas memorables, o que incluyan el uso
de iconos para representar los datos, serán más fácil de recordar. A
diferencia con las técnicas de presentación, para las de análisis no es
relevante que el usuario recuerde un gráfico en especial, este tipo de técnicas
se enfocan en el contenido que se muestra, es decir, en la opinión final con la
que se queda el usuario luego de haber visualizado un gráfico.
Un punto en común en el que convergen estas técnicas, es que ambas buscan
que la audiencia frente a la cual están expuestas preste atención a lo que se
muestra, para esto se debe buscar un punto de equilibrio entre lo relevante y
atractivo en un gráfico. La facilidad de aprendizaje también es parte de esto,
especialmente para las técnicas inusuales. Si la forma en que funciona la
visualización no puede ser captada rápidamente, los posibles espectadores se
sentirán frustrados.12
A continuación, Kozara (2016) menciona una serie de técnicas de
presentación, resaltando sus características y beneficios.
En primer lugar, se hace mención del System of Typographic Picture
Education (ISOTYPE)13, creada en 1930 por Otto y Marie Neurath con el
principal fin de comunicar conocimiento a través de los datos. Lo resaltante
de este sistema en relación a la visualización, son las unit charts o como su
traducción lo indica, cuadro de unidades, donde se apilan objetos en la parte
superior o al lado de otro objeto representando cantidades. Lo beneficioso de
este tipo de gráficos es en primer lugar, que, al utilizar objetos, estos son
reconocibles, es decir, son fáciles y entendibles para el usuario. Si bien se
resalta que este tipo de gráfico es visualmente atractivo y fácil de leer, su uso
para el análisis no es recomendado.

12
Cfr. Kozara (2016)
13
También conocida como Isotipo por su traducción al español.

96
En segundo lugar, se hace referencia a The Connected Scatterplot o
Diagrama de dispersión conectado. Es una técnica sencilla en su núcleo,
pero puede ser visualmente interesante y eficaz. Como su nombre lo sugiere,
la técnica consiste en un diagrama de dispersión con los puntos conectados
en una secuencia. El atractivo de este tipo de grafico reside en la forma en la
que invita al usuario a que preste un poco más de atención a los detalles de
lo que se muestra. Recientes estudios arrojaron que los usuarios fueron
capaces de leer y entender las tablas con facilidad. Dicho esto, la técnica a
menudo falla, debido a la gran cantidad de información o al gran número de
líneas que se cruzan unas con otras, generando confusión.
Se concluye con la idea de que la creación de nuevos tipos de
visualizaciones no siempre trae consigo resultados positivos, pero que aun
así el experimento de crearlo sigue aportando valor. Se debe a su vez
prestarle una mayor importancia al factor de presentación y equilibrarlo con
el análisis y exploración de datos.
El autor brinda como recomendación el desarrollo de nuevas herramientas y
criterios para lograr comprender este tipo de técnicas y cuáles serían sus
casos de uso, lograr entender el cómo y cuándo funciona aplicarlas y cuando
no, de esta forma, aquellas personas interesadas en utilizarlas o
implementarlas, tendrían una serie de criterios bajo los cuales regirse para la
presentación de sus datos, esto a su vez sería un valioso aporte al campo de
la visualización.

b. Lecciones aprendidas del diseño de los tableros de


visualización
Maria-Elena Froese, Melanie Tory
Si bien existe una amplia gama de conocimientos acerca del campo de la
visualización y como los diseños visuales son más eficaces para expresar
ciertas ideas, el propio diseño de interfaces y herramientas de visualización
sigue siendo un arte.14

14
Cfr. Froese & Tory (2016)

97
En el presente artículo, las autoras Maria-Elena Froese y Melanie Tory,
discuten las lecciones aprendidas resultantes de proyectos de diseño de
aplicaciones para pequeñas empresas y startups.

Youneeq
Lecciones aprendidas del diseño de los tableros de visualización

Trusterra Technologies

Empresas involucradas

Tutela Technologies

Ocean Networks Canada

Cada empresa posee un nivel de


complejidad en particular en relación al
diseño de los tableros.

Idea inicial del diseño errónea.

Lecciones aprendidas
Dificultad al elegir el tipo de gráfico más
eficaz.

Se debe incluir a diseñadores de


visualizaciones en la etapa de diseño.

Figura 46. Lecciones aprendidas de proyectos de diseño de tableros de


visualización para empresas
Nota. Elaboración propia

98
Tal como lo mencionan, cada uno de los proyectos de diseño empieza con
una vaga descripción de las necesidades y requisitos propios de la empresa,
que deberían estar plasmados en la solución, a partir de esto se plantearon
una serie de soluciones propuestas en estrecha colaboración con los key
users de las empresas.
El proceso incluyó la recopilación y documentación de los requisitos, la
creación de wireframes15 estáticos, que se fueron mejorando de forma
iterativa con los comentarios de los key users, la implementación de
prototipos funcionales y por último, la realización de las pruebas de
usabilidad.
Se expone los casos de Youneeq, compañía que ofrece un motor de
recomendación para los editores de medios en línea; Trusterra Technologies,
compañía que creó una plataforma para la documentación de los eventos de
seguridad; Tutela Technologies, empresa preocupada por el rendimiento de
la red de telecomunicaciones; y Ocean Networks Canada (ONC), una
compañía sin ánimo de lucro, que recoge y analiza el océano y los datos
sísmicos.16
El primer caso es acerca de la empresa Youneeq, la cual tenía como
principal necesidad un dashboard o panel de control donde se mostrarán
todos los datos del monitoreo que realizaba sobre el tráfico de los sitios web
de sus clientes, estos datos expresados mediante indicadores de rendimiento
(KPI's). Se incluyeron diversos tipos de técnicas tales como histogramas,
diagramas de flujos interactivos y mapas de calor.

15
También llamados prototipos. Son bocetos donde se representa visualmente la estructura de una página
web. En este caso, la estructura del dashboard a desarrollarse. (Cfr. Centelles, 2015)
16
Cfr. Froese & Tory (2016)

99
Figura 47. Visualizaciones del dashboard de Youneeq
Nota. Recuperado de IEEE Computer Society (2016)

El tercer caso es de Tutela, empresa que desarrolla productos de software


para permitir a los proveedores de servicios de red supervisar el rendimiento
de la red. Sus clientes tienen la necesidad de explorar los datos de las
pruebas de campo e identificar las causas relacionadas al mal rendimiento de
la red. Para este proyecto se implementaron cinco tipos de técnicas de
visualización: el mapa de calor, coordenadas paralelas, múltiples líneas de
tiempo, la matriz de correlación y, por último, los histogramas. Cada uno de
estos tipos de técnicas cubría necesidades específicas del cliente
relacionadas a los KPI’s.

100
El segundo caso es de Trusterra, empresa que desarrolla un sistema de
seguimiento que es utilizado por sus clientes para reportar las inspecciones
de seguridad en el lugar de trabajo. Los datos recogidos se utilizan para
identificar problemas y poder idear acciones correctivas o preventivas. El
principio de diseño para este tablero era permitir que los usuarios se
centrarán solo en la elección de los datos que querían ver. Se definieron
reglas para que el sistema sólo permitiera mostrar gráficos que eran
apropiadas para los datos seleccionados. Por ejemplo, se permite un
histograma sólo cuando los datos se componen de un elemento numérico.
Una tabla está recomendada cuando se tiene dos cuadros de selección con
varios artículos. Cuando el usuario selecciona un máximo de cinco medidas,
se recomienda una línea de tiempo. Para cubrir todos los casos posibles, se
creó una extensa lista de reglas de gráficos.17
El cuarto y último caso es en relación a ONC, empresa que opera una red de
sensores para detectar eventos sísmicos, tanto en tierra como bajo la
superficie del océano. Ellos tenían como necesidad un panel de control para
mostrar cuándo y dónde sus sensores habían detectado eventos sísmicos. Se
incluyó en su tablero un mapa con la ubicación geográfica de los terremotos;
una tabla con la magnitud del terremoto, los datos, y la ubicación.
Se concluye mencionando los puntos por mejorar o que presentaron
dificultades durante el desarrollo de estos proyectos, entre los puntos más
críticos el proceso de diseño.
Durante el desarrollo de los proyectos, se pudo evidenciar que cada empresa
en particular poseía un nivel de complejidad en relación al diseño de las
visualizaciones a incluir en los paneles. Un caso frecuente que se presentaba
era que se establecía una idea de cómo sería el diseño retratado en
wireframes estáticos, pero al momento de interactuar con los datos reales se
presentaban problemas o no se obtenía el resultado deseado, como

17
Cfr. Froese & Tory (2016)

101
consecuencia, la etapa de diseño se alargaba ya que se realizaban
modificaciones en los diseños iniciales.
Aunque se encontró que era fácil para los usuarios elegir qué KPI querían
explorar, elegir el tipo más eficaz de gráfico era lo dificultoso.
Investigaciones anteriores habían demostrado que los usuarios a menudo
eligen los gráficos con los que ya están familiarizados, y se señaló de
manera similar una petición frecuente para los gráficos circulares.18
Para lograr la selección de visualizaciones adecuadas durante el proceso de
diseño, se incluyó a diseñadores de visualizaciones, personal dedicado a
escoger y diseñar el mejor tipo de visualización de acuerdo a las necesidades
del cliente, los cuales se encargaron de crear prototipos que interactuaban
con la data real. Se hizo uso de herramientas de software tales como
Tableau, R o Matlab.
La comunidad de visualización19 ha desarrollado una gran cantidad de
conocimientos de diseño, juegos de herramientas y técnicas para la
construcción de herramientas de visualización interactiva. Sin embargo, para
los profesionales de la analítica visual, es importante conocer no sólo las
últimas técnicas de visualización, sino también los retos a los que se pueden
encontrar durante el proceso de diseño y la implementación de una
herramienta de análisis visual.

c. Contar Historias Con Visualización de Datos


María Teresa Rodríguez, Sérgio Nunes, Tiago Devezas

La motivación de María Teresa Rodríguez, Sérgio Nunes y Tiago Devezas,


para elaborar este paper es hacer uso de la narrativa con data procesada,
técnica utilizada por periodistas. Con ello, aumentar el interés para realizar

18
Cfr. Froese & Tory (2016)
19
Las autoras hacen referencia a todos aquellos profesionales que han brindado sus aportes al tema de
visualización de la información.

102
una investigación más profunda de los conceptos de data visualization
relacionados a la narrativa.

Mostrar Modelo
Detectar
el Ajuste de ajuste
patrón
panorama mental

Figura 48. Propuesta para proveer una visión del uso de la visualización de
información
Nota. Elaboración propia

Como primer punto dan a resaltar el por qué la visualización de la


información es importante. La razón es que ayuda al ojo humano a ver cosas
que no son vistas en un primer instante y para poder entender grandes
conjuntos de datos. Sobre este tema, el experto en interacción humano-
computadora, Stuard Card, habla sobre la capacidad del cerebro humano de
comprender estímulos visuales en uno de sus libros, sobre esto propone una
noción de que nuestra limitada capacidad mental es asistida por un método
llamado cognición externa, sobre esto dio un ejemplo describiendo que tan
fácil es aprender una tarea como multiplicar en papel, en vez de hacerlo
mentalmente. Este proceso es tomado como base utilizando medios visuales
para informar por qué los campos de la percepción, diseño gráfico,

103
visualización de la información, estadística, minería de datos y cartografía
pueden juntarse como un enfoque unificado para el manejo efectivo de data
compleja.
Del mismo modo, otro sustento mostrado es el de Colin Ware (2013),
renombrado experto en el campo de la psicología de percepciones, el cual
habla del importante rol que tiene la visualización en los sistemas
cognitivos, comentando que el término visualización se ha vuelto más que
sólo una simple imagen de algo en la mente, sino un artefacto externo que
ayuda a la toma de decisiones.
Proveer una visión es considerado como el principal objetivo al momento de
utilizar la visualización de la información, pero es importante entender de
qué trata. La propuesta consiste en cuatro fases:
1. Mostrar el panorama: Permite a la persona comprender a groso modo
de qué trata el conjunto de datos, permitiéndole entender la
información conocida y no conocida.
2. Ajuste: Consiste en la exploración del conjunto de datos ajustando el
nivel de abstracción, permitiendo a la persona cambiar de perspectiva
con respecto a la data.20
3. Detectar patrón: En esta etapa la persona normalmente encuentra lo
que estaba buscando y gana nuevo conocimiento encontrando
tendencias, frecuencias y estructuras en el conjunto de datos.
4. Modelo de ajuste mental: es una metáfora para hacer referencia a que
las personas pueden hacer un match de la representación visual con
el modelo mental del conjunto de datos.
Como siguiente punto, los autores muestran con algunos ejemplos cómo
haciendo uso de Data Visualization se puede llegar a contar un evento. Para
esto muestra un ejemplo en la que se fusiona la narrativa con la
visualización, el proyecto Gapminder. Es un tipo de visualización de

20
Cfr. Rodriguez, Nunes y Devezas (2015)

104
información que fue creado con la finalidad de mostrar y explicar ciertos
eventos a través de la historia. (Ejemplo mostrado en la ilustración 1)

Figura 49. Mortalidad del Ejército Británico por Florence Nightingale


Nota. Recuperado de Scientific American, 1984

A partir de los conceptos vistos anteriormente, los autores presentan la


relación entre Data Visualization y Narrativa. Para lograr esto, detallan una
estructura, el cual se basa en el trabajo desarrollado por Mirko Lorenz,
arquitecto de la información y periodista multimedia. Es un trabajo de tres
partes que incluye Data Visualization como un paso crítico antes de la
elaboración de una nueva historia. Incluye:
 La localización, recuperación y la integración de los datos.

 Visualización de los datos, donde la salida de los datos puede ser


observado y los patrones se transmiten de la misma.

105
 Composición de la historia desde el análisis que se hizo después de la
visualización.

Figura 50. Proceso de periodismo de datos


Nota. Recuperado de European Journalism Centre, 2010

Como resultado de esta investigación preliminar del espacio de la narración


en el campo de la visualización de la información, los autores consideran
que el tema está empezando a tomar forma y hay frecuentes discusiones que
se están llevando a cabo para articular técnicas bien fundamentadas.21

d. Datos, métodos de visualización de la información y mecanismos


interactivos: Encuesta
Muzammil Khan, Sarwar Shah Khan

De acuerdo con Khan y Shah Khan (2011), con el volumen de datos e


información que se maneja y que es generado diariamente por diversas
fuentes, el problema ya no radica en poder trabajar con esa cantidad de
datos, el problema reside en lograr extraer conocimiento valioso de esas
fuentes. Haciendo una analogía con Data Visualization, el problema ya no
radica en la cantidad de técnicas que se posee, en su lugar, es poder elegir
cual es la indicada para lograr transmitir una idea con la mayor comprensión
posible.

21
Cfr. Rodriguez, Nunes y Devezas (2015)

106
Bajo esta premisa, la motivación de los autores es investigar acerca de la
visualización, las etapas del proceso de visualización, cuales son los retos a
enfrentar y la categorización de sus técnicas, centrándose específicamente en
las técnicas de Data Visualization.
Los autores en primer lugar buscan establecer el significado de que es
visualización, y lo definen como una representación gráfica que transmite las
ideas complicadas de manera clara, precisa y eficiente, es decir, estas
representaciones son fáciles de entender e interpretar. A su vez, establecen
que el objetivo principal de la visualización es analizar, explorar, descubrir,
ilustrar y comunicar información en forma totalmente comprensible.
Para el proceso de visualización, los autores se basan en trabajos previos
para presentar y describir brevemente los seis pasos de este proceso.
1. Primer paso: Mapeo, como se transformarán los datos o la
información en formas graficas bajo determinadas características
visuales.
2. Segundo paso: Selección, hace referencia a la selección de la
información necesaria según el propósito del gráfico. Es el paso más
importante del proceso, una mala elección de la información a incluir
podría conllevar a malas decisiones por parte del usuario.
3. Tercer paso: Presentación, como organizar la información en el
espacio disponible de manera efectiva.
4. Cuarto paso: Interactividad, incluye las facilidades que tendrá la
visualización para ser explorada, de esta forma, el usuario podrá
comprender e interpretar mejor la información.
5. Quinto paso: Factor Humano, abarca la facilidad de uso y los
factores de accesibilidad de la visualización.
6. Sexto paso: Evaluación, el último paso es evaluar la visualización
creada, si esta es eficaz o no y si cumple el propósito para el que fue
creada.

107
Paso 1: Mapeo

Paso 2: Selección

Paso 3: Presentación
Proceso de
Visualización
Paso 4: Interactividad

Paso 5: Factor Humano

Datos, métodos de Paso 6: Evaluación


visualización de la
información y Tabla
mecanismos
interactivos:
Encuesta Diagrama de Pie

Gráfico de barras

Histograma
Técnicas descritas
Gráfico de Líneas

Gráfico de Áreas

Diagrama de Dispersión

Diagrama de burbujas

Figura 51. Proceso de visualización y técnicas descritas


Nota. Elaboración propia

108
Con respecto a los desafíos de la visualización22, se establecen puntos
críticos a tener en cuenta, tales como la usabilidad, donde debe haber un
equilibro entre eficiencia y la facilidad de usar; la comprensión de las tareas
perceptivo-cognitivas que está relacionada a la capacidad de percepción de
los humanos; el conocimiento previo que una persona debe tener antes de
utilizar una técnica; la educación y formación que se requiere y deben tener
todos los profesionales relacionados a la rama de la visualización y por
último, la escalabilidad del gráfico es uno de la más grandes desafíos,
especialmente ante la presencia de los dispositivos móviles y sus pantallas
de menor dimensión.23
En relación a Data Visualization, se define como el estudio de la
representación de los datos de una forma sistemática, incluyendo atributos y
variables para la unidad de información (Khan & Shah Khan, 2011), en otras
palabras, representa los datos de tal forma que simplifica la interpretación de
los mismos y su relación.
A continuación, se presentan las técnicas de Data Visualization que el
presente artículo abarca y se hace una breve descripción del aporte de los
autores con respecto a cada una de las técnicas.
 Tabla
Es la técnica de representación de datos más simple, fácil de entender
e interpretar. Tabla es un formato estructurado, organizado por filas y
columnas que transmiten las relaciones. La tabla cumple el papel
principal en la investigación y análisis de datos.
 Diagrama de Pie
También llamado diagrama circular, está dividido en un número de
sectores, donde se agrupan datos que poseen características comunes,
cada uno describe una proporción de la cantidad total. La
visualización de este gráfico es eficaz si comparamos un segmento

22
Estos desafíos agrupan problemas desde la perspectiva del usuario y desafíos técnicos.
23
Cfr. Khan & Shah Khan (2011)

109
con el resto de segmentos que conforma el pie, pero es difícil
comparar diferentes diagramas de pie entre sí.
 Gráfico de barras
Una de las técnicas de Data Visualization más comunes. Es
comúnmente usado para representar datos discretos, pero no
continuos y posee variaciones, es decir, es representado tanto de
manera vertical como horizontal. El uso de colores en las barras
ayuda a que estas sean más visibles y comprensibles.
 Histograma
Técnica de vital importancia en el campo de la estadística y análisis
de datos, fue por primera vez presentada por Karl Pearson, representa
la distribución de datos continuos.
 Gráfico de Líneas
Representación visual usualmente usada para mostrar información en
puntos de datos conectados entre sí a través de una línea continua o
recta. Es una extensión del Diagrama de Dispersión. El gráfico de
líneas a menudo se utiliza para visualizar una tendencia en los datos a
través de un intervalo de tiempo, es decir, es utilizado para ilustrar el
comportamiento de un conjunto de datos con el paso del tiempo o
durante un intervalo de tiempo específico.
 Gráfico de Áreas
Es utilizado para representar datos cuantitativos en un área
delimitada. Dicha área delimitada está basada en el gráfico de líneas,
anteriormente mencionado. Una vez generada la línea en el Gráfico
de líneas, el área de abajo resultante es sombreada con colores o
diferentes texturas.
 Diagrama de Dispersión
Es la visualización gráfica de un conjunto de datos en coordenadas
cartesianas, se muestra la relación entre dos variables, una variable
representa la distancia horizontal y la segunda variable la distancia
vertical del punto de datos desde el eje de coordenadas. Es de utilidad

110
para determinar la tendencia en los datos e identificar valores
atípicos.24
 Diagrama de burbujas
Se definen tres parámetros numéricos diferentes para este gráfico, un
valor determina su posición en el eje x, otro en el eje Y, y el tercero
representa el tamaño de la burbuja. Las burbujas son diferenciadas en
términos de su tamaño y posición. El diagrama de burbujas es en
realidad una variación del Gráfico de dispersión, en el que un punto
de datos está representado gráficamente por un punto y este es
sustituido por una burbuja.

Asimismo, cabe recalcar que existen visualizaciones que combinan más de


una técnica en un mismo espacio gráfico y son creados para cubrir un fin
específico y son llamados diagramas combinados.
Se concluye el artículo mencionando la importancia del correcto uso de las
técnicas de Data Visualization, para así lograr obtener el máximo beneficio
que las visualizaciones pueden ofrecer. Otro punto que los autores resaltan,
es la importancia de los datos y el tipo de dato con el que se trabaja una
visualización, para así lograr un mayor entendimiento de lo que se busca
transmitir.

e. Diez Directrices Para Una Efectiva Visualización de Data en


Publicaciones Científicas
Christa Kelleher, Thorsten Wagener
La motivación de Kelleher y Wagener (2011) se basa en poder ayudar a
disminuir esa dificultad que se tiene al momento de procesar información
científica, tomando en cuenta que es más fácil para el cerebro comprender
una imagen frente a palabras y números. Debido al creciente acceso y

24
Valor atípico es un elemento de observación donde un dato se comporta de forma diferente a los demás
miembros del conjunto de datos.

111
cantidad de data se requiere formas efectivas de analizar y comunicar
información con formatos fáciles de entender.

112
• Crea el gráfico más simple que muestre la información que
Directriz n°1
se quiera transmitir

• Considera el tipo de objeto y atributo codificado utilizado


Directriz n°2
para crear un gráfico

• Enfócate en los patrones de visualización o en detalles de la


Directriz n°3
visualización, dependiendo el propósito del gráfico.

Directriz n°4 • Selecciona rangos de ejes significativos

•Las transformaciones de data y elecciones cuidadosas de los


Directriz n°5 aspectos de los ratios gráficos pueden ser utilizadas para enfatizar
tazas de variación para datos de series de tiempo.

• Trazar puntos superpuestas de manera que las diferencias


Directriz n°6
de densidad sean evidentes en los gráficos de dispersión.

• Utiliza líneas cuando use data secuencial en gráficos de


Directriz n°7
series de tiempo.

• Agrega conjuntos de datos más grandes de manera


Directriz n°8
significante

• Mantén los rangos de ejes lo más similares posibles para


Directriz n°9
comparar variables.

• Selecciona un apropiado color de esquema basado en el


Directriz n°10
tipo de data.

Figura 52. Diez Directrices Para Una Efectiva Visualización de Data en


Publicaciones Científicas

113
Nota. Elaboración propia
Los autores proponen diez directrices que representan un listado general de
sugerencias que mejoran la efectividad de las visualizaciones científicas a lo
largo de un rango de disciplinas. Estas directrices tienen como propósito
indicar cuáles son esas dificultades y/ dar ideas a utilizar por investigadores
para cuando se realicen estos gráficos.
 Directriz n° 1: Crea el gráfico más simple que muestre la
información que se quiera transmitir
La razón para incluir un gráfico en una publicación científica es para
explicar algo o para apoyar un argumento. Atributos redundantes o
exceso de texto puede volver más tediosa la comprensión de lo que se
quiere mostrar y confundir la información. Por ello, para simplificar
la visualización se recomienda remover la redundancia, con ello se
asegura que el lector pueda distinguir entre las diferentes propiedades
de visualización como forma, color, grosor. Asimismo, la simplicidad
del gráfico puede ser mejorado minimizando la cantidad de texto para
mostrar información no relevante frente al total de texto mostrado.
 Directriz n° 2: Considera el tipo de objeto y atributo codificado
utilizado para crear un gráfico
La codificación de los objetos gráficos (puntos, líneas y barras) y sus
atributos de valor de codificación (posición del punto, longitud, la
longitud de la línea, color)25 son utilizados para mostrar diferentes
piezas de información de un conjunto de datos. Seleccionar los
atributos a utilizar es importante, debido a que los humanos pueden
cuantificar ciertos atributos gráficos mejor que otros.
 Directriz n°3: Enfócate en los patrones de visualización o en detalles
de la visualización, dependiendo el propósito del gráfico.
Una opción básica al momento de seleccionar un gráfico es mostrar
patrones o detalles. Esa opción requiere la selección de un tipo de

25
Cfr. Kelleher y Wagener (2011)

114
gráfico como también los objetos utilizados para codificar los
valores. Cuando se busca patrones, puede ser efectivo mapas de calor
o gráficos de burbujas aun a pesar de que la extracción de las
diferencias entre valores sea un poco difícil. Por otro lado, los
gráficos de barras o líneas se deben utilizar cuando los valores
individuales sean importantes, como la longitud y la posición, ya que
son fácilmente percibidos cuantitativamente.
Un mapa de calor representa los conjuntos de datos individuales o
múltiples utilizando una secuencia de cuadrados, donde cada
cuadrado representa un valor de datos y color representa la magnitud
del punto de datos. Una alternativa a los mapas de calor son los
gráficos horizontales que muestran múltiples series de tiempo en
paralelo. Los gráficos horizontales son similares a los gráficos de
series de tiempo, pero utiliza colores para resaltar diferencias y
valores extremos dentro y a través de series de tiempo. Si bien los
gráficos horizontales pueden expresar más información, son mejor
utilizados para el análisis de datos y comparaciones ya que su uso
eficaz requiere un nivel de familiaridad con este tipo de gráfico.

Figura 53. Valor codificado frente al atributo


Nota. Recuperado de Few Adaptado, 2009

115
 Directriz n°4: Selecciona rangos de ejes significativos
Seleccionar un rango para el eje vertical depende del objetivo y tipo
de gráfico. Cuando las magnitudes absolutas son importantes, el eje
vertical debe empezar en cero. Mostrar los datos a lo largo de un eje
vertical que no incluye cero, distorsiona el rango de datos y exagera
la magnitud relativa entre los valores.
 Directriz n°5: Las transformaciones de data y elecciones cuidadosas
de los aspectos de los ratios gráficos pueden ser utilizadas para
enfatizar tazas de variación para datos de series de tiempo.
La tasa de variación de visualización de una serie de tiempo, que se
refiere a las diferencias de valores entre los intervalos de tiempo, se
puede mejorar u obstaculizar por transformaciones en el eje vertical.
La decisión de usar una transformación debe depender del conjunto
de datos y el objetivo del gráfico, como transformaciones puede
cambiar la impresión de un gráfico y por lo tanto la información
transmitida. El trazado sobre un eje vertical logarítmica puede
eliminar la asimetría en los conjuntos de datos con rangos que
incluyen valores grandes y pequeños.
 Directriz n°6: Trazar puntos superpuestas de manera que las
diferencias de densidad sean evidentes en los gráficos de dispersión.
En los gráficos de dispersión donde los puntos son opacos, las
diferencias de densidad son oscuras o incluso invisibles como
múltiples puntos ubicados en un mismo lugar que se muestran como
un mismo punto. Cambiar puntos trazados de opaco a transparente
resalta la información mostrada mediante la visualización de las
diferencias de densidad.
Otra alternativa para lograr un efecto parecido es trazar los círculos
sin rellenar. Para grandes conjuntos de datos, la densidad puede ser
mejor visualizado por la disminución de tamaño de punto.
 Directriz n°7: Utiliza líneas cuando use data secuencial en gráficos
de series de tiempo.

116
Gráficos que conectan data no secuencial o valores en cada lado de
un periodo de data perdida con una línea implica un cambio lineal
entre puntos.
 Directriz n° 8: Agrega conjuntos de datos más grandes de manera
significante
La simplicidad puede ser dificultosa de alcanzar en muestras con
grandes conjuntos de data cuantitativa o categórica. Grandes
conjuntos de datos cuantitativos pueden ser simplificados vía gráficos
resumen como los gráficos de cajas o estrategias de Kernel. Las
características de los conjuntos de datos, pueden ser mostradas
utilizando gráficos de puntos Cleveland o gráficos de micro mapas
que presenta data referenciada a un mapa o locación, aunque el orden
de esa data puede influenciar la percepción de puntos individuales26.
 Directriz n°9: Mantén los rangos de ejes lo más similares posibles
para comparar variables.
Mostrar variables por sub gráficos con diferentes rangos de ejes
propicia comparación de rangos y variabilidad a lo largo de los
conjuntos de datos. Manteniendo los mismos rangos de ejes, los
conjuntos de datos pueden ser comparados más fácilmente.
 Directriz n°10: Selecciona un apropiado color de esquema basado en
el tipo de data.
Utiliza un esquema de color que coincide con el tipo de data. Esto
soportaría el propósito del gráfico.
Finalmente, como conclusión se deja en claro que el objetivo de cualquier
gráfico en el contexto de publicaciones científicas y presentaciones es el de
proporcionar efectivamente la información27.

26
Cfr. Kelleher y Wagener (2011)
27
Cfr. Kelleher y Wagener (2011)

117
4.2.2 Framework de estrategias de diseño
Un aspecto importante de la visualización de datos es la etapa de
creación, momento en donde se definen las consideraciones a tomar para
la fase de diseño, de tal modo que se pueda encontrar un criterio que
ayude a mostrar una visualización “correcta” de una determinada data,
esto implica ciertas pautas para lograrlo, es por ello que esta sección se
enfocará en todos aquellos papers relacionados a marcos de trabajos,
guías de referencias, pautas estructuradas que aborden este tipo de
información.

a. Generación y exploración de diseño basada en visualizaciones


preestablecidas
Hans-Jörg Schulz, Steffen Hadlak
La motivación de Schulz y Hadlak (2015) es poder mostrar y crear una
nueva forma de generar representaciones visuales, proponiendo una forma
de construir nuevos diseños de visualización, juntando un número de
representaciones visuales existentes llamados presets. Para lograr esto, estas
nuevas visualizaciones se mostrarán en interfaces de fácil uso de tal modo
que lo pueda manejar tanto el usuario casual como el usuario experto. Dicha
interfaz debe poder ser utilizada en caso de realizar un prototipo rápido, el
cual implique una representación visual específica como también permita
mostrar una visualización para explorar un espacio de diseño de
representaciones visuales.

118
Figura 54. Paleta de Visualizaciones Presets
Nota. Recuperado de Hans-Jörg Schulz y Steffen Hadlak, 2014

A partir de esto, el enfoque para poder describir las representaciones


visuales se basa en un conjunto de parámetros de configuración numéricas
que son lo suficientemente genéricas para poder capturar tanto el mapeo
fundamental de una visualización y su posterior puesta a través de la
configuración individual. Es por ello que se puede expresar una gran gama
de diferentes visualizaciones. Asimismo, debido a la naturaleza numérica de
los parámetros de configuración, esta forma de especificar visualizaciones
permite mezclar diseños visuales mediante la interpolación entre los
respectivos valores de los parámetros.
A partir de las visualizaciones existentes, llamados presets, se puede crear
nuevas visualizaciones de una mezcla entre estos.
Para lograr esto, como primer paso los autores ofrecen una visión general de
los enfoques existentes para la descripción de visualizaciones y la relación a
las clases de interfaz para el diseño de la visualización que fueron

119
identificados. Estos son divididos en enfoques enumerados, constructivos y
descriptivos.
Enfoque enumerado
Tienen como objetivo describir el espacio de visualización de los diseños a
través de una recopilación entendible de las visualizaciones individuales
existentes que lo constituyen. Los ejemplos más comunes sobre los enfoques
enumerativos son directorios de visualización y referencias de visualización
que listan diversas técnicas de visualización existentes en un orden que
ayuda en la localización de las técnicas individuales - por ejemplo, en un
orden alfabético o mediante el uso de un esquema para tipos de data y tareas
de visualización. Espacios más complejos de diseños de visualización se
describen en visualizaciones taxonómicas y tipologías de visualización.

Enfoque constructivo
Si bien los métodos enumerativos consideran una visualización en su
conjunto, este enfoque se desarrolla de abajo hacia arriba a través de
bloques. Los autores entienden el espacio de visualización de diseños como
el reino de todas las posibles combinaciones de estos bloques. A diferencia
del enfoque enumerativo, no sólo puede capturar visualizaciones existentes,
sino también las visualizaciones hasta ahora no existentes que resultan de
nuevas combinaciones de estos bloques. Ejemplos de enfoques constructivos
que utilizan elementos gráficos y sus propiedades visuales como bloques son
notaciones algebraicas.

Enfoque descriptivo
Este tipo de enfoque no considera una visualización en su totalidad, sino que
tienen por objetivo especificarlo, detallando un número de características de
diseño independientes. En contraste con los enfoques constructivos, el
espacio de diseños de visualización no es un resultado emergente formado
de abajo hacia arriba por las diversas disposiciones posibles de los diferentes
bloques. En cambio, es una caracterización de arriba hacia abajo que ya

120
comienza con una visión de diversidad que tiene como objetivo captar a
través del diseño de diversas características. A diferencia de la ruptura
categórica de los enfoques taxonómicos, estas características son lo
suficientemente específicas para describir y generar visualizaciones
concretas existentes y diseños nuevos por igual. Un ejemplo de este tipo de
enfoques descriptivos son espacios de diseño de visualización
Luego de esta explicación, como segundo paso, los autores pasan a hacer
mención de las tramas que existen entre elegir y crear visualizaciones.
Por ejemplo, mencionan que los enfoques descritos anteriormente permiten a
un usuario elegir una visualización como un todo a partir de una
enumeración de tipos de gráficos existentes o permite crear visualizaciones
personalizadas desde cero de abajo hacia arriba construyéndolos a partir de
una variedad de bloques de construcción o de arriba hacia abajo mediante la
descripción de sus diversas propiedades.
Por otro lado, el enfoque propuesto es para capturar representaciones
visuales a través de un conjunto de parámetros y datos numéricos. Por
ejemplo, para los casos de visualizaciones de árboles y plots, se construiría
tales conjuntos de parámetros. En ese caso, se detalló las dos interfaces para
esta forma de configuración visual, la paleta y la mesa de mezclas. Luego se
detalla su utilidad para la generación de diseños de visualización por
preajustes de la remezcla (es exhibido brevemente por dos ejemplos y un
estudio de usuarios).
En conclusión, los autores afirman que el uso continuo de espacios de
parámetros para describir clases enteras de visualizaciones es un modelo de
gran alcance, extensible y flexible para unificar visualizaciones existentes
bajo un sentido común y para desarrollar nuevas mezclas de visualización.
Esto con interfaces de usuario adecuadas, como la paleta y el mezclador,
permite la creación rápida de prototipos de diseño de visualización

121
personalizada. Es esta combinación continua de diseños amoldables de
visualización e interfaces de usuario que dará acceso directo a ellos.28

4.2.3 Modelos y métodos según los tipos de datos


Para la visualización de datos es importante considerar el tipo de dato con el
que se trabaja, de este modo es más fácil distinguir qué tipo de técnica
utilizar en cada caso. Cuando se habla de tipo de dato tomamos en cuenta si
es cuantitativa, cualitativa, si sólo es conformada por una variable o muchas
variables. Por ello, en esta sección se abordará todos aquellos paper
relacionados a modelos o métodos que permitan identificar de acuerdo el
tipo de dato a trabajar, la técnica más conveniente que pueda permitir una
eficiente visualización.

a. Visualización de Datos en Ciencias Políticas y Sociales


Andrei Zinovyev
La motivación de Zinovyev (2010) es lograr proveer un eficiente despliegue
gráfico para resumir y razonar sobre información cuantitativa y para ello, se
tomará al campo de las ciencias políticas como el principal enfoque de la
data.

28
Cfr. Schulz y Hadlak (2015)

122
Agrupaciones de métodos para la Visualización de
Gráficos Uni variables

Gráficos estadísticos e Métodos utilizados


Gráficos Bi variables
infografías en Data Cuantitativa

Gráficos Multi
Sistemas de información variables
geográfica (GIS)
Datos

Visualización de gráficos o
mapas de la red

Cartografía de datos

Figura 55. Grupos de Métodos para la Visualización de Datos en las ciencias políticas
Nota. Elaboración propia

Los enfoques de la visualización de datos se pueden clasificar en varios


grupos, a partir de la creación de gráficos informativos y diagramas (gráficos
estadísticos e infografía) y terminando con métodos estadísticos avanzados
para la visualización de tablas multidimensionales que contienen tanto
información cuantitativa como cualitativa.
En el caso de las ciencias políticas tiene cierta especificidad como el uso
frecuente de mapas geográficos, los cuales crean un vínculo con el campo
bien desarrollado de sistemas de información geográfica (GIS).
Se pueden distinguir varios grupos de métodos para la visualización de datos
en el campo de las ciencias política:

123
 Gráficos estadísticos e infografías con amplio uso del color, la forma,
el tamaño, la forma y estilo de superponer muchas variables
cuantitativas en la misma tabla o diagrama

 Sistemas de información geográfica (GIS) para visualizar datos


vinculados geográficamente.

 Visualización de gráficos o mapas de la red para representar las


relaciones entre los objetos

 Proyección de datos multidimensionales en pantallas de baja


dimensión (cartografía de datos)

Entre los métodos de visualización comúnmente utilizados de data


cuantitativa, se pueden clasificar en: 29
 Gráficos uni variables: Diseñados para visualizar la distribución de
valores de una sola variable. Los básicos son: gráfico de pie, gráfico
de barras, histogramas y gráficos de cajas.

 Gráficos bi variables: Diseñados para visualizar relaciones entre dos


variables. Esto incluye varios tipos de gráficos de dispersión y
gráficos de líneas. Un caso particular a considerar es el de series de
tiempo, donde el tiempo es una de las variables.

 Gráficos multi variables: Diseñados para visualizar varias variables


al mismo tiempo permitiendo su comparación. Algunos ejemplos de
estos son gráficos de áreas, gráficos de radares, gráficos mosaicos y
gráficos de coordenadas paralelas.

Con respecto a data multidimensional, el método más fundamental a mapear


en un espacio de baja dimensión es el “Principal Component Analysis”
(PCA) inventado por Karl Pearson. Este método puede ser aplicado en los
tipos de tablas “Objeto – Característica”

29
Cfr. Zinovyev (2010)

124
En conclusión, a pesar del innegable rol que tiene la visualización de datos,
en proveer una eficiente herramienta para analizar sobre data cuantitativa
aún existen problemas relacionados a falta de uso de muestra de data
gráfica30. No obstante, los métodos mencionados dan una luz inicial de lo
que constituye el enfoque y propósito de esta investigación.

30
Cfr. Zinovyev (2010)

125
CAPÍTULO 5 Desarrollo del
Proyecto

En este capítulo se presenta la investigación de las cuarenta técnicas de Data


Visualization, y el proceso que se siguió para la elaboración de los lineamientos,
incluyendo el benchmarking de herramientas de Business Intelligence y Data
Visualization, la arquitectura de las herramientas evaluadas y finalmente las pruebas
de concepto donde se validan e implementan los lineamientos

126
5.1 Entregables del proyecto
A lo largo del desarrollo del proyecto se han ido elaborando diferentes entregables
para poder cumplir con los objetivos iniciales, estos son:
 Lineamientos de Uso y Diseño

 Proceso de uso de los lineamientos propuestos.

 Benchmarking de las herramientas de Data Visualization

 Arquitecturas de las herramientas

 Pruebas de Concepto

 Propuesta de proyectos

5.2 Investigación de las técnicas de data visualization

5.2.1 Estructura de los lineamientos


Los lineamientos a desarrollar se basarán a partir de cuarenta técnicas de Data
Visualization que actualmente se utilizan y de los cuales se ha podido recopilar
información.

5.2.1.1 Estructura de trabajo


Para el desarrollo de este documento, primero, por cada técnica a detallar se tomará
en cuenta los siguientes criterios:
 Definición: Descripción de la técnica y en qué consiste

 Tipos de Variables

 Cuando utilizar la técnica

 Cuando no utilizar la técnica

 Ejemplo de Aplicación

127
 Herramientas en las que se puede elaborar

 Ejemplos de uso

Luego de la presentación de cada una de las técnicas y, en base a los criterios


Cuando utilizarlo y cuando no, se mostrará un cuadro distinguiendo los
lineamientos de uso y diseño para cada una de ellas.

5.2.1.1.1 Gráfico de Barras (Bar Chart)

5.2.1.1.1.1 Definición

Es una de las técnicas más utilizadas, las cuales se pueden presentar de


forma vertical como horizontal. En uno de los ejes de la gráfica muestra las
categorías específicas que se comparan, y el otro eje representa un valor
discreto. Se distinguen de los histogramas, ya que las columnas no
muestran un desarrollo continuo en un determinado intervalo.

Figura 56. Grupos de Métodos para la Visualización


de Datos en las ciencias políticas
Nota. Data Visualization Catalogue, 2013.
Recuperado de
http://www.datavizcatalogue.com/methods/
bar_chart.html

128
Figura 57. Ventas realizadas en cada cuarto de año
Nota. Telerik. Recuperado de
http://docs.telerik.com/devtools/winforms/chart/understanding-radchart-
types/bar-charts

5.2.1.1.1.2 Tipos de Variables

 Variables con escala nominal con valores discretos.

5.2.1.1.1.3 Cuando utilizarlo

 Se utiliza para mostrar comparaciones numéricas entre diferentes


categorías. Esto en caso es conveniente que sean pocas categorías,
pueden ser de cinco, pero no más de siete, esto es para mantener una
mayor claridad del gráfico.

 Se debe considerar el valor cero en el eje (Y) numérico como valor


inicial, para que al usarlo la gráfica se entienda.

 Permite conocer cuántos datos existen por distintas categorías.

 Se utiliza cuando se desea identificar patrones (esto puede suceder


cuando en el eje X se tiene años y en el eje Y la cantidad de algún valor a
analizar).

129
5.2.1.1.1.4 Cuando no utilizarlo

 Cuando existen muchas categorías visualmente se vuelve cargado y


difícil de identificar las variables (más de siete categorías).

5.2.1.1.1.5 Ejemplos de aplicación

En este ejemplo, elaborado por Google, se muestra la representación de la


densidad de cuatro metales en g/cm^3. Como se puede observar en la
Figura 3, en el eje X muestra lo tipos de metales y el eje Y la densidad por
cada uno de ellos.

Figura 58. Gráfico de barras: Densidad de metales


Nota. Google Developers. Recuperado de:
https://developers.google.com/chart/interactive/doc
s/gallery/columnchart#coloring-columns

5.2.1.1.1.6 Herramientas

Se puede elaborar dicha técnica en herramientas como:


 MS Excel and Apple Numbers

 D3

 DataHero

130
 Datamatic

 Datawrapper

 Google Charts y Google Docs

 Infogr.am

 OnlineChartTool.com

 Protovis

 Slemma

 Vega

5.2.1.1.1.7 Ejemplos de Uso

Para obtener otros ejemplos nos podemos dirigir a la página de Google


Developers, en el siguiente enlace:
https://developers.google.com/chart/interactive/docs/gallery/columnchart#c
oloring-columns
Asimismo, en la página de Knoema también se puede encontrar ejemplos:
http://knoema.es/atlas/topics/Econom%C3%ADa/Contabilidad-Nacional-
Prodcuto-Interno-Bruto/Crecimiento-del-PIB

5.2.1.1.2 Gráfico de Barras Radial (Radial Bar Chart)

5.2.1.1.2.1 Definición
Es un gráfico de barras mostrado en un sistema de coordenadas polar y no en
un sistema cartesiano.
El problema de mostrarlo bajo este sistema es que puede llegar a ser
malinterpretado, ya que por lo general la última barra hacia afuera tiende a
ser el más largo, incluso si es que representan el mismo valor. Esto se debe a
que cada barra debe estar en un radio diferente para que cada uno puede ser
analizado independientemente. Es una variante del gráfico de barras

131
modificado como medida estética, es más notorio para la vista, pero poco
entendible.

Figura 59. Gráfico de Barras Radial


Nota. Data Visualization
Catalogue. Recuperado de
http://www.datavizcatalogue.co
m/methods/radial_bar_chart.ht
ml

5.2.1.1.1.1 Tipos de Variables

 Variables con escala de intervalos y valores discretos.

5.2.1.1.1.2 Cuando utilizarlo

 Cuando se desee visualizar rápidamente las variables.

5.2.1.1.1.3 Cuando no utilizarlo

 Cuando se desconoce la forma de interpretar dicha técnica, Por lo


general tiende a ser malinterpretado debido a que la última barra
hacia afuera sobresale pese a que pueda tener el mismo valor que
los demás.

132
5.2.1.1.1.4 Herramientas
Actualmente se desconoce en qué herramientas se puede elaborar dicha
técnica.

5.2.1.1.1.5 Ejemplos de Uso


Para obtener otros ejemplos nos podemos dirigir a la página de Data Viz
Project, en el siguiente enlace:
http://datavizproject.com/data-type/circular-bar-chart/

5.2.1.1.3 Pirámide de población (Population Pyramid)

5.2.1.1.3.1 Definición
Una pirámide de población, también conocida como pirámide de edad y sexo
es un estilo espalda con espalda, conformado por un par de histogramas
(para cada sexo) que muestra la distribución de la población en todos los
grupos de edad y en ambos sexos. El eje X se utiliza para trazar los números
de población y el eje Y muestra los grupos de edad.

Figura 60. Pirámide de Población

Nota. DataVisualization Catalogue. Recuperado de:


http://www.datavizcatalogue.com/methods/population
_pyramid.html

133
Figura 61. Formas de Pirámides de Población
Nota.US Census Bureau International Programs, 2011.
Recuperado de:
http://2012books.lardbucket.org/books/regional-geography-
of-the-world-globalization-people-and-places/s04-03-
population-and-culture.html

5.2.1.1.3.2 Tipos de Valores

 Variables con escala de intervalos y valores continuos.

5.2.1.1.3.3 Cuando utilizarlo

 Es ideal cuando se quiere detectar cambios o diferencias en los


patrones de población.

 En caso se quiera comparar patrones a través de las naciones o


grupos de población se pueden utilizar una variación de este
gráfico, pirámides de población múltiples.

 La forma de una pirámide de población se puede utilizar para


interpretar una población. Por ejemplo, una pirámide con una
base muy ancha y una sección superior estrecha sugiere una

134
población con altas tasas de fecundidad y mortalidad.
Considerando que, una pirámide con una parte superior más
ancha y base más estrecha sugiere una población que envejece
con bajas tasas de fertilidad.

 Se pueden utilizar para especular el futuro desarrollo de una


población. El envejecimiento de la población que no está
reproduciendo con el tiempo podría tener problemas tales como
tener descendencia suficiente para el cuidado de los ancianos.
Otras teorías tales como el estado "aumento de la juventud" que
cuando hay un gran abultamiento alrededor del rango de 16-30
años de edad, sobre todo en los hombres, esto lleva a la agitación
social, la guerra y el terrorismo.

 Es útil cuando se quiere analizar data relacionada a los campos de


la ecología, sociología y economía.

5.2.1.1.3.4 Ejemplos de aplicación


Se muestra como ejemplo la distribución de la población canadiense en el
año 1961. Como se puede observar las barras se encuentran ordenadas por
grupos de edad siendo los primeros en la parte superior los de edad mayor a
90 años hasta disminuir y llegar al grupo de 0-4 años en la parte base de la
pirámide. Ese orden se encuentra de tal forma porque indica que los que
tienen mayor probabilidad de muerte son los de mayor edad que los más
jóvenes. Por otro lado, el grupo entre 20 -24 se diferencia, pues se indica que
no hay mucha población de esa edad.

135
Figura 62. Pirámide de Población 1961
Nota. Regional School District 17. Recuperado
de
http://www.rsd17.org/TeacherWebPage/HighS
chool/JAnderson/A/introduction/graphic%20or
ganizers/Pop%20Pyramid%20&%20Climograp
h%20DEFINITION.htm

5.2.1.1.3.5 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 D3

 Vega

 ZingChart

5.2.1.1.3.6 Ejemplos de Uso


Este tipo de técnica se puede encontrar en la página web “Pirámides de
población del mundo desde 1950 a 2100”, en el cual de forma interactiva
permite ver la pirámide de población por cada país y de acuerdo al año que se
desee ver.
En este ejemplo se ve interactivamente como va cambiando la forma de dicha
pirámide.
https://populationpyramid.net/es/peru/2055/

136
5.2.1.1.4 Mapa Choropleth (Choropleth Map)

5.2.1.1.4.1 Definición
Esta técnica es una representación que realza las diferencias en la distribución
geográfica de la data por unidad espacial, además de hacer uso de límites como
países, ciudades, regiones, etc. (Robinson, 1982). Permite identificar distintos
patrones, comportamientos a lo largo de una determinada región. Las variables
de la data son los que determinan una progresión de las tonalidades en cada
región determinada.
Por lo general se toma un color de referencia y se utiliza sus diferentes
tonalidades desde opacos hasta tonalidades transparentes.
Los tamaños de algunas regiones son más pronunciados que otros por lo cual
puede provocar la malinterpretación de la información, que como consecuencia
puede afectar en la percepción del usuario.

Figura 63. Mapa Choropleth


Nota. Data Visualization Catalogue.
Recuperado de
http://www.datavizcatalogue.com/metho
ds/choropleth.html

137
5.2.1.1.4.2 Tipo de Variables

 Variables con escala de intervalos y valores discretos.

5.2.1.1.4.3 Cuando utilizarlo

 Puede ser efectivamente utilizado para mostrar reportes de valores de


áreas en cualquier escala virtual, a nivel global como local

 Puede ser analizada en muchos niveles a través de la asignación de


distintos colores y sus diferentes tonalidades.

 Se puede identificar desde patrones en un plano general hasta la


detección de detalles.

 Se puede utilizar para detectar relaciones entre la variable y la


locación geográfica

 Permite ver la comparación de las áreas con otros (no es exacto).

5.2.1.1.4.4 Cuando no utilizarlo

 Si es que se quiere leer o comparar la data de forma exacta. (Tiende a


ser mal utilizado de esta forma).

 No utilizarlo si lo que se ingresa es data cruda como por ejemplo


cantidad de población. (Primero se debe normalizar las cantidades
con el espacio de la región, de este modo, por ejemplo, se podría
calcular la densidad de población de cada región).

138
5.2.1.1.4.5 Ejemplos de aplicación
En la Figura 9 se muestra las diferentes tonalidades de cada país dependiendo de
la cantidad de letras de los nombres de cada uno. Como se puede observar en la
leyenda, la asignación de colores dependerá de los intervalos, mientras menos
letras tengan el nombre del país, la tonalidad del color será menos intensa y
mientras más letras tengan, el color será más intenso.

Figura 64. Mapa Choropleth


Nota. Huebler, Friedrich, 2012. Recuperado de:
http://huebler.blogspot.pe/2012/08/stata-maps.html

5.2.1.1.4.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 CartoDB

 Datavisual

 Infogr.am

 Mbostock’s blocks

 R Graph Gallery

139
5.2.1.1.4.7 Ejemplos de Uso
La página web “Vision of Humanity” muestra el índice de paz del Reino
Unido desde el 2013 hasta el 2012, haciendo uso de elementos
complementarios para la optimizar la visualización como una leyenda y
clasificación de indicadores como homicidios, crímenes violentos, crímenes
con armas, desorden público, etc.
http://www.visionofhumanity.org/#page/indexes/uk-peace-index/2012

5.2.1.1.5 Mapa de burbujas (Bubble Map)

5.2.1.1.5.1 Definición
Esta técnica, también conocida como Cartograma, es un tipo de gráfico de
burbujas que permite ver tres dimensiones de la data, siendo los dos primeros la
locación geográfica de un evento en particular y la tercera, una variable
cuantitativa de interés.

Figura 65. Mapa de Burbujas

Nota. ESpatial, 2014. Recuperado de


https://www.espatial.com/articles/create-a-bubble-map

140
5.2.1.1.5.2 Tipos de Variables

 Variables con escala de intervalos y valores discretos.

5.2.1.1.5.3 Cuando utilizarlo

 Es útil utilizarlo cuando lo que se quiere realizar es una comparación


de proporciones sobre regiones geográficas sin los problemas
causados por el tamaño del área regional, caso contrario a los mapas
Choropleths.

5.2.1.1.5.4 Cuando no utilizarlo

 Dependiendo los datos que se manejen las burbujas pueden llegar a


ser muy grandes, se pueden superponer a otras y también a regiones
en el mapa, por lo que este necesita ser contabilizado, de lo contrario
podría crear confusión.

5.2.1.1.5.5 Ejemplos de aplicación


El Diario Financial Times elaboró en el 2010 un gráfico que muestra la
inversión internacional de China desde el 2003 hasta el 2009 en diferentes
dimensiones. Para ello utilizó un mapa de burbujas el cual mostraba los países
con quienes ha realizado alguna inversión mientras que el tamaño de las
burbujas varía dependiendo la dimensión escogida (Porcentaje total de
exportaciones, volumen total en millones de dólares e inversión directa
extranjera de China). Como resultado del uso del gráfico se puede visualizar la
creciente presencia de China en inversión en el mundo.

141
Figura 66. Inversiones Internacionales de China
Nota. Financial Times, 2010. Recuperado de http://www.improving-
visualisation.org/vis/id=314

5.2.1.1.5.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 CartoDB

 Datavisual

 Google Docs

 Polymaps

5.2.1.1.5.7 Ejemplos de Uso


Este ejemplo elaborado por la página web Mango muestra de forma preliminar
cómo elaborar dicho gráfico. Para el caso muestra la cantidad de población por
estado en Estados Unidos.
Enlace: http://mangomap.com/maps/51682/Bubble-Map#

142
5.2.1.1.6 Gráfico Nightingale Rose (Coxcomb Chart/ Polar Area Diagram)

5.2.1.1.6.1 Definición
Esta fue una técnica bastante utilizada por el estadístico y médico Florence
Kigthingale con la intención de mostrar las muertes prevenibles de los soldados
durante la guerra de Crimea. Cada categoría o intervalo de los datos se dividen
en segmentos iguales en un gráfico radial. Para poder determinar qué tanto se
extiende los segmentos en proporción al valor que representa, se toma en cuenta
el eje polar.

Figura 67. Gráfico Nightingale Rose


Nota. Data Visualization
Catalogue. Recuperado de
http://www.datavizcatalogue.com/
methods/nightingale_rose_chart.ht
ml

143
5.2.1.1.6.2 Tipos de Variables

 Variables con escala de intervalos y valores discretos.

5.2.1.1.6.3 Cuando utilizarlo

 Puede ser utilizado en caso se quiera visualizar el tamaño de cada


segmento y representar el valor más alto, para esto se haría uso de
cada anillo desde el centro de la cuadrícula, que sería como una
escala.

 En caso se tenga diferentes categorías/ grupos por cada segmento, se


puede hacer uso de distintos colores para diferenciarlos, además de
agregar una leyenda para una clara interpretación.

5.2.1.1.6.4 Cuando no utilizarlo

 No se recomienda utilizarlo cuando no se tiene una idea clara de


cómo interpretar este gráfico, pues se tiende a darle mucha
importancia a los segmentos externos debido a sus grandes tamaños y
esto a su vez produce aumentos desproporcionados de su valor.

5.2.1.1.6.5 Ejemplos de aplicación


La Figura 13 nos habla de los programas que fueron influencia para la creación
y posterior emisión de Los Simpsons (color celeste) y los programas que se
vieron influenciados por este (color amarillo). Como se puede observar la
escala indica los años al cual pertenecen los programas y su tamaño dependerá
de cuantos años abarquen.

144
Figura 68. Gráfico Nightingale Rose acerca de los Simpsons
Nota. CNN, 2009. Recuperado de
http://edition.cnn.com/2009/SHOWBIZ/TV/12/14/s
idebar.simpsons.influence/index.html

5.2.1.1.6.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 Datamatic

 Infogr.am

5.2.1.1.6.7 Ejemplos de Uso


Para obtener otros ejemplos nos podemos dirigir a la página de Powered
Template, en el siguiente enlace:
http://charts.poweredtemplate.com/powerpoint-diagrams-charts/ppt-pie-
charts/01056/0/index.html

5.2.1.1.7 Gráfico de Columnas Radial (Radial Column Chart/ Circular Column


Graph/ Star Graph)

5.2.1.1.7.1 Definición
También es conocido como gráfico de columnas circular o gráfico estrella. Es
una técnica que utiliza una grilla para concentrar círculos y con ello mostrar
barras. Cada círculo en el gráfico representa un valor en una escala, mientras

145
que los divisores radiales son utilizados por cada categoría o intervalo (en caso
sea un histograma).
Por lo general, los valores bajos en la escala empiezan del centro e incrementan
con cada círculo, no obstante, también se puede mostrar valores negativos si es
que el 0 no se encuentra en el centro, sino a partir de los siguientes divisores.
Las barras tienden a empezar desde el centro y de ahí extenderse hacia afuera.

Figura 69. Gráfico de Columnas Radial


Nota. Data Visualization Catalogue.
Recuperado de
http://www.datavizcatalogue.com/me
thods/radial_column_chart.html

5.2.1.1.7.2 Tipos de Variables

 Variables con escala de intervalos y valores discretos.

5.2.1.1.7.3 Cuando utilizarlo

 Cuando se desea comprar los valores de un determinado grupo de


variables.

146
 En caso se desee tener otra vista del valor de cada variable.

5.2.1.1.7.4 Ejemplos de aplicación


La Figura 15 está enfocada en los países y la cantidad de CO2 que estos
emitieron en el 2006. Como se puede observar la escala indica la cantidad de
CO2, cada barra son los países y los colores permiten distinguir a qué
continentes pertenecen.

Figura 70. Gráfico de Columnas Radial


Nota. ModernData, 2016. Recuperado de
http://moderndata.plot.ly/radial-bar-charts-
in-r-using-plotly/

5.2.1.1.7.5 Herramientas
Se puede elaborar dicha técnica en herramientas como:

147
 jChartFX (JavaScript plugin)

5.2.1.1.7.6 Ejemplos de Uso


Para obtener otros ejemplos nos podemos dirigir a la página de Data Viz
Project, en el siguiente enlace:
http://datavizproject.com/data-type/radical-histogram/

5.2.1.1.8 Gráfico Radar (Radar Chart/ Spider Chart/ Web Chart/ Polar Chart/
Star Plots)

5.2.1.1.8.1 Definición
Es una forma de comparar cantidades múltiples de variables. Son útiles para
visualizar qué variables tienen similares valores o si es que existen valores
atípicos en cada variable. Son útiles para visualizar qué están calificadas de
forma alta o baja por cada dataset, ideal para verificar el rendimiento mostrado.
Cada variable tiene asignado un eje, que comienza desde el centro. Ada eje se
encuentra ubicado radialmente, con distancias iguales. También se muestran
líneas que unen los ejes como método referencial o guía al momento de mostrar
la data. Cada valor es mostrado en cada eje y distinguida por un punto, al unir
cada punto forma un polígono, forma final a mostrar.

Figura 71. Gráfico Radar

148
Note. Data Visualization Catalogue.
Recuperado de
http://www.datavizcatalogue.com/me
thods/radar_chart.html

5.2.1.1.8.2 Tipos de Variables

 Variables con escala nominal y valores discretos.

5.2.1.1.8.3 Cuando utilizarlo

 Cuando se desee comparar cantidades múltiples de variables.

 Cuando se quiera conocer qué variables tienen valores similares o si


es que existen valores atípicos en cada variable.

 Si en caso se tiene un número limitado de variables a trabajar para


lograr una visualización sencilla.

 Se utiliza cuando las diferentes fuentes deben encontrarse


estandarizadas para que puedan ser medidas de igual forma.

5.2.1.1.8.4 Cuando no utilizarlo

 Cuando se quiera mostrar muchos polígonos. Esto puede hacer que


su interpretación sea dificultosa, logrando que sea confusa y
complicada.

 Cuando se quiere comparar valores a través de cada variable. Esto se


debe a que es más entendible y fácil de comparar todas las variables
en una sola pasada por todos los ejes con sus respectivas variables.

5.2.1.1.8.5 Ejemplos de aplicación

149
La página Coffee Analysts utiliza el gráfico radar para comparar visualmente y
contrastar muestras como un punto de referencia para el desarrollo de nuevos
productos o sabores, es decir, "Quiero que mi café tenga esto o aquello". Se
puede observar que la escala indica la cantidad de cada fragancia (sabor) y
cada eje son los distintos tipos de fragancias.

Figura 72. Gráfico Radar


Nota. Coffee Analysts, 2011. Recuperado de
http://www.coffeeanalysts.com/2011/11/coffee-
spider-graphs-explained/

5.2.1.1.8.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 Amcharts

 Google Docs

 jChartFX (JavaScript plugin)

 Online Chart Tool

 Zing Chart

150
5.2.1.1.8.7 Ejemplos de Uso
Para obtener otros ejemplos nos podemos dirigir a la página de Data Viz
Project, en el siguiente enlace:
http://datavizproject.com/data-type/radar-diagram/

5.2.1.1.9 Gráfico Span (Range Bar/ Column Graph/ Floating Bar Graph/
Difference Graph, High-Low Graph)

5.2.1.1.9.1 Definición
Es utilizado para mostrar un conjunto de data desde un rango de valor mínimo
hasta un valor máximo. Muestra sólo los valores extremos, mínimo y máximo,
no se especifica los valores intermedios.

Figura 73. Gráfico Span


Nota. Data Visualization Catalogue.
Recuperado de
http://www.datavizcatalogue.com/methods/span
_chart.html

5.2.1.1.9.2 Tipos de Variables

 Variables con escala nominal y valores discretos.

151
5.2.1.1.9.3 Cuando utilizarlo

 En caso de querer realizar comparaciones de rangos de datos


distinguidos por categorías.

 En caso de querer evaluar los valores mínimos y máximos.

 Cuando no es crítico conocer los valores intermedios de los rangos


expuestos.

5.2.1.1.9.4 Cuando no utilizarlo

 Cuando se desea tener más detalle de los valores intermedios de los


rangos.

 Cuando se quiere conocer el promedio de los valores de los rangos.

 Cuando se quiere conocer la distribución de la data (Sólo por


categoría)

5.2.1.1.9.5 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 ZingChart

5.2.1.1.9.6 Ejemplos de Uso


Para obtener otros ejemplos nos podemos dirigir a la página de Data Viz Project,
en el siguiente enlace:
http://datavizproject.com/data-type/span-chart/

152
5.2.1.1.10 Gráfico de Barras Multi Set (Multi-set Bar Chart/ Grouped/ Clustered
Bar Charts)

5.2.1.1.10.1 Definición
También son conocidos como Gráfico de barras agrupados. Estos son agrupados
uno al costado del otro diferenciados por categorías ubicados en el mismo eje.
El tamaño de las barras permite ver las comparaciones numéricas discretas de
las cantidades que representan a través de categorías. Cada una de estas
agrupaciones se encuentra separadas.
Su mayor aporte es el de permitir comparar entre los conjuntos de data, cada uno
de ellos distribuidos en las mismas variables o categorías. También este tipo de
técnica realiza comparaciones de mini histogramas.

Figura 74. Gráfico de Barra Multi Set


Nota. Data Visualization Catalogue.
Recuperado de
http://www.datavizcatalogue.com/me
thods/multiset_barchart.html

5.2.1.1.10.2 Tipos de Variables

 Variables con escala nominal y valores discretos.

5.2.1.1.10.3 Cuando utilizarlo

153
 Cuando se desea comparar dos a más data sets por
categorías/variables.

 Cuando se quiere realizar comparaciones entre mini histogramas.

 Se puede asignar diferentes colores por cada subgrupo (data set), los
cuales permite identificarlos en cada categoría.

5.2.1.1.10.4 Cuando no utilizarlo

 Cuando se maneja distintas variables/categorías por cada agrupación


de datos.

5.2.1.1.10.5 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 D3

 DataHero

 Datavisual

 Datawrapper

 Infogr.am

 NVD3.js (code)

 R Graph Gallery (code)

 Slemma

 Vega (code)

 Visage

5.2.1.1.10.6 Ejemplos de Uso

154
Para obtener otros ejemplos nos podemos dirigir a la página de Plotly, en el
siguiente enlace:
https://plot.ly/matlab/bar-charts/

5.2.1.1.11 Gráfico de anillos (Donut chart)

5.2.1.1.11.1 Definición
Esta técnica guarda la esencia de un gráfico de pie con la diferencia de no contar
con la parte central de este.
A diferencia del diagrama de pie es más claro distinguir las diferencias de cada
variable/categoría a diferencia del diagrama de pie, el cual tienden a criticar por
los tamaños relativos de las categorías. En ese caso se tiende a evaluar el largo
del arco.

Figura 75. Gráfico de anillos

Nota. Data Visualization Catalogue.


Recuperado de

155
http://www.datavizcatalogue.com/me
thods/donut_chart.html

5.2.1.1.11.2 Tipos de Variables

 Variables con escala nominal y valores discretos.

5.2.1.1.11.3 Cuando utilizarlo

 En caso lo que se quiera distinguir es la diferencia entre las proporciones


de las variables/ categorías.

5.2.1.1.11.4 Cuando no utilizarlo

 En caso se cuente con una gran cantidad de variables/ categorías a


analizar.

5.2.1.1.11.5 Ejemplos de aplicación


La organización AVERT, el cual se encarga de apoyar a las personas con VIH
en el mundo, publicó en su sitio web las muertes relacionadas al VIH en Sub
Saharan África durante el 2013, para ello utilizó de la técnica, clasificando por
colores los diferentes países de esa área y mostrando el porcentaje, el cual
indica la cantidad de muertes en cada uno de los países. Como resultado se
pudo interpretar que el país con mayores muertes relacionadas a virus VIH en
dicha zona es Nigeria con un 19%.

156
Figura 76. Muertes relacionadas al VIH en Sub Saharan África 2013
Nota. AVERT. Recuperado de http://www.avert.org/professionals/hiv-around-
world/sub-saharan-africa/overview

5.2.1.1.11.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 D3 (Single) o D3 (Multiple)

 DataHero

 Datamatic

 Datavisual

 Datawrapper

 Google Docs

 Infogr.am

 Protovis

 Slemma

 Visage

 ZingChart

157
5.2.1.1.11.7 Ejemplos de Uso
Esta técnica fue utilizada por el diario el Comercio en el 2015 para mostrar la
composición del PBI en el Perú, la información fue obtenida de la INEI y de la
Guía de Negocios e Inversión 2015-2016 de Ernst & Young. Para ver el
ejemplo dirigirse a la página del Comercio en el siguiente enlace:
http://elcomercio.pe/economia/peru/grafico-dia-cuanto-pesa-cada-sector-pbi-
peru-noticia-1825899

5.2.1.1.12 Gráfico Marimekko (Marimekko Chart/ Mosaic Plot)

5.2.1.1.12.1 Definición
Esta técnica posee dos ejes, (X e Y) en los cuales se distinguen dos gráficos
apilados hasta el 100%, todas las barras son de igual longitud y son divididos en
segmentos. Cada eje representa una variable con una escala que determinan la
longitud y ancho de cada segmento. Esto hace posible detectar la relación entre
categorías y subcategorías (si es que existen) a través de las dos variables.
Tiene similitud con el gráfico apilado en 2D, no obstante, además de distribuir la
data en niveles de acuerdo a las variables, también agregan como factor a
observar, el grosor de las columnas.

Figura 77. Gráfico Marimekko

158
Nota. Data Visualization Catalogue. Recuperado de
http://www.datavizcatalogue.com/methods/marimekko
_chart.html

5.2.1.1.12.2 Tipos de Variables

 Variables con escala nominal, ordinal y valores continuos.

5.2.1.1.12.3 Cuando utilizarlo

 Es utilizado para visualizar data en categorías, haciendo uso de un


par de variables.

 Si lo que se desea es obtener una vista panorámica de la data.

5.2.1.1.12.4 Cuando no utilizarlo

 En caso se desconozca cómo interpretar este tipo de gráfico, se


recomienda no utilizarlo, debido a que no son tan fáciles de
interpretar sobre todo si es que son muchos segmentos.

 Si los segmentos no se encuentran alineados continuamente como si


se tratase de un gráfico de barras, se recomienda no utilizarlo, pues se
dificulta realizar las comparaciones entre estos.

 En caso se quiera tener un profundo análisis de la data.

5.2.1.1.12.5 Ejemplos de aplicación


La empresa Nielsen, hizo un estudio acerca de qué marcas de celulares
preferían los americanos y cuáles eran los sistemas operativos de estos
celulares, para esto utilizaron un Gráfico Marimekko para representar el
porcentaje por edad de usuarios que prefieren estos sistemas operativos, en
comparación a otro. Como se puede apreciar en la Figura 23, en el eje X se

159
muestra los sistemas operativos y en el eje Y los grupos de edades y por cada
uno el porcentaje respectivo.

Figura 78. Gráfico Marimekko


Nota. Nielsen, 2011. Recuperado de
http://www.nielsen.com/us/en/insights/news/2011/who-is-winning-
the-u-s-smartphone-
battle.html?utm_source=feedburner&utm_medium=feed&utm_camp
aign=Feed:+NielsenWire+%252528Nielsen+Wire

5.2.1.1.12.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 D3

5.2.1.1.12.7 Ejemplos de Uso


Para obtener otros ejemplos nos podemos dirigir a la página de Mekko
Graphics, en el siguiente enlace:
http://www.mekkographics.com/resources/charts-by-type/marimekko/

5.2.1.1.13 Gráfico Pie (Pie Chart)

5.2.1.1.13.1 Definición

160
Es una de las técnicas más utilizadas y conocidas. Cada arco representa una
proporción de cada categoría lo cual al ser sumado se obtiene el 100% de la
data.

Figura 79. Gráfico Pie


Nota. Data Visualization Catalogue.
Recuperado de
http://www.datavizcatalogue.com/methods/pie
_chart.html

5.2.1.1.13.2 Tipos de Variables

 Variables con escala de nominal y valores continuos.

5.2.1.1.13.3 Cuando utilizarlo

 Es útil cuando lo que se quiere analizar son proporciones y


porcentajes de determinadas categorías a considerar dentro del
gráfico, divididos por segmentos en un círculo.

161
 Se recomienda utilizarlo cuando se quiere comparar un segmento o
categoría frente al total, para identificar la relación que guarda.

5.2.1.1.13.4 Cuando no utilizarlo

 Cuando existen muchos valores, se vuelve más dificultoso


entenderlo.

 De tener muchos valores, los segmentos se volverían más pequeños,


provocando que no se pueda visualizar fácilmente las diferencias
entre los segmentos.

 En caso no se desee o no se cuente con el espacio suficiente para


mostrar la técnica

 Cuando se pretende comparar diferentes conjuntos de datos en


distintos gráficos de pie.

5.2.1.1.13.5 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 MS Excel or Apple Numbers

 D3

 DataHero

 Datamatic

 Datavisual

 Datawrapper

 Google Charts and Google Docs

 Infogr.am

 Protovis

 OnlineChartTool.com

162
 Slemma

 ZingChart

5.2.1.1.13.6 Ejemplos de Uso


Para obtener otros ejemplos nos podemos dirigir a la página de Data Viz
Project, en el siguiente enlace:
http://datavizproject.com/data-type/pie-chart/

5.2.1.1.14 Gráfico de barras apiladas (Stacked Bar Graph)

5.2.1.1.14.1 Definición
Esta técnica segmenta las barras en porciones de distintos tamaños. Cada
porción es una categoría. Es utilizado para mostrar las sub categorías de una
categoría y cuál es su relación cuantitativamente con respecto al total. Existen
dos tipos: simples y al 100%.
Simples: muestra cada valor al costado del otro y el total es la suma de los
valores mostrados.
100%: muestra el porcentaje de cada sub segmento, el cual en total completan el
100%.

Figura 80. Gráfico de barras apiladas


Nota. Data Visualization Catalogue.
Recuperado de

163
http://www.datavizcatalogue.com/methods/s
tacked_bar_graph.html

5.2.1.1.14.2 Tipos de Variables

 Variables con escala de intervalos y valores continuos.

5.2.1.1.14.3 Cuando utilizarlo

 Cuando se desea realizar un análisis comparativo.

 En caso de los gráficos de barras apiladas simples, se utiliza cuando se


desea mostrar el total de las cantidades considerando las barras.

 En caso de los gráficos de barras apiladas al 100%, se utiliza cuando lo


que se desea es visualizar las diferencias relativas cuantitativamente de
cada segmento.

5.2.1.1.14.4 Cuando no utilizarlo

 En caso hay una gran cantidad de segmentos a mostrar en la barra. Esto


dificulta realizar comparaciones cuando posee distintas cantidades de
segmentos y/o cuando no tiene la misma base de categorías.

5.2.1.1.14.5 Ejemplos de aplicación


En el año 2010, Tableau realizó una encuesta basándose en los clientes de
Garter del cuadrante mágico de BI, la encuesta estaba relacionada a como estos
clientes utilizaban sus plataformas de BI.

164
Figura 81. Gráfico de barras apiladas
Nota. Tableau, 2010. Recuperado de
http://www.tableau.com/blog/gartner-vendors-bi-
activities
En la imagen de arriba, se puede apreciar el porcentaje de clientes que utilizan el
producto de uno de las ocho diferentes actividades de BI. Cada barra apilada
representa la suma de esos. Puesto que un cliente puede utilizar un producto
para múltiples funciones, la barra apilada llega a más de 100%.

5.2.1.1.14.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 MS Excel & Apple Numbers

 Datavisual

 Datawrapper

 Infogr.am

 Slemma

 ZingChart

165
5.2.1.1.14.7 Ejemplos de Uso
Para obtener otros ejemplos nos podemos dirigir a la página de Mekko
Graphics, en el siguiente enlace:
http://www.mekkographics.com/resources/charts-by-type/bar/

5.2.1.1.15 Gráfico de Área Proporcional (Proportional Area Chart)

5.2.1.1.15.1 Definición
Por lo general esta técnica se muestra en círculos o en cuadrados. El objetivo es
comparar valores para dar una rápida vista de los tamaños relativos de la data,
sin el uso de escalas.
También es posible mostrarlo haciendo uso de otro tipo de forma además de
circulo o cuadrados. Al final, es importante que se pueda mostrar de alguna
forma la data.

Figura 82. Gráfico de Área Proporcional


Nota. Data Visualization Catalogue. Recuperado
de
http://www.datavizcatalogue.com/methods/area_c
hart.html

5.2.1.1.15.2 Tipos de Variables

 Variables cuantitativas.

5.2.1.1.15.3 Cuando utilizarlo

166
 Cuando se desea comparar valores para dar una rápida vista de los
tamaños relativos de la data, sin el uso de escalas.

 Cuando su uso es netamente para comunicar la información, no para


análisis.

5.2.1.1.15.4 Cuando no utilizarlo

 Cuando lo que se desea es estimar valores.

 Cuando se utiliza una longitud para determinar el tamaño de la figura a


utilizar. Para ello, lo que se debería realizar es calcular el espacio para
determinar el tamaño, de lo contrario se mostraría incrementos y bajas
exponencialmente.

5.2.1.1.15.5 Ejemplos de aplicación


En la Figura 28 se muestra la crisis de la deuda europea desde el año, hace uso
de las gráficas de áreas proporcionales. Los países están ordenados por el
tamaño de su PIB, y luego se cubrieron con un bloque rojo que representa el
porcentaje del PIB que es la deuda del gobierno. Como se puede apreciar, la
proporción de los cuadros es en base a la cantidad del PIB.

167
Figura 83. Gráfico de Área Proporcional
Nota. Undullify. Recuperado de http://undullify.com/data-
visualization-101-visualize-common-simple-data-points/

5.2.1.1.15.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 D3 (Bubbles/Circles)

 Datamatic

 Datavisual

 Infogr.am

5.2.1.1.15.7 Ejemplos de Uso


Para obtener otros ejemplos nos podemos dirigir a la página de Data Viz
Project, en el siguiente enlace:
http://datavizproject.com/data-type/proportional-area-chart/

168
5.2.1.1.16 Gráficos de líneas (Line Graph)

5.2.1.1.16.1 Definición
Los gráficos de líneas se dibujan partiendo de puntos de datos de trazado en un
plano de coordenadas cartesianas y luego se conecta una línea entre los puntos.
Típicamente, el eje Y tiene un valor cuantitativo, mientras que el eje X tiene
una escala categórica o secuenciada. Los valores negativos se pueden mostrar
por debajo del eje X.

Figura 84. Gráficos de líneas

Nota. Data Visualization Cataloge.


Recuperado de
http://www.datavizcatalogue.com/me
thods/line_graph.html

5.2.1.1.16.2 Tipos de Variables

 Variables con escala de intervalos y valores continuos.

5.2.1.1.16.3 Cuando utilizarlo

 Son utilizados para mostrar valores cuantitativos a través de un


intervalo continuo o lapso de tiempo.

169
 Se utiliza con mayor frecuencia para mostrar tendencias y relaciones
(cuando se agrupan con otras líneas).

 Los gráficos de líneas ayudan a dar una "visión global " sobre un
intervalo, para ver cómo se ha desarrollado a lo largo de un período
determinado.

5.2.1.1.16.4 Cuando no utilizarlo


Cuando se muestran varias líneas, sobrecargando el gráfico. Para ello, se
recomienda mantener una cierta cantidad de líneas (5-7) (Ley de Miller), si el
gráfico se recarga o tiene muchas líneas, es más dificultoso para el usuario
captar la información.

5.2.1.1.16.5 Ejemplos de aplicación


En la Figura 31 se muestra el porcentaje de crecimiento de la población de
África desde 1970 hasta el 2015. Como se puede observar en el eje X se muestra
los años y en el eje Y los porcentajes. Esta información es obtenida de la base de
datos de Knoema.

Figura 85. Porcentaje de crecimiento de la población de África


desde 1970 hasta 2015

170
Nota. Knoema, 2015. Recuperado de
http://knoema.es/UNWPP2015R/world-
population-prospects-the-2015-revision

5.2.1.1.16.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 MS Excel or Apple Numbers

 D3 (Single) and D3 (Multiple)

 DataHero

 Datamatic

 Datawrapper

 Envision.js

 Google Charts and Google Docs

 Infogr.am

 OnlineChartTool.com

 Slemma

 Vega

5.2.1.1.16.7 Ejemplos de Uso


Un ejemplo encontrado fue en la página de Anychart mostrado en el siguiente
enlace:
http://anychart.com/products/anychart/gallery/Line,_Spline,_Step-
Line_Charts/Line_Chart.php
Del mismo modo, otro ejemplo encontrado fue en de la base de datos de la
página Knoema:

171
http://knoema.es/UNWPP2015R/world-population-prospects-the-2015-
revision

5.2.1.1.17 Sets paralelos (Parallel Sets)

5.2.1.1.17.1 Definición
Son similares a los diagramas Sankey en la forma como muestra el flujo y
proporciones de la data, sin embargo, esta técnica no utiliza flechas y se dividen
el flujo del camino en cada set de línea mostrado.
Combina las ventajas de técnicas basadas en la frecuencia, en este caso de
categorías en coordenadas paralelas.
Su objetivo principal es mostrar data categórica, su creación se dio
principalmente por ello. Cada línea corresponde a una dimensión o dataset que
son valores/ categorías que se representan en cada línea. El grosor de cada línea
y los caminos de los flujos son determinados por la fracción proporcional de la
categoría total. Cada camino de flujo puede ser distinguido por diferentes
colores para mostrar y comparar la distribución entre categorías.
Esta técnica de visualización consta de ejes que no se encuentran
ortogonalmente posicionados, si no que se encuentran colocados uno al lado del
otro, de tal forma que permite mostrar data en alta dimensión, ya que los ejes
son visualmente independientes.(Bendix, Kosara & Hauser, 2005)

172
Figura 86. Sets Paralelos
Nota. Data Visualization Catalogue.
Recuperado de
http://www.datavizcatalogue.com/met
hods/parallel_sets.html

5.2.1.1.17.2 Tipos de Variables

 Variables cualitativas

5.2.1.1.17.3 Cuando utilizarlo

 Cuando se quiere mostrar data categórica.

 Cuando se desea comparar la distribución entre categorías, en este caso


se hace uso de distintos colores por cada categoría.

173
5.2.1.1.17.4 Ejemplos de aplicación
Un análisis de la actividad de Facebook revela cómo cambió apoyo de los
aficionados durante el torneo.

Figura 87. Sets Paralelos – How Fan Loyalty Change During the World Cup
Nota. New York Times. Recuperado de
http://www.nytimes.com/interactive/2014/07/12/upshot/how-fan-
loyalty-changed-during-the-world-cup.html

En la Figura 87 se muestra las migraciones de apoyo de los aficionados de un


país a otro a lo largo del torneo, etapa por etapa. Se indica los países y el
grosor de cada uno, el porcentaje. Cabe resaltar la utilización de colores para
poder hacer más notorio la presencia de cada país en cada etapa.

5.2.1.1.17.5 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 SankeyMATIC

 Jason Davies (D3)

 EagerEyes: ParallelSets

5.2.1.1.17.6 Ejemplos de Uso

174
Para obtener otros ejemplos nos podemos dirigir a la página de Data Viz
Project, en el siguiente enlace:
http://datavizproject.com/data-type/parallel-sets/

5.2.1.1.18 Diagrama de caja (Box and Whisker Plot)

5.2.1.1.18.1 Definición
Esta técnica es una representación que permite conocer cinco valores concisos
acerca de la distribución de un conjunto de datos, estos son el valor mínimo,
máximo, cuartil superior, inferior y la mediana. (Potter, 2006, p.98) Por lo
general, también tienen líneas que se extienden en paralelo de las cajas
(barbas) que indican la variabilidad fuera de los cuartiles superior e inferior.
Los valores atípicos a veces se representan como puntos individuales que están
en línea con las barbas.
A pesar de que puedan parecer primitivos en comparación con un histograma o
gráfico de densidad, tienen la ventaja de ocupar menos espacio.
Dos de las variaciones más comúnmente utilizadas del diagrama de caja son:
diagramas de caja ancho variable y gráficos de caja con muescas.

Figura 88. Diagrama de Caja

175
Nota. Data Visualization Catalogue.
Recuperado de
http://www.datavizcatalogue.com/meth
ods/box_plot.html

5.2.1.1.18.2 Tipos de Variables

 Variables cuantitativas.

5.2.1.1.18.3 Cuando utilizarlo

 Es útil para examinar rápidamente en uno o más conjuntos de datos


gráficamente.

 Es útil cuando se comparan las distribuciones entre muchos grupos o


conjuntos de datos (ocupa poco espacio).

 A partir de la visualización de un diagrama de caja, se puede realizar las


siguientes observaciones:

o Cuáles son los valores clave, por ejemplo: la media, la mediana


25a percentil etc.
o La existencia de valores atípicos y cuáles son.
o Qué tan junta se encuentra la data agrupada (dependiendo la
ubicación de la data se puede distinguir si hay patrones de
comportamiento de la data).
o Si los datos son asimétricos o no y, en caso afirmativo, en qué
dirección.

5.2.1.1.18.4 Cuando no utilizarlo

 Si lo que se desea mostrar es data cualitativa, ya sea sean categorías o


valores no numéricos.

176
5.2.1.1.18.5 Ejemplos de aplicación
Este tipo de gráficos es comúnmente utilizado en el ámbito estadístico, por
ejemplo el Centro de Investigación y Desarrollo realizó en el 2002 ,un gráfico
de diagrama de caja del PBI del Perú en el cual se muestra cada caja por cada
mes desde 1991 hasta el 2001 con la finalidad de comparar por cada mes la
mediana, la cual es representada por una línea horizontal al interior de cada
caja, la dispersión de los valores mediante la longitud de la caja y las
prolongaciones conocidos como “bigotes”. Como resultado, se puede
visualizar que en los primeros y últimos meses se presentan los menores
niveles de producción, mientras que el mes de mayo es el que registra mayor
nivel de producción

Figura 89. PBI 1991 - 2001 Perú


Nota. Centro de Investigación y Desarrollo,
2002. Recuperado de
https://www.inei.gob.pe/media/MenuRecurs
ivo/publicaciones_digitales/Est/Lib1160/libr
o.pdf

5.2.1.1.18.6 Herramientas

177
Se puede elaborar dicha técnica en herramientas como:
 D3

 Protovis

 R Graph Gallery

 ZingChart

5.2.1.1.18.7 Ejemplos de Uso


Al ser una técnica mayormente utilizada en el ámbito matemático, estadístico,
existen distintas fuentes web en el cual muestran su funcionalidad, tal como se
muestra en la página web Braining Camp en el siguiente enlace:
https://www.brainingcamp.com/lessons/box-and-whisker-
plots/manipulative.php

5.2.1.1.19 Gráfico de Tallo y Hoja (Stem and Leaf plot/ Stemplot/ Stem & Leaf
Display)

5.2.1.1.19.1 Definición
Es una técnica que permite organizar data tomando en cuenta su lugar de valor
para mostrar su distribución. Los valores son ubicados ascendentemente hacia
abajo en una columna “tallo”. La data que se encuentra asociada con cada valor
ubicado en el tallo se lista por los costados, llamados “hojas”.
Los valores ubicados en la columna “tallo” representarán la parte decena de los
números, mientras que los números mostrados en las hojas serán la parte de la
unidad de tal forma que si se quiere mostrar los valores: 3, 4, 12, 14, 16, 22, 34,
con el gráfico se representaría así:
Tallo Hojas
0 3,4
1 2,4,6

178
2 2
3 4

Figura 90. Gráfico de Tallo y Hoja


Nota. Data Visualization Catalogue.
Recuperado de
http://www.datavizcatalogue.com/methods
/stem_and_leaf_plot.html

5.2.1.1.19.2 Tipos de Variables

 Variables cuantitativas.

5.2.1.1.19.3 Cuando utilizarlo

 Es útil cuando se quiere tener una vista general de la distribución de la


data.

 Si se quiere saber si es que se tiene valores atípicos.

 Cuando se tiene dos conjuntos de datos, se puede graficar a través de una


variación de la técnica (doble tallo) para poder comparar los valores de
los dos conjuntos de datos.

179
5.2.1.1.19.4 Cuando no utilizarlo

 Si es que se cuenta con mucha data en el conjunto, se vuelve complicado


de analizar.

 Si es que se cuenta con muy poca data, no tiene sentido utilizar la


técnica.

5.2.1.1.19.5 Ejemplos de aplicación


En la Figura 36, la estación de trenes de Minatomirai en Yokohama, Japón;
existe una tabla que indica la salida de los trenes con este patrón de diseño, la
columna de color negro muestra el numero inicial (línea principal) y luego la
finalización de los números de los distintos buses que pertenecen a dicha línea.

Figura 91. Ejemplo del uso de un diagrama Tallo y Hoja


Nota. Wikipedia, 2016. Recuperado de
http://en.wikipedia.org/wiki/Stem-and-leaf_display

5.2.1.1.19.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 ZingChart

180
5.2.1.1.19.7 Ejemplos de Uso
Para obtener otros ejemplos nos podemos dirigir a la página Bitesize de la
BBC, en el siguiente enlace:
http://www.bbc.co.uk/education/guides/zvybkqt/revision/7

5.2.1.1.20 Histograma (Histogram)

5.2.1.1.20.1 Definición
Un histograma muestra la distribución de datos a través de un período de
tiempo de intervalo. Este es la principal diferencia con la representación de
barras. Cada barra representa un histograma de la frecuencia tabulada en cada
intervalo / bin. El área total del histograma es igual al número de datos.
Los histogramas ayudan a dar una estimación de cuánto y en dónde se
concentran los valores, lo que los extremos encuentran y si hay lagunas o
valores inusuales.

Figura 92. Histograma

Nota. Data Visualization


Catalogue. Recuperado de

181
http://www.datavizcatalogue.com/
methods/histogram.html

Figura 93. Salario de Trabajos de TI de los últimos tres meses hasta el 28 de mayo
del 2016 en Inglaterra
Nota. ITJobsWatch, 2016. Recuperado de
http://www.itjobswatch.co.uk/jobs/uk/python.do

5.2.1.1.20.2 Tipos de Variables

 Escala de intervalos con valores continuos.

5.2.1.1.20.3 Cuando utilizarlo

 Es útil si se quiere conocer dónde los valores se concentran.

 Son útiles para dar una vista aproximada de la distribución de


probabilidad.

 Cuando se quiere distribuir la data y se quiere mostrar las relaciones que


existen en una variable sobre un conjunto de categorías.

 Es una forma de organizar la data.

182
5.2.1.1.20.4 Cuando no utilizarlo

 Cuando la data a analizar es nominal u ordinal.

 Cuando se desea representar distribuciones de frecuencia, no se


recomienda utilizar muchos segmentos de intervalo, en tal caso lo
recomendables es entre 5 a 20 segmentos de intervalo.

5.2.1.1.20.5 Ejemplos de aplicación


Kathy Rowell, co fundadora de Katherine S. Rowell & Associates and
HealthDataViz, consultora especializada en la visualización de datos en el
ámbito de la salud, muestra en uno de sus artículos la frecuencia de bajo riesgo
de parto por edad de la madre en Estados unidos en el 2013. Dicha
información la muestra a través de un histograma en el cual se puede observar
los intervalos de las edades en el eje X y los porcentajes por cada rango en el
eje Y. Los signos utilizados en los intervalos permiten la distinción y
aclaración de los rangos sin dejar ambigüedad.

Figura 94. Histograma de Riesgo de parto por cesárea por edad


de la madre en Estados Unidos en el 2013
Nota. Katherine S. Rowell blog, 2015.
Recuperado de http://ksrowell.com/blog-
visualizing-data/2013/

183
5.2.1.1.20.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 MS Excel and Apple Numbers

 D3

 Datavisual

 Datamatic

 Google Docs

 Infogr.am

 OnlineChartTool.com

 Protovis

 Slemma

 R Graph Gallery

5.2.1.1.20.7 Ejemplos de Uso


Para obtener otros ejemplos nos podemos dirigir a la página de Google
Developers, en el siguiente enlace:
https://developers.google.com/chart/interactive/docs/gallery/histogram#controlli
ng-buckets

5.2.1.1.21 Diagrama de Árbol (Tree Diagram/Organizational Chart Linkage Tree)

5.2.1.1.21.1 Definición
Esta técnica permite visualizar la data jerárquica en forma de una estructura de
árbol. Parte de un nodo principal padre, el cual no depende de nadie, a partir de
este se originan nodos hijos que a su vez se relacionan a través de conectores
(Ramas). Finalmente, los últimos nodos serán considerados así cuando ya no
existan ramificaciones hijas debajo de estas.

184
Figura 95. Diagrama de árbol

Nota. Data Visualization Catalogue.


Recuperado de
http://www.datavizcatalogue.com/me
thods/tree_diagram.html

5.2.1.1.21.2 Tipos de Variables

 Variable Cualitativa

5.2.1.1.21.3 Cuando utilizarlo

 En caso se quiera mostrar data jerárquica.

 En caso se quiere visualizar las relaciones de la data a trabajar.

 En el estudio de la taxonomía, cuando se quiere realizar clasificaciones.

 En la ciencia evolutiva, para mostrar el origen de las especies.

 Su estructura puede representarse de arriba hacia abajo como de


izquierda a derecha.

185
5.2.1.1.21.4 Ejemplos de aplicación
En el año 2013, el MIT Sloan Sports Analytics Conference, publicó un juego
interactivo que celebraba la histórica temporada de Rafael Nadal. Este juego
consistía en un árbol que permitía a los usuarios explorar visualmente como
Nadal ganó, con dificultad o fácilmente, cada uno de sus 666 servicios en los
torneos de Masters 1000 Tournaments, Grand Slams and World Tour Finals.
Para poder interactuar con el juego, ingresar al siguiente link:
http://gamesetmap.com/nadalgametree/

Figura 96. Árbol Interactivo de Nadal


Nota. MIT Sloan Sports Analytics Conference, 2014. Recuperado de
http://www.gamesetmap.com/nadalgametree/

5.2.1.1.21.5 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 Datamatic

 Google Charts

 Google Docs

 Giffy

186
5.2.1.1.21.6 Ejemplos de Uso
Para obtener otros ejemplos nos podemos dirigir a la página de Wiki Tree, en el
siguiente enlace:
http://www.wikitree.com/printable/family-tree-diagram.html

5.2.1.1.22 Mapa de Conexiones (Connection Mapp/ Link Map/ Ray Map)

5.2.1.1.22.1 Definición
Consiste en asociar puntos distribuidos por el mapa con líneas curvas o rectas.
Tal como menciona su nombre, sirven para poder mostrar las conexiones y
relaciones geográficas. Asimismo, son utilizados para mostrar rutas a través de
una cadena de enlaces.

Figura 97. Mapa de Conexiones


Nota. Data Visualization Catalogue.
Recuperado de
http://www.datavizcatalogue.com/meth
ods/connection_map.html

187
Figura 98. Mapa de Rutas de vuelos de Vienna
International
Nota. Anita Gracer, 2011. Recuperado de
https://anitagraser.com/2011/08/20/visualizing-global-
connections/

5.2.1.1.22.2 Tipos de Variables

 Variables con escala nominal.

5.2.1.1.22.3 Cuando utilizarlo

 Si lo que se quiere conocer es la cantidad de relaciones que existen con


respecto a la data que se desea visualizar.

 Si es que se desea identificar si existen patrones de esparcimiento por la


región analizada.

5.2.1.1.22.4 Ejemplos de aplicación


La empresa de seguridad Kaspersky Lab creó en el 2014 un mapa interactivo
en 3D haciendo uso de la técnica, el cual permite ver más de 300 000 cyber
ataques que la compañía detecta cada día a nivel global. A través de la
aplicación de este gráfico interactivo se pudo detectar que Alemania había
experimentado un incremento de cyber ataques en los últimos desde el 2014

188
que se realizó dicho mapa, de los cuales en su mayoría provenían de China. A
raíz de la publicación de esta información el gobierno estableció un Centro
Nacional de Cyber defensa para poder lidiar con este tipo de acontecimientos.

Figura 99. Mapa Interactivo Cyber ataques


Nota. Kaspersky Lab, 2014. Recuperado de
http://www.businessinsider.com/kaspersky-map-of-cyberattacks-
2014-4

5.2.1.1.22.5 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 CartoDB

 Datavisual

 Infogr.am

 Mbostock’s blocks

 R Graph Gallery

189
5.2.1.1.22.6 Ejemplos de Uso
La página Flight Connections permite conocer las diferentes salidas que tiene
los aeropuertos hacia otros aeropuertos en todo el mundo, para ello han
utilizado esta técnica ingresando el aeropuerto del cual se desea conocer sus
conexiones. Enlace: http://www.flightconnections.com/
Otro ejemplo muestra las migraciones de distintos países hacia Estados
Unidos. Para visualizarlo puede ingresar la página de MigrationaMap.net en el
siguiente enlace: http://migrationsmap.net/#/USA/arrivals

5.2.1.1.23 Diagrama de Arco (Arc Diagram)

5.2.1.1.23.1 Definición
Los diagramas de arco son una forma alternativa de representar gráficos
bidimensionales. Está compuesto por nodos, los cuales son lugares a lo largo
de un eje de línea / unidimensional y por arcos, los cuales se utilizan para
mostrar las conexiones entre los nodos. El grosor de las líneas de arco puede
ser usado para representar la frecuencia de la fuente al nodo de destino.

Figura 100. Diagrama de arco


Nota. Data Visualization Catalogue.
Recuperado de
http://www.datavizcatalogue.com/me
thods/arc_diagram.html

190
Figura 101. Diagrama de Arco - Gráfico para visualizar personajes de Los Miserables
Nota. Revolutions, 2013. Recuperado de http://www.r-bloggers.com/arc-diagrams-in-r-
les-miserables/

5.2.1.1.23.2 Tipos de Variables

 Variable Cualitativa.

5.2.1.1.23.3 Cuando utilizarlo

 Puede ser utilizado cuando lo que se desea mostrar es la concurrencia de


datos.

 En caso se quiera conocer las relaciones existentes de la data a analizar.

 Si lo que se quiere conocer es una vista general que permita la


interpretación, mas no el detalle de éste

5.2.1.1.23.4 Cuando no utilizarlo

 En caso lo que se quiera es una vista general de una estructura.

191
5.2.1.1.23.5 Ejemplos de aplicación
El primer ejemplo, el cual fue una investigación de IBM, se trata de la
representación de la estructura de la canción Für Elise de Beethoven. Lo que se
desea mostrar es la concurrencia en la que se presentan las mismas notas y en
donde se producen los acordes (en ese caso sólo se consideran las notas más
altas).

Figura 102. Representación de la canción Für Elise de Beethoven en


un diagrama de arco
Nota. Martin Wattenberg, 2009. Recuperado de
http://hint.fm/papers/arc-diagrams.pdf

La imagen muestra cómo la pieza comienza y termina con el mismo pasaje,


mientras que una versión más larga de este pasaje se repite a lo largo a
intervalos cada vez mayores. Asimismo, en la segunda parte de la canción la
estructura se ve claramente diferente, lo que corresponde bien con lo que se
oye cuando se escucha la música. Como se puede observar en la ilustración
anterior, se muestra dos situaciones, Por un lado, el gráfico contiene como
nodos a las notas de la canción, estas son mucha por lo cual en el gráfico ya no
se llega a visualizar claramente los nodos, no obstante, como vista general sí se
pudo distinguir la estructura de la canción.

192
5.2.1.1.23.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 Protovis

 D3

5.2.1.1.24 Diagrama de acorde (Chord Diagram)

5.2.1.1.24.1 Definición
Es un conjunto de puntos distribuidos en un círculo en sentido antihorario que
permite visualizar las conexiones internas entre entidades. (Sawada, 2002) Las
conexiones indican que existe algo en común entre las entidades, por tanto, en
caso quiera comparar un conjunto de data o diferentes grupos de data, se puede
hacer uso de esta técnica. Está compuesto por tres partes fundamentales: El nodo,
la curva del arco de conexión y los valores asignados en el punto de conexión.
Los colores pueden ser utilizados en cada grupo de datos para distinguir
categorías o grupos y los valores asignados son proporcionalmente equivalentes
al tamaño de cada arco.

Figura 103. Diagrama de acorde

193
Nota. Data Visualization
Catalogue. Recuperado de
http://www.datavizcatalog
ue.com/methods/chord_dia
gram.html

Figura 104. Ejemplo Diagrama de Arco

Nota. Simon James, 2015. Recuperado de


https://www.linkedin.com/pulse/charts-graphs-
make-your-reporting-stand-out-part-1-chord-
simon-james

5.2.1.1.24.2 Tipos de Variables

 Variables cualitativas.

5.2.1.1.24.3 Cuando utilizarlo

 Si lo que se quiere es identificar las relaciones entre grupos o entidades.

 Es utilizado en el campo de ciencias biológicas.

5.2.1.1.24.4 Cuando no utilizarlo

194
 Esta técnica no suele ser claro cuando lo que se quiere es analizar gran
cantidad de variables al punto de que ya no se pueda visualizar los
nombres de estos.

5.2.1.1.24.5 Ejemplos de aplicación


Un caso es el mostrado por Mike Bostock en el cual muestra la frecuencia de
los paseos entre los distintos barrios de San francisco. A través de este se pudo
distinguir que existe el doble de paseos de South of Market a Downtown. Cabe
resaltar que, en este caso, tal como se muestra en el gráfico los colores juegan
un papel importante para poder distinguir de donde parten y en dónde acaban.

Figura 105. Rutas de Uber por Vecindario


Nota. Mike Bostock, 2012. Recuperado de
https://bost.ocks.org/mike/uberdata/

5.2.1.1.24.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 Circos

195
 D3

 R Graph

 Zing Chart

 Power Bi

5.2.1.1.24.7 Ejemplos de Uso


Tal como se describe en la sección Ejemplo de Aplicación, se toma como
referencia el mismo ejemplo, el cual, a través de una barra de tiempo se puede
ir modificando y viendo al mismo tiempo el cambio que se produce en el
gráfico. Para ver ejemplo dirigirse a la página web Carson Farmer’s Block en
el siguiente enlace: http://bl.ocks.org/carsonfarmer/11478345

5.2.1.1.25 Diagrama de acorde sin cinta (Non-ribbon Chord Diagram)

5.2.1.1.25.1 Definición
Haciendo uso de la técnica, en este ejemplo se muestra los países de América
(representados en cada punto) y cuáles son los países vecinos a ellos
(conexiones).

Figura 106. Diagrama de acorde


sin cinta

196
Nota. Data Visualization
Catalogue. Recuperado de
http://www.datavizcatalogue.co
m/methods/non_ribbon_chord_d
iagram.html

5.2.1.1.25.2 Tipos de Variables

 Variable cualitativa.

5.2.1.1.25.3 Cuando utilizarlo

 Es útil cuando se desea mostrar las relaciones que existe en un conjunto


de datos.

5.2.1.1.25.4 Ejemplos de aplicación


Haciendo uso de la técnica, en este ejemplo se muestra los países de América y
cuáles son los países vecinos a ellos (conexiones).

Figura 107. Vecinos de cada país de América

197
Nota. Visualign, 2016. Recuperado de
https://visualign.wordpress.com/tag/mathematica/

5.2.1.1.25.5 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 Circos

5.2.1.1.26 Diagrama Sankey (Sankey Diagram)

5.2.1.1.26.1 Definición
Esta técnica muestra principalmente flujos y sus cantidades en proporción a cada
uno. Provee una vista resumida del camino involucrado en un proceso (Tiwari,
2016). El grosor de las flechas o líneas permiten ver sus magnitudes, entonces,
mientras más grande la flecha, más grande el flujo. Las flechas de flujo o líneas
pueden combinarse o dividirse por diferentes caminos. También se puede
utilizar diferentes colores para distinguir categorías en caso las tuviera o para
mostrar la transición de un estado al otro.

Figura 108. Diagrama Sankey


Nota. Data Visualization Catalogue.
Recuperado de

198
http://www.datavizcatalogue.com/methods
/sankey_diagram.html

5.2.1.1.26.2 Tipos de Variables

 Escala de nominal con valores discretos.

5.2.1.1.26.3 Cuando utilizarlo

 Cuando se desee mostrar la transferencia/desplazamiento de un objeto en


particular (Ej.: Energía, dinero, materiales, etc.).

 Cuando se desee mostrar flujos (Ej.: flujo de un proceso de sistema).

 En caso se tenga categorías, se puede hacer uso de esta técnica tomando


en cuenta la asignación de colores para lograr la distinción de las
categorías.

5.2.1.1.26.4 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 RAW (Under Alluvial Diagram)

 Sankey Diagram Blog Software List

 SankeyMATIC

 Tamc

5.2.1.1.26.5 Ejemplos de Uso


Para obtener otros ejemplos nos podemos dirigir a la página de Data Viz Project,
en el siguiente enlace:
http://datavizproject.com/data-type/sankey-diagram/

199
5.2.1.1.27 Lluvia de ideas/ Mapa mentales (Brainstorm/ Mind-Maps)

5.2.1.1.27.1 Definición
También conocido como mapa mental. Es un diagrama para asociar ideas,
palabras y conceptos. Se suelen utilizar como una herramienta para la
generación de ideas, la búsqueda de asociaciones, la clasificación de las ideas, la
organización de la información, la visualización de la estructura y ayuda a
estudiar. La estructura de un mapa de una lluvia de ideas / mente es el siguiente:
las categorías principales se extienden hacia fuera desde un nodo central. Cada
rama son categorías, que también pueden desarrollar sus propias subcategorías.

Para crear una lluvia de ideas / mapa mental:


1. Comenzar en el centro de una página y escribir el título del proyecto o el
tema en una nube o círculo.
2. Pensar en palabras o categorías pertinentes, útiles o relacionadas con el tema
que se está investigando.
3. Para cada categoría, dibujar como una extensión fuera del título central (en
cualquier dirección), las líneas con el nombre de la categoría en el extremo.
4. Ahora, para cada una de las categorías, pensar en cualquier palabra que se
relacionan con ella y dibujar de la misma forma que en el paso anterior.
5. Puede repetir el paso 4 para el nuevo conjunto de subcategorías o resaltar las
palabras si es necesario.

Figura 109. Lluvia de ideas

200
Nota. Data Visualization Catalogue.
Recuperado de
http://www.datavizcatalogue.com/me
thods/brainstorm.html

5.2.1.1.27.2 Tipos de Variables

 Variable Cualitativa.

5.2.1.1.27.3 Cuando utilizarlo

 A menudo es útil en la fase inicial de un proyecto y el trabajo como una


forma de toma de notas.

 También pueden ser útiles en el trabajo de colaboración.

5.2.1.1.27.4 Cuando no utilizarlo

 En caso se tenga valores numéricos, pues esta técnica se enfoca en


mostrar premisas, valores del tipo cualitativo.

5.2.1.1.27.5 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 Coggle

 MindMup

5.2.1.1.27.6 Ejemplos de Uso


Este tipo de técnicas son muy utilizadas para organizar ideas y por ello existen
diferentes herramientas online que permiten generarlos e incluso compartirlos,

201
permitiendo la colaboración de distintos usuarios. Tal es el caso de la
herramienta bubbl.us tal como se muestra en el siguiente enlace:
https://bubbl.us/#06145779895013146

5.2.1.1.28 Diagrama de Venn (Venn Diagram/ Set Diagram)

5.2.1.1.28.1 Definición
Este tipo de diagrama representa la data como conjuntos de datos,
englobándolos en círculos, los cuales dependiendo si es que tienen data en
común o relacionada se muestran en la intersección de dichos círculos.

Figura 110. Diagrama Venn

Nota. Data Visualization Catalogue. Recuperado de


http://www.datavizcatalogue.com/methods/venn_dia
gram.html

5.2.1.1.28.2 Tipos de Variables

 Variable Cualitativa.

5.2.1.1.28.3 Cuando utilizarlo

 Se utiliza cuando se desea realizar comparaciones entre la data de


diferentes conjuntos.

202
 Se utiliza cuando se quiere conocer la relación entre data de diferentes
conjuntos.

5.2.1.1.28.4 Cuando no utilizarlo

 En caso el espacio donde se quiera mostrar es pequeño.

 En caso se requiera manejar de forma más flexible la data no es


recomendable su uso pues es limitante (comparaciones/ contrastes).

5.2.1.1.28.5 Ejemplos de aplicación


Uno de los proyectos de Neoformix, empresa dedicada a la creación de
visualizaciones de datos personalizados; fue el Twitter Venn, una aplicación
que permitía ver la relación entre el uso de las palabras dentro de los mensajes
de Twitter.
Consiste en escribir dos o tres términos separados por comas, hacer clic en el
botón Buscar y obtener una imagen como la siguiente:

Figura 111. Twitter Venn


Nota. Neoformix, 2008. Recuperado de
www.neoformix.com/2008/TwitterVenn.html

203
En este ejemplo, el gran círculo de la izquierda contiene un gran número de
pequeños círculos rojos que representan mensajes (tweets) que contienen la
palabra "chocolate" pero que no contienen "leche". El gran círculo de la
derecha tiene círculos azules que representan los mensajes que contienen
"leche", pero no "chocolate". El área de intersección tiene círculos de color
púrpura que indican el número de los tweets contienen ambos términos.

5.2.1.1.28.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 Datamatic

 R Graph Gallery

 ZingChart

 Gliffy

5.2.1.1.28.7 Ejemplos de Uso


Para obtener otros ejemplos nos podemos dirigir a la página de los Doodles de
Google, en el siguiente enlace:
https://www.google.com/doodles/john-venns-180th-birthday

5.2.1.1.29 Gráfico de Matriz de puntos (Dot Matrix Chart)

5.2.1.1.29.1 Definición
Esta técnica se asemeja al gráfico de matriz el cual muestra la relación entre dos
o más variables en un formato de filas y columnas. Se divide en categorías X e
Y. Si existen otros factores, se distingue mediante colores. Lo que lo diferencia
es que en vez de mostrarse en rectángulos se muestran en puntos.

204
Figura 112. Gráfico de matriz de puntos
Nota. Data Visualization Catalogue.
Recuperado de
http://www.datavizcatalogue.com/methods
/dot_map.html

5.2.1.1.29.2 Tipos de Variables

 Variable Cualitativa.

5.2.1.1.29.3 Cuando utilizarlo

 Utilizarlo cuando se quiere visualizar proporciones de los grupos de data,


de este modo se pueda identificar los patrones.

5.2.1.1.29.4 Cuando no utilizarlo

 Cuando sólo se tiene una variable o una sola categoría, ya que este
pasaría a funcionar como un gráfico de área proporcional.

5.2.1.1.29.5 Herramientas
Actualmente se desconoce en qué herramientas se puede elaborar dicha técnica.

205
5.2.1.1.29.6 Ejemplos de Uso
Para obtener otros ejemplos nos podemos dirigir a la página de Behance, en el
siguiente enlace:
https://www.behance.net/gallery/16809363/Do-You-Speak-Chinese

5.2.1.1.30 Pictograma (Pictogram Chart)

5.2.1.1.30.1 Definición
Es una técnica de Data Visualization el cual tiene como una de sus
características principales, la utilización de íconos para poder dar una vista más
participativa de pequeños sets y data discreta. Los íconos representan el objeto a
evaluar o categoría (Ejemplo: Si lo que se quiere mostrar es población se tomará
como ícono de presentación un gráfico de personas). Cada uno de estos
representan o bien una unidad o un número de unidades, para poder comparar
cada categoría entre ellas.

Figura 113. Pictograma


Nota. Data Visualization Catalogue. Recuperado
de
http://www.datavizcatalogue.com/methods/pictogr
am.html

5.2.1.1.30.2 Tipos de Variables

 Variable Cualitativa.

206
5.2.1.1.30.3 Cuando utilizarlo

 Cuando se desea mostrar de forma simple el objeto de interés, por ello se


hace uso de los íconos.

5.2.1.1.30.4 Cuando no utilizarlo

 No utilizar para grandes cantidades de data pues dificulta contarlos.

 En caso se quiera mostrar íconos parciales, pues puede generar confusión


al momento de realizar el análisis e interpretación del gráfico.

5.2.1.1.30.5 Ejemplos de aplicación


En la Figura 114, los acontecimientos históricos se simplifican con las Tiras
Typodesign H-57, una serie de carteles de pictogramas creados por la empresa
de diseño italiano. La idea detrás de la cultura pop y la infografía historia con
infusión es mostrar que la mayoría de los eventos se pueden resumir de forma
rápida en "no más de 3 o 4 pasos."

Figura 114. Pictograma de la vida de Darth Vader

207
Nota. Feel Desain, 2011. Recuperado de
http://www.feeldesain.com/historical-
pictogram-posters-html

5.2.1.1.30.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 Infogr.am

 jChart (JavaScript plugin)

5.2.1.1.30.7 Ejemplos de Uso


Para obtener otros ejemplos nos podemos dirigir a la página de Data Viz
Project, en el siguiente enlace:
http://datavizproject.com/data-type/scaled-up-number-with-icon/

5.2.1.1.31 Mapa de árbol (TreeMap)

5.2.1.1.31.1 Definición
Este tipo de representación fue creado ante la problemática de mostrar
información compacta, reduciendo el espacio. Originalmente fue utilizado en los
90’s para visualizar el contenido de los discos duros y cómo es que están
distribuidos 10 mil archivos de cinco a diez niveles de directorios.
Es una forma alternativa de visualizar una estructura jerárquica como la del
diagrama de árbol mientras que al mismo tiempo se puede mostrar cantidades
por nivel jerárquico a través del tamaño que ocupa el área de cada rectángulo.
Cada categoría es asignada a un rectángulo con sus sub categorías representadas
también en esta forma. Cuando una cantidad es asignada a una categoría, su área
es mostrada en proporción a la cantidad designada y tomando en cuenta el

208
tamaño del rectángulo padre. Cuando no es agregado el atributo cantidad, las
áreas de los rectángulos son distribuidos igualitariamente.
Con respecto a la forma como son divididos y ordenados depende del algoritmo
utilizado. Para poder mantener los rectángulos, el algoritmo mayormente
utilizado es el algoritmo squarified.

Figura 115. Mapa de árbol


Nota. Data Visualization Catalogue.
Recuperado de
http://www.datavizcatalogue.com/method
s/treemap.html

5.2.1.1.31.2 Tipos de Variables

 Variables con escala nominal y valores discretos.

5.2.1.1.31.3 Cuando utilizarlo

 Es una alternativa a utilizar cuando lo que se desea mostrar es una


estructura jerárquica de la información.

209
 En caso que cada categoría tenga una cantidad asociada.

 En caso se quiera comparar proporciones entre jerarquías.

5.2.1.1.31.4 Cuando no utilizarlo

 En caso la cantidad de categorías a mostrar sea mucha y cada una tenga


una cantidad asociada. Es posible que para un usuario que no se
encuentre familiarizado con la técnica le sea más difícil la interpretación
de esta e incurra a entender algo diferente.

5.2.1.1.31.5 Ejemplos de aplicación


The Atlas of Economic Complexity utilizó un mapa de árbol para poder
representar los países que exportaron uvas desde 1995 hasta 2014, siendo el
mayor exportador Francia durante dicho periodo. Como se puede apreciar el
tamaño de cada uno de los países indica el porcentaje estos representan frente a
los demás países, distinguiéndolos por colores de acuerdo al continente al que
pertenecen.

Figura 116. Exportadores de uva 2014

210
Nota. The Atlas of Economic Complexity, 2016. Recuperado de
http://atlas.cid.harvard.edu/explore/tree_map/export/show/all/2204
/2014/

5.2.1.1.31.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 CartoDB

 Datavisual

 Google Docs

 Polymaps

5.2.1.1.31.7 Ejemplos de Uso


The Atlas of Economic Complexity es una herramienta web que permite
conocer información económica a nivel mundial y utiliza diferentes técnicas de
visualización para mostrarla, por ejemplo, haciendo uso del mapa de árbol
mostró los países que importaron granos de café en el 2014, a través de dicho
gráfico se pudo identificar por el tamaño de cada recuadro dentro del mapa
quienes fueron los que más importaron (Estados Unidos, Alemania).
Enlace:
http://atlas.cid.harvard.edu/explore/tree_map/import/show/all/0901/2014/

5.2.1.1.32 Mapa de árbol circular (Circle Packing/ Circular Treemap)

5.2.1.1.32.1 Definición
Esta técnica es una variación del Mapa de árbol el cual utiliza círculos para
distinguir los niveles jerárquicos. Cada círculo contenedor representa un nivel
dentro jerarquía, en el caso de un mapa de árbol cada rama es representada por
un círculo y sus sub ramas serian círculos dentro de este. El área de cada círculo
también puede ser utilizado como un atributo arbitrario como cantidad o tamaño

211
del objeto a analizar. Los colores utilizados también pueden ser un atributo para
para distinguir categorías.

Figura 117. Mapa de árbol circular


Nota. Data Visualization
Catalogue. Recuperado de
http://www.datavizcatalogue.co
m/methods/circle_packing.html

5.2.1.1.32.2 Tipos de Variables

 Variables con escala nominal y valores discretos.

5.2.1.1.32.3 Cuando utilizarlo

 Es una alternativa en caso lo que se quiera sea organizar la data de tal


forma que se distinga fácilmente la estructura jerárquica de la data.

5.2.1.1.32.4 Cuando no utilizarlo

 En caso la cantidad de categorías a mostrar sea mucha y no se desee


ocupar mayor espacio de lo necesario.

212
5.2.1.1.32.5 Ejemplos de aplicación
Bodbot es un sitio web, el cual brinda información para realizar ejercicios y
llevar una vida sana, esto implica una sección de alimentación, para mostrar la
información nutricional hizo uso de esta técnica para mostrar la jerarquía de
macro a micronutrientes, incluyendo compuestos de aminos ácidos, tipos de
grasa, fibra y azúcar al igual que vitaminas.

Figura 118. Estructura de Macro a micronutrientes


Nota. Bodbot, 2016. Recuperado de
http://www.bodbot.com/Nutrition/Foods/1153
1/tomatoes-red-ripe-canned-packed-in-
tomato-juice

5.2.1.1.32.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 D3

 D3 Zoomable

 RAW

213
5.2.1.1.33 Gráfico de burbujas (Bubble Chart)

5.2.1.1.33.1 Definición
Un gráfico de burbujas es un gráfico de múltiples variables. Es una
combinación de un gráfico de dispersión y un gráfico proporcional de la zona.
Al igual que un gráfico de dispersión, el cuadro de burbujas utiliza un sistema
de coordenadas cartesianas para trazar puntos a lo largo de una cuadrícula en
los ejes X e Y son variables independientes, sin embargo, a diferencia de un
gráfico de dispersión, cada punto se le asigna una etiqueta o categoría (ya sea
que aparecen al lado o en una leyenda). Cada punto representa una tercera
variable por la zona de su círculo. Los colores también se pueden utilizar para
distinguir entre categorías o se utiliza para representar una variable de datos
adicional. Como también puede brillo y opacidad. El tiempo puede ser
mostrado ya sea por tener como variable sobre uno de los ejes o por la
animación de las variables de datos cambiando con el tiempo.

Figura 119. Gráfico de Burbujas


Nota. Data Visualization Catalogue. Recuperado de
http://www.datavizcatalogue.com/methods/bubble_c
hart.html

214
Figura 120. Expectativa de vida vs PBI per Cápita en el 2007
Nota. Plotly, 2016. Recuperado de http://help.plot.ly/make-a-bubble-
chart/

5.2.1.1.33.2 Tipos de Variables

 Múltiples variables con escala nominal y valores discretos.

5.2.1.1.33.3 Cuando utilizarlo

 Los gráficos de burbujas se utilizan normalmente para comparar y


mostrar las relaciones entre los círculos etiquetados / categorizados, por
el uso de posicionamiento y proporciones.

 El panorama general del gráfico de burbuja se puede utilizar para


analizar patrones / correlaciones.

 Se utiliza una capacidad limitada de cantidad de datos para una mayor


claridad de los datos.

 Puede usarse interactividad: al hacer clic o se cierne sobre las burbujas


para visualizar información oculta, además de que tenga una opción para
reorganizar o filtrar las categorías agrupadas.

215
 Es útil cuando se desea analizar data sobre el tiempo, esto permite
evaluar posibles patrones.

 Si se quiere conocer proporciones, es posible visualizarlo aplicando ese


factor cuando se distinguen las variables en cada burbuja.

 Se puede utilizar para distinguir categorías, para ello se hace uso de


colores que permitan diferenciarlos.

 Si se cuenta con otras variables, se pueden representar a través de la


asignación de colores.

5.2.1.1.33.4 Cuando no utilizarlo

 Cuando la cantidad de data produce que existan demasiadas burbujas, ya


que pueden hacer que el gráfico se vuelva difícil de leer

5.2.1.1.33.5 Ejemplos de aplicación


Un ejemplo conocido es el mostrado por el investigador suizo Hans Rosling.
Su sitio web “GapMinder” incluye un panel del diagrama de burbujas
interactivo, el cual compara la expectativa de vida en los países del mundo vs
el ingreso per cápita y el total de la población en los últimos 200 años.
Haciendo uso de la barra deslizadora se pudo ver claramente el cambio de
dichos valores a lo largo del tiempo, revelando eventos como la pandemia de
gripe español de 1918 y el crecimiento del comercio global. Como se puede
observar en el eje x se muestra el ingreso de cada páis y en el eje Y la edad
promedio de la expectativa de vida.

216
Figura 121. Interactive bubble plot
Nota. Hans Rosling, 2008. Recuperado de
http://www.nytimes.com/interactive/2014/07/12/upshot/how-fan-loyalty-
changed-during-the-world-cup.html

5.2.1.1.33.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 Google Charts

 Google Docs

 Infogr.am

 jChartFX

 Online Chart Tool

 RAW

 Slemma

 Visage

 ZingChart

217
5.2.1.1.33.7 Ejemplos de Uso
Un ejemplo encontrado en la página de Anychart muestra el gráfico con data
de los mejores deportistas, para visualizarlo se puede dirigir al siguiente
enlace:
http://www.anychart.com/products/anychart/gallery/Marker_and_Bubble_Char
ts/Multi-Series_Bubble_Chart.php
Del mismo modo, otro ejemplo es el realizado por Hans Rosling, el cual puede
ser presentado de forma interactiva tal como lo muestra en el video realizado
por la BBC, “Hans Rosling's 200 Countries, 200 Years, 4 Minutes - The Joy of
Stats” y el cual se encuentra en la página Youtube en el siguiente enlace:
https://www.youtube.com/watch?v=jbkSRLYSojo).

5.2.1.1.34 Mapa de flujo (Flow Map)

5.2.1.1.34.1 Definición
Geográficamente muestran los movimientos de la información u objetos de una
locación a otra y la cantidad que viaja.
Los flujos se inician desde un punto de origen y a partir de ello se distribuyen en
diferentes direcciones. En estos casos son utilizadas las flechas para especificar
hacia dónde se dirigen estos flujos. Con las flechas, se puede visualizar el
comportamiento del flujo, no obstante, se recomienda evitar los cruces para
mantener el orden de los flujos.

218
Figura 122. Mapa de Flujo
Nota. Data Visualization
Catalogue. Recuperado de
http://www.datavizcatalogue.com/
methods/flow_map.html

Figura 123. Mapa de flujo de comercio de petróleo y derivados


Nota. Sankey-Diagrams, 2015. Recuperado de http://www.sankey-
diagrams.com/tag/map/

5.2.1.1.34.2 Tipos de Variables

 Variables con escala nominal y valores discretos

219
5.2.1.1.34.3 Cuando utilizarlo

 En caso se quiera mostrar el comportamiento de la migración de


personas, animales o productos.

 Si se quiera mostrar la cantidad de personas, productos, animales o cierto


objeto (tipo de mercadería), se puede mostrar a través del grosor de la
flecha, el cual indicaría la cantidad y la dirección que apunten (hacia
dónde se dirigen de una región a otra).

 Permite realizar un análisis de la distribución del objeto en cuestión (en


el caso de personas, se utiliza mayormente para realizar un análisis de la
distribución de la migración).

5.2.1.1.34.4 Cuando no utilizarlo

 En caso se distingan muchos flujos, propiciando su excesivo uso. Esto


crea una sobrecarga de la visualización.

5.2.1.1.34.5 Ejemplos de aplicación


La consultora estadounidense TeleGeography realizó un mapa global del
tráfico del 2010 el cual se muestra cómo fluye la voz en grandes rutas de
llamadas internacionales en todo el mundo. El grosor indica la cantidad de
tráfico sin dejar de mostrar cuales son los países origen y los finales.

220
Figura 124. Mapa Global del Tráfico 2010
Nota. TeleGeography, 2010. Recuperado de
https://www.telegeography.com/telecom-maps/global-traffic-map.1.html

5.2.1.1.34.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 QGis

5.2.1.1.34.7 Ejemplos de Uso


La Universidad Linköping, mostró el desplazamiento entre los municipios de
Suecia en el 2010 con la intención de mostrar la funcionalidad del gráfico. Para
visualizarlo se puede dirigir a la página Flow Max eXplorer en el siguiente
enlace:
http://mitweb.itn.liu.se/GAV/flowmapsweden/#app=88c9&e5f7-
selectedIndex=0&4766-selectedIndex=0&5ef4-selectedIndex=0&3271-
selectedIndex=0&8820-selectedIndex=0&52d8-selectedIndex=0&a0cc-
selectedIndex=0&e6ce-selectedIndex=0

221
5.2.1.1.35 Mapa de Puntos (Dot Map/ Dot Distribution Map/ Dot Density Map)

5.2.1.1.35.1 Definición
También es conocido como Mapa de distribución de puntos, es una técnica que
permite detectar patrones espaciales o la distribución de data sobre un espacio
geográfico. Consiste en distribuir puntos del mismo tamaño en un espacio
geográfico. Existen dos tipos de mapas de puntos, uno a uno, el cual un punto
representa una sola unidad y uno a muchos, el cual un punto representa una
cantidad en particular, por ejemplo, un punto puede equivaler a 5, 10, 12 objetos
a especificar.

Figura 125. Mapa de Puntos


Nota. Data Visualization Catalogue.
Recuperado de
http://www.datavizcatalogue.com/meth
ods/dot_map.html

5.2.1.1.35.2 Tipos de Variables

 Variables con escala de intervalos y valores discretos.

5.2.1.1.35.3 Cuando utilizarlo

 Es ideal cuando se quiere analizar cuantos objetos se encuentran en una


región geográfica.

 Permite detectar patrones cuando los puntos se encuentran cerca entre


ellas.

222
 Es útil cuando se quiere tener una visión general de la data a visualizar.

 Se debe tener en cuenta que tiene que estar claro qué es lo que se desea
mostrar para poder visualizar la distribución de la data y sus densidades.
Con ello, se podrá realizar una correcta comparación de densidades.

 Es útil cuando se quiere mostrar gran cantidad de objetos como


población, valor de los minerales, cultivos, etc. (no obstante considerar
que la escala no debe ser muy pequeña)

5.2.1.1.35.4 Cuando no utilizarlo

 No se recomienda utilizarlo cuando el usuario requiere de data exacta.

 Si la escala es muy pequeña, es posible que muchos puntos sean


dibujados lo cual, por lo tanto, no es recomendable utilizarlo, pues
visualmente se vuelve más difícil contabilizar la cantidad de puntos
existentes en el mapa.

 Si no se tiene claro cómo proceder a realizar este gráfico (cálculo de los


puntos a mostrar, cuánto equivaldrán, densidad) es posible que la
información que se llegue a mostrar no sea la correcta o no sea la que se
quiere mostrar en un principio.

5.2.1.1.35.5 Ejemplos de aplicación


En la figura 71, lo que se quiso mostrar fue la densidad de la población hispana
en Estados Unidos, en el cual cada punto representa 100 000 personas, dichos
puntos se encuentras localizados de acuerdo a cada estado.

223
Figura 126. Población hispana en Estados Unidos
Nota. John A. Dutton e-Education Institute, 2016. Recuperado de
https://www.eeducation.psu.edu/geog160/c3_p14.html

5.2.1.1.35.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 CartoDB

 Datavisual

 Infogr.am

 Mbostock’s blocks

 R Graph Gallery

5.2.1.1.35.7 Ejemplos de Uso


Este tipo de técnica fue utilizado en Estados Unidos, para mostrar la población
de dicho país. Fue elaborado por Martin – Anderson, egresado del MIT, quien
utilizó información del censo para contabilizar la población. El trabajo

224
realizado por Anderson es similar al que se encuentra en el siguiente enlace,
con la diferencia que se puede observar la población por condición racial
(Blancos, Afroamericanos, Hispanos, asiáticos, multirracial).
Para visualizarlo, se puede dirigir a la página Demographics en el siguiente
enlace: http://demographics.coopercenter.org/DotMap/

5.2.1.1.36 Gráficos de áreas apiladas (Stacked Area Graphs)

5.2.1.1.36.1 Definición
Trabaja de la misma forma que lo hacen los gráficos de áreas, excepto por el
uso de varias series de datos, cada punto inicia desde el último punto de la
serie de datos anterior.
Todo el gráfico representa el total de todos los datos. Los gráficos de áreas
apiladas también utilizan el área para transmitir números enteros, por lo que no
funciona para los valores negativos.

Figura 127. Gráficos de Áreas Apiladas

Nota. Data Visualization Catalogue. Recuperado


de
http://www.datavizcatalogue.com/methods/stack
ed_bar_graph.html

225
5.2.1.1.36.2 Tipos de Variables

 Variables con escala de intervalos con valores continuos.

5.2.1.1.36.3 Cuando utilizarlo

 Es útil cuando se quiere comparar múltiples variables que cambian en un


intervalo.

5.2.1.1.36.4 Cuando no utilizarlo

 No es una técnica que permita realizar comparaciones de la data.

 No se recomienda su uso si es que se cuenta con más de 5 categorías.

5.2.1.1.36.5 Ejemplos de aplicación


En base a la data obtenida de The World Bank, se muestra un ejemplo del
porcentaje de edad de los japonenses desde 1980 hasta el 2010. Cada grupo
distingue un rango de edad, esto se muestran de distintos colores para evitar
confusión.

Figura 128. Sectores de edad de la población


de Japón desde 1980 hasta 2010

Nota. Packt Publishing, 2013.


Recuperado de

226
https://www.packtpub.com/books/content
/line-area-and-scatter-charts

5.2.1.1.36.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 MS Excel and Apple's Numbers

 DataHero

 Datavisual

 Google Docs

 Infogr.am

 OnlineChartTool

 Slemma

 Vega

 ZingChart

5.2.1.1.36.7 Ejemplos de Uso


Un ejemplo encontrado fue en la página de Anychart mostrado en el siguiente
enlace:
http://anychart.com/products/anychart/gallery/Area,_Spline-Area,_Step-
Area_Charts/Stacked_Area_Chart.php

227
5.2.1.1.37 Gráfico de Dispersión (Scatterplot/ Scatter Graph/ Point Graph/ X-Y
Plot/ Scatter Chart/ Scatter gram)

5.2.1.1.37.1 Definición
Se utiliza esta técnica cuando se desea analizar una data que dependen de dos
variables. Esto se realiza sobre un plano cartesiano con coordenadas cada una en
un eje X e Y.
El diagrama de dispersión tradicional representa cada objeto en un conjunto de
datos con un punto (u otra marca), posicionado en dos dimensiones ortogonales
continuas. (Sarikaya & Gleicher, 2018)
Al asignar una variable en cada eje respectivamente se puede establecer un
punto y abarcar las dos variables, con ello se puede detectar su relación.
Muchas correlaciones pueden ser interpretadas a través de los patrones
mostrados en el gráfico de dispersión. Algunos de estos son:
 Positivo: Los valores incrementan formando una línea que inicia de abajo
hacia arriba

 Negativo: Los valores decrecen formando una línea que inicia de arriba
hacia abajo

 Nulo: No existe correlación entre los puntos.

 Lineal: los valores son iguales.

 Exponencial: Los valores van aumentando de forma curva.

 En U: Los valores decrecen y luego aumentan, tomando la forma de una U.

Este tipo de correlación se puede distinguir conforme los puntos se encuentren a


una corta distancia de una a otra. Aquellos que se encuentren distantes a los
valores correlativos y se encuentren separados se conocen como valores
aislados.
Las líneas o curvas que se forman ayudan a realizar un análisis, es conocido
como la línea de mejor ajuste o línea de tendencia y pueden ser utilizados para
realizar estimaciones vía interpolación.

228
Figura 129. Diagrama de Dispersión
Nota. Data Visualization
Catalogue. Recuperado de
http://www.datavizcatalogue.c
om/methods/scatterplot.html

5.2.1.1.37.2 Tipos de Variables

 Variables con escala de intervalos con valores continuos.

5.2.1.1.37.3 Cuando utilizarlo

 Se utiliza esta técnica cuando se desea analizar una data que dependen de
dos variables.

229
 Cuando se desee identificar patrones de comportamiento de la data
analizada.

 Cuando se pretende analizar data numérica y lo que se quiere conocer es


si una variable impacta a la otra. Sin embargo, la correlación que se
muestra no es casualidad, por lo que abre la posibilidad de verificar otras
variables no visibles, las cuales pueden ser que influyan en el resultado.

 Agregar una línea de tendencia permite que se pueda tener una mayor
claridad del gráfico.

 Se puede variar los tamaños de los puntos en caso se quiera mostrar una
variable de la data.

 En caso se quiera agregar más variables al gráfico también se puede


hacer uso de la asignación de colores.

5.2.1.1.37.4 Cuando no utilizarlo

 No es recomendable comparar más de dos líneas de tendencias.

 A medida que los datos crecen en escala y complejidad, el diseño del


diagrama de dispersión tradicional se vuelve rápidamente ineficaz.31

5.2.1.1.37.5 Ejemplos de aplicación


Un nuevo análisis se refiere no sólo a la cantidad de años que se esperar vivir,
sino también el número de años, que podemos esperar vivir con buena salud.
En la mayor parte del mundo, la esperanza de vida es más larga de lo que era
hace 20 años. Basado en el estudio de las enfermedades a nivel global de
Joshua A. Salomon realizado en el 2010, el gráfico muestra la realidad de 187
países, 1160 diferentes enfermedades y más de 30000 personas encuestadas.

31
Cfr. Sarikaya & Gleicher, 2018

230
Figura 130. Diagrama de Dispersión
Nota. Washington Post, 2012. Recuperado de
http://www.washingtonpost.com/wp-srv/special/health/healthy-life-
expectancy/

5.2.1.1.37.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 RAW (Under Alluvial Diagram)

 Sankey Diagram Blog Software List

 SankeyMATIC

 Tamc

5.2.1.1.37.7 Ejemplos de Uso


Para obtener otros ejemplos nos podemos dirigir a la página de Data Viz Project,
en el siguiente enlace:
http://datavizproject.com/data-type/scatter-plot/

231
5.2.1.1.38 Espiral de Caracol (Spiral plot /Time Series Spiral)

5.2.1.1.38.1 Definición
Este tipo de visualización comienza desde el centro de la espiral y se desarrolla
hacia afuera. Toma la forma de un espiral de Arquímedes. Se utiliza con barras,
líneas o puntos.
Se puede hacer uso de colores para asignar a un periodo, y de ese modo
distinguirlo.

Figura 131. Espiral de Caracol


Nota. Data Visualization Catalogue. Recuperado
de
http://www.datavizcatalogue.com/methods/spiral_
plot.html

5.2.1.1.38.2 Tipos de Variables

 Variables con escala de intervalos con valores continuos.

5.2.1.1.38.3 Cuando utilizarlo

 Se utiliza cuando se tiene data basada en el tiempo.

 Es ideal para mostrar un gran conjunto de datos, por lo general para


mostrar tendencias a lo largo de un periodo de tiempo.

232
 El gráfico espiral es de ayuda cuando se quiere mostrar patrones
periódicos.

 En el caso que se muestren diferentes periodos, que ya cuentan con


diferentes colores asignados para distinguirlos, pueden ser
comparados como medida de análisis entre diferentes periodos.

5.2.1.1.38.4 Ejemplos de aplicación


Investigadores de la Temple University dirigidos por el biólogo evolutivo S.
Blair Hedges, elaboraron el árbol más grande del mundo de la vida a través del
tiempo. El árbol de los organismos vivos y extintos abarca 50.000 especies.
Para adaptarse a su trabajo en una página impresa, el equipo decidió visualizar
los datos como una espiral.

Figura 132. Árbol de la vida


Nota. CoDesign, 2016. Recuperado de
https://www.fastcodesign.com/3043479/infog

233
raphic-of-the-day/worlds-largest-tree-of-life-
visualizes-50000-species-across-time

La espiral representa el tiempo de arriba a abajo en la escala de grises, desde el


origen de la vida hace 4 mil millones de años (el gris más oscuro) hasta la
actualidad. Diversas especies de plantas y animales están representadas por
diferentes ramas de color que están conectados como un árbol genealógico.

5.2.1.1.38.5 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 ZingChart

5.2.1.1.38.6 Ejemplos de Uso


Para obtener otros ejemplos nos podemos dirigir a la página ResearchGate, en
el siguiente enlace:
https://www.researchgate.net/publication/230887318_Enhanced_Interactive_S
piral_Display

5.2.1.1.39 Línea de Tiempo (Timeline)

5.2.1.1.39.1 Definición
Es una técnica que permite mostrar una lista de eventos que sucedieron de forma
cronológica. En algunos casos se diagraman en cascada como también en
algunos casos se muestra lineal.

234
Figura 133. Línea de tiempo
Nota. Data Visualization Catalogue.
Recuperado de
http://www.datavizcatalogue.com/methods/tim
eline.html

5.2.1.1.39.2 Tipos de Variables

 Variable Ordinal.

5.2.1.1.39.3 Cuando utilizarlo

 Sirve para comunicar información referente a tiempo, ya sea para realizar


un análisis de la data o para visualmente presentar una historia.

 Si se basa en escalas, las líneas de tiempo pueden ser utilizados para ver
cosas que ocurren o van a ocurrir, permitiendo al usuario evaluar los
intervalos de tiempo entre eventos.

 Si se utiliza la técnica en escala se puede detectar si es que existen


patrones a lo largo de cualquier periodo de tiempo y cómo ciertos
eventos se distribuyen a lo largo del tiempo.

 Se utiliza cuando se quiere mostrar cómo la data cuantitativa cambia con


el tiempo, en este caso se tiende a combinar esta técnica con otros
gráficos.

235
 Permiten acercar o alejar la línea de tiempo para poder ver desde un
plano general como más específico los datos, ayuda a que se pueda
realizar un análisis más profundo de los datos.

5.2.1.1.39.4 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 Google Charts

 Timeline.js

 Tiki- Toki

 Vega

5.2.1.1.39.5 Ejemplos de Uso


Para obtener otros ejemplos nos podemos dirigir a la página Behance, en el
siguiente enlace:
https://www.behance.net/gallery/27694299/Festival-Line-Up

5.2.1.1.40 Gráfico de área (Area Graphs)

5.2.1.1.40.1 Definición
Los gráficos de área son una variación de los gráficos de líneas, ya que el área
por debajo de la línea se rellena con un determinado color o textura. Para
elaborarlos, primero se trazan los puntos de datos en un plano de coordenadas
cartesianas y luego se unen a través de una línea entre los puntos. Finalmente, se
rellena el espacio debajo de la línea completa.
Existen dos variantes populares de los gráficos de áreas: agrupados y gráficos de
áreas apiladas. Los gráficos de áreas agrupadas comienzan desde el mismo eje
cero. En el caso de los gráficos de áreas apiladas, cada serie de datos inicia
desde el punto izquierdo de la serie de datos anterior.

236
Figura 134. Gráficos de área

Nota. Data Visualization Catalogue.


Recuperado de
http://www.datavizcatalogue.com/methods
/area_graph.html

5.2.1.1.40.2 Tipos de Variables

 Variables con escala de intervalos y valores continuos.

5.2.1.1.40.3 Cuando utilizarlo

 Los gráficos de área se utilizan para mostrar el desarrollo de


valores cuantitativos durante un período de tiempo.

 Se utilizan normalmente para mostrar tendencias y relaciones, en


lugar de transmitir valores específicos.

237
5.2.1.1.40.4 Cuando no utilizarlo

 No es recomendable tratar de sobreponer las áreas, pues


visualmente origina que el usuario pueda confundirse y
malinterpretar los datos (aparece nuevas áreas producto de la
sobre posición de dos a más áreas.). En ese caso se hace uso del
gráfico de áreas apiladas.

5.2.1.1.40.5 Ejemplos de aplicación


Haciendo uso de esta técnica, este ejemplo muestra los encarcelamientos
realizados en Estados Unidos desde 1920 hasta el 2006.

Figura 135. Encarcelamientos en Estados Unidos 1920 - 2006


Nota. Justice Police Institute Report, 2016. Recuperado
de https://www.packtpub.com/books/content/line-area-
and-scatter-charts

5.2.1.1.40.6 Herramientas
Se puede elaborar dicha técnica en herramientas como:
 MS Excel & Apple Numbers

238
 D3 (code)

 DataHero

 Datamatic

 Google Charts

 Google Docs

 Infogr.am

 Protovis

 Slemma

 Vega

 OnlineChartTool.com

5.2.1.1.40.7 Ejemplos de Uso


Para obtener otros ejemplos nos podemos dirigir a la página de Data Viz
Project, en el siguiente enlace:
http://datavizproject.com/data-type/area-chart/

5.3 Benchmarking de las Herramientas de data visualization

5.3.1 Introducción
Existen herramientas relacionadas a la representación gráfica de la información
con el objetivo de ayudar a los usuarios a poder entender con mayor claridad
grandes cantidades de data y con ello, tomar decisiones con mayor precisión.
No obstante, hoy en día se cuenta con diferentes proveedores que, en algunos
casos centran su atención únicamente en el concepto de Business Intillegence,
dejando de lado conceptos complementarios.

239
Esto trae como consecuencia que no se encuentra una referencia o evaluación
enfocada netamente en las funcionalidades de herramientas de Data
Visualization sino de Business Intelligence y Analytics.

Para la elaboración de este proyecto, el cual requiere de una evaluación de


herramientas enfocadas a la visualización de datos, se realizará un
benchmarking que nos permita analizar y verificar tanto aspectos generales de
ciertas herramientas como aspectos específicos, que nos ayuden a constatar
efectivamente qué herramienta se ajusta a las necesidades de este proyecto y
sobre todo que pueda soportar las técnicas de Data Visualization investigadas
para los lineamientos planteados.

5.3.2 Consideraciones base


Para la elaboración del Benchmarking se tomará como referencia base las
herramientas evaluadas y categorizadas en el Cuadrante Mágico de Gartner en la
categoría de Plataformas de Business Intelligence y Analytics, las cuales ya han
sido evaluadas y distribuidas en cada cuadrante. La razón para elegir dicha
categoría es debido a que dentro de sus criterios se llega a evaluar ciertos puntos
relacionados a la visualización de datos, importantes para este proyecto.

Debido a que se toma como principal fuente el Cuadrante Mágico de Gartner, a


continuación, se pasará a detallar acerca de su metodología de evaluación
incluyendo los criterios que utilizan para la categorización de las herramientas
del rubro especificado anteriormente.

 Metodología de Gartner

Para la elaboración del Cuadrante Mágico de la categoría antes mencionada,


Gartner toma en cuenta cinco casos de uso y catorce capacidades críticas por las

240
cuales los proveedores son evaluados para conocer qué tanto dan soporte en
estos aspectos. Estos tipos de evaluación son los siguientes:

Casos de uso:

Aprovisionamiento ágil BI centralizado:


Se analiza que la herramienta soporte un ágil flujo de trabajo de TI, desde la
data centralizada, distribuida y gestionada tomando en cuenta las capacidades de
la plataforma.

Análisis Descentralizado:
Se evalúa el soporte de un flujo de trabajo a partir de datos hasta el análisis
detallado de autoservicio.

Gobierno de Descubrimiento de Datos:


Soporta un flujo de trabajo a partir de datos al análisis detallado de autoservicio,
a los sistemas de registro hasta el gobierno de la gestión del contenido por parte
de TI.

BI Embebido:
Implica que la herramienta pueda soportar un flujo de trabajo desde la data hasta
qué tanto pueda ser el contenido embebido en un proceso o aplicación.

Despliegue Extranet:
Implica el soporte a un flujo de trabajo similar al aprovisionamiento ágil BI
centralizado para el cliente externo, o en un sector público, el acceso de los
ciudadanos al contenido analítico.

Del mismo modo el otro tipo de evaluación el cual se encuentra estructurado en


subcategorías, es el que se encuentra más detallado y que, para el propósito de

241
este proyecto permite distinguir ciertas características que se toman en cuenta
para la elección de las herramientas a evaluar. Estos son:

Infraestructura
6. Gestión de Plataforma BI
7. BI Cloud
8. Gestión de seguridad y usuarios
9. Conectividad de fuentes de datos

Gestión de Datos
10. Gestión de Gobierno y Metadata
11. Extracción, transformación y carga (ETL) y Almacenamiento de Datos
12. Auto preparación de Data

Análisis y Creación de Contenido


13. Análisis Avanzado Embebido
14. Dashboards Analytics
15. Exploración Visual interactivo
16. Exploración móvil y autorizado

Intercambio de los resultados


17. Contenido Analítico embebido
18. Publicación de Contenido Analítico
19. Colaboración y BI Social

Bajo este tipo de criterios los resultados del cuadrante mágico de Gartner fueron los
siguientes:

242
Figura 136. Cuadrante Mágico de Gartner Business Intelligence y Analytics Platorms 2016
Nota. Recuperado de Gartner Inc., 2016

Como se puede observar, la evaluación da como resultado tres empresas


ubicadas en el primer cuadrante de líderes, Microsoft, Tableau y Qlik.
Cuyas herramientas son Power BI (Microsoft), Tableau (Tableau Software) y
Qlik Sense (Qlik).
Tomando esta referencia, de las capacidades críticas planteadas por Gartner, nos
enfocaremos en analizar dichas herramientas y todos los aspectos que se
encuentran referidas a estos y a sus capacidades a nivel de la muestra de los
resultados más no el procesamiento de la data.

5.3.3 Descripción de las herramientas


Con el propósito de dar a conocer las herramientas ubicadas como líderes dentro
del Cuadrante mágico de Gartner, a continuación, se muestra los siguientes
cuadros: la descripción general de Power BI, Tableau y Qlik Sense en el cual

243
consta de datos generales de las empresas proveedoras y una breve reseña de las
características de las herramientas y empresas que lo utilizan actualmente.

244
Figura 137. Descripción General de los Productos
Nota. Elaboración propia

245
Power BI32
Esta herramienta de Microsoft cuenta con diferentes presentaciones en
diferentes plataformas. Los productos que conforman Power BI son:

 Power BI Cloud
Esta versión de Power BI es un servicio soportado en la nube y se puede
acceder a través de una cuenta Office 365. Está conformado por tres pilares
los cuales son Paneles, Informes y Conjunto de datos.

 Power BI Desktop
Esta versión de Power BI es compatible para escritorio. No varía de gran
forma con respecto a la versión cloud. Desktop tiene todas las funciones
necesarias para conectar la información sobre los datos, darle forma,
visualizarla y compartirla de forma rápida a través de Power BI (Cloud).

 Power BI Mobile
Esta versión se encuentra disponible en los sistemas operativos Android, IOS
y Windows Phone. A diferencia de las versiones cloud y desktop, esta
aplicación no soporta la edición de algún informe, reporte, no obstante, se
enfoca en la visualización, compartir e interacción con los iconos de los
paneles e informes, además de permitir la visualización de los paneles a
través del Apple Watch.

 Power BI for Excel


Esta versión funciona como complemento en Microsoft Excel. Se encuentra
disponible a partir de la versión 2013 y se encuentra compuesto por cinco
complementos:
 Power Pivot: Permite importar data de diferentes fuentes de datos y
recopilarlos en un Excel y con ello el cálculo de columnas y medidas.

32
Cfr. Microsoft Power BI, 2016.

246
 Power Map: permite visualizar data en 3D a nivel geográfico.

 Power View: Permite relacionar y visualizar data en una variedad de


visualizaciones.

 Power Query: Permite de una forma intuitiva el descubrimiento,


combinación y refinamiento de la data a utilizar.

 Power Publisher: Permite obtener data, tablas pivot y asociarlos en


dashboards a Power BI.

Tableau33
Tableau Software presenta la herramienta mostrando tres principales productos.

 Tableau Online
Una de sus características principales es que se encuentra soportada bajo la
plataforma de Tableau Server, lo cual hace que también tenga la velocidad,
disponibilidad y seguridad de dicho producto sin la necesidad de tener un
hardware. Permite la colaboración y visualización distribuida de dashboards.

 Tableau Server
Es una plataforma de análisis de negocio el cual tiene un soporte para grandes
cantidades de usuarios. Su principal enfoque es a nivel corporativo, tiene alta
disponibilidad, se ejecuta en ambas máquinas físicas y virtuales y provee
integración en cluster. Permite compartir modelo de datos, definir las fuentes
de datos, incluir metadata para usarlo de forma colaborativa con la seguridad
correspondiente. Por otro lado, resalta la colaboración entre usuarios por lo
que también se puede acceder de forma móvil, disponible en los sistemas
operativos Android y IOS.

 Tableau Desktop

33
Cfr. Tableau Software, 2016

247
Esta versión de Tableau permite crear y publicar vistas, reportes y dashboards
en Tableau Server. Permite conectar un reporte a distintas fuentes de datos,
ver relaciones entre la data, crear dashboard, modificar metadata y finalmente
publicarlo en Tableau Server.

Qlik Sense34
Esta herramienta se presenta en distintas plataformas las cuales se encuentran
conectadas entre sí. Los productos son:

 Qlik Sense Cloud


Esta versión del producto permite la creación de dashboards, compartirlos,
visualización de forma narrada (Data Storytelling) haciendo uso de distintas
fuentes de datos. Por otro lado, una característica importante es su
adaptabilidad en distintos dispositivos, esto se debe a su diseño responsive, lo
cual ayuda a que se adapte en cualquier dispositivo.

 Qlik Sense Desktop


Esta versión de la herramienta, además de proporcionar las principales
funcionalidades como creación de dashboards dinámicos y reportes,
visualización interactiva, Data Storytelling y visualizaciones responsive,
ayuda en la exploración de la información y destaca la búsqueda inteligente
en la data, lo cual proporciona flexibilidad para encontrar las relaciones en
éste.

 Qlik Sense Enterprise


Esta versión de la herramienta tiene un enfoque empresarial. Además de
contar con todas las características descritas en la versión Desktop y Cloud,
su principal enfoque es Gobierno, soporte de autoservicio, aplicaciones
analíticas guiadas, cuadros de mando, análisis y presentación de informes

34
Cfr. Qlik Sense, 2016

248
integrados, todo dentro de un framework de gobierno que proporciona
escalabilidad empresarial.

249
Figura 138. Requerimientos Técnicos de las Herramientas
Nota. Elaboración propia

250
5.3.4 Criterios de Evaluación
Para lograr evaluar dichas herramientas nos enfocaremos en determinados
criterios que para el propósito de este proyecto son relevantes. A continuación,
explicaremos cuales son:
Costo: En este criterio se evaluarán los precios de las licencias por las
ediciones que posee cada herramienta de forma anual. En caso no exista algún
costo por licencia, se tomará en consideración algún otro costo por requisitos
previos.
TCO: Total Cost of Ownership es un análisis que cubre todos los costos por los
que se puede incurrir al adquirir un software durante su ciclo de vida.
Para dicho análisis se evalúen diferentes criterios, los cuales se agrupan en
distintas categorías:
 Hardware, Plataformas

 Aplicaciones, Salarios

 Cargos de servicios

Cantidad de Gráficos soportados: Para el propósito del proyecto se evaluará


la cantidad de técnicas de data visualization que pueden proveer como plantillas
las herramientas. Se tomará en consideración con mayor prioridad aquellas
investigadas para la elaboración de los lineamientos de uso y diseño.
Customización: Se evalúa las capacidades que las herramientas ofrecen para
amoldarse a las necesidades del cliente. En este caso se tomará en
consideración los API que cuenta y la flexibilidad en cuanto a desarrollo dentro
de la herramienta.

Seguridad: Se evalúa los protocolos de seguridad tanto a nivel de autenticación


como accesos para la visualización de información.
5.3.5 Evaluación de Herramientas
Costo
A continuación, se muestra un cuadro referencial de los precios por las licencias
de las diferentes ediciones que poseen las herramientas, considerando las
versiones en la que se encuentra disponible, on premise o cloud.

Figura 139. Precios y Ediciones de las Herramientas


Nota. Elaboración propia

Como se puede observar, para el caso de las tres herramientas, se toma en


cuenta el monto correspondiente de manera anual. Asimismo, se ha tomado en
cuenta el costo implícito por los programas que se requieren.

TCO (Total Cost Ownership)


Como parte del proceso de aplicación del TCO, se tomará en cuenta los
criterios que para el caso modelo apliquen. Para la evaluación de los costos

252
tomaremos en cuenta la siguiente consideración y bajo esa premisa se
determinarán los costos:
 Para la implementación, uso y mantenimiento de la herramienta se contará
con 3 miembros.

Considerando la estructura base del TCO, se tuvieron en cuenta tres grupos:


Hardware, Software y Gastos operativos. Cabe resaltar que para el cálculo del
primer año, se tomó en cuenta la cantidad de miembros que harían uso de las
herramientas y la valorización de todas las cantidades en dólares. Asimismo, se
ha procurado tener en cuenta los mismos costos para los grupos Hardware y
Gastos operativos de los siguientes años con la finalidad de que sea el grupo
Software el que haga la diferenciación del total de los costos por cada
herramienta.

A continuación, se muestra los resultados luego de realizar los cálculos


correspondientes:

Power BI Año 1 Año 2 Año 3


Hardware
Computadora 1265,63
Software
Windows 8.1 115
Power bi pro 359,64 359,64 359,64
Office 365 e5 1260 1260 1260
.net 4.5
Google oogle
chrome
Gastos operativos
Luz 5576,69 5576,69 5576,69
Internet 596,91 596,91 596,91
Personal
174000 174000 174000
Administrador
Total 183173,87 181793,24 181793,24
Figura 140. Evaluación TCO Power BI
Nota. Elaboración propia

253
Tableau Año 1 Año 2 Año 3
Hardware
Computadora 1265,63
Software
Windows Server
1209
2012 R2
Tableau server 3000
Google Chrome 0
Gastos operativos
Luz 5576.69 5576.69 5576.69
Internet 596.91 596.91 596.91
Actualizaciones y
750 750
soporte
Personal
174000 174000 174000
administrador
Total 185648,23 180923.6 180923.6
Figura 141. Evaluación TCO Tableau Server
Nota. Elaboración propia

Qlik Sense Año 1 Año 2 Año 3


Hardware
Computadora 1265,63
Software
Windows Server
2012 R2 1209
Qlik Sense
Enterprise 4500
Google Chrome 0
Gastos operativos
Luz 5576.69 5576.69 5576.69
Internet 596.91 596.91 596.91
Personal
administrador 174000 174000 174000
Total 187148,23 180173.6 180173.6
Figura 142. Evaluación TCO Qlik Sense
Nota. Elaboración propia

Como se puede observar, los costos a incurrir por la herramienta Power BI no


varían mucho si comparamos los costos del primer año y los dos siguientes
años, a diferencia de Tableau y Qlik Sense, en los cuales sí se puede ver una
diferencia entre el primer año y los dos siguientes, no obstante, cabe resaltar
que, a diferencia de las dos últimas herramientas, en los Costos de Power BI se
considera Office 365 E5, el cual es necesario para que se pueda acceder a nivel

254
cloud y realizar publicaciones, esto quiere decir que los costos incurridos en
dicha herramienta cubren tanto implementar indistintamente la versión
Desktop y Cloud, a diferencia de Tableau y Qlik Sense que sólo cubren una
sola versión de cada una, puesto que, si se quisiera considerar la versión cloud,
los costos serían mayores.

Cantidad de Gráficos Soportados

Para la elaboración de este match se realizaron pruebas con la base de datos


Contoso, como resultado a continuación se puede ver las técnicas de data
visualization investigadas para la elaboración de los lineamientos de uso y
diseño y en qué herramientas se encuentran soportadas.

255
Figura 143. Cuadro de Cantidad de Gráficos soportados por cada herramienta
Nota. Elaboración propia

Customización
Sobre este punto se evaluará qué tanto la herramienta tiene la capacidad para
poder amoldarse. Tomaremos en cuenta características en base al desarrollo que
se pueda realizar y API’s disponibles (cuantos y cuales).

256
 Power BI

Power BI provee el Power BI REST API para poder realizar distintas


tareas. Si bien es cierto sólo cuenta con el API Rest, a continuación, se
muestran algunas de las actividades que se pueden realizar:
 Extender un flujo de trabajo de negocio existente para empujar data
importante en un dashboard Power BI.

 Insertar recuadros (sector de un dashboard) en una app.

 Insertar reportes en una app.

 Importar archivos a Power BI Desktop.

 Autenticar una app de Power BI.

 Autenticar las operaciones de REST de Power BI con Azure Active


Directory OAuth2

 Crear y obtener conjuntos de datos

 Establecer una directiva de retención para limpiar automáticamente


los datos antiguos

 Obtener y actualizar esquemas de tabla

 Agregar y eliminar filas

 Obtener grupos

Por otro lado, en cuanto a la programación que se pueda realizar en Power


BI, la herramienta proporciona proyectos en Github los cuales son:
 App Cliente: Consiste en una aplicación en consola el cual muestra
cómo autenticar una app cliente y llamar a todas las operaciones de
Power BI.
 App Web: Muestra cómo autenticar una aplicación web de Power
BI.
 Integrar un recuadro de Power BI en una aplicación: es una
aplicación web que muestra cómo realizar la integración.
 Integrar un reporte de Power BI en una aplicación: es una aplicación
web que muestra cómo realizar la integración.
 Realizar operaciones como “Create Datasets” y Get Datasets”.

257
 Tableau
A diferencia de Power BI, esta herramienta provee dos tipos de API:
Javascript API y REST API.
 Javascript API: permite integrar vistas en aplicaciones web.
 REST API: Algunas funciones que permite realizar son:
 Gestión de aprovisionamiento
 Permisos
 Publicar en Tableau Server o Tableau Online vía HTTP.
 Otorga accesos a las funcionalidades detrás de las fuentes de
datos, proyectos, libros de trabajo, usuarios del sitio y sitios.
Estos accesos permiten crear aplicaciones customizadas o
interacciones via script con los recursos del servidor.
Por otro lado, con respecto al grado de flexibilidad de la herramienta a
través de los recursos de desarrollo, Tableau cuenta con lo siguiente:
 Tableau SDK: Haciendo uso de los lenguajes de programación C,
C++, Java o Python se puede crear extractos de cualquier data y
luego publicarlos.

 Web Data Connector: Permite crear una conexión Tableau en


JavaScript a cualquier fuente de datos vía HTTP. Esto puede incluir
servicios web internos, data JSON, XML, REST API y otras
fuentes.

 ODBC Connector: Se puede crear una conexión ODBC (Open Data


Conectivity), el cual es un protocolo de acceso a data que está
soportado por diversas fuentes de datos. En el caso de Tableau
Desktop, también es posible conectar una fuente de datos que
funcione bajo el protocolo ODBC haciendo uso de conector built in
ODBC.

 Qlik Sense

Esta herramienta a diferencia de las dos anteriores, cuenta con distintos


API’s o es así como se puede ver distribuido en la documentación oficial,

258
cada una de ellas permite realizar diversas actividades de acuerdo a cómo
se vaya a proceder. Si bien se encuentran distribuidos de esa forma, son del
tipo Javascript, REST y .NET.
En el caso de aquellos del tipo Javascript, estos son con los que se cuenta:
 Extension API

 Backend API

 Root API

 App API

 Bookmark API

 Field API

 Global API

 Navigation API

 Selection API

 Table API

 Variable API

 Visualization API

Esta relación de APIs son utilizados cuando es del tipo REST. En ese caso
permite administrar data, configurar información y autenticación. Estos
son:
 Qlik Sense Proxy Service API

 Qlik Sense Repository Service API

A nivel de desarrollo en la herramienta, Qlik Sense provee distintos medios


que permiten esto.
 Construcción de conectores: Para esto Qlik Sense ofrece el QVX
SDK el cual permite crear conectores customizados utilizados para
recuperar data de cualquier fuente no soportado por un instalador
genérico.

259
 Construcción de aplicaciones en Windows: Qlik Sense ofrece el
.NET SDK con el propósito de integrar la herramienta a
aplicaciones Windows (.NET).

 Importación de usuarios y grupos: con esta API, la herramienta


permite realizar dicha funcionalidad Por este medio es que se ha
hace uso del API tipo .NET.

 Qlik Sense User Directory Connector API

Seguridad
Para esta sección se tomará en consideración las formas de autenticación por los
que un usuario puede ingresar tanto a la herramienta como a las fuentes de
datos.

 Power BI

Se cuenta con diferentes aspectos para evaluar la seguridad, no obstante, en


esta ocasión nos centraremos en dos grandes aspectos, accesos
(autenticación) y nivel de seguridad a nivel de fuentes de datos.

 Autenticación de usuarios:
Se encuentra basado en una serie de solicitudes, respuestas y reenvíos
entre el navegador del usuario y el servicio de Power BI o de los
servicios de Azure utilizados por Power BI. Esa secuencia describe el
proceso de autenticación de usuarios en la herramienta. Dicha secuencia
se muestra a continuación.

1. Un usuario inicia una conexión con el servicio de alimentación de


BI desde un navegador, ya sea escribiendo en la dirección de Power
BI en la barra de direcciones (como https://app.powerbi.com) o
seleccionando iniciar sesión del landing page de Power BI
(https://powerbi.microsoft.com). La conexión se establece a través
de HTTPS, y toda comunicación posterior entre el navegador y el

260
servicio de Power BI utiliza HTTPS. La solicitud se envía al Azure
Traffic Manager.
2. El Azure Traffic Manager comprueba registro DNS del usuario para
determinar el centro de datos más cercano donde se despliega Power
BI, y responde al DNS con la dirección IP del cluster WFE a la que
el usuario debe ser enviada.
3. El WFE (Cluster dentro de la arquitectura de Power BI) luego re
direcciona al usuario a la página de inicio de sesión del servicio de
Microsoft online.

Figura 144. Flujo de autenticación de usuarios Power BI parte I


Nota. Recuperado de Microsoft, 2016

4. Una vez autenticado el usuario, la página de inicio de sesión redirige al


usuario a la agrupación de servicios WFE previamente al servicio de
Power BI más cercana determinada.
5. El navegador envía una cookie que se obtiene a partir del inicio de
sesión satisfactorio de Microsoft Online Services, que es inspeccionado
por el servicio ASP.NET dentro del grupo de WFE.
6. El cluster WFE verifica con el servicio Azure Active Directory (AAD)
para autenticar la suscripción del servicio de Power BI del usuario, para
obtener un token de seguridad AAD. Cuando AAD regresa como
autenticación exitosa del usuario y devuelve un token de seguridad

261
AAD, el clúster WFE consulta al Servicio Global de Power BI, que
mantiene una lista de los “tenants” y las ubicaciones de los cluster Back
End de Power BI, y determina qué cluster del servicio de Power BI
contiene el “tenant” del usuario. Luego, el cluster WFE, indica al
usuario el cluster de Power BI donde reside el “tenant” y devuelve un
conjunto de artículos al navegador del usuario:
 Token de seguridad de AAD
 Información de la sesión
 La dirección web del cluster Back End del usuario.
7. El navegador del usuario contacta el Azure CDN específico con el fin de
descargar la colección de archivos comunes especificados necesarios
para permitir la interacción del navegador con el servicio de Power BI.
La página del navegador incluye entonces el token AAD, la información
de la sesión, la ubicación de la agrupación asociada Back End, y la
colección de archivos descargados de la agrupación Azure CDN y WFE,
durante la duración de la sesión del navegador del servicio de Power BI.

Figura 145. Flujo de autenticación de usuarios Power BI parte II


Nota. Recuperado de Microsoft, 2016

262
 Autenticación de usuario a nivel de fuentes de datos:
Sobre este punto, es importante recalcar que una vez que las
visualizaciones son dependientes de que las fuentes de datos soporten el
Role Level Security (RLS).
Si una fuente de datos soporta el Role Level Security (RLS), el servicio de
Power BI aplicará la seguridad a nivel de roles y los usuarios que no tengan
suficientes credenciales para acceder no podrá ver dicha data.

 Tableau

Tableau resume diferentes formas en las que trabaja la seguridad dentro de


la herramienta, por ejemplo:

 Database login account: Cuando se crea una fuente de datos que se


conecta en live a una base de datos, el usuario elige entre autenticarse a
la base de datos a través de Windows NT o a través del mecanismo de
seguridad de la base de datos.

 Authentication mode: Cuando se publica una fuente de datos o un libro


de trabajo con una conexión live de la base de datos, el usuario puede
escoger este tipo de modalidad. Existen diferentes modalidades
dependiendo que tipo de autenticación haya elegido.

 User filters: Se puede aplicar filtros en un libro de trabajo o fuente de


datos que controla que data puede visualizar una persona en una vista
publicada, esto dependerá de la cuenta con la que inicie sesión en
Tableau Server.

Tableau comparte dentro de su documentación un cuadro que nos permite


conocer de forma resumida qué restricciones tiene la herramienta
dependiendo que tipo de autenticación haya optado el usuario.

263
Opciones de Conexión a Base de Datos Preguntas sobre seguridad a nivel de datos

¿Los filtros
¿Es posible
de usuarios
seguridad a ¿Son
son la única
Cuenta de inicio de nivel de base compartidos
forma de
sesión a la base de Modo autenticación de datos por entre usuarios
restringir
datos utiliza… usuario en los caches
qué data
Tableau Web?
cada usuario
Server?
puede ver?

Server funciona como


No Sí Sí
cuenta
Window NT
Hacerse pasar a través
Integrated
del servidor de cuenta Sí No* No
Security (Windows
de ejecución
Authentication)
Credenciales de
Sí No* No
espectador

Usuario Prompt: A los


espectadores se les
solicita sus
credenciales de base
Sí No No
de datos cuando hacen
clic en una vista. Las
credenciales pueden
ser guardadas.

Credenciales
embebidos: El libro de
trabajo o el editor de
fuente de datos puede No Sí Sí
Usuario y contraseña incrustar sus
credenciales de base
de datos.

Hacerse pasar a través


de contraseña
incrustada:
credenciales de base Sí No* No
de datos con permiso
de suplantación están
incrustados.
Figura 146. Seguridad de Tableau
Nota. Recuperado de Tableau Software, 2016

Aquellas respuestas marcadas con asterisco indican que la razón por la cual se
menciona que no es debido a que puede crear resultados inesperados, por lo
cual Tableau no recomienda esta modalidad.

264
 Qlik Sense

Al igual que Power BI, Qlik Sense tiene una secuencia para la
autenticación, el cual consiste en:
20. El módulo de autenticación obtiene la identidad del usuario y
credenciales.
21. El módulo de autenticación solicita un sistema externo para verificar las
credenciales utilizadas por la identidad del usuario.
22. El usuario accede a Qlik Sense utilizando el Ticket API, Session API,
cabeceras HTTP o SAML.

Qlik Sense requiere de un proveedor externo para realizar la autenticación


por lo cual el usuario es transferido al Hub o al QMC (Qlik Management
Console) utilizando el Transport Layer Security (TLS) como vía.
Existen diferentes métodos que utiliza Qlik Sense, estos ya fueron
mencionados dentro del tercer paso en la secuencia para la autenticación,
estos son:

 Ticket API: Transfiere al usuario y a sus atributos utilizando un one


time ticket. Por ejemplo, la autenticación de Windows con Qlik Sense
invoca el ticket API luego de la verificación con el dominio.

 Session API: donde un módulo externo transfiere una sesión web


identificando el usuario a Qlik Sense.

 Cabeceras HTTP: Se utiliza en soluciones con sistemas confiables que


transfieren información del usuario.

 SAML: su integración con Qlik Sense actúa como un proveedor de


servicio (SP) integrándose con una identidad (IdP).

 Anónimo: los usuarios pueden ingresar a través de configuración.

Por otro lado, a nivel de autorizaciones a las distintas funcionalidades y


fuentes de datos Qlik Sense trabaja de la siguiente forma: a través de un
atributo basado en control de accesos (ABAC) y reglas de seguridad.

265
 Atributo Basado en Control de Accesos (ABAC): Este método
consiste en que el usuario solicita realizar acciones en recursos y se les
es concedido en la medida que cuente con los atributos
correspondientes. Atributos de Active Directory, LDAP y fuentes de
datos son cagados en Qlik Sense.

 Reglas de Seguridad: Son los que definen las capacidades del usuario
en los recursos de la herramienta. Estas reglas están asociadas a los
atributos asignados al usuario. El acceso es dado si por lo menos una
regla de seguridad es verdadera de los atributos del usuario.

5.3.6 Conclusiones
Para llegar a un resultado que nos permita escoger la herramienta a utilizar en
nuestro proyecto, tomaremos en cuenta dos grandes premisas desarrolladas: las
consideraciones base y los criterios de evaluación.
Como ya se ha detallado al inicio de este documento, el cuadrante mágico clasificó
a distintas herramientas en los cuatro cuadrantes, para ello tomaron en cuenta
capacidades críticas. Los resultados cuantitativos de la evaluación realizada por
Gartner fueron los siguientes:

Critical capabilities Microsoft Tableau Qlik


Gestión de Plataforma BI 4.5 3.5 3.5
BI Cloud 4 2.5 1.5
Gestión de seguridad y usuarios 3 4 3.5
Conectividad de fuentes de datos 4.5 4 2.5
Gestión de Gobierno y Metadata 2.5 2 2
Extracción, transformación y carga
4 4.5 3
(ETL) y Almacenamiento de Datos
Auto preparación de Data 3 2.5 3
Análisis Avanzado Embebido 1.5 1.5 1.5
Dashboards Analytics 3 3 3.5
Exploración Visual interactivo 2.5 4 3.5
Exploración móvil y autorizado 3 3 2
Contenido Analítico embebido 3.5 3 4
Publicación de Contenido Analítico 1.5 2 2
Colaboración y BI Social 1.5 1.5 1.5
Total 42 41 37
Figura 147. Extracto del Product/Service Rating on Critical Capabilities
Nota. Recuperado de Gartner Inc, 2016

266
Como se puede observar en el extracto de los resultados de las capacidades críticas
de Gartner, Microsoft es quien obtiene mayor calificación a diferencia de los
demás.

Por otro lado, con respecto a los criterios de evaluación, se había hecho mención
que la capacidad de gráficos soportados en cada herramienta tendría un gran peso al
momento de la evaluación. Tomando eso en cuenta, quien obtuvo mayor cantidad
de gráficos soportados fue Tableau. Esto nos permite ver que la primera opción
estaría entre Power BI y Tableau.
Si evaluamos las herramientas en un rango del 1 al 5, tomando en cuenta todos los
aspectos mencionados anteriormente, la priorización de las tres herramientas como
resultado de la evaluación final del benchmarking, es el siguiente:

Tabla 8 : Resultado final del Benchmarking


Herramienta Puntaje Prioridad
Power BI 4 1
Tableau 3 2
Qlik Sense 2 3

Nota. Elaboración propia

Finalmente, se concluye que, para la continuación de este proyecto, se hará uso de


la herramienta Power BI de Microsoft.

267
5.4 Arquitecturas de las herramientas

5.4.1 Arquitectura de Power BI

 Diagrama de Arquitectura Lógica

La arquitectura se encuentra estructurada en base a la parte cliente, parte lógica


interna de la herramienta y las distintas fuentes de datos con los que se conecta, en
este caso Power BI los da a conocer como servicios. Con respecto a la parte
cliente, la herramienta cuenta con dos grupos importantes, browsers y móvil. En el
caso de los browsers, son compatibles Safari, Google Chrome, Mozilla Firefox,
Microsoft Edge e Internet Explorer y por otro lado, en cuento a la parte móvil, la
herramienta cuenta con su aplicación el cual es compatible en iOS, Android y
Windows Phone.
A través de cualquiera de estos grupos el usuario accede al servicio de Power BI, se
establece conexión HTTP y se envía una solicitud al Azure Traffic Manager. Este
componente comprueba el registro DNS del usuario para determinar el centro de
datos más cercano donde se despliega Power BI, responde al DNS con la dirección
IP del cluster WFE a la que el usuario debe ser llamado. En el cluster WFE, el
navegador envía un cookie que se obtiene de haber iniciado sesión en Microsoft
Online Services que es inspeccionado por el servicio de ASP. NET. El cluster
WFE verifica con el servicio Azure Active Directory (AAD) para autenticar la
suscripción del servicio de Power BI del usuario, para obtener un token de
seguridad AAD. Cuando el AAD regresa como autenticación exitosa del usuario y
devuelve un token de seguridad AAD, el clúster WFE consulta al Servicio Global
de Power BI, que mantiene una lista de los “tenants” y las ubicaciones de los cluster
Back End de Power BI y determina qué cluster del servicio de Power BI contiene el
“tenant” del usuario. Luego, el cluster WFE, indica al usuario el cluster de Power
BI donde reside el “tenant” y devuelve un conjunto de artículos al navegador del
usuario (Token de seguridad de AAD, Información de la sesión y la dirección web
del cluster Back End del usuario). El navegador del usuario contacta el Azure CDN
específico con el fin de descargar la colección de archivos comunes especificados
necesarios para permitir la interacción del navegador con el servicio de Power BI.
Cuando eso es finalizado, el navegador inicia contacto con el cluster Back End
específico. A partir de ese momento, el contacto que se tenga desde la parte cliente
hacia el servicio de Power BI es directamente hacia el Back End Cluster.

268
A través del Back End cluster, el cliente puede interactuar con el servicio de Power
BI, se encarga de gestionar las visualizaciones, dashboards de los usuarios, datasets,
reportes, almacenamiento de datos, conexiones con la data, actualización de la data
y otros aspectos. Dentro de sus componentes se encuentra el Gateway role, es una
compuerta por donde se canaliza las solicitudes del usuario y las respuestas del
servicio de Power BI. Sólo es a través de este componente que el usuario puede
interactuar. Asismismo, el Azure API Management es un componente que contará
con las mismas capacidades del Gateway role eventualmente y son estos dos los
que pueden verificar la autenticación, autorización, protección DDoS, balance de
carga, routing y otras funcionalidades.
Como se puede visualizar en la arquitectura más adelante, bajo el Gateway role y
Azure API Management , se encuentran los compomentes Presentation Role, Data
Role, BJP Role (Background Job Processing Role) y el Data M Role (Data
Movement Role). Cada uno de estos son llamados respectivamente dependiento el
tipo de solicitud que haga el cliente, si el cliente solicita visualizar un dashboard el
Gateway role recibe y acepta dicha solicitud y se lo envía al Presentation Role para
poder obtener la data que se visualizaría en el dashboard.
En cuanto al almacenamiento de data, el servicio de Power BI tiene dos grandes
repositorios, Azure Blob y Azure SQL Database. En el caso de la data que es
actualizada por los usuarios se almacena en el Azure Blob, mientras que la
metadata y artefactos del sistema mismo son almacenadas en Azure SQL Database.
En cuanto a las conexiones a distintas fuentes de datos, Power BI tiene
compativilidad con 60 servicios, los se han podido agrupar bajo dos categorías:
Cloud y On premise. Los que son almacenados en la nube se encuentran divididos
en aquellos servicios que son de Office 365, Azure y Non Azure. En el caso de
algunos servicios, se requiere un puente el cual ayude a tener una transferencia
segura de los datos y para ello, en el caso de todos los servicios que se conecten al
servicio de Power BI, deben conectarse con el Enterprise Gateway.
Finalmente, Power BI cuenta con una versión Desktop, el cual sólo tiene conexión
a los servicios on premise y puede publicar los informes en el servicio de Power BI
en la nube. También existe una versión de Gateway Personal de mejora la
tranferencia segura de datos, no obstante sólo aplica para ciertos servicios on
premise.

269
Figura 148. Arquitectura Lógica de Power BI
Nota. Elaboración propia

Figura 149. Arquitectura Lógica de Power BI Desktop


Nota. Elaboración propia

270
Tabla 9 : Descripción de la arquitectura de Power BI

Información de
Modulo Responsabilidad
Implementación

Comprueba el registro DNS del


usuario para determinar el
Azure Traffic Manager Servicio
centro de datos más cercano
donde se despliega Power BI

Contiene una lista de los


“tenants” y las ubicaciones de
Global Service Servicio
los cluster Back End de Power
BI

Compuerta por donde se


canaliza las solicitudes del
Gateway Role Componente
usuario y las respuestas del
servicio de Power BI

Posee las mismas


características de Gateway
Azure API Management Role y eventualmente realizará Componente
todas sus funciones
completamente

Componente al cual recurre el


Gateway Role para poder
Presentation Role Componente
obtener la data que se
visualizaría en el dashboard

Componente al cual recurre el


Gateway Role cuando el cliente
Data Role Componente
solicita algún aspecto referente
a este

BJP Role (Background Job Componente al cual recurre el


Componente
Processing Role) Gateway Role cuando el cliente

271
Información de
Modulo Responsabilidad
Implementación

solicita algún aspecto referente


a este

Componente al cual recurre el

Data M Role (Data Gateway Role cuando el cliente


Componente
Movement Role) solicita algún aspecto referente
a este

Servicio de Microsoft el cual es


consultado por el cluster WFE
para autenticar la suscripción
Active Directory Servidor
del servicio de Power BI del
usuario, obteniendo un token
de seguridad AAD

Contiene la colección de
archivos comunes
especificados necesarios para
Azure CDN Servicio
permitir la interacción del
navegador con el servicio de
Power BI.

Almacena data actualizada por


Azure Blob Base de Datos
usuarios

Almacena metadata del


Azure SQL Database Base de Datos
servicio

En el cluster WFE, inspecciona


la información recibida en un
ASP.NET cookie, el cual se obtiene de Componente
haber iniciado sesión en
Microsoft Online Services

272
Información de
Modulo Responsabilidad
Implementación

Puente que permite canalizar


de forma segura y rápida la
Power BI Enterprise
información desde los servicios Gateway
Gateway
en la nueve hacia el servicio de
Power BI.

Componente de Excel que


permite agregar data con gran
Power Pivot Componente de Excel
cantidad de registros de
distintas fuentes de datos

Componente de Excel que


permite una forma fácil de
Power Query Componente de Excel
descubrir, combinar y refinar
data

Power Publisher Componente Componente de Excel

Componente que ayuda en la


Power Map visualización de espacios Componente de Excel
geográficos.

Software de oficina para


Microsoft Excel
realizar cálculos, tablas, etc.

Es un requisito para la
.Net 4.5 Framework instalación del Power BI
Desktop

Es un requisito para la
Internet Explorer instalación del Power BI Navegador
Desktop

Versión Desktop de la
Power BI Desktop Desktop
herramienta Power BI

273
Información de
Modulo Responsabilidad
Implementación

Versión mínima de los sistemas

Windows 7/ Windows operativos sobre los cuales se


Sistema Operativo
Server 2008 R2 instala el Power BI Desktop

Nota. Elaboración propia

 Diagrama de Arquitectura Física

La arquitectura física, al igual que la versión lógica, se encuentra dividida. Se puede


distinguir los dispositivos clientes tanto browsers como móvil, para ambos caso la
comunicación con los servidores del servicio de Power BI en la nube es por
protocolo HTTP. Asimismo, en la parte central se encuentran los distintos
servidores que se ha podido identificar. Con respeto a la estructura propia del
servicio de Power BI, este posee dos grandes conjuntos de servidores el WFE
Cluster y el Back End Cluster, donde el WFE es el primer servidor por donde al
inciar sesión el usuario tiene contacto luego de pasar por el Azure Traffic Manager.
En dicho cluster se encuentra el componente ASP.NET. En el cluster Back End se
encuentran los componentes, Gateway role y Azure API Management ya
mencionados anteriormente. Es a través de estos dos componentes por donde se
recibe las solicitudes del cliente y son enviados a los componentes correspondientes
(Presentation Role, Data Role, BJP Role (Background Job Processing Role) y el
Data M Role (Data Movement Role)). Del mismo modo el Back End Cluster se
conecta con los servidores dode se encuentran el Azure Blob Database, en el cual se
almacenan data de los usuarios, los cuales utilizan para elaborar informes y el
Azure SQL Database donde se almacena metadata del mismo sercicio de la
herramienta. Cuando se requiere la conexión con otros servicios (con los que son
compatibles Power BI) se requiere de la compuerta de Power BI Enterprise, el cual
es necesario para una mejor fluctuación de la data y refuerzo de la seguridad en la
transferencia de información. Dichos servicios son divididos principalmente los que
son cloud y los que son on premise, en el caso del cloud se encuentran
representados en aquellos que son propios de Office 365, Azure y Non Azure. En el

274
caso de los que son on premise, se encontrarán almacenados en un servidor, por el
cual se tiene un fácil acceso a través de la versión Desktop de la herramienta.

Figura 150. Arquitectura Física de Power BI


Nota. Elaboración propia

Tabla 10 : Descripción de la arquitectura física de Power BI

Información de
Componente Responsabilidad
Implementación

Web Browser Navegador web

Android Dispositivo móvil con sistema


Móvil
Mobile operativo Android

275
Información de
Componente Responsabilidad
Implementación

Dispositivo móvil con sistema


iOS Mobile Móvil
operativo iOS

Windows Dispositivo móvil con sistema


Móvil
Phone operativo Windows Phone

Aloja el servicio que comprueba el


Traffic
registro DNS del usuario para
Manager Servicio
determinar el centro de datos más
Server
cercano donde se despliega Power BI

WFE Server Aloja el componente, .NET Servicio

Back End Aloja los componentes del servicio de


Servicio
Server Power BI

Active Servidor donde se aloja Active


Directory Directoy, Gestor de autorizaciones y Servicio

Server accesos.

Power BI
Servidor donde aloja el Gateway
Gateway Servicio
Enterprise
Enterprise

Azure
Database Grupo de servicios de Azure Servicio de Base de Datos

Server

Non Azure
Database Grupo de servcios no azure Servicio de Base de Datos

server

Office 365
Database Grupo de servicios de Office 365 Servicio de Base de Datos

Server

276
Información de
Componente Responsabilidad
Implementación

Azure Blob
Base de Datos donde se aloja
Database Base de Datos
metadata del servicio Power BI
Server

Azure SQL Base de Datos donde se aloja datos de


Database los informes, dashboards de los Base de Datos

Server usuarios en el servicio Power BI

Power BI
Se aloja Power BI Desktop
Workstation

On premise
Grupo de servicios/bases de datos on
database
premise
server
Nota. Elaboración propia

 Diagrama de Componentes

Se cuenta con la representación de los principales componentes dentro de la


arquitectura y cómo es su relación entre ellas mediante el tipo de conexión.

277
Figura 151.1Diagrama de Componentes de Power BI
Ilustración -
Nota. Elaboración propia

Tabla 11 : Descripción del diagrama de componentes de Power BI

Componente Responsabilidad

Browser Navegador Cliente

Power BI Mobile Aplicación móvil de Power BI

Azure Traffic Comprueba el registro DNS del usuario para determinar el centro

Manager de datos más cercano donde se despliega Power BI

WFE Cluster Cluster que contiene el componente .Net

Back End Cluster Cluster que contiene los componentes del servicio de Power BI

Azure Blob Base de datos que contiene data de los informes, dashboards

Base de Datos SQL


Base de datos que contiene metadata del servicio de Power BI.
Azure

Azure Active Permite la autenticación de los usuarios a la herramienta y sus

Directory respectivos permisos

278
Componente Responsabilidad

Contiene la colección de archivos comunes especificados

Azure CDN necesarios para permitir la interacción del navegador con el


servicio de Power BI.

Puente que permite canalizar de forma segura y rápida la


Power BI Gateway for
información desde los servicios en la nueve hacia el servicio de
Enterprise
Power BI.

Componente de Excel que permite agregar data con gran


Power Pivot
cantidad de registros de distintas fuentes de datos

Componente de Excel que permite una forma fácil de descubrir,


Power Query
combinar y refinar data

Power Publisher Componente

Componente que ayuda en la visualización de espacios


Power Map
geográficos.

Microsoft Excel Software de oficina para realizar cálculos, tablas, etc.

.Net 4.5 Framework Es un requisito para la instalación del Power BI Desktop

Internet Explorer Es un requisito para la instalación del Power BI Desktop

Power BI Desktop Versión Desktop de la herramienta Power BI

Accumatica Base de datos cloud Non Azure

Adobe Analytics Base de datos cloud Non Azure

appFigures Base de datos cloud Non Azure

Circuit ID Base de datos cloud Non Azure

comScore Base de datos cloud Non Azure

Github Base de datos cloud Non Azure

279
Componente Responsabilidad

Google Analytics Base de datos cloud Non Azure

Mailchimp Base de datos cloud Non Azure

Mandrill Base de datos cloud Non Azure

OData Base de datos cloud Non Azure

Planview Enterprise Base de datos cloud Non Azure

QuickBooks Online Base de datos cloud Non Azure

Salesforce Base de datos cloud Non Azure

Stripe Base de datos cloud Non Azure

SweetIQ Base de datos cloud Non Azure

Twilio Base de datos cloud Non Azure

tyGraph Base de datos cloud Non Azure

UserVoice Base de datos cloud Non Azure

Visual Studio Online Base de datos cloud Non Azure

Zendesk Base de datos cloud Non Azure

Facebook Base de datos cloud Non Azure

Web Base de datos cloud Non Azure

Microsoft Dynamics
Base de datos cloud Non Azure
CRM

SQL Sentry Base de datos cloud Non Azure

Registros de
Base de datos cloud Azure
Auditoría de Azure

Azure Mobile Base de datos cloud Azure

280
Componente Responsabilidad

Engagement

Microsoft Dynamics
Base de datos cloud Azure
NAV

Base de Datos SQL de


Base de datos cloud Azure
Azure

Azure DocumentDB Base de datos cloud Azure

Spark en HDInsight de
Base de datos cloud Azure
Azure

HDInsight Base de datos cloud Azure

Azure Marketplace Base de datos cloud Azure

Almacenamiento de
Base de datos cloud Azure
Blobs de Azure

Microsoft Dynamics
Base de datos cloud Azure
Marketing

Almacenamiento de
Base de datos cloud Azure
tablas de Azure

Almacenamiento de
Base de datos cloud Azure
datos SQL de Azure

Access Base de datos cloud Office 365

Excel Base de datos cloud Office 365

Exchange Base de datos cloud Office 365

Sharepoint Base de datos cloud Office 365

Oracle Base de datos on premise

281
Componente Responsabilidad

MySQL Base de datos on premise

SQL Server Base de datos on premise

IBM DB2 Base de datos on premise

PostreSQL Base de datos on premise

HDFS Base de datos on premise

Teradata Base de datos on premise

SyBase Base de datos on premise

ODBC Base de datos on premise

Auditoría de Base de
Base de datos on premise
Datos SQL

Marketo Base de datos on premise

Webtrends Base de datos on premise

SendGrid Base de datos on premise

CSV Base de datos on premise

XML Base de datos on premise

Carpetas Base de datos on premise

Active Directory Base de datos on premise

SQL Analysis Services Base de datos on premise

Nota. Elaboración propia

282
Tabla 12 : Descripción los conectores del diagrama de componentes de Power BI

Conector Responsabilidad

Indica que un componente se conecta con otro componente,


Connect
para el intercambio de información

Use Indica que un componente hace uso de los recursos del otro

Nota. Elaboración propia

 Diagrama de Despliegue

El presente diagrama muestra la relación de los nodos que requiere la arquitectura


de la herramienta y cómo es que interactúan (protocolos de comunicación), además
de indicar lo componentes que se encuentran en cada uno de estos nodos. En este
caso se puede resaltar el tipo de conexión que tiene los nodos (HTTP) y el tipo de
nodo (Base de Datos, Servidor, etc.).

Figura 152. Diagrama de Despliegue de Power BI


Nota. Elaboración propia

283
Tabla 13 : Descripción del diagrama de despliegue de Power BI

Componente Responsabilidad

Computadora Equipo que aloja navegadores compatibles.

Dispositivo móvil Equipo que aloja aplicación de la herramienta.

Servidor de
Aloja el servicio Azure Traffic Manager
Aplicaciones

Servidor Web Aloja el WFE Cluster

Base de Datos Blob Base de Datos donde se aloja metadata del servicio Power BI

Base de Datos SQL Base de Datos donde se aloja datos de los informes, dashboards

Azure de los usuarios en el servicio Power BI

Puente que permite canalizar de forma segura y rápida la


Servidor de Power BI
información desde los servicios en la nueve hacia el servicio de
Gateway Enterprise
Power BI.

Computadora Equipo que aloja Power BI Desktop, sus componentes requisito,

Workstation Microsoft Excel y sus componentes.

Servidor de Base de
Aloja las bases de Datos On premise
Datos On premise

Servidor de Base de
Aloja las bases de Datos cloud Non Azure
Datos Non Azure

Servidor de Base de
Aloja las bases de Datos cloud Azure
Datos Azure

Servidor de Base de
Aloja las bases de Datos cloud Office 365
Datos Office 365
Nota. Elaboración propia

284
5.4.2 Arquitectura de Tableau Server

 Diagrama de Arquitectura Lógica

La arquitectura se encuentra estructurada en base a la parte cliente, parte lógica


interna de la herramienta y las distintas fuentes de datos con los que se conecta, en
este caso Power BI los da a conocer como servicios. Con respecto a la parte
cliente, la herramienta cuenta con tres grupos importantes, browsers, móvil y
desktop. En el caso de los browsers, son compatibles Safari, Google Chrome,
Mozilla Firefox, Microsoft Edge e Internet Explorer y por otro lado, en cuento a la
parte móvil, la herramienta cuenta con su aplicación el cual es compatible en iOS y
Android, además de ser compatible con los browsers Safari y Google Chrome
respectivamente. Del mismo modo, cuenta con la versión desktop de la herramienta
también soportado en Windows e iOS.
A través de cualquiera de estos grupos el usuario accede al servidor de Tableau, se
establece conexión HTTP y la solicitud pasa primero el Gateway/ Load Balancer el
cual es el encargado de enviar todas las solicitudes a los componentes. El usuario al
acceder por cualquiera de los clientes mediante su usuario y contraseña, Tableau
Server utiliza encriptación de llave pública/privada. Una vez que tiene acceso al
servidor, este cuenta con cuatro procesos: Application Server (proceso
wgserver.exe) es el encargado de la navegación y los permisos en las interface web
y mobile de Tableau Server. Esto quiere decir que cuando un usuario abre una vista
en un dispositivo cliente, ese usuario empieza una sesión en Tableau Server y es ahí
cuando el Application Server se inicia y verifica los permisos para esee usuario y
esa vista. Cuando una vista es abierta, el cliente envía una solicitud al proceso de
VizQL (proceso vizqlserver.exe). Este es el encargado de enviar los querys
directamente a la fuente de datos, devolviendo el conjunto de resultados enviados
como imágenes y presentados al usuario. Cada proceso tiene su propio caché el cual
puede ser compartido con múltiples usuarios. Por otro lado, el Data Server permite
gestionar y almacenar de forma centrada las fuentes de datos y del mismo modo
contiene metadata en el caso de Tableau Desktop como cálculos, definiciones y
grupos. La fuente de datos publicada puede estar basado en un extracto del Tableau
Data Engine o una conexión en vivo a la base de datos relacional (en este caso
cubos no son soportados).
Coon respeto a las conexiones que se puede tener a las fuentes de datos, existen dos
tipos: Live connection e In memory. En el caso de que se optara por una conexión

285
live, los conectores de datos de Tableau envían sentencias SQL o MDX a las bases
de datos directamente. Mientras que, si se opta por una conexión In memory
permite extraer la data solicitada.
Finalmente, con el propósito de dar a conocer las restricciones, se agrupó las bases
de datos con las que puede conectarse Tableau Server según el tipo de conexión que
requieren, esto son: Bases de datos con conexión ODBC, Base de datos con
conexión Nativa, Base de Datos con conexión JDBC y Conexión a Web Service.

Figura 153. Arquitectura Lógica deNota. Elaboración


Tableau Serverpropia
Nota. Elaboración propia

Tabla 14 : Descripción de la arquitectura de Tableau

Información de
Modulo Responsabilidad
Implementación

Aplicación móvil de Tableau


Tableau Application Aplicación móvil
compatible con Android y iOS

Cliente desktop de Tableau


Tableau Desktop Desktop
compatible con Windows y iOS

Internet Explorer 8 Navegador mínimo que se Navegador

286
Información de
Modulo Responsabilidad
Implementación

debe tener para utilizar


Tableau Desktop

Encargado de enviar todas las


Gateway/ Load Balancer Gateway
solicitudes a los componentes

Proceso encargado de la
navegación y los permisos en
Application Server Proceso
las interface web y mobile de
Tableau Server

Proceso encargado de enviar


los querys directamente a la
fuente de datos, devolviendo
VizQL Server Proceso
el conjunto de resultados
enviados como imágenes y
presentados al usuario

Permite gestionar y almacenar


de forma centrada las fuentes
de datos y del mismo modo
Data Server Gestor de Data
contiene metadata en el caso
de Tableau Desktop como
cálculos, definiciones y grupos

Fast Data Engine Motor de Datos

Permite el envío de sentencias


SQL Connector sql directamente a las bases de Conector
datos

Permite el envío de sentencias


MDX Connector mdx directamente a las bases Conector
de datos

287
Información de
Modulo Responsabilidad
Implementación

Versión mínima de los sistemas


Windows 7/ Windows
operativos sobre los cuales se Sistema Operativo
Server 2008 SP2
instala el Tableau Server

Versión mínima de los sistemas


iOS 3.X operativos sobre los cuales se Sistema Operativo
instala el Tableau Server

Tipo de autenticación. Permite


la autenticación de los usuarios
Active Directory Servidor
a la herramienta y sus
respectivos permisos

Tipo de autenticación. Permite


la autenticación de los usuarios
Local Authentication Servicio
a la herramienta y sus
respectivos permisos

Tipo de autenticación. Permite


la autenticación de los usuarios
Trusted Authentication Configuración
a la herramienta y sus
respectivos permisos

Tipo de autenticación. Permite


la autenticación de los usuarios
a la herramienta y sus
Guest User respectivos permisos. Configuración
Esta opción sólo está
disponible con una licencia de
servidor core-based.

Grupo de base de datos que


Bases de Datos con
requiere de una conexión Bases de Datos
conexión ODBC
ODBC para lograr el enlace a

288
Información de
Modulo Responsabilidad
Implementación

Tableau Server.

Grupo de base de datos que no

Bases de Datos con requiere de un tipo de


Bases de Datos
conexión Nativa conector externo para lograr el
enlace a Tableau Server.

Grupo de base de datos que

Bases de Datos con requiere de una conexión JDBC


Bases de Datos
conexión JDBC para lograr el enlace a Tableau
Server.

Conexión aplicable a aquellos


servicios que no son
Conexión Web Service Web services
compatibles con los otros tipos
de conexión.
Nota. Elaboración propia

 Diagrama de Arquitectura Física

La arquitectura, al igual que la versión lógica, se encuentra dividida. Se puede


distinguir los dispositivos clientes tanto browsers, móvil como desktop, para todos
los caso la comunicación con los servidores de Tableau Server es por protocolo
HTTP. Asimismo, en la parte central se encuentran los distintos servidores que se
ha podido identificar. Con respeto a la estructura propia de Tableau server, primero
se cuenta con el Gateway/ Load Balancer que es el que se encarga de distribuir las
solicitudes a los componentes, luego se cuenta con los servidores: Application
Server, el cual se comunica con el VizQL Server que a su vez se comunica con el
Data Server. En el caso del Application Server, ya que es el encargado de la
autenticación del usuario es este servidor el que se comunica con el servidor de
Active Directory.
Finalmente, son los servidores VizQL y Data los que pueden conectarse a las
fuentes de datos (ya sea por live connection o in memory) y estos a su ves se han
separado de acuerdo a su tipo de conexión (ODBC, Nativa, JDBC y Web Service).

289
Figura 154. Arquitectura Física de Tableau Server
Nota. Elaboración propia

Tabla 15 : Descripción de la arquitectura física de Tableau

Información de
Componente Descripción
Implementación

Navegadores cliente por donde puede


Web Browser
ingresar el usuario

Android Dispositivo móvil con sistema


Móvil
Mobile operativo Android

Dispositivo móvil con sistema


iOS Mobile Móvil
operativo iOS

290
Información de
Componente Descripción
Implementación

Tableau Versión de la herramienta para


Computadora/ Laptop
Desktop computadora escritorio/ laptop

Gateway/ Encargado de enviar todas las


Servidor
Load Balancer solicitudes a los componentes

Active Servidor donde se aloja Active


Directory Directoy, Gestor de autorizaciones y Servidor

Server accesos.

Aloja el proceso encargado de la


Application navegación y los permisos en las
Servidor
Server interface web y mobile de Tableau
Server

Aloja el proceso encargado de enviar


los querys directamente a la fuente de
VizQL Server datos, devolviendo el conjunto de Servidor
resultados enviados como imágenes y
presentados al usuario

Permite gestionar y almacenar de


forma centrada las fuentes de datos y
Data Server del mismo modo contiene metadata Servidor
en el caso de Tableau Desktop como
cálculos, definiciones y grupos

Servidor donde se aloja cualquier base


Database
de datos que sea compatible con la Servidor de Base de Datos
Server ODBC
conexión ODBC

Servidor donde se aloja cualquier base


Database
de datos que sea compatible con la Servidor de Base de Datos
Server Nativa
conexión Nativa

291
Información de
Componente Descripción
Implementación

Servidor donde se aloja cualquier base


Database
de datos que sea compatible con la Servidor de Base de Datos
Server JDBC
conexión JDBC

Conexión aplicable a aquellos servicios


Database
que no son compatibles con los otros Servidor
Web Service
tipos de conexión.
Nota. Elaboración propia

 Diagrama de Componentes

Se cuenta con la representación de los principales componentes dentro de la


arquitectura y cómo es su relación entre ellas mediante el tipo de conexión.

Figura 155. Diagrama de Componentes de Tableau Server


Nota. Elaboración propia

Tabla 16 : Descripción del diagrama de componentes de Tableau

Componente Responsabilidad

Internet Explorer Componente requisito para utilizar Tableau Desktop

Browser Navegadores Cliente

292
Componente Responsabilidad

Tableau Mobile Aplicación móvil Cliente

Tableau desktop Versión para computadora/ laptop de la herramienta Cliente

Gateway/ Load
Encargado de enviar todas las solicitudes a los componentes
Balancer

Encargado de la navegación y los permisos en las interface web y


Application Server
mobile de Tableau Server

Encargado de enviar los querys directamente a la fuente de

VizQL Server datos, devolviendo el conjunto de resultados enviados como


imágenes y presentados al usuario

Permite gestionar y almacenar de forma centrada las fuentes de

Data Server datos y del mismo modo contiene metadata en el caso de


Tableau Desktop como cálculos, definiciones y grupos

Repositorio donde se aloja información propia del servidor de


Repository
Tableau (metadata)

Permite la autenticación de los usuarios a la herramienta y sus


Active Directory
respectivos permisos

Actian Vectorwise Base de Datos con conexión ODBC

Amazon Elastic
Base de Datos con conexión ODBC
MapReduce

Cisco Information
Base de Datos con conexión ODBC
Server

Cloudera Impala Base de Datos con conexión ODBC

Claudera Hadoop Base de Datos con conexión ODBC

Datamax Enterprise Base de Datos con conexión ODBC

293
Componente Responsabilidad

Kognitio Base de Datos con conexión ODBC

Exasol Base de Datos con conexión ODBC

Firebird Base de Datos con conexión ODBC

Hortonworks Base de Datos con conexión ODBC

HP Vertica Base de Datos con conexión ODBC

IBM DB2 Base de Datos con conexión ODBC

IBM Netezza Base de Datos con conexión ODBC

PostgreSQL Base de Datos con conexión ODBC

Pivotal Greenplum
Base de Datos con conexión ODBC
Database

MapR Distribution Base de Datos con conexión ODBC

OData Base de Datos con conexión ODBC

Splunk Base de Datos con conexión ODBC

Oracle Database Base de Datos con conexión ODBC

Oracle Hyperion Base de Datos con conexión ODBC

ParAccel Analytics
Base de Datos con conexión ODBC
Database

SAP Sybase ASE Base de Datos con conexión ODBC

SAP HANNA Base de Datos con conexión ODBC

SAP NetWeaver Base de Datos con conexión ODBC

SAP SyBase IQ Base de Datos con conexión ODBC

Google Analytics Base de Datos con conexión Nativa

294
Componente Responsabilidad

Salesforce Base de Datos con conexión Nativa

GoogleBigQuery Base de Datos con conexión Nativa

Google Cloud SQL Base de Datos con conexión Nativa

MySQL Base de Datos con conexión Nativa

SQL Server Analytics


Base de Datos con conexión Nativa
Service

Base de Datos SQL de


Base de Datos con conexión Nativa
Azure

Access Base de Datos con conexión Nativa

Excel Base de Datos con conexión Nativa

Power Pivot Base de Datos con conexión Nativa

CSV Base de Datos con conexión Nativa

TXT Base de Datos con conexión Nativa

Microsoft Azure SQL


Base de Datos con conexión Nativa
Data Warehouse

SQL Server Base de Datos con conexión Nativa

Amazon Elastic
Base de Datos con conexión JDBC
Mapreduce

Conexión Web
Conexión a Web Service
Service
Nota. Elaboración propia

295
Tabla 17 : Descripción los conectores del diagrama de componentes de Tableau

Conector Responsabilidad

Indica que un componente se conecta con otro componente,


Connect
para el intercambio de información

Llama al componente en base a una solicitud específica para ser


Call
respondido en base a los valores enviados.

Nota. Elaboración propia

 Diagrama de Despliegue

El presente diagrama muestra la relación de los nodos que requiere la arquitectura


de la herramienta y cómo es que interactúan (protocolos de comunicación), además
de indicar lo componentes que se encuentran en cada uno de estos nodos. En este
caso se puede resaltar el tipo de conexión que tiene los nodos (HTTP de cliente a
Tableau Server y ODBC, Nativa, JDBC y Web Service, de Tableau Server a las
bases de datos) y el tipo de nodo (Base de Datos, Servidor, etc.)

296
Figura 156. Diagrama de Despliegue de Tableau Server
Nota. Elaboración propia

Tabla 18 : Descripción del diagrama de despliegue de Tableau

Componente Responsabilidad
Equipo que aloja Tableau Desktop, Internet Explorer y
Computadora
navegadores compatibles.

Dispositivo que aloja aplicación móvil de la herramienta y


Dispositivo móvil
navegadores compatibles.

Servidor del Servicio


Aloja el Gateway/Load Balancer de Tableau
Bus

Servidor VizQL Aloja los procesos wgserver

Servidor de Base de Aloja la base de datos de Tableau

297
Componente Responsabilidad
Datos de Tableau

Servidor de Base de
Datos con conexión Aloja las bases de Datos con conexión ODBC

ODBC

Servidor de Base de
Datos con conexión Aloja las bases de Datos con conexión Nativa

Nativa

Servidor de Base de
Datos con conexión Aloja las bases de Datos con conexión JDBC

JDBC

Servidor de Base de
Datos con conexión a Aloja las bases de datos y servicios con conexión a web service

Web Service
Nota. Elaboración propia

5.4.1 Arquitectura de Qlik Sense Enterprise

 Diagrama de Arquitectura Lógica

La arquitectura se encuentra estructurada en base a la parte cliente, parte lógica


interna de la herramienta y las distintas fuentes de datos con los que se conecta.
Con respecto a la parte cliente, la herramienta cuenta con dos grupos importantes,
browsers y móvil. En el caso de los browsers, son compatibles Safari, Google
Chrome, Mozilla Firefox, Microsoft Edge e Internet Explorer y por otro lado, en
cuento a la parte móvil, la herramienta no cuenta con su aplicación pero sí son
compatibles los navegadores Safari y Google Chrome en iOS, Google Chrome en
Android e Internet Explorer en Windows Phone.
A través de cualquiera de estos grupos el usuario accede a Qlik Sense. El usuario
accede y primero pasa por el proxy , el cual es el servicio que maneja las
autenticaciones de la herramienta. Recibe la identidad y credenciales del usuario, el

298
módulo en el proxy solicita a un sistema externo para verificar la identidad y
credenciales recibidas, ya sea al Hub o al QMC (Qlik Management Console). Esta
tranferencia la puede realizar utilizando el Ticket API, Session API, cabeceras
HTTP o SAML. Posee integración con proveedores de autenticación como por
ejemplo Active Directory.
Cuando el usuario accede, el proxy se conecta con el Engine, el cual es el motor
indexado para data en memoria. Permite visualizaciones auto servicio, búsqueda y
cálculos en tiempo de ejecución. Este puede conectarse con el Qlik Sense Scheduler
el cual es el componente que coordina las actualizaciones de la data. Este
planificador admite recargas de aplicaciones basadas en el tiempo, dependencias,
etc. Este componente al igual que el Engine puede conectarse con el Qlik Sense
Repository el cual es el almacén centralizado de configuración y gestión de la
información de la plataforma. Este componente gestiona definiciones de usuario, la
seguridad y muchos otros elementos de la plataforma. Por otro lado el Qlik Sense
Applications se componen de datos, un modelo de datos, y la capa de presentación.
Estas aplicaciones se almacenan persistentemente en un sistema de archivos y se
cargan en la memoria por el Qlik Sense Engine conforme los usuarios lo soliciten.
Finalmente, Al igual que en la arquitectura de Tableau Server, con el propósito de
dar a conocer las restricciones, se agrupó las bases de datos con las que puede
conectarse Qlik Sense según el tipo de conexión que requieren, esto son: bases de
datos con conexión ODBC, conexión Salesforce, bases de datos con conexión
SAPSQL y Conexión REST y bases de datos con conexión Nativa.

299
Figura 157. Arquitectura Lógica de Qlik Sense Enterprise
Nota. Elaboración propia

Tabla 19 : Descripción de la arquitectura de Qlik Sense

Información de
Modulo Responsabilidad Implementación

Navegadores Cliente

Sistema operativo compatible


iOS Sistema operativo
en dispositivos móviles

Sistema operativo compatible


Android Sistema operativo
en dispositivos móviles

Sistema operativo compatible


Windows Phone Sistema operativo
en dispositivos móviles

Servicio que maneja las


Qlik Sense Proxy autenticaciones de la Servicio
herramienta

Motor indexado para data en


Qlik Sense Engine memoria. Permite Motor de data
visualizaciones auto servicio,

300
Información de
Modulo Responsabilidad Implementación
búsqueda y cálculos en tiempo
de ejecución

Componente que coordina las


Qlik Sense Scheduler Servicio
actualizaciones de la data

Almacén centralizado de
Qlik Sense Repository configuración y gestión de la Repositorio
información de la plataforma

Se componen de datos, un
Qlik Sense Applications modelo de datos, y la capa de Archivos
presentación

Sistema operativo mínimo


Windows Server 2008 R2
necesario para utilizar Qlik Sistema operativo
SP1
Sense

Tipo de autenticación. Permite


la autenticación de los usuarios
Microsoft Active Directoy Servidor
a la herramienta y sus
respectivos permisos

Tipo de autenticación. Permite

Lightweight Directory la autenticación de los usuarios


Protocolo
Access Protocol a la herramienta y sus
respectivos permisos

Tipo de autenticación. Permite

Open Data Base la autenticación de los usuarios


Tipo de conexión
Conectivity a la herramienta y sus
respectivos permisos

Grupo de base de datos que


Bases de Datos con
requiere de una conexión Bases de datos
conexión ODBC
ODBC para lograr el enlace a

301
Información de
Modulo Responsabilidad Implementación
Qlik Sense

Permite la conexión a
Conexión Salesforce
Salesforce

Permite la conexión a las


Conexión SAPSQL
fuentes de datos SAP

Grupo de base de datos que


requiere de una conexión REST
Conexión REST
para lograr el enlace a Qlik
Sense

Grupo de base de datos que no


requiere de un tipo de
Conexión Nativa
conector externo para lograr el
enlace a Qlik Sense.
Nota. Elaboración propia

 Diagrama de Arquitectura Física

La arquitectura, al igual que la versión lógica, se encuentra dividida. Se puede


distinguir los dispositivos clientes tanto browsers como móvil, para ambos casos la
comunicación con los servidores de Qlik Sense por protocolo HTTP,Ticket API,
Session API o SAML. Asimismo, en la parte central se encuentran los distintos
servidores que se ha podido identificar. Con respeto a la estructura propia de Qlik
Sense, este cuenta con un servidor para el Proxy, el cual se conecta con el servidor
de Active Directory, luego pasa por el servidor Engine, el cual se comunica con los
servidores Scheduler, Repository y Applications. Finalmente es el Scheduler el
qeue se comunica con las bases de datos distinguidos por el tipo de conexión que
tiene compatible (ODBC, Salesforce, SAPSQL, Nativa y REST)

302
Figura 158. Arquitectura Física de Qlik Sense Enterprise
Nota. Elaboración propia

Tabla 20 : Descripción de la arquitectura física de Qlik Sense

Información de
Componente Responsabilidad Implementación

WEB Browser Navegadores en web

Mobile
Navegadores en dispositivos móviles
Browser

Aloja al servicio que maneja las


Proxy Server Servidor
autenticaciones de la herramienta

Aloja al motor indexado para data en


Engine Server Servidor
memoria.

303
Información de
Componente Responsabilidad Implementación

Scheduler Aloja al componente que coordina las


Servidor
Server actualizaciones de la data

Almacén centralizado de configuración


Repository
y gestión de la información de la Servidor
Server
plataforma

Applications Se componen de datos, un modelo de


Servidor de Aplicaciones
Server datos, y la capa de presentación

Servidor donde se aloja cualquier base


Database
de datos que sea compatible con la Servidor de Base de Datos
Server ODBC
conexión ODBC

Database
Server Servidor donde se aloja Salesforce Servidor de Base de Datos

Salesforce

Servidor donde se aloja cualquier base


Database
de datos o servicio que sea compatible Servidor de Base de Datos
Server REST
con la conexión REST

Database Servidor donde se aloja base de datos


Server de SAP que sea compatible con la Servidor de Base de Datos

SAPSQL conexión SAPSQL

Servidor donde se aloja cualquier base


Database
de datos que sea compatible con la Servidor de Base de Datos
Server Nativa
conexión nativa
Nota. Elaboración propia

304
 Diagrama de Componentes

Se cuenta con la representación de los principales componentes dentro de la


arquitectura y cómo es su relación entre ellas mediante el tipo de conexión.

Figura 159. Diagrama de Componentes de Qlik Sense Enterprise


Nota. Elaboración propia

Tabla 21 : Descripción del diagrama de componentes de Qlik Sense

Componente Responsabilidad

Browser Navegadores Cliente

Proxy Servicio que maneja las autenticaciones de la herramienta

Motor indexado para data en memoria. Permite visualizaciones


Engine
auto servicio, búsqueda y cálculos en tiempo de ejecución

Scheduler Componente que coordina las actualizaciones de la data

Almacén centralizado de configuración y gestión de la


Repository
información de la plataforma

Se componen de datos, un modelo de datos, y la capa de


Application
presentación

Microsoft Active Tipo de autenticación. Permite la autenticación de los usuarios a

305
Componente Responsabilidad
Directory la herramienta y sus respectivos permisos

Lightweight Diretory Tipo de autenticación. Permite la autenticación de los usuarios a

Access Protocol la herramienta y sus respectivos permisos

Open DataBase Tipo de autenticación. Permite la autenticación de los usuarios a

Connectivity la herramienta y sus respectivos permisos

Apache Hive Base de Datos con conexión ODBC

Teradata Aster Base de Datos con conexión ODBC

Microsoft Access Base de Datos con conexión ODBC

Microsoft SQL Server Base de Datos con conexión ODBC

Cloudera Impala Base de Datos con conexión ODBC

Teradata Base de Datos con conexión ODBC

MySQL Enterprise
Base de Datos con conexión ODBC
Edition

Oracle 11g Base de Datos con conexión ODBC

SAP Sybase ASE Base de Datos con conexión ODBC

PostgreSQL Base de Datos con conexión ODBC

IBM DB2 Base de Datos con conexión ODBC

Oracle JD Edwards Base de Datos con conexión ODBC

Salesforce Fuente de datos Salesforce

SAP Fuente de datos SAP

Facebook Fuente de datos con conexión REST

Linkedin Fuente de datos con conexión REST

306
Componente Responsabilidad

Twitter Fuente de datos con conexión REST

Access Fuente de datos con conexión Nativa

Excel Fuente de datos con conexión Nativa

CSV Fuente de datos con conexión Nativa

TXT Fuente de datos con conexión Nativa

Nota. Elaboración propia

Tabla 22 : Descripción los conectores del diagrama de componentes de Qlik Sense

Conector Responsabilidad
Indica que un componente se conecta con otro componente,
Connect
para el intercambio de información

Use Indica que un componente hace uso de los recursos del otro

Nota. Elaboración propia

 Diagrama de Despliegue

El presente diagrama muestra la relación de los nodos que requiere la arquitectura


de la herramienta y cómo es que interactúan (protocolos de comunicación), además
de indicar lo componentes que se encuentran en cada uno de estos nodos. En este
caso se puede resaltar el tipo de conexión que tiene los nodos (HTTP) y el tipo de
nodo (Base de Datos, Servidor, etc.)

307
Figura 160. Diagrama de Despliegue Qlik Sense Enterprise
Nota. Elaboración propia

Tabla 23 : Descripción del diagrama de despliegue de Qlik Sense

Componente Responsabilidad

Computadora Equipo que aloja navegadores compatibles.

Dispositivo móvil Dispositivo que aloja navegadores compatibles.

Servidor de Proxy Aloja el servicio de proxy

Servidor de Engine Aloja el motor indexado para data en memoria

Servidor de Base de
Aloja el repositorio
Datos

Servidor de Scheduler Aloja el servicio scheduler

Servidor de Archicos Aloja los archivos de aplicación

Servidor de Base de
Datos con conexión Aloja las bases de Datos con conexión ODBC

ODBC

308
Componente Responsabilidad

Servidor de Base de
Datos con conexión Aloja las bases de Datos con conexión SAPSQL

SAPSQL

Servidor de Base de
Datos con conexión Aloja las bases de Datos con conexión REST

REST

Servidor de Base de
Datos con conexión Aloja las bases de Datos con conexión Nativa

Nativa

Servidor de Base de
Datos con conexión Aloja las bases de Datos con conexión Salesforce 13.0

Salesforce
Nota. Elaboración propia

309
5.5 Pruebas de Concepto
Para la elaboración de las pruebas de concepto, se hizo uso de lo siguiente:

 Power BI Desktop (el cual fue elegido en base al Benchmarking elaborado)

 SQL Server 2014

 Base de Datos Contoso

 Cuenta de Office 365

5.5.1 Proceso de elaboración


Para la elaboración de las pruebas de concepto se elaboraron seis dashboards, cada
uno con un enfoque distinto en base a la información proporcionada por Contoso,
En cada uno de estos dashboards se plasmaron un aproximado de tres a cinco
técnicas de Data Visualization.

A continuación, se muestran los resultados.

 Dashboard 01 – Ventas

Figura 161. Dashboard – Ventas


Nota. Elaboración propia

310
 Dashboard 02 – Ventas Canales

Figura 162. Dashboard – Ventas Canales


Nota. Elaboración propia

 Dashboard 03 – Productos

Figura 163. Dashboard - Productos


Nota. Elaboración propia

311
 Dashboard 04 – Marketing

Figura 164. Dashboard - Marketing


Nota. Elaboración propia

 Dashboard 05 – Logística

Figura 165. Dashboard - Logística


Nota. Elaboración propia

312
 Dashboard 06 – Regiones

Figura 166. Dashboard - Regiones


Nota. Elaboración propia

Tabla 24 : Indicadores de Dashboards planteados en las pruebas de concepto

Dashboard Indicador Técnica

Ventas Planificadas por Ciudad Mapa de burbujas (Bubble Map)

Ventas Estimadas vs Ventas Actuales


Gráfico Bullet (Bullet chart)
por Canal
Ventas Promedio de Margen de Ganancia
Planificado vs Promedio de Ventas Gráficos de líneas (Line Graph)
Planificadas por Año
Cantidad de Ventas Planificadas vs
Histograma (Histogram)
Monto de Ventas Planificadas
Monto de Ventas Planificado vs
Monto de Ventas por Margen de Gráfico de Dispersión (Scatterplot)
Ganancia Planificado y Canales

Canales Gráficos de áreas apiladas (Stacked


Ventas por Canal por Año
Area Graphs)

Monto de Ventas por Canal Gráfico de anillos (Donut Chart)

313
Monto de Ventas por Categoria de Diagrama Sankey (Sankey
Producto y Canal Diagram)

Monto de Ventas Planificadas por


Gráfico Radar (Radar Chart)
Categoría de Producto

Monto de Ventas por Categoría de


Gráfico de Barras (Bar Chart)
Producto

Cantidad de Ventas por Categoría de


Productos Gráfico Pie (Pie Chart)
Producto

Monto de Ventas por Categoría de


Gráfico de Barras (Bar Chart)
Producto y Producto

Monto de Ventas por Categoría y Gráfico de Barras Radial (Spiral


Subcategoría de Producto Plot)

Consumo de Hombres y Mujeres por Pirámide de población (Population


edad Pyramid)

Gráfico de Matriz de puntos (Dot


Porcentaje de Clientes por Promoción
Matrix Chart)
Marketing
Monto de Ventas por Canal y Tipo de Diagrama de acorde (Chord
Promoción Diagram)
Gráfico Nightingale Rose
Promedio de Ingreso Anual por
(Coxcomb Chart/ Polar Area
Promoción
Diagram)
Gráfico de Barras Multi Set (Multi-
Margen de Ganancia Planificada por
set Bar Chart/ Grouped/ Clustered
Categoría de Producto y Año
Bar Charts)
Costo Total por Categoría de Producto
Gráfico de Barras (Bar Chart)
y Producto
Logística
Monto de Ventas vs Costo Total por
Gráfico de Dispersión (Scatterplot)
Categoría de Producto

Cantidad de Productos por Categoría


Mapa de árbol (TreeMap)
de Producto

Margen de Ganancia Planificado por


Mapa Chloropeth (Chloropeth Map)
Estado
Span Chart (Range Bar/ Column
Ventas por Cantidad de Ventas por Continente y Graph/ Floating Bar Graph/
Regiones Categoría de Producto Difference Graph, High-Low
Graph)
Monto de Venta Planificado vs Monto
Gráfico Marimekko (Marimekko
de Ganancia Planificado por
Chart/ Mosaic Plot)
Continente y Categoría de Producto

314
Monto de Ventas vs Monto de Ventas Gráfico de barras apiladas (Stacked
Planificado por Canal Bar Graph)

Nota. Elaboración propia

315
CAPÍTULO 6 Resultado del Proyecto

En este capítulo se presentan los Lineamientos de uso y diseño de las técnicas de Data
Visualization acompañados de un proceso propuesto para su óptima aplicación.

316
6.1 Lineamientos de Uso y diseño
Los lineamientos están basados en cuarenta (40) técnicas de Data Visualization.
Para la elección de dichas técnicas se tomó como referencia la página web Data
Visualization Catalogue, elaborado por Severino Ribecca35, el cual se encuentra
especializado en el tema.

6.1.1 Estructura de trabajo


Para el desarrollo de los lineamientos, primero se elaboró la investigación de las
técnicas de Data Visualization, el cual se encuentra detallada en el capítulo 5,
Desarrollo del Proyecto. En dicha investigación, se tomó en cuenta los siguientes
criterios por cada técnica a considerar:
 Definición: Descripción de la técnica y en qué consiste

 Cuando utilizar la técnica

 Cuando no utilizar la técnica

 Ejemplo de Aplicación

 Herramientas en las que se puede elaborar

 Ejemplos de uso

A partir de la investigación se tomó en consideración tres criterios importantes para


la elaboración los lineamientos: tipo de variable, Cuando utilizarlo y Cuando no
utilizarlo.

6.1.2 Enfoques y Lineamientos de Uso y Diseño


Como parte del objetivo de presentar lineamientos que ayuden a identificar el tipo
de técnica que el usuario necesite (de acuerdo a lo que se desea representar y que,
efectivamente se pueda presentar la información deseada de forma interactiva, clara
y precisa) se requirió, antes de identificar los lineamientos de uso y de diseño,
realizar una distinción del enfoque que en primera instancia se desea percibir de la
gráfica a mostrar, con el propósito de hacer más sencilla la tarea de llegar a la
técnica que el usuario necesita. Tomando en cuenta esto, se delimitaron siete (7)

35
Véase: http://www.severinoribecca.one/

317
enfoques principales que permiten englobar el propósito de cada una de las
técnicas.
Estos enfoques son utilizados por herramientas de visualización de datos como Qlik
eazyBI y de otro enfoque como Hubspot. Nacen del conocido gráfico elaborado por
Andrew Abela, PhD, “Choosing a Good Chart” (2006), el cual a su vez fue
inspirado del libro Saying It With Charts de Gene Zelazny. No obstante, dicho
gráfico sólo agrupa cuatro grupos de presentación: Comparación, Composición,
Distribución y Relación. Bajo ese esquema, el gráfico se encuentra distribuido y por
cada uno de ellos existen subgrupos como la cantidad de variables, en el tiempo,
cambiante o estático, identificando en su totalidad, veintiún (21) técnicas. En esta
ocasión, debido a que la cantidad de técnicas investigadas es cuarenta, se tomaron
en cuenta dichas agrupaciones, agregando tres más bajo la necesidad de hacer notar
el enfoque principal de cada técnica.
A continuación se presentan los lineamientos de uso y diseño clasificados en
enfoques y tomando en cuenta el tipo de variable que utilizan.

318
6.1.2.1 Comparación
Este enfoque permite comparar las magnitudes de los valores entre sí y puede ser utilizado para hallar de manera sencilla los valores
máximos y mínimos de la data. De la misma forma permite comparar valores actuales versus valores anteriores o planificados36.

Tabla 25 : Lineamientos de uso y diseño por enfoque de Comparación

Técnicas de Lineamientos
Tipo de
Data
Variable Lineamientos de Uso Lineamientos de Diseño
Visualization

-Cuando existen muchas categorías visualmente se vuelve cargado y


-Se utiliza para mostrar comparaciones numéricas entre diferentes
difícil de identificar las variables (más de siete categorías). [37]
categorías. Esto en caso es conveniente que sean pocas categorías,
Considerar que en cuanto más barras se agreguen al gráfico menor será
pueden ser de cinco pero no más de siete, esto es para mantener una
el espacio para la descripción de las barras, volviendo difícil de leer los
mayor claridad del gráfico. [70]
nombres de las categorías. [61]

Escala
Gráfico de -Se debe considerar el valor cero en el eje (Y) numérico como valor -Se recomienda hacer uso de un color para mostrar las barras. En caso se
nominal con
Barras (Bar inicial, para que al usarlo la gráfica se entienda. [7] quiera asignar distintos colores puede apoyarse de una leyenda. [62]
valores
Chart)
discretos -Tomar en cuenta la forma en la que desee mostrar las barras, pues su
alteración (adornos) impacta en que tan bien pueda comunicarse o verse
la data en la gráfica. [137]

-Evitar hacer uso de barras 3D. Este gráfico será más efectivo en la
-Permite conocer cuántos datos existen por distintas categorías. [70]
medida que sea conciso y simple para su rápido entendimiento. [61]

Gráfico de Escala de -Permite visualizar rápidamente las variables. [72] Su diseño puede ser de dos formas, partiendo del eje Y o del eje X.

36
Cfr. Lundblad, 2016
Barras Radial intervalos Ambos casos son confusos de interpretar por lo cual no se recomienda
(Spiral Plot) con valores -Evitar su uso cuando se desconoce la forma de interpretar dicha utilizarlo. [125]
discretos técnica. Por lo general tiende a ser malinterpretado debido a que la
última barra hacia afuera sobresale pese a que pueda tener el mismo
valor que los demás. [25] Utilizarlo implica una mala práctica [125].
Este gráfico dificulta identificar aspectos de periodicidad y serie de
manera efectiva.[138]

-Es ideal cuando se quiere detectar cambios o diferencias en los


patrones de población. [73] Un factor importante es la utilización de
rangos de edades como uno de las principales variables que permite
especificar mejor modelos estadísticos, fenómenos demográficos,
Pirámide de Escala de etc. [97]
población intervalos y La forma de una pirámide de población se puede utilizar para interpretar
(Population valores -En caso se quiera comparar patrones a través de las naciones o el comportamiento o detalle de una población. [73]
Pyramid) continuos. grupos de población se pueden utilizar una variación de este gráfico,
pirámides de población múltiples. [73]

-Es útil cuando se quiere analizar data relacionada a los campos de la


ecología, sociología y economía. [73]
-Puede ser analizada en muchos niveles a través de la asignación de
-Puede ser efectivamente utilizado para mostrar reportes de valores colores y sus diferentes tonalidades. [85] Sin embargo, considerar que en
de áreas en cualquier escala virtual, a nivel global como local. [74] caso se tenga otra variable, se recomienda agregar una capa variante sin
alterar el color original (puntos, rayas, etc.).

-Permite resaltar diferencias en una distribución geográfica de la data


Mapa Escala de por unidad de espacio. El tipo de data a utilizarse puede ser del tipo
-Agrega una leyenda. Distribuye los rangos entre 3 a 5 valores y utilizar
Choropleth intervalos y socio económico, como población, ingresos, índice de crímenes,
signos de +/- para extender rango más altos o más bajos. [64]
(Choropleth valores resultados de elecciones y datos que impliquen actividad humana en
Map) discretos espacios geográficos [141].

-Se puede utilizar para detectar relaciones entre la variable y la


locación geográfica. [75]
- Este tipo de técnica es inadecuada para mostrar magnitud de algún
fenómeno, por el contrario debería usarse para mostrar intensidad
[141]

320
-No utilizarlo si lo que se ingresa es data cruda como por ejemplo
cantidad de población. (Primero se debe normalizar las cantidades
con el espacio de la región, de este modo, por ejemplo, se podría
calcular la densidad de población de cada región). [74]

Es útil usarlo cuando lo que se quiere realizar es una comparación de


proporciones sobre regiones geográficas sin los problemas causados
Escala de Dependiendo los datos que se manejen las burbujas pueden llegar a ser
Mapa de por el tamaño del área regional, caso contrario a los mapas
intervalos y muy grandes, se pueden superponer a otras y también a regiones en el
burbujas Choropleths. [77] Es una gráfica especializada que permite mostrar
valores mapa, por lo que este necesita ser contabilizado, de lo contrario podría
(Bubble Map) data en tres dimensiones, donde las dos primeras representan la
discretos crear confusión. [86]
locación geográfica de un evento y la tercera dimensión puede ser
otra variable cuantitativa [25]

-Puede ser utilizado en caso se quiera visualizar el tamaño de cada


segmento y representar el valor más alto, para esto se haría uso de
Gráfico cada anillo desde el centro de la cuadrícula, que sería como una
Escala de escala. [26]
Nightingale En caso se tenga diferentes categorías/ grupos por cada segmento, se
intervalos y
Rose (Coxcomb -No se recomienda utilizarlo cuando no se tiene una idea clara de puede hacer uso de distintos colores para diferenciarlos, además de
valores
Chart/ Polar cómo interpretar este gráfico, pues se tiende a darle mucha agregar una leyenda para una clara interpretación. [80]
discretos
Area Diagram) importancia a los segmentos externos debido a sus grandes tamaños
y esto a su vez produce aumentos desproporcionados de su valor.
[78]
Gráfico de
Si bien es cierto existen varios ejemplos que muestran una cantidad
Columnas -Es útil cuando se desea comparar los valores de un determinado
Escala de considerable de columnas, se recomienda que solo muestre una reducida
Radial (Radial grupo de variables. [79]
intervalos y cantidad, ya que se vuelve difícil identificar a que hacen referencia cada
Column Chart/
valores columna (descripción). En caso de no reducir el número de columnas,
Circular -Es útil en caso se desee tener otra vista del valor de cada
discretos quite la descripción de cada columna, agrúpelas haciendo uso de colores
Column Graph/ variable.[79]
para identificarlos y asigne una descripción por cada agrupación. (*)
Star Graph)
Gráfico Radar Escala de -Se utiliza cuando se desea comparar cantidades múltiples de Evitar mostrar muchos polígonos. Esto puede hacer que su
(Radar Chart/ intervalos y variables. [80] interpretación sea dificultosa, logrando que sea confusa y complicada.

321
Spider Chart/ valores -Es útil cuando se quiere conocer qué variables tienen valores [87]
Web Chart/ discretos similares o si es que existen valores atípicos en cada variable. [26]
Polar Chart/ Star Las variables que puedan ser analizadas deben encontrarse en iguales
Plots) términos de comparación, es decir normalizados de acuerdo al tipo
de escala a utilizarse. [142]

-Evitar comparar valores a través de cada variable. Esto se debe a


que es más entendible y fácil de comparar todas las variables en una
sola pasada por todos los ejes con sus respectivas variables.[26]

-Es útil en caso de querer realizar comparaciones de rangos de datos


Span Chart distinguidos por categorías.[8]
(Range Bar/
Column Graph/ Escala -Es útil en caso de querer evaluar los valores mínimos y
Floating Bar nominal y máximos.[81] Utilizar colores en caso se muestren una mayor cantidad de elementos,
Graph/ valores -Se puede utilizar dicha técnica cuando no es crítico conocer los considerando su descripción para una mayor claridad de las técnica. (**)
Difference discretos. valores intermedios de los rangos expuestos.[82]
Graph, High-
Low Graph) -No se recomienda usarlo cuando se quiere conocer la distribución
de la data (Sólo por categoría)[82]

Gráfico de -Es útil cuando se desea comparar dos a más data sets por
Barras Multi Set Escala categorías/variables. [83]
(Multi-set Bar nominal y Se puede asignar diferentes colores por cada subgrupo (data set), los
Chart/ Grouped/ valores cuales permite identificarlos en cada categoría. [83]
Clustered Bar discretos -Es útil cuando se quiere realizar comparaciones entre mini
Charts) histogramas.[83]

(*) Lineamiento Sugerido. Fuente: https://www.behance.net/gallery/23426603/Unemployment-vs-


birth-rates
(**) Lineamiento Sugerido. Fuente: https://www.behance.net/gallery/19862445/The-Weight-of-the-
World

322
6.1.2.2 Composición
Este tipo de enfoque permite visualizar un conjunto de datos y cómo es que se pueden dividir por partes. Tiende a mostrar data a nivel de
porcentajes o cantidades totales.

Tabla 26 : Lineamientos de uso y diseño por enfoque de Composición

Técnicas de Lineamientos
Tipo de
Data
Variable
Visualization Lineamientos de Uso Lineamientos de Diseño
Escala
Gráfico de
nominal y -En caso lo que se quiera distinguir es la diferencia entre las proporciones -Toma en cuenta el largo del arco , pues su alteración afecta la
anillos (Donut
valores de las variables/ categorías.[96] perspectiva del usuario incurriendo en una mala interpretación.[146]
Chart)
discretos
-Es utilizado para visualizar data en categorías, haciendo uso de un par de
Gráfico variables.[25]
Si los segmentos (Categorías) no se encuentran alineados
Marimekko Intervalos y -Si lo que se desea es obtener una vista panorámica de la data.[97] continuamente como si se tratase de un gráfico de barras, se
(Marimekko valores
Chart/ Mosaic continuos -En caso se desconozca cómo interpretar este tipo de gráfico, se recomienda no utilizarlo, pues se dificulta realizar las comparaciones
Plot) recomienda no utilizarlo, debido a que no son tan fáciles de interpretar entre estos.[25]
sobre todo si es que son muchos segmentos.[97]

-Es útil cuando lo que se quiere analizar son proporciones y porcentajes -Cuando existen muchos valores, se vuelve más dificultoso
de determinadas categorías a considerar dentro del gráfico, divididos por entenderlo.[99] Se recomienda mantener menos de seis partes
segmentos en un círculo.[98] divididas [67]

Gráfico Pie -Se recomienda utilizarlo cuando se quiere comparar un segmento o - Se recomienda mantener un orden al mostrar las partes, desde el
Cuantitativa
(Pie Chart) categoría frente al total, para identificar la relación que guarda.[8] más grande hasta el más pequeño [67]

-Evita cambiar el radio de las partes divididas del pie, ya sea por la
proporción de la data o como impacto visual, esto puede influenciar
en la percepción del usuario [146]

323
-No se recomienda su uso, cuando se pretende comparar diferentes
conjuntos de datos en distintos gráficos de pie.[99]

-Es útil cuando se desea realizar un análisis comparativo de una parte


frente a un todo.[147]

Gráfico de Escala de -En caso de los gráficos de barras apiladas simples, se utiliza cuando se -No se recomiendo su uso en caso hay una gran cantidad de
barras apiladas intervalos y desea mostrar el total de las cantidades considerando las barras.[101] segmentos a mostrar en la barra. Esto dificulta realizar
(Stacked Bar valores comparaciones cuando posee distintas cantidades de segmentos y/o
Graph) continuos cuando no tiene la misma base de categorías.[100]
-En caso de los gráficos de barras apiladas al 100%, se utiliza cuando lo
que se desea es visualizar las diferencias relativas cuantitativamente de
cada segmento.[101]

-Es útil cuando se desea comparar valores para dar una rápida vista de los
Gráfico de tamaños relativos de la data, sin el uso de escalas.[102]
Área -No hacer uso de la longitud de la figura a utilizar, lo que se debería
Proporcional Cuantitativa realizar es calcular el espacio para determinar el tamaño, de lo
-Es útil cuando su uso es netamente para comunicar la información, no
(Proportional contrario se mostraría incrementos y bajas exponencialmente.[103]
para análisis.[103]
Area Chart)
-Es útil cuando lo que se desea es estimar valores.[103]

324
6.1.2.3 Distribución
Este tipo de enfoque engloba a todas aquellas técnicas que permiten ver cómo los valores cuantitativos están distribuidos a lo largo de los
ejes o agrupaciones del menor a mayor valor. Permite distinguir a través de la forma, características como el rango de valores, tendencia
central, forma, valores dispersos, etc.37.

Tabla 27 : Lineamientos de uso y diseño por enfoque de Distribución

Técnicas de Lineamientos
Tipo de
Data
Variable
Visualization Lineamientos de Uso Lineamientos de Diseño
-Mantener una cierta cantidad de líneas (5-7)(Ley de Miller), si el
gráfico se recarga o tiene muchas líneas, es más dificultoso para el
Cuantitativa - -Se utiliza con mayor frecuencia para mostrar tendencias y relaciones
usuario captar la información.[21] En caso de tener más líneas se
Gráficos de Escala de (cuando se agrupan con otras líneas).[104]
recomienda distinguir la línea con mayor relevancia y asignar otro
líneas (Line intervalos y
color neutro a los demás [68]
Graph) valores
-Los gráficos de líneas ayudan a dar una "visión global " sobre un
continuos -Utilizar distintos colores para diferenciar las líneas y agregar una
intervalo, para ver cómo se ha desarrollado a lo largo de un período
leyenda para ello .[68]
determinado.[105]
Sets paralelos Su diseño visual discreto permite manejar la frecuencia de categorías y
Cualitativo -Se utiliza cuando se quiere mostrar data categórica.[50]
(Parallel Sets) la relación entre estas[50]

Diagrama de
-Es utl cuando se pretende mostrar la data distribuida de forma Es útil cuando se comparan las distribuciones entre muchos grupos o
caja (Box and Cuantitativa
resumida.[51] conjuntos de datos (ocupa poco espacio).[114]
Whisker Plot)

Gráfico de -Es útil cuando se quiere tener una vista general de la distribución de la Cuando se tiene dos conjuntos de datos, se puede graficar a través de
Cuantitativo
Tallo y Hoja data.[114] una variación de la técnica (doble tallo) para poder comparar los

37
Cfr. Lundblad, 2016

325
(Stem and valores de los dos conjuntos de datos.[114]
Leaf plot/ -Es útil si se quiere saber si es que se tiene valores atípicos.[114]
Stemplot/
Setm & Leaf
Display) -Si es que se cuenta con mucha data en el conjunto, se vuelve
complicado de analizar, por el contrario, si es que se cuenta con muy
poca data, no tiene sentido utilizar la técnica .[114]

326
6.1.2.4 Relación
Este tipo de enfoque permite visualizar las relaciones, dispersión o agrupaciones que pueda presentar la data.

Tabla 28 : Lineamientos de uso y diseño por enfoque de Relación


Lineamientos
Técnicas de Data Tipo de
Visualization Variable Lineamientos de Uso Lineamientos de Diseño

Cuantitativa -Es útil si se quiere conocer dónde los valores se concentran.[115]


- Escala de -En el caso de representar distribuciones de frecuencia utiliza
Histograma (Histogram) intervalos y -Son útiles para dar una vista aproximada de la distribución de entre 5 a 20 segmentos de intervalo, más serían apropiados para
valores probabilidad.[148] otros tipos de casos.[116]
continuos -Es útil cuando la data a analizar es nominal u ordinal.[116]
-Su estructura puede representarse de arriba hacia abajo como de
-Es útil en caso se quiera mostrar data jerárquica.[149]
izquierda a derecha.[135]
Diagrama de Árbol (Tree
Diagram/Organizational Cualitativa -Es importante saber distinguir las categorías dentro de un -Tomar en cuenta la correcta posición de las categorías a mostrar
Chart Linkage Tree) diagrama de árbol, pues esto impacta en que tan efectivo sea la dentro de la estructura jerárquica, distinguiendo correctamente en
técnica para poder representar una jerarquía de los datos. [149] qué nivel dentro de la jerarquía se encuentra cada categoría. [149]

-Si lo que se quiere conocer es la cantidad de relaciones que existen


Mapa de Conexiones Cualitativa - con respecto a la data que se desea visualizar.[117] Hacer uso de distintos elementos externos como filtros, para
(Connection Mapp/ Link Escala lograr que el mapa sea más dinámico y pueda visualizarse de
Map/ Ray Map) Nominal -Es útil si es que se desea identificar si existen patrones de manera clara las diferentes conexiones (*)
esparcimiento por la región analizada.[117]
-Cuando se cuenta con mucho volumen de datos puede que la
-Puede ser utilizado cuando lo que se desea mostrar es la
visualización resulte desordenada y dificultosa para leer si no se
Diagrama de Arco (Arc concurrencia de datos.[118]
Cualitativa llega a mantener un orden.[31]
Diagram)
-En caso se quiera conocer las relaciones existentes de la data a -No utilizar esta técnica cuando lo que se quiera es una vista
analizar.[118] general de una estructura de red.[31]

327
-Si lo que se quiere conocer es una vista general que permita la
interpretación, mas no el detalle de éste.[118]
-Es útil si lo que se quiere es identificar las relaciones entre grupos
o entidades.[119] La asignación de colores es importante para diferenciar las
Diagrama de acorde categorías, no obstante se recomienda que sólo se muestren una
Cualitativa -Es utilizado en el campo de ciencias biológicas.[120]
(Chord Diagram) cantidad reducida de categorías, de tal modo que las relaciones no
-Esta técnica no suele ser claro cuando lo que se quiere es analizar se vean cargadas, causando poca claridad en la gráfica. (**)
gran cantidad de data.[120]
Diagrama de acorde sin Al igual que el diagrama de acorde es importante asignar colores
Es útil cuando se desea mostrar las relaciones que existe en un
cinta (Non-ribbon Chord Cualitativa por categorías, si son varios nodos, agruparlos y asignar un color
conjunto de datos. [121]
Diagram) y descripción(***)
-Es útil cuando se desea mostrar la transferencia/desplazamiento de
Escala de
un objeto en particular (Ej: Energía, dinero, materiales, etc).[53] -En caso se tenga categorías, se puede hacer uso de esta técnica
Diagrama Sankey nominal con
-Es útil cuando lo que se quiere mostrar es el mapeo de diferentes tomando en cuenta la asignación de colores para lograr la
(Sankey Diagram) valores
distinción de las categorías.[122]
discretos. dominios o el mapeo de distintos caminos involucrados en un
proceso [53]
Lluvia de ideas/ Mapa
-A menudo es útil en la fase inicial de un proyecto y el trabajo -No es útil en caso se tenga valores numéricos, pues esta técnica
mentales (Brainstorm/ Cualitativa
como una forma de toma de notas.[27] se enfoca en mostrar premisas, valores del tipo cualitativo.[27]
Mind-Maps)
-Considerar el espacio a utilizar para la la visualización de la
-Se utiliza cuando se desea realizar comparaciones entre la data de
técnica. No se recomienda usarlo en caso el espacio donde se
diferentes conjuntos.[123]
quiera mostrar es pequeño.[123]
Diagrama de Venn (Venn
Cualitativa
Diagram/ Set Diagram) -En caso se requiera manejar de forma más flexible la data no es
-Se utiliza cuando se quiere conocer la relación entre data de
recomendable su uso pues es limitante (comparaciones/
diferentes conjuntos.[124]
contrastes).[123]

(*) Lineamiento Sugerido. Fuente: http://migrationsmap.net/#/USA/arrivals


(**) Lineamiento Sugerido. Fuente: http://bl.ocks.org/carsonfarmer/11478345
(***) Lineamiento Sugerido. Fuente: https://visualign.files.wordpress.com/2011/10/countryneighbors_circular2.png

328
6.1.2.5 Proporción
Este tipo de enfoque resalta la magnitud o cantidad de un determinado conjunto de datos frente a otros. Es decir, se agrupan métodos de
visualización que utilizan el tamaño o el área para mostrar diferencias o similitudes entre los valores o un conjunto38.

Tabla 29 : Lineamientos de uso y diseño por enfoque de Proporción

Técnicas de Data Tipo de Lineamientos


Visualization Variable Lineamientos de Uso Lineamientos de Diseño

-Utilizarlo cuando se quiere visualizar proporciones de los grupos de


Gráfico de Matriz de data, de este modo se puede identificar los patrones.[92]
Para poder diferenciar proporciones, hacer uso de colores para
puntos (Dot Matrix Cualitativa
Chart) -No se recomienda utilizarlo cuando sólo se tiene una variable o una diferenciar los grupos de data (*)
sola categoría, ya que este pasaría a funcionar como un gráfico de
área proporcional.[92]
-No utilizar para grandes cantidades de data pues dificulta
contarlos.[95]
Pictograma (Pictogram Se utiliza cuando se desea mostrar de forma simple el objeto de
Cualitativa -No se recomienda utilizarlo en caso se quiera mostrar íconos
Chart) interés, por ello se hace uso de los íconos. [9]
parciales, pues puede generar confusión al momento de realizar el
análisis e interpretación del gráfico.[95]
Escala
Mapa de árbol circular
nominal y Es una alternativa para mostrar data jerárquica e invariante en el Considerar que en caso la cantidad de categorías a mostrar sea
(Circle Packing/
valores tiempo.[145] mucha, el espacio a ocupar será mayor.[94]
Circular Treemap)
discretos
(*) Lineamiento Sugerido. Fuente: https://www.behance.net/gallery/16809363/Do-You-Speak-Chinese

38
Cfr. Ribecca, 2016

329
6.1.2.6 Patrones
Este conjunto de técnicas tiene como principal enfoque mostrar formas de comportamiento dentro de la data, los cuales cuentan con un
significado.

Tabla 30 : Lineamientos de uso y diseño por enfoque de Patrones


Lineamientos
Técnicas de
Tipo de
Data
Variable Lineamientos de Uso Lineamientos de Diseño
Visualization

-Los gráficos de burbujas se utilizan normalmente para comparar y


-El panorama general del gráfico de burbuja se puede utilizar para
mostrar las relaciones entre los círculos etiquetados / categorizados, por el
analizar patrones / correlaciones. [87]
uso de posicionamiento y proporciones. [8]
-Es útil cuando se desea analizar data sobre el tiempo, esto permite - Es importante contar con una leyenda que permita mostrar las diferencias
evaluar posibles patrones. [87] por categorías de la data representada [142]
-Puede usarse interactividad: al hacer clic o al pasar sobre las burbujas
Múltiples -Si se quiere conocer proporciones, es posible visualizarlo para visualizar información oculta, además de que tenga una opción para
variables con aplicando ese factor cuando se distinguen las variables en cada reorganizar o filtrar las categorías agrupadas. [8] Asimismo, se puede
Gráfico de
escala burbuja. [88] hacer uso de botones para reproducir el comportamiento de las burbujas
burbujas
nominal y sobre un determinado lapso de tiempo. [142]
(Bubble Chart)
valores
discretos
-Se puede utilizar para distinguir categorías, para ello se hace uso de
colores que permitan diferenciarlos. [8] en caso de querer resaltar una sola
categoría o un grupo de estos que muestren una característica en particular
se puede resaltar dicho grupo de burbujas y sombrear el resto en gris [142]

-Si se cuenta con otras variables, se pueden representar a través de la


asignación de colores. [8]

330
-No se recomienda utilizarlo cuando la cantidad de data produce que
existan demasiadas burbujas, ya que pueden hacer que el gráfico se vuelva
difícil de entender. [87] un caso particular sería agregar el tiempo como
una variante más, el cual apoyado de una animación permitiría ver cómo
los datos han cambiado a través del tiempo [142] por tanto el
comportamiento de los datos sería el enfoque principal y no la cantidad a
mostrarse.

-Es útil en caso se quiera mostrar el comportamiento de la


migración de personas, productos comercializados o el número de El grosor de las líneas debe mostrar la cantidad de data. [143]
paquetes en una red. [143]
Escala - Es útil si es que lo que se quiere es reducir el desorden visual al Es importante considerar las líneas como el elemento dominante en la
Mapa de flujo nominal y fusionar los datos a través de líneas conectadas de un punto al otro gráfica, por ende es lo que debería ser notado fácilmente de los otros
(Flow Map) valores [143] elementos. [143]
discretos
-Permite realizar un análisis de la distribución del objeto en
- Considerar elaborar la leyenda de forma clara, señalando los valores
cuestión (en el caso de personas, se utiliza mayormente para
claves para el grosor de las lineas [143]
realizar un análisis de la distribución de la migración). [89]

-Es ideal cuando se quiere analizar cuantos objetos se encuentran


Si la escala es muy pequeña, es posible que muchos puntos sean dibujados
en una región geográfica. [22]
lo cual, por lo tanto no es recomendable utilizarlo, pues visualmente se
-Es útil cuando lo que se quiere analizar es el detalle a nivel es vuelve más difícil contabilizar la cantidad de puntos existentes en el mapa
parcial de la población, siendo un punto la representación de una [91]
cantidad de personas.[144]
Mapa de Puntos -Es útil cuando se quiere mostrar gran cantidad de objetos como
Escala de Tomar en cuenta el tamaño apropiado y el valor a asignar a los puntos
(Dot Map/ Dot valor de los minerales, cultivos, etc (no obstante considerar que la
intervalos y pues esto impacta en el patron que pueda visualizar el usuario. [144]
Distribution escala no debe ser muy pequeña) [91]
valores
Map/ Dot
discretos -Tiene que estar claro qué es lo que se desea mostrar para poder
Density Map)
visualizar la distribución de la data y sus densidades. Con ello, se
podrá realizar una correcta comparación de densidades. [90]

-No se recomienda utilizarlo cuando el usuario requiere de data


exacta. [90]

331
-Si no se tiene claro cómo proceder a realizar este gráfico (cálculo
de los puntos a mostrar, cuánto equivaldrán, densidad) es posible
que la información que se llegue a mostrar no sea la correcta o no
sea la que se quiere mostrar en un principio. [90]

332
6.1.2.7 Tendencia
Este enfoque agrupa a todas aquellas técnicas que permiten visualizar data en intervalos o periodos de tiempo. Es importante considerarlo
debido a que simulaciones tempo-dependientes y data variante en el tiempo se encuentran en casi toda disciplina científica. Este tipo de data
es dinámica naturalmente y puede ser categorizada como un comportamiento diferente39. Tomando esto en cuenta, a diferencia del esquema
inicial, elaborada por Andrew Abela, en el cual dicha característica es contemplada dentro de los grupos Comparación y Composición, en
esta ocasión se opta por separarlos de dichos enfoques para juntarlos en éste.

Tabla 31 : Lineamientos de uso y diseño por enfoque de Tendencias

Técnicas de Lineamientos
Tipo de
Data
Variable
Visualization Lineamientos de Uso Lineamientos de Diseño

-Mantener una cierta cantidad de líneas (5-7)(Ley de Miller), si el gráfico


Cuantitativa - -Son utilizados para mostrar valores cuantitativos a través de un se recarga o tiene muchas líneas, es más dificultoso para el usuario captar
Gráficos de Escala de intervalo continuo o lapso de tiempo.[104] la información.[21] En caso de tener más líneas se recomienda distinguir
líneas (Line intervalos y la línea con mayor relevancia y asignar otro color neutro a los demás [68]
Graph) valores
continuos -Se utiliza con mayor frecuencia para mostrar tendencias y -Utilizar distintos colores para diferenciar las líneas y agregar una leyenda
relaciones (cuando se agrupan con otras líneas).[104] para ello .[68]

Cuantitativa - -Es útil cuando se quiere comparar múltiples variables que


Gráficos de
Escala de cambian en un intervalo.[106] De no tener cambios, entonces lo
áreas apiladas - No se recomienda su uso si es que se cuenta con más de 5
intervalos y más probables es que ese no sea la técnica más conveniente [127]
(Stacked Area categorías.[106]
valores
Graphs) -No es una técnica que permita realizar comparaciones de la
continuos
data.[106]

39
Wang, Yu & Ma, 2008

333
-Se utiliza esta técnica cuando se desea analizar una data que -Agregar una línea de tendencia permite que se pueda tener una mayor
dependen de dos variables o dimensiones.[54] claridad del gráfico.[107]

Gráfico de -Es útil cuando se desee identificar patrones de comportamiento de -Se puede variar los tamaños de los puntos en caso se quiera mostrar una
Dispersión la data analizada.[107] variable de la data.[107]
(Scatterplot/ Escala de
Scatter Graph/ intervalos con -Es útil cuando se pretende analizar data numérica y lo que se
Point Graph/ valores quiere conocer es si una variable impacta a la otra. Sin embargo, la
-En caso se quiera agregar más variables al gráfico también se puede hacer
X-Y Plot/ continuos correlación que se muestra no es casualidad, por lo que abre la
uso de la asignación de colores.[107]
Scatter Chart/ posibilidad de verificar otras variables no visibles, las cuales
Scattergram) pueden ser que influyan en el resultado.[108]

-Para una mayor comprensión del gráfico el valor del eje Y debe
-No es recomendable comparar más de dos líneas de tendencias.[108]
empezar desde cero.[107]
-Es ideal para mostrar un gran conjunto de datos, por lo general -Si los colores asignados no permiten evidenciar qué es lo que representan
para mostrar tendencias a lo largo de un periodo de tiempo.[110] es importante considerar una leyenda [110]
Espiral de Escala de
Caracol (Spiral intervalos con - Toma en cuenta mostrar de forma clara las locaciones dentro de un
plot /Time valores -Es útil cuando se quiere detectar ciclos que permitan comparar espiral. Estos dependen del tipo de data a mostrar, es decir, si se tratara de
Series Spiral) continuos conjuntos de datos periódicos [110] horas, un ciclo podría representar 24 horas y las escalas deberían mostrar
qué ángulos representan qué horas [110]

-Es útil cuando se quiere comunicar información referente a


-Cuando se quiere mostrar cómo la data cuantitativa cambia con el tiempo,
tiempo, ya sea para realizar un análisis de la data o para
en este caso se tiende a combinar esta técnica con otros gráficos.[111]
visualmente presentar una historia.[110]

Línea de -Si se basa en escalas, las líneas de tiempo pueden ser utilizados -Permiten acercar o alejar la línea de tiempo para poder ver desde un plano
Tiempo Ordinal para ver cosas que ocurren o van a ocurrir, permitiendo al usuario general como más específico los datos. Esto ayuda a que se pueda realizar
(Timeline) evaluar los intervalos de tiempo entre eventos.[8] un análisis más profundo de los datos.[111]

-Si se utiliza la técnica en escala se puede detectar si es que


existen patrones a lo largo de cualquier periodo de tiempo y cómo
ciertos eventos se distribuyen a lo largo del tiempo. [111]

Gráficos de Cuantitativa - -Los gráficos de área se utilizan para mostrar el desarrollo de -No es recomendable tratar de sobreponer las áreas, pues visualmente
área (Area Escala de valores cuantitativos durante un período de tiempo.[112] origina que el usuario pueda confundirse y malinterpretar los datos

334
Graphs) intervalos y (aparece nuevas áreas producto de la sobre posición de dos a más áreas.)
-Se utilizan normalmente para mostrar tendencias y relaciones, en
valores En ese caso se hace uso del gráfico de áreas apiladas. [113]
lugar de transmitir valores específicos.[112]
continuos

335
6.1.3 Proceso de aplicación de los lineamientos propuestos
Al elaborar los lineamientos se consideró que no sólo bastaba con que estos fueran
distribuidos según su enfoque, sino también que puedan ser entendidos de forma coherente
y utilizados bajo un orden efectivo, es por ello que se propuso los siguientes pasos a seguir
para su aplicación.

Lo que quieres vs Lo que tienes

Enfoque

Técnica

Lineamientos

Figura 167. Proceso de Aplicación de los Lineamientos


Nota. Elaboración propia

 Lo que quieres vs Los que tienes


Primero, determina que es lo que quieres lograr con el gráfico, tomando en cuenta la data
que tienes.
 Enfoque
En base al objetivo inicial, define lo que quieres visualizar en primera instancia y ubícalo
en uno de los enfoques.
 Técnica
Cuando ya se tiene el enfoque que se quiere visualizar, elige la técnica que mejor se ajuste.
 Lineamientos
Al aplicar la técnica escogida, toma en cuenta cada uno de los lineamientos asociados a
dicha técnica.
Este proceso nos permite utilizar los lineamientos de uso y diseño, no obstante agregado a
ello te recalcamos los siguientes lineamientos que consideramos aplican para cualquiera de
las técnicas pertenecientes a un mismo enfoque.
Para el enfoque de relación, sea la técnica que elijas toma en cuenta siempre la cantidad de
datos a mostrar, sobre todo si son categorías, ya que mientras más categorías sean más
cargado se verá y con ello la visualización se vuelve engorrosa, reduciendo en algunos
casos, el espacio de las descripciones o leyendas.
Si el enfoque es comparación, ten en cuenta mantener el rasgo distintivo que permita
diferenciar las variables o categorías para que se pueda visualizar la comparación, para ello
considera siempre aplicar colores o si se tratase de muchos elementos has uso de elementos
externos como filtros para mostrar dichos datos por partes
Para el enfoque distribución, ten en cuenta que dichas técnicas muestran datos en
categorías y una vista general de la distribución de la data.
En el caso del enfoque patrones, ten en cuenta que siempre muestran el comportamiento de
la data ya sea en el tiempo y en categorías, además no es recomendable utilizarlos si
esperas mostrar cantidades exactas.
Para el enfoque proporción, es importante asignar colores a las agrupaciones de datos o
categorías y dichos datos deben mostrarse juntos para visualizar la proporción.
Para el enfoque tendencia, es importante distinguir que se utilizarán si los tipos de datos
que se mostrarán son cuantitativos y variantes en el tiempo.
En el caso del enfoque composición, es importante considerar su uso cuando lo que se
mostrará es la división de un total por categorías sea en cantidades o porcentajes.
Finalmente, dos recomendaciones principales a tener en cuenta en todo momento son:
primero, si se desconoce el uso de la técnica y cómo aporta valor, entonces no se debe
utilizar ni implementar, puesto que el desconocimiento conlleva a errores; y segundo, se
debe tener siempre presente la cantidad de variables que la técnica puede llegar a soportar
a nivel funcional y visual, para lograr un equilibrio.

6.2 Roadmap de proyectos


Data Visualization es un campo que sigue en constante crecimiento debido al incremento
progresivo de los volúmenes de datos, es por ello que nace la necesidad de ya no sólo
seguir creando distintos tipos de técnicas, sino también cómo combinar estas con otros
factores frente a la necesidad y facilidad de uso que necesita el usuario, ya sea en la rapidez
con la se quiera acceder a la información o a la interactividad que demande el usuario. Es
por ello que a continuación, se detallan dos propuestas de investigación, con la finalidad de
cubrir esta necesidad:

337
6.2.1 Propuesta 1: Investigación de Interactive Visualization en
dispositivos móviles

6.2.1.1 Introducción
La representación de datos es una forma que permite visualizar con mayor facilidad
información de lo que se podría conocer a través de grandes registros y por tanto es una
solución que ayuda a conocer información de importancia para cualquiera, sea empresa o
persona común, no obstante la presentación de este puede incluso mejorar más
dependiendo de las diferentes formas y opciones que se le pueda ofrecer al usuario para
facilitar su interpretación y experiencia de usuario. El manejo de la tecnología como parte
de nuestra vida cotidiana y organizacional va en aumento continuo, lo cual abre puertas a
que nuevas tecnologías sean utilizadas, sin embargo no se cuenta con la suficiente
investigación realizada para generar nuevas herramientas y formas en el país, como para
lograr dicho objetivo.

6.2.1.2 Problema
No se cuenta con las suficientes investigaciones que permitan emprender la realización de
nuevas soluciones tecnológicas, aplicando dispositivos móviles que aseguren nuevas
formas de visualizar información a través de la interactividad que se pueda tener con
dichos dispositivos y la presentación de la data mediante técnicas de Data Visualization,
los cuales son recursos gráficos que proporcionan una vista e interpretación fácil de la
información, todo ello con el propósito de no sólo mejorar la visualización de la
información sino incluso mejorar la experiencia del usuario.

6.2.1.3 Objetivo
Diseñar un modelo de visualización de datos aplicando Interactive Visualization en
dispositivos móviles.

6.2.1.4 Descripción de la propuesta


Se propone la elaboración de una investigación basada en la aplicación de Interactive
Visualization haciendo uso de dispositivos móviles, con el propósito de dar a conocer
además de la presentación de distintas técnicas de Data Visualization y la interactividad

338
que se puede tener con ello a través de los dispositivos móviles y sus restricciones, las
diferentes formas en las que se podría mostrar la información agrandando las posibilidades
de presentación de los gráficos y con ello mejorar la experiencia del usuario.

6.2.1.4.1 Conceptos de investigación

 Interactive Data Visualization


De acuerdo con Gartner, es toda aquella tecnología que permite la exploración de la
data a través de la manipulación de imágenes gráficos con colores, brillo, tamaño,
forma y movimiento de los objetos visuales que representan aspectos de la
información analizada. Dichos productos proveen una gran variedad de opciones
que van más allá de los gráficos básicos y otras visualizaciones para fines
específicos. Estas herramientas permiten a los usuarios analizar la data a través de
la interacción con la representación gráfica de éste.
 Dispositivos móviles
Estos recursos tecnológicos que actualmente se encuentran a un mayor alcance de
las personas permiten acceder con mayor facilidad a la información que se quiera
conocer. Los dispositivos móviles ofrecen diferentes capacidades que se pueden
desarrollar como la detección multitouch, retorno de visualizaciones, interfaces y
con ello explorar distintas interacciones. Existen tres áreas de investigación que
permiten la interacción: gestos ergonómicos, áreas de interacción y técnicas de
señalización. En base a estos puntos es que se puede realizar distintas acciones en la
superficie del dispositivo y con ello obtener un resultado de la interfaz mostrada.

339
Figura 168. Caraterísticas ergonómicas
Nota. Elaborado por: Katrin Wolf, Robert Schleicher y Michael Rohs (2014)

Tomando en cuenta las restricciones de tamaño, dimensión de la pantalla e


interacción, se pueden mostrar distintas formas en las que, para el propósito de la
investigación, permitan mostrar diversos gráficos y con ello visualizar de distintas
formas la información.

 Data Visualization
De acuerdo con Vitaly Friedman (2008), editor de la revista Smashing,
especializada para diseñadores y desarrolladores, el principal objetivo de Data
Visualization es transmitir de forma clara y efectiva información a través de
representaciones gráficas, esto implica que no necesita ser funcionalmente aburrido
o extremadamente sofisticado para que sea agradable a la vista. Para lograr que se
logre transmitir lo que se desea al usuario, se necesita que vaya relacionado la
forma estética como funcional, de esta manera se podrá llegar a comunicar los
puntos importantes de la información de forma intuitiva. No obstante, diseñadores
tienden a fallar al momento de balancear estos dos aspectos, pues crean
espectaculares gráficos, pero fallan en el propósito final, comunicar la información

340
Data Visualization se debe enfocar desde la perspectiva del usuario, que recibe la
información. Si sólo se presentan resultados analíticos en una hoja, este enfoque
podría fallar al momento de comunicar la información y su comportamiento.
Tomando en cuenta los diferentes lineamientos de uso y diseño propuestos en este
proyecto, se espera su consideración al momento de ser empleados en la aplicación
propuesta.

6.2.1.4.2 Funcionalidades
No aplica.

6.2.1.4.3 Arquitectura Lógica


No aplica.

6.2.1.4.4 Arquitectura Física


No aplica.

6.2.1.5 Requerimientos
No aplica.

6.2.1.6 Costos
No aplica.

6.2.1.7 Interesados y usuario final


Los interesados en la realización de esta investigación serían empresas de
tecnología que se encuentren relacionados a la elaboración de aplicaciones y/o
soluciones móviles de visualización de información.

6.2.1.8 Entregable Final


Modelo de visualización de datos aplicando Interactive Visualization en
dispositivos móviles.

341
6.2.2 Propuesta 2: Investigación de técnicas de visualización con
Streaming Analytics

6.2.2.1 Introducción
Los sistemas de Business Intelligence (BI), que se basan únicamente en datos
estáticos y archivados no pueden seguir el ritmo de un entorno de negocios que
exige acciones rápidas y precisas en el momento. Los negocios actuales necesitan
una nueva generación de BI, que incluya datos dinámicos, que consuma diversas
fuentes operacionales en tiempo real para exponer patrones relevantes y permitir
tomar decisiones con agilidad. A este nuevo enfoque de BI se le llama Streaming
Analytics (SA).
A diferencia del BI tradicional, que se basa en un modelo de "almacenar primero,
luego analizar", SA posee un diseño de latencia mínimo que analiza e informa
sobre eventos empresariales a medida que ocurren, permitiéndole a las
organizaciones detectar, evaluar y reaccionar ante situaciones críticas del negocio
con un tiempo prudente. Los datos que consume pueden provenir de "n" número de
fuentes tales como dispositivos de Internet of Things (IoT), smartphones y
dispositivos móviles como iPads, datos del mercado, sensores, estadísticas de una
página web, transacciones entre otras.
Asimismo, las herramientas orientadas a la visualización de datos están incluyendo
este nuevo enfoque de BI, por tanto, se debe tener siempre presente que la efectiva
visualización de cualquier tipo de gráfico, elaborado con fuentes de datos
convencionales o que actualicen en tiempo real, contribuye a darle un valor
agregado al usuario.
En el presente documento se presentará la propuesta de una investigación de
técnicas de visualización con Streaming Analytics.

6.2.2.2 Problema
Las herramientas actuales de Visualización de Datos están empezando a incluir
Streaming Analytics como una capacidad diferenciadora, no obstante, estas no le
ofrecen al usuario una mayor variedad de visualizaciones que se ajusten a la
información creciente y actualizada que este demanda para tomar decisiones ante
situaciones críticas con agilidad y beneficiar al negocio.

342
6.2.2.3 Objetivo
Diseñar un modelo de visualización de datos, considerando diversos campos de
visualización que sean factibles de usar con Streaming Analytics, abriendo nuevas
oportunidades de visualización al usuario bajo la demanda de grandes flujos de
información en tiempo real.

6.2.2.4 Descripción de la propuesta


Se propone realizar una investigación de técnicas de visualización con Streaming
Analytics, la cual parte con la evaluación de las técnicas de Data Visualization y
cómo es que estas se acoplan con el ritmo de datos que Streaming Analytics
soporta, teniendo en consideración las restricciones propias de ambas partes.
La investigación se centraría en el análisis de la capacidad de cada técnica para
soportar grandes flujos de datos, sin perder el foco de lo que esta muestra,
proyectándose a su constante crecimiento; y en base a ello tomar las medidas
necesarias para decidir si se realizan ajustes a la presentación de la gráfica, o la
búsqueda y propuesta de nuevas técnicas en otros campos de visualización.

6.2.2.4.1 Conceptos de investigación

 Streaming Analytics
Forrester (2016) define Streaming Analytics como un software que puede filtrar,
agregar, enriquecer y analizar con alto rendimiento múltiples fuentes de datos en
vivo e identificar patrones simples y complejos para proporcionar esta información
a las aplicaciones necesarias, de esta forma estas pueden detectar situaciones
oportunas, automatizar acciones inmediatas y adaptarse dinámicamente.
 Business Intelligence
Gartner (2016) define Business Intelligence como un término que agrupa
aplicaciones, infraestructura y herramientas, y las mejores prácticas que te permiten
acceder y analizar información para optimizar las decisiones y el rendimiento del
negocio. A su vez, Lian y Li (2012) lo definen como el proceso de transformación
de data cruda en información valiosa para establecer estrategias efectivas, tener una
visión de la parte operativa y poder tomar mejores decisiones que sean
beneficiosas.

343
Desde distintos enfoques, los autores convergen en una misma idea, afirman que el
propósito de Business Intelligence es brindarle una ventaja estratégica al negocio
frente a sus competidores.
 Internet of Things
El departamento de Investigación orientado a Internet de las Cosas (IERC),
encargado del desarrollo de proyectos financiados por los estados europeos que
tengan que ver con IoT, define Internet of Things de la siguiente manera:
“IoT es una infraestructura de redes global y dinámica, con la capacidad de ser
auto-configurada basada en estándares y protocolos de comunicación entre
plataformas, donde las “cosas” físicas y virtuales tienen identidades, atributos
físicos, personalidades virtuales y usan interfaces inteligentes que pueden ser
integradas en esta red de Información.” (IERC, 2014)

6.2.2.4.2 Funcionalidades
No aplica.

6.2.2.4.3 Arquitectura Lógica


No aplica.

6.2.2.4.4 Arquitectura Física


No aplica.

6.2.2.5 Requerimientos
No aplica.

6.2.2.6 Costos
No aplica.

6.2.2.7 Interesados y usuario final (Importancia)


Los interesados en la realización de esta investigación serían personas y/o empresas
relacionadas al desarrollo de soluciones de Data Visualization.

344
6.2.2.8 Entregable Final
El entregable final del proyecto es un modelo de visualización de datos
provenientes de diversos campos de visualización que soporten Streaming
Analytics.

345
CAPÍTULO 7 Gestión del Proyecto

En este capítulo se explica a detalle la gestión del desarrollo del proyecto bajo los
lineamientos del PMBOK.

346
6.1 Producto Final
Para el presente proyecto se establecieron determinados entregables, los cuales se listan a
continuación.
 Investigación enfocada a los conceptos, técnicas y herramientas de Data
Visualization.

 Lineamientos de uso y diseño basados en cuarenta técnicas de Data


Visualization.

 Proceso de uso de los lineamientos propuestos.

 Benchmarking de las herramientas de Data Visualization presentes en el


mercado.

 Pruebas de concepto.

 Arquitectura de las herramientas de Data Visualization.

 Roadmap de proyectos.

El producto final del proyecto son los lineamientos de uso y diseño elaborados, cuyo
principal objetivo es ser un apoyo al momento de decidir qué tipo de técnica utilizar para
representar cierto tipo de información.

347
6.2 Registro de interesados
En este documento se presenta la información de todos los interesados, así como su influencia e impacto en el desarrollo del proyecto. A
continuación, se presenta el registro de interesados.

Tabla 32 : Registro de interesados del proyecto DATAVIZ


Influencia Impacto
Nombres y Requerimientos sobre Influencia sobre el el
Organización Cargo Información del contacto Tipo de interés
Apellidos el Producto proyecto (1 proyecto
I P E S C al 5) (1 al 5)
Desarrollo de Lineamientos de
lineamientos de uso y uso y diseño de
Directora de la
Teléfono: 967407593 diseño de técnicas de técnicas de Data
Rosario Comité EISC – Escuela de
Email: Data Visualization y ☐ ☐ ☐ ☒ ☒ 5 5 Visualization y
Villalta Riego UPC Sistemas y
rosario.villalta@upc.edu.pe Pruebas de concepto Pruebas de
Computación
aplicando los concepto aplicando
lineamientos los lineamientos
Desarrollo de Lineamientos de
Coordinador de la lineamientos de uso y uso y diseño de
carrera de Teléfono: 991783933 diseño de técnicas de técnicas de Data
Comité EISC -
Jimmy Armas Ingeniería de Email: Data Visualization y ☐ ☐ ☐ ☒ ☒ 5 5 Visualization y
UPC
Sistemas de jimmy.armas@upc.edu.pe Pruebas de concepto Pruebas de
Información aplicando los concepto aplicando
lineamientos los lineamientos
Desarrollo de Lineamientos de
lineamientos de uso y uso y diseño de
Coordinador de la
Teléfono: - diseño de técnicas de técnicas de Data
Comité EISC – carrera de
Oscar Gómez Email: Data Visualization y ☐ ☐ ☐ ☒ ☒ 5 5 Visualization y
UPC Ingeniería de
oscar.gomez@upc.edu.pe Pruebas de concepto Pruebas de
Software
aplicando los concepto aplicando
lineamientos los lineamientos
Desarrollo de Lineamientos de
Coordinador de la lineamientos de uso y uso y diseño de
carrera de Teléfono: 991484729 diseño de técnicas de técnicas de Data
Pedro Comité EISC –
Ingeniería de Email: Data Visualization y ☒ ☐ ☐ ☒ ☒ 5 5 Visualization y
Shiguihara UPC
Ciencias de la pedro.shiguihara@upc.edu.pe Pruebas de concepto Pruebas de
Computación aplicando los concepto aplicando
lineamientos los lineamientos
Desarrollo de Lineamientos de
lineamientos de uso y uso y diseño de
diseño de técnicas de técnicas de Data
Universidad Data Visualization Visualization y
Teléfono: -
Alfredo Peruana de Pruebas de concepto pruebas de
Profesor Cliente Email: ☒ ☒ ☒ ☒ ☒ 5 5
Barrientos Ciencias aplicando los concepto aplicando
pcsiabar@upc.edu.pe
Aplicadas lineamientos los lineamientos
Benchmarking de Benchmarking de
herramientas de Data herramientas de
Visualization Data Visualization
Universidad Cumplimiento de los Objetivos de la
Teléfono: -
Peruana de Profesor Gerente objetivos, entregables y
Roy Perez Email: ☒ ☐ ☐ ☒ ☐ 3 3 empresa virtual
Ciencias de Innova TI cronograma del
pcsirper@upc.edu.pe Innova TI
Aplicadas proyecto
Cumplimiento de los Gestión de la
Teléfono: 980045805
INNOVA TI – Alumno Gerente objetivos, entregables y
Henry Paulett Email: ☒ ☐ ☐ ☒ ☐ 3 3 empresa virtual
UPC de Innova TI cronograma del
U201211501@upc.edu.pe Innova TI
proyecto
Elaboración de
investigación de Data
Teléfono: 945946835 Visualization para la Gestión del
Angela INNOVA TI –
Jefe de Proyecto Email: elaboración de ☒ ☒ ☒ ☒ ☒ 5 5
Camavilca R. UPC proyecto
U201110502@upc.edu.pe lineamientos y posterior
aplicación mediante
pruebas de concepto
Elaboración de
Teléfono: 949562129 Gestión del
Jocelyn INNOVA TI - investigación de Data
Jefe de Proyecto Email: ☒ ☒ ☒ ☒ ☒ 5 5
Jimenez M. UPC Visualization para la proyecto
U201210250@upc.edu.pe
elaboración de

349
lineamientos y posterior
aplicación mediante
pruebas de concepto

Universidad Teléfono: -
Memoria del
Miguel Peruana de Email: Avance, corrección de
Profesor Revisor ☐ ☐ ☐ ☒ ☐ 4 4
Ayllón Ciencias pcsimayl@upc.edu.pe la Memoria proyecto
Aplicadas
Nota. Elaboración propia

350
6.3 Matriz de trazabilidad de requerimientos
A continuación, se muestra un análisis de la matriz de trazabilidad de requerimientos, esta matriz vincula los requerimientos del proyecto
con los objetivos y entregables a desarrollar.

Tabla 33 : Matriz de Trazabilidad de Requerimientos del proyecto DATAVIZ


Verificación de
Prioridad/ Propósitos u Objetivos Código Método de Estado
ID Requerimiento Justificación Alcance / Fecha
Categoría del proyecto EDT Revisión Actual
Validación
OE1: Analizar los
Conocer las técnicas
Se requiere investigar
existentes de Data conceptos, técnicas y
DATAVIZ - acerca de las técnicas
Visualization para la Alta 1.4.11.1 Presencial No cumplido Activo 28/04/2016
REQ0001 existentes de Data distintas herramientas de
elaboración de los
Visualization
lineamientos Data Visualization.

Conocer qué herramientas


lideran el rubro de Data
OE1: Analizar los
Se requiere investigar Visualization para
acerca de las diferenciar cuales son los conceptos, técnicas y
DATAVIZ – 1.4.11.9
herramientas más que más se amoldan a las Alta Presencial No cumplido Activo 18/05/2016
REQ002 distintas herramientas de 1.6.4.5
conocidas en el rubro necesidades del proyecto y
de Data Visualization en el cual se podrían Data Visualization.
realizar las pruebas de
concepto
OE2: Diseñar y definir
Se requiere elaborar lineamientos de uso y
lineamientos de uso y Elaborar los lineamientos diseño tomando como
DATAVIZ –
diseño de las mejores para lograr el objetivo de Alta referencia las mejores 1.4.11.1 Presencial No cumplido Activo 27/06/2016
REQ0003
prácticas de Data este proyecto prácticas de las técnicas
Visualization de Data Visualization y el
tipo de dato.

351
Elaborar un benchmarking
OE3: Implementar
Se requiere elaborar de la herramientas para
pruebas de concepto en la
un benchmarking de conocer sus beneficios y
DATAVIZ – herramienta previamente
las herramientas del cuales se amoldarían a las Alta 1.6.4.5 Presencial No cumplido Activo 07/09/2016
REQ004 definida, aplicando cada
rubro de Data necesidades del proyecto
uno de los lineamientos
Visualization en base a los lineamientos
gráficos propuestos.
propuestos
Se requiere la
OE3: Implementar
instalación de la
Instalación de la pruebas de concepto en la
herramienta
DATAVIZ – herramienta seleccionada herramienta previamente
seleccionada y todos Alta 1.6.9.3 Presencial No cumplido Diferido 12/10/2016
REQ005 para poder llevar a cabo definida, aplicando cada
los software
las pruebas de concepto uno de los lineamientos
requisitos para su
gráficos propuestos.
funcionamiento
Se requiere elaborar
Elaboración del entregable OE1: Analizar los
la arquitectura de las
DATAVIZ – para conocer las conceptos, técnicas y
herramientas de Data Alta 1.4.11.9 Presencial No cumplido Diferido 02/07/2016
REQ006 dependencias de las distintas herramientas de
Visualization
herramientas definidas. Data Visualization.
seleccionadas
OE3: Implementar
Se requiere elaborar Elaborar pruebas de pruebas de concepto en la
DATAVIZ – pruebas de concepto concepto para comprobar herramienta previamente
Alta 1.6.9.3 Presencial No cumplido Diferido 12/10/2016
REQ007 de los lineamientos la efectividad de los definida, aplicando cada
propuestos lineamientos propuestos uno de los lineamientos
gráficos propuestos.
Elaborar dos propuestas de OE4: Proponer dos
Se requiere elaborar proyectos en base a la proyectos profesionales
DATAVIZ –
dos propuestas de investigación realizada y a Alta alineados a la 1.7.1.2 Presencial No cumplido Diferido 08/11/2016
REQ008
proyectos. la elaboración de investigación y resultados
lineamientos. de este proyecto.
Nota. Elaboración propia

352
6.4 Matriz de asignacion de responsabilidades
A continuación, se presenta la matriz de asignación de responsabilidades de todos los involucrados del proyecto, estas responsabilidades son
designadas en función al entregable respectivo.
Función que realiza el rol en el entregable:
R (Es el responsable del entregable), C (Coordina actividades del entregable), P (Participa en la construcción/elaboración del entregable), A
(Aprueba entregable), V (Participa en el control de calidad del entregable), F (El entregable requiere su firma).

Tabla 34 : Matriz de responsabilidades de los involucrados del proyecto DATAVIZ


Gerente Gerente
Jefe de Comité de Profesor Analista Profesor Profesor Co-
Código EDT Entregable Profesor Alumno
proyecto proyectos Cliente QC Revisor autor
INNOVA TI INNOVA TI
1.1 Inicio
1.2.2.1 Project Charter R,P A,C,F A,F P,A,F C
1.2 Planificación
1.3.1.2.1 Cronograma R,P A,C,F A,F A C
1.3.1.2.2 Diccionario EDT R,P A,C,F A,F A C V
1.3.1.2.3 Registro de Interesados R,P A,C,F A,F A C V
Descripción de Roles y
1.3.1.2.4 R,P A,C,F A,F A C V
Responsabilidades
Plan de Gestión del
1.3.1.2.5 R,P A,C,F A,F A C V
Cronograma
1.3.1.2.6 Plan de Gestión de Alcance R,P A,C,F A,F A C V
Plan de Gestión de
1.3.1.2.7 R,P A,C,F A,F A C V
Comunicaciones
1.3.2.1.1 Plan de Gestión de Riesgo R,P A,C,F A,F A C V
1.3.2.1.2 Plan de Gestión de Calidad R,P A,C,F A,F A C V
1.3.2.1.3 Plan de Gestión de RR.HH R,P A,C,F A,F A C V

353
Matriz de Trazabilidad de
1.3.2.1.4 R,P A,C,F A,F A C V
Requerimientos
1.3.2.1.5 Matriz RAM R,P A,C,F A,F A C V
1.3.2.1.6 Matriz de Riesgos R,P A,C,F A,F A C V
1.3 Ejecución [R]
Lineamientos gráficos de
1.4.11.1 R,P A,C,F A,F A,C,F C
Data Visualization
Benchmarking herramientas
1.6.4.5 R,P A,C,F A,F A,C,F C V
de Data Visualization
Arquitecturas de las
1.4.11.9 Herramientas de Data R,P A,C,F A,F A,C,F C
Visualization
1.6.9.9 Pruebas de concepto R,P A,C,F A,F A,C,F C V
1.4 Cierre [R]
Propuestas de proyectos
1.7.1.2 R,P A,C,F A,F A,C,F C
profesionales
1.7.1.11 Memoria Final del Proyecto R,P A,C,F A,F A C A,V,F
1.7.2.5 Paper de Investigación R,P,V,F A,C,F A,F A C R,P,V,F
1.7.2.4 Poster R,P A,C,F A,F A,C,F C
Nota. Elaboración propia

354
6.5 Plan de gestión de Calidad
Se estableció un Plan de Gestión de Calidad para asegurar la calidad del proyecto
durante todas sus fases, a continuación, se detallan algunos puntos descritos en el
plan.

6.5.1 Roles y Responsabilidades


Comité de Proyectos
 Aprobar proyectos profesionales
 Evaluar el avance del proyecto
 Decidir continuidad de proyectos

Cliente
 Evaluar y dar seguimiento a los avances del proyecto
 Aprobar los resultados del proyecto
 Asesorar a los jefes de proyecto

Gerente Profesor Innova TI


 Dar seguimiento a los proyectos de la empresa
 Facilitar comunicación entre las empresas virtuales involucradas
 Aprobar los documentos de gestión

Gerente Alumno Innova TI


 Apoyar en el monitoreo y control de las actividades programadas del
proyecto
 Brindar las facilidades para la asignación de recursos requeridos

Jefe de Proyecto
 Gestionar el proyecto
 Gestionar los recursos
 Definir el alcance del proyecto
 Coordinar con las autoridades involucradas en el proyecto
Jefe de Investigación
 Cumplir con el cronograma
 Realizar las investigaciones necesarias a lo largo del proyecto
 Validar los avances del proyecto

Analista de Quality Services


 Realizar tareas de validación y verificación que permitan asegurar la calidad
de los entregables del proyecto

6.5.2 Procedimientos
1. Procedimiento para la Planificación de la Calidad
 Definir aquellos entregables que deberán pasar por el control de calidad, los
responsables de este control y como se realizara dicho proceso.
 Definir aquellos certificados con los que deberá contar el proyecto para
validar que ha pasado por un proceso de control de calidad.
 Definir los recursos necesarios para las pruebas de control de calidad.
 Definir las fechas en el cronograma de cuando se realizarán estas pruebas de
calidad.

2. Procedimiento para Aseguramiento de la Calidad


 Se realizará un monitoreo semanal de las fechas establecidas en el
cronograma para asegurar el cumplimiento de las actividades.
 Asegurar la asignación de recursos de la empresa virtual QS para el
aseguramiento de la calidad de los entregables.
 Evaluar el impacto de algún cambio dentro del proyecto (alcance, objetivos,
tiempos, etc.) con respecto a la calidad.

3. Procedimiento para el Control de la Calidad


 El control de calidad se iniciará revisando los entregables y la matriz de
incidencias encontradas por el Analista de QS.
 Se analizan las mejoras y acciones correctivas para los entregables del
proyecto.

356
4. Procedimiento para Mejora Continua
 El Jefe de Proyecto junto al Jefe de Investigación, definirán aquellas
mejoras que se podrían incluir en el proyecto en base a lecciones
aprendidas.

En el siguiente cuadro se muestra un análisis del control de la calidad y auditorias


programadas de los entregables del proyecto.

Tabla 35 : Análisis del control de calidad y auditorías del proyecto DATAVIZ

Entregable/ Estándar de Actividad de Auditoría


Id. EDT Actividad de control
Tarea Calidad Aplicable Aseguramiento Programada

Gestión del
1 proyecto
DATAVIZ
1.2 Inicio
Validación y/o
Entregable pasa Entregables
Aprobación por parte
por un proceso de enviados para su Semana 5 Ciclo
1.2.2.1 Project Charter del Comité de
validación y/o validación y/o 2016-1
Proyectos, Cliente, y
aprobación aprobación
Gerente Profesor

1.3 Planificación

Validación y/o
Entregables
Entregables pasan Aprobación por parte
enviados para su Semana 4 Ciclo
1.3.1.2.1 EDT por un proceso de del Comité de
validación y/o 2016-1
QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Validación y/o
Entregables
Entregables pasan Aprobación por parte
enviados para su Semana 4 Ciclo
1.3.1.2.2 Diccionario EDT por un proceso de del Comité de
validación y/o 2016-1
QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Validación y/o
Entregables
Descripción de Entregables pasan Aprobación por parte
enviados para su Semana 4 Ciclo
1.3.1.2.4 Roles y por un proceso de del Comité de
validación y/o 2016-1
Responsabilidades QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Validación y/o
Entregables
Entregables pasan Aprobación por parte
enviados para su Semana 4 Ciclo
1.3.2.1.6 Matriz de Riesgos por un proceso de del Comité de
validación y/o 2016-1
QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Matriz de Entregables pasan Entregables Validación y/o
Semana 4 Ciclo
1.3.2.1.4 Trazabilidad de por un proceso de enviados para su Aprobación por parte
2016-1
Requerimientos QA validación y/o del Comité de

357
aprobación Proyectos, Cliente,
Gerente Profesor y QS
Validación y/o
Entregables
Entregables pasan Aprobación por parte
enviados para su Semana 4 Ciclo
1.3.2.1.5 Matriz RAM por un proceso de del Comité de
validación y/o 2016-1
QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Validación y/o
Entregables
Entregables pasan Aprobación por parte
Plan de Gestión de enviados para su Semana 4 Ciclo
1.3.2.1.2 por un proceso de del Comité de
Calidad validación y/o 2016-1
QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Validación y/o
Entregables
Entregables pasan Aprobación por parte
Plan de Gestión del enviados para su Semana 4 Ciclo
1.3.1.2.6 por un proceso de del Comité de
Alcance validación y/o 2016-1
QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Validación y/o
Entregables
Entregables pasan Aprobación por parte
Plan de Gestión de enviados para su Semana 4 Ciclo
1.3.1.2.7 por un proceso de del Comité de
Comunicaciones validación y/o 2016-1
QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Validación y/o
Entregables
Entregables pasan Aprobación por parte
Matriz de enviados para su Semana 4 Ciclo
1.3.2.1.7 por un proceso de del Comité de
Comunicaciones validación y/o 2016-1
QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Validación y/o
Entregables
Entregables pasan Aprobación por parte
Plan de Gestión de enviados para su Semana 4 Ciclo
1.3.2.1.1 por un proceso de del Comité de
Riesgo validación y/o 2016-1
QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Validación y/o
Entregables
Entregables pasan Aprobación por parte
Plan de Gestión de enviados para su Semana 4 Ciclo
1.3.2.1.3 por un proceso de del Comité de
RRHH validación y/o 2016-1
QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Validación y/o
Entregables
Entregables pasan Aprobación por parte
Plan de Gestión de enviados para su Semana 4 Ciclo
1.3.1.2.5 por un proceso de del Comité de
Cronograma validación y/o 2016-1
QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Validación y/o
Entregables
Entregables pasan Aprobación por parte
Registro de enviados para su Semana 4 Ciclo
1.3.1.2.3 por un proceso de del Comité de
Interesados validación y/o 2016-1
QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Ejecución
1.4
(2016-1)
Presentación Entregables Validación y/o
Parcial con el Punto de control enviados para su Aprobación por parte Semana 5 Ciclo
1.4.1.7
Comité de del proyecto validación y/o del Comité de 2016-1
Proyecto aprobación Proyectos, Cliente, y

358
Gerente Profesor
Validación y/o
Entregable pasa Entregables
Arquitectura de Aprobación por parte
por un proceso de enviados para su Semana 16
1.4.11.9 herramientas de del Comité de
validación y/o validación y/o Ciclo 2016-1
Data Visualization Proyectos, Cliente, y
aprobación aprobación
Gerente Profesor
Validación y/o
Entregable pasa Entregables
Aprobación por parte
Lineamientos de por un proceso de enviados para su Semana 16
1.4.11.1 del Comité de
uso y diseño validación y/o validación y/o Ciclo 2016-1
Proyectos, Cliente, y
aprobación aprobación
Gerente Profesor
Validación y/o
Entregables
Presentación Final Aprobación por parte
Punto de control enviados para su Semana 16
1.4.12.1 con el Comité de del Comité de
del proyecto validación y/o Ciclo 2016-1
Proyecto Proyectos, Cliente, y
aprobación
Gerente Profesor
Ejecución
1.6
(2016-2)
Validación y/o
Entregables
Benchmarking de Entregables pasan Aprobación por parte
enviados para su Semana 4 Ciclo
1.6.4.5 herramientas de por un proceso de del Comité de
validación y/o 2016-2
Data Visualization QA Proyectos, Cliente,
aprobación
Gerente Profesor y QS
Entregable pasa Entregables
Validación y/o
Pruebas de por un proceso de enviados para su Semana 10
1.6.9.3 Aprobación por parte
Concepto validación y/o validación y/o Ciclo 2016-2
del Cliente
aprobación aprobación
1.7 Cierre
Entregable pasa Entregables Validación y/o
Propuestas de por un proceso de enviados para su Aprobación por parte Semana 13
1.7.1.2
proyectos validación y/o validación y/o Cliente y Gerente Ciclo 2016-2
aprobación aprobación Profesor
Nota. Elaboración propia

359
6.6 Plan de gestión de Riesgos
A continuación, se presenta un cuadro resumen de los riesgos establecidos para el proyecto y su análisis en relación a la probabilidad e impacto en
el desarrollo del proyecto.

Tabla 36 : Análisis de los riesgos del proyecto DATAVIZ


Identificación Análisis
Exp al Exp al
Cód. Fecha de Categoría - Impacto
Descripción del Riesgo Disparador Probabilidad Impacto Riesgo Riesgo
Riesgo registro Origen (HH)
(Horas) (Costo S/.)

Retrasos en la elaboración y
DATAVIZ- Int - Equipo de Incumplimiento en las tareas
07/04/2016 presentación de los 70%-Alta 22 4 Alta 15.40 15.4
R001 trabajo establecidas en el cronograma
entregables del proyecto

Avances del proyecto no Falta de reuniones con Cliente /


DATAVIZ-
07/04/2016 Int - El proceso validados a tiempo por el Gerente Profesor / Comité de 70%-Alta 22 4 Alta 15.40 15.4
R002
cliente y comité Proyectos

DATAVIZ- Int - El Cambio del alcance del Reuniones con Cliente / Gerente
07/04/2016 70%-Alta 22 4 Alta 15.40 15.4
R003 proyecto proyecto Profesor / Comité de Proyectos

Falta de información Investigación de las buenas


DATAVIZ- Int - La
07/04/2016 relacionada al tema del prácticas de las técnicas de Data 70%-Alta 16 3 Media 11.20 11.2
R004 tecnología
proyecto Visualization
Incumplimiento de las
Revisión de documentos de
DATAVIZ- Int - Equipo de actividades asignadas a los
07/04/2016 gestión y entregables del 70%-Alta 16 3 Media 11.20 11.2
R005 trabajo recursos de las empresas
proyecto por parte de QS
virtuales de la EISC

DATAVIZ- Int - La No encontrar herramientas Implementación de las pruebas


07/04/2016 70%-Alta 16 3 Media 11.20 11.2
R006 tecnología que se ajusten al proyecto de concepto de los lineamientos

Nota. Elaboración propia

El siguiente cuadro representa las estrategias de respuesta y monitoreo de los riesgos antes presentados.

Tabla 37 : Estrategias de respuesta y monitoreo de riesgos del proyecto DATAVIZ


Identificación Estrategia de respuesta Monitoreo
Situación Fecha de
Tipo de Descripción de la Rol Nombre Acciones
Cód. Riesgo de la Plan de Contingencia Estado cambio de
Estrategia estrategia planteada responsable Responsable realizadas
estrategia estado
Establecer fechas con
determinados tiempos Reasignación de horas
Iniciar a tiempo
de holgura, que Angela de trabajo dedicadas a
la realización de
permitan cumplir con Camavilca / la elaboración de No
DATAVIZ-R001 Evitar Jefe los entregables y No iniciado N/A
las actividades Jocelyn documentos de gestión Incurrido
documentos de
definidas incluso de Jimenez y entregables del
gestión
presentarse alguna proyecto
eventualidad.
Contactar a los Reuniones Establecer fechas fijas
Angela
miembros del comité constantes con de reuniones semanales
Camavilca / No
DATAVIZ-R002 Mitigar o al cliente para Jefe Cliente / Gerente No iniciado con Cliente / Gerente N/A
Jocelyn Incurrido
presentar avances del Profesor / Profesor / Comité de
Jimenez
proyecto y re-agendar Comité de Proyectos

361
reuniones en casos de Proyectos
no disponibilidad en
fechas acordadas.

Evaluación del
Validación con Cliente
Restructuración del Angela impacto del
/ Gerente Profesor /
proyecto y del Camavilca / cambio en los Incurrido
DATAVIZ-R003 Mitigar Jefe Cerrado Comité de Proyectos de 14/06/2016
cronograma planteado Jocelyn documentos ya (Problema)
los cambios en el
previamente. Jimenez definidos del
proyecto
proyecto
Búsqueda de
información en Angela Búsqueda de Acceso a fuentes
diversas fuentes Camavilca / información en bibliográficas fuera de No
DATAVIZ-R004 Mitigar Jefe No iniciado N/A
confiables que aporten Jocelyn fuentes brindadas las opciones brindadas Incurrido
al desarrollo del Jimenez por la UPC por la UPC
proyecto.
No asignar tareas
Angela Capacitar a los
críticas que cubran
Camavilca / recursos para Solicitar cambio de No
DATAVIZ-R005 Mitigar más tiempo del que Jefe No iniciado N/A
Jocelyn optimizar su recursos Incurrido
dispone el recurso
Jimenez tiempo de trabajo
para el curso.
Priorizar la búsqueda
de herramientas open Angela Búsqueda de
source, y en caso se Camavilca / herramientas Adquirir una No
DATAVIZ-R006 Mitigar Jefe No iniciado N/A
requiera, optar por la Jocelyn open source y herramienta paga Incurrido
adquisición de alguna Jimenez pagas
herramienta paga.
Nota. Elaboración propia

362
6.7 Plan de gestión de Tiempo
El Plan de Gestión de Tiempo tiene como objetivo principal colaborar en la estimación del
tiempo necesario para el desarrollo de las actividades planificadas del proyecto.
A continuación, se muestra un cuadro resumen de los tiempos planificado por cada fase del
proyecto distribuido por semanas.

Tabla 38 : Gestión del tiempo de las fases del proyecto DATAVIZ


Semana Duración Inicio Fin % cumplido

Ciclo 2016-1 (100 días)

Inicio (12 días)


Semana 1 6 días Lunes 3/21/16 Sábado 26/03/16 100%
Planificación (18.13 días)
Semana 2 5.19 días Lunes 28/3/16 Sábado 02/04/16 100%
Semana 3 6.88 días Lunes 4/4/16 Domingo 10/04/16 100%
Semana 4 5.13 días Lunes 11/4/16 Sábado 16/04/16 100%
Ejecución (68.38 días)
Semana 5 6 días Lunes 18/04/16 Sábado 23/04/16 100%
Semana 6 6 días Lunes 25/04/16 Sábado 30/04/16 100%
Semana 7 5.13 días Lunes 02/05/16 Sábado 07/05/16 100%
Semana 8 6 días Lunes 09/05/16 Sábado 14/05/16 100%
100%
Semana 9 6 días Lunes 16/05/16 Sábado 21/05/16
Semana 10 7 días Lunes 23/05/16 Domingo 29/05/16 100%
Semana 11 5.88 días Lunes 30/05/16 Sábado 04/06/16 100%
Semana 12 5.63 días Lunes 06/06/16 Sábado 11/06/16 100%
Semana 13 6 días Lunes 13/06/16 Sábado 18/06/16 100%
Semana 14 6 días Lunes 20/06/16 Sábado 25/06/16 100%
Semana 15 6 días Lunes 27/06/16 Sábado 2/07/16 100%
Semana 16 0.38 días Martes 05/07/16 Martes 05/07/16 100%
Ciclo 2016-2 (102 días)
Ejecución (78 días)
Semana 1 6 días lun 15/08/16 sáb 20/08/16 100%
Semana 2 5.5 días mar 23/08/16 lun 29/08/16 100%
Semana 3 5.5 días lun 29/08/16 sáb 3/09/16 100%
Semana 4 6 días lun 5/09/16 sáb 10/09/16 100%
Semana 5 7 días lun 12/09/16 dom 18/09/16 100%
Semana 6 7 días lun 19/09/16 dom 25/09/16 100%
Semana 7 6 días lun 26/09/16 sáb 1/10/16 100%
Semana 8 7 días lun 3/10/16 dom 9/10/16 100%
Semana 9 7 días lun 10/10/16 dom 16/10/16 100%
Semana 10 5.75 días lun 17/10/16 sáb 22/10/16 100%
Semana 11 6 días lun 24/10/16 sáb 29/10/16 100%
Semana 12 7 días lun 31/10/16 dom 6/11/16 100%
Cierre (24 días)
Semana 13 6 días lun 7/11/16 sáb 12/11/16 100%
Semana 14 6 días lun 14/11/16 sáb 19/11/16 100%
Semana 15 6 días lun 21/11/16 sáb 26/11/16 100%
Semana 16 0.38 días mar 29/11/16 mar 29/11/16 100%
Nota. Elaboración propia
Conclusiones

 A partir de las 40 técnicas de Visualización de Datos investigadas, se elaboraron 96


lineamientos de uso y 66 lineamientos de diseño. A su vez, dichas técnicas se
encuentran distribuidas en siete enfoques que permiten al usuario reconocer lo que
desea mostrar y/o visualizar en primera instancia.

 En las pruebas de concepto se demuestra que el proceso propuesto para la aplicación de


los lineamientos de uso y diseño, facilita la tarea del usuario para identificar de forma
ágil y concisa la técnica que debe utilizar para lo que requiere mostrar.

 Luego de evaluar tres herramientas de Business Intelligence y Data Visualization a


través de un benchmarking, se determinó que la herramienta que más se adapta a las
necesidades del proyecto es Power BI de Microsoft, resaltando tres características
importantes, su fácil uso, customización y precio.

 Las herramientas existentes en el mercado de Business Intelligence y Data


Visualization no proveen una solución completa al usuario ya que, aún no se ha
logrado un equilibro entre dos aspectos importantes: la cantidad de técnicas soportadas
por la herramienta vs la experiencia del usuario.

 A raíz de las limitaciones encontradas durante la realización de las pruebas de concepto


se propone un roadmap de futuros proyectos para profundizar la investigación del
campo de la visualización de datos, ya no sólo a nivel de herramientas, sino también
enfocado a otros tipos de campos de estudio que se proyecten, además de la amplia
gama de técnicas, a las distintas formas de cómo el usuario pueda interactuar con estas.

364
 Nuestra propuesta de lineamientos de uso y diseño no se limita a una herramienta de
visualización de datos o entorno a utilizar, pues se enfoca netamente en cómo aplicar la
técnica.

 Data Visualization es un campo que sigue en constante crecimiento debido al


incremento progresivo de los volúmenes de datos, es por ello que nace la necesidad de
ya no sólo seguir creando distintos tipos de técnicas, sino también cómo combinar estas
con otros factores frente a la necesidad y facilidad de uso que necesita el usuario, ya
sea en la rapidez con la se quiera acceder a la información o a la interactividad que
demande el usuario.

365
Recomendaciones

 El usuario que requiera utilizar los lineamientos de uso y diseño debe hacerlo usando el
proceso de aplicación propuesto, de tal forma que sea efectiva la tarea de encontrar la
técnica que más se adecue a lo que necesite mostrar.

 Es importante acotar que el usuario debe aplicar los lineamientos sin tener una
predisposición de la técnica que utilizará, ya que esto significaría forzar la aplicación
de una técnica que no necesariamente sea acorde con el tipo de dato que va a mostrar o
el enfoque que quiera visualizar como resultado.

 Tomar en cuenta la calidad de los datos a trabajar, pues de lo contrario no se garantiza


que muestre resultados reales y genere una decisión o conclusión errada al usuario.

 Si se requiere implementar una de las herramientas evaluadas en el benchmarking,


primero se debe hacer un análisis de los costos y beneficios vs las necesidades reales
del negocio.

 Se recomienda profundizar en la investigación de otros campos de estudio


relacionados con la visualización de datos para complementar el estudio realizado y así
lograr encontrar soluciones que mejoren las condiciones del usuario al momento de
realizar el análisis de los datos para la toma de decisiones.

366
Glosario

 Bussiness Intelligence: Unión de datos, tecnología, análisis y conocimiento humano


para optimizar las decisiones del negocio y conducir al éxito de la empresa.

 Cuadrante Mágico de Gartner: herramienta que ayuda a la selección de productos de la


industria de las tecnologías de información, donde se evidencia de manera gráfica la
situación del mercado.

 Data Visualization: Su principal objetivo es transmitir de forma clara y efectiva


información a través de representaciones gráficas.

 Dashboard: es una herramienta de visualización de datos, usualmente de una sola hoja,


que a través de gráficos y KPI’s, nos da a conocer el estado actual de una empresa.

 Lineamiento de diseño: Sugerencia o directriz que ayuda a realzar la efectividad de las


visualizaciones a través de un rango de disciplinas.

 Lineamiento de uso: Recomendación o directriz que brinda un enfoque funcional de


cómo utilizar las técnicas de Data Visualization.

 REST: Representational State Transfer, tipo de arquitectura de desarrollo web que se


apoya en el estándar HTTP.

 API: Application Programming Interface, conjunto de procedimiento a los cuales se


puede acceder y hacer uso, provistos por un tercero, dentro de una aplicación web.

 Total Cost Ownership: Análisis que cubre todos los costos por los que se puede incurrir
al adquirir un software durante su ciclo de vida.

367
Anexo 1 - Plan de Gestión de Comunicaciones
El Plan de Gestión de Comunicaciones deberá ser revisado y actualizado cada vez
que:
 Hay una solicitud de cambio aprobada o acción correctiva que impacte los
requerimientos o necesidades de información de los Stakeholders.

 Hay cambios en los miembros y roles del equipo del proyecto.

 Hay solicitudes inusuales de informes o reportes adicionales que se van a


mantener a lo largo del proyecto.

 Cuando se presenten quejas, sugerencias o comentarios o evidencia de


requerimientos de información no satisfechas.

La actualización del Plan de Gestión de Comunicaciones deberá seguir los siguientes


pasos:
 Identificación y clasificación de stakeholders

 Determinación de requerimientos de información.

 Elaboración/Actualización de la matriz de comunicaciones del Proyecto.

 Actualización del ítem correspondiente del Plan de Gestión de las


Comunicaciones.

 Aprobación del Plan de Gestión de Comunicaciones por el Comité Ejecutivo.

 Difusión del nuevo Plan de Gestión de Comunicaciones de acuerdo a lo


definido en la Matriz de Comunicaciones.

El almacenamiento de los documentos del proyecto deberá seguir las siguientes


pautas:
 Se subirán los archivos según la estructura definida por la empresa.

 Cada nueva versión de un documento debe ser subida en la misma carpeta del
documento origen.

 Las versiones de los documentos deben ser de acuerdo a lo definido por la


empresa.

368
Anexo 2 – Matriz de Riesgos
Tabla 39

Matriz de riesgos del proyecto DATAVIZ


Identificación Análisis Estrategia de respuesta Monitoreo

estrategia planteada

Fecha de cambio de
Acciones realizadas
Categoría - Origen

Tipo de Estrategia

Descripción de la
Descripción del

Situación de la
Impacto (HH)

Exp al Riesgo
Exp al Riesgo

Contingencia
Probabilidad

Responsable
Cód. Riesgo

Disparador

(Costo S/.)

estrategia
Impacto

Nombre
(Horas)

Plan de

Estado
Riesgo

estado
Establecer fechas con
determinados tiempos Iniciar a tiempo
Retrasos en la
Int - Incumplimiento de holgura, que Angela la realización
elaboración y No
DATAVI Equipo en las tareas 70%- permitan cumplir con Camavilca / de los No
presentación de 22 4 Alta 15.40 15.4 Evitar iniciad N/A
Z-R001 de establecidas en el Alta las actividades Jocelyn entregables y Incurrido
los entregables o
trabajo cronograma definidas incluso de Jimenez documentos de
del proyecto
presentarse alguna gestión
eventualidad.
Establecer
Contactar a los
Reuniones fechas fijas
miembros del comité
Avances del Falta de reuniones constantes con de reuniones
o al cliente para Angela
proyecto no con Cliente / Cliente / No semanales
DATAVI Int - El 70%- presentar avances del Camavilca / No
validados a Gerente Profesor / 22 4 Alta 15.40 15.4 Mitigar Gerente iniciad con Cliente / N/A
Z-R002 proceso Alta proyecto y re-agendar Jocelyn Incurrido
tiempo por el Comité de Profesor / o Gerente
reuniones en casos de Jimenez
cliente y comité Proyectos Comité de Profesor /
no disponibilidad en
Proyectos Comité de
fechas acordadas.
Proyectos
Validación
con Cliente /
Evaluación del
Gerente
Reuniones con Restructuración del Angela impacto del
Cambio del Profesor /
DATAVI Int - El Cliente / Gerente 70%- proyecto y del Camavilca / cambio en los Cerrad Incurrido 14/06
alcance del 22 4 Alta 15.40 15.4 Mitigar Comité de
Z-R003 proyecto Profesor / Comité Alta cronograma planteado Jocelyn documentos ya o (Problema) /2016
proyecto Proyectos de
de Proyectos previamente. Jimenez definidos del
los cambios
proyecto
en el
proyecto
Acceso a
Búsqueda de
Falta de Investigación de Búsqueda de fuentes
información en Angela
Int - La información las buenas información en No bibliográficas
DATAVI 70%- 3 diversas fuentes Camavilca / No
tecnologí relacionada al prácticas de las 16 11.20 11.2 Mitigar fuentes iniciad fuera de las N/A
Z-R004 Alta Media confiables que aporten Jocelyn Incurrido
a tema del técnicas de Data brindadas por o opciones
al desarrollo del Jimenez
proyecto Visualization la UPC brindadas por
proyecto.
la UPC
Incumplimiento
de las Revisión de
No asignar tareas Capacitar a los
Int - actividades documentos de Angela
críticas que cubran recursos para No Solicitar
DATAVI Equipo asignadas a los gestión y 70%- 3 Camavilca / No
16 11.20 11.2 Mitigar más tiempo del que optimizar su iniciad cambio de N/A
Z-R005 de recursos de las entregables del Alta Media Jocelyn Incurrido
dispone el recurso tiempo de o recursos
trabajo empresas proyecto por parte Jimenez
para el curso. trabajo
virtuales de la de QS
EISC
Priorizar la búsqueda
No encontrar Implementación de herramientas open Angela Búsqueda de
Int - La No Adquirir una
DATAVI herramientas de las pruebas de 70%- 3 source, y en caso se Camavilca / herramientas No
tecnologí 16 11.20 11.2 Mitigar iniciad herramienta N/A
Z-R006 que se ajusten concepto de los Alta Media requiera, optar por la Jocelyn open source y Incurrido
a o paga
al proyecto lineamientos adquisición de alguna Jimenez pagas
herramienta paga.
Nota. Elaboración propia

370
Referencas Bibliografícas

Centelles, S. (2015). Webdesdecero. Recuperado de http://webdesdecero.com/wireframes-


que-son-y-como-crearlos/

Friedman, V. (2008). Data Visualization and Infographics. Recuperado de


https://www.smashingmagazine.com/2008/01/monday-inspiration-data-visualization-and-
infographics/

Froese, M. & Tory, M. (2016). Lessons Learned from Designing Visualization


Dashboards. IEEE Computer Graphics and Applications, 83 - 89.

Gartner Inc. (2016). About Gartner. Recuperado de http://www.gartner.com/

Gartner Inc. (2016). IT Glossary. Recuperado de http://www.gartner.com/it-


glossary/business-intelligence-bi/

Gartner Inc. (2016). Research Methodologies. Recuperado de


http://www.gartner.com/technology/research/methodologies/methodology.jsp

Kelleher, C. & Wagener, T. (2011). Ten guidelines for effective data visualization in
scientific publications. Environmental Modelling & Software, 822 - 827.

Khan, M. & Shah Khan, S. (2011). Data and Information Visualization Methods, and
Interactive Mechanisms: A Survey. International Journal of Computer Applications, 1-14.

Kozara, R. (2016). Presentation-Oriented Visualization Techniques. IEEE Computer


Graphics and Applications, XXXVI(1), 80 - 85.

Lian, D. & Li, D. (2012). Business Intelligence for Enterprise Systems: A Survey. IEEE
Transactions on Industrial Informatics.

Polyvista. (s.f.). Using Data Visualization to Tell a Better Story. Recuperado de


http://www.polyvista.com/blog/using-data-visualization-to-tell-a-better-story

Ramos, S. (2011). Microsoft Business Intelligence: vea el cubo medio lleno. Alicante:
SolidQ Press.
Real Academia Española. (2014). Recuperado de http://dle.rae.es/?id=ZIkyMDs

Ribecca, S. (s.f.). Recuperado de http://www.datavizcatalogue.com/

Rodríguez, M., Nunes, S. & Devezas, T. (2015). Telling Stories with Data Visualization.
Proceedings of the 2015 Workshop on Narrative & Hypertext, 7 - 11.

SAS Institute Inc. (2014). SAS - The power to know. Recuperado de


http://www.sas.com/content/dam/SAS/en_us/doc/whitepaper1/data-visualization-
techniques-106006.pdf

Schulz, H. & Hadlak, S. (2015). Preset-based generation and exploration of visualization


designs. Journal of Visual Languages & Computing, Pages 9–29.

Zinovyev, A. (2010). Data visualization in political and social sciences. Journal of Visual
Languages & Computing.

Africa Geography Blog. (13 de Julio de 2015). Recuperado el 20 de Mayo de 2016, de


http://geographymaterials.blogspot.pe/2015/07/advantages-and-disadvantages-of-dot-
maps.html

Better Evaluation. (2 de Octubre de 2014). Recuperado el 26 de Mayo de 2016, de


http://betterevaluation.org/evaluation-options/matrixchart

Bi Notes. (05 de 08 de 2015). Recuperado el 03 de 05 de 2016, de http://bi-


notes.com/2015/08/line-charts-kiss-review-sas-visual-analytics/

Datalabs. (s.f.). Recuperado el 05 de 05 de 2016, de http://www.datalabs.com.au/data-


visualization-news/15-most-common-types-of-data-visualisation/

Datameer. (s.f.). Datameer. Recuperado el 08 de 05 de 2016, de


https://www.datameer.com/documentation/current/Polar+Area+Chart#PolarAreaChart-
Color

Dataviz Catalogue. (s.f.). Recuperado el 01 de Mayo de 2016, de


http://www.datavizcatalogue.com/

Fusion Charts. (s.f.). Recuperado el 20 de Mayo de 2016, de


http://www.fusioncharts.com/chart-primers/marimekko-chart/

372
Magazine, E. (05 de 06 de 2012). Scribble Live. Recuperado el 20 de Mayo de 2016, de
http://www.scribblelive.com/blog/2012/06/05/cartesian-vs-radial-charts/

Sankey Diagrams. (s.f.). Recuperado el 20 de Mayo de 2016, de http://www.sankey-


diagrams.com/tag/map/

Software, T. (s.f.).Tableau. Recuperado el 01 de 05 de 2016, de


http://www.tableau.com/sites/default/files/media/which_chart_v6_final_0.pdf

Surrey, U. o. (s.f.). Recuperado el 01 de 05 de 2016, de


http://libweb.surrey.ac.uk/library/skills/Number%20Skills%20Leicester/page_47.htm

Visage. (2015). Visage. Recuperado el 01 de 05 de 2016, de https://visage.co/data-


visualization-101-scatter-plots/

Wattenberg, M.(2002) Arc Diagrams: Visualizing Structure in Strings . Information


Visualization, 110 - 116.

Cybersource. (2002). Linux vs. Windows: Total Cost of Ownership.

Gartner Inc. (2016). Critical Capabilities for Business Intelligence and Analytics
Platforms.

Gartner Inc. (2016). Magic Quadrant for Business Intelligence and Analytics Platforms.

Microsoft. (s.f.). Power BI. Recuperado el 2016, de https://powerbi.microsoft.com/

MorningStar. (s.f.). MorningStar. Recuperado el 2016, de


http://financials.morningstar.com/

Qlik Sense. (s.f.). Qlik. Recuperado el 2016, de http://www.qlik.com/

Tableau Software. (s.f.). Tableau. Recuperado el 2016, de http://www.tableau.com/

Informatica. (2014). Streaming Analytics: Business Intelligence’s Next Stage. California.

O. V., & P. F. (2014). Internet of Things – From Research and Innovation to Market
Deployment. River Publishers Series in Communication. Obtenido de IERC’s River
Publishers Series in Communication.

373
R. C., & M. G. (30 de Marzo de 2016). The Forrester Wave™: Big Data Streaming
Analytics. Obtenido de Forrester Research, Inc: https://go.forrester.com/

Gartner Inc. Interactive Visualization Recuperado de http://www.gartner.com/it-


glossary/interactive-visualization/

AdriaNavarro.net (2011) Tangible Tablets Recuperado de


http://adrianavarro.net/projects/tangibletablets/

Wolf Katrin (2012) Tablet Interaction with Grasping Hands Recuperado de


http://katrinwolf.info/tablet-interaction-with-grasping-hands/

Wolf K., Schleicher R., Rohs M. (2014) Ergonomic Characteristics of Gestures for Front-
and B

Lack-of-Tablets Interaction with Grasping Hands Recuperado de http://katrinwolf.info/wp-


content/uploads/2014/06/mobileHCI2014_poster_gestureCharacteristics_cameraReady.pdf

Robinson, A. H., Early Thematic Mapping in the History of Cartography. Chicago, Il.:
University of Chicago Press, (1982)

Walker, C. & Warren Rogers Associates (2016). Put Your Data on the Map: Using the
GEOCODE and GMAP Procedures to Create Bubble Maps in SAS®. SAS Global Forum
2016.

Bendix, F., Kosara, R. & Hauser, H. (2005). Parallel Sets: Visual Analysis of Categorical
Data. INFOVIS 2005.

Potter, K. (2006). Methods for Presenting Statistical Information: The Box Plot.
Visualization of Large and Unstructured Data Sets, 98-106.

Sawada, J. (2002). A Fast Algorithm for generating Nonisomorphic Chord Diagrams.


SIAM Journal on Discrete Mathematics, 546 - 561.

Tiwari, A., Accenture & Netherlands (2016). Sankey Diagram- A Compelling, Convenient,
and Informational Path Analysis with SAS® Visual Analytics.

Sarikaya, A. & Gleicher M. (2018). Scatterplots: Tasks, Data, and Designs. IEEE
Transactions on Visualization and Computer Graphics, 402-412.

374
Ribecca, S. (2018) Recuperado de http://www.severinoribecca.one/.

Wang, C.; Yu, H.; Ma, KL. Importance-driven time-varying data visualization. IEEE
Transactions on Visualization and Computer Graphics, Vol. 14, No. 6, pp. 1547-1554
(2008).

Lundblad, P.: Dissecting How to Choose the Right Chart. Qlik Blog.
http://global.qlik.com/uk/blog/posts/patrik-lundblad/dissecting-how-to-choose-the-right-
chart (2015). August 2016.

Segel, E.; Heer, J.: Narrative Visualization: Telling Stories with Data. IEEE Transactions
on Visualization and Computer Graphics, Vol. 16, No. 6, pp. 1139-1148 (2010).

Vande, A.; Tomitsch, M.; Wimmer, C.; Boesch, C.; Grechenig, T.: Evaluating the Effect of
Style in Information Visualization. IEEE Transactions on Visualization and Computer
Graphics, Vol. 18, No. 12, pp. 2739-2748 (2012).

Pandey, A.; Manivannan, A.; Nov, O.; Satterthwaite, M.; Bertini, E.: The Persuasive
Power of Data Visualization. IEEE Transactions on Visualization and Computer Graphic,
Vol. 20, No. 12, pp. 2211-2220 (2014)

SAP: Bar Chart. https://digital.sap.com/bar-chart/. August 2016.

Visage: How to Design Bar Charts. https://visage.co/data-visualization-101-bar-charts/.


August 2016.

Visage: How to Design Heat Maps. https://visage.co/data-visualization-101-heat-maps/.


August 2016.

Shamim, A.; Balakrishnan, V.; Tahir, M: Evaluation of opinion visualization techniques.


Information Visualization, Vol. 14, No. 4, pp. 339-358 (2015).

Xiaoyan Bai, X.; White, D.; Sundaram, D.: A Flexible Approach for Visualization
Development. 2010 Sixth International Conference on Signal-Image Technology and
Internet-Based Systems (SITIS), pp. 315-322 (2010).

SAP. Pie Chart. https://digital.sap.com/pie-chart/. August 2016.

SAP. Line Chart. https://digital.sap.com/line-chart/. August 2016.

375
Ribecca, S.: What do you want to show? The Data Visualization Catalogue.
http://www.datavizcatalogue.com/search.html. May 2016.

Hardin, M.; Hom, D.; Perez, R.; Williams, L.: Which chart or graph is right for you?
Tableau Software.
http://www.tableau.com/sites/default/files/media/which_chart_v6_final_0.pdf. June 2016.

Column Chart. Any Chart.


http://www.anychart.com/products/anychart/gallery/Column_Charts/Column_Chart.php.
April 2016.

Ribecca, S.: Radial Bar Chart. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/radial_bar_chart.html. May 2016.

Ribecca, S.: Population Pyramid. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/population_pyramid.html. May 2016

Ribecca, S.: Choropleth Map. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/choropleth.html. May 2016

Choropleth Maps. Indie Maper. http://indiemapper.com/app/learnmore.php?l=choropleth.


May 2016

Choropleth Maps. Barcelona Field Studies Center.


http://geographyfieldwork.com/DataPresentationMappingTechniques.htm. June 2016.

Ribecca, S.: Dot Map. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/dot_map.html. June 2016.

Ribecca, S.: Nightingale Rose Chart. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/nightingale_rose_chart.html. June 2016.

Ribecca, S.: Radial Column Chart. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/radial_column_chart.html. June 2016.

Ribecca, S.: Radar Chart. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/radar_chart.html. June 2016.

376
Selecting the right chart type for your data. Fusion Charts.
http://www.fusioncharts.com/charting-best-practices/selecting-the-right-chart/. August
2016.

Ribecca, S.: Span Chart. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/span_chart.html. August 2016.

Ribecca, S.: Multiset Barchart. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/multiset_barchart.html. May 2016.

Miller, G.: The Magical Number Seven, Plus or Minus Two Some Limits on Our Capacity
for Processing Information. Phychological Review, Vol. 101, No 2, pp. 43-352 (2003).

Choropleth Map. Visually. https://visual.ly/m/choropleth-maps/. June 2016.

Ribecca, S.: Bubble Map. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/bubble_map.html. June 2016.

Ribecca, S.: Bubble Chart. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/bubble_chart.html. June 2016.

Bubble Chart. Fusion Charts. http://www.fusioncharts.com/chart-primers/bubble-chart/.


August 2016.

Ribecca, S.: Flow Map. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/flow_map.html. June 2016.

Dot Maps. Penn State. https://www.e-education.psu.edu/geog486/node/1870. May 2016.

Amidu, E.: Advantages and Disafvantages of Dot Maps. Africa Geography Blog.
http://geographymaterials.blogspot.pe/2015/07/advantages-and-disadvantages-of-dot-
maps.html (2015). May 2016.

Ribecca, S.: Dot Matrix Chart. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/dot_matrix_chart.html. May 2016.

Ribecca, S.: Tree Diagram. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/tree_diagram.html. May 2016.

377
Ribecca, S.: Circle Packing. The Data Visualization Catalogue.
http://www.datavizcatalogue.com/methods/circle_packing.html. May 2016.

Love, C.: Show Me How: Unit Charts. The information Lab.


http://www.theinformationlab.co.uk/2015/03/03/show-me-how-unit-charts/ (2015). May
2016.

Ribecca, S.: Donut Chart. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/donut_chart.html. May 2016.

Ribecca, S.: Marimekko Chart. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/marimekko_chart.html. May 2016.

Ferdio: Pie Chart. Data Viz Project. http://datavizproject.com/data-type/pie-chart/. August


2016.

Ribecca, S.: Pie Chart. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/pie_chart.html. May 2016.

Ribecca, S.: Stacked Bar Graph. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/stacked_bar_graph.html. May 2016.

Ferdio: Stacked Bar Chart. Data Viz Project. http://datavizproject.com/data-type/stacked-


bar-chart/. May 2016.

Ferdio: Proportional Area Chart. Data Viz Project. http://datavizproject.com/data-


type/proportional-area-chart/. May 2016.

Ribecca, S.: Area Chart. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/area_chart.html. May 2016.

Ribecca, S.: Line Graph. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/line_graph.html. May 2016.

Ferdio: Line Chart. Data Viz Project. http://datavizproject.com/data-type/line-chart/. May


2016.

Ribecca, S.: Stacked Area raph. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/stacked_area_graph.html. May 2016.

378
Starr, B.: How to design Scatter plots. Visage. https://visage.co/data-visualization-101-
scatter-plots/ (2015). September 2016.

Ribecca, S.: Scatterplot Map. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/scatterplot.html. June 2016.

Ribecca, S.: Spiral Plot. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/spiral_plot.html. June 2016.

Ferdio: Timeline. Data Viz Project. http://datavizproject.com/data-type/timeline/. June


2016.

Ribecca, S.: Timeline. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/timeline.html. June 2016.

Ferdio: Area Chart. Data Viz Project. http://datavizproject.com/data-type/area-chart/. June


2016.

Ribecca, S.: Area Graph. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/area_graph.html. June 2016.

Ribecca, S.: Stem and Leaf Plot. The Data Visualization Catalogue.

http://www.datavizcatalogue.com/methods/stem_and_leaf_plot.html. May 2016.

Ferdio: Histogram. Data Viz Project. http://datavizproject.com/data-type/histogram/.


August 2016.

Ribecca, S.: Histogram. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/histogram.html. June 2016.

Ferdio: Connection Map. Data Viz Project. http://datavizproject.com/data-type/connection-


map/. June 2016.

Ribecca, S.: Arc Diagram. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/arc_diagram.html. June 2016.

Ferdio: Chord Diagram. Data Viz Project. http://datavizproject.com/data-type/chord-


diagram/. June 2016.

379
Ribecca, S.: Chord Diagram. The Data Visualization Catalogue.
http://www.datavizcatalogue.com/methods/chord_diagram.html. August 2016.

Ribecca, S.: Non Ribbon Chord Diagram. The Data Visualization Catalogue.
http://www.datavizcatalogue.com/methods/non_ribbon_chord_diagram.html. May 2016.

Ribecca, S.: Brainstorm. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/brainstorm.html. May 2016.

Ribecca, S.: Venn Diagram. The Data Visualization Catalogue.


http://www.datavizcatalogue.com/methods/venn_diagram.html. c

Ferdio: Venn Diagram. Data Viz Project. http://datavizproject.com/data-type/venn-


diagram/. August 2016.

SAP: Radial Bar Chart. https://digital.sap.com/radial-bar-chart/. August 2016.

Google Books: Say It With Charts: The Executive’s Guide to Visual Communication.
https://books.google.com.pe/books/about/Say_It_With_Charts_The_Executive_s_Guide.ht
ml?id=9WnzStbbffcC&redir_esc=y. August 2016.

SAP: Stacked Area Chart. https://digital.sap.com/stacked-area-chart/. August 2016.

Andrew Abela, PhD, “Choosing a Good Chart” (2006)

Sardo, Ana. Unemployment vs. birth rates. Behance.

https://www.behance.net/gallery/23426603/Unemployment-vs-birth-rates (2015). June


2017.

Willers, B. The Weight of the World. Behance.


https://www.behance.net/gallery/19862445/The-Weight-of-the-World (2014) June 2017.

Chiu, G. Do you speak Chinese? Behance. https://www.behance.net/gallery/16809363/Do-


You-Speak-Chinese (2014) June 2017.

Wulf, M. Migrations maps: Where are migrans coming from? Where have migranst left?
http://migrationsmap.net/#/USA/arrivals (2007) June 2017.

380
Farmer, C. Chord flow diagram with time slider. http://bl.ocks.org/carsonfarmer/11478345
(2015). June 2017.

Number of Neighbors for World Countries. Visualign.


https://visualign.files.wordpress.com/2011/10/countryneighbors_circular2.png (2011) June
2017.

Skau, D., Harrison, L. & Kosara R. (2015). An Evaluation of the Impact of Visual
Embellishments in Bar Charts, Eurographics Conference on Visualization, Volume 34.

Weber, M., Alexa, M. & Müller, W (2001). Visualizing Time-Series on Spirals, INFOVIS.

MacInnes, J., Riffe, T. & Spijker, J. (2013). Decomposing and recomposing the population
pyramid by remaining years of life, Population Association of Amercia 2014 Annual
Meeting Program.

Skowronnek, A. (2015). Beyond choropleth maps: A review of techniques to visualize


quantitative areal geodata.

Peña Aguilar J., Valencia L., Pastrana A., Nava E., Martinez A., Vivanco M. & Castañeda
A. (2014). Radar Charts Analysis to Compare the Level of Innovation in Mexico with
Most Innovative Countries in Triple Helix Schema Economic and Human Factor
Dimension, Engineering and Technology International Journal of Humanities and Social
Sciences, Vol. 8, No. 4.

Robertson, G., Fernandez, R., Fisher, D., Lee, B. & Stasko J. (2008). Effectiveness of
Animation in Trend Visualization, IEEE Transactions on Visualization and Computer
Graphics, Volume 14.

Phan D., Xiao L., Yeh R., Hanrahan P. & Winograd, T. (2005). Flow Map Layout,
Proceedings of Information Visualization.

Turner E. & Allen J. (2010) Issues in Depicting Population Change with Dot Maps,
Cartography and Geographic Information Science, 189-197.

Fischer F., Fuchs J. & Mansmann F. (2012). ClockMap: Enhancing Circular Treemaps
with Temporal Glyphs for Time-Series Data, Eurographics Conference on Visualization.

381
Skau Dr. & Kosara R. (2016). Arcs, Angles, or Areas: Individual Data Encodings in Pie
and Donut Charts, Eurographics Conference on Visualization, Volume 35.

Szigeti, S., Patrasc, J., Schnitman, D. & Diamond S. (2015). The Stacked-Stacked Bar
Graph: A new twist on an old visualization.

Guha, S., Koudas N. & Shim K. (2006). Approximation and Streaming Algorithms for
Histogram Construction Problems, ACM Transactions on Database Systems, Volume 31,
396 - 438.

Wang, Q. (2010). Drawing Tree Diagrams: Problems and Suggestions, Journal of


Language Teaching and Research, Volume 1, 926-934.

Imágenes
Cohen, B. & Nightingale (s.f). F. Scienti_c American [Ilustración]. Recuperado
de http://nht.ecs.soton.ac.uk/2015/papers/2-mrodriguez.pdf

European Journalism Centre (2010) Data-driven journalism: What is there to learn?


[Ilustración] Recuperado de http://nht.ecs.soton.ac.uk/2015/papers/2-mrodriguez.pdf

Few, S. (2009) Now You See It [Ilustración adaptada] Recuperado de http://ac.els-


cdn.com/S1364815210003270/1-s2.0-S1364815210003270-main.pdf?_tid=04b50caa-
1b46-11e6-904f-
00000aacb35e&acdnat=1463390002_386b9755b63b5d8ad689ac1ecb800336

GCN Technology (2016) Tools and Tactics for Public Sector IT. Map of Foreign
Assistance [Ilustración] Recuperado de https://gcn.com/articles/2015/08/19/mission-data-
visualization.aspx?m=1

Visualizing Data (2010) How The Goverment Spends your money [Ilustración]
Recuperado de http://www.visualisingdata.com/2010/10/guardian-interactive-you-make-
the-cuts/

382
Microsoft (2014) Adding muscle to data visualization: new Power BI features [Ilustración]
Recuperado de https://blogs.microsoft.com/iot/2014/12/19/adding-muscle-to-data-
visualization-new-power-bi-features/

FlowingData (2016). Lower socioeconomic status linked to lower education attainment


[Ilustración] Recuperado de http://flowingdata.com/2016/05/02/lower-socioeconomic-
status-linked-to-lower-education-attainment/

Dataprix (2009) Data Warehouse manager. [Ilustración] Recuperado de


http://www.dataprix.com/datawarehouse-manager

Dataprix (2014) Consideraciones procesos ETL en entornos Big Data: Caso Hadoop.
[Ilustración] Recuperado de http://www.dataprix.com/blog-it/big-data/consideraciones-
procesos-etl-entornos-big-data-caso-hadoop

Schulz, H. y Hadlak, S. (2011) In situ exploration of large dynamic networks [Ilustración]


2334–2343. Recuperado de http://dx.doi.org/10.1109/TVCG.2011.213.

Froese, M. & Tory, M. (2016). [Ilustración] Recuperado de


http://dx.doi.org/10.1109/MCG.2016.33

Gartner Inc. (2016) Magic Quadrant for Business Intelligence and Analytics Platforms
[Ilustración]. Recuperado de https://www.gartner.com/doc/reprints?id=1-
2XXKCD7&ct=160204&st=sb

Gartner Inc. (2016) Product/Service Rating on Critical Capabilities [Ilustración adaptada]


Recuperado de https://www.gartner.com/doc/reprints?id=1-2RVRL5R&ct=151110&st=sb

Microsoft Inc. (2016) Publicado en Power BI Whitepaper. Estados Unidos: Microsoft.

Tableau Software (2016) Data Security [Tabla] Recuperado de


https://onlinehelp.tableau.com/current/server/en-us/security_data.htm

383
Wolf K., Schleicher R., Rohs M. (2014) Gesture vectors (grey) and median for front
(orange) and back (black, see-through view) of a tablet, drawn to scale of a tablet screen of
1280x742 pixels. [Ilustración] http://katrinwolf.info/wp-
content/uploads/2014/06/mobileHCI2014_poster_gestureCharacteristics_cameraReady.pdf

384

También podría gustarte