Ebook: Herramientas de Visualización de Datos
Ebook: Herramientas de Visualización de Datos
Ebook: Herramientas de Visualización de Datos
02
03
Herramientas de
visualizacin de datos
cientfico de datos
La ciencia del dato se erige en nuestros das como una profesin
multidisciplinar. Esta pretende ser una gua bsica de recursos en
cada una de las facetas desempeadas por estos profesionales.
HERRAMIENTAS
Y LENGUAJES
SQL
pyODBC
Sqlite
mxODBC
SQlite3
SQLAlchemy
RSQlite
pandas
Toad
data.table
Tora
XML
RapidMiner Jsonlite
Knime
Pentaho
RODBC
RJDBC
json
Gestin de datos
Parte del trabajo del cientfico de datos es la
captura, depuracin y almacenamiento de la
informacin en un formato adecuado para su
tratamiento y anlisis.
El caso ms frecuente ser el acceso a una rplica
de los datos para una captura puntual o peridica.
Ser necesario conocer SQL para acceder a la
informacin almacenada en bases de datos
relacionales. Cada base de datos tiene una consola
Anlisis de datos
Si bien las reas de business intelligence, data
warehousing y machine learning son objetos de
la ciencia de datos, es esta ltima la ms
diferencial en el sentido que necesita de un
nmero mayor de utilidades especficas.
En cuanto a lenguajes de programacin,
imprescindibles en nuestra caja de herramientas
son R y Python, los ms utilizados para el
aprendizaje automtico.
Si necesitamos modificar algn paquete de R requeriremos C++ y disponer de utilidades que nos permitan
volver a generarlos: Rtools o devtools facilitan todos los procesos relacionados con el desarrollo.
Clustering: cluster.
Una mencin especial requieren los entornos distribuidos. Si hemos trabajado con datos procedentes de una
entidad o empresa de cierto tamao probablemente tengamos experiencia con el denominado ecosistema
Hadoop. Hadoop es en su origen un sistema distribuido de ficheros (HDFS) dotado de unos algoritmos
(MapReduce) que permiten realizar procesamiento de la informacin en paralelo.
Visualizacin
Para terminar una breve referencia a
la presentacin de los resultados.
Las herramientas ms utilizadas en R
son sin duda lattice y ggplot2 y en
Python Matplotlib, pero si necesitamos
presentaciones profesionales
integradas en entornos web la mejor
opcin sin duda es D3.js.
Entre los entornos integrados de
business intelligence, con un enfoque
claro a la presentacin, destacar
Tableau, el ms conocido, y como
alternativas para la exploracin grfica
de datos, Birst y Necto.
Cinco herramientas
de visualizacin de datos que
no debes perder de vista
NDICE DE HERRAMIENTAS
DE VISUALIZACIN
Google Fusion Tables
CartoDB
Tableau Public
iCharts
Smart Data Report
CartoDB
Se trata de un servicio open source dirigido a
cualquier usuario, independientemente del nivel
tcnico que tenga, con una interfaz muy amigable.
Permite crear una gran variedad de mapas
interactivos, lo que permite elegir entre el catlogo
que el mismo servicio ofrece, incluir mapas
de Google Maps, o agregar a la lista tus propios
mapas personalizados.
Lo ms interesante es que es posible tener acceso a
los datos de Twitter para ver cmo los usuarios
reaccionan ante una marca, una determinada
campaa de marketing o un evento. Un buen
ejemplo de ello lo podemos ver en el mapa de
seguimiento de tuits que se cre el pasado ao con
motivo del lanzamiento del ltimo lbum
de Beyonce en el que, claramente, se puede
observar los lugares donde ms impacto tuvo. Toda
una fuente de informacin visual para los
profesionales del marketing y de negocio.
Tableau Public
Con Tableau Public puedes crear mapas
interactivos, grficos de barras, tartas, etc. de forma
sencilla. Una de sus ventajas es que, al igual que
con Google Fusion Tables, es posible importar
tablas de Excel para facilitar tu trabajo. En cuestin
de minutos, puedes crear un grfico interactivo,
embeberlo en tu pgina web y compartirlo. Por
ejemplo, el medio de comunicacin Global
Post cre una serie de grficos sobre cules son los
mejores pases para hacer negocios en frica.
Recientemente, lanzaron su versin 8.2. En ella
tambin podemos encontrar la nueva
herramienta OpenStreetMap que permite generar
mapas muy detallados a partir de datos locales,
como cafeteras o tiendas. Tableau Public es una
herramienta gratuita, aunque existe tambin una
versin de pago.
iCharts
Con esta herramienta puedes iniciarte en el mundo
de la visualizacin de datos. iCharts cuenta con una
versin gratuita (Basic) y dos de pago (Platinum y
Enterprise). Con esta herramienta puedes crear
visualizaciones en pocos pasos exportando
documentos de Excel y Google Drive, o aadir
datos manualmente.
A travs de esta herramientas tambin es posible
compartir tus grficos con tus colaboradores de
forma privada, adems de poder editar y actualizar
cuatro tutoriales
03. TUTORIALES
Mapear datos
CartoDB nos explica cmo convertir los datos de localizacin en conocimiento para tu negocio. En este
tutorial podrs aprender a analizar, visualizar y construir aplicaciones de datos a travs de su herramienta.
03. TUTORIALES
Aprendizaje automtico
Ahora que se acerca el verano, Andrs Gonzlez, responsable de soluciones de Big Data y Data Prediction en
Clever Task, nos ensea cmo hacer predicciones de los datos en un caso muy concreto: el sector turstico.
03. TUTORIALES
Apps geoespaciales
Y si lo que quieres es aprender a crear aplicaciones con datos geoespaciales no te puedes perder este
tutorial, tambin de CartoDB, en el que se explica cmo puedes sacar provecho de una API, en este caso la
que abri BBVA para el concurso InnovaChallenge, y as poder crear apps y visualizaciones.
03. TUTORIALES
compartir
TE PUEDE INTERESAR
Regstrate
para estar al da
de las ltimas
tendencias
www.bbvaopen4u.com