Bigdata-En La Practica
Bigdata-En La Practica
Bigdata-En La Practica
La revolución
analítica:
el Big Data en
la práctica
Los ‘data driven business’ (empresas como Google, Amazon,
Facebook, Yahoo, Twitter, Netflix y el resto de la comunidad
‘open source’, que basan su éxito en el análisis de la
información que reciben de sus usuarios) han generado
con éxito un nuevo estándar de servicio consistente en
proporcionar a sus clientes una experiencia única basada en
una personalización absoluta. El Big Data ya ha dejado de ser
un fenómeno para convertirse en una realidad. Pero ¿cómo lo
emplean las empresas y qué ejemplos encontramos en cada
L
sector? Aplican los viejos algoritmos a nuevos datos y les
confieren usos que antes ni siquiera se nos habrían ocurrido
• Ecomo
mpresas de moda usan las redes sociales
YouTube para detectar tendencias
zamos. Lo hizo Amazon cuando cambió com-
pletamente la experiencia de comprar en In-
en el momento en que aparecen. ternet con su aclamado servicio “Clientes
como tú...”, que era capaz de analizar las com-
• CNetflix
ompañías de video on demand como
aseguran el éxito de sus series de
pras realizadas y recomendar los libros que
habían comprado usuarios con gustos afines.
TV (House of cards) en función de la ex- Y lo hace Facebook cada vez que selecciona y
tracción, transformación y lectura de los prioriza para nosotros, en base a su famoso
datos procedentes de las recomendacio- algoritmo Edge Rank, qué contenido, de todo
nes de los usuarios. el que generan aquellos a quienes seguimos
(amigos, conocidos y empresas), debe mos-
• DFestival
urante la semana en que se celebró el
de Eurovisión, en mayo de 2015,
trarnos en nuestro timeline para que conti-
nuemos cada día “enganchados” a su red.
un grupo de ingenieros de Microsoft es-
pecializados en matemáticas predictivas ¿CÓMO LO HACEN?
Estos data driven business han generado un
nuevo estándar de servicio basado en la perso-
Los ‘data driven nalización absoluta de la experiencia del clien-
business’ desarrollan te, al que el resto de industrias se tendrán que
adaptar si quieren sobrevivir en la nueva eco-
modelos predictivos nomía de servicios digitales que gobernará
mediante un complejo nuestro siglo. ¿Cómo lo hacen? Generan algo-
proceso, casi artesanal, ritmos: desarrollan modelos predictivos me-
diante un complejo proceso, casi artesanal,
liderado por la figura liderado por la figura del data scientist, una
del ‘Data Scientist’ especie de “alquimista” moderno que es capaz
de extraer y destilar conocimiento de los datos.
Para ello, el método que sigue el científico de
usó el Big Data para tratar de predecir datos consiste en:
cuál sería el resultado: combinando las
búsquedas realizadas en los buscadores 1. Simplificar el problema de negocio hasta
con el entusiasmo y sentimiento que los formular una pregunta a la que se quiere
distintos cantantes despertaban en las dar respuesta.
redes sociales, confeccionó una lista de
los países con más probabilidades de lle- 2. L
impiar las impurezas que se acumulan
varse a casa la victoria. en los datos.
Caso de éxito. Si hay una compañía turís- tancia a recorrer, gracias a un algoritmo de
tica que está sabiendo captar todo el potencial cálculo de precio.
del Big Data, esa es, sin duda, Uber. Esta com- Patentado bajo el nombre Surge Pricing, es-
pañía internacional proporciona transporte a te sistema se apoya en herramientas analíticas
sus clientes mediante una conexión entre pa- que no solo tienen en cuenta la oferta y la de-
sajeros y conductores de vehículos basada en manda para un trayecto en concreto, sino que,
una aplicación móvil que organiza los contac- además, son capaces de calcular, en tiempo
tos en ciudades de todo el mundo. Aparte de lo real y usando datos de GPS, la duración esti-
controvertido del mecanismo, que ha sido mada de ese trayecto en función de la monito-
puesto en tela de juicio por empresas de taxis, rización de las condiciones del tráfico ➤ ➤ ➤
32 DOSSIER Harvard Deusto Márketing y Ventas
ridades (el Banco de España hace tiempo que con su mismo vehículo y compañía acaban de
ha puesto techo a la retribución de los depó- cambiar su seguro a la compañía ‘X’, con lo
sitos). En este escenario, las entidades solo que han conseguido ahorrar un 28% anual.
pueden competir y diferenciarse unas de otras Esta compañía trabaja con nuestra entidad,
a través de la experiencia de los clientes. Pero, por lo que, si lo desea, con solo decir la palabra
para poder ofrecerles una experiencia dife- ‘autorizo’, nosotros mismos llevaremos a cabo
rencial y completamente personalizada, lo todos los trámites para gestionar su cambio
primero, e indispensable, es conocerles hasta de póliza. El ahorro calculado para usted es
el más mínimo detalle, para darles lo que quie- de 254 euros al año. ¿Desea algo más?”.
ren en cada momento. Todo este largo párrafo, que puede pare-
Si nos dedicamos a este negocio, la “banca cernos hoy ciencia ficción, no lo es, realmen-
del conocimiento” significa que, cuando nos te. Las entidades financieras trabajan ya en
llame un cliente, podamos anticiparnos y de- desarrollar lo que llaman “visión 360 grados
cirle: “Sr. Martínez, sabemos que nos llama del cliente”, algo que les permitirá no solo co-
porque el cajero en el que usted se encuentra nocer al dedillo todos nuestros datos finan-
ahora se acaba de estropear y se ha quedado cieros, sino también nuestros gustos, aficio-
con su tarjeta. Disculpe las molestias y no se nes, hábitos y estilos de vida, inferidos a
preocupe, porque ya le hemos enviado una través de los pagos que realizamos por tarje-
nueva a su domicilio. Además, le facilitamos ta, nuestras domiciliaciones, recibos e, inclu-
un código SMS con el que podrá sacar gratui- so, nuestra cuenta de Twitter. Podrán saber,
tamente dinero en otro cajero que está a dos- por tanto, si llevamos un estilo de vida lujoso
cientos metros de su localización actual. Pa- o ahorrador, si nos gusta salir a cenar o a co-
‘analytics’ y gestión de datos
DOSSIER 33
mer los fines de semana, si viajamos de ma- más volumen de transacciones y de mayor
nera frecuente, si somos deportistas… Todo importe medio, y, además, sus clientes acu-
ello, con el objetivo de desarrollar potentes den desde mayor distancia a comprar allí,
algoritmos, motores de decisión que en tiem- obtendrá un mejor scoring de riesgo, teniendo
po real nos ofrecerán productos y servicios más probabilidades de obtener un crédito, y,
adaptados completamente a nuestras nece-
sidades y que nos tienen que garantizar, a
priori, una experiencia verdaderamente di- Las entidades
ferencial en cada uno de nuestros contactos financieras trabajan
con la entidad.
ya en desarrollar lo
Caso de éxito. Francisco González, presi- que llaman “visión 360
dente de BBVA, declaraba en diciembre de 2013, grados del cliente”,
en una entrevista titulada Banks need to take
on Amazon and Google or die, publicada en Fi- algo que les permitirá,
nancial Times, que “la gran competencia” de la no solo conocer al
banca del futuro la constituirán Google, Ama-
zon, PayPal y Facebook, y que todos aquellos
dedillo todos nuestros
bancos que no sean capaces de desarrollar las datos financieros, sino
mismas capacidades que tienen estas compa- también nuestros gustos,
ñías para dar a sus clientes exactamente lo que
necesitan, gracias al análisis de sus datos, es-
aficiones, hábitos
tán destinadas a desaparecer. Pues bien, si al- y estilos de vida
go hay que “admirar” en el presidente de BBVA
no es solo su visión de futuro, sino la capacidad
de hacer realidad lo que dice y de predicar con el banco, mayor seguridad de que lo va a re-
el ejemplo: en 2014, el banco anunciaba la crea- cuperar en el futuro.
ción, no de un departamento, sino de toda una Pero las posibilidades de explotar esta in-
empresa dedicada al Big Data, un spin-off bau- formación exceden más allá de la propia en-
tizado como BBVA Data Analytics. tidad financiera, porque son muchos los ac-
El objetivo de esta empresa es maximizar el tores que podrían beneficiarse de su correcta
enorme valor que tienen los datos de los millo- explotación. Como el Ayuntamiento de Ma-
nes de clientes del banco (movimientos de drid, que, en una colaboración conjunta rea-
cuentas, contratos, e-mails, llamadas telefóni- lizada recientemente para estudiar el turismo
cas…). Pero, sobre todo, donde ha encontrado de la capital, tras analizar los datos de los pa-
un auténtico filón es en los millones de tran- gos generados con tarjeta durante el desfile
sacciones al día que suponen los pagos reali- del Orgullo Gay de los años 2011 y 2012, deci-
zados con las tarjetas de crédito, perfectamen- dió rectificar el recorrido de 2014 para bene-
te geolocalizados a través de los terminales de ficiar a decenas de pequeños comercios y po-
punto de venta y debidamente agregados y tenciar las oportunidades económicas del
anonimizados para salvaguardar la privacidad evento.
de sus clientes.
Son múltiples los procesos del banco que ▶ MONETIZACIÓN DE LOS DATOS EN
pueden beneficiarse de incluir nuevos algo- LAS COMPAÑÍAS DE TELECOMUNI-
ritmos matemáticos o modificar los tradicio- CACIONES. Los nuevos competidores digi-
nales incorporando esta nueva información, tales, como WhatsApp o Skype, están “obli-
como el proyecto Risk360, que busca predecir gando” a las compañías de telecomunicaciones
la probabilidad de default de un negocio a a buscar nuevas formas de ingresos que hagan
partir de la información contextual de sus sostenible su negocio en el futuro. Las más
pagos. Si el nuevo algoritmo detecta, por innovadoras están apostando por la diversi-
ejemplo, que un negocio, ya sea una peluque- ficación y la apertura de nuevas líneas de ne-
ría o una panadería, al compararlo con esta- gocio, como sería, por ejemplo, la monetiza-
blecimientos similares de su zona, presenta ción del Big Data. ¿En qué consiste? ➤ ➤ ➤
34 DOSSIER Harvard Deusto Márketing y Ventas
➤ ➤ ➤ Pues se trata de algo tan sencillo co- cadena de moda que quiere abrir una nueva
mo aprovechar todos los datos que tienen es- tienda y que se debate entre varios locales co-
tas compañías de sus clientes para identificar merciales disponibles. ¿Cuánto estaríamos
a aquellos que puedan ser de interés a otras dispuestos a pagar por obtener una informa-
empresas, y, una vez anonimizados y agrega- ción que puede suponer el éxito o el fracaso de
dos debidamente para salvaguardar la priva- nuestro futuro negocio?
cidad, comercializarlos y obtener ingresos Pero no solo el sector retail es un potencial
adicionales. usuario de este tipo de servicios. El sector tu-
rístico, el transporte y toda la Administración
Caso de éxito. Esta monetización es preci- Pública en general necesitan hacer uso inten-
samente lo que está llevando a cabo Telefónica sivo de estas nuevas fuentes de información.
a través de Smart Steps, un producto que se Por ejemplo, si fuésemos los responsables de
encarga de procesar de manera masiva todos
los eventos de red, señales que emiten nuestros
móviles constantemente a la red de antenas
con el objetivo de estar geolocalizados y poder
realizar llamadas. El objetivo es saber, en cada
punto de la ciudad, cuántas personas transi-
tan en cada momento del día. Pero no solo eso,
sino poder analizar también qué edad tienen,
si son mayoría de hombres o mujeres, qué es-
tilo de vida llevan, qué modo de transporte
utilizan, la frecuencia con la que realizan esa
ruta, o incluso saber de dónde proceden y a
qué distancia queda su lugar de trabajo o el
domicilio habitual. Todo ello debidamente pre-
sentado a través de un sistema de información
geográfica que representa esta información
de manera visual y fácilmente analizable. Es- movilidad de una gran ciudad y tuviésemos
ta información permite hacer estudios esta- que programar la frecuencia de una línea de
dísticos geotemporales que ayudan a analizar metro, elegir el recorrido y paradas de los au-
áreas de consumo, hacer comparaciones entre tobuses o decidir cuándo es el mejor momen-
zonas para saber cuál tiene mayor potencial to para acometer una nueva obra de infraes-
para la captación de clientes, adaptar promo- tructura, ¿no nos sería útil poder disponer de
ciones de street marketing en ubicaciones con los flujos de movimiento entre los distintos
mayor movilidad de personas, determinar cuál barrios de la ciudad por tramo horario? ¿Cómo
es la mejor zona para abrir un nuevo local… afectaría a la ciudadanía disponer de una in-
Pensemos, por ejemplo, que somos una gran formación que permitiese mejorar la toma de
‘analytics’ y gestión de datos
DOSSIER 35
este tipo de decisiones, que tanto nos impac- frenamos bruscamente, el número de acciden-
tan en el día a día? tes de cada tramo de vía que transitamos o la
frecuencia con la que realizamos un mismo
▶ SEGUROS BASADOS EN NUESTROS trayecto son solo algunos de los datos que,
COMPORTAMIENTOS. Otro claro ejemplo una vez analizados por un potente algoritmo
de cómo el Big Data va a cambiar radicalmen- matemático, determinarán el precio más ade-
te la forma tradicional de hacer las cosas en cuado para cada cliente en función de su com-
un sector es el de los seguros de automóvil. portamiento como conductor y, por tanto, del
Como todos sabemos, hasta ahora, el precio riesgo calculado que tenga de estar involucra-
de nuestro seguro venía influido por las carac- dos en un accidente.
terísticas particulares de nuestro vehículo,
más allá de lo bueno o malo que fuera cada uno Caso de éxito. Aunque en Europa apenas
se han dado a conocer hasta hace unos meses,
en Estados Unidos, los seguros de automóviles
Pay as you Drive surgieron ya hace unos cuan-
tos años, y más de treinta compañías asegu-
radoras ofrecen esta modalidad. De entre to-
das ellas, destaca Progressive Insurance, la
cuarta aseguradora del país, pionera en el uso
de tecnologías telemáticas y que, además,
cuenta con Snapshot, el programa Pay as you
Drive más popular entre los conductores ame-
ricanos. Consiste en la instalación de un dis-
positivo que, durante treinta días, monitoriza
los hábitos de conducción y analiza paráme-
tros como el tiempo que le dedicamos a con-
ducir, a qué horas del día o con qué frecuencia
frenamos violentamente o precipitadamente.
Progressive puede aplicar descuentos hasta
del 30% a los mejores conductores, es decir, a
aquellos que eviten conducir a las horas en que
ocurren más accidentes de tráfico o a los que
conduzcan menos tiempo.
Snapshot fue lanzado en enero de 2008, y
desde entonces ha logrado unas espectacula-
res cifras solo comprensibles desde la óptica
del Big Data: su base de datos, de más de cien-
to diez terabytes (unas siete veces la cantidad
de información almacenada en la librería del
Congreso de Estados Unidos), ha sido genera-
da por los dos millones de clientes del progra-
ma, que han realizado un total de 1.500 millo-
nes de desplazamientos de 10,6 quilómetros
al volante. La capacidad de procesar millones de media cada uno, lo que significa tener al-
de registros que facilitan las herramientas de macenados y analizados unos 16.000 millones
Big Data va a permitir a las compañías de se- de quilómetros de conducción, o, lo que es lo
guros cambiar esta forma tradicional, e injus- mismo, el equivalente a 50 viajes de ida y vuel-
ta, de fijar los precios. ta desde el Sol a la Tierra.
Para ello, algunas compañías se han lan- En lo económico, Snapshot no ha parado de
zado a instalar sensores en los vehículos de crecer desde su lanzamiento. Actualmente
sus asegurados, que recogen vía satélite gigas genera unos dos mi seiscientos millones de
de información cada vez que suben a ellos. La euros en pólizas anuales, lo que representa ya
velocidad a la que conducimos, las veces que un 15% del negocio total de la compa- ➤ ➤ ➤
36 DOSSIER Harvard Deusto Márketing y Ventas
➤ ➤ ➤ ñía, que, además, no cesa de probar ción de sus pruebas clínicas, sino que sofisti-
nuevos modelos de negocio: desde 2015, no cados algoritmos de decisión analizarán todas
solo los buenos conductores se verán benefi- y cada una de nuestras características indivi-
ciados con un descuento de hasta el 30% en su duales: genética, hábitos alimenticios, forma
póliza, si no que Progressive empezará tam- física, estilo de vida e, incluso, estado de ánimo.
bién a penalizar a los malos conductores con Variables todas ellas que serán tenidas en cuen-
mayor riesgo de accidente con hasta un 10% ta para asegurar que se da a cada paciente el
adicional en su póliza. tratamiento adecuado en el momento adecua-
En España, Generali, con una modalidad de do, para garantizarle así los mejores resultados
seguro bajo el nombre “Pago como conduzco”, de salud.
y Mapfre, con el modelo llamado “YCAR”, son
las primeras aseguradoras que han introduci- Caso de éxito. Que una decisión correcta
do en el mercado español este tipo de pólizas. puede suponer la diferencia entre la vida y la
muerte para un paciente es lo que quizá debió
▶LA PROMESA DE UNA MEDICINA de pensar IBM cuando, tras desarrollar Wat-
DE PRECISION. Pero no todo es maximizar son, un ordenador capaz de entender cualquier
beneficios en el mundo del Big Data. Si hay un pregunta formulada por una persona y respon-
sector en el que la capacidad de analizar infor- der con certeza en tiempo real, que se hizo fa-
mación para la toma de decisiones más certe- moso tras ganar el concurso de preguntas y
ras cobra especial relevancia es el de la salud, respuestas más popular de la TV americana
donde una decisión correcta puede suponer la (Jeopardy), decidió afrontar el reto de enseñar-
diferencia entre la vida y la muerte para un pa- le medicina. Un año después, en colaboración
ciente. Pero el Big Data no solo está presente con el prestigioso Centro Oncológico Memorial
en el mundo de la salud con el uso de técnicas Sloan-Kettering, Watson ha desarrollado el
de inteligencia artificial para apoyar o mejorar conocimiento necesario para realizar diagnós-
las capacidades diagnósticas de los médicos. ticos y ofrecer recomendaciones de tratamien-
Las herramientas de Big Data han sido claves to a personas diagnosticadas con cáncer.
también para acelerar y abaratar los costes de Tras incorporar más de medio millón de
la secuenciación del genoma humano y para pruebas médicas, alrededor de dos millones de
facilitar el uso de dispositivos wearables, que páginas de texto de investigación sobre cáncer
recogen mediante sensores millones de datos de mama y de pulmón y los registros de 1,5 mi-
generados por nuestro organismo. Son estos llones de pacientes diagnosticados, los exper-
tos enseñaron a Watson cómo procesar, ana-
lizar e interpretar el significado de toda esta
Pocas personas información durante meses, en un esfuerzo
debieron creer, cuando que, sin duda, mereció la pena y que ha cam-
biado el rumbo de la medicina para siempre.
vieron en 2002 la Actualmente, Watson ha demostrado ser capaz
película ‘Minority de diagnosticar correctamente el 90% de los
Report’, que vivirían casos de cáncer de pulmón, mientras que, de
media, un especialista en oncología solo es ca-
para ver un ordenador paz de diagnosticar correctamente el 50%.
ayudando a predecir
▶ ANALÍTICA CONTRA EL CRIMEN.
dónde y cuándo se va a Pero si ha habido un entorno en el que el uso
producir un crimen del Big Data siempre ha llevado aparejada po-
lémica, este ha sido el de la seguridad, por las
múltiples consideraciones legales, éticas y de
dos de los cambios tecnológicos que nos per- privacidad que trae consigo. La capacidad de
mitirán hacer realidad la promesa de una ver- las nuevas tecnologías de Big Data para anali-
dadera medicina de precisión. De esta forma, zar en tiempo real datos no estructurados (tex-
los médicos serán capaces de personalizar pa- to, audio, imágenes o videos) ha convertido
ciente a paciente el tratamiento no solo en fun- algoritmos y modelos predictivos en las nuevas
‘analytics’ y gestión de datos
DOSSIER 37
“armas” de la lucha contra el crimen. Tras los variables que caracterizan cada uno de los su-
atentados del 11 de septiembre en Estados Uni- cesos delictivos acontecidos (hora del día, día
dos, los gobiernos americanos e israelí dieron de la semana, calle y número, tipo de crimen
un fuerte impulso al desarrollo de sistemas cometido, personas implicadas, su edad y se-
capaces de analizar millones de comunicacio- xo…), y se ha enriquecido con otras fuentes de
nes telefónicas y correos electrónicos para de- información de la ciudad que aportan datos
tectar redes de terroristas mediante complejos sociodemográficos y medioambientales de ca-
algoritmos de minería de texto y de análisis del da punto urbano (desde el número de viviendas
lenguaje natural. La aplicación de algoritmos a la temperatura, el ciclo lunar o la hora a la
de redes neuronales para el tratamiento de que amanece y anochece, pasando por la altu-
imágenes permite hacer el matching entre las ra media de los habitantes de cada zona o su
personas que aparecen en un video o una foto- nivel de ingresos).
grafía y en cualquier base de datos de crimina- A toda esta gran base de datos se han apli-
les para identificar posibles sospechosos. Y cado los más modernos algoritmos predicti-
mediante algoritmos de lógica difusa que ana- vos para identificar patrones que permiten
lizan números de teléfono, nombres, nicks, etc. desarrollar un modelo predictivo que, basán-
puede identificarse a un mismo individuo que dose en los cientos de variables analizadas,
utiliza identidades diferentes en Internet, lo indique con un grado de fiabilidad suficiente
que permite a los investigadores conseguir des- cuál es, en cada punto de la ciudad y en cada
articular redes de fraude en la red. momento del día, la probabilidad de que se
cometa un acto criminal. Con esta informa-
Caso de éxito. Pocas personas debieron ción ya nos podemos imaginar que, cada día,
creer, cuando vieron en 2002 la película Mino- se definen las rutas exactas que tienen que
rity Report, que vivirían para ver un ordenador realizar las diferentes patrullas, permitiendo
ayudando a predecir dónde y cuándo se va a a los agentes estar en el sitio adecuado en el
producir un crimen. De hecho, muchos todavía momento adecuado y persuadiendo a los cri-
hoy lo considerarían ciencia ficción o algo que, minales de hacer algo de lo que luego puedan
al final, es meramente imposible. Excepto en arrepentirse, lo que les ha facilitado reducir
Memphis, donde, si preguntásemos a cualquier la tasa de criminalidad en más de un 30% en
policía, nos respondería que para ellos esto es los dos últimos años.
algo tan normal como comerse un Donut para Y es que, como nos demuestra este último
desayunar. Y es que, efectivamente, el Depar- caso, no existen apenas límites en cuanto a lo
tamento de Policía de Memphis (Tennessee) ha que podemos hacer en el ámbito del Big Data
implantado un innovador sistema de Big Data, para mejorar la sociedad en la que vivimos.
en colaboración con IBM, que está ayudando Ahora solo nos queda terminar de entender
a los agentes en su lucha contra el crimen. cómo podemos impulsar el uso de todas estas
El primer reto ha sido digitalizar la informa- tecnologías sin que el hacerlo suponga un ries-
ción en papel para, posteriormente, dotarla de go para la seguridad y la privacidad de las per-
una estructura que permitiera poderla anali- sonas, pero sin permitir tampoco que leyes del
zar. Sobre toda esta información se han apli- siglo pasado nos hagan evolucionar más des- “La revolución analítica:
el Big Data en la práctica”.
cado algoritmos de procesamiento del lengua- pacio de lo que lo hace el pensamiento abierto © Planeta DeAgostini
je natural que han posibilitado identificar las de nuestra sociedad digital. ■ Formación, S.L.