Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
0% encontró este documento útil (0 votos)
63 vistas9 páginas

Mineria de Datos

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1/ 9

Introducción

Las instituciones y empresas privadas coleccionan bastante información (ventas,


clientes, cobros, pacientes, tratamientos, estudiantes, calificaciones, etcétera, según
su giro), aprovechando que las computadoras y los discos de almacenamiento se
han abaratado, y las comunicaciones son también baratas y confiables. Esta
información reside en bases de datos operacionales, llamadas así porque con
ellas se lleva a cabo la labor primordial de la empresa: envío de mercancía a
clientes, registro de estudiantes, tratamiento a pacientes, cobranza, entre otros.

Posteriormente la información se depura y se resume para transferirla a bases de


datos conocidas como bodegas de datos. Son evidencias periódicas (trimestrales,
tal vez) del estado de la empresa. Aquí se lleva a cabo la labor estratégica de ella:
averiguar qué pasa en la organización. ¿Qué productos se venden
significativamente menos? ¿La materia prima utilizada ha sufrido aumentos en su
costo? ¿La relación con nuestro proveedor es nuestra mejor opción? Ésta es la
zona de las decisiones estratégicas, y los sistemas usados para ellas se conocen
como Sistemas de Apoyo a la Toma de Decisiones. Estos sistemas muestran al
funcionario los indicadores principales del estado de la empresa (en cualquier
período que se quisiese revisar). El directivo de la empresa indaga o averigua
situaciones que él cree son de interés o preocupación. El sistema contesta con
datos y gráficas para que el director de la organización pueda tomar decisiones.

Aunque el directivo o gerente tiene la experiencia necesaria, no siempre, ya sea por


falta de tiempo ó porque no se le ocurrió, no mira situaciones que están tomando
rumbos interesantes, peligrosos quizá. Así, ciertas decisiones importantes pueden
ser ignoradas o tomarse ya muy tarde. Se pueden así desperdiciar oportunidades o
se pueden tomar riesgos indeseables.

Recientemente, la computación ha inventado la minería de datos, en auxilio del


directivo que toma decisiones. En las bodegas de datos se colocan “mineros”,
algoritmos que buscan tendencias, anomalías, desviaciones o situaciones
interesantes pero desconocidas, y otros eventos importantes. Utilizan,
además de las bases de datos, la inteligencia artificial (procedimientos para
hallar grupos en situaciones similares, clasificar eventos nuevos en categorías
conocidas, etcétera) y la estadística. Pero a diferencia de esta última, que toma
una muestra de los datos y la estudia, la minería de datos estudia todos los datos.
Mientras más datos se analicen, más precisa es, y su poder de detección y
predicción aumenta.

Es importante que conozcamos más sobre los mineros. En un mundo globalizado,


donde es importante saber lo que ocurre en el entorno de la organización, en su
contexto, los mineros son auxiliares indispensables para los ejecutivos de una
empresa bien organizada. Para que los mineros trabajen bien, la empresa debe:
a) Tener registros operacionales que apoyen sus trabajos cotidianos, sus
funciones principales.
b) Mantener actualizados periódicamente estos registros y resumiéndolos
para que formen qué parte de la bodega de datos;
c) Crear y depurar sus mineros de datos, haciéndolos trabajar
exhaustivamente sobre la bodega de datos.

Las organizaciones innovadoras utilizan la minería de datos y la analítica predictiva


para detectar los fraudes y los problemas de seguridad cibernética, para gestionar
los riesgos, anticipar las demandas de recursos, aumentar las tasas de respuesta de
las campañas de marketing, generar las próximas mejores ofertas, reducir el
abandono de los clientes e identificar efectos adversos que tendrían los
medicamentos durante las pruebas clínicas, entre otras muchas cosas.

Implementar rápidamente los conocimientos analíticos asegura que la conveniencia


de sus modelos analíticos no se pierda debido a procesos lentos como son
reescribir el código para cada entorno, revalidar los modelos reescritos y otros
procesos manuales. Si como directivos podemos implementar rápidamente los
modelos analíticos, el contexto y la relevancia de los modelos no se pierde,
cualquiera puede conservar su ventaja competitiva.

Desarrollo
Como se mencionó previamente, es muy importante que los directivos, quienes son
encargados de la toma de decisiones en las organizaciones, conozcan que hay
herramientas que pueden ayudar a facilitar su proceso en la elección de la mejor
decisión para el rumbo de la empresa en cualquier aspecto que se necesitase. Los
datos históricos son muy importantes, ya que son información útil para el empresa,
con ellos se pueden fundamentar mejor aún las decisiones y todo esto puede ser
ayudado con la minería de datos, pero… ¿Qué es la minería de datos?

La minería de datos es el proceso que tiene como propósito descubrir, extraer y


almacenar información relevante de amplias bases de datos, a través de programas
de búsqueda e identificación de patrones y relaciones globales, tendencias,
desviaciones y otros indicadores que podrían parecer sumamente difíciles de
manejar, sin embargo, todos estos datos pueden tener una explicación mediante el
descubrimiento de diversas técnicas que nos puede dar la minería de datos.

Su objetivo principal es aprovechar el valor de la información localizada y usar los


patrones preestablecidos para que los directivos tengan un mejor conocimiento de
su negocio y puedan tomar decisiones más confiables.

Pero, y ¿de dónde proviene todo este mar de datos? Todas las organizaciones
coleccionan y administran datos de su interés relacionados con personas, procesos
u otro tipo de actividades para las cuales fueron creadas. Los más comunes son los
relacionados con ventas de productos o servicios, empleados dedicados a
pronosticar el clima, o en actividades muy especializadas, como la detección de
fraudes en el consumo de algún recurso natural, por ejemplo. Las colecciones se
pueden almacenar en discos de gran capacidad, que es ya posible comprar y tener
en el hogar, y que pueden ser del tamaño de la palma de la mano o menos.

¿Cómo funciona la minería de datos?


El proceso de la minería de dato es un ciclo, debido a que los resultados obtenidos
pueden alimentar nuevamente dicho proceso; intervienen, principalmente, cuatro
pasos:

1. Los usuarios de la información deberán identificar los problemas de la


organización y las áreas en donde los datos pueden dar valor agregado a la
empresa, esto significa que a raíz de un problema surge la necesidad de
analizar a detalle los datos de la empresa para poder encontrar posibles
soluciones al mismo o información que haga que las decisiones tomadas
sean lo más cercanas posibles a la solución del problema. Asimismo, es
importante identificar las áreas en donde la información es muy cambiante,
pero muy importante para la actividad de la empresa. Para esto, pueden
manejarse diferentes criterios pero todo depende de las características de la
empresa, aún así el objetivo a perseguir es determinar los criterios, ideas,
normas y cuestionamientos que darán paso a la entrada para el proceso de
minería de datos.

2. El usuario para analizar la información histórica seleccionara el algoritmo o


algoritmos de minería de datos. Posteriormente, estos algoritmos son
traducidos a programas mineros que realizarán las búsquedas con los
criterios previamente definidos. Existen varias dificultades que pueden
interferir con el resultado que se obtenga del análisis, y esto es porque los
datos se pueden encontrar en diferentes formas, formatos y en múltiples
sistemas además de que pueden provenir de fuentes internas o externas;
para resolver este problema actualmente se ha hecho uso del data
warehouse, que pretende reunir los datos más importantes de la empresa en
una especie de base de datos corporativa, la cual requiere una gran cantidad
de gigabytes, no siempre disponible en las organizaciones, sin embargo, es
posible hacer minería de datos sin necesidad de tener el data warehouse,
pero es muy importante tener claro que la información deberá estar lo más
clara y congruente posible, ya que en mucho depende de esto la certidumbre
de los resultados que arroje.

3. Incorporar la información obtenida a través del proceso de minería de datos


al proceso de toma de decisiones, así como presentar los hallazgos
encontrados a los responsables de las operaciones de forma que la
información obtenida pueda integrarse en los procesos de la empresa y
pueda aplicarse en la solución de los problemas.

4. Medir el valor de los resultados encontrados que se proporcionan al tomador


de decisiones con relación a la solución de los problemas identificados y a los
criterios definidos en el primer punto.

Aplicaciones

Las operaciones comerciales de alguna manera hoy en día se basan en informes


periódicos producidos por la consultas en bases de datos pregrabadas: ¿cuál es la
cifra de venta en una tienda?, ¿qué tendencias se derivan de las cifras de ventas?,
¿en dónde tienen una mejor aceptación los productos?, ¿qué zonas son las mejores
para tener puntos de venta?. Los informes con referencias cruzadas forman la base
de la mayoría de las decisiones de los ejecutivos. Las consultas se elaboran de
manera interactiva con el usuario para garantizar que la información presente una
estructura adecuada. Estos informes se han elaborado para que sean capaces de
responder preguntas recurrentes.

La minería de datos permite la gestión en tiempo real de manera eficaz de mucha


información, es una herramienta aplicable a cualquier tipo de organización. Una
amplia gama de compañías pueden tener aplicaciones exitosas con ella, por
ejemplo:

- En el área de mercadotecnia las organizaciones prefieren concentrar sus


recursos en aquellas personas con mayores probabilidades de responder al
producto o servicio que se ofrezca, en lugar de dirigirse a miles de personas
que no pueden convertirse en sus clientes. Si las empresas conocen quienes
son estas personas, pueden efectuar una estrategia directamente enfocada a
esas personas.

Los hallazgos encontrados por los programas mineros ayudan a los directivos a
analizar los hábitos de los clientes con el fin de satisfacer sus necesidades, mejorar
la administración de inventarios, y en general, aumentar sus márgenes de utilidad.
Como se mencionó en el ejemplo previo, la minería de datos ofrece una serie de
tecnologías que ayudan a las organizaciones a anticipar resultados futuros,
descubrir nuevas oportunidades y mejorar el desempeño del negocio. Puede
aplicarse a una variedad de problemas de los clientes en todas las industrias, desde
la segmentación de clientes y la detección de fraudes y la calificación de riesgo de
crédito, hasta identificar los efectos adversos de un medicamento durante las
pruebas clínicas. Un uso común de la minería de datos es la segmentación
automática de los clientes por comportamiento, demografías o actitudes para
entender mejor las necesidades de grupos específicos y atenderlos de una manera
más dirigida. Esta segmentación analítica, o modelado sin supervisión, ayuda a
identificar a grupos de clientes que son similares y que podrían reaccionar a ciertas
ofertas o actividades de manera parecida.

Utilizando toda esta información que reúne la minería de datos, las organizaciones
pueden crear estrategias para cada grupo y así predecir la oferta que se les dará
con el producto o servicio para que sea adquirido por un gran número de personas.

Debido a su potencial de producir conocimientos predictivos precisos de enormes


volúmenes de datos diversos, la minería de datos ha demostrado ser un
componente valioso de muchas iniciativas analíticas. La minería de datos pueden
ayudar a:
● Descubrir automáticamente patrones, tendencias y relaciones representadas
en los datos
● Desarrollar modelos para entender y describir mejor las características y
actividades basadas en estos patrones.
● Utilizar esos conocimientos para ayudar a evaluar las opciones futuras y
tomar decisiones basadas en hechos.
● Crear código de calificación que exprese los cálculos hechos para acciones
adecuadas oportunas.

Principales características y objetivos

● Explorar los datos que se encuentran en las profundidades de las bases de


datos (por ejemplo los Almacenes de Datos), que algunas veces contienen
información almacenada durante varios años.
● En algunos casos, los datos se consolidan en un almacén de datos y en
mercados de datos; en otros, se mantienen en servidores de Internet e
Intranet.
● El entorno de la minería de datos suele tener una Arquitectura Cliente
Servidor.
● Las herramientas de la minería de datos ayudan a extraer el mineral de la
información registrado en archivos corporativos o en registros públicos,
archivados.
● El minero es, muchas veces un usuario final con poca o ninguna habilidad de
programación, facultado por barrenadoras de datos y otras poderosas
herramientas indagatorias, para efectuar preguntas ad-hoc y obtener
rápidamente respuestas.
● Hurgar y sacudir a menudo implica el descubrimiento de resultados valiosos e
inesperados.
● Las herramientas de la minería de datos se combinan fácilmente y pueden
analizarse y procesarse rápidamente.
● Debido a la gran cantidad de datos, algunas veces resulta necesario usar
procesamiento en paralelo para la minería de datos.
La minería de datos produce cinco tipos de información:
● Asociaciones.
● Secuencias.
● Clasificaciones.
● Agrupamientos.
● Pronósticos.
Los mineros de datos usan varias herramientas y técnicas.

La minería de datos es un proceso que invierte la dinámica del método científico en


el siguiente sentido:

● En el método científico, primero se formula la hipótesis y luego se diseña el


experimento para coleccionar los datos que confirmen o refuten la hipótesis.
Si esto se hace con la formalidad adecuada (cuidando cuáles son las
variables controladas y cuáles experimentales), se obtiene un nuevo
conocimiento.
● En la minería de datos, se coleccionan los datos y se espera que de ellos
emerjan hipótesis. Luego entonces, se valida esa hipótesis inspirada por los
datos en los datos mismos, será numéricamente significativa, pero
experimentalmente inválida. De ahí que la minería de datos debe presentar
un enfoque exploratorio, y no confirmador. Usar la minería de datos para
confirmar las hipótesis formuladas puede ser peligroso, pues se está
haciendo una inferencia poco válida.

Ejemplos de uso de la minería de datos

● Negocios:
La minería de datos puede contribuir significativamente en las aplicaciones de
Administración Empresarial basada en la relación con el cliente. En lugar de
contactar con el cliente de forma indiscriminada a través de un centro de llamadas o
enviando cartas, sólo se contactará con aquellos que se perciba que tienen una
mayor probabilidad de responder positivamente a una determinada oferta o
promoción.

Por lo general, las empresas que emplean minería de datos ven rápidamente el
retorno de la inversión, pero también reconocen que el número de modelos
predictivos desarrollados puede crecer muy rápidamente.

En lugar de crear modelos para predecir qué clientes pueden cambiar, la empresa
podría construir modelos separados para cada región y/o para cada tipo de cliente.
También puede querer determinar qué clientes van a ser rentables durante una
ventana de tiempo (una quincena, un mes, ...) y sólo enviar las ofertas a las
personas que es probable que sean rentables. Para mantener esta cantidad de
modelos, es necesario gestionar las versiones de cada modelo y pasar a una
minería de datos lo más automatizada posible.

● Patrones de fuga:
Un ejemplo más habitual es el de la detección de patrones de fuga. En muchas
industrias —como la banca, las telecomunicaciones, entre otras— existe un
comprensible interés en detectar cuanto antes, aquellos clientes que puedan estar
pensando en prescindir sus contratos para posiblemente pasarse a la competencia.
A estos clientes —y en función de su valor— se les podrían hacer ofertas
personalizadas, ofrecer promociones especiales, etc., con el objetivo último de
retenerlos.

La minería de datos ayuda a determinar qué clientes son los más proclives a darse
de baja estudiando sus patrones de comportamiento y comparándolos con muestras
de clientes que efectivamente, se dieron de baja en el pasado.

● Recursos humanos:
La minería de datos también puede ser útil para los departamentos de recursos
humanos, en la identificación de las características de sus empleados de mayor
éxito. La información obtenida puede ayudar a la contratación de personal,
centrándose en los esfuerzos de sus empleados y los resultados obtenidos por
éstos. Además, la ayuda ofrecida por las aplicaciones para dirección estratégica en
una empresa se traducen en la obtención de ventajas a nivel corporativo; tales como
mejorar el margen de beneficios o compartir objetivos y en la mejora de las
decisiones operativas, como por ejemplo el desarrollo de planes de producción o
gestión de mano de obra.

● Comportamiento en Internet:
También es un área en boga el del análisis del comportamiento de los visitantes —
sobre todo cuando son clientes potenciales— en una página de Internet, así como
también, la utilización de la información sobre ellos para ofrecerles propaganda
adaptada específicamente a su perfil; o para una vez que adquieren un determinado
producto, conocer inmediatamente qué otro ofrecerle, teniendo en cuenta la
información histórica disponible acerca de los clientes que han comprado el primero.

● Terrorismo:
La minería de datos ha sido citada como el método por el cual la unidad Able
Danger del Ejército de los Estados Unidos había identificado al líder de los
atentados del 11 de septiembre de 2001, Mohammed Atta, y a otros tres
secuestradores del "11-S", como posibles miembros de una célula de Al Qaeda; que
operaban en los EE.UU más de un año antes del ataque. Se ha sugerido que tanto
la Agencia Central de Inteligencia (CIA) y su homóloga canadiense, Servicio de
Inteligencia y Seguridad Canadiense, han empleado este método.
● Juegos:
Desde comienzos de la década de 1960, con la disponibilidad de oráculos para
determinados juegos combinacionales, también llamados finales de juego de tablero
(por ejemplo, para las tres en raya o en finales de ajedrez) con cualquier
configuración de inicio, se ha abierto una nueva área en la minería de datos que
consiste en la extracción de estrategias utilizadas por personas para estos oráculos.
Los planteamientos actuales sobre reconocimiento de patrones, no parecen poder
aplicarse con éxito al funcionamiento de estos oráculos. En su lugar, la producción
de patrones perspicaces se basa en una amplia experimentación con bases de
datos sobre esos finales de juego, combinado con un estudio intensivo de los
propios finales de juego en problemas bien diseñados y con conocimiento de la
técnica (datos previos sobre el final del juego). Ejemplos notables de investigadores
que trabajan en este campo son Elwyn Berlekamp en el juego de puntos y cajas (o
Timbiriche) y John Nunn en finales de ajedrez.

● Ciencia e ingeniería:
En los últimos años la minería de datos se está utilizando ampliamente en diversas
áreas relacionadas con la ciencia y la ingeniería. Algunos ejemplos de aplicación en
estos campos son:

● Genética:
En el estudio de la genética humana, el objetivo principal es entender la relación
cartográfica entre las partes y la variación individual en las secuencias del ADN
humano y la variabilidad en la susceptibilidad a las enfermedades. En términos más
llanos, se trata de saber cómo los cambios en la secuencia de ADN de un individuo
afectan al riesgo de desarrollar enfermedades comunes (como por ejemplo el
cáncer). Esto es muy importante para ayudar a mejorar el diagnóstico, prevención y
tratamiento de las enfermedades. La técnica de minería de datos que se utiliza para
realizar esta tarea se conoce como "reducción de dimensionalidad multifactorial".

● Ingeniería eléctrica:
En el ámbito de la ingeniería eléctrica, las técnicas de minería de datos han sido
ampliamente utilizadas para monitorizar las condiciones de las instalaciones de alta
tensión. La finalidad de esta monitorización es obtener información valiosa sobre el
estado del aislamiento de los equipos. Para la vigilancia de las vibraciones o el
análisis de los cambios de carga en transformadores se utilizan ciertas técnicas para
agrupación de datos (clustering) tales como: los Mapas Auto-Organizativos (en
inglés: SOM, Self-organizing map). Estos mapas sirven para detectar condiciones
anormales y para estimar la naturaleza de dichas anomalías.

Conclusión
Actualmente el contar con información útil, clara y veraz que es un gran activo para
cualquier organización, además de que representa un poder sobre su competencia
al saber qué medidas se pueden tener para diferentes situaciones que se presenten.
La minería de datos ayuda a los altos mandos a obtener una visión más completa y
detallada de su negocio, ya que les permite buscar y organizar su información con
base en sus necesidades y de esta manera poder apoyarse para realizar mejor sus
operaciones. Conforme la empresa mejore y organice su información, obtendrá
información valiosa acerca de cómo poder conseguir clientes, incrementar ventas,
posibles anomalías, entre otros.

Es importante saber que en todo el proceso de la minería de datos, el capital


humano es la base de todo el desarrollo de esta estrategia, pues son ellos quienes
tienen la capacidad de analizar y decidir si los patrones, normas o funciones
encontrados tienen importancia, pertinencia y utilidad para la organización.

La minería de datos tiene un futuro muy prometedor dentro de las empresas, debido
a que existen grandes cantidades de información que necesitan ser manejadas con
más agilidad y precisión y además, se necesitan de análisis exhaustivos para saber
qué es lo mejor en nuestra toma de decisiones.

Bibliografía

- Martínez Luna, G. (2011). MINERÍA DE DATOS: cómo hallar una aguja en un pajar.
[online] AMC EDUCACIÓN. Available at:
https://www.revistaciencia.amc.edu.mx/images/revista/62_3/PDF/mineria_aguja.pdf
[Accessed 29 Feb. 2020].
- Angeles Larrieta, M. y Santillán Gómez, A. (2008). Minería de datos: Concepto,
características, estructura y aplicaciones. [online] Ejournal UNAM. Available at:
http://www.ejournal.unam.mx/rca/190/RCA19007.pdf
[Accessed 29 Feb. 2020].

- SAS MÉXICO. (2014). La Minería de Datos de la A a la Z: Cómo Descubrir


Conocimientos y Crear Mejores Oportunidades. [online] Available at:
https://www.sas.com/content/dam/SAS/es_mx/doc/assets/data-minig.pdf
[Accessed 29 Feb. 2020].

- Daza, A. (2003). DATA MINING: MINERÍA DE DATOS. Editorial Alfa-Omega Macro

También podría gustarte