Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Introduction To Data Analytics

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 4

Introduction to Data Analytics (Analista de Datos Junior)

IBM

Modern Data Ecosystem

Para citar un informe de Forbes 2020 en las próximas décadas. "El constante aumento de
velocidades de procesamiento de datos y ancho de banda, la invención sin parar de nuevas
herramientas para crear, confiando y compartiendo datos, y la constante adición de los
consumidores de clase media alrededor del mundo. asegurar que el crecimiento de los datos
continúe sin disminuir. Los datos inician más datos en un ciclo virtuoso constante".

Un moderno ecosistema de datos incluye toda una red interconectada, independiente, y


entidades en continua evolución. Incluye datos que tienen que ser integrado de fuentes
dispares, diferentes tipos de análisis y habilidades para generar conocimientos. Partes
interesadas activas para colaborar y actuar sobre la información generada, y las herramientas,
aplicaciones y la infraestructura para almacenar, proceso y difundir los datos según sea
necesario.

Comencemos con las fuentes de datos. Los datos están disponibles en una variedad de
conjuntos de datos estructurados y no estructurados, residiendo en texto, imágenes, vídeos,
flujos de clics, conversaciones de usuario, plataformas de redes sociales, el Internet de las
cosas o dispositivos IoT, eventos en tiempo real que transmiten datos, bases de datos
heredadas, y datos obtenidos de proveedores profesionales de datos y agencias. Las fuentes
nunca antes han sido tan diversas y dinámicas. Cuando trabajan con tantas fuentes de datos
diferentes, el primer paso es extraer una copia de los datos de las fuentes originales en un
depósito de datos. En esta etapa, solo están buscando adquirir los datos que necesitan
trabajando con formatos de datos, fuentes e interfaces en la que estos datos pueden ser
extraídos. Fiabilidad, seguridad e integridad de los datos adquiridos son algunos de los los
desafíos que se trabajan en esta etapa. Una vez que los datos brutos están en un lugar común,
necesita ser organizado, limpiado, y optimizado para el acceso de los usuarios finales. Los datos
también necesitarán ajustarse a el cumplimiento y estándares aplicados en la organización. Por
ejemplo, conforme a las directrices que regulan el almacenamiento y el uso de los datos
personales, como salud, biometría o datos del hogar en el caso de los dispositivos IoT.
Adherirse a las tablas de datos maestras dentro de la organización para garantizar la
estandarización de datos maestros a través de todas las aplicaciones y sistemas de una
organización es otro ejemplo. Los desafíos clave en esta etapa podrían involucrar la gestión de
datos y el trabajo con repositorios de datos que proporcionan alta disponibilidad, flexibilidad,
accesibilidad, y seguridad. Finalmente, tenemos nuestras partes interesadas de negocio,
aplicaciones, programadores, analistas y casos de uso de ciencia de datos, todos extrayendo
estos datos del repositorio de datos empresariales. Los principales retos en esta fase podrían
incluir las interfaces, APIs, y aplicaciones que pueden obtener estos datos para los usuarios
finales en línea con sus necesidades específicas. Por ejemplo, los analistas de datos pueden
necesitar los datos en bruto para trabajar con ellos. Es posible que las partes interesadas de la
empresa necesiten informes y cuadros de mando. Las aplicaciones pueden necesitar APIs
personalizadas para obtener estos datos.
Es importante notar la influencia de algunas de las nuevas y emergentes tecnologías que están
dando forma al actual ecosistema de datos y sus posibilidades, por ejemplo: la computación en
nube, aprendizaje automático, y big data, por nombrar algunos. Gracias a las tecnologías en la
nube, hoy en día, todas las empresas tienen acceso a un almacenamiento ilimitado, informática
de alto rendimiento, tecnologías de código abierto, tecnologías de aprendizaje automático, y
las últimas herramientas y bibliotecas. Los científicos de datos están creando modelos
predictivos al entrenar algoritmos de aprendizaje automático sobre datos pasados, también big
data. Hoy, estamos tratando con conjuntos de datos que son tan masivos y tan variados, que
las herramientas tradicionales y los métodos de análisis ya no son adecuados, allanando el
camino para nuevas herramientas y técnicas y también nuevos conocimientos e ideas.

Key Players in the Data Ecosystem (Jugadores clave en el ecosistema de datos)

Hoy en día, las organizaciones que están utilizando los datos para descubrir oportunidades y
están aplicando ese conocimiento para diferenciarse son las que conducen al futuro. Ya sea
buscando patrones en las transacciones financieras para detectar fraudes, utilizando motores
de recomendación para impulsar la conversión, minería, publicaciones en redes sociales para la
voz de los clientes o marcas que personalicen sus ofertas en función del análisis del
comportamiento de los clientes, los líderes empresariales se dieron cuenta de que los datos
son la clave a una ventaja competitiva. Para obtener valor de los datos, necesita una gran
cantidad de conjuntos de habilidades y personas que desempeñen diferentes roles.

Todo comienza con un ingeniero de datos. Los ingenieros de datos son personas que
desarrollan y mantienen arquitecturas de datos y ponen los datos disponibles para operaciones
y análisis empresariales. Los ingenieros de datos trabajan dentro del ecosistema de datos para
extraer, integrar y organizar datos de fuentes dispares. Limpie la transformación y prepare el
diseño de datos, almacene y administre datos en repositorios de datos. Permitieron que los
datos fueran accesibles en formatos y sistemas que pueden utilizar las diversas aplicaciones
empresariales, así como las partes interesadas, como los analistas de datos y los científicos de
datos. Un ingeniero de datos debe tener buenos conocimientos de programación,
conocimientos sólidos de sistemas y arquitecturas tecnológicas, y un conocimiento profundo
de bases de datos relacionales y almacenes de datos no relacionales.

Un analista de datos traduce datos y números en un lenguaje sencillo, de modo que las
organizaciones pueden tomar decisiones, los analistas de datos inspeccionan y limpian los
datos para obtener información, identificar correlaciones, encontrar patrones y aplicar
métodos estadísticos. Analizar y extraer datos y visualizar datos para interpretar y presentar los
resultados del análisis de datos. Los analistas son las personas que responden preguntas tales
como, ¿Son las experiencias de búsqueda de usuarios generalmente buenas o malas con la
funcionalidad de búsqueda en nuestro sitio? o ¿Cuál es la percepción popular de las personas
con respecto a nuestras iniciativas de cambio de marca? ¿O hay una correlación entre las
ventas, y un producto y otro? Los analistas de datos requieren un buen conocimiento de las
hojas de cálculo, la escritura de consultas y el uso de herramientas estadísticas para crear
gráficos y tableros. Los analistas de datos modernos también necesitan tener algunas
habilidades de programación. También necesitan fuertes habilidades analíticas y de narración
de historias.
Los científicos de datos analizan los datos para obtener información procesable y crean
modelos de aprendizaje automático o aprendizaje profundo que se capacitan en datos
anteriores para crear modelos predictivos. Los científicos de datos son personas que responden
preguntas como, ¿cuántos nuevos seguidores de redes sociales tengo probabilidades de
obtener el próximo mes, o qué porcentaje de mis clientes es probable que pierda ante la
competencia en el próximo trimestre, o es esta transacción financiera inusual para este
cliente? Los científicos de datos requieren conocimientos de matemáticas, estadísticas y una
comprensión justa de lenguajes de programación, bases de datos y modelos de datos de
construcción. También necesitan tener conocimientos de dominio.

Los analistas de negocios aprovechan el trabajo de los analistas de datos y científicos de datos
para analizar las posibles implicaciones para su negocio y las acciones que necesitan tomar o
recomendar. Los analistas de BI hacen lo mismo excepto. Su enfoque se centra en las fuerzas
del mercado y las influencias externas que dan forma a su negocio. Proporcionan soluciones
inteligentes para el negocio organizando y supervisando datos sobre diferentes funciones
empresariales y explorando esos datos para extraer información y acciones que mejoren el
rendimiento del negocio. Para resumir, en términos sencillos, la ingeniería de datos convierte
los datos sin procesar en datos utilizables.

El análisis de datos utiliza estos datos para generar información. Los científicos de datos
utilizan el análisis de datos y la ingeniería de datos para predecir el futuro utilizando datos del
pasado, los analistas de negocios y los analistas de inteligencia empresarial utilizan estos
conocimientos y predicciones para impulsar decisiones que benefician y hacen crecer su
negocio.

Definiendo el Análisis de Datos


El análisis de datos es el proceso de agrupar, limpiar, extraer y analizar información,
interpretar resultados, y reportar los hallazgos. Por medio del análisis de datos encontraremos
patrones y correlaciones en diferentes puntos de información. Y es a través de estos patrones y
correlaciones en donde se genera el entendimiento y donde se determinan las conclusiones.

El análisis de datos ayuda a las empresas a entender como ha sido su desempeño pasado y
así informar a las instancias con poder de decisión, respecto a las acciones futuras. Al usar el
análisis de datos las empresas pueden validar un plan de acción antes de comprometerse con
él. Salvando así tiempo y recursos, al igual que asegurando en mayor medida su éxito.

Exploraremos cuatro tipos primarios de análisis de datos, cada uno con un objetivo y lugar
diferente dentro del proceso del análisis de datos presupuestos de error:

 Las analíticas descriptivas ayudan a responder preguntas sobre lo que ocurrió en un


período determinado de tiempo, resumiendo los datos anteriores y presentando los
hallazgos para las partes interesadas. Ayuda a proporcionar una visión esencial de los
acontecimientos pasados. Por ejemplo, el seguimiento a resultados anteriores
basándose en los indicadores claves de desempeño de la organización o en el análisis
de sus flujos de caja.
 La analítica de diagnóstico ayudar a responder la pregunta puedes decir por qué
sucedió, Se requiere del entendimiento dado por la analítica predictiva para
profundizar en la causa de un resultado. Por ejemplo, un cambio repentino en el tráfico
de una página web sin una razón obvia, o el incremento de las ventas en una región
donde no existió cambio alguno en el mercadeo.
 La analítica predictiva ayuda a responder la pregunta: ¿Qué sucede a continuación? Los
datos históricos y las tendencias son usadas para predecir resultados futuros. Algunas
de las áreas en donde las empresas aplican el análisis predictivo son: la evaluación de
riesgos y el pronóstico de ventas. Es importante señalar que el propósito de la analítica
predictiva no es el de decir que pasará en el futuro, su objetivo es el de predecir que
podría pasar en ese futuro. Todas las predicciones son de naturaleza probabilística.
 Las analíticas prescriptivas ayudan a responder la pregunta, ¿Qué hay que hacer al
respecto? Mediante el análisis de decisiones y acontecimientos pasados, la
probabilidad de diferentes resultados es estimado en base a la cual se decide un curso
de acción. Los coches autónomos son un buen ejemplo de analíticas prescriptivas.
Analizan el entorno para tomar decisiones con respecto a la velocidad, cambiar de
carril, que ruta tomar, etc. O las aerolíneas ajustando automáticamente los precios de
los billetes en función de la demanda del cliente. Precios del gas, el clima o el tráfico en
las rutas de conexión. Ahora veamos algunos de los pasos clave en cualquier proceso
de análisis de datos. Comprender el problema y el resultado deseado. El análisis de
datos comienza con la comprensión del problema que hay que resolver y el resultado
que hay que conseguir. Dónde están y dónde quieren estar, debe estar claramente
definido antes de que el proceso de análisis pueda comenzar. Establecer una métrica
clara. Esta etapa del proceso incluye decidir qué se medirá, por ejemplo, el número de
productos X vendidos en una región y cómo se medirá, por ejemplo, en un trimestre o
durante una temporada de festivales. Recopilando datos, una vez que saben lo que van
a para medir y cómo lo van a medir, identificas los datos que necesitas, las fuentes de
datos de las que necesitas extraer estos datos, y las mejores herramientas para el
trabajo. Limpieza de datos. Una vez recopilados los datos, el siguiente paso es para
solucionar los problemas de calidad de los datos que podrían afectar la precisión del
análisis. Este es un paso crítico porque la precisión del análisis solo puede garantizarse
si los datos están limpios. Limpiará los datos de los valores faltantes o incompletos y los
valores atípicos. Por ejemplo, los datos demográficos de un cliente en los que el campo
de la edad tiene un valor de 150 es un valor atípico. También normalizará los datos que
llegan desde múltiples fuentes. Análisis y minería de datos. Una vez que los datos están
limpios, se extraen y se analizan desde diferentes perspectivas. Es posible que necesite
manipular sus datos de varias maneras diferentes para entender las tendencias,
identificar correlaciones y encontrar patrones y variaciones. Interpretando resultados.
Después de analizar los datos y, posiblemente, de llevar a cabo una investigación
adicional, que puede ser un bucle iterativo, es el momento de interpretar sus
resultados. Al interpretar los resultados, hay que evaluar si su análisis es defendible
frente a las objeciones, y si existen limitaciones o circunstancias en las que su análisis
puede no ser válido. Presentación de los resultados. En última instancia, el objetivo de
cualquier análisis es impactar en la toma de decisiones. La capacidad de comunicar y
presentar los resultados de forma clara e impactante es tan importante como parte del
proceso de análisis de datos como el análisis mismo. Informes, tableros, tablas,
gráficos, mapas, casos de estudio, son solo algunas de las formas en que puedes
presentar tus datos.

También podría gustarte