Introduction To Data Analytics
Introduction To Data Analytics
Introduction To Data Analytics
IBM
Para citar un informe de Forbes 2020 en las próximas décadas. "El constante aumento de
velocidades de procesamiento de datos y ancho de banda, la invención sin parar de nuevas
herramientas para crear, confiando y compartiendo datos, y la constante adición de los
consumidores de clase media alrededor del mundo. asegurar que el crecimiento de los datos
continúe sin disminuir. Los datos inician más datos en un ciclo virtuoso constante".
Comencemos con las fuentes de datos. Los datos están disponibles en una variedad de
conjuntos de datos estructurados y no estructurados, residiendo en texto, imágenes, vídeos,
flujos de clics, conversaciones de usuario, plataformas de redes sociales, el Internet de las
cosas o dispositivos IoT, eventos en tiempo real que transmiten datos, bases de datos
heredadas, y datos obtenidos de proveedores profesionales de datos y agencias. Las fuentes
nunca antes han sido tan diversas y dinámicas. Cuando trabajan con tantas fuentes de datos
diferentes, el primer paso es extraer una copia de los datos de las fuentes originales en un
depósito de datos. En esta etapa, solo están buscando adquirir los datos que necesitan
trabajando con formatos de datos, fuentes e interfaces en la que estos datos pueden ser
extraídos. Fiabilidad, seguridad e integridad de los datos adquiridos son algunos de los los
desafíos que se trabajan en esta etapa. Una vez que los datos brutos están en un lugar común,
necesita ser organizado, limpiado, y optimizado para el acceso de los usuarios finales. Los datos
también necesitarán ajustarse a el cumplimiento y estándares aplicados en la organización. Por
ejemplo, conforme a las directrices que regulan el almacenamiento y el uso de los datos
personales, como salud, biometría o datos del hogar en el caso de los dispositivos IoT.
Adherirse a las tablas de datos maestras dentro de la organización para garantizar la
estandarización de datos maestros a través de todas las aplicaciones y sistemas de una
organización es otro ejemplo. Los desafíos clave en esta etapa podrían involucrar la gestión de
datos y el trabajo con repositorios de datos que proporcionan alta disponibilidad, flexibilidad,
accesibilidad, y seguridad. Finalmente, tenemos nuestras partes interesadas de negocio,
aplicaciones, programadores, analistas y casos de uso de ciencia de datos, todos extrayendo
estos datos del repositorio de datos empresariales. Los principales retos en esta fase podrían
incluir las interfaces, APIs, y aplicaciones que pueden obtener estos datos para los usuarios
finales en línea con sus necesidades específicas. Por ejemplo, los analistas de datos pueden
necesitar los datos en bruto para trabajar con ellos. Es posible que las partes interesadas de la
empresa necesiten informes y cuadros de mando. Las aplicaciones pueden necesitar APIs
personalizadas para obtener estos datos.
Es importante notar la influencia de algunas de las nuevas y emergentes tecnologías que están
dando forma al actual ecosistema de datos y sus posibilidades, por ejemplo: la computación en
nube, aprendizaje automático, y big data, por nombrar algunos. Gracias a las tecnologías en la
nube, hoy en día, todas las empresas tienen acceso a un almacenamiento ilimitado, informática
de alto rendimiento, tecnologías de código abierto, tecnologías de aprendizaje automático, y
las últimas herramientas y bibliotecas. Los científicos de datos están creando modelos
predictivos al entrenar algoritmos de aprendizaje automático sobre datos pasados, también big
data. Hoy, estamos tratando con conjuntos de datos que son tan masivos y tan variados, que
las herramientas tradicionales y los métodos de análisis ya no son adecuados, allanando el
camino para nuevas herramientas y técnicas y también nuevos conocimientos e ideas.
Hoy en día, las organizaciones que están utilizando los datos para descubrir oportunidades y
están aplicando ese conocimiento para diferenciarse son las que conducen al futuro. Ya sea
buscando patrones en las transacciones financieras para detectar fraudes, utilizando motores
de recomendación para impulsar la conversión, minería, publicaciones en redes sociales para la
voz de los clientes o marcas que personalicen sus ofertas en función del análisis del
comportamiento de los clientes, los líderes empresariales se dieron cuenta de que los datos
son la clave a una ventaja competitiva. Para obtener valor de los datos, necesita una gran
cantidad de conjuntos de habilidades y personas que desempeñen diferentes roles.
Todo comienza con un ingeniero de datos. Los ingenieros de datos son personas que
desarrollan y mantienen arquitecturas de datos y ponen los datos disponibles para operaciones
y análisis empresariales. Los ingenieros de datos trabajan dentro del ecosistema de datos para
extraer, integrar y organizar datos de fuentes dispares. Limpie la transformación y prepare el
diseño de datos, almacene y administre datos en repositorios de datos. Permitieron que los
datos fueran accesibles en formatos y sistemas que pueden utilizar las diversas aplicaciones
empresariales, así como las partes interesadas, como los analistas de datos y los científicos de
datos. Un ingeniero de datos debe tener buenos conocimientos de programación,
conocimientos sólidos de sistemas y arquitecturas tecnológicas, y un conocimiento profundo
de bases de datos relacionales y almacenes de datos no relacionales.
Un analista de datos traduce datos y números en un lenguaje sencillo, de modo que las
organizaciones pueden tomar decisiones, los analistas de datos inspeccionan y limpian los
datos para obtener información, identificar correlaciones, encontrar patrones y aplicar
métodos estadísticos. Analizar y extraer datos y visualizar datos para interpretar y presentar los
resultados del análisis de datos. Los analistas son las personas que responden preguntas tales
como, ¿Son las experiencias de búsqueda de usuarios generalmente buenas o malas con la
funcionalidad de búsqueda en nuestro sitio? o ¿Cuál es la percepción popular de las personas
con respecto a nuestras iniciativas de cambio de marca? ¿O hay una correlación entre las
ventas, y un producto y otro? Los analistas de datos requieren un buen conocimiento de las
hojas de cálculo, la escritura de consultas y el uso de herramientas estadísticas para crear
gráficos y tableros. Los analistas de datos modernos también necesitan tener algunas
habilidades de programación. También necesitan fuertes habilidades analíticas y de narración
de historias.
Los científicos de datos analizan los datos para obtener información procesable y crean
modelos de aprendizaje automático o aprendizaje profundo que se capacitan en datos
anteriores para crear modelos predictivos. Los científicos de datos son personas que responden
preguntas como, ¿cuántos nuevos seguidores de redes sociales tengo probabilidades de
obtener el próximo mes, o qué porcentaje de mis clientes es probable que pierda ante la
competencia en el próximo trimestre, o es esta transacción financiera inusual para este
cliente? Los científicos de datos requieren conocimientos de matemáticas, estadísticas y una
comprensión justa de lenguajes de programación, bases de datos y modelos de datos de
construcción. También necesitan tener conocimientos de dominio.
Los analistas de negocios aprovechan el trabajo de los analistas de datos y científicos de datos
para analizar las posibles implicaciones para su negocio y las acciones que necesitan tomar o
recomendar. Los analistas de BI hacen lo mismo excepto. Su enfoque se centra en las fuerzas
del mercado y las influencias externas que dan forma a su negocio. Proporcionan soluciones
inteligentes para el negocio organizando y supervisando datos sobre diferentes funciones
empresariales y explorando esos datos para extraer información y acciones que mejoren el
rendimiento del negocio. Para resumir, en términos sencillos, la ingeniería de datos convierte
los datos sin procesar en datos utilizables.
El análisis de datos utiliza estos datos para generar información. Los científicos de datos
utilizan el análisis de datos y la ingeniería de datos para predecir el futuro utilizando datos del
pasado, los analistas de negocios y los analistas de inteligencia empresarial utilizan estos
conocimientos y predicciones para impulsar decisiones que benefician y hacen crecer su
negocio.
El análisis de datos ayuda a las empresas a entender como ha sido su desempeño pasado y
así informar a las instancias con poder de decisión, respecto a las acciones futuras. Al usar el
análisis de datos las empresas pueden validar un plan de acción antes de comprometerse con
él. Salvando así tiempo y recursos, al igual que asegurando en mayor medida su éxito.
Exploraremos cuatro tipos primarios de análisis de datos, cada uno con un objetivo y lugar
diferente dentro del proceso del análisis de datos presupuestos de error: