Ciclo de Vida de Proyectos de Big Data
Ciclo de Vida de Proyectos de Big Data
Ciclo de Vida de Proyectos de Big Data
Oliver
Apellidos:
Taveras Méndez
Matrícula:
2021-0328
Asignatura:
Electiva 1
Tema:
Ciclo de Vida de Proyectos de Big Data
Maestro:
Francis Ramírez
Investigación:
Las regresiones clásicas son métodos estadísticos utilizados para modelar la relación entre una variable
dependiente y una o más variables independientes. Las regresiones lineales y no lineales son dos tipos
comunes de regresiones clásicas.
Regresión lineal:
La regresión lineal es un modelo estadístico que asume una relación lineal entre la variable dependiente
y las variables independientes. El objetivo es encontrar la mejor línea recta que se ajuste a los datos.
Regresión no lineal:
A diferencia de la regresión lineal, la regresión no lineal asume una relación no lineal entre la variable
dependiente y las variables independientes. Puede tomar muchas formas, como polinómica,
exponencial, logarítmica, sigmoide, entre otras. La ecuación general de una regresión no lineal puede ser
más compleja y depende del tipo específico de relación que se esté modelando.
• Definición del proyecto: En esta etapa inicial, se identifican los objetivos y requisitos del proyecto
de Big Data.
• Recopilación de datos: En esta etapa, se recopilan los datos necesarios para el proyecto de Big
Data.
• Análisis de datos: En esta etapa, se aplican técnicas de análisis de datos para extraer información
y conocimiento significativo.
• Evaluación y mejora: En esta etapa, se evalúa el éxito del proyecto de Big Data en función de los
objetivos establecidos.
Existen varias metodologías que pueden utilizarse para gestionar proyectos de manera efectiva. Estas
metodologías proporcionan un enfoque estructurado para planificar, ejecutar y controlar proyectos de
Ciencia de Datos. Estas son:
• CRISP-DM (Cross Industry Standard Process for Data Mining): Es una metodología ampliamente
utilizada que consta de seis fases: comprensión del negocio, comprensión de los datos,
preparación de los datos, modelado, evaluación y despliegue.
• Agile Data Science: Esta metodología se basa en los principios del desarrollo ágil de software y se
adapta a la Ciencia de Datos. Se enfoca en la colaboración y la iteración continua a lo largo del
proyecto.
• TDSP (Team Data Science Process): Es una metodología desarrollada por Microsoft que
proporciona un enfoque completo para proyectos de Ciencia de Datos.
• Lean Data Science: Esta metodología se basa en los principios del pensamiento lean y se centra
en la maximización del valor y la minimización del desperdicio en proyectos de Ciencia de Datos.
El tema a investigar ha sido interesante ya que el Big Data para mí es un tema completamente nuevo,
pero claro, estoy aprendiendo poco a poco del tema, ya que me parece un tema interesante dentro de lo
que cabe, ya que siempre he visto interesante el manejo de datos.