Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Ciclo de Vida de Proyectos de Big Data

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 3

Nombre:

Oliver

Apellidos:
Taveras Méndez

Matrícula:
2021-0328

Asignatura:
Electiva 1

Tema:
Ciclo de Vida de Proyectos de Big Data

Maestro:
Francis Ramírez
Investigación:

Regresiones lineales y no lineales clásicas:

Las regresiones clásicas son métodos estadísticos utilizados para modelar la relación entre una variable
dependiente y una o más variables independientes. Las regresiones lineales y no lineales son dos tipos
comunes de regresiones clásicas.

Regresión lineal:

La regresión lineal es un modelo estadístico que asume una relación lineal entre la variable dependiente
y las variables independientes. El objetivo es encontrar la mejor línea recta que se ajuste a los datos.

Regresión no lineal:

A diferencia de la regresión lineal, la regresión no lineal asume una relación no lineal entre la variable
dependiente y las variables independientes. Puede tomar muchas formas, como polinómica,
exponencial, logarítmica, sigmoide, entre otras. La ecuación general de una regresión no lineal puede ser
más compleja y depende del tipo específico de relación que se esté modelando.

Elementos del ciclo de vida:

• Definición del proyecto: En esta etapa inicial, se identifican los objetivos y requisitos del proyecto
de Big Data.

• Recopilación de datos: En esta etapa, se recopilan los datos necesarios para el proyecto de Big
Data.

• Almacenamiento y procesamiento de datos: En esta etapa, los datos recopilados se almacenan


en un entorno adecuado, como un data lake o un data warehouse.

• Análisis de datos: En esta etapa, se aplican técnicas de análisis de datos para extraer información
y conocimiento significativo.

• Visualización y presentación de resultados: En esta etapa, se utilizan herramientas de


visualización de datos para representar los resultados del análisis de manera comprensible y
significativa.
• Implementación y despliegue: En esta etapa, se implementa la solución de Big Data desarrollada
y se despliega en el entorno de producción.
• Monitoreo y mantenimiento: Una vez implementada la solución, es importante monitorear su
rendimiento y asegurarse de que cumple con los requisitos establecidos.

• Evaluación y mejora: En esta etapa, se evalúa el éxito del proyecto de Big Data en función de los
objetivos establecidos.

Metodologías para proyectos de Ciencia de Datos:

Existen varias metodologías que pueden utilizarse para gestionar proyectos de manera efectiva. Estas
metodologías proporcionan un enfoque estructurado para planificar, ejecutar y controlar proyectos de
Ciencia de Datos. Estas son:

• CRISP-DM (Cross Industry Standard Process for Data Mining): Es una metodología ampliamente
utilizada que consta de seis fases: comprensión del negocio, comprensión de los datos,
preparación de los datos, modelado, evaluación y despliegue.

• KDD (Knowledge Discovery in Databases): Es una metodología similar a CRISP-DM y se utiliza


para extraer conocimiento útil a partir de grandes conjuntos de datos.

• Agile Data Science: Esta metodología se basa en los principios del desarrollo ágil de software y se
adapta a la Ciencia de Datos. Se enfoca en la colaboración y la iteración continua a lo largo del
proyecto.

• TDSP (Team Data Science Process): Es una metodología desarrollada por Microsoft que
proporciona un enfoque completo para proyectos de Ciencia de Datos.

• Lean Data Science: Esta metodología se basa en los principios del pensamiento lean y se centra
en la maximización del valor y la minimización del desperdicio en proyectos de Ciencia de Datos.

Evaluación del Tema:

El tema a investigar ha sido interesante ya que el Big Data para mí es un tema completamente nuevo,
pero claro, estoy aprendiendo poco a poco del tema, ya que me parece un tema interesante dentro de lo
que cabe, ya que siempre he visto interesante el manejo de datos.

También podría gustarte