Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
0% encontró este documento útil (0 votos)
49 vistas6 páginas

Proyecto Métodos Predictivos2023

Descargar como pdf o txt
Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1/ 6

UNIVERSIDAD DE EL SALVADOR

FACULTAD DE CIENCIAS NATURALES Y MATEMÁTICA

ESCUELA DE MATEMÁTICA

PROYECTO DE CURSO DE ESPECIALIZACIÓN: “MÉTODOS PREDIC-


TIVOS AVANZADOS EN REGRESIÓN Y CLASIFICACIÓN”

PROFESOR RESPONSABLE: RICARDO SALVADOR RÍOS MÁRQUEZ

DATOS GENERALES

Ciclo académico: N/A

Curso de especialización para la: Licenciatura en Estadística y Licenciatura en


Matemática

Asignatura: Métodos predictivos avanzados en regresión y clasificación

Número de horas del curso: 162

Duración del curso en semanas: 28

Número de unidades valorativas: 8 UV

Prerrequisito para poder cursar: Egresado de Licenciatura en Estadística o


Egresado de Licenciatura en Matemática

DESCRIPCIÓN DE LA ASIGNATURA

Desde los inicios de la estadística moderna con John Tukey proponiendo el


término “análisis de datos” hasta los aportes de DJ Patil en el libro “Building
data science teams”, la disciplina de la ciencia de datos ha estado latente en

1
la pŕactica de los profesionales de estadística, es hasta años recientes que el
término ciencia de datos se ha popularizado.

Dentro de la ciencia de datos como campo interdisciplinario se hace uso de


modelos paramétricos y no-paramétricos para realizar predicciones en problemas
de regresión y clasificación. Los problemas de regresión y clasificación surgen en
la práctica profesional de graduados de carreras en Licenciatura en Estadística y
Matemática, en concreto a lo largo de los años se ha identificado el área de riesgo
crediticio como un área en la cual los graduados han logrado aplicar modelos en
concreto de regresión logística.

Con el curso se espera ampliar el repertorio de modelos tanto en regresión como


clasificación, así como presentar sus ventajas y desventajas. Se usará el marco
de referencia conocido como Aprendizaje Estadístico el cual parte de la idea de
comprender los datos.

OBJETIVOS DE APRENDIZAJE

OBJETIVO GENERAL

• Que el estudiante conozca las diferencias entre los modelos paramétricos y


no-paramétricos cuando se aplican a problemas de regresión y clasificación,
así como sus respectivas ventajas y desventajas.

OBJETIVOS ESPECÍFICOS POR UNIDAD DIDÁCTICA

1. Introducción al lenguaje de programación R


• Que el estudiante se familiarize con el lenguaje de programación R.
2. Introducción al análisis exploratorio de datos

• Que el estudiante se familiarize con el análisis exploratorio de datos


para realizar investigaciones iniciales en los datos para descubrir pa-
trones y verificar supuestos en los datos.
3. Introducción a la Inferencia Estadística

• Que el estudiante repase conceptos fundamentales en probabilidad


tales como: probabilidad condicional, valores esperados, varianza y
distribuciones de probabilidad.
• Que el estudiante se familiarize con los intervalos de confianza y prue-
bas de hipótesis.

2
4. Introducción al Aprendizaje Estadístico
• Que el estudiante comprenda las diferencias entre aprendizaje super-
visado y no-supervisado.
• Que el estudiante entienda la diferencia entre problemas de regresión
y clasificación.
• Que el estudiante comprenda el concepto de la compensación entre
sesgo y varianza.
5. Regresión Lineal
• Que el estudiante domine las fases de estimación, interpretación y
predicción en un modelo de regresión lineal.
6. Clasificación
• Que el estudiante conozca las fases de estimación, interpretación y
predicción en un modelo de regresión logística.
• Que el estudiante conozca las fases de estimación, interpretación y
predicción en modelos generativos tales como: análisis discriminante
lineal, análisis discriminante cuadrático y naive bayes.
7. Metodos de re-muestreo
• Que el estudiante conozca las técnicas de validación cruzada para
mejorar la estimación del rendimiento de los modelos.
• Que el estudiante conozca las técnicas de boostrap para cuantificar
la incertidumbre asociada con un modelo.
8. Selección de variables y Regularización
• Que el estudiante conozca los métodos tradicionales de selección de
variables tales como: selección por pasos, eliminación hacia atrás y
selección hacia adelante.
• Que el estudiante conozca las técnicas de regularización tales como
la regresión rige y regresión lasso.
9. Modelos no-lineales
• Que el estudiante conozca los modelos de regresión polinómica.
• Que el estudiante conozca los modelos de función de paso.
• Que el estudiante conozca los modelos splines.
10. Modelos basados en árboles de decisión
• Que el estudiante conozca los arboles de regresión y clasificación.
• Que el estudiante conozca las ventajas y desventajas de los modelos
de arboles frente a las técnicas lineales.

3
• Que el estudiante conozca los modelos ensamblado tales como: bag-
ging, random forest y boosting.

MODALIDAD DE TRABAJO

El curso de especialización se realizará de manera virtual el cual tendra lugar


del 6 de Marzo de 2023 al 10 de Noviembre de 2023.

METODOLOGÍA

El curso consistirá en tres sesiones semanales de clases expositivas de duración


una hora y media las cuales estarán a cargo del MSc. Ricardo Ríos Márquez.
Dado que la orientación del curso se enmarca dentro de la ciencia de datos
se usará una metodología basada en proyectos. Debido a las limitaciones en
cuanto a conjuntos de dataset se propondrá tres proyectos de investigación, se
privilegiará el uso de datos reales en lugar de datos simulados.

• Sesiones del curso: lunes, miércoles y jueves de 4:30 p.m a 6:00 p.m.

EVALUACIÓN

• Tareas (25%) a lo largo del curso.


• Proyecto de investigación I correspondientes a los temas 1,2,3,4,5,6, 7 y 8
(25%).
• Proyecto de investigación II correspondiente al tema 1,2,3,4,5,6, 7, 8 y 9
del curso (25%).
• Proyecto de investigación III correspondiente al tema 1,2,3,4,5,6, 7, 8, 9 y
10 del curso (25%).

RESPONSABLE

Responsable interno: MSc. Ricardo Ríos Márquez. Docente de la Escuela


de Matemática.

TEMARIO

4
1. Introducción al lenguaje de programación R

• Tipos de datos y variables


• Operadores
• Operadores condicionales y bucles
• Funciones
• Introducción al tidyverse

2. Introducción al análisis exploratorio de datos

• Haciendo gráficos exploratorios


• Principios de gráficos análiticos

3. Introducción a la Inferencia Estadística

• Conceptos fundamentales en probabilidad


• Distribuciones de probabilidad
• Intervalos de confianza
• Pruebas de hipótesis

4. Introducción al Aprendizaje Estadístico

• La compensación sesgo-varianza.
• Aprendizaje supervisado versus aprendizaje no-supervisado
• Regresión versus Clasificación

5. Regresión Lineal

• Regresión lineal simple


• Regresión lineal múltiple
• Otras consideraciones sobre modelos de regresión lineal
6. Clasificación

• Regresión logística
• Modelos generativos para clasificación
• Comparando modelos de clasificación
7. Metodos de re-muestreo

• Validación cruzada
• El método de bootstrap
8. Selección de variables y Regularización

5
• Métodos de selección de variables
• Técnicas de regularización
9. Modelos no-lineales
• Regresión polinomial
• Funciones de paso
• Splines
10. Modelos basados en árboles de decisión
• Arboles de regresión y clasificación
• Arboles vs Modelos Lineales
• Modelos de ensamblado: bagging, random forest y boosting.

BIBLIOGRAFÍA

• Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani. (2021).


An introduction to statistical learning : with applications in R. New York
:Springer.
• Daniel Peña. (2002). Regresión y diseño de experimentos: Alianza Edito-
rial.
• Montgomery, Douglas C., and Elizabeth A. Peck. (1992). Introduction to
Linear Regression Analysis. New York: Wiley.
• Vapnik, V. (1999). The nature of statistical learning theory. Springer
science & business media.

PLAN REMEDIAL DE RECUPERACIÓN

En el caso de surgir imprevistos se proporcionará un mes adicional en el cual se


asignará un proyecto.

También podría gustarte