Proyecto Métodos Predictivos2023

UNIVERSIDAD DE EL SALVADOR
FACULTAD DE CIENCIAS NATURALES Y MATEMÁTICA
ESCUELA DE MATEMÁTICA
PROYECTO DE CURSO DE ESPECIALIZACIÓN: “MÉTODOS PREDIC-

TIVOS AVANZADOS EN REGRESIÓN Y CLASIFICACIÓN”
PROFESOR RESPONSABLE: RICARDO SALVADOR RÍOS MÁRQUEZ
DATOS GENERALES
Ciclo académico: N/A
Curso de especialización para la: Licenciatura en Estadística y Licenciatura en

Matemática
Asignatura: Métodos predictivos avanzados en regresión y clasificación
Número de horas del curso: 162
Duración del curso en semanas: 28
Número de unidades valorativas: 8 UV
Prerrequisito para poder cursar: Egresado de Licenciatura en Estadística o

Egresado de Licenciatura en Matemática
DESCRIPCIÓN DE LA ASIGNATURA
Desde los inicios de la estadística moderna con John Tukey proponiendo el

término “análisis de datos” hasta los aportes de DJ Patil en el libro “Building
data science teams”, la disciplina de la ciencia de datos ha estado latente en
1
la pŕactica de los profesionales de estadística, es hasta años recientes que el
término ciencia de datos se ha popularizado.
Dentro de la ciencia de datos como campo interdisciplinario se hace uso de

modelos paramétricos y no-paramétricos para realizar predicciones en problemas
de regresión y clasificación. Los problemas de regresión y clasificación surgen en
la práctica profesional de graduados de carreras en Licenciatura en Estadística y
Matemática, en concreto a lo largo de los años se ha identificado el área de riesgo
crediticio como un área en la cual los graduados han logrado aplicar modelos en
concreto de regresión logística.
Con el curso se espera ampliar el repertorio de modelos tanto en regresión como

clasificación, así como presentar sus ventajas y desventajas. Se usará el marco
de referencia conocido como Aprendizaje Estadístico el cual parte de la idea de
comprender los datos.
OBJETIVOS DE APRENDIZAJE
OBJETIVO GENERAL
• Que el estudiante conozca las diferencias entre los modelos paramétricos y

no-paramétricos cuando se aplican a problemas de regresión y clasificación,
así como sus respectivas ventajas y desventajas.
OBJETIVOS ESPECÍFICOS POR UNIDAD DIDÁCTICA
1. Introducción al lenguaje de programación R

• Que el estudiante se familiarize con el lenguaje de programación R.
2. Introducción al análisis exploratorio de datos
• Que el estudiante se familiarize con el análisis exploratorio de datos

para realizar investigaciones iniciales en los datos para descubrir pa-
trones y verificar supuestos en los datos.
3. Introducción a la Inferencia Estadística
• Que el estudiante repase conceptos fundamentales en probabilidad

tales como: probabilidad condicional, valores esperados, varianza y
distribuciones de probabilidad.
• Que el estudiante se familiarize con los intervalos de confianza y prue-
bas de hipótesis.
2
4. Introducción al Aprendizaje Estadístico
• Que el estudiante comprenda las diferencias entre aprendizaje super-
visado y no-supervisado.
• Que el estudiante entienda la diferencia entre problemas de regresión
y clasificación.
• Que el estudiante comprenda el concepto de la compensación entre
sesgo y varianza.
5. Regresión Lineal
• Que el estudiante domine las fases de estimación, interpretación y
predicción en un modelo de regresión lineal.
6. Clasificación
• Que el estudiante conozca las fases de estimación, interpretación y
predicción en un modelo de regresión logística.
• Que el estudiante conozca las fases de estimación, interpretación y
predicción en modelos generativos tales como: análisis discriminante
lineal, análisis discriminante cuadrático y naive bayes.
7. Metodos de re-muestreo
• Que el estudiante conozca las técnicas de validación cruzada para
mejorar la estimación del rendimiento de los modelos.
• Que el estudiante conozca las técnicas de boostrap para cuantificar
la incertidumbre asociada con un modelo.
8. Selección de variables y Regularización
• Que el estudiante conozca los métodos tradicionales de selección de
variables tales como: selección por pasos, eliminación hacia atrás y
selección hacia adelante.
• Que el estudiante conozca las técnicas de regularización tales como
la regresión rige y regresión lasso.
9. Modelos no-lineales
• Que el estudiante conozca los modelos de regresión polinómica.
• Que el estudiante conozca los modelos de función de paso.
• Que el estudiante conozca los modelos splines.
10. Modelos basados en árboles de decisión
• Que el estudiante conozca los arboles de regresión y clasificación.
• Que el estudiante conozca las ventajas y desventajas de los modelos
de arboles frente a las técnicas lineales.
3
• Que el estudiante conozca los modelos ensamblado tales como: bag-
ging, random forest y boosting.
MODALIDAD DE TRABAJO
El curso de especialización se realizará de manera virtual el cual tendra lugar

del 6 de Marzo de 2023 al 10 de Noviembre de 2023.
METODOLOGÍA
El curso consistirá en tres sesiones semanales de clases expositivas de duración

una hora y media las cuales estarán a cargo del MSc. Ricardo Ríos Márquez.
Dado que la orientación del curso se enmarca dentro de la ciencia de datos
se usará una metodología basada en proyectos. Debido a las limitaciones en
cuanto a conjuntos de dataset se propondrá tres proyectos de investigación, se
privilegiará el uso de datos reales en lugar de datos simulados.
• Sesiones del curso: lunes, miércoles y jueves de 4:30 p.m a 6:00 p.m.
EVALUACIÓN
• Tareas (25%) a lo largo del curso.

• Proyecto de investigación I correspondientes a los temas 1,2,3,4,5,6, 7 y 8
(25%).
• Proyecto de investigación II correspondiente al tema 1,2,3,4,5,6, 7, 8 y 9
del curso (25%).
• Proyecto de investigación III correspondiente al tema 1,2,3,4,5,6, 7, 8, 9 y
10 del curso (25%).
RESPONSABLE
Responsable interno: MSc. Ricardo Ríos Márquez. Docente de la Escuela

de Matemática.
TEMARIO
4
1. Introducción al lenguaje de programación R
• Tipos de datos y variables

• Operadores
• Operadores condicionales y bucles
• Funciones
• Introducción al tidyverse
2. Introducción al análisis exploratorio de datos
• Haciendo gráficos exploratorios

• Principios de gráficos análiticos
3. Introducción a la Inferencia Estadística
• Conceptos fundamentales en probabilidad

• Distribuciones de probabilidad
• Intervalos de confianza
• Pruebas de hipótesis
4. Introducción al Aprendizaje Estadístico
• La compensación sesgo-varianza.
• Aprendizaje supervisado versus aprendizaje no-supervisado
• Regresión versus Clasificación
5. Regresión Lineal
• Regresión lineal simple

• Regresión lineal múltiple
• Otras consideraciones sobre modelos de regresión lineal
6. Clasificación
• Regresión logística
• Modelos generativos para clasificación
• Comparando modelos de clasificación
7. Metodos de re-muestreo
• Validación cruzada
• El método de bootstrap
8. Selección de variables y Regularización
5
• Métodos de selección de variables
• Técnicas de regularización
9. Modelos no-lineales
• Regresión polinomial
• Funciones de paso
• Splines
10. Modelos basados en árboles de decisión
• Arboles de regresión y clasificación
• Arboles vs Modelos Lineales
• Modelos de ensamblado: bagging, random forest y boosting.
BIBLIOGRAFÍA
• Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani. (2021).

An introduction to statistical learning : with applications in R. New York
:Springer.
• Daniel Peña. (2002). Regresión y diseño de experimentos: Alianza Edito-
rial.
• Montgomery, Douglas C., and Elizabeth A. Peck. (1992). Introduction to
Linear Regression Analysis. New York: Wiley.
• Vapnik, V. (1999). The nature of statistical learning theory. Springer
science & business media.
PLAN REMEDIAL DE RECUPERACIÓN
En el caso de surgir imprevistos se proporcionará un mes adicional en el cual se

asignará un proyecto.

Proyecto Métodos Predictivos2023

Cargado por

Información del documentohacer clic para expandir la información del documento

Copyright:

Formatos disponibles

Proyecto Métodos Predictivos2023

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Proyecto Métodos Predictivos2023

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD DE EL SALVADOR

FACULTAD DE CIENCIAS NATURALES Y MATEMÁTICA

PROYECTO DE CURSO DE ESPECIALIZACIÓN: “MÉTODOS PREDIC-

PROFESOR RESPONSABLE: RICARDO SALVADOR RÍOS MÁRQUEZ

Ciclo académico: N/A

Curso de especialización para la: Licenciatura en Estadística y Licenciatura en

Asignatura: Métodos predictivos avanzados en regresión y clasificación

Número de horas del curso: 162

Duración del curso en semanas: 28

Número de unidades valorativas: 8 UV

Prerrequisito para poder cursar: Egresado de Licenciatura en Estadística o

Desde los inicios de la estadística moderna con John Tukey proponiendo el

Dentro de la ciencia de datos como campo interdisciplinario se hace uso de

Con el curso se espera ampliar el repertorio de modelos tanto en regresión como

• Que el estudiante conozca las diferencias entre los modelos paramétricos y

OBJETIVOS ESPECÍFICOS POR UNIDAD DIDÁCTICA

1. Introducción al lenguaje de programación R

• Que el estudiante se familiarize con el análisis exploratorio de datos

• Que el estudiante repase conceptos fundamentales en probabilidad

El curso de especialización se realizará de manera virtual el cual tendra lugar

El curso consistirá en tres sesiones semanales de clases expositivas de duración

• Tareas (25%) a lo largo del curso.

Responsable interno: MSc. Ricardo Ríos Márquez. Docente de la Escuela

• Tipos de datos y variables

2. Introducción al análisis exploratorio de datos

• Haciendo gráficos exploratorios

3. Introducción a la Inferencia Estadística

• Conceptos fundamentales en probabilidad

4. Introducción al Aprendizaje Estadístico

• Regresión lineal simple

• Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani. (2021).

PLAN REMEDIAL DE RECUPERACIÓN

En el caso de surgir imprevistos se proporcionará un mes adicional en el cual se

También podría gustarte