Extracto Del Libro
Extracto Del Libro
Extracto Del Libro
Capítulo 4
Principales algoritmos de
Machine Learning
1. Lo que vamos a descubrir y requisitos
Principales algoritmos de Machine Learning
Observación
Requisitos necesarios para abordar este capítulo correctamente: haber leído
el capítulo Estadísticas para comprender los datos.
2. ¿Supervisado o no supervisado?
¿Regresión o clasificación?
Realizar un aprendizaje supervisado consiste en proporcionarle a la máquina
datos etiquetados y propicios para el aprendizaje. Es decir, que vamos a anali-
zar y preparar los datos y a darles un significado. La máquina realizará su
aprendizaje a partir de este significado. El objetivo es indicarle a la máquina
que, para una serie de datos y para una observación precisa, el valor que se ha
de predecir es un gato, un perro u otro valor.
Cuando se trata de predecir un valor, hablaremos de regresión; en caso
contrario hablaremos de clasificación. Predecir el porcentaje de éxito de un
equipo de fútbol durante un partido es una regresión; predecir que la foto mos-
trada es un gato o un perro es una clasificación.
Allí donde utilizamos una sola variable explicativa para explicar otra variable
(una nota en función del tiempo de estudio), en la regresión lineal vamos a uti-
lizar varias variables explicativas.
Por ejemplo, queremos predecir el tiempo que va a invertir un ciclista para
ganar una etapa del Tour de Francia, en función de su edad, del tiempo que ha
invertido en hacer la etapa anterior, de su clasificación en el pelotón y otros
datos.
Una fase importante durante el uso de múltiples variables explicativas es su
normalización (adaptación de la escala). En nuestro ejemplo, es posible que
el tiempo invertido en minutos durante la etapa precedente varíe de 160 a 200,
y la posición en el pelotón, entre 1 y 80 en función de la cantidad de partici-
pantes en el Tour de Francia.
112 Inteligencia artificial fácil
Machine Learning y Deep Learning prácticos
Por lo tanto, no todas las variables explicativas están en la misma escala (de
160 a 200 frente a de 1 a 80).
La adaptación a la escala (scaling) consistirá en conseguir que la media de
cada serie de observaciones sea igual a 0, y que la varianza y la desviación típica
sean iguales a 1. Este método también se llama centrar una variable.
Después de esta fase podemos pasar a la predicción gracias al método de des-
censo del gradiente o también al método de los mínimos cuadrados.
Estos dos métodos toman en cuenta las distintas variables explicativas que se
ponen a escala con objeto de predecir la variable explicada.
A veces es difícil encontrar una recta que pueda pasar entre los puntos de la
serie de observaciones de manera óptima. Sin embargo, en ocasiones es posible
encontrar un vínculo entre las variables con ayuda de una curva. Es lo que per-
mite la regresión polinomial añadiendo pliegues a la curva usando elementos
llamados polinomios.
Regresión polinomial
114 Inteligencia artificial fácil
Machine Learning y Deep Learning prácticos