Aprendizaje Automático
Aprendizaje Automático
Aprendizaje Automático
Ir a la navegaciónIr a la búsqueda
Aprendizaje automático
Índice
1Resumen
o 1.1Modelos
2Tipos de algoritmos
3Técnicas de clasificación
o 3.1Árboles de decisiones
o 3.2Reglas de asociación
o 3.3Algoritmos genéticos
o 3.6Algoritmos de agrupamiento
o 3.7Redes bayesianas
4Conocimiento
6Aplicaciones
9Software
o 9.2Software comercial
10Publicaciones y conferencias
11Véase también
12Referencias
13Bibliografía
14Enlaces externos
Resumen[editar]
El aprendizaje automático tiene como resultado un modelo para resolver una tarea dada.
Entre los modelos se distinguen2
Tipos de algoritmos[editar]
Aprendizaje supervisado
El algoritmo produce una función que establece una correspondencia entre las entradas y las
salidas deseadas del sistema. Un ejemplo de este tipo de algoritmo es el problema
de clasificación, donde el sistema de aprendizaje trata de etiquetar (clasificar) una serie de
vectores utilizando una entre varias categorías (clases). La base de conocimiento del sistema
está formada por ejemplos de etiquetados anteriores. Este tipo de aprendizaje puede llegar a
ser muy útil en problemas de investigación biológica, biología computacional y bioinformática.
Aprendizaje no supervisado
Todo el proceso de modelado se lleva a cabo sobre un conjunto de ejemplos formado tan sólo
por entradas al sistema. No se tiene información sobre las categorías de esos ejemplos. Por lo
tanto, en este caso, el sistema tiene que ser capaz de reconocer patrones para poder etiquetar
las nuevas entradas.
Aprendizaje semisupervisado
Este tipo de algoritmos combinan los dos algoritmos anteriores para poder clasificar de
manera adecuada. Se tiene en cuenta los datos marcados y los no marcados.
El aprendizaje por refuerzo es el más general entre las tres categorías. En vez de que un
instructor indique al agente qué hacer, el agente inteligente debe aprender cómo se comporta
el entorno mediante recompensas (refuerzos) o castigos, derivados del éxito o del fracaso
respectivamente. El objetivo principal es aprender la función de valor que le ayude al agente
inteligente a maximizar la señal de recompensa y así optimizar sus políticas de modo a
comprender el comportamiento del entorno y a tomar buenas decisiones para el logro de sus
objetivos formales.
Los principales algoritmos de aprendizaje por refuerzo se desarrollan dentro de los métodos de
resolución de problemas de decisión finitos de Markov, que incorporan las ecuaciones de
Bellman y las funciones de valor. Los tres métodos principales son: la Programación Dinámica,
los métodos de Monte Carlo y el aprendizaje de Diferencias Temporales. 3
Transducción
Similar al aprendizaje supervisado, pero no construye de forma explícita una función. Trata de
predecir las categorías de los futuros ejemplos basándose en los ejemplos de entrada, sus
respectivas categorías y los ejemplos nuevos al sistema.
Aprendizaje multi-tarea
Métodos de aprendizaje que usan conocimiento previamente aprendido por el sistema de cara
a enfrentarse a problemas parecidos a los ya vistos.
Para llevar a cabo un buen aprendizaje es necesario considerar todos los factores que a este le
rodean, como la sociedad, la economía, la ciudad, el ambiente, el lugar, etc. Por lo tanto, es
necesario empezar a tomar diversas medidas para lograr un aprendizaje adecuado, y obtener
una automatización adecuada del aprendizaje. Así, lo primero que se debe tener en cuenta es
el concepto de conocimiento, que es el entendimiento de un determinado tema o materia en
el cual tú puedas dar tu opinión o punto de vista, así como responder a ciertas interrogantes
que puedan surgir de dicho tema o materia.
Técnicas de clasificación[editar]
Árboles de decisiones[editar]
Este tipo de aprendizaje usa un árbol de decisiones como modelo predictivo. Se mapean
observaciones sobre un objeto con conclusiones sobre el valor final de dicho objeto.
Los árboles son estructuras básicas en la informática. Los árboles de atributos son la base de
las decisiones. Una de las dos formas principales de árboles de decisiones es la desarrollada
por Quinlan de medir la impureza de la entropía en cada rama, algo que primero desarrolló en
el algoritmo ID3 y luego en el C4.5. Otra de las estrategias se basa en el índice GINI y fue
desarrollada por Breiman, Friedman et alia. El algoritmo de CART es una implementación de
esta estrategia.4
Reglas de asociación[editar]
Algoritmos genéticos[editar]
Los algoritmos genéticos son procesos de búsqueda heurística que simulan la selección
natural. Usan métodos tales como la mutación y el cruzamiento para generar nuevas clases
que puedan ofrecer una buena solución a un problema dado.
Las MVS son una serie de métodos de aprendizaje supervisado usados para clasificación y
regresión. Los algoritmos de MVS usan un conjunto de ejemplos de entrenamiento clasificado
en dos categorías para construir un modelo que prediga si un nuevo ejemplo pertenece a una
u otra de dichas categorías.
Algoritmos de agrupamiento[editar]
Las técnicas de agrupamiento hacen inferencias diferentes sobre la estructura de los datos; se
guían usualmente por una medida de similaridad específica y por un nivel de compactamiento
interno (similaridad entre los miembros de un grupo) y la separación entre los diferentes
grupos.
Una red bayesiana, red de creencia o modelo acíclico dirigido es un modelo probabilístico que
representa una serie de variables de azar y sus independencias condicionales a través de un
grafo acíclico dirigido. Una red bayesiana puede representar, por ejemplo, las relaciones
probabilísticas entre enfermedades y síntomas. Dados ciertos síntomas, la red puede usarse
para calcular las probabilidades de que ciertas enfermedades estén presentes en un
organismo. Hay algoritmos eficientes que infieren y aprenden usando este tipo de
representación.
Conocimiento[editar]
1. Crecimiento
Es el que se adquiere de lo que nos rodea, el cual guarda la información en la memoria como si
dejara huellas.
2. Reestructuración
3. Ajuste
Los tres tipos se efectúan durante un proceso de aprendizaje automático pero la importancia
de cada tipo de conocimiento depende de las características de lo que se está tratando de
aprender.
El aprendizaje es más que una necesidad, es un factor primordial para satisfacer las
necesidades de la inteligencia artificial.
El aprendizaje supervisado se caracteriza por contar con información que especifica qué
conjuntos de datos son satisfactorios para el objetivo del aprendizaje. Un ejemplo podría ser
un software que reconoce si una imagen dada es o no la imagen de un rostro: para el
aprendizaje del programa tendríamos que proporcionarle diferentes imágenes, especificando
en el proceso si se trata o no de rostros.
Aplicaciones[editar]
Motores de búsqueda
Diagnóstico médico
Robótica
Minería de datos
Big Data
A continuación se muestran una serie de temas que podrían formar parte del temario de un
curso sobre aprendizaje automático.
o Perceptrón
o Algoritmo EM
o Métodos variacionales
Software[editar]
Encog
H2O
KNIME
mlpy
MLPACK
MOA
OpenCV
Tortilla JS
OpenNN
RapidMiner
Spark MLlib: una librería que forma parte de Apache Spark, una plataforma para
computación de grupos
Software comercial[editar]
SPSS Modeler
Mathematica
MATLAB
Neural Designer
RCASE
STATISTICA
SAS