Tarea 1
Tarea 1
Tarea 1
Desarrollo:
El concepto común de métrica es la correspondencia de un dominio empírico (mundo real)
a Es la correspondencia de un dominio empírico (mundo real) a un mundo formal,
matemático. La medida incluye al valor numérico o incluye al valor numérico o nominal
asignado al atribut de un de un ente por medio de dicha por medio de dicha
correspondencia. Pudiendo existir dos tipos de métricas:
1. Métrica directa: Una métrica de un atributo que no depende de ninguna métrica de otro
atributo.
2. Métrica indirecta: Una métrica de un atributo que se deriva de una o más métricas de
otros atributos. Se formaliza por medio de una función de medición (fórmula ecuación).
Función de medición, un algoritmo o cálculo que permite combinar dos o más métricas.
Dentro del área de las redes neuronales una métrica es una función que, dados los valores
predichos y los valores reales de los ejemplos, le proporciona una medida escalar de la
adecuación de su modelo a los datos que tiene. Entonces, como puede ver, una función de
pérdida es métrica, pero lo contrario no siempre se cumple. Para comprender estas
diferencias, veamos los ejemplos más comunes de uso de métricas:
> Mida el rendimiento de su red utilizando funciones no diferenciables: por ejemplo, la
precisión no es diferenciable (ni siquiera continua), por lo que no puede optimizar
directamente su red w.r.t. lo. Sin embargo, puede usarlo para elegir el modelo con la mejor
precisión.
> Obtenga valores de diferentes funciones de pérdida cuando su pérdida final sea una
combinación de algunas de ellas: Supongamos que su pérdida tiene un término de
regularización que mide cómo sus pesos difieren de 0 y un término que mide la aptitud de
su modelo. En este caso, podría usar las métricas para tener una pista separada de cómo
cambia la forma física de sus modelos a lo largo de las épocas.
> Realice un seguimiento de una medida con respecto a la cual no desea optimizar
directamente su modelo: asumamos que está resolviendo un problema de regresión
multidimensional en el que está más preocupado por mse pero al mismo tiempo está
interesado en cómo un coseno -la distancia de su solución está cambiando en el tiempo.
Entonces, es lo mejor para usar métricas. Una métrica es una función usada para juzgar el
desempeño del modelo.
-Métrica Matriz de confusión o error. La información bruta producida por un esquema
de clasificación durante la prueba son recuentos de las clasificaciones correctas e
incorrectas de cada clase. Esta información normalmente se muestra en una matriz
de confusión. Una matriz de confusión es una forma de tabla de contingencia que
muestra las diferencias entre la verdad y las clases predichas para un conjunto de ejemplos
etiquetados.
Entonces, MSPE puede ser pensado como versiones ponderadas de MSE. El peso de su
muestra es inversamente proporcional a su cuadrado objetivo. Esto significa que, el costo
que pagamos por un error absoluto fijo, depende del valor objetivo y, a medida que
aumenta, pagamos menos. Dado que MSPE se considera como la versión ponderada de
MSE, las predicciones constantes óptimas para MSPE resultan ser la media ponderada de
los valores objetivo. Error de porcentaje cuadrático medio (MSPE) Entonces, MSPE puede
ser pensado como versiones ponderadas de MSE. El peso de su muestra es inversamente
proporcional a su cuadrado objetivo. Esto significa que, el costo que pagamos por un error
absoluto fijo, depende del valor objetivo y, a medida que aumenta, pagamos menos. Dado
que MSPE se considera como la versión ponderada de MSE, las predicciones constantes
óptimas para MSPE resultan ser la media ponderada de los valores objetivo.
-Métrica Error porcentual absoluto medio (MAPE). La preferencia de error relativo
también se puede expresar con el Error porcentual absoluto medio, MAPE. Para cada
objeto, el error absoluto se divide por el valor objetivo, dando un error relativo. MAPE
también puede ser pensado como versiones ponderadas de MAE:
Para MAPE, el peso de su muestra es inversamente proporcional a su objetivo. Pero de
manera similar a MSPE, el costo que pagamos por un error absoluto fijo depende del valor
objetivo. Y a medida que aumenta el objetivo, pagamos menos. Dado que MAPE se
considera como la versión ponderada de MAE, las predicciones constantes óptimas para
MAPE resultan ser la mediana ponderada de los valores objetivo. Tenga en cuenta que si
un valor atípico tuviera un valor muy, muy pequeño, MAPE estaría muy sesgado hacia él,
ya que este valor atípico tendrá el peso más alto.
-Métrica Error logarítmico cuadrático medio (RMSLE). Es solo un RMSE calculado
en escala logarítmica. De hecho, para calcularlo, tomamos un logaritmo de nuestras
predicciones y los valores objetivo, y calculamos RMSE entre ellos. Los objetivos
generalmente no son negativos pero pueden ser iguales a 0, y el logaritmo de 0 no está
definido. Es por eso que generalmente se agrega una constante a las predicciones y los
objetivos antes de aplicar la operación logarítmica. Esta constante también se puede elegir
para que sea diferente a una dependiendo del problema:
Esta métrica se usa generalmente en la misma situación que MSPE y MAPE, ya que
también conlleva errores relativos más que errores absolutos. Tenga en cuenta la asimetría
de las curvas de error. Desde la perspectiva de RMSLE, siempre es mejor predecir más de
la misma cantidad menos que el objetivo. Por lo tanto, llegamos a la conclusión de que
RMSLE penaliza una estimación poco predicha mayor que una estimación sobre
pronosticada. RMSLE se puede calcular sin la operación raíz, pero la versión rooteada se
usa más ampliamente. Ahora pasemos a la pregunta sobre la mejor constante. (Recuerde la
conexión entre RMSLE y RMSE). Primero, encontramos la mejor constante para RMSE
en el espacio de registro, que será la media ponderada en el espacio de registro. Y, después,
debemos regresar del espacio de registro al habitual con una transformación inversa.
-Métrica Error cuadrático medio (RMSE). RMSE es solo la raíz cuadrada de MSE. La
raíz cuadrada se introduce para hacer que la escala de los errores sea igual a la escala de
los objetivos:
Ahora, es muy importante entender en qué sentido RMSE es similar a MSE y cuál es la
diferencia. Primero, son similares en términos de sus minimizadores, cada minimizador de
MSE es también un minimizador para RMSE y viceversa, ya que la raíz cuadrada es una
función que no disminuye. Por ejemplo, si tenemos dos conjuntos de predicciones, A y B,
y decimos que el MSE de A es mayor que el MSE de B, entonces podemos estar seguros
de que RMSE de A es mayor que RMSE de B. Y también funciona en la dirección opuesta:
Conclusión:
Al principio me fue muy difícil encontrar las métricas de las redes neuronales para con ello
logar identificar apropiadamente los patrones de un conjunto de datos, una vez ya la
encontré me di cuenta que eran demasiadas, bueno tengo en parte duda si las de Machine
Learning son correctas dado que muchas métricas que encontré eran para redes neuronales
y también para Machine Learning, el cual a su vez contiene en su interior redes neuronales
en algunos casos, espero si estén correctas, o si no tendré métricas demás, pero sé que si
tengo las básicas y no quería que fueran a faltar en la presente investigación.
Es necesario optimizar nuestras métricas para lograr que estas sean lo más precisas
posibles, donde estas son medidas del rendimiento de red respecto a datos de comprobación
y entrenamiento, respectivamente. Se calculan como la correlación entre los valores reales
y predichos al cuadrado, dividida por la media de los errores cuadráticos, no suenan difícil
de implementar, pero ya a la hora de pasar la teoría a la práctica y más en programación
logramos observar muchas diferencias a considerar con lo cual se elige una métrica a
utilizar.
Existe un montón de métricas para usar, lo importante es saber cuándo usarlas y cuantas
vamos a usar, que depende mucho del tipo de objetivo que tengamos que alcanzar donde
lograremos verificar si una red neuronal ha logrado identificar o no apropiadamente los
patrones de un conjunto de datos, en qué medida lo va logrando en cada una de sus
iteraciones con la modificación de sus entradas y datos que la constituyen. Muchas de estas
métricas me parecieron muy avanzadas en su lógica, funcionamiento y constitución por lo
cual no los comprendí detalladamente como me hubiera gustado entenderlas y más a la
primera. Algunas métricas logran alcanzar una mayor precisión del 99% o poco más en
comparación de las otras, pero hay muchos aspectos a considerar o pensar si hasta es
conveniente combinarlas, por lo cual es importante tomarse un tiempo para comenzar a
elegir adecuadamente la o las métricas más apropiadas.
Bibliografía:
https://codeday.me/es/qa/20190324/369627.html
https://es.wikipedia.org/wiki/Algoritmo_gen%C3%A9tico
https://es.wikipedia.org/wiki/Mapa_autoorganizado#cite_note-2
https://es.wikipedia.org/wiki/Red_neuronal_artificial
http://sitiobigdata.com/2019/01/19/machine-learning-metrica-clasificacion-parte-3/#