PAM-presentación-2 Avance Versión Final
PAM-presentación-2 Avance Versión Final
PAM-presentación-2 Avance Versión Final
Análisis Multivariado
2023-03-24
Algoritmo PAM
Los algoritmos de partición buscan segmentar un conjunto de
objetos en k grupos (clústers), el objetivo principal es encontrar
grupos, cuyos objetos muestran un alto grado de similitud.
El algoritmo utilizado en el programa PAM se basa en la búsqueda
de k objetos representativos entre los objetos del conjunto de
datos.
Tales objetos representativos a menudo se denominan centrotipos.
En el algoritmo PAM los objetos representativos son los llamados
medoides de los clústers (Kaufman y Rousseeuw, 1987).
Hay básicamente dos formas de ingresar los datos en PAM.
• La forma más común es mediante una matriz de valores de
medición.
• Alternativamente, se puede utilizar introduciendo una matriz
de disimilaridades entre objetos. Tales diferencias se pueden
obtener de varias maneras. A menudo se calculan a partir de
variables que no están necesariamente en una escala de
intervalos, pero que también pueden ser binarias, ordinales o
nominales. También sucede que las diferencias se dan
directamente, sin recurrir a ningún valor de medición.
Fase 1: BUILD
El algoritmo PAM consta de dos fases. En la primera fase,
llamada BUILD, se obtiene un agrupamiento de objetos
representativos hasta encontrar k objetos de estos.
El primer objeto representativo es aquel para el cual la suma de
las disimiliridades con todos los demás objetos es lo más
pequeña posible. Este objeto es el más céntrico de este
conjunto.
Posteriormente, en cada paso, se selecciona otro objeto, el cual
tiene por objetivo minimizar la suma de las disimilaridades de los
objetos con sus objetos representativos.
Pasos de la fase BUILD:
b.2. j está al menos tan distante de h que del segundo objeto representativo
cercano, es decir, . Entonces la contribución del objeto j es:
c. j está más distante del objeto i que de al menos uno de los otros objetos representativos, pero más
cerca de h que de cualquier objeto representativo. En este caso, la contribución de j es:
3. Seleccione el par (i, h) que minimiza