Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

PAM-presentación-2 Avance Versión Final

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 9

Algoritmo PAM

Análisis Multivariado

Rafael Castillo / Sergio Serrano

2023-03-24
Algoritmo PAM
Los algoritmos de partición buscan segmentar un conjunto de
objetos en k grupos (clústers), el objetivo principal es encontrar
grupos, cuyos objetos muestran un alto grado de similitud.
El algoritmo utilizado en el programa PAM se basa en la búsqueda
de k objetos representativos entre los objetos del conjunto de
datos.
Tales objetos representativos a menudo se denominan centrotipos.
En el algoritmo PAM los objetos representativos son los llamados
medoides de los clústers (Kaufman y Rousseeuw, 1987).
Hay básicamente dos formas de ingresar los datos en PAM.
• La forma más común es mediante una matriz de valores de
medición.
• Alternativamente, se puede utilizar introduciendo una matriz
de disimilaridades entre objetos. Tales diferencias se pueden
obtener de varias maneras. A menudo se calculan a partir de
variables que no están necesariamente en una escala de
intervalos, pero que también pueden ser binarias, ordinales o
nominales. También sucede que las diferencias se dan
directamente, sin recurrir a ningún valor de medición.
Fase 1: BUILD
El algoritmo PAM consta de dos fases. En la primera fase,
llamada BUILD, se obtiene un agrupamiento de objetos
representativos hasta encontrar k objetos de estos.
El primer objeto representativo es aquel para el cual la suma de
las disimiliridades con todos los demás objetos es lo más
pequeña posible. Este objeto es el más céntrico de este
conjunto.
Posteriormente, en cada paso, se selecciona otro objeto, el cual
tiene por objetivo minimizar la suma de las disimilaridades de los
objetos con sus objetos representativos.
Pasos de la fase BUILD:

1. Considere un objeto i que aún no ha sido seleccionado.


2. Considere un objeto j no seleccionado y calcule la diferencia
entre su disimilitud Dj, con el objeto más similar previamente
seleccionado, y su disimilitud d(j, i) con el objeto i.
3. Si esta diferencia es positiva, el objeto j contribuirá a la
decisión de seleccionar el objeto i. Por lo tanto, calculamos:
,0)
4. Calcular la ganancia total obtenida seleccionando el objeto i:

5. Elegir el objeto i aún no seleccionado que maximiza

Este proceso continúa hasta encontrar los k objetos representativos.


Fase 2: SWAP

En esta fase se busca mejorar el conjunto de objetos representativos y, por


lo tanto, también mejorar la agrupación en clústeres producida por este
conjunto.
Vamos a considerar todos los pares de objetos (i, h) para el cual el objeto i
ha sido selec cionado y el objeto h no.
Se determina qué efecto es obtenido sobre el valor de la agrupación
cuando el objeto i ya no está seleccionado como objeto representativo,
sino el objeto h.
Recordemos que el valor de una agrupación determinada por k objetos
representativos se define como la suma de disimilaridades entre cada
objeto y el objeto representativo.
Pasos de la fase SWAP:

1. Considere un objeto j no seleccionado y calcule su contribución al ser intercambiado:


a. Si j está más distante de i y h que de uno de los otros objetos representativos, es cero.
b. Si j no está más lejos de i que de cualquier otro representante seleccionado objeto, es
decir, se deben considerar dos situaciones:
b.1. j está más cerca de h que del segundo objeto representativo más cercano ,
donde es la disimilitud entre j y el segundo objeto más representativo similar.
Entonces la contribución del objeto j al ser intercambiado entre los objetos i y h es:

b.2. j está al menos tan distante de h que del segundo objeto representativo
cercano, es decir, . Entonces la contribución del objeto j es:
c. j está más distante del objeto i que de al menos uno de los otros objetos representativos, pero más
cerca de h que de cualquier objeto representativo. En este caso, la contribución de j es:

2. Calcular el resultado total de un swap sumando las contribuciones :

En los siguientes pasos se decide si llevar a cabo un intercambio.

 
3. Seleccione el par (i, h) que minimiza

4. Si el mínimo es negativo, el swap se lleva a cabo y el algoritmo vuelve al paso 1. Si el mínimo es


positivo o 0, el valor del objetivo no puede reducirse mediante la realización de un swap y el algoritmo
se detiene.

También podría gustarte