Clasificacion - No Supervisada

TELEDETECCIÓN
Interpretación de imágenes en Teledetección
Remote Sensing (Curso 2018/19)

Repaso
Segmentación y Clasificación
Adquisición de información
Resolución del sensor
Definición de clasificación
Tipos de clases
Sensor ETM+ (LANDSAT 7)
Fases de la clasificación digital basada en
píxeles
Fase de entrenamiento
Segmentación de imágenes. Definición y utilidad
 Fases del procesado de señal en teledetección:

• Rectificación y restauración de imágenes
• Realce y mejora de imágenes
• Clasificación de imágenes
• Integración de la información en GIS
La clasificación condiciona todo el tratamiento previo de la imagen
Tomado de:
“Remote Sensing, Third Edition Models
and Methods for Image Processing”.
Robert A. Schowengerdt. Elsevier. 2007
Clasificación de imágenes en teledetección
Monobanda: Un sólo valor/pixel (nivel de
gris, nivel digital, ND)
Multibanda: Un vector/pixel (dimensión=nº

de bandas
Firma espectral para cada pixel
Representación de cada píxel en un espacio bidimensional:
Visible e Infrarrojo, para tres cubiertas: agua, suelo y vegetación
Nubes de puntos, por
variabilidad de patrones de
entrada.
Patrones de una misma

“clase”, están relativamente
cercanos
Diagramas de dispersión
o scattergramas
Clasificación como toma de decisiones de datos con variabilidad
estadística. Localizar un rango numérico que caracterice a cada
categoría
Los píxeles con características espectrales similares tienden a agruparse en

nubes/conglomerados/clusters, correspondientes a distintas clases espectrales
clases temáticas
Clasificación de imágenes en teledetección.
Desde la toma de datos “en crudo”, se deben extraer

características:
• Reducción de la dimensionalidad: Tomar información más relevante

• Cambio en el espacio de representación: Objetivo maximizar la varianza
En la imagen clasificada un píxel es un

identificador de clase
Niveles I y II de cubiertas terrestres
Conjunto muy Conjunto poco

separable separable
 Entrenamiento
• Supervisado  Clases temáticas.
• Conocimiento previo de las clases temáticas
• No supervisado Clases espectrales

• Búsqueda automática de grupos con valores homogéneos en la
imagen
 Situaciones reales:
• Dos clases temáticas una única firma espectral
• Una clase temática dos clases espectrales
Entrenamiento no-supervisado y supervisado
 Entrenamiento Supervisado conocimiento previo

de clases de interés
asignación de los pixels de la escena a

alguna de las clases previamente
Consideradas. Métodos bayesianos
Mínima distancia
Mínima distancia de
Mahalanobis
Máxima probabilidad
Paralelepipedo
 Entrenamiento No Supervisado
No conocimiento previo de clases de interés
Los pixels de las áreas de entrenamiento se someten a un algoritmo de clustering
para determinar el agrupamiento "natural" de los mismos.
Algoritmos de “clustering”
K-medias
Isodatos
 ALGORITMO K-MEANS
 Ejemplo de K-means
 PLANTEAMIENTO (K=2)
 Supóngase que se tienen cuatro tipos de medicina con dos
atributos (peso e índice PH) como se muestra en la siguiente
tabla:
MEDICINA PESO ÍNDICE PH
A 1 1
B 2 1
m = [ 1 1; 2 1; 4 3; 5 4]
C 4 3
D 5 4
Valor inicial de los centroides: Sean C1 y C2 los
centroides de los k-grupos. Si se eligen las
medicinas A y B como los primeros centroides
que quedan en los puntos (1,1) y (2,1).
Distancia de cada objeto a los centroides: Se calcula la distancia de cada

objeto utilizando la distancia euclidiana:
• Resultado de la matriz de distancias de la inicialización (Distancia euclidiana de
cada componente a cada uno de los dos centroides) :
PRIMERA ITERACIÓN:
• Agrupación de Objetos: A al grupo 1 y B, C y D al grupo 2, quedando la matriz
de agrupación:
• Determinar centroides: el grupo 1 tiene sólo un miembro el centroide de ese grupo

permanece en (1,1). El grupo 2 tiene ahora 3 miembros, por lo que el nuevo
centroide es (11/3, 8/3):
• Nuevamente se calculan la distancia para todos los objetos con base en los nuevos
centroides. Obteniendo las siguiente matriz de distancias:
• Nueva Agrupación de Objetos: A y B al grupo 1, C y D al grupo 2, quedando la

matriz de agrupación:
Los casos de entrada tendrán bajo esta nueva iteración la misma clasificación,
concluyéndose que el cálculo de centroides se ha estabilizado, y no es necesario
continuar iterando.
k-Means
Características principales
El método de las K Medias (MacQueen, 1967)
Ventajas

Sencillo y eficiente.

Un único parámetro.
Desventajas

Sesgado por el orden de presentación de los patrones
(el resultado depende de la configuración inicial de los
agrupamientos).

Necesidad de conocer el número de clusters k:
Su comportamiento depende enormemente del valor
elegido para el parámetro k.
32
k-Means
Funcionamiento

Cada cluster tiene asociado un centroide
(centro geométrico del cluster).

Los puntos se asignan al cluster cuyo centroide esté más
cerca (utilizando cualquier métrica de distancia).

Iterativamente, se van actualizando los centroides en
función de las asignaciones de puntos a clusters, hasta
que los centroides dejen de cambiar.
BASE TEÓRICA: Algoritmo basado en la minimización de la

distancia interna (suma de las distancias de los patrones
asignados a un agrupamiento a su centroide). En
realidad, se minimiza la suma de las distancias al
cuadrado de cada patrón al centroide de su cluster.
33
k-Means
Iteration 6
1
2
3
4
5
3
2.5
1.5
y
0.5
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2

x
34
k-Means
Iteration 1 Iteration 2 Iteration 3
3 3 3
2.5 2.5 2.5
2 2 2
y 1.5 1.5 1.5
y
1 1 1
0.5 0.5 0.5
0 0 0
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2
x x x
Iteration 4 Iteration 5 Iteration 6

3 3 3
2.5 2.5 2.5
2 2 2
1.5 1.5 1.5

y
y
1 1 1
0.5 0.5 0.5
0 0 0
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2
x x x
35
k-Means
Variantes

GRASP [Greedy Randomized Adaptive Search Procedure]
para evitar óptimos locales.

k-Modes (Huang’1998) utiliza modas en vez de medias
(para poder trabajar con atributos de tipo categórico).

k-Medoids utiliza medianas en vez de medias para
limitar la influencia de los outliers
vg. PAM (Partitioning Around Medoids, 1987)

CLARA (Clustering LARge Applications, 1990)
CLARANS (CLARA + Randomized Search, 1994)
36
k-Means
Parámetros
K

Número deseado de agrupamientos.
37
Algoritmo ISODATA
Características principales
Iterative Self-Organizing Data Analysis Techniques
Ventajas

Flexibilidad: Su comportamiento puede ajustarse
gracias a su amplio conjunto de parámetros.

No está sesgado por el orden de presentación de los
patrones.
Desventajas

Utilización: Los valores adecuados para los parámetros
son difíciles de establecer a priori, por lo que se suele
emplear un proceso de prueba y error.
38
Algoritmo ISODATA
Funcionamiento
Similar al K-Means,
si bien incorpora heurísticas con tres objetivos:

Eliminar agrupamientos poco numerosos.

Mezclar agrupamientos cercanos.

Dividir agrupamientos dispersos.
39
Algoritmo ISODATA
Funcionamiento
Inicialmente se seleccionan los centros de A agrupamientos.
En cada iteración

Se asigna cada patrón al cluster más cercano.

Se eliminan los agrupamientos de menos de N patrones.

Si el número de agrupamientos es pequeño (≤ K/2), se
dividen los agrupamientos más dispersos.

En las iteraciones pares o cuando el número de
agrupamientos es elevado (>2K), mezclamos un máximo
de L pares de agrupamientos cercanos.
40
Algoritmo ISODATA
Parámetros
K Número deseado
de agrupamientos
A Número inicial
de agrupamientos
N Umbral del número
de patrones para la
eliminación de
agrupamientos
s Umbral de desviación típica
para la división de un agrupamiento
c Umbral de distancia
para la unión de agrupamientos
L Máximo número de mezclas en una iteración
I Máximo número de iteraciones permitidas
41
ISODATA. Primer paso
ISODATA. Segundo paso
ISODATA. Tercer paso
ISODATA. Cuarto paso
ISODATA. Final

Clasificacion - No Supervisada

Cargado por

Copyright:

Formatos disponibles

Clasificacion - No Supervisada

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Clasificacion - No Supervisada

Cargado por

Copyright:

Formatos disponibles

TELEDETECCIÓN

Interpretación de imágenes en Teledetección

Remote Sensing (Curso 2018/19)

 Fases del procesado de señal en teledetección:

La clasificación condiciona todo el tratamiento previo de la imagen

Multibanda: Un vector/pixel (dimensión=nº

Firma espectral para cada pixel

Patrones de una misma

Los píxeles con características espectrales similares tienden a agruparse en

Desde la toma de datos “en crudo”, se deben extraer

• Reducción de la dimensionalidad: Tomar información más relevante

En la imagen clasificada un píxel es un

Niveles I y II de cubiertas terrestres

Conjunto muy Conjunto poco

• No supervisado Clases espectrales

 Entrenamiento Supervisado conocimiento previo

asignación de los pixels de la escena a

Distancia de cada objeto a los centroides: Se calcula la distancia de cada

• Determinar centroides: el grupo 1 tiene sólo un miembro el centroide de ese grupo

• Nueva Agrupación de Objetos: A y B al grupo 1, C y D al grupo 2, quedando la

BASE TEÓRICA: Algoritmo basado en la minimización de la

-2 -1.5 -1 -0.5 0 0.5 1 1.5 2

2.5 2.5 2.5

y 1.5 1.5 1.5

0.5 0.5 0.5

Iteration 4 Iteration 5 Iteration 6

2.5 2.5 2.5

1.5 1.5 1.5

0.5 0.5 0.5

vg. PAM (Partitioning Around Medoids, 1987)

Inicialmente se seleccionan los centros de A agrupamientos.

También podría gustarte