Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Clasificacion - No Supervisada

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 44

TELEDETECCIÓN

Interpretación de imágenes en Teledetección

Remote Sensing (Curso 2018/19)


Repaso

Segmentación y Clasificación
Adquisición de información

Segmentación y Clasificación
Resolución del sensor

Segmentación y Clasificación
Definición de clasificación

Segmentación y Clasificación
Tipos de clases

Segmentación y Clasificación
Sensor ETM+ (LANDSAT 7)

Segmentación y Clasificación
Fases de la clasificación digital basada en
píxeles

Segmentación y Clasificación
Fase de entrenamiento

Segmentación y Clasificación
Segmentación de imágenes. Definición y utilidad

 Fases del procesado de señal en teledetección:


• Rectificación y restauración de imágenes
• Realce y mejora de imágenes
• Clasificación de imágenes
• Integración de la información en GIS

La clasificación condiciona todo el tratamiento previo de la imagen

Segmentación y Clasificación
Tomado de:
“Remote Sensing, Third Edition Models
and Methods for Image Processing”.
Robert A. Schowengerdt. Elsevier. 2007

Segmentación y Clasificación
Clasificación de imágenes en teledetección
Monobanda: Un sólo valor/pixel (nivel de
gris, nivel digital, ND)

Multibanda: Un vector/pixel (dimensión=nº


de bandas

Segmentación y Clasificación
Clasificación de imágenes en teledetección

Firma espectral para cada pixel

Segmentación y Clasificación
Clasificación de imágenes en teledetección
Representación de cada píxel en un espacio bidimensional:
Visible e Infrarrojo, para tres cubiertas: agua, suelo y vegetación
Nubes de puntos, por
variabilidad de patrones de
entrada.

Patrones de una misma


“clase”, están relativamente
cercanos
Diagramas de dispersión
o scattergramas

Segmentación y Clasificación
Clasificación de imágenes en teledetección
Clasificación como toma de decisiones de datos con variabilidad
estadística. Localizar un rango numérico que caracterice a cada
categoría

Los píxeles con características espectrales similares tienden a agruparse en


nubes/conglomerados/clusters, correspondientes a distintas clases espectrales
clases temáticas

Segmentación y Clasificación
Clasificación de imágenes en teledetección.

Desde la toma de datos “en crudo”, se deben extraer


características:

• Reducción de la dimensionalidad: Tomar información más relevante


• Cambio en el espacio de representación: Objetivo maximizar la varianza

En la imagen clasificada un píxel es un


identificador de clase

Segmentación y Clasificación
Clasificación de imágenes en teledetección

Niveles I y II de cubiertas terrestres

Conjunto muy Conjunto poco


separable separable

Segmentación y Clasificación
Clasificación de imágenes en teledetección

 Entrenamiento
• Supervisado  Clases temáticas.
• Conocimiento previo de las clases temáticas

• No supervisado Clases espectrales


• Búsqueda automática de grupos con valores homogéneos en la
imagen

 Situaciones reales:
• Dos clases temáticas una única firma espectral
• Una clase temática dos clases espectrales
Segmentación y Clasificación
Entrenamiento no-supervisado y supervisado

Segmentación y Clasificación
Clasificación de imágenes en teledetección

 Entrenamiento Supervisado conocimiento previo


de clases de interés

asignación de los pixels de la escena a


alguna de las clases previamente
Consideradas. Métodos bayesianos

Mínima distancia
Mínima distancia de
Mahalanobis
Máxima probabilidad
Paralelepipedo
Segmentación y Clasificación
Clasificación de imágenes en teledetección

 Entrenamiento No Supervisado
No conocimiento previo de clases de interés
Los pixels de las áreas de entrenamiento se someten a un algoritmo de clustering
para determinar el agrupamiento "natural" de los mismos.

Algoritmos de “clustering”

K-medias
Isodatos

Segmentación y Clasificación
Clasificación de imágenes en teledetección
 ALGORITMO K-MEANS

Segmentación y Clasificación
Clasificación de imágenes en teledetección
 Ejemplo de K-means
 PLANTEAMIENTO (K=2)
 Supóngase que se tienen cuatro tipos de medicina con dos
atributos (peso e índice PH) como se muestra en la siguiente
tabla:
MEDICINA PESO ÍNDICE PH
A 1 1
B 2 1
m = [ 1 1; 2 1; 4 3; 5 4]
C 4 3
D 5 4

Segmentación y Clasificación
Valor inicial de los centroides: Sean C1 y C2 los
centroides de los k-grupos. Si se eligen las
medicinas A y B como los primeros centroides
que quedan en los puntos (1,1) y (2,1).

 Distancia de cada objeto a los centroides: Se calcula la distancia de cada


objeto utilizando la distancia euclidiana:

Segmentación y Clasificación
 • Resultado de la matriz de distancias de la inicialización (Distancia euclidiana de
cada componente a cada uno de los dos centroides) :

PRIMERA ITERACIÓN:
• Agrupación de Objetos: A al grupo 1 y B, C y D al grupo 2, quedando la matriz
de agrupación:

• Determinar centroides: el grupo 1 tiene sólo un miembro el centroide de ese grupo


permanece en (1,1). El grupo 2 tiene ahora 3 miembros, por lo que el nuevo
centroide es (11/3, 8/3):

Segmentación y Clasificación
 • Nuevamente se calculan la distancia para todos los objetos con base en los nuevos
centroides. Obteniendo las siguiente matriz de distancias:

• Nueva Agrupación de Objetos: A y B al grupo 1, C y D al grupo 2, quedando la


matriz de agrupación:

Los casos de entrada tendrán bajo esta nueva iteración la misma clasificación,
concluyéndose que el cálculo de centroides se ha estabilizado, y no es necesario
continuar iterando.

Segmentación y Clasificación
k-Means
Características principales
El método de las K Medias (MacQueen, 1967)

Ventajas

Sencillo y eficiente.

Un único parámetro.

Desventajas

Sesgado por el orden de presentación de los patrones
(el resultado depende de la configuración inicial de los
agrupamientos).

Necesidad de conocer el número de clusters k:
Su comportamiento depende enormemente del valor
elegido para el parámetro k.

32
k-Means
Funcionamiento


Cada cluster tiene asociado un centroide
(centro geométrico del cluster).

Los puntos se asignan al cluster cuyo centroide esté más
cerca (utilizando cualquier métrica de distancia).

Iterativamente, se van actualizando los centroides en
función de las asignaciones de puntos a clusters, hasta
que los centroides dejen de cambiar.

BASE TEÓRICA: Algoritmo basado en la minimización de la


distancia interna (suma de las distancias de los patrones
asignados a un agrupamiento a su centroide). En
realidad, se minimiza la suma de las distancias al
cuadrado de cada patrón al centroide de su cluster.

33
k-Means

Iteration 6
1
2
3
4
5
3

2.5

1.5
y

0.5

-2 -1.5 -1 -0.5 0 0.5 1 1.5 2


x

34
k-Means
Iteration 1 Iteration 2 Iteration 3
3 3 3

2.5 2.5 2.5

2 2 2

y 1.5 1.5 1.5

y
1 1 1

0.5 0.5 0.5

0 0 0

-2 -1.5 -1 -0.5 0 0.5 1 1.5 2 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2
x x x

Iteration 4 Iteration 5 Iteration 6


3 3 3

2.5 2.5 2.5

2 2 2

1.5 1.5 1.5


y

y
1 1 1

0.5 0.5 0.5

0 0 0

-2 -1.5 -1 -0.5 0 0.5 1 1.5 2 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2
x x x

35
k-Means

Variantes


GRASP [Greedy Randomized Adaptive Search Procedure]
para evitar óptimos locales.


k-Modes (Huang’1998) utiliza modas en vez de medias
(para poder trabajar con atributos de tipo categórico).


k-Medoids utiliza medianas en vez de medias para
limitar la influencia de los outliers

vg. PAM (Partitioning Around Medoids, 1987)


CLARA (Clustering LARge Applications, 1990)
CLARANS (CLARA + Randomized Search, 1994)
36
k-Means

Parámetros

K

Número deseado de agrupamientos.

37
Algoritmo ISODATA

Características principales
Iterative Self-Organizing Data Analysis Techniques

Ventajas

Flexibilidad: Su comportamiento puede ajustarse
gracias a su amplio conjunto de parámetros.

No está sesgado por el orden de presentación de los
patrones.

Desventajas

Utilización: Los valores adecuados para los parámetros
son difíciles de establecer a priori, por lo que se suele
emplear un proceso de prueba y error.
38
Algoritmo ISODATA

Funcionamiento

Similar al K-Means,
si bien incorpora heurísticas con tres objetivos:


Eliminar agrupamientos poco numerosos.


Mezclar agrupamientos cercanos.


Dividir agrupamientos dispersos.

39
Algoritmo ISODATA

Funcionamiento

Inicialmente se seleccionan los centros de A agrupamientos.

En cada iteración

Se asigna cada patrón al cluster más cercano.

Se eliminan los agrupamientos de menos de N patrones.

Si el número de agrupamientos es pequeño (≤ K/2), se
dividen los agrupamientos más dispersos.

En las iteraciones pares o cuando el número de
agrupamientos es elevado (>2K), mezclamos un máximo
de L pares de agrupamientos cercanos.

40
Algoritmo ISODATA
Parámetros
K Número deseado
de agrupamientos
A Número inicial
de agrupamientos
N Umbral del número
de patrones para la
eliminación de
agrupamientos
s Umbral de desviación típica
para la división de un agrupamiento
c Umbral de distancia
para la unión de agrupamientos
L Máximo número de mezclas en una iteración
I Máximo número de iteraciones permitidas
41
ISODATA. Primer paso

Segmentación y Clasificación
ISODATA. Segundo paso

Segmentación y Clasificación
ISODATA. Tercer paso

Segmentación y Clasificación
ISODATA. Cuarto paso

Segmentación y Clasificación
ISODATA. Final

Segmentación y Clasificación
Segmentación y Clasificación
Segmentación y Clasificación
Segmentación y Clasificación

También podría gustarte