Thesec. Vachier
Thesec. Vachier
Thesec. Vachier
morphologie mathématique
Corinne Vachier
EXTRACTION DE CARACTERISTIQUES,
SEGMENTATION D’IMAGE ET
MORPHOLOGIE MATHEMATIQUE
THESE
présentée à
l’Ecole Nationale Supérieure des Mines de Paris
par
Corinne VACHIER
Cette thèse est le résultat d’une collaboration étroite entre le Centre de Morphologie
Mathématique de l’Ecole des Mines de Paris et General Electric Medical Systems. Je tiens
ici à exprimer ma très sincère gratitude à tous ceux et toutes celles qui ont pris sur le
temps pour m’aider et m’entourer de leurs conseils tout au long de ce travail ; ils ont
contribué pour une grande part à l’aboutissement de cette thèse.
Mes plus vifs remerciements vont tout d’abord à Jean Serra pour m’avoir accueillie
au Centre de Morphologie Mathématique, mais aussi pour sa grande disponibilité, son
expérience qu’il sait transmettre à chacun, sa gentillesse et la confiance qu’il accorde aux
jeunes thésards. Je le remercie aussi d’avoir accepté de faire partie du jury. Je tiens aussi
à exprimer ma sincère gratitude à Fernand Meyer qui a assumé la charge de directeur
de thèse et qui a su diriger et orienter mes recherches tout en me laissant une grande
liberté. Je lui suis également très reconnaissante pour sa disponibilité et pour m’avoir fait
profiter de son expérience. L’aboutissement de cette thèse doit beaucoup à ses conseils
comme à ses critiques. Mes plus vifs remerciements vont également à Serge Muller qui a
supervisé ce travail tout au long de son déroulement et dont les conseils et critiques m’ont
beaucoup aidée. Je tiens aussi à le remercier pour la confiance qu’il m’a accordée dès le
début ainsi que pour avoir accepté la lourde tâche d’être rapporteur. Merci beaucoup à
Bernard Picinbono d’accepter de présider le jury de cette thèse. J’en suis très honorée.
J’espère avoir su tirer le plus grand profit de l’enseignement qu’il m’a dispensé il y a
quelques années déjà. Je tiens à remercier vivement Philippe Bolon d’avoir accepté d’être
rapporteur de cette thèse. Mes plus vifs remerciements vont également au Professeur Jean-
Louis Lamarque qui a accepté de faire partie du jury et qui nous permet ainsi de profiter
de sa grande compétence en sénologie. Enfin, je remercie vivement Michel Schmitt d’avoir
accepté de faire partie du jury.
Je tiens également à remercier Christophe Gratin et Michel Bilodeau qui, durant mon
séjour au Centre de Morphologie Mathématique, m’ont sans cesse aidé de leurs conseils et
auxquels je dois une lecture critique approfondie de la première version de ce manuscript.
Je remercie également vivement Luc Vincent, de l’autre côté de l’Atlantique, pour l’intérêt
qu’il a porté à ce travail et pour m’avoir aidé à le diffuser.
Merci enfin à l’ensemble de l’équipe du Centre de Morphologie Mathématique (je cite
en vrac et je m’excuse déjà si ma RAM oublie quelqu’un ou quelqu’une). Les disparus :
Roro Bremond, Hugues Talbot (et je salue le Poitou au passage !), Jean-François Rivest,
Jean-Nono Mialet, René Peyrard, Pierre Soille, Tilman Jochems, Christophe Gratin et
Michel Grimaud. Un merci tout particulier à Oscar grâce à qui nous avons gagné le
tournoi de boules l’année dernière. Les indéracinables ensuite : Jean-Claude Klein, Serge
Beucher, les deux Michel (Bilodeau et Gauthier), Marc Waroquier et Laura Andriamasi-
noro. Un merci tout particulier à Liliane Pipault qui, par sa disponibilité, sa gentillesse
et sa bonne humeur, contribue beaucoup à l’excellente ambiance qui règne au centre. Je
salue enfin tous les thésards, ceux du centre et ceux de General Electric, ceux qui commen-
cent et ceux qui terminent : Fabrice Lemonnier, Nicolas Bez (pour les discussions dans la
navettomobile), Sylvie Bothorel, Beatris Marcotegui, Pascal Laurenge, François Calmel
(même s’il ne fait pas partie du clan des thésards)... Je leur sais gré à tous, non seule-
ment de leur aide concrète, mais surtout de l’atmosphère chaleureuse et amicale qu’ils ont
tous contribué à créer au Centre de Morphologie Mathématique, dans la navettomobile
ou ailleurs.
Table des matières
1 Introduction 5
1.1 Avant propos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Plan et contenu de l’ouvrage . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1
2 TABLE DES MATIÈRES
3.5.4 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
3.6 Récapitulation et discussion . . . . . . . . . . . . . . . . . . . . . . . . . . 88
A Notations 185
TABLE DES MATIÈRES 3
Introduction
Le problème central de tout système de vision artificielle consiste à traduire sous forme
algorithmique ce que réalise la vision humaine : à partir d’un flot d’information brute,
5
6 Chapitre 1. Introduction
trier cette information et en extraire le sens. Tous ces systèmes fonctionnent aujourd’hui
sur une connaissance a priori du problème à traiter. Même les systèmes basés sur un
apprentissage doivent être redéfinis selon le problème à résoudre. L’homme pour sa part
est bien plus performant puisqu’il s’adapte seul, accroı̂t lui-même ses connaissances, ce
qu’aucun système artificiel ne saurait faire aujourd’hui.
Les systèmes de vision artificielle utilisent aujourd’hui deux classes principales et fon-
damentales de techniques : celles des techniques numériques (pour la segmentation et la
quantification d’images) et celles de l’intelligence artificielle (pour l’analyse sémantique de
données). Dans de nombreux systèmes de vision, les techniques numériques sont utilisées
comme préambule aux techniques de l’intelligence artificielle.
Tout au long de notre travail, notre problème central a été la segmentation d’image,
c’est-à-dire l’extraction des différentes régions d’une image. Cette définition est en fait
incomplète, car lorsqu’on parle des régions d’une image, on sous-entend généralement les
“bonnes” régions de l’image, celles qui présentent un intérêt pour le problème étudié. Par-
ler de segmentation d’image sans parler d’une définition préalable des régions d’intérêt n’a
réellement pas de sens : pour une image donnée, il n’y a pas une unique bonne segmenta-
tion, mais des segmentations possibles dont la pertinence est directement liée à l’utilisation
que l’on veut en faire. C’est d’ailleurs ainsi que la vision humaine procède puisque le
contexte intervient toujours dans la perception que l’on a des choses. L’approche mor-
phologique des problèmes de segmentation d’image puise certainement une grande partie
de sa justification et de sa force dans le respect de ce principe. Avant de chercher à seg-
menter une image, on se pose d’abord la question de ce que l’on cherche à segmenter :
c’est-à-dire que, dans un premier temps, on se fixe comme objectif d’identifier et de lo-
caliser les régions pertinentes dans l’image avant de chercher à en extraire les contours.
C’est pour cette raison que, même si notre problème central a été la segmentation d’image,
une partie importante de notre travail a d’abord consisté à développer des outils perme-
ttant d’extraire, de trier et de caractériser l’information brute présente sur une image,
c’est-à-dire des outils permettant de comprendre une image, d’identifier les éléments qui
la constituent. Ces outils allaient ensuite nous permettre d’orienter convenablement nos
algorithmes de segmentation.
Pour illustrer la génèse de la morphologie mathématique, J. Serra écrit : “Percevoir,
c’est transformer”. Le problème de l’extraction de caractéristiques d’une image est en fait
un problème de transformation d’image puis d’interprétation de cette transformation et
du comportement de l’image par rapport à cette transformation. Une grande partie de ce
mémoire se propose d’explorer, sur ce principe, de nouvelles méthodes pour extraire les
caractéristiques des structures ou régions présentes sur une image. Notre but n’est pas
tant d’introduire de nouvelles transformations d’images que de chercher comment mieux
exploiter celles que nous connaissons déjà. Notre approche est très clairement orientée
vers les objets de l’image : ce qui nous intéresse ce n’est pas une caractérisation de la
scène dans son ensemble mais une caractérisation de chaque élément composant la scène,
du plus insignifiant au plus important. La morphologie mathématique s’adapte justement
très bien à ce type d’approche : les transformations morphologiques opèrent dans le plan
de l’image et s’interprètent très aisément.
Ce mémoire est rédigé avec le souci constant de décrire les opérateurs que nous intro-
duisons et leurs algorithmes de la manière la plus précise et la plus générale possible. Ceci
1.2. Plan et contenu de l’ouvrage 7
nous amène ensuite à étudier à part les cas particuliers les plus pertinents. De nombreux
exemples sont utilisés pour permettre au lecteur de mieux percevoir visuellement comment
ces opérateurs agissent et quelles sont leurs particularités. Nous espérons également ainsi
mettre en lumière leur intérêt et leurs utilisations potentielles. Les débouchés pratiques
des outils que nous étudions ne sont pas tous immédiats ; de même que nous ne préten-
dons pas donner une solution à tous les problèmes de segmentation d’image. Le but de
cette thèse est simplement d’apporter une pierre à l’édifice et de se donner de nouveaux
moyens pour résoudre plus aisément certains des problèmes de l’analyse d’image.
Transformations morphologiques et
extraction de caractéristiques
2.1 Introduction
Le terme d’extraction de caractéristiques recouvre en fait deux problèmes distincts : la
quantification de texture et l’extraction des caractéristiques des structures ou régions
présentes sur une image. Ces problèmes sont distincts, non pas tant dans les méthodes de
résolution auxquelles ils font appel, mais dans la manière même qu’on a de les aborder.
L’extraction des caractéristiques d’un signal procède généralement par une transfor-
mation de ce signal : sa réponse à une transformation donnée est utilisée pour en déduire
une caractérisation. L’information est pertinente à partir du moment où la transforma-
tion est discriminante : deux signaux distincts (dans un contexte donné) ont des réponses
distinctes à la transformation. Dans le cas de l’analyse de textures, cette condition est
généralement suffisante. Pour la satisfaire, on peut être amené à considérer non pas une
transformation mais plusieurs transformations et l’ensemble des réponses à ces trans-
formations. Lorsque le problème se pose en termes d’extraction de caractéristiques des
structures ou régions présentes dans l’image, cette condition ne suffit généralement pas.
En effet, il faut également être en mesure d’interpréter les caractéristiques déduites.
Les transformations de la morphologie mathématique satisfont cette deuxième con-
9
10 Chapitre 2. Transformations morphologiques et extraction de caractéristiques
dition. En effet, elles opèrent sur les structures de l’image en répondant à une question
du type : cette structure satisfait-elle ce critère (où le critère est défini par le biais d’un
élément structurant et d’un opérateur topologique simple) ? Leur interprétation ne pose
généralement pas de problème.
Nous distinguerons ici deux types d’approches au problème de l’extraction de car-
actéristiques. La première considère des familles de transformations morphologiques et
étudie comment l’image est transformée par ces transformations : c’est le point de vue de
l’analyse granulométrique. La deuxième considère de manière plus systématique chaque
structure ou région de l’image et définit des critères pour les caractériser : c’est l’approche
par extrema.
Définition 2.1 (granulométrie [49]) Soit (ψλ )λ≥0 une famille de transformations dépen-
dant d’un paramètre unique λ. Cette famille constitue une granulométrie si et seulement
si elle vérifie les trois propriétés suivantes :
On montre que si B est convexe, alors la famille des ouvertures par les homothétiques
(λB)λ≥0 de ce convexe est une granulométrie (si B est convexe, la famille des éléments
structurants déduits de B par addition de Minkowski (les λB) sont homothétiques à B).
Insistons sur le fait que l’élément structurant utilisé doit impérativement être convexe pour
que la dernière propriété soit vérifiée, c’est-à-dire pour que l’opération granulométrique
ait un sens physique.
On définit de manière duale les anti-granulométries associées à une famille croissante
de transformations extensives satisfaisant, de plus, la dernière propriété. Ainsi, la famille
des fermetures (ϕλB )λ≥0 , avec B convexe, est une anti-granulométrie. Le couple consti-
tuée par une granulométrie et l’anti-granulométrie qui lui est associée (constituée des
transformations duales) permet de généraliser ce concept à des images biphasées.
Définition 2.2 (Résidus granulométriques [62]) Soit (ψλ )λ≥0 une granulométrie. On
appelle résidus granulométriques les différences entre les résultats obtenus pour deux niveaux
granulométriques successifs :
∀λ ≥ 0, Rλ (X) = ψλ (X) \ ψλ+1 (X) ≥ 0 (2.4)
Dans cette définition l’opèrateur “\” représente la différence ensembliste (X \Y = X ∩Y c ).
La famille constituée des images résidus (Rλ )λ≥0 synthétise toute l’information gran-
ulométrique et constitue une représentation complète de l’image :
S
X= λ≥0 (Rλ (X)) et λ 6= µ ⇒ Rλ (X) ∩ Rµ (X) = ∅ (2.5)
Dans la famille (Rλ )λ≥0 , l’information est hiérarchisée selon un critère déterminé par
la transformation ψ. En effet, Rλ représente ce qui est préservé au niveau λ mais éliminé
au niveau (λ + 1) de la granulométrie.
Si ψλ est une ouverture par l’élément structurant λB (B convexe) et si X est homoth-
étique à B (X = λ0 B), alors : λ ≤ λ0 ⇒ γλB (X) = X et λ > λ0 ⇒ γλB (X) = ∅. Par
conséquent : Rλ0 (X) = X et λ 6= λ0 ⇒ Rλ (X) = ∅. Deux objets identiques mais homoth-
étiques de rapport λ seront donc présents sur des résidus différents, correspondant à des
niveaux hiérarchiques homothétiques, où le rapport est λ.
Remarquons que, parmi tous les convexes B utilisables pour effectuer des granu-
lométries, les boules (et leurs approximations dans le cas digital : hexagones, carrés ...)
sont privilégiées : en effet ce choix permet de s’affranchir au mieux des considérations de
forme.
Enfin, insistons sur le fait que tout ce que nous venons de dire vaut sans aucune
restriction pour le cas numérique :
Rλ (f ) = ψλ (f ) − ψλ+1 (f ) et f = R0 (f ) + R1 (f ) + R2 (f ) + ... + Rλ (f ) + ... (2.6)
Définition 2.3 (Fonction granulométrique) Soit X un ensemble, la fonction granu-
lométrique de X notée gX associe à tout point x de X la taille λ du plus grand ouvert de
X (γλ(X)) contenant x :
gX (x) = λ0 si x ∈ γλ0 (X) et ∀λ > λ0 , x ∈
/ γλ (X) (2.7)
2.2. Le point de vue de l’analyse granulométrique 13
La figure 2.5 donne un exemple d’une fonction granulométrique. Notons que cette notion
n’est définie que dans le cas binaire. Dans le cas numérique, on se contente des couples
((Rλ (f ), λ)λ≥0 (voir figure 2.4).
Volume
r65
r77
Ce type d’approche est bien adapté à l’analyse de textures où l’information à extraire
est quantitative : quelle est la quantité de signal perdu à chaque niveau granulométrique ?
Dans le cas de problèmes de reconnaissance de formes par exemple, on utilise généralement
une autre transformation morphologique, apparentée aux granulométries par ouvertures
: le squelette morphologique.
Dans le cas numérique, le squelette de f est défini par la famille (Sλ (f ))λ≥0 avec :
Sλ (f ) = ǫλ (f ) − γ1 (ǫλ (f )).
2.2. Le point de vue de l’analyse granulométrique 15
Les Sλ (X) sont appelées composantes ou résidus du squelette : ce sont les chapeaux
haut de forme des érodés successifs de X. Dans le cas binaire, le squelette correspond
donc à l’ensemble des lieux des centres des boules maximales inclues dans X. Pour cette
raison, ce squelette est également appelé squelette par boules maximales.
∀λ ≥ 0, ǫ1 (Sλ (f )) = ∅ (2.9)
Si le support de X est fini (ce qui est le cas en pratique) alors, l’ensemble (Sλ )λ≥0 est
fini.
On montre que le squelette par boules maximales peut être obtenu, dans le cas discret,
en recherchant les maxima locaux de la fonction distance, c’est-à-dire les points qui n’ont
pas de voisin immédiat d’altitude supérieure [96]. Nous rappelons que la fonction distance
d’un ensemble X (notée fd (X)) associe à tout point de X sa distance au complémentaire
de X, c’est-à-dire la taille de la boule maximale centrée en ce point et incluse dans X
(voir définition B.8). Les différentes lignes de niveau de la fonction distance correspondent
aux frontières des érodés successifs de X.
Le lien entre le squelette et la fonction distance peut notamment être utilisé pour
introduire de nouveau types de squelette, simplement en modifiant la fonction distance
que l’on utilise [55]. Enfin, des algorithmes efficaces séquentiels [55] ou à base de files
d’attente [2] permettent d’obtenir le squelette par ouverture très rapidement.
A tout point du squelette S(X), on peut associer le rayon de la boule maximale cor-
respondante, c’est-à-dire sa valeur sur la fonction distance. On définit ainsi la fonction
d’extinction de X (également appelée fonction d’étanchéité).
16 Chapitre 2. Transformations morphologiques et extraction de caractéristiques
Ce qui donne (nous rappelons que la dilatation est distributive par rapport à l’union) :
X = S0 (X) ∪ δ1 ( S1 (f ) ∪ δ1 (ǫ2 (f )) )
= S0 (X) ∪ δ1 (S1 (X)) ∪ δ2 (ǫ2 (X))
On remarque que, pour reconstruire les ouverts d’un ensemble X (les γλ0 (X)), il suffit
de restreindre la classe des λ à λ ≥ λ0 :
S S S
X= 0≤λ<λ0 δλ (Sλ (X)) γλ0 (X) et γλ0 (X) = λ≥λ0 δλ (Sλ (X))
Cette relation montre comment le squelette est lié à la notion d’ouverts (et donc de
granulométrie).
f = (f − γ1 (f )) + γ1 (f ) = S0 (f ) + δ1 (ǫ1 (f ))
La dilatation n’est pas distributive par rapport à l’addition. Cette expression ne se simpli-
fie donc pas. On applique la même décomposition aux érodés successifs de f . Finalement,
le processus de reconstruction dans le cas numérique sécrit :
P. Maragos [44] a proposé une autre définition du squelette permettant une recon-
struction de l’image faisant intervenir un processus d’union (supremum en numérique)
identique à celui utilisé dans le cas binaire (relation 2.11).
Définition 2.6 (Squelette de Maragos [44]) Soit f un fonction numérique, les com-
posantes du squelette de f , notées Dλ (f ) sont définies par :
(
ǫn (f )(x) si ǫλ (f )(x) > γ1 (ǫλ (f ))(x)
∀λ ≥ 0, Dλ (f )(x) = (2.13)
−∞ si ǫλ (f )(x) = γ1 (ǫλ (f ))(x)
Nous donnons figure 2.9 un exemple illustrant les premières composantes du squelette
selon l’une ou l’autre des deux définitions proposées. Les deux squelettes ont même sup-
port. Par contre, les niveaux de gris des composantes différent.
(
1 si g(x) > 0
Dλ (f ) = Ind(Sλ (f )) × ǫλ (f ) avec : Ind(g)(x) = (2.14)
0 si g(x) = 0
Nous verrons dans la section suivante, sur des exemples concrets, comment ces deux
définitions peuvent être exploitées.
18 Chapitre 2. Transformations morphologiques et extraction de caractéristiques
a b
F F−
οB
d c e f
S 0 (F) D0 (F)
S 1 (F) D1 (F)
f = D0 (f ) ∨ γ1 (f ) = D0 (f ) ∨ δ1 (ǫ1 (f ))
Nous avons vu, dans ce paragraphe, que la notion de squelette et celle de fonction
d’extinction fournit une représentation complète et intelligible de l’image : l’information
est triée et hiérarchisée. Il est dès lors possible d’extraire une caractérisation des objets
d’une image binaire ou numérique par la considération de leur squelette : la forme du
squelette est caractéristique de la forme de l’objet (indépendamment de sa taille), les
valeurs d’extinction associées à chaque composante définissent une caractéristique en taille
de l’objet.
2.2. Le point de vue de l’analyse granulométrique 19
Erosion Erosion
Chapeau haut de forme S n(f) Addition Ouverture Dn(f) Dilatation de taille n
Bien entendu, cela vaut également si l’on considère les composantes Dλ (f ) définies par
Maragos (définition 2.6 et relation 2.15) :
_
Supposons ∀λ ≥ 0, Dλ′ (f ) ≤ Dλ (f ) , alors : f ′ = δλ (Dλ′ (f )) ≤ f (2.17)
λ≥0
En fait, la notion de squelette permet d’établir un principe général de filtrage que nous
appelons filtrage par décomposition morphologique [91, 94] qui consiste en trois étapes :
b d
S 0 (F) S’0 (F)
a f
F F F’
seuil
c e
S 1 (F)
S’1 (F)
seuil
Figure 2.11: Décomposition (b,c) filtrage par seuillage (d,e) et reconstruction partielle (f)
Nous n’avons imposé jusqu’ici aucune condition sur le filtrage des résidus. Dans la
pratique cependant, il ne sera bien souvent pas nécessaire de traiter tous les résidus
de la décomposition mais seulement ceux significatifs dans le contexte de l’étude : on
se restreindra aux premiers résidus si l’on s’intéresse aux structures de petite taille par
exemple. Dans ce cas, il n’est pas utile de calculer l’ensemble des résidus :
W
f = S0 (f ) + δ1 (S1 (f ) + δ1 (... + δ1 (ǫλ+1 (f )))) ou f = ( 0≤λ≤n δλ (Dλ (f )) ) ∨ γλ+1 (f )
W
f = S0′ (f ) + δ1 (S1′ (f ) + δ1 (... + δ1 (ǫλ+1 (f )))) ou f ′ = ( 0≤λ≤n δλ (Dλ′ (f )) ) ∨ γλ+1 (f )
Le nombre de résidus du squelette considérés est déterminé par la taille maximale des
structures à étudier. Les structures de plus grande taille ne seront pas affectées par le fil-
trage. C’est d’ailleurs de cette façon que sont définis la plupart des filtres morphologiques :
la taille d’une ouverture par exemple est définie selon la taille maximale des structures à
éliminer.
Remarquons que le filtre ainsi défini est anti-extensif f ′ ≤ f et agit donc sur les
structures claires de l’image (voir figure 2.11). La transformation duale peut être obtenue
en considérant le squelette par fermetures ou bien en appliquant le même processus à
l’image inversée (et en inversant le résultat).
Nous avons résumé figures 2.12 et 2.13 les algorithmes de filtrage par décomposition
selon que l’on adopte l’une ou l’autre des deux définitions du squelette : squelette mor-
phologique ou squelette de Maragos. Dans le premier cas, le processus de reconstruction
est effectué pas à pas et ne peut commencer que lorsque l’étape de filtrage est entièrement
terminée. Dans le second cas, les étapes de décomposition, de filtrage et de reconstruc-
tion peuvent s’effectuer en parallèle, ce qui présente de grands avantages : notamment, il
n’est plus nécessaire, contrairement au cas précédent, de stocker l’ensemble des résidus.
Ils sont entièrement traités les uns après les autres. De plus, ce principe de reconstruction
est très intéressant du point de vue de l’interprétation : les images δλ (Dλ (f )) correspon-
dent en effet aux structures de taille λ telles qu’elles apparaissent sur l’image originale.
Ici, l’image est vue comme la superposition de sous-images correspondant chacune aux
structures d’une taille donnée.
22 Chapitre 2. Transformations morphologiques et extraction de caractéristiques
Erosion Dilatation
Erosion Dilatation
Erosion Dilatation
Erosion Dilatation
Supremum
Par contre, il sera bien souvent plus intéressant d’étudier les composantes du squelette
morphologiques (les Sn (f )) plutôt que celles du squelette de Maragos. En effet, nous
avons vu que le squelette morphologique considère les chapeaux haut-de-forme des érodés
successifs de l’image : les composantes Sλ (f ) contiennent donc une information relative
au contraste des objets par rapport au fond de l’image dans leur voisinage. L’intérêt
de choisir cette définition est donc de s’assurer d’une certaine robustesse vis-à-vis des
variations d’intensité qui peuvent exister de part et d’autre d’une image, ce qui n’est pas
le cas si la définition de Maragos est choisie.
On peut penser concilier les avantages de chacune des deux définitions en filtrant les
composantes Sλ puis en effectuant la reconstruction selon l’algorithme de Maragos. Pour
cela, on utilise la relation 2.14 et, connaissant les composantes filtrées Sλ′ (f ), on pose :
Dλ′ (f ) = Ind(Sλ′ (f )) × ǫλ (f )
2.2. Le point de vue de l’analyse granulométrique 23
Nous reprenons l’exemple de la figure 2.11 pour illustrer comment le résultat du filtrage
est modifé lorsque la reconstruction est effectuée à partir des composantes Dλ′ : il peut
y avoir un rehaussement artificiel du contraste relatif des structures reconstruites (voir
figure 2.14).
b c f
S’0 (F) S’1 (F) F F’
Reconstruction
a
F
d e g
D’0 (F) D’1 (F) F F’
Reconstruction
La figure 2.15 fournit une illustration de la technique de filtrage que nous venons de
définir. A est l’image originale. Le filtrage par décomposition utilisé considère les 4 pre-
miers résidus du squelette morphologique (S0 (f ), S1 (f ), S2 (f ) et S3 (f )) et l’algorithme
de reconstruction utilisé est celui de Maragos. Les résidus filtrés sont obtenus par un
seuillage, c’est-à-dire que le critère de filtrage est le contraste :
(
Si (f )(x) si Si (f )(x) ≥ si
Si′ (f )(x) =
0 sinon
Les seuils si sont choisis de moins en moins sélectifs : s0 = 20, s1 = 15, s2 = 10, s3 = 5.
Le résultat du filtrage est l’image B. L’image C est obtenue en appliquant le même filtre
par décomposition à l’image B inversée (puis en inversant le résultat).
Les image D et E ont été obtenues en appliquant respectivement un filtre alterné
séquentiel de taille 3 et un filtre médian de taille 3 à l’image originale A. Cet exemple
illustre bien l’originalité du filtrage par décomposition : ce type d’approche permet un
traitement plus fin des structures de l’image, qui sont examinées taille par taille. Ici,
une struture de grande taille peut très bien être éliminée si son contraste est faible alors
qu’une structure plus petite mais de plus grand contraste sera préservée (les détails dans
les plumes du chapeau par exemple). Ce type d’approche ne peut être effectué par les
24 Chapitre 2. Transformations morphologiques et extraction de caractéristiques
filtres morphologiques classiques : les ouvertures par exemple agissent uniquement sur un
critère de taille ou de forme. Citons tout de même, le filtre gommette qui, bien que faisant
appel à un tout autre principe, permet également un filtrage plus fin que l’ouverture et
tenant compte de la notion de contraste : voir le paragraphe B.4 de l’annexe B.
A B C
D E
Figure 2.15: Exemple de filtrage par décomposition morphologique sur l’image ”Lena”
(seuillage des résidus de la décomposition). A : image originale. B : filtrage par décompo-
sition morphologique des structures claires (seuillage des 4 premiers résidus du squelette
morphologique). C : filtrage par décomposition morphologique des structures sombres (on
applique la transformation duale sur B). Comparaison avec le filtre alterné séquentiel de
taille 3 (D) et le filtre médian de taille 3 (E).
2.2. Le point de vue de l’analyse granulométrique 25
de bruit de forte amplitude rend la détection des traces des fibres les plus fines extrême-
ment délicate.
26 Chapitre 2. Transformations morphologiques et extraction de caractéristiques
Pour détecter les structures rectilignes sur les images issues de la décomposition, nous
allons d’abord en établir un “prototype”. Sur les images résidus, la linéarité des structures
n’est pas évidente, même si visuellement elle ne fait aucun doute. En fait, les éléments
rectilignes correspondent à un ensemble de pixels localement rectilignes (pouvant être
approximés par des segments de droite) dont les intensités peuvent varier de façon im-
portante. Nous modéliserons les variations en niveau de gris le long de ces structures par
des discontinuités locales dont on supposera la taille faible devant la longueur totale de
l’élément rectiligne (figure 2.18).
L
Approximation par l
des segments de droite
Nous voyons apparaı̂tre deux paramètres : celui lié à la taille des segments approximant
les éléments rectilignes et celui lié à la taille des irrégularités locales. A cause du bruit
et du fait que les petites structures ont des rayons de courbure supérieurs à ceux des
grosses structures, ces paramètres varient selon le niveau hiérarchique du résidu considéré
(figure 2.17).
Pour extraire l’information directionnelle d’une image, l’élément structurant utilisé
doit être défini de manière à contenir également cette information directionnelle. L’élément
structurant optimal pour extraire les éléments rectilignes de direction iest un segment de
direction i variable. La détection se fera donc direction par direction et i devra parcourir
l’ensemble des orientations du plan.
Si les structures étaient régulières (absence de bruit), alors leur extraction pourrait
être réalisée grâce à de simples ouvertures linéaires. Ce n’est pas le cas ici. Il est donc
nécessaire de procéder à certains prétraitements avant d’effectuer ces ouvertures linéaires.
L’algorithme de détection que nous proposons comporte trois étapes. Chacune de ces
étapes tente de reproduire sous forme algorithmique l’analyse effectuée visuellement : l’œil
néglige les irrégularités locales au profit de la tendance générale.
Nous allons travailler direction par direction. La première étape consiste donc à extraire
l’information directionnelle et ceci pour chaque direction du plan. Les images résidus ont
été obtenues en effectuant des chapeaux haut de forme avec un élément structurant de
taille fixe b (taille de l’élément structurant B utilisé dans la décomposition). Toutes les
structures sur les images résidus sont donc caractérisées par un critère de taille connu :
dans au moins une direction, leur largeur est strictement inférieure à b. Nous supposerons
que les structures rectilignes recherchées sont constituées de petits éléments rectilignes de
longueur (taille dans une autre direction) supérieure à b.
2.2. Le point de vue de l’analyse granulométrique 27
Pour réduire l’information contenue sur les images résidus aux seules structures rec-
tilignes de direction i, nous effectuons une ouverture dans la direction i de taille supérieure
à b. Les structures étant hachées (discontinuités locales), il est préférable de choisir la taille
de l’ouverture faible (pratiquement, on la choisit égale à b) (cf. figure 2.19). Cette opéra-
tion permet de compenser le fait que les images résidus sont issues de transformations
non-directionnelles.
En parcourant l’ensemble des directions du plan, nous obtenons une famille de sous-
fonctions des résidus, chacune de ces sous-fonctions privilégiant l’information liée à une
direction donnée (voir figure 2.19).
<b
Sn(F)
Direction de travail
Sn,i(F)
Dans un deuxième temps, l’information directionnelle ayant été extraite, il est néces-
saire d’effectuer un renforcement de l’information directionnelle pour compenser les irrégu-
larités locales. Nous proposons d’effectuer une moyenne directionnelle sur un segment de
taille adaptée à la taille des irrégularités locales (figure 2.20).
Petite ouverture
directionnelle
Moyennage
Moyennages directionnels de taille 8 dans les directions :
Directionnel
0, 30, 60, 90 et 150 degres
Moyennage
Directionnel
Ouverture
directionnelle
Ouvertures directionnelles de taille 10 dans les directions :
de grande taille
0, 30, 60, 90 et 150 degres
Figure 2.22: Regroupement des résultats obtenus dans chaque direction du plan (32 di-
rections).
: il n’est pas nécessaire de traiter l’ensemble des résidus pour entamer le processus de
reconstruction. Cet aspect est d’importance si un grand nombre de résidus est étudié pour
prévenir des problèmes d’encombrement de mémoire (il n’est pas nécessaire de stocker les
résultats obtenus pour chaque résidu).
La figure 2.23 résume l’algorithme général d’extraction des structures rectilignes de
l’image. Nous voyons qu’un autre intérêt de cet algorithme par décomposition est de
permettre la segmentation des fibres lorsqu’elles se chevauchent. Par contre, les niveaux
de gris le long des fibres n’étant pas uniformes, certaines fibres peuvent être présentes sur
plusieurs résidus.
Structure
reguliere
Irregularite Dilatation de
l’irregularite
D’autre part, le fait de travailler sur des primitives de taille fine accentue le problème du
nombre de directions à explorer : en effet, plus une structure est fine, plus l’information
directionnelle est définie de manière précise. De plus larges structures supportent une
plus grande imprécision (voir figure 2.25). Le fait de recourir à une décomposition mor-
phologique des larges structures impose donc de travailler avec un plus grand nombre de
directions que si le traitement était effectué directement sur l’image originale.
Figure 2.25: Lien entre la taille des structures rectilignes et la précision de la mesure de
direction
2.2. Le point de vue de l’analyse granulométrique 31
Element structurant
Ouverture
a- ouverture par rec. de taille 3 b- ouverture par rec. de taille 6 c- ouverture par rec. de taille 10
Z MAXIMA REGIONAUX
MINIMA REGIONAUX
X
Nous rappelons que Cx désigne l’ouverture connexe ponctuelle qui extrait de tout ensemble
la composante connexe contenant x.
34 Chapitre 2. Transformations morphologiques et extraction de caractéristiques
On distingue trois types de plateaux : les maxima régionaux, les minima régionaux et
les plateaux non-extrema.
Définition 2.8 (Maxima et minima régionaux) Un maximum (respectivement min-
imum) régional M d’une image f est un plateau sans voisin plus haut (respectivement
sans voisin plus bas).
composante connexe de tout seuil Xs+ (f ) où s > h. Enfin, d’après la définition 2.8, un
maximum régional M de f d’altitude h, satisfait :
Les maxima d’altitude h de f sont donc les composantes de Xh+ (f ) non reconstruites
+
par Xh+1 (f ), soit encore, les composantes de Xh+ (f ) non reconstruites par Xh+ (f − 1).
Dans tout ce qui suit, Max(f ) (respectivement Min (f )) désignera l’ensemble des
maxima régionaux (respectivement minima régionaux) de f . Pour extraire les maxima
régionaux de f , il suffit donc d’effectuer une reconstruction de f par dilatation géodésique
de (f − 1) sous f (voir section B.3), de soustraire le résultat de f et de considérer les
ensembles connexes de pixels strictement positifs [2] :
MAXIMA REGIONAUX
f
δ (f,f-1)
f-1
Figure 2.31: Extraction des maxima régionaux par une reconstruction géodésique
Si les extrema d’une image numérique semblent bien adaptés pour marquer les struc-
tures sombres et claires d’une image, dans la pratique, plusieurs difficultés peuvent appa-
raı̂tre :
-Cas des plateaux non extrema Dans le cas où les zones plates de l’image sont
très étendues, des plateaux non extrema peuvent correspondre à des régions d’intérêt dans
l’image (voir figure 2.32). En considérant uniquement les extrema de l’image, ces régions
échappent à l’analyse.
Figure 2.32: Les plateaux non extrema peuvent correspondre à des régions d’intérêt dans
l’image (à gauche : image originale ; au centre : extrema régionaux (minima en blanc,
maxima en noir) ; à droite : quelques plateaux non extrema)
Z X
FONCTION DISTANCE
X
CREATION D’UN NOUVEAU MAXIMUM
X
CREATION D’UN NOUVEAU MINIMUM
l’altitude de chaque pixel d’un plateau sa valeur sur la fonction distance, on crée alors de
nouveaux minima régionaux (voir figure 2.33).
La plupart des images réelles sont bruitées et ce problème ne se pose pas : chaque
région d’intérêt est marquée par au moins un extremum régional. Par contre, le problème
inverse apparaı̂t : celui du sur nombre d’extrema régionaux dans l’image (voir figure 2.34).
M1 IMAGE CLAIRE
m2 m3
m1 m4 M2
m7
IMAGE BRUITEE
m8
m5 m6
m9
-Relations entre les structures de l’image Lorsqu’on utilise les extrema de l’image
pour marquer les structures ou régions présentes dans l’image, la question qui se pose
d’emblée est la suivante : comment à partir des extrema de l’image mettre en évidence
l’aspect hiérarchisé de l’observation ? (deux petits disques clairs identiques sont inclus
dans une régions plus sombre dans l’exemple de la figure 2.36).
Des méthodes structurelles ont été proposées pour résoudre ce problème complexe.
Citons notamment les travaux R. W. Ehrich [15] et ceux de P. V. Sankar et A. Rosen-
feld [78] basés sur une mise en correspondance des pics des signaux. Nous aurons l’occasion,
2.3. L’approche par extrema 37
Y X
X
SCENE NIVEAUX DE GRIS
Figure 2.36: Comment extraire les relations hiérarchiques entre les structures d’une image
?
dans la suite de cette thèse, d’approfondir ce point et de décrire plus en détail ces tech-
niques d’analyse.
La figure 2.37 illustre les extrema extraits par cette transformation pour une grande valeur
de h. Plus h augmente plus les extrema extraits sont étendus et seuls les extrema à fort
contraste persistent.
h-MAXIMA
f
δ (f,f-h)
h
f-h
a- h-reconstruction b- h-maxima
Figure 2.38: Extraction des h-extrema de l’image Tools (256 niveaux de gris, h = 50)
Enfin, les rh-extrema [80, 79] permettent d’introduire un critère supplémentaire (spa-
tial) de sélection des maxima. Les rh-extrema d’une image numérique f (Maxr,h (f )) sont
obtenus en effectuant non plus une reconstruction géodésique (dilatation géodésique de
taille infinie) mais en effectuant une dilatation géodésique de taille finie r de f par (f − h)
(cf. figure 2.39). Les dômes de faible contraste (paramètre h) ou trop larges (paramètre
r) ne sont pas extraits par cette transformation.
(
h f (x) − h si x ∈ Max(f )
fM (x) =
0
sinon
+ r
Y1 = X1 f − δ f, fM h
Y2 = X1+ δ r f, fM
h
h r,h-maximum
f
r h
δ (f , fM )
+ r h
Y1 = X1 [ f - δ (f , fM ) ]
+ r h
Y2 = X1 [ δ (f , fM )]
Figure 2.39: Extraction des rh-extrema par une dilatation géodésique de taille finie
Cette transformation présente quelques désavantages. D’une part, il peut arriver que
des pixels n’appartenant pas à des maxima soient extraits. Il faut donc ne retenir des
composantes connexes extraites que celles contenant un maximum régional de l’image
2.3. L’approche par extrema 39
originale. D’autre part, cette transformation est sensible au bruit. Pour cette raison, il est
généralement nécessaire de filtrer l’image avant de calculer les rh-maxima, ce qui ajoute
un paramètre supplémentaire à l’algorithme. Pour cette raison cette transformation est
délicate à mettre en oeuvre et peu utilisée dans la pratique. Pour plus de précision sur ce
point on pourra consulter la référence [21].
dyn(M)
Comme nous l’avons dit, la dynamique permet de valuer les extrema d’une image
numérique selon leur contraste sur l’image, ou plus exactement, selon le contraste des
structures qu’ils marquent. La distribution en dynamique d’une image numérique est
donc une caractérisation du contraste des structures ou régions présentes sur cette image.
40 Chapitre 2. Transformations morphologiques et extraction de caractéristiques
Figure 2.41: Maxima régionaux de l’image Tools de forte dynamique (> 50)
La sélection des régions significatives (en termes de contraste) peut alors s’effectuer par
un simple seuillage des valeurs de dynamique des extrema (voir figure 2.41). Une car-
actéristique importante de cette transformation est de ne tenir compte d’aucun critère
spatial (forme, taille ...) : sur la figure 2.41 on obtient un marqueur pour la clef ou pour
le crayon comme pour les écrous de petite taille.
La dynamique peut donc être vue comme une mesure de la persistance des structures
de l’image quand on applique des filtres de contraste de plus en plus sélectifs (on calcule
(f − δ ∞ (f, f − h)) pour des valeurs croissantes de h).
2.4 Discussion
Les méthodes granulométriques et celles basées sur l’étude des extrema de l’image peuvent
paraı̂tre très dissemblables. Pourtant, elles sont étroitement liées.
Nous avons vu que les granulométries par reconstruction permettent de définir dans le
cas binaire une méthode de valuation des composantes connexes d’une image numérique
par le biais de la fonction granulométrique (relation 2.19). Soit C(X) l’ensemble des com-
posantes connexes d’une image binaire X :
Chaque composante connexe est valué avec une mesure de sa persistance (le niveau
pour lequel elle disparaı̂t) lorsqu’on applique des ouvertures de taille croissante.
La dynamique quant à elle introduit une méthode de valuation des extrema d’une
image numérique et nous avons vu le lien qui existe entre cette notion et une famille de
reconstructions géodésiques (relation 2.25) :
Chaque maximum est valué avec une mesure de sa persistance (le niveau pour lequel
il disparaı̂t) lorsqu’on applique des filtres de contraste de taille croissante.
Les similitudes entre les relations 2.26 et 2.27 montrent que les fontions granulométriques
binaires et la dynamique fonctionnent selon un même principe : on mesure la persistance
des structures ou des particules de l’image lorsqu’on applique des filtres de taille crois-
sante. Alors que les fonctions granulométriques usuelles valuent les particules binaires
selon un critère spatial (taille et/ou forme), la dynamique value les extrema d’une image
numérique (et donc les structures de l’image qu’ils marquent) selon un critère de contraste
et indépendamment de leur taille ou de leur forme.
Dans la pratique, la dynamique est une transformation très utile lorsque l’on cherche à
extraire les extrema significatifs d’une image (par exemple dans les problèmes de segmen-
tation). Une de ses caractéristiques est de ne dépendre d’aucune considération de taille
ou de forme. Cet avantage devient pourtant un inconvénient dès lors qu’une caractérisa-
tion spatiale des structures doit être prise en considération. Une manière de résoudre ce
problème consiste généralement à associer à la dynamique un filtrage spatial de l’image,
par des ouvertures morphologiques par exemple.
La question qui se pose alors est : est-il possible de valuer les extrema d’une image
numérique selon un critère spatial (de taille ou de forme) selon le modèle des granu-
lométries par ouvertures binaires ?
42 Chapitre 2. Transformations morphologiques et extraction de caractéristiques
Chapitre 3
La plupart des transformations morphologiques ont d’abord été introduites pour les en-
sembles binaires puis étendues aux fonctions numériques. Un exemple bien connu est
celui de la ligne de partage des eaux définie comme une extension de la notion de SKIZ
binaire [82, 2].
Aujourd’hui encore certains outils binaires n’ont pas d’équivalent en morphologie
numérique. C’est le cas par exemple de l’ensemble des outils disponibles pour caractériser
des particules binaires (les mesures de surface, de forme...). De ce fait, on aborde générale-
ment ce type de problème en morphologie numérique en se ramenant au cas binaire que
l’on sait résoudre par un seuillage, une segmentation de l’image... Une telle démarche
s’accompagne inévitablement d’une perte d’information et est de plus généralement assez
complexe et peu systématique : des prétraitements paramétriques sont souvent néces-
saires. La question qui se pose alors est : est-il possible d’étendre au cas numérique la dé-
marche réalisée dans le cas binaire ? C’est de cette question que traite le présent chapitre.
Nous proposons ici de nouveaux opérateurs morphologiques, les fonctions d’extinction
numériques, définis comme une extension des fonctions de type granulométrique déjà
connues en morphologie binaire.
3.1 Introduction
Les transformations morphologiques agissent sur les structures d’une image qui sont soit
préservées, soit éliminées selon qu’elles satisfont ou pas le critère de filtrage (critère de
taille, de forme, de contraste...) : une ouverture morphologique par un élément structurant
B élimine les structures claires de l’image ne contenant pas B et préserve les autres ; une
h-reconstruction élimine les structures claires de l’image ayant un contraste inférieur à h
et préserve les structures de plus fort contraste (voir figure 3.1).
En considérant des transformations de plus en plus sélectives, on élimine progressive-
ment les structures de l’image des moins significatives aux plus significatives (au sens du
critère de filtrage). Si l’on repère une structure donnée et qu’on l’étudie tout au long du
processus de filtrage, l’indice pour lequel elle disparait entièrement constitue une mesure
43
44 Chapitre 3. Des fonctions d’extinction numériques
a- Ouverture par rec. de taille 10 b- ouverture par rec. de taille 20 c- ouverture par rec. de taille 30
Définition 3.1 (Opérateur connexe binaire [83]) Un opérateur binaire ψ est dit con-
nexe si pour tout ensemble A de E, la différence symétrique entre A et ψ(A) (notée
A △ ψ(A)) est exclusivement constituée de composantes connexes de A ou de son complé-
mentaire Ac :
ψ est connexe ⇔ C(A △ ψ(A)) ⊂ C(A) ∪ C(Ac ) (3.1)
46 Chapitre 3. Des fonctions d’extinction numériques
On définit les opérateurs connexes pour les fonctions numériques en partant des opéra-
teurs connexes binaires que l’on fait agir sur les sections planes (ou plateaux : voir défini-
tion 2.7) des fonctions numériques [83, 14]. La propriété de conservation de la connexité
dans le cas binaire vaut alors pour les plateaux des fonctions numériques. Il est ainsi
possible de définir autant d’opérateurs connexes pour les fonctions numériques qu’il en
existe pour les ensembles.
Définition 3.2 (Opérateur connexe numérique [83]) Un opérateur numérique ψ est
connexe si et seulement si il étend les plateaux de l’image d’entrée :
ψ est connexe ⇔ ∀x ∈ E, P ltx (f ) ⊂ P ltx (ψ(f )) (3.2)
Les opérateurs connexes numériques ont donc pour caractéristique d’élargir (on parlera
également de propagation) et de fusionnner les plateaux de l’image [83]. Cette définition
n’impose aucune condition sur la manière dont les niveaux d’intensité de la fonction sont
modifiés.
Nous donnons figure 3.3 un exemple d’opérateur connexe numérique (ici, une ouverture
par reconstruction) et les maxima de l’image originale et de l’image filtrée. Les maxima
de l’image filtrée sont moins nombreux et plus étendus que ceux de l’image originale.
3.2. Fonction d’extinction : principe et définition 47
Figure 3.3: Effet des opérateurs connexes numériques sur les zones plates de l’image
1. pour tout couple (λ, µ), le produit de composition (ψλ ◦ ψµ ) appartient encore à la
famille
2. ∀λ ≥ µ > 0, ∃ν > 0, ψλ = ψν ◦ ψµ
Lorsque les opérateurs qui engendrent cette famille sont connexes, la famille s’enrichit
d’une propriété très importante. Nous avons vu qu’un opérateur connexe n’agit sur les
fonctions qu’en en propageant les zones plates. Si l’on considère les fonctions issues de la
pyramide (ψλ (f ))λ≥0 , alors : les zones plates des ψλ (f ) s’élargissent avec λ : les zones de
gradient nul sont emboitées les unes dans les autres (voir figure 3.4). Cette propriété est
particulièrement intéressante dans le cadre de la segmentation d’image et est à la base de
techniques de segmentation pyramidales très performantes [83, 14].
48 Chapitre 3. Des fonctions d’extinction numériques
a- Image originale "Pepper" b- Ouverture par rec. de taille 10 c- ouverture par rec. de taille 20 d- ouverture par rec. de taille 30
a’- gradient morphologique de (a) b’- gradient morphologique de (b) c’- gradient morphologique de (c) d’- gradient morphologique de (d)
Figure 3.4: Emboitement des zones de gradient nul dans le cas d’une pyramide d’opérateurs
connexes
1. ∀λ ≥ 0, ψλ (f ) est connexe
2. ∀µ ≥ λ ≥ 0 =⇒ ψλ ≤ ψµ
3. ∀λ ≥ 0, ψλ (f ) ≤ f et ψ0 = Id
Nous allons, dans un premier temps, définir la notion de fonction d’extinction dans le
cas des fonctions binaires, et, dans un second temps, étendre cette définition aux fonctions
numériques. Nous nous restreignons dans tout ce qui suit au cas discret. Les notions intro-
duites valent dans le cas continu pour l’ensemble restreint des fonctions lipschitziennes.
Si Ψ est une granulométrie par ouvertures par reconstruction, alors EΨ (X) est la taille
de l’ouverture ultime associée à X (voir la relation 2.19 au paragraphe 2.2.4) :
Dans ce cas, si Y est un ensemble quelconque, la fonction ayant pour support Y et pour
valeurs numériques les valeurs d’extinction des composantes connexes de Y est exactement
la fonction granulométrique par reconstruction associée à Y .
Dans tout ce qui suit, nous noterons C(Y ) l’ensemble des composantes connexes de
l’ensemble Y . On définit la fonction d’extinction d’un ensemble Y sur le modèle des
fonctions granulométriques (voir paragraphe 2.2.4) :
50 Chapitre 3. Des fonctions d’extinction numériques
où Surf (X) désigne la surface de X (nombre de pixels de la composante connexe X).
X X’ Surface(X) Surface(X’)
Surface(X")
Y X"
Figure 3.5: Fonction d’extinction d’une image binaire : sur cet exemple, on associe à
chaque composante connexe un niveau de gris égal à sa surface.
C’est l’extension au cas numérique de telles opérations binaires classiques qui nous
intéresse ici.
Nous nous intéressons, dans un premier temps, à l’étude des maxima de l’image : on
se restreint donc à des transformations agissant uniquement sur les structures claires de
l’image, c’est-à-dire des transformations anti-extensives. Nous supposerons donc, dans
tout ce qui suit, que Ψ est une famille décroissante de transformations connexes anti-
extensives.
Nous notons Max(f ) l’ensemble des maxima régionaux d’une fonction numérique f .
ψλ est par hypothèse un opérateur connexe donc il n’agit sur l’image qu’en propageant
les zones plates et en particulier les maxima :
Un maximum de f est étendu par ψλ pour donner soit un maximum, soit un plateau
non-maximum de ψλ (f ).
Les images ψλ (f ) sont constituées de plateaux de plus en plus étendus à mesure que
λ augmente, pour finalement (pour une valeur λ infinie, c’est à dire suffisamment grande)
ne constituer qu’un seul plateau unique. Une image constante définit un plateau à la fois
maximum (sans voisin plus haut) et à la fois minimum (sans voisin plus bas). Par conven-
tion, lorsqu’on étudie les maxima de l’image, nous considérons de tels plateaux comme
des minima (lorsqu’on étudie les minima, nous les considérons comme des maxima). Cette
convention permet d’assurer, pour tout maximum M de f , l’existence d’un niveau λ tel
que M n’appartienne plus à un maximum de ψλ (f ).
Finalement, comme ψλ est décroissant vis-à-vis de l’indice λ, on a :
(
µ ≤ λ ⇒ M ∈ Max(ψµ (f ))
∀M ∈ Max(f ), ∃λ ≥ 0 tel que :
M∈ / Max(ψλ+1 (f ))
On impose que M soit maximum régional pour toute valeur µ ≤ λ. En effet, on calcule
la valeur d’extinction de M dès que le plateau de ψµ (f ) contenant M n’est plus maximum
régional, mais ce plateau peut éventuellement, pour des indices suivants, fusionner avec
un autre plateau pour redonner un maximum régional.
Si l’on suppose que les structures claires d’une image sont toutes marquées par un max-
imum régional, alors la valeur d’extinction associée à un maximum régional M caractérise
la persistance de la structure claire qu’il marque lorsqu’on filtre de plus en plus sélective-
ment l’image. Le critère de filtrage introduit par la famille Ψ, définit la caractéristique
des structures de l’image qui est ainsi extraite.
On définit sur le modèle binaire la fonction d’extinction numérique, qui associe aux
maxima d’une image leurs valeurs d’extinction :
52 Chapitre 3. Des fonctions d’extinction numériques
Définition 3.6 (Fonction d’extinction d’une fonction numérique) Soit f une fonc-
tion numérique et Ψ = (ψλ )λ une famille décroissante de transformations connexes anti-
extensives. La fonction d’extinction de f respectivement à Ψ notée FΨE (f ) associe à chaque
maximum régional de f sa valeur d’extinction par rapport à Ψ :
(
EΨ (M) si ∃M ∈ Max(f ), x ∈ M
∀x ∈ E, FΨE (f )(x) = (3.7)
−∞ sinon
On définit de manière duale les valeurs d’extinction des minima régionaux d’une image
numérique à partir d’une famille de transformations anti-extensives. Cela revient égale-
ment à appliquer ψλ à (−f ) puis à inverser le résultat. On a :
La figure 3.6 illustre la fonction d’extinction obtenue dans le cas d’ouvertures par
reconstruction.
Ouvertures par reconstruction de taille croissante
fonction d’extinction
Figure 3.6: Fonction d’extinction d’une image numérique : sur cet exemple, à chaque
maximum (chaque dôme de l’image), on associe la taille maximale de l’ouverture par
reconstruction qui préserve (au moins partiellement) le dôme.
: lorsqu’on étudie les structures claires de l’image, on considère des transformations agis-
sant de manière privilégiée sur les structures claires de l’image, c’est-à-dire des transfor-
mations anti-extensives. Les transformations extensives seront utilisées pour l’étude des
structures sombres de l’image.
La famille (δ ∞ (f, f − h))h≥0 satisfait l’ensemble des conditions que nous avons imposées
pour définir une fonction d’extinction. La valeur d’extinction d’un maximum régional M
d’une fonction f par rapport à la famille (δ ∞ (f, f − h))h≥0 est alors définie par :
Nous allons montrer que E d (M) = dyn(M) − 1, c’est-à-dire que l’on a (puisque que les
valeurs de h sont discrètes) :
Avant de démontrer la relation 3.8, quelques remarques importantes pour la suite peu-
vent être faites à propos de la dynamique et des h-reconstructions.
• Nous rappelons que la dynamique d’un maximum régional M est la dénivellation
minimale à franchir, quand, partant de M, on cherche à atteindre un point de plus haute
altitude (définition 2.10 de M. Grimaud). Cette définition se formalise en :
dyn(M) = f (M) − sup{s ≤ f (M) | ∃x ∈ CM (Xs+ (f )), f (x) > f (M)} (3.9)
dyn(M)
Figure 3.9: Principe de la dynamique : on cherche le col le plus haut qui unit le dôme de
sommet M à un autre dôme de plus haut sommet.
f
δ (f,f-h)
f-h
Figure 3.10: Principe des h-reconstructions : les dômes de l’image sont arasés.
• Montrons que si h = dyn(M), alors M n’est pas inclus dans un maximum régional
de δ ∞ (f, f − h).
Soit s = f (M) − dyn(M). Si h = dyn(M), on a :
Montrons que x ∈ CM (Xs+ (δ ∞ (f, f − h))). δ ∞ (f, f − h) est connexe : elle agit
sur les seuils de f composante connexe par composante connexe (une composante
connexe est soit entièrement préservée soit entièrement éliminée). Par conséquent :
CM (Xs+ (f )) ⊂ CM (Xs+ (δ ∞ (f, f − h))).
(
s = δ ∞ (f, f − h)(M)
Finalement :
∃x ∈ CM (Xs+ (δ ∞ (f, f − h))), δ ∞ (f, f − h)(x) > δ ∞ (f, f − h)(M)
• Montrons que si h < dyn(M), alors M est inclus dans un maximum régional de
δ ∞ (f, f − h). Pour cela, nous allons montrer que si M n’est pas inclus dans un
maximum régional, alors h ≥ dyn(M).
On pose s = δ ∞ (f, f − h)(M) ≥ f (M) − h. Si M n’est pas inclus dans un maximum
de δ ∞ (f, f − h), alors le plateau contenant M admet au moins un voisin de plus
haute altitude :
+
δ ∞ (f, f − h)(x) ≥ s + 1. D’après 3.10 : ∃y ∈ Cx (Xs+1 (f )), f (y) − h ≥ s + 1 > s
56 Chapitre 3. Des fonctions d’extinction numériques
Evaluons f (y) : s ≥ f (M) − h donc f (y) − h > f (M) − h soit f (y) > f (M)
+
De plus, y ∈ CM (Xs+ (f )). En effet : Cx (Xs+1 (f )) ⊂ Cx (Xs+ (f )) = CM (Xs+ (f )).
y vérifie : y ∈ CM (Xs+ (f )) et f (y) > f (M), donc d’après 3.9 : s ≤ f (M) − dyn(M).
Or s ≥ f (M) − h, par conséquent, on a forcément : h ≥ dyn(M) (cqfd)
(cqfd)
3.3. Etude approfondie de quelques cas particuliers 57
La conclusion de tout ceci est que la dynamique correspond, à une constante près, aux
valeurs d’extinction associées à la famille (δ ∞ (f, f − h))h≥0 :
h
M’
Dyn(M’) = h
Decalage / reconstruction
de départ (les maxima et les minima de l’image originale sont des minima de l’image
gradient). Remarquons que l’interprétation de la dynamique ainsi calculée n’est pas la
même que lorsqu’elle est calculée sur l’image originale : ce n’est plus une mesure de
contraste des structures qui est déduite mais une mesure caractéristique de la force et de
l’homogénéité des contours des régions (voir figure 3.14).
Notons, enfin, la fragilité de la dynamique lorsqu’elle est calculée sur une image gradi-
ent : des variations locales d’intensité, au niveau des lignes de crête du gradient, peuvent
modifier radicalement les valeurs de dynamique (voir figure 3.15). Nous aurons l’occasion
de revenir plus en détails sur ce point important dans le chapitre 5 (voir notamment la
figure 5.16). Le même phénomène apparaı̂t également sur l’image originale lorsque le con-
tour d’une région est flou (faible transition des niveaux de gris à la frontière de la région)
; ceci peut influencer également, de manière plus ou moins significative, la dynamique
calculée sur l’image originale.
Image originale "Road" Maxima de l’image originale les 4 maxima de plus forte dynamique h-reconstruction equivalente
Figure 3.12: Utilisation de la dynamique pour extraire les extrema les plus significatifs
en termes de contraste : on ne retient que les 4 maxima de plus forte dynamique ; nous
donnons, pour référence, le résultat d’une h-reconstruction de paramètre h égal à la plus
faible valeur de dynamique prise par ces 4 maxima.
Image gradient Minima de l’image gradient les 4 minima de plus forte dynamique
Figure 3.13: Exemple où la dynamique est calculée sur une image gradient
3.3. Etude approfondie de quelques cas particuliers 59
Image originale
M M’
dyn(M)
= dyn(M’)
Image gradient
dyn(M’)
dyn(M)
M M’
Figure 3.14: Comparaison entre la dynamique calculée sur l’image originale et la dy-
namique calculée sur l’image gradient : lorsqu’elle est calculée sur le gradient, la dynamique
est caractéristique de la force et de l’homogénéité des contours des régions.
M M
Contour Contour
dyn(M)
dyn(M)
minima minima
Figure 3.15: Illustration du manque de robustesse de la dynamique calculée sur une im-
age gradient : des variations locales d’intensité modifient radicalement les valeurs de dy-
namique extraites.
M’
E(M) = R
Figure 3.16: Valeurs d’extinction associées aux ouvertures par reconstruction : principe
et illustration sur l’exemple ”Tools”
Selon le choix de l’élément structurant, on peut ainsi valuer les extrema d’une image
numérique selon un critère de taille et/ou de forme et ceci indépendamment de toute
considération relative au contraste des structures.
Cependant, quel que soit le choix de l’élément structurant, les valeurs d’extinction
associées aux ouvertures par reconstruction classiques ne correspondent jamais à une car-
actérisation essentiellement en taille : le concept de forme contenu dans l’élément struc-
turant implique que la caractérisation déduite est toujours fonction de la morphologie de
la région. Ainsi sur l’exemple ”Tools” de la figure 3.16, le crayon, la lame de rasoir et les
clefs ont des surfaces de même ordre. Seules les clefs constituées d’une partie ronde ont de
fortes valeurs d’extinction (l’élément structurant utilisé est un hexagone, par conséquent
les objets “ronds” sont privilégiés). La figure 3.17 illustre le comportement des valeurs
d’extinction lorsqu’on change l’élément structurant utilisé. Pour que la valeur d’extinction
associée au crayon soit significative de sa taille réelle, l’élément structurant utilisé doit
être adapté à sa forme (un segment de même direction par exemple est mieux adapté que
l’hexagone). Mais un tel élément structurant ne convient plus pour les objets de forme
différente...
On s’aperçoit donc que pour extraire les caractéristiques en taille et seulement en
taille des structures d’une image par le biais d’ouvertures morphologiques, il faudrait
en toute rigueur considérer toutes les configurations morphologiques possibles d’éléments
3.3. Etude approfondie de quelques cas particuliers 61
Image originale Ouverture par reconstruction Maxima de l’image ouverte Max. de l’im. orig. de plus forte val. d’extinct.
Image originale Ouverture par reconstruction Maxima de l’image ouverte Max. de l’im. orig. de plus forte val. d’extinct.
Figure 3.17: Influence de l’élément structurant sur les valeurs d’extinction associées aux
ouvertures par reconstruction : cas d’un segment de surface constante et de direction 30o
(en haut) puis 160o (en bas)
Définition 3.7 (Ouverture surfacique [97]) L’ouverture surfacique d’une image numérique
f de taille λ notée γλa (f ) est définie par :
Dans cette définition, Surf (X) désigne la surface de l’ensemble X (nb de pixels appar-
tenant à X).
L’ouverture surfacique peut être vue comme une transformation avec un élément struc-
turant plan qui adapte localement sa forme aux structures de l’image. L. Vincent montre
la relation liant cette ouverture aux ouvertures morphologiques classiques définies à partir
d’éléments structurants fixes : une ouverture surfacique de taille λ est égale à un supré-
mum des ouvertures morphologiques définies à partir d’éléments structurants connexes de
62 Chapitre 3. Des fonctions d’extinction numériques
Nous appellerons valeurs d’extinction surfaciques les valeurs d’extinction associées aux
ouvertures et aux fermetures surfaciques. Elles seront notées E a . Ces valeurs correspon-
dent à la persistence des structures de l’image lorsqu’on applique des ouvertures ou des
fermetures surfaciques de taille croissante.
∀M ∈ Max(f ), E a(M) = sup{λ ≥ 0 | M ∩ Max(γλa (f )) 6= ∅} (3.14)
Contrairement aux valeurs d’extinction associées aux ouvertures morphologiques clas-
siques, les valeurs d’extinction surfaciques permettent d’extraire une caractérisation en
taille des structures de l’image sans qu’aucun critère de forme ne soit pris en compte : sur
l’exemple de la figure 3.18, les clefs, le crayon et la lame de rasoir ont de toute évidence
des surfaces équivalentes. Les valeurs d’extinction surfaciques qui leur sont associées sont
également du même ordre de grandeur.
M’
Surface = S
Ouverture surfacique de taille 1000 Maxima de l’image ouverte
Surface > S
E(M) = S
Figure 3.18: Valeurs d’extinction surfaciques : principe et illustration sur l’exemple ”Tools”
forme des régions ne sont pas pris en compte. A chaque grande région de l’image (la route,
le ciel, le bord de route enneigé et le mur) est associé un et un seul maximum de forte
valeur d’extinction surfacique. Ce résultat peut être comparé à celui obtenu précédemment
grâce à la dynamique (voir figure 3.12).
La figure 3.20 illustre la comparaison entre la dynamique et les valeurs d’extinction
surfaciques. On construit bien ainsi un équivalent spatial de la dynamique. A un maximum
de faible dynamique peut être associée une valeur d’extinction surfacique importante et
vice versa.
Image originale "Road" Maxima de l’image originale les 4 max. de plus forte val. d’extinct. surf. Ouverture surfacique equivalente
Figure 3.19: Utilisation de la fonction d’extinction surfacique pour extraire les extrema
les plus significatifs en termes de taille : on ne retient ici que les 4 maxima de plus forte
valeur d’extinction. L’image de gauche est le résultat de l’ouverture surfacique de taille
λ, où λ correspond à la plus faible valeur d’extinction des 4 maxima retenus. Seules les
régions claires qui persistent sur l’image filtrée sont marquées.
M M
Tout comme la dynamique, la fonction d’extinction surfacique peut également être cal-
culée sur une image gradient (voir figure 3.21). Comme nous l’avons vu, le fait de travailler
sur une image gradient permet de traiter simultanément de manière non indépendante
les structures claires et sombres de l’image. Les valeurs d’extinction surfaciques calculées
64 Chapitre 3. Des fonctions d’extinction numériques
sur l’image gradient sont également une mesure de la surface des régions de l’image : con-
trairement à la dynamique, dans le cas des valeurs d’extinction surfaciques, il n’y a pas de
différence d’interprétation entre la mesure calculée sur l’image originale et celle calculée
sur l’image gradient, même si ces mesures peuvent être différentes (voir figure 3.22).
En fait, il semble tout-à-fait pertinent de calculer la fonction d’extinction surfacique
sur une image gradient. En effet, la notion de taille d’une région est étroitement liée à
la notion de contour de la région, information que le calcul d’une image gradient permet
d’extraire (voir figure 3.22). La distribution en taille ainsi obtenue est d’autant plus fiable
que les contours des régions sont précisément définis (lignes de crêtes fermées, pas de
discontinuité locale sur l’image gradient). Lorsque ce n’est pas le cas, l’incertitude sur la
taille calculée est à la mesure de l’incertitude sur le contour de la région étudiée.
Image gradient Minima de l’image gradient les 4 minima de plus forte val. d’extinct. surf.
Figure 3.21: Exemple où la fonction d’extinction surfacique est calculée sur une image
gradient
Image originale
M’
M
Surf(M) Surf(M’)
Image gradient
Surf(M) Surf(M’)
M M’
Figure 3.22: Comparaison entre la fonction d’extinction surfacique calculée sur l’image
originale et la fonction d’extinction surfacique calculée sur l’image gradient. Contrairement
au cas de la dynamique, il n’y a pas ici de différence d’interprétation entre la mesure
calculée sur l’image originale et celle clculée sur l’image gradient, même si ces mesures
peuvent être différentes.
3.3. Etude approfondie de quelques cas particuliers 65
Figure 3.23: Une fonction numérique f peut être vue comme une superposition de ses
seuils successifs
Nous avons vu que les transformations δ ∞ (f, f − h) et γλa (f ) (qui sont à la base de la
dynamique et de la fonction d’extinction surfacique) sont définies par :
∀x ∈ E, δ ∞ (f, f − h)(x) = sup {s ≤ f (x) | ∃y ∈ Cx (Xs+ (f )), f (y) − s ≥ h}
f f
h-reconstruction ouverture surfacique de taille S
h
<h
<S
δ ∞ (f, f − h) élimine les dômes de l’image (c’est-à-dire les structures claires de l’image)
de hauteur inférieure à h ; les autres sont arasés sur une hauteur h (donc partiellement
préservés). γλa (f ) élimine les dômes de l’image de surface inférieure à λ ; les autres sont
arasés (voir figure 3.24). Nous nous proposons ici de définir une transformation agissant
sur les dômes de l’image selon leur volume.
66 Chapitre 3. Des fonctions d’extinction numériques
γλa (f ) peut être vue comme une ouverture par un élément structurant plan de surface
λ déformable. δ ∞ (f, f − h) peut être vue comme une érosion (suivie d’une reconstruction
géodésique) par un segment vertical de hauteur h centré en bas. Une manière de concilier
les critères de taille et de hauteur peut consister à considérer un élément structurant non
plan et non ponctuel.
On peut notamment considérer la composée γλa (δ ∞ (f, f − h)). Cette transformation
peut être vue comme une érosion (suivie d’une reconstruction géodésique) par un élément
structurant définit par un segment de hauteur h et une base déformable de surface λ (le
centre de l’élement structurant étant situé sur sa base). On vérifie aisément que :
γλa (δ ∞ (f, f − h)) = inf (γλa (f ), δ ∞ (f, f − h))
γλa (δ ∞ (f, f − h)) élimine donc les dômes de l’image de hauteur ou de surface trop petite.
Mais ce n’est pas exactement le volume des dômes qui est pris en compte. Un dôme de
volume V > h × λ peut très bien être éliminé par γλa (δ ∞ (f, f − h)) (voir figure 3.25).
h-reconstruction
f puis Comportement identique dans ces 2 configurations
ouverture surfacique de taille S
S
<h
<S V > h.S
E.S.
Figure 3.25: γλa (δ ∞ (f, f − h)) agit selon la surface et la hauteur des dômes mais non selon
leur volume.
Considérons maintenant une érosion par un élément structurant non plan quelconque
(voir figure 3.26). Si on effectue une reconstruction de f par cet érodé, alors, tous les
dômes de l’image ne contenant pas cet élément structurant non plan sont éliminés. Les
autres sont érodés. Nous définissons l’arasement volumique comme une érosion associée
à un élément structurant non plan de volume donné λ déformable capable d’adapter
localement sa forme aux structures de l’image.
Figure 3.26: érosion à partir d’un élément structurant à niveaux de gris déformable
avλ (f ) élimine les dômes de l’image (c’est-à-dire les structures claires de l’image) de
volume strictement inférieur à λ ; les autres sont arasés (voir figure 3.27).
On définit de manière duale une transformation agissant sur les structures sombres de
l’image :
X
∀x ∈ E, avλ (f )(x) = −avλ (−f ) = inf {s ≥ f (x) | (s − f (y)) ≥ λ} (3.17)
y∈Cx (Xs− (f ))
f
Arasement volumique (taille V) Le volume en discret
<V
f(y)-s
>= V s
y
Figure 3.27: Principe de l’arasement volumique : élimination des dômes de volume trop
faible
• avλ n’est pas idempotente (comme l’ouverture surfacique) et avλ ◦ avµ ≤ avλ+µ mais on
n’a pas toujours l’égalité donc avλ ne satisfait pas une loi de composition additive (comme
les h-reconstructions) (voir figure 3.29).
68 Chapitre 3. Des fonctions d’extinction numériques
g
f
v v v
a λ (f^ g) a λ (f)
^ a λ (g)
Figure 3.28: L’arasement volumique ne commute pas avec l’inf : ce n’est pas une érosion.
Sur cet exemple avλ (f ) ∧ avλ (g) 6= avλ (f ∧ g)
En conclusion, les propriétés de la la transformation avλ ne sont pas aussi riches que
celles des transformations morphologiques classiques utilisées pour le filtrage d’image.
Doit-on en déduire que cette transformation n’est pas intéressante ? Nous ne le pensons
pas. Notamment, le fait qu’elle soit connexe, croissante, anti-extensive et décroissante
vis-à-vis de l’indice λ permet d’utiliser la famille (avλ )λ≥0 pour l’étude des maxima de
l’image.
On peut également s’interroger sur le sens physique d’une telle transformation qui
mélange des grandeurs spatiales et des grandeurs relatives à la luminance. En effet, par
construction, le résultat d’une telle transformation est complètement modifié par anamor-
phose. En réalité, c’est en liant l’information spatiale et celle de luminance qu’il est possible
d’approcher la perception humaine : à contrastes égaux, l’oeil perçoit avec plus ou moins
d’intensité des objets de petite ou de grande taille. Nous verrons dans le chapitre suivant,
que sur le principe du volume, d’autres critères peuvent être introduits pour mélanger ces
informations : rapport contraste sur surface par exemple.
Figure 3.29: avλ ◦avµ ≤ avλ+µ mais on n’a pas toujours l’égalité : sur cet exemple notamment.
engendrée par la dynamique. De même, si toutes les structures de l’image sont de même
hauteur, la hiérarchie engendrée est identique à celle que l’on obtiendrait à partir de la
fonction d’extinction surfacique.
M M’
S
ARASEMENTS VOLUMIQUES DE TAILLE CROISSANTE
M M’ M M’ M M’
Figure 3.30: Les valeurs d’extinction volumiques permettent de distinguer des régions
ayant des caractéristiques en taille et en contraste identiques
La fonction d’extinction volumique peut également être calculée sur une image gradient
(voir figure 3.33). Comme dans le cas de la dynamique, l’information extraite dans ce cas
n’est pas la même que celle que l’on extrait en calculant la fonction d’extinction volumique
sur l’image originale. Ici, c’est la taille et la force des contours des régions qui sont pris
en compte et non pas la taille et le contraste des régions (voir figure 3.34). Par rapport à
la fonction d’extinction surfacique calculée sur l’image gradient, la fonction d’extinction
volumique présente l’avantage de prendre en compte la qualité des contours des régions
en plus de leur taille.
3.4. Définition symétrique à l’aide des transformations alternées séquentielles 71
M’
seuil s
E(M’) = V
Image originale "Road" Maxima de l’image originale les 4 max. de plus forte val. d’extinct. vol. Arasement volum. de taille equivalente
Figure 3.32: Utilisation de la fonction d’extinction volumique pour extraire les extrema
les plus significatifs en termes de volume. On ne retient ici que les 4 maxima de plus forte
valeur d’extinction volumique. L’image de gauche est le résultat de l’arasement volumique
de paramètre λ, où λ correspond à la plus faible valeur d’extinction des 4 maxima retenus.
Seules les régions claires qui persistent sur l’image filtrée sont marquées.
Image gradient Minima de l’image gradient les 4 minima de plus forte val. d’extinct. vol.
Figure 3.33: Exemple où la fonction d’extinction volumique est calculée sur une image
gradient
Image originale
M M’
Vol(M) = Vol(M’)
Image gradient
M M’
Vol(M) < Vol(M’)
Figure 3.34: Comparaison entre la fonction d’extinction volumique calculée sur l’image
originale et la fonction d’extinction volumique calculée sur l’image gradient : lorsqu’elle
est calculée sur l’image gradient, la fonction d’extinction volumique est caractéristique de
la taille et de la force des contours des régions de l’image.
Si ψλ est idempotente, le filtre alterné séquentiel associé est défini par (voir figure 3.35) :
ψλAS = (ψ λ ◦ ψλ ) ◦ (ψλ−1 ◦ ψλ−1 ) ◦ ... ◦ (ψ 1 ◦ ψ1 ) = (ψ λ ◦ ψλ ) ◦ ψλ−1
AS
(3.19)
ou bien :
ψλAS = (ψλ ◦ ψ λ ) ◦ (ψλ−1 ◦ ψλ−1 ) ◦ ... ◦ (ψ1 ◦ ψ 1 ) = (ψλ ◦ ψ λ ) ◦ ψλ−1
AS
(3.20)
Dans le cas où ψλ n’est pas idempotente, on considère la transformation (voir fig-
ure 3.36) :
ψλAS = (ψ 1 ◦ ψ1 ) ◦ (ψ 1 ◦ ψ1 ) ◦ ... ◦ (ψ 1 ◦ ψ1 ) = (ψ 1 ◦ ψ1 ) ◦ ψλ−1
AS
(3.21)
| {z }
λ fois
74 Chapitre 3. Des fonctions d’extinction numériques
h
h
h
h
(f-1) / Reconst. puis (f+1) / Reconst. ... puis (f-1) / Reconst. puis (f+1) / Reconst.
ou bien :
Les filtres alternés séquentiels ont fait l’objet d’études approfondies [82, 29] et sont
aujourd’hui très utilisées. Ces transformations ne sont ni auto-duales, ni idempotentes
: elles sont à la limite auto-duales lorsque les valeurs λ sont continues et que la valeur
initale de λ tend vers zéro. On choisit l’une ou l’autre des deux définitions 3.19 ou 3.20 (ou
bien 3.21 ou 3.22) selon que l’on désire privilégier les structures claires ou les structures
sombres de l’image. Ce choix est laissé à l’utilisateur et doit être redéfini pour chaque
problème traité. Enfin, ces transformations ne sont ni extensives, ni anti-extensives, c’est-
à-dire que les fonctions f et ΨAS AS AS
λ (f ) ne sont pas comparables (Ψλ ne vérifie ni Ψλ (f ) ≥ f
AS
ni Ψλ (f ) ≤ f ).
image originale ouverture par rec. de taille 10 fermeture par rec. de taille 10 F.A.S. par rec. de taille 10
extrema de l’image originale extrema de l’image ouverte extrema de l’image fermee extrema du F.A.S.
Figure 3.37: Effet d’un Filtre Alterné Séquentiel par reconstruction sur les extrema d’une
image numérique
∀M ∈ Extr(f ),
( " )
sym M ∈ Max(ψµAS (f )) si M ∈ Max(f ) (3.23)
EΨ (M) = sup λ ≥ 0 | ∀µ ≤ λ,
M ∈ Min(ψµAS (f )) si M ∈ Min(f )
Les figures 3.38 et 3.39 illustrent la comparaison entre la fonction d’extinction associée
aux h-reconstructions (c’est-à-dire la dynamique) et celle associée aux h-reconstructions al-
ternées séquentielles (que nous appelons la dynamique symétrique). Sur l’exemple ”Tools”,
les résultats obtenus dans les cas de la dynamique et de la dynamique symétrique diffèrent
pour tous les outils troués : dans de telles configurations en effet, les structures sombres
et claires de l’image sont traitées de manière non indépendante par les transformations
alternées séquentielles. De ce fait, sur cet exemple, la dynamique symétrique d’un trou
est plus faible que sa dynamique.
maxima
M’
M
h
M’
dyn(N) > h
h N
sym sym
dyn (M) = dyn (N) = h
Extrema de dyn. sym. sup. a 15 Extrema de l’image filtree
Extrema de dyn. sym. sup. a 40 (16 extr.) Extrema de dyn. sup. a 40 (24 extr.)
3.5.1 Principe
Supposons que l’on s’intéresse uniquement aux structures claires de l’image, et que l’on
dispose d’un ensemble de marqueurs quelconques (connexes ou non) Marq = (Mi )i∈I
pointant sur les structures d’intérêt dans l’image. Pour reconstruire uniquement les struc-
tures marquées dans Marq, on effectue une reconstruction géodésique à partir de l’ensemble
e ces marqueurs [21] :
(
∞ +∞ si x ∈ Marq
δ (f, f ∧ fMarq ) avec : ∀x ∈ E, fMarq (x) =
−∞ sinon
3.5. Utilisation des fonctions d’extinction pour le filtrage d’image 79
Si l’on s’intéresse aux structures sombres de l’image, on fait alors intervenir le processus
dual, c’est-à-dire une reconstruction géodésique par érosion.
Pour qu’une région claire (resp. sombre) marquée soit entièrement reconstruite il faut
et il suffit que le marqueur coı̈ncide avec le maximum régional le plus haut (resp. minimum
le plus bas) inclus dans la région.
La reconstruction numérique à partir de marqueurs est utilisée depuis longtemps déjà
pour filtrer des images. Elle a d’ailleurs déjà été mise à profit par M. Grimaud dans le
cas de la dynamique et a donné naissance au filtre en dynamique [21]. Le point délicat de
tels algorithmes ne réside pas dans le principe de reconstruction mais dans l’obtention de
marqueurs des structures devant être reconstruites dans l’image. C’est à ce niveau que les
outils que nous avons présentés dans ce chapitre offrent de nouvelles perspectives.
RE,+ ∞
s (f ) = δ (f, f ∧ fMarq ) avec : Marq = Maxs = {M ∈ Max(f ) | E(M) ≥ s}
où E(M) désigne la valeur d’extinction de M (par rapport à une famille (ψλ )λ≥0 donnée)
calculée sur l’image f .
80 Chapitre 3. Des fonctions d’extinction numériques
M’
M
M"
dyn(M’)
dyn(M")
surf(M’)
surf(M")
dyn(M)
surf(M)
Figure 3.41: Principe des “filtres” d’extinction : les régions marquées par des extrema de
forte valeur d’extinction sont intégralement préservées, les autres sont éliminées.
On dispose évidemment de l’opérateur dual pour agir sur les structures sombres de
l’image : RE,− E,+
s (f ) = −Rs (−f )
Comme les marqueurs considérés correspondent toujours à des extrema régionaux de
l’image, on est sûr que les structures intéressantes sont intégralement reconstruites. La
figure 3.41 illustre ce principe de filtrage dans le cas de la dynamique et des valeurs
d’extinction surfaciques.
3.5.3 Propriétés
• RE,+
s est, par construction, une transformation anti-extensive, idempotente et décrois-
sante vis-à-vis de l’indice s :
∀f, RE,+
s (f ) ≤ f
• Ces transformations ne sont pas croissantes : elles ne définissent donc pas des filtres
morphologiques (voir figure 3.43).
3.5. Utilisation des fonctions d’extinction pour le filtrage d’image 81
M’
M
M"
surf(M’)
surf(M")
surf(M)
surf(M’)
surf(M)
Figure 3.42: La valeur d’extinction surfacique d’un maximum M n’est pas modifiée
lorsqu’on élimine les maxima de moins grande surface que M. Ici, après reconstruction,
la région marquée par M ′′ est éliminée. Les valeurs d’extinction surfaciques associées à
M et M ′ (calculées sur l’image filtrée) restent inchangées.
∀λ ≥ 0, ∀µ ≥ 0, RE,+
λ ◦ RE,+
µ = RE,+
max(λ,µ)
3.5.4 Exemples
Nous nous proposons de comparer les filtres d’extinction dans le cas de la dynamique et
des valeurs d’extinction surfaciques et volumiques lorsque celles-ci sont calculées soit sur
l’image originale, soit sur l’image gradient. L’image ”Tools” nous servira d’illustration
(voir figure 3.44).
82 Chapitre 3. Des fonctions d’extinction numériques
M’ M’
f f
M
M" g M"
surf(M’)
surf(M") surf(M")
surf(M)
surf(M’)
Figure 3.43: Non croissance des filtres d’extinction. Sur cet exemple, on calcule un filtre
d’extinction surfacique. On a f ≥ g mais RE,+ E,+
s (f ) et Rs (g) ne sont pas comparables.
• La figure 3.45 donne un premier exemple du filtrage obtenu lorsque les marqueurs
considérés sont les maxima les plus significatifs de l’image en termes de contraste, de taille
et de volume. Dans un premier temps, les valeurs d’extinction des maxima régionaux de
l’image originale sont calculées. Les marqueurs sont obtenus en sélectionnant les maxima
de plus forte valeur d’extinction. Le filtre d’extinction consiste enfin en une reconstruction
géodésique de l’image à partir des marqueurs obtenus. Dans le cas des valeurs d’extinction
surfaciques par exemple, les seuls outils préservés par le filtrage sont les outils de grande
surface.
Nous comparons ce résultat à celui obtenu en appliquant le filtre équivalent : nous
avons vu que si les valeurs d’extinction sont définies à partir de la famille de transfor-
mations (ψλ )λ≥0 alors, les maxima de valeur d’extinction supérieure ou égale à un seuil s
3.5. Utilisation des fonctions d’extinction pour le filtrage d’image 83
donné marquent des structures de l’image qui persistent lorsqu’on applique ψs à l’image.
Ainsi, le filtre d’extinction surfacique de seuil 1000 est comparé à une ouverture sur-
facique de taille 1000. On remarque que les images issues des deux filtrages sont com-
parables : les mêmes structures sont éliminées, les mêmes structures sont préservées.
Cependant, les structures d’intérêt sont intégralement préservées par le filtre d’extinction
alors qu’elles sont arasées en hauteur par le filtre ψs . Ceci est particulièrement visible sur
nos exemple si l’on compare le filtre d’extinction surfacique de seuil 1000 et l’ouverture
surfacique de taille 1000. Une des clés (celle située dans le coin bas à gauche) a presque
entièrement été éliminée par l’ouverture (l’élimination n’est pas encore totale cependant :
voir figure 3.18)) ; elle est intégralement reconstruite par le filtre d’extinction.
E ,+
D’une manière générale, si Rs ψ désigne le filtre d’extinction et si ψλ est la transfor-
mation associée aux valeurs d’extinction étudiées, alors on a :
REs ψ ,+ (f ) ≥ ψs (f )
84 Chapitre 3. Des fonctions d’extinction numériques
Max. de dyn. sup. a 40 (17 marqueurs) Reconstruction des structures marquees h-reconstruction avec h = 40
Max. de val. d’ext. surf. sup. a 1000 Reconstruction des structures marquees Ouverture surfacique de taille 1000
Max. de vol. sup. a 60000 (17 marq.) Reconstruction des structures marquees Arasement volumique de taille 60000
Figure 3.45: Exemple d’utilisation des valeurs d’extinction pour le filtrage d’image. En
haut, les marqueurs correspondent aux maxima de forte dynamique. Au centre, les mar-
queurs correspondent aux maxima de forte valeur d’extinction surfacique. En bas, les mar-
queurs correspondent aux maxima de forte valeur d’extinction volumique. On compare les
résultats à ce que l’on obtiendrait à partir des filtres équivalents : par une h-reconstruction,
par une ouverture surfacique et par un arasement volumique.
• Le même traitement peut être appliqué aux structures sombres de l’image. Nous don-
nons figure 3.46 le résultat obtenu dans le cas de la dynamique. Après avoir reconstruit les
structures blanches de fort contraste (marquées par des maxima de dynamique supérieure
ou égale à 40), on reconstruit, sur l’image résultat, les structures sombres de fort contraste
à partir des minima de l’image originale de dynamique supérieure ou égale au même seuil
s = 40.
Le résultat est comparé à ce que l’on obtiendrait en effectuant sur l’image originale des
h-reconstructions alternée séquentielle (pour une même taille h = 40). La différence entre
ces deux filtrages est notable : sur l’image filtrée déduite de la dynamique les objets troués
sont intégralement reconstruits (objet plus trou) ; Par contre, ces trous ont été fermés par
les h-reconstructions alternées séquentielles. La dynamique considère les structures claires
3.5. Utilisation des fonctions d’extinction pour le filtrage d’image 85
Extr. de dyn. sup. a 40 Reconstruction des structures claires Reconstruction des structures sombres h-rec. alt. seq. (40 iterations)
Figure 3.46: Filtrage des structures claires et sombres de l’image de faible contraste en
utilisant la dynamique des extrema de l’image - Comparaison avec le résultat obtenu à
partir d’un filtre de contraste symétrique
Extr. de dyn. sym. sup. a 40 Reconstr. des struct. claires et sombres h-rec. alt. seq. (40 iterations)
Figure 3.47: Filtrage des structures claires et sombres de l’image de faible contraste en
utilisant la dynamique symétrique des extrema de l’image
86 Chapitre 3. Des fonctions d’extinction numériques
• Reprenons l’exemple de la figure 3.45 où le critère de filtrage est la taille des structures.
Pour filtrer les structures claires et sombres de l’image de taille inférieure à une valeur s
donnée, plusieurs solutions sont possibles :
La dernière solution est de toute évidence la plus simple. En effet, nous avons déjà vu
que les valeurs d’extinction surfaciques, qu’elles soient calculées sur l’image originale ou
sur l’image gradient, correspondent toujours à une mesure de la taille des structures. Le
calcul sur l’image gradient présente en outre l’intérêt de considérer simultanément et de
manière inter-dépendante les structures claires et sombres de l’image (voir figure 3.48).
La dynamique des minima du gradient peut également être utilisée pour filtrer les
structures de l’image originale. Dans ce cas, le critère de filtrage n’est pas le contraste
mais la force et la régularité des contours des structures (voir figure 3.49).
Enfin, les valeurs d’extinction volumiques calculées sur l’image gradient permettent
d’éliminer les régions de l’image de faible taille ou bien ayant des contours mal définis
(voir figure 3.50).
3.5. Utilisation des fonctions d’extinction pour le filtrage d’image 87
Minima du gradient de
Reconstruction des structures marquees
val. d’extinct. surf. sup. a 1000
Figure 3.48: Filtrage des structures claires et sombres de l’image de faible taille en utilisant
les valeurs d’extinction surfaciques des minima de l’image gradient
Figure 3.49: Filtrage des structures claires et sombres de l’image aux contours mal définis
en utilisant la dynamique des minima de l’image gradient
88 Chapitre 3. Des fonctions d’extinction numériques
Figure 3.50: Filtrage des structures claires et sombres de l’image en utilisant les valeurs
d’extinction volumiques des minima de l’image gradient
Figure 3.51: Les fonctions d’extinction : tableau récaputalif des opérateurs présentés
Un des atouts majeurs de la dynamique est qu’il existe un algorithme rapide pour son
calcul. Cette question n’a pas encore été abordée pour les nouveaux outils que nous venons
d’introduire.
3.6. Récapitulation et discussion 89
Remarquons simplement que le calcul des fonctions d’extinction ne peut être effectué
par une application directe de la définition que nous avons donnée : en effet, il faudrait
alors calculer les transformées ψλ (f ) (ou ψλAS (f ) dans le cas symétrique) pour des valeurs
croissantes de λ et ceci tant que ψλ (f ) n’est pas une fonction constante ; il faudrait égale-
ment pour chaque valeur de λ extraire les maxima et/ou minima régionaux de ψλ (f ) et
les comparer à ceux de ψλ−1 (f ). Tout ceci n’est en réalité pas envisageable ! Ce type
d’algorithme est en effet très couteux en temps de calcul sur des processeurs non spécial-
isés.
La question du calcul efficace des fonctions d’extinction apparaı̂t alors inévitable pour
que ces outils puissent êtres utilisables.
90 Chapitre 3. Des fonctions d’extinction numériques
Chapitre 4
Les transformations les plus évoluées de la morphologie mathématique sont, pour la plu-
part, définies comme des combinaisons de plus en plus complexes de transformées élé-
mentaires. Ainsi, la ligne de partage des eaux a originellement été introduite comme une
extension du SKIZ binaire aux fonctions numériques, le SKIZ étant lui-même défini à
partir de l’épaississement, résultat de la combinaison de deux dilatations élémentaires. La
définition de ces transformations pose alors le problème de celui de leur programmation
algorithmique : en effet, la combinaison de transformations élémentaires est généralement
coûteux en temps de calcul et nécessite des processeurs spécialisés. Ce fut le cas pour la
ligne de partage des eaux dont le calcul nécessitait initialement un très grand nombre
de parcours de l’image et était très long sur les machines non câblées. Les travaux de
L. Vincent [96, 98] et de F. Meyer [57] aboutirent à un algorithme original et très efficace
qui constitue aujourd’hui un des grands atouts de cette transformation. Dans le même
temps, la définition algorithmique de la ligne de partage des eaux introduisait une nouvelle
manière de considérer cette transformation et enrichissait par là-même ce concept.
La notion de fonction d’extinction ne déroge pas à cette règle. Définie à partir de
familles de transformations morphologiques élémentaires, le problème de son calcul ef-
ficace se pose immédiatement. Une partie de notre travail a donc consisté à établir un
algorithme efficace pour le calcul des valeurs d’extinction. C’est de ce sujet que traite le
présent chapitre. De la même façon que pour la ligne de partage des eaux, l’aspect algo-
rithmique de la notion de fonction d’extinction conduit à une nouvelle interprétation de
cette transformée et permet d’établir un lien avec des techniques d’analyse d’image par
arbres hiérarchiques de représentation, ce que l’on appelle parfois l’analyse dendronique.
4.1 Introduction
Nous avons vu que les fonctions d’extinction sont des opérateurs définis à partir de
familles d’opérateurs connexes. Or, les opérateurs connexes n’agissent sur les images
numériques qu’en propageant les plateaux de l’image. Une manière efficace de program-
mer les opérateurs connexes consiste donc à effectuer une propagation de ces plateaux.
91
92 Chapitre 4. Calcul efficace des fonctions d’extinction
Ce type d’algorithme a déjà été utilisé pour le calcul de la dynamique [21] ou encore
des ouvertures surfaciques [97] et est à la base d’algorithmes de segmentation pyramidale
performants [14].
Les algorithmes par propagation utilisent généralement des files d’attente hiérarchiques
pour stocker les pixels à propager. Ces files d’attente (First In First Out) sont aujourd’hui
bien connues ; nous nous dispenserons donc d’en refaire une présentation complète. Pour
plus de détails sur ce point, on pourra consulter les ouvrages de la liste non exhaustive
suivante : [57, 96, 21, 19, 14].
Nous allons voir que, dans le cas non symétrique, le calcul des valeurs d’extinction
surfaciques et volumiques fait appel à un processus similaire à celui utilisé pour le calcul
de la dynamique. Le cas symétrique fait, par contre, appel à un processus plus complexe.
niveau d’inondation
Figure 4.1: Principe de l’inondation d’un relief : l’eau pénètre par les minima ; le niveau
d’inondation est maintenu constant.
Lorsque deux lacs provenant de deux sources différentes se rencontrent, on est sur un
4.2. Algorithme de calcul des fonctions d’extinction 93
L.P.E
niveau d’inondation = h
Figure 4.2: Inondation et ligne de partage des eaux : lorsque deux eaux provenant de deux
sources différentes se rencontrent, on est sur un point de la ligne de partage des eaux.
point de la ligne de partage des eaux [2]. Soit M et M ′ les minima sources des lacs qui se
rencontrent. On note h le niveau courant d’inondation.
Au niveau d’inondation h, le lac de source M correspond à la composante connexe du
seuil de niveau h de f contenant M :
• Calcul de la dynamique
Nous avons vu que la dynamique d’un minimum M est définie par (voir section 3.3.1,
relation 3.9) :
L.P.E
Plateau non-extremum
Minimum
dyn(M) dyn(M)
M M
Figure 4.3: Calcul de la dynamique : lorsque deux lacs de sources différentes se rencontrent,
la dynamique de la source associée au lac de plus faible profondeur est calculée.
Une configuration ambigüe peut être rencontrée : elle correspond au cas où M et
′
M sont de même altitude. Par une h-reconstruction de paramètre (h − alt(M)) = (h −
alt(M ′ )), M et M ′ fusionnent pour donner un unique minimum régional (voir figure 4.4).
M. Grimaud propose plusieurs solutions pour résoudre cette configuration pathologique
: celle que nous retenons consiste à attribuer fictivement une altitude plus faible à l’un
des deux minima (choisi par exemple au hasard), de telle sorte que le traitement décrit
ci-dessus puisse être appliqué.
L.P.E.
Minimum regional
M M’ M M’
Une fois la dynamique de l’un des deux minima calculée (ici M), les deux lacs fusion-
nent, ou plus exactement l’un absorbe l’autre : le lac associé au minimum le plus profond
(M ′ ) absorbe l’autre (M) : M −→ M ′ . L’inondation continue en considérant que ces lacs
n’en font plus qu’un (si M a auparavant absorbé d’autres lacs, alors M ′ absorbe également
ces autres lacs). Le processus d’absorption se traduit algorithmiquement par un chaı̂nage
des minima de l’image : à l’origine M est son propre père ; après fusion des deux lacs, M
a pour père M ′ . Nous appelons l’arbre ainsi construit arbre de fusion des minima (voir
figure 4.5).
4.2. Algorithme de calcul des fonctions d’extinction 95
L.P.E L.P.E
2 3 4 2 3 4
1 1
5 5
L.P.E
5
2 4
1 3
Figure 4.5: Algorithme de calcul de la dynamique - Construction d’un arbre de fusion des
minima de l’image : lorsque deux lacs de sources différentes se rencontrent le plus fort (le
lac le plus profond) absorbe le plus faible (le lac le moins profond) et la dynamique de la
source du lac le plus faible est calculée. Tout ce passe ensuite comme si la source du lac
absorbé n’existait plus.
L’arbre de fusion des minima déduit de la dynamique satisfait les conditions suivantes :
(
′ dyn(M ′ ) ≥ dyn(M)
si M −→ M alors :
l’altitude à franchir pour aller de M à M ′ est minimale
L’algorithme de calcul de la dynamique est donc basé sur une inondation de l’image et
sur l’étude des points de rencontre des différents lacs. Ensuite, le mécanisme de traitement
des minima utilise :
1. une mesure sur les lacs (c’est-à-dire un calcul quantitatif sur les composantes con-
nexes des seuils de l’image) : la profondeur.
2. un critère d’attribution de cette mesure à l’un ou l’autre des deux minima dont les
lacs se rencontrent : on décide que le lac le moins profond est traité.
Nous allons voir que pour calculer les valeurs d’extinction surfaciques et volumiques, il
suffit de modifier, dans cet algorithme, le critère (le calcul quantitatif) que l’on considère.
96 Chapitre 4. Calcul efficace des fonctions d’extinction
s
s-1 S = Surf(M) Minimum
au niveau s-1
M M
Ouverture surfacique
niveau d’inondation h=s M’ de taille (S+1) M’
Figure 4.6: Calcul des valeurs d’extinction surfaciques : lorsque deux lacs de sources
différentes se rencontrent, la valeur d’extinction surfacique de la source associée au lac de
plus faible surface est calculée.
Démontration
• (i) Considérons ϕaλ la fermeture surfacique de taille λ. Montrons que si le plateau
de ϕaλ (f ) contenant M n’est pas minimum régional, alors : λ > λ0 .
Posons h = ϕaλ (f )(M). Si le plateau contenant M n’est pas minimum régional de
ϕaλ (f ) alors, il admet au moins un voisin de plus faible altitude :
−
Surf (CM (Xh−1 (f ))) < λ
x ∈ CM (Xh− (ϕaλ (f ))) donc x ∈ CM (Xh− (f )) car ϕaλ est extensive. On a donc :
−
Surf (Cx(Xs−1 (f ))) > λ0 . Par conséquent : ϕλ (f )(x) ≤ s − 1
x ∈ CM (Xs− (f )) et ϕaλ est connexe, donc : x ∈ CM (Xs− (ϕaλ (f ))). Finalement, on a :
(cqfd)
Ainsi, le calcul des valeurs d’extinction surfaciques peut s’effectuer selon un proces-
sus identique à celui utilisé dans le cas de la dynamique. Lorsque deux lacs de sources
différentes(M et M ′ ) se rencontrent, on compare les surfaces de deux lacs au niveau
d’inondation immédiatement précédent : (h − 1) si h est le niveau courant d’inondation.
Si le lac associé à M ′ est de plus grande surface que celui associé à M, alors on calcule la
valeur d’extinction surfacique associée à M (voir figure 4.6).
98 Chapitre 4. Calcul efficace des fonctions d’extinction
L.P.E.
Minimum regional
h
h-1
Ouverture surfacique
Surf(M) = Surf(M’) = S de taille (S + 1)
M M’ M M’
niveau d’inondation = h
Figure 4.7: Configuration pathologique pour le calcul des valeurs d’extinction surfaciques
: deux lacs de même surface se rencontrent.
Le calcul des valeurs d’extinction associées aux ouvertures par reconstruction (définies
à l’aide d’un élément structurant B quelconque) relève du même processus, excepté qu’on
ne considére plus la surface des lacs au niveau (h − 1) mais la taille maximale de la boule
λB contenue dans chaque lac au niveau (h − 1). Un calcul de surface est très simple à
réaliser : lorsqu’un pixel est extrait de la file d’attente, un lac se propage en ce pixel
et la nouvelle surface de ce lac est obtenue par une simple incrémentation. Par contre,
4.2. Algorithme de calcul des fonctions d’extinction 99
L.P.E L.P.E
2 3 4 2 3 4
1 1
5 5
L.P.E
3
2 5
1 4
Figure 4.8: Algorithme de calcul des valeurs d’extinction surfaciques - Construction d’un
arbre de fusion des minima de l’image : lorsque deux lacs de sources différentes se ren-
contrent, le plus fort (le lac de plus grande surface) absorbe le plus faible (le lacs de plus
petite surface). La valeur d’extinction surfacique de la source du lac absorbé est calculée.
déterminer la taille de la boule contenue dans cette nouvelle surface est plus complexe à
mettre en oeuvre et plus coûteux en temps d’exécution.
On peut montrer que, pour calculer la valeur d’extinction volumique d’un minimum
M, il suffit de considérer le niveau d’inondation minimal s tel que le lac de source M
rencontre un autre lac de plus grand volume.
s
s-1 V = Vol(M) Minimum
au niveau s-1
M M
Filtre volumique
niveau d’inondation h=s M’ de taille (V+1) M’
Figure 4.9: Calcul des valeurs d’extinction volumiques : lorsque deux lacs de sources
différentes se rencontrent, la valeur d’extinction volumique associée au lac de plus faible
volume est calculée.
h+1
S h
V’ = V + S V
Figure 4.10: Calcul du volume d’un lac au niveau h + 1 connaissant son volume et sa
surface au niveau h
L.P.E L.P.E
2 3 4 2 3 4
1 1
5 5
L.P.E
2
1 3 4
Figure 4.11: Algorithme de calcul des valeurs d’extinction volumiques - Construction d’un
arbre de fusion des minima de l’image : lorsque deux lacs se rencontrent, le plus fort (celui
de plus grand volume) absorbe le plus faible (celui de plus petit volume).
• Remarques
Efficacité de l’algorithme proposé pour le calcul des valeurs d’extinction non symétriques
L’efficacité des algorithmes du type de ceux décrits et utilisant des files d’attente hiérar-
chique est aujourd’hui bien connue. Lorsque les calculs effectués sur les lacs sont de type
algébriques (cas de la profondeur, de la surface ou du volume ...), la vitesse d’exécution
102 Chapitre 4. Calcul efficace des fonctions d’extinction
h(4)
2 3 4 2 h(3) 3 4 h(5)
1 1
h(5)
5 5
Filtre volumique
Volume suffisant
h(1) = h(2)
h(3) h(4)
2 3 4 h(5) 2 3 4
1 1
5 5
Figure 4.12: Calcul du filtre volumique par inondation du relief : lorsqu’un lac atteint un
volume suffisant, le niveau d’inondation courant est noté. Les points de ce lac prendront
ce niveau de gris dans l’image de sortie.
de ces algorithmes est de l’ordre de celle du calcul de la ligne de partage des eaux et
entre donc dans la catégorie des algorithmes rapides de la morphologie mathématique.
En effet, nous avons vu que de telles mesures sont programmables par incrémentation :
le volume par exemple des lacs à l’altitude h se déduit très simplement de celui calculé
à une altitude inférieure. Lorsqu’un pixel est extrait de la file d’attente au niveau h, on
peut immédiatement noter sa contribution au volume du lac pour le niveau h (sans que la
connaissance d’autres points soit nécessaire). Par contre, le calcul des valeurs d’extinction
associées aux ouvertures morphologiques par reconstruction fait appel à des processus
plus complexes et plus coûteux en temps de calcul. Nous donnons en annexe C les algo-
rithmes en pseudo-code décrits ici pour le calcul des valeurs d’extinction surfaciques et
volumiques.
Figure 4.13: Les algorithmes de calcul des valeurs d’extinction des maxima conduisent à
la construction d’arbres de fusion des maxima de l’image
18
M M 9
11
8 19
M’ 8 M’ 10
11 M" M"
Figure 4.14: Valuation des branches de l’arbre des minima : lorsque deux lacs de sources
différentes se rencontrent, une branche de l’arbre est créée ; cette branche est valuée en
utilisant l’information du lac le plus fort : avec la profondeur du lac le plus profond dans
le cas de la dynamique (notre exemple), selon la surface du lac de plus grande surface
dans le cas de la fonction d’extinction surfacique, selon le volume du lac de plus grand
volume dans le cas de la fonction d’extinction volumique.
Différentes options possibles pour le chaı̂nage des minima Nous avons vu que, dans les
trois cas étudiés, la construction des arbres de fusion des minima repose sur un méme
mécanisme. Si M → M ′ dans l’arbre de fusion, alors M ′ satisfait : parmi tous les M ′′ plus
persistants que M (E(M ′′ ) ≥ E(M)), M ′ est celui que l’on peut atteindre à partir de M
en montant le moins.
Ces conditions n’assurent pas l’unicité de M. L’algorithme que nous avons proposé
introduit naturellement une solution au choix de M. D’autres choix auraient pu être
effectués : celui proposé figure 4.15 permet d’assurer une condition supplémentaire de
“proximité” entre M et M ′ . C’est d’ailleurs à partir d’un arbre de ce type que les exemples
de la figure 4.13 ont été obtenus. On peut se poser la question de l’utilité de modifier ainsi
les relations de fusion : nous reviendrons sur ce point dans la section 5.3 du chapitre suivant
4.2. Algorithme de calcul des fonctions d’extinction 105
où nous discuterons de l’intérêt ces représentations dans des applications de segmentation
hiérarchique d’images.
Soulignons que cette modification ne change rien quant à l’interpétation de l’arbre.
A partir du moment où les conditions 4.1 et 4.2 sont satisfaites, alors : l’arbre dont
les noeuds et les branches sont valués comme indiqué précédemment mémorise quand et
comment les régions de l’image fusionnent quand on applique la famille (ψλ (f ))λ≥0 .
M M
M’ M’
M" M"
Figure 4.15: Plusieurs options sont possibles pour le chaı̂nage des minima : sur cet exemple,
M ′ et M ′′ ont des valeurs de dynamique plus grandes que M ; la hauteur à franchir pour
aller de M vers M ′ ou M ′′ est la même. On peut créer une branche liant soit M à M ′ soit
M à M ′′ .
1. Une inondation de l’image (en d’autres termes, on considère les seuils de l’image
pour des niveaux croissants). Chaque lac (chaque composante connexe des seuils
successifs de l’image) correspond à une région particulière dans l’image.
2. Une opération sur les lacs (on évalue la profondeur, la surface, le volume... des lacs).
On extrait ainsi des caractéristiques des régions de l’image.
On peut intervenir dans ce mécanisme à deux niveaux : pour le choix de la (ou des)
mesure(s) effectuées sur les lacs et pour le choix du mode d’affectation de la mesure à une
région. C’est en modifiant l’un de ces points (ou les deux) qu’il est possible d’introduire de
nouveaux opérateurs. On peut par exemple, choisir comme mesure le rapport profondeur
sur surface (nous avons vu qu’un tel opérateur est bien adapté pour modéliser la perception
visuelle de l’Homme). Ensuite, le choix de l’affectation (lorsque deux lacs se rencontrent)
reste à définir : on peut par exemple, sur le modèle des opérateurs précédents, traiter le
lac ayant le plus faible rapport profondeur sur surface...
106 Chapitre 4. Calcul efficace des fonctions d’extinction
Propagation
des
extrema
Le processus symétrique est plus complexe que celui utilisé dans le cas non symétrique.
Nous allons le décrire plus en détails.
Initialement, l’ensemble des plateaux à propager est l’ensemble des extrema de l’image.
Dans une étape préliminaire, les extrema de l’image sont donc extraits et étiquetés (dans
l’image de sortie) : on attribue à chacun un niveau de gris particulier permettant ensuite
de le reconnaı̂tre (pour cette étape on pourra consulter [96]). Il faut pour ce point prévoir
un algorithme d’étiquetage capable de traiter correctement le cas où un minimum et un
maximum sont voisins : on doit alors leur attribuer deux labels différents alors que leur
union ne définit qu’une seule composante connexe.
Les pixels de M sont étiquetés minima ou maxima. Les pixels voisins de M sont
étiquetés voisin et sont entrés dans la file d’attente au niveau de priorité égal à : | f (x) −
f (M) |. Si un pixel est voisin de plusieurs extrema, il est entré plusieurs fois dans la file
d’attente : voir figure 4.17.
108 Chapitre 4. Calcul efficace des fonctions d’extinction
minimum maximum
4 7 4 5 0 6
4 2 5 2 1 5
2 3 9 8 6 4
1 5 5 8 6 6
1 2 3 4 5 6 7
Figure 4.17: Calcul des valeurs d’extinction symétriques : initialisation de la file d’attente
hiérarchique. Si un pixel est voisin de deux extrema, il est entré deux fois dans la file
d’attente.
(1) Tant que la file d’attente est non vide, on extrait les pixels de niveau de priorité
minimal. Si ce pixel a déjà un label, on extrait le pixel suivant de la file d’attente ; dans
le cas contraire, on le traite.
Soit x le pixel courant extrait de la file et h le niveau de priorité courant.
4 7 4 5 0 6
4 2 5 2 1 5
X
2 3 9 8 6 4
1 5 5 8 6 6
1 2 3 4 5 6 7
P
4 7 4 5 0 6
4 2 5 2 1 5
X
2 3 9 8 6 4
1 5 5 8 6 6
1 2 3 4 5 6 7
Figure 4.18: Extraction et traitement des pixels de la file d’attente. Un pixel x est extrait
de la file d’attente. Un plateau extremum se propage en x et les voisins de x non traités
sont insérés dans la file d’attente.
4.2. Algorithme de calcul des fonctions d’extinction 109
4 7 4 5 0 6 4 6 4 5 1 5
4 2 5 2 1 5 4 3 5 2 1 5
sym-dyn=1
2 3 9 8 6 4 2 3 8 8 6 4
1 5 5 8 6 6 2 5 5 8 6 6
Non-extremum
Figure 4.19: Lorsqu’un extremum étendu cesse d’être extremum, sa propagation est arrêtée
et sa dynamique symétrique est calculée. (Ici, le niveau de priorité courant est égal à 1.)
Lors de cette opération, selon le niveau de gris des voisins de x, on est en mesure
de dire si le plateau propagé en x est toujours extremum ou non. En effet, si x est
étiqueté minimum (resp. maximum) et que x a un voisin d’altitude strictement inférieure
(resp. strictement supérieure) à alt(x) alors, le plateau contenant x est un plateau non-
extremum. Dans ce cas, x est étiqueté en attente (voir figure 4.19) et la propagation du
plateau est arrêtée (et tant que cette situation ne changera pas l’altitude courante du
plateau ne sera pas modifiée).
Ce plateau correspond à un extremum M de l’image originale qui a été étendu. Si
le plateau contenant M cesse d’être extremum, alors la dynamique symétrique de M est
calculée ; elle est exactement égale au niveau de priorité courant h : dynsym(M) = h.
4 7 4 5 0 6 4 6 4 5 1 5
4 2 5 2 1 5 4 3 5 2 1 5
2 3 9 8 6 4 2 3 8 8 6 4
1 5 5 8 6 6 2 5 5 8 6 6
Non-extremum
sym-dyn=3
4 5 4 5 2 4 4 4 4 5 3 4
sym-dyn=2
4 3 5 2 2 4 4 4 5 3 3 4
3 3 7 7 6 4 4 4 6 6 6 4
3 5 5 7 6 6 4 5 5 6 6 6
Merging Non-extremum Merging
Figure 4.20: Lorsque deux plateaux de même altitude se rencontrent, ils fusionnent
fusions ont lieu et on ne peut se permettre d’effectuer à chaque fois une lecture de l’image
pour accéder aux voisins des nappes qui fusionnent !
La solution que nous proposons consiste à travailler non pas avec une seule file d’attente
mais avec une file d’attente par extremum. Ainsi, lorsqu’un pixel est voisin d’un plateau,
il est inséré dans la file d’attente associée à ce plateau. De même, lorsqu’on cherche à
déterminer la nature d’un plateau, il suffit de relire les pixels de la file d’attente qui lui
est associée.
Lorsque deux plateaux M et M ′ fusionnent M → M ′ , les pixels dans la file d’attente
associée à M sont insérés dans celle associée à M ′ . Leur altitude est prise en compte
pour déduire la nature du plateau résultant de la fusion. Notons qu’il faut également
tenir compte de l’altitude des plateaux voisins pour que la conclusion soit valable : aussi,
lorsque deux plateaux d’altitudes différentes se rencontrent, même s’ils ne fusionnent pas
(puisqu’ils ne sont pas à la même altitude), cette rencontre est mémorisée.
Le fait de travailler avec plusieurs files d’attente n’est pas source en soi d’augmentation
de temps de calcul. De plus, cette variante facilite la gestion des plateaux en attente
(les plateaux non-extrema) : lorsqu’un plateau n’est pas extremum, sa propagation est
arrêtée c’est-à-dire que la file d’attente qui lui est associée est elle-même mise en attente.
Ceci facilite également l’étape (2) : lorsqu’on extrait x d’une file d’attente, on connait
immédiatement le label du plateau voisin et on sait que ce plateau n’est pas en attente,
sinon x n’aurait pas été extrait.
• Min ∪ Plt
si Min ∪ P lt = Min : P lt −→ Min
sinon : P lt −→ Min et dynsym (Min) = h
4.2. Algorithme de calcul des fonctions d’extinction 111
• Min ∪ Max
sym
Si Min ∪ Max = Min : Max −→ Min et dyn
( (Max) = h
sym
dyn (Min) = h
Si Min ∪ Max = P lt : Max −→ Min et
dynsym (Max) = h
• Min ∪ Min
Si deux minima fusionnent, le résultat est encore un minimum. Celui de plus basse
altitude absorbe l’autre et la dynamique symétrique de celui qui est absorbé est
calculée.
On a bien entendu des règles équivalentes pour les maxima de l’image (remplacer Min
par Max dans les relations).
4 7 4 5 0 6 4 4 4 5 3 4
4 2 5 2 1 5 4 4 5 3 3 4
2 3 9 8 6 4 4 4 6 6 6 4
1 5 5 8 6 6 4 5 5 6 6 6
Fusion
Fusion dyn-sym=5
5 5 5 5 4 4 4 7 4 5 0 6
5 5 5 4 4 4 4 2 5 2 1 5
5 5 5 5 5 4 2 3 9 8 6 4
5 5 5 5 5 5 1 5 5 8 6 6
dyn-sym=4 dyn-sym=5
Fusion Arbre de fusion des extrema
Figure 4.22: Exemple “Tools” : arbre de fusion des extrema de l’image dérivé de la dy-
namique symétrique
h’<h
h
h
h’’>h
T.A.S. de taille h Arbre de fusion des extrema
Figure 4.23: L’arbre de fusion dynamique des extrema mémorise quand et comment les
plateaux de l’image fusionnent lorsqu’on calcule des h-reconstructions alternées séquen-
tielles de taille croissante
Nous avons vu que le calcul des valeurs d’extinction surfaciques et volumiques dans le cas
non symétrique pouvait être effectué par un algorithme tout à fait similaire à celui utilisé
pour le calcul de la ligne de partage des eaux et de la dynamique. Ce type d’algorithme est
très efficace. Pour donner un ordre de grandeur, sur une station de travail SUN SPARC 1,
le temps de calcul des valeurs d’extinction de plus de 1000 minima sur une image de taille
256 × 256 est de l’ordre de 7 ou 8 secondes. En comparaison, le temps de calcul d’une
reconstruction numérique est de l’ordre de 4 secondes. De plus, les temps de calcul varient
peu d’une image à l’autre (pour une même taille d’image) et lorsque le nombre de minima
augmente : en effet l’algorithme par inondation traite toujours le même nombre de fois
chaque pixel de l’image. De plus, les temps de calcul ne varient pas selon que l’on calcule
la dynamique, les valeurs d’extinction surfaciques ou les valeurs d’extinction volumiques
: les traitements algébriques effectués pour chaque pixel diffèrent mais n’influent pas de
manière significative sur les temps de calcul. Nous donnons figure 4.24 des exemples
de temps de calcul évalués sur les images ”Tools” et ”Road” originales (grand nombre
d’extrema) et filtrées (faible nombre d’extrema).
114 Chapitre 4. Calcul efficace des fonctions d’extinction
Figure 4.24: Temps de calcul des valeurs d’extinction non symétriques (temps évalués sur
une station SUN SPARC 1 et pour des images de taille (256 × 256))
Figure 4.25: Temps de calcul de la dynamique symétrique (temps évalués sur une station
SUN SPARC 1 et pour des images de taille (256 × 256))
Considérons l’image comme un relief initialement englouti sous la mer. La mer se retire
progressivement découvrant le paysage. D’une hauteur de marée à une autre, plusieurs
évènements peuvent se produire : une nouvelle ı̂le apparaı̂t, une ı̂le voit sa surface croı̂tre,
deux ı̂les fusionnent pour n’en donner qu’une seule. A chacun de ces évènements corre-
spond une étape dans la construction du dendrone : quand une ı̂le apparaı̂t, un noeud
terminal du dendrone est créé (on note en ce noeud la position et l’altitude de l’ı̂le) ; au fur
et à mesure que l’ı̂le grossit, on garde trace du centre de masse de la base de l’ı̂le ; quand
deux ı̂les fusionnent, l’information de leur base est collectée, un nouveau noeud est créé
116 Chapitre 4. Calcul efficace des fonctions d’extinction
correspondant à l’agrégat des deux ı̂les, avec comme information de sommet celle de l’une
des deux sous-ı̂les, et sa propre information de base. C’est ce phénomène d’agrégation qui
est à l’origine de la structure d’arbre : les branches de l’arbre lient la nouvelle ı̂le-agrégat
aux deux sous-ı̂les.
La figure 4.26 illustre cette définition. On le voit ici, dans la définition proposée par
R. W. Ehrich, ce n’est pas la hauteur absolue des extrema mais leur hauteur relative qui
est prise en compte pour construire la hiérarchie [16].
B C
A
D
(B+C) E
(D+E)
(A+(B+C))
((A+(B+C))+(D+E))
Les noeuds du dendrone sont étiquetés de telle sorte que le dendrone contienne toute
l’information utile de l’image : la surface, l’élongation, l’orientation de la base d’une ı̂le ...
Des exemples d’utilisation de ce dendrone pour la reconnaissance de forme peuvent être
trouvées dans [27]. La reconnaissance de formes effectuée à l’aide du dendrone doit son
efficacité à la valeur sémantique de celui-ci, plus élevée que celle de l’image. Les noeuds
du dendrone pointent sur les régions de l’image, les branches du dendrone traduisent les
relations hiérarchiques d’inclusion entre les régions de l’image. L’étiquetage des noeuds
du dendrone permet en plus de qualifier toutes ces régions.
dendrone ne l’est pas. Une relation simple lie le dendrone à l’arbre des minima déduit de
la dynamique : considérons deux minima A et B de l’image. Si A −→ B dans l’arbre des
minima alors A et B sont liés au noeud (A + B) dans le dendrone. Nous avons vu qu’à
chaque fonction d’extinction correspond un arbre de fusion des minima particulier. Par
contre le dendrone est défini de façon unique car ses branches sont non-orientées.
B C
A
D Ligne de partage des eaux
E
E
A D
B C
((A+(B+C))+(D+C))
(A+(B+C))
(D+C)
(B+C) E E
A D A D
B B
C C
Figure 4.29: Etiquetage des noeuds du dendrone : chaque branche est étiquetée par sa
hauteur, la surface de la base de l’ı̂le qui lui est associée...
; lorsque deux nappes fusionnent, un nouveau noeud est créé, résultat de l’agrégation des
deux nappes : si A −→ B dans l’arbre de fusion des extrema, alors A et B sont des noeuds
terminaux du dendrone symétrique et A et B ont pour pére le nouveau noeud (A + B).
Encore une fois, seule la structure utilisée (de type ”arbre non orienté” et non plus de
type ”arbre orienté”) diffère dans l’algorithme (voir figure 4.30).
B C
A
D
E
dendrone
B C
A
D
b E
a d
c
dendrone symetrique
4.4 Discussion
La définition algorithmique des fonctions d’extinction met en évidence une notion sous-
jacente très importante : celle d’ arbres de fusion des extrema de l’image. Dans le cas
non symétrique, l’arbre construit lie soit les minima soit les maxima de l’image ; dans le
cas symétrique l’ensemble des extrema de l’image sont liés entre eux. De plus ces arbres
contiennent toute l’information qu’il est possible d’extraire de l’image en calculant les
familles croissantes de filtres morphologiques associées.
L’utilisation de telles représentations arborescentes dans le cas non symétrique n’est
pas nouvelle. Par contre, la notion de dynamique symétrique introduit de nouvelles per-
spectives pour l’analyse d’image par arbre qui peut par ce biais être définie symétrique-
ment pour les structures claires et sombres de l’image.
A partir de cette structure arborescente, il est possible de centraliser toute l’information
recueillie : le contraste, la surface, le volume... ; nous avons vu qu’on peut également
l’utiliser pour introduire d’autres mesures sur les régions de l’image... Nous allons voir
enfin, dans le chapitre suivant, comment cette information est exploitable pour la seg-
mentation d’images.
120 Chapitre 4. Calcul efficace des fonctions d’extinction
Chapitre 5
Application à la segmentation
d’image
121
122 Chapitre 5. Application à la segmentation d’image
La notion de LPE est étroitement liée à celle de minimum régional. Nous rappelons qu’un
minimum régional est un ensemble connexe de pixels d’altitude constante tel qu’il n’est pas
possible, partant de cet ensemble de rejoindre un point de la surface d’altitude inférieure
sans avoir à grimper.
Une manière de déterminer les minima régionaux d’une image peut consister en
l’expérience suivante : considérons le relief sous un nuage de pluie. Une goutte d’eau
tombant en un point x va couler le long du relief et va finalement rejoindre le fond d’une
vallée : un minimum régional. Soit M un minimum régional de l’image. Si une goutte
d’eau tombant en x rejoint finalement M, alors x appartient au bassin versant de M [96]
(cf. figure 5.1).
Définition 5.1 (Bassin versant d’un minimum régional [96]) Soit M un minimum
régional d’une image numérique f . Le bassin versant associé à M (noté BV (M)) est
l’ensemble des pixels x tels qu’une goutte d’eau tombant en x rejoint finalement M.
5.1. Introduction : la segmentation par LPE 123
La notion de bassin versant permet d’associer à chaque minimum régional une portion
de l’image : la vallée qui lui correspond. L’ensemble des bassins versants associés à chaque
minimum régional de l’image définit une partition de l’image. L’ensemble des points de
séparation de deux bassins versants adjacents forme la ligne de partage des eaux.
Plusieurs techniques permettent de calculer la ligne de partage des eaux d’une image.
Pour certaines configurations du relief, les résultats obtenus peuvent varier légèrement [2].
Dans tout ce qui suit, nous considérerons que la LPE a été obtenue par un algorithme
d’inondation (tel que nous l’avons évoqué dans le chapitre précédent). Cette technique est
la plus utilisée aujourd’hui [96, 57]. La LPE produite par inondation peut-être formulée
à l’aide d’une distance topographique [2].
La ligne de partage des eaux est généralement calculée non pas sur l’image originale
mais sur son gradient : ainsi les points de partage des eaux correspondent aux points crête
du gradient autour des minima, c’est-à-dire aux lieux de forte transition d’intensité sur
l’image originale. Les régions extraites par cette transformation satisfont alors au critère
d’homogénéité.
La figure 5.2 donne un exemple de la segmentation ainsi obtenue. Par définition, le
nombre de régions est égal au nombre de minima régionaux de l’image gradient. Comme
nous le voyons sur cet exemple, cette transformation conduit généralement à une sur-
segmentation de l’image et n’est donc pas directement utilisable.
Image originale "Tools" Image gradient Minima de l’image gradient Segmentation par LPE (1643 regions)
sur laquel on calcule la LPE, c’est-à-dire d’imposer d’autres minima à cette image : les
marqueurs des régions devant être segmentées dans l’image [61].
L’ensemble des minima régionaux de cette fonction est exactement égal à l’ensemble
des marqueurs des régions à segmenter. Une manière de contrôler le résultat de la seg-
mentation est de modifier les minima de l’image sur laquelle on calcule la LPE (l’image
gradient le plus souvent), c’est-à-dire d’imposer nos marqueurs (les zéros de fM ) comme
seuls minima régionaux de l’image g. Ceci est réalisé très simplement par une reconstruc-
tion géodésique de (g ∧ fM ) par fM [61] (voir figure 5.3) :
g ′ = ǫ∞ ((g ∧ fM ), fM ) (5.1)
fM fM
LPE(g) LPE(g’)
g’
g g
Figure 5.3: Modification de l’homotopie d’une image gradient : on impose d’autres minima
à l’image en utilisant une reconstruction géodésique
Image filtree Extrema de l’image filtree Modif. de l’homothopie du gradient Segmentation par LPE (48 regions)
à extraire. C’est au niveau du ou des filtres utilisés que les connaissances a priori sont
généralement introduites dans l’algorithme de segmentation. L’ajustement des paramètres
de filtrage est alors, dans de nombreux cas, le seul point mécanique de l’algorithme.
La modification de l’homotopie du gradient est en fait une étape fictive qui n’apparaı̂t
pas explicitement dans l’algorithme aujourd’hui utilisé pour calculer la LPE. En effet,
la définition algorithmique de la LPE plus générale que la définition formelle permet de
dissocier cette notion de celle de minima régionaux [96, 57]. Considérant un ensemble
de marqueurs quelconques (connexes ou non), chaque marqueur représente une source
d’inondation du relief. La LPE associée à ces marqueurs correspond alors aux barrages
qu’il faut ériger pour que deux lacs provenant de deux sources distinctes ne se rencontrent
pas lorsque le niveau d’inondation du relief progresse.
Lorsque la LPE est calculée à partir de marqueurs quelconques, les régions ainsi définies
autour des marqueurs sont appelées zones d’influence.
Notons que, dans le cas où les marqueurs sont connexes, alors, le nombre de régions est
exactement égal au nombre de marqueurs. Cette propriété n’est pas forcément satisfaite
dans le cas de marqueurs non connexes.
marqueurs
2. Déterminer l’image sur laquelle on calcul la LPE (image gradient le plus souvent)
La LPE s’avère être une technique puissante de segmentation, à partir du moment où
les étapes préparatoires (1 et 2) qui lui sont associées sont correctement effectuées : la
segmentation finalement obtenue est en effet entièrement conditionnée par les marqueurs
sélectionnés et l’image sur laquelle la LPE est calculée.
L’expérience montre que les images que l’on rencontre dans la pratique sont rarement
d’aussi bonne qualité que l’image “Tools” précédemment étudiée. L’exemple de la fig-
ure 5.6 en est une illustration. Il sagit ici de segmenter des cellules musculaires séparées
sur l’image par des filaments clairs. Cet exemple est particulier car on peut calculer di-
rectement la LPE sur l’image originale. Soulignons que les lignes de séparation entre les
différentes cellules présentent de fortes irrégularités locales d’intensité.
A chaque cellule est associé un et un seul marqueur connexe localisant très approxi-
mativement les régions à extraire (nous avons obtenus ces marqueurs “à la main” en les
choisissant parmi les minima régionaux de l’image). La LPE est calculée directement sur
l’image originale. Nous constatons que certaines cellules sont mal segmentées.
Pour améliorer la segmentation dans ce cas, on peut agir sur deux points : les mar-
queurs et l’image sur laquelle la LPE est calculée (image originale dans notre exemple,
image gradient le plus souvent).
5.1. Introduction : la segmentation par LPE 127
f f f
marqueur
marqueurs LPE etendu
LPE LPE
g g g
Figure 5.7: Influence des marqueurs sur la segmentation : la présence de bruit de forte
amplitude par exemple peut modifier la segmentation (figure centrale) ; une solution peut
alors consister à utiliser des marqueurs plus précis des régions d’intérêt (figure de droite).
Irregularite locale
LPE
Contour
marqueurs marqueurs
Figure 5.9: Influence de la qualité du gradient sur la segmentation : une irrégularité locale
peut modifier notablement la position de la LPE.
Figure 5.10: Correction de l’image par une fermeture morphologique puis segmentation
(résultat à comparer à la figure 5.8).
”bouchées”. L’érosion quant à elle est utilisée pour compenser l’étalement des valeurs
hautes engendré par la dilatation. Or, lorsque deux lignes crêtes du gradient sont suff-
isamment proches, la dilatation peut fusionner ces lignes de crêtes. Dans ce cas, l’érosion
ne joue pas son rôle correctif (les lignes de crête proches restent jointes) et on perd défini-
tivement l’information fine des contours.
Ainsi, on peut dire que les bonnes priopriétés de la fermeture sont dues à la dilatation
et que ses inconvénients sont dus à l’érosion qui ne joue pas correctement son rôle dans
certaines configurations.
Pour remédier à cela, une solution peut consister à remplacer l’érosion par une moyenne
entre l’image originale et l’image dilatée : on calcule 12 (f + δ1 (f )). Ainsi, l’étalement des
niveaux de gris qui résulte de la dilatation est corrigé sans que les profils en niveaux de
gris entre les lignes de crête soient radicalement modifiés.
Cette opération doit être itérée un nombre de fois égal à la taille des irrégularités
locales. Ainsi, si une fermeture de taille n est nécessaire, le processus de dilatation/addition
sera itéré n fois ; on calcule :
1
(δ(i−1) (f ) + δi (f )) pour 1 ≤ i ≤ n avec δ0 (f ) = f
2
Dilatation
(dilate + original) / 2
Original
Observons sur notre exemple comment cette correction agit sur le résultat obtenu par
LPE (voir figure 5.11). L’image gradient corrigée semble visuellement meilleure bien que
le signal soit encore très altéré par cette transformation. Notamment, comme dans le cas
de la fermeture, le bruit local est amplifié : cela se traduit sur notre exemple par une
dégradation notable du contour des cellules les plus denses.
130 Chapitre 5. Application à la segmentation d’image
LPE
Portion de
contour
Point triple
Figure 5.12: On utilise la sur-segmentation pour effectuer une correction locale du gradient
Cette idée a été émise et utilisée pour la première fois par S. Beucher notamment pour
introduire un processus de segmentation hiérarchique de l’image et résoudre le problème de
la sur-segmentation des images [2] : après avoir calculé une première segmentation (lLPE
associée à tous les minima de l’image gradient), on calcule l’image mosaı̈que associée (on
associe à chaque bassin versant, un niveau de gris égal au niveau de gris moyen de l’image
originale sur cette région), puis une nouvelle segmentation est calculée sur le gradient
de l’image mosaı̈que et ainsi de suite... On construit ainsi un processus de fusion de
régions : deux régions fusionnent lorsque leur niveau de gris moyen est proche. Notons à
ce propos que d’autres critères de fusion peuvent être utilisés [14, 48]. Le recours à une
image mosaı̈que s’avère être souvent une bonne solution lorsque la LPE est calculée sur
une image gradient et que l’on cherche à extraire des régions aux contours localement mal
définis. En effet, on prend ainsi en compte non plus les valeurs locales du gradient sous
la fonction numérique mais les différences entre les “contrastes moyens” de deux régions
voisines. Par contre, cette méthode utilise à la fois l’information de l’image originale et
celle du gradient. Dans notre exemple notamment, la LPE est calculée directement sur
l’image originale et cette méthode n’est donc pas utilisable.
5.1. Introduction : la segmentation par LPE 131
Figure 5.13: Correction du gradient par des moyennes locales sous les portions de LPE
Notre but ici est de renforcer les niveaux de gris le long des lignes de crête de l’image
sans utiliser d’autre connaissance que celle relative à l’image étudiée. Nous considérons
pour cela chaque arc de contour extrait par une première segmentation de l’image : un
arc est défini comme l’ensemble des pixels situés entre deux points triples (points de la
LPE ayant 3 voisins sur la LPE pour la trame hexagonale) (voir figure 5.12).
On applique alors un processus correctif non plus sur toute l’image (comme précédem-
ment) mais uniquement sous chaque portion de LPE. On limite ainsi le risque d’altérer le
signal entre les lignes de crête de l’image comme cela se produisait pour les deux précé-
dentes méthodes.
On peut, à partir de ce principe, appliquer une fermeture ou toute autre transformation
susceptible de corriger correctement les irrégularités locales du gradient sous les contours
de la sur-segmentation. La figure 5.13 illustre le résultat obtenu en calculant des moyennes
locales.
2. Elimination des points triples de la LPE : chaque portion de LPE définit alors une
composante connexe.
5. On affecte à chaque point triple la plus grande valeur calculée sur les portions qui
lui sont adjacentes.
6. On prend le sup entre l’image originale et l’image des moyennes locales : ceci de telle
sorte que les irrégularités locales soient corrigées sans que, en dehors de ces points
sensibles, les niveaux de gris des lignes de crête ne soient modifiés.
132 Chapitre 5. Application à la segmentation d’image
Figure 5.14: Segmentation obtenue après correction de l’image par des moyennes locales
sous les portions de LPE (LPE obtenue par une première sur-segmentation de l’image)
Cette méthode peut être assimilée aux transformations géodésiques qui considèrent
une image sur laquelle elles s’appliquent et un masque géodésique délimitant la portion
de l’image allant être transformée. Ici, l’information directionnelle est bien prise en compte
puisque les portions de LPE suivent exactement les lignes de crête de l’image.
Nous donnons figure 5.14 la segmentation obtenue par cet algorithme de correction.
Cette fois-ci le résultat est correct. Des exemples d’utilisation de tels processus correctifs
pour la segmentation d’images complexes pourront également être trouvés dans [48].
• Il faut souligner également que cette méthode fonctionne si les irrégularités sont
seulement locales. En effet, il n’est pas possible, par ce biais, d’extrapoler l’information
de contour qui n’existe pas sur l’image gradient. Il faut dans ce cas avoir recours à
d’autres méthodes plus élaborées.
5.2. Extraction de marqueurs à l’aide des fonctions d’extinction 133
5.1.3 Conclusion
Dans cette première partie introductive, nous avons décrit les étapes clefs des algorithmes
de segmentation basés sur la LPE. Si cette technique a prouvée son efficacité à résoudre
des problèmes complexes de segmentation d’image, il n’en reste pas moins que la mise en
oeuvre des algorithmes de segmentation par LPE est bien souvent délicate.
D’une manière quelque peu simplificatrice, la LPE fonctionne bien si les contours des
régions à extraire sont clairement définis et si on marque correctement ces régions. Or,
la plupart du temps, ces conditions ne sont naturellement pas satisfaites. L’utilisateur
doit alors avoir recours à un certains nombre de transformations d’image pour orienter
convenablement le comportement de l’algorithme de segmentation qu’il construit.
Le point central de tout algorithme de segmentation par LPE est certainement l’extraction
de marqueurs des régions à segmenter. Tout-à-fait volontairement, la question de la réso-
lution de ce problème n’a pas été réellement abordée dans cette section : elle est au centre
de nos préoccupations dans les sections suivantes de ce chapitre.
Nous avons vu l’importance du rôle des marqueurs dans les algorithmes de segmentation.
C’est par leur intermédiaire qu’on répond à la question : qu’est-ce qu’on cherche à seg-
menter ? La question de la segmentation proprement dite des régions choisies relève ensuite
d’un processus entièrement automatique : le calcul de la LPE associée aux marqueurs.
Pour résoudre ce problème , on dispose généralement d’informations a priori permet-
tant de caractériser les régions recherchées : selon leur taille, leur forme, leur contraste,
des caractéristiques relatives à leur contour... Extraire des marqueurs des régions d’intérêt
dans l’image consiste alors à traduire sous forme algorithmique l’ensemble de ces infor-
mations.
Il serait fastidieux voire même impossible d’énumérer l’ensemble des méthodes qu’il est
possible d’utiliser pour mener à bien cette étape d’extraction de marqueurs : chaque prob-
lème de segmentation d’image nécessite la plupart du temps l’élaboration d’une technique
spécifique.
On peut cependant distinguer une approche “type” très souvent utilisée : elle consiste
à filtrer l’image originale (ou l’image gradient) puis à extraire les extrema (les minima,
les maxima ou les deux) de l’image filtrée. Ce sont les connaissances a priori qu’on a
des régions recherchées qui décident du choix du (ou des) filtre(s) à utiliser. La mise
au point d’une telle procédure est bien souvent délicate et s’effectue généralement par
tâtonnements...
134 Chapitre 5. Application à la segmentation d’image
Les fonctions d’extinction que nous avons introduites présentent trois grands atouts
par rapport aux approches “classiques” :
• Tout d’abord elles sont explicites, ce qui facilite la transcription du “cahier des
charges” en langage machine : les valeurs d’extinction surfaciques par exemple per-
mettent d’extraire la taille des régions de l’image, la dynamique calculée sur l’image
originale correspond à une mesure du contraste des régions de l’image, la dynamique
calculée sur l’image gradient correspond à une mesure de la force et de la régularité
des contours des régions de l’image ...
• Une fois le (ou les) critères à prendre en compte choisi(s), le problème de l’extraction
de marqueurs des régions de l’image satisfaisant ce(s) critère(s) ne consiste plus qu’en
un simple seuillage de la (ou des) fonction(s) d’extinction correspondante(s).
• Enfin, la rapidité des algorithmes de calcul des fonctions d’extinction rend leur
utilisation conviviale.
Figure 5.15: Exemple “Muscle” : segmentation des 20 régions les plus significatives de
l’image en termes de surface (image de gauche) ou de dynamique (image de droite)
La dynamique, par contre, n’est pas bien adaptée à ce problème : elle ne permet
d’extraire que les cellules aux contours forts et uniformes ; on extrait, en outre, de très
petites régions non significatives.
D’une manière générale, on constate que les valeurs d’extinction surfaciques sont moins
sensibles aux irrégularités locales des contours que la dynamique (voir figure 5.16).
LPE LPE
M M
Surf(M)=S Surf(M)=S
Dyn(M)=d Dyn(M)<d
N N
marqueurs marqueurs
Figure 5.17: Exemple “Aer” : segmentation des régions de l’image de surface supérieure
ou égale à 4000 puis à 6000 pixels
La pertinence d’une région est définie par la perception visuelle qu’on en a : une large
région même peu contrastée doit être préservée. Une petite région fortement contrastée
doit l’être également car l’oeil la perçoit tout aussi bien... L’outil le mieux adapté à
l’ensemble de ces contraintes est a priori la fonction d’extinction volumique qui considère
simultanément l’information de taille et de contraste.
Les fonctions d’extinction sont calculées sur le gradient : ainsi les structures sombres
et claires sont traitées de manière non indépendantes. Pour que la dynamique et les
valeurs d’extinction volumiques tiennent compte du “contraste” relatif entre les régions
de l’image, nous construisons l’image gradient de la façon suivante : dans un premier
temps une première sur-segmentation est calculée à partir de l’ensemble des minima du
gradient morphologique (voir section B.2.1) de l’image originale. Le gradient que nous
utilisons est défini comme le gradient morphologique de la mosaı̈que associée à cette sur-
segmentation (voir figure 5.18). Ainsi, les niveaux de gris sous une portion de contour
correspondent à la différence de contraste moyen entre les régions adjacentes [2]. Cette
opération a également pour conséquence de réduire le nombre de minima à traiter.
Image originale
Gradient de l’image originale Image mosaique (1345 regions) Gradient de l’image mosaique
Figure 5.19: Exemple “Lena” : segmentation des 100 régions les plus significatives en
termes de volume (à gauche), de surface (au centre), de dynamique (à droite). Les valeurs
d’extinction ont été calculées sur le gradient de l’image mosaı̈que.
Figure 5.20: Exemple “Aer” : segmentation des régions fortement contrastées de l’image
en utilisant la dynamique des extrema de l’image originale ou leur dynamique symétrique
cas de la dynamique, les contours extraits ne correspondent pas aux contours des champs
mais à ceux de sur-densités locales ou bien à du bruit.
Ce comportement est tout-à-fait caractéristique de la dynamique et de la dynamique
symétrique. Nous le schématisons figure 5.21. Nous avons représenté une région fortement
contrastée, bruitée et aux contours “incertains”. Le bruit local de forte amplitude corre-
spond à des pics étroits de haute intensité donc de forte dynamique. Lorsqu’on extrait un
marqueur de la région en utilisant la dynamique ou la dynamique symétrique des extrema
de l’image, alors ce marqueur pointe justement sur cette sur-densité locale qui n’est pas
réellement significative. Dans de telles configurations, la LPE ne permet pas d’extraire
les contours recherchés. C’est pour cette raison d’ailleurs que la dynamique est souvent
associée à un pré-filtrage spatial de l’image de telle sorte à éliminer l’influence du bruit
sur le résultat.
M M Extrema de forte
dynamique
N N
dyn(M)
Contours extraits
Figure 5.21: Extraction des marqueurs des régions de fort contraste par sélection des
extrema de forte dynamique ou de forte dynamique symétrique : les marqueurs peuvent
être localisés sur des pics de forte amplitude non significatifs.
140 Chapitre 5. Application à la segmentation d’image
Par contre, les marqueurs extraits par ces deux méthodes diffèrent : par seuillage de
la fonction d’extinction on extrait des marqueurs locaux (ce sont des extrema de l’image
originale) ; par le filtrage, on extrait des marqueurs étendus (les filtres utilisés pour définir
les fonction d’extinction sont connexes : ils ont pour propriété caractéristique de propager
et de fusionner les plateaux de l’image d’entrée).
Comparons les segmentations déduites de ces deux approches sur l’exemple de la
dynamique symétrique (voir figure 5.22). La segmentation calculée à partir des extrema
de l’image originale de dynamique symétrique supérieure à 80 est comparée à celle dérivée
N N
Figure 5.23: Les extrema de forte dynamique pointent sur des sur-densités locales
Nous allons utiliser cette information pour approcher au plus près la segmentation
déduite par filtrage sans qu’il soit nécessaire d’effectuer l’opération de filtrage en elle-
même.
Soit s le niveau choisi pour seuiller la fonction d’extinction. Nous considérons donc tous
les extrema de valeur d’extinction supérieure à s. A chacun de ces extrema correspond un
et un seul extremum étendu de l’image filtrée ψs (f ) .
Dans une première étape, les branches de l’arbre valués avec une valeur strictement
supérieure à s sont coupées. On définit ainsi plusieurs petits arbres dont le point commun
est le suivant : si l’on considère les noeuds d’un sous-arbre donné, ceux-ci sont tous inclus
dans un même plateau de l’image filtrée de taille s. Il ne reste plus alors qu’à sélectionner
ceux inclus dans un extremum de l’image filtrée de taille s. Il suffit pour cela de ne retenir,
parmi l’ensemble des petits arbres, que ceux dont le sommet a une valeur d’extinction
supérieure ou égale à s (voir figure 5.24).
On obtient ainsi un ensemble de marqueurs non connexes qui vérifie : à chaque mar-
queur correspond un et un seul extremum de l’image filtrée de taille s ; chaque marqueur
est entièrement inclus dans un extremum de l’image filtrée ψs (f ).
M Arbre de fusion M Petits arbres des extr.
4 des extrema 4 de dyn. sym. > 5
5 5
1 1
1 1
9 9
2 7 2 7
L L
11 N 11 N
M Marqueurs
non connexes
Extrema de
l’image filtree
Figure 5.24: Extraction de marqueurs à partir de l’arbre dynamique de fusion des extrema
de l’image (arbre déduit du calcul de la dynamique symétrique). Si s est le seuil en
dynamique choisi, on élague les branches de l’arbre de valeur strictement supérieure à s :
on obtient plusieurs petits arbres. On ne retient que les arbres dont le sommet a une valeur
d’extinction supérieure à s. On aboutit ainsi à un ensemble de marqueurs non connexes
proche de l’ensemble des extrema de l’image filtrée (par le filtre équivalent de taille s).
5.2. Extraction de marqueurs à l’aide des fonctions d’extinction 143
Cette méthode permet d’obtenir des marqueurs plus précis des régions à segmenter que
celle qui consiste juste à sélectionner les extrema de l’image. Mais elle ne permet pas de
retrouver exactement les extrema étendus extraits de l’image filtrée. Cependant, comme
la plupart des images réelles sont bruitées, et que, de ce fait, le nombre d’extrema traités
est élevé, on est sûr que la différence entre les extrema étendus de l’image filtrée et les
marqueur non-connexes ainsi extraits est faible (les petits arbres extraits sont “touffus”).
Nous rappelons que le calcul de la ligne de partage des eaux à partir de marqueurs non
connexes relève du même processus que celui utilisé dans le cas de marqueurs connexes :
pour un marqueur donné (auquel on a associé un label), chacune de ses composantes
connexes donne naissance à un lac, mais les lacs ainsi produit ont même label ; de ce fait,
leur rencontre ne produit pas d’arc de LPE.
Nous donnons figure 5.25 la segmentation obtenue par cette méthode sur l’image “Aer”
: le résultat est très proche de celui dérivé du calcul des h-reconstructions alternées séquen-
tielles (comparaison avec la figure 5.22). Nous avons vu que les opérateurs connexes éten-
dent les zones plates de l’image d’entrée ce qui se traduit au niveau du gradient par un
emboı̂tement des zones de gradient nul. En fait, la démarche réalisée ici à partir de l’arbre
de fusion des extrema revient à imposer ces règles d’emboı̂tement aux zones de gradient
nul.
Figure 5.25: Exemple “Aer” : extraction de marqueurs précis en utilisant l’arbre dy-
namique de fusion des extrema de l’image
Nous avons illustré ce processus dans le cas de la dynamique symétrique (voir fig-
ure 5.25). Tout ce que nous venons de dire vaut également pour les valeurs d’extinction
non symétriques. Cependant, l’arbre dérivé de la dynamique ou des valeurs d’extinction
surfaciques et volumiques (non symétriques) lie soit les maxima soit les minima de l’image
mais pas les deux, ce qui constitue un fort handicap dans de nombreux cas : lorsqu’il est
nécessaire de considérer simultanément les structures claires et sombres de l’image et que
le recours à l’étude de l’image gradient n’est pas envisageable.
144 Chapitre 5. Application à la segmentation d’image
5.2.4 Discussion
Une procédure classique dans les algorithmes de segmentation pour l’extraction de mar-
queurs consiste à filtrer l’image puis à considérer les extrema de l’image filtrée. Choisir le
“bon” filtre et la “bonne ” taille du filtre est généralement une étape laborieuse dans les
algorithmes de segmentation : en effet, il faut généralement itérer le processus en adaptant
petit-à-petit les paramètres ... jusqu’à temps que les résultats escomptés soient atteints.
Figure 5.26: Apport des fonctions d’extinction pour la mise au point des algorithmes de
segmentation par LPE
LPE LPE
FUSION
Mi Mi
M0
Parmi tous les Mj satisfaisant les conditions 5.2 et 5.3, on choisit celui tel que :
Ces relations expriment que la connaissance des zones d’influence au niveau 0 et des
relations de fusion entre les marqueurs (définies par les relations 5.2, 5.4 et 5.3) suffit
pour déduire l’ensemble des zones d’influence pour tous les niveaux hiérarchiques.
ZI0 (A) ZI0 (B) ZI0 (C) ZI0 (D) ZI0 (E) ZI1 (A) ZI1 (B) ZI1 (D) ZI1 (E) ZI2 (A) ZI2 (B) ZI2 (E)
D(2) D(2)
B(5) B(5) B(5)
C(1)
Nous allons montrer maintenant comment extraire l’information décrite par ces trois
relations, lors du calcul de la segmentation de niveau 0 (lors du calcul des zones d’influence
de niveau 0). Nous allons voir que l’on est amené à construire un arbre de fusion des
marqueurs Mi .
5.3. Segmentation hiérarchique interactive 147
ZI0 (A) ZI0 (B) ZI0 (C) ZI0 (D) ZI0 (E) ZI0 (A) ZI0 (B) ZI0 (C) ZI0 (D) ZI0 (E)
D(2) D(2)
B(5) B(5)
C(1) C(1)
la zone d’influence (de niveau h = ν(E)) associée à B. Une nouvelle branche de l’arbre
est donc construite : [E → B]
La construction de l’arbre est effectué lors du calcul des zones d’infuence (de niveau
0) associées aux marqueurs ce qui permet de tout faire en une seule “passe”. En effet,
nous avons vu que les zones d’influence au niveau hiérarchique h se déduisent de celles
de niveau 0. Pour produire l’image des zones d’influence au niveau hiérarchique h (image
sur laquelle les pixels appartenant à ZIh (Mi ) ont comme niveau de gris le label de Mi ),
il suffit de suivre la procédure suivante :
• Lecture de l’image des zones d’influence (avec leurs labels) au niveau hiérarchique
0 : les ZI0 (Mi ).
Quelques remarques :
LPE LPE
Mj
Mi Deplacement d’arcs de LPE.
M0
Figure 5.30: L’élimination d’un marqueur peut provoquer le déplacement d’un (ou
plusieurs) arc(s) de LPE
Dans ce cas, la condition 5.4 n’a plus d’effet sur le choix de Mi et l’ensemble des
trois relations 5.2, 5.4 et 5.3 ne suffit pas à assurer l’unicité de Mi : deux régions
voisines envahissent en même temps une région sans marqueur (celle anciennement
associée à M0 ) qui est scindée en deux.
5.3. Segmentation hiérarchique interactive 149
LPE
Mj
Mi
M0 Zones d’influence deduites de l’arbre des minima
Figure 5.31: L’arbre de fusion des minima fournit naturellement une solution aux config-
urations pathologiques
Enfin, nous pouvons comparer l’information contenue par l’arbre de fusion orienté à
celle contenue dans une structure de représentation non orientée. Nous illustrons notre
propos par la figure 5.32.
Nous reprenons l’arbre non orienté classiquement utilisé (celui que nous avons déjà
présenté au chapitre précédent). Cet arbre traduit comment les composantes connexes
des seuils successifs d’une image fusionnent lorsqu’on augmente progressivement le niveau
de seuillage de l’image.
Nous avons défini le processus de segmentation de segmentation hiérarchique à partir
de valeurs hiérarchiques νi quelconques. De ce fait, l’arbre de fusion non orienté permet
de savoir à quel niveau un arc de LPE est éliminé ; mais il ne permet pas de connaı̂tre
comment les régions fusionnent entre elles.
Lorsqu’on ne s’intéresse qu’aux arcs de LPE (comme nous allons le voir dans le para-
graphe suivant), l’arbre de fusion non orienté contient suffisamment d’information et peut
donc être utilisé. Par contre, nous donnerons un autre exemple d’utilisation pour lequel
l’arbre non-orienté ne convient plus et pour lequel l’arbre orienté devra être utilisé.
Segmentation initiale
B Marqueurs
et
Niveaux hierarchiques
200
10 A
C 100 A(1) B(2) C(3)
200
200 200
B B
10 200 10 200
Marqueurs : B et C Marqueurs : C
C C
dendrone
200 Segmentation de niveau 2 : A est elimine
B
10 200 dendrone arbre de fusion
B C A B A
100 A C
arbre de fusion B C A
C
B A A est asborbe par B ou C ? A est absorbe par C
C
A(1) B(2) C(3)
Figure 5.32: Les arbres non-orientés contiennent moins d’information que les arbres de
fusion orientés : ils permettent de mémoriser à quel niveau un arc de LPE est éliminé,
mais ils ne permettent pas de mémoriser pas comment les régions fusionnent entre elles
5.3. Segmentation hiérarchique interactive 151
Altitude des points col sous chaque arc de LPE Segmentation de niveau 2
Figure 5.33: Valuation des arcs de LPE à partir de l’arbre des minima
Nous supposerons que les noeuds de l’arbre ont été préalablement étiquetés : on associe
à chaque noeud terminal (correspondant à un marqueur) sa valeur hérarchique νi ; on
associe à un noeud non terminal le sup des valeurs associées à ces “fils” : voir figure 5.33.
Nous considérons la segmentation de niveau 0 (effectuée à partir de tous les marqueurs)
et nous nous plaçons en un point de LPE (P ), point séparant deux zones d’influence de
labels différents : P ∈ Arc(Mi , Mj ). Notre but est de valuer chaque arc Arc(Mi , Mj ) avec
le niveau hiérarchique h maximal tel que cet arc persiste dans la segmentation de niveau
h. L’arc Arc(Mi , Mj ) persiste tant que les régions associées à Mi et Mj n’ont pas fusionné.
La valuation de cet arc est donc obtenue en cherchant le premier ascendant commun de
Mi et Mj dans l’arbre. Ce noeud admet deux fils. On associe à l’arc Arc(Mi , Mj ), le min
des valeur hiérarchiques associées à ces deux fils.
Sur l’exemple de la figure 5.33, on cherche à déterminer le niveau hiérarchique max-
imal h tel que l’arc de LPE séparant A et C persiste dans la segmentation de niveau h.
152 Chapitre 5. Application à la segmentation d’image
L’image des arcs ainsi valués contient toute l’information qu’on peut obtenir en seuillant
l’image des marqueurs valués au niveau h puis en calculant la LPE associée à cet ensemble
de marqueurs et ceci pour des valeurs croissantes de h (voir figure 5.34). On obtient alors
la segmentation associée à l’ensemble {Mi , ν(Mi ) ≥ h} par un simple seuillage de l’image
des arcs valués au niveau h (voir figure 5.34).
Segmentation de niveau h = 15
A 15 B A B
3 C 10
15 10
D 10
15 15
E
15 5
8 F
G
Figure 5.34: Valuation des arcs de LPE en utilisant l’arbre non orienté des minima : on
obtient la segmentation de niveau h par un simple seuillage de l’image des arcs valués
Il n’y a absolument aucune relation entre les valeurs associées par cette méthode
aux arcs de LPE et les valeurs de l’image sous ces arcs ; excepté dans le cas particulier
où l’image étudiée est une image gradient et où les valeurs ν(Mi ) correspondent à la
dynamique des minima du gradient : dans ce cas, en effet, les valeurs de dynamique
correspondent aux niveaux de gris de certains points col sous les arcs de LPE (si les
minima du gradient ont tous une altitude nulle), et les valuations déduites pour les arcs
sont liées aux niveaux de gris de l’image. La segmentation hiérarchique déduite de la
dynamique des minima calculée sur le gradient est en fait équivalente à celle que l’on
obtiendrait par un seuillage progressif du gradient (voir figure 5.35).
Nous donnons figure 5.36 des exemples obtenus dans le cas où les valeurs ν(Mi ) cor-
respondent : à la dynamique des extrema de l’image originale, à la fonction d’extinction
surfacique des minima du gradient et à la fonction d’extinction volumique des minima du
gradient. Nous avons préalablement imposé les extrema de l’image originale comme seuls
minima du gradient.
5.3. Segmentation hiérarchique interactive 153
100 80
A 50 B A B
C C
30
10 10 30
D D 10 10
100 80
100 E 80 80 100 E
150 80
F 50 F
50
G G
Dyn(F)=10 Dyn(C)=10 Dyn(D)=30 Dyn(G)=50 Dyn(A)=80 Dyn(B) = 100 Dyn(E) > 100
Figure 5.36: Exemple “Pepper” : valuation des arcs de LPE selon, de gauche à droite, le
contraste, la surface et le volume des régions de l’image
Récapitulation :
Les notions de fonctions d’extinction et d’arbres de fusion des minima définissent des
algorithmes de segmentation dont la mise au point s’effectue très simplement, selon les
étapes suivantes (voir figure 5.37) :
1. Utilisation des connaissances a priori (quelles régions cherche-t-on à extraire ?) :
• Choix de la (ou des) fonction(s) d’extinction (dynamique, surfacique, volu-
mique) calculée(s) sur l’image originale ou sur l’image gradient.
• Les valeurs hiérarchiques associées aux marqueurs (les ν(Mi ) peuvent être
définies comme des combinaisons de plusieurs fonctions d’extinction (exem-
ple : combinaison de la surface calculée sur l’image gradient et de la dynamique
calculée sur l’image originale).
Cette étape nécessite une ou deux inondations de l’image (selon que l’on calcule les
fonctions d’extinction sur l’image originale ou sur l’image gradient ou bien sur les
deux).
2. Calcul de la segmentation initiale (à partir de tous les marqueurs) et construction
de l’arbre de fusion des marqueurs : une unique inondation de l’image est nécessaire.
3. Valuation des arcs de LPE en utilisant l’arbre de fusion des minima : une seule
lecture de l’image de la segmentation de niveau 0 est nécessaire.
5.3. Segmentation hiérarchique interactive 155
4. Choix du niveau de seuillage des valeurs hiérarchiques associées aux régions sur
l’image des arcs de LPE valués pour obtenir la segmentation recherchée (segmenta-
tion interactive).
Or, les zones d’influence de niveau h se déduisent de celles de niveau 0. Il est donc
possible de calculer très efficacement la fonction err(h) en utilisant l’arbre de fusion des
minima. Remarquons que, pour cette application, il faut utiliser l’arbre de fusion orienté
des minima. En effet, nous avons vu que la structure non orientée est moins riche que
la structure orientée : elle permet de mémoriser quand mais pas comment les régions
fusionnent entre elles (voir figure 5.32). Nous utilisons donc ici l’arbre orienté de fusion
des minima. Nous rappelons que [M −→ M ′ ] signifie que ZIh−1 (M) est absorbée par
ZIh−1 (M ′ ) au niveau h = ν(M) + 1 (M ′ est le premier ascendant de M).
Nous supposons dans tout ce qui suit que les valeurs ν(Mi ) associées aux marqueurs
sont toutes distinctes. Cette restriction ne pose a priori pas de problème : on peut toujours,
de manière simple, se ramener à ce cas (il suffit, dans le cas où deux marqueurs ont même
niveau hiérarchique, d’attribuer, à l’un des deux, la valeur immédiatement supérieure et
d’incrémenter d’autant les valeurs hiérarchiques plus grandes).
A chaque marqueur est associé un label. Dans tout ce qui suit, nous supposerons, pour
simplifier, que Mi a pour label i. N désignera le nombre de marqueurs (1 ≤ i ≤ N).
Nous utilisons une table de correspondance T ab[h] permettant de connaı̂tre, pour
chaque niveau hiérarchique, le marqueur qui va être éliminé :
T ab[h] = i si ν(Mi ) = h
5.3. Segmentation hiérarchique interactive 157
• Lecture de l’image originale et de l’image des zones d’influence (avec leurs labels) de
niveau hiérarchique 0 (les ZI0 (Mj )). Pour chaque pixel x, faire :
• Calcul des moyennes de l’image sur chaque zone d’influence de niveau (h+1) :
(
Moy[h + 1][i] = Som[i] / Surf [i] si ν(Mi ) ≥ h + 1
∀i, 1 ≤ i ≤ N,
0 sinon
Moy[h][i] = Moy[h][asc]
Figure 5.38: Erreur entre l’image originale et l’image mosaı̈que selon le critère de sélection
choisi et selon le nombre de régions considérées
Figure 5.39: Images mosaı̈ques obtenues en sélectionnant les 80 régions les plus significa-
tives en termes de contraste (à gauche), de taille (au centre) et de volume (à droite)
5.4. Conclusion 159
5.4 Conclusion
La notion de fonction d’extinction permet de généraliser l’approche utilisée dans le cas de
la dynamique pour sélectionner les extrema significatifs d’une image dans les algorithmes
de segmentation ; en ce sens, elles correspondent à un outil important lorsque la surface
ou le volume des régions doit être pris en compte.
Nous avons vu que le grand intérêt de la notion de fonction d’extinction par rap-
port aux méthodes basées sur l’utilisation de filtrage est de rendre plus aisée et plus
rapide la mise au point des algorithmes de segmentation. Du point de vue de l’utilisateur,
c’est-à-dire de celui qui se trouve confronté au problème de segmentation, cela représente
certainement un progrès important. En effet, plus le test d’une méthode s’effectue de
manière simple et efficace, plus l’utilisateur a la possiblité de tester un nombre important
d’approches différentes et plus il a de chance d’atteindre le résultat qu’il recherche.
Enfin, nous avons vu que les fonctions d’extinction ouvrent la voie à des algorithmes
de segmentation interactifs. De tels outils sont très intéressants, notamment pour la créa-
tion de logiciels évolués de traitement d’image dédiés à des utilisateurs non spécialistes.
L’utilisateur entre son cahier des charges : segmentation des régions de fort contraste, de
grande taille, de faible volume... Ensuite, son travail consiste simplement à sélectionner,
par seuillage de l’image des arcs de LPE valués, la segmentation qu’il juge correcte...
160 Chapitre 5. Application à la segmentation d’image
Chapitre 6
Application à la détection
automatique des opacités du sein
L’analyse d’image est une science appliquée, développée pour résoudre des problèmes de
vision. A l’intérieur des domaines privilégiés de l’analyse d’image, la morphologie mathé-
matique a pris une part tout à fait originale, grâce à son approche aussi bien pragmatique
que théoriquement bien fondée. C’est sans doute grâce à la symbiose entre une rigueur
mathématique féconde et une volonté d’appliquer ses principes à des vrais problèmes que
la morphologie mathématique a connu le succès qu’elle mérite, auprès, en particulier, des
industriels.
Nous présentons ici l’application qui fut le cadre de notre travail. L’analyse automa-
tique des images mammographiques est un problème qui n’a été abordé qu’assez récem-
ment (puisque les premières recherches dans ce domaine ont moins de dix ans) et qui
vient en parallèle avec un travail de développement de techniques de mammographies
numériques. Ce domaine de recherche est aujourd’hui en plein essor.
Cette application fait largement appel aux notions que nous avons présentées dans
cette thèse (ainsi qu’à d’autres notions plus classiques de la morphologie mathématique).
Nous avons indiqué, dans la mesure du possible, la démarche générale adoptée sans
toutefois entrer dans les détails. Pour des raisons de confidentialité industrielle, nous
ne décrirons pas nos algorithmes.
6.1 Introduction
Le cancer du sein constitue la première cause de mortalité chez les femmes agées de 35 à 50
ans. En France, le nombre de décès annuels dus à cette maladie est évalué à 9000. En outre,
on recence 26000 nouveaux cas de maladie par an, ce qui permet de dire qu’une française
sur 12 ou 13 sera un jour touché par la maladie. Ces chiffres ne sont pas spécifiques à
la France. Dans toutes les sociétés industralisées, à l’exception du Japon, l’incidence du
cancer du sein est devenue très importante.
Plus la maladie est détectée à un stade précoce, plus les chances de guérison sont
grandes. Un dépistage systématique des maladies du sein constitue donc une étape im-
portante de la chaı̂ne de traitement des maladies du sein.
161
162 Chapitre 6. Application à la détection automatique des opacités du sein
La glande mammaire
Le sein est composé de trois entités anatomiques : la peau, la glande mammaire et les
tissus adipeux sous-cutanés et rétromammaire.
La glande mammaire est encore appelée matrice conjonctivo-graisseuse. Le tissu con-
jonctif qui en assure le soutien est perforé en tout sens tel une éponge. A l’intérieur de la
matrice conjonctive se développent les systèmes vasculaire, lymphatique et glandulaire.
Le système glandulaire, à fonction de lactation, se compose de lobules (qui sécrètent le
lait en période de lactation) s’ouvrant sur des canaux galactophoriques (qui drainent le
lait vers le mamelon). Comme tous les organes creux, l’ensemble du système excréteur
(lobules et canaux galactophoriques) est tapissé de tissu épithélial.
Le cancer du sein
La définition d’une normalité de la glande mammaire se heurte à plusieurs difficultés
d’ordre théorique et histophysiologique. Tout au long de la vie génitale, la glande mam-
maire va subir de perpétuels remaniements sous les influences hormonales et auxquels
des modifications cellulaires sont liées. Certaines évolutions sont irréversibles (celles ap-
paraissant à la puberté ou à la ménaupause), d’autres sont temporaires (pendant le cycle
menstruel, la grossesse ou l’allaitement).
Une très grande majorité des cancers du sein se développent à partir du tissu ép-
ithélial. Ils correspondent à un développement anarchique des cellules composant ce tissu.
Les tumeurs malignes développées à partir du tissu conjonctif sont beaucoup plus rares.
Lorsque les cellules malignes restent localisées dans le système excréteur, on parle de
cancer in situ, qui se situe à la frontière du processus cancéreux et dont l’évolution est
impossible à prédire. Lorsque les cellules malignes envahissent le tissu conjonctif voisin,
on parle alors de cancer invasif.
Le taux de gravité d’un cancer est très fortement lié à la dissémination métastasique. Si
les cellules malignes restent localisées, la chirurgie ou la radiothérapie permettent d’obtenir
des taux de guérison élevés. Dans le cas contraire, le taux de mortalité est plus important
et les traitements plus agressifs. Une tumeur devient généralement cliniquement décelable
après plus plus de dix ans et la dissémination métastasique, rapide dans le cas du cancer du
sein, peut intervenir avant que la tumeur ait atteint ce seuil de détectabilité. Cependant,
plus la tumeur est détectée précocement, plus la probalité d’apparition de métastases est
6.1. Introduction 163
faible et plus les chances de guérision sont grandes (le taux de survie se situe entre 90 et
98% pour une détection des tumeurs infracentimétriques).
Toutes les dégénérescences des tissus mammaires ne débouchent pas systématiquement
sur un processus cancéreux. Ainsi, 80% des nodules détectés cliniquement sont bénins.
Cependant un suivi particulier de leur évolution est nécessaire.
sur l’utilisation de la résonnance magnétique (IRM) qui se trouve toujours dans une phase
exploratoire.
En conclusion, le dépistage ainsi que le diagnostic du cancer du sein reposent actuelle-
ment sur l’examen clinique et la mammographie. L’ensemble des autres techniques étant
utilisées comme des techniques complémentaires d’aide au diagnostic [32].
Figure 6.1: Exemple d’image radiographique du sein (sein dense) : les tissus graisseux et
la matrice conjonctivo-fibreuse sont à l’opposé quant à l’absorption des rayons X
166 Chapitre 6. Application à la détection automatique des opacités du sein
ment lésions) rendent les images particulièrement complexes. De plus, les caractéristiques
de ces éléments (en taille, en intensité, en contraste, en forme...) peuvent varier de façon
radicale d’une image à l’autre.
Les exemples de la figure 6.2 illustrent ce point important (nous indiquons les signes
pathologiques correspondant au dépistage du radiologue par une flèche). Un oeil non ex-
pert différencie très difficilement les sur-densités anormales présentes sur les clichés ; leur
détection est d’autant plus difficile que la matrice conjonctivo-fibreuse est très dévelop-
pée (cas des seins denses ou mixtes, voir l’exemple “g029fg”). Ces exemples illustrent
également la grande variabilité de l’aspect de la glande mammaire : le cliché “g017fd”
correspond à un sein clair, le chiché “g029fg” à un sein mixte.
Les clichés sur lesquels nous avons travaillé ont été fournis par le Docteur Godschalk
(Paris). Ils ont été effectués sur des sénographes 600T de GE-CGR avec des couples
écran/film MinR/OrthoM1. Les images que nous présentons ont été obtenues par numéri-
sation des clichés radiographiques (précision 300 microns, taille des images 600 × 900 × 12
bits). Nous ne nous étendrons pas sur l’étape de numérisation. Ce qui importe, par contre,
c’est de disposer d’images de bonne qualité. Cela signifie que la radiographie effectuée par
le médecin doit être faite avec beaucoup de soin (bon calibrage du matétiel) et que le
numériseur utilisé ne doit pas introduire de distorsion trop importante sur les images.
Nous supposerons ces conditions satisfaites. (Signalons que la distribution des niveaux
de gris sur les images que nous présentons ici a été modifiée pour mettre en évidence les
régions d’intérêt dans la glande.)
Figure 6.2: Exemples “g017fd” (face sein droit) et “g029fg” (face sein gauche)
168 Chapitre 6. Application à la détection automatique des opacités du sein
MAMMOGRAMME NUMERIQUE
ANALYSE D’IMAGE
TRAITEMENTS PRELIMINAIRES
OPACITES
Figure 6.3: Les principales étapes de l’algorithme de détection des opacités du sein
Dans une première étape, nous nous proposons d’extraire de l’image la région correspon-
dant à la glande mammaire. A priori cette étape n’est pas indispensable. Un de ses intérêts
est de réduire la fenêtre de travail et donc de réduire les temps des traitements qui suivront.
Ce point n’est certainement pas négligeable pour l’utilisateur (c’est-à-dire le médecin) qui
doit pouvoir disposer du résultat founi par la machine relativement rapidement.
La glande mammaire est une des régions de plus grande taille sur le cliché radio-
graphique. L’algorithme de segmentation de la glande mammaire est donc basé sur l’utilisation
de la fonction d’extinction surfacique et de la LPE. Nous donnons les résultats obtenus
sur quelques exemples : figure 6.4. L’algorithme n’est sensible ni à la taille de la glande
mammaire, ni à la présence ou non d’informations parasites sur le cliché (la présence d’une
étiquette blanche par exemple ne modifie pas le comportement de l’algorithme).
Un des grands atouts de cet algorithme est d’être peu paramétrique. En effet, les
connaissances nécessaires pour initialiser le système sont : la taille minimale d’une glande
mammaire et le niveau de gris moyen de la glande sur la mammographie numérisée.
De plus, une estimation grossière de ces paramètres suffit pour que l’algorithme ait un
comportement correct ; lorsqu’on modifie les conditions de numérisation notamment, ces
paramètres n’ont pas à être réajustés. Cet algorithme a été testé sur une base d’une
centaine d’images. Dans chacun des cas, le résultat obtenu était satisfaisant.
170 Chapitre 6. Application à la détection automatique des opacités du sein
L’étape suivante consiste à extraire les régions d’intérêt dans la glande mammaire : les
sur-densités. Nous ne parlons pas encore de sur-densité anormale car cette distinction ne
sera effectuée que dans une étape suivante. Ici, notre but est de segmenter correctement
toutes les sur-densités présentes dans la glande mammaire, quelles soient pathologiques
ou non, et ceci quelque soit leur taille ou leur forme...
Sur les mammogrammes numérisés, une sur-densité correspond à une région à fort
contraste. Ce terme est assez peu précis mais tout à fait caractéristique de la réalité. En
effet, les sur-densités d’intérêt peuvent avoir sur le cliché un contraste d’une valeur très
faible ou très grande selon leur nature, la nature du sein (dense ou clair), leur position
dans l’espace... Malgré cela, le contraste (c’est-à-dire la dynamique) reste la caractéris-
tique la plus pertinente pour extraire ces sur-densités. Nous utilisons donc un algorithme
de segmentation basé sur la LPE ; les marqueurs des sur-densités sont obtenus en con-
sidérant les maxima de plus forte dynamique (dynamique calculée sur l’image originale).
Cet algorithme est donc très peu paramétrique : un seul seuil en contraste est nécessaire.
Ce seuil est fixé par le contraste minimal des sur-densités que le système doit détecter.
Nous indiquons les résultats obtenus sur les exemples précédents : figures 6.5, 6.6
et 6.7. Un des grands atouts de cet algorithme est de donner une segmentation correcte
pour toutes les régions recherchées de l’image : qu’elles soient de petite ou de grande taille,
de forme ronde (comme certaines opacités) ou allongée (comme les structures fibreuses),
de faible ou fort contraste, homogène ou non, aux contours bien définis ou incertains
(même si le résultat reste approximatif lorsqu’une partie de l’information relative au
contour manque). La bonne qualité de la segmentation obtenue ne peut que faciliter
l’étape suivante de notre algorithme : la sélection parmi les candidats segmentés des sur-
densités anormales (ou tout du moins suspectes).
Les exemples “g031pg” et “g029fg” illustrent le comportement de l’algorithme de seg-
mentation dans des cas particulièrement difficiles : les opacités sont enfouies dans la masse
fibreuse environnante ; une portion de leur contour manque. L’imprécision sur les contours
que l’on extrait est à la mesure de l’imprécision visuelle sur les contours de ces opacités.
On le voit sur ces exemples, on segmente un grand nombre de structures non pathologiques
(des structures fibreuses notamment) et ce nombre est d’autant plus important que le
sein est dense. Ceci est dû au fait que nous n’utilisons que l’information de contraste pour
sélectionner les régions devant être segmentées. Une autre solution aurait pu consister
à sélectionner plus sévèrement ces régions en introduisant des connaissances supplémen-
taires (prendre en compte la forme des régions, par exemple, peut permettre d’éliminer
les marqueurs des structures fibreuses). Nous avons préféré réaliser ce tri dans une étape
suivante, de manière à séparer très nettement les étapes de segmentation et de sélection.
Nous avons testé cet algorithme sur une base de 24 images. Dans tous les cas, les
sur-densités suspectes sont extraites et correctement segmentées (les contours ne sont mé-
diocres que dans des cas particulièrement difficiles). Enfin, le nombre de sur-densités non
suspectes extraites est fonction de la texture du sein (ce nombre peut être très important
pour les seins denses et est la plupart du temps très faible pour les seins clairs).
172 Chapitre 6. Application à la détection automatique des opacités du sein
Figure 6.8: Exemples “g017fd” et “g029fg” : sélection des opacités parmi les candidats
segmentés (à gauche : diagnostic du radiologue - à droite : résultat de l’algorithme de
détection automatique ; VP en noir et FP en blanc)
6.2. Processus de détection automatique des opacités du sein 177
Figure 6.9: Exemples “g031pg” et “g035pg” : sélection des opacités parmi les candidats
segmentés (à gauche : diagnostic du radiologue - à droite : résultat de l’algorithme de
détection automatique ; VP en noir et FP en blanc)
178 Chapitre 6. Application à la détection automatique des opacités du sein
Figure 6.10: Exemples “g054pg” et “g065fd” : sélection des opacités parmi les candidats
segmentés (à gauche : diagnostic du radiologue - à droite : résultat de l’algorithme de
détection automatique ; VP en noir et FP en blanc)
6.3. Résultats et conclusion 179
Bien évidemment, il s’agit, dans cette application, d’atteindre une haute sensibilité
sans que le nombre de faux positifs par image soit trop important. Ici, le nombre de
faux positifs par image est assez élevé et nécessite encore d’être diminué. De même, la
sensibilité devrait pourvoir être augmentée.
Notons qu’on ne doit accorder à ces résultats qu’une importance relative. En effet, pour
valider de tels algorithmes, il est nécessaire d’utiliser une base entièrement différente de la
base d’apprentissage, ce qui n’est pas le cas ici. Une étape importante dans notre travail
consiste à tester notre algorithme sur un nombre beaucoup plus important d’images. Ceci
est actuellement en cours de réalisation. Néammoins ces résultats sont très encourageants
et prouvent clairement la faisabilité de la résolution de notre problème.
L’étude menée pour la détection automatique des opacités du sein n’a pas encore
atteint son point final. Cependant, des étapes importantes ont été franchies dans ce do-
maine jusqu’ici inexploré. Tout d’abord, cette étude a permis de montrer la faisabilité
de l’application. Ensuite, les résultats obtenus pour la partie segmentation, qui est plus
spécifiquement du domaine de l’analyse d’image, sont très encourageants même si certains
perfectionnements doivent encore être apportés, notamment pour diminuer la sensibilité
de l’algorithme vis à vis des conditions de radiographie et de numérisation (en ce qui
concerne la segmentation de la glande mammaire, les résultats obtenus sont satisfaisants
pour toutes les images, c’est-à-dire que cette partie de l’algorithme est complètement
opérationnelle). Aujourd’hui, l’effort doit principalement porter sur la partie décisionnelle
de l’algorithme, c’est-à-dire sur la mise en oeuvre d’un système de décision évolué per-
mettant d’atteindre une meilleure sensibilité et de diminuer le nombre de faux positifs
par image. Si l’on dispose aujourd’hui globalement des bons critères à prendre en compte
pour décider si un candidat correspond ou non à une opacité, il reste encore à mettre en
oeuvre la structure de décision plus évoluée que celle utiliée aujourd’hui (faisant appel
notamment aux techniques de l’intelligence artificielle) et capable de gérer ces critères.
180 Chapitre 6. Application à la détection automatique des opacités du sein
Chapitre 7
Conclusion et perspectives
• L’arasement volumique
Nous classons à part cette transformation que nous avons introduite “dans la foulée”,
mais qui a son importance dans la boı̂te à outils des transformations morphologiques.
Elle vient directement compléter la panoplie des filtres morphologiques agissant sur des
critères de taille ou de contraste. La méthode de calcul efficace que nous avons proposée
permet, de plus, de ranger cette transformation parmi les plus rapides de la morphologie
mathématique.
181
182 Chapitre 7. Conclusion et perspectives
Notations
Ensembles et fonctions
E Compact de Z 2
F Ensemble des fonctions de E dans Z
X Elément de E
f Elément de F
C (X) Ensemble des composantes connexes de X
Xs+ (f ) Seuil de f au niveau s : Xs+ (f ) = {x ∈ E | f (x) ≥ s}
Xs− (f ) Seuil de f au niveau s : Xs− (f ) = {x ∈ E | f (x) ≤ s}
Max (f ) Ensembles des maxima régionaux de f
Min (f ) Ensembles des minima régionaux de f
Extr (f ) Ensembles des extrema régionaux de f
Plt (f ) Ensemble des plateaux de f
Logique
∃ (!) x, ... il existe (un unique) x tel que ...
∀x, ... pour tout x, ...
x∈X x élément de X
X⊂Y X est un sous-ensemble de Y
Xc Ensemble complémentaire de X
X \Y Différence ensembliste : X \ Y = X ∩ Y c
X △Y différence symétrique : X △ Y = (X ∩ Y c ) ∪ (X c ∩ Y )
∧, ∨ inf et sup
λB homothétique de B de rapport λ
f ≤g ∀x ∈ E, f (x) ≤ g (x)
Transformations morphologiques
B Elément structurant (E.S.)
δλ (δλB ) Dilatation de taille λ (employant B comme E.S.)
ǫλ (ǫλB ) Erosion de taille λ (employant B comme E.S.)
185
186 Annexe A. Notations
γλ Ouverture de taille λ
ϕλ Fermeture de taille λ
δ n (f, g) Dilatation géodésique de taille n de g sous f
ǫn (f, g) Erosion géodésique de taille n de g sur f
δ ∞ (f, g) Reconstruction de f par dilatation géodésique de g
ǫ∞ (f, g) Reconstruction de f par érosion géodésique de g
γλrec Ouverture par reconstruction
ϕrec
λ Fermeture par reconstruction
δ ∞ (f, f − h) h-reconstructions : décalage (positif) / reconstruction
ǫ∞ (f, f + h) h-reconstructions : décalage (négatif) / reconstruction
Cx Ouverture connexe pontuelle (binaire)
γλa Ouverture surfacique de taille λ
ϕaλ Fermeture surfacique de taille λ
avλ Arasement volumique de taille λ
ψλAS Filtre (ou Transformation) Alterné(e) Séquentiel(le) de taille λ
dyn (M) Dynamique de M
dynsym (M) Dynamique symétrique de M
Eψ (M) Valeur d’extinction de M par rapport à ψ
Eψsym (M) Valeur d’extinction symétrique de M par rapport à ψ
FψE (f ) Fonction d’extinction de f par rapport à ψ
E a (M) Valeur d’extinction surfacique de M
E v (M) Valeur d’extinction volumique de M
Annexe B
Rappels de morphologie
mathématique
187
188 Annexe B. Rappels de morphologie mathématique
Définition B.1 (Ouverture connexe ponctuelle) Une ouverture Cx est appelée ou-
verture connexe ponctuelle si elle vérifie les trois axiomes suivants :
On suppose toujours qu’un pixel n’est pas son propre voisin et que la relation est voisin
de est transitive et symétrique. Le voisinage d’un pixel p au sens de la trame est :
p0 = p et pn = q (B.4)
∀i ∈ [1, n], pi ∈ NG (pi−1 ) (B.5)
(B.6)
Nous verrons que le terme chemin géodésique vient du fait que le chemin est astreint
à être entièrement inclus dans A.
Cette distance vaut, par définition, +∞ s’il n’existe aucun chemin entre x et y à
l’intérieur de X, c’est-à-dire si x ∈
/ X ou si y ∈
/ X.
La distance géodésique d’un point x à un ensemble X notée D (x, X) vaut alors :
(
0 si x ∈ X
D(x, X) = inf{y ∈ X, dX (x, y)} =
+∞ sinon
Figure B.1: Trames carrée et hexagonale : la trame hexagonale vaut pour la forme et pour
le fond
Figure B.2: Sur la trame discrète, il n’y a pas unicité du chemin de longueur minimale
entre deux points
Définir une distance et une connexité sur la trame revient donc à définir des relations de
voisinage entre les pixels de cette trame. Ainsi, on distingue plusieurs types de connexités
: hexagonale (6 voisins sur la trame), carrée (4 ou 8 voisins sur la trame). La trame
190 Annexe B. Rappels de morphologie mathématique
hexagonale est certainement la plus utilisée par les morphologues car elle possède de
bonnes propriétés de symétrie (voir figure B.1): même connexité définie pour la forme et
pour le fond (ce qui n’est pas le cas des trames carrées).
Morphologie binaire Dans le cas binaire, ψ agit sur des éléments de P(IR2 ), c’est-
à-dire des ensembles de IR2 (ψ : P(IR2 ) → P(IR2 )). Dans ce cas la relation d’ordre est
l’inclusion.
2
Morphologie numérique Dans le cas numérique, n ψ agit sur
o des fonctions de IR dans
IR. F désignera l’ensemble de ces fonctions (F = f : IR2 → IR ). ψ : F → F . Dans ce cas
la relation d’ordre est la suivante :
∀f, g ∈ F , f ≤ g ⇔ ∀x ∈ IR2 , f (x) ≤ g(x)
En pratique, les transformations s’appliquent dans un domaine fini du plan discrèt Z 2 ,
domaine le plus généralement rectangulaire : les images correspondent alors à des tableaux
de données. Une image numérique sera à valeurs dans Z . Une image binaire peut alors
être considérée comme une image numérique à valeurs binaires (prenant exclusivement
les valeurs 0 ou 1 par exemple : 0 pour le fond et 1 pour la forme).
t
f
sous-graphe de f
x
Extensivité ψ sera dite extensive si et seulement si son résultat est plus grand que
l’ensemble ou la fonction de départ :
Idempotence Une transformation ψ est dite idempotente si, appliquer plusieurs fois ψ
revient à appliquer ψ une seule fois :
ψ◦ψ =ψ
Homothopie Une dernière propriété dont il est utile de parler est la conservation (ou
la non conservation) de l’homothopie. D’une manière simple, on peut dire que deux en-
sembles (ou fonctions) sont homothopes si on peut passer de l’un à l’autre par une trans-
formation continue. Une transformation qui préserve l’homothopie ne crée ni de détruit
de particule.
Définition
Considérons un ensemble X et un élément structurant B (ensemble donné dont on définit
le centre, c’est-à-dire dont on repère un point particulier quelconque). La dilatation de
X par B (notée δB (X)) est l’union des points x de IR2 tels que Bx (B translaté en x)
intersecte X :
δB (X) = {x ∈ IR2 , Bx ∩ X 6= ∅}
L’érosion ǫB (X) de X par B est l’ensemble des points x de IR2 tels que B soit entièrement
inclus dans X lorsque B est centré en x.
ǫB (X) = {x ∈ IR2 , Bx ⊂ X}
Dans le cas numérique, si B est un élément structurant plan, alors dilater une image f
par B revient à donner à tout pixel x du domaine E (compact de IR2 ) la valeur maximale
de l’image f dans la fenêtre d’observation définie par B, lorsque B est centré en x :
δB (f )(x) = max{xk , k ∈ B}
ǫB (f )(x) = min{xk , k ∈ B}
t . δB( f ) t δB( f )
. .
. f f
x x
Figure B.4: Dilatation par un des éléments structurants plan et non plan.
Si B est non plan, alors érosion et dilatation numériques doivent être définies par
l’addition de Minkowsky.
Il y a beaucoup à dire sur les propriétés de l’érosion et de la dilatation. Nous ne
retenons ici que les principales :
x x
Figure B.5: Gradient morphologique (symétrique) : dilaté - érodé
Les gradients permettent d’extraire les zones de variation d’intensité. Les valeurs crêtes
correspondent à des zones de forte transition et coı̈ncident généralement avec les contours
des objets. Cette information est très utile pour les problèmes de segmentation d’image.
ϕB = ǫB̆ ◦ δB
t f γB( f ) t f ϕB( f )
x x
Figure B.6: Ouverture et fermeture morphologiques
T Hn+ (f ) = f − γn (f )
T Hn− (f ) = φn (f ) − f
Le chapeau haut de forme blanc permet de détecter ce que l’ouverture a fait disparaitre,
c’est-à-dire les pics ou structures claires de l’image originale (voir figure B.7). Le chapeau
haut de forme noir détecte, quant à lui, les vallées ou structures sombres de l’image.
B.3. Transformations géodésiques et reconstruction 195
B = E.S. plan
t f γB( f )
TH( f )
x
Figure B.7: Chapeau haut de forme blanc
En général, ni une érosion ni une dilatation n’est un filtre morphologique puisque ces
opérations ne sont pas idempotentes (sauf lorsque l’élément structurant est réduit à un
point, ce qui donne l’identité) . Par contre, les ouvertures et les fermetures sont des filtres
morphologiques et, d’une manière générale, les compositions de fermetures et d’ouvertures
sont des filtres morphologiques.
L’étude théorique des filtres morphologiques permet d’introduire un certain nombre
de transformations, combinaisons d’ouvertures et de fermetures de tailles différentes, asso-
ciées à des familles d’éléments structurants homogènes ou non. Elles sont particulièrement
intéressantes dans tous les problèmes de restauration des images à teintes de gris. Parmi
ces transformations, on distingue la classe des filtres alternés dont la principale propriété
est d’avoir un comportement symétrique vis-à-vis des structures sombres et claires de
l’image.
La théorie des filtres morphologique est assez longue et ne saurait tenir dans ces
quelques pages. Nous nous contenterons d’insister sur une notion très importante en mor-
phologie mathématique et qui sert de base à notre travail : la notion de géodésie.
connexes d’un second ensemble B est non vide. L’ensemble de référence B est généralement
appelé marqueur et l’ensemble A masque géodésique. L’idée généralisait en quelque sorte la
technique classique qui consiste à garder ou à rejeter, indépendamment les unes des autres,
les composantes connexes d’un ensemble selon leur mesure (surface, volume, diamétre de
feret ...) par exemple.
Aujourd’hui, les transformations les plus évoluées de la morphologie mathématique
font presque toutes appel à la notion de géodésie.
Dans tout ce qui suit, nous noterons simplement la dilatation par δ(X) (au lieu de
δB (X)).
Géodésie numérique
La dilatation géodésique est définie d’une manière similaire dans les cas binaires et
numériques. Dans de nombreux cas, le masque géodésique est encore une image binaire.
Dans ce cas, les transformations géodésiques sont utilisées pour restreindre la zone de
travail. Le masque géodésique peut également correspondre à une image numérique. On
définit alors les transformations géodésiques numériques en considérant uniquement la
partie du graphe de l’image située sous le masque géodésique et ceci à chaque itération.
t t
x x
De la même manière que dans le cas binaire, la dilatation géodésique est généralement
utilisée pour reconstruire partiellement une image numérique. Dans ce cas l’image étudiée
joue le rôle du masque géodésique fR et l’image que nous dilatons est définie de sorte à
marquer les structures ou régions devant être reconstruites. Dans ce cas, la taille de la
dilatation géodésique appliquée est infinie (en réalité jusquà idempotence) (cf. figure B.9).
Si l’ensemble des marqueurs coı̈ncide avec l’ensemble des maxima régionaux de l’image,
alors la dilatation géodésique conduit à une reconstruction totale de l’image :
(
∞ +∞ si x ∈ M⊣§({)
δ (f, fM ) = f avec fM (x) =
−∞ sinon
cas d’une transformation anti-extensive, et par érosion dans le cas d’une transformation
extensive.
La famille des filtres par reconstruction est constituée des ouvertures et fermetures
par reconstruction et des transformations obtenues par composition, sup ou inf de ces
transformations. Ces filtres, outre les propriétés de croissance et d’idempotence ont de
bonnes propriétés vis-à-vis des composantes connexes des images binaires ou des plateaux
des images numériques.
Définition B.8 (Ouverture par reconstruction) Soit γ une ouverture quelconque. On
définit l’ouverture par reconstruction qui lui est associée par :
γλrec (g) = δ rec (γλ (g) , g) = δ rec (ǫλ (g) , g)
La fermeture par reconstruction est définie de manière duale :
ϕrec
λ (g) = ǫ
rec
(ϕλ (g) , g) = ǫrec (δλ (g) , g)
D’une manière générale, on a :
∀f ∈ F , ∀λ ≥ 0, 0 ≤ γλ (f ) ≤ γλrec (f ) ≤ f
Z
Y
Z=h
Z = h’
X
X X
Z=h Y
Z = h’
X
Figure B.10: Ouverture par reconstruction et décomposition de l’image par ses seuils
Des résidus : les chapeaux haut de forme par reconstruction A partir des ou-
vertures et des fermetures par reconstruction, on définit les chapeaux haut de forme par
reconstruction : résidus entre l’image et son ouvert par reconstruction ou résidu entre le
fermé par reconstruction et l’image originale :
T Hbrec rec
λ (f ) = f − γλ (f )
T Hnrec rec
λ (f ) = ϕλ (f ) − f
B.4. Un intermédiaire entre ouverture et ouverture par reconstruction : le filtre gommette199
Définition
Soit f l’image originale. Considérons, T Hn (f ) et T Hnrec (f ) les chapeaux haut de forme
(blancs) résidus de l’ouverture et de l’ouverture par reconstruction de taille n :
T Hn (f ) = f − γn (f ) et T Hnrec(f ) = f − γnrec (f )
120 E.S. 80 80
100
80
200
150 Ouverture Ouverture par reconstruction
0 0 0
120 40
120
100 20 80 20
80
200 200 120
150 150 150
0 0 0
T Hn (f ) est consitué des caps, ı̂lots et isthmes clairs de taille inférieure à n. Leur niveau
de gris sur l’image T Hn (f ) correspond à leur contraste par rapport au fond de l’image en
leur voisinage. Nous appelons ces composantes gommettes.
T Hnrec (f ) est constitué des ı̂lots clairs de l’image de taille inférieure à n. Leur niveau de
gris sur l’image T Hnrec (f ) correspond à leur contraste par rapport aux structures voisines
de plus grande taille (qui ont résisté à l’ouverture) (cf. figures B.11 et B.12).
L’ouverture gomme toutes les gommettes ce qui engendre une dégradation des contours
des structures persistantes sur l’image ouverte. A l’opposé l’ouverture par reconstruction
préserve toutes les gommettes sauf les ı̂les, ce qui peut conduire à une sur-reconstruction
(reconstruction des isthmes) ainsi qu’à une atténuation du contraste des structures.
L’idée du filtre gommette est de sélectionner les gommettes du chapeau haut de forme
devant être éliminées de telle sorte que la dégradation de l’image filtrée soit minimisée.
200 Annexe B. Rappels de morphologie mathématique
Une solution consiste à sélectionner les gommettes par un seuillage de leur contraste sur
l’image du chapeau haut de forme par reconstruction :
(
+∞ si T Hnrec (f )(x) ≥ s
Ss (T Hnrec (f ))(x) =
0 sinon
Ss (T Hnrec(f )) marque les gommettes considérées comme des structures à part entière ; ces
structures sont de petite taille (elles ne contenient pas l’élément structurant courant) et
doivent donc être éliminées par le filtre gommette. Les gommettes non marquées seront
préservées : les caps et isthmes et certaines ı̂les de faible contraste par rapport aux struc-
tures voisines.
Définition B.9 (Filtre gommette) Le filtre gommette de taille n et de seuil s est défini
par :
Gomn,s (f ) = f − δ ∞ (T Hn (f ), Ss (T Hnrec (f )))
Nous noterons Gomn,s le filtre dual défini à partir des chapeaux haut de formes noirs
(résidus de fermetures).
Propriétés
• 0 ≤ δ ∞ (T Hn (f ), Ss (T Hnrec(f ))) ≤ T Hn (f ) donc, en notant Id la fonction identité :
∀s ≥ 0, ∀n ≥ 0, γn ≤ Gomn,s ≤ Id
Image originale
120
100
80
200
150
0
80 80
200 120
150 150
0 0
Marquage des gommettes
Reconstruction Seuillage (s = 100)
120
Reconstruction des gommettes
200
150 Elimination des gommettes
0 0
120
100
80
Filtre gommette
0
rec
• ∀n ≥ 0, γn+1 ≤ γn et γn+1 ≤ γnrec , donc : T Hn+1 ≥ T Hn et T Hn+1
rec
≥ T Hnrec
rec
Pour un seuil s fixé : Ss (T Hn+1 (f )) ≥ Ss (T Hnrec(f )) et
δ ∞ (T Hn+1(f ), Ss (T Hn+1
rec
(f ))) ≥ δ ∞ (T Hn (f ), Ss (T Hnrec (f ))). On a donc :
∀s ≥ 0, ∀n ≥ 0, Gomn+1,s ≤ Gomn,s
∀s ≥ 0, ∀n ≥ 0, Gomn,s+1 ≥ Gomn,s
Image originale
Ouverture de taille 3 Ouverture par reconstruction de taille 3 Filtre gomette de taille 3 et de seuil 5
B.5 Conclusion
Dans ce chapitre, nous avons évoqué un certain nombre d’opérateurs classiques de la MM.
Nous pouvons faire à leur propos quelques remarques d’ordre général :
• Les opérateurs morphologiques vont généralement par paire (dualité par rapport à
la complémentation ou l’inversion de l’image).
Algorithmes en pseudo-code
Cet annexe rassemble l’ensemble des algorithmes décrits dans cet ouvrage et présentés ici
en pseudo-code. La plupart de ces algorithmes utilisent des files d’attente hiérarchiques
(FAH). Une description complète de la gestion de ces files pourra notamment être trouvée
dans [21].
205
206 Annexe C. Algorithmes en pseudo-code
• si LAB(x) 6= 0 faire :
– Surfh [LAB(x)]++
– Arbre[LAB(x)].alt = f (x)
– Pour tous les voisins p de x faire :
∗ Si LAB(p) = 0 faire :
· insertion de p dans la FAH au niveau de priorité f (p).
· LAB(p) = −LAB(x)
• (inondation de l’image)
niveau = 0
Tant que la file d’attente est non vide faire :
· V ol[label] + = V ol[label′ ]
– si LAB(p) = 0 (propagation) faire :
∗ insertion de p dans la FAH au niveau de priorité f (p).
∗ LAB(p) = −LAB(x)
• (traitement du minimum le plus persistant)
Pour tous les labels l faire :
Fin
• si LAB(x) 6= 0 faire :
– si LAB(x) ≤ nbmin faire Arbre[LAB(x)].type = min
– sinon faire Arbre[LAB(x)].type = max
– Arbre[LAB(x)].alt = f (x)
– Altc[LAB(x)] = f (x)
– Pour tous les voisins p de x faire :
∗ si LAB(p) = 0 faire : insertion de p dans FAH[LAB(x)] au niveau
hiérarchique | f (p) − f (x) |.
∗ si (LAB(p) 6= 0) et (LAB(p) 6= LAB(x)) faire :
Renc[LAB(x)][LAB(p)] = 1
• (Propagation des extrema)
niveau = 0 end = 0
Tant que (end = 0) faire :
209
• niveau++
• Pour tous les labels l tels que (Arbre[l].asc = l et Arbre[l].type 6= nonextr)
faire (Propagation des extrema) :
– si (Arbre[l].type = max) faire : altc[l]−−
– si (Arbre[l].type = min) faire : altc[l]++
– Tant que F AH[l][niveau] est non vide faire :
∗ extraction du premier pixel de FAH[l][niveau]. Soit x ce pixel.
Si LAB(x) 6= 0, on passe au suivant.
∗ LAB(x) = l
∗ Pour tous les voisins p de x faire :
· si LAB(p) > 0 faire :
− l′ = LAB(p) Tant que (Arbre[l′ ].asc 6= l′ ) faire : l’ = Arbre[l’].asc
− si (l 6= l′ ) faire : Renc[l][l′ ] = 1
· si LAB(p) = 0 faire :
− Insertion de p dans F AH[l] au niveau | Arbre[l].alt − f (p) |
− Si (Arbre[l].type = min et f (p) < Arbre[l].alt) faire :
Arbre[l].type = nonextr
− Si (Arbre[l].type = max et f (p) > Arbre[l].alt) faire :
Arbre[l].type = nonextr
• Pour tous les labels l tels que (Arbre[l].asc = l) faire (fusions ?) :
– si (Arbre[l].type = nonextr) et (Arbre[l].V E = 0) faire :
Arbre[l].V E = niveau
– Pour tous les label l′ tels que (Arbre[l′ ].asc = l′ et altc[l] = altc[l′ ] et
(Renc[l][l′ ] = 1 ou Renc[l′ ][l] = 1)) faire :
∗ sup = 0 inf = 0
∗ Pour tous les pixels de F AH[l] faire :
· si (f (x) < altc[l]) faire : inf = 1
· si (f (x) < altc[l]) faire : sup = 1
∗ Pour tous les labels i faire :
· si (Renc[i][l] = 1 ou Renc[l][i] = 1 ou Renc[i][l′ ] = 1 ou Renc[l′ ][i] =
1) faire :
si (altc[i] < altc[l]) faire : inf = 1
si (altc[i] > altc[l]) faire : sup = 1
∗ si (sup = 0) et (inf = 0) (plateau) faire : end = 1 , sup = 1 , inf = 1
∗ si (sup = 1) et (inf = 1) (plateau) faire :
· si (Arbre[l].V E = 0) faire Arbre[l].V E = niveau
· si (Arbre[l′ ].V E = 0) faire Arbre[l′ ].V E = niveau
∗ si (sup = 1) et (inf = 0) (plateau) faire :
· si (Arbre[l].type 6= min) faire : label = l, l = l’, l’ = label
· si Arbre[l′ ].V E = 0 faire : Arbre[l′ ].V E = niveau
210 Annexe C. Algorithmes en pseudo-code
Fin
Table des figures
211
212 TABLE DES FIGURES
3.43 Non croissance des filtres d’extinction. Sur cet exemple, on calcule un filtre
d’extinction surfacique. On a f ≥ g mais RE,+ E,+
s (f ) et Rs (g) ne sont pas
comparables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
3.44 Image ”Tools” et son gradient (gradient morphologique de taille 1) . . . . . 82
3.45 Exemple d’utilisation des valeurs d’extinction pour le filtrage d’image. En
haut, les marqueurs correspondent aux maxima de forte dynamique. Au
centre, les marqueurs correspondent aux maxima de forte valeur d’extinction
surfacique. En bas, les marqueurs correspondent aux maxima de forte
valeur d’extinction volumique. On compare les résultats à ce que l’on ob-
tiendrait à partir des filtres équivalents : par une h-reconstruction, par une
ouverture surfacique et par un arasement volumique. . . . . . . . . . . . . 84
3.46 Filtrage des structures claires et sombres de l’image de faible contraste
en utilisant la dynamique des extrema de l’image - Comparaison avec le
résultat obtenu à partir d’un filtre de contraste symétrique . . . . . . . . . 85
3.47 Filtrage des structures claires et sombres de l’image de faible contraste en
utilisant la dynamique symétrique des extrema de l’image . . . . . . . . . . 85
3.48 Filtrage des structures claires et sombres de l’image de faible taille en util-
isant les valeurs d’extinction surfaciques des minima de l’image gradient . . 87
3.49 Filtrage des structures claires et sombres de l’image aux contours mal défi-
nis en utilisant la dynamique des minima de l’image gradient . . . . . . . . 87
3.50 Filtrage des structures claires et sombres de l’image en utilisant les valeurs
d’extinction volumiques des minima de l’image gradient . . . . . . . . . . . 88
3.51 Les fonctions d’extinction : tableau récaputalif des opérateurs présentés . . 88
4.1 Principe de l’inondation d’un relief : l’eau pénètre par les minima ; le niveau
d’inondation est maintenu constant. . . . . . . . . . . . . . . . . . . . . . . 92
4.2 Inondation et ligne de partage des eaux : lorsque deux eaux provenant de
deux sources différentes se rencontrent, on est sur un point de la ligne de
partage des eaux. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
4.3 Calcul de la dynamique : lorsque deux lacs de sources différentes se rencon-
trent, la dynamique de la source associée au lac de plus faible profondeur
est calculée. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
4.4 Configuration pathologique pour le calcul de la dynamique : deux lacs de
même profondeur se rencontrent. . . . . . . . . . . . . . . . . . . . . . . . 94
4.5 Algorithme de calcul de la dynamique - Construction d’un arbre de fusion
des minima de l’image : lorsque deux lacs de sources différentes se ren-
contrent le plus fort (le lac le plus profond) absorbe le plus faible (le lac
le moins profond) et la dynamique de la source du lac le plus faible est
calculée. Tout ce passe ensuite comme si la source du lac absorbé n’existait
plus. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.6 Calcul des valeurs d’extinction surfaciques : lorsque deux lacs de sources
différentes se rencontrent, la valeur d’extinction surfacique de la source
associée au lac de plus faible surface est calculée. . . . . . . . . . . . . . . 96
4.7 Configuration pathologique pour le calcul des valeurs d’extinction sur-
faciques : deux lacs de même surface se rencontrent. . . . . . . . . . . . . . 98
216 TABLE DES FIGURES
5.14 Segmentation obtenue après correction de l’image par des moyennes locales
sous les portions de LPE (LPE obtenue par une première sur-segmentation
de l’image) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
5.15 Exemple “Muscle” : segmentation des 20 régions les plus significatives de
l’image en termes de surface (image de gauche) ou de dynamique (image
de droite) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
5.16 Comparaison des sensibilités des valeurs d’extinction surfaciques et de
la dynamique aux variations locales d’intensité : la dynamique prend en
compte le plus bas niveau de gris sous chaque arc de LPE ; dans le cas des
valeurs d’extinction surfaciques seule la position des arcs de LPE intervient. 135
5.17 Exemple “Aer” : segmentation des régions de l’image de surface supérieure
ou égale à 4000 puis à 6000 pixels . . . . . . . . . . . . . . . . . . . . . . . 136
5.18 Exemple “Lena” : Sur-segmentation, image mosaı̈que et gradient . . . . . . 137
5.19 Exemple “Lena” : segmentation des 100 régions les plus significatives en
termes de volume (à gauche), de surface (au centre), de dynamique (à
droite). Les valeurs d’extinction ont été calculées sur le gradient de l’image
mosaı̈que. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
5.20 Exemple “Aer” : segmentation des régions fortement contrastées de l’image
en utilisant la dynamique des extrema de l’image originale ou leur dy-
namique symétrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
5.21 Extraction des marqueurs des régions de fort contraste par sélection des
extrema de forte dynamique ou de forte dynamique symétrique : les mar-
queurs peuvent être localisés sur des pics de forte amplitude non significatifs.139
5.22 Comparaison entre la segmentation obtenue à partir de la dynamique symétrique
et celle obtenue en calculant le filtre de contraste équivalent. De haut en bas
et de gauche à droite : Image originale, extrema de dynamique symétrique
supérieure à 80, segmentation associée à ces marqueurs (LPE calculée sur
l’image gradient), filtrage de l’image originale (h-reconstruction alternées
séquentielles de taille 80), extrema de l’image filtrée, segmentation associée
(LPE calculée sur la même image gradient) . . . . . . . . . . . . . . . . . . 140
5.23 Les extrema de forte dynamique pointent sur des sur-densités locales . . . 141
5.24 Extraction de marqueurs à partir de l’arbre dynamique de fusion des ex-
trema de l’image (arbre déduit du calcul de la dynamique symétrique). Si s
est le seuil en dynamique choisi, on élague les branches de l’arbre de valeur
strictement supérieure à s : on obtient plusieurs petits arbres. On ne re-
tient que les arbres dont le sommet a une valeur d’extinction supérieure à
s. On aboutit ainsi à un ensemble de marqueurs non connexes proche de
l’ensemble des extrema de l’image filtrée (par le filtre équivalent de taille s).142
5.25 Exemple “Aer” : extraction de marqueurs précis en utilisant l’arbre dy-
namique de fusion des extrema de l’image . . . . . . . . . . . . . . . . . . 143
5.26 Apport des fonctions d’extinction pour la mise au point des algorithmes de
segmentation par LPE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
5.27 Un processus de segmentation hiérarchique par croissance de régions :
l’élimination d’un marqueur se traduit par l’élimination d’un arc de LPE. . 145
TABLE DES FIGURES 219
6.1 Exemple d’image radiographique du sein (sein dense) : les tissus graisseux
et la matrice conjonctivo-fibreuse sont à l’opposé quant à l’absorption des
rayons X . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
6.2 Exemples “g017fd” (face sein droit) et “g029fg” (face sein gauche) . . . . . 167
6.3 Les principales étapes de l’algorithme de détection des opacités du sein . . 168
6.4 Segmentation de la glande mammaire en utilisant la fonction d’extinction
surfacique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
6.5 Exemples “g017fd” et “g029fg” : segmentation des sur-densités en utilisant
la dynamique (à gauche : image originale - à droite : résultat de la segmen-
tation) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
220 TABLE DES FIGURES
[7] H. Blum. An associative machine for dealing with the visual field and some of
its bilogical implications. Biological Prototypes and synthetic systems. 2nd Annual
Bionics Symposium, Cornell Univ., E. E. Bernard and M. R, Kare eds., Plenum
Press, New-York, 1:244–260, 1961.
[8] H. Blum. A transformation for extracting new descriptors for shape. Symp. on Models
for the perception of speech and visual form. Boston, pages 362–380, Nov. 1964.
[9] L. Calabi, W.E. Hartnett. Shape recognition prairies fires, convex deficiencies and
skeletons. American Mathematical Monthly, 75(4), 1968.
[11] S.H. Collins. Terrain parameters directly from a digital terrain model. The Canadian
Surveyor, 29, nO 5:507–518, 1975.
221
222 BIBLIOGRAPHIE
[13] M. Coster, J.-L. Chermant. Précis d’Analyse d’Images. Editions CNRS, 1985.
[14] J. Crespo. Morphological Connected Filters and Intra-Region Smoothing for Image
Segmentation. PhD thesis, The Academic Faculty, Georgia Institute of Technology,
Nov. 1993.
[15] R.W. Ehrich, J.P. Foith. Representation of random waveforms by relational trees.
IEEE Trans. on Computers, C-25, N o 7, 1976.
[16] C. Faure. Comparaison de signaux représentés par des arbres relationnels. 5ième
congrès RFIA, Nov. 1985.
[18] G.H. Granlund. Description of texture using the general operator approach. IEEE
Proceedings, 5th International Conference on Pattern Recognition, pages 776–779,
1980.
[22] M. Grimaud. New measure of contrast : dynamics. Image Algebra and Morphological
Processing III, San Diego CA, Proc. SPIE, 1992.
[25] H. Hadwiger. Vorlesungen über Inhalt, Oberfläche und Isoperimetrie. Springer, 1957.
[26] H. Hadwiger. Normale körper im euklidischen raum und ihre topologishen und
metrischen eigenschaften. Math. Zeitschr., 71:124–149, 1959.
[27] P. Hanusse, P. Guillataux. Sémantique des images par analyse dendronique. AFCET,
2:577–588, Nov. 1991.
[29] H. Heijmans. A new class of alternating sequential filters. Proc. of 1995 IEEE
Workshop on Nonlinear Signal and Image Processing, pages 30–33(Vol.I), Juin 1995.
BIBLIOGRAPHIE 223
[31] J. C. Klein. Conception et réalisation d’une unité logique pour l’analyse quantitative
d’images. Thèse Université de Nancy, 1976.
[32] D.B. Kopans, J. Meyer, N. Sadowsky. Breast imaging. New Engl. J. Med, pages
310(15) 960–967, 1984.
[46] P. Maragos, R. Schafer. Morphological filters - part ii: their relations to median, order-
statistic, ans stack filters. IEEE Trans. Acoust. Speech Signal Processing, 35:1170–
1184, Aôut 1987.
[49] G. Matheron. Eléments pour une Théorie des Milieux Poreux. Masson, Paris, 1967.
[50] G. Matheron. Random Sets and Integral Geometry. John Wiley and Sons, New York,
1975.
[55] F. Meyer. Skeleton and perceptual graphs. Signal Processing, 16:335–363, 1989.
[56] F. Meyer. Digital euclidean skeletons. Visual Communicationss and Image Process-
ing’90, SPIE, Lausanne, 1360:251–262, 1990.
[57] F. Meyer. Un algorithme optimal de lignes de partage des eaux. 8ième congrès RFIA,
Lyon-Villeurbanne, pages 847–857, 1991.
[58] F. Meyer. Arbre des minima et dynamique. Note interne CMM N-04/93/MM, Ecole
des Mines de Paris, Mars 1993.
[59] F. Meyer. Morphological image segmentation for coding. Projet RACE N-01/93/MM,
Janv. 1993.
[63] H. Minkowsky. Allgemeine lehrs atze uber konvexe polyeder. Nachr. Ges. Wiss. G
ottingen, pages 198–219, 1897.
BIBLIOGRAPHIE 225
[64] H. Minkowsky. uber die begriffe l ange, oberfl ache und volumen. Jahresbericht der
Deutschen Mathematiker Vereinigung, 9:115–121, 1901.
[65] O. Monga. An optimal region growing algorithm for image segmentation. Interna-
tional Journal of Pattern Recognition and Artifical Intelligence, 3(4), Dec. 1987.
[69] S. Peleg, A. Rosenfeld. A min-max medial axis transformation. IEEE Trans. Pattern
Anal. Machine Intell., pages 208–210, 1981.
[71] F. Poirier. Mise en correspondance d’un signal temporel et d’une description formelle.
application à l’étiquetage automatique de la parole. AFCET, 1989.
[74] T.H. Puecker, D.H. Douglas. Detection of surface specific points by local parallel pro-
cessing of discrete terrain elevation data. Computer Graphics and Image Processing,
4:375–387, 1975.
[81] J. Serra. Image Analysis and Mathematical Morphology. Academic Press, 1982.
[82] J. Serra. Image Analysis and Mathematical Morphology. Theoretical Advances. Aca-
demic Press, 1988.
[83] J. Serra, P. Salembier. Connected operators and pyramids. Proc. of SPIE. Image
Algebra and Mathematical Morphology’93, San Diego, Juil. 1993.
[85] J.-C. Simon. La reconnaissance des formes par algorithmes. Masson, 1985.
[86] H. Talbot. Analyse morphologique de fibres minérales d’isolation. Thèse Ecole des
Mines de Paris, Oct. 1993.
[89] A.V. Tuzikov, P. Soille, D. Jeulin. Extraction of grid lines on stamped metallic pieces
using mathematical morphology - final report on ocas project. Rapport interne CMM
N-22/91/MM, Ecole des Mines de Paris, Juil. 1991.
[90] C. Vachier. A propos d’arbres... Rapport interne CMM, Ecole des Mines de Paris,
1992.
[97] L. Vincent. Morphological area openings and closings for grayscale images. Shape in
Picture, NATO Workshop, Driebergen, Sept. 1992.
[98] L. Vincent, P. Soille. Watersheds in digital space and efficient algorithm based on
immersion simulations. IEEE Transactions on PAMI, 13(No. 6):583–598, 1991.
Résumé
The purpose of this thesis is to investigate new morphological methods for extracting
the characteristics of an image regions. These methods are destined to be applied to
image segmentation. Two different approaches are first presented : the first one is based
on granulometries (classical sieving process), the second one considers the image extrema.
We then focus on the latter and on the study of dynamics. This transformation associates
with each image extremum the contrast of the region it marks. We show that it can be
considered as a contrast sieving process and that it is closely linked to granulometric
approaches.
We then propose a generalization of the dynamics concept using connected morpholog-
ical operators. These operators act on grey level images by simply propagating their flat
zones. By computing more and more selective connected filters, image structures progres-
sively disappear. The level for which one given structure is totally eliminated characterizes
the structure in terms of the filtering criterion : in terms of contrast, size, shape... This
leads us to introduce a new class of morphological transformations, the extinction func-
tions, which associate with each image extremum a characteristic of the region it marks.
An extinction function key concept is that of merging tree of image extrema which corre-
sponds to a hierarchical description of the image regions.
Extinction functions can be used for selecting significant regions in an image. They
are therefore of great interest in filtering and segmentation applications (for solving the
well known marking step before computing watershed transform). We illustrate the lat-
ter point with many segmentation examples. The results obtained by this method are
compared with the results deduced from more classical approaches. The most significant
contribution of extinction functions in segmentation applications is to simplify the adjust-
ment of segmentation algorithms based on the watershed transform. In particular, they
allow to produce efficient hierarchical interactive segmentation algorithms.