Geometrie Riemannienne Espaces de Formes
Geometrie Riemannienne Espaces de Formes
Geometrie Riemannienne Espaces de Formes
Jean Feydy
2016–2017
2018–2019
2
Résumé
Qu’est-ce qu’une forme ? Comment écrire mathématiquement qu’une baleine ressemble plus
à un merlu qu’à un labrador (quoique...) ? Pour répondre à ces questions, qui sont aujourd’hui
d’un intérêt crucial en vision par ordinateur et en imagerie médicale, une idée féconde consiste
à munir des espaces quotients de courbes ou de surfaces d’une structure métrique convenable,
où deux objets “semblables” seraient proches. Comment y parvenir ? Et quelles seront alors les
propriétés des espaces construits ?
Dans un premier temps, on présentera les concepts élémentaires de géométrie riemannienne
dans un cadre simple : variétés, métriques, connections, géodésiques, distances induites et
courbures. On pourra alors appliquer ces notions à des exemples concrets : les possibilités
sont nombreuses ! Formules explicites et étude poussée dans les espaces de courbes du plan,
problématiques de contrôlabilité dans les espaces de formes “abstraits”, calculs effectifs sur
les nuages de points pour des applications en biologie et en anatomie humaine... Il s’agira de
découvrir un véritable écosystème de travaux, allant des considérations sur les actions par
transport de groupes de difféomorphismes aux outils diagnostiques de demain.
What is a shape ? How can we mathematically write that a dolphin looks much more similar
to a fish than to a dog (although...) ? To answer those questions, now of crucial interest in the
fields of computer vision and medical imaging, a seminal idea is to equip curves or surfaces
quotient spaces of a suitable metric structure : “similar” objects shall be close to each other. How
can we do so ? What would then be the properties of the constructed spaces ?
First, we will introduce the elementary tools of Riemannian geometry in a simple way : ma-
nifolds, metrics, connections, geodesics, induced distances and curvatures. Then, we shall apply
these notions to concrete situations : possibilities are countless ! Explicit formulas and extensive
studies in the spaces of plane curves, controlability problems in “abstract” shapes spaces, effec-
tive computations on points clouds with applications to biology and human anatomy... Walking
through a colourful collection of papers, we shall discover an active field of research, which links
diffeomorphomisms groups actions to the future of diagnosis.
3
4
Informations pratiques
Contact :
— Adresses mail : jean.feydy@ens.fr, jean.feydy@gmail.com (utilisez les deux).
— Bureau : sous les toits du DMA, les lundis et mercredis à coup sûr.
— Page web du cours : www.math.ens.fr/~feydy/Teaching/index.html.
Vous y trouverez la version la plus à jour du poly, mais aussi de petits carnets interactifs
en Matlab/Python qui vous permettront d’expérimenter et de voir nos algorithmes en
action.
Planning hebdomadaire :
— Samedi-Dimanche : comptez un bon week-end de travail...
— Lundi ou Mardi 16h30–17h30 : réunion pour faire le point dans mon bureau, avec un plan
détaillé, une ébauche de chapitre et des questions.
— Mardi soir : envoi d’une version finale du chapitre du polycopié à l’adresse
jean.feydy@gmail.com. Je me charge de l’impression.
— Mercredi après-midi, de 15h à 16h30 en salle R : exposé.
Échéances :
— 26 septembre : Séance d’introduction, Jean Feydy.
. Répartition des rôles pour la première session.
— 3 octobre : Séance 2, Emmanuel et Léo.
— 10 octobre : Séance 3, Massil et Ivan.
— 17 octobre : Séance 4, Luc et Lucas.
— 24 octobre : Séance 5, Raphaël et Antoine.
— 7 novembre : Séance 6, Lino et Valentin.
— 14 novembre : Séance 7, Maxime et Grégoire.
. Répartition des rôles pour la deuxième session.
— 21 novembre : Séance banalisée pour les partiels ?
— 28 novembre : Séance 8, et .
— 5 décembre : Séance 9, et .
— 12 décembre : Séance 10, et .
— 19 décembre : Séance 11, Louis-Pierre et .
— 9 janvier : Séance 12, et .
— 16 janvier : Séance 13, et .
— 17 janvier : Séance 14, et .
Table des matières
Bibliographie 9
1 Introduction 11 Séance 1
1.1 Géométries non-euclidiennes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Jean Feydy
1.2 Métriques locales sur un ouvert de Rn . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3 La géométrie Riemannienne : l’exemple du tore . . . . . . . . . . . . . . . . . . . 17
1.4 Applications en vue : l’anatomie computationnelle . . . . . . . . . . . . . . . . . 18
1.5 Variétés : un petit guide de survie . . . . . . . . . . . . . . . . . . . . . . . . . . 22
9
10 Bibliographie
[MM07] Peter W Michor and David Mumford. An overview of the riemannian metrics on
spaces of curves using the hamiltonian approach. Applied and Computational Har-
monic Analysis, 23(1) :74–113, 2007.
[MMM12] Mario Micheli, Peter W Michor, and David Mumford. Sectional curvature in terms
of the cometric, with applications to the riemannian manifolds of landmarks. SIAM
Journal on Imaging Sciences, 5(1) :394–433, 2012.
[MPS+ 11] Tommaso Mansi, Xavier Pennec, Maxime Sermesant, Hervé Delingette, and Nicholas
Ayache. ilogdemons : A demons-based registration algorithm for tracking incompres-
sible elastic biological tissues. International journal of computer vision, 92(1) :92–111,
2011.
[Pen09] Xavier Pennec. Statistical computing on manifolds : from riemannian geometry to
computational anatomy. In Emerging Trends in Visual Computing, pages 347–386.
Springer, 2009.
[T+ 42] Darcy Wentworth Thompson et al. On growth and form. On growth and form., 1942.
Chapitre 1
Introduction Séance 1
Jean Feydy
11
Séance 1 12 Chapitre 1. Introduction
Jean Feydy
Figure 1.1 – Le disque de Poincaré. Pour emprunter le plus court chemin, un habitant de ce
monde réduit aura toujours tendance à passer par le centre du disque, où la température élevée
lui permet de faire des pas de géant. La simplicité de la métrique permet d’expliciter les “droites”
géodésiques : ce sont les arcs de cercle orthogonaux au bord du disque. Par le point P passent
donc une infinité de “droites” n’intersectant pas la droite (AA0 ).
Image modifiée du site de John D. Norton, University of Pittsburgh.
Pour construire des géométries nouvelles, M. Poincaré propose donc simplement de partir d’un
ouvert de l’espace euclidien – ici, la boule Ω = B(0, R) de R2 –, et de le déformer localement :
Séance 1 16 Chapitre 1. Introduction
Jean Feydy
On peut par exemple calculer le “rayon” du disque de Poincaré associé au chemin radial γ(t) =
(t, 0). Pour la métrique euclidienne, habituelle, on a tout simplement
Z 1
`eucl (γ) = kγ 0 (t)kγ(t), eucl dt (1.5)
0
Z 1
= k(1, 0)kγ(t), eucl dt (1.6)
0
Z 1 p
= 12 + 02 dt = 1. (1.7)
0
On l’a vu, déformer judicieusement l’espace euclidien permet de construire des modèles aux
théories axiomatiques non-euclidiennes développées par Lobatchevski et Bolyai. L’idée clé de la
géométrie Riemannienne est de généraliser cette procédure à tous les étirements réguliers de
la métrique euclidienne sur Rn : on s’autorisera à considérer tout champ de matrices n × n
symétriques définies positives, g : x ∈ Ω 7→ g(x) ∈ Sn++ , avec g de classe C ∞ et Ω un ouvert
de Rn – ou mieux, une variété de dimension n comme défini section 1.5.
L’idée est féconde : prenons l’exemple du tore. Il existe a priori deux manières de l’étudier : en
tant que surface immergée dans l’espace ambiant R3 , ou comme quotient du plan R2 par l’action
des translations entières – le fameux carré aux bords recollés. Cette dernière représentation est
de loin la plus pratique : plutôt que de travailler avec des points (x, y, z) dont il faut toujours
s’assurer qu’ils ne quittent pas la surface, on utilise des couples (r, θ) sans se poser d’autre
question que celle du “modulo 2π”.
Malheureusement, la structure métrique du carré recollé n’est pas représentative de l’idée
sous-jacente de “bouée” que nous avons tous en tête : avec un parallélépipède, impossible de
rendre le “petit équateur” plus court que le grand – voir figure 1.2. Pour réunir le meilleur des
deux mondes, il faudra en fait déformer le carré par une métrique appropriée, qui accorde d’autant
plus de poids à dθ que le point de base (r, θ) est proche de l’axe de révolution du donut. Vous
pourrez trouvez des précisions à ce sujet sur la page web du cours et dans les excellentes notes
de Robert T. Jantzen [Jan12].
(a) Un tore bouée vu comme surface immergée (b) Le tore carré. Muni de la métrique natu-
dans l’espace ambiant R3 . relle euclidienne, il est plat : petits et grands
parallèles sont de même longueur.
Figure 1.2 – Deux manières de représenter un tore. La géométrie Riemannienne permet d’étu-
dier la structure métrique de la bouée avec le confort pratique offert par une paramétrisation
bidimensionnelle.
Séance 1 18 Chapitre 1. Introduction
Jean Feydy
Régression et suivi longitudinal On connaît tous les courbes de croissances présentes sur
nos carnets de santé : dûment remplies, elles permettent de suivre notre évolution, de la comparer
à une population “normale” et de détecter un éventuel retard de croissance – voir Figure 1.3.
Maintenant, serait-il possible de faire la même chose avec, disons, la forme du cœur ? Atten-
tion : il ne s’agit pas ici de remplacer une grandeur scalaire – la taille – par un simple vecteur
“largeur/longueur/volume/que-sais-je”. Ce traitement simpliste éclaterait les cœurs similaires –
mêmes rapports de taille – en une ribambelle de points... Si l’on s’intéresse véritablement à la
forme du cœur, aux atrophies/hypertrophies éventuelles de ses ventricules, il faudra nécessaire-
ment travailler dans un espace quotient – sur lequel la notion de régression n’est a priori pas
définie.
Création d’atlas et analyse statistique Autre axe de recherche, dans la même veine : l’étude
statistique d’une population de formes. On le sait, l’étude approfondie d’un jeu d’indicateurs
scalaires – poids, âge, tension artérielle... – peut nous apprendre beaucoup sur l’état de santé
d’un patient. En comparant celui-ci à un humain moyen, en le replaçant au sein d’une population
connue, on peut le classer dans tel ou tel groupe, détecter l’apparition de certaines pathologies.
Alors, au XXIe siècle, sera-t-il possible de faire la même chose avec des données plus complexes ?
On pense par exemple à des images de colonne vertébrale (scoliose...), de fonds d’œils rétiniens
(glaucome...) ou à la forme de l’hippocampe, corrélée à la présence de démences dégénératives
comme la maladie d’Alzheimer – voir Figures 1.4-1.5.
Dans les trois situation précédentes, tout serait simple si l’on disposait d’une structure algé-
brique/vectorielle raisonnable sur nos données – qui sont ici des “formes” – : moyenne, régression
linéaire et analyse de la variance de l’échantillon sont toujours données par des formule pleines
de « + » et de « × »... Malheureusement, une théorie additive des formes a peu de chance de
voir le jour : quel sens pourrait-on donner à la somme de deux cœurs ?
Qu’à cela ne tienne : une notion de distance, une métrique Riemannienne suffira. La moyenne
ne sera plus qu’un point minimisant la somme des distances aux observations et la droite de
régression, une courbe géodésique approchant au mieux les données aux instants d’observations.
1.4. Applications en vue : l’anatomie computationnelle 19
Figure 1.3 – Le suivi longitudinal et les techniques de régression méritent d’être généralisés aux
formes. (b) est tiré de Vascular endothelial growth factor in heart failure, Taimeh et Al., Nature
Reviews Cardiology 10 (Septembre 2013).
Figure 1.4 – Estimation d’un cœur moyen à partir de sept cœurs de chiens.
Images tirées de A computational framework for the statistical analysis of cardiac diffusion ten-
sors : application to a small database of canine hearts, Peyrat et Al., IEEE transactions on
medical imaging, 2007.
Séance 1 20 Chapitre 1. Introduction
Jean Feydy
(a) Recalage des données sur la moyenne. (b) Quelques modes de déformation typiques.
(c) Estimation des déformations typiques du template selon la “Body Surface Area”.
(a) Exemples de segmentation de régions du cerveau. Deux sujets sont observées, quatre méthodes sont
utilisées pour transporter une carte pré-établie.
Image tirée de Segmentation of brain magnetic resonance images based on multi-atlas likelihood fusion :
testing using data with a broad range of anatomical and photometric profiles, Tang et Al., Frontiers in
Neurosciences, 03 March 2015.
(b) À partir d’un modèle de référence, on peut inférer les mécanismes internes de silhouettes arbitraires :
Le David, Olive, Brutus, un loup-garou... Des débouchés dans les domaine de l’imagerie médicale et de
l’animation sont envisagés.
Image tirée de Anatomy Transfer, Dicko et Al., ACM Transactions on Graphics, 2013.
On modélisera ici nos formes par des nuages de points, éléments d’un espace de landmarks
que l’on peut voir comme un ouvert de Rnp . (On pourrait bien sûr en considérer le quotient
à numérotation σ ∈ Sn près, à similitude près, ou bien considérer des espaces de courbes, de
surfaces voire de mesures, mais cela nous encombrerait plus qu’autre chose dans ce cours à
l’agenda serré.)
Viendront alors trois questions : Comment construire une métrique locale anatomiquement
pertinente sur Lnp ? Quelles seront alors les propriétés de l’espace métrique induit ? Et surtout,
sera-t-on capable d’implémenter de manière efficace les algorithmes de régression, matching,
création d’atlas que nous demandent les médecins/neurologues/biologistes ? C’est ce que nous
verrons dans la deuxième moitié du semestre.
Sous-variétés, variétés ? Nous souhaitons travailler avec des espaces qui sont “localement
semblables” à Rd ... Comme souvent en mathématiques, il y a en fait deux manières de définir et
caractériser ces objets : en parler de manière extrinsèque, avec le vocabulaire des sous-variétés
plongées dans Rn ; ou bien le faire de manière intrinsèque – on parlera alors de variété abstraite,
ou, tout simplement, de variété. Le théorème de plongement de Whitney permettra alors d’iden-
tifier les deux notions, en montrant que toute variété abstraite de dimension d peut être plongée
dans l’espace euclidien R2d .
Définition 1.1. Soit M ⊂ Rn . On dit que M est une sous variété de dimension d si et seulement
si en chaque point x0 ∈ M , il existe un voisinage U de x0 , un difféomorphisme ϕ : Rn → Rn tel
que
j :V →M ∩U (1.16)
Éléments de Géométrie
Riemannienne
25
Chapitre 2
Arnaud Eteve,
Léo Hahn-Lecler,
2.1 Introduction Emmanuel
Kammerer
La géométrie Riemannienne permet de réintroduire, dans la géométrie différentielle, les Un peu énumératif
concepts géométriques d’angles, de distances, sur des objets courbes. Nous introduirons donc
la notion de courbure et son lien avec la toppologie. Puis nous nous équiperons de l’attirail
nécessaire dans la perspective d’introduire les distances et les angles : tenseurs, variétés, fibrés...
Définition 2.2 (Cercle osculateur). Mieux qu’une droite tangente, il existe un unique cercle
C approchant γ à l’ordre 2 en p, qu’on appelle le cercle osculateur à γ en p. C’est le cercle
(paramétré) dont les vecteurs vitesse et accélération coïncident en p avec ceux de la courbe. On
peut facilement montrer que son centre est sur la droite orthogonale à γ̇ en p, et son rayon est
égal à l’inverse de la courbure, R = κ1 .
La courbure ainsi définie ne permet pas de savoir “dans quel sens ça tourne”. On peut pour ce
faire affecter un signe à la courbure en choisissant un champ de vecteurs normaux à la courbe,
noté N , que l’on voit comme une direction canonique. On note alors la courbure signée κN , κN
est positive si N et γ̈ ont le même sens, négative sinon.
27
Séance 2 28 Chapitre 2. Intuitions sur la courbure, Vocabulaire
[Lee97], Chap. 1-2
Arnaud Eteve,
Léo Hahn-Lecler,
Emmanuel
Kammerer
Un peu énumératif
(a) Le cercle osculateur en M à la courbe (b) Courbures principales sur une selle de cheval. Quelle
rouge. De manière générique, la courbe que soit l’orientation choisie, les deux courbures sont de
traverse le cercle osculateur : le terme signe opposé : la selle est une surface de courbure gaus-
d’ordre 3 n’a aucune raison de s’annuler. sienne négative.
Figure 2.1 – Illustrations sur la courbure d’une trajectoire et d’une surface, tirées de Wikipédia.
2.3 Variétés
Introduisons quelques définitions pour généraliser les courbes et les surfaces. Nous renvoyons
le lecteur au guide de survie pour la définition des variétés lisses.
Soit M une variété, x0 ∈ M et U ⊂ M un voisinage de x0 : on identifiera U avec son image
dans Rn , ce qui nous donne des coordonnées locales lisses autour de x0 .
Le plan (vectoriel) tangent à une surface en un point est le plan ayant pour vecteur normal
la normale N à la surface en p. Mais c’est aussi l’ensemble des vecteurs vitesse en p des courbes
dans la surface passant par p. De même, pour une sous-variété M de Rn , l’espace tangent en p
est l’ensemble des vecteurs vitesse en p des courbes à valeurs dans M passant par p.
De manière encore plus générale, on définit :
Définition 2.4 (Espace Tangent, Tangent space). Soit p ∈ M , on considère l’ensemble des
courbes de M qui passent par p quotienté par la relation d’équivalence suivante : γ1 ∼ γ2 ssi ils
2.4. Fibrés Vectoriels 29
ont le même vecteur vitesse en p. Cet espace est un espace vectoriel de même dimension que M
noté Tp M .
Définition 2.5 (Sous Variété, Submanifold). Soit M1 et M2 des variétés, M1 est une sous variété
(régulière) de M2 si on dispose d’une injection i : M1 → M2 et i realise un homéomorphisme de
M1 → i(M1 ).
De cela on obtient des coordonnées locales sur M1 à partir de celles de M2 et on peut voir
Tp M1 comme un sous espace de Tp M2
Prenons l’exemple d’une masse ponctuelle m en chute libre dans un champ de gravité uni-
forme g. En repérant la position de la masse par son altitude z, et en appliquant les lois de
Newton, on obtient (avec les bonnes conventions de signe) l’équation du second ordre :
Pour obtenir existence et unicité des solutions au problème de Cauchy, il est de bon goût de
réécrire notre dynamique sous la forme d’une équation du premier ordre sur l’espace des phases :
˙
z v
= X(z, v) = . (2.2)
v −g
Séance 2 30 Chapitre 2. Intuitions sur la courbure, Vocabulaire
[Lee97], Chap. 1-2
Arnaud Eteve,
Léo Hahn-Lecler,
Emmanuel
Kammerer
Un peu énumératif
Figure 2.2 – Définition intrinsèque et locale de la notion de fibré vectoriel. Image tirée de [Lee97].
Figure 2.3 – Deux manières de voir le fibré tangent au cercle S 1 . Twister la représentation (b)
pour obtenir un ruban de Moebius permet d’obtenir un fibré vectoriel sur le cercle qui n’est pas
équivalent au produit cartésien – exercice !
2.4. Fibrés Vectoriels 31
15 15
10 10
5 5
Moment p
Vitesse v
0 0
−5 −5
−10 −10
−15 −15
−5 0 5 −5 0 5
Altitude z Altitude z
(a) Flot des équations de Newton dans l’espace (b) Flot Hamiltonien dans l’espace des
des phases (z, v). Le champ de vecteur X(z, v) phases (z, p). Les trajectoires restent à énergie
est tangent aux lignes de niveau de l’énergie constante, avec un renseignement supplémen-
mécanique : cette dernière est donc une quan- taire : plus les lignes de niveau du Hamiltonien
tité conservée au cours du mouvement. sont serrées, plus le gradient est fort, et plus
le point courant bouge vite dans l’espace des
phases.
Figure 2.4 – Flot des équations de la mécanique classique dans l’espace des phases (en rouge)
pour la chute libre d’une masse m = 2 dans un champ de gravité uniforme g = 1. Les lignes de
contours correspondent aux iso-énergies.
Séance 2 32 Chapitre 2. Intuitions sur la courbure, Vocabulaire
[Lee97], Chap. 1-2
Arnaud Eteve, L’étude de notre système est donc ramenée à celle du flot du champ de vecteur X sur le produit
Léo Hahn-Lecler, cartésien R × R : c’est, à peu de choses près, ce que les classes prépa nous ont appris sur la
Emmanuel mécanique classique... Mais depuis Newton, les physiciens ont trouvé des manières bien plus
Kammerer élégantes – et donc efficaces – de formuler ce problème. Le formalisme Lagrangien exprime ainsi
Un peu énumératif qu’entre deux états (q0 , v0 ) et (q1 , v1 ), un système physique emprunte une trajectoire qui minimise
l’intégrale au cours du temps de l’action – une grandeur physique ad hoc. Plus pratique encore
le formalisme Hamiltonien propose de substituer au vecteur tangent v un vecteur cotangent p, le
moment, défini de manière appropriée. Dans notre cas, il s’agit simplement du moment inertiel
p = mv ∈ (R)? = R. En les variables (z, p), on réécrit alors le système 2.2 :
(
ż = +p/m
. (2.3)
ṗ = −m g
1 p2
H(z, p) = Ec + Epp = + mgz, (2.4)
2m
on a
( ˙
ż = + ∂H z
∂p
i.e. = R−90◦ ∇H (2.5)
ṗ = − ∂H p
∂z
Le flot “Hamiltonien” des systèmes physiques n’est donc autre qu’un flot de gradient “tourné d’un
quart de tour”. De cette information, on peut immédiatement déduire que le Hamiltonien – ici,
l’énergie mécanique – est une quantité conservée au cours du mouvement... Et de nombreuses
autres propriétés qui forment l’objet d’étude de la mécanique géométrique et la motivation prin-
cipale de la géométrie symplectique.
L’espace des phases d’une variable (x, y, z) ∈ R3 n’est autre que le produit R3 × R3 des
couples ((x, y, z), (ẋ, ẏ, ż)) – i.e. le fibré tangent T R3 . La généralisation présentée ici permet donc
simplement de parler d’espaces des phases d’une variable q ∈ M quelconque.
C’est un point crucial dans l’élaboration de notre cours : comme le problème des géodésiques
est moralement un problème “Lagrangien”, nous verrons que les courbes géodésiques sont en fait
solutions d’une équation différentielle d’ordre 2 (analogue aux équations de Newton), que l’on
peut exprimer dans l’espace des phases T ? M comme le flot du Hamiltonien H(q, p) = 21 (p, Kq p)
où Kq est la cométrique au point q – tout ceci sera bien sûr précisé en temps voulu. La puissance
du point de vue Hamiltonien – qui capture l’essence de la propriété “être une géodésique” sous
une forme compacte et pratique – sera au cœur des algorithmes que nous développerons dans la
deuxième partie du semestre.
Pour montrer que les exemples précédents sont des fibrés vectoriels sans avoir à construire
une structure de variété lissse sur l’ensemble total, on peut s’appuyer sur le lemmme suivant :
Lemme 2.1. Soit M une variété lisse, E un ensemble et π : E → M une application surjective.
Soit {Uα } un recouvrement ouvert de M , et des applications bijectives ϕα : π −1 (Uα ) → Uα × Rk
satisfaisant π1 ◦ ϕα = π et dès que Uα ∩ Uβ 6= ∅ , l’application ϕα ◦ ϕ−1
β : Uα ∩ Uβ × R →
k
k −1
Uα ∩ Uβ × R est de la forme ϕα ◦ ϕβ (p, V ) = (p, τ (p)V ), où τ est une application lisse τ :
Uα ∩ Uβ → GL(k, R).
Alors E a une unique structure de k-fibré vectoriel lisse sur M pour laquelle les applications
ϕα sont les trivialisations locales. La fonction τ est appelée fonction de transition.
2.5. Tenseurs 33
En d’autres termes, il suffit d’exhiber des trivialisations locales qui se superposent “correcte-
ment”.
Définition 2.7 (Section). Soit π : E → M un fibré vectoriel, une section de E est une application
lisse F : M → E telle que π ◦ F = IdM .
C’est donc la donnée lisse en tout point p d’un “vecteur” F (p) vivant dans la fibre π −1 (p).
2.5 Tenseurs
La géométrie Riemannienne est construite à l’aide de tenseurs. Ces objets sont en quelque
sorte des généralisations des matrices. Ils peuvent représenter en particulier des formes multili-
néraires, des matrices ou des produits scalaires.
Pour alléger les notations, il est d’usage d’utiliser la sommation d’Einstein : dès lors qu’un
indice est hors contexte c’est qu’on le somme sur toutes les valeurs possibles. C’est par exemple
utile pour le calcul de la différentielle d’une composée, ou pour écrire des produits matriciels de
manière compacte.
Définition 2.8 (Tenseur, Cotenseur). Soit V un espace vectoriel de dimension finie, un k-tenseur
est une application k linéraire de V k → R un l-cotenseur est une application l linéaire de V ?l → R
k
un -tenseur est une application multilinéaire de V ?l × V k → R
l
Remarque 2.3. On peut voir un tenseur d’ordre 2 comme la décomposition d’une matrice sur
l’espace de base V et son dual V ? : en effet, une matrice M de taille n × n est entièrement
déterminée par la donnée de l’application bilinéaire (Y, X) ∈ (Rn )? × Rn 7→ (Y, M X) = Y t M X.
Remarque 2.4. La terminologie “tensorielle” est plus lourde que celle des matrices, qui nous suffi-
rait pourtant ici – aucun tenseur d’ordre supérieur à 2 n’est nécessaire pour parler de géodésiques.
Elle a néanmoins l’avantage de désambiguïser la confusion qui est souvent faite entre un espace
V et son dual V ? .
On le voit en cours d’analyse fonctionnelle, le dual topologique d’un espace de dimension
infinie est rarement identifiable à l’espace de départ. Mais même dans le cas des espaces de
landmarks, celui des ouverts de Rn , il est important de faire la distinction : c’est que si on a
topologiquement (Rn )? ' Rn , la structure métrique sur ces deux espaces peut elle être complè-
tement chamboulée.
Supposons par exemple Rn muni d’un produit scalaire h·, ·iG donné par une matrice n × n
symétrique définie positive G :
2
∀ v ∈ Rn , kvkG = v | Gv. (2.6)
De même qu’un vecteur est identifié à la matrice colonne de ses coordonnées dans la base
canonique, on représente toujours une forme linéaire p ∈ (Rn )? par la matrice ligne de ses
coordonnées dans la base duale canonique (e?1 , . . . , e?n ) :
p(x) = p1 x1 + p2 x2 + · · · + pn xn = p| x. (2.7)
Séance 2 34 Chapitre 2. Intuitions sur la courbure, Vocabulaire
[Lee97], Chap. 1-2
Arnaud Eteve, La norme d’opérateur d’une forme linéaire p est alors donnée par :
Léo Hahn-Lecler,
Emmanuel kpkG? = max p(v) (2.8)
hv,viG =1
Kammerer
Un peu énumératif = max p| v (2.9)
hv,viG =1
= max
|
p| G−1/2 u (2.10)
u u=1
G−1/2 p
= p| G−1/2 ·
G−1/2 p
,
(2.11)
2
avec le changement de variable u = G1/2 v – racine carrée d’une matrice de Sn+ . Autrement dit,
2
kpkG? = p| G−1 p. (2.12)
À une métrique G sur l’espace primal, il faut donc associer la cométrique K = G−1 sur l’espace
dual. Si l’identification est tentante dans Rn muni du produit scalaire canonique, c’est uniquement
parce que In−1 = In : dans notre cours, il faudra aller plus loin.
Définition 2.10 (Champ de tenseur, Tensor Field). Un champ de tenseurs est une section lisse
de Tlk M .
2.7 Conclusion
Si, au début, on a pu appréhender la notion de courbure d’une surface, nous avons ensuite
bien équipé nos variétés de fibrés qui nous permettront de construire ainsi une géométrie.
Chapitre 3
Paul Fraux,
Manolis Perrot,
3.1 Métriques Riemanniennes Massil Hihat,
Ivan Yakovlev
3.1.1 Définitions Sans souci
Définition 3.1 (Métrique). Une métrique Riemannienne sur une variété lisse (smooth manifold)
M est une application continue g de M dans l’ensemble des formes bilinéaires symétriques et
définies positives sur Tp M . Autrement dit, g associe à un p ∈ M un produit scalaire de Tp M .
Notations :
— Pour (X, Y ) ∈ Tp M 2 , on note < X, Y >:= g(p)(X, Y ) = g(X, Y ).
— Un couple variété et métrique Riemannienne est appelé variété Riemannienne.
— S’il n’y a pas de confusion possible, on parlera de métrique et pas de métrique Rieman-
nienne.
— (X, Y ) ∈ Tp M 2 sont dit orthonormaux si < X, Y >= 0.
Définition 3.2 (Normes, angles). On peut alors définir une norme et des angles sur Tp , avec
et l’angle entre X et Y pour (X, Y ) ∈ Tp comme l’unique réel θ de [0, π] tel que
< X, Y >
cos(θ) = . (3.2)
|X|.|Y |
Définition 3.3 (tiré en arrière, pull-back). Si f est différentiable de M dans N (deux variétés),
et si N est munie d’une métrique g N , alors on peut définir une métrique sur M par :
On voit aisément que cela définie bien une forme bilinéaire symétrique et positive, par contre
elle est définie positive si et seulement si la différentielle dfp est injective.
C’est à partir de cette métrique que d’autres notions clés vont être définies comme celle
d’isométrie entre variétés riemanniennes. Avant de voir ces notions, manipulons cette définition
à travers un exemple.
35
Séance 3 36 Chapitre 3. Métriques Riemanniennes
[Lee97], Chap. 3
Manolis Perrot, On se place dans un repère (Oxyz), avec le θ des coordonnées polaires. On considère alors
Massil Hihat, l’application entre le rectangle [−bπ, bπ] × [−π, π] et le tore dans R3 :
Ivan Yakovlev
Sans souci f (r, θ) = R(r)(cos θ, sin θ, 0) + Z(r)(0, 0, 1) (3.4)
avec R(r) = a + b cos(r/b) (3.5)
Z(r) = b sin(r/b). (3.6)
C’est une paramétrisation du tore, où à θ fixé r décrit le "petit" cercle (section du tube)
représenté ci-dessous, et pour r fixé θ décrit le "grand" cercle (de hauteur z constante).
Figure 3.1 – Le tore vu en coupe : on fait tourner ce cercle autour de Oz pour obtenir le tore.
Notre but est de munir le carré d’une métrique qui est cohérente avec la vision qu’on a du
tore de R3 muni de la métrique euclidienne. Pour cela on peut calculer la métrique pull-back,
qui en revenant à la définition nous demande de calculer la différentielle de f :
ϕ∗ ge = g. (3.7)
On dit que (M, g) et (M̃ , g̃) sont isométriques s’il existe une isométrie entre les deux.
Remarque 3.1. Si on se place dans l’ensemble des isométries entre une même variété. Il est facile
de vérifier que la composition de deux isométries et que l’inverse d’une isométrie restent des
isométries, celles-ci forment donc un groupe pour la composition.
Séance 3 38 Chapitre 3. Métriques Riemanniennes
[Lee97], Chap. 3
Paul Fraux, Remarque 3.2. La relation être isométrique étant une relation d’équivalence sur la classe des
Manolis Perrot, variétés Riemanniennes, la géométrie Riemannienne s’intéresse principalement aux propriétés
Massil Hihat, conservés par isométries.
Ivan Yakovlev
Sans souci
Exemple 3.2. Si on considère une application linéaire A de Rn dans Rn qui est une isométrie
dans le sens ci-dessus : on a A∗ geucl = geucl , ce qui est bien équivalent au fait que A.AT = I2 .
Coordonnées locales : Soit (E1 , ..., En ) une base locale 1 de TM , et (ϕ1 , ..., , ϕn ) sa base
duale. Alors une métrique Riemannienne peut s’écrire localement comme :
X
g = gij ϕi ⊗ ϕj = gij ϕi ⊗ ϕj
i,j
3.1.2 Exemples
Un premier exemple est Rn muni de la métrique euclidienne g, qui est le simple produit
scalaire (x, y) 7→ x| y avec l’identification Tx Rn = Rn . La matrice de g dans la base canonique
est alors In = (δi,j ).
D’autres exemples de métrique Riemannienne arrivent naturellement quand on considère des
sous-variétés, des produits ou des quotients de variétés.
Définition 3.5 (Métrique sur une sous-variété). Soit (M f, ge) une variété Riemannienne. Soit M
une sous variété de M̃ . Alors la restriction de g̃ aux vecteurs tangents de M est une métrique
Riemannienne car la restriction d’un produit scalaire à un sous espace vectoriel est encore un
produit scalaire.
C’est ainsi qu’on a précédemment définit une métrique sur le tore, et c’est aussi de cette
manière qu’on définit la métrique de S n ⊂ Rn+1 .
Dans la pratique, on supposera souvent M̃ ⊂ Rm et la donnée d’un paramétrage local, i.e. un
plongement 2 d’un ouvert U ⊂ Rn dans M̃ dont l’image est un ouvert de M ). En se donnant un
tel paramétrage X : U → Rm d’une sous variété M ⊂ Rm avec la métrique induite, on dispose
de la formule ci-dessous pour calculer cette métrique dans la base canonique de U :
n
m X
X ∂X i 2
g= duj .
i=1 j=1
∂uj
1
dui .duj = dui ⊗ duj + duj ⊗ dui .
2
Exercice 3.1. Retrouver directement à partir de cette formule la métrique induite sur le tore
définie dans l’exemple 3.1.
Exercice 3.2. Soit γ(t) = (a(t), b(t)), t ∈ I (un intervalle ouvert) une courbe lisse injective dans
le plan xz. On suppose que ∀t ∈ I, a(t) > 0 et γ̇(t) 6= 0
Soit M R3 la surface obtenue par révolution de γ autour de l’axe des z
— Montrer que M est une sous variété de R3 , et que M est un plongement si γ en est un.
— Montrer que ϕ(θ, t) = (a(t)cos(θ), a(t)sin(θ), b(t)) est un paramétrage local de M au
voisinage de tout point.
— Calculer l’expression de la métrique induite sur M sur le point de coordonnée (θ, t).
— appliquer ce calcul au cas du tore donné par (a(t), b(t)) = (2 + cos(t), sin(t)).
Soit g une métrique sur M, on définit l’application (dit ”flat” ou ”bémol”) de T M dans
T ∗ M comme suit : pour le vecteur X ∈ Tp M on définit le covecteur X [ ∈ Tp∗ M par
X [ (Y ) := g(X, Y )
Donc la matrice de flat dans une base et sa base duale est celle de g. Cette matrice est inversible,
ainsi cette opération est aussi inversible. Donc on peut définir l’operateur inverse (dit ”dièse” ou
”sharp”) ω → ω ] . En coordonnées, ω ] a les composantes :
ω i := g ij ωj ,
où, par définition, g ij sont les composantes de la matrice inverse (gi j)−1 .
∀Y ∈ T M, df (Y ) = hgrad(f ), Y i.
Cette n-forme (noté aussi dVg ) est appelé l’élément de volume. L’importance de l’élément
de volume est qu’il permet d’intégrer des applications. Si f est une fonction lisse Ravec le
support compact, alors f dV est une n-form avec le support compact. Alors l’integral M f dV
est
R bien défini et est appelé l’integral de f sur M . De même, le volume de M est défini comme
.
R
M
dV = M
1dV
Un exemple notable d’une telle métrique est la métrique de Minkowski dans R4 : c’est
un invariant fondamental dans la théorie de la relativité restreinte d’Einstein. On peut l’expri-
mer succinctement en disant qu’en l’absence de gravité, les lois de la physique sont les mêmes
dans tout système de coordonnées, dans lequel la métrique a une expression dx21 +dx22 +dx23 −dt2 .
La théorie de la relativité générale inclut les effets gravitationnels en permettant la métrique de
varier point à point.
3.4.2 La sphère
La sphère SR n
de Rn+1 , munie de la métrique g 0 induite par celle sur Rn+1 , est une autre
variété Riemannienne canonique. La première propriété qui nous vient à l’esprit est la grande
symétrie de la sphère.
On dit que la variété Riemannienne M est homogène, s’il existe un groupe de Lie opè-
rant de manière lisse et transitivement par isométries sur M . Donc, pour chaque couple de
points de M on peut trouver une isométrie qui envoie l’un sur l’autre.
Si p ∈ M , on dit que M est isotrope dans p s’il existe un groupe de Lie opèrant par isométries
transitivement sur l’ensemble des vecteurs unitaires de Tp M .
Plus simplement, une variété homogène a les mêmes propriétés géométriques à chaque point, et
une variété isotrope a les mêmes propriétés à chaque direction.
La sphère est homogène et isotrope à chaque point. On peut le voir facilement : l’action
du groupe orthogonal O(n + 1) sur Rn+1 préserve la sphère, la métrique euclidien, et opère
transitivement sur les bases orthonormées sur la sphère.
Outre sa grande symmétrie, la sphère est localement équivalente de manière conforme à
l’espace euclidien.
Définition : deux métriques g et g 0 sur une variété M sont dites conformes l’une avec l’autre
s’il existe une fonction positive f ∈ C ∞ (M ) telle que g = f g 0 . Deux variétés Riemmanniennes
(M, g) et (M 0 , g 0 ) sont dites équivalentes de manière conforme s’il existe un difféomorphisme
ϕ : M −→ M 0 tel que g 0 ◦ ϕ soit conforme à g.
En fait, deux métriques sont conformes si et seulement si elles définissent les mêmes angles mais
pas nécessairement les mêmes longueurs.
On obtient que :
Rξ
σ(ξ, τ ) = .
R−τ
3.4. Les espaces canoniques de la géométrie Riemannienne 43
On peut montrer que cette projection rendent bien équivalents la sphère et le plan. En
fait, on peut interpréter cette propriété par le fait que la projection stéréographique conserve les
angles entre des vecteurs tangents à la sphère et leurs images par σ.
De plus, les méridiens sont des droites passant par l’image du pôle Sud, et les parallèles sont des
cercles.
Exercice. Soit P un polyèdre qui est équivalent combinatoirement à un cube (c’est à dire
il a 8 sommets, 6 faces quadrangulaire, à chaque sommet il y a trois faces). Montrer que si 7 de
sommets se trouvent sur une sphère, le dernier sommet aussi y se trouve.
Exercice Montrer qu’il est impossible de construire le centre du cercle en utilisant uniquement
la règle. (Indication : il existe une projection de le plan sur un autre plan, qui projete le cercle
vers le cercle, mais ne projete pas le centre vers le centre).
M : R × [−π, π] → R3 ,
(3.8)
(Z, θ) 7→ R(Z)(cos θ, sin θ, 0) + h(Z)(0, 0, 1)
puis calculer la métrique pull-back associée à M −1 sur la carte Mercator. Cette projection est
souvent employée par les marins, et pour les planisphères usuels. Elle ne conserve pas les distances
(comparer la taille du Groenland et de l’Afrique), mais on peut se faire une idée de la déformation
avec la figure suivante. Faites attention aux cercles à chaque point - ils ne sont pas déformés.
(a) Projection Mercator : C = M (S) (b) Les cercles bleus sont de rayons constant
pour la métrique pull-back (M −1 )? geucl,S 2 .
Paul Fraux,
Manolis Perrot,
Massil Hihat,
Ivan Yakovlev
Sans souci
Chapitre 4
Basile Coron,
Yohan Mandin
4.1 Dériver des champs de vecteurs ? -Huble, Lucas
Rey, Louis-
Intuitivement, une géodésique correspond à une courbe de M aussi droite que possible. Dans Pierre Chaintron
l’espace euclidien usuel Rn , les géodésiques sont précisément les droites, qui se caractérisent Technique
comme les courbes d’accélération nulle. Considérons une variété plongée dans un espace euclidien :
on pourrait de même envisager de calculer l’accélération d’une courbe γ(t) par dérivation double,
puis projeter orthogonalement ce vecteur sur l’espace tangent à M en γ(t). Dans une variété
quelconque, cela ne marche pas : dériver dans un système de coordonnées quelconque donne un
vecteur vitesse indépendant de ce système, mais il n’en va pas de même pour l’accélération.
Exemple 4.1. Considérons le cercle dans le plan. Il peut être paramétré par γ : t 7→ (cos(t), sin(t)).
Le champ des vecteurs vitesse obtenu est alors γ̇ : t 7→ (− sin(t), cos(t)) et en dérivant une fois
de plus, on obtient γ̈ : t 7→ (− cos(t), − sin(t)).
En coordonnées polaires, on peut utiliser le paramétrage t 7→ (1, t), qui donne le champ de vec-
teurs vitesse t 7→ (0, 1) : on retrouve bien ce qui précède. Néanmoins cela ne fonctionne plus pour
l’accélération : dériver deux fois donne le vecteur nul.
Il manque donc une définition intrinsèque de l’accélération. Les vecteurs vitesses évoluant dans
des fibres tangentes a priori très différentes, on ne peut définir l’accélération comme on l’a fait
pour la vitesse (les positions appartenaient toutes au même espace). La première étape consiste
à introduire un nouvel opérateur, la connexion, qui va permettre de relier les espaces tangents.
Elle permet de définir la notion de dérivée covariante d’un champ de vecteurs selon une courbe,
pour enfin arriver aux géodésiques et au transport parallèle.
∀ q ∈ M, X(q) ∈ Tq M. (4.1)
47
Séance 4 48 Chapitre 4. Connexions et courbes géodésiques
[Lee97], Chap. 4
Basile Coron, qui est une expression bien définie si X(q) est un vecteur de l’espace tangent. Une connexion
Yohan Mandin affine sur M est une application ∇ : T (M ) × T (M ) → T (M ) qui vérifie les propriétés suivantes :
-Huble, Lucas Linéarité à gauche Pour f, g ∈ C ∞ (M, R), ∇f X1 +gX2 Y = f ∇X1 Y + g∇X2 Y
Rey, Louis- R-linéarité à droite Pour a, b ∈ R, ∇X (aY1 + bY2 ) = a∇X Y1 + b∇X Y2
Pierre Chaintron Leibnitz-linéarité à droite Pour f ∈ C ∞ (M, R), ∇X (f Y ) = f ∇X Y + (Xf )Y
Technique
Remarque 4.1. A priori, le comportement de ∇X (Y ) en p dépend de celui de X et Y sur toute
la variété, et pas seulement en p. C’est pourquoi la propriété de linéarité à gauche est globale et
distincte d’une simple R-linéarité.
Exemple 4.2. Sur Rn (ou plus généralement sur tout ouvert U de Rn , la connexion naturelle,
appelée connexion euclidienne, est :
n
X
∇X Y = (XY i )∂i = (XY i )∂i (4.3)
i=1
en utilisant la notation sommatoire d’Einstein, ce qu’on fera toujours par la suite. Définie à partir
d’un système de coordonnées locales arbitraire, ∂i est l’application qui à p ∈ M associe le i-ème
vecteur d’une base de Tp M convenue. Dans Rn , c’est l’application constante donnant le i-ième
vecteur de la base canonique. Le cas euclidien permet de voir un champ de vecteurs comme une
application f ∈ C ∞ (U, Rn ). On a alors plus simplement
Remarque 4.2. On a vu au chapitre précédent qu’une structure métrique était en gros la don-
née d’une base orthonormée (e1 (q), e2 (q), . . . , en (q)) en chaque point q d’une carte. Il est donc
raisonnable de penser que, pour comprendre les courbes géodésiques, il faille décrire la manière
dont évolue un champs de bases (ou, ce qui est équivalent, n champs de vecteurs e1 (·), . . . , en (·))
avec le point courant q.
De même qu’une métrique riemannienne est la notion infinitésimale qui correspond à la
longueur d’une courbe, une connexion doit être vue comme la différentielle par rapport au point
de base q du transport d’un vecteur Y le long d’un déplacement Xdt :
Démonstration. Par linéarité, il suffit de montrer que X(p) = 0 entraine ∇X Y (p) = 0. Consi-
dérons un voisinage U de p sur lequel on dispose d’un système de coordonnées permettant la
décomposition X = X i ∂i . Le lemme précédent assure que la valeur de ∇X Y en p ne dépend que
du comportement de X et Y , ce qui permet d’utiliser localement les propriétés de la connexion :
Soit maintenant U un ouvert de M muni d’un système de coordonnées locales. Chaque ∇∂i ∂j se
décompose dans la base (∂k ), d’où n3 fonctions Γkij ∈ C ∞ (M, R) telles que :
Basile Coron, Ce résultat est du type « opérateur algébrique déterminé par des paramètres scalaires ». C’est
Yohan Mandin l’analogue pour les connexions (i.e. les applications linéaires à gauche, Leibniz-linéaires à droite)
-Huble, Lucas du célèbre résultat de prépa : « une application linéaire est entièrement déterminée par l’image
Rey, Louis- de la base canonique ». Les symboles de Christoffel sont donc moralement les « coefficients » de
Pierre Chaintron la connexion : nous verrons au chapitre suivant comment on peut les relier aux coefficients de
Technique la métrique g. Nous allons maintenant voir comment construire des connexions sur une variété.
Sans surprise, il suffira de donner explicitement les « coordonnées dans la base canonique »,
les fameux symboles de Christoffel : le lemme suivant montre comment construire toutes les
connexions affines sur une variété couverte par un seul système de coordonnées (un ouvert de Rn
par exemple).
Lemme 4.4. Soit M une telle variété différentielle. La donnée d’une connexion affine sur M
revient exactement à la donnée de n3 fonctions Γkij ∈ C ∞ (M, R) par la formule :
Démonstration. À une connexion sur M on associe n3 telles fonctions, qui sont entièrement
déterminées par la connexion. Réciproquement, avec n3 fonctions Γkij ∈ C ∞ (M, R) un calcul
montre que la formule ci-dessus défini bien une connexion ayant pour coefficients de Christoffel
les Γkij .
En recollant les connexions affines obtenues sur les ouverts d’un revêtement de M , on obtient
alors le résultat suivant :
Propriété 4.1. Sur toute variété il existe une connexion affine.
Démonstration. On recouvre M par des ouverts (Uα ) : sur chacun d’eux on a une connexion ∇α .
On se donne une partition de l’unité
P (ϕα ), i.e. une famille de fonctions lisses
Ptelle que ϕα soit à
support dans Uα pour tout α, et α ϕα = 1 sur M . Alors ∇ : (X, Y ) → α ϕα ∇α X Y est une
connexion sur M .
Remarque 4.4. Une combinaison linéaire de connexions n’en est pas nécessairement une, à cause
de la Leibniz-dérivation. ∇ et ∇0 étant deux connexions, ni 12 ∇ ni
P∇ + ∇ n’en sont en général.
0
Définition 4.2. Un champ de vecteurs le long de la courbe γ est une application V de classe C ∞
de I dans T M , telle que V (t) ∈ Tγ(t) M pour tout t dans I . On note T(γ) l’espace des champs
de vecteurs le long de γ.
Lemme 4.5. Pour toute courbe γ, une connexion affine ∇ détermine un unique opérateur :
vérifiant
R-linéarité Dt est linéaire.
Leibnitz-linéarité Pour toute f ∈ C ∞ (I), Dt (f V ) = f˙V + f Dt V
Compatibilité avec ∇ Pour V extensible d’extension Ve , ∀t0 ∈ I, Dt V (t0 ) = ∇γ̇(t0 ) (Ve ◦ γ)(t0 ).
Un tel opérateur dépend seulement localement des valeurs de γ. γ̇ n’étant pas un élément de
T (M ), i.e. un champ de vecteurs tangents défini sur M , la notation ∇γ̇(t0 ) peut paraitre abusive.
Néanmoins ∇X (Y )(p) ne dépend que de X(p), et du comportement de Y au voisinage de p : la
décomposition de ∇ par les symboles de Christoffel assure que tout ceci à un sens. Si l’espace
tangent Tγ̇(t0 ) M est identifié à M , on peut aussi voir γ̇(t0 ) comme un champ constant de M
dans T M .
Démonstration. Fixons t0 dans I ainsi qu’un voisinage de γ(t0 ) pour lequel on dispose d’une base
locale de l’espace tangent en chaque point : {Ei } de sections associées {∂i }. Dans cette base un
champ de vecteurs V étendu en Ve s’écrit :
X
Ve = Ve j ∂j = Ve j ∂j (4.15)
j
Pour l’existence, on vérifie que l’opérateur défini par cette formule a les propriétés souhaitées.
4.4 Géodésiques
Ayant construit une dérivation formelle sur les courbes, on peut revenir à notre objet initial :
l’étude des géodésiques.
Définition 4.3. On appelle géodésique toute courbe γ telle que Dt γ̇ est nul, ce que l’on note
souvent 1 :
∇γ̇ γ̇ = 0 (4.19)
1. Il s’agit d’un abus, dans la mesure où γ̇ n’est pas un champ M → T M
Séance 4 52 Chapitre 4. Connexions et courbes géodésiques
[Lee97], Chap. 4
Remarque 4.5. Dans le cas de la connexion euclidienne, tous les symboles de Christoffel sont
nuls et l’équation des géodésiques devient γ̈ = 0 : les géodésiques sont des droites, parcourues à
vitesse constante (unitaire si on prend un paramétrage normal
Remarque 4.6. L’équation (4.20) peut être vue comme une équation de contrôle d’ordre 2 sur le
point courant γ(t) : la commande de vitesse γ̇ est ajustée en temps réel pour rester “constante”
au sens de ∇,
(4.21)
γ̇(t + dt) = γ̇(t) + dt · Bγ(t) γ̇(t) , γ̇(t)
où Bγ(t) est une forme bilinéaire. Le “problème” est ici que ce contrôle quadratique peut exploser
en temps fini : j’en veux pour preuve le cas classique de l’équation différentielle réelle
ẏ = 1 + y 2 , (4.22)
dont les solutions t 7→ tan(t − t0 ) ne peuvent être définies sur des intervalles de longueurs
supérieures à π, ou de l’équation
ẏ = y 2 , (4.23)
dont les solutions t 7→ − t−t
1
0
divergent en temps fini dans une direction et s’écrasent dans l’autre.
Remarque 4.7. Le théorème de Cauchy-Lipschitz ne permet donc pas a priori de disposer de
géodésiques définies pour tout temps. En anticipant sur les chapitres suivants et le lien entre
géodésiques “au sens des connexions” et géodésiques “qui minimisent la longueur”, il n’est pas
difficile de produire des contre-exemples explicites.
Ainsi, sur la bande − 1, +1 × R munie de la métrique euclidienne canonique geucl , on pourra
√ √ √ √
montrer que la courbe γ : t ∈ − 2, + 2 7→ t/ 2, t/ 2 est une géodésique (au sens de
la connexion métrique associée) de vitesse unitaire qui ne peut être prolongée : les bords du
domaine sont atteints !
Si l’on veut des géodésiques qui vont à l’infini “pour de vrai” (ce qui n’est pas un notion
intrinsèque), il suffit de considérer le changement de coordonnées
ϕ: R×R → − 1, +1 × R
(4.24)
(x, y) 7→ (2 arctan(x)/π , y)
4.5. Transport parallèle 53
√ √
et de munir R × R de la métrique pull-back ϕ? geucl . La courbe ϕ−1 ◦ γ : − 2, + 2 → R × R
est alors une géodésique pour la connexion associée, qui explose à l’infini aux deux bornes de
l’intervalle de définition – on sait en effet que ϕ est une isométrie entre R × R , ϕ? geucl et
] − 1, +1[ × R , geucl .
Remarque 4.8. La linéarité de l’équation est cruciale pour obtenir l’existence du champ parallèle
sur toute la courbe γ. On a en effet remplacé l’équation de contrôle quadratique (4.21) par le
contrôle linéaire
(4.26)
V (t + dt) = V (t) + dt · Bγ(t) γ̇(t) , V (t)
où q 7→ Bq (·, ·) est une application continue de M dans l’espace des formes bilinéaires muni de
la norme d’opérateur – nous travaillons en dimension finie. Si kBq k était uniformément borné, le
très utile lemme de Grönwall permettrait alors d’assurer un résultat intuitivement crédible :
et donc, par complétude de R, la bonne définition de solutions sur R tout entier – Cf. un grand
classique de spé, le “théorème des bouts”.
Notez qu’en toute généralité, kBq k n’est pas uniformément bornée... Mais comme elle est
continue et que l’image par γ de tout intervalle [0, T ] est compacte, on peut toujours prolonger
“raisonnablement” l’intervalle de définition d’une solution de l’équation (4.25) et donc, en utilisant
les arguments habituels, obtenir des prolongement à R tout entier des solutions.
Soient alors γ une courbe dans M définie sur un intervalle I et t0 , t1 deux réels de I. On peut
définir une fonction Pt0 t1 : Tγ(t0 ) M → Tγ(t1 ) M qui à un vecteur V0 associe le vecteur V1 défini
par V1 = V (t1 ) avec V l’unique champ de vecteurs parallèle le long de γ tel que V (t0 ) = V0 .
On peut donc “transporter” un vecteur tangent le long de la courbe γ. Réciproquement, on peut
revenir du global au local par un taux d’accroissement classique.
Séance 4 54 Chapitre 4. Connexions et courbes géodésiques
[Lee97], Chap. 4
Basile Coron,
Yohan Mandin
-Huble, Lucas
Rey, Louis-
Pierre Chaintron
Technique
Chapitre 5
Nicolas Masson,
Pascal Millet,
5.1 Connexion associée à une métrique Riemannienne Raphaël Barboni,
Antoine Le Calvez
On cherche à associer de manière naturelle une connexion à une variété M sur laquelle est Équilibré
définie une métrique Riemannienne. On demande pour cela deux propriétés (compatibilité avec la
métrique et symétrie) qui sont naturelles dans le sens où elles déterminent une unique connexion
qui coïncide avec celle induite par la connexion euclidienne si on plonge la variété M dans Rn
(ce qui est toujours possible d’après un théorème de Nash).
∇⊥ ⊥
X Y := π (∇X̃ Ỹ ) (5.1)
Démonstration. L’application est bien définie. En effet, ∇X̃ Ỹ (P ) ne dépend que de X̃(P ) et de Ỹ
le long d’une courbe passant par P et de vecteur tangent X(P) en P. Cela résulte de l’expression
de ∇X Y sur un voisinage U de P, démontrée au chapitre précédent :
Grâce à cette remarque, on ne notera plus les˜dans la suite. Le caractère C ∞ provient du fait que
la projection M → L(Rn ), P 7→ πP⊥ est C ∞ . Les deux premiers axiomes de linéarité sont évidents
avec la linéarité de π ⊥ . Soit f ∈ C ∞ (M ), on a f Ỹ qui prolonge f Y , donc on peut écrire :
∇⊥ ⊥
X f Y = π ((Xf )Y + f ∇X Y ) (5.3)
⊥ ⊥
= (Xf )π Y + f π ∇X Y linéarité de π ⊥
(5.4)
= (Xf )Y + f ∇⊥
XY car Y est déjà dans l’espace tangent (5.5)
55
Séance 5 56 Chapitre 5. Géodésiques Riemanniennes
[Lee97], Chap. 5
On utilise la définition des ∂i pour calculer une base de l’espace tangent au point P (θ, ϕ). Comme
le tore est plongé dans R3 , ils peuvent être exprimés dans la base canonique :
−(b cos ϕ + a) sin θ
∂θ (θ, ϕ) = +(b cos ϕ + a) cos θ (5.7)
0
− sin ϕ cos θ
∂ϕ (θ, ϕ) = b − sin ϕ sin θ (5.8)
cos ϕ
Il est également utile de calculer les coordonnées du vecteur normal à la surface du tore en P (θ, χ)
cos ϕ cos θ
n(θ, ϕ) = cos ϕ sin θ (5.9)
sin ϕ
−b sin ϕ
∇∂θ ∂ϕ (P ) = ∂θ (5.10)
a + b cos ϕ
−b sin ϕ
∇∂ϕ ∂θ (P ) = ∂θ (5.11)
a + b cos ϕ
sin ϕ
∇∂θ ∂θ (P ) = (b cos ϕ + a) ∂ϕ − cos ϕn (5.12)
b
∇∂ϕ ∂ϕ (P ) = −bn (5.13)
(a) Sur la carte 2D, on peut faire les calculs (b) En 3D, le résultat est bien conforme à nos
simplement – modulo les Christoffels. attentes !
Figure 5.1 – Géodésiques de longueur 3π/2 tirées à partir du grand équateur, sur le tore de
rayon médian 2 et de section 1. Les trajectoires sont intégrées par une simple méthode d’Euler,
sur un domaine rectangulaire périodique (θ, ϕ) ∈ S 1 × S 1 .
Équation géodésique :
−b sin ϕ
γ̈ θ + 2γ̇ θ γ̇ ϕ = 0 (5.18)
a + b cos ϕ
sin ϕ
γ̈ ϕ + (γ˙θ )2 (b cos ϕ + a) = 0 (5.19)
b
Nicolas Masson, 3. Pour toute courbe γ sur M , si U et V sont deux champs de vecteurs parallèles le long
Pascal Millet, de γ, hU, V i est constant.
Raphaël Barboni, 4. Pour toute courbe γ et pour tout réels t0 et t1 de l’intervalle de définition de γ, le transport
Antoine Le Calvez
parallèle le long de γ de γ(t0 ) à γ(t1 ) est une isométrie. Autrement dit le transport parallèle
Équilibré
conserve la norme des vecteurs.
Démonstration. Traitons les implications suivantes :
1)⇒2) Par définition de Dt et car ∇ est compatible avec g,
où γ est un chemin tel que γ(0) = P et γ 0 (0) = X(P ). On a supposé que transporter parallèlement
les vecteurs le long de γ ne change pas le produit scalaire. On notera X(P 0 )P le vecteur du champ
X au point P 0 transporté parallèlement au point P le long de γ.
On a donc
1
X(P )hY, Zi = lim [hY (γ(t))P , Z (γ(t))P i −hY (P ), Z(P )i] (5.26)
t→0 t
On obtient l’égalité voulue avec la continuité du produit scalaire sur TP M 2 (vraie pour une
application bilinéaire en dimension finie).
Remarque 5.2. A priori l’unicité d’un connexion ∇ compatible avec la métrique g n’est pas
assurée. On cherche donc dans la suite à renforcer les hypothèses pour avoir une connexion
canonique associée à la métrique g.
5.1.4 Symétrie
Définition 5.2. On dit qu’une connexion est symétrique si elle vérifie :
∇X Y − ∇Y X = [X, Y ] (5.29)
Où [X, Y ] désigne un champ de vecteur appelé crochet de Lie de X et Y , qui quantifie le défaut de
commutativité des flots de X et Y – c’est une notion abordée en cours de géométrie différentielle,
5.2. Géodésiques et isométries 59
qui ne dépend que des champs de vecteurs et de la structure de variété. Nous ne l’utiliserons pas
par la suite. Pour la démonstration de l’unicité de la connexion de Levi-Civita, il suffit de savoir
que [X, Y ] ne dépend pas de ∇.
Exemple 5.1. La connexion tangentielle sur M sous-varieté de Rn est à la fois symétrique et
compatible avec la métrique.
Théorème 5.1 (Théorème fondamental de la géométrie riemannienne). Soit (M, g) une variété
riemannienne. Il existe une unique connexion linéaire compatible avec g et symétrique. Elle est
appelée connexion de Levi-Civita.
Démonstration. On montre ici l’unicité. Puisque ∇ respecte g, on a :
En sommant les deux premières lignes, en soustrayant la troisième puis en réarrangeant les
termes, il vient :
1
h∇X Y, Zi = XhY, Zi + YhZ, Xi − ZhX, Y i −hY, [X, Z]i +hX, [Z, Y ]i (5.36)
2
Cette expression ne dépend pas de ∇. Donc, puisqu’un vecteur V est uniquement déterminé par
la forme linéaire hV, .i, le champ de vecteur ∇X Y est uniquement déterminé par cette égalité.
Pour l’existence, on pose pour tout système de coordonnées locales les symboles de Christoffel
(qui déterminent entièrement la connexion) :
1 kl
Γkij = g (∂i gjl + ∂j gil − ∂l gij ), (5.37)
2
où les g kl désignent les coefficients de la cométrique g −1 . Il faudrait alors démontrer que la
connexion est bien définie, qu’elle vérifie la propriété de symétrie et la compatibilité avec g
mais nous ne le ferons pas ici. L’important pour la suite est de retenir que l’on peut calculer les
symboles de Christoffel de la connexion de Levi-Civita à partir des coefficients de la métrique.
Remarque 5.3. La connexion tangentielle sur une sous-varieté de Rn est donc la connexion de
Levi-Civita sur cette sous-varieté.
Nicolas Masson, Proposition 5.1. Soit ϕ : (M, g) → (M̃ , g̃) une isométrie.
Pascal Millet, ˜ de
1. ϕ envoie la connexion Riemannienne ∇ de (M, g) sur la connexion Riemannienne ∇
Raphaël Barboni,
g̃, au sens où :
Antoine Le Calvez ˜ dϕX (dϕY )
Équilibré ϕ∗ (∇X Y ) = ∇ (5.38)
2. Si γ est une courbe et V un champ de vecteurs le long de γ, alors
Reste à voir si cette géodésique n’explose pas aux bords de la variété avant le temps 1.
Définition 5.3. On définit le domaine de la carte exponentielle par :
= c2 Dt γ̇(ct) = 0 (5.47)
Le point clé est donc que, tant pour l’accélération γ̈ que pour le contrôle quadratique en γ̇, dilater
l’axe du temps par c fait sortir un facteur c2 .
Remarque 5.4. La carte exponentielle est donc la carte des géodésiques partant d’un point donné
de la varieté. Si V ∈ T M , γV est donné par :
γV (t) = expp (tV ) (5.48)
Séance 5 62 Chapitre 5. Géodésiques Riemanniennes
[Lee97], Chap. 5
Tp M
dϕ
/ Tϕ(p) M̃ (5.49)
expp expϕ(p)
M / M̃
ϕ
ϕ := E −1 ◦ exp−1 n
p :U →R . (5.50)
Tout paramétrage de ce type est appelé système de coordonnées Riemanniennes normales
centré en p. Dans un tel système, il est naturel de définir la distance radiale :
!1/2
i 2
X
(5.51)
r(x) := x
i
5.4. Voisinages normaux et coordonnées normales 63
∂ xi ∂
:= (5.52)
∂r r(x) ∂xi
Ces dernières définitions sont tout à fait intuitives dans un espace euclidien, et la proposition
suivante permet de transposer cette intuition dans une variété Riemannienne quelconque :
Proposition 5.5. Soit (U, (xi )) un systèmes de coordonnées Riemanniennes normales centré en
p ∈ M . On a alors :
Les coordonnées normales étant un outil essentiel pour calculer en géométrie Riemannienne,
ces propriétés doivent être comprises. De plus, comme évoqué précédemment, elles transposent
l’intuition que l’on peut avoir dans un espace euclidien : une géodésique est une ligne droite
dans un système de coordonnées normales. En revanche il est compliqué d’estimer précisement
la distance entre deux points de la varieté qui sont différents du point d’origine à l’aide d’un tel
système.
Séance 5 64 Chapitre 5. Géodésiques Riemanniennes
[Lee97], Chap. 5
partant du pôle nord N dont la vitesse initiale V est un multiple de ∂1 . Il paraît intuitivement
évident par symétrie que cette géodésique doit rester sur le méridien x2 = ...xn = 0 – voir
Figure 5.4. Pour le montrer rigoureusement, supposons l’existence d’un temps t0 et d’un indice
2 ≤ i ≤ n tels que xi (t0 ) 6= 0. On peut considérer la réflexion ϕ : Rn+1 → Rn+1 qui envoie xi sur
−xi en conservant les autres directions : elle induit une isométrie de la sphère dans elle-même
qui préserve N ainsi que V . Par conséquent, la proposition 5.1 associée à l’unicité des solutions
au problème de Cauchy
(
γ(0) = N
(ShootN,V ) : (5.56)
γ̇(0) = V
permet d’assurer que ϕ ◦ γ = γ, ce qui est faux car par hypothèse ϕ(γ(t0 )) 6= γ(t0 ).
5.5. Géodésiques des espaces classiques 65
Conclusion Les géodésiques des espaces homogènes que sont le plan et la sphère sont donc
particulièrement simples à décrire. Pour le tore, les surfaces arbitraires ou les espaces de formes
et de landmarks, nous ne pourrons pas en dire autant... Avant d’attaquer ces problèmes difficiles
(et riches !), nous consacrerons le chapitre qui vient à l’étude explicite des géodésiques du dernier
espace homogène canonique : le plan hyperbolique, ou disque de Poincaré, introduit lors de la
première séance. Ce sera l’occasion de réviser les notions clés introduites depuis le début du
cours, et de nous forger une intuition des espaces à courbures négatives.
Séance 5 66 Chapitre 5. Géodésiques Riemanniennes
[Lee97], Chap. 5
Nicolas Masson,
Pascal Millet,
Raphaël Barboni,
Antoine Le Calvez
Équilibré
Chapitre 6
Vadim Lebovici,
Robin Lemaire,
Introduction Valentin Carlier,
Lino Benedetto
Depuis Euclide et ses 5 postulats de la géométrie, les mathématiciens ont longtemps cherché à Très joli
démontrer le cinquième postulat, ou axiome des parallèles, à partir des quatre autres. Bien leur en
prit, car en cherchant à démontrer l’absurdité d’une géométrie dans laquelle cet axiome n’est pas
respecté, ils ont ouvert la voie aux géométries non-euclidiennes, dont la géométrie hyperbolique,
qui nous intéresse ici. Elle peut être définie notamment en gardant les quatre premiers postulats
d’Euclide, et en substituant au cinquième celui-ci : “Soient un point et une droite, alors il existe au
moins une droite parallèle à ce point.” On notera également que le mot “droite” est ici synonyme
de “géodésique”, soit une courbe à accélération nulle, ou encore un chemin minimisant la distance
entre deux point.
On utilisera dans la suite cinq modèles analytiques de géométrie hyperbolique parmi les plus
importants. Trois d’entre eux sont des modèles conformes dus à Henri Poincaré, qu’il imagina
lors de son étude des automorphismes complexes.
67
Séance 6 68 Chapitre 6. Le plan hyperbolique
[CFK+ 97]
Vadim Lebovici,
Robin Lemaire,
Valentin Carlier,
Lino Benedetto
Très joli
où l’on identifie les deux feuillets de l’hyperboloïde par quotient “x = −x”. On peut le voir comme
une sphère de Rn+1 de rayon au carré -1.
6.1.2 Cas n = 1
Comparons l’étude du cercle euclidien avec celle de l’espace H 1 .
Si on paramètre le cercle unité dans l’espace euclidien par un chemin lisse p :] − ∞, +∞[→ S 1
avec p(0) = (0, 1), on peut écrire p(t) = (x(t), y(t)) et x2 + y 2 = 1. Dans le plan hyperbolique si
pH :] − ∞, +∞[→ H 1 est une chemin lisse avec pH = (1, 0), on peut écrire pH (t) = (x(t), y(t))
et x2 − y 2 = −1.
En différentiant ces équations on obtient :
Ce qui exprime que le vecteur vitesse est orthogonal au vecteur position sur le cercle dans chacun
des deux cas. On peut en particulier écrire :
Figure 6.2 – Comparaison entre cercle et hyperbole, entre trigonométrie classique et trigono-
métrie hyperbolique.
6.2.1 Définitions
Définition 6.2. On définit les modèles suivants du plan hyperbolique :
Vadim Lebovici, Proposition 6.1. On constate immédiatement les propriétés d’invariance suivantes :
Robin Lemaire, — ds2H est invariante par translation sur x2 , x3 ( mais pas x1 ),
Valentin Carlier, — ds2H est invariante par dilatation de l’espace ((x2 , x3 ) 7−→ (hx2 , hx3 ) pour h > 0).
Lino Benedetto — ds2I et ds2J sont invariantes par rotations d’axe x3 .
Très joli
Figure 6.3 – Les cinq modèles du plan hyperbolique vus dans le plan (x1 , x3 ), et les projections
associées qui sont des isométries.
Démonstration. Nous allons décrire des isométries entre ces espaces. Pour cela on utilisera J
comme espace référent, et on trouvera des isométries de J vers les autres modèles ou inversement.
On rédige la preuve pour H et I, qui sont nos espaces d’études privilégiés – les deux autres cas
étant analogues.
Nos cinq modèles étant définis dans R3 , on définira les fonctions comme suit :
α : J → H est la projection stéréographique à partir du point (−1, 0, 0) sur H :
2 x2 2 x3
α : J → H, (x1 , x2 , x3 ) 7→ 1, , . (6.17)
x1 + 1 x1 + 1
Comme projection, α est bien à valeurs dans H et est définie sur tout J. De plus, on montre
que la métrique ds2H est la métrique pull back de ds2J par α :
Soient j = (x1 , x2 , x3 ) et h = α(x) = (1, y2 , y3 ) (avec yi = x21x+1
i
). Alors en “notations
physiciennes”, dy = dαx · dx, i.e.
2 xi
dyi = dxi − dx1 (6.18)
xi + 1 x1 + 1
On sait de plus que x21 + x22 + x23 = 1. En notation physiciennes, l’équation du plan tangent s’écrit
donc
x1 dx1 = −(x2 dx2 + x3 dx3 ) (6.19)
6.2. Cinq modèles en dimension 2 71
Ainsi, on a :
dy22 + dy32
α? (ds2H ) = (6.20)
y32
3
!
(x1 + 1)2 4 X 2 dx21
= 2
dx + 2
x1 dx1 + 2
(1 − x1 ) (6.21)
4 x23 (x1 + 1)2 i=2 i x1 + 1 (x1 + 1)2
3
1 X 2
= dx (6.22)
x23 i=1 i
= ds2J (6.23)
(6.24)
2 2 2 2
!
X 1 X X xi X x2i
dyi2 = dx2i − 2 dx3 dxi + 2
dx23 (6.27)
i=1
x 3 + 1 i=1 i=1
x 3 + 1 i=1
(x 3 + 1)
2
!
2
1 X x3 1 − x3
= 2
dx + 2 2
dx + dx 2
(6.28)
x3 + 1 i=1 i x3 + 1 3 (x3 + 1)2 3
3
1 X
= dxi (6.29)
(x3 + 1)2 i=1
Nous avons ainsi nos cinq modèles de géométrie hyperboliques, et les manières de passer des
uns aux autres. On peut remarquer que deux des quatre isométries présentées sont des projections
stéréographiques d’une sphère sur un plan.
Vadim Lebovici, de la sphère et de la projection orthogonale de son centre sur P . Si x ∈ S \ N , alors on note π(x)
Robin Lemaire, l’intersection entre l’hyperplan P et la droite (euclidienne) reliant N et x. C’est la projection
Valentin Carlier, stéréographique de x sur P .
Lino Benedetto
Très joli
Par exemple, la fonction α de J dans H est la restriction sur J de la projection stéréographique
sur le plan x1 = 1, dont l’image est H.
6.3 Géodésiques
Pour déterminer la forme des géodésiques dans chacun des cinq modèles exposés précédem-
ment, nous allons tout d’abord le faire dans le demi-espace H puis en déduire les résultats dans
les autres modèles en utilisant les propriétés des projections. Le principal outil pour la déter-
mination de la nature des géodésiques dans H est le principe de rétraction qui permet d’établir
l’existence de géodésiques sous certaines conditions.
Théorème 6.4 (Principe de rétraction). Soient X une variété Riemannienne et C :]a, b[→ X
un plongement d’intervalle de R. Supposons de plus qu’il existe une application r : X → Im(C)
appelée rétraction qui réduit les distances au sens où : si on restreint la métrique sur X à Im(C)
alors la métrique pullback par r définie sur tout X est inférieure ou égale à la métrique originale
sur X.
Alors Im(C) contient une géodésique entre chaque paire de ses points.
Autrement dit, on n’a jamais intérêt à sortir de =(C) pour rester “droit”.
6.3. Géodésiques 73
Démonstration. Pour démontrer ce fait, il suffit de considérer un chemin arbitraire entre deux
points de Im(C) et de constater que la rétraction de ce chemin par r est de longueur inférieure
ou égale à la longueur du chemin initial.
Théorème 6.5 (Existence de géodésiques). Dans le modèle H de l’espace hyperbolique, les droites
verticales sont des géodésiques.
Démonstration. Soit une droite verticale C : ]0, ∞[→ H telle que C(t) = (1, x2 , t) ∈ H où x2 est
fixé. On définit la rétraction r sur H par la formule : r(1, z2 , t) = (1, x2 , t) : c’est simplement la
projection horizontale sur notre droite.
dx2 dx2 dx2 +dx2
La métrique pullback est alors : x23 et on a bien : x23 ≤ 2x2 3 . D’où on déduit, par principe
3 3 3
de rétraction, que l’image de C contient une géodésique entre chaque paire de ses points.
De plus si l’on considère deux points de l’image de C (ie sur la droite verticale) et n’importe
quel chemin entre les deux, si ce chemin sort de l’image de C alors on a un des dx2i > 0 autour
de ce point et le chemin est strictement plus long que le chemin restant dans C. De plus, Im(C)
étant une droite verticale il existe une unique géodésiques reliant deux points de C restant dans
l’image de C. Ce qui permet de conclure qu’il existe un unique plus court chemin entre deux
points d’une droite verticale et que ce chemin est tracé le long de la droite.
Théorème 6.6 (Classification des géodésiques de H). Les géodésiques de H sont exacte-
ment les droites verticales et les demi-cercles d’extrémités appartenant à la limite de H :
∂H = {(1, x2 , 0), x2 ∈ R}.
Vadim Lebovici, 5. Deux demi-cercles limites sont les mêmes à une isométrie hyperbolique près.
Robin Lemaire,
Démonstration.
Valentin Carlier,
Lino Benedetto — Les droites verticales sont les géodésiques de H : Le théorème 6.5 et le (1)
Très joli du lemme 6.1 nous assure que les droites verticales sont des géodésiques de H, toutes
identiques à une isométrie hyperbolique près, et contenant chacun un plus court chemin
entre chaque paire de leurs points.
Théorème 6.7 (Caractérisation des géodésiques des modèles standards du plan hyperbolique).
— Les demi-cercles de J sont isométriques aux segments droits de K via la projection verti-
cale, qui sont donc les géodésiques de K.
— Les segments droits de K sont isométriques via la projection centrale aux intersections de
L avec des sous-espaces vectoriels de R3 de dimension 2. Ces intersections sont donc les
géodésiques de L.
(a) Projection des géodésiques de J (b) Projection des géodésiques de J sur celles
sur celles de I. de K.
Comme on peut voir sur la Figure 6.8, les courbes en question sont des droites euclidiennes
non verticales, et non des demi-cercles “géodésiques”.
6.4. Propriétés diverses 77
Propriété 6.3. La somme des angles d’un triangle du plan hyperbolique est inférieure à π. L’aire
d’un triangle d’angles α, β, γ est π − α − β − γ (théorème de Gauss-Bonnet). Si α, β, γ sont
des angles de somme inférieure à π, alors il existe un unique triangle possédant ces angles à
congruence près.
Figure 6.9 – La somme des angles d’un triangle hyperbolique est inférieure à π.
(a) Distances entre deux géodésiques verticales. (b) Distance entre deux points d’une géodésique.
Vadim Lebovici,
Robin Lemaire,
Valentin Carlier,
Lino Benedetto
Très joli
Propriété 6.5. Dans le plan hyperbolique, le ratio de l’aire d’un disque à sa circonférence est
inférieure à 1, et tend vers 1 quand le rayon tend vers l’infini. L’aire et la circonférence sont
toutes deux des fonctions exponentielles du rayon hyperbolique.
On se place dans l’espace du disque I et on calcule un élément de distance le long d’un arc
de cercle ds = 2 1−r
dr
2 et un élément d’aire dA = (1−r 2 )2 drdθ. Si alors ρ est le rayon hyperbolique
4r
et R le rayon euclidien R, on a
cosh ρ − 1
A = 2π(cosh ρ − 1)C = 2π sinh ρR = (6.30)
sinh ρ
D’où la propriété.
Propriété 6.6. Dans l’espace H, si Σ est un cercle centré en x ∈ ∂H, alors l’inversion par Σ
induit une isométrie hyperbolique de H qui échange l’intérieur et l’extérieur de Σ dans H.
La preuve de cette propriété repose sur l’équivalence entre H et J, en effet on peut supposer,
quitte à passer Σ par une isométrie, que c’est le cercle image du cercle x1 = 0|x22 + x23 = 1 ∈ J,
et comme la métrique sur J est invariante par symétrie par rapport au plan x1 = 0, la propriété
est vérifiée.
Figure 6.14 – L’inversion est une isométrie hyperbolique, qui correspond à une symétrie sur le
modèle hémisphérique.
Séance 6 80 Chapitre 6. Le plan hyperbolique
[CFK+ 97]
Déplacements Dans le graphe dual, la longueur d’un chemin est définie comme le nombre de
côtés rencontrés par le chemin tracé.
Propriété 6.8. Les triangles du graphe dual sont uniformément fins, de distance minimale 8.
On constate que la longueur d’un déplacement horizontal est au plus 5 par la propriété 6.7
et que la longueur du déplacement horizontal de gauche est au plus 3 compte-tenu du fait que le
nombre de carrés à traverser sur un niveau horizontal est divisé par deux lorsqu’on monte d’un
niveau.
6.6 Conclusion
Ce dernier point de vue, combinatoire, fait ressortir de manière forte la propriété 6.4 sur la
finesse des triangles : c’est une notion qui “passe au discret”, et qui ne dépend donc pas de la
structure analytique – très confortable – du plan hyperbolique.
Une idée extrêmement forte de Mikhaïl Gromov a été, dans le courant des années 80, de
prendre cette propriété pour définition de l’hyperbolicité :
Figure 6.17 – Un espace métrique est δ-hyperbolique au sens de Gromov si tous ses triangles
sont δ-fins : pour tous points a, b, c, le segment géodésique [a, b] est inclus dans un δ-voisinage
de [a, c] ∪ [b, c].
Un exemple tout naturel nous vient de la théorie des graphes : les arbres, ou graphes acy-
cliques, sont des espaces métriques 0-hyperboliques. Ainsi, du point de vue de la structure mé-
trique, un espace hyperbolique est “presque” un arbre !
Cela n’a l’air de rien, mais c’est exactement le genre d’idées qui fait la différence entre les
mathématiques du XIXe siècle et la géométrie contemporaine. Des belles preuves analytiques,
du travail sur les projections stéréographiques accessibles au calcul direct, on est passé à l’étude
d’espaces a priori beaucoup moins “sympathiques” et pourtant si naturels : pensez aux pavages
d’Escher !
Figure 6.18 – Circle Limit IV (Heaven and Hell) de M.C. Escher : que se passerait-il si anges
et démons jouaient au téléphone arabe ?
Séance 6 82 Chapitre 6. Le plan hyperbolique
[CFK+ 97]
Vadim Lebovici,
Robin Lemaire,
Valentin Carlier,
Lino Benedetto
Très joli
Figure 6.19 – Un exemple d’espace métrique hyperbolique non-trivial : le graphe de Cayley (ici
tracé au voisinage de l’unité pour un bon système de générateurs) du groupe SL2 (Z), qui agit
naturellement sur H par isométries. C’est l’analogue hyperbolique de la grille infinie classique,
graphe de Cayley du groupe Z × Z qui agit par isométries sur le plan euclidien.
Eva Philippe,
Arthur Touati,
Dans ce chapitre, nous allons étudier la relation entre les géodésiques et la notion de distance Grégoire Macqueron,
sur une variété riemannienne. Nous allons formuler rigoureusement et démontrer l’intuition que Maxime Sylvestre
l’on a sur la nature des géodésiques : pour minimiser la distance parcourue entre deux points si Équilibré
on se balade sur une variété, on doit emprunter une géodésique.
Définition 7.1 (Courbe régulière par morceaux). Une courbe lisse γ : I → M est dite régulière
si pour tout t ∈ I, γ̇(t) 6= 0. Elle est dite régulière par morceaux si I = [a, b] et qu’il existe une
subdivision finie a = a0 < . . . < ak = b telle que γ|]ai−1 ,ai [ est régulière pour i = 1, . . . , k. Les
vecteurs vitesses sont bien définis sur les ]ai−1 , ai [ et on pose
γ̇(a−
i ) = lim+ γ̇(t) (7.1)
t→ai
γ̇(a+
i ) = lim γ̇(t). (7.2)
t→a−
i
Remarquons tout de suite qu’une géodésique est régulière, car la norme de son vecteur vitesse
est constante. Dans la suite, on appellera des courbes régulières par morceaux des courbes ad-
missibles. C’est avec cette classe de courbes qu’on mesurera la distance entre deux points d’une
variété riemannienne. Nous commençons par définir la notion de longueur d’une courbe :
Définition 7.2 (Longueur d’une courbe). Si M est une variété riemannienne et γ : [a, b] → M
une courbe, on définit sa longueur L(γ) par :
Z b
L(γ) := |γ̇(t)|dt (7.3)
a
83
Séance 7 84 Chapitre 7. Distances et géodésiques
[Lee97], Chap. 6
Eva Philippe, On écrit parfois Lg (γ) pour indiquer la dépendance de cette valeur à la métrique (la métrique
Arthur Touati, intervient dans le calcul de la norme de γ̇(t) ). La longueur d’une courbe ne dépend pas de la
Grégoire Macqueron, paramétrisation, comme le formalisent les énoncés suivants :
Maxime Sylvestre
Équilibré Définition 7.3 (Reparamétrisation d’une courbe). Si γ : [a, b] → M est une courbe, on appelle
reparamétrisation de γ toute courbe de la forme γ̃ = γ ◦ ϕ où ϕ : [c, d] → [a, b] est C ∞ , bijective
d’inverse C ∞ .
Lemme 7.1. Si γ est une courbe et γ̃ une de ses reparamétrisations, alors L(γ) = L(γ̃).
Démonstration. Si gamma : [a, b] → M et γ̃ = γ ◦ ϕ où ϕ; [c, d] → [a, b], alors :
Z d Z d Z b
L(γ̃) = ˙
|γ̃(t)|dt = |ϕ̇(t)γ(ϕ(t))|dt = |γ̇(t)|dt = L(γ) (7.4)
c c a
M étant localement connexe par arcs lisses – comme toute variété –, elle est globalement connexe
par arcs admissibles : la distance ci-dessus est donc bien définie.
Lemme 7.3. Avec la distance d ainsi définie, toute variété riemannienne est un espace métrique
dont la topologie induite coïncide avec la topologie donnée pour la variété.
Démonstration. Pour montrer que d est bien une distance, le seul point difficile est d(p, q) 6= 0
pour p 6= q. Montrons d’abord que l’on peut comparer la distance riemannienne et la distance
euclidienne : il existe une boule géodésique fermée Ȳ de rayon autour de p et c, C deux
constantes positives telles que pour tout x ∈ Ȳ et V ∈ Tx M :
Si p 6= q, on peut diminuer jusqu’à avoir q ∈ / Ȳ. Alors toute courbe admissible γ : [a, b] → M
reliant p à q doit traverser la sphère géodésique (frontière de Y), d’après le lemme de passage
des douanes. On note t0 le premier instant où γ(t) est sur cette sphère.
On a alors :
Lg (γ) ≥ Lg (γ|[a,t0 ] ) ≥ cLḡ (γ|[a,to ] ) ≥ cdḡ (p, γ(t0 )) = c (7.8)
Ces inégalités étant vraies pour toute courbe admissible γ reliant p à q, on a en passant à
l’inf : d(p, q) ≥ c > 0. D’où d est une distance.
Enfin, pour comparer les deux topologies il suffit de voir qu’on peut construire une base pour
la topologie de la variété à partir de petites boules euclidiennes dans des ouverts de la forme Y.
Or sur ces ensembles la distance euclidienne et la distance riemannienne sont équivalentes. Donc
les ouverts de cette base sont aussi des ouverts pour la distance riemannienne et elle engendre la
topologie riemannienne car une topologie métrique est engendrée par de petites boules métriques.
Ainsi, ces deux topologies sont identiques.
Eva Philippe,
Arthur Touati,
Grégoire Macqueron,
Maxime Sylvestre
Équilibré
∂xk
∂t Λ = ∂k (7.12)
∂t
∂xk
∂s Λ = ∂k (7.13)
∂s
Figure 7.3 – Tout champ de vecteurs le long de γ est le champ de variation d’une variation de γ
Définition 7.6 (Variation d’une courbe admissible). Si γ : [a, b] → M est une courbe admissible,
une variation de γ est une famille admissible Λ telle que Λ(0, t) = γ(t) pour t ∈ [a, b].
On dit qu’une variation est propre si Λ(s, a) = γ(a) et Λ(s, b) = γ(b) pour tout s.
Si Λ est une variation de γ, on définit le champ de variation de Λ par V (t) = ∂s Λ(0, t) (c’est
un champ de vecteurs le long de γ).
On dit qu’un champ de vecteurs le long d’une courbe γ est propre si V (a) = V (b) = 0. Le
champ de variation d’une variation propre est lui-même propre.
Il y a équivalence entre variation d’une courbe et champ de vecteurs le long d’une courbe
comme le montre le lemme suivant.
Lemme 7.5. Si γ est une courbe admissible et V un champ de vecteurs le long de γ, alors il
existe une variation Λ de γ telle que V soit son champ de variation. Si V est propre, Λ peut être
choisi propre.
Proposition 7.1 (Formule de la première variation). Soit γ : [a, b] → M une courbe admissible
de vitesse unitaire, Λ une variation propre de γ, V son champ de variation et a = a0 < . . . <
ak = b une subdivision adaptée à γ. Alors :
b k−1
d
Z X
L(Λs ) = − hV, Dt γ̇idt − hV (ai ), ∆i γ̇i (7.16)
ds s=0 a i=1
−
où ∆i γ̇ = γ̇(a+
i ) − γ̇(ai ) est le “saut” du champ de vecteur tangent γ̇ au point ai .
Eva Philippe,
Arthur Touati,
Grégoire Macqueron,
Maxime Sylvestre
Équilibré
Or, comme la connexion ∇ choisie est compatible avec la métrique g, on a (se référer au
chapitre 5, lemme 5.1)
∂
hT, T idt = 2hDs T, T i. (7.20)
∂s
De plus, le fait d’avoir choisi une connexion symétrique permet d’écrire grâce au lemme de
symétrie :
Ds T = Dt S (7.21)
Ainsi, on comprend a posteriori le choix particulier de travailler avec la connexion de Levi-
Civita, l’unique connexion compatible avec la métrique qui soit symétrique. Le calcul donne :
Z ai Z ai
∂ 1 1 1
hT, T i 2 dt = hT, T i− 2 2hDs T, T idt (7.22)
ai−1 ∂s ai−1 2
Z ai
1
= hDt S, T idt. (7.23)
ai−1 |T |
En sommant sur i et en se souvenant que V (a0 ) = V (ak ) = 0 car V est une variation propre,
on obtient bien l’expression voulue.
7.2. Courbes minimisantes et géodésiques 89
Comme le montre le lemme 7.1, la contrainte d’avoir un vecteur vitesse unitaire pour tout t
de la proposition précédente n’en est pas vraiment une, mais plutôt une exigence de calcul. On
peut maintenant préciser le lien entre les courbes minimisantes, les points critiques de L et les
géodésiques sous la forme d’un lemme et d’un théorème.
Théorème 7.1. Une courbe admissible de vecteur vitesse unitaire est un point critique de L si
et seulement si c’est une géodésique.
Démonstration. Si γ est une courbe admissible de vecteur vitesse unitaire, on peut utiliser la
formule de la première variation. Si γ est une géodésique : Dt γ̇ = 0 et ∆t γ̇ = 0 donc le membre
de droite de la formule de la première variation est nul et ds d
L(Λs ) = 0 en s = 0.
Si γ : [a, b] → M est un point critique pour L, soit a = a0 < . . . < ak = b une subdivision
adaptée à γ. Comme tout champ de vecteur propre le long de γ est le champ de variation d’une
certaine variation propre de γ, le membre de droite doit être nul pour tout champ de vecteurs
propre le long de γ. La première étape est de montrer que Dt γ̇ = 0 sur tous les intervalles
[ai−1 , ai ]. Sur un tel intervalle, on choisit comme champ de vecteur propre ϕDt γ̇ où ϕ est C ∞ ,
strictement positive sur [ai−1 , ai ] et nulle ailleurs. L’équation devient alors :
Z ai
0=− ϕ|Dt γ̇|2 dt (7.27)
ai−1
La fonction intégrée est strictement positive donc Dt γ̇ = 0 sur tous les intervalles [ai−1 , ai ].
La deuxième étape est de montrer que ∆i γ̇ = 0 pour tout i. Pour un certain i, en utilisant une
fonction de la forme de ϕ et en se donnant un système de coordonnées on peut construire un
champ de vecteur V le long de γ tel que V (ai ) = ∆i γ̇ et V (aj ) = 0 pour j 6= i. L’équation
devient alors −|∆i γ̇|2 = 0. Finalement, comme les vecteurs vitesse sont égaux de part et d’autres
de chaque ai , par unicité des géodésiques, γ|[ai ,ai+1 ] est le prolongement de γ|[ai−1 ,ai ] et ainsi γ
est lisse sur [a, b].
∂
hS, T i = hDt S, T i + hS, Dt T i (par compatibilité avec la métrique) (7.28)
∂t
= hDt S, T i (car Γs est une géodésique) (7.29)
= hDs T, T i (par le lemme de symétrie) (7.30)
1 ∂
= |T |2 (par compatibilité avec la métrique) (7.31)
2 ∂s
=0 (car T est unitaire) (7.32)
Lemme 7.7. Si (xi ) sont les coordonnées normales sur une boule géodésique U centrée en p ∈ M ,
∂
et si r est la fonction distance radiale, alors grad r = ∂r sur U\{p}.
Proposition 7.2. Si p ∈ M et q est dans une boule géodésique centrée en p, alors, à reparamé-
trisation près, la géodésique radiale de p à q est l’unique courbe minimisante de p à q dans M .
Proposition 7.3. Au sein d’une boule géodésique autour de p ∈ M , la distance radiale r(x)
coïncide avec la distance riemannienne entre p et x.
Séance 7 92 Chapitre 7. Distances et géodésiques
[Lee97], Chap. 6
Eva Philippe,
Arthur Touati,
Grégoire Macqueron,
Maxime Sylvestre
Équilibré
Faute de temps, nous n’aborderons pas la preuve de ce théorème, qui repose en grande partie
sur les propriétés de la carte exponentielle. On retiendra simplement les corollaires suivants, qui
nous rassurent quand à la bonne définition des géodésiques dans un espace où les bords sont
inaccessibles, à l’infini :
Proposition 7.4. S’il existe un point p tel que la carte exponentielle expp est définie sur tout
Tp M , alors M est complète.
Proposition 7.5. M est complète si et seulement si deux points de M peuvent être reliés par un
segment géodésique minimisant.
Proposition 7.6. Si M est compacte, alors toute géodésique peut être définie pour tout temps.
Deuxième partie
93
Chapitre 8
« Étant donnée une collection arbitraire de points du plan, à partir de quels critères peut-on
affirmer qu’elle présente “trop” d’alignements, indices d’une structuration sous-jacente ? »
« Quelle est la distribution “standard” des formes de triangles – à similitude près – reliant des
points tirés au hasard selon une loi de probabilité simple ?
Plus spécifiquement, si des points sont (par exemple) tirés de manière indépendante et
uniforme dans le disque unité, puis reliés trois à trois, quelle sera la proportion observée de
triangles “presque plats” avec un angle inférieur à 1◦ ? »
Durant cette séance nous allons d’abord nous concentrer sur les triangles, on pourra ainsi
se faire une bonne intuition d’un espace de forme particulier et présenter dans un cadre assez
simples les premiers principes et outils servant dans l’étude de ces espaces comme l’analyse
procrustéenne. Par ailleurs, nous allons réussir à montrer le surprenant résultat de Kendall à
propos de la sphère des triangles en utilisant des outils géométriques et trigonométriques assez
simples. Nous verrons ensuite les résultats de généralisation de ces espaces, où nous devrons
utiliser un bagage beaucoup plus conséquent. Enfin, nous étudierons les questions relatives aux
probabilités et aux statistiques sur ces espaces.
95
Séance 8 96 Chapitre 8. Un article fondateur : les triangles de Kendall
[Ken84]
Basile Coron,
Paul Fraux,
Massil Hihat,
Lino Benedetto
Élémentaire
et élégant
(a) À l’extrémité ouest des îles britanniques, la pointe des Cor- (b) Sur cette péninsule de 10km sur
nouailles recèlerait-elle un secret ? 15km, on observe une concentration
Carte OpenStreetMap. élevée de monolithes.
Figure 8.1 – Motivation initiale de David Kendall : les monolithes de Land’s End ont-ils été
placés au hasard, ou peut-on voir dans la distribution ci-dessus les traces d’alignements signifi-
catifs ? Chaque site est ici représenté par un nombre, celui des “triangles presque plats” dont il
fait partie. On reformule alors notre question de manière statistique :
« Sur la carte (b), y a-t-il un nombre anormalement élevé de triades de mégalithes alignés ? »
Dans un article d’une grande importance historique, Simulating the Ley Hunter paru en 1980, Si-
mon Broadbent laisse à penser que non – ce qui est bien entendu sujet à de sérieuses controverses
archéologiques.
Action des similitudes Ces nuages de points P n , on peut les transformer à l’aide de trans-
lations, homothéties, rotations : si (x, y) est un vecteur du plan, s est une échelle et θ un angle,
on définit l’application
x s cos(θ) · x − s sin(θ) · y + x
Sx,y,s,θ : 7→ (8.1)
y s sin(θ) · x + s cos(θ) · y + y
qui est la composée d’une translation de vecteur (x, y), d’une rotation d’angle θ et d’une ho-
mothétie de rapport s strictement positif. À vrai dire, puisque qu’on se restreint aux formes du
plan, on peut se simplifier la vie en adoptant le formalisme complexe. On caractérisera nos points
(x, y) par des affixes z = x + iy et une similitude du plan est la donnée de deux complexes
τ = x + iy et υ = seiθ , (8.2)
et on pourra écrire nos similitudes comme des applications
Sτ,υ : z 7→ υ · z + τ. (8.3)
8.2. Un espace de formes : la sphère des triangles 97
Si P n = (P1n , . . . , PIn ) est l’une de nos “formes”, on définira sans ambages son transformé :
Sτ,υ (P n ) = (Sτ,υ (P1n ), . . . , Sτ,υ (PIn )) . (8.4)
Paramétrisation naïve À première vue, un triangle ABC n’est rien d’autre que la donnée
de trois affixes complexes associées aux sommets : z1? , z2? et z3? . Conformément à l’équation (8.4),
pour tout “vecteur” τ et rapport υ, on peut écrire
Sτ,υ (ABC) = Sτ,υ (z1? , z2? , z3? ) = ( υ · z1? + τ, υ · z2? + τ, υ · z3? + τ ). (8.7)
De plus, pour et
(z1? , z2? , z3? ) deux triangles quelconques, le critère minimisé par
(w1? , w2? , w3? )
l’analyse procustéenne s’écrit simplement :
2
k z ? − w? k2 = |z1? − w1? |2 + |z2? − w2? |2 + |z3? − w3? |2 . (8.8)
√ √ √
1/√3 −1/√2 −1/√6
= z1? z2? z3? · 1/√3 +1/ 2 −1/√6 . (8.10)
1/ 3 0 +2/ 6
Séance 8 98 Chapitre 8. Un article fondateur : les triangles de Kendall
[Ken84]
Basile Coron,
Paul Fraux,
Massil Hihat,
Lino Benedetto
Élémentaire
et élégant
(a) Données brutes : la source (b) La meilleure translation est (c) Après recalage des bary-
P m est en vert (clair), la cible celle qui aligne les barycentres. centres.
P n en bleu (foncé).
(d) Les deux formes, centrées. (e) On peut calculer le rapport (f) Après application de la
de dilatation optimal. translation + homothétie.
(g) Les deux formes sont cen- (h) La meilleure rotation s’ob- (i) Après recalage par une simi-
trées et normalisées : reste à re- tient elle aussi par un calcul litude : le résidu peut être ana-
caler les orientations. analytique simple. lysé indépendamment.
Figure 8.3 – On peut caractériser un triangle (z1? , z2? , z3? ) par son barycentre zc = 31 (z1? + z2? + z3? )
et deux vecteurs directionnels α = z2? − z1? et β = 31 (2z3? − z1? − z2? ). En normalisant ceux-
√ √ √ √
ci pour obtenir un jeu de coordonnées (z0 , z1 , z2 ) = ( 3 zc , α/ 2, β 3/ 2), on dispose d’une
représentation adaptée aux similitudes et aux calculs de distances – équations (8.11-8.12).
Finalement, le ratio ξ = z2 /z1 encode complètement la forme du triangle aux similitudes près.
Illustré Figure 8.3, ce changement linéaire de coordonnées permet d’écrire les similitudes de
manière plus compacte
√
Sτ,υ (ABC) = Sτ,υ (z0 , z1 , z2 ) = ( υ · z0 + 3 τ, υ · z1 , υ · z2 ), (8.11)
les translations n’ayant d’influence que sur le seul barycentre. Dans le même temps, grâce aux
propriétés d’orthogonalité de la matrice de changement de repère, on a toujours une expression
simple de la distance quadratique entre deux triangles du plan :
2 2
k z ? − w? k2 = kz − wk2 = |z0 − w0 |2 + |z1 − w1 |2 + |z2 − w2 |2 . (8.12)
⇐⇒ z1 w2 = z2 w1 . (8.14)
Autrement dit, si notre triangle n’est pas dégénéré (A = B = C, cas que l’on exclut de notre
analyse), on peut caractériser sa forme “à similitude près” par le ratio
√1 (2z ? − z ? − z ? )
z2 6 3 1 2
ξ = = 1 ? ?
∈ C ∪ {∞}. (8.15)
z1 √ (z − z )
2 2 1
Séance 8 100 Chapitre 8. Un article fondateur : les triangles de Kendall
[Ken84]
Basile Coron,
Paul Fraux, Deux triangles non dégénérés (z) et (w) seront semblables si et seulement si leurs “ratios” res-
Massil Hihat, pectifs ξ = z2 /z1 et ξ 0 = w2 /w1 sont égaux. On a réussi à décrire la forme d’un triangle par un
Lino Benedetto unique nombre complexe “projectif” (i.e. qui peut être infini), avec deux paramètres réels (mo-
Élémentaire dule et argument). À vrai dire, comme illustré Figures 8.4 et 8.5, considérer le ratio ξ revient ni
et élégant plus ni moins à utiliser une similitude pour recaler (A, B) = (z1? , z2? ) sur (−1, 1), puis à identifier
la forme du triangle avec la coordonnée libre restante, issue de z3? .
La sphère des triangles Souvenons-nous : dans le film Dimensions repris Figure ??, nous
avions appris qu’une “droite projective complexe” n’est rien d’autre qu’une sphère. Par la pro-
jection stéréographique, il est donc possible d’identifier un ratio complexe ξ ∈ C ∪ {∞} avec
un point de la boule unité, caractérisé par deux angles en coordonnées sphériques θ et ϕ. En
s’inspirant de cette idée, David Kendall propose d’associer un couple d’angles à chaque triangle
(z ? ) ∼ (z) ∼ ξ par la formule :
Chaque classe de triangle à similitude près est alors associée à un point de la sphère, que l’on
choisit de rayon 1/2 pour une raison qui deviendra claire au Théorème 8.1 :
1
f (ξ) = (cos θ, sin θ cos ϕ, sin θ sin ϕ) (8.18)
2
en coordonnées (X, Y, Z). Le résultat est illustré Figure 8.7, avec un représentant de classe pour
chaque point du globe. Suivant la page précédente, on trouve :
— Le segment [A = B, C] au point (−1/2, 0, 0).
— Le triangle plat où C est au milieu de [AB] au point (+1/2, 0, 0).
— Les triangles plats sur l’équateur Z = 0.
— Les triangles isocèles en C sur le méridien Y = 0.
— Les deux triangles équilatéraux direct (Nord) et indirect (Sud) aux pôles (0, 0, ±1/2).
8.2. Un espace de formes : la sphère des triangles 101
Figure 8.4 – Étant donné un point de la sphère de coordonnées sphériques (θ, ϕ) ∈ [0, π]×[0, 2π[,
comment√ construire un triangle lui correspondant ? Il suffit de considérer le triplet (z1? , z2? , z3? ) =
iϕ
(−1, 1, 3 tan(θ/2) e ).
Théorème 8.1 (Sphère de Kendall et moindres carrés). Soit ABC et DEF deux triangles
du plan aux sommets étiquetés, identifiés à des triplets d’affixes complexes z ? = (z1? , z2? , z3? ) et
w? = (w1? , w2? , w3? ).
Suivant la discussion des pages précédentes, on associe à z ? (respectivement w? ) un couple
de complexes “barycentriques” z = (z1 , z2 ) (resp. w = (w1 , w2 )), puis un ratio projectif complexe
ξ = z2 /z1 (resp. ξ 0 = w2 /w1 ), un couple d’angles (θ, ϕ) ∈ [0, π] × [0, 2π[ (resp. (θ0 , ϕ0 )) et un
en 0 de rayon 1/2 dans R3 , f (ξ) (resp. f (ξ 0 )).
point de la sphère centrée p
Alors en notant W = |w1 |2 + |w2 |2 l’échelle de DEF, on a :
La preuve repose sur un simple calcul de minimum par annulation de la dérivée, avec utilisa-
tion de moult identités trigonométriques.
Séance 8 102 Chapitre 8. Un article fondateur : les triangles de Kendall
[Ken84]
Basile Coron,
Paul Fraux,
Massil Hihat,
Lino Benedetto
Élémentaire
et élégant
Figure 8.5 – L’espace des triangles à similitude près, vu dans le plan des ratios ξ ∈ C ∪ {∞}.
Dessiné en rouge, l’axe des abscisses correspond aux triangles plats. Les triangles isocèles se
répartissent selon trois courbes, qui dépendent du sommet privilégié : en bleu, l’axe des ordonnées
correspondant aux triangles isocèles en C ; en vert la courbe des triangles isocèles en A, en cyan
celle des triangles isocèles en B. Le point correspondant au ratio ξ = 0 est ici représenté à
l’origine du repère.
8.2. Un espace de formes : la sphère des triangles 103
Démonstration. Reprenons les membres de notre équation. À gauche et au centre, un réel défini
de manière implicite :
v
u 3
uX
dProcuste (ABC → DEF ) = min t |υ · zi? + τ − wi? |2 . (8.20)
τ,υ∈C
i=1
√
Passage aux distances quadratiques Commençons par rappeler que x 7→ x est une fonc-
tion positive et strictement croissante de x. Il suffit donc de démontrer notre égalité sur les carrés
des distances mises en jeu, i.e. montrer que :
3
!
X
min |υ · zi? +τ − wi? |2 (8.24)
τ,υ∈C
i=1
1
= W2 · (cos θ − cos θ0 )2 + (sin θ cos ϕ − sin θ0 cos ϕ0 )2 + (sin θ sin ϕ − sin θ0 sin ϕ0 )2 (8.25)
4
La similitude optimale recale les barycentres Reste à le caractériser. Pour cela, remar-
quons que pour tout accroissement dτ , on a :
2 2
kSτ0 +dτ,υ0 (z ? ) − w? k2 > kSτ0 ,υ0 (z ? ) − w? k2 . (8.26)
Séance 8 104 Chapitre 8. Un article fondateur : les triangles de Kendall
[Ken84]
Basile Coron,
Paul Fraux, Or on peut calculer que :
Massil Hihat,
Lino Benedetto X3
2
Élémentaire kSτ0 +dτ,υ0 (z ? ) − w? k2 = |υ0 · zi? + τ0 + dτ − wi? |2 (8.27)
et élégant i=1
3
X
= (υ0 · zi? + τ0 + dτ − wi? ) (υ0 · zi? + τ0 + dτ − wi? ) (8.28)
i=1
2
= kSτ0 ,υ0 (z ? ) − w? k2 + 3 |dτ |2 (8.29)
3
X
+ dτ ·(υ0 · zi? + τ0 − wi? ) + dτ ·(υ0 · zi? + τ0 − wi? ) (8.30)
i=1
2
= kSτ0 ,υ0 (z ? ) − w? k2 + 3 |dτ |2 (8.31)
3
X
+ 2 <dτ · (υ0 · zi? + τ0 − wi? ), (8.32)
i=1
qui est le développement en dτ du coût minimisé au voisinage de l’optimum (τ0 , υ0 ). Par suite
de l’inégalité (8.26), le terme linéarisé d’ordre 1 doit être positif pour toute valeur assez faible de
dτ : ceci n’est possible que si on a annulation de la dérivée,
3
X
(υ0 · zi? + τ0 − wi? ) = 0. (8.33)
i=1
3 3
1X ? 1X ?
υ· zi + τ0 = w , (8.34)
3 i=1 3 i=1 i
i.e. « Sτ0 ,υ0 recale les deux barycentres ». C’est un résultat que nous avions utilisé de manière
intuitive dans la Figure 8.2b.
2 2
kSτ,υ (z ? ) − w? k2 = kSτ,υ (z) − wk2 (8.35)
√
= |υ · z0 + 3 τ − w0 |2 + |υ · z1 − w1 |2 + |υ · z2 − w2 |2 . (8.36)
Pour trouver le coût procustéen d2Procuste (ABC → DEF ), il suffit donc de minimiser en υ
l’expression :
2
kSτ0 ,υ (z ? ) − w? k2 = |υ · z1 − w1 |2 + |υ · z2 − w2 |2 . (8.38)
8.2. Un espace de formes : la sphère des triangles 105
2
X
2
kSτ0 ,υ0 +dυ (z ? ) − w? k2 = ((υ + dυ) · zi − wi ) ·((υ + dυ) · zi − wi ) (8.39)
i=1
2
= kSτ0 ,υ0 (z ? ) − w? k2 + |dυ|2 · (|z1 |2 + |z2 |2 ) (8.40)
2
X
+ dυ · zi ·(υ · zi − wi ) + dυ · zi ·(υ · zi − wi ) . (8.41)
i=1
À l’optimum, on a alors :
2
X 2
X
(υ0 zi ) ·(υ0 zi ) = (υ0 zi ) · wi , (8.43)
i=1 i=1
2
X
d2Procuste (ABC → DEF ) = (υ0 zi − wi ) ·(υ0 zi − wi ) (8.44)
i=1
2
X
= (υ0 zi ) ·(υ0 zi ) −(υ0 zi ) · wi − wi ·(υ0 zi ) + wi · wi (8.45)
i=1
2
X
= wi · (wi − υ0 zi ) (8.46)
i=1
2
X 2
X
= wi wi − υ0 wi zi (8.47)
i=1 i=1
2 P2
X | wi zi |2
= wi wi − Pi=12 (8.48)
i=1 |zi |
2
i=1
!
2 P2 2
X | w i zi |
= |wi |2 · 1 − P i=1
P . (8.49)
2 2
i=1 |z
i=1 i | 2 ·
i=1 |wi |2
z2 = ξ z1 et w2 = ξ 0 w1 . (8.50)
Séance 8 106 Chapitre 8. Un article fondateur : les triangles de Kendall
[Ken84]
Basile Coron,
Paul Fraux, On peut donc écrire :
Massil Hihat, !
Lino Benedetto 2 P2 2
X | w i zi |
Élémentaire d2Procuste (ABC → DEF ) = |wi |2 · 1 − P i=1
P (8.51)
2 2
et élégant i=1 i=1 i|z |2 ·
i=1 |w i |2
|w1 z1 + w2 z2 |2
= |w1 |2 + |w2 |2 · 1 − (8.52)
(|z1 |2 + |z2 |2 ) ·(|w1 |2 + |w2 |2 )
|w1 z1 + w1 z1 ξ 0 ξ|2
2 2
(8.53)
= |w1 | + |w2 | · 1 −
|z1 |2 (1 + |ξ|2 ) · |w1 |2 (1 + |ξ 0 |2 )
|1 + ξ 0 ξ|2
= |w1 |2 + |w2 |2 · 1 − (8.54)
.
(1 + |ξ|2 ) ·(1 + |ξ 0 |2 )
1 2 |1 + ξ 0 ξ|2
dProcuste (ABC → DEF ) = 1 − . (8.55)
W 2 (1 + |ξ|2 ) ·(1 + |ξ 0 |2 )
En coordonnées sphériques Pour conclure, il suffit alors de s’armer de patience, d’une fiche
de formules trigonométriques, et de se souvenir que
0
ξ = tan(θ/2) eiϕ , ξ 0 = tan(θ0 /2) eiϕ . (8.56)
On trouve :
0
1 2 |1 + tan(θ/2) tan(θ0 /2)ei(ϕ−ϕ ) |2
d (ABC → DEF ) = 1 − (8.57)
W 2 Procuste 1 + tan2 (θ/2) · 1 + tan2 (θ0 /2
1
= ·(1 − cos θ cos θ0 − sin θ sin θ0 cos(ϕ − ϕ0 )) (8.59)
2
1
· (cos θ − cos θ0 )2 + (sin θ cos ϕ − sin θ0 cos ϕ0 )2 + (sin θ sin ϕ − sin θ0 sin ϕ0 )2 (8.60)
=
4
2
= kf (ξ) − f (ξ 0 )kR3 . (8.61)
À la variance du triangle d’arrivée près, la sphère de rayon 1/2 est bien le bon espace pour
calculer les distances procustéennes entre triangles.
8.3. Généralisation 107
8.3 Généralisation
8.3.1 Définition formelle
Nous allons maintenant essayer de généraliser la construction précédente. Considérons une
forme à k points déterminée par les vecteurs de Rm (zj∗ )i∈j...k de barycentre zc∗ . On autorise les
dégénérescences à l’exception du polygone effondré en un point, (tous les zj égaux).
Nous allons tout d’abord négliger l’effet des translations. Pour cela, comme dans le cas des
triangles, on commence par chercher une base orthonormale qui décrive bien le problème. Puisque
seules nous intéressent les positions relatives au barycentre, on considère les coordonnées obtenues
par la transformation orthogonale suivante :
√ ∗
jzj+1 − (z1∗ + ... + zj∗ )
z0 = zc∗ k zj = p . (8.63)
j2 + j
où Sim est le groupe des similitudes engendré par les rotations et les dilatations (non nulles). Le
0 ∈ (Rm )k−1 est exclu car nous ne considérons pas la forme du k-polygone totalement dégénéré.
k−1
X k
X k
X
||z||2 = |zj |2 = |zi∗ |2 − k|zc∗ |2 = |zi∗ − zc∗ |2 (8.65)
j=1 i=1 i=1
où |.| est la norme euclidienne de Rm . On remarque que cette norme est canonique, au sens où
elle ne dépend plus de la transformation orthogonale définie en 8.63.
L’espace quotient Σkm muni la topologie quotient héritée de cette norme, sera appelé l’espace
des formes d’ordre (k, m)
Pour des raisons pratiques, on considérera le quotient définissant Σkm , comme effectué d’abord
par les dilatations, ramenant (Rm )k−1 à S m(k−1)−1 noté Sm k
, ensuite par les rotations SO(m)
agissant à gauche de (R )
m k−1
(identifié à Mm,k−1 ), on a donc :
Σkm = Sm
k
/SO(m) (8.66)
On note p la projection de Sm
k
→ Σkm , alors un argument de théorie des groupes montre que
la métrique de Σm est exactement celle engendrée par la distance ρ :
k
Une idée sur la classification Les espaces de la forme Σm+1 m que l’on appellera espace de
forme simplicial, sont plus important qu’il n’y parait. Une telle forme détermine un simplex de
Rm . A. J. Casson à prouver que tous ces espaces sont homéomorphes à des sphères.
En fait tous, les espaces Σkm avec k < m + 1 que l’on appellera espaces de formes sur-
dimensionné se ramènent aux cas des espaces simpliciaux Σkk−1 . En effet, modulo SO(m) dans
un tel espace sur-dimensionné, on peut transformer nos formes (vues dans Mm,k−1 ), de sorte à
ce qu’elles ait les m − (k − 1) dernières lignes nulles. L’action de conjugaison τ sur les formes de
Σkk−1 fait correspondre celles-ci aux formes de Σkm , par un processus de déconjugaison, on peut
donc revenir à Σkk−1 .
Plus de transformations Remarquons déja que par cette identification, la conjugaison par
τ que l’on a défini précédemment correspond bien à la conjugaison complexe. En fait, voir notre
espace de forme, comme un espace complexe nous permet d’enrichir encore plus notre groupe de
similitudes G+ .
En effet, on peut l’étendre en un groupe G++ en ajoutant les éléments de U (k − 1)/U (1)
(quotient du groupe unité par son centre, les homothéties de rapport non nul de Ck−1 ). Ainsi,
on a que Σk2 est homogène car G++ agit alors transitivement. C’est un résultat qui ne se vérifiera
pas en dimension m ≥ 3.
Remarques Notons, au passage, qu’il vient naturellement que Σ22 = CP 0 = {.}, cette dernière
identification peut , par ailleurs, se voir tout aussi bien géométriquement. Aussi, Σ32 = CP 1 = S 2 ,
ce qui semble déja nous indiquer que l’espace des triangle est une sphère, nous avons déja vu une
preuve de la nature métrique de cette identification, nous developperons dans la suite d’autres
arguments pour cela.
8.4. Etude des formes du plan, Σk2 109
wi |2
P
i |zi −P
P (8.70)
i |zi − b| +
2
i |wi − b|
2
et on trouve finalement :
∗
− zc∗ |
P
∗ ∗ | i (zi
∆([z ], [w ]) = 1 − qP (8.72)
∗ ∗ 2 ∗ ∗ 2
P
i |zi − zc | j |wj − wc |
ρ = arccos(1 − ∆) (8.74)
et on vérifie que c’est une distance avec un maximum atteint de π2 et que dans le cas où
m = 2 c’est bien la fonction définie dans la partie 8.67.
On a alors de nombreuse distances équivalentes à ρ comme 1+ρ
ρ
ou encore c sin( ρc ) avec 2 ≤ c (le
√
cas c = 2 conduit même à 2∆). Mais la fonction ρ est la bonne puisqu’il s’agit d’une définition
alternative de la distance quotient.
1
ds2 = (dθ2 + sin2 (θ)dϕ2 ). (8.78)
4
Théorème 8.2. Σ32 est isométrique à S 2 ( 12 )
1 1 − r2
X= cos(θ) = (8.79)
2 2(1 + r2 )
1 2r cos(ψ)
Y = sin(θ) cos(ψ) = (8.80)
2 2(1 + r2 )
1 2r sin(ψ)
Z = sin(θ) sin(ψ) = (8.81)
2 2(1 + r2 )
Or dans la plupart des cas pratiques ou théoriques les permutations de sommets sont
sans importances. S 2 ( 12 ) est alors découpé en 6 lunes équivalentes. Il peut donc être utile
de ne considerer les formes que modulo une réindexation des sommets, ie S 2 ( 12 )/G6 qui est
topologiquement equivalent à une sphère. Néanmoins nous sommes obligés de continuer à
travailler dans S 2 ( 12 ) si nous voulons une isométrie. Si en plus les effets d’une réflexion ne sont
8.4. Etude des formes du plan, Σk2 111
Figure 8.6 – L’espace des triangles à similitude près, muni de la distance quotient / procrus-
téenne. Il est isométrique à la sphère de rayon 1/2. Les triangles équilatéraux se trouvent aux
pôles, et les triangles plats à l’équateur. Notez que l’on n’a pas ici quotienté par les symétries ou
l’étiquetage des points (dans le groupe symétrique S3 ) : la même “forme” au sens des rapports de
longueurs se retrouve donc 12 fois, sauf exception. L’espace quotient résultant, le “tableau noir
sphérique” est montré dans la figure suivante.
Séance 8 112 Chapitre 8. Un article fondateur : les triangles de Kendall
[Ken84]
Basile Coron,
Paul Fraux,
Massil Hihat,
Lino Benedetto
Élémentaire
et élégant
Figure 8.7 – L’espace des triangles à similitude près, isométrique à la sphère de rayon 1/2.
Homogène, cette représentation permet de rendre compte des symétries intrinsèques de l’espace
des triangles liées au ré-étiquetage des points et aux réflexions. Ici, chaque “forme” au sens des
rapports de longueurs se retrouve dans les 12 quartiers découpés par l’équateur des triangles
plats et les méridiens des triangles isocèles.
8.5. Statistiques sur la sphère 113
pas significatif, on peut considerer le sous groupe d’ordre 12 G12 de G++ obtenu par adjonction
de l’opérateur de conjugaison à G6 . on considère alors la demi-lune supérieure : S 2 ( 21 )/G12 qui
sera par la suite appelée tableau sphérique (spherical blackboard)
On se place alors dans la demi-lune délimitée par le triangle sphérique LMN qui sont les
résultats des projections de :
1
L = (r = √ , ψ = π), ie A = C (8.85)
3
A+B
M = (r = 0, ψ quelconque), ie C = (8.86)
2
π
N = (r = 1, ψ = ), ie AB = AC = BC (8.87)
2
Alors les formes colinéaires sont celles sur l’arc LM et les formes isocèles celles sur les arcs
MN et LN.
Avec une forme ABC, on peut alors s’intéresser à la fonction max-angle qui donne l’angle
maximal du triangle et regarder quand est-ce qu’elle est proche de 180◦ (pour alors être presque
alignée).
Un des cas les plus intéressant est celui où les points (Pi ) sont indépendamment et iden-
tiquement distribués dans Rm de loi individuelle µ. On note µk la loi conjointe, elle induit
sur Σkm une mesure image µk∗ = µk p−1 qui va être inchangée si l’on modifie les paramètres
de µ contrôlant la position, la taille ou les rotations autour d’un axe. On note [µ] la classe
d’equivalence de µ suivant de telles transformations.
Séance 8 114 Chapitre 8. Un article fondateur : les triangles de Kendall
[Ken84]
Basile Coron,
Paul Fraux,
Massil Hihat,
Lino Benedetto
Élémentaire
et élégant
(a) Le douzième de sphère, qui contient tous les (b) Histogramme empirique sur la sphère,
triangles à similitude, permutation des points lorsque les points des triangles sont tirés de ma-
et symétrie près. Les triangles plats sont sur nière i.i.d. selon une gaussienne isotrope dans
le bord du bas, et les triangles isocèles, sur les le plan. Comme prévu, la densité empirique est
deux côtés. uniforme en bonne approximation.
(c) En remplaçant la gaussienne isotrope par (d) Enfin, lorsque l’anisotropie devient impor-
une gaussienne anisotrope (ici, σ1 = 3, σ2 = 1), tante (ici, σ1 = 6, σ2 = 1), la masse se
on perd l’uniformité. Par contre, et c’est un fait concentre autour de l’équateur des triangles
remarquable, la mesure image est une fonction plats, ce qui correspond bien à notre intuition :
de la seule altitude Z. les triangles équilatéraux, aux pôles, se font
rares !
8.5. Statistiques sur la sphère 115
Beaucoup de questions se pose après avoir définis ces objets pour une vision plus exhaus-
tive on consultera l’article original de Kendall ; Shape Manifolds, Procustean Metrics and
Complex Projective Spaces (1984).
Le résultat ci-dessus est remarquable : il fait le lien entre la loi normale isotrope dans le plan
(qui est en un sens la loi de probabilité la plus simple, la moins structurée dans R2 ) et la loi
uniforme sur la sphère. Autrement dit, voir les triangles sur la sphère est aussi naturel que de
tirer des sommets indépendamment selon une loi normale isotrope. Sur la sphère, chaque élément
de surface est d’une importance proportionnée à sa représentativité, ce qui est un progrès flagrant
par rapport au plan des ξ présenté Figure 8.5.
Intérêt pratique du résultat Si nous tirons les points du plan non plus selon une loi normale,
mais de manière uniforme dans un domaine fixé – par exemple, la péninsule de Land’s End dans
les Cornouailles –, la répartition des formes de triangles sur la sphère s’en trouve sensiblement
modifiée. À la dernière ligne de la Figure 8.9, on représente les densités empiriques sur la sphère
pour des points tirés uniformément dans le disque unité, puis dans des ellipses de rapports
d’anisotropie 2 et 4 pour 1. Ici, point de distribution uniforme sur la sphère : là où la loi normale
et sa “bosse” maintenaient à flot les triangles “à deux petits côtés + un grand”, ceux-ci sont
maintenant clairement désavantagés au profit des triangles à “deux grands côtés + un petit”.
Par contre, le phénomène de tassement sur l’équateur des triangles plats se confirme à mesure
que la loi de tirage devient anisotrope. In fine, la comportement précis de la distribution des angles
d’un triangle en fonction de la loi de tirage de ses sommets peut être bien comprise, et des tables
mises à dispositions des archéologues et des biologistes. Tester une hypothèse d’indépendance
dans la génération des sommets par cette statistique est donc devenu une opération de routine.
Quantification des erreurs statistiques On peut aussi obtenir un résultat statistique sur
l’erreur commise lors de la prise de mesures empiriques par exemple.
Figure 8.9 – Histogrammes empiriques sur la sphère de Kendall. Sur les trois premières lignes
(a-f), les points sont tirés de manière i.i.d. selon une gaussienne isotrope (a-b) ou anisotrope
(c-d) et (e-f). À gauche, on représente la densité de tirage des points et une dizaine de triangles.
Comme indiqué par le théorème 8.3, la densité sur la sphère (représentée à droite par rapport à
la mesure de surface) ne dépend que de l’altitude Z.
Sur la ligne du bas (g-i), des histogrammes analogues sont tracés pour des points tirés de manière
uniforme dans une ellipse de grands axes (r, 1). Les triangles isocèles “deux petits côtés + un
grand” perdent en influence au profit des triangles “deux grands côtés + un petit”, ce qui conduit
à la formation de trois îlots d’attraction espacés régulièrement le long de l’équateur.
Chapitre 9
3
X
arg min 2 |υ · (Ai + τ ) − Bi |2 (9.1)
υ,τ ∈C
i=1
3
X
= arg min |eλ+iθ · (Ai + τ ) − Bi |2 (9.2)
λ,θ,τ ∈R×R×R2
i=1
117
Séance 9 118 Chapitre 9. Étude statistique dans un espace de formes simple
[Ken84]
Grégoire Macqueron,
Maxime Sylvestre
Très visuel
9.1. Généralisation de l’analyse de Kendall à des polygones quelconques 119
3
1X
τ = (Bi − Ai )
3 i=1
Si on étudie alors les triangles centrés a , b, le produit hermitien contient alors les informations
permettant d’ajuster l’echelle et la rotation :
3
X
a? b = ha, biC3 = ai bi
i=1
a? b
υ = eλ+iθ = kak2 .
En prenant en compte cela on a enfin réussi à expliciter la distance procustéenne à l’aide des
affixes des sommets des triangles avec leurs barycentres superposés. On a alors :
a? b
2
a ? b 2 2
= kbk2C3 · 1 − kak
b −
kak2 a C3
.
kbk
Le facteur kbk2 est le facteur d’ajustement d’échelle, et le reste de cette expression ne dépend
que des triangles normalisés centrés a/kak et b/kbk.
Ainsi il est possible de généraliser, si A et B sont deux polygones non-dégénérés du plan
complexe, on peut alors définir la distance optimale L2 en normalisant A et B en polygones
centrés normalisés a et b pour définir, à l’aide du produit hermitien de Cn :
p
dL2 ([A], [B]) = dL2 (a, b) = 1 − |a? b|2
Figure 9.1
Théorème 9.2. Si on pioche dans le plan complexe selon une gaussienne des sommets et ainsi
des triangles, alors dans l’espace quotient on obtient une distribution de triangles qui ne dépend
que du caractère anisotrope de la distribution Gaussienne.
Si la distribution est isotrope on obtient alors une loi uniforme sur la sphère de Kendall. Sinon
il y a une concentration de triangle plats.
Dans un espace vectoriel euclidien, les moyennes de Fréchet d’ordre 1 et 2 coïncident respec-
tivement avec la médiane et la moyenne arithmétique de la distribution.
γ0 = a et γ̇0 = v.
La longueur d’une telle courbe géodésique est simplement égale à la norme du vecteur tangent
à la position a.
Pour tout point de référence a, la carte exponentielle définit un isomorphisme entre un voi-
sinage de 0 (sur le plan tangent) sur un voisinage de a sur notre variété.
Nous pouvons ainsi définir la carte Loga comme l’inverse de Expa sur un voisinage de a, et
l’utiliser pour représenter la variété courbe dans le plan tangent.
Le plus souvent, les opérateurs Exp et Log sont difficiles à implémenter. Mais dans le cas
très spécifique (et important) des formes polygonales à similitude près, la théorie classique de
Kendall fournie des formules explicites (Figure 9.7).
Figure 9.2
9.3. Application sur les petits vers 123
Figure 9.3
inactif. Puis les axes de variabilité sont les formes qui permettent de décomposer efficacement le
mouvement. On observe ici des ondulations à des fréquences différentes, c’est une décomposition
de Fourier.
Dans la séance d’aujourd’hui consacrée à la théorie classique des formes, nous avons détaillé
9.3. Application sur les petits vers 125
Figure 9.5
une méthode de base pour décomposer la variabilité d’une population anatomique. Les algo-
rithmes ci-dessus permettent d’étudier séparément le vecteur de similitude (position, orientation
et échelle, codé par un couple de nombres complexes) et la variété des formes résiduelles. Dans
des contextes très simples (faible variance, données étiquetées), une analyse des formes résiduelles
peut suffire. Mais dans un contexte médical, la plupart des problèmes d’anatomie sont mal posés.
La conception de méthodes posant un cadre topologique plus fort fera l’objet d’une prochaine
séance.
Séance 9 126 Chapitre 9. Étude statistique dans un espace de formes simple
[Ken84]
Grégoire Macqueron,
Maxime Sylvestre
Très visuel
Chapitre 10
127
Séance 10 128 Chapitre 10. Travailler avec des données non-étiquetées
[CT13]
Valentin Carlier, n
Louis-Pierre avec αi = 1. Le problème initial consistant à caractériser une forme à partir d’un échantillon
P
Chaintron i=1
Retour aux fondamentaux de points, se ramène donc à la détermination d’une mesure en se donnant ses valeurs en seulement
certains points. Pour mesurer l’erreur commise dans ce travail d’approximation, on va s’atteler
à la construction de distances sur des espaces de mesures bien choisies.
1
Z
f (x) = fb(ω)eiωx dω (10.5)
2π
Remarque 1. Les fonctions x 7→ eiωx forment une base Hilbertienne orthonormale de L2 (R, C),
tout comme les fonctions de Dirac δx . On peut alors interpréter la transformée de Fourier comme
le changement de base correspondant, qui à une fonction associe ses composantes en prenant
les produits scalaires avec les x 7→ eiωx . Il s’agit de l’analogue en dimension infinie d’un simple
changement de base en dimension finie. Par exemple dans C , on peut préférer travailler dans la
n
2iπkl
base orthonormale donnée par les vecteurs uj = √1n e n où j est dans J0; n − 1K. La
0≤l≤n−1
matrice de passage de la base canonique à la base des fj est circulante (et de Van der Monde).
10.2. Distances sur un espace de formes 129
Comme cette base est orthonormale, un vecteur x = (x0 , · · · , xn−1 ) dans la base canonique s’écrit
directement
n−1
X n−1
X −2iπkl
x= cj fj avec cj = hx, fj i = e n xl (10.7)
j=0 l=0
La donnée de la suite (cj )0≤j≤n−1 constitue la transformée de Fourier discrète de x, très utile
en Informatique notamment dans le domaine de la compression d’image.
Proposition 1. La transformée de Fourier satisfait les propriétés suivantes
1. L’application f 7→ fb est linéaire
2. Pour (a, b) dans R2 , la transformée de x 7→ f (ax + b) est ω 7→ |a|
1 b ω ibω
f ( a )e
4. f[? g = fb × gb
5. hf, gi = hfb, gbi
6. Si f est de classe C 1 , alors fb0 : ω 7→ iω fb(ω)
7. De même la transformée de x 7→ xf (x) est ifb 0
8. Si fb est dans L1 alors f est continue.
R +∞
le produit scalaire considéré étant hf, gi = −∞ f (x)g(x)dx
Démonstration. On ne détaille ici que certains points :
1. Résulte de la linéarité de l’intégrale, et du produit scalaire hermitien en sa seconde variable.
2. Changement de variable.
3. On calcule directement
Z +∞
f˜(ω) = e−iωx f (−x)dx (10.8)
b
−∞
Z +∞
= eiωx f (x)dx (10.9)
−∞
Z +∞
= e−iωx f (x)dx (10.10)
−∞
Z +∞
= e−iωx f (x)dx = fb(ω) (10.11)
−∞
= fb(ω)b
g (ω) (10.16)
Séance 10 130 Chapitre 10. Travailler avec des données non-étiquetées
[CT13]
Valentin Carlier,
Louis-Pierre 5. Calcul analogue.
Chaintron
6. On dérive sous le signe somme.
Retour aux fondamentaux
7. Intégration par parties.
8. Théorème de continuité sous l’intégrale.
Remarque 2. Ces notions se généralisent à des espaces multidimensionnels, et les propriétés sont
conservés
Z
ω ) = e−i~ω.~x f (~x)d~x
f (~
b (10.17)
Le produit de convolution d’une mesure et d’une fonction de Rd est également défini par
Z
g ? µ(x) = g(x − y)dµ(y) (10.21)
Rd
Les mesures étant vues comme des formes linéaires, il s’agit du crochet de dualité hµ, f i =
R
f dµ.
10.3. Normes à noyau 131
Néanmoins cette norme est complètement inadaptée : il suffit que deux nuages de point (xi ) et (yj )
soient à support disjoints pour avoir kµ − νk∞ = 2, en prenant par exemple une fonction valant
1 sur les xi et -1 sur les yj . Pour les mesures concernées ici (combinaisons linéaires pondérées de
mesures de Dirac), la distance induite est à valeurs dans [0; 2], et peut valoir 2 sur des formes a
priori très proches. A l’inverse, elle être faible sur des forme intuitivement très différentes...
Une fois les mesures transformées en fonctions plus maniables, on définit une nouvelle
norme sur notre espace de mesures par la formule
kµk2 = hg ? µ, g ? µi (10.23)
Séance 10 132 Chapitre 10. Travailler avec des données non-étiquetées
[CT13]
Valentin Carlier,
Louis-Pierre Posant g̃(x) = g(−x) et k = g̃ ? g, on a l’égalité remarquable (g étant à valeurs réelles)
Chaintron
Retour aux fondamentaux kµk2k = hg ? µ, g ? µi = hb
g×µb, gb × µ
bi = hb
µ, gb × gb × µ
bi = hb ? g ? µi = hµ, k ? µi
µ, g̃ \ (10.24)
A chaque fonction noyau k de la forme g̃ ? g est donc associé un produit scalaire. Si de plus les
mesures sont combinaison de mesures de Dirac (cas des nuages de points), on a l’expression très
simple
XX Xn n
X
hµ, νik = k(xi − yj )µi νj où µ = µi δxi et ν = νj δ yj (10.26)
i j i=1 j=1
Le cas lié à notre étude est celui où p = 2, et on notera plus simplement H m pour W m,2 . La
norme des espaces de Sobolev est alors induite par le produit scalaire
X
hf, gim = hDα f, Dα gi (10.31)
|α|≤m
10.3. Normes à noyau 133
où comme précédemment hu, vi = uv. H m est un espace de Hilbert. Pour f dans L2 de classe
R
Rn
C ∞ et α liste d’au plus m indices, la condition kf kH m < ∞ se réécrit kfbkH m < ∞ d’après
l’égalité de Parseval, c’est-à-dire Z
|fb(ω)|ω||α| |2 dω (10.32)
Rn
avec Z
(f, g)m = g (ω)(1 + |ω|2 )m dω
fb(ω)b (10.34)
Rn
|f (ω)|2
Z b
2
kf kV = dω = hk (−1) ? f, f i (10.35)
n
k(ω)
b
R
f (ω)b
g (ω)
Z b
hf, giV = dω = hk (−1) ? f, gi (10.37)
k(ω)
b
Rn
Une condition suffisante à cela est que b k soit à la fois continue et dans L1 . Le Théorème de
Représentation de Riesz dans un espace de Hilbert permet alors d’identifier δx à la fonction
continue k ? δx : y 7→ k(y − x), grâce à l’identité
Cette approche a permis une fois de plus d’identifier les mesures à des formes linéaires continues
sur des espaces de fonctions continues. La norme naturelle pour une mesure µ est alors la norme
duale kµk = supkf kV ≤1 hµ, f i. On l’explicite par la méthode habituelle des multiplicateurs de
Lagrange. On se ramène à maximiser la quantité hµ, f i sous la contrainte kf kV = 1. La condition
de colinéarité des gradients assure l’existence d’un réel λ tel que la fonction maximisante f vérifie
f = λk ? µ. De
on déduit λ = √ 1
, puis f = √ k?µ
. Finalement
hµ,λk?µi hµ,λk?µi
k?µ hµ, λk ? µi p
kµk = hµ, p i= p = hµ, λk ? µi = kµkk (10.41)
hµ, λk ? µi hµ, λk ? µi
Remarque 6. On s’est ramené à une situation analogue à celle qu’on avait pour k.k∞ dans l’espace
de Sobolev associé à L∞ (Rn ). A ceci près que désormais, on dispose d’une distance capable de
comparer les formes.
10.5 Conclusion
La comparaison des formes nous a d’abord entrainé à changer de point de vue en considérant
nos nuages de points comme des mesures. Le problème s’est alors ramené à construire une distance
permettant de comparer efficacement deux mesures. La solution présentée ici consiste à utiliser
des normes à noyau, en voyant nos mesures comme des formes linéaires sur l’analogue d’un espace
de Sobolev. Une telle norme correspond à la donnée d’une fonction k suffisamment régulière, qu’on
choisira en pratique avec des dérivées nulles en zéro est un « rayon de floutage » suffisamment
large pour préserver l’information que le nuage de points donne sur la forme. D’autres méthodes
fructueuses pour construire des distances sur les mesures consisteraient à utiliser des estimations
probabilistes, ou des techniques de transport optimal.
Chapitre 11
Géodésiques Riemanniennes,
équations Hamiltoniennes Séance 11
Antoine Le Calvez
Raphaël Barboni
Deux résultats
remarquables
11.1 Métrique riemanienne, distance de chemins
Rappel
On définit en tout point d’un variété riemanienne M une métrique locale g qui sert à évaluer
les distances dans le plan tangent.
Définition 11.1. On appelle métrique sur Rn une matrice symétrique définie positive g définis-
sant un nouveau produit scalaire hgv, wi et donc une nouvelle norme :
kvk2g = hgv, vi
On définit alors sur le dual la cométrique K := g −1
Remarque 11.1. Si p = gv , kvk2g = hgv, vi = hp, vi = hp, Kpi = kpk2K
Définition 11.2 (Métrique Riemanienne). On appelle métrique riemanienne sur une variété M
une application qui associe à tout point de la variété une métrique sur l’espace tangent en ce
point.
g : q ∈ M 7−→ gq ∈ Tq M
Pour des raisons pratiques, on supposera de plus que les métriques sont C 1 .
Définition 11.3 (Coût d’un chemin). Etant donné q : [0; 1] −→ M , C 1 par morceaux, un chemin
sur une varieté, on définit le coût et la longueur de q par :
Z 1
C(q) = l(q)2 = ˙ 2 dt
kq(t)k q(t)
0
Cela permet de munir M d’une structure métrique en posant :
d(a, b) = Inf l(q)
q:[0,1]→M
q(0)=a,q(1)=b
Définition 11.4 (Plus court chemin). On appelle plus court chemin de a à b un chemin dont la
longueur réalise d(a, b). Les géodésiques sont localement des plus courts chemins, elles minimisent
le coût entre deux point proches.
Dans la suite notre but sera de caractériser par une équation les géodésiques sur une variété.
137
Séance 11 138 Chapitre 11. Géodésiques Riemanniennes, équations Hamiltoniennes
Antoine Le Calvez
Raphaël Barboni
ux résultats remarquables Equation hamiltonienne des géodésiques
Dans un chapitre précédent nous avons pu décrire explicitement les géodésiques de trois
espaces homogènes : le plan euclidien, la sphère et le plan hyperbolique (ou disque de Poincaré).
Grâce aux nombreuses isométries de ces espaces, nous avions en effet réussi à nous ramener à
des cas simples, accessibles au calcul et au raisonnement direct.
En toute généralité, ce n’est plus possible : la Figure 11.1 montre bien que sur une surface quel-
conque, on ne peut espérer de description exhaustive simple des courbes géodésiques. D’ailleurs,
ce n’est pas parcequ’une courbe est géodésique, ou “droite” (ce qui est une notion locale : entre
deux points proches, elle minimise la distance) qu’elle est nécessairement un plus court chemin
entre ses deux extrémités : on peut souvent trouver d’autres géodésiques plus astucieuses, qui
coupent à travers les “vallées” !
Figure 11.1 – Trois exemples de trajectoires géodésiques – i.e. qui minimisent localement la
longueur – sur une statue de taureau. On l’aura compris, l’ensemble des “lignes droites” est ici
bien plus riche que sur la sphère homogène !
Image tirée du très bon film Chaos de Jos Leys, Étienne Ghys et Aurélien Alvarez, accessible
librement à l’adresse suivante : www.chaos-math.org.
Nous allons établir une équation différentielle verifiée par les plus courts chemins, ce qui
permettra de les calculer algorithmiquement (à l’aide d’une méthode d’Euler par exemple).
Ici on travaille sur U , ouvert de Rn .
Définition 11.5 (Energie cinétique). On pose, par analogie avec la physique, l’énergie cinétique
du couple (q, v) par :
1 1
E : (q, v) ∈ Rn × Rn 7−→ kvk2q = hgq v, vi
2 2
Comme on a consideré la métrique C 1 , E l’est aussi. On a :
Z 1
C(q) = 2 E(q(t), q̇(t))dt
0
d
∂v E(q, q̇) = ∂q E(q, q̇)
dt
Démonstration. Si q est un plus court chemin entre a et b dans U . Par définition, q est un point
critique de la fonction de coût. On se ramène alors à une dérivation en dimension 1 en perturbant
q par xQ où Q est un chemin s’annulant en 0 et en 1 et où x ∈ R est un paramètre proche de 0.
On pose f (x) := C(q + xQ) définie et dérivable au voisinage de 0 avec f 0 (0) = 0. La densité des
chemins s’annulant en 0 et en 1 dans l’ensemble des chemins permet ensuite de conclure.
Exercice 11.1 (Géodésique de Rn ). On retrouve avec la formule précédente que les géodésiques
de Rn , muni de la métrique euclidienne, sont les courbes d’accelération nulle, c’est à dire les
lignes droites.
Plutôt que d’essayer de développer cette expression, on pose :
p := gq v = ∂v E(q, v)
1
H(q, p) = hp, Kq pi = E(q, Kq p)
2
On a alors :
∂q H(q, p) = −∂q E(q, Kq p)∂p H(q, p) = Kq p
Théorème 11.1 (Equations de Hamilton). On a équivalence entre les deux propositions sui-
vantes :
1. γ est une courbe géodésique, qui minimise (localement) la distance.
2. La trajectoire relevée (qt , pt ) dans l’espace des phases suit le flot hamiltonien correspondant
au gradient symplectique (tourné de − π2 ) de H :
(
q̇t = + ∂H
∂p (qt , pt ) = +Kqt pt
(Ham) : ∂H . (11.1)
ṗt = − ∂q (qt , pt ) = −∂q (pt , Kq pt )(qt )
Séance 11 140 Chapitre 11. Géodésiques Riemanniennes, équations Hamiltoniennes
Antoine Le Calvez
Raphaël Barboni
ux résultats remarquables Remarque 11.3. Pour q un plus court chemin, on a :
˙
q q
= R− π2 ∇H
p p
˙
q
est orthogonal à ∇H tout le long du chemin donc q suit une équipotentielle : on retrouve
p
que H(q, p) est constant tout le long du chemin.
Remarque 11.4. La réciproque est fausse : un chemin vérifiant les équations de Hamilton n’est
pas forcément un plus court chemin entre ses deux extremités. On peut seulement affirmer que
c’est localement un plus court chemin, c’est à dire un géodésique.
12.1 Introduction
Rappelons notre motivation initiale : on cherche des géodésiques sur l’espace des nuages de
points muni de la métrique de transport corrélé, c’est-à-dire trouver un chemin q minimisant
Z 1
2
c(q) = kq̇(t)kq(t) dt
0
2
où kq̇(t)kq(t) = gq(t) q̇(t), q̇(t) . Cependant, dans les équations hamiltonniennes, ce sont les mo-
141
Séance 12 142 Chapitre 12. Cométriques à noyaux, méthode LDDMM
Emmanuel Kammerer
Léo Hahn-Lecler
Pour ce qui est du calcul de H(q, p) = 21 pT Kq p, la multiplication par p va être rapide avec
PyTorch car on va pouvoir effectuer de nombreux calcul simples en parallèle en utilisant la carte
graphique. Reste donc le calcul de Kq = gq−1 qui dépend de la métrique choisie.
Une remarque importante que l’on peut faire est que la métrique gq n’intervient pas dans nos
calculs qui utilisant uniquement Kq = gq−1 . Il est donc intéressant de se donner directement la
cométrique Kq pour ne pas devoir inverser (coûteux algorithmiquement) une matrice à chaque
fois que l’on veut calculer H(q, p).
Maintenant que l’on a décidé de se donner la cométrique Kq , il faut la construire rapidement.
Cela fait (N d)2 coefficients à calculer, où d est la dimension de l’espace et N le nombre de points
dans le nuage. Pour cela on peut utiliser la cométrique à noyaux
−kxk2
où k est une fonction de noyau (par exemple une gaussienne k(x) = e 2σ2 ). Elle est symétrique
et on vérifiera plus tard qu’elle est définie positive. Cette matrice est égale au produit tensoriel de
la matrice Id et de la matrice de noyau réduite kq = [k(qi − qj )]i,j . On peut calculer rapidement
12.3. Comprendre les cométriques à noyaux 143
la matrice car la formule est parallélisable. De même pour le produit par un vecteur : on verra
qu’on peut réécrire le produit Kq v sous la forme d’un produit de convolution.
Ainsi, dans le TP, l’algorithme cherche un chemin minimisant le coût qui dépend du moment
innitial p0 (et non de la vitesse initiale). Le coût est composé de deux termes : un terme contrôlant
si l’on est proche du nuage ciblé et un terme correspondant au coût du chemin.
Remarquons que la cométrique à noyaux permet bien d’empêcher les déchirures. En effet, elles
associent un poids fort aux points proches. Cependant, on peut remarquer que les points proches
ont même tendance à se resserrer durant le trajet pour s’écarter à la fin. Comment expliquer ce
phénomène de “covoiturage” ?
Calcul de la métrique associée sur un exemple jouet Les cométriques à noyaux sont
extrêmement simples à calculer : il suffit d’une application de la fonction noyau pour chaque
terme (q i − q j ). La matrice de noyau réduite pourra alors être vue comme une matrice de
corrélation entre les points du nuage, qui associe un poids fort aux paires de points proches.
On a vu que la métrique était rapide à calculer, mais reste à voir si la métrique associée fait
−kxk2
sens ! Prenons le temps de détailler les calculs dans un cas simple, avec k(x) = e 2σ 2 le noyau
gaussien d’échelle σ, d = 2 et N = 6.
On considère un état q ∈ R12 , donné par six points (q1 , q2 , q3 , q4 , q5 , q6 ) du plan sur lesquels
on fait les hypothèses simplificatrices suivantes :
— Les points se répartissent en trois groupes (q1 ), (q2 , q3 , q4 ), et (q5 , q6 ), qui sont éloignés les
uns des autres à une distance très grande devant l’échelle σ du noyau.
— q5 et q6 sont à une distance l donnée l’un de l’autre.
— Le groupe (q2 , q3 , q4 ) est un triangle équilatéral de côté l.
Séance 12 144 Chapitre 12. Cométriques à noyaux, méthode LDDMM
Emmanuel Kammerer
Léo Hahn-Lecler
Sous ces hypothèses, on peut écrire très simplement la matrice de noyau réduite en le nuage
de points q :
1 · · · · ·
· 1 a a · ·
· a 1 a · ·
kq = ·
, (12.2)
a a 1 · ·
· · · · 1 a
· · · · a 1
−l2
où a = e 2σ2 ∈ [0, 1], et où l’on a remplacé les termes négligeables par des points.
À la limite (quand les groupes de points sont très éloignés), on obtient un matrice diagonale
par blocs de la forme :
1
1 (a)
..
t
Bn (a) = (1 − a) · In + a · (1) (1) = . . (12.3)
(a) 1
1
Pour trouver la métrique associée, c’est-à-dire inverser kq , inversons les blocs Bn (a) associés
aux amas de n points.
Pour inverser Bn (a), on peut remarquer qu’elle est symétrique et la diagonaliser pour trouver
(1)
son inverse. Un vecteur propre évident est e = k(1)k , associé à la valeur propre 1 + (n − 1)a et
on remarque que Bn (a) agit comme (1 − a) fois l’identité sur l’orthogonal. Ainsi,
1 1
Bn (a)−1 = et e + (In − et e)
1 + (n − 1) a 1−a
.
Si on décompose un vecteur v sous la forme
v = e(t ev) + (v − e(t ev)) = vmoy + vvar , (12.4)
12.3. Comprendre les cométriques à noyaux 145
Interprétation Tout d’abord, un fait rassurant : le rôle particulier joué par les champs de
vitesses constants, “colinéaires”. Lorsque n est grand, le coût associé à une translation est petit
par rapport à celui des autres transformations. Le coût associé à un champ de vitesses sur l’amas
2
est la somme d’un terme de translation, proportionnel à kvmoy k2 , et d’un terme de régularisation
2
pénalisant la non-uniformité en kvvar k2 .
Lorsque l >> σ, a est petit devant 1. On a alors
1 1
' 1 ' , (12.6)
1 + (n − 1) a 1−a
l’équilibre entre les deux pénalisations. Le coût t v(Bn (a))−1 v est simplement égal au coût t vv =
2
kvk2 , cela se ramène bien au cas où on a n blocs de taille 1.
À l’inverse, si le diamètre l de l’amas est petit devant σ, si le noyau voit les points de l’amas
comme quasiment confondus, on aura a ' 1− et par suite
1 2 2
t
v(Bn (a))−1 v ' kvmoy k2 + ∞ kvvar k2 . (12.7)
n
Ainsi, les déchirures sont surpénalisées alors que le poids des translations est atténué en n1 . Tout
se passe donc comme si notre amas de n particules se réduisait à un seul atome, très difficile à
éclater mais aussi facile à transporter qu’une particule seule.
Dans notre exemple, la métrique (réduite) est :
1 · · · · ·
· · ·
−1
· B3 (a) · ·
gq = (kq )−1 = (12.8)
· · ·
· · · ·
B2 (a)−1
· · · ·
Les trois amas sont donc complètement indépendants, ce qui n’est pas une surprise puisqu’ils
sont décorrélés au sens de k.
kfˆ(ω)k2
Z
2 d
H = {f ∈ L (R ); dω < +∞}
Rd k̂(ω)
i, j.
XN
Si p est un nuage de moments et v = Kq p, notons π = pi δqi ∈ H ∗ . Alors on a
i=1
N N
* N
+
X X
X
vi = (Kq p)i = k(qi −qj )pj = δqi , k ∗ δqj pj = δqi , k ∗ pj δqj = hδqi , k ∗ πi = (k∗π)(qi ) = u(qi )
j=1 j=1 j=1
12.4 conclusion
Les métriques à noyaux sont, en un sens, les moins chères sur un espace de nuages de points
grâce à la programmation parallèle. L’analyse de la section précédente permet de comprendre
leur comportement, et de garantir le caractère "difféomorphique" du recalage obtenu (car à
un recalage sur les nuages de points correspond un recalage sur les difféomorphismes de coût
minimal). Le choix du noyau permet de contrôler la régularité de la déformation.
Néanmoins, un effet indésirable subsiste : le “covoiturage” dont on avait parlé en première
partie. On peut l’expliquer de la façon suivante : les phases de rapprochement et d’éloignement
sont coûteuses (car les vitesses ne sont pas colinéaires) mais la phase centrale est avantageuse
(car on a vu que translater n points à distance nulle coûte autant qu’en translater un seul). Ainsi,
si la distance à parcourir est suffisamment longue, le covoiturage devient avantageux.
Séance 12 148 Chapitre 12. Cométriques à noyaux, méthode LDDMM
Emmanuel Kammerer
Léo Hahn-Lecler
Figure 12.4 – Dans un ouvrage en tous points remarquable, le lettré, biologiste et mathématicien
D’Arcy Wentworth Thompson (1860-1948) souligna l’importance des facteurs environnementaux
et physiques (en opposition à la seule hérédité) dans la morphogenèse des êtres vivants. La forme
des poissons étant peu ou prou optimale, il n’y a pas une infinité de “plans” différents les uns des
autres mais bien une poignée seulement de patrons originaux, qui permettent par des déforma-
tions (non-triviales) d’engendrer toutes les formes privilégiées par l’évolution.
Pour décrire la variabilité anatomique d’une famille ou d’une population observée, il suffit donc
de donner un template de référence (arbitrairement complexe, mais commun à toutes les observa-
tions) et les déformations qui permettent de passer dudit template aux individus. La complexité
se retrouve alors découplée en deux composantes intelligibles : une image de référence, complexe
mais fixe ; des déformations propres aux sujets observées, souvent assez simples pour être décrites
avec peu de paramètres.
Fait remarquable : les schémas ci-dessus présentent la variabilité des formes de poissons non
pas comme des déplacements arbitraires de squelettes, mais comme des changements de co-
ordonnées, des déformations de l’espace ambiant. C’est sur cette idée mathématique de
déformation extrinsèque de l’espace (en opposition aux mouvements intrinsèques des particules
de poisson) que repose l’analyse procustéenne et la théorie “LDDMM” présentée dans ce cha-
pitre. Grâce aux algorithmes détaillés dans les pages qui suivent, on peut aujourd’hui produire
des figures de ce type de manière automatique.
On Growth and Forms, 1946.
Chapitre 13
Vadim Lebovici
et Arthur Touati
13.1 Objectifs Fondamental
149
Bonus 150 Chapitre 13. Méthodes à noyaux pour l’appariement de nuages de points
[Gla05]
Vadim Lebovici des points de références sur les formes que nous serons amenés à comparer (artère pulmonaire,
et Arthur Touati artère aorte pour le cœur par exemple).
Fondamental
13.2 Difféomorphismes
Supposer les déformations linéaires est trop restrictif pour faire de la reconnaissance de formes,
c’est pourquoi il est nécessaire de se placer en dimension plus grande et même infinie pour
s’autoriser des déformations plus complexes et ainsi accéder à des résultats plus fins. On se
placera donc dans un espace de difféomorphismes.
Le schéma général est le suivant : on construit d’abord un espace de vecteurs dont la norme
définira le coût d’une déformation infinitésimale et les difféomorphismes permettant de déformer
nos formes seront obtenus par intégration d’une équation de flot. On doit pour ceci travailler
avec un contrôle L1 ou L2 sur nos champs de vecteurs.
Construisons les champs utiles à la construction de nos déformations élastiques.
Définition 13.1. Un espace vectoriel V de champs de vecteurs sur Rd sera dit admissible s’il
vérifie les conditions suivantes :
1. V est un espace de Hilbert. On note sa norme k · kV et son produit scalaire h·, ·iV .
2. (V, k · kV ) s’injecte continûment dans (C01 (Rd , Rd ), k · k1,∞ ) des champs de classe C 1 sur
Rd s’annulant à l’infini, ainsi que leurs dérivées partiellles. Il existe donc cV > 0 telle que :
En fait, les difféomorphismes que nous allons définir sont vus comme solutions d’une équation
de flot. On voit en fait un champ de vecteur vt (modélisant des déformations infinitésimales),
déformer notre espace au cours du temps. Arrivé au temps t, la déformation définit un difféo-
morphisme. On dispose d’un théorème qui nous assure l’existence et l’unicité de telles solutions.
Cependant, il nous faut des hypothèses supplémentaires sur nos champs de vecteurs, un contrôle
L1 . On définit alors
Remarque 13.1. L’espace (L1V , kvkL1V ) est un Banach et (L2V , kvkL2V ) est un Hilbert. De plus
notons aussi que L2V s’injecte dans L1V par inégalité de Cauchy-Schwarz.
On peut alors, si l’on prend un champ de vecteur adéquat, énoncer le théorème suivant et
construire nos difféomorphismes :
13.2. Difféomorphismes 151
Figure 13.1 – Déformation d’une surface en une autre, sous l’action d’un difféomorphisme.
Étape par étape, on voit la grille se déformer sous l’action d’un champs de vecteur vt .
Bonus 152 Chapitre 13. Méthodes à noyaux pour l’appariement de nuages de points
[Gla05]
1 d v
Vadim Lebovici Théorème 13.1. Soit v ∈ LV . Pour tout x ∈ R , il existe une unique application t 7→ Φt (x)
d
et Arthur Touati continue de [0, 1] dans R vérifiant l’équation de flot
Fondamental Z t
Φvt (x) = x + vs ◦ Φvs (x) ds. (13.6)
0
Autrement dit,
Φv0 (x) = x Φ̇vt (x) = vt (Φvt (x)) (13.7)
On peut en fait montrer que l’application x 7→ Φvt (x) est un homéomorphisme de Rd dans
R . Les difféomorphismes qui vont nous servir sont donc les éléments de l’ensemble
d
Tout ceci nous permet alors de poser un coût pertinent à la transformation de O1 à O2 , qu’on
notera J et on peut définir proprement le problème d’appariement :
Définition 13.3. Soit A : AV 7→ [0, +∞[ une fonctionnelle (appelée attache aux données), et
λ > 0 fixé. Le problème d’appariement pour A consiste à minimiser sur AV
J(Φ) = λdV (id, Φ) + A(Φ). (13.15)
ou encore de manière équivalente à minimiser sur L2V la fonctionnelle :
Z 1
J(v) = λ kvt k2V dt + A(Φv1 ). (13.16)
0
Remarque 13.2. L’équivalence entre les deux formulations provient du théorème d’existence de
géodésiques sur AV . Attention : en dimension infinie, c’est un résultat compliqué !
Pour résoudre ce problème d’appariement, on possède un premier théorème d’existence de
solution, qui nous assure que ceci n’est pas vain et qu’il existe effectivement des difféomorphismes
qui vont nous permettre en pratique de passer d’une forme à une autre de façon optimale.
En pratique, il s’agira de trouver un difféomorphisme Φ, qui déforme une forme X en une
forme Φ(X) proche de X e : on prendra typiquement pour A une attache quadratique du type
kΦ(X)− Xk avec une norme à préciser sur l’espace E des observations. La forme optimale Φ(X)
e 2
pourra alors être vue comme un barycentre des points X – de poids λ – et X e – de poids 1.
Le réel λ est un poids de régularisation, qui force Φ(X) à rester dans un voisinage de X :
on prendra souvent 0 < λ << 1, de façon à avoir un modèle Φ(X) proche de l’observation X, e
mais qui reste à distance “finie” de la forme X. Comme nos normes RKHS – définies ci-dessous –
pénalisent de manière exponentielle les discontinuités de Φ à une échelle inférieure à une longueur
caractéristique σ, résoudre le problème d’appariement sera alors un moyen de trouver, parmis
les déformations σ-lisses de X, la forme la plus proche de X. e
Bonus 154 Chapitre 13. Méthodes à noyaux pour l’appariement de nuages de points
[Gla05]
Vadim Lebovici
et Arthur Touati
Fondamental
Figure 13.2 – Matching d’un carré sur un cercle, à l’aide d’un noyau gaussien (k(x, y) =
2
exp(−kx − yk /2σ 2 )). Un tel noyau force la préservation des structures plus fines que σ, en
corrélant fortement les points tels que k(x, y) ' 1.
On peut alors appliquer le théorème de Riesz aux δxα et définir le noyau reproduisant d’un
RKHS :
Définition 13.6. On appelle noyau vectoriel positif de dimension m sur S toute application
k : S 2 7→ L(Rm ) telle que
∀(x, y) ∈ S 2 , k(x, y) = k(y, x) (13.20)
X
∀(x1 , ..., xn ) ∈ S n , ∀(α1 , ..., αn ) ∈ (Rm )n , αj · k(xi , xj )αi ≥ 0 (13.21)
1≤i,j≤n
Le noyau est dit strictement positif si lorsque les xi sont distincts, l’expression ci-dessus est
nulle si et seulement si les αi sont tous nuls. On montre l’équivalence entre la notion de noyau
reproduisant et la notion de noyau vectoriel positif :
Dans le cas d’un RKHS séparable, si on se donne une base orthonormée (en )n∈N , un simple
calcul nous donne que :
n
X
∀(x, y) ∈ S 2 , ∀α ∈ Rm , kH (x, y)α = lim (α · en (x))en (y) (13.23)
n→+∞
k=0
Bonus 156 Chapitre 13. Méthodes à noyaux pour l’appariement de nuages de points
[Gla05]
2. Pour tout v0 ∈ V il existe un champ v0S ∈ VS⊥ tel que v0|S = v0|S
S
. Le champ v0S est le
champ de norme minimale dans V interpolant v0 sur S.
On montre maintenant comment le noyau kV nous permet d’interpoler n’importe quel champ
de vecteur en minimisant la norme.
Théorème 13.3. Supposons que kV soit strictement positif. Soient x1 , ..., xn des points tous
distincts de Rd et γ 1 , ..., γ n des vecteurs de Rd . Il existe une unique solution v∗ ∈ V au problème
d’interpolation suivant :
v(xi ) = γ i
(13.25)
kvkV minimal
La solution v∗ s’écrit
n
X
v∗ = kV (xi , x)αi (13.26)
i=1
Démonstration. Le système linéaire précédent admet une unique solution par stricte positivité
du noyau. Le champ v∗ satisfait par construction la condition d’interpolation. On est dans la
situation de la proposition précédente avec S = {xi , 1 ≤ i ≤ n} et v0 = v∗ . Par construction v∗ ∈
VS⊥ donc c’est l’unique solution du problème d’interpolation et v∗ est bien de norme minimale.
13.5. Méthodes à noyaux 157
La minimisation se fait a priori sur L2V . Notons L2V,S le sous-ensemble fermé de L2V suivant :
On a le résultat suivant :
S
Théorème 13.4. Pour tout champ v ∈ L2V , il existe v S ∈ L2V,S tel que Φv1|S = Φv1|S et kvtS k ≤
kvt kV pour tout t ∈ [0, 1].
Démonstration. Pour t ∈ [0, 1], on définit vtS comme le champ minimal interpolant vt sur Φvt (S).
S
Par construction on a kvtS k ≤ kvt kV pour tout t ∈ [0, 1]. De plus, par unicité du flot, Φv1|S = Φv1|S
pour tout t ∈ [0, 1]. D’après la proposition 13.4, vtS ∈ VΦ⊥v (S) = V ⊥vS donc v S ∈ L2V,S .
t Φt (S)
xi0 = xi
Pn (13.31)
∂t xit = vt (xit ) = j=1 kV (xj , xi )αtj .
Bonus 158 Chapitre 13. Méthodes à noyaux pour l’appariement de nuages de points
[Gla05]
Vadim Lebovici On voit que l’on peut paramétrer l’espace de minimisation LV,S par les vecteurs αt . Un des
2 i
et Arthur Touati intérêts majeurs de la formule définissant vt est de pouvoir calculer facilement la norme de vt :
Fondamental
n
X
kvt k2V = αtj · kV (xj , xi )αtj (13.32)
i,j=1
où les trajectoires xit ∈ Rd sont calculées par résolution du système différentiel 13.31.
Thinking in terms of coordinates, we are often used to say that gq is an m-by-m positive definite
symmetric matrix, thus working with the usual dot product (u, v) = uT v. However, as we will now
discover the proeminent role played by the cotangent bundle T ? M , we have to be more careful
and disambiguate the distinction between Tq M and Tq? M = (Tq M )? . The so-called bilinear “dot
product” shall then be reserved to couples (u, v) ∈ Tq? M × Tq M , with
At each location q ∈ M , the metric tensor gq can now be seen as a linear isomorphism
gq : Tq M → Tq? M, (13.36)
13.6. Équations Hamiltoniennes 159
and we will pay special attention to its inverse, the kernel or co-metric tensor
Kq : Tq? M → Tq M. (13.37)
Dual norm A remarkable fact about the positive definite symmetric tensor Kq is that it
encodes on Tq? M the dual norm of gq :
!2
2
∀p ∈ Tq? M, kpkgq? = sup (p, v) = (p, Kq p). (13.39)
(v,gq v)=1
in the tangent bundle T M makes no difficulty : undergrad physics courses have taught us how
insightful it can be to study dynamical systems in the “phase plane”.
Pushing even further, we can define the smooth trajectory
in the cotangent bundle T ? M . Kinetic energy can now be expressed smoothly as a function –
the so-called Hamiltonian – of the phase points (q, v) or (q, p) :
1 1
E(q, v) = (v, gq v), H(q, p) = (p, Kq p). (13.43)
2 2
At first sight, those two formalisms are completely equivalent, and we barely see the need for
a non-intuitive “co-tangent” phase space...
Otherwise said, the geodesics of M are exactly the projection on the space coordinate “q” of
the integral trajectories – in phase space T ? M – of the hamiltonian dynamical system
Vadim Lebovici and we have an equivalence between the two shootings Cauchy problems, associated respectively
et Arthur Touati to the geodesic and hamiltonian equations :
Fondamental
q(0) = q0 q(0) = q0
(Shootq0 ,v0 ) : , (Shoot?q0 ,p0 ) : . (13.46)
q̇(0) = v0 = Kq0 p0 p(0) = p0 = gq0 v0
The above theorem is a stunning result : it reduces the geodesic equation – a priori, an order 2
ODE given through highly non-trivial Christoffel coefficients – to a sole order 1 equation in phase
space, whose vector field happens to be the rotated gradient of the “kinetic energy”.
The standard proof of this result relies on the calculus of variations, and is very much related
to the fact that geodesics locally minimize the length. In this report, for a change, we will give
an elementary proof : The only “hard to prove” lemma will be the fact that our m-manifold M
can be isometrically embedded in the euclidean space Rn , at least locally – the global statement
is true, and has been proved by Nash, but is way too hard to be detailed here. This fits well
within the spirit of the lecture group “Introduction to Riemannian Geometry through the study
of shapes spaces”, given to undergrad students at the Ecole Normale Supérieure in the autumn
of 2016.
Main proof : Hamiltonian formulation of the geodesic equations.
Lemme 13.2 (Locally, M can be isometrically embedded in a euclidean space Rn ).
Let q0 be a base point in M . Then there exists a neighborhood Ω of q0 in M , a euclidean space Rn
– with n > m – and a smooth diffeomorphism
Simplifications Now, consider a smooth trajectory qt = q(t) in M such that q(0) = q0 . For
all time t, we can define pt = gqt q̇t , and the above lemma gives us a neighborhood Ω of q0 , and
an embedding ϕ : Ω → Rn .
We want to characterize on pt the property « qt is a solution of the geodesic equation » :
as this is a local problem, we can restrict our study to the case where M = Ω. Restricting the
neighborhood even further, we can even assume that Ω is covered by a single coordinate chart :
we can safely assume that M = Ω is an open set of Rm , endowed with a smooth metric g.
Denoting dϕ?q the euclidean adjoint of dϕq – in coordinates, it’s nothing but the transpose –, we
then have :
then becomes :
Finally, we remind the reader that since ϕ is of class C 2 , it has an order two differential at
every point q,
d2 ϕq : Tq M → L(Tq M, Rn ), (13.53)
which is such that, according to Schwarz’s theorem,
Replacing the time derivative q̇t by its phase-space expression Kqt pt , we also know that :
˙
q̈t = K
\ qt pt (13.62)
= (dq Kq · q̇t ) pt + Kqt ṗt (13.63)
= (dq Kq · Kqt pt ) pt + Kqt ṗt . (13.64)
dq Kq · Kqt pt = −Kqt (d2 ϕ?qt · Kqt pt ) dϕqt + dϕ?qt (d2 ϕqt · Kqt pt ) Kqt . (13.69)
Bonus 162 Chapitre 13. Méthodes à noyaux pour l’appariement de nuages de points
[Gla05]
+ ṗt
i.e. ṗt = (d2 ϕ?qt · Kqt pt ) dϕqt Kqt pt (13.76)
Interpretation of ṗt as a gradient The last step of our proof is to see that the above
expression is nothing but the opposite of the Hamiltonian’s q-gradient. Indeed, according to the
very definition of what is a gradient and the expression computed equation (13.68), we know
that for any displacement δq ∈ Tqt M ,
1 1
pt , Kqt (d2 ϕ?qt · δq) dϕqt + dϕ?qt (d2 ϕqt · δq) Kqt pt (13.77)
− ∂q pt , Kq pt · δq =
2 2
Now, developping by linearity :
1 1 1
− ∂q pt , Kq pt · δq = pt , Kqt (d2 ϕ?qt · δq) dϕqt Kqt pt + pt , Kqt dϕ?qt (d2 ϕqt · δq)Kqt pt (13.78)
2 2 2
1 1
= Kqt pt , (d2 ϕ?qt · δq) dϕqt Kqt pt + Kqt pt , dϕ?qt (d2 ϕqt · δq)Kqt pt (13.79)
2 2
1 2 1
= (d ϕqt · δq) Kqt pt , dϕqt Kqt pt + dϕqt Kqt pt , (d2 ϕqt · δq)Kqt pt (13.80)
2 2
= (d2 ϕqt · δq) Kqt pt , dϕqt Kqt pt (13.81)
since Kqt is symmetric (i.e. Kq?t = Kqt ) and dϕ?? qt = dϕqt . The last step is then to remember
that, according to Schwarz’s theorem,
(d2 ϕqt · δq) Kqt pt , dϕqt Kqt pt = (d2 ϕqt · Kqt pt ) δq, dϕqt Kqt pt (13.82)
= δq, (d2 ϕ?qt · Kqt pt ) dϕqt Kqt pt (13.83)
13.6. Équations Hamiltoniennes 163
Otherwise said,
1
− ∂q pt , Kq pt = (d2 ϕ?qt · Kqt pt ) dϕqt Kqt pt (13.84)
2
in the sense of the space of linear forms Tq? M .
Conclusion All in all, we have proved that given pt = gqt q̇t the only trajectory in the space
of co-vectors (« momentums ») such that
∂H(q, p)
q̇t = + (qt , pt ) = Kqt pt , (13.85)
∂p
then ϕ(qt ) is a geodesic of the surface ϕ(M ) embedded in the the euclidean space Rn if and only
if the acceleration of this kinematic point is purely normal, i.e.
¨
∀ t, πT⊥ϕ(q) ϕ(M ) ϕ(q
[ t ) = 0, (13.86)
∂H(q, p)
∀ t, ṗt = − (qt , pt ) = (d2 ϕ?qt · Kqt pt ) dϕqt Kqt pt . (13.87)
∂q
Now, a word about our proof. It is filled with elementary but cumbersome calculations, no
doubt about it. But it also allowed us to interpret the co-metric in a rather unusual way : denoting
X = ϕ(M ) the embedded m-hypersurface and ψ = ϕ−1 : X → M our isometry, we have seen
that
∀ x ∈ X, Kψ(x) = dψx πT⊥x X dψx? , (13.88)
which means that the action of Kq = Kψ(x) can be decomposed as follow :
1. Given a linear-form/momentum p ∈ Tq? M , consider its isometric representant dψx? p in the
?
dual euclidean space Rn .
? ?
2. Taking advantage of the canonical identification (Rn , geucl ) ' Rn , geucl , orthogonally
project this representant onto Tx X ' Tx? X – in all of the above, we have ommitted to
write explicitely the Riesz mapping In : (Rn )? → Rn .
3. In the end, push(“-back”) the projected tangent vector towards Tq M .
Kq could therefore be seen as a projection operator, which forgets about irrele-
vant/inaccessible/inefficient directions to concentrate on the sole tangent plane.
et Arthur Touati 1
qt1
Fondamental pt
pt = ... qt = ... (13.90)
pnt qtn
Enfin on définit :
Kqt = (kV (xit , xjt ))1≤i,j≤n (13.91)
La matrice Kqt est inversible pour tout t dans [0, 1] par stricte positivité du noyau. On a alors
vt = q˙t = Kqt pt , on retrouve bien le formalisme hamiltonien. De plus, kvt k2V = (pt , Kqt pt ).
On montre maintenant comment réduire à nouveau le problème de minimisation.
Etape 1 : on est sur une géodésique R 1 Si la trajectoire qt est telle que vt = q˙t minimise la
fonctionnelle J(v), alors elle minimise 0 kq˙t kV dt c’est-à-dire la longueur du chemin parcouru,
c’est donc une courbe minimisante. Comme on l’a vu en géométrie riemannienne, les courbes mi-
nimisantes sont des géodésiques. On a montré que si une trajectoire minimise notre fonctionnelle,
c’est une géodésique. Le couple (qt , pt ) vérifie donc les équations de Hamilton :
q˙t = Kqt pt
(13.92)
p˙t = −∂q (pt , Kq pt )(qt )
Etape 2 : réduction Si on est sur une géodésique, la vitesse est de norme constante c’est-à-dire
est constant égal à (p0 , Kq0 p0 ). Dans les équations de Hamilton c’est un fait qui est reflété par
le fait que l’évolution suit un gradient de l’énergie cinétique... tourné de 90◦ ! La fonctionnelle
prend alors la forme très simple suivante :
Arnaud Eteve et
Yohan Mandin
14.1 Introduction -Huble
Aspects
L’objectif de ce chapitre est d’apporter plusieurs solutions au problème de l’appariement pratiques
non-labellisé, c’est-à-dire entre deux nuages de points considérés globalement, où les points ne
sont plus regroupés par paires point source, point cible. On pourra travailler avec un nombre de
points source et un nombre de points cible différents, et s’affranchir de la nécessité d’associer les
points par paires (opération souvent arbitraire et non pertinente, comme dans le cas de points
répartis sur une courbe). Nous présenterons trois modélisations différentes : par les mesures, par
les courants et par les varifolds, avant d’en décrire les avantages et limitations respectives.
165
Bonus 166 Chapitre 14. Appariement de courbes et surfaces polygonales
[CT13]
Arnaud Eteve et et, étant donné une norme k·k sur un sous-ensemble dense de C0 (R ), on peut définir la norme
d
-Huble Z
Aspects ?
∀ µ ∈ Ms (Rd ), kµk = sup f dµ, kf k 6 1 . (14.2)
pratiques
Le problème est alors de trouver une norme sur les fonctions qui réalise un bon compromis entre :
— la simplicité mathématique/algorithmique.
?
— la pertinence pour nos problèmes de matching : la distance kµ − νk devrait se réduire au
fur et à mesure que l’objet représenté par µ se “rapproche” de l’objet représenté par ν.
Nous allons comparer, pour l’exemple, deux normes sur Ms (Rd ) (qui ne seront pas celles
utilisées in fine). Si, pour commencer, nous utilisons la norme infinie :
Z
?
kµk∞ = sup d
f dµ, f ∈ C0 (R ), kf k∞ 6 1 (14.3)
Rd
Cette mesure ne peut que donner de très mauvais résultats. En effet, si µ et ν correspondent
à deux nuages disjoints de points, chaque point ayant pour masse 1, on peut trouver une fonction
continue bornée par 1 valant 1 sur les points de µ et −1 sur ceux de ν. Autrement dit,
?
kµ − νk∞ = |µ| + |ν|, (14.4)
ce qui n’encode aucune information sur les positions relatives de µ et ν. Cela vient du fait que
la norme infinie n’interdit aucunement à une fonction de sauter du coq à l’âne entre le support
de µ et celui de ν, même s’ils sont géométriquement proches. On va donc tenter d’imposer une
certaine lissité à la fonction, en rajoutant un terme régularisant.
Nous définissons par exemple :
Z
?
kµk∞,λ = sup d
f dµ, f ∈ C1 (R ), kf k∞ + λ kdf k∞ 6 1 , (14.5)
Rd
où λ est un réel strictement positif à choisir. En pratique, ce paramètre λ représente le rayon
caractéristique d’une zone autour de µ où une proximité géométrique avec ν se traduit par une
petite valeur de kµ − νk∞,λ , ce qui est souhaitable : une fonction f telle que kdf k∞ 6 1/λ – i.e.
une fonction (1/λ)-lipschitzienne – ne saurait passer de 1 à −1 entre deux points λ-proches. En
pratique, il ne faudrait donc pas choisir λ trop petit, sous peine d’isoler µ et de retomber dans le
cas de la norme infinie, mais pas trop grand non plus, pour ne pas que n’importe quelle mesure
soit proche de µ (floutage trop important).
Donc :
ϕ.δx = δϕ(x) (14.8)
D’où le résultat suivant pour un nuage de points :
X X
ϕ. ai δxi = ai δϕ(xi ) (14.9)
2
X
kµkI 0 = ai aj kI (xi , xj ) (14.14)
i,j
Arnaud Eteve et Attardons-nous quelque peu sur cette formule, en rappelant qu’on prendra typiquement
2
Yohan Mandin kI (x, y) = exp(−(x − y) /2σI2 ). Si on a par exemple
-Huble
Aspects µ = aδx ν = bδy , (14.18)
pratiques
on aura alors :
2
kµ − νk = hµ, µi − 2hµ, νi + hν, νi
(14.19)
= a2 − 2 ab · k(x, y) + b2 ,
ce qui, dans le cas d’une mesure de comptage – où a = b = 1 – se réduit à
2
(14.20)
kµ − νk = 2 · 1 − k(x, y)
Le point clé de tout ce chapitre est alors de comprendre que la fonction “noyau” de corréla-
tion entre deux formes élémentaires (ici, des points isolés, représentés commes des diracs) permet
en fait de coder une distance, un terme d’attache aux données bien défini. Ansi, si on suppose
que y est la cible et x le point à transporter, minimiser kµ − νk reviendra simplement à tenter
de maximiser la corrélation k(x, y), en suivant le gradient ∂x k(x, y).
Il est important de noter que l’attractivité de y est en pratique limitée à la zone de l’espace
où ∂x k(x, y) est “non nul”, i.e. une boule centrée sur y de rayon ' 3 · σI . Au delà de ce rayon,
les points x et y n’interargissent plus (au sens où bouger x et y ne change rien à kµ − νk), et un
algorithme de matching utilisant cette attache aux données échouera.
Ce problème admet une solution en toute généralité sous l’hypothèse que µ est à support
compact, qui est vérifiée car on travaille avec des sommes finies de Dirac. Ceci tient à la présence
du λ > 0. En effet, celui-ci assure que les minima de J peuvent être cherchés dans une boule pour
la norme L2V centrée en 0. Celle-ci n’est pas compacte pour la norme sur L2V (c’est un espace
de dimension infinie), mais un travail non trivial permet d’obtenir des résultats qui assurent la
présence d’un minimum – c’est une conséquence du théorème de compacité faible de Banach-
Alaoglu, un des points culminants du cours d’analyse fonctionnelle. Cette solution peut être
obtenue par un algorithme de descente de gradient qui sera explicité plus loin dans le cadre
des varifolds. Nous allons enfin énoncer un théorème justifiant notre démarche (qui consiste à
échantilloner la courbe source et la courbe cible, trouver une déformation optimale d’un nuage
de points vers l’autre, et espérer que cette déformation fonctionne encore entre les deux courbes).
Théorème 14.1. Supposons que le noyau kI vérifie kI (x, y) > 0 pour tous x, y ∈ Rd et ∂1 log(kI )
borné sur tout compact. Soient µ et ν deux mesures sur Rd à support borné, et supposons que la
solution v ∗ associée au problème d’appariement de µ vers ν est unique. Soient (µn ) et (νn ) deux
suites dans Ms (Rd ) à support uniformément borné convergeant faiblement vers µ et ν respective-
ment. Alors les champs de déformation optimaux vn∗ associés au problème d’appariement de µn
vers νn convergent presque sûrement dans L2 ([0, 1| , V ) vers v ∗ .
14.2. Transport et appariement de mesures 169
Figure 14.1 – Principe de l’étiquetage partiel : µi sera matché sur νi , sans information supplé-
mentaires point-à-point.
Arnaud Eteve et
Yohan Mandin
-Huble
Aspects
pratiques
Figure 14.2 – Expérience d’appariement de deux paires de courbes – des cercles sur les croix.
À gauche, les deux jeux de données ; à droite, le matching obtenu.
Figure 14.3 – Matching d’une courbe et de deux points – des cercles sur les croix.
14.2. Transport et appariement de mesures 171
Figure 14.4 – Robustesse vis-à-vis des données non significatives (0, 20, 40 et 60 points ajoutés
aléatoirement). La régularité imposée par la norme infinitésimale sur les déformations (RKHS
gaussien de déviation σV = 0.5) permet d’encaisser un bruitage conséquent : si la déformation
est très affectée sur les coins du domaine, le matching de la courbe ne se laisse pas distraire, et
reste satisfaisant sur les quatres images.
Bonus 172 Chapitre 14. Appariement de courbes et surfaces polygonales
[CT13]
Arnaud Eteve et
Yohan Mandin
-Huble
Aspects
pratiques
Figure 14.6 – Comparaison de plusieurs tailles de noyaux avec données bruitées. σV correspond
à la taille du noyau de déformation, σI à celui de l’attache aux données.
Bonus 174 Chapitre 14. Appariement de courbes et surfaces polygonales
[CT13]
Arnaud Eteve et
Yohan Mandin
-Huble
Aspects
pratiques
Figure 14.7 – Expérience avec données bruitées, avec σV = 0.5, σI = 0.5, pour un bruit blanc
gaussien de variances du bruit 0, 0.01, 0.03, et 0.1. On le voit, choisir des valeurs importantes pour
ces deux paramètres permet de considérablement lisser le matching : en diminuant la précision
de nos attaches, on diminue aussi la sensibilité au bruit. En pratique, le choix de paramètres
appropriés aux données aura une influence considérable sur la pertinence des résultats obtenus.
14.3. Courants 175
14.3 Courants
Le transport de masse nous a permis du surmonter le problème de l’étiquetage des land-
marks. Malheureusement, pour réussir des appariements de courbes/surfaces, il reste un outil
trop élémentaire : en représentant des segments/triangles par des diracs de masse, on perd toute
information sur l’orientation. Deux bouts de courbes seront “proches” au sens des mesures s’ils
sont géométriquement voisins – à une échelle définie par le rayon σI – et qu’ils on la même
longueur, sans plus de précisions.
Pour aller plus loin, et obtenir un recalage plus fin où l’alignement des espaces tangents est
mis en avant, plusieurs formalismes ont été proposés. Dans cette section, nous présenterons le
plus ancien d’entre eux, celui des courants : on manipulera les espaces tangents aux travers de
leurs normales sortantes, traitées de manière linéaire.
14.3.1 Définitions
Définition 14.2. Une forme différentielle de degré p sur Rd est une application continue de Rd
dans l’espace des formes p-linéaires alternées sur Rd . En d’autres termes, il s’agit d’un champ
continu sur Rd de forme p-linéaires alternées – i.e. quelque chose que l’on intègre sur une p-
surface. (Par exemple, si f est une fonction numérique différentiable, alors df est une forme
différentielle de degré 1.)
Définition 14.3. L’espace des p-courants sur Rd est l’espace des formes linéaires continues sur
l’espace des formes différentielles continues de dimension p sur E qui s’annulent à l’infini.
Cette définition est l’analogue de celle de la circulation sur une courbe, ou du flux à travers une
surface. L’exemple le plus simple de courants est celui des courants de Dirac : si x est un point
et ξ un p-uplet, on définit le courant δxξ : ω 7→ ω(x)(ξ).
La question suivante qui se pose est : : comment encoder un nuage de points en termes de
courant ? Plaçons-nous par exemple dans le cas d’un nuage de points échantillonant une surface
dans R3 : C’est la donnée d’une famille de landmarks, et d’une triangulation présetnée comme
une liste de triplets d’indices. A chaque triangle (x1 , x2 , x3 ), on associe le 2-courant de Dirac
pour x = x1 +x32 +x3 et ξ = (x2 − x1 ) ∧ (x3 − x1 ) donnée comme une normale sortante, un élément
de surface → −
n · dS. Par cette méthode, on encode à la fois la localisation, l’aire du triangle et
l’orientation de la surface. C’est la principale différence pratique entre le formalisme des
courants et celui des mesures. Et si maintenant le nuage échantillone une courbe, alors à chaque
couple (x1 , x2 ) de points successifs (la courbe est orientée), on associe le 1-courant de Dirac pour
x = x1 +x
2
2
et ξ = x2 − x1 .
Tout comme on avait associé à chaque nuage de points (et plus généralement à chaque forme)
une mesure, on leur associe maintenant un courant. On cherche alors une norme sur l’espace
des courants pour définir le terme d’attache aux données qui soit calculable et qui traduise
notre intuition géométrique : de la même manière que dans la section précédente, on plonge
continûment l’espace des courants dans le dual d’un RKHS (sous l’hypothèse que le RKHS se
plonge continûment dans l’espace des formes différentielles de degré p). On peut ainsi utiliser la
norme de Hilbert sur le dual du RKHS, qui présente l’avantage d’être explicitement calculable
Bonus 176 Chapitre 14. Appariement de courbes et surfaces polygonales
[CT13]
Arnaud Eteve et dans le cas de courants associés à des nuages de points (sommes finies de courants de Dirac) :
Yohan Mandin
(14.22)
ξ1 ξ2
-Huble
δx1 , δx2 W 0 = k(x1 , x2 ) hξ1 , ξ2 i
Aspects = k(x1 , x2 )µ1 µ2 cos(θ) (14.23)
pratiques
où les ξi doivent être compris comme des normales sortantes dans le cas des surfaces, et comme
des vitesses dans le cas des courbes, où µi = kξi k la masse associée à l’élément de courbe/surface,
et où θ est l’angle entre les deux vecteurs ξi . Le formalisme des courants permet donc d’encoder
une courbe/surface comme une superposition de courants élémentaires, données d’une position et
d’un vecteur “aire · direction orientée”. La corrélation donnée par la formule ci-dessus permettra
alors de comparer ces nuages de courants, et calculer son gradient nous permettra d’obtenir des
“désirs” d’alignements pertinents.
Cette distance s’annule lorsque la distance entre x et y est petite devant σ. Il en découle certaines
pathologies : des courbes orientées de longueur plus grande que 2 dont la norme du courant
associée est arbitrairement petite, des difficultés à matcher des structures épineuses commes les
oreilles de lapin... Ceci motive l’introduction d’un nouvel objet mathématique, modélisant des
courbes et surfaces non orientées : les varifolds.
14.4 Varifolds
Dans toute la suite E est l’espace ambiant dans lequel sont plongées nos variétés – en pratique,
on a donc E = R2 ou R3 .
14.4.1 Grassmannienne
Pour contourner le problème posé par l’orientation, on introduit un nouvel objet : les va-
rifolds, ceux ci ne prennent en compte que la direction. Précédemment on pouvait représenter
une direction par un vecteur – typiquement, la vitesse ou la normale sortante – et l’espace des
orientations était un espace vectoriel : ce n’est plus possible avec les directions simplement.
Définition 14.4 (Grassmannienne). La variété grassmannienne de dimension d dans E est
l’ensemble des sous-espaces de dimension d de E. On la note Gd (E).
On peut le voir comme l’ensemble des familles de d vecteurs libres quotienté par la relation
d’équivalence :
(x1 , . . . , xd ) ∼ (y1 , . . . , yd ) ⇐⇒ Vect(x1 , . . . , xd ) = Vect(y1 , . . . , yd ) (14.25)
14.4. Varifolds 177
On vérifie alors que H d est une mesure extérieure, que sa tribu contient les boréliens. De
plus elle est bornée sur les parties compactes et est invariante par translations. Ainsi si E est
de dimension d, H d = Kλ où λ est la mesure de Lebesgue et K une constante. La mesure de
Haussdorf n’est autre que la généralisation de la d-aire aux objets non-lisses (voire fractals),
comme les collections dénombrables de segments/triangles.
14.4.3 Varifolds
Définition 14.5. Un varifold de dimension d sur E est une mesure borélienne finie sur E×Gd (E).
En particulier c’est un élément de C0 (E × Gd (E))0 , le dual topologique de C0 (E × Gd (E)).
Cette notion tirée de la théorie de la mesure géométrique semble a priori hors de propos, trop
sophistiquée pour être utilisable. On va pourtant voir qu’elle permet de représenter facilement
une surface à l’ordre 1, et qu’elle légitimera un hack bien pratique de la formule donnée équa-
tion (14.23). Étant donné X une variété de dimension d, µX est le varifold associé à X, et on le
définit par :
Dans une optique plus computationnelle, on disposera de P diracs : δ(x,V ) (ω) = ω(x, V ), et on
approchera une mesure quelconque par une somme de diracs ci δ(pi ,Vi ) :
Pour d = 1, on considère une courbe, les points sont x1 , . . . , xN et les segments (fi1 , fi2 ) :
xfi1 + xfi1
pi = (14.30)
2
Vi = (xfi1 , xfi1 ) (14.31)
ci = k−
x− −−→
fi1 xfi2 k (14.32)
Bonus 178 Chapitre 14. Appariement de courbes et surfaces polygonales
[CT13]
Arnaud Eteve et Pour d = 2, on considère une surface, de sommetsx1 , . . . , xN , et de faces triangulaires données
Yohan Mandin sous forme de triplets d’indices (fi1 , fi2 , fi3 ) :
-Huble
Aspects xfi1 + xfi1 + fi3
pratiques
p i = (14.33)
3
Vi = [−
x−−−→ −−−−→
fi1 xfi2 , xfi1 xfi3 ] (14.34)
1 −−−→ −−−−→
ci = k −x 1 x 2 ∧ xfi1 xfi3 k (14.35)
2 fi fi
Avec Vi le plan engendré par les deux vecteurs.
Enfin si ϕ est un difféomorphisme et µ un varifold on définit le transport (ϕ∗ µ)(ω) = µ(ϕ∗ ω)
où ϕ∗ ω = |ϕ0 (x)|ω ◦ ϕ.
Propriété 14.1. Si X est une sous variété de dimension d et ϕ un difféomorphisme alors
ϕ∗ µX = µϕ(X) . (14.36)
14.4.4 Noyaux
|x−y|2
On sait déjà construire un noyaux sur E, par exemple le noyaux gaussien : kE (x, y) = e− 2σ2
L’objectif de cette partie est double : la construction d’un noyau kV sur Gd (E) , puis la construc-
tion d’un noyau sur E × Gd (E) que l’on obtiendra en considérant le produit tensoriel des deux
noyaux sur chacun des deux membres du produits.
Figure 14.8 – Calcul de la distance entre les deux grilles, fonction de l’angle θ de rotation de
la grille rose par rapport à la noire. Le noyau spatial est d’une taille bien supérieure à celle
des figures – i.e. floutage complet en position –, et on utilise sur les orientations un noyau de
Cauchy-Binet (rouge) et un noyau gaussien (bleu) de faible déviation angulaire. Pour θ = 0 ou
π/2, les deux grilles coïncident : il n’est donc pas étonnant que la dissimilarité la plus impor-
tante soit obtenue avec un décalage angulaire θ = π/4. Sans surprise, il apparait que le noyau
gaussien sépare beaucoup mieux les orientations que Cauchy-Binet. On peut en effet calculer
explicitement les interactions entre une croix de la grille noire et une croix de la grille rose :
k(θ, 0) + k(θ, π/2) = cos2 (t) + cos2 (π/2 − t) = 1 pour le noyau Cauchy-Binet (d’où l’indiscer-
nabilité, qui n’est qu’approchée numériquement vu que la grille n’est pas découpée de manière
régulière par le cercle) ; par contre, ce même terme d’interaction peut prendre des valeurs inté-
ressantes si k est un pic plus resseré autour de 0.
Nous avons donc desormais une méthode simple pour construire des noyaux sur les varifolds.*
Cependant il n’est pas certain que le la norme obtenue sur W 0 soit bien séparante : cela requiert
l’injectivité de la fonction i∗ : C0 ((E × Gd (E))0 → W 0 , qyu n’est pas toujours vérifiée. Pour le
Bonus 180 Chapitre 14. Appariement de courbes et surfaces polygonales
[CT13]
Arnaud Eteve et noyau de Cauchy Binet ce n’est en effet pas le cas, on l’a bien vu lorsque celle-ci ne séparait pas
Yohan Mandin les deux grilles tournées l’une par rapport a l’autre, et ce quelque soit l’angle de rotation. On
-Huble dira que i∗ est C0 universelle si elle est injective.
Aspects
pratiques
Propriété 14.3. Prenons k = ke ⊗ kt un noyau défini comme dans la proposition précédente, et
supposons que ke est C0 universel. Supposons de plus que kt est tel que kt (V, V ) > 0 pour tout
V ∈ Gd (E).
SN SM
Alors la norme induite sur les formes est séparante, au sens où, si X = i=1 Xi et Y = i=1 Yi
sont deux unions finies de sous variétés compactes de dimension d de E, on a kµX − µY k = 0 si
et seulement si X = Y .
Propriété 14.4. Si k = ke ⊗ kG et ke est C0 universel et kG est le noyau gaussien défini comme
précédemment alors k est C0 universel sur E × Gd (E).
La conclusion des deux propriétés précédentes est que si on choisit le noyaux gaussien sur
Gd (E) alors on est certain que la norme que l’on obtient est bien séparante.
Cette dernière intégrale n’est à priori pas nulle même pour une variété sans bord ce qui
traduit l’idée que l’on a pas perdu toute l’information sur la structure, il reste encore l’infor-
mation concernant l’agencement des plans tangents, encodée comme une sorte de norme sur
l’histogramme des orientations.
On obtient en particulier l’inégalité suivante :
Propriété 14.5. Soit X une sous variété de E inclue dans la boule unité, on suppose les noyaux
choisis comme dans les propriétés précédentes. Alors il existe une constante K indépendante de
X telle que
kµX kW 0 ≥ KH d (X) (14.48)
C’est une très bonne nouvelle : la destruction de masse est ainsi évitée.
Étant donné un shoot sur l’espace des formes on peut se demander comment Évolue µX .
Propriété 14.6. Soit X une sous variété compacte et orientable et µX le varifold associé. Soit v un
champ de vecteur C 1 à support compact défini sur E, et considérons le groupe à une dimension
généré par le flot de v , t 7→ ϕt . Alors si Xt = ϕ(X) la variété transportée, pour toute fonction
ω, C 1 de E × Gd (E) on a
14.5. Retour au problème d’appariement 181
Z Z
d ∂ω ∂ω ∂ω ⊥
|t=0 µX (ω) = ( − divX ( ) − ωHX |v ⊥ ) + hν, ωv > + ( |v )i (14.49)
dt X ∂x ∂x ∂X ∂V
où v ⊥ et v > sont les parties tangentielle et normale de v le long de X, et ν est la normale unité
le long de ∂X.
Nous pouvons faire quelques remarque sur cette expression. Tout d’abord, les variations de
la norme du varifold ne dependent que de v et pas de sa dérivé. Ensuite il y a des termes qui
dépendent de ∂X et cela caractérise l’extension tangentielle de X (autrement dit si X est très
étiré la norme du varifold associé est assez grande). Enfin sur la partie se trouvant à l’intérieur
de X, la variation ne dépend que de v > , ce qui traduit le fait que le gradient de la distane
d’appareillement est orthogonal à X.
14.4.6 Récapitulons
On a vu comment réduire le problème de l’attache aux données à l’obtention d’une formule
simple donnant la corrélation entre deux éléments de courbe/surface élémentaires. Les trois for-
malismes développés, s’ils peuvent sembler éloignés conceptuellement, sont en fait extrêmement
proches d’un point de vue algorithmique : nous rappelons ici les principales formules obtenues
aujourd’hui, utiles en pratique.
Mesures Courants Varifolds
Repr. d’un segment [x1 → x2 ] : kx2 − x1 k δ x1 +x2 δ xx21−x1
+x2 kx 2 − x k
1 δ x1 +x2 , x2 −x1
2 2 2 kx2 −x1 k
Repr. d’un triangle [x1 , x2 , x3 ]
de normale ξ = (x2 − x1 ) ∧ (x3 − x1 ) : kξk δ x1 +x2 +x3 δ ξx1 +x2 kξk δ( x1 +x2 +x3 ,ξ/kξk)
3 2 3
Corrélation entre deux diracs : hµδx , νδy i hδxξ , δyζ i hµδ(x,u) , νδ(y,v) i
= µνkσI (x, y) = kσI (x, y)hξ, ζi = µνkσI (x, y) cos2 (θ) ou
= µνkσI (x, y) cos(θ) µνkσI (x, y) exp(−4 sin2 (θ)2 /σ 2 )
En rappelant que, pour deux formes données par des collections de segments/triangles, la
mesure/courant/varifold totale est la somme des diracs associés, avec :
2
X X
X X X X X X
(14.50)
δ xi −
= h
δyj
δ xi , δxi i − 2h δ xi , δyj i + h δyj , δyj i
i j
i i i j j j
XX XX XX
= hδxi , δxi0 i − 2 hδxi , δyj i + hδyj , δyj0 i (14.51)
i i0 i j j j0
Arnaud Eteve et Hilbert de champs de vecteurs sur E. Cela revient à résoudre le problème d’optimisation suivant :
Yohan Mandin
1 1
Z
γ
-Huble inf J(v) = |vt |2 dt + d(ϕv1 · O1 , O2 ) (14.52)
Aspects 2
v∈LV ([0,1]) 2 0 2
pratiques
où le premier terme est le coût de la déformation et le deuxième est l’écart restant. Ici γ est le
paramètre du barycentre de la séance précédante, (ie un γ grand forcera la solution à être proche
de O2 )
On a vu à la séance précédente que ce problème se ramenait à une optimisation sur le moment
de tir initial p0 : la seule difficulté était de trouver un gradient sur p0 , une direction de descente
qui nous permettrait de modifier ce tir de manière intelligente. En prenant d(ϕv1 .O1 , O2 ) =
2
kϕv1 .O1 − O2 k pour une des trois normes que nous avons défini aujourd’hui, nous sommes capable
de calculer rapidement le gradient en q1 = ϕv1 .O1 du terme d’attaches aux données.
Étant donné une forme q0 (un nuage de points) que l’on cherche à matcher sur une forme qe1 , on
procédera de manière itérative pour trouver un moment de tir optimal p0 , permettant d’obtenir
une déformation q1 = ϕv1 · q0 proche de qe1 . À chaque itération de l’algorithme de descente sur p0 ,
il s’agira donc de répéter les actions suivantes :
1. Étant donné p0 , tirer la géodésique qt par intégration du flot hamiltonien, partant de
(q0 , p0 ) pour arriver en (q1 , p1 ).
2
2. À l’arrivée, calculer l’opposé du gradient de l’attache aux données −∂q1 γkµq1 − µqe1 k /2
pour obtenir un désir de mouvement δq1 .
3. “Transporter en arrière” ce désir δq1 pour obtenir un pas de descente δp0 .
4. Régulariser δp0 , en lui ajoutant l’opposé du gradient du terme de longueur,
−∂p0 (p0 , Kq0 p0 )/2 = −Kq0 p0 – il s’agit d’une descente de gradient L2 .
5. Suivre le pas de descente régularisé : p0 ← p0 + δp0 .
14.5.1 Applications
|x−y|2
−
Dans la suite on prendra le noyau gaussien ke (x, y) = e σe2 sur E. On a presenté que
deux noyaux sur Gd (E) à savoir le noyau gaussien et le noyau de Cauchy-Binet, le deuxième est
nettement moins bon en terme de séparation mais il a l’avantage d’être plus rapide à calculer
(c’est juste un produit matriciel) donc facilement parallélisable et de ne pas ajouter de paramètre,
le noyau gaussien permet quand à lui de bien mieux séparer les éléments selon l’agencement des
plans tangents (ie des directions). Toutes les images qui suivent sont tirées du papier de Nicolas
Charon et d’Alain Trouvé et ont été calculées en utilisant les noyaux gaussiens sur les deux
espaces.
14.6 Conclusion
On a ainsi présenté trois manières de résoudre le problème d’appariement entre deux surfaces a
priori non étiquetées. L’appariement simple de mesure, la méthode des courants puis les varifolds,
rangés par ordre de précision, mais aussi de coût algorithmique : en pratique, il s’agira de trouver
un bon compromis entre temps de calcul et précision souhaitée. Dans tous les cas toutes ces
méthodes sont facilement parallélisables (il s’agit de simples produits matriciels . calculs de
noyaux point par points), ce qui permet de les faire tourner sur des données réelles à l’aide
de cartes graphiques – des fermes de quelques centaines/milliers de petits processeurs mis en
parallèle, qui ont permis une révolution dans les méthodes de traitement d’images ces dix dernière
années.
14.6. Conclusion 183
Figure 14.9 – On cherche à appareiller ici le cercle bleu (au centre) avec l’étoile ninja en rouge,
la version avec les courants lisse la structure complète alors que l’algorithme avec les varifolds
donne un résulat bien meilleur.
Figure 14.10 – Application au suivi de fibres – fiber tracking : grâce aux progrès effectués ces
dernières années dans le design des séquences IRM, on dispose en chaque point d’une petite
flèche (en réalité, c’est bien souvent un ellipsoide) caractérisant la diffusion de l’eau dans les
tissus observés. À partir de ces informations d’un genre nouveau, on peut typiquement repérer
des hémorragies cérébrales (importante diffusion isotrope), ou inférer le tracé des fibres neuronales
dans la matière blanche et la moelle épinière. On cherche ici à matcher l’ensemble bleu à gauche
sur l’ensemble rouge : Les flèches de l’ensemble rouge ne sont pas orientées de manière cohérente
et les courants (à gauche) ont donc beaucoup de mal à approcher correctement la structure ;
cette absence d’orientation canonique ne pose aucun problème à l’attache varifolds (à droite) :
le matching est bien plus satisfaisant, d’une fibre sur une autre.
Bonus 184 Chapitre 14. Appariement de courbes et surfaces polygonales
[CT13]
Arnaud Eteve et
Yohan Mandin
-Huble
Aspects
pratiques
Figure 14.11 – On cherche à déformer la boule sur le lapin (ligne du haut, avec deux vues
différentes). Là encore, les courants (ligne du milieu) ont un effet lissant tandis que les varifolds
(ligne du bas) sont plus précis.
Chapitre 15
Eva Philippe
et Robin Lemaire
15.1 Introduction Applications
réelles
Dans le domaine médical, on a souvent besoin d’étudier un paramètre, tout en s’affranchissant
de la variabilité géométrique entre deux sujets. Par exemple, dans une rétine la présence d’un
glaucome se traduit par une élévation de la pression au niveau du nerf optique. Pour comparer
deux relevés d’épaisseur de la rétine, on veut pouvoir passer outre les différences physiologiques
intrinsèques des individus.
L’étude des espaces de formes réalisées dans les chapitres précédents nous fournit de bons
outils pour matcher une forme en une autre. On va donc s’intéresser maintenant au transport
d’un signal numérique sur ces formes.
185
Bonus 186 Chapitre 15. Construction d’Atlas, étude statistique et aide au diagnostic
[CCT14]
Eva Philippe
et Robin Lemaire
Applications
réelles
Figure 15.1 – Exemple de métamorphose entre deux visages, tirée du clip Matilda du groupe
Alt-J (∆). Observez comme des features géométriques (forme des oreille, coiffure) sont continû-
ment déformées, tandis que des informations fonctionnelles (lunettes, foulard) sont obtenues par
modification de l’image, via un simple fondu. Un matching “par métamorphose” permet donc de
distinguer ces deux informations et, in fine, de comparer des images définies sur des supports
géométriques différents. Notez que ce morphing n’est pas parfait (je ne sais pas comment il a été
obtenu, probablement par un étiquetage automatique ou manuel des points saillants du visage +
déformations localement affines) : le changement de nez est ici compris comme une information
fonctionnelle, alors que nous voudrions l’inclure dans la partie géométrique.
Figure 15.2 – Exemple de transformation d’une fshape le long d’un tir géodésique.
15.2. Ajout d’un terme fonctionnel 187
(a) Obtention de nos données : plutôt que de travail avec un mille-feuille de couches
rapprochées, on préfèrera assimiler nos rétines à des feuillets simples, sur lesquels
un signal donne l’épaisseur en microns.
(c) Sur la première ligne, quatre données typiques. Sur la seconde, les
modèles obtenus par shooting, caractérisés dans la carte exponentielle
par les moments de tir initiaux. Notez comme les zones de répartition de
l’épaisseur dans le “carré” dépendent du cadrage et de la vascularisation
sous-jacente, propre à chaque individu.
Figure 15.3 – Notre jeu de donnée “cas d’école” : scan de rétines optenus par tomographie à
cohérence optique. L’objectif est d’arriver à une détection automatique du glaucome (une patho-
logie dûe à une surpression intra-oculaire, caractérisée par la dégénerescence de la rétine autour
du point de branchement du nerf optique selon des patterns qui correspondent typiquement à la
vascularisation sous-jacente, variable selon les individus). Ces images sont tirées de l’article d’ap-
plication des idées exposées ici, Atlas-based Shape Analysis and Classi cation of Retinal Optical
Coherence Tomography Images using the Functional Shape (fshape) Framework, par Sieun Lee,
Nicolas Charon, Benjamin Charlier, Karteek Popuri, Evgeniy Lebed, Marinko V. Sarunic, Alain
Trouvé et Mirza Faisal Beg
.
Bonus 188 Chapitre 15. Construction d’Atlas, étude statistique et aide au diagnostic
[CCT14]
Eva Philippe ment différentiables de E dans E qui s’annulent à l’infini) et G le groupe des difféomorphismes
et Robin Lemaire associé obtenu en intégrant les champs de vecteurs dans L2 ([0, 1], V ).
Applications Soit χ0 l’espace homogène engendré par un sous-ensemble X0 compact et de volume d-
réelles dimensionnel fini de E (i.e χ0 = {ϕ(X0 )|ϕ ∈ G}.
On note L2 (X) l’espace des fonctions de carré intégrable sur X pour la mesure de Hausdorff
en dimension d, i.e
n Z o
2
L (X) = f : X → R f 2 (x)dHd (x) < +∞ . (15.1)
X
Démonstration. dF est bien définie et est finie car F a été bien défini.
La symétrie vient du fait qu’on peut inverser le sens de parcours des chemins.
L’inégalité triangulaire est obtenue par concaténation de chemins.
On vérifie aussi que si dF ((X, f ), (X 0 , f 0 )) = 0, alors X = X 0 et f = f 0 .
Théorème 15.2. Pour (X, f ) et (X 0 , f 0 ) dans F, il existe (v, h) ∈ L2 ([0, 1], V × L2 (X)) tel que
1
EX (v, h) 2 = dF ((X, f ), (X 0 , f 0 )). (15.7)
En particulier, le chemin
Z t
t 7→ (Xt , ft ) = (ϕvt .X, (f + hs ds) ◦ (ϕvt )−1 ), (15.8)
0
pose le problème suivant : si on ne pénalise pas du tout la variation géométrique et qu’on pénalise
la variation du signal selon "le volume" (ce qui correspond à la multiplication par le Jacobien),
une manière de minimiser le coût pourrait être de compresser la forme géométrique, faire varier
le signal à moindres frais sur un petit volume puis redilater.
Pour éviter cette solution peu satisfaisante, on peut geler la métrique à sa valeur initiale sur
X0 = X et négliger la variation de la mesure.
On obtient alors le coût suivant :
Z 1Z
|ζ˙t ◦ (ϕvt )−1 |2 (y)dHd (y)dt, (15.10)
0 X
Or, à x ∈ X fixé et étant données les extrémités ζ0 = 0 et ζ1 , le plus court chemin est la
droite t 7→ tζ1 (x). On obtient donc le coût habituel sur L2 (X) :
Z
2
|ζ1 |X = |ζ1 (x)|2 dHd (x). (15.12)
X
Bonus 190 Chapitre 15. Construction d’Atlas, étude statistique et aide au diagnostic
[CCT14]
Eva Philippe Avec ce nouveau coût on peut à nouveau définir une application d˜F sur F :
et Robin Lemaire Z 1 21
Applications
γV γf 2
d˜F ((X, f ), (X 0 , f 0 )) = inf{ |vt |2V dt + |ζ|X |X 0 = ϕv1 .X, f 0 = (f + ζ) ◦ (ϕv1 )−1 }
réelles 2 0 2
(15.13)
d˜F n’est plus une distance mais on a quand-même un résultat d’existence d’un chemin optimal
pour matcher deux fshapes quelconques.
La méthode tangentielle est également plus rapide à calculer mais présente l’inconvénient qu’il
faut "se souvenir de la paramétrisation au temps initiale" à chaque instant de la métamorphose
pour la pénaliser de manière adéquate.
Définition 15.3. On dit que µ est un varifold fonctionnel (ou fvarifold ) de dimension d si
µ est une mesure borélienne finie sur l’espace E × Gd (E) × R, ou de manière équivalente :
µ ∈ C0 (E × Gd (E) × R)0 .
La corrélation entre deux fshapes (par exemple des triangles colorés) δ(x,V,c) et δ(x0 ,V 0 ,c0 ) (où
x code la position, V l’orientation (la normale pour un triangle) et c le signal) est alors donnée
par une formule à noyau :
pour des diracs, où ke est un noyau positif sur E continu, borné et tel que ke (x, ·) s’annule
à l’infini pour tout x, kt est un noyau continu sur la variété Gd (E) et ff est un noyau sur R
continu, borné et tel que kf (c, ·) s’annule à l’infini pour tout c.
De la même manière que les métriques à noyaux poussent les points à s’aligner, on pousse ici
les signaux à s’ajuster.
On approximera dans cette section une forme fonctionnelle (Xc , fc ) par un ensemble discret
de points x reliés, associé à la fonction restreinte à cet ensemble de points. On obtient ainsi un
polyèdre fonctionnel (X, f ), qui est la seule approximation discrète raisonnable, bien qu’on ne
discutera pas de la convergence de ce modèle. On approximera de même la mesure µX,f par la
somme de Diracs µx,y .
Comme on souhaite minimiser la fonctionnelle du coût, les trajectoires de la déformation sont
des géodésiques. Ainsi nous avons vu que les géodésiques sont déterminées de manière unique
par le vecteur vitesse initiale. (Nous sommes ici en présence d’un vecteur de dimension dP où d
est la dimension de l’espace et P le nombres de points de notre approximation.)
Il suffit alors de minimiser la fonctionnelle
Z 1 Z 1
γV γf
|vt |2V dt + (D(xt )ht |ht )dt (15.15)
2 0 2 0
Une fois ces bases de modèle posées, tentons de voir comment obtenir notre template moyen.
15.3.1 Hypertemplate
Le premier algorithme présenté part d’un hypertemplate, que l’on déformera afin d’obtenir
un template moyen entre les observations.
La méthode est telle que présentée dans la figure :
L’algorithme prend en entrée N observations (xi , f i ), un hypertemplate (x0 , f0 ) où f0 = 0, les
quantités de mouvements p0 et les p1 , . . . , pN ainsi que les fonctionnelles f et ζ 1 , . . . , ζ N .
On écrit d’abord un algorithme calculant l’énergie Jtan 0 .
N
γV0 p0 2 γf0 X γV 0 γf γW
Jtan i i
0 (p0 , f , (p , f )1≤i≤N ) = |v |V0 + |f |2x + ( |v p |2V0 + |ζ i |2x + g((x̃i , f̃ i ), xi , f i ))
2 2 i=1
2 2 2
(15.18)
Où g calcule le terme d’attache aux données pour aller du template moyen en cours de
construction vers les observations.
L’algorithme calcule x en intégrant la quantité de mouvement initiale p0 , puis les (x̃i , f̃ i en
intégrant les pi et par f̃ i = f + ζ i .
i
On ajoute ensuite les coûts |v p |2V et |v p0 |2V0 et les coûts |ζ i |2x et |f |2x .
On écrit ensuite un algorithme calculant le gradient de cette énergie en calculant simplement
le f gradient de chaque terme en chaque variable.
L’algorithme final optimisera des déformations de notre hypertemplate pour se rapprocher
au plus d’un template moyen entre les observations. Nous le verrons après la deuxième méthode.
Bonus 192 Chapitre 15. Construction d’Atlas, étude statistique et aide au diagnostic
[CCT14]
Eva Philippe
et Robin Lemaire
Applications
réelles
La sortie est alors une estimation du template moyen, les moments p1 , . . . , pN et les fonc-
tionnelles résiduelles ζ 1 , . . . , ζ N .
Cet algorithme pose le problème du choix de l’hypertemplate. En effet il faut utiliser une forme
topologiquement proche des observations, sous peine de se retrouver avec quelque chose d’absurde
et très loin des observations. Néanmoins il n’est pas conseillé d’utiliser une des observations
sous peine de biaiser l’atlas, le template "moyen" que l’on obtient étant plus proche d’une des
observations, choisie arbitrairement.
15.3. Etude de population avec moyenne à estimer 193
15.3.3 Optimisation
L’algorithme d’optimisation est une descente de gradient dite adaptative. En effet, les va-
riables sont nombreuses et de types différents : ce sont les f , p, f i , pi . Ces variables vivant dans
des espaces différents, ça n’aurait que peu de sens de les incrémenter de la même manière. On uti-
lise donc quatre tailles de pas différentes. L’algorithme consiste à voir les quantités de mouvement
comme des désirs d’avancer. Ici, on utilise seulement le gradient de l’énergie, laquelle pénalise
les écarts quadratiques aux observations (ceux-ci incluant les coûts de déformation et les coûts
d’attache aux données). Quand on l’implémente, on peut de plus ajouter un coefficient sur ses
deux composantes (fonctionnelle et géométrique) afin d’accorder plus ou moins d’importance à
chacune, selon le travail que l’on veut effectuer avec.
On remarquera avec profit qu’appliquer cet algorithme plusieurs fois avec des noyaux de plus
en plus fins permet d’améliorer la pertinence du template obtenu, si l’on applique à chaque
itération l’algorithme en le template d’arrivée.
Dans tous les cas l’algorithme se fait ainsi :
1. Entrées : La fonctionnelle J, énergie initiale, et son gradient initial ∇J = (∇ui J)K i=1 .
Les variables f init , pinit , fiinit , pinit
i et les tailles de pas (δ init init init init
f , δp , δfi , δpi )
2. Début
3. Initialisation : On initialise les f , p, fi , pi et (δf , δp , δfi , δpi ), et breakLoop à False
4. Tant que "Nombre d’itérations inférieur au nombre maximal d’itérations"
. et "les pas ne sont pas trop petits" et "la descente n’est pas trop petite" :
5. . Calculer J actuel ← J et son gradient ∇u J actuel ← ∇J. Où u est f , p, fi ou pi .
6. . Mettre à jour toutes les variables unew
i ← u + δu ∇u J actuel et calculer J new .
7. . Adapter les pas
8. . Tant que "breakLoop = False" et "les pas ne sont pas trop petits" :
9. . Calculer l’énergie en mettant à jour chaque variable séparément :
. (Jˆinew ) et la calculer en mettant les variables à jour en même temps : Jˆnew
10. . Garder la meilleure configuration (pour minimiser l’énergie) :
. on obtient des f ∗ , p∗ , fi∗ , p∗i et (δf∗ , δp∗ , δf∗i , δp∗ i ).
Bonus 194 Chapitre 15. Construction d’Atlas, étude statistique et aide au diagnostic
[CCT14]
|hδx1 ,V1 ,f1 , δx2 ,V2 ,f2 iW 0 | ≤ |ke (·, ·)|∞ |kt (·, ·)|∞ kf (f1 , f2 ) (15.19)
Ainsi comme kf (f1 , ·) est continue et tend vers 0 en l’infini, on obtient que ce produit scalaire
peut être arbitrairement petit si l’on choisit une fonction variant beaucoup. Cela entraîne des
comportements problématiques quand on laisse une grande liberté à l’algorithme pour changer
le signal (paramètre γf ).
Par exemple, si l’on souhaite envoyer un grand carré de signal uniforme 0 sur un petit carré
de signal uniforme 1
Si l’on laisse une liberté totale à l’algorithme (γf = 0), il créera des oscillations déraisonnables
de f dans le complémentaire du but, ce qui l’annule artificiellement d’après lui. En augmentant un
peu γf , les oscillations sont plus faibles, mais le signal du but est moins précis et un peu plus faible.
15.4. Limitations et contraintes d’implémentation 195
(a) La source (1600 points) (b) Le but (400 points) (c) Source et but superposés
Figure 15.6 – Nous allons tenter d’envoyer le grand carré sur le petit, en refusant toute trans-
formation géométrique.
15 4
0.4
1
1
−4
−15
Figure 15.7 – On obtient en sortie de descente de gradient ces formes pour différentes valeurs
de γf .
Bonus 196 Chapitre 15. Construction d’Atlas, étude statistique et aide au diagnostic
[CCT14]
Eva Philippe Enfin si l’on augmente encore γf , les oscillations disparaissent presque, et le complémentaire du
et Robin Lemaire but garde un signal faible, mais le signal du but est d’intensité faible (ici environ 0.25 et non
Applications plus 1)
réelles Une solution envisageable serait de régulariser le gradient de J par rapport à f , de manière
analogue à ce que nous ferons au paragraphe suivant, avec la partie géométrique de l’énergie.
15.5 Conclusion
Ainsi, on a des outils très bien théorisés permettant de construire un template moyen à partir
de ces observations ainsi que des cartes renvoyant à ces observations. On peut donc effectivement
comparer des signaux sur des formes (par exemples des rétines) en s’affranchissant de la variabilité
géométrique entre individus. La méthode développée est assez coûteuse en calcul mais elle est plus
15.5. Conclusion 197
Figure 15.8 – On prend ici une forme ressemblant à celle d’une coupe de rétine.
10
(a) Les flèches représentent le gradient à l’ini- (b) Après quelques pas de descente de gradient,
tialisation, la couleur représente la norme du on obtient ceci.
gradient avec une échelle logarithmique.
Figure 15.9 – Descente de gradient sur l’énergie par la méthode du template moyen libre.
0.6
0.5
0.4
0.3
0.2
0.1
(a) Les flèches représentent le nouveau gradient (b) Après quelques pas de descente de gradient,
à l’initialisation, la couleur représente la norme on obtient cette forme.
du gradient avec une échelle logarithmique.
Eva Philippe
et Robin Lemaire
Applications
réelles
Figure 15.11 – Ces deux observations diffèrent en leur géométrie (taille et position du trou
central, qui dénote le nerf optique). Pourtant le cadrage différent sera considéré comme étant
une différence de forme.
efficace que mettre à la main des étiquettes sur les points pertinents pour réaliser un matching
car elle prend en compte l’information globale (sur un cerveau par exemple, on ne peut pas
reconnaître localement les régions à matcher). De plus, la construction d’atlas donne également
de l’information pertinente. Néanmoins, on ne réussit pas à s’affranchir des biais dûs aux manières
différentes dont les données ont été collectées.
Troisième partie
Critiques et perspectives
199
Chapitre 16
Manolis Perrot
16.1 Introduction.
Il est nécessaire de pouvoir comparer deux formes, dans le domaine médical, afin de détecter
des pathologies par exemple. Pour ce faire, on considère nos formes comme des nuages de points,
puis on définit une distance entre les deux formes comme le coût de la déformation minimale
de l’une sur l’autre. On travaille donc avec des méthodes à noyau pour l’appariement de nuages
de points (chapitre 9), mais en imposant que l’appariement soit exact. Dans ce chapitre, nous
allons montrer comment calculer numériquement cette déformation minimale, qui revient à un
calcul de géodésiques, puis nous verrons différents comportements des géodésiques en lien avec
la courbure de cet espace de formes, lesquels peuvent biaiser l’interprétation des données.
201
Séance 12 202 Chapitre 16. Conséquences pratiques du choix des métriques à noyaux
[MMM12]
Manolis Perrot admet une unique solution du type ψ(t, x). Si on regarde tous les points obtenus au temps 1, v
induit alors un difféomorphisme ϕv de RD , défini par :
Ceci nous permet de définir une distance entre deux ensembles de landmarks X = (x1 , ..., xN )
et Y = (y 1 , ..., y N ) comme :
Z 1
d(X, Y ) = inf E[v] = kv(t, .)kV dt : v ∈ L2 ([0, 1], V ), ∀a ϕv (xa ) = y a . (16.4)
0
Remarque 16.2. Il n’y a pas de terme d’attache aux données dans cette énergie, contrairement à
ce qui a été vu dans les chapitres antérieurs. Cela indique que pour notre modèle, on considère
un appariement exact. Ainsi, ϕv est un difféomorphisme de RD , donc son injectivité implique
qu’il ne peut y avoir de collision dans les trajectoires des points (car dans ce cas les trajectoires
seraient confondues), et aussi que tous les landmarks sont distincts à tout temps.
Si on fixe un chemin q ∈ Q, et qu’on se place à t, cela défini N couples
q 1 (t), q̇ 1 (t) , ..., q N (t), q̇ N (t) que l’on peut interpoler, d’après un théorème vu au chapitre
9, par vt∗ ∈ V , de norme minimale. En regardant ce minimiseur pour tout t, on a donc construit
R1
un unique v ∗ ∈ L2 ([0, 1], V ) vérifiant q̇(t) = vt (q(t)) et tel que 0 kv(t, .)k2 dt soit minimale,
donné par :
N
X
v ∗ (t, x) := pa (t)k(x − q a (t)), (16.5)
a=1
d’où X
kv ∗ k2V = k(q a , q b )hpa , pb iRD , (16.9)
a,b
ce qui s’écrit :
kv ∗ k2V = hp, Kq piRN D , (16.10)
si on note
p1
p = ... ∈ (RN )D (16.11)
pN
16.2. Le modèle de déformation et son exploitation. 203
et
Kq (0)
Kq = .. (16.12)
.
(0) Kq
Kq la matrice N D × N D bloc diagonale, dont les blocs diagonaux sont Kq . Enfin, il suffit de
remarquer que (16.6) se réécrit :
p = Kq −1 q̇, (16.13)
où gq = K−1q est la métrique associée à la cométrique Kq . E est donc une énergie riemannienne,
−1
qui est minimale si q est une géodésique reliant I à I . Trouver cette géodésique revient à résoudre
0
le système hamiltonien :
( PN
q̇ a = b=1 k(q a − q b )pb
PN . (16.15)
ṗa = − b=1 ∇k(q a − q b )hpa , pb i
Remarque 16.3. Pour comprendre le comportement de nos points, PN on peut garder à l’esprit que
les pa sont les intentions de bouger de chaque point, et q̇ a = b=1 k(q a − q b )pb indique que le
déplacement réel de q a dépend de l’intention de bouger de tous les autres points.
La réduction du problème à un calcul de géodésiques simplifie grandement la tache, car on
peut aisément implémenter leur calcul en intégrant le système hamiltonien (avec un schéma
d’Euler par exemple).
Puis on détermine les vecteurs wi ∈ Tm I tels que expm (wi ) = Ji (i.e. la géodésique partant
de m avec une vitesse initiale wi arrive en Ji au bout d’un temps 1). L’analyse statistique se
déroule alors sur les wi , c’est-à-dire qu’on a une interprétation des données dans un espace plat.
Par conséquent, nous allons voir que les comportements des géodésiques et la courbure non nulle
de l’espace des formes donnent des interprétations erronées des données dès que l’on s’éloigne un
peut trop de la position initiale du tir. Ainsi l’analyse des données à partir des tirs géodésiques
n’est pertinente que pour de faibles déformations, ce qui, fort heureusement, est le cas en pratique
(par exemple pour des cerveaux, il ne faut qu’un faible recalage).
Séance 12 204 Chapitre 16. Conséquences pratiques du choix des métriques à noyaux
[MMM12]
Analyse spectrale de la métrique Afin de regarder quelles sont les vitesses privilégiées, il
faut calculer l’inverse de cette matrice, ce qui revient à calculer l’inverse de chaque bloc. Le bloc
suivant correspond à un regroupement de n points équidistants :
1
1 (a)
(16.18)
M = 1 .
(a) 1
1
1
Un vecteur propre de M est (1) = ... , associé à la valeur propre 1 + (n − 1)a. M étant
1
diagonalisable, car symétrique, on peut l’écrire :
X
M= λi ei eTi , (16.19)
(1)
avec (ei ) une famille orthonormée de vecteurs propres. Posons e = √ , on a alors :
n
M − (1 + (n − 1)a)eeT = In (1 − a) + a(1)(1)T − (1 + (n − 1)a)eeT = (1 − a)(In − eeT ). (16.20)
En vérifiant que 1 − a est valeur propre, la décomposition de M est :
1 1
M = (1 + (n − 1)a) eeT + (1 − a)(In − eeT )etg = M −1 = eeT + (In − eeT ).
1 + (n − 1)a 1−a
(16.21)
Ainsi, pour v un champ de vitesses sur nos landmarks, il est aisé de calculer son coût qua-
dratique v T M v en l’écrivant
v = e(eT v) + (v − e(eT v)) (16.22)
= vcol + vncol , (16.23)
16.3. Un cas typique pour comprendre la dynamique des landmarks. 205
où vcol est la composante colinéaire de v, et où le résiduel orthogonal vncol est de moyenne nulle.
On trouve alors simplement
Résultats limites D’une part, lorsque les points sont très éloignés (d grand donc a ∼ 0), on
a : et on retrouve que tous les points sont indépendants, il n’y a pas d’influence. En revanche,
s’ils sont proches (d petit, a ∼ 1)) : où la dernière écriture est un abus, et doit être compris par
bloc. Pour être plus précis, il faut voir que le défaut de colinéarité sera très fortement pénalisé, ce
qui incitera des points proches à bouger dans la même direction : à la limite, un vecteur vitesse
de norme finie s’écrira nécessairement
v = (w1 , w2 , w2 , w2 , w3 , w3 )T , (16.24)
et sera pénalisé en
1 1
v T gq v = w12 + (w22 + w22 + w22 ) + (w32 + w32 ) (16.25)
3 2
= w12 + w22 + w32 . (16.26)
Un groupe de n points très proches se déplaceront donc comme un seul ! On retrouve là notre
interprétation “mécanique des fluides” des métriques de déformations à noyaux, où le coût d’une
déformation est assimilé à l’effort nécessaire à un opérateur extérieur pour “déformer la nappe
élastique” de l’espace ambiant, sans considération pour ce qui est dessiné ici.
Les outils que nous avons développé dans la première section ont un aspect pratique in-
déniable, et apparaissent adéquats à nos problèmes d’appariement. Cependant, la pénalisation
introduite induits des comportements indésirés lors du transport des points, que nous allons
maintenant décrire.
Séance 12 206 Chapitre 16. Conséquences pratiques du choix des métriques à noyaux
[MMM12]
3 3
Manolis Perrot
2 2
1 1
0 0
−1 −1
−2 −2
−3 −3
−3 −2 −1 0 1 2 3 −3 −2 −1 0 1 2 3
(a) Un effet de covoiturage. Les géodésiques de (b) Une trajectoire de contournement dans
cette figure et de toutes les suivantes sont tra- L2 (R2 ). Les points (•) et les cercles (◦) sont
2
cées avec γ = e−x /2 . les ensembles initiaux et finaux de landmarks.
La grille représente le difféomorphisme final de
l’espace.
Figure 16.1 – Au sens des métriques à noyaux, les trajectoire optimales ne sont pas toujours
celles auxquelles on s’attendrait de prime abord. C’est qu’en plus de pénaliser les déchirures,
ces métriques induisent un effet “de covoiturage”, de mutualisation du coût de transport entre
particules proches.
0.2 12
0.15
10
0.1
8
0.05
q2
0 6
"
−0.05
4
−0.1
2
−0.15
GEODESIC 1
GEODESIC 2
−0.2 0
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 0 2 4 6 8 10 12
! q1
Figure 16.2 – A gauche : courbure sectionnelle κ pour L2 (R1 ). A droite : deux trajectoires
dans L2 (R1 ) dans le plan (q 1 , q 2 ). Les deux géodésiques ont la même origine, et restent dans la
région où κ > 0 (la ligne supérieure en pointillés bleus indique κ = 0) ; elles ont comme moments
initiaux (p1 , p2 ) = (1, 1) et (p1 , p2 ) = (1, 0.4).
Remarque 16.4. Voilà comment on peut interpréter le signe de la courbure. Une courbure négative
provoque une divergence des géodésiques issues d’un même point, alors qu’une courbure positive
se traduit par un croisement ultérieur, et donc l’apparition de points conjugués (i.e. des points
qui peuvent être reliés par plus d’une géodésique).
Sur la figure 16.2, on remarque que la courbure est négative lorsque les points se rapprochent,
et est positive pour des plus grandes valeurs de ρ, puis que la variété “s’aplatit” quand ρ −→ ∞
(les points ne sont plus corrélés). La courbure positive induit notamment l’existence de points
conjugués.
Essayons de comprendre les deux géodésiques présentées sur la figure16.2. Supposons que
les deux points veuillent se déplacer d’une distance fixée vers la droite. S’ils sont assez éloignés,
ils peuvent se déplacer plus ou moins indépendamment (c’est la géodésique 1). Mais si (i) le
point de derrière accélère tandis que celui de devant ralentit, alors (ii) une fois que les points
sont proches, ils se déplacent en tandem en utilisant moins d’énergie car ils sont proches et
finalement (iii) le point de derrière ralentit et celui de devant accélère lorsqu’ils sont vraiment
très proches (géodésique 2).
Séance 12 208 Chapitre 16. Conséquences pratiques du choix des métriques à noyaux
[MMM12]
Manolis Perrot 6
−2
−4
GEODESIC 1
GEODESIC 2
−6
−6 −4 −2 0 2 4 6
Remarque 16.5. Cette figure nous montre l’existence de points conjugués. L’exemple le plus
simple de tels points se voit sur la sphère ; en partant d’un pôle, on peut rejoindre l’autre par
n’importe quel grand cercle. Ce phénomène pose un problème pour l’analyse des données. En
effet, rappelons qu’on procède à cette analyse en regardant les wi , vecteurs de tirs initiaux.
Ainsi, deux vecteurs différents (par exemple opposés dans le cas de la sphère), et donc traités
comme tels, aboutiront à la même forme. On voit ici l’importance de faire uniquement de faibles
déformations, donc de “petits tirs”, pour éviter ce genre d’interprétations erronées.
! 4
" 3
# 2
$ 1
% 0
!$ −1
!# −2
!" −3
!! −4
!! !" !# !$ % $ # " ! −4 −3 −2 −1 0 1 2 3 4
Figure 16.4 – Effet de charriage avec un noyau gaussien, pour un seul porteur de moment non
nul q 1 . A gauche : configuration initiale. A droite : configuration à t = 1. La courbure négative
s’interprète aisément à partir de cette figure. Considérons en effet le triangle (AOB), où A est la
configuration de droite, O (pour origine) celle de gauche, et où B est simplement obtenue comme
A à partir de O, mais avec une direction de tir différente. Les côtés [OA] et [OB] du triangle
sont donc les tirs géodésiques décrits ci-dessus, avec effet de charriage. Maintenant, quelle est la
géodésique [AB], le troisième côté du triangle ? Pour passer d’une grille déformée à une autre, les
points “comprimés” doivent prendre des trajectoires différentes les unes des autres. Pour éviter
de payer le coût de “déchirure”, la trajectoire optimale aura donc tout intérêt à détendre la grille,
à espacer les points comprimés en revenant de A sur O, avant de les redéformer sur B.
Autrement dit, le troisième côté [AB] est très proche de la trajectoire [AO] + [OB], le triangle
est fin, pincé : c’est bien ce que nous avons appris à associer à une courbure négative.
0.6 0.6
0.4 0.4
0.2 0.2
0 0
−0.2 −0.2
−0.4 −0.4
−0.6 −0.6
−0.8 −0.8
−1 −1
−1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 −1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1
Figure 16.5 – Trajectoires convergentes et divergentes de deux landmarks. Remarquons que les
tracés sont effectués pour (q 1 (0), (q 2 (0)) = ((0, −1), (0, 1)), (p1 (0), p2 (0)) = ((−10, 9), (10, 9)) à
gauche, et (p1 (0), p2 (0)) = ((−10, 8.6), (10, 8.6)) à droite.
16.6.2 Conclusion
On l’a vu, le cadre LDDMM + métriques à noyaux est, au sens de la complexité algorithmique,
l’une des plus simples structures riemannienne “sans déchirure” dont on peut munir un espace
de landmarks : on sait depuis Hamilton qu’un tir géodésique efficace reposera sur la cométrique
Kq , et quelle manière plus efficace d’associer une matrice à un nuage de point que la formule
totalement parallèle
2
Kq,ij = k(xi , xj ) = exp(−kxi − xj k /2σ 2 ) ? (16.28)
Cette simplicité algorithmique est la grande raison de la popularité des métrique “à noyaux”.
Il ne faut néanmoins pas nous leurrer sur leur pertinence : si les résultats obtenus sont crédibles
pour des déformations d’une taille inférieure au diamètre des formes, la séance d’aujourd’hui aura
eu le mérite de montrer le manque de fiabilité/pertinence de ces métriques pour des trajectoires
de tir plus longues.
Un sujet de recherche actuel serait donc de chercher à dépasser la théorie présentée lors de
la séance 9, pour combiner les propriétés désirables des métriques de Wasserstein (i.e. transport
optimal, qui se comportent très bien vis à vis des translations, mais n’imposent aucune corrélation
aux particules voisines) et des métriques à noyaux (qui permettent justement d’imposer – à un
coût raisonnable – des a priori de régularité spatiale sur le plan de déformation).
Chapitre 17
Nicolas Masson
17.1 Introduction
Au cours des séances précédentes, nous nous sommes penchés sur des techniques de recalage
d’image LDDMM (Large Deformation Diffeomorphic Metric Mapping) utilisant la géométrie
Riemannienne, dans le but de construire un atlas permettant une analyse statistique sur des
données biologiques. Cependant, malgré la pertinence et le bien-fondé de ces méthodes, celles-ci
sont très coûteuses, voire à la limite du praticable dans certains contextes. De plus, si l’on s’est
jusqu’ici concentrés sur une application en particulier, l’intérêt du matching ne se limite pas
à l’étude de population. Le problème du recalage concerne aussi bien l’encodage d’une vidéo
que le suivi individuel d’un patient ; il faut donc bien avoir à l’esprit que les exigences varient
considérablement selon l’utilisation que l’on cherche à en faire. En ce sens, il est légitime de
s’interroger sur la nécessité des méthodes LDDMM, et de se demander si d’autres approches
ne pourraient pas nous fournir un meilleur rapport efficacité/coût que l’approche Riemannienne
dans certains cas. L’objet de cette séance sera donc d’étudier une idée "concurrente" : le matching
SVF (pour Stationary Velocity Field), et de le comparer aux procédés LDDMM. On commencera
par une brève introduction aux groupes de Lie, qui constituent le cadre mathématique adapté
pour la méthode SVF, avant d’exposer le principe de ladite méthode, pour enfin donner quelques
éléments de comparaison avec le point de vue Riemannien.
[X, Y ]ϕ = ∂X ∂Y ϕ − ∂Y ∂X ϕ
Notons que celui-ci qui agit comme une multiplication interne sur l’algèbre des champs de
211
Séance 13 212 Chapitre 17. Remise en question du cadre d’étude riemannien
[LP13], [Ash07]
Nicolas Masson vecteurs. Si a ∈ G, on définit la translation à gauche La : g → ag. On dit qu’un champ de vecteurs
est invariant à gauche s’il reste inchangé sous l’action de la différentielle de la translation, au
sens où : dLa (g).X(g) = X(ag), c’est-à-dire (La )? X = X en reprenant les notations du cours.
L’ensemble des champs de vecteurs invariants à gauche, noté G, forme une sous-algèbre de Lie de
l’espace des champs de vecteurs. Dans la mesure où un champ invariant à gauche est entièrement
déterminé par sa valeur en id, on pourra identifier G à Tid G grâce à la carte x ∈ Tid G → X ∈ G
défini par X(g) = dLg (id).x. Par conséquent, on notera indifféremment X un champ de vecteur
invariant à gauche ou un élément de Tid G. On remarque que les éléments de G sont complets, au
sens où leur flot est défini en tout temps, et que celui-ci vérifie ϕtX (g) = gϕtX (id) par invariance
à gauche. Ces propriétés nous permettent de définir l’exponentielle de Lie comme suit :
exp : G → G
X → ϕ1X (id)
En particulier, l’exponentielle permet de définir le sous-groupe à un paramètre associé à X
comme le morphisme :
R → G
t → exp(tX)
qui vérifie ϕtX = exp(tX). Ainsi, pour tout vecteur tangent X ∈ Tid G, le sous-groupe à un
paramètre qui lui est associé est une courbe qui part de l’identité avec X pour vecteur tangent
initial.
Il faut bien le reconnaître, la théorie est au premier abord un peu indigeste pour le lecteur
profane, mais l’utilisation que nous en feront est à la fois limitée et illustrative.
Même si l’on accepte pour un temps la pertinence de l’approche pour les petites déformations,
le procédé apparaît à première vue comme un appauvrissement du LDDMM. Cependant, le
changement n’est pas des moindres, car il permet d’utiliser la théorie des groupes de Lie, le flot
d’une ODE (équation différentielle autonome) étant en fait un sous-groupe à un paramètre d’un
certain groupe de Lie, ce qui n’est pas du tout le cas des flots dans le cadre Riemannien. Ce qui
fait tout l’intérêt du cadre Lie est que le matching est considérablement plus rapide à la fois au
niveau de la recherche du meilleur champ de vitesses que du calcul de la déformation.
Ici, le principe est le même, mais la théorie des groupes de Lie nous aide beaucoup en nous
donnant la formule Baker-Campbell-Hausdorff (BCH) :
1 1
log(exp(X) ◦ exp(δX)) = X + δX + [X, δX] + [X, [X, δX]] · · · (17.2)
2 12
Il est assez clair que calculer une somme est nettement plus rapide que d’intégrer un flot,
d’où une efficacité nettement accrue en comparaison au LDDMM.
Maintenant qu’il est établi que la méthode SVF dépassait largement sa concurrente en terme
de rapidité, il reste à déterminer au moyen d’expériences dans quels contexte l’approche Lie
trouve sa pertinence.
Séance 13 214 Chapitre 17. Remise en question du cadre d’étude riemannien
[LP13], [Ash07]
Nicolas Masson
Figure 17.1 – Le cadre “Champs de Vecteurs Stationnaires” et la théorie LDDMM n’ont pas
la même manière d’interpréter le matching du point de gauche sur le point de droite. Là où
le premier repose sur la théorie des groupes de Lie, et construit la déformation par intégration
d’un champ de vecteurs stationnaire au cours du temps, le second s’appuie sur une notion de
“transport à coût minimal” qui sera concentré autour des particules en mouvement (principe de
réduction). Dans les deux cas, un a priori de régularité gaussien est utilisé, que ce soit sous la
forme d’une simple pénalisation ou d’une métrique RKHS.
Si la théorie des champs de vecteurs stationnaires permet d’obtenir des transports difféomor-
phiques à moindre coût, elle souffre de sévères limitations pour l’analyse : l’extrapolation (i.e.
laisser filer les trajectoires jusqu’à t = 1.5, t = 2) sera généralement médiocre, et l’information
peu localisée. Là où le champ LDDMM pris en t = 0 (peu ou prou le moment de tir initial)
permet de bien voir que c’est la particule de droite qui est en mouvement (et pas le reste de
l’image), cette trajectoire a complètement “bavé” dans l’espace avec la théorie “groupe de Lie”.
Sur une image complexe, cette diffusion de l’information le long des trajectoires peut grandement
compliquer l’analyse, qui pourrait se résumer à prendre la norme L2 du moment de tir initial
dans le cas Riemannien.
Cette figure est l’exact analogue de la Figure 17.3.
17.3. La méthode SVF 215
Figure 17.2 – Pour un déplacement plus petit par rapport à l’échelle de régularisation, ce pro-
blème de dilution de l’information est moins gênant. Avec un coût numérique bien inférieur,
on aura donc tendance à privilégier les méthodes “Lie” pour du matching intra-sujet où aucune
extrapolation sur le long terme n’est nécessaire. Pensons par exemple à une application de suivi
longitudinal, avec comparaison de scans IRM d’un même sujet âgé/dément pris à un an d’in-
tervalle : une forte norme du champ de déformation autour de l’hippocampe est un indicateur
anatomique pertinent (souvent corrélé à la maladie d’Alzheimer), que l’on peut analyser auto-
matiquement et faire remonter au radiologue.
Cette figure est l’exact analogue de la Figure 17.4.
Séance 13 216 Chapitre 17. Remise en question du cadre d’étude riemannien
[LP13], [Ash07]
Nicolas Masson
Figure 17.3 – Comparaison inter-sujet. En bleu : champ de vitesses optimal pour le matching
avec les différentes méthodes. En A), SVF, en B) C) C’), LDDMM respectivement aux temps 0,
0.4, et 0.8. En D), magnitude associée mesurée avec la norme L2 .
17.3. La méthode SVF 217
Figure 17.4 – Suivi longitudinal intra-sujet. En bleu : champ de vitesses optimal pour le matching
avec les différentes méthodes. En A), SVF, en B) C) C’), LDDMM respectivement aux temps 0,
0.4, et 0.8. En D), magnitude associée mesurée avec la norme L2 .
Séance 13 218 Chapitre 17. Remise en question du cadre d’étude riemannien
[LP13], [Ash07]
Nicolas Masson 17.4 Récapitulatif des notions vues dans les théories Rie-
manniennes et Lie
γreg T γreg 2
Critère à minimiser : 2 p0 Kq0 p0 + 2 Att(q1 , q
γatt
e) 2 kXkreg + 2 Att(ϕ
γatt
· I0 , I1 )
Routine backward, Flot rétrograde des équations adjointes, Basée sur la formule BCH,
(dp0 /X exp)? : ∂q1 C 7→ ∂p0 C. ∂ϕ C 7→ ∂X C.
Le cadre le plus “crédible” biologiquement est celui de la géométrie Riemannienne, qui permet
d’encoder dans la métrique un a priori anatomique. En délaissant ce degré de liberté “géométri-
que” pour gagner en structure algébrique comme le fait la méthode SVF, le gain algorithmique est
considérable : on passe du linéaire au logarithmique en la précision temporelle pour le matching
d’images pleines – en opposition au recalage de nuages de points épars, de surface de codimension
1 pour lesquelles stocker un flot sur l’espace ambiant est un gros gachis.
17.5. Comparaison expérimentale 219
On constate que dans ce cas, les résultats sont assez similaires avec les méthodes SVF et
LDDMM : le champ de vitesses est localisé à peu près aux mêmes endroits, nous procurant
les mêmes informations. De plus, on constate également que le champ de vitesses dans le cas
LDDMM ne présente pas de variations pertinentes. Les résultats sont donc très similaires, mais
avec des coûts incomparables !
La situation est ici radicalement différente : les champs de vitesse ne sont pas du tout localisés
au même endroit, synonyme d’une grande perte d’information et d’un manque de pertinence pour
la méthode SVF. Ce n’est si étonnant : comme on l’a remarqué précédemment, la pertinence de
la méthode SVF repose sur de petites déformations, et il y bien évidemment une différence
beaucoup plus importante entre deux sujets qu’entre un sujet à deux instants différents.
17.6 Conclusion
Le champ d’applications du recalage d’image est vaste, et les méthodes utilisées en sont
donc d’autant plus variées. Les exigences différant considérablement entre deux applications, il
est nécessaire de bien savoir dans quel contexte on se trouve pour évaluer l’adéquation d’une
méthode. Ainsi, l’approche Riemannienne, bien que très séduisante et relativement efficace dans
certains domaines (notamment la comparaison inter-sujet), peut être largement dépassée en
terme de rapport précision/coût par des méthodes Lie comme il a été vu ici. Notons tout de
même afin de nuancer le propos que la présentation des résultats a volontairement été simplifiée
et que certains paramètres sous-jacents ayant leur importance n’ont pas été présentés.
Séance 13 220 Chapitre 17. Remise en question du cadre d’étude riemannien
[LP13], [Ash07]
Nicolas Masson
Figure 17.5 – Exemple de matching SVF ϕ obtenu entre une boule f et une image de “C” g. Dans
cette image tirée d’un article “pratique” présentant une implémentation efficace des idées SVF,
[Ash07] de John Ashburner, on voit que la continuité du difféo est bien assurée numériquement.
Chapitre 18
Pascal Millet
La carte exponentielle Etant donné un espace de Riemann et un point P, on peut définir une
application lisse entre l’espace tangent et une partie de la variété en associant à chaque vecteur
~v le point de la géodésique de condition initiale ~v au temps 1 (c’est le flot géodésique au temps 1
comme défini en cours de calcul différentiel). Cependant, cette application n’est injective qu’au
voisinage de 0 car, car certains points peuvent être atteints au temps 1 par plusieurs géodésiques
(exemple du pôle sud de la sphère si on considère la carte exponentielle associée au pôle nord).
On peut définir le logarithme d’un point Q de la variété comme le vecteur de norme minimale
dont l’image par l’exponentielle est Q. Le logarithme est ainsi défini en tout point où un tel
vecteur existe et est unique. On appelle cut locus vectoriel, le bord de l’image du logarithme et
cut locus l’ensemble des exponentielles des point du cut locus vectoriel. Ainsi sur la sphère au
pôle nord, le cut locus vectoriel est le cercle de rayon πr.
221
Séance 14 222 Chapitre 18. Autres utilisations de la géométrie Riemannienne en imagerie médicale
[Pen09]
Pascal Millet des espaces vectoriels au cas riemannien. Il existe des algorithmes efficaces pour calculer l’expo-
nentielle et le logarithme.
On peut également remarquer que la métrique riemannienne induit une mesure sur la va-
riété. Cela permet de définir l’intégrale d’une fonction de la variété dans un espace vectoriel de
dimension finie.
On
R a ensuite la définition barycentrique de Karcher qui consiste à trouver un point P tel que
M
logP (t)dt = 0 et dans le cas d’une distribution discrète
n
X
logP (Qk ) = 0. (18.3)
k=1
Proposition 18.1. Soit p ∈ M , si le cut-locus de p est de mesure nulle, alors σ 2 est différentiable
en p et on a : Z
~ 2 (p) = −2
∇σ logp (q)dµ(q) (18.4)
Démonstration. Nous allons démontrer la proposition dans le cas fini. Pour cela, il suffit de
calculer le gradient en p de d(p, q)2 . Rappelons le lemme de Gauss, vu à la fin de la première
partie du cours :
Lemme 18.1. Soit U une boule géodésique centrée en p ∈ M sur laquelle l’exponentielle est
∂
injective (pour que le champ radial soit bien définit), le champ de vecteurs radial ∂r est orthogonal
aux sphères géodésiques de U .
~ ∂
∇r(p) = (p) (18.6)
∂r
18.1. Synthèse sur la géométrie Riemannienne 223
Preuve du corollaire. Pour démontrer cette proposition, il suffit de remarquer que la carte ex-
ponentielle au point q fournit une carte locale de U donc la différentiabilité de r est équivalente
(par définition d’une fonction différentiable sur une variété) à la différentiabilité de r ◦ expq et
on peut calculer la différentielle dans cette carte (qui est pour l’instant une forme linéaire sur
Tlogq (p) (Tq M ) : le produit scalaire contre ∂r
∂
) qu’il faut ramener à une forme linéaire sur Tp M au
moyen du difféomorphisme d expq (p) induit par la carte entre Tlogq (p) (Tq M ) et Tp M . On obtient
∂ ∂
(p) = d expq (p)( ) (18.8)
∂r ∂r
Cela signifie en évaluant 18.7 en ∂
∂r que
∂
dr(p)( (p)) = 1 (18.9)
∂r
Par le lemme de Gauss, ∂r ∂
(p) est orthogonal à l’espace tangent à la sphère donc dr(q) est
simplement le produit scalaire contre ∂r
∂
(p). C’est pourquoi on trouve bien le résultat annoncé.
logq (p) t
expq (logq (p) + t ) = γ(1 + ) (18.14)
d(p, q) logq (p)
Séance 14 224 Chapitre 18. Autres utilisations de la géométrie Riemannienne en imagerie médicale
[Pen09]
Pascal Millet où γ est l’unique géodésique minimale telle que γ(0) = q et γ(1) = p. donc on obtient finalement :
∂ γ 0 (1)
(p) = (18.15)
∂r d(p, q)
On se place maintenant dans la carte exponentielle au point p. Par définition, si on note γ̃
l’unique géodésique minimale telle que γ̃(0) = p et γ̃(1) = q, on a :
˜
logp (q) = γ(0) (18.16)
On en déduit (par linéarité du gradient) la formule du gradient de la variance dans le cas fini (le
cas continu ne se déduit pas directement de ce qui précède car la dérivation sous l’intégrale ne
s’obtient pas simplement) :
X n
~ 2 (p) = −2
∇σ logp (qi ) (18.19)
i=1
dans le cas fini.
et on constate, dans le cas euclidien que le minimiseur de cette énergie est bien la moyenne
pondérée des fi .
Formules pratiques Une fois que l’on a trouvé la moyenne, on peut s’intéresser à la variance
d’un ensemble continu ou discret de données. Si on note p̄ la moyenne des données, on peut se
placer dans le plan tangent (muni d’une base orthonormée) et calculer la quantité :
Z
Σ = logp̄ (q) logp̄ (q)T dP (q) (18.21)
18.2.1 Interpolation
L’interpolation est le fait de retrouver la valeur d’une fonction à partir de l’image de quelques
points. On a donc pour une interpolation linéaire entre deux points d’antécédent 0 et 1.
Sous cette forme, la valeur apparait comme une moyenne pondérée des données. On peut générali-
Pn+1
ser cette notion en dimension n en exprimant x comme barycentre de n+1 points x = i=1 λi xi .
On obtient donc une formule pour calculer l’image de x :
n+1
X
f (x) = λi f (xi ) (18.24)
i=1
Donc si f est à valeur dans une variété riemannienne, on comprend l’intérêt d’avoir généralisé
la notion de moyenne pondérée. On verra par la suite un exemple dans lequel l’interpolation
linéaire permet de reconstituer un champ de tenseurs à partir de quelques points.
On peut bien sûr envisager une descente de gradient pour trouver f mais pour certains critères,
il est possible d’obtenir une expression explicite de f (par des calculs d’analyse de Fourier qui
seront vus en cours de “Traitement du signal”) comme une moyenne pondérée des images de f˜
ωi (x)f˜(i).
X
f (x) = (18.26)
i
On peut donc ranger dans ce cadre le simple floutage gaussien, ou convolution avec une gaussienne
1 ki−xk2
ωi (x) = √ e 2 . (18.27)
2π
Séance 14 226 Chapitre 18. Autres utilisations de la géométrie Riemannienne en imagerie médicale
[Pen09]
Pascal Millet
(b) Un tableau de Van Gogh... (c) Après application d’un algo de diffusion ani-
sotrope. Remarquons comme les structures “en
ligne”, les arêtes sont préservées.
On peut interpréter le calcul en disant que f (x) est la moyenne des f˜(i) pondérés selon une
gaussienne centrée en x. On comprend donc que la fonction f˜ est lissée par ce processus. Lorsque
la fonction est à valeur dans une variété riemannienne (nous allons en voir un exemple par la
suite), nous allons donc utiliser la notion de moyenne pondérée définie précédemment.
Il existe aussi des manière non-linéaires de filtrer le bruit sur un image. La diffusion harmonique
consiste à minimiser une quantité qui pénalise les fortes variations de la fonction :
1
Z
2
Reg(p) = k∇pkp(x) dx (18.28)
2 Ω
Par un calcul d’analyse fonctionnelle (équation d’Euler-Lagrange), on peut calculer le gradient
de cette quantité (qui est donc une fonction) :
∇Reg(p)(x) = −∆p(x) (18.29)
Suivre ce gradient pendant un temps δt revient à suivre l’évolution spontanée du système pen-
dant δt si on considère que la fonction donne la température en chaque point. On comprend
bien que ce procédé a tendence à lisser l’image. Il faut suffisemment d’itérations pour obtenir
une image débruitée mais pas trop pour ne pas obtenir une répartition de “température” ho-
mogène. En pratique, on ajoute donc à Reg, un terme qui pénalise l’éloignement par rapport
aux données initiales. Par exemple dans le cas d’un bruit gaussien, on peut ajouter le terme :
dist 2
(p(x), q(x))dx où q est la donnée initiale. Il peut également être intéressant de filtrer les
R
Ω
régions homogènes de l’image sans aténuer les contours de ces régions (on considère en quelque
sorte que l’image est constituée d’aplats). On utilise pour cela la diffusion anisotrope dans laquelle
on minimise Z
Regϕ (p) = ϕ(k∇p(x)kp(x) )dx (18.30)
Ω
Cela permet, en choisissant bien la fonction ϕ d’obtenir une diffusion anisotrope.
car
d0 (p, q)
Z
∇E(p) = −2 ϕ0 (d(p, q)) logp (q)dq (18.34)
Ω d(p, q)
Il faut donc choisir la définition qui convient le mieux. De manière générale, on utilise la métrique
intrinsèque pour évaluer la performance et le domaine de validité d’une métrique approchée (ce
domaine de validité est un domaine de variance des données).
Métrique affine-invariante Pour choisir une métrique canonique, on va imposer que la mé-
trique soit invariante par changement de coordonnées affine. Ici les matrices que l’on considère
18.3. Application de la géométrie Riemannienne à l’analyse d’images de tenseurs 229
(a) Simulation d’un shoot géodésique avec diffé- (b) Interpolation géodésique entre deux ten-
rentes métriques. En haut, un shoot dans Sn++ seurs. La première ligne est une simple inter-
vu comme une sous-variété riemannienne de polation linéaire “coordonnée à coordonnée”, la
Sn , munie de la métrique euclidienne des ma- seconde est le shoot géodésique dans Sn++ muni
trices : les géodésiques sortent du cône. Au de la métrique affine-invariante, et la troisième
milieu, un shoot pour la métrique de Cho- correspond au cadre log-euclidien. À droite, on
lesky. En bas, un shoot pour la métrique affine- trace le volume de l’ellipsoïde en fonction du
invariante. La dernière ligne est bien la plus sa- temps : l’effet de gonflement des moyennes, in-
tisfaisante, avec des bords repoussés à l’infini : désirables dans l’interpolation naïve, est bien
un algorithme de descente de gradient (comme évité.
les diffusions) ne risque donc pas de sortir du
cône Sn++ .
(c) Comparaison entre les différentes méthodes. (a) : image initiale. (b) :
image bruitée. (c) : régularisation euclidienne. (d) : régularisation de Cho-
lesky. (e) : régularisation log-euclidienne
Pascal Millet sont des matrices de diffusion donc l’action de GLn sur Sn est naturellement donnée par :
++
A ∗ Σ = AT ΣA (18.35)
En effet, ainsi, si Σ est la matrice de diffusion dans la base B, et si A = M atB0 ,B (id), A ∗
Σ est la matrice de diffusion dans la nouvelle base B 0 . Ainsi, intuitivement, on voudrait une
distance entre les diffusions qui ne doit donc pas dépendre du choix de la base utilisée pour
les représenter. Il faut maintenant préciser formellement ce que signifie une métrique invariante
sous l’action. Il faut notamment comprendre comment l’action transporte les vecteurs tangents.
L’espace tangent en tout point est Sn . L’action de A ∈ GLn induit un difféomorphisme de la
variété. On utilise la différentielle pour transporter les vecteurs tangent d’un point à un autre.
La condition d’invariance s’écrit donc :
∀V, W ∈ Sn , < V, W >Σ =< AT V A, AT W A >AT ΣA (18.36)
L’action est transitive donc une métrique vérifiant la condition d’invariance ci-dessus est entière-
ment déterminée par sa données en l’identité. De plus, puisque les transformations orthogonales
laissent l’identité invariante, on a, en notant O une matrice orthogonale :
∀V, W ∈ Sn , < V, W >Id =< OT V O, OT W O >Id (18.37)
On peut montrer que les métrique vérifiant cette condition sont de la forme
1
< V, W >Id = T r(V W ) + βT r(V )T r(W ) avec β > − (18.38)
n
Pour connaitre la métrique en un autre point Σ, on utilise la transitivité et l’invariance. On pose
1
A = Σ 2 ∈ GLn et on a alors (A est en fait symétrique définie positive) : A ∗ Id = Σ. Cela permet
très facilement de réécrire la métrique en Σ :
∀V, W ∈ Sn , < V, W >Σ = < A−1 V A−1 , A−1 W A−1 >Id (18.39)
= T r(V Σ−1 W Σ−1 ) + βT r(V Σ−1 )T r(W Σ−1 ) (18.40)
Il est intéressant de remarquer que toutes ces métriques sont associées à la même connexion de
Levi-Civita. En particulier, elles partagent toutes les même géodésiques, cependant la distance
le long d’une géodésique n’est pas la même d’une métrique à l’autre. On dispose également
d’expressions explicites de l’exponentielle et du logarithme.
1 1 1 1
ExpΣ (W ) = Σ 2 exp(Σ 2 W Σ 2 )Σ 2 (18.41)
1 1 1 1
LogΣ (V ) = Σ log(Σ V Σ )Σ
2 2 2 2 (18.42)
Avec la formule du logarithme, on peut calculer la distance et voir que les matrices qui ont une
valeur propre nulle (c’est à dire les bords du cône) ont bien été envoyées à l’infini !
Métrique Log-euclidienne Dans la métrique précédente, la moyenne est obtenue par une des-
cente du gradient. Il serait plus efficace d’avoir une formule explicite. La métrique log-euclidienne
permet d’obtenir une telle formule tout en restant satisfaisante en terme de précision. Ainsi, elle
se situe entre la métrique affine-invariante (très bien fondée mathématiquement) et la simple
moyenne dans Sn (très rapide à calculer mais présentant de nombreux défauts). Pour la définir,
il faut tout d’abord remarquer les faits suivants :
Proposition 18.3. L’exponentielle des matrices est une bijection de Sn dans Sn++
La preuve se fait simplement en utilisant le théorème spectral qui permet de diagonaliser la
matrice symétrique dans une base orthonormée. Cela permet également d’obtenir une formule
explicite pour le calcul de l’exponentielle et du logarithme.
18.3. Application de la géométrie Riemannienne à l’analyse d’images de tenseurs 231
L’intérêt d’une telle bijection est qu’elle permet de transporter la structure d’espace euclidien
de l’ensemble des matrices symétriques vers l’ensemble des matrice symétriques définies positives.
La métrique Log-euclidienne est alors la métrique ainsi transportée. Ainsi, on a donc un moyen
simple de traiter des données : On envoie les matrice de Sn++ dans Sn grâce au logarithme puis
on effectue les calculs (par exemple la moyenne) puis on prend l’exponentielle du résultat. Ainsi
on peut obtenir une formule explicite pour la moyenne et la calculer efficacement et appliquer
l’algorithme de descente du gradient sans craindre de rencontrer les bords du cône. Par ailleurs,
l’espace obtenu présente de nombreuses similarités avec l’espace muni de la métrique affine-
invariante. Par exemple, les géodésiques passant par l’identité sont les même pour les deux
métriques. Par ailleurs, les tests sur des données réelles montrent que les résultat obtenus lors
des calculs avec ces deux métriques sont très similaires (on observe typiquement un écart de 1%)
alors que les algorithmes implémentant la métrique Log-euclidienne tournent 4 à 10 fois plus
vite !
Nous allons d’abord voir comment la géométrique riemannienne permet de mieux prendre en
compte la spécificité du bruit lors de la construction de l’image. En effet, le processus d’acquisition
est très bruité. Il consiste à observer la diffusion du signal pour différente direction du gradient
du champ électrique. Si on note Si le signal (valeur scalaire) et gi le gradient, on a la relation
suivante entre ces valeurs (fournie par l’analyse physique du phénomème) :
Comme D est symétrique il suffit en principe de 6 équations scalaires pour retrouver tous les
coefficients. Cependant, étant donné le niveau de bruit, il peut être intéressant de surdéterminer
le système (ie prendre plus de mesures que nécessaire) et trouver une solution au sens des moindre
carrés. Il s’agit donc de minimiser la quantité suivante :
X
SimG (D) = (Ŝi − Si (D))2 (18.44)
où Ŝi désigne la valeur mesurée et Si (D) la valeur calculée en prenant la matrice de diffusion égale
à D. Cependant, si l’on résout cela de manière naïve dans Sn R en cherchant quand le gradient (de
la fonction vue comme allant de Sn dans R) est nul, le résultat peut ne pas être une matrice de
Sn++ à cause de l’imprécision des mesures. Un meilleur choix est donc de considérer cette fonction
comme allant de la variété riemannienne Sn++ munie de l’une des métriques définies plus haut
dans R puis d’effectuer une descente du gradient. Par exemple pour la métrique Log-euclidienne,
cela correspond simplement à minimiser dans Sn la fonction suivante :
X
SimG (L) = (Ŝi − Si (exp(L)))2 (18.45)
car l’exponentielle est une isométrie entre Sn et Sn++ par définition de la métrique. L’avantage de
procéder ainsi est double : les valeurs obtenues sont toujours dans Sn++ et les résultats obtenus
sont plus satisfaisants. Le critère de régularisation est ici un critère des moindres carrées ce qui
Séance 14 232 Chapitre 18. Autres utilisations de la géométrie Riemannienne en imagerie médicale
[Pen09]
Pascal Millet correspond à un bruit gaussien. En pratique, le bruit est d’un autre type (bruit ricien) et le
critère de régularisation est différent mais le formalisme riemannien s’adapte bien à ce cas et
fourni un algorithme satisfaisant.
Figure 18.3 – Carte de variabilité des lignes sulcales obtenue par le protocole précédent. A
gauche, les tenseurs retenus pour expliquer la variabilité et à gauche l’interpolation linéaire entre
eux pour reconstituer la carte complète.
18.3. Application de la géométrie Riemannienne à l’analyse d’images de tenseurs 233
(c) En répétant l’opération pour au moins 6 (d) Un algorithme de débruitage adapté permet
gradients, on peut estimer point-par-point un de diminuer le rapport signal/bruit, et d’aug-
champ de tenseurs bruité. menter la fiabilité des algorithmes de traite-
ment ultérieurs – suivi de fibre, par exemple.
Figure 18.4 – Exemple pratique de traitement d’image DTI, sur le haut de la moelle épinière -
rachis d’un patient.
Séance 14 234 Chapitre 18. Autres utilisations de la géométrie Riemannienne en imagerie médicale
[Pen09]
Perspectives de carrière J’espère vous avoir donné un bon aperçu de ce que peuvent être les
mathématiques appliquées au traitement d’image. Vous montrer que « problème concret » ne rime
pas toujours avec « idées simplistes » ! Aujourd’hui, les questions mathématiquement intéressantes
liées à des applications réelles ne manquent pas ; elles ouvrent de plus des perspectives de carrière
très intéressantes.
Dans le monde académique, d’abord : on en est rarement conscient en entrant à l’ENS,
mais le nombre de postes ouverts aux mathématiciens “appliqués” est bien supérieur à celui
proposé à leurs homologues algébristes, géomètres ou logiciens – voir à ce sujet la Figure 18.5.
Soyez conscients que se lancer dans les domaines les plus fondamentaux, c’est rentrer dans un
milieu extrêmement compétitif. Le confort matériel offert aux élèves normaliens ne doit pas vous
leurrer : même pour vous qui avez “réussi les concours” à vingt ans (...), il sera difficile de percer
et d’obtenir un emploi.
A contrario, se spécialiser en mathématiques appliquées, c’est s’ouvrir les portes du monde
des start-ups, de l’industrie. Les entreprises de haute-technologie ont grand besoin d’experts
qui puissent leur apporter des algorithmes à la pointe, une vraie plus-value sur des produits
extraordinairement complexes. Pour développer un scanner IRM par exemple, des dizaines de
compétences pointues sont mises à contribution. Un profil unique d’ingénieur généraliste ne peut
donc pas suffire, et, avec votre formation très poussée en mathématiques, vous disposez d’un
capital précieux. Les entreprises en sont bien conscientes, et sont prêtes à vous accueillir à bras
ouverts : je peux en témoigner comme bon nombre de camarades.
Je vous encourage donc très fortement à rester ouverts et curieux : au moment de décider de
votre orientation, de choisir votre domaine de spécialisation, prenez bien tous ces éléments en
considération. Soyez sûrs de faire un choix que vous ne regretterez pas.
18.4. Pour aller plus loin : conclusion et perspectives 235
150
Maîtres de conférence
100
50
0
2000 2002 2004 2006 2008 2010 2012 2014 2016 2018 2020
Année
Figure 18.5 – Postes de « maître de conférence » ouverts en France, selon les filières. On peut
ajouter à ceux-ci les postes de « chargé de recherches » CNRS, 8-10 par an au total pour les
filières mathématiques.
Données tirées du site de référence, postes.smai.emath.fr/2017/OUTILS/bilans.php.
Offre de cours Pour clore ce polycopié comme il se doit, voici donc quelques suggestions
de cours et références dans la continuité de notre groupe de lecture. De nombreuses questions
restent à élucider, tant du point de vue théorique que pratique, et, pour ceux qui souhaiteraient
s’y lancer, la route est encore pleine de surprises...
— Le cours de MM. Alain Trouvé et Joan Glaunès, Géométrie et espaces de formes, au M2
MVA – à l’ENS Cachan, de janvier à mars au deuxième semestre. C’est le cours qui sous-
tend les articles des séances 9, 10 et 11 ; la suite naturelle de ce groupe de lecture : le
cours demande du travail, mais est tout à fait accessible à des élèves maîtrisant les bases
de géométrie riemannienne présentées ici. C’est un bon exemple de cours de “traitement
d’images” solide sur le plan mathématique.
— Autre cours du M2 MVA : Advanced Medical Imaging, par MM. Hervé Delingette et Xavier
Pennec – semestres 1 et 2. Plus touche à tout, proche du milieu médical, ce cours est aussi
l’occasion de découvrir la variété des applications, la pluralité des approches coexistant en
anatomie computationnelle. Si le point de vue privilégié dans notre cours a été celui de la
géométrie Riemannienne, avec tracé de géodésiques dans un espace de difféomorphismes
de l’espace ambiant, il ne faut pas croire qu’il s’agit là de la seule manière de travailler :
on l’a bien vu au cours des deux dernières séances, portant sur des articles de M. Pennec !
Séance 14 236 Chapitre 18. Autres utilisations de la géométrie Riemannienne en imagerie médicale
[Pen09]
Pascal Millet Enfin, si l’esprit “maths appliquées à l’imagerie” de ce cours vous a plu, sachez que vous pour-
rez tout simplement le retrouver ici, au 45 rue d’Ulm : MM. Stéphane Mallat (au DI) et Bertrand
Maury ou Gabriel Peyré (au DMA) sont d’excellents enseignants, qui sauront parfaitement vous
conseiller et répondre à vos interrogations. Je ne saurais d’ailleurs trop vous recommander les
cours de Modélisation (1A) et de Data Science (2A) : on s’y intéresse aux foules, aux photos, et
à la musique plutôt qu’aux cerveaux et aux cœurs... mais le plaisir de découvrir et expérimenter
reste le même !