Poly
Poly
Poly
M1MMD
Joseph Lehec
Table des matières
1 Ensembles convexes 2
4 Fonctions convexes 10
5 Le théorème de Hahn-Banach 12
6 Polarité 15
7 Transformée de Legendre-Fenchel 17
8 Convexité et différentiabilité 21
9 Le théorème de Krein-Milman 24
10 Optimisation convexe 27
11 Le théorème de John 33
1
1 Ensembles convexes
Soit E un espace vectoriel réel.
Définition 1. On dit qu’un sous-ensemble A de E est un sous-espace affine s’il contient toutes
les droites passant par deux de ses points :
(1 − t)x + ty ∈ A, ∀x, y ∈ A, ∀t ∈ R.
Exemple. Soit k · k une norme sur E. Les boules de E, ouvertes ou fermées, sont des convexes de
E.
Un ensemble convexe K estP stable par combinaison convexe : si x1 , . . . , xm ∈ K et λ1 , . . . , λm
m
sont des réels positifs vérifiant i=1 λi = 1 alors
m
X
λi xi ∈ K.
i=1
Il est clair d’après la définition qu’une intersection quelconque d’espaces affines est un espace
affine, et qu’une intersection quelconque d’ensembles convexes est un ensemble convexe.
Définition 3. Soit A une partie de E. On appelle enveloppe affine de A, notée aff(A) l’intersec-
tion de tous les espaces affines contenant A. On appelle enveloppe convexe de A, notée conv(A)
l’intersection de tous les sous-ensembles convexes contenant A.
Par stabilité par intersection aff(A) est un espace affine. C’est le plus petit espace affine conte-
nant A : si F est un sous-espace affine contenant A alors aff(A) ⊂ F . De même conv(A) est le plus
petit ensemble convexe contenant A.
Proposition 4. Soit A une partie de E. Alors aff(A) est égal à l’ensemble des combinaisons affines
d’éléments de A. De même conv(A) est égal à l’ensemble des combinaisons convexes d’éléments de
A.
Démonstration. Soit C l’ensemble des combinaisons convexes d’éléments de A. Alors C est convexe
et contient A donc conv(A) ⊂ C. Réciproquement, comme conv(A) est convexe et contient A il
contient toutes les combinaisons convexes d’éléments de A.
La démonstration est la même pour aff(A).
A + B = {a + b, a ∈ A, b ∈ B}.
aK + bK = (a + b)K.
2
Démonstration. Soient x, y ∈ K. Alors par convexité de K
a b
x+ y ∈ K,
a+b a+b
et donc ax + by ∈ (a + b)K. Donc aK + bK ⊂ (a + b)K. L’inclusion réciproque est évidente.
Remarque. L’inclusion (a+b)K ⊂ aK +bK est vraie sans hypothèse sur K, mais elle est en général
stricte. Par exemple si K = [−2, −1] ∪ [1, 2], alors K + K = [−4, 4] et
Définition 8. Une famille (xi )i∈I de point de E est dite affinement indépendante si
xi ∈
/ aff {xj , j ∈ I\{i}} , ∀i ∈ I.
Il est facile de voir que les {xi , i ∈ I} sont affinement indépendants si et seulement si les
{xj − xi , j ∈ I\{i}}
Définition 10. On appelle simplexe de dimension n l’enveloppe convexe de n+1 points affinement
indépendants.
Exemple. Un simplexe de dimension 1 est un segment, un simplexe de dimension 2 est un triangle,
un simplexe de dimension 3 est un tétraèdre.
Lemme 11. Soit K un convexe de dimension n alors il contient un simplexe de dimension n.
3
Exercice 3. Soit K ⊂ E un ensemble convexe. On dit que x ∈ K est un point extrémal de K si
y+z
= x ⇒ y = z = x, ∀y, z ∈ K.
2
Montrer que x est un point extrémal de K si et seulement si K\{x} est convexe.
Exercice 4. Soit A ⊂ E et soit x un point extrémal de conv(A), montrer que x ∈ A.
Exercice 5. Montrer que la somme de deux sous-espaces affines est un sous-espace affine. Montrer
que la somme de deux convexes est convexe.
Exercice 6. Soit p ∈ [1, +∞]. Pour x ∈ Rn on pose
n
!1/p
X
p
kxkp = |xi | , p < +∞
i=1
kxk∞ = max{|xi |; i ≤ n}.
1. Montrer que ceci définit une norme sur Rn . L’espace vectoriel normé (Rn , k · kp ) est noté `np .
Sa boule unité fermée est notée Bpn .
2. Montrer que Bpn ⊂ Bqn pour tout p ≤ q.
3. On dit qu’un espace vectoriel normé est strictement convexe si sa norme vérifie
x + y
(kxk = kyk = 1 et x 6= y) ⇒
< 1.
2
lim kxn − xk = α.
n
1. En utilisant l’égalité du parallélogramme, montrer que (xn ) est une suite de Cauchy.
2. En déduire qu’il existe un unique x ∈ C qui minimise la distance à x. Ce point est appelé
projeté de x sur C.
3. Montrer que le projeté x de x sur C est caractérisé par la propriété suivante :
hx − x, y − xi ≤ 0, ∀y ∈ C.
4
2 Théorème de Carathéodory, théorème de Helly
Théorème 12 (Théorème de Carathéodory). Soit A ⊂ Rn . Toute combinaison convexe d’éléments
de A peut s’écrire comme combinaison convexe d’au plus n + 1 éléments de A.
Démonstration. Il suffit de montrer que pour tout N ≥ n + 2, toute combinaison convexe de N
s’écrire comme combinaison convexe de N − 1 éléments.
éléments de A peut en fait P
N
Soit N ≥ n + 2 et soit x = i=1 αi xi une combinaison convexe de N éléments de A. On considère
le système
N
X
βj x j = 0
j=1
N
X
βj = 0.
j=1
Il y a n + 1 équations et N > n + 1 inconnues. Le système a donc une P solution non nulle. Soit
λ1 , . . . , λN une telle solution. Comme les λi sont non tous nuls et que λi = 0, l’ensemble
I = {i ≤ N, λi > 0}
est non vide. Posons
A = {xi , i ∈ I}.
Alors
1 X
x= P λi xi
i∈I λi
i∈I
Donc si B = {xj , j ∈
/ I}, alors x ∈ conv(B).
5
Théorème 14 (Théorème de Helly). Si une famille finie de sous-ensembles convexes de Rn est
telle que toute sous-famille de cardinal n + 1 est d’intersection non vide alors la famille entière est
d’intersection non vide.
Démonstration. Soit m ≥ n + 1, et soient K1 , . . . , Km+1 des convexes vérifiant
\
Ki 6= ∅, ∀j ≤ m + 1.
i6=j
T
Pour tout j il existe donc xj ∈ i6=j Ki . Comme m + 1 ≥ n + 2, d’après le théorème de Radon il
existe I, J disjoints tels que
conv{xj , j ∈ I} ∩ conv{xj , j ∈ J} =
6 ∅
Il est ensuite facile de voir que l’intersection précédente est contenue dans l’intersection de tous les
Ki . On conclut par récurrence : si toute sous-famille de cardinal n + 1 est d’intersection non vide
alors d’après ce qui précède toute sous-famille de cardinal n + 2 est d’intersection non vide, donc
toute sous-famille de cardinal n + 3, etc. . .
6
3 Propriétés topologiques des convexes
On suppose que E est un espace vectoriel topologique (voir l’annexe 1).
◦
Proposition 15. Soit K un ensemble convexe. Alors son intérieur K et son adhérence K sont
aussi convexes.
◦
Démonstration. Soient x, y ∈ K et α ∈ [0, 1]. Alors il existe un ouvert U contenant x et inclus dans
K ainsi qu’un ouvert V contenant y et inclus dans K. Alors (1 − α)U + αV est ouvert, contient
◦
(1 − α)x + αy et est inclus dans K (par convexité de K). Donc (1 − α)x + αy ∈ K.
Soient x0 , x1 ∈ K et t ∈]0, 1[. Posons xt = (1 − t)x0 + tx1 . Soit Ut un ouvert contenant xt . Alors
Ut − tx1 U − (1 − t)x0
U0 = etU1 =
1−t t
sont deux ouverts contenant x0 et x1 respectivement, ils intersectent donc tous les deux K. Soit
y0 ∈ U0 ∩ K et soit y1 ∈ U1 ∩ K. Alors (1 − t)y0 + ty1 ∈ Ut ∩ K. Tout ouvert contenant xt intersecte
donc K. Donc xt ∈ K, donc K est convexe.
Un ensemble convexe peut très bien être d’intérieur vide, par exemple un segment dans R2 .
Définition 16. Soit K un convexe, on appelle intérieur relatif de K, noté ri(K), l’intérieur de K
vu comme sous-ensemble de aff(K), c’est-à-dire l’ensemble des x ∈ E tels qu’il existe un ouvert U
tel que
x ∈ U et U ∩ aff(K) ⊂ K.
Exemple. L’ensemble [0, 1] × {0} est un convexe de R2 . Son intérieur est vide, et son intérieur
relatif est ]0, 1[×{0}.
Lemme 17. L’intérieur relatif d’un convexe est convexe.
La démonstration est la même que pour montrer que l’intérieur d’un convexe est convexe.
Proposition 18. Soit K un sous-ensemble convexe non vide de Rn . Alors ri(K) 6= ∅.
Démonstration. Il suffit de montrer que si K est de dimension n alors K est d’intérieur non vide.
Mais K contient alors un simplexe de dimension n, qui est clairement d’intérieur non vide, d’où le
résultat.
Définition 19. Soit K un convexe contenant 0, on appelle jauge de K la fonction j : E → [0, +∞]
définie par
j(x) = inf{s > 0; x ∈ sK},
avec la convention inf(∅) = +∞.
Remarque. Comme K est convexe et contient 0, l’ensemble K ∩ (R+ x) est un intervalle contenant
0. Alors j(x) est l’inverse de la longueur de cet intervalle. Autrement dit
x x
K ∩ (R+ x) = 0, ou 0, .
j(x) j(x)
Exemple. Soit E un espace vectoriel normé et B sa boule. Pour tout x on a
7
Démonstration. L’homogénéité est laissée en exercice.
Soient x, y ∈ E, soient s, t > 0 tels que x ∈ sK et y ∈ tK. Alors par convexité de K
x + y ∈ sK + tK = (s + t)K;
De plus, si 0 est dans l’intérieur de K la première et la dernière inclusion sont des égalités.
◦
Démonstration. Si x ∈ K, c’est-à-dire si K contient un voisinage de x, comme (1 + 1/n)x → x, il
existe n tel que (1 + 1/n)x ∈ K. Donc
1
j(x) ≤ < 1.
1 + 1/n
2. En déduire que
riK = K.
3. Montrer par un exemple que cette propriété n’est pas vraie sans hypothèse de convexité.
8
Exercice 9. Soit A ⊂ E. Montrer que l’adhérence de conv(A) est le plus petit ensemble convexe
fermé contenant A.
Montrer que A est fermé, mais que conv(A) n’est pas fermé.
2. Montrer que si A est un sous-ensemble fini d’un espace vectoriel topologique E alors conv(A)
est fermé.
3. Montrer que si A est un sous-ensemble ouvert d’un espace topologique alors conv(A) est
ouvert.
4. Montrer que si A est un sous-ensemble compact de Rn alors conv(A) est compact.
Indication : utiliser le théorème de Carathéodory.
9
4 Fonctions convexes
On va considérer des fonctions à valeurs dans R ∪ {+∞}. On dira qu’une telle fonction f est
propre si elle n’est pas constamment égale à +∞.
Définition 24. Soit E un espace vectoriel et K un sous-ensemble convexe de E. Une fonction
f : K → R ∪ {+∞} est dite convexe si
On dit aussi que f est concave si −f est convexe et que f est affine si elle est convexe et
concave, c’est-à-dire si
Proposition 26. Le domaine d’une fonction convexe est convexe. Une fonction f est convexe si
et seulement si son épigraphe est un sous-ensemble convexe de E × R.
La démonstration est laissée en exercice.
Proposition 27. (i) Un supremum de fonctions convexes est une fonction convexe.
(ii) Soient α ≥ 0 et f une fonction convexe. Alors αf est convexe.
(iii) La somme de deux fonctions convexes est convexe.
Démonstration. Remarquons que
\
epi sup fi = epi(fi ).
i∈I
i∈I
Donc si les fi sont convexes, leurs épigraphes sont convexes et l’épigraphe de sup fi aussi comme
intersection d’ensembles convexes. Les autres propriétés sont laissées en exercice.
On va aborder les propriétés de continuité des fonctions convexes. On suppose donc désormais
que E est un espace vectoriel topologique.
Lemme 28. Soit f une fonction convexe et soit x ∈ E. Si f est majorée au voisinage de x alors
f est continue en x.
Démonstration. Par hypothèse, il existe un voisinage U de 0 et une constante C tels que f ≤ C
sur x + U . Quitte à remplacer U par U ∩ (−U ) on peut supposer que U = −U . Soit > 0. Alors
V = x + U est un voisinage de x. Soit z = x + u ∈ V .
Donc
f (z) − f (x) ≤ −f (x) + C ≤ 2C 0 ,
10
en posant C 0 = max{|f (x)|, C}. De plus
1 1
f (x) = f z+ (x − u) ≤ f (z) + f (x − u),
1+ 1+ 1+ 1+
Démonstration. Soit x dans l’intérieur du domaine de f . Il existe δ > 0 tel que la boule x + δB1n
soit incluse dans le domaine de f . Mais la boule x + δB1n est l’enveloppe convexe des 2n points
max(f (x ± ei ), i = 1, . . . , n}
Remarque. C’est faux en dimension infinie, on peut par exemple avoir des fonctions linéaires qui
ne soient pas continues.
Exercice 11. Soit f : E → R ∪ {+∞}. Montrer que si f est convexe alors pour tout a ∈ R son
ensemble de niveau {x ∈ E, f (x) ≤ a} est convexe. Montrer que la réciproque est fausse. Une
fonction dont tous les ensembles de niveau sont convexes est dite quasi-convexe.
Exercice 12. Soit A un sous-ensemble de E montrer que A est convexe si et seulement si − ln(1A )
est une fonction convexe.
Exercice 13. Soit f : E → R ∪ {+∞} une fonction convexe et A ⊂ E. Montrer que
sup f = sup f.
A conv(A)
11
5 Le théorème de Hahn-Banach
Théorème 31 (Théorème de Hahn-Banach). Soit E un espace vectoriel, soit j : E → R une
fonction 1-homogène et sous-additive, soit F un sous-espace vectoriel de E et φ : F → R une
application linéaire dominée par j :
φ(x) ≤ j(x), ∀x ∈ F.
Alors φ peut être étendue à E tout entier en restant dominée par j : il existe ψ : E → R linéaire
vérifiant
ψ(x) = φ(x), ∀x ∈ F
ψ(x) ≤ j(x), ∀x ∈ E.
Remarque. On autorise dans ce théorème la fonction j à prendre des valeurs négatives, en revanche
j ne peut pas prendre de valeur infinie.
Démonstration. Soit y ∈ E\F . On commence par prolonger φ à F + Ry. Pour tous x, x0 ∈ F
On étend ensuite φ au sous-espace F + Ry en posant φ(y) = α. Montrons que φ reste dominée par
j. Soit x ∈ E et t ∈ R, on a
φ(x + ty) = φ(x) + tα.
Il suffit donc de montrer que pour tout t ∈ R et pour tout x ∈ E
Ceci se déduit de (2) en distinguant les t = 0, t > 0, t < 0, les détails sont laissés en exercice. En
dimension finie, il suffit d’itérer le processus pour terminer la preuve. En dimension infinie, il faut
faire appel au lemme de Zorn, on renvoie à l’annexe 2.
Corollaire 32. Soit E un espace vectoriel normé, soit F un sous-espace et soit φ une forme
linéaire continue sur F . Alors φ s’étend en une forme linéaire continue sur E de même norme que
φ : il existe ψ ∈ E ∗ telle que ψ|F = φ et kψkE ∗ = kφkF ∗ .
Démonstration. On pose C = kφkF ∗ . Alors φ(x) ≤ Ckxk pour tout x ∈ F . En appliquant Hahn-
Banach avec la fonction j(x) = Ckxk, qui est 1-homogène et sous-additive, on obtient le résultat.
Corollaire 33. Soit E un espace vectoriel normé, il existe φ ∈ E ∗ de norme 1 telle que φ(x) = kxk.
Autrement dit
kxk = max{φ(x), kφkE ∗ ≤ 1}
Démonstration. Posons pour φ(tx) = tkxk pour tout t ∈ R. Alors φ est une forme linéaire continue
sur Rx de norme 1 et vérifiant φ(x) = kxk. D’après le corollaire précédent φ se prolonge en une
forme linéaire continue sur de norme 1 sur E.
Sous sa forme géométrique le théorème de Hahn-Banach affirme que deux ensembles convexes
disjoints peuvent être séparés par un hyperplan affine.
Théorème 34. Soit E un espace vectoriel topologique et soient A, B deux ensembles convexes
disjoints.
(i) Si A est ouvert il existe φ ∈ E ∗ telle que
12
(ii) Si l’espace E est localement convexe, si A est compact et B fermé, il existe φ ∈ E ∗ et > 0
tels que
φ(x) + < φ(y) ∀x ∈ A, ∀y ∈ B.
Démonstration. On commence par le point (i). Soit z un point arbitraire de A − B et soit C =
A − B − z. Alors C est un ouvert convexe contenant 0. Soit j la jauge de C. Comme C est un
voisinage de 0, on a 0 ≤ j(x) < +∞ pour tout x ∈ E. De plus j est 1-homogène et sous-additive.
Pour t ∈ R on pose φ(tz) = t. Comme A ∩ B = ∅, on a z ∈
/ C et donc j(z) ≥ 1. Par conséquent
pour tout t ≥ 0. Pour t < 0 on a bien sûr φ(tz) < 0 ≤ j(tz). Par Hahn-Banach, on prolonge φ de
manière linéaire sur E tout entier, en gardant l’inégalité φ ≤ j. Comme C est ouvert, sa jauge j est
continue, ce qui implique facilement la continuité de φ. Soient x ∈ A et y ∈ B. Alors x − y + z ∈ C
et donc
φ(x − y + z) ≤ j(x − y + z) < 1
D’autre part
φ(x − y + z) = φ(x) − φ(y) + φ(z) ≥ φ(x) − φ(y) + 1.
Donc φ(x) < φ(y), ce qu’il fallait démontrer.
Si A est compact, B fermé et E localement convexe, il existe un ouvert convexe U contenant 0 tel
que A0 = A + U n’intersecte pas B (voir l’annexe 2). En appliquant le résultat précédent à A0 et
B, on trouve φ ∈ E ∗ telle que
φ(x + u) < φ(y)
pour tout x ∈ A, u ∈ U, y ∈ B. On obtient le résultat cherché en posant par exemple =
1
2 sup{φ(u), u ∈ U }.
Corollaire 35 (Hyperplan d’appui). Soit C un convexe fermé d’intérieur non vide et x ∈ ∂C.
Alors C admet un hyperplan d’appui en x : il existe φ ∈ E ∗ non nulle telle que
φ(y) ≤ φ(x), ∀y ∈ C
◦
Démonstration. Il suffit d’appliquer (i) à A = C et B = {x}.
Exercice 14. Soit E un espace vectoriel topologique localement convexe et E ∗ sont dual. Étant
donné A ⊂ E on pose
A⊥ = {φ ∈ E ∗ ; φ(x) = 0, ∀x ∈ A}.
Montrer que vect(A) est dense dans E si et seulement si A⊥ = {0}.
Exercice 15. On considère `∞ (N), l’espace des suites réelles bornées muni de la norme
Soit F l’ensemble des suites qui possèdent une limite finie. Pour u ∈ F on pose
φ(u) = lim un .
n
1. Montrer que F est un sous-espace vectoriel de `∞ (N) et que φ est une forme linéaire continue
sur F .
2. En déduire que `1 (N) n’est pas réflexif (voir l’annexe 3).
Exercice 16. On considère l’espace L2 ([−1, 1], B([−1, 1]), λ) où λ est la mesure de Lebesgue, et
soit Eα l’ensemble des fonctions continues f sur [−1, 1] vérifiant f (0) = α. Montrer que Eα est un
sous-espace affine dense de L2 . En déduire que par exemple E0 et E1 sont deux ensembles convexes
disjoints qui ne peuvent pas être séparés par une forme linéaire continue.
Exercice 17. Redémontrer la partie (ii) du Théorème 34 dans le cas où E est un espace de Hilbert
et A un singleton en utilisant la notion de projection sur un convexe (exercice 7).
13
Exercice 18. Rappelons le théorème de Carathéodory : soit A un sous-ensemble d’un espace
vectoriel. Si E = aff(A) est de dimension finie n alors conv(A) est égal à l’ensemble des combinaisons
convexes de n + 1 éléments de A. L’objectif de cet exercice est de redémontrer ce théorème.
1. Montrer qu’il suffit de démontrer le résultat pour A fini.
2. On suppose A fini. Soit x ∈ conv(A) et soit y ∈ A, différent de x. Soit D+ la demi-droite
issue de y et passant par x. Montrer qu’il existe z ∈ E tel que
φ ∈ vect{φ1 , . . . , φm }
\m
ker(φi ) ⊂ ker(φ).
i=1
Montrer qu’on définit une forme linéaire ψ sur l’image de T en posant ψ(T (x)) = φ(x) pour
tout x ∈ E.
3. Appliquer Hahn-Banach et conclure.
14
6 Polarité
Dans cette section on se place en dimension finie.
Définition 36. Soit A ⊂ Rn . On appelle polaire de A l’ensemble
A◦ = {x ∈ Rn , hx, yi ≤ 1, ∀y ∈ A}
Lemme 37. L’ensemble A◦ est convexe, fermé et contient 0.
Démonstration. L’ensemble \
A◦ = {hx, yi ≤ 1}
y∈A
15
Démonstration. Soit y ∈ Rn . On a
kykE ∗ = sup {hy, xi; x ∈ K}
= hK (y) = jK ◦ (y),
λx + µy ∈ C, ∀x, y ∈ C, ∀λ, µ ≥ 0.
A∗ = {y ∈ Rn ; hy, xi ≥ 0, ∀x ∈ A}.
fi (x) = hyi , xi + ai
{z1 , . . . , zm }∗ ⊂ {en+1 }∗
16
7 Transformée de Legendre-Fenchel
Dans cette section on se place en dimension finie.
Définition 42. Une fonction f : Rn → R ∪ {+∞} est dite semi-continue inférieurement si pour
tout suite convergente (xn ) d’éléments de Rn on a
Lemme 43. Une fonction de Rn dans R ∪ {+∞} est semi-continue inférieurement si et seulement
si sont épigraphe est un sous-ensemble fermé de Rn × R.
Démonstration. On suppose que f est s.c.i. Si une suite (xn , tn ) d’éléments de epi(f ) converge vers
(x, t) ∈ Rn+1 . Alors le caractère s.c.i. de f donne
ce qui montre que (x, t) appartient à epi(f ) qui est donc fermé. La réciproque se démontre de
manière similaire.
Remarque. Attention le fait que l’épigraphe de f soit fermé n’implique par que le domaine de f le
soit.
Lemme 44. Un supremum de fonctions semi-continues inférieurement est semi-continu inférieu-
rement.
Démonstration. \
epi sup fi = epi(fi ).
i∈I
i∈I
x0 7→ hy, x0 − xi + f (x)
Théorème 48. Soit f une fonction convexe propre et x un point appartenant à l’intérieur relatif
de son domaine, alors ∂f (x) est non vide.
17
Démonstration. C’est une conséquence de Hahn-Banach. Supposons dans un premier temps que
dom(f ) est d’intérieur non vide. Soit x appartenant à l’intérieur du domaine de f . Soit A l’intérieur
de l’épigraphe de f , c’est-à-dire l’ensemble des couples (x, t) avec x dans l’intérieur du domaine de
f et t > f (x). Alors A est un ouvert convexe non vide de Rn+1 et le point (x, f (x)) n’appartient
pas à A. On peut donc séparer (x, f (x)) de A par un hyperplan. Il existe y ∈ Rn et α ∈ R tels que
pour tout (x0 , t) ∈ A. En appliquant cette inégalité à (x, f (x) + 1), qui appartient à A, on obtient
α > 0. Posons y 0 = −y/α, on a donc
hy 0 , x0 i − t ≤ hy 0 , xi − f (x), ∀(x0 , t) ∈ A.
Comme epi(f ) est un convexe d’intérieur non vide, tout couple (x0 , t) appartenant à epi(f ) est
limite d’éléments de son intérieur A (voir l’exercice 8). L’inégalité précédente est donc valable pour
tout (x0 , t) ∈ epi(f ). Par conséquent
hy 0 , x0 i − f (x0 ) ≤ hy 0 , xi − f (x),
Corollaire 49. Soit f une fonction convexe et propre, alors f est minorée par une fonction affine.
Démonstration. D’après le résultat précédent, il existe x et y tels que y ∈ ∂f (x). C’est-à-dire
pour tout x0 ∈ Rn .
Remarquons que la fonction f ∗ est propre si et seulement si f est minorée par une fonction
affine. Pour une telle fonction f on peut s’intéresser à f ∗∗ . Comme
pour tous x, y ∈ Rn , on a
Théorème 50. Soit f : Rn → R ∪ {+∞} une fonction propre, minorée par une fonction affine.
On a
epi(f ∗∗ ) = conv (epi(f )).
Une autre manière de formuler ce théorème est la suivante : Si f est minorée par une fonction
affine, alors f ∗∗ est la plus grande fonction convexe s.c.i qui soit plus petite que f . L’hypothèse est
nécessaire : si f n’est pas minorée par une fonction affine, l’ensemble des fonctions convexes plus
petites que f est vide. On dit que f ∗∗ est l’enveloppe convexe s.c.i. de f .
Démonstration. On sait déjà que f ∗∗ ≤ f donc epi(f ∗∗ ) ⊃ epi(f ). De plus f ∗∗ étant convexe s.c.i.
epi(f ∗∗ ) est convexe fermé, donc
18
Réciproquement si un point (x, t) de Rn+1 n’appartient pas à l’enveloppe convexe fermée de epi(f )
alors par Hahn-Banach (x, t) peut-être séparé de epi(f ) de manière stricte par un hyperplan : il
existe y ∈ Rn , α ∈ R et > 0 tels que
pour tout (x0 , t0 ) ∈ epi(f ). En faisant tendre t0 vers +∞ on voit que α est nécessairement négatif.
Si α < 0 on divise l’inégalité par −α, on pose y 0 = y/(−α) on obtient
f ∗∗ (x) ≥ hx, y 0 i − f ∗ (y 0 ) ≥ t + ,
/ epi(f ∗∗ ).
et donc (x, t) ∈
Si α = 0, on obtient
hx, yi ≥ hx0 , yi +
pour tout x0 ∈ dom(f ). On sait que f est minorée par une fonction affine : il existe a ∈ Rn et b ∈ R
tels que
f (x) ≥ ha, xi + b, ∀x ∈ Rn .
En combinant les deux dernières inégalités, on montre facilement que pour tout t > 0
Et donc
f ∗∗ (x) ≥ hx, a + tyi − f ∗ (a + ty)
≥ tkyk22 + b.
f ∗∗ (x) = +∞,
/ epi(f ∗∗ ).
ce qui montre que (x, t) ∈
Corollaire 51. Soit f : Rn → R ∪ {+∞} une fonction propre. Alors f ∗∗ = f si et seulement si f
est convexe et semi-continue inférieurement.
Démonstration. Le sens direct est clair : f ∗∗ est toujours convexe s.c.i. Réciproquement, supposons
f convexe s.c.i. Alors f est minorée par une fonction affine et epi(f ) est convexe et fermé. Dans ce
cas le théorème précédent donne
epi(f ∗∗ ) = epi(f ),
et donc f ∗∗ = f .
Si f est convexe s.c.i. on a donc la série d’équivalence suivantes
19
Exercice 26. Déterminer la transformée de Legendre de la fonction exponentielle.
Exercice 27. Soit f : Rn → R ∪ {+∞} une fonction propre. À quelle condition a-t’on f = f ∗ ?
Exercice 28. Soit K un corps convexe de Rn contenant 0 dans son intérieur et soit jK sa jauge.
1. Montrer que pour tout t ≥ 0 et pour tout y ∈ Rn
2. En déduire que si φ : R → R ∪ {+∞} est une fonction propre dont le domaine est inclus dans
[0, +∞[, alors
(φ ◦ jK )∗ = φ∗ ◦ hK .
Exercice 29. Soit f une fonction convexe et x un point du domaine de f . Montrer que ∂f (x) est
convexe et fermé.
20
8 Convexité et différentiabilité
Dans cette section, on se place en dimension finie.
Définition 53. Soit f une fonction définie au voisinage d’un point x et soit v ∈ Rn . On dit que
f admet une dérivée directionnelle en x dans la direction v, notée f 0 (x; v) si
f (x + tv) − f (x)
f 0 (x; v) = lim
t→0+ t
existe dans R.
Remarque. Si f est différentiable en x alors f 0 (x; v) existe pour toute direction v et on a
Définition 54. Soit f définie au voisinage d’un point x. On dit que f est Gâteaux-différentiable
en x si elle admet des dérivées dans toutes les directions, et s’il existe y ∈ Rn tel que pour tout v
L’inégalité précédente montre que D ∩ A = ∅. Comme D est convexe et A convexe ouvert, il existe
y ∈ Rn et α ∈ R tels que
hy, x0 i + αs < hy, x00 i + αt. (3)
pour tout (x0 , s) ∈ A et (x00 , t) ∈ D. En appliquant ceci à (x00 , t) = (x, f (x)) et en raisonnant de la
même manière que dans la preuve du Théorème 48 on montre que α > 0 et que y 0 = −y/α ∈ ∂f (x).
L’inégalité (3) implique alors
21
Au passage on a vu que si f est convexe alors
f (x + v) ≥ f (x) + f 0 (x; v)
pour tout x, v.
Proposition 56. Soit U un ouvert convexe de Rn et soit f : U → R une fonction Gâteaux-
différentiable sur U . Les assertions suivantes sont équivalentes :
(i) f est convexe sur U .
(ii) f (y) ≥ f (x) + hf 0 (x), y − xi, ∀x, y ∈ U .
(iii) hf 0 (y) − f 0 (x), y − xi ≥ 0, ∀x, y ∈ U .
Démonstration. On a déjà vu que (i) ⇒ (ii). Réciproquement si (ii) est vraie alors
Corollaire 57. Si f est deux fois différentiable sur U et si D2 f (x) ≥ 0 en tout point de U alors
f est convexe.
Démonstration. D’après la formule de Taylor
Z 1
f (y) = f (x) + h∇f (x), y − xi + (1 − t)D2 f ((1 − t)x + ty) (y − x, y − x) dt
0
≥ f (x) + h∇f (x), y − xi.
Il n’est pas vrai en général qu’une fonction Gâteaux-différentiable est différentiable. On a néan-
moins le résultat suivant.
Lemme 58. Soit f : Rn → R ∪ {+∞} une fonction convexe et soit x dans l’intérieur du domaine
de f . Si f est Gâteaux-différentiable en x alors f est différentiable et f 0 (x) = ∇f (x).
Démonstration. Quitte à remplacer f par
on peut supposer que x = 0 et f 0 (0) = 0. On sait alors que f ≥ 0 et que pour toute direction v
quand t → 0. Soit y ∈ Rn , comme y ∈ kyk1 B1n , qui est l’enveloppe convexe des
{±kyk1 ei , i ≤ n} ,
la convexité de f implique
f (y) ≤ max {f (±kyk1 ei ) , i ≤ n} .
En combinant ceci avec (4), on obtient
f (y) = o (kyk1 ) ,
ce qui montre que f est différentiable en 0 et que son gradient est nul.
22
Proposition 59. Soit f convexe et soit x dans l’intérieur du domaine de f . Alors f est différen-
tiable en x si et seulement si ∂f (x) est un singleton. On a alors
∂f (x) = {∇f (x)}.
Démonstration. Supposons que f est différentiable en x. On sait que pour toute direction v
f (x + v) − f (x) ≥ f 0 (x; v) = h∇f (x), vi.
autrement dit ∇f (x) ∈ ∂f (x). Si y ∈ ∂f (x), on a pour tout v ∈ Rn et t > 0
f (x + tv) − f (x) ≥ thy, vi.
En divisant pas t et en faisant tendre t vers 0 on obtient
h∇f (x), vi ≤ hy, vi.
Comme ceci est valable pour tout v on en déduit y = ∇f (x).
Réciproquement, si ∂f (x) = {y} le Lemme 55 montre que f 0 (x; v) existe pour toute direction v et
f 0 (x; v) = hv, yi.
Autrement dit f est Gâteaux-différentiable en x de dérivée y. Le lemme précédent permet alors de
conclure.
Exercice 32. Soit f : R → R ∪ {+∞} une fonction convexe propre. Soit I l’intérieur du domaine
de f . Pour x ∈ I on pose
0
f+ (x) = f 0 (x; 1) et f−
0
(x) = f 0 (x; −1).
On appelle D l’ensemble des points de dérivabilité de f .
0 0 0 0
1. Montrer que f+ et f− sont croissantes sur I et que f− ≤ f+ .
0 0
2. Montrer que f+ est continue à droite et que f− est continue à gauche.
0 0
3. Montrer que l’ensemble {f+ − f− > 0} est au plus dénombrable.
4. En déduire que le complémentaire de D est au plus dénombrable et que f 0 est continue sur
D.
Exercice 33. Soit f : Rn → R ∪ {+∞} une fonction convexe et soit x dans l’intérieur de son
domaine.
1. Montrer que
v ∈ Rn 7→ f 0 (x; v)
est 1-homogène et sous-additive.
2. En déduire que si f 0 (x; v) = f 0 (x, −v) pour toute direction v, alors f est dérivable en x.
3. Montrer qu’il suffit même de vérifier cette égalité pour les vecteurs d’une base de Rn .
Exercice 34. Soit f : Rn → R ∪ {+∞} une fonction convexe et soit A l’intérieur du domaine de
f.
1. Soit v ∈ Rn , on pose
B = {x ∈ A; f 0 (x; v) − f 0 (x; −v) > 0} .
Montrer que l’intersection de B avec toute droite parallèle à v est au plus dénombrable.
2. En déduire que f 0 (x; v) = f 0 (x; −v) pour presque tout x de A.
3. Montrer que f est dérivable en presque tout point de A.
Exercice 35. Soit f : Rn → R ∪ {+∞} une fonction convexe propre. On suppose que f est
strictement convexe sur son domaine :
x+y f (x) + f (y)
∀x 6= y ∈ dom(f ), f < .
2 2
1. Montrer que la sous-différentielle de f est injective, au sens où
∂f (x) ∩ ∂f (y) = ∅, ∀x 6= y ∈ dom(f ).
2. En déduire que f ∗ est différentiable sur l’intérieur de son domaine.
23
9 Le théorème de Krein-Milman
Dans cette section on se place dans un espace vectoriel topologique localement convexe E.
Définition 60. Soit K un sous-ensemble convexe de E. On dit que F ⊂ K est une face de K si
F est convexe et si
(1 − t)x + ty ⇒ x, y ∈ F,
pour tous x, y ∈ F et pour tout t ∈]0, 1[. On dit que x ∈ K est un point extrémal de K si pour
tout {x} est une face de K, ce qui revient à dire que x ne peut pas s’écrire comme demi-somme
de deux points distincts de K.
Lemme 61. Soit K un convexe et F une face de K. Si F 0 est une face de F , alors F 0 est une
face de K.
La démonstration est laissée en exercice.
Lemme 62. Soit K un convexe et soit φ une forme linéaire atteignant son maximum sur K. Alors
l’ensemble n o
F = x ∈ K; φ(x) = max φ
K
est une face de K.
Démonstration. Il est clair que F est convexe. Soient x, y ∈ K et soit t ∈]0, 1[. On a
φ(x) ≤ max φ etφ(y) ≤ max φ.
K K
est une face de K. De plus F est fermée, donc compacte. Si K est de dimension finie n alors F
est de dimension n − 1 au plus. En dimension finie on peut donc raisonner par récurrence : F
étant un compact convexe de dimension strictement plus petite que K admet un point extrémal z
(hypothèse de récurrence). Et comme F est une face de K, le point z est aussi extrémal pour K
(voir le lemme ci-dessus).
Pour le cas général, on renvoie à l’annexe 2.
Théorème 64 (Krein-Milman). Soit K un ensemble convexe compact de E, alors K est l’enveloppe
convexe fermée de ses points extrémaux.
Démonstration. Soit K 0 l’enveloppe convexe fermée des points extrémaux de K. Alors K 0 est un
sous-ensemble convexe compact de K. Supposons par l’absurde que K 0 6= K et donc qu’il existe
x ∈ K\K 0 . Par Hahn-Banach, on peut séparer strictement x de K 0 : il existe φ ∈ E ∗ et > 0 tel
que
φ(y) + < φ(x), ∀y ∈ K 0 .
À nouveau, posons
F = {x ∈ K; φ(x) = max φ}.
K
Alors F est un convexe compact non vide. D’après la proposition précédente F admet un point
extrémal y, qui est aussi un point extrémal de K puisque F est une face de K. Du coup y ∈ K 0 et
on a la contradiction suivante
φ(y) < φ(x) ≤ max φ = φ(y).
K
24
Remarque. Toutes les hypothèses du théorème sont nécessaires. Par exemple R ou ]0, 1[ sont des
sous-ensembles convexes de R qui ne possèdent pas de point extrémal. La demi droite [0, +∞[
possède un seul point extrémal : 0, elle n’est donc pas égale à l’enveloppe convexe fermée de ses
points extrémaux.
Exercice 36. Déterminer les points extrémaux de B2n , B1n , B∞
n
.
Exercice 37. Soit K ⊂ Rn un polytope définit par m contraintes affines :
m
\
K= {x ∈ Rn , hx, yi i ≤ ai } .
i=1
Soit x ∈ K et soit
I = {i ≤ m, hx, yi i = ai }
l’ensemble des contraintes saturées par x. Montrer que x est un point extrémal de K si et seulement
si
vect(yi , i ∈ I) = Rn .
Exercice 38 (Théorème de Birkhoff-Von Neumann). On dit qu’une matrice (aij )i,j≤n est double-
ment stochastique si ses coefficients sont tous positifs et si
n
X
aij = 1, ∀j ≤ n
i=1
n (5)
X
aij = 1, ∀i ≤ n
j=1
kf k = sup |f (x)|,
x∈[0,1]
25
1. Soit f ∈ B non nulle. Montrer qu’il existe t ∈ [0, 1] tel que
Z t
1
|f | ds = kf k1 .
0 2
f ≥ 0 ⇒ φ(f ) ≥ 0, ∀f ∈ C.
On appelle K l’ensemble des formes linéaires φ positives sur C vérifiant φ(1) = 1 (où 1 est simple-
ment la fonction constante égale à 1).
1. On appelle Dirac en t l’application
δt : f ∈ C 7→ f (t).
Montrer que δt ∈ K.
2. Montrer que si φ est positive alors φ est continue et
kφk∗ ≤ φ(1),
6. Montrer que toute fonction de C peut s’écrire comme la différence de deux fonctions atteignant
leur maximum en t. En déduire que δt est un point extrémal de K.
7. Soit φ un point extrémal de K et soit h ∈ C vérifiant 0 < h < 1. Montrer que
φ(hf ) φ((1 − h)f )
f 7→ et f 7→
φ(h) φ(1 − h)
appartiennent à K.
8. En déduire que φ(hf ) = φ(h)φ(f ). Montrer que cette égalité reste vraie sans l’hypothèse
0 < h < 1.
9. En déduire que
f > 0 ⇒ φ(f ) > 0, ∀f ∈ C.
10. Montrer que toute suite finie f1 , . . .P
, fn d’éléments de ker(φ) possède un 0 commun.
n
Indication : Considérer la fonction i=1 fi2 .
11. En déduire qu’il existe t ∈ [0, 1] tel que
ker(φ) ⊂ ker(δt ),
puis que φ = δt .
On a donc montré que les points extrémaux de K sont exactement les Dirac.
26
10 Optimisation convexe
On se donne f, g1 , . . . , gk des fonctions convexes propres sur Rn et h1 , . . . , hl des fonctions
affines sur Rn . On s’intéresse au problème suivant
minimiser f (x)
(P) sous contraintes gi (x) ≤ 0, ∀i ≤ k
hi (x) = 0, ∀i ≤ l.
On dit que (P) est un problème d’optimisation convexe. Dans la suite on appellera C le domaine de
f et on supposera que le domaine des fonctions fi contient C. Ce n’est pas vraiment une restriction,
on peut toujours se ramener à cette situation en posant
f = +∞
T
en dehors de dom(fi ). Comme les fonctions gi sont convexes et les fonctions hi sont affines,
l’ensemble des x vérifiant les contraintes
gi (x) ≤ 0, i≤k
(6)
hi (x) = 0, i≤l
f (x) = α.
Le but de ce chapitre est de donner un critère pratique permettant de déterminer les solutions
de (P).
Faisons d’abord quelques remarques sur la minimisation sans contraintes d’une fonction convexe.
Soit f : Rn → R ∪ {+∞} une fonction convexe propre. Alors f atteint son minimum en x si et
seulement si 0 ∈ ∂f (x). En effet, par définition du sous-gradient 0 ∈ ∂f (x) si et seulement si
Remarquons aussi que f minorée si et seulement si 0 ∈ dom(f ∗ ). Enfin f atteint son minimum
si et seulement si ∂f ∗ (0) 6= ∅, ce qui est le cas en particulier si 0 est dans l’intérieur relatif du
domaine de f ∗ . Par exemple f : x 7→ ex est convexe sur R. Elle est minorée mais n’atteint pas son
minimum. Sa transformée de Legendre est donnée par
∗ y ln(y) − y si y ≥ 0
f : y 7→
+∞ sinon.
27
Remarque. Soit (λ, µ) tel que les λi soient positifs. Si x vérifie les contraintes (6) alors
L(x, λ, µ) ≤ f (x).
Par conséquent (λ, µ) est vecteur KKT si et seulement si
L(x, λ, µ) ≥ inf {f (x0 ); x0 vérifie (6)} , ∀x ∈ Rn .
Il suffit même de vérifier cette inégalité pour les x du domaine C de f puisque L(x, λ, µ) = +∞
en dehors.
Proposition 67. Soient (x, λ, µ) ∈ Rn × Rk × Rl , x est solution de (P) et (λ, µ) est un vecteur
KKT si et seulement si x vérifie les contraintes (6) et les conditions :
λi gi (x) = 0, ∀i ≤ k
k l
!
X X (7)
0∈∂ f+ λi gi + µi hi .
i=1 i=1
lorsque les fonctions f, g1 , . . . , gk sont dérivable en x. Lorsque les fonctions ne sont pas dérivables,
on a quand même dans la plupart des cas (voir l’exercice 44 plus loin)
k l
! k l
X X X X
∂ f+ λi gi + µi hi (x) = ∂f (x) + λi ∂gi (x) + µi ∂hi (x).
i=1 i=1 i=1 i=1
Théorème 68. On suppose que la valeur du problème P n’est pas −∞ et que la condition sui-
vante, dite condition de Slater, est vérifiée : Il existe x dans l’intérieur relatif de C vérifiant les
contraintes (6) et vérifiant de plus
gi (x) < 0
pour tout i tel que la fonction gi ne soit pas affine sur C. Alors le problème (P) admet un vecteur
KKT.
28
La démonstration repose sur le lemme de séparation suivant.
Lemme 69. Soit K un ensemble convexe quelconque et soit C un cône convexe engendré par un
nombre fini de vecteurs. Si C ne rencontre pas l’intérieur relatif de K on peut séparer K de C au
sens suivant : il existe y ∈ C ∗
hy, xi ≤ 0, ∀x ∈ K
et tel que l’inégalité précédente soit stricte pour au moins un élément de K.
Démonstration. Quitte à remplacer K par R+ K on peut supposer que K aussi est un cône (détails
laissés en exercice). Soit E l’espace vectoriel engendré par K et soit K0 l’intérieur relatif de K,
c’est-à-dire l’intérieur de K vu comme sous-ensemble de E. Vus comme sous-ensemble de E les
convexes C ∩ F et K0 sont disjoints et K0 est ouvert. Donc il existe une forme linéaire φ sur E qui
sépare E ∩ C de K0 :
φ(x) < φ(x0 ), ∀x ∈ K0 , ∀x0 ∈ E ∩ C.
Comme E ∩ C est un cône de E il est facile de voir que ceci implique en fait
On pose H = {φ = 0} et
D = H + C.
Alors D est un cône engendré par un nombre fini de vecteurs (rappelons que H est de dimension
finie), en particulier D est un cône fermé, et D ∩ K0 = ∅ (puisque φ est positive sur D ∩ E et
strictement négative sur K0 ). Soit x0 ∈ K0 . Alors x0 ∈/ D et comme D est un cône fermé il existe
y ∈ D∗ tel que
hx0 , yi < 0.
Comme C ⊂ D on a D∗ ⊂ C ∗ donc y ∈ C ∗ . D’autre part comme H ⊂ D et y ∈ D∗ on a hx, yi ≥ 0
pour tout x ∈ H et donc en fait hx, yi = 0 puisque −x appartient aussi à H. Autrement dit, en
appelant ψ la forme linéaire sur E définie par
on obtient ker(φ) ⊂ ker(ψ) et donc ψ = λφ pour un certain réel λ. De plus comme φ(x0 ) et ψ(x0 )
sont strictement négatifs tous les deux, on a forcément λ > 0. On en déduit
Bien sûr, ceci implique l’inégalité large pour tout x ∈ K, ce qui termine la preuve.
Démonstration du Théorème 68. On commence par prouver le théorème quand il n’y a pas de
contraintes en égalité. On considère donc le problème
minimiser f (x)
(P0 )
sous contraintes gi (x) ≤ 0, ∀i ≤ k.
On suppose que g1 , . . . , gr sont convexes et non-affines, et que gr+1 , . . . , gk sont affines. Soit K
l’ensemble des (t, y) ∈ Rk+1 tels qu’il existe x ∈ Rn tel que
f (x) − α < t
gi (x) < yi , 1≤i≤r
gi (x) = yi , r + 1 ≤ i ≤ k,
en appelant α la valeur du problème (P0 ). L’ensemble K n’est pas vide, puisque pour tout x dans
C et pour tout > 0, le vecteur (t, y) donné par
t = f (x) − α +
yi = gi (x) + , 1≤i≤r
yi = gi (x), r+1≤i≤k
29
appartient à K. En utilisant la convexité des gi pour i ≤ r et le caractère affine des gi pour i ≥ r +1
on montre facilement que K est convexe. De plus par définition de α le convexe K n’intersecte pas
où les ei sont les vecteurs de la base canonique. Comme C ∗ = C le lemme précédent montre qu’il
existe (τ, λ) ∈ R × Rk à coordonnées positives et vérifiant
τ t + hy, λi ≥ 0, (8)
pour tout (t, y) ∈ K, et avec une inégalité stricte pour au moins un élément de K.
D’après ce qui précède cette inégalité implique
r
X k
X
τ (f (x) − α + ) + λi (gi (x) + ) + λi hi (x) ≥ 0,
i=1 i=r+1
pour x ∈ C. Si τ > 0 on en déduit que τ1 λ est un vecteur KKT pour le pour le problème (P0 ).
Supposons τ = 0 et (λ1 , . . . , λr ) 6= 0. On obtient
k
X
λi gi (x) ≥ 0
i=1
pour tout x ∈ C. Or, d’après l’hypothèse, il existe x satisfaisant gi (x) ≤ 0 pour tout i ≤ k, avec
inégalité stricte si i ≤ r. Comme les (λi )i≤k sont tous négatifs et que l’un au moins des (λi )i≤r est
strictement négatif, on en déduit
Xk
λi gi (x) < 0.
i=1
30
Corollaire 70. On suppose que le problème (P) vérifie les hypothèses du théorème précédent. Alors
x est solution de (P) si et seulement s’il existe (λ, µ) tel que x vérifie les contraintes (6) et les
conditions de KKT (7).
Exercice 42. Soit A, B deux convexes fermés d’un espace vectoriel topologique localement convexe
E.
1. Montrer par un exemple que A + B n’est pas forcément fermé.
On appelle cône de récession de A, noté rec(A) l’ensemble des vecteurs v ∈ Rn vérifiant
x + v ⊂ A,
pour tout x ∈ A.
2. Montrer que rec(A) est un cône convexe.
3. Montrer que si (xn ) est une suite d’éléments de A et (λn ) une suite de réels positifs tendant
vers 0 telle que (λn xn ) converge alors
lim λn xn ∈ rec(A).
n
epi(f1∗ ) + epi(f2∗ )
est fermé.
3. En utilisant l’exercice 30 montrer que
et que pour tout y dans le domaine de f1∗ f2∗ , il existe y1 , y2 tels que
2. Montrer par un exemple que l’inclusion réciproque n’est pas forcément vraie.
3. Montrer que si f1 et f2 vérifient la condition de l’exercice précédent alors pour tout x ∈ Rn
31
Exercice 45. Étant données µ, ν deux mesures de probabilité sur {1, . . . , m} et {1, . . . , n} respec-
tivement et une fonction de coût c : {1, . . . , m} × {1, . . . , n} → R+ on veut minimiser
X
cij πij
ij
sur l’ensemble des mesures de probabilité π sur le produit {1, . . . , m} × {1, . . . , n} ayant comme
première et deuxième marginales µ et ν respectivement (on dit que π est un couplage de µ, ν).
1. Montrer qu’il s’agit d’un problème d’optimisation convexe.
2. Montrer qu’il admet au moins une solution π.
3. Montrer qu’un couplage π de µ, ν est solution du problème si et seulement s’il existe f : {1, . . . , n} →
R et g : {1, . . . , n} → R telles que
fi + gi ≤ cij , ∀i, j
avec égalité pour tout (i, j) appartenant au support de π (égalité π-presque partout).
4. Montrer que la valeur du problème est donnée par
m
X n
X
fi µi + gj νj .
i=1 j=1
32
11 Le théorème de John
On dit que E ⊂ Rn est un ellipsoïde si E est l’image de la boule euclidienne par une application
affine de Rn dans Rn bijective : il existe une matrice inversible A et un vecteur u tels que
E = A−1 (B2n ) + u.
On a alors
x∈E ⇔ kA(x + u)k12 ≤ 1 ⇔ hAT A(x − u), x − ui ≤ 1
ce qui montre que E ne dépend en fait que de AT A. Quitte à remplacer A par
√
AT A
on peut supposer que A est symétrique définie positive, auquel cas la mesure de Lebesgue de E est
proportionnelle à l’inverse du déterminant de A. Quitte à remplacer u par −Au on peut supposer
que
E = A−1 (B2n − u),
auquel cas
x∈E ⇔ kAx + uk22 ≤ 1.
Étant donné un convexe compact d’intérieur non vide K, on cherche à minimiser la mesure de E
parmi les ellipsoïdes contenant K. Ceci revient donc à
minimiser − log(det(A))
sous contraintes kAx + uk22 ≤ 1, ∀x ∈ K,
avec une contrainte implicite supplémentaire que A doit être une matrice symétrique définie posi-
tive. On appellera problème de John ce problème dans la suite. L’ensemble des matrices symétriques
est noté Sn c’est un espace vectoriel de dimension n(n + 1)/2.
Lemme 71. La fonction
− log det(A) si A est définie positive
A ∈ Sn 7→
+∞ sinon
sont aussi convexes, le problème de John est un problème d’optimisation convexe avec une infinité
de contraintes.
Théorème 72. Soit K un convexe compact K d’intérieur non vide. Il existe un unique ellipsoïde
contenant K de volume maximal, appelé ellipsoïde de John de K.
33
Démonstration. Il faut minimiser
− ln(det(A))
sous les contraintes
kAx + uk22 ≤ 1, ∀x ∈ K.
Comme K est d’intérieur non vide K contient une boule euclidienne de rayon . Soit z son centre,
soit x de norme 1 et soit (A, u) vérifiant la contrainte ci-dessus. Alors z + x et z − x appartiennent
à K, et comme
1 1
Ax = (A(z + x) + u) − (A(z − x) + u)
2 2
on a par convexité de la norme
1 1
2 kAxk22 ≤ kA(z + x) + uk22 + kA(z − x) + uk22 ≤ 1.
2 2
Ceci montre que les valeurs propres de A sont majorées par 1/. En particulier le déterminant de
A est majoré et la valeur du problème n’est pas −∞. Soit (An , un ) une suite minimisante pour
le problème. D’après ce qui précède les valeurs propres de An sont majorées et le déterminant de
An converge vers une constante strictement positive. Ceci montre que les valeurs propres de A
sont aussi minorées. Quitte à extraire on peut donc supposer que An converge vers une matrice A
définie positive. On déduit alors facilement de la contrainte que la suite (un ) est nécessairement
bornée ; donc convergente quitte à extraire à nouveau. La limite de (An , un ) est alors une solution
du problème de John.
Pour l’unicité, la stricte concavité du déterminant montre que si (A, u) et (B, v) sont deux solutions
alors A = B. On a donc
Supposons par l’absurde que u 6= v et posons = ku − vk2 /4 . Il est facile de voir que
√
u+v
(B2n − u) ∩ (B2n − v) ⊂ 1 − B2n −
2
Remarque. Il est facile de voir que l’ellipsoïde de John est un invariant affine : si E est l’ellipsoïde
de John de K et T : Rn → Rn est affine et bijective, alors T E est l’ellipsoïde de John de T K. Par
conséquent pour tout K il existe T tel que l’ellipsoïde de John soit la boule Euclidienne. On dit
que K est en position de John. Une autre conséquence de cette remarque est que si K admet un
centre de symétrie x alors son ellipsoïde de John est aussi centré en x.
Théorème 73. Un convexe compact d’intérieur non vide K est en position de John si et seulement
si K est contenu dans B2n et il existe r entier, c1 , . . . , cr des réels positifs et x1 , . . . , xr appartenant
à ∂K ∩ Sn−1 tels que
r
X
ci xi = 0
i=1
r
(10)
X
T
ci xi (xi ) = id.
i=1
34
Démonstration. On va se contenter de faire la démonstration dans le cas où K est un polytope :
il existe x1 , . . . , xm tels que
K = conv{x1 , . . . xm }.
Le problème est plus simple dans ce cas puisque la condition K ⊂ E est équivalente à
xi ∈ E, 1 ≤ i ≤ m.
minimiser − log(det(A))
(P)
sous contraintes kAxi + uk22 ≤ 1, i = 1, . . . , m
qui est un problème d’optimisation convexe. La fonction à optimiser est la fonction convexe
f : (A, u) ∈ Sn × Rn 7→ − log(det(A)).
qui sont convexes. Le problème (P) vérifie la condition de Slater : soit > 0, alors ( id, 0) est dans
l’intérieur du domaine de f et
gi (id, 0) = 2 kxi k22 − 1
sera strictement négatif pour tout i ≤ m si est suffisamment petit. Le problème (P) admet donc
un vecteur KKT, qu’on note λ. Supposons que K soit en position de John. Alors (id, 0) est solution
du problème (P). Par conséquent (id, 0) vérifie les contraintes et les conditions de KKT
λi gi (id, 0) = 0, i = 1, . . . , m
Xm
0 = ∂(f + λi ∇gi )(id, 0).
i=1
Soit I = {i ≤ m; λi > 0}. La première condition KKT devient kxi k22 = 1 pour tout i ∈ I.
Autrement dit xi est un point de contact entre K et le bord de B2n . Si A et B sont des matrices
symétriques le produit scalaire entre A et B s’écrit
X
hA, Bi = Aij Bij = tr(AB).
ij
Ceci montre que f est dérivable en (id, 0) et que son gradient vaut
∇f (id, 0) = (−id, 0)
35
En prenant la trace de la décomposition de l’identité
r
X
ci xi (xi )T = id
i=1
on obtient
r
X
ci = n.
i=1
Démonstration. Quitte à faire une transformation affine on peut supposer que K est en position
de John. On a alors une décomposition de John (10) où les xi sont des points de contact entre
K et la sphère unité et K. Supposons que K est symétrique notons k · kK la norme associée à
K. En utilisant la décomposition de l’identité plusieurs fois, l’inégalité triangulaire pour k · kK et
l’inégalité de Cauchy-Scwhartz on obtient
X r
X r
kxkK =
ci hx, xi ixi
≤ ci |hx, xi i|
i=1 K i=1
r
!1/2 r
!1/2
X X √
≤ ci ci hx, xi i2 = n kxk2
i=1 i=1
n
pour tout x ∈ R . Ceci montre bien que
1
√ B2n ⊂ K.
n
Si K n’est pas symétrique l’argument précédent ne marche pas parce que la norme associée à K
n’est pas symétrique et donc on ne peut pas écrire
ci xi = 0 on a pour tout x ∈ Rn
P
En revanche, comme
r
X r
X
x= ci hx, xi ixi = ci (hx, xi i + kxk2 ) xi .
i=1 i=1
hx, xi i + kxk2 ≥ 0.
36
Donc d’après l’inégalité triangulaire
r
X
kxkK =
ci (hx, xi i + kxk2 ) xi
i=1 K
r
X
≤ ci (hx, xi i + kxk2 )
i=1
r
!
X
= ci kxk2 = n kxk2 .
i=1
Donc
1 n
B ⊂ K,
n 2
ce qu’il fallait démontrer.
On a donc montré que pour tout convexe compact d’intérieur non vide K, on peut trouver une
application affine T telle que
1 n
B ⊂ T K ⊂ B2n .
n 2
On dit que la distance de Banach-Mazur de K à la boule euclidienne est majorée par n. Cette
estimation est optimale : la distance de Banach-Mazur d’un simplexe à la boule
√ Euclidienne est
effectivement n. Si K est symétrique la distance de K à B2n est majorée par n. À nouveau ce
ceci est optimal : il y égalité pour B1n et B∞
n
entre autres.
Exercice 46. Déterminer l’ellipsoïde de John des boules `p .
Exercice 47. Soit K un convexe compact d’intérieur non vide vérifiant la condition de John : K
est inclus dans B2n et il existe des points de contact xi et des réels positifs ci tels que
X X
ci xi (xi )T = id, ci xi = 0,
et soit
E = A−1 (B2n − u)
un ellipsoïde contenant K.
1. Montrer que tr(AT A) ≤ n.
2. En déduire que le volume de E est supérieur ou égal à celui de B2n (sans utiliser le théorème
de John).
37
12 Espaces en dualité et programmation linéaire
Définition 75. On dit que deux espaces vectoriels E et F sont en dualité s’il existe une application
h·, ·i : E × F → R.
vérifiant
– x 7→ hx, yi est linéaire sur E pour tout y ∈ F .
– y 7→ hx, yi est linéaire sur F pour tout x ∈ E.
– si hx, yi = 0 pour tout y alors x = 0.
– si hx, yi = 0 pour tout x alors y = 0.
On parle de forme bilinéaire non dégénérée.
Exemple. Soit E = R(N) l’espace des suites réelles nulles à partir d’un certain rang et F = RN
l’espace des suites réelles. On muni E, F d’une dualité en posant
+∞
X
hx, yi = xi yi , ∀x ∈ E, y ∈ F.
i=1
Définition 76. Soit E, F deux espaces en dualité. Soit σ(E, F ) la plus petite topologie sur E telle
que pour tout y l’application
x 7→ hx, yi
soit continue. Alors E muni de cette topologie est un espace vectoriel topologique localement
convexe. On définit la topologie σ(F, E) sur F de manière analogue.
Une base d’ouverts de la topologie σ(E, F ) est donnée par les ensembles de la forme
m
\
{x ∈ E; hx, yi i < ti }
i=1
avec y1 , . . . , ym ∈ F et t1 , . . . , tm ∈ R.
Exemple. Si E = F = Rn munis du produit scalaire usuel, la topologie obtenue est la topologie
usuelle. Si E est un espace de Banach, F son dual, munis de la dualité naturelle, la topologie
σ(E, F ) est la topologie faible sur E et la topologie σ(F ∗ , E) est la topologie faible (∗) sur E ∗ .
Théorème 77. Soit φ une forme linéaire sur E. Alors φ est continue pour la topologie σ(E, F ) si
et seulement s’il existe y ∈ E tel que
φ(x) = hx, yi.
Démonstration. Si φ est linéaire continue {φ < 1} est un ouvert σ(E, F ) contenant 0. Il existe
donc y1 , . . . , ym ∈ F tels que
m
\
{x; hx, yi i < 1} ⊂ {φ < 1}.
i=1
On pose φi (x) = hx, yi i. On déduit facilement de l’inclusion précédente que ∩m i=1 ker(φi ) ⊂ ker(φ),
ce qui implique φ ∈ vect(φ1 , . . . , φm ). Il existe donc λ1 , . . . , λm ∈ R tels que
m
* m +
X X
φ(x) = λhx, yi i = x, λi yi ,
i=1 i=1
C ∗ = {y ∈ F ; hx, yi ≥ 0, ∀x ∈ C} .
C’est un cône fermé de F appelé cône dual. De même si D est un cône de F , le cône dual de D est
D∗ = {x ∈ E; hx, yi ≥ 0, ∀y ∈ D} .
38
Théorème 79. Soit C ⊂ E. On a C = (C ∗ )∗ si et seulement si C est un cône fermé. Plus
généralement (C ∗ )∗ est l’enveloppe conique fermée de C.
A : E → E1
une application linéaire continue pour les topologies σ(E, F ) et σ(E1 , F1 ). Alors par composition
x ∈ E 7→ hAx, bi ∈ R
hAx, bi = hx, yi
pour tout x ∈ E. On pose y = A∗ b. Il est alors facile de voir que A∗ : F1 → F est linéaire continue.
Soit A : E → E1 linéaire continue, C un cône de E, a un élément de E1 et y ∈ F . On s’intéresse
au problème suivant
minimiser hx, yi
(P) sous contraintes Ax = a
x ∈ C.
On parle de programme linéaire. Encore une fois on appelle valeur du problème l’infimum des hx, yi
parmi les x vérifiant les contraintes. On dit que x est solution si cet infimum est atteint en x. Le
problème dual associé à (P) est par définition
maximiser ha, bi
(P 0 )
sous contraintes −A∗ b + y ∈ C ∗ .
hx, −A∗ b + yi ≥ 0
et donc
ha, bi = hAx, bi = hx, A∗ bi ≤ hx, yi,
ce qu’il fallait démontrer.
Théorème 81. Si l’ensemble des x satisfaisant les contraintes de (P) est non vide et si le cône
est fermé (dans E1 × R muni de la topologie produit) alors α = α0 . Si de plus α > −∞, le problème
(P) admet une solution.
Démonstration. Supposons α > −∞. Soit
I = {t ∈ R; (a, t) ∈ D}.
39
Par définition l’infimum de I est la valeur α du problème. Mais puisque D est fermé I l’est aussi,
donc l’infimum est atteint. Soit > 0, alors
(b, α − ) ∈
/ D.
ha, bi + sα ≥ 0.
ha, b0 i > α − .
hAx, bi + shx, yi ≥ 0, ∀x ∈ C.
On en déduit facilement que −A∗ b0 + y ∈ C ∗ . Donc α0 > α − , ce qui donne le résultat en faisant
tendre vers 0.
Attention, il ne suffit pas que C soit fermé pour pouvoir appliquer le théorème. En effet l’image
d’un cône fermé par une application linéaire continue n’est pas forcément fermée. En revanche
l’image d’un cône engendré par nombre fini de points reste un cône engendré par un nombre fini
de points, donc un ensemble fermé.
On considère le problème de transport optimal. Soient µ et ν deux mesures de probabilité sur
[0, 1] et c : [0, 1]2 → R une fonction continue. On cherche à
Z
minimiser c dπ
[0,1]2
sur les mesures de probabilités π sur [0, 1]2 ayant comme première et deuxième marginales µ et ν
respectivement. L’espace E = M([0, 1]2 ) est l’espace des mesures de Radon (= différences de deux
mesures finies) sur [0, 1]2 qui est en dualité avec F = C([0, 1]2 ). L’application
associe à une mesure π le couple (π1 , π2 ) formé par ses marginales. Le cône C est le cône des
mesures positives sur [0, 1]2 . On voit tout de suite que C ∗ est le cône des fonctions positives sur
[0, 1]2 . Déterminons A∗ . Soit (f, g) ∈ C([0, 1]) × C([0, 1]). Par Fubini on a
Donc A∗ (f, g) est la fonction sur [0, 1]2 qui à (x, y) associe f (x) + g(y). Le problème dual
40
Démonstration. D’après le théorème précédent, il suffit de montrer que le cône
Z
D= π1 , π2 , c dπ , π ∈ C
est fermé. Soit K l’ensemble des mesures de probabilité sur [0, 1]2 . D’après Banach-Alaoglu (et
Riesz) K est compact pour la topologie σ(M, C). De plus on a C = co(K). On pose
Z
T : π 7→ π1 , π2 , c dπ
Alors T est continue, donc T K est compact. De plus si π est une mesure de probabilité sur [0, 1]2
alors π1 est une mesure de probabilité sur [0, 1], en particulier π1 n’est pas nulle. Donc 0 ∈
/ T K.
En utilisant le lemme ci-dessous, on voit que
D = T (co(K)) = co(T K)
est fermé.
Lemme 83. Soit E un espace vectoriel topologique localement convexe. Soit K ⊂ E un convexe
compact ne contenant pas 0. Alors co(K) est fermé.
Démonstration. Exercice (pas facile).
Exercice 48. On considère le problème suivant sur l’espace R(N) des suites réelles nulles à partir
d’un certain rang.
minimiser x
P1 ∞
sous contraintes Pk=1 kxk = 1,
∞
k=2 xk = 0,
xk ≥ 0, ∀k.
Déterminer le problème dual, résoudre les deux problèmes et montrer que les deux problèmes n’ont
pas la même valeur.
Exercice 49. On reprend le problème de transport discret :
P
minimiser c π
Pij ij ij
sous contraintes π = µi , ∀i
Pj ij
i π ij = νi , ∀j
πij ≥ 0, ∀ij.
1. Déterminer le problème dual et montrer qu’il a la même valeur que le problème initial.
2. Montrer que les deux problèmes ont une solution.
41
Annexe 1. Espaces vectoriels topologiques
Définition 84. On dit que E est un espace vectoriel topologique si E est un espace vectoriel muni
d’une topologie vérifiant les propriétés suivantes :
(i) La topologie est séparée : pour tous x 6= y dans E il existe deux ouverts disjoints U et V
contenant respectivement x et y.
(ii) Les opérations d’espace vectoriel :
E×E →E R×E →E
et
(x, y) 7→ x + y (λ, x) 7→ λx
sont continues.
Proposition 85. Soit E un espace topologique et U un ouvert. Alors pour tout x ∈ E et tout
λ 6= 0 l’ensemble x + λU est ouvert.
Démonstration. Comme E est un espace vectoriel topologique, la fonction
f: E →E
y 7→ y−x λ
On pose
m
\ Uxi
U= .
i=1
2
Alors U est un voisinage convexe de 0 (comme intersection finie de voisinages convexe). De plus
m
[ Ux
A+U ⊂ xi + i + U
i=1
2
m
[ Uxi U xi
⊂ xi + +
i=1
2 2
m
[
= (xi + Uxi )
i=1
puisque Uxi est convexe pour tout i. Mais comme chacun des x + Ux est disjoint de B, l’ensemble
A + U aussi.
42
Annexe 2. Lemme de Zorn
Théorème 88 (Lemme de Zorn). Soit (Ω, ≤) un ensemble muni d’une relation d’ordre partiel (les
éléments de Ω ne sont pas nécessairement comparables). Si tout sous-ensemble totalement ordonné
de E admet un majorant (dans E) alors E admet un élément maximal, c’est-à-dire un élément
ω ∈ Ω vérifiant
ω ≤ ω 0 ⇒ ω = ω 0 , ∀ω 0 ∈ Ω.
Ce résultat est équivalent à l’axiome du choix. Donnons un premier exemple d’application.
Théorème 89. Tout espace vectoriel E admet une base algébrique, c’est-à-dire une famille d’élé-
ments de E qui soit à la fois libre et génératrice.
Remarque. Si E est de dimension finie, le résultat se montre facilement par récurrence sur la
dimension de E. De manière générale, le lemme de Zorn permet de faire des récurrences infinies.
Démonstration. Soit E un espace vectoriel et soit Ω l’ensemble des familles libres d’éléments de
E. On muni Ω de l’ordre partiel donné par l’inclusion. Soit A ⊂ Ω un sous-ensemble totalement
ordonné et A = ∪A. Je prétends que A est une famille libre d’éléments de E. En effet soient
x1 , . . . , xm ∈ A. Pour tout i ≤ m il existe Ai ∈ A tel que xi ∈ Ai . Mais comme la famille A est
totalement ordonnée, l’ensemble {A1 , . . . , Am } admet un plus grand élément. Il existe donc j ≤ m
tel que
xi ∈ Ai ⊂ Aj , ∀i ≤ m.
Enfin comme Aj ∈ Ω la famille {x1 , . . . xm } est libre, ce qu’il fallait démontrer. De plus, on a
B ⊂ A pour tout B ∈ A. Par conséquent A est un majorant de A. D’après le lemme de Zorn,
il existe donc une famille libre C, qui soit maximale pour l’inclusion. Alors C est génératrice. En
effet, s’il existait x ∈
/ vect(C) alors la famille C ∪ {x} serait encore libre et strictement plus grande
(pour l’inclusion) que C, contredisant la maximalité de C.
Démonstration du théorème de Hahn-Banach. On considère l’ensemble Ω0 des couples (G, ψ) où
G est un sous-espace vectoriel de E et ψ une forme linéaire sur G dominée par j :
ψ(x) ≤ j(x), ∀x ∈ G.
On muni Ω0 de la relation d’ordre
(G, ψ) ≤ (G0 , ψ 0 ) si G ⊂ G0 et ψ 0 (x) = ψ(x), ∀x ∈ G.
Ensuite on considère l’ensemble
Ω = {(G, ψ) ∈ Ω0 ; (F, φ) ≤ (G, ψ)} ,
qui est non vide puisque (F, φ) ∈ Ω0 . On veut montrer qu’il existe une forme linéaire ψ sur E telle
que (E, ψ) ∈ Ω. Il suffit de montrer que Ω admet un élément maximal. En effet la démonstration
faite en dimension finie montre qu’étant donné (F, ψ) ∈ Ω et x ∈ E\F , on peut prolonger ψ à
F + Rx en restant dominée par j ; autrement dit (F, ψ) n’est pas maximal. D’après le lemme de
Zorn, il suffit de montrer que tout sous-ensemble totalement ordonné de Ω admet un majorant.
Soit A un sous-ensemble totalement ordonné de Ω. On pose
G = {G; ∃ψ, (G, ψ) ∈ A} .
Comme A est totalement ordonnée pour l’ordre ≤, la famille G est totalement ordonnée pour
l’inclusion. Posons G = ∪G. Alors G est un sous-espace vectoriel de E. En effet soient x1 , x2 ∈ G.
Il existe G1 , G2 ∈ G tels que x1 ∈ G1 et x2 ∈ G2 . Mais comme la famille G est totalement ordonnée,
on a par exemple G1 ⊂ G2 . Alors toute combinaison linéaire de x1 , x2 appartient à G2 , donc à G.
Soit x ∈ G. Il existe (G1 , ψ1 ) ∈ A tel que x ∈ G1 . On pose alors
ψ(x) = ψ1 (x).
Ceci ne dépend pas du choix de (G1 , ψ1 ). En effet, soit (G2 , ψ2 ) ∈ A tel que x ∈ G2 . Comme A est
totalement ordonné on a soit (G1 , ψ1 ) ≤ (G2 , ψ2 ) soit l’inverse. Dans les deux cas ψ1 (x) = ψ2 (x).
On montre ensuite facilement que ψ est linéaire dominée par j et que (G1 , ψ) ≤ (G, ψ) pour tout
(G1 , ψ1 ) ∈ A.
43
On va maintenant montrer que n’importe quel convexe compact d’un espace vectoriel topolo-
gique localement convexe admet un point extrémal. Remarquons d’abord que le lemme de Zorn
peut se reformuler de la manière suivante : Soit Ω un ensemble ordonné non vide tel que tout
sous-ensemble totalement ordonné admette un minorant, alors Ω admet un élément minimal.
Démonstration de la Proposition 63. Soit E espace vectoriel topologique localement convexe. Soit
K un sous-ensemble convexe compact de E. Considérons l’ensemble Ω des faces fermées non vides
de K, muni de la relation d’inclusion. La démonstration faite en dimension finie montre le fait
suivant : si K est un convexe compact contenant au moins deux points alors il admet une face
fermée stricte, c’est-à-dire une face fermée F telle que F 6= K. Ceci implique que si F est une face
de K contenant au moins deux points alors F n’est pas minimale dans Ω. Il suffit donc de montrer
que Ω admet un élément minimal. L’ensemble Ω est non-vide puisque K lui-même appartient à Ω.
Soit F une famille totalement ordonnée de faces fermées non vides de K. Soit G un sous-ensemble
fini de F. Comme F est totalement ordonnée G admet un minimum G et donc
\
G = G 6= ∅.
Donc toute intersection finie d’éléments de F est non vide. Comme F est une famille de sous-
ensembles fermés de K qui est compact, on en déduit que
\
F = F
est non vide. Enfin il est facile de voir qu’une intersection non-vide de face est une face. Donc
F ∈ Ω est un minorant de F, ce qui termine la preuve.
44
Annexe 3. Dualité. Topologies faible et faible ∗
Définition 90. Soit E un espace vectoriel toplogique. On appelle espace dual de E, l’espace E ∗
des formes linéaires continues sur E.
Remarque. En dimension finie les formes linéaires sont toujours continues mais ce n’est pas forcé-
ment le cas si E est de dimension infinie.
Définition 91. Si E est un espace vectoriel normé, on définit une norme sur E ∗ en posant
De plus E ∗ muni de cette norme est un espace de Banach (même si E lui-même n’était pas complet).
Proposition 92. Soit E un espace vectoriel normé et soit x ∈ E, l’application
i(x) : E ∗ →R
φ 7→ φ(x)
est une forme linéaire continue sur E ∗∗ . De plus x 7→ i(x) est linéaire et on a
ki(x)k∗∗ = kxk.
L’espace c0 (N) est un Banach. En effet c’est un sous-espace fermé de l’espace `∞ (N). Rappelons
que `1 (N) est l’espace des suites sommables muni de la norme
X
kvk1 = |v(k)|.
k∈N
Soit v ∈ `1 (N ), l’application X
j(v) : u ∈ c0 (N) 7→ u(k)v(k)
k∈N
45
est linéaire continue. On montre facilement que
Par conséquent `1 (N) s’injecte isométriquement dans c0 (N)∗ . Montrons que cette injection est
surjective, autrement dit que tout élément de c0 (N) est de la forme j(v). Soit φ ∈ c0 (N)∗ . Pour
tout entier n, on définit
1 si k = n
en (k) =
0 sinon.
On définit ensuite v(k) = φ(ek ). On montre facilement que v ∈ `1 (N) et que j(v) = φ. L’application
j définit donc une isométrie entre `1 (N) et c0 (N). Avec un léger abus de langage on dit que `1 (N)
est le dual de c0 (N). De manière analogue, le dual de `1 (N) s’identifie à l’espace `∞ (N) et l’injection
canonique de c0 (N) dans son bidual s’identifie à l’injection de c0 (N) dans `∞ (N). Donc c0 (N) n’est
pas réflexif.
Définition 94. Soit E un espace de Banach, on appelle topologie faible sur E, la plus petite
topologie rendant les éléments de E ∗ continus. De manière équivalente, un ensemble est ouvert
pour la topologie faible s’il peut s’écrire comme une union (quelconque) d’ensemble de la forme
m
\
(φi )−1 (Ui ),
i=1
un voisinage de x. En utilisant le fait que φi (xn ) → φ(x) pour tout i ≤ m on obtient xn ∈ U pour
n assez grand, ce qu’il fallait démontrer.
Lemme 96. En dimension finie, topologie forte et topologie faible coïncident.
Démonstration. Les ouverts faibles sont toujours des ouverts forts. Pour la réciproque il suffit de
remarquer que si U est un ouvert de Rn contenant un point x = (x1 , . . . , xn ) alors pour > 0
suffisamment petit
m
\
{xi − < yi < xi + }
i=1
46
Remarque. On peut aussi montrer que dès que E est de dimension infinie, la norme n’est pas
continue (pour la topologie faible). Ceci fournit un exemple de fonction convexe sur un espace
topologique qui soit finie partout sans être continue.
Définition 98. Soit E un Banach et E ∗ sont dual. On appelle topologie faible ∗ sur E ∗ la plus
petite topologie telle que topologie telle que pour tout x ∈ E, l’application
φ ∈ E ∗ 7→ φ(x)
soit continue.
On a les propriétés suivantes :
– E ∗ muni de la topologie faible ∗ est un espace vectoriel topologique localement convexe.
– Une suite φn converge vers φ pour la topologie faible ∗ si et seulement si φn (x) → φ(x) pour
tout x ∈ E.
– La norme de E ∗ est s.c.i. pour la topologie faible sur E ∗ .
Ces propriétés se démontrent de la même manière que pour la topologie faible.
Remarquons que l’injection de E dans son bidual E ∗∗ montre que la topologie faible ∗ sur E ∗
est une topologie moins fine (avec moins d’ouverts) que la topologie faible sur E ∗ . Si l’espace E
est réflexif, alors les deux topologies coïncident.
Exemple. Reprenons l’exemple de c0 (N). On considère la suite (en ) d’éléments de `1 (N) définie
plus haut (tous les termes de en sont nuls sauf le n-ième qui vaut 1). Pour tout u ∈ c0 (N)
(ju)(en ) = un → 0.
Ceci montre que (en ) tend vers 0 (la suite nulle) pour la topologie faible ∗ de `1 (N). D’un autre
côté, soit φ l’application linéaire définie sur `1 (N) par
X
φ : v 7→ v(k).
k∈N
Alors φ(en ) = 1 pour tout n ∈ N. Ceci montre que (en ) ne tend pas vers 0 pour la topologie faible.
Ceci montre même que la suite (en ) ne converge pas. En effet, comme la convergence faible entraine
la convergence faible ∗, elle ne pourrait converger que vers 0.
Théorème 99 (Théorème de Banach-Alaoglu). Soit E un espace de Banach, la boule unité de E ∗
est compacte pour la topologie faible ∗.
Remarque. Dans ce théorème, compact s’entend au sens Borel-Lebesgue : de tout recouvrement
par des ouverts on peut extraire un sous-recouvrement fini. Dans les espaces métriques cette notion
de compacité est équivalente à la propriété de Bolzano-Weierstrass (toute suite admet une valeur
d’adhérence), mais ce n’est pas vrai pour tous les espaces topologiques.
Rappelons qu’on dit qu’un Banach E est séparable s’il existe un sous-ensemble dénombrable
dense dans E.
Lemme 100. Soit E un Banach, si E ∗ est séparable la topologie faible sur E est métrisable : il
existe une distance d sur E telle que la topologie associée à d coïncide avec la topologie faible sur
E. De manière analogue, si E est séparable, la topologie faible ∗ sur E ∗ est métrisable.
Démonstration (idée). Soit (φn )n≥1 une suite dense dans E. Pour x, y ∈ E on pose
∞
X min{|φn (x − y)|, 1}
d(x, y) = .
n=1
2n
On montre alors que d est une distance et qui métrise la topologie faible sur E.
Démonstration de Banach-Alaoglu dans le cas séparable. On suppose que l’espace E est séparable.
La topologie faible ∗ de E ∗ est alors métrisable. Il s’agit de montrer que de toute suite bornée (φn )
de E ∗ on peut extraire une sous-suite convergente pour la topologie faible ∗. Soit (xi )i≥1 une suite
47
dénombrable dense dans E. Pour tout i la suite (φn (xi ))n≥1 est une suite bornée de R. Quitte à
extraire diagonalement on peut supposer que pour tout i ≥ 1 la suite (φn (xi ))n converge vers un
nombre ai ∈ R. Posons
E0 = vect{xi , i ≥ 1}.
On définit une fonction φ sur E0 en posant
X X
φ λ i xi = λi ai
pour toute combinaison linéaire des xi . On montre facilement que φ est bien définie, linéaire et
vérifie
φn (x) → φ(x), ∀x ∈ E0 .
Comme la suite (φn ) est bornée dans E ∗ , il existe une constante C telle que
pour tout x ∈ E0 . Autrement dit φ est continue sur E0 . Comme E0 est dense dans E, la fonction
φ s’étend de manière unique en une forme linéaire continue ψ sur E (exercice). Il reste à montrer
que
φn (x) → ψ(x), ∀x ∈ E.
On sait déjà que ceci est vrai pour x ∈ E0 , on l’obtient pour tout x ∈ E en utilisant la densité de
E0 dans E.
Exemple. Reprenons l’exemple précédent. Remarquons d’abord que c0 (N) est séparable puisque
les suites à coefficients rationnels nulles à partir d’un certain rang sont denses dans c0 (N). La suite
(en ) est une suite d’éléments de la boule unité de `1 (N). On a vu qu’elle tendait vers 0 pour la
topologie faible ∗, mais qu’elle ne convergeait pas pour la topologie faible. On voit même qu’aucune
sous-suite de (en ) ne converge pour la topologie faible. Ceci montre que pour la topologie faible sur
`1 (N), la boule unité de `1 (N) ne possède pas la propriété de Bolzano-Weierstrass. Ceci ne permet
pas a priori de conclure que la boule unité de `1 (N) n’est pas compacte : l’espace `∞ (N) n’étant
pas séparable, on ne peut pas affirmer que la topologie faible sur `1 (N) est métrisable. Néanmoins,
on a le résultat suivant.
Théorème 101. Soit E un espace de Banach, la boule unité de E est compacte pour la topologie
faible si et seulement si E est réflexif.
Démonstration (idée). Si E est réflexif, alors (modulo l’injection i) la topologie faible sur E est
égale à la topologie faible ∗ sur E vu comme dual de E ∗ . Donc la boule unité de E est compacte
d’après Banach-Alaoglu.
Pour la réciproque on commence par montrer que (toujours modulo l’injection i) la boule unité de
E est toujours dense dans la boule de E ∗∗ pour la topologie faible ∗ sur E ∗∗ (voir ci-dessous). Si
de plus elle est compacte pour la topologie faible sur E alors elle est compacte (donc fermée) pour
la topologie faible ∗ sur E ∗∗ . Donc BE = BE ∗∗ .
Exercice 50. Soit E un espace de Banach et soit y une forme linéaire sur E ∗ . On veut montrer
que y est continue pour la topologie faible ∗ si et seulement s’il existe x ∈ E tel que
y(φ) = φ(x), ∀φ ∈ E ∗ .
où x⊥ désigne l’ensemble des φ ∈ E ∗ nulles en x, qu’on peut aussi voir comme le noyau de x
vu comme élément de E ∗∗ .
48
3. Conclure en utilisant l’exercice 19.
49