Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

ANALYSE FONCTIONNELLE

2010, ANALYSE FONCTIONNELLE

Notes de cours ANALYSE FONCTIONNELLE Guillaume CARLIER ENS, 2009-2010 2 3 Table des matières 1 Espaces vectoriels topologiques localement convexes 1.1 Définitions et propriétés premières . . . . . . . . . . . . 1.2 Bornitude, continuité, suites . . . . . . . . . . . . . . . 1.3 Applications linéaires continues . . . . . . . . . . . . . 1.4 Limites inductives et topologie de D(Ω) . . . . . . . . . 1.5 Théorèmes de Hahn-Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 6 15 17 23 30 2 Introduction à la théorie des distributions 2.1 Quelques résultats préliminaires . . . . . . . . . . . 2.2 Définitions et propriétés premières des distributions 2.3 Convolution et régularisation . . . . . . . . . . . . . 2.4 Transformation de Fourier . . . . . . . . . . . . . . 2.5 Solution fondamentale du Laplacien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 39 45 51 57 64 . . . . . 67 67 71 72 76 78 4 Opérateurs linéaires, opérateurs compacts 4.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Conséquences de la théorie de Baire . . . . . . . . . . . . . . . 4.3 Opérateurs compacts, alternative de Fredholm . . . . . . . . . 4.4 Décomposition spectrale des opérateurs compacts autoadjoints 81 81 82 84 89 3 Espaces de Banach et topologies faibles 3.1 Topologie faible . . . . . . . . . . . . . . 3.2 Topologie faible-∗ . . . . . . . . . . . . . 3.3 Espaces réflexifs . . . . . . . . . . . . . . 3.4 Espaces séparables . . . . . . . . . . . . 3.5 Espaces uniformément convexes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 Espaces Lp 91 5.1 Rappels d’intégration . . . . . . . . . . . . . . . . . . . . . . . 91 5.2 Propriétés élémentaires des espaces Lp . . . . . . . . . . . . . 93 5.3 Dualité, réflexivité, séparabilité . . . . . . . . . . . . . . . . . 97 4 5.4 5.5 Compacité dans Lp . . . . . . . . . . . . . . . . . . . . . . . . 105 Compacité faible dans L1 . . . . . . . . . . . . . . . . . . . . . 107 6 Espaces de mesures 6.1 Rappels sur les espaces de fonctions continues . . . . . . . . 6.2 Théorème de Riesz et mesures de Radon dans le cas compact 6.3 Mesures de Radon dans le cas localement compact . . . . . . 6.4 Théorème de Radon-Nikodym, désintégration des mesures . 6.5 Dualité convexe et transport optimal . . . . . . . . . . . . . . . . . . 110 110 112 121 128 132 7 Espaces de Sobolev et EDP’s elliptiques linéaires 141 7.1 Cas de la dimension 1 . . . . . . . . . . . . . . . . . . . . . . 141 7.2 Définitions et propriétés premières en dimension quelconque . 148 7.3 Injections de Sobolev . . . . . . . . . . . . . . . . . . . . . . . 154 7.4 Espace W01,p et traces de fonctions W 1,p . . . . . . . . . . . . . 160 7.5 Formulation variationnelle de quelques pro- blèmes aux limites 163 7.6 Principe du maximum et régularité elliptique . . . . . . . . . . 167 8 Calcul des variations et EDP’s elliptiques non-linéaires 174 8.1 Méthode directe du calcul des variations . . . . . . . . . . . . 175 8.2 Théorèmes de point-fixe et applications . . . . . . . . . . . . . 178 5 Chapitre 1 Espaces vectoriels topologiques localement convexes 1.1 Définitions et propriétés premières Dans tout ce qui suit, E désignera un espace vectoriel sur R, les définitions et résultats qui suivent s’étendent au cas complexe (une fois correctement étendues les notions de convexité et de symétrie). Définition 1.1 On appelle espace vectoriel topologique (evt) tout ev E muni d’une topologie rendant continues les applications (x, y) ∈ E × E 7→ x + y, et (λ, x) ∈ R × E 7→ λx. Si E est un evt, alors les translations τy (τx (y) := x + y) sont des homéomorphismes de E, et donc si V est un système fondamental de voisinages de 0, {τx (V ) = x+V, V ∈ V} est un système fondamental de voisinages de x. De même, si λ ∈ R∗ , l’homothétie y 7→ λy est un homéomorphisme de E. Si U est un voisinage de 0 et x ∈ E alors pour λ ∈ R suffisamment petit en valeur absolue λx ∈ U , on dit alors que les voisinages de 0 sont absorbants. On notera également qu’une application linéaire entre evt est continue si et seulement si elle l’est en 0. Enfin, on rappelle qu’un espace topologique est séparé dès que tout couple de points distincts possède des voisinages disjoints (ce qui est toujours le cas dans les espaces métriques). Exercice 1.1 (Histoire de manipuler la définition) Montrer que si E est un evt, 0 possède un système fondamental de voisinages équilibrés (V est équilibré si λV ⊂ V pour λ ∈ [−1, 1]). L’evt E est séparé si et seulement si {0} est fermé. 6 Exercice 1.2 Montrer qu’un evt séparé localement compact (i.e. tel que chaque point admet un voisinage compact) est nécessairement de dimension finie. Exercice 1.3 (Histoire de régler une bonne fois pour toutes le cas de la dimension finie) Soit E un evt séparé de dimension finie, montrer que sa topologie coı̈ncide avec celle définie par une norme. Evidemment, la topologie induite par une norme sur E fait de E un evt mais dans les applications la structure d’espace vectoriel normé s’avère parfois trop rigide et inadaptée (car, par exemple, la boule unité n’est jamais relativement compacte dans un espace vectoriel de dimension infinie...). Inversement, la notion d’evt seule est souvent trop générale pour les analystes et en pratique, les espaces fonctionnels que nous rencontrerons auront en fait davantage de structure. Avant d’aller plus loin, considérons le cas (important et pas si particulier que cela comme nous le verrons au Théorème 1.1) d’une topologie engendrée par une famille de semi-normes. Définition 1.2 Soit E un R-ev, on appelle semi-norme sur E toute application p : E → R+ , vérifiant : p(x + y) ≤ p(x) + p(y), ∀(x, y) ∈ E × E, p(λx) = |λ|p(x), ∀(x, λ) ∈ E × R. Soit P une famille de semi-normes sur E, on dit que P sépare les points (ou est séparante) de E si p(x) = 0, ∀p ∈ P ⇒ x = 0. Soit P = {pi , i ∈ I}, une famille de semi-normes sur E, x ∈ E, r > 0 et J ⊂ I, finie, on définit la P-boule ouverte de centre x, BJ (x, r) par \ BJ (x, r) = Bpj (x, r) = {y ∈ E : pj (x − y) < r, ∀j ∈ J}. j∈J Notons que BJ (x, r) = x + BJ (0, r) et que par définition même les P-boules BJ (x, r) sont des ensembles convexes de E (on rappelle qu’un sous ensemble C de E est convexe si tx + (1 − t)y ∈ C pour tout (t, x, y) ∈ [0, 1] × C × C). La topologie associée à une famille de semi-normes est définie comme suit : 7 Définition 1.3 Soit E un R-ev et P = {pi , i ∈ I}, une famille de seminormes sur E, les ouverts de la topologie associée à P sont les parties U de E telles que pour tout x ∈ U , il existe r > 0 et J ⊂ I fini tels que BJ (x, r) ⊂ U . Autrement dit, la topologie associée à P est celle dont les P-boules ouvertes centrées en x forment un système fondamental de voisinages de x. Il est aisé de voir que E muni de cette topologie est un evt et qu’il est séparé si et seulement si la famille P est séparante. Notons que si P et P ′ sont deux familles de semi-normes sur E vérifiant P ⊂ P ′ alors la topologie associée à P ′ est plus fine que celle associée à P. Par ailleurs, chaque point de E possède pour cette topologie un système fondamental de voisinages formé d’ensembles convexes. La topologie associée à une famille de semi-normes est donc localement convexe au sens de la définition suivante : Définition 1.4 Un R-espace vectoriel topologique localement convexe (evtlc) est un evt dont chaque point possède un système fondamental de voisinages formé d’ensembles convexes. On peut évidemment dans la définition précédente remplacer ”chaque point” par ”un point”. Notez aussi que l’evt E est un evtlc ssi 0 possède une système fondamental de voisinages convexes et symétriques (un sous ensemble C de E est dit symétrique si C = −C). En remarquant que dans un evtlc, l’intérieur d’un convexe d’intérieur non vide est encore convexe (exercice facile), on notera qu’on peut aussi rajouter ”ouverts” dans la définition qui précède. Lemme 1.1 Soit E un evtlc de topologie T définie par la famille de seminormes P et soit q une semi-norme sur E alors q est continue (pour T ) si et seulement s’il existe C ≥ 0, k ∈ N∗ et p1 , . . . , pk dans P telles que q ≤ C sup pi . i=1,...,k Preuve: Si q est continue, il existe un voisinage de 0 sur lequel q ≤ 1, il existe donc aussi une P-boule sur laquelle q ≤ 1, l’inégalité cherchée s’obtient alors facilement par homogénéité. Réciproquement, supposons qu’il existe C ≥ 0, k ∈ N∗ et p1 , . . . , pk dans P telles que q ≤ C sup pi . i=1,...,k 8 Soit x ∈ E et ε > 0, alors on a |q(x) − q(y)| ≤ q(x − y) ≤ ε pour tout y dans la P-boule {y ∈ E, pi (x − y) < (1 + C)−1 ε, i = 1, . . . , k} ce qui montre la continuité de q. ✷ Remarque. Une combinaison linéaire à coefficients posititifs de semi-normes est encore une semi-norme de même qu’un supremum d’un nombre fini de semi-normes, si p est une semi-norme sur E et T un application linéaire de F vers E alors p ◦ T est une semi-norme sur F . Si P est une famille de seminormes sur E, la topologie qu’elle définit est la même que celle définie par la famille (dite filtrante) P ′ formée par les suprema de familles finies d’éléments de P. Exemples Passons maintenant en revue quelques exemples de familles de seminormes naturellement associées à quelques espaces fonctionnels usuels. Dans ce qui suit Ω désigne un ouvert de Rd et K un compact d’intérieur non vide inclus dans Ω, une suite exhaustive de compacts Kj de Ω est une suite de compacts inclus dans Ω tels que Kj ⊂ int(Kj+1 ) et Ω = ∪j Kj (par exemple Kj := {x ∈ Rd : |x| ≤ j, d(x, Rd \ Ω) ≥ 1/j}). Un multi indices α est unPélément (α1 , ..., αd ) de Nd , sa longueur notée |α| est par définition |α| = di=1 αi . Pour α = (α1 , ..., αd ) et β = (β1 , ..., βd ) deux multi-indices, on notera – α ≤ β si αi ≤ βi , pour i = 1, ..., d, – α ± β = (α1 ± β1 , . . . , αd ± βd ), – α! = α1 ! . . . αd !, et pour β ≤ α Cαβ = α! , β!(α − β)! – si x ∈ Rd , xα = xα1 1 . . . xαd d , – si f ∈ C ∞ (Rd )(= C ∞ (Rd , R) ou C ∞ (Rd , C)), et α 6= (0, . . . , 0), ∂αf = ∂ |α| f , ∂ α1 x 1 . . . ∂ αd x d et ∂ α f = f si α = (0, . . . , 0). On rappelle aussi, à toutes fins utiles, la formule de Leibniz : si f, g ∈ C ∞ (Rd )2 : X ∂ α (f g) = Cαβ ∂ α−β f ∂ β g. (1.1) β≤α 9 Si f ∈ C(Ω)(= C(Ω, R) ou C(Ω, C)), on appelle support de f et l’on note supp(f ) le complémentaire du plus grand ouvert sur lequel f est nulle, qui est aussi l’adhérence de {x ∈ Ω : f (x) 6= 0}. – Si K est un compact de Rd , on note C(K) l’espace des fonctions continues de K à valeurs dans R ou C, on le munit classiquement de la norme uniforme kf k := sup kf (x)k x∈K (qui en fait un Banach). On peut également munir C(K) de la famille de semi-normes px (f ) := |f (x)| avec x ∈ K. – Si Ω est un ouvert de Rd , m ∈ N et K un compact de Ω pour f ∈ C ∞ (Ω), posons pm,K (f ) := sup α∈Nd sup |Dα f (x)|. :|α|≤m x∈K L’espace C(Ω)(= C(Ω, R) ou C(Ω, C)) des fonctions continues sur Ω est muni de la famille de semi normes pK = p0,K avec K compact de Ω (ou simplement la famille p0,Kj avec une suite exhaustive de compacts Kj de Ω). CK (Ω) désigne l’espace des fonctions continues sur Ω à support dans K (i.e. nulles en dehors de K) et Cc (Ω) désigne l’espace des fonctions continues sur Ω à support compact i.e. : Cc (Ω) = ∪j CKj (Ω) Pour m ∈ N ∪ {+∞}, on définit de même l’espace C m (Ω) des fonctions de classe C m sur Ω, on le munit de la famille pm,Kj . On définit de m (Ω) même les espaces de fonctions de classe C m à support compact, CK et Ccm (Ω). – On note de même DK (Ω) l’espace des fonctions C ∞ à support dans K et D(Ω) := Cc∞ (Ω) l’espace des fonctions C ∞ à support compact. La topologie de DK (Ω) est définie par la famille de semi normes {pm,K , m ∈ N} (nous verrons plus loin que DK (Ω) est métrisable et complet pour cette topologie). Une ”bonne” topologie sur D(Ω) (de même que sur Cc (Ω) ou Ccm (Ω)) est plus subtile à définir (voir le paragraphe 1.4). – Soit p ∈ [1, ∞), Lploc (Ω) est l’espace des fonctions fonctions mesurables f telles que pour tout compact K de Ω 1/p Z p |f | qK,p (f ) := < ∞. K On munit Lploc (Ω) de la famille de semi-normes qK,p où K parcourt l’ensemble des compacts de Ω (une suite exhaustive suffit évidemment). 10 – Considérons l’espace de Schwartz S des fonctions régulières à décroissance rapide S = {f ∈ C ∞ (Rd ) : sup (1 + |x|k )|∂ β f (x)| < ∞, ∀k ∈ N, ∀β ∈ Nd } x∈Rd on le munit naturellement de la famille de semi-normes f 7→ sup β∈Nd , sup (1 + |x|k )|∂ β f (x)|. |β|≤m x∈Rd 2 Un exemple typique de fonction de S est la gaussienne f (x) = e−|x| /2 . – Si E est un evn et E ′ son dual topologique, la famille de semi-normes pf (x) := |f (x)|, f ∈ E ′ , x ∈ E définit la topologie faible σ(E, E ′ ) sur E, cette famille est séparante en vertu du théorème de Hahn-Banach que nous verrons plus loin. De même la famille de semi-normes qx (f ) := |f (x)|, f ∈ E ′ , x ∈ E définit la topologie faible ∗ σ(E ′ , E) sur E ′ , elle est séparante par définition même. Un autre exemple de semi-normes nous est fourni par la jauge d’un ouvert convexe symétrique. Soit E un evt et C un ouvert convexe contenant 0, la jauge de C est alors définie par : jC (x) := inf{t > 0 : x ∈ C}, ∀x ∈ E. t Pour tout x on a jC (x) ∈ R, par ailleurs il est évident que jC (λx) = λx pour tout λ > 0 et x ∈ E. De plus, jC vérifie l’inégalité triangulaire, en effet soit x et y dans E, pour ε > 0, (jC (x) + ε)−1 x et (jC (y) + ε)−1 )y sont dans C, en remarquant que x jC (x) + ε x+y = jC (x) + jC (y) + 2ε jC (x) + jC (y) + 2ε jC (x) + ε jC (y) + ε y + jC (x) + jC (y) + 2ε jC (y) + ε comme ε > 0 est arbitraire on déduit de la convexité de C : jC (x + y) ≤ jC (x) + jC (y). 11 (1.2) Si x ∈ C alors comme C est ouvert (1 + ε)x ∈ C pour ε > 0 assez petit et donc jC (x) < 1. Si réciproquement jC (x) < 1 alors il est évident que x ∈ C, si bien que l’on a C = {x ∈ E : jC (x) < 1}. (1.3) Enfin, si C est de plus supposée symétrique, alors sa jauge est clairement paire et donc c’est une semi-norme (dont la boule unité ouverte est précisément C). Exercice 1.4 Soit E un evt et C un sous ensemble convexe de E montrer que l’adhérence de C est convexe. Théorème 1.1 Soit E un evtlc alors il existe une famille de semi-normes P sur E qui induit la topologie de E. En outre, la topologie de E est séparée si et seulement si la famille P sépare les points de E. Preuve: Nous avons déja vu que la topologie associée à une famille de semi-normes munit E d’une structure d’evtlc. Réciproquement, soit E un evtlc et notons T sa topologie. Posons C := {C ∈ T : C convexe, 0 ∈ C, C = −C} on sait que C est un système fondamental de voisinages de 0 et que x + C est un système fondamental de voisinages de x, pour tout x ∈ E. On pose maintenant P := {jC , C ∈ C}. Nous avons vu que P est une famille de semi-normes sur E et nous allons montrer que T coı̈ncide avec la topologie associée à P. Soit U ∈ T et x ∈ U , il existe C ∈ C tel que x+C ⊂ U ce qui est équivalent à BjC (x, 1) ⊂ U ainsi U est un ouvert pour la topologie associée à P. Soit maintenant U ouvert dans la topologie associée à P, pour tout x dans U il existe donc k ∈ N∗ , C1 , ..., Ck dans C et r > 0 tel que ∩ki=1 BjCi (x, r) ⊂ U ce qui est encore équivalent à x + C ⊂ U avec C = r ∩ki=1 Ci et puisque C ∈ C, on en déduit que U ∈ T . La seconde assertion du théorème a déja été vue. ✷ On retiendra donc que la topologie d’un evtlc (respectivement d’evtlcs) est déterminée par une famille de semi-normes (respectivement une famille de semi-normes séparante). Une question naturelle à ce stade est de savoir si 12 l’on peut métriser une topologie d’evtlcs (le caractère séparé est évidemment nécessaire). En effet, dans le cadre métrique, les objets topologiques de base (ensembles compacts, continuité, ensembles fermés, adhérence....) peuvent être caractérisés en termes séquentiels et sont ainsi bien plus aisés à manipuler que dans le cadre des espaces topologiques généraux. Théorème 1.2 Soit E un evtlcs dont la topologie est associée à la famille dénombrable (et séparante) de semi-normes P = {pn }n∈N . Alors la distance ∞ X 1 (pn (x − y) ∧ 1) d(x, y) := 2n n=0 est invariante par translation (i.e. d(x+z, y+z) = d(x, y) pour tout (x, y, z) ∈ E 3 ) et métrise la topologie de E. Preuve: Le fait que d est une distance est facile à voir, de même que l’invariance par translation. Montrons que la topologie induite par d coı̈ncide avec celle induite par P. Soit x ∈ E, J un sous ensemble fini de N et r > 0, montrons qu’il existe ε > 0 tel que la P-boule ouverte BJ (x, r) contienne la boule ouverte pour d, Bd (x, ε) : posons ε = 2−K−1 (r ∧ 1) avec K = max J si bien que Bd (x, ε) ⊂ BJ (x, r). Montrons maintenant que Bd (x, r) une PPcontient −n boule ouverte de centre x : on choisit d’abord N tel que n≥N 2 ≤ r/2, on pose J = {0, ..., N } de sorte que BJ (x, r/4) ⊂ Bd (x, r). ✷ A titre d’exercice, on montrera que la topologie d’evtlcs associée à une famille (séparante) de semi-normes P sur E est métrisable si et seulement si l’une des propriétés équivalentes suivantes est satisfaite : – 0 possède un système fondamental de voisinages dénombrable, – il existe une famille dénombrable de semi-normes induisant la topologie de E. L’importance de la compétude dans les espaces métriques (théorème du point fixe de Banach, théorie de Baire...) justifie la définition suivante : Définition 1.5 On appelle espace de Fréchet tout evtlcs métrisable par une distance invariante par translation (ce qui revient à dire que sa topologie peut être définie par une famille dénombrable et séparante de semi-normes) et complet. Soit P = {pn }n∈N une suite de semi-normes (séparante) définissant la topologie de E, on remarque que dire que la suite (xk )k converge vers x (la limite x étant unique car E est séparé) revient à l’une des assertions équivalentes suivantes 13 1. pour tout voisinage U de 0, il existe K tel que xk − x ∈ U pour tout k ≥ K (c’est la définition dans un evt général) 2. pour tout n, pn (xk − x) → 0 quand k → ∞, 3. d(xk , x) → 0 quand k → ∞ avec d distance invariante par translation métrisant la topologie de E. Notons aussi que (xk )k est de Cauchy dans l’espace métrique (E, d) (avec d invariante par translation métrisant la topologie de E définie par P) est équivalent aux assertions équivalentes suivantes 1. pour tout voisinage U de 0, il existe K tel que xk − xl ∈ U pour tout k, l ≥ K (c’est la définition dans un evt général), 2. pour tout n, et tout ε > 0 il existe K tel que pn (xk − xl ) ≤ ε pour tout k, l ≥ K, 3. supk,l≥K d(xk , xl ) → 0 quand K → ∞. Exemples Voici quelques exemples à retenir (la complétude est dans chaque cas aisée à obtenir et donc laissée en exercice au lecteur) : – C(Ω) muni de la famille {p0,Kj }j (convergence uniforme sur tout compact) est un espace de Fréchet, il en est de même pour C m (Ω) pour la famille {pm,Kj }j et de E(Ω) := C ∞ (Ω) pour la famille {pm,Kj }m,j . – Lploc est un espace de Fréchet pour la famille de semi-normes f 7→ kf kLp (Kj ) , – DK (Ω) est un espace de Fréchet pour la famille de semi-normes {pm,K }m . – L’espace de Schwartz S est de Fréchet pour la famille de semi-normes f 7→ sup β∈Nd , sup (1 + |x|k )|∂ β f (x)|. |β|≤m x∈Rd Exercice 1.5 Montrer que L1loc (Ω) et DK (Ω), munis de leurs topologies usuelles ne sont pas normables. Exercice 1.6 Soit (En , pn ) une suite décroissantes d’espaces de Banach avec injections (de En+1 dans En évidemment) continues, montrer que E = ∩n En muni de la famille de semi-normes {pn }n est un espace de Fréchet. 14 1.2 Bornitude, continuité, suites Il s’agit dans ce paragraphe de définir quelques notions topologiques de base dans les evt (en fait rappeler puisque ces notions sont déja bien connues dans le cadre des espaces topologiques quelconques) mais aussi d’introduire leur pendant séquentiel. Il est bien connu que dans les espaces métriques, on peut développer la topologie indifféremment soit à partir de la topologie associée à la distance, soit à partir de la notion de convergence de suites. Autrement dit, dans les espaces métriques, les deux points de vue sont équivalents. Cela n’est malheureusement pas le cas dans les espaces topologiques généraux (et en particulier ni dans les evt, ni dans les evtlcs) et pourtant, il est souvent bien utile de manier des notions séquentielles. Nous allons définir ici certaines de ces notions séquentielles en avertissant d’emblée le lecteur qu’en dehors du cas métrisable, il ne faudra pas les confondre avec les notions topologiques. Définition 1.6 Soit E un evt, (xn )n une suite à valeurs dans E et x ∈ E. On dit que (xn ) converge vers x (ou encore que x est limite de la suite (xn )n , ce que l’on notera simplement xn → x) si et seulement si pour tout voisinage U de 0, il existe N tel que (xn − x) ∈ U pour tout n ≥ N . Evidemment, la définition précédente n’a véritablement d’intérêt que dans le cas où E est séparé ce qui assure que si (xn )n converge, sa limite est uniquement déterminée. Dans le cas d’un evtlc de topologie associée à la famille de semi-normes P, la définition précédente se traduit simplement par : ∀p ∈ P, p(xn − x) → 0 quand n → +∞. Par définition, un fermé de E est une partie dont le complémentaire est ouvert. Une partie A de E est dite séquentiellement fermée si pour toute suite à valeurs dans A et convergeant dans E vers une limite x on a x ∈ A. On dira qu’une partie de E est séquentiellement ouverte si son complémentaire est séquentiellement fermé. Il est évident qu’une partie fermée (ouverte) est séquentiellement fermée (ouverte) mais l’inverse n’est en général pas vrai. L’adhérence d’une partie est le plus petit fermé contenant cette partie (ou encore l’intersection des fermés contenant cette partie) et une partie de E est dite dense dans E si son adhérence est E tout entier (ou encore si elle rencontre tout ouvert non vide). L’adhérence séquentielle d’une partie A de E est l’ensemble des limites de suites à valeurs dans A convergentes dans E. Une partie de E est dite séquentiellement dense dans E si son adhérence séquentielle est E entier. Une partie A de E est dite séquentiellement compacte si de toute suite à valeurs dans A on peut extraire une sous suite convergeant dans A (la notion coı̈ncide avec la compacité usuelle dans le cas métrique mais en général il n’y a pas d’implication entre les deux notions). 15 Soit (E1 , T1 ) et (E2 , T2 ) deux espaces topologigues et ϕ : E1 → E2 , ϕ est continue sur E1 (respectivement continue en x ∈ E1 ) si ϕ−1 (U ) ∈ T1 pour tout U ∈ T2 (respectivement ϕ−1 (U ) est voisinage de x pour tout U voisinage de ϕ(x)). Dans le cas où E1 et E2 sont deux evtlcs de topologies associées respectivement aux familles de semi-normes P1 et P2 , la continuité de ϕ en x s’exprime par : pour tout ε > 0 et p2 ∈ P2 il existe δ > 0 et une semi-norme continue sur E1 , p tels que pour tout y ∈ E1 tel que p(x − y) ≤ δ on a p2 (ϕ(x) − ϕ(y)) ≤ ε. L’application ϕ : E1 → E2 est dite séquentiellement continue en x ∈ E1 si pour toute suite (xn )n convergeant vers x dans E1 , la suite (ϕ(xn ))n converge vers ϕ(x) dans E2 ; ϕ est dite séquentiellement continue sur E1 si elle est séquentiellement continue en chaque point de E1 . Soit (E, T ) un espace topologique et ϕ : E → R ∪ {+∞}, on rappelle que ϕ est semi-continue inférieurement (sci en abrégé) sur E si l’une des conditions équivalentes suivantes est satisfaite : – pour tout λ ∈ R, l’ensemble {x ∈ E : ϕ(x) ≤ λ} est fermé dans E, – l’ensemble (épigraphe de ϕ) {(x, λ) ∈ E × R : ϕ(x) ≤ λ} est fermé dans E × R, – pour tout x ∈ E et tout ε > 0, il existe U voisinage de x dans E tel que ϕ(y) ≥ ϕ(x) − ε, pour tout y ∈ U . Enfin, ϕ est dite séquentiellement continue, si pour tout x ∈ E et toute suite (xn )n convergeant vers x dans E on a : ϕ(x) ≤ lim inf ϕ(xn ). n On vérifie facilement que la continuité (la semi-continuité inférieure) implique la continuité (la semi-continuité inférieure) séquentielle mais la réciproque n’est pas vraie en général, nous aurons l’occasion d’y revenir. Définition 1.7 Soit E un evt, on dit que la partie B de E est bornée si et seulement si pour tout U voisinage de 0, il existe λ > 0 tel que B ⊂ λU . Si E est un evtlc de topologie associée à la famille de semi-normes P = {pi , i ∈ I}, on vérifie facilement que la bornitude de B ⊂ E équivaut à l’une des assertions équivalentes suivantes : – pour tout p ∈ P, supx∈B p(x) < +∞, – pour tout J ⊂ I, fini, il existe R > 0 tel que B ⊂ BJ (0, R). Dans le cas où E est un evtlcs métrisable, il ne faut pas confondre la bornitude au sens précédent et la bornitude au sens d’une distance métrisant la topologie de E (remarquons d’ailleurs que pour la distance construite au théorème 1.2, E est borné). 16 Exercice 1.7 Soit E un evtlcs montrer que E est normable si et seulement si 0 possède un voisinage (convexe) borné. Définition 1.8 Soit E un evt et (xn )n une suite à valeurs dans E, on dit que (xn )n est de Cauchy si et seulement si pour tout U voisinage de 0, il existe N tel que xk − xl ∈ U pour tout k ≥ N et tout l ≥ N . Un evt est dit complet si toute suite de Cauchy de E converge dans E. Dans le cas où la topologie de E est définie par la famille de semi-normes P, dire que (xn )n est de Cauchy se traduit par : pour tout p ∈ P, et tout ε > 0, il existe N tel que p(xk − xl ) ≤ ε pour tout k ≥ N et tout l ≥ N . 1.3 Applications linéaires continues Lemme 1.2 Soit E et F deux evtlc de topologies respectivement définies par les familles de semi-normes P et Q et soit T une application linéaire de E dans F . On a les équivalences : 1. T est continue, 2. T est continue en 0, 3. pour tout q ∈ Q, il existe C ≥ 0, k ∈ N∗ et p1 , . . . pk dans P tels que q(T x) ≤ C sup pi (x), ∀x ∈ E. i=1,...,k Preuve: 1 et 2. sont clairement équivalents. Supposons 2. et soit q ∈ Q alors il existe U voisinage de 0 tel que q(T (x)) ≤ 1 pour tout x ∈ U . Il existe k ∈ N∗ et p1 , . . . pk dans P et ε > 0 tels que la P-boule {x ∈ E : pi (x) ≤ ε, i = 1, . . . , k} soit incluse dans U . Par homogénéité on en déduit facilement l’assertion 3. avec C = ε−1 . Supposons 3 satisfaite, alors soit x ∈ E et U un voisinage de T (x) dans F , soit B une Q-boule ouverte de centre T (x) incluse dans U , il découle de 3. qu’il existe une P-boule ouverte, C de centre x telle que T (y) ∈ B ⊂ U pour tout y ∈ C. ✷ Définition 1.9 Soit E et F deux evt et soit T une application linéaire de E dans F . On dit que T est bornée si et seulement si T envoie les parties bornées de E dans des parties bornées de F . 17 On rappelle que si E et F deux evtlc de topologies associée aux familles de semi-normes P et Q et T est une application linéaire de E dans F , T est séquentiellement continue revient à dire qu’elle est séquentiellement continue en 0 ce qui s’exprime par : si p(xn ) → 0, ∀p ∈ P, alors q(T (xn )) → 0, ∀q ∈ Q. On a alors : Lemme 1.3 Soit E et F deux evtlc de topologies associée aux familles de semi-normes P et Q et T est une application linéaire de E dans F , on a les implications : T continue ⇒ T séquentiellement continue ⇒ T bornée. Preuve: Seule la dernière implication est à démontrer. Suposons T séquentiellement continue et supposons par l’absurde que T ne soit pas bornée : ∃B borné de E tel que T (B) n’est pas borné. Ceci implique qu’il existe une semi-norme q continue sur F telle que pour tout n ∈ N∗ , il existe xn ∈ B vérifiant q(T (xn )) ≥ n. Comme B est borné, yn := n−1/2 xn tend vers 0 dans E, avec la continuité séquentielle de T , ceci implique que q(T (yn )) tend vers 0 ce qui est contredit par q(T (yn )) ≥ n1/2 . ✷ En général, les implications précédentes sont strictes, nous verrons plus tard des exemples de formes linéaires séquentiellement continues et non continues. Dans L2 (0, 1), il est assez facile de voir que la suite fn : t 7→ fn (t) := sin(2nπt) converge faiblement mais pas fortement vers 0, ce qui montre que l’application identité n’est pas séquentiellement continue de L2 muni de la topologie faible dans L2 muni de sa topologie forte (celle de la norme) et pourtant elle est bornée (utiliser Banach-Steinhaus). Il existe donc des applications linéaires bornées et non séquentiellement continues. Dans le cas où E est métrisable toutefois, la bornitude est équivalente à la continuité (on laisse au lecteur le soin de prouver cette assertion). L’important théorème de Banach-Steinhaus (aussi souvent appelé Principle of Uniform Boundedness) permet de déduire pour les opérateurs linéaires des estimations uniformes à partir d’estimations ponctuelles : Théorème 1.3 (Théorème de Banach-Steinhaus ou Principle of Uniform Boundedness) Soit E un espace de Fréchet (de topologie associée à la famille de semi-normes P), F un evtlc (de topologie associée à la famille de seminormes Q) et (Ti )i∈I une famille d’applications linéaires continues de E dans F tels que ∀q ∈ Q, ∀x ∈ E, sup q(Ti (x)) < +∞ i∈I 18 alors pour tout q ∈ Q, il existe C ≥ 0, J ∈ N∗ et p1 , . . . , pJ ∈ P J tels que ∀i ∈ I, ∀x ∈ E, q(Ti (x)) ≤ C sup pj (x). j=1,...,J Preuve: Pour n ∈ N∗ , posons An := {x ∈ E : sup q(Ti (x)) ≤ n}. i∈I Comme An est une suite de fermés dont la réunion est E et comme E est de Fréchet, il résulte du théorème de Baire qu’il existe n0 tel que An0 est d’intérieur non vide. Il existe donc x0 ∈ E, J ∈ N∗ et p1 , . . . , pJ ∈ P J et r > 0 tels que pour tout y dans la P boule B de centre 0 et de rayon 1 définie par les semi-normes p1 , ..., pJ , on a q(Ti (x0 + ry)) ≤ n0 , ∀i ∈ I. On a donc pour tout y ∈ B et tout i ∈ I, q(Ti (y)) ≤ C := r−1 (n0 + supi∈I q(Ti (x0 ))), on conclut par homogénéité. ✷ Nous allons maintenant nous intéresser plus en détail au cas des formes linéaires continues. Dans ce qui suit étant donné un ev E on notera E ∗ son dual algébrique c’est à dire l’ensemble des formes linéaires sur E. Si E est muni d’une structure d’evt (a fortiori d’evtlc), on notera E ′ son dual topologique, i.e. l’espace des formes linéaires continues sur E. Exemple Etant donné un espace métrique compact K, on appelle mesure de Radon sur K toute forme linéaire continue sur C(K) et l’on note M(K) l’espace des mesures de Radon sur K (la terminologie sera justifiée au Chapitre 6). Le dual topologique de l’espace de Schwartz S, S ′ est appelé espace des distributions tempérées, celui de E(Ω) := C ∞ (Ω), E ′ (Ω) est appelé espace des distributions à support compact. On rappelle qu’un hyperplan H de E est un sev strict maximal de E, ce qui revient à dire que pour tout x ∈ / H, E = H ⊕ Rx ou encore qu’il existe f ∈ E ∗ \ {0} telle que H = ker(f ). On définit de même les hyperplans affines comme étant les ensembles de la forme {f = α} = {x ∈ E : f (x) = α} pour un certain f ∈ E ∗ \ {0} et un certain α ∈ R. Lemme 1.4 Soit E un evt, f ∈ E ∗ \ {0} et α ∈ R alors f est continue si et seulement si l’hyperplan {f = α} est fermé. Preuve: Si f est continue l’hyperplan f −1 ({α}) est évidemment fermé. Pour la réciproque, on suppose sans perte de généralité que α = 0 et que l’hyperplan H = ker(f ) 19 est fermé. Soit x0 tel que f (x0 ) = 1, il existe un voisinage de 0, U0 tel que x0 + U0 ⊂ {f 6= 0}, on peut aussi supposer que U0 est équilibré (c’est à dire λU0 ⊂ U0 pour λ ∈ [−1, 1]) et donc en particulier symétrique (U0 = −U0 ). Supposons par l’absurde qu’il existe u0 ∈ U0 tel que f (x0 + u0 ) < 0, alors il existerait λ ∈ (0, 1) tel que f (x0 + λu0 ) = 0 or x0 + λU0 ∈ x0 + U0 ⊂ {f 6= 0} ce qui constitue la contradiction recherchée. On a donc x0 + U0 ⊂ {f > 0} et comme U0 = −U0 on en déduit que |f | ≤ 1 sur U0 de sorte que f est continue. ✷ Exercice 1.8 Il s’agit ici de montrer un lemme algébrique élémentaire mais fort utile. Soit E un ev et f, f1 , . . . , fn des éléments de E ∗ . Montrer que ker(fi ) ⊂ ker(f ) si et seulement s’il existe λ1 , . . . , λn ∈ Rn tels que ∩ni=1 P f = ni=1 λi fi . Une question naturelle est maintenant de savoir de quelle topologie muniton le dual topologique E ′ d’ un evtlcs E. Nous avons déja vu que dans le cas d’un evn, deux choix ”raisonnables” étaient possibles : la topologie forte (celle donnée par la norme duale) et la topologie faible ∗ (donnée par la famille de semi-normes {qx }x∈E avec qx (f ) = |f (x)|). Cela se généralise comme suit aux evt (même si ici nous nous limiterons aux evtlcs) : Définition 1.10 Soit E un evtlcs et E ′ son dual. On appelle topologie forte sur E ′ , la topologie définie par la famille de semi-normes qB (f ) := sup |f (x)|, ∀f ∈ E ′ B ⊂ E, B borné. x∈B On appelle topologie faible-∗ sur E ′ et l’on note ∗-σ(E ′ , E), la topologie définie par la famille de semi-normes qx (f ) := |f (x)|, ∀f ∈ E ′ , x ∈ E. On notera que les deux topologies précédemment définies sur E ′ le munissent d’une structure d’evtlcs. En termes séquentiels, on dit qu’une suite fn de E ′ converge fortement vers f dans E ′ , ce que l’on note fn → f si et seulement si qB (fn − f ) → 0 pour tout borné B de E. On dit qu’une suite (fn )n de E ′ converge faiblement-∗ (ou simplement faiblement s’il n’y a pas ∗ d’ambiguité) vers f , ce que l’on note fn ⇀ f si et seulement si fn (x) → f (x), pour tout x ∈ E. Par construction, une base de voisinages de f ∈ E ′ pour la topologie faible-∗ est donnée par les ensembles de la forme : Vε,x1 ,...xk := {g ∈ E ′ : |(f − g)(xi )| < ε, i = 1, . . . , k} 20 avec ε > 0, k ∈ N∗ et x1 , . . . , xk ∈ E k . On a la caractérisation importante suivante de la topologie faible-∗ sur ′ E : Théorème 1.4 La topologie faible-∗ sur E ′ , ∗-σ(E ′ , E) est la topologie la moins fine sur E ′ rendant continue les applications f ∈ E ′ 7→ f (x) ∈ R, x ∈ E. La notion de topologie la moins fine rendant continue une famille d’applications et sa construction ont déja été vus dans le cours de topologie du premier semestre et nous reviendrons dessus au chapitre 3, on omet donc ici la preuve du résultat précédent. On peut bien se demander pourquoi chercher à affaiblir la topologie forte de E ′ , c’est à dire considérer une topologie ayant moins d’ouverts. La réponse est qu’une topologie ayant moins d’ouverts a des chances d’avoir plus de compacts, et, effectivement, on a l’important résultat de compacité suivant : Théorème 1.5 (Banach-Alaoglu-Bourbaki) Soit E un evtlcs, U un voisinage de 0 et K := {f ∈ E ′ : |f (x)| ≤ 1, ∀x ∈ U } alors K est compact pour la topologie faible-∗ de E ′ . Preuve: Soit p une semi-norme continue sur E telle que B := {p ≤ 1} ⊂ U on a alors K ⊂ K0 avec K0 := {f ∈ E ′ : |f (x)| ≤ 1, ∀x ∈ B} = {f ∈ E ′ : |f (x)| ≤ p(x), ∀x ∈ E}. Comme K est clairement fermé dans K0 il nous suffit de montrer que K0 est compact pour la topologie faible-∗ de E ′ . Soit Y = RE = {(ωx )x∈E , ωx ∈ R, ∀x ∈ E} muni de la topologie produit (i.e. la moins fine rendant continues les projections canoniques) et Φ : E ′ → Y définie par Φ(f ) := (f (x))x∈E pour tout f ∈ E ′ , Φ est une application linéaire injective, continue de E ′ muni de la topologie faible-∗ vers Y muni de la topologie produit. Montrons maintenant que Φ−1 : Φ(E ′ ) → E ′ est continue, pour cela il suffit de montrer que pour tout x ∈ E, ω 7→ Φ−1 (ω)(x) est continue sur Φ(E ′ ), ce qui est évident puisque Φ−1 (ω)(x) = ωx . Il nous suffit donc désormais de montrer que Φ(K0 ) est compact. Or, on a : Φ(K0 ) = A1 ∩ A2 21 avec A1 := {ω ∈ Y : |ωx | ≤ p(x), ∀x ∈ E} = et Y [−p(x), p(x)], x∈E A2 := {ω ∈ Y : ωx+λy = ωx + λωy , ∀(x, y, λ) ∈ E 2 × R}. Il résulte du théorème de Tychonov que A1 est compact et de la continuité des projections canoniques que A2 est fermé de sorte que Φ(K0 ) est compact. ✷ Ce résultat de compacité explique que sur E ′ , on utilisera presque systématiquement la topologie faible-∗ et le mode de convergence associé. Dans le cas où E est séquentiellement séparable (i.e. possède une partie dénombrable séquentiellement dense), la topologie faible ∗ jouit de bonnes propriétés de métrisabilité : Proposition 1.1 Soit E un evtlcs séquentiellement séparable et p une seminorme continue sur E, alors la topologie faible-∗ est métrisable sur l’ensemble K := {f ∈ E ′ : |f (x)| ≤ p(x), ∀x ∈ E}. Preuve: Soit {xn }n dense dans B = {p ≤ 1}, pour tout f et g dans K, on pose d(f, g) := ∞ X 1 |(f − g)(xn )| n 2 n=0 il est facile de voir que d est une distance sur K. Montrons que cette distance métrise la topologie faible sur K. Soit f ∈ K, r > 0, montrons que la boule ouverte B(f, r) (dans K pour la distance est voisinage de f dans K pour P d) −n la topologie faible-∗. Soit N tel que n≥N 2 ≤ r/4, et V = Vr/4,x1 ,...,xN := {g ∈ E ′ : |(g − f )(xi )| < r/4, i = 1, . . . , N } alors V ∩ K est un voisinage de f dans K pour la topologie faible-∗ contenu dans B(f, r). Soit maintenant ε > 0, k ∈ N et y1 , . . . , yk ∈ E k et soit U = Vε,y1 ,...,yk := {g ∈ E ′ : |(g − f )(yi )| < ε, i = 1, . . . , k} il s’agit de montrer qu’il existe r > 0 tel que B(f, r) ⊂ U ∩ K. Pour i = 1, . . . , k soit ni tel que p(yi − xni ) ≤ ε/4 et soit r = mini=1,...,k ε2−ni −1 . Pour g ∈ B(f, r), on a pour tout i = 1, .., k |(f − g)(yi )| ≤ |(f − g)(xni )| + 2p(yi − xni ) < 2ni r + ε/2 ≤ ε 22 et donc B(f, r) ⊂ U ∩ K. ✷ En combinant la proposition 1.1 et le théorème de Banach-Alaoglu-Bourbaki, on obtient le résultat de compacité séquentiel, fort utile en pratique suivant : Théorème 1.6 Soit E un evtlcs séquentiellement séparable, soit (fn )n une suite de E ′ telle qu’il existe p une semi-norme continue sur E vérifiant |fn (x)| ≤ p(x), ∀n ∈ N et ∀x ∈ E alors (fn )n possède une sous suite convergente pour la topologie faible-∗. Lorsque E est en outre un espace de Fréchet (respectivement une limite inductive d’espaces de Fréchet), le théorème de Banach-Steinhaus (respectivement la proposition 1.7) sera fort utile évidemment pour obtenir l’estimation requise dans le théorème précédent. De même que l’on a défini la topologie faible-∗ sur E ′ , on peut définir la topologie faible sur E comme étant la topologie associée à la famille de semi-normes : pf (x) := |f (x)|, ∀x ∈ E avec f ∈ E ′ . La topologie faible sur E est notée σ(E, E ′ ), on déduit du Théorème de Hahn-Banach qu’elle est séparée. Par construction, une base de voisinages de x ∈ E pour la topologie faible est donnée par les ensembles de la forme : Vε,f1 ,...fk := {y ∈ E : |fi (x − y)| < ε, i = 1, . . . , k} avec ε > 0, k ∈ N∗ et f1 , . . . , fk ∈ (E ′ )k . La topologie faible sur E est aussi la topologie la moins fine sur E rendant continus les éléments de E ′ . En termes séquentiels, on dit que xn converge faiblement dans x, ce que l’on note xn ⇀ x si et seulement si f (xn ) → f (x) pour tout f ∈ E ′ . Sauf dans le cas où E est un Banach (et en particulier un espace de Banach réflexif), nous utiliserons assez peu cette topologie et ce mode de convergence. 1.4 Limites inductives et topologie de D(Ω) Soit E un ev, réunion d’une famille d’ev (Ei )i∈I , on suppose que chaque Ei est muni d’une topologie d’evtlc Ti (définie par une famille de semi-normes Pi = {pij }j∈Ji ). La topologie limite inductive des topologies (Ti )i∈I est alors la topologie T définie par la famille de semi-normes P := {p semi-norme sur E dont la restriction à Ei est continue pour tout i ∈ I}. 23 Autrement dit, une semi-norme p appartient à P si et seulement si pour tout i ∈ I, il existe C ≥ 0, J ⊂ Ji finie telle que p ≤ C sup pij sur Ei . j∈J Notons que la caractérisation précédente exprime exactement le fait que toutes les injections canoniques Ei → E sont continues de (Ei , Ti ) vers (E, T ). On a alors la caractérisation suivante Théorème 1.7 La topologie T limite inductive des (Ti )i∈I est la topologie d’evtlc sur E la plus fine rendant continues les injections canoniques Ei → E ∀i ∈ I. Preuve: Nous avons déja remarqué que T est une topologie d’evtlc qui rend continue les injections canoniques Ei → E, ∀i ∈ I. Soit T ′ une topologie d’evtlc qui rend continue toutes ces injections canoniques et soit P ′ la famille des semi-normes continues pour la topologie T ′ . La continuité des injections canoniques implique que P ′ ⊂ P et donc que T est plus fine que T ′ . ✷ Lemme 1.5 Soit (E, T ) limite inductive des evtlc (Ei , Ti ) définie comme cidessus, F un evtlc et T linéaire E → F , pour que T soit continue il faut et il suffit que sa restriction T |Ei soit continue pour Ti , pour tout i ∈ I. Preuve: Si T est continue alors T |Ei l’est aussi comme composée de T et de l’injection canonique Ei → E. Réciproquement, suposons T |Ei est continue pour Ti , pour tout i ∈ I. Soit Q une famille de semi-normes définissant la topologie de F et soit q ∈ Q, q ◦ T est alors une semi-norme sur E continue sur chaque Ei elle appartient donc à P. La continuité de T en découle immédiatement. ✷ Lemme 1.6 Soit E un evtlc, F un sev de E, U un ouvert convexe de F pour la topologie induite par celle de E, il existe C ouvert convexe de E tel que U = C ∩ F . Preuve: On peut supposer sans perte de généralité que 0 ∈ U . Par définition, il existe un ouvert V de E tel que U = V ∩ F , comme E est un evtlc, il existe W ouvert convexe de E contenant 0 tel que W ⊂ V . Posons C := ∪t∈[0,1] (tW + (1 − t)U ) = ∪t∈]0,1] (tW + (1 − t)U ) 24 Le fait que l’on puisse exclure la valeur t = 0 dans la réunion provient du fait que W est absorbant (pour x ∈ U on a x = (1 − ε)(1 + ε)x + ε2 x et pour ε > 0 assez petit le premier terme est dans (1 − ε)U et le second dans εW ) et ceci montre que C est ouvert ; C est évidemment convexe. Puisque U ⊂ C, on a U ⊂ C ∩ F . Pour l’inclusion inverse, il suffit de remarquer que pour t ∈ (0, 1], (tW + (1 − t)U ) ∩ F = tW ∩ F + (1 − t)U ⊂ tV ∩ F + (1 − t)U ⊂ U (car U est convexe). ✷ Nous ne rencontrerons en pratique par la suite que le cas d’une topologie limite inductive d’une suite (croissante) d’evtlc (Ek , Tk )k∈N (la topologie Tk étant associée à la famille de semi-normes Pk ), vérifiant en outre les conditions suivantes : – pour tout k, Ek ⊂ Ek+1 et Ek est fermé dans (Ek+1 , Tk+1 ), – Tk = Tk+1 |Ek (c’est à dire que la topologie de Ek est celle induite par celle de Ek+1 sur Ek ). On munit alors E := ∪∞ k=0 Ek de la topologie T limite inductive des topologies Tk et l’on appellera (E, T ) (ou simplement E) limite inductive de la suite d’evtlc (Ek , Tk )k (ou (Ek )k si cela n’engendre pas de confusion). Dans toute la suite de ce paragraphe, nous nous placerons dans ce cadre. Notons que sous les hypothèses précédentes on vérifie immédiatement par récurrence que pour m > k on a Tk = Tm |Ek . Remarquons aussi Ek est fermé dans Em pour tout m > k. En effet, soit x ∈ Em \ Ek , soit l > k tel que x ∈ El \ El−1 , comme El−1 est fermé dans El il existe Ul ∈ Tl tel que x ∈ Ul et Ul ∩ El−1 = ∅. Comme Tl = Tm |El , il existe Um ∈ Tm tel que Ul = Um ∩ El , on a alors Um ∩ Ek = ∅. Il existe donc un voisinage de x dans Em disjoint de Ek et donc Ek est fermé dans Em . Lorsqu’en plus, les inclusions Ek ⊂ Ek+1 sont strictes on dit que (E, T ) est limite inductive stricte de la suite (Ek , Tk )k . Exemple Les espaces Cc (Ω), Ccm (Ω) et D(Ω) = Cc∞ (Ω) sont naturellem (Ω))j et (DKj (Ω)) ment limites inductives respectives des suites (CKj (Ω))j , (CK j où Kj est une suite exhaustive de compacts. On vérifie sans peine que la topologie définie par limite inductive définie sur ces espaces ne dépend pas de la suite exhaustive de compacts choisie. A partir de maintenant, nous supposerons la plupart du temps, sans nécessairement le préciser, Cc (Ω), Ccm (Ω) et D(Ω) munis de ces topologies. Le dual de l’espace Cc (Ω) (muni de sa topologie de limite inductive) est appelé espace des mesures de Radon sur Ω et noté Mloc (Ω), ainsi une forme linéaire T sur Cc (Ω) est une mesure de Radon 25 sur Ω si et seulement si pour tout K ⊂ Ω, compact, ∃ CK ≥ 0 tel que |T (ϕ)| ≤ CK supx∈K |ϕ(x)|, ∀ϕ ∈ Cc (Ω), supp(ϕ) ⊂ K. Evidemment, on munit Mloc (Ω) de la topologie faible ∗ et de la convergence associée : Tn converge vers T si et seulement si Tn (ϕ) → T (ϕ), ∀ϕ ∈ Cc (Ω). Passons en revue quelques propriétés de base des limites inductives d’une suite d’evtlc : Proposition 1.2 Soit (E, T ) limite inductive de la suite d’evtlc (Ek , Tk )k définie comme précédemment, on a : 1. Si U est un convexe symétrique non vide de E tel que U ∩ Ek ∈ Tk pour tout k alors U est voisinage de 0 dans (E, T ), 2. T |Ek = Tk i.e. la topologie induite par celle de E sur Ek coı̈ncide avec celle de Ek , 3. si chaque (Ek , Tk ) est séparé, alors (E, T ) l’est aussi, 4. Ek est fermé dans (E, T ) pour tout k. Preuve: 1. Pour tout k, il existe une Pk -boule ouverte centrée en 0, Bk telle que Bk ⊂ U ∩ Ek . On a donc jU |Ek ≤ jBk de sorte que jU est une semi-norme continue sur (E, T ). Comme {jU < 1} ⊂ U , on a bien que U est voisinage de 0 dans (E, T ). 2. Si U ∈ T alors par continuité de l’injection canonique Jk : Ek → E, U ∩ Ek = Jk−1 (U ) ∈ Tk de sorte que T |Ek ⊂ Tk . Soit maintenant Uk un voisinage de 0 dans (Ek , Tk ), il s’agit de montrer qu’il existe U voisinage de 0 dans (E, T ) tel que Uk = U ∩ Ek . Sans perte de généralité, on peut supposer en outre que Uk est convexe symétrique et Uk ∈ Tk . En utilisant le fait que Tk = Tk+1 |Ek et par application itérée du lemme 1.6, il existe une suite croissante de convexes (qu’on peut aussi supposer symétriques) (Uk+l )l≥1 telle que chaque Uk+l est ouvert dans Ek+l et Uk = Uk+l ∩ Ek . On pose alors U := ∪l≥1 Uk+l , comme la suite Uk+l est croissante, U est convexe, Uk = U ∩ Ek , enfin U est voisinage de 0 dans E en vertu du point 1 de la proposition. 3. Soit x ∈ E, x 6= 0, il s’agit de montrer qu’il existe U voisinage de 0 dans T tel que x ∈ / U . Il existe k tel que x ∈ Ek et Uk un ouvert convexe symétrique de (Ek , Tk ) tel que x ∈ / Uk . Comme dans le point précédent, on construit une suite croissante de convexes symétriques (Uk+l )l≥1 telle que chaque Uk+l est ouvert dans Ek+l et Uk = Uk+l ∩Ek et on pose U := ∪l≥1 Uk+l . 26 Comme précédemment, U est voisinage de 0 dans E et U ∩ Ek = Uk de sorte que U ne contient pas x. 4. Soit x ∈ E \ Ek et m > k tel que x ∈ Em , comme Ek est fermé dans (Em , Tm ) il existe Um ∈ Tm , convexe symétrique tel que (x + Um ) ∩ Ek = ∅. Comme précédemment, on construit une suite croissante de convexes symétriques (Um+l )l≥1 telle que chaque Um+l est ouvert dans Em+l et Um = Um+l ∩ Em et on pose U := ∪l≥1 Um+l . Comme dans le point précédent, U est un voisinage de 0 dans (E, T ) et (x + U ) ∩ Ek = ∅. Ceci montre bien que Ek est fermé dans (E, T ). ✷ Théorème 1.8 Soit (E, T ) limite inductive de la suite d’evtlc (Ek , Tk )k , définie comme précédemment, (xn )n une suite de E et x ∈ E, on a alors les équivalences entre : 1. (xn )n converge vers x dans (E, T ), 2. il existe k tel que x ∈ Ek , xn ∈ Ek pour tout n et (xn )n converge vers x dans (Ek , Tk ). Preuve: Supposons que (xn )n converge vers x dans (E, T ) et commencons par montrer qu’il existe k tel que xn ∈ Ek pour tout n (ce qui impliquera en particulier que x ∈ Ek car Ek est fermé donc séquentiellement fermé). Si un tel k n’existe pas alors il existerait des sous-suites (nl )l et (kl )l tel que pour tout l ∈ N, xnl ∈ Ekl+1 \ Ekl . Comme Ekl est fermé, on déduit du théorème de séparation 1.11 (que nous verrons à la section suivante) qu’il existe Tl ∈ E ′ telle que Tl ≡ 0 sur Ekl et Tl (xnl ) 6= 0. Pour tout x ∈ E, posons alors ∞ X |Tl (x)| . p(x) := l |Tl (xnl )| l=0 En remarquant que la somme précédente est en fait finie sur chaque Ej , on en déduit que p est une semi-norme continue sur chaque Ej et donc sur E (autrement dit p ∈ P). En particulier, on devrait avoir que (p(xnl ))l est bornée ce qui est contredit par le fait que par construction p(xnl ) ≥ l, ∀l ∈ N. On a donc montré qu’il existe k tel que xn ∈ Ek pour tout n et x ∈ Ek . Ceci implique en particulier que (xn )n converge vers x dans T |Ek et donc dans (Ek , Tk ), en vertu du point 2. de la proposition 1.2. 27 L’implication 2. ⇒ 1. découle immédiatement du point 2. de la proposition 1.2. ✷ En particulier une suite (ϕn )n de D(Ω) converge vers ϕ si et seulement s’il existe un compact K de Ω tel que toutes les fonctions ϕn et ϕ soient à support dans K et ϕn − ϕ ainsi que toutes ses dérivées convergent uniformément vers 0 sur K. Lemme 1.7 Soit (E, T ) limite inductive de la suite d’evtlc (Ek , Tk )k . Si chaque (Ek , Tk ) est séquentiellement séparable, alors (E, T ) l’est aussi. Preuve: Soit Dk dénombrable séquentiellement dense dans Ek et D := ∪k Dk . Montrons que D est séquentiellement dense dans E. Soit x ∈ E et k tel que x ∈ Ek , il existe alors une suite de Dk convergeant dans (Ek , Tk )k vers x et donc cette suite converge aussi vers x dans (E, T ). ✷ Proposition 1.3 Soit (E, T ) limite inductive de la suite d’evtlc (Ek , Tk )k . Si chaque (Ek , Tk ) est complet, alors (E, T ) l’est aussi. Preuve: Soit (xn )n une suite de Cauchy de (E, T ). On montre d’abord qu’il existe k tel que xn ∈ Ek pour tout n. Pour cela, on remarque que pour tout p ∈ P, la suite (p(xn ))n est bornée puis on procède par l’absurde exactement de la même manière que dans la preuve du Théorème 1.8. Utilisant à nouveau le fait que T |Ek = Tk , on en déduit que (xn )n est de Cauchy dans (Ek , Tk ) dont la complétude permet de conclure. ✷ En particulier on a : Proposition 1.4 D(Ω), muni de sa topologie usuelle (limite inductive des topologies de DKj (Ω) avec Kj suite exhaustive de compacts de Ω) est complet. On a vu qu’une limite inductive d’evtlc complets était encore complète, en particulier, une limite inductive stricte d’espaces de Fréchet est complète. Il est naturel de se demander si cette limite inductive est métrisable (donc de Fréchet) : pour une limite inductive stricte la réponse est toujours négative : Proposition 1.5 Une limite inductive stricte d’une suite d’espaces de Fréchet n’est jamais métrisable. 28 Preuve: Notons E la limite inductive stricte de la suite d’espaces de Fréchet (Ek )k . Chaque Ek est fermé dans E et d’intérieur vide (sans quoi Ek contiendrait un voisinage de 0 et ce dernier étant absorbant ceci impliquerait que Ek = E). Puisque E est complet, s’il était métrisable, il résulterait du Lemme de Baire que E = ∪k Ek est lui-même d’intérieur vide, ce qui est absurde. ✷ En particulier, D(Ω) muni de sa topologie usuelle (limite inductive stricte de la suite d’espaces de Fréchet DKj (Ω) avec Kj suite exhaustive de compacts de Ω) n’est pas métrisable. Noter que la preuve précédente fournit des exemples d’espaces topologiques complets et non de Baire et montre que la propriété ”être de Baire” ne passe pas à la limite inductive. On peut être déçu par le caractère non métrisable d’une limite inductive stricte d’espaces de Fréchet, néanmoins on a : Proposition 1.6 Soit (E, T ) limite inductive de la suite d’evtlc (Ek , Tk )k et soit T ∈ E ∗ . Si chaque Ek est métrisable alors T ∈ E ′ si et seulement si T est séquentiellement continue. Preuve: Si T est séquentiellement continue alors T |Ek est séquentiellement continue pour tout k et comme Tk est métrisable on en déduit que T |Ek est continue pour tout k et donc T ∈ E ′ en vertu du lemme 1.5. ✷ En particulier, une forme linéaire T sur D(Ω) est continue sur D(Ω) (autrement dit c’est une distribution c’est à dire un élément de D′ (Ω)) si et seulement si T est séquentiellement continue. Indiquons une application immédiate mais utile du théorème de BanachSteinhaus aux limites inductives d’espaces de Fréchet : Proposition 1.7 Soit (E, T ) limite inductive de la suite d’espaces de Fréchet (Ek , Tk )k (de topologie associée à la famille de semi-normes Pk ), F un evtlc (de topologie associée à la famille de semi-normes Q) et (Ti )i∈I une famille d’applications linéaires continues de E dans F tels que ∀q ∈ Q, ∀x ∈ E, sup q(Ti (x)) < +∞ i∈I alors pour tout q ∈ Q et tout k, il existe C ≥ 0, J ∈ N∗ et p1 , . . . , pJ ∈ PkJ tels que ∀i ∈ I, ∀x ∈ Ek , q(Ti (x)) ≤ C sup pj (x). j=1,...,J 29 On notera au passage que sous les hypothèses précédentes x ∈ E 7→ sup q(Ti (x)) i∈I est une semi-norme continue sur E (puisqu’elle l’est sur chaque Ek ). Exercice 1.9 Montrer que les fermés bornés de DK (Ω) sont séquentiellement compacts et qu’il en est de même dans D(Ω) (propriété de Montel). Exercice 1.10 (E, T ) limite inductive de la suite d’evtlc (Ek )k , montrer que B ⊂ E est borné si et seulement s’il existe k tel que B ⊂ Ek et B est borné dans Ek . Exercice 1.11 Montrer que D′ (Ω) muni de la topologie faible ∗ est complet. 1.5 Théorèmes de Hahn-Banach Avant de prouver le Théorème de Hahn-Banach sous sa forme analytique, procédons à quelques rappels sur les ensembles ordonnés. Soit A un ensemble non vide muni d’un ordre (partiel) 4. Un élément m de A est dit maximal si {x ∈ A : m 4 x} = {m}. Une partie B de A est dite totalement ordonnée si pour tout (x, y) ∈ B 2 on a x 4 y ou y 4 x ; on dit que m ∈ A est un majorant de B si et seulement si x 4 m pour tout x ∈ B. Enfin, on dit que A est inductif si toute partie totalement ordonnée de A admet un majorant. Le lemme de Zorn (que nous admettrons ici, voir [11] pour une démonstration à partir de l’axiome du choix) s’énonce comme suit. Lemme 1.8 Tout ensemble ordonné, inductif non vide possède un élément maximal. Il va sans dire qu’on peut aussi utiliser le lemme de Zorn sous la forme suivante : tout ensemble ordonné, inductif décroissant (i.e. telle que toute partie totalement ordonnée de A admet un minorant) non vide possède un élément minimal (c’est à dire un élément qui n’a d’autre minorant que luimême). 30 Théorème 1.9 (Hahn-Banach, forme analytique) Soit E un R-ev et p : E → R vérifiant p(λx) = λp(x), ∀x ∈ E, ∀λ > 0, p(x + y) ≤ p(x) + p(y), ∀(x, y) ∈ E 2 . Soit G un sev de E et g une forme linéaire sur G telle que g(x) ≤ p(x), ∀x ∈ G alors il existe un forme linéaire f sur E prolongeant g (f (x) = g(x), ∀x ∈ G) telle que f (x) ≤ p(x), ∀x ∈ E. Preuve: Soit A l’ensemble des couples (H, h) avec H sev de E contenant G, h forme linéaire sur H prolongeant g et tels que h ≤ p sur H. Evidemment (G, g) ∈ A ce qui en assure la non vacuité. Munissons A de la relation d’ordre 4 : (H1 , h1 ) 4 (H2 , h2 ) ⇐⇒ H1 ⊂ H2 et h2 prolonge h1 . Si (Hi , hi )i∈I est une partie totalement ordonnée de E alors elle admet pour majorant H := ∪i∈I Hi , h(x) = hi (x), ∀x ∈ Hi . Ainsi A est inductif, et possède donc un élément maximal (H, h) en vertu du Lemme de Zorn rappelé plus haut. Si l’on montre que H = E, la preuve sera achevée. Supposons au contraire que H 6= E, soit alors x0 ∈ E \ H et H0 := H ⊕ Rx0 , si l’on arrive à prolonger h en une forme linéaire h0 sur H0 majorée par p, on aura la contradiction souhaitée à la maximalité de (H, h). Tout prolongement h0 de h à H0 est de la forme h0 (x + tx0 ) = h(x) + tα, ∀(x, t) ∈ H × R pour un certain α ∈ R. Si bien que h0 ≤ p sur H0 si et seulement si h(x) + tα ≤ p(x + tx0 ), ∀t ∈ R, ∀x ∈ H ce qui par homogénéité revient à h(x) + α ≤ p(x + x0 ), et h(x) − α ≤ p(x − x0 ), ∀x ∈ H (1.4) sup{h(x) − p(x − x0 )} ≤ α ≤ inf {p(y + x0 ) − h(y)}. (1.5) ou encore x∈H x∈H 31 Or si (x, y) ∈ H 2 on a h(x + y) = h(x) + h(y) ≤ p(x + y) ≤ p(x − x0 ) + p(y + x0 ) et donc sup{h(x) − p(x − x0 )} ≤ inf {p(y + x0 ) − h(y)} x∈H x∈H ainsi on peut choisir α vérifiant (1.5), ce qui achève la preuve. ✷ On déduit immédiatement du Théorème de Hahn-Banach, quelques conséquences utiles comme le prolongement de formes linéaires continues dans les evn. Rappelons que si E est un evn, on munit canoniquement son dual topologique E ′ de le norme duale : kf kE ′ := sup{|f (x)|, x ∈ E, kxk ≤ 1} qui fait de E ′ un espace de Banach. Corollaire 1.1 Soit E un evn, G un sev de E et g ∈ G′ , il existe f ∈ E ′ , prolongeant g et telle que kf kE ′ = kgkG′ . Preuve: On applique le Théorème 1.9 avec p(x) := kgkG′ kxk. ✷ Corollaire 1.2 Soit E un evn et x0 ∈ E il existe f ∈ E ′ tel que kf kE ′ = 1 et f (x0 ) = kx0 k. On a donc pour tout x ∈ E, kxk = max{f (x), f ∈ E ′ , kf kE ′ ≤ 1}. Preuve: On applique le corollaire 1.1 avec G = Rx0 , g(tx0 ) = tkx0 k pour tout t ∈ R si bien que kgkG′ = 1. La deuxième assertion s’en déduit immédiatement. ✷ On déduit trivialement de ce corollaire : Corollaire 1.3 Soit E un evn, la topologie faible σ(E, E ′ ) est séparée. On s’intéresse maintenat aux formes géométriques du théorème de HahnBanach ou théorèmes de séparation des convexes. Expliquons ce que nous entendons par le terme de ”séparation” : on dit que deux parties A et B de 32 l’evt E sont séparées (au sens large) par l’hyperplan affine fermé H = {f = α} (avec f ∈ E ′ \ {0}) si f (x) ≤ α, ∀x ∈ A, et f (y) ≥ α ∀y ∈ B ce qui exprime géométriquement le fait que A et B se situent ”de part et d’autre” de H. On parle de séparation stricte si il existe ε > 0 tel que f (x) ≤ α − ε, ∀x ∈ A, et f (y) ≥ α ∀y ∈ B. Par la suite on appellera demi-espace fermé tout ensemble de la forme {f ≥ α} = {x ∈ E : f (x) ≥ α} avec f ∈ E ′ \ {0} et α ∈ R. On commence par le cas d’un point et d’un convexe ouvert ne contenant pas ce point (et ce, dans le cadre d’un evt général) : Lemme 1.9 Soit E un evt, C un ouvert convexe non vide et x0 ∈ / C alors il existe f ∈ E ′ tel que f (x) < f (x0 ) pour tout x ∈ C. En particulier l’hyperplan {f = f (x0 )} sépare {x0 } et C au sens large. Preuve: Quitte à effectuer une translation nous pouvons supposer que 0 ∈ C si bien que C est un voisinage ouvert de 0 et nous en notons jC la jauge. Posons G = Rx0 et g(tx0 ) = t pour tout t ∈ R. Comme x0 ∈ / C, on a jC (x0 ) ≥ 1 = g(x0 ) et par homogénéité on a donc jC (tx0 ) ≥ g(tx0 ) pour tout t ≥ 0, cette dernière inégalité étant évidemment satisfaite pour les t < 0 ainsi g ≤ jC sur G. Par le Théorème de Hahn-Banach 1.9, il existe f ∈ E ∗ telle que f ≤ jC sur E et f = g sur G. Si x ∈ C on a alors f (x) ≤ jC (x) < 1 = f (x0 ). Il ne nous reste donc qu’à montrer que f est continue. Or si x appartient au voisinage ouvert de 0, C ∩ (−C) on a f (x) ≤ jC (x) < 1 et f (−x) ≤ jC (−x) < 1 de sorte que |f | ≤ 1 sur C ∩ (−C). ✷ Théorème 1.10 (Hahn-Banach, première forme géométrique) Soit E, un evt, A et B deux convexes non vides disjoints de E, A étant ouvert alors il existe un hyperplan fermé qui sépare A et B au sens large. Preuve: On remarque que A − B est convexe et ouvert car A − B = ∪b∈B (A − b) et que 0 ∈ / (A − B). Ainsi il résulte du lemme 1.9 qu’il existe f ∈ E ′ telle que f (a) − f (b) < f (0) = 0, ∀(a, b) ∈ A × B Ceci implique que f 6= 0 et sup{f (a), a ∈ A} ≤ inf{f (b), b ∈ B} 33 de sorte que {f = α} sépare A de B au sens large pour tout α compris entre les deux membres de l’inégalité précédente. ✷ Pour la séparation stricte, on a le théorème suivant (bien noter la différence dans les hypothèses) : Théorème 1.11 (Hahn-Banach, deuxième forme géométrique) Soit E, un evtlc, A et B deux convexes non vides disjoints de E, A étant compact et B étant fermé alors il existe un hyperplan fermé qui sépare A et B au sens strict. Preuve: Comme B est fermé et A ⊂ E \ B pour tout a ∈ A, il existe Ua voisinage ouvert convexe de 0 tel que (a+Ua )∩B = ∅ et par continuité de (x, y) 7→ x+y en (0, 0), il existe Va voisinage ouvert convexe de 0 tel que Va + Va ⊂ Ua . Puisque A est compact il existe n et a1 , ..., an dans A tels que A ⊂ ∪ni=1 (ai + Vai ). Soit maintenant V := ∩ni=1 Vai et x ∈ (A + V ), alors il existe un i tel que x ∈ ai + Vai + V ⊂ ai + Vai + Vai ⊂ E \ B et donc (A + V ) ∩ B = ∅. Comme A + V est un ouvert convexe disjoint de B, d’aprés le théorème 1.11, il existe f ∈ E ′ \ {0} telle que f (a) + f (v) ≤ f (b), ∀(a, b, v) ∈ A × B × V. Comme V est absorbant et f 6= 0 il existe v ∈ V telle que f (v) > 0, ce qui achève la preuve. ✷ On en déduit : Corollaire 1.4 Soit E un evtlcs alors la topologie faible σ(E, E ′ ) est séparée. Preuve: Comme la topologie de E est séparée, les points sont fermés, ils sont également compacts, on peut donc les séparer strictement par un hyperplan fermé, ce qui prouve que la topologie faible σ(E, E ′ ) est séparée. ✷ Une seconde application immédiate nous est fournie par le Corollaire 1.5 Soit E un evtlc alors tout convexe fermé C de E est l’intersection des demi-espaces fermés le contenant. En particulier, tout convexe fermé C de E est intersection de demi-espaces fermés. 34 Preuve: Le cas où C est vide est évident. Supposons C non vide et appelons C ′ l’intersection des demi-espaces fermés contenant C. S’il existe x ∈ C ′ \ C, en vertu du théorème 1.11 (appliqué au convexe fermé C et au convexe compact {x}), il existe un demi-espace fermé contenant C et non x ce qui contredit x ∈ C ′. ✷ Le théorème 1.11 peut s’avérer très utile pour montrer qu’un sev est dense : Corollaire 1.6 Soit E un evtlc et F un sev de E si F 6= E il existe f ∈ E ′ \ {0} telle que f ≡ 0 sur F . Preuve: Si x ∈ E et x ∈ / F , le théorème 1.11 appliqué à {x} et F fournit l’existence ′ d’un f ∈ E \ {0} et d’un α ∈ R tels que f (x) < α ≤ f (y), pour tout y ∈ F , ceci implique que f ≡ 0 sur F . ✷ Ainsi pour montrer qu’un sev F est dense dans E il suffit de montrer que toute forme linéaire continue sur E nulle sur F est identiquement nulle sur E. Avant d’énoncer et démontrer le théorème de Krein-Milman comme conséquence du théorème 1.11, définissons la notion de point extrémal Définition 1.11 Soit E un ev, C un convexe de E et x ∈ C, on dit que x est un point extrémal de C si et seulement s’il vérifie : ∀(t, y, z) ∈]0, 1[×C × C, x = ty + (1 − t)z ⇒ y = z. On note ext(C) l’ensemble des points extrémaux de C. Il s’agit d’une notion purement géométrique, on vérifie sans peine que les points extrémaux de la boule euclidienne de Rd forment la sphère, que les points extrémaux d’un pavé de Rd sont ses sommets etc... On notera aussi que x est un point extrémal de C est équivalent à dire que C \{x} est convexe. Proposition 1.8 Soit E un evtlcs et C un convexe compact de E alors ext(C) 6= ∅. Preuve: Soit A l’ensemble des fermés non vides de C, F tels que pour tout (x, y) ∈ C× C, si ]x, y[∩F 6= ∅ alors ]x, y[⊂ F . Comme C ∈ A, A 6= ∅, par ailleurs, il est 35 clair que toute intersection non vide d’éléments de A est encore dans A, enfin dire que x ∈ ext(C) revient à dire que {x} ∈ A. Pour montrer que ext(C) 6= ∅ nous allons montrer (en utilisant le lemme de Zorn) que A admet un élément minimal pour l’inclusion et que ce dernier est nécessairement réduit à un singleton. Montrons d’abord que A est inductif décroissant pour l’inclusion (c’est à dire que toute partie totalement ordonnée de A possède un minorant). Soit donc (Fi )i∈I une partie totalement ordonnée de A, F := ∩i∈I Fi , pour montrer que F est un minorant de (Fi )i∈I , il nous suffit de montrer que F 6= ∅ mais si F était vide, par compacité de C une intersection finie de Fi serait vide, ce qui comme la famille est ordonnée, impliquerait que l’un des Fi soit vide contredisant ainsi le fait que chaque Fi est dans A. Le lemme de Zorn permet de conclure à l’existence d’un élément minimal F de A. Il s’agit maintenant de montrer que F est un singleton, si tel n’était pas le cas il existerait x et y distincts dans F . E étant un evtlcs il existe un voisinage ouvert convexe de y ne contenant pas x et donc, avec le lemme 1.9 il existe f ∈ E ′ telle que f (x) < f (y) en particulier f n’est pas constante sur F . Posons α := minF f et G := F ∩{f = α} (fermé non vide par compacité de F et continuité de f ) comme G est inclus strictement dans F , si nous montrons que G ∈ A, nous aurons la contradiction recherchée à la minimalité de F . Soit donc x et y dans C et t ∈]0, 1[ tels que z = tx + (1 − t)y ∈ G comme G ⊂ F ∈ A, comme F est fermé, x et y apartiennent à F donc en particulier f (x) ≥ α et f (y) ≥ α et comme f (z) = α on en déduit que ces inégalités sont en fait des égalités et donc x et y sont dans G, par convexité de G, on en déduit que G ∈ A. ✷ En notant co(A) l’enveloppe convexe fermée d’une partie A de E, i.e. le plus petit convexe fermé contenant A, on a : Théorème 1.12 (Krein-Milman) Soit E un evtlcs et C un convexe compact de E alors C = co(ext(C)). Preuve: Posons C ′ = co(ext(C)), il est clair que C ′ ⊂ C. Pour l’inclusion inverse, supposons par l’absurde qu’il existe x ∈ C \ C ′ , en utilisant le Théorème 1.11, il existe f ∈ E ′ tel que f (x) > max′ f (y) y∈C si bien qu’en particulier α := max f (z) > max′ f (y) z∈C y∈C 36 (1.6) En appliquant la proposition 1.8, l’ensemble convexe compact Cα = {z ∈ C : f (z) = α} possède au moins un point extrémal z dont on vérifie facilement qu’il est aussi un point extrémal de C, ce qui contredit (1.6). ✷ Notons que si f est une forme linéaire continue (ou plus généralement une fonction concave sci) sur le convexe compact C alors elle atteint son minimum en au moins un point extrémal de C. Cette remarque est à la base de la programmation linéaire et prend tout son sens lorsque C a peu de points extrémaux et notamment quand elle en a un nombre fini comme c’est le cas des polyèdres convexes, dans ce cas il suffit de déterminer et explorer (si possible intelligemment) l’ensemble des points extrémaux de C (algorithme du simplexe etc...). Exercice 1.12 Soit E un evn séparable (i.e. admettant une famille dénombrable dense) montrer qu’il existe une famille dénombrable de formes linéaires continues séparant les points de E. En déduire une preuve de la proposition 1.8 n’utilisant pas le lemme de Zorn. Exercice 1.13 Soit C un convexe (quelconque) de Rd et x ∈ / C, montrer que l’on peut séparer au sens large x de C. Trouver un contre-exemple en dimension infinie. Exercice 1.14 (Birkhoff ) Soit A ∈ Mn (R), on dit que A est bistochastique, si ses coefficients sont positifs et que la somme de ses coefficients sur chaque ligne et chaque colonne est 1. Montrer que les matrices bistochastiques sont les combinaisons convexes des matrices de permutation. Exercice 1.15 Dans le cas d’un espace de Hilbert, donner une preuve élémentaire du Théorème 1.11 à partir du théorème de projection sur un convexe fermé. Exercice 1.16 Soit l1 := l1 (N) muni de sa structure usuelle d’espace de Banach. Montrer que (l1 )′ = l∞ . Montrer que si une suite converge faiblement dans l1 alors elle converge fortement (Schur). Montrer que l’application identité (l1 , σ(l1 , l∞ )) → (l1 , k.kl1 ) est séquentiellement continue mais pas continue et conclure. 37 Chapitre 2 Introduction à la théorie des distributions Une des idées de base de la théorie des distributions est de ne pas voir une fonction f (disons L1loc (Rd )) ”ponctuellement” mais à partir de son action sur des fonctions-test c’est à dire à travers les quantités Z f (x)ϕ(x)dx, ϕ ∈ D(Rd ). Rd Un des intérêts de ce point de vue est que par dualité-ou transpositionon va en fait faire porter un certain nombre d’opérations (la dérivation en particulier) sur les fonctions-test et non sur f a priori trop peu régulière pour que ces opérations puissent lui être licitement directement appliquées. Le choix de D(Rd ) comme espace de fonctions-test est assez naturel (mais d’autres peuvent aussi être judicieux) : on peut dériver licitement autant qu’on veut, intégrer autant qu’on veut ces dérivées et les termes de bord dans les intégrations par parties seront nuls. On disposera donc d’un cadre très général dans lequel on pourra dériver ”au sens des distributions” des objets relativement pathologiques comme des mesures. Nous verrons dans ce chapitre un certain nombre d’opérations naturelles (dérivation, multiplication, convolution, transformée de Fourier) sur les distributions et comment elles permettent de résoudre certaines équations aux dérivées partielles. Néanmoins, toutes ces opérations (et donc les EDP’s que nous verrons dans ce chapitre) sont linéaires et cela est dans la nature des choses : la théorie des distributions permet-entre autres choses- de donner un sens aux dérivées d’une masse de Dirac mais pas à son carré ou son exponentielle.... 38 2.1 Quelques résultats préliminaires On se propose de regrouper dans ce paragraphe divers résultats classiques d’approximation (régularisation par convolution, troncature) et d’établir quelques formules d’intégration par parties qui nous seront utiles par la suite. Dans tout ce qui suit, Ω désigne un ouvert de Rd et les fonctions en jeu dans ce chapitre seront à valeurs dans R ou dans C. On commence par le classique lemme de densité, vu dans le cours d’Intégration : Lemme 2.1 Cc (Ω) est dense dans L1 (Ω). Pour f ∈ L1 (Rd ) et g dans L1 (Rd ) on définit la convolution de f et g par Z (f ⋆ g)(x) := f (x − y)g(y)dy, ∀x ∈ Rd Rd on vérifie sans peine que f ⋆ g = g ⋆ f , que f ⋆ g ∈ L1 (Rd ) et que kf ⋆ gkL1 ≤ kf kL1 kgkL1 . Il est clair par ailleurs que la définition précédente de f ⋆ g fait sens dès que y 7→ f (x − y)g(y) est L1 pour presque tout x, on peut donc en particulier définir f ⋆ g pour f ∈ L1 à support compact (i.e. nulle p.p. en dehors d’un compact) et g ∈ L1loc . Pour f ∈ L1 (Rd ) et g ∈ Lp (Rd ) on a : Lemme 2.2 Soit f ∈ L1 (Rd ) et g ∈ Lp (Rd ) (1 ≤ p ≤ ∞) alors pour presque tout x ∈ Rd , y 7→ f (x − y)g(y) est L1 , f ⋆ g ∈ Lp (Rd ) avec kf ⋆ gkLp ≤ kf kL1 kgkLp . Preuve: Le résultat est évident pour p = ∞ et p = 1. On supposera donc que p ∈]1, ∞[ et on note p∗ l’exposant conjugué de p (i.e. p∗ = p/(p−1)). Puisque |g|p ∈ L1 , on déduit du cas L1 que pour presque tout x on a y 7→ |f (x−y)|1/p |g(y)| ∈ Lp , ∗ ∗ comme y 7→ |f (x − y)|1/p est Lp , on déduit de l’inégalité de Hölder que y 7→ |f (x − y)g(y)| est L1 pour presque tout x avec : Z ∗ 1/p∗ |f (x − y)|1/p |f (x − y)|1/p |g(y)|dy ≤ kf kL1 (|f | ⋆ |g|p )1/p (x). |f ⋆ g|(x) ≤ Rd Puisque |f | ⋆ |g|p ∈ L1 avec k|f | ⋆ |g|p kL1 ≤ kf kL1 kgkpLp , on en déduit immédiatement que f ⋆ g ∈ Lp avec kf ⋆ gkLp ≤ kf kL1 kgkLp . ✷ 39 Exercice 2.1 Montrer que S ⋆ S ⊂ S. Le support d’une fonction Lp étant par définition le complémentaire du plus grand ouvert sur lequel cette fonction s’annule presque partout alors, on vérifie facilement que pour f ∈ L1 (Rd ) et g ∈ Lp (Rd ), on a : supp(f ⋆ g) ⊂ supp(f ) + supp(g). Ainsi, en particulier si f et g sont à support compact, alors f ⋆ g aussi avec supp(f ⋆ g) ⊂ supp(f ) + supp(g). R Soit ρ ∈ C ∞ (Rd ) tel que Rd ρ = 1, ρ ≥ 0 et supp(ρ) ⊂ B(0, 1). Un exemple typique de fonction vérifiant ces conditions étant : ( 1 |x|2 −1 si |x| < 1 Ce ρ(x) = 0 sinon. R avec C constante choisie de sorte que Rd ρ = 1. Pour ε > 0, on définit alors ρε par ρε (x) = ε−d ρ(ε−1 x), ∀x ∈ Rd . On appelle (ρε )ε > 0 famille régularisante (mollifying en anglais), cette terminologie étant justifiée par le fait que si f ∈ L1 , ρε ⋆ f est C ∞ (et à support compact si f l’est) avec ∂ β (ρε ⋆ f ) = (∂ β ρε ) ⋆ f, ∀β ∈ Nd . Lemme 2.3 D(Ω) est dense dans L1 (Ω). Preuve: Soit f ∈ L1 et ε > 0, il existe fε ∈ Cc (Ω) tel que kf − fε kL1 ≤ ε/2. Soit (ρδ )δ une suite régularisante, pour δ < dist(supp(fε ), Rd \ Ω)), ρδ ⋆ fε est correctement définie et appartient à D(Ω). Il est aisé de déduire de l’uniforme continuité de fε que pour δ assez petit on a kρδ ⋆ fε − fε kL1 ≤ ε/2 ce qui achève la preuve. ✷ L’approximation de f par ρε ⋆ f s’appelle régularisation par convolution ou par noyau régularisant. Notons que dans certains cas, on peut souhaiter approcher f non pas par des fonctions de D(Rd ) comme précedemment mais par des fonctions analytiques, on peut alors procéder par convolution en considérant ρε ⋆ f avec (par exemple) ρε gaussienne centrée de variance ε2 id. Il faut retenir le procédé de régularisation par convolution qui permet d’approcher des fonctions à support compact par des fonctions C ∞ à support compact. Un autre procédé important dans les applications est celui de 40 troncature qui permet d’approcher une fonction par une fonction à support compact. Ce procédé consiste à approcher f ∈ L1 (Ω) (par exemple) par ηn f avec ηn une fonction plateau (ou cut-off ) c’est-à dire une fonction continue comprise entre 0 et 1 valant 1 sur Kn et 0 sur Ω \ Kn+1 (avec Kn une suite exhaustive de compacts de Ω). L’existence de telles fonctions-plateau résulte du lemme d’Urysohn et l’on peut bien sûr les choisir C ∞ par régularisation par convolution. Lemme 2.4 (Partition de l’unité) Soit Γ un compact de Rd et U1 , . . . Uk un recouvrement ouvert de Γ, il existe des fonctions C ∞ à support compact P θ1 , . . . , θk vérifiant supp(θi ) ⊂ Ui , 0 ≤ θi ≤ 1, i = 1, . . . , k et ki=1 θi = 1 sur un voisinage de Γ (on appelle alors θ1 , . . . , θk partition de l’unité subordonnée au recouvrement U1 , . . . Uk ) . Le lemme précédent est classique et peut se démontrer par récurrence sur k, on en laisse la démonstration au lecteur. Exercice 2.2 Ce qui suit est évident mais il est essentiel de l’avoir en tête pour comprendre les dérivées au sens des distributions. Soit ϕ ∈ Cc1 (Rd ) montrer que Z ∇ϕ = 0. Rd Soit ϕ et ψ sont dans C 1 (Rd ) avec ϕ à support compact montrer que Z Z ϕ ∂i ψ, i = 1, . . . , d. ∂i ϕ ψ = − Rd Rd Soit Ω un ouvert de Rd , et k ∈ N∗ , on dira que Ω est un ouvert de classe C k s’il existe Φ ∈ C k (Rd , R) tel que Ω = {x ∈ Rd : Φ(x) < 0}, ∂Ω = {x ∈ Rd : Φ(x) = 0} (2.1) ∇Φ(x) 6= 0, ∀x ∈ ∂Ω. (2.2) et Pour tout x ∈ ∂Ω, on définit alors la normale extérieure à ∂Ω en x par n(x) := ∇Φ(x) . |∇Φ(x)| La mesure de surface σ sur ∂Ω est alors construite de la manière suivante. d−1 Soit x0 ∈ ∂Ω et ed := n(x0 ), on identifie l’hyperplan e⊥ et on note d à R 41 x ∈ Rd sous la forme x = (x′ , xd ) avec xd = x · ed et x′ les coordonnées de la projection orthogonale de x dans une base orthonormée de e⊥ d . On a alors ∂d Φ(x0 ) = ∇Φ(x0 ) · ed = 1 et donc il résulte du théorème de l’inversion locale qu’il existe U un ouvert de Rd contenant x0 , Q′ un ouvert de Rd−1 contenant x′0 et ε > 0 tels que x 7→ (x′ , Φ(x)) soit un C 1 -difféormorphisme de U sur Q′ ×]−ε, ε[. On note l’inverse de ce C 1 -difféomorphisme sous la forme (x′ , t) ∈ Q′ ×] − ε, ε[7→ (x′ , g(x′ , t)) et g0 (x′ ) := g(x′ , 0) pour tout x′ ∈ Q′ , de sorte que l’on a {Φ = t} ∩ U = {(x′ , g(x′ , t)), x′ ∈ Q′ }, ∀t ∈] − ε, ε[ (2.3) Ω ∩ U = {(x′ , g(x′ , t)), x′ ∈ Q′ , t ∈] − ε, 0[}. (2.4) ∂Ω ∩ U = {(x′ , g0 (x′ )), x′ ∈ Q′ }. (2.5) et donc et Pour f ∈ Cc (U ), on pose alors Z Z p f (x)dσ(x) := f (x′ , g0 (x′ )) 1 + |∇g0 (x′ )|2 dx′ . (2.6) Q′ ∂Ω Pour f ∈ Cc (Rd ), on recouvre ∂Ω ∩ supp(f ) par un nombre fini d’ouverts Uj sur chacun desquels ∂Ω se représente comme un graphe sous la forme (2.3), et on note θj une partition de l’unité subordonnée au recouvrement par les R Uj . Comme chaque terme θj f est à support dans Uj , on définit ∂Ω θj f dσ de manière analogue à (2.6), et on pose enfin Z XZ θj f dσ. f dσ = ∂Ω j ∂Ω A ce stade, le fait que cette définition ne dépende pas du choix des Uj , des paramétrisations locales gj et de la partition de l’unité n’est pas totalement clair. Cela résulte en particulier du résultat suivant : Lemme 2.5 (Mesure de surface sur le bord d’un ouvert régulier comme dérivée d’une intégrale de volume) Soit Ω un ouvert de classe C 1 , Φ et la mesure de surface σ définies comme précédemment et f ∈ Cc (Rd ), on a alors Z Z 1 |∇Φ(x)|f (x)dx f (x)dσ(x) = lim+ δ→0 δ Ω ∂Ω δ où Ωδ := {x ∈ Ω : Φ(x) > −δ}. 42 Preuve: On peut supposer sans perte de généralité que supp(f ) ⊂ U où U est un ouvert tel que U ∩ {Φ = t} soit de la forme donnée par (2.3) pour tout t ∈]−ε, ε[. Pour δ < ε on a alors Ωδ ∩U = {(x′ , g(x′ , t)), x′ ∈ Q′ , t ∈]−δ, 0[}. En notant que le Jacobien du changement de variables (x′ , t) 7→ (x′ , g(x′ , t)) est ∂t g(x′ , t), il vient donc Z Z 0Z |∇Φ(x)|f (x)dx = |∇Φ(x′ , g(x′ , t))|f (x′ , g(x′ , t))|∂t g(x′ , t)|dx′ dt. Ωδ −δ Q′ (2.7) Par construction on a Φ(x′ , g(x′ , t)) = t, pour tout (x′ , t) ∈ Q′ ×] − ε, ε[, en dérivant cette relation par rapport à t et à x′ on a en particulier ∂d Φ(x′ , g(x′ , t))∂t g(x′ , t) = 1, ∇x′ Φ(x′ , g(x′ , t)) = −∂d Φ(x′ , g(x′ , t))∇x′ g(x′ , t). (2.8) On en déduit alors que |∇Φ(x′ , g(x′ , t))|2 = |∂d Φ(x′ , g(x′ , t))|2 + |∇x′ Φ(x′ , g(x′ , t))|2  = |∂d Φ(x′ , g(x′ , t))|2 1 + |∇x′ g(x′ , t)|2 . 1 + |∇x′ g(x′ , t)|2 . = |∂t g(x′ , t)|2 En substituant la relation précédente dans (2.7), il vient Z Z Z p 1 1 0 f (x′ , g(x′ , t)) 1 + |∇x′ g(x′ , t)|2 dx′ dt. |∇Φ(x)|f (x)dx = δ Ωδ δ −δ Q′ On conclut aisément à partir de l’expression précédente, en utilisant les théorèmes de Fubini et de convergence dominée de Lebesgue. ✷ On rappelle que la divergence d’un champ de vecteurs ϕ = (ϕ1 , . . . , ϕd ) ∈ C 1 (Rd , Rd ) est par définition donnée par d X ∂ ϕi (x) = tr(Dϕ(x)), ∀x ∈ Rd . div(ϕ(x)) := ∂x i i=1 Notons que si ϕ ∈ Cc1 (Ω, Rd ), alors Z div(ϕ) = 0. Ω 43 Théorème 2.1 (Formule de Stokes) Soit Ω un ouvert de classe C 1 de Rd et ϕ ∈ Cc1 (Rd , Rd ), on a Z Z ϕ(x) · n(x)dσ(x) div(ϕ) = ∂Ω Ω Preuve: Notons d’abord que si η ∈ C 1 (Rd , R) et η ≡ 1 sur un voisinage de ∂Ω on a Z Z Z η div(ϕ) + ∇η · ϕ div(ηϕ) = div(ϕ) = Ω Ω Ω car (η − 1)ϕ|Ω est à support compact dans Ω. Soit maintenant pour ε > 0 et δ > 0, ηε,δ = fδ (ε−1 Φ) avec fδ = ρδ/2 ⋆ gδ et gδ paire, à support dans [−1, 1], valant 1 sur [−δ, δ] et affine entre δ et 1. On a donc Z Z ηε,δ div(ϕ) + ∇ηε,δ · ϕ. div(ϕ) = Ω Ω Le théorème de convergence dominée implique que le premier terme dans le membre de droite de l’égalité précédente tend vers 0 quand ε → 0+ (et ce uniformément en δ ∈ [0, δ0 ], δ0 > 0). Quant au second terme, il se réecrit sous la forme : Z 1 f˙δ (ε−1 Φ)∇Φ · ϕ. ε Ωε(1+δ/2) Pour ε > 0 assez petit, il est facile de voir que {Φ = −ε} ∩ supp(ϕ) est de mesure nulle, ainsi, pour un tel ε, en appliquant à nouveau le théorème de convergence dominée, la quantité précédente converge quand δ → 0+ vers Z 1 ∇Φ · ϕ. ε Ωε En vertu du lemme 2.5, on a enfin Z Z Z 1 ∇Φ lim ∇Φ · ϕ = · ϕdσ = ϕ · ndσ ε→0+ ε Ωε ∂Ω |∇Φ| ∂Ω ce qui achève la preuve. ✷ Mentionnons maintenant quelques formules d’intégration par parties, corollaires immédiats de la formule de Stokes. Pour u et v dans Cc1 (Rd , R), et i = 1, . . . , d, on a d’abord la formule d’intégration par parties Z Z Z uv ni dσ. (2.9) u ∂i v = − ∂i u v + Ω ∂Ω Ω 44 Pour ϕ ∈ Cc1 (Rd , Rd ) et u ∈ Cc1 (Rd , R), en utilisant div(uϕ) = u div(ϕ) + ∇u · ϕ, on obtient Z Z Z u ϕ · ndσ. (2.10) u div(ϕ) = − ∇u · ϕ + ∂Ω Ω Ω En particulier, lorsque ϕ = ∇v avec v ∈ Cc2 (Rd , R), et en rappelant que ∆v := div(∇v) et que ∂v/∂n := ∇v · n, on obtient les formules de Green : Z Z Z ∂v u dσ, ∇v · ∇u = − ∆v u + (2.11) ∂Ω ∂n Ω Ω et Z Ω 2.2 ∆v u = Z ∆u v + Ω Z ∂Ω  ∂v ∂u u −v ∂n ∂n  dσ. (2.12) Définitions et propriétés premières des distributions Définition 2.1 On appelle distribution sur Ω toute forme linéaire continue sur l’espace des fonctions-test D(Ω) (muni de sa topologie usuelle telle que définie au chapitre précédent) et l’on note D′ (Ω) l’ensemble des distributions sur Ω. Pour T forme linéaire sur D(Ω) et ϕ ∈ D(Ω), on notera désormais hT, ϕi plutôt que T (ϕ). Au risque de nous répéter, rappelons que les résultats du chapitre précédent, impliquent en particulier que si T est une forme linéaire sur D(Ω) on a les équivalences entre : – T ∈ D′ (Ω) (T est une distribution sur Ω), – pour tout compact K ⊂ Ω il existe m ∈ N et C ≥ 0 tels que | hT, ϕi | ≤ C pm,K (ϕ) = C sup{|∂ α ϕ(x)|, x ∈ K, α ∈ Nd , |α| ≤ m}, ∀ϕ ∈ D(Ω) : supp(ϕ) ⊂ K, – T est séquentiellement continue sur D(Ω) : i.e. si ϕn → ϕ dans D(Ω) (ce qui rappelons le signifie qu’il existe un compact K tel que pour tout n, ϕn et ϕ soient à support dans K et ∂ α ϕn converge uniformément vers ∂ α ϕ pour tout α ∈ Nd ) alors hT, ϕn i → hT, ϕi. – T est séquentiellement continue en 0, 45 – pour tout compact K ⊂ Ω, la restriction de T à DK (Ω) est continue. On munit D′ (Ω) de la topologie faible-∗, i.e. de la topologie d’evtlcs associée à la famille de semi-normes T 7→ | hT, ϕi | pour ϕ ∈ D(Ω). On dira qu’une suite (Tn )n de distributions sur Ω converge au sens des distributions vers T ∈ D′ (Ω) (ce que l’on notera simplement Tn → T dans D′ (Ω)) si hTn , ϕi → hT, ϕi, ∀ϕ ∈ D(Ω). Exemples Soit f ∈ L1loc (Ω) alors f définit une distribution {f } via : Z f ϕ, ∀ϕ ∈ D(Ω). h{f }, ϕi := Ω Soit a ∈ Ω, on appelle masse de Dirac en a et l’on note δa la distribution définie par hδa , ϕi := ϕ(a),P∀ϕ ∈ D(Ω). De même pour α ∈ Nd , ϕ 7→ ∂ α ϕ(a) (j) est une distribution ; ϕ 7→ ∞ j=0 ϕ (j) est une distribution sur R... On notera aussi que si (ρε )ε est une famille régularisante, alors {ρε } → δ0 quand ε → 0 dans D′ (Rd ). (Valeur principale de 1/x) Pour ϕ ∈ D(R), Z ϕ(x) dx x |x|>ε admet une limite quand ε → 0, que l’on note hVP(1/x), ϕi ; VP(1/x) est une distribution sur R appelée valeur principale de 1/x. Comme D(Ω) s’injecte continûment dans E(Ω) = C ∞ (Ω), les éléments de E ′ (Ω) définissent (par restriction à D(Ω)) des distributions sur Ω appelées distribution à support compact (cette terminologie sera justifiée ultérieurement). Rappelons ici qu’une forme linéaire T sur E(Ω) appartient à E ′ (Ω) si et seulement s’il existe un compact K de Ω, m ∈ N et C ≥ 0 tels que | hT, ϕi | ≤ Cpm,K (ϕ) = C sup sup |∂ α ϕ(x)|, ∀ϕ ∈ E(Ω). x∈K |α|≤m De la même manière, les éléments de S ′ (dual topologique de l’espace de Schwartz S) sont des distributions sur Rd appelées distributions tempérées (cadre naturel comme nous le verrons plus loin pour la transformation de Fourier). Par définition même, une forme linéaire T sur S appartient à S ′ si et seulement s’il existe m et k dans N et C ≥ 0 tels que | hT, ϕi | ≤ C sup sup (1 + |x|k )|∂ α ϕ(x)|, ∀ϕ ∈ S. x∈Rd |α|≤m Par exemple VP(1/x) est une distribution tempérée sur R. 46 Enfin, pour m ∈ N, les (restrictions à D(Ω) des) éléments de (Ccm (Ω))′ sont appelées distributions d’ordre au plus m (les distributions d’ordre 0 étant appelées mesures de Radon sur Ω, le terme ”mesure” sera justifié et explicité au chapitre 6). Une forme linéaire T sur Ccm (Ω) (muni comme au m (Ω)) est continue si pour chapitre 1 de sa topologie, limite inductive des CK j tout compact K ⊂ Ω il existe C ≥ 0 telle que | hT, ϕi | ≤ C sup sup |∂ α ϕ(x)|, ∀ϕ ∈ Ccm (Ω) : supp(ϕ) ⊂ K. x∈K |α|≤m Lemme 2.6 Soit (ϕn )n ∈ D(Ω)N , Tn ∈ D′ (Ω)N , ϕ ∈ D(Ω) et T ∈ D′ (Ω) tels que ϕn → ϕ dans D(Ω) et Tn → T dans D′ (Ω) alors hTn , ϕn i → hT, ϕi. Preuve: On écrit hTn , ϕn i−hT, ϕi = hTn − T, ϕi+hTn , ϕn − ϕi, le premier terme tend vers 0 par convergence de Tn vers T et le second aussi en vertu du Théorème de Banach-Steinhaus (sous la forme de la proposition 1.7). ✷ Lemme 2.7 Soit f ∈ L1loc (Ω) alors {f } = 0 dans D′ (Ω) si et seulement si f = 0 p.p. Preuve: Supposons {f } = 0 dans D′ (Ω) et soit K un compact de Ω. Soit ε > 0 avec ε < d(K, Rd \ Ω) et fε := ρε ⋆ (χK f /(|f | + ε)). Par le théorème de convergence Rdominée de Lebesgue, en passant à la limite dans h{f }, fε i = 0 on obtient |f | = 0. K ✷ Définition 2.2 Soit U un ouvert inclus dans Ω, x0 ∈ Ω et T1 et T2 deux distributions sur Ω. On dit que T1 = T2 sur U si hT1 , ϕi = hT2 , ϕi pour tout ϕ ∈ D(Ω) telle que supp(ϕ) ⊂ U . On dit que T1 et T2 sont égales au voisinage de x0 s’il existe un voisinage ouvert de x0 dans Ω sur lequel T1 = T2 . On a alors : Lemme 2.8 Soit T1 et T2 deux distributions sur Ω. Si T1 et T2 sont égales au voisinage de tout point de Ω alors T1 = T2 . Preuve: Soit ϕ ∈ D(Ω) et K := supp(ϕ). Il existe alors un nombre fini d’ouverts U1 , ..., Uk de Ω recouvrant K et tels que T1 = T2 sur chacun des Ui . Soit θi 47 une partition de l’unité subordonnée au recouvrement de K par les Ui , on a alors k X hT1 − T2 , ϕi = hT1 − T2 , θi ϕi i=1 et chacun des termes de la somme précédente est nul car θi ϕ ∈ D(Ω) et supp(θi ϕ) ⊂ Ui . ✷ La réunion de tous les ouverts sur lesquels une distribution est nulle est ainsi le plus grand ouvert sur lequel cette distribution est nulle. Le support d’une distribution est alors défini comme suit Définition 2.3 (Support d’une distribution) Soit T ∈ D′ (Ω) on appelle support de T et l’on note supp(T ) le complémentaire dans Ω du plus grand ouvert sur lequel T est nulle. On dit que T est à support compact si son support est compact. Exemples Si f ∈ L1loc , supp{f } est le complémentaire du plus grand ouvert sur lequel f = 0 p.p, supp(δa ) = {a}, sur R, supp(VP(1/x) = R... Le résultat suivant permet d’identifier l’ensemble des distributions à support compact à E ′ (Ω)(= ∪m (C m (Ω)′ )) : Proposition 2.1 Soit T ∈ E ′ (Ω) alors la restriction de T à D(Ω) est une distribution à support compact. Réciproquement si T est une distribution à support compact, alors T se prolonge de manière unique en une forme linéaire continue sur E(Ω). Preuve: Si T ∈ E ′ (Ω) alors il existe un compact K ⊂ Ω, m ∈ N et C ≥ 0 tels que : | hT, ϕi | ≤ C sup sup |∂ α ϕ(x)|, ∀ϕ ∈ E(Ω) x∈K |α|≤m ce qui implique évidemment que supp(T ) ⊂ K. Réciproquement, soit T une distribution à support compact supp(T ) := K. Soit ψ ∈ D(Ω) une fonction plateau valant 1 sur un voisinage de K. Pour ϕ ∈ E(Ω), posons alors E D Te, ϕ := hT, ψϕi . En utilisant la formule de Leibniz, il est facile de voir que Te ∈ E ′ (Ω) et par construction, Te prolonge T à E(Ω). Pour montrer l’unicité de ce prolongement, il suffit de remarquer que D(Ω) est séquentiellement dense dans E(Ω) (troncature par multiplication par fonction plateau). ✷ Passons maintenant à la notion d’ordre d’une distribution : 48 Définition 2.4 (Distributions d’ordre fini) Soit T ∈ D′ (Ω) et m ∈ N, on dit que T est une distribution d’ordre ≤ m si et seulement si pour tout compact K ⊂ Ω, il existe une constante C telle que | hT, ϕi | ≤ C sup sup |∂ α ϕ(x)|, ∀ϕ ∈ D(Ω) supp(ϕ) ⊂ K. x∈K |α|≤m Il est clair à partir de la définition précédente que T est une distribution d’ordre ≤ m si et seulement si T se prolonge continûment à Ccm (Ω) qu’on identifie souvent l’espace des distributions d’ordre ≤ m à (Ccm (Ω))′ . Rappelons aussi que l’espace des distributions d’ordre 0 (identifié à (Cc0 (Ω))′ ) est l’espace des mesures de Radon sur Ω. Par définition, les distributions d’ordre fini sont les distributions d’ordre ≤ m pour un certain m ∈ N. Enfin, on dit qu’une distribution est d’ordre m si elle est d’ordre ≤ m mais n’est pas d’ordre ≤ m − 1. On déduit immédiatement de la proposition 2.1 le résultat suivant : Proposition 2.2 Toute distribution à support compact est d’ordre fini. Exemples Si f ∈ L1loc alorsP{f } est d’ordre 0, de même que δa . Sur R, VP(1/x) est d’ordre 1, et ϕ 7→ j ϕ(j) (j) est d’ordre infini. Soit ψ ∈ E(Ω), alors l’application ”multiplication par ψ” : ϕ ∈ D(Ω) 7→ ψϕ est un endomorphisme continu de D(Ω). On peut donc définir la multiplication d’une distribution et d’une fonction C ∞ par transposition comme suit : Définition 2.5 Soit ψ ∈ E(Ω) et T ∈ D′ (Ω) on appelle produit de T et ψ et l’on note ψT la distribution définie par : hψT, ϕi := hT, ψϕi , ∀ϕ ∈ D(Ω). On remarque que pour ψ ∈ E(Ω) et T ∈ D′ (Ω) on a supp(ψT ) ⊂ supp(ψ) ∩ supp(T ). En considérant une suite de fonction-plateaux ηn et Tn = ηn T , il est facile de voir que Tn est une suite de distributions à support compact convergeant vers T . Ainsi E ′ (Ω) est séquentiellement dense dans D′ (Ω). La dérivation des distributions se définit aussi par transposition : Définition 2.6 (Dérivées d’une distribution) Soit T ∈ D′ (Ω) et α ∈ Nd on définit la distribution ∂ α T par : h∂ α T, ϕi := (−1)|α| hT, ∂ α ϕi , ∀ϕ ∈ D(Ω). 49 Il résulte de la définition précédente que si Tn → T dans D′ (Ω) alors ∂ α T → ∂ α T dans D′ (Ω) pour tout α ∈ Nd . On notera ∂i T les dérivées partielles premières de T , ∇T = (∂1 T, ..., ∂d T ). Notons également que si T est d’ordre ≤ m alors ∂ α T est d’ordre ≤ |α| + m. L’intérêt de la définition précédente est évident : il permet de dériver les distributions et donc en particulier les fonctions de L1loc , les mesures etc.... Evidemment si T = {f } avec f ∈ C 1 (Ω) alors ∂i {f } = {∂i f } autrement dit les dérivées partielles au sens des distributions et au sens classique coı̈ncident dans ce cas. Il convient de retenir que l’idée dans la définition précédente est de faire porter les dérivées sur les fonctions-test (nous retrouverons cette idée quand nous verrons la formulation variationnelle de certains problèmes aux limites). On peut ainsi chercher à résoudre des EDP’s linéaires dans un espace beaucoup plus gros (et donc dans lequel on a plus de chance d’effectivement trouver des solutions) que l’espace des fonctions pour lesquelles les dérivées intervenant dans l’équation ont un sens classique. Exemples Soit H la fonction de Heaviside : H(x) = 0 pour x < 0 et H(x) = 1 pour x ≥ 0, un calcul immédiat donne {H}′ = δ0 . De même la dérivée de {|x|} est la fonction signe. Exercice 2.3 Montrer que x 7→ log(|x|) est une distribution tempérée sur R et que sa dérivée est VP(1/x). Pour ϕ ∈ D(R) on pose :   Z ϕ(x) − ϕ(0) 1 dx PF( 2 ), ϕ := lim+ ε→0 x x2 |x|≥ε montrer que PF( x12 ) est une distribution (appelée partie finie de 1/x2 ) et que c’est la dérivée de VP( x1 ). Donner une formule générale pour la dérivée d’une fonction C 1 par morceaux d’une variable. On remarquera que supp(∂ α T ) ⊂ supp(T ) et qu’évidemment le théorème de Schwarz se transpose aux distributions : ∂i (∂j T ) = ∂j (∂j T ). De même la formule de Leibniz se transpose immédiatement au produit ψT avec ψ ∈ E(Ω) et T ∈ D′ (Ω) : X ∂ α (ψT ) = Cαβ ∂ α−β ψ ∂ β T. β≤α On définit alors les espaces de Sobolev (que nous étudierons plus en détail au chapitre 7) de la manière suivante : Définition 2.7 Soit p ∈ [1, +∞], on définit l’espace de Sobolev d’ordre 1 : W 1,p (Ω) := {f ∈ Lp (Ω) : ∂i {f } ∈ Lp , ∀i ∈ {1, ..., d}} 50 pour m ∈ N, m ≥ 1, on définit l’espace de Sobolev d’ordre m W m,p (Ω) := {f ∈ Lp (Ω) : ∂ α {f } ∈ Lp , ∀α : |α| ≤ m}. Exercice 2.4 Soit T ∈ E ′ (Ω) une distribution à support compact d’ordre ≤ m et ϕ ∈ E(Ω) telle que ∂ α ϕ = 0 sur supp(T ) pour tout |α| ≤ m. Montrer que hT, ϕi = 0. Exercice 2.5 L’objectif de cet exercice est de montrer que toute distribution à support dans {x} est combinaison linéaire de δx et ses dérivées (utiliser l’exercice précédent et un développement de Taylor). 2.3 Convolution et régularisation Dans ce paragraphe, sauf mention explicite du contraire nous nous placerons dans le cas de l’espace Rd tout entier et ce afin de ne pas avoir à discuter des questions (parfois plus subtiles qu’il n’y parait) des domaines de définition. Pour ϕ ∈ D(Rd ) on définit ϕ̌ par ϕ̌(x) := ϕ(−x) pour tout x ∈ Rd . Pour T ∈ D′ (Rd ) on définit alors Ť ∈ D′ (Rd ) (symétrique de T ) par Ť , ϕ = hT, ϕ̌i , ∀ϕ ∈ D(Rd ). Evidemment la définition précédente fait aussi sens sur un ouvert symétrique Ω. Pour h ∈ Rd et ϕ ∈ D(Rd ) on note τh ϕ la translatée de ϕ définie par τh ϕ(x) := ϕ(x +h), ∀x ∈ Rd . Pour T ∈ D′ (Rd ) on définit alors la distribution translatée τh T ∈ D′ (Rd ) par hτh T, ϕi = hT, τ−h ϕi , ∀ϕ ∈ D(Rd ). Lemme 2.9 Soit ϕ ∈ E(Rd × RN ) telle que tout r > 0 il existe M (r) > 0 tel que supp(ϕ(., y)) ⊂ B d (M (r)) pour tout y ∈ B N (r) et soit T ∈ D′ (Rd ). L’application y ∈ RN 7→ hT, ϕ(., y)i est de classe C ∞ sur RN et l’on a ∂ α (hT, ϕ(., y)i) = T, ∂yα ϕ(., y) , ∀α ∈ NN , ∀y ∈ RN . 51 Preuve: Posons pour tout y ∈ RN G(y) := hT, ϕ(., y)i. Soit h ∈ Rd et t ∈ R 6= 0, on a alors t−1 (G(y + th) − G(y)) = hT, t−1 (ϕ(., y + th) − ϕ(., y))i. On montre aisément sous les hypothèses précédentes que t−1 (ϕ(., y+th)−ϕ(., y)) converge dans D(Rd ) vers ∇y ϕ(., y) · h de sorte que G est Gâteaux dérivable avec G′ (y)(h) = hT, ∇y ϕ(., y) · hi. Comme y 7→ ∇y ϕ(., y) est continue de RN dans D(Rd ), on en déduit que G est de classe C 1 et ∇G(y) = hT, ∇y ϕ(., y)i. En itérant l’argument précédent, on obtient que G est de classe C ∞ et ∂ α G(y) = T, ∂yα ϕ(., y) , ∀α ∈ NN , ∀y ∈ RN . ✷ Lemme 2.10 (Lemme fondamental du calcul intégral) Soit T ∈ D′ (Rd ), ϕ ∈ D(Rd ) et x ∈ Rd , on a : Z 1 hT, τtx ∇ϕ · xi dt. hT, τx ϕi − hT, ϕi = 0 Preuve: Posons pour tout t ∈ [0, 1] g(t) := hT, τtx ϕi. Soit t ∈ (0, 1) et h 6= 0 tel que t + h ∈ (0, 1) on a alors h−1 (g(t + h) − g(t)) = hT, ψh i avec ψh = h−1 (τ(t+h)x ϕ − τtx ϕ) et il est facile de voir que ψh → τtx ∇ϕ · x dans D(Rd ) quand h → 0 de sorte que g est dérivable (et même de classe C ∞ ) avec g ′ (t) = hT, τtx ∇ϕ · xi. Ainsi Z 1 Z 1 ′ hT, τtx ∇ϕ · xi dt. g (t)dt = hT, τx ϕi − hT, ϕi = g(1) − g(0) = 0 0 ✷ On cherche maintenant à définir la convolution d’une distribution et d’une fonction-test et ce, évidemment de manière à étendre la convolution des fonctions telle que définie au début de ce chapitre. Soit f ∈ L1loc pour g ∈ D, f ⋆ g est la fonction C ∞ définie pour tout x ∈ Rd par : Z (f ⋆ g)(x) = f (y)g(x − y)dy = h{f }, g(x − .)i = h{f }, τ−x ǧi , ∀x ∈ Rd . Rd Une première stratégie pour définir T ⋆ g (avec T ∈ D′ et g ∈ D) est donc de considérer (T ⋆ g) comme la fonction x 7→ hT, τ−x ǧi (qui, en vertu du lemme 2.9 est C ∞ ). Revenant au cas f ∈ L1loc , on peut aussi considérer f ⋆ g 52 comme une distribution c’est à dire à partir de son action sur les fonctionstest ϕ ∈ D : Z Z h{f ⋆ g}, ϕi = ϕ(x) f (y)g(x − y)dydx Rd Rd Z Z ϕ(x)ǧ(y − x)dxdy = h{f }, ǧ ⋆ ϕi . f (y) = Rd Rd Ce qui suggère une deuxième stratégie pour définir T ⋆ g comme une distribution. Nous verrons un peu plus loin qu’en fait ces deux points de vue coı̈ncident. Définition 2.8 Soit T ∈ D′ (Rd ) et g ∈ D(Rd ). On définit la convolée de T et de g en tant que fonction C ∞ (i.e. (T ⋆1 g) ∈ E(Rd )) par : (T ⋆1 g)(x) := hT, τ−x ǧi , ∀x ∈ Rd . On définit la convolée de T et de g en tant que distribution (i.e. (T ⋆2 g) ∈ D′ (Rd )) par : h(T ⋆2 g), ϕi := hT, ǧ ⋆ ϕi , ∀ϕ ∈ D(Rd ). En posant G := Zd l’ensemble des points de Rd à coordonnées entières, un exercice standard sur les sommes de Riemann, laissé au lecteur, donne Lemme 2.11 Soit F ∈ Cc (Rd × Rd ), et soit Z X F (εx, y), ∀ε > 0, ∀y ∈ Rd F (x, y)dx, fε (y) := εd f (y) := Rd x∈G alors fε converge uniformément vers f . Pour g et ϕ dans D(Rd ), on déduit facilement du lemme précédent que X τ−εx ǧ ϕ(εx) → ǧ ⋆ ϕ dans D(Rd ) (2.13) εd x∈G quand ε → 0. Ceci permet de conclure que les deux notions de convolution définies plus haut coı̈ncident : Lemme 2.12 Soit T ∈ D′ (Rd ) et g ∈ D(Rd ), on a {T ⋆1 g} = T ⋆2 g. 53 Preuve: Soit ϕ ∈ D(Rd ), on a d’abord Z X h{T ⋆1 g}, ϕi = hT, τ−εx ǧi ϕ(εx). hT, τ−x ǧi ϕ(x)dx = lim εd ε→0 Rd x∈G Par continuité et linéarité de T , on a ensuite en utilisant (2.13) : * + X lim+ T, εd τ−εx ǧ ϕ(εx) = hT, ǧ ⋆ ϕi = hT ⋆2 g, ϕi . ε→0 x∈G ✷ Evidemment par la suite, nous noterons la convolution de T ∈ D′ (Rd ) et g ∈ D(Rd ) simplement sous la forme T ⋆ g. Lemme 2.13 Soit T ∈ D′ (Rd ), g ∈ D(Rd ) et α ∈ Nd , on a alors ∂ α (T ⋆ g) = ∂ α T ⋆ g = T ⋆ ∂ α g. Preuve: Soit ϕ ∈ D(Rd ), on a h∂ α (T ⋆ g), ϕi = (−1)|α| hT, ǧ ⋆ ∂ α ϕi = (−1)|α| hT, ∂ α (ǧ ⋆ ϕ)i = h∂ α T ⋆ g, ϕi . et donc ∂ α (T ⋆ g) = ∂ α T ⋆ g. Pour l’autre identité, on remarque que ∂ˇα g = (−1)|α| ∂ α ǧ et donc h∂ α (T ⋆ g), ϕi = (−1)|α| hT, ∂ α ǧ ⋆ ϕ)i = T, ∂ˇα g ⋆ ϕ = hT ⋆ ∂ α g, ϕi . ✷ Lemme 2.14 Soit T ∈ D′ (Rd ), g ∈ D(Rd ) et α ∈ Nd , on a alors supp(T ⋆ g) ⊂ supp(T ) + supp(g). Preuve: Soit ω un ouvert inclus dans Rd \ (supp(T ) + supp(g)) et ϕ ∈ D(Rd ) avec supp(ϕ) ⊂ ω ; il s’agit de montrer que hT ⋆ g, ϕi = 0. Or hT ⋆ g, ϕi = hT, ǧ ⋆ ϕi et supp(ǧ ⋆ϕ) ⊂ ω −supp(g) ⊂ Rd \supp(T ) et donc hT ⋆ g, ϕi = 0. ✷ 54 Le lemme précédent montre que si S ∈ E ′ (Rd ) et ϕ ∈ D(Rd ) alors S ⋆ g ∈ D(Rd ) ce qui permet de définir le produit de convolution de deux distributions dont l’une est à support compact S ∈ E ′ (Rd ) et T ∈ D′ (Rd ) par hT ⋆ S, ϕi = T, Š ⋆ ϕ , ∀ϕ ∈ D(Rd ). On a alors E ′ ⋆ D′ ⊂ D′ et E ′ ⋆ E ′ ⊂ E ′ . Notons aussi que T ⋆ δ0 = T pour tout T ∈ D′ (Rd ). En utilisant le fait que S ⋆ S ⊂ S et en définissant pour T ∈ S ′ et g ∈ S la convolution de T ⋆g comme précédemment (i.e. hT ⋆ g, ϕi = hT, ǧ ⋆ ϕi , ∀ϕ ∈ D(Rd )) il est facile de voir qu’en fait cette définition coı̈ncide avec la convolution de T et g en tant que fonction ((T ⋆ g(x)) := hT, τ−x ǧi pour tout x) et que T ⋆ g ∈ S ′ ∩ E. Enfin, pour m ∈ Mloc (Rd ) et ϕ ∈ Cc (Rd ) la convolution de m et ϕ est la fonction continue définie par : Z ϕ(x − y)dm(y). (m ⋆ ϕ)(x) := Rd Lemme 2.15 Soit T ∈ D(Rd ) et (ρε )ε une famille régularisante alors T ⋆ ρε converge vers T dans D′ (Rd ) quand ε → 0+ . Preuve: Soit ϕ ∈ D(Rd ) on a hT ⋆ ρε , ϕi = hT, ρˇε ⋆ ϕi et on conclut en utilisant le fait que ρˇε ⋆ ϕ converge vers ϕ dans D(Rd ). ✷ Comme T ⋆ ρε ∈ E(Rd ), on déduit du lemme précédent que E(Rd ) est séquentiellement dense dans D′ (Rd ). Par des argument classiques de troncature, on en déduit le résultat de densité suivant : Théorème 2.2 Soit Ω un ouvert de Rd alors D(Ω) est séquentiellement dense dans D′ (Ω). Preuve: Soit Kn une suite exhaustive de compacts de Ω, ηn ∈ D(Ω) avec supp(ηn ) ⊂ Kn+1 et ηn ≡ 1 sur Kn et soit ρn une suite régularisante telle qu’en outre supp(ρn ) + Kn+1 ⊂ Ω. Soit T ∈ D′ (Ω) et Tn := (ηn T ) ⋆ ρn , on a alors Tn ∈ D(Ω) et Tn converge vers T dans D′ (Ω) quand n → +∞. ✷ Lemme 2.16 (Lemme de Dubois-Reymond) Soit T ∈ D′ (Ω) telle que ∇T soit une fonction continue alors T est une fonction de classe C 1 et ses dérivées premières au sens des distributions et au sens classique coı̈ncident. 55 Preuve: Notons ∇T = {G} (avec G continue sur Ω). Soit x0 ∈ Ω et r > 0 tels que B(x0 , r) ⊂ Ω, soit r0 ∈ (0, r) et ε ∈ (0, r − r0 ). On peut alors définir Tε := ρε ⋆T à la fois comme distribution sur B(x0 , r0 ) (étant entendu que l’on prolonge par 0 en dehors de B(x0 , r0 ) les fonctions-test de D(B(x0 , r0 ))) et comme fonction C ∞ sur B(x0 , r0 ). En particulier sur B(x0 , r0 ), on a ∇Tε = Gε = ρε ⋆ G, de sorte que pour tout x, y dans B(x0 , r0 ), on a : Z 1 Gε (x + t(y − x)) · (y − x)dt. (2.14) Tε (y) − Tε (x) = 0 Comme r0 + ε < r, et G est bornée sur B(x0 , r), on a aussi sup |Gε | ≤ sup |G| := K < +∞. B(x0 ,r0 ) (2.15) B(x0 ,r) On déduit de (2.16) et (2.15) que Tε est une famille équilipschitzienne sur B(x0 , r0 ). Comme Tε converge dans D′ (B(x0 , r0 )) il est facile d’en déduire que Tε est uniformément bornée sur B(x0 , r0 ) (sans quoi il existerait une sous suite qui convergerait uniformémentRvers +∞ ou −∞ ce qui est incompatible avec la convergence des intégrales B(x0 ,r0 ) Tε ϕ avec ϕ ∈ D(B(x0 , r0 ))). On déduit donc du théorème d’Ascoli qu’il existe une suite εn tendant vers 0 telle que Tn := Tεn converge uniformément sur B(x0 , r0 ) vers une fonction continue f . On a évidemment h{f }, ϕi = hT, ϕi pour tout ϕ ∈ D(Ω) avec supp(ϕ) ⊂ B(x0 , r0 ) de sorte que T coı̈ncide avec une fonction continue sur B(x0 , r0 ). Enfin, en passant à la limite dans (2.16), on obtient que pour tout x, y dans B(x0 , r0 ), on a : Z 1 G(x + t(y − x)) · (y − x)dt (2.16) f (y) − f (x) = 0 de sorte que f est de classe C 1 et ∇f = G sur B(x0 , r0 ). Le résultat cherché étant de nature locale, sa preuve en est achevée. ✷ Comme corollaire immédiat du résultat précédent, on a : Lemme 2.17 Soit Ω un ouvert connexe de Rd et T ∈ D′ (Ω) telle que ∇T = 0 alors il existe une constante C telle que T = {C}. Exercice 2.6 Montrer que S ne possède pas d’élément neutre pour ⋆. 56 2.4 Transformation de Fourier Définition 2.9 Soit f ∈ L1 := L1 (Rn ), la transformée de Fourier de f est la fonction notée fˆ (ou F(f )) définie pour tout ξ ∈ Rd par Z ˆ e−ix·ξ f (x)dx. F(f )(ξ) = f (ξ) = Rd Dans la définition précédente, x · ξ est le produit scalaire usuel de x et ξ. On rencontre dans la littérature un certain nombre d’autres définitions de la transformée de Fourier, consistant par exemple à considérer e−2iπx·ξ plutôt que e−ix·ξ dans la définition précédente, ou encore à diviser l’expression de F(f ) donnée ci-dessus par (2π)d ou (2π)d/2 ... Il s’agit là d’une affaire de convention ou de commodité d’écriture sans grande importance. En notant C0 = C0 (Rd ) l’espace des fonctions continues sur Rd tendant vers 0 à l’infini, on a alors : Lemme 2.18 Pour tout f ∈ L1 , on a fˆ ∈ C0 (i.e. fˆ est continue et tend vers 0 à l’infini) et kfˆk∞ ≤ kf kL1 . Preuve: La continuité de fˆ découle immédiatement du théorème de convergence dominée de Lebesgue et l’estimation uniforme est évidente. Seul le fait que fˆ tend vers 0 à l’infini (c’est le lemme de Riemann-Lebesgue) est réellement à démontrer. Un calcul immédiat donne le résultat dans le cas où f est l’indicatrice d’un pavé, on conclut le cas général par densité des combinaisons linéaires de telles indicatrices dans Cc puis par densité de Cc dans L1 . ✷ Notons que pour f ∈ L1 , on n’a pas en général fˆ ∈ L1 . En effet, si f est l’indicatrice de [−a, a]d , un calcul immédiat donne sin(ξj a) fˆ(ξ) = 2d Πdj=1 ξj qui n’est pas (Lebesgue) intégrable. Un changement de variable et le théorème de Fubini impliquent immédiatement que si f et g sont dans L1 (Rd ) on a l’identité : F(f ⋆ g) = F(f )F(g). 57 (2.17) Lemme 2.19 (Dérivation et transformée de Fourier) Soit f ∈ L1 (Rd ) telle que xj f ∈ L1 (Rd ) alors F(f ) admet une dérivée partielle par rapport à ξj et F(xj f ) = i∂j F(f ). Soit f ∈ L1 (Rd ) telle que ∂j f ∈ L1 (Rd ) alors F(∂j f ) = iξj F(f ). Preuve: Le premier point découle simplement du théorème de Lebesgue de dérivation sous le signe somme. Pour le second point, on raisonne par approximation et on se contente de montrer le résultat pour f ∈ Cc1 (Rd ), dans ce cas en effectuant une intégration par parties on a Z Z −ix·ξ F(∂j f )(ξ) = e−ix·ξ f (x)dx. e ∂j f (x)dx = iξj Rd Rd ✷ Lemme 2.20 (Transformée de Fourier de la gaussienne) Soit θ > 0 et 2 fθ (x) := e−|x| /(2θ) , ∀x ∈ Rd , alors on a 2 θ|ξ| fˆθ (ξ) = (2πθ)d/2 e− 2 , ∀ξ ∈ Rd . Preuve: Par produit et un argument d’homogénéité, il suffit de démontrer le résultat pour d = 1 et θ = 1, dans ce cas on considère l’équation différentielle ordinaire linéaire : g ′ (x) + xg(x) = 0, x ∈ R (2.18) dont les solutions sont de la forme Cf1 . En utilisant le lemme 2.19 on a 0 = F(f1′ + xf1 ) = i(ξF(f1 ) + F(f1 )′ ) 2 ainsi F(f1 ) résout (2.18) et donc est de la forme Ce−ξ /2 on conclut en notant que Z Z √ x2 C = fˆ1 (0) = f1 = e− 2 dx = 2π. R R ✷ Lemme 2.21 Soit f et g dans L1 (Rd ), on a Z Z ix·ξ e f (ξ)ĝ(ξ)dξ = fˆ(ξ)g(x + ξ)dξ, ∀x ∈ Rd Rd et donc en particulier Rd Z f (ξ)ĝ(ξ)dξ = Rd Z Rd 58 fˆ(ξ)g(ξ)dξ. Preuve: Comme (y, ξ) → g(y)f (ξ) ∈ L1 , on appliquant le théorème de Fubini on a :  Z Z Z i(x−y)·ξ ix·ξ e g(y)dy f (ξ)dξ e ĝ(ξ)f (ξ)dξ = Rd Rd Rd  Z Z i(x−y)·ξ e f (ξ)dξ g(y)dy = Rd Rd Z Z ˆ = f (y − x)g(y)dy = fˆ(ξ)g(x + ξ)dξ. Rd Rd ✷ Théorème 2.3 (Inversion de la transformation de Fourier) Soit f ∈ L1 (Rd ) telle que fˆ ∈ L1 (Rd ) on a alors Z 1 f (x) = eix·ξ fˆ(ξ)dξ, ∀x ∈ Rd (2π)d Rd si bien qu’en particulier f ∈ C0 (Rd ). Preuve: ε2 |x|2 Pour ε > 0, soit gε (x) := e− 2 , avec les lemmes 2.21 et 2.20, on a : Z Z ε2 |ξ|2 ix·ξ ˆ − 2 e f (ξ)e dξ = ĝε (ξ)f (x + ξ)dξ Rd Rd Z |ξ|2 d/2 ε−d e− 2ε2 f (x + ξ)dξ = (2π) d ZR |y|2 = (2π)d/2 e− 2 f (x + εy)dy. Rd Comme fˆ ∈ L1 , il découle du théorème de convergence dominée de Lebesgue que Z Z ε2 |ξ|2 ix·ξ ˆ − 2 e f (ξ)e lim eix·ξ fˆ(ξ)dξ. dξ = ε→0+ Rd Rd Par ailleurs, il est facile de voir (en procédant par approximation comme au lemme 2.3) que Z |y|2 x 7→ e− 2 f (x + εy)dy Rd converge dans L1 vers (2π)d/2 f quand ε → 0+ , ce qui achève la preuve. ✷ On notera aussi que que la formule d’inversion de la transformée de Fourier peut s’écrire sous la forme F ◦ F(f ) = (2π)d fˇ, ∀f ∈ L1 (Rd ) : F(f ) ∈ L1 . 59 avec fˇ(x) = f (−x), ∀x ∈ Rd . On rappelle que l’espace de Schwartz est défini par : S = {f ∈ C ∞ (Rd ) : sup (1 + |x|k )|∂ β f (x)| < ∞, ∀k ∈ N, ∀β ∈ Nd }. x∈Rd On munit, comme au chapitre 1, S de la famille de semi normes f 7→ sup (1 + |x|k )|∂ β f (x)|, k ∈ N, β ∈ Nd }. x∈Rd Il est facile de voir que les applications suivantes sont des endomorphismes continus de S : f→ 7 ∂ β f (β ∈ Nd ), f → 7 xα f (α ∈ Nd ), f 7→ ψf (ψ ∈ S), f → 7 (1 + |x|2 )s f (s ∈ R). Il résulte du lemme 2.19 que la transformée de Fourier d’un élément de l’espace de Schwartz S est encore dans S et que pour tout f ∈ S et α ∈ Nd on a: F(xα f ) = i|α| ∂ α F(f ), F(∂ α f ) = i|α| ξ α F(f ). (2.19) Autrement dit, F échange la dérivation ∂ α et la multiplication par ξ α . Par ailleurs il est facile de voir que F est un automorphisme continu de S et il découle du théorème 2.3 que F ◦ F(f ) = (2π)d fˇ, ∀f ∈ S. Proposition 2.3 (Formule de Parseval) Soit f ∈ S et g ∈ L1 , alors on a : Z Z −d ¯ f ḡ = (2π) fˆĝ. Rd Rd (Formule de Plancherel) En particulier, pour tout f ∈ S on a kf k2L2 = (2π)−d kfˆk2L2 . Preuve: En utilisant le lemme 2.21 et la formule d’inversion de la transformée de Fourier dans S on a : Z Z Z Z 1 ˆ 1 −1 ˆ f (ξ)ḡˆ(−ξ)dξ f (−ξ)ḡˆ(ξ)dξ = f ḡ = F (f )F(ḡ) = d d (2π) Rd Rd (2π) Rd Rd ¯ et on conclut en remarquant que ḡˆ(−ξ) = ĝ(ξ). 60 ✷ La formule de Plancherel permet de prolonger la transformée de Fourier 2 à L . En effet, en notant J l’injection (continue et dense) de S dans L2 , on a k(J ◦ F)(f )kL2 = (2π)d/2 kf kL2 , ∀f ∈ S de sorte que J ◦ F est une application linéaire de S munie de la topologie trace de L2 dans L2 . Par densité de S dans L2 , J ◦ F admet un unique prolongement linéaire continu à L2 , que l’on notera encore F (ou fˆ avec f ∈ L2 ) et qu’on appelle transformée de Fourier dans L2 . Pour f ∈ L2 ∩ L1 , F(f ) est évidemment défini par Z e−ix·ξ f (x)dx F(f )(ξ) = Rd mais cette formule intégrale n’a pas de sens si f est seulement L2 , dans ce cas F(f ) est la limite dans L2 de F(fn ) avec (fn ) suite de S convergeant dans L2 vers f . Par prolongement/densité, on obtient immédiatement que la transformée de Fourier dans L2 hérite des propriétés suivantes : Proposition 2.4 F est un automorphisme bicontinu de L2 et l’on a la formule d’inversion : F ◦ F(f ) = (2π)d fˇ, ∀f ∈ L2 (Rd ) Pour tous f et g dans L2 on a hf, giL2 = (2π)−d hF(f ), F(g)iL2 (avec hf, giL2 = et donc en particulier R Rd f ḡ) kf kL2 = (2π)−d/2 kF(f )kL2 . Notons qu’il peut parfois être utile d’écrire la formule d’inversion de la transformée de Fourier sous la forme plus explicite : F −1 (f ) = (2π)−d F(fˇ). Nous avons vu que la transformée de Fourier est un automorphisme bicontinu de S, la transformée de Fourier sur S ′ est donc définie par transposition comme suit : 61 Définition 2.10 Soit T ∈ S ′ on appelle transformée de Fourier et l’on note F(T ) ou T̂ la distribution tempérée définie par hF(T ), ϕi = hT, F(ϕ)i , ∀ϕ ∈ S. On vérifie sans peine les propriétés suivantes de la transformée de Fourier dans S ′ : Proposition 2.5 F est un automorphisme (faiblement) bicontinu de S ′ et l’on a la formule d’inversion : F ◦ F(T ) = (2π)d Ť , ∀T ∈ S ′ (avec Ť , ϕ := hT, ϕ̌i, ∀ϕ ∈ S). Pour tout T ∈ S ′ et α ∈ Nd , on a : F(xα T ) = i|α| ∂ α F(T ), F(∂ α T ) = i|α| ξ α F(T ). Evidemment si T ∈ L1 les transformées de Fourier dans L1 et dans S ′ coı̈ncident. Plus généralement si T est une mesure bornée, sa transformée de Fourier est définie par Z T̂ (ξ) := e−ix·ξ dT (x), ∀ξ ∈ Rd Rd et l’on vérifie sans peine que T̂ ∈ Cb (Rd ) et que pour T mesure bornée, la définition précédente coı̈ncide avec F(T ) au sens de S ′ . Un calcul immédiat donne en particulier δˆ0 = 1 ce qui montre que la transformée de Fourier d’une mesure n’est généralement pas dans C0 (Rd ). Nous avons vu que le fait que la transformée de Fourier d’une fonction possède des moments finis se traduit en terme de dérivabilité. On peut donc (dans un cadre L2 ) définir des dérivées fractionnaires par transformée de Fourier, c’est ce qui motive la définition suivante. Pour tout s ∈ R, on définit l’espace de Sobolev H s = H s (Rd ) par H s := {u ∈ S ′ : (1 + |ξ|2 )s/2 û ∈ L2 } on vérifie sans peine que H s est un espace de Hilbert séparable muni du produit scalaire Z s û(ξ)v̂(ξ)) 1 + |ξ|2 dξ hu, viH s := Rd 62 et la norme associée 2 s/2 kukH s := k(1 + |ξ| ) ûkL2 = Z Rd 2 |û(ξ)|  2 s 1 + |ξ| dξ 1/2 . On a évidemment que H 0 = L2 et pour s ∈ N on vérifie sans peine que H s défini précédemment coı̈ncide avec l’espace de Sobolev W s,2 H s = W s,2 = {f ∈ L2 : ∂ α f ∈ L2 , ∀α : |α| ≤ s}. Pour (s, t) ∈ R2 on définit (I − ∆)t/2 : H s+t → H s T 7→ F −1 ((1 + |ξ|2 )t/2 T̂ ) Pour T ∈ H s+t on a alors par définition : k(I − ∆)t/2 T kH s = k(1 + |ξ|2 )(s+t)/2 T̂ kL2 = kT kH s+t de sorte que (I −∆)t/2 est une isométrie linéaire de H s+t dans H s pour tout s (et donc en particulier de H t sur L2 ). On vérifie immédiatement que l’inverse de (I − ∆)s/2 est (I − ∆)−s/2 . Exercice 2.7 Montrer que pour s > d/2, H s ⊂ C0 (Rd ) avec injection continue. Exercice 2.8 Montrer que δ0 ∈ H s dès que s < −d/2. Montrer que l’injection de H s dans S ′ est continue et dense. Soit s1 ≥ s2 montrer que l’injection de H s1 dans H s2 est continue. Exercice 2.9 Montrer que si u ∈ H s et f ∈ S alors uf ∈ H s . Montrer que si u ∈ H s alors ∂ α u ∈ H s−|α| . Montrer que E ′ ⊂ ∪s H s et ∩s H s ⊂ E. Exercice 2.10 Soit m ∈ N∗ montrer que T ∈ H−m si et seulement T = P α 2 |α|≤m ∂ Tα pour des Tα dans L . 63 2.5 Solution fondamentale du Laplacien L’objet de ce paragraphe est de montrer comment ce que nous avons vu dans ce chapitre (convolution et transformée de Fourier notamment) permet de résoudre quelques EDP’s linéaires ”modèle”. Théorème 2.4 Soit d un entier d ≥ 3 et f (x) := 1 , ∀x ∈ Rd , |x|d−2 alors on a −∆f = (d − 2)sd δ0 dans D′ (Rd ) avec sd la mesure superficielle de la sphère unité S d−1 (sd = d|ωd | avec ωd la mesure de Lebesgue de la boule unité). Pour d = 2, soit g(x) := ln(|x|), ∀x ∈ R2 alors on a −∆g = 2πδ0 dans D′ (R2 ). Preuve: On se contentera ici de démontrer le cas d ≥ 3, le cas d = 2 étant similaire. Pour x 6= 0 on a, ∂i |x| = xi /|x| et donc ∂i f (x) = (2 − d)|x|−d xi , ∂ii2 f (x) = (2 − d)|x|−d − d(2 − d)|x|−d−2 x2i , de sorte que ∆f (x) = d(2 − d)|x|−d − d(2 − d)|x|−d−2 |x|2 = 0, ∀x ∈ Rd \ {0}. Comme f ∈ L1loc , on a pour ϕ ∈ D(Rd ), Z Z ∆ϕf = lim+ h−∆f, ϕi = − ε→0 Rd |x|>ε (2.20) −∆ϕf comme f est C ∞ sur Rd \ Bε , en utilisant la formule de Green et (2.20), on a:     Z Z Z ∂f ∂ϕ 1−d 2−d ∂ϕ ϕ ∆ϕf = − −f dσ = ϕ(d − 2)ε −ε dσ. ∂n ∂n ∂n |x|=ε |x|=ε |x|>ε On conclut en remarquant que Z Z 1−d ϕdσ = sd ϕ(0), lim+ ε ε→0 |x|=ε |x|=ε 64 ∂ϕ dσ = O(εd−1 ). ∂n ✷ Le Théorème précédent nous ayant fourni la solution fondamentale du laplacien : g2 (x) = 1 1 , d ≥ 3, ln(|y|), gd (y) = 2π (d − 2)sd |y|d−2 nous pouvons en déduire qu’une solution au sens des distributions de l’équation −∆u = f, dans D′ (Rd ) avec f ∈ E ′ est donnée par convolution avec la solution fondamentale, c’est à dire u = gd ⋆ f . En effet, ∆(gd ⋆ f ) = (∆gd ) ⋆ f = δ0 ⋆ f = f . Notons que l’on n’a pas unicité de la solution au sens des distributions pour l’équation précédente (ajouter à u déterminée précédemment une fonction harmonique quelconque). Si f a davantage de régularité, par exemple f ∈ S, alors u ∈ E et on a la formule explicite : Z 1 u(x) = ln(|x − y|)f (y)dy 2π R2 en dimension 2 et 1 u(x) = (d − 2)sd Z Rd 1 f (y)dy |x − y|d−2 en dimension supérieure. Considérons maintenant l’EDP linéaire : −∆u + u = f avec f ∈ S et dont on cherche une solution dans S. En prenant la transformée de Fourier de cette équation on obtient une équation algébrique en û : (1 + |ξ|2 )û = fˆ dont la solution est évidemment donnée par u = F −1 ((1 + |ξ|2 )−1 fˆ). Notons que l’on a û ∈ S et donc on a bien u ∈ S. Pour calculer effectivement u, on utilise le fait que (1 + |ξ|2 )−1 ∈ S ′ et l’identité F −1 (gh) = F −1 (g) ⋆ F −1 (h), ∀g ∈ S, ∀h ∈ S ′ de sorte qu’en définissant B (noyau de Bessel) par :   B := F −1 (1 + |ξ|2 )−1 = (2π)−d F (1 + |ξ|2 )−1 65 on a u = B ⋆ f. Pour clore ce chapitre, indiquons formellement comment les notions vues dans ce chapitre permettent également de résoudre certaines équations d’évolution linéaires standard (mais importantes) comme l’équation de la chaleur. Nous nous bornerons ici au cas de l’équation de la chaleur et à une description heuristique pour ne pas avoir à introduire le cadre fonctionnel rigoureux mais un peu lourd permettant de traiter la variable temporelle. Le problème de Cauchy pour l’équation de la chaleur homogène s’écrit  ∂t u − ∆u = 0 u(0, .) = u0 , avec une condition initiale u0 ∈ L2 . En prenant la transformée de Fourier de cette équation par rapport à la seule variable spatiale on obtient une équation différentielle ordinaire pour t 7→ û(t, ξ) : ∂t û = −|ξ|2 û et donc û(t, ξ) = û(0, ξ)e−t|ξ| 2 de sorte que u(t, x) = (Gt ⋆ u0 )(x) = Z Rd 2 Gt (x − y)u0 (y)dy avec Gt = F −1 (e−t|ξ| ). On a l’expression explicite suivante pour Gt (noyau de la chaleur) : Z |x|2 1 1 − 4t ix·ξ −t|ξ|2 e e dξ = e Gt (x) = (2π)d Rd (4πt)d/2 d’où la formule de représentation pour la solution de l’équation de la chaleur : Z |x−y|2 1 − 4t u0 (y)dy. e u(t, x) = (4πt)d/2 Rd Le fait que le noyau de la chaleur soit la densité d’une gaussienne centrée de variance t ne doit rien au hasard étant donné le lien très étroit entre cette équation (et plus généralement les équations paraboliques) et le mouvement Brownien (et plus généralement les processus de diffusion). 66 Chapitre 3 Espaces de Banach et topologies faibles 3.1 Topologie faible Soit E un espace de Banach et E ′ son dual topologique, muni de sa norme duale. La topologie faible sur E est alors définie de la manière suivante : Définition 3.1 La topologie faible sur E, notée σ(E, E ′ ) est la topologie la moins fine (i.e. ayant le moins d’ouverts) rendant continus les éléments de E ′. La topologie faible sur E, σ(E, E ′ ), est donc un cas particulier de topologie la moins fine rendant continues une famille d’applications définies sur E à valeurs réelles. La construction de telles topologies a déja été vue dans le cours de topologie. Rappelons-en simplement les grandes lignes. Il est clair que la topologie σ(E, E ′ ) est la topologie la moins fine contenant (ou encore la topologie engendrée par) la famille Λ := {f −1 (ω), f ∈ E ′ , ω ouvert de R}. La topologie engendrée par cette famille est formée par les réunions quelconques d’intersections finies d’éléments de Λ. Pour montrer que cette nouvelle famille est effectivement une topologie (et donc la moins fine contenant Λ), il suffit de montrer qu’elle est stable par intersection finie, ce qui résulte de : ! ! \ \ [ \ \ [ Oi2j Oij = Oi1j k=1,2 i∈Ik j∈Jk (i1 ,i2 )∈I1 ×I2 j∈J1 j∈J2 Lemme 3.1 Soit X un espace topologique et ϕ une application de X vers E, alors ϕ est continue pour la topologie σ(E, E ′ ) si et seulement si pour tout f ∈ E ′ , f ◦ ϕ est continue sur X. 67 Preuve: Si ϕ est continue de X dans (E, σ(E, E ′ )) comme par définition tout f ∈ E ′ est continue pour (E, σ(E, E ′ )) alors par composition pour tout f ∈ E ′ , f ◦ ϕ est continue sur X. Réciproquement, supposons que f ◦ ϕ soit continue sur X pour tout f ∈ E ′ , il s’agit de montrer que ϕ est continue de X dans (E, σ(E, E ′ )). Pour cela, il s’agit de montrer que ϕ−1 (U ) est un ouvert de X pour tout ouvert U pour σ(E, E ′ ). Or nous savons que U est de la forme : [\ U= fi−1 (ωi ) j∈J i∈Ij où chaque Ij est fini, fi ∈ E ′ et ωi est un ouvert de R. On a alors [\ ϕ−1 (U ) = (fi ◦ ϕ)−1 (ωi ) j∈J i∈Ij qui est bien ouvert puisque chaque fi ◦ ϕ est continue. ✷ Lemme 3.2 Soit x ∈ E, un système fondamental de voisinages de x ∈ E pour la topologie faible σ(E, E ′ ) est donné par les ensembles de la forme : Vε,f1 ,...fk := {y ∈ E : |fi (x − y)| < ε, i = 1, . . . , k} avec ε > 0, k ∈ N∗ et f1 , . . . , fk ∈ (E ′ )k . Preuve: Par définition de la topologie σ(E, E ′ ), Vε,f1 ,...fk est un ouvert de la topologie faible contenant x. Soit maintenant U un voisinage de x pour σ(E, E ′ ), il existe alors un ensemble fini I, des formes linéaires continues (fi )i∈I et des ouverts de R, (ωi )i∈I tels que fi (x) ∈ ωi et ∩i∈I fi−1 (ωi ) ⊂ U . On choisit alors ε > 0 suffisamment petit pour que (fi (x) − ε, fi (x) + ε) ⊂ ωi pour tout i ∈ I de sorte que V := {y ∈ E : |fi (x − y)| < ε, ∀i ∈ I} ⊂ U . ✷ La topologie σ(E, E ′ ) est ainsi une topologie d’evtlc puisqu’elle peut de manière équivalente être définie par la famille de semi-normes {pf , f ∈ E ′ } avec pf (x) := |f (x)| pour tout (x, f ) ∈ E × E ′ . Nous avons déja vu au chapitre 1 qu’il résulte du théorème de Hahn-Banach que : Lemme 3.3 La topologie σ(E, E ′ ) est séparée. 68 Par définition même tout ouvert pour la topologie faible est ouvert pour la topologie forte et l’on vérifie sans peine que les deux topologies coı̈ncident lorsque E est de dimension finie (pour s’en convaincre, il suffit de considérer la base duale d’une base de E). Lorsque E est de dimension infinie, les deux topologies sont distinctes et il existe toujours des fermés ”fort” (i.e. pour la topologie de la norme) qui ne sont pas fermés faibles (i.e. pour σ(E, E ′ )). En effet, supposons E de dimension infinie et définissons S := {x ∈ E : kxk = 1} la sphère unité de E, alors S n’est pas faiblement fermée est plus précisément l’adhérence de S pour σ(E, E ′ ) contient la boule fermée BE toute entière. En effet soit x0 ∈ E avec kx0 k < 1 et soit V un voisinage de x0 pour σ(E, E ′ ), on peut sans perte de généralité supposer que V est de la forme V = {y ∈ E : |fi (y − x0 )| < ε, i = 1, ..., k} pour un certain ε > 0 et une famille finie d’éléments de E ′ , f1 , ...., fk . Comme E est de dimension infinie il existe y0 ∈ E, y0 6= 0 tel que fi (y0 ) = 0 pour i = 1, ..., k (faute de quoi E s’injecterait dans Rk ). On peut alors choisir t ∈ R tel que x0 + ty0 ∈ S comme x0 + ty0 ∈ V on en déduit bien que x0 est adhérent à S pour σ(E, E ′ ). En dimension infinie, il convient de retenir de l’argument précédent que les parties d’intérieur non vides pour σ(E, E ′ ) ” contiennent toujours un sous-espace affine (de dimension infinie !) de E, et donc sont non bornées. En particulier tout borné de E est d’intérieur vide pour σ(E, E ′ ). σ(E,E ′ ) Pour A ⊂ E, on notera A l’adhérence de A pour la topologie faible et A son adhérence pour la topologie forte, comme les fermés faibles sont fermés σ(E,E ′ ) , l’inclusion étant en générale stricte. Pour forts on a toujours A ⊂ A les sous-ensembles convexes toutefois on a le résultat suivant : Proposition 3.1 Soit C un convexe fermé de E alors C est faiblement fermé. Preuve: Soit x ∈ E \ C il s’agit de montrer que E \ C est voisinage de x pour σ(E, E ′ ) or il résulte du théorème de Hahn-Banach 1.11 qu’il existe f ∈ E ′ et ε > 0 tels que le voisinage de x pour σ(E, E ′ ), V := {y ∈ E : |f (x) − f (y)| < ε} ne rencontre pas C. ✷ Par la suite nous dirons qu’une suite (xn ) de E converge faiblement vers x ∈ E (ou au sens de σ(E, E ′ )), ce que nous noterons xn ⇀ x lorsque f (xn ) → f (x) pour tout f ∈ E ′ . Passons en revue quelques propriétés élémentaires de la convergence faible : – si (xn ) converge faiblement sa limite faible est unique, – si xn → x alors xn ⇀ x 69 – toute suite faiblement convergente de E est bornée (conséquence immédiate du théorème de Banach-Steinhaus), – si xn ⇀ x alors kxk ≤ lim inf n kxn k (utiliser le fait que kxk = sup{f (x), f ∈ E ′ , kf kE ′ ≤ 1}), – si xn ⇀ x et si fn → f dans E ′ alors fn (xn ) → f (x). On se persuade aisément que la convergence faible n’entraine en général pas la convergence forte (sauf en dimension finie et dans quelques cas ”pathologiques” comme celui de l1 ). On a cependant comme première conséquence de la proposition 3.1 : Lemme 3.4 (Lemme de Mazur) Soit (xn ) une suite convergeant faiblement vers x dans E alors il existe une suite (yn ) avec chaque yn combinaison convexe des {xk , k ≥ n} convergeant fortement vers x dans E. Preuve: σ(E,E ′ ) Posons Cn := co({xk , k ≥ n}) comme xn ⇀ x on a x ∈ Cn pour tout n. Comme Cn est convexe, il découle facilement de la proposition 3.1 que l’on σ(E,E ′ ) = Cn et donc x ∈ Cn il existe donc yn ∈ Cn tel que kx−yn k ≤ 1/n a Cn ce qui achève la preuve. ✷ Une autre conséquence de la proposition 3.1 est donnée par : Proposition 3.2 Soit f : E → R∪{+∞} une fonction convexe s.c.i pour la topologie forte de E alors f est s.c.i. pour σ(E, E ′ ). En particulier, si xn ⇀ x alors f (x) ≤ lim inf f (xn ). Preuve: Il suffit de remarquer que les sous-niveaux de f (i.e. {f ≤ λ}, λ ∈ R) sont convexes fermés donc faiblement fermés. Le deuxième point résulte du fait que la semi-continuité inférieure faible implique la semi-continuité inférieure faible séquentielle. ✷ Si E est un espace de Banach de dimension infinie, la topologie faible σ(E, E ′ ) n’est jamais métrisable. C’est l’objet de l’exercice suivant : Exercice 3.1 Soit E un espace de Banach de dimension infinie dont on suppose que la topologie faible σ(E, E ′ ) est métrisable par la distance d. Montrer qu’il existe alors une suite xn telle que kxn k → +∞ et xn ⇀ 0 et conclure. 70 Exercice 3.2 Soit E un espace de Banach de dimension infinie, montrer que toute base algébrique de E est non dénombrable (utiliser le théorème de Baire). Supposons maintenant que σ(E, E ′ ) soit métrisable montrer que ceci implique l’existence d’une famille au plus dénombrable de E ′ engendrant E ′ . Conclure. Exercice 3.3 Soit E un espace de Banach, (xn ) ∈ E N et x ∈ E tels que xn ⇀ x. Montrer que pour tout n, il existe zn ∈ co({xk , k ≤ n}) tel que zn → x (on pourra raisonner par l’absurde et utiliser un argument de séparation). Exercice 3.4 Soit E un espace de Banach,P(xn ) ∈ E N et x ∈ E tels que xn ⇀ x. Pour tout n ≥ 1 on pose zn := n−1 ( ni=1 xi ), montrer que zn ⇀ x. Proposition 3.3 Soit E et F deux espaces de Banach et T une application linéaire de E dans F . Alors T est continue de E (fort) dans F (fort) si et seulement si elle est continue de (E, σ(E, E ′ )) dans (F, σ(F, F ′ )). Preuve: Supposons d’abord T continue de E fort dans F fort. Pour tout f ∈ F ′ , f ◦ T appartient à E ′ et donc est continue pour σ(E, E ′ ), on en déduit que T est continue de (E, σ(E, E ′ )) dans (F, σ(F, F ′ )) grâce au lemme 3.1. Supposons maintenant que T est continue de (E, σ(E, E ′ )) dans (F, σ(F, F ′ )) alors son graphe est fermé pour σ(E × F, E ′ × F ′ ) et donc aussi fortement fermé dans E × F . Comme E et F sont de Banach, grâce au théorème du graphe fermé (voir chapitre 4) on en déduit bien que T est continue de E fort dans F fort. ✷ 3.2 Topologie faible-∗ La topologie faible-∗ sur E ′ , est définie comme suit : Définition 3.2 La topologie faible-∗ sur E ′ , notée σ(E ′ , E) est la topologie la moins fine (i.e. ayant le moins d’ouverts) rendant continus les formes linéaires f 7→ f (x) pour tout x ∈ E. Il est à noter qu’on dispose désormais de trois topologies sur E ′ : la topologie forte, la topologie faible-∗, σ(E ′ , E) et la topologie faible σ(E ′ , E ′′ ). En dimension finie, évidemment ces trois topologies coı̈ncident. De plus 71 comme E s’injecte continûment dans E ′′ , σ(E ′ , E) est toujours moins fine que σ(E ′ , E ′′ ). En transposant ce que nous avons vu sur la topologie faible σ(E, E ′ ), on montre aisément qu’un système fondamental de voisinages de f ∈ E ′ pour la topologie faible ∗ σ(E, E ′ ) est donné par les ensembles de la forme : Vε,x1 ,...xk := {g ∈ E ′ : |(g − f )(xi )| < ε, i = 1, . . . , k} avec ε > 0, k ∈ N∗ et x1 , . . . , xk ∈ E k . La topologie faible-∗ sur E ′ est donc une topologie d’evtlcs sur E ′ associée à la famille de semi-normes f ∈ E ′ 7→ qx (f ) := |f (x)|, pour x ∈ E. On a naturellement une notion de convergence pour la topologie faible-∗ sur E ′ qui se définit comme suit. On dit qu’une suite (fn )n de E ′ converge ∗ faiblement-∗ vers f , ce que l’on note fn ⇀ f si et seulement si fn (x) → f (x), pour tout x ∈ E. On vérifie sans peine les propriétés suivantes de la convergence faible-∗ : – si (fn ) converge faiblement-∗, sa limite faible-∗ est unique, ∗ – si fn → f (i.e. kfn − f k → 0) alors fn ⇀ f , ∗ – si fn ⇀ f pour σ(E ′ , E ′′ ) alors fn ⇀ f , – toute suite faiblement-∗ convergente de E ′ est bornée, ∗ – si fn ⇀ f alors kf k ≤ lim inf n kfn k, ∗ – si fn ⇀ f et si xn → x dans E (fort) alors fn (xn ) → f (x). Le résultat de compacité suivant découle du théorème de Banach-AlaogluBourbaki que nous avons établi au chapitre 1 dans le cadre plus général des evtlc : Théorème 3.1 (Banach-Alaoglu-Bourbaki) La boule unité fermée de E ′ , BE ′ est compacte pour la topologie faible ∗ σ(E ′ , E). Terminons ce paragraphe par un critère utile de fermeture faible ∗ dont on omettra ici la preuve (le lecteur pourra consulter par exemple [22]) Théorème 3.2 (Krein-Smulian) Soit E un espace de Banach et C un convexe de E ′ tel que C ∩ rBE ′ soit fermé pour la topologie faible ∗ pour tout r > 0, alors C est fermé pour la topologie faible ∗. 3.3 Espaces réflexifs 72 Etant donné un espace de Banach E (ou plus généralement un evn), on rappelle que E s’injecte dans son bidual E ′′ via l’injection canonique J : E → E ′′ définie par : J(x)(f ) := f (x), ∀x ∈ E, ∀f ∈ E ′ . Il résulte du corollaire 1.2 que J est une isométrie de E sur E ′′ , en particulier J est une injection continue. Définition 3.3 On dit que l’evn E est réflexif si J est surjective. Autrement dit, dire que E est réflexif revient à dire qu’on peut identifier E ′′ à E. Evidemment tout espace de Hilbert est réfexif (ceci découle du théorème de Riesz qui permet d’identifier un espace de Hilbert à son dual topologique). Pour tout p ∈ (1, ∞) les espaces lp , Lp et W 1,p (Ω) sont réflexifs. Par contre l1 , L1 , W 1,1 , l∞ , L∞ , W 1,∞ , C 0 , les espaces de mesures ne sont pas réflexifs. L’importance fondamentale de la réflexivité provient du résultat de compacité énoncé dans le théorème de Kakutani 3.3 plus bas. Avant d’énoncer et de démontrer ce résultat important nous aurons besoin de deux lemmes préliminaires : Lemme 3.5 (Helly) Soit E un espace de Banach, f1 , ...., fn dans E ′ et α1 , ...., αn des réels on a équivalence entre les assertions suivantes : 1. pour tout ε > 0, il existe xε ∈ BE tel que |fi (xε ) − αi | < ε, ∀i = 1, ..., n 2. pour tout β1 , ...., βn ∈ Rn on a | n X i=1 βi αi | ≤ k n X i=1 βi fi k. Preuve: Supposons d’abord 1., et soit β1 , ..., βn ∈ Rd , on a alors | X i=1 βi αi | ≤ | n X βi fi (xε )| + ε i=1 ≤k n X i=1 n X i=1 73 βi fi k + ε n X i=1 |βi | |βi | d’où l’on déduit 2. en faisant tendre ε vers 0. Pour établir la réciproque remarquons que 1 signifie exactement que α := (α1 , ...., αn ) ∈ F (BE ) avec F (x) := (f1 (x), ..., fn (x)) pour tout x ∈ E. Supposons donc que α ∈ / F (BE ), comme F (BE ) est convexe fermé dans Rn , en utilisant le théorème de séparation stricte, il existe β1 , ..., βn ∈ Rn et γ ∈ R tels que n n X X βi fi (x) < γ < βi αi , ∀x ∈ BE i=1 i=1 ce qui implique en particulier k n X i=1 βi fi k < | n X i=1 βi αi | contredisant ainsi la seconde assertion. ✷ Lemme 3.6 (Goldstine) Soit E un espace de Banach, alors J(BE ) est dense dans BE ′′ pour la topologie σ(E ′′ , E ′ ). Preuve: Soit η ∈ BE ′′ et V un voisinage de η pour σ(E ′′ , E ′ ), il s’agit de montrer que V ∩ J(BE ) 6= ∅. Sans perte de généralité, on peut supposer qu’il existe n, ε > 0 et f1 , ..., fn ∈ (E ′ )n tels que V = {ξ ∈ E ′′ : |(ξ − η)(fi )| < ε, ∀i = 1, ..., n}. Posons αi := η(fi ) pour i = 1, ..., n et soit β1 , ..., βn ∈ Rn , on a alors puisque η ∈ BE ′′ : n n X X X | βi αi | = |η( βi fi )| ≤ k βi fi k. i=1 i=1 i=1 On déduit alors du lemme 3.5 qu’il existe xε ∈ BE tel que |fi (xε ) − αi | < ε pour i = 1, ..., n ce qui signifie exactement que J(xε ) ∈ V et donc on a bien V ∩ J(BE ) 6= ∅. ✷ Théorème 3.3 (Kakutani) Soit E un espace de Banach alors E est réflexif si et seulement si BE est compacte pour σ(E, E ′ ). Preuve: Supposons d’abord que E est réflexif on a alors J(BE ) = BE ′′ et il résulte du 74 théorème de Banach-Alaoglu-Bourbaki que BE ′′ est compacte pour σ(E ′′ , E ′ ). Il suffit donc de montrer que J −1 est continue de (E ′′ , σ(E ′′ , E ′ )) vers (E, σ(E, E ′ )) pour en conclure que BE est compacte pour σ(E, E ′ ). Avec le lemme 3.1, il s’agit donc de montrer que pour tout f ∈ E ′ , f ◦ J −1 est continue pour σ(E ′′ , E ′ ). Or si η ∈ E ′′ il existe x ∈ E tel que η = J(x) on a donc f (J −1 (η)) = f (x) = η(f ) et comme f ∈ E ′ , on en déduit bien que f ◦ J −1 est continue pour σ(E ′′ , E ′ ). Réciproquement, supposons que BE soit compacte pour σ(E, E ′ ). Comme J est continue de E (fort) dans E ′′ (fort), il découle de la proposition 3.3 que J est continue de (E, σ(E, E ′ )) vers (E ′′ , σ(E ′′ , E ′′′ )). Comme σ(E ′′ , E ′ ) est moins fine que σ(E ′′ , E ′′′ ), J est aussi continue de (E, σ(E, E ′ )) vers (E ′′ , σ(E ′′ , E ′ )). Cela implique que J(BE ) est compact pour σ(E ′′ , E ′ ) mais comme, par le lemme 3.6, J(BE ) est dense dans BE ′′ pour σ(E ′′ , E ′ ) on doit avoir BE ′′ = BE et donc E ′′ = J(E). ✷ Examinons maintenant quelques conséquences du théorème de Kakutani. Corollaire 3.1 Soit E un espace de Banach réflexif et F un sev fermé de E alors F muni de la topologie induite par la topologie forte de E est réflexif. Preuve: Il est facile de voir que la topologie faible σ(F, F ′ ) coı̈ncide avec la trace de σ(E, E ′ ) à F de sorte que BF est compacte pour σ(F, F ′ ) car F est fermé pour σ(E, E ′ ) et BE est compacte pour σ(E, E ′ ). D’après le théorème de Kakutani, F est donc réflexif. ✷ Corollaire 3.2 Soit E un espace de Banach, alors E est réflexif si et seulement si E ′ est réflexif. Preuve: Supposons d’abord E réflexif. Il résulte du théorème de Banach-AlaogluBourbaki que BE ′ est compacte pour σ(E ′ , E) mais comme E est réflexif, σ(E ′ , E) = σ(E ′ , E ′′ ) donc on déduit du théorème de Kakutani que E ′ est réflexif. Si E ′ est réflexif alors d’après ce qui précède E ′′ est réflexif. Comme J est une isométrie de E sur E ′′ , on vérifie facilement que J(E) est un sev fermé de E ′′ et donc que J(E) est réflexif. Comme J −1 : J(E) → E est un isomorphisme isométrique entre espaces de Banach on en déduit aisément que E est réflexif. ✷ 75 Corollaire 3.3 Soit E un espace de Banach réflexif et K une partie convexe fermée bornée de E alors K est compacte pour σ(E, E ′ ). Preuve: K est fermé faible en vertu de la proposition 3.1 et inclus dans une boule fermée laquelle est faiblement compacte en vertu du théorème de Kakutani. ✷ Corollaire 3.4 Soit E un espace de Banach réflexif, C un convex non vide fermé de E, f : C → R ∪ +∞ une fonction convexe s.c.i. non identiquement égale à +∞, si C est bornée ou si f (x) → +∞ quand x ∈ C, kxk → +∞. (3.1) alors il existe x ∈ C tel que f (x) ≤ f (x), ∀x ∈ C. Preuve: Soit x ∈ C tel que f (x) < +∞ alors A := {y ∈ C : f (y) ≤ f (x)} est compact pour σ(E, E ′ ) d’après le corollaire 3.3 et f est faiblement s.c.i. sur A d’après la proposition 3.2 ; f atteint donc son mimimum sur A qui est aussi son minimum sur C. ✷ 3.4 Espaces séparables Définition 3.4 On dit que l’espace de Banach E est séparable si et seulement si E possède une partie dénombrable dense. Proposition 3.4 Soit E un espace de Banach tel que E ′ soit séparable alors E est séparable. Preuve: Soit (fn )n∈N ∈ E ′N dense dans E ′ . Pour n ∈ N, soit xn ∈ E tel que kxn k = 1 et 1 fn (xn ) ≥ kfn k. 2 Soit F l’ensemble des combinaisons linéaires à coefficients dans Q de {xn , n ∈ N}. Notons que F est dénombrable, montrons maintenant que F est dense dans E. Pour cela, comme F est dense dans G := vect({xn , n ∈ N} il suffit de montrer que G est dense dans E. D’après le corollaire 1.6 il suffit de montrer que si f ∈ E ′ vérifie f (x) = 0 pour tout x ∈ G alors f ≡ 0. Soit donc f 76 vérifiant la propriété précédente ε > 0 et n ∈ N tel que kf − fn k ≤ ε/3, on a alors kf k ≤ ε ε ε ε + kfn k ≤ + 2fn (xn ) = + 2(fn − f )(xn ) ≤ + 2kfn − f k ≤ ε 3 3 3 3 comme ε > 0 est arbitraire, on, en déduit bien que f ≡ 0. ✷ Il est à noter que la séparabilité de E n’entraine généralement pas celle de E ′ (par exemple L1 (Ω) est séparable tandis que son dual L∞ (Ω) ne l’est pas, nous renvoyons le lecteur au chapitre 5 pour plus de détails). Dans le cas où E est réflexif on a cependant : Corollaire 3.5 Soit E un espace de Banach alors E est réflexif et séparable si et seulement si E ′ est réflexif et séparable. Preuve: Si E ′ est réflexif alors E aussi (proposition 3.4) et si E ′ est séparable alors E aussi (corollaire 3.2). Réciproquement si E est réflexif et séparable alors E ′′ = J(E) est réflexif et séparable et donc E ′ aussi. ✷ Théorème 3.4 Soit E un espace de Banach alors E est séparable si et seulement si la trace de la topologie faible-∗ σ(E ′ , E) à BE ′ est métrisable. Preuve: Le fait que si E est séparable alors la trace de la topologie faible-∗ σ(E ′ , E) à BE ′ est métrisable résulte de la proposition 1.1. Réciproquement supposons que la distance d métrise σ(E ′ , E) sur BE ′ . Pour tout n ∈ N∗ , B(0, 1/n) := {f ∈ BE ′ : d(0, f ) < 1/n} est un voisinage de 0 pour σ(E ′ , E) de sorte qu’il existe εn , In fini et (xi )i∈In tels que Vn := {f ∈ BE ′ : |f (xi )| < εn , ∀i ∈ In } ⊂ B(0, 1/n). Pour montrer que E est séparable il nous suffit de montrer que l’espace vectoriel engendré par ∪n {xi , i ∈ In }, F est dense dans E. Soit f ∈ BE ′ telle que f (x) = 0 pour tout x ∈ F alors f ∈ Vn pour tout n ∈ N et donc d(0, f ) = 0 de sorte que f = 0, on conclut alors avec le corollaire 1.6. ✷ De manière symétrique on a : Proposition 3.5 Soit E un espace de Banach, si E ′ est séparable alors la trace de la topologie faible σ(E, E ′ ) à BE est métrisable. 77 La réciproque est également vraie mais sa démonstration est plus difficile. Noter que la proposition précédente n’est pas contradictoire avec le fait que σ(E, E ′ ) ne soit jamais métrisable sur E tout entier lorsque E est de dimension infinie. La métrisabilité de la topologie faible-∗ sur les bornés combinée au théorème de Banach-Alaoglu-Bourbaki fournit immédiatement le résultat de compacité séquentielle suivant : Corollaire 3.6 Soit E un espace de Banach séparable et soit (fn )n une suite bornée de E ′ , alors (fn )n possède une sous-suite qui converge pour la topologie faible-∗ σ(E ′ , E). Preuve: Sans perte de généralité nous pouvons supposer tous les fn dans BE ′ qui est un compact métrisable pour σ(E ′ , E), d’où le résultat. ✷ Dans le cas où E est réflexif, on a de même le résultat de compacité séquentielle suivant : Théorème 3.5 Soit E un espace de Banach réflexif et (xn )n une suite bornée de E alors (xn )n possède une sous-suite qui converge faiblement. Preuve: Soit M := vect{xn , n ∈ N}, M est un sev fermé de E donc est réflexif (corollaire 3.1) et M est séparable par construction. Ainsi M ′ est séparable et donc pour tout r > 0, σ(M, M ′ ) est métrisable sur rBM qui est compacte pour σ(M, M ′ ) d’après le théorème de Kakutani. La suite (xn )n admet donc une sous-suite convergente pour σ(M ′ , M ), cette sous-suite est aussi évidemment convergente pour σ(E ′ , E) (par restriction des éléments de E ′ à M ). ✷ 3.5 Espaces uniformément convexes Définition 3.5 Soit E un espace de Banach, on dit que E est dit uniformément convexe si pour tout ε > 0 il existe δ > 0 tel que pour tout x et y dans BE si kx − yk ≥ ε alors x+y ≤ 1 − δ. 2 78 La définition précédente est de nature géométrique et exprime le fait que la boule unité de E doit être ”bien ronde”. Cette propriété n’est pas stable par passage à une norme équivalente (Rd est uniformément convexe lorsque muni de la norme euclidienne il ne l’est pas lorsque muni de la norme 1 ou de la norme du max). Tout espace de Hilbert est uniformément convexe (conséquence facile de l’identité du parallélogramme), les espaces Lp et lp sont uniformément convexes pour 1 < p < ∞, L1 , l1 , L∞ et l∞ ne sont pas uniformément convexes. Théorème 3.6 (Milman-Pettis) Tout espace de Banach uniformément convexe est réflexif. Preuve: Supposons E uniformément convexe et montrons que J(BE ) = BE ′′ . Comme J(BE ) est clairement fermée, il suffit par homogénéité de montrer que J(BE ) est dense (fort) dans SE ′′ := {η ∈ E ′′ : kη| = 1}. Soit η ∈ SE ′′ et ε > 0 montrons qu’il existe x ∈ BE tel que kJ(x) − ηk ≤ ε. Comme E est uniformément convexe, il existe δ ∈ (0, 1) tel que kx + yk ≤ 2 − 2δ pour tout (x, y) ∈ BE2 tels que kx − yk ≥ ε. Choisissons f ∈ E ′ tel que kf k = 1 et η(f ) ≥ 1 − δ 2 d’après le lemme de Goldstine, il existe x ∈ BE tel que δ |η(f ) − f (x)| < . 2 Supposons que η ∈ / B(J(x), ε) alors comme E ′′ \ B(J(x), ε) est ouvert pour ′′ ′ σ(E , E ), il résulte du lemme de Goldstine qu’il existe y ∈ BE tel que kJ(y) − J(x)k = kx − yk > ε et |η(f ) − f (y)| < on a alors d’une part 1 kx + yk ≥ 1 − δ 2 et d’autre part 1− δ 1 δ 1 δ ≤ η(f ) < f (x + y) + ≤ kx + yk + 2 2 2 2 2 d’où la contradiction recherchée. ✷ 79 δ 2 Théorème 3.7 Soit E un espace de Banach uniformément convexe et (xn ) une suite convergeant faiblement vers x dans E, si kxn k converge vers kxk alors (xn ) une suite converge fortement vers x dans E. Preuve: Si x = 0, le résultat est évident, on peut donc sans perte de généralité supposer x 6= 0. En posant λn := max(kxn k, kxk), on a λn → kxk > 0. En définissant alors yn := λ−1 n xn et y := x/kxk, on a (yn + y)/2 ⇀ y et donc kyk = 1 ≤ lim inf n yn + y 2 et comme kyn k ≤ 1 on a en fait k yn2+y k → 1. Avec l’uniforme convexité de E ceci implique que kyn − yk → 0 ce qui implique aussi que kxn − xk → 0. ✷ 80 Chapitre 4 Opérateurs linéaires, opérateurs compacts On rappelle dans ce chapitre un certain nombre de résultats, pour la plupart déja vus au premier semestre dans le cours de Frédéric Paulin, sur les opérateurs linéaires dans les espaces de Banach et en particulier sur les opérateurs compacts. Dans tout ce chapitre E et F désigneront des espaces de Banach, nous noterons L(E, F ) (respectivement L(E)) l’espace des applications linéaires continues de E dans F (respectivement des endomorphismes continus de E) muni de sa norme d’opérateur habituelle. 4.1 Généralités Par la suite pour f ∈ E ′ et x ∈ E, nous noterons parfois hf, xi au lieu de f (x). Soit T ∈ L(E, F ) l’adjoint de T noté T ∗ est l’opérateur linéaire F ′ → E ′ défini par : hT ∗ f, xi = hf, T xi , ∀f ∈ F ′ , ∀x ∈ E. On vérifie immédiatement que T ∗ ∈ L(F ′ , E ′ ) (et que T et T ∗ ont même norme). Pour A ⊂ E, on note A⊥ := {f ∈ E ′ : f (x) = 0, ∀x ∈ A} et de même pour B ⊂ E ′ , on note B ⊥ := {x ∈ E : f (x) = 0, ∀f ∈ B}. Notons que si T ∈ L(E, F ) on a ker(T ) = (Im(T ∗ ))⊥ , ker(T ∗ ) = (Im(T ))⊥ et de plus : 81 (4.1) Lemme 4.1 Soit T ∈ L(E, F ) alors Im(T ) est fermé si et seulement si Im(T ) = (kerT ∗ )⊥ . (4.2) Preuve: Si (4.2) a lieu alors Im(T ) est évidemment fermé. Par ailleurs, l’inclusion Im(T ) ⊂ (ker(T ∗ ))⊥ est évidente. Supposons Im(T ) fermé et que l’inclusion précédente soit stricte, alors il existe y ∈ (ker(T ∗ ))⊥ \ Im(T ). Par le théorème de séparation stricte, il existe alors f ∈ F ′ telle que f (y) > 0 et f ≡ 0 sur Im(T ) c’est à dire f ∈ ker(T ∗ ) ce qui contredit le fait que y ∈ (ker(T ∗ ))⊥ . ✷ Le lemme 4.1 découle évidemment de l’énoncé (légèrement) plus général : Exercice 4.1 Soit A une partie de E, montrer que (A⊥ )⊥ = vect(A). Exercice 4.2 Soit B une partie de E ′ , montrer que vect(B) ⊂ (B ⊥ )⊥ . Montrer qu’il y a égalité dans le cas où E est réflexif, est ce le cas en général ? Caractériser dans le cas général (B ⊥ )⊥ en terme de la topologie faible ∗ σ(E ′ , E). 4.2 Conséquences de la théorie de Baire On rappelle dans cette section quelques résultats sur les applications linéaires continues entre espaces de Banach qui ont déja été vus et résultent du théorème de Baire. Théorème 4.1 (Banach-Steinhaus ou principle of uniform boudedness) Soit E un espace de Banach, F un evn et (fi )i∈I une famille d’éléments de L(E, F ). Si, ∀x ∈ E, sup kfi (x)kF < +∞ i∈I alors sup kfi kL(E,F ) < +∞. i∈I 82 Preuve: Soit En := {x ∈ E : kfi (x)kF ≤ n, ∀i ∈ I}, chaque En est fermé et par hypothèse on a ∪n En = E. Il résulte donc du théorème de Baire qu’il existe n0 tel que En0 soit d’intérieur non vide : soit donc r > 0 et x0 ∈ E tels que kfi (x0 + ru)kF ≤ n0 , ∀i ∈ E, ∀u ∈ BE . Pour tout u ∈ BE et tout j ∈ I, on a alors   1 kfj (u)kF ≤ n0 + sup kfi (x0 )kF . r i∈I ✷ Une autre conséquence du théorème de Baire est le théorème de l’application ouverte : Théorème 4.2 (Théorème de l’application ouverte) Soit E et F deux espaces de Banach et soit f ∈ L(E, F ) surjective. Alors f est une application ouverte au sens où pour tout U ouvert de E, f (U ) est un ouvert de F . Preuve: Par linéarité de f , il suffit de montrer qu’il existe r0 > 0 tel que BF (0, r0 ) ⊂ f (BE (0, 1)). Soit Fn := nf (BE (0, 1)), comme f est surjective, F = ∪n Fn et donc il résulte du théorème de Baire qu’il existe n0 tel que Fn0 soit d’intérieur non vide. Ainsi, il existe y0 ∈ E et ρ > 0 tels que BF (y0 , ρ) ⊂ f (BE (0, n0 )), par linearité, on a aussi BF (−y0 , ρ) ⊂ f (BE (0, n0 )) de sorte que BF (0, ρ) = −y0 + BF (y0 , ρ) ⊂ f (BE (0, 2n0 )). Par homogénéité, on a donc BF (0, r) ⊂ f (BE (0, 1)) avec r = ρ/2n0 . Prouvons maintenant que BF (0, r) ⊂ f (B E (0, 2)). Soit y ∈ BF (0, r), il existe x1 ∈ BE (0, 1) tel que y − f (x1 ) ∈ BF (0, r/2), comme BF (0, r/2) ⊂ f (BE (0, 1/2)), il existe x2 ∈ BE (0, 1/2) tel que y−f (x1 )−f (x2 ) ∈ BF (0, r/4). En itérant l’ argument, on construit une suite (xn )n de E telle que kxn kE ≤ 1/2n−1 et ky − f (x1 + .... + xn )kF ≤ r/2n pour tout n. Comme la suite des sommes partielles x1 + .... + xn est de Cauchy sequence, elle converge vers un certain x ∈ B E (0, 2) et par continuité y = f (x), ce qui prouve que BF (0, r) ⊂ f (B E (0, 2)) ⊂ f (BE (0, 5/2)) et donc BF (0, r0 ) ⊂ f (BE (0, 1)) avec r0 = 2r/5. ✷ Une application immédiate du théorème précédent est que si E est de Banach muni de n’importe laquelle des deux normes k.k1 et k.k2 et s’il existe C ≥ 0 tel que k.k1 ≤ Ck.k2 alors k.k1 et k.k2 sont en fait équivalentes. Une autre conséquence du résultat précédent est le théorème suivant de continuité automatique dû à Banach : 83 Théorème 4.3 (Théorème de continuité de l’inverse de Banach) Soit E et F deux espaces de Banach f ∈ L(E, F ) une bijection alors f −1 ∈ L(F, E). Une conséquence classique du théorème de Banach nous est fournie par : Théorème 4.4 (Théorème du graphe fermé) Soit E et F deux espaces de Banach, f ∈ L(E, F ) tel que le graphe de f soit fermé dans E × F (muni sa structure d’evn produit) alors f ∈ L(E, F ). Preuve: Soit G le graphe de f muni de la norme induite par celle de E × F , comme G est fermé dans E × F c’est un espace de Banach. L’application linéaire (x, y) = (x, f (x)) ∈ G 7→ x est une bijection linéaire continue, il résulte donc du théorème de Banach que son inverse : x ∈ E 7→ (x, f (x)) est continue, la continuité de f en découle trivialement. ✷ Le résultat suivant est classique mais peut s’avérer utile : Proposition 4.1 Soit E un espace de Banach et f ∈ L(E) tel que kf kL(E) < 1 alors id + f est inversible avec −1 (id + f ) = ∞ X (−1)k f k k=0 Preuve: Comme L(E) est de Banach et kf kL(E) < 1, la suite des sommes partielles Sn := n X (−1)k f k k=0 étant de Cauchy, elle converge. De plus Sn ◦ (id + f ) = id + (−1)n f n+1 , ce dont on tire le résultat voulu en faisant tendre n vers ∞. ✷ 4.3 Opérateurs compacts, alternative de Fredholm Par la suite, nous noterons BE la boule unité fermée de E. Définition 4.1 Soit T ∈ L(E, F ) on dit que T est un opérateur compact si et seulement si T (BE ) est relativement compact. On note K(E, F ) l’ensemble des opérateurs compacts de E vers F et K(E) l’ensemble des endomorphismes compacts de E. 84 Il découle immédiatement de la définition précédente que la composition (à droite ou à gauche) d’un opérateur compact et d’un opérateur linéaire continu est compacte. Lemme 4.2 K(E, F ) est un sous-espace vectoriel fermé de L(E, F ). Preuve: Le seul point à établir est la fermeture de K(E, F ). Supposons donc que Tn ∈ K(E, F ) et Tn → T , il s’agit de montrer que T (BE ) est relativement compact. Comme F est complet, ceci revient à montrer que T (BE ) est precompact. Soit ε et n tel que kTn − T k ≤ ε/2, comme Tn est compact, il existe k et y1 , . . . , yk ∈ F k tels que Tn (BE ) ⊂ ∪ki=1 B(yi , ε/2) de sorte que T (BE ) ⊂ ∪ki=1 B(yi , ε). ✷ Proposition 4.2 Soit E et F deux espaces de Banach et T ∈ K(E, F ) alors si (xn ) est une suite de E convergeant faiblement vers x, T xn converge fortement dans F vers T x. Preuve: Comme (xn ) est bornée et T est compact, T xn prend ses valeurs dans un compact (fort) de F . Comme par ailleurs T xn converge faiblement vers T x on en déduit que T x est l’unique valeur d’adhérence forte de la suite (T xn ) et donc que toute la suite converge fortement vers T x. ✷ Les opérateurs de rang fini (i.e. dont l’image est de dimension finie) sont évidemment compacts et donc les limites dans L(E, F ) d’opérateurs de rang fini sont des opérateurs compacts. Réciproquement, il n’est pas vrai en général qu’un opérateur compact soit limite d’opérateurs de rang fini (mais cette propriété est vraie dans les espaces de Hilbert). Théorème 4.5 Soit T ∈ K(E, F ) alors T ∗ ∈ K(F ′ , E ′ ). Réciproquement, si T ∗ ∈ K(F ′ , E ′ ) alors T ∈ K(E, F ). Preuve: Soit (vn ) une suite de BF ′ il s’agit de montrer que T ∗ (vn ) possède une sous suite convergente (ou de manière équivalente, de Cauchy) dans E ′ . Soit K := T (BE ), K est un compact de F , et posons fn (y) = hvn , yi , ∀y ∈ K. Comme les vn sont dans BF ′ , chaque fn est 1-Lipschitzienne sur K et fn (0) = 0 de sorte qu’avec le théorème d’Ascoli, la suite (fn ) possède une sous-suite 85 (encore notée fn par simplicité) convergeant uniformément sur K vers f ∈ C(K, R). Par construction, on a kT ∗ vn − T ∗ vm kE ′ ≤ sup |(fn − fm )(y)| y∈K si bien que la suite (T ∗ vn ) est de Cauchy dans E ′ . Réciproquement, si T ∗ ∈ K(F ′ , E ′ ), on déduit de ce qui précède T ∗∗ ∈ K(E ′′ , F ′′ ) c’est-à dire que T ∗∗ (BE ′′ ) est relativement compact dans F ′′ . Comme T (BE ) ⊂ T ∗∗ (BE ′′ ) et F est fermé dans F ′′ , on en déduit bien que T (BE ) est relativement compact dans F . ✷ Lemme 4.3 (Lemme de Riesz) Soit E un evn et F un sev fermé strict de E, pour tout ε ∈ (0, 1), il existe u ∈ E tel que kuk = 1 et d(u, F ) ≥ 1 − ε. Preuve: Soit v ∈ / F , d := d(v, F ) > 0 (car F est fermé) et u0 ∈ F tel que d ≤ kv − u0 k ≤ posons alors u := d 1−ε (4.3) v − u0 kv − u0 k et montrons que d(u, F ) ≥ 1 − ε. Soit f ∈ F , on a alors en utilisant (4.3) et le fait que u0 + kv − u0 kf ∈ F : ku − f k = 1 d ≥ 1 − ε. v − u0 − kv − u0 kf ≥ kv − u0 k kv − u0 k ✷ Théorème 4.6 (Alternative de Fredholm) Soit T ∈ K(E), alors on a : 1. ker(I − T ) est de dimension finie, 2. Im(I − T ) est fermé et Im(I − T ) = (ker(I − T ∗ ))⊥ , 3. ker(I − T ) = {0} si et seulement si Im(I − T ) = E, 4. dim ker(I − T ) = dim ker(I − T ∗ ). 86 Preuve: 1. Soit F := ker(I − T ) on a BF = T (BF ) ⊂ T (BE ) et donc BF est relativement compacte ce qui implique que F est de dimension finie. 2. Soit fn := un − T un une suite de Im(I − T ) convergeant vers f ∈ E, montrons que f ∈ Im(I − T ). Comme ker(I − T ) est de dimension finie, il existe vn ∈ ker(I − T ) tel que kun − vn k = d(un , ker(I − T )). Et évidemment on a fn = un − vn − T (un − vn ). (4.4) Montrons que (un − vn ) est bornée, si tel n’était pas le cas, à une extraction près, on aurait kun − vn k → ∞. En posant wn := (un − vn )/kun − vn k, et en utilisant (4.4) et le fait que fn est borné, ceci implique que wn − T wn → 0. Comme T est compact, on peut, à nouveau à une extraction près supposer que T wn converge vers z ∈ E et donc wn → z et z ∈ ker(I − T ). Mais par ailleurs, on a : d(wn , ker(I − T )) = 1 d(un , ker(I − T )) = 1 kun − vn k et donc en passant à la limite quand n → ∞, on obtient d(z, ker(I − T )) = 1 ce qui est absurde. Ainsi, on a bien que (un − vn ) est bornée, comme T est compacte on peut à une extraction près supposer que T (un − vn ) converge vers un certain g ∈ E de sorte que un − vn converge vers f + g et donc f = (f + g) − T (f + g) ∈ Im(I − T ). Comme Im(I − T ) est fermé, on déduit du lemme 4.1 que Im(I − T ) = (ker(I − T ∗ ))⊥ . 3. Supposons d’abord que ker(I − T ) = {0} et supposons par l’absurde que E1 := Im(I − T ) 6= E. On a T (E1 ) ⊂ E1 et il découle du point précédent que E1 est fermé et donc que T |E1 est compact. Posons E2 := (I − T )2 (E) = (I − T )(E1 ), comme (I − T ) est injective E2 est un sev strict de E1 et est fermé d’après le point 2. ; en posant En := (I −T )n (E), En est ainsi une suite strictement décroissante de sev fermés de E. Il résulte du lemme de Riesz qu’il existe xn ∈ En tel que kxn k = 1 et d(xn , En+1 ) ≥ 1/2. Soit n > m, on a T xm − T xn = T xm − xm − (T xn − xn ) + xm − xn 87 (4.5) et par construction, les vecteurs T xm − xm , T xn − xn et xn appartiennent à Em+1 , de sorte qu’avec (4.5), on a : kT xm − T xn k ≥ d(xm , Em+1 ) ≥ 1 2 ce qui est absurde puisque T est compact et (xn ) est bornée. Réciproquement supposons que Im(I − T ) = E, il découle alors du lemme 4.1 que ker(I −T ∗ ) = {0} et donc, en utilisant ce qui précède, Im(I −T ∗ ) = E ′ et donc avec (4.1) : ker(I − T ) = (Im(I − T ∗ ))⊥ = {0}. 4. Posons d := dim ker(I − T ) et d∗ := dim ker(I − T ∗ ) et montrons tout d’abord que d∗ ≤ d. Supposons par l’absurde que d < d∗ . Comme ker(I − T ) est de dimension finie, il existe un projecteur continu P de E sur ker(I − T ) (voir [2] pour les détails). De plus Im(I − T ) = ker(I − T ∗ )⊥ est de codimension finie d∗ et admet donc un supplémentaire F fermé de dimension d∗ dans E. Comme d < d∗ , il existe un opérateur linéaire Λ : ker(I − T ) → F injectif et non surjectif. Posons alors S := T + Λ ◦ P , S est un opérateur compact car Λ ◦ P est de rang fini. Soit u ∈ ker(I − S) : 0 = (u − T u) − (Λ ◦ P )(u) on a alors u − T u ∈ Im(I − T ) ∩ F et donc u − T u = 0 et Λ(P u) = 0. Comme u ∈ ker(I − T ), P u = u et donc u = 0 car Λ est injective. On a donc ker(I − S) = {0} si bien, qu ’en vertu du point 3., Im(I − S) = E. Soit f ∈ F avec f ∈ / Im(Λ), s’il existait u ∈ E tel que (I − S)(u) = u − T u − (Λ ◦ P )(u) = f alors on aurait u − T u ∈ F et donc u − T u = 0 ce qui impliquerait que f ∈ Im(Λ). Donc (I − S) n’est pas surjective ce qui constitue la contradiction cherchée. On a donc bien d∗ ≤ d. Appliquant le même argument que précédemment à T ∗ , il vient dim ker(I − T ∗∗ ) ≤ dim ker(I − T ∗ ) ≤ dim ker(I − T ) comme par ailleurs il est évident que ker(I − T ) ⊂ ker(I − T ∗∗ ), ceci permet d’en conclure que d = d∗ . ✷ Le théorème précédent appelle quelques commentaires. Tout d’abord le point 3. exprime que les opérateurs de la forme (I − T ) avec T compact sont injectifs si et seulement si ils sont surjectifs, cette propriété (automatique et familière en dimension finie) est remarquable en dimension infinie. Ensuite, l’alternative de Fredholm proprement dite concerne la solvabilité de l’équation u − T u = f . Elle exprime que : – ou bien pour tout f ∈ E, l’équation u − T u = f possède une unique solution 88 – ou bien l’équation homogène u − T u = 0 possède d = dim ker(I − T ) solutions linéairement indépendantes et dans ce cas, l’équation non homogène u−T u = f est résoluble si et seulement si f vérifie d conditions d’orthogonalité correspondant à f ∈ ker(I − T ∗ )⊥ . 4.4 Décomposition spectrale des opérateurs compacts autoadjoints Pour la preuve des résultats de ce paragraphe et en particulier l’important théorème spectral, nous renvoyons le lecteur au cours de Frédéric Paulin [15]. Soit T ∈ L(E), l’ensemble résolvant de T , ρ(T ) est donné par définition par : ρ(T ) := {λ ∈ R : T − λI bijective}. Le spectre de T , noté σ(T ) est le complémentaire de l’ensemble résolvant de T . On dit que λ ∈ R est une valeur propre de T (notation : λ ∈ VP(T )) si et seulement si (T − λI) n’est pas injective et dans ce cas on appelle ker(T − λI) 6= {0} l’espace propre associé à la valeur propre λ. On a toujours VP(T ) ⊂ σ(T ) mais (hormis évidemment en dimension finie) l’inclusion est en général stricte. Par exemple pour T ∈ L(lp ) défini par T ((xn )n ) = (0, x0 , x1 , ....), 0 est dans le spectre de T car T n’est pas surjective mais n’est pas valeur propre de T car T est injective. Proposition 4.3 Soit T ∈ L(E), le spectre de T est un ensemble compact inclus dans l’intervalle [−kT k, kT k]. Pour un opérateur compact en dimension infinie on a : Théorème 4.7 Soit E un espace de Banach de dimension infinie et soit T ∈ K(E). Alors on a : 1. 0 ∈ σ(T ), 2. σ(T ) \ {0} = VP(T ) \ {0}, 3. l’une des situations suivantes – ou bien σ(T ) = {0}, – ou bien σ(T ) \ {0} est fini, – ou bien σ(T ) \ {0} est une suite qui tend vers 0. Dans le cas où E = H est un espace de Hilbert, pour T ∈ L(H), en identifiant H ′ à H, on peut identifier T ∗ à un élément de L(H). Dans ce cadre Hilbertien, les opérateurs autoajoints sont alors définis par : 89 Définition 4.2 Soit H un espace de Hilbert et T ∈ L(H) on dit que T est autoajoint si T ∗ = T c’est-à-dire si hT u, vi = hu, T vi , ∀(u, v) ∈ H × H. Une première propriété spectrale des opérateurs autoadjoints nous est fournie par la Proposition 4.4 Soit H un espace de Hilbert et T ∈ L(H) un opérateur autoadjoint. On pose m := inf{hT u, ui , u ∈ H, kuk ≤ 1}, M := sup{hT u, ui , u ∈ H, kuk ≤ 1}. Alors σ(T ) ⊂ [m, M ] et (m, M ) ∈ σ(T )2 . On termine ce chapitre avec une propriété fondamentale des opérateurs compacts et autoadjoints : Théorème 4.8 (Théorème spectral pour les opérateurs compacts autoadjoints) Soit H un espace de Hilbert séparable et T un opérateur autoadjoint compact de H, alors il existe une base hilbertienne de H formée de vecteurs propres de T . 90 Chapitre 5 Espaces Lp On suppose le lecteur familier avec les résultats de base de la théorie de la mesure. On se limitera dans ce chapitre aux espaces de Lebesgue pour la mesure de Lebesgue (ce qui signifie que dans ce chapitre quand on parlera de ”presque partout”, ce sera au sens de la mesure de Lebesgue) sur un ouvert Ω de Rd , en laissant le soin au lecteur de généraliser les résultats à des espaces plus généraux. Enfin, on notera |A| la mesure de Lebesgue de la partie A de Rd et χA son indicatrice. On note L1 (Ω) l’espace des fonctions intégrables à valeurs réelles (en fait des classes d’équivalence pour la relation d’égalité presque partout, c’est à dire que l’on identifie naturellement deux fonctions intégrables qui coı̈ncident presque partout). Pour f ∈ L1 (Ω) on note Z |f (x)|dx. kf kL1 := Ω Quand cela n’engendrera pas de confusion, on notera simplement par la suite R p 1 1 L1 (et de même pour L ) plutôt que L (Ω) et pour f ∈ L (Ω), on notera f R au lieu de Ω f (x)dx. 5.1 Rappels d’intégration Passons en revue quelques résultats de base qu’il faut absolument connaitre. Théorème 5.1 (Théorème de convergence monotone Rde Beppo Levi) Soit (fn )n une suite croissante d’éléments de L1 . Si supn fn < ∞ alors (fn ) converge presque partout vers f = supn fn . De plus f ∈ L1 et kfn − f kL1 → 0 quand n → ∞. 91 1 Lemme 5.1 (Lemme de Fatou) R Soit (fn ) une suite de fonctions L 1 telle que chaque fn est positive et supn fn < ∞. Alors f := lim inf n fn ∈ L et Z Z f ≤ lim inf fn . n Théorème 5.2 (Théorème de convergence dominée de Lebesgue) Soit (fn )n une suite d’éléments de L1 . Si (fn (x)) converge p.p. vers une limite f (x) et s’il existe g ∈ L1 telle que pour tout n, |fn | ≤ g p.p. (on dit qu’un tel g est une majorante intégrable de (fn )) alors f ∈ L1 et kfn − f kL1 → 0 quand n → ∞. Lemme 5.2 (Densité des fonctions continues à support compact) Soit f ∈ L1 (Ω), pour tout ε > 0, il existe g ∈ Cc (Ω) tel que kf − gkL1 ≤ ε. Par convolution avec un noyau régularisant, on en déduit immédiatement Théorème 5.3 (Densité des fonctions C ∞ à support compact) Soit f ∈ L1 (Ω), pour tout ε > 0, il existe g ∈ Cc∞ (Ω) tel que kf − gkL1 ≤ ε. Soit maintenant Ω et U respectivement des ouverts de Rd et Rq et f une fonction mesurable Ω × U → R. Dans ce qui suit, on notera g(x) ∈ L1x au lieu de x 7→ g(x) est dans L1 . On a alors Théorème 5.4 (Fubini) Si f ∈ L1 (Ω×U ) alors pour presque tout x, f (x, y) ∈ R L1y (U ) et U f (x, y)dy ∈ L1x (Ω) et on a Z Z Ω f (x, y)dxdy = U Z Z f (x, y)dy dx. U Ω  Théorème 5.5 (Tonelli) Si pour presque tout x, f (x, .) ∈ L1y (U ) et Z Z Ω U  |f (x, y)|dy dx < +∞ alors f ∈ L1 (Ω × U ). 92 Exercice 5.1 Soit f ∈ L1 (Rd ) montrer que Z +∞ |{|f | > t}|dt. kf kL1 = 0 Exercice 5.2 Soit f ∈ L1 (Ω) montrer que pour tout ε > 0, il existe δ > 0 tel que Z |f | ≤ ε A pour tout mesurable A tel que |A| ≤ δ. 5.2 Propriétés élémentaires des espaces Lp Soit p : 1 ≤ p < ∞, on définit : Lp (Ω) := {f : Ω → R : f mesurable et |f |p ∈ L1 (Ω)} et pour f ∈ Lp (Ω) kf kLp := Z Ω p |f | 1/p . Pour p = ∞, L∞ est par définition l’ensemble des fonctions mesurables f telles qu’il existe C ≥ 0 tel que |f | ≤ C p.p. et pour f ∈ L∞ kf kL∞ := inf{C : |f | ≤ C p.p.}. Notons que si f ∈ L∞ alors on a p.p : |f (x)| ≤ kf kL∞ . Nous vérifierons ultérieurement que k.kLp est bien une norme sur Lp , cela est évident pour p = 1 et p = ∞ mais aussi pour pR = 2 car dans ce cas, k.kL2 est la norme associé au produit scalaire (f, g) 7→ Ω f g. Pour p : 1 ≤ p ≤ ∞, on note p′ l’exposant conjugué de p. Pour p ∈]1, ∞[ p 1 1 + ′ = 1 i.e. p′ = p p p−1 et évidemment 1′ = ∞, ∞′ = 1. 93 ′ Théorème 5.6 (Inégalité de Hölder) Soit f ∈ Lp et g ∈ Lp alors f g ∈ L1 et kf gkL1 ≤ kf kLp kgkLp′ . Preuve: La conclusion est évidente si p = 1 ou p = ∞ supposons donc 1 < p < ∞. Par concavité de log on a pour a et b strictement positifs   1 p 1 p′ ≥ log(ab) a + ′b log p p et donc 1 1 ′ ab ≤ ap + ′ bp p p cette inégalité étant évidente pour a = 0 ou b = 0. On a donc (en supposant f et g non nulles, ce qui est le cas où l’inégalité de Hölder n’est pas triviale) : ′ 1 |g(x)|p 1 |f (x)|p |f (x)g(x)| + ≤ ′ kf kLp kgkLp′ p kf kpLp p′ kgkp p′ L on en déduit que f g ∈ L1 et on obtient en intégrant l’inégalité précédente : Z |f g| ≤ 1. Ω kf kLp kgkLp′ ✷ Théorème 5.7 Soit p ∈ [1, ∞], Lp (Ω) est un espace vectoriel et k.kLp est une norme sur Lp (Ω). Preuve: A nouveau, la conclusion est évidente si p = 1 ou p = ∞ supposons donc 1 < p < ∞. Soit donc f et g dans Lp on a par convexité de t 7→ tp : |f (x) + g(x)|p ≤ (|f (x)| + |g(x)|)p ≤ 2p−1 (|f (x)|p + |g(x)|p ) de sorte que f + g ∈ Lp . Pour montrer que k.kLp est une norme sur Lp (Ω), il nous suffit de montrer l’inégalité triangulaire. Soit f et g dans Lp , on a Z Z Z p p−1 p−1 kf + gkLp = |f + g| |f + g| ≤ |f + g| |f | + |f + g|p−1 |g| 94 ′ et comme |f + g|p−1 ∈ Lp/(p−1) = Lp , il résulte de l’inégalité de Hölder que kf + gkpLp ≤ (kf kLp + kgkLp ) Z p |f + g| = (kf kLp + kgkLp )kf + gkp−1 Lp (p−1)/p de sorte que l’on a bien kf + gkLp ≤ kf kLp + kgkLp . ✷ Avant d’aller plus loin, voici quelques applications ou variantes faciles mais qu’il est bon de connaitre de l’inégalité de Hölder : Exercice 5.3 Soit Ω un ouvert de Rd de mesure finie, p > q ≥ 1 et u ∈ Lq (Ω) montrer que kukLq (Ω) ≤ kukLp (Ω) |Ω|1/q−1/p . Exercice 5.4 Soit gi ∈ Lpi (Ω) pour i = 1, ..., k avec que g = g1 ....gk ∈ L1 (Ω) avec kgkL1 ≤ k Y i=1 kf kLp ≤ i=1 i 1/pi = 1 montrer kgi kLpi . Montrer que si fi ∈ Lpi (Ω) pour i = 1, ..., k avec f = f1 ....fk ∈ Lp (Ω) avec k Y P P i 1/pi = 1/p ≤ 1, alors kfi kLpi . Exercice 5.5 Soit f ∈ Lp (Ω) ∩ Lq (Ω) (1 ≤ p ≤ q ≤ ∞). Montrer que f ∈ Lr (Ω), pour tout r ∈ [p, q] et que kf kLr ≤ kf kαLp kf k1−α Lq où α ∈ [0, 1] satisfait α (1 − α) 1 = + . r p q 95 Théorème 5.8 Lp (Ω) est un espace de Banach pour tout p, 1 ≤ p ≤ ∞. Preuve: Traitons d’abord le cas p = ∞. Soit (fn ) une suite de Cauchy de Lp , pour tout k ∈ N∗ il existe nk tel que pour tout m et n ≥ nk on a kfm − fn kL∞ ≤ 1 . k Ceci implique qu’il existe Ek négligeable tel que |fm (x) − fn (x)| ≤ 1 , ∀m, n ≥ nk , ∀x ∈ Ω \ Ek . k (5.1) Ainsi pour tout x ∈ Ω \ Ek , (fn (x))n est de Cauchy et converge donc vers une limite notée f (x). En posant E = ∪k Ek (de sorte que E est négligeable) et en passant à la limite m → ∞ dans (5.1) on a |f (x) − fn (x)| ≤ 1 , ∀n ≥ nk ∀x ∈ Ω \ E k ce qui prouve que f − fn (et donc f ) est dans L∞ et que kfn − f kL∞ tend vers 0 quand n → ∞. Supposons maintenant 1 ≤ p < ∞ et soit (fn ) une suite de Cauchy de Lp . Pour montrer que (fn ) converge dans Lp , il nous suffit de montrer que (fn ) possède une valeur d’adhérence dans Lp . Soit (fnk )k une sous-suite vérifiant kfnk+1 − fnk kLp ≤ 1 , ∀k ≥ 1. 2k (5.2) Posons alors gk := fnk et hn := n X k=1 |gk+1 − gk |. Par construction, (hn ) est une suite croissante vérifiant khn kLp ≤ 1, ∀n. Il résulte du théorème de convergence monotone de Beppo-Levi que (hn ) converge p.p. vers h ∈ Lp . Pour m ≥ n ≥ 2 on a |gm (x) − gn (x)| ≤ h(x) − hn−1 (x) (5.3) et donc pour presque tout x, (gn (x)) est une suite de Cauchy de limite g(x). En faisant m → ∞ dans (5.3), on a |gn − g| ≤ h p.p. 96 (5.4) et comme h ∈ Lp , on déduit du théorème de convergence dominée de Lebesgue que kgn − gkLp → 0 ce qui achève la preuve. ✷ Il convient de distinguer le cas p = 2, en effet L2 (Ω) est un espace de Hilbert pour le produit scalaire Z f (x)g(x)dx, ∀(f, g) ∈ L2 (Ω) × L2 (Ω). hf, gi := Ω Proposition 5.1 Soit (fn )n une suite de Lp et f ∈ Lp . Si fn converge vers f dans Lp alors (fn ) possède une sous-suite qui admet une majorante Lp et qui converge vers f presque partout. Preuve: Le cas p = ∞ étant évident on suppose p ∈]1, ∞[ et on construit comme dans la preuve précédente (gk ) = (fnk ) de sorte que (5.2) soit satisfaite. Comme dans la preuve précédente on a (5.4) avec h ∈ Lp et (gn ) converge vers g p.p. et dans Lp . On a donc f = g et il résulte de (5.4) que |gn | ≤ h + |f | ∈ Lp ce qui fournit la majorante Lp recherchée. ✷ 5.3 Dualité, réflexivité, séparabilité Lemme 5.3 (Inégalité de Clarkson) Soit p ∈ [2, ∞[, pour tout f et g dans Lp , on a :  f +g p 1 f −g p kf kpLp + kgkpLp . + ≤ 2 2 2 Lp Lp Preuve: On commence par remarquer que t 7→ (t2 + 1)p/2 − tp − 1 est croissante sur R+ et donc tp + 1 ≤ (t2 + 1)p/2 , ∀t ≥ 0 (en remplaçant t par t/s dans l’inégalité précédente) il en résulte que tp + sp ≤ (t2 + s2 )p/2 ∀t ≥ 0, ∀s ≥ 0 et donc pour tout (f, g) ∈ R2 : f +g 2 p + f −g 2 p 97 ≤ f2 2 + g 2 p/2 2 en utilisant la convexité de t 7→ tp/2 pour p ≥ 2, il vient donc f +g p f −g p 1 p 1 p + ≤ |f | + |g| 2 2 2 2 et l’inégalité recherchée en découle immédiatement. ✷ Notons que p = 2 est un cas limite dans lequel l’inégalité de Clarkson est une égalité (c’est l’identité du parallélogramme !). On déduit immédiatement du lemme précédent : Lemme 5.4 Lp est uniformément convexe pour 2 ≤ p < ∞. Preuve: Soit ε > 0, f et g dans Lp avec kf kLp ≤ 1, kgkLp ≤ 1 et kf − gkLp ≥ ε, il résulte du lemme 5.3 que  εp 1/p f +g ≤ 1 − δ, avec δ := 1 − 1 − p 2 2 Lp p ce qui prouve L est uniformément convexe. ✷ Dans le cas où 1 < p ≤ 2, Lp est également uniformément convexe, la preuve est cependant un peu plus compliquée et repose sur l’inégalité suivante : Lemme 5.5 (Inégalité de Hanner) Soit p ∈]1, 2], pour tout f et g dans Lp , on a :  p p kf kLp + kgkLp + kf kLp − kgkLp ≤ kf + gkpLp + kf − gkpLp . Preuve: On commence par remarquer que la fonction F : (x, y) ∈ R+ × R+ 7→ F (x, y) = (x1/p + y 1/p )p + |x1/p − y 1/p |p est convexe et homogène de degré 1. On a donc par l’inégalité de Jensen : Z Z Z p p F ( |f | , |g| ) ≤ F (|f |p , |g|p ) c’est à dire :  p p p kf kL + kgkL + kf kLp − kgkLp p ≤ Z  p Z |f | − |g| |f | + |g| + p on conclut en remarquant (en distinguant le cas où f et g ont même signe de celui où f et g sont de signes opposés) que l’on a  p p |f | + |g| + |f | − |g| = |f + g|p + |f − g|p . ✷ 98 Lemme 5.6 Lp est uniformément convexe pour 1 < p ≤ 2. Preuve: Soit ε > 0, f et g dans Lp avec kf kLp ≤ 1, kgkLp ≤ 1 et kf − gkLp ≥ ε. Appliquant ’inégalité de Hanner à (f + g)/2 et (f − g)/2, il vient  f +g 2 Lp + f −g 2 Lp p f +g 2 + Lp − f −g 2 p Lp ≤ kf kpLp +kgkpLp ≤ 2. (5.5) Posons ϕ(t) := t pour tout t ≥ 0, soit a ≥ b ≥ 0, la formule de Taylor avec reste intégral donne Z 1 b2 1 1 ϕ(a + b) + ϕ(a − b) = ϕ(a) + (1 − t)(ϕ′′ (a + tb) + ϕ′′ (a − tb))dt 2 2 2 0 Z 1 1 p 2 = a + p(p − 1)b (1 − t) ((a + tb)p−2 + (a − tb)p−2 )dt 2 0 p utilisant le fait que comme p ≤ 2, s > 0 7→ sp−2 est convexe, il vient donc que pour a ≥ b ≥ 0, on a : 1 p(p − 1)b2 ap−2 1 (a + b)p + (a − b)p ≥ ap + . 2 2 2 (5.6) Dans le cas où kf + gkLp ≥ kf − gkLp , avec (5.5) et (5.6), il vient donc 1≥ f +g 2 p Lp + p(p − 1) f − g 2 2 2 Lp f +g 2 p−2 Lp on obtient kL2−p en multipliant par k f +g p 2 1≥ f +g 2 2−p Lp ≥ f +g 2 2 Lp + p(p − 1) f − g 2 2 de sorte que 2 Lp f +g 2 p(p − 1)ε2 . ≤1− 2 8 Lp Dans le cas où kf + gkLp ≤ kf − gkLp , on tire immédiatement de (5.5) que f +g 2 p Lp ce qui achève la preuve. ✷ Pour résumer, on a donc établi : 99 ≤ 21−p Théorème 5.9 Pour tout p ∈]1, ∞[, Lp (Ω) est uniformément convexe. On vérifie très facilement ”à la main” que L1 et L∞ ne sont pas uniformément convexes. Il résulte du théorème précédent et du théorème de Milman-Pettis 3.6 : Théorème 5.10 Lp (Ω) est un espace réflexif pour tout p, 1 < p < ∞. Une autre conséquence utile en pratique de l’uniforme convexité de Lp nous est fournie par le théorème 3.7 qui ici se traduit par : Théorème 5.11 Soit p ∈]1, ∞[, (fn ) une suite de Lp (Ω) et f ∈ Lp (Ω). Si (fn ) converge faiblement vers f dans Lp et si lim kfn k = kf k n alors (fn ) converge fortement dans Lp vers f . Exercice 5.6 Monter que le résultat précédent est faux dans L1 (faible) et L∞ (faible ∗). Le résultat de représentation suivant montre que si 1 < p < ∞, on peut ′ identifier (Lp )′ à Lp : Théorème 5.12 (Théorème de représentation de Riesz) Soit p : 1 < p < ∞ ′ et soit ϕ ∈ (Lp (Ω))′ alors il existe un unique u ∈ Lp tel que Z uf, ∀f ∈ Lp (Ω) hϕ, f i = Ω de plus on a kϕk(Lp )′ = kukLp′ . Preuve: ′ Définissons T : Lp → (Lp )′ par Z ′ hT u, f i := uf, ∀u ∈ Lp , ∀f ∈ Lp . Ω Il résute de l’inégalité de Hölder que T est continue et plus précisément : kT uk(Lp )′ ≤ kukLp′ , ∀u ∈ Lp . 100 ′ ′ Soit u ∈ Lp , u 6= 0, alors f := |u|p −2 u appartient à Lp et donc R fu = kukLp . kT uk(Lp )′ ≥ kf kLp ′ On en déduit donc que T est une isométrie de Lp dans (Lp )′ . En particulier, T est injective, ce qui montre l’unicité. Pour l’existence il s’agit de montrer ′ que T est surjective, T (Lp ) étant fermé, il suffit de montrer que T (Lp ) est ′ dense dans (Lp )′ . Soit h ∈ (Lp )′′ tel que h ≡ 0 sur T (Lp ) comme Lp est réflexif, on peut identifier h à un élément (encore noté h) de Lp , en prenant ′ u := |h|p−2 h ∈ Lp , on a alors Z hT u, hi = 0 = |h|p = 0 ′ et donc h = 0 ce qui montre que T (Lp ) est dense dans (Lp )′ . ✷ S’agissant du dual de L1 on a le théorème de représentation suivant : Théorème 5.13 Soit ϕ ∈ (L1 (Ω))′ alors il existe un unique u ∈ L∞ tel que Z uf, ∀f ∈ L1 (Ω) hϕ, f i = Ω de plus on a kϕk(L1 )′ = kukL∞ . Preuve: Montrons l’existence d’un u dans L∞ représentant ϕ. Soit K un compact inclus dans Ω, pour f ∈ L2 on a | hϕ, χK f i | ≤ kϕk(L1 )′ |K|1/2 kf kL2 de sorte que f ∈ L2 7→ hϕ, χK f i est dans (L2 )′ = L2 . Par le théorème de Riesz pour les Hilbert ou le théorème 5.12, il existe donc uK ∈ L2 telle que Z f uK , ∀f ∈ L2 hϕ, χK f i = Ω on vérifie aisément que uK est nécessairement de la forme uK = χK u avec u ∈ L2loc . En particulier on a Z uf, ∀f ∈ Cc (Ω). (5.7) hϕ, f i = Ω 101 Montrons que u ∈ L∞ et plus précisément que |u| ≤ kϕk(L1 )′ p.p. ; si tel n’était pas le cas, il existerait δ > 0 tel que  Aδ := |u| ≥ kϕk(L1 )′ + δ soit de mesure strictement positive, ceci entrainant qu’il existe K compact inclus dans Ω tel que Kδ := K ∩ Aδ soit aussi de mesure strictement positive. Soit alors f := χKδ sg(u) on a alors kϕk(L1 )′ kf kL1 = kϕk(L1 )′ |Kδ | Z Z |u| uf = ≥ hϕ, f i = Kδ Ω   ≥ |Kδ | kϕk(L1 )′ + δ ce qui constitue la contradiction recherchée. On a donc u ∈ L∞ et kukL∞ ≤ kϕk(L1 )′ . Par densité de Cc (Ω) dans L1 avec (5.7), on a donc Z hϕ, f i = uf, ∀f ∈ L1 (Ω) ce qui implique aussi kϕk(L1 )′ ≤ kukL∞ . Enfin l’unicité de u ∈ L∞ représentant ϕ découle immédiatement du lemme 2.7. ✷ Le résultat précédent précédent prouve en particulier que L∞ est un dual topologique, on pourra donc en particulier lui appliquer le théorème de Banach-Alaoglu-Bourbaki. Théorème 5.14 Soit p ∈ [1, +∞[, D(Ω) est dense dans Lp (Ω). Preuve: Soit T ∈ (Lp )′ tel que T (ϕ) = 0, pour tout ϕ ∈ D. Il résulte des théorèmes ′ 5.12 et 5.13 qu’il existe u ∈ Lp (en particulier u ∈ L1loc ) représentant T , on a alors {u} = 0 dans D′ et donc u = 0 p.p. en vertu du Lemme 2.7. On a donc T = 0, on en conclut que D(Ω) est dense dans Lp (Ω) grâce au corollaire 1.6 ✷ Théorème 5.15 Lp (Ω) est séparable pour tout p ∈ [1, ∞[. Preuve: Soit E l’ensemble des combinaisons linéaires à coefficients dans Q d’indicatrices de pavés de la forme Πdi=1 ]xi , yi [ inclus dans Ω et avec les xi , yi à coordonnées rationnelles. Par construction E est dénombrable, il nous suffit 102 donc de montrer que E est dense dans Lp (Ω). Soit f ∈ Lp (Ω) et ε > 0, on commence par choisir g ∈ Cc (Ω) tel que kf − gkLp (Ω) ≤ ε/2. Soit ω un ouvert borné contenant supp(g), en utilisant l’uniforme continuité de g, on construit facilement h ∈ E tel que supp(h) ⊂ ω et kg − hkL∞ (ω) ≤ ε/(2|ω|1/p ), de sorte que l’on a kg − hkLp (Ω) ≤ ε/2 et donc aussi kf − hkLp (Ω) ≤ ε. ✷ Notons que L2 est un Hilbert séparable. En particulier, L2 admet des bases Hilbertiennes, mieux encore : on peut appliquer le théorème de décomposition spectrale dans L2 , nous reviendrons sur ce point plus en détail par la suite. Comme L1 est séparable et L∞ = (L1 )′ , on déduit du corollaire 3.6 du théorème de Banach-Alaoglu-Bourbaki : Théorème 5.16 Toute suite bornée de L∞ (Ω) possède une sous-suite convergente pour la topologie faible-∗ σ(L∞ , L1 ). Nous avons laissé en suspens la question de la réflexivité de L1 et L∞ , à cette question, la réponse est négative : Théorème 5.17 L1 (Ω) et L∞ (Ω) ne sont pas réflexifs. Preuve: Comme (L1 )′ = L∞ , en vertu du corollaire 3.2, il nous suffit de montrer que L1 n’est pas réflexif c’est à dire que L1 6= (L∞ )′ . Soit x0 ∈ Ω et ϕ la forme linéaire sur Cc (Ω) définie par hϕ, f i := f (x0 ), ∀f ∈ Cc (Ω) comme hϕ, f i ≤ kf kL∞ , ∀f ∈ Cc (Ω), grâce au théorème de Hahn-Banach, on peut prolonger ϕ en un élément de (L∞ )′ (qu’on notera encore ϕ). S’il existait u ∈ L1 représentant ϕ, on aurait en particulier {u} = 0 dans D′ (Ω \ {x0 }) ce qui avec le lemme 2.7 entrainerait f = 0 p.p. sur Ω \ {x0 } et donc aussi f = 0 p.p. sur Ω, on aurait alors ϕ = 0 ce qui est absurde. ✷ Le résultat qui suit va nous permettre de répondre négativement à la question de la séparabilité de L∞ : Lemme 5.7 Soit E un evn, s’il existe, (Oi )i∈I une famille d’ouverts non vides de E vérifiant I non dénombrable et Oi ∩ Oj = ∅ si (i, j) ∈ I 2 et i 6= j alors E n’est pas séparable. Preuve: Supposons par l’absurde que (un ) soit dense dans E alors pour chaque i ∈ I, il existe n = n(i) tel que un(i) ∈ Oi . Comme i ∈ I 7→ n(i) est injective on en déduit que I est au plus dénombrable, d’où la contradiction recherchée. ✷ 103 Proposition 5.2 L∞ n’est pas séparable. Preuve: Soit x ∈ Ω et rx < d(x, Rd \ Ω), posons ux := χB(x,rx ) et   1 ∞ Ox := u ∈ L : ku − ux kL∞ < . 2 On vérifie facilement que la famille (Ox )x∈Ω vérifie les hypothèses du lemme 5.7 dans L∞ et donc que L∞ n’est pas séparable. ✷ Exercice 5.7 Soit (ρn ) une suite régularisante et f ∈ Lp (Rd ) montrer que ρn ⋆ f converge vers f dans Lp (Rd ). Exercice 5.8 Soit Ω un ouvert borné de Rd et p : 1 < p < ∞. Soit (un ) ′ une suite de Lp (Ω) et u ∈ Lp (Ω) tels que un ⇀ u pour σ(Lp , Lp ) et il existe λ ≥ 0 tel que |{|un | ≥ λ}| → 0 quand n → +∞. Montrer que u ∈ L∞ avec kukL∞ ≤ λ. Exercice 5.9 (Théorème de Lusin) Soit Ω un ouvert borné de Rd et f mesurable Ω → R. Montrer que pour tout ε > 0, il existe g ∈ Cc (Ω) tel que |{f 6= g}| ≤ ε. Dans le cas où f ∈ L∞ montrer que g peut être choisie satisfaisant en plus kgkL∞ ≤ kf kL∞ Exercice 5.10 (Théorème d’Egorov) Soit Ω un ouvert de Rd de mesure finie, (fn ) et f mesurables telles que (fn ) converge vers f p.p. Montrer que pour tout ε > 0, il existe Aε ⊂ Ω mesurable tel que |Ω \ Aε | ≤ ε et (fn ) converge uniformément vers f sur Aε . Exercice 5.11 Soit p ∈ [1, ∞[ et f ∈ Lp (Rd ), montrer que lim kτh f − f kLp = 0 h→0 (on rappelle que τh f (x) := f (x + h)). 104 5.4 Compacité dans Lp Nous avons déja vu que Lp est réflexif pour 1 < p < ∞ il résulte donc du théorème de Kakutani que les parties bornées de Lp sont faiblement relati′ vement compactes et du théorème 3.5 (ou du fait que Lp est séparable) que les suites bornées de Lp admettent des sous-suites faiblement convergentes : Théorème 5.18 Soit p ∈]1, ∞[. Toute partie bornée de Lp est faiblement relativement compacte. Toute suite bornée de Lp possède une sous-suite qui ′ converge faiblement σ(Lp , Lp ). Pour p = ∞, comme L∞ = (L1 )′ on a comme conséquence immédiate du théorème de Banach-Alaoglu-Bourbaki d’une part et de la séparabilité de L1 et du corollaire 3.6 d’autre part : Théorème 5.19 Toute partie bornée de L∞ est faiblement ∗ relativement compacte. Toute suite bornée de L∞ possède une sous-suite qui converge faiblement -∗ σ(L∞ , L1 ). Pour la compacité forte, on a le critère suivant : Théorème 5.20 (Théorème de compacité de Riesz-Fréchet-Kolmogorov) Soit p ∈ [1, ∞[ et F une partie bornée de Lp (Ω). Si d’une part pour tout ε > 0 et tout ω ⊂⊂ Ω il existe δ : 0 < δ < d(ω, Rd \ Ω) tel que sup kτh f − f kLp (ω) ≤ ε, ∀h ∈ Rd : |h| ≤ δ f ∈F et d’autre part pour tout ε > 0 il existe ω ⊂⊂ Ω (i.e. ω ouvert, ω compact et inclus dans Ω) tel que sup kf kLp (Ω\ω) ≤ ε f ∈F alors F est relativement compact dans Lp (Ω). Preuve: Comme Lp (Ω) est complet il suffit de montrer que F est précompact dans Lp (Ω). Soit donc ε > 0, il s’agit de montrer que F peut être recouvert par un nombre fini de boules de rayon ε de Lp (Ω). On commence par choisir ω ⊂⊂ Ω tel que ε sup kf kLp (Ω\ω) ≤ (5.8) 3 f ∈F c’est à dire ε sup kf − f χω kLp (Ω) ≤ . 3 f ∈F 105 (5.9) Par hypothèse, il existe n ∈ N∗ tel que n−1 < d(ω, Rd \ Ω) et ε sup kτh f − f kLp (ω) ≤ , ∀h ∈ Rd : |h| ≤ n−1 . 3 f ∈F (5.10) Soit ρn un noyau régularisant (C ∞ , positif, à support dans B(0, n−1 ) et d’intégrale 1) et Fn,ω := {(ρn ⋆ f ) |ω , f ∈ F }. Pour f ∈ F et x ∈ Ω on a |(ρn ⋆ f − f )(x)| ≤ Z ρn (h)|τ−h f (x) − f (x)|dh B(0,n−1 ) et donc avec l’inégalité de Jensen Z p |(ρn ⋆ f − f )(x)| ≤ ρn (h)|τ−h f (x) − f (x)|p dh B(0,n−1 ) et donc en utilisant le théorème de Fubini et (5.10) on a Z  ε p p p ρn (h)kτ−h f − f kLp (ω) dh ≤ kρn ⋆ f − f kLp (ω) ≤ 3 B(0,n−1 ) ainsi Pour f ∈ F on a et ε sup kρn ⋆ f − f kLp (ω) ≤ . 3 f ∈F (5.11) kρn ⋆ f kL∞ (ω) ≤ kρn kLp′ kf kLp k∇(ρn ⋆ f )kL∞ (ω) ≤ k∇ρn kLp′ kf kLp de sorte que Fn,ω est uniformément bornée et équilipschitzienne et donc, en vertu du théorème d’Ascoli, relativement compact dans C(ω) et donc aussi dans Lp (ω). Il existe donc N et g1 , ..., gN dans Lp (ω) (qu’on prolonge par 0 en dehors de ω) tel que N [ ε Fn,ω ⊂ B(gi , ). 3 i=1 Grâce à (5.9) et (5.11) on en déduit que Fn,ω ⊂ N [ B(gi , ε) i=1 ce qui achève la démonstration. ✷ 106 Exercice 5.12 Montrer que les conditions sur F dans le Théorème de RieszFréchet-Kolmogorov sont en fait aussi nécessaires pour la relative compacité de F. Exercice 5.13 Soit g ∈ L1 , F une partie bornée de Lp (Rd ) et ω un ouvert borné de Rd , montrer que {(g ⋆ f )χω , f ∈ F } est relativement compact dans Lp (ω). Le résultat précédent est-il vrai quand on remplace ω par Rd ? Compacité faible dans L1 5.5 Définition 5.1 Soit Ω un ouvert borné de Rd et F une partie bornée de L1 (Ω), alors F est dite uniformément intégrable si ∀ε > 0, ∃δ > 0 tel que Z |f | ≤ ε, pour tout f ∈ F et tout A ⊂ Ω tel que |A| ≤ δ. (5.12) A Le théorème de Dunford-Pettis énonce que l’uniforme intégrabilité est une condition nécessaire et suffisante de relative compacité faible dans L1 . Nous nous contenterons ici de démontrer le caractère suffisant pour la compacité faible séquentielle, la preuve du caractère nécessaire étant a priori moins utile, nous renvoyons le lecteur intéressé à [6] pour plus de détails. Théorème 5.21 (Dunford-Pettis) Soit Ω un ouvert borné de Rd et F une partie bornée de L1 (Ω), alors si F est uniformément intégrable, de toute suite de F, on peut extraire une sous suite convergeant pour σ(L1 , L∞ ). Preuve: On commence par remarquer que l’on peut supposer les éléments de F positifs (écrire f = f+ − f− et remarquer que {f± , f ∈ F} sont uniformément ∗ k intégrables). Soit (fn ) une R suite de F, pour tout k ∈ N on pose fn := fn χ{fn ≤k} . Soit C = supn fn , on a Z C ≥ fn ≥ k|{fn > k}| il résute donc de l’uniforme intégrabilité de F que Z fn = 0 lim sup k→∞ n {fn >k} 107 et donc que k δ := sup kfn − n fnk kL1 = sup n Z {fn >k} fn → 0 quand k → ∞. (5.13) On remarque ensuite que comme (fnk )n est bornée dans L∞ , elle admet une sous-suite qui converge pour σ(L∞ , L1 ) et donc a fortiori pour σ(L1 , L∞ ) (c’est ici qu’intervient le fait que Ω soit borné). On applique alors le procédé habituel d’extraction diagonal de Cantor. Pour tout k, il existe ϕk strictement croissante de N dans N et il existe f k ∈ L∞ tels que (fϕkk (n) ) converge vers f k pour σ(L1 , L∞ ) quand n → ∞ (et on choisit ϕk+1 de la forme ϕk+1 = ϕk ◦ ψk avec ψk strictement croissante de N dans N de sorte que (fϕl k (n) ) converge vers f l pour l ≤ k). On a Z Z Z k k f ≤ lim inf fϕk (n) ≤ lim inf fϕk (n) ≤ C n n R et de plus (f k ) est croissante par rapport à k (passer à la limite dans g(fnk+1 − fnk ) ≥ 0 pour g ≥ 0, g ∈ L∞ ). Il résulte donc du théorème de convergence monotone de Beppo-Levi que (f k ) converge fortement dans L1 vers f . Il nous reste maintenant à montrer que (fϕ(n) ) (avec ϕ(n) := ϕn (n)) converge vers f pour σ(L1 , L∞ ). Soit g ∈ L∞ , ε > 0 et k0 tel que kgk∞ (δk0 + kf k0 − f kL1 ) ≤ on a alors Z ε 2 Z k0 k0 − f k0 + f k 0 − f ) + fϕ(n) g(fϕ(n) − fϕ(n) Z ε k0 ≤ + g(fϕ(n) − f k0 ) 2 g(fϕ(n) − f ) = k0 )n converge faiblement dans L1 vers f k0 , on a pour n assez et comme (fϕ(n) grand Z g(fϕ(n) − f ) ≤ ε ce qui achève la preuve. ✷ Exercice 5.14 Montrer que l’uniforme intégrabilité est aussi une condition nécessaire à la relative compacité faible séquentielle. 108 Exercice 5.15 Soit F une partie bornée de L1 (Ω). Montrer que F est uniformément intégrable si et seulement si Z |f | → 0, quand M → +∞. sup f ∈F {|f |≥M } Exercice 5.16 (Critère de de La Vallée-Poussin) Soit F une partie bornée de L1 (Ω). Montrer que F est uniformément intégrable si et seulement s’il existe une fonction g : R+ → R+ croissante (et que l’on peut en outre choisir convexe) et telle que g(t)/t → +∞ quand t → ∞ et Z sup g(|f (x)|)dx < +∞. f ∈F Ω Pour les suites bornées de L1 (mais non nécessairement uniformément intégrables) on a le résultat suivant que nous donnons ici sans démonstration : Lemme 5.8 (Biting Lemma) Soit Ω un ouvert borné de Rd et (fn ) une suite bornée de L1 (Ω). Il existe une suite décroissante d’ensemble mesurables (Ek ) telle que |Ek | → 0 et une sous suite de (fn ), (fnk ) tels que (χΩ\Ek fnk ) soit uniformément intégrable. Nous évoquerons au prochain chapitre le principe de concentration-compacité de Pierre-Louis Lions qui donne précisément les différents comportements possibles des suites de mesures de probabilité sur Rd . 109 Chapitre 6 Espaces de mesures 6.1 Rappels sur les espaces de fonctions continues Rappelons à toutes fins utiles le théorème d’Ascoli-Arzelà que nous avons d’ailleurs déjà utilisé à plusieurs reprises Théorème 6.1 (Théorème d’Ascoli-Arzelà) Soit (K, d) un espace métrique compact et F une partie bornée de C(K) uniformément équicontinue c’est à dire vérifiant : pour tout ε > 0, il existe δ > 0 tel que pour tout (x1 , x2 ) ∈ K 2 si d(x1 , x2 ) ≤ δ alors |f (x1 ) − f (x2 )| ≤ ε, ∀f ∈ F. Alors F est relativement compacte dans C(K). En pratique, pour montrer l’uniforme équicontinuité d’une famille F on montre souvent (et c’est équivalent !) qu’elle possède un module de continuité uniforme c’est à dire une fonction croissante ω tendant vers 0 en 0 et telle que |f (x1 ) − f (x2 )| ≤ ω(d(x1 , x2 )), ∀(x1 , x2 , f ) ∈ K 2 × F. Pour ω(t) = Ct, on a une famille équilipschitzienne, pour ω(t) = Ctα avec α ≤ 1, une famille équi-Hölderienne d’exposant α.... Proposition 6.1 (Lemme d’Urysohn) Soit (X, d) un espace localement compact (c’est à dire dont tout point possède un voisinage compact) soit K une partie non vide compacte de X et V un ouvert contenant K alors il existe f ∈ Cc (X) tel que χK ≤ f ≤ χV . 110 Preuve: Il est facile de voir qu’il existe O, voisinage ouvert et relativement compact de K contenu dans V . En posant : f (x) := d(x, X \ O) , ∀x ∈ X d(x, K) + d(x, X \ O) il est clair que f a les propriétés requises. ✷ Proposition 6.2 (Partition de l’unité) Soit (X, d) un espace localement compact, K une partie compacte de X et V1 , ..., Vn un recouvrement ouvert de K. Il existe g1 , .., gn ∈ Cc (X)n vérifiant 0 ≤ gi ≤ 1, supp(gi ) ⊂ Vi et n X i=1 gi (x) = 1, ∀x ∈ K. La famille g1 , .., gn s’appelle partition de l’unité subordonnée au recouvrement V1 , ..., Vn de K. Preuve: Pour tout x ∈ K, il existe Wx un voisinage ouvert de x tel que W x soit compact et inclus dans l’un des Vi . Par compacité de K, on peut le recouvrir par les ouverts Wxj , j = 1, ..., p. On définit alors pour i = 1, ..., n [ W xj . Ki := j : W xj ⊂Vi On déduit du Lemme d’Urysohn qu’il existe fi ∈ Cc (X), tel que χKi ≤ fi ≤ χVi . Définissons g1 := f1 , g2 := f2 (1 − f1 ), ...., gn := fn (1 − fn−1 )....(1 − f1 ) on a alors n X i=1 gi (x) = 1 − (1 − f1 (x))...(1 − fn (x)) or si x ∈ K, x ∈ Ki pour un certain i et donc ✷ Pn i=1 gi (x) = 1. Théorème 6.2 (Prolongement de Tietze) Soit (K, d) un espace métrique compact, F un fermé de K et f ∈ C(F ), alors f admet un prolongement continu à K. 111 Preuve: Soit ω un module de continuité de f sur F (correctement défini car F est compact et donc f est uniformément continue sur F ) qu’on suppose sans perte de généralité sous-additif (ω(s + t) ≤ ω(s) + ω(t)). Pour tout x ∈ K posons g(x) := inf {f (y) + ω(d(x, y))} y∈F on vérifie sans peine que g prolonge f et admet ω comme module de continuité. ✷ Théorème 6.3 Si (K, d) est un espace métrique compact alors C(K) est séparable. Preuve: K étant compact, il est séparable ; soit donc {xi }i∈N dense dans K. Pour tout i ∈ N et n ∈ N, on déduit du lemme d’Urysohn qu’il existe fi,n ∈ C(K) vérifiant χB(xi ,2−n−1 ) ≤ fi,n ≤ χB(xi ,2−n ) . Pour tout n, il existe In ⊂ N fini tel que [ K= B(xi , 2−n−1 ) i∈In on pose alors pour tout n ∈ N et tout i ∈ In : fi,n (x) , ∀x ∈ K. j∈In fj,n (x) gi,n (x) := P On vérifie sans peine que l’espace vectoriel sur Q engendré par la famille {gi,n , n ∈ N, i ∈ In } est dense dans C(K). ✷ On déduit des résultats précédents que si l’espace métrique (X, d) est σcompact (i.e. réunion d’une suite croissante de compacts Kn ) alors Cc (X) (limite inductive des espaces CKn (X)) est séquentiellement séparable. 6.2 Théorème de Riesz et mesures de Radon dans le cas compact On rappelle que si (X, d) est un espace métrique (ici on ne considèrera par simplicité que ce cas même si la plupart des résultats de ce chapitre s’étendent au cas séparé), sa tribu Borélienne, BX , est par définition la tribu 112 engendrée par ses ouverts. Une mesure borélienne sur X est une mesure définie sur la tribu borélienne de X (c’est à dire une application σ-additive de BX à valeurs dans [0, ∞]). Nous omettrons parfois par la suite le terme borélienne, étant entendu implicitement que nous ne considèrerons que des mesures boréliennes. On dit en outre que µ est finie si µ(X) < +∞ etS que µ est σ-finie s’il existe une suite croissante de Boréliens Bn telle que X = n Bn et µ(Bn ) < +∞ pour tout n. Les mesures boréliennes régulières sont définies comme suit : Définition 6.1 Soit (X, d) un espace métrique et µ une mesure borélienne sur X alors µ est dite régulière si pour tout A ∈ BX on a µ(A) = inf{µ(O) : O ouvert, A ⊂ O} et µ(A) = sup{µ(K) : K compact, K ⊂ A}. Si (X, d) est compact et µ est une mesure borélienne finie alors la forme linéaire Tµ définie par Z f dµ, ∀f ∈ C(X) Tµ (f ) := X est continue (|Tµ (f )| ≤ kf kµ(X)) et positive au sens où Tµ (f ) ≥ 0 pour tout f ≥ 0. Comme on a Tµ (1) = µ(X) on a : kTµ kC(X)′ = µ(X). Le théorème de représentation de Riesz énonce (entre autres) que réciproquement toute forme linéaire continue et positive sur C(X) se représente par une mesure borélienne finie. Théorème 6.4 (Théorème de représentation de Riesz, cas compact et positif) Soit (X, d) un espace métrique compact et T une forme linéaire continue et positive sur C(X). Il existe une unique mesure borélienne finie et régulière µ sur X telle que T = Tµ . Preuve: Nous allons diviser la preuve (qui n’est pas compliquée mais relativement longue si l’on veut en donner tous les détails) en plusieurs étapes. Etape 1 : unicité 113 R f dµ = Si deux mesures (positives) boréliennes µ et ν représentent T on a X R f dν pour tout f ∈ C(X). Soit K un fermé (donc un compact) de X X et Vn := {x ∈ X : d(x, K) < 1/n}, par le lemme d’Urysohn, il existe fn ∈ C(X) tel que χK ≤ fn ≤ χVn , on a donc Z Z fn dµ = fn dν ≤ ν(Vn ) µ(K) ≤ X X et donc µ(K) ≤ lim ν(Vn ) = ν n \ n  Vn = ν(K). On en déduit que µ et ν coı̈ncident sur les fermés, un argument classique de classe monotone permet d’en déduire que µ = ν. Etape 2 : définition et propriétés de µ sur les ouverts et sur les compacts Pour tout ouvert V de X on pose µ(V ) := sup{T (f ), f ∈ C(X), 0 ≤ f ≤ χV }. (6.1) Par construction µ est positive et monotone au sens où si V1 et V2 sont des ouverts et si V1 ⊂ V2 , alors µ(V1 ) ≤ µ(V2 ). Soit (Vn )n des ouverts de X et f ∈ C(X) tel que 0 ≤ f ≤ χ∪n Vn comme supp(f ) est compact, il existe N tel que supp(f ) ⊂ ∪N n=1 Vn . Soit g1 , ..., gN une partition de l’unité subordonnée au recouvrement V1 , ..., VN . Utilisant la linéarité de T et le fait que 0 ≤ f gn ≤ χVn , on a alors T (f ) = N X n=1 T (f gn ) ≤ N X n=1 µ(Vn ) ≤ ∞ X µ(Vn ) n=1 passant au supremum sur tous les f ∈ C(X) tels que 0 ≤ f ≤ χ∪n Vn on en déduit ∞ ∞ [  X µ Vn ≤ µ(Vn ). (6.2) n=1 n=1 Soit maintenant V1 et V2 ouverts disjoints et ε > 0 et pour i = 1, 2, fi ∈ C(X) tel que 0 ≤ fi ≤ χVi et ε T (fi ) ≥ µ(Vi ) − 2 on a alors 0 ≤ f1 + f2 ≤ χV1 + χV2 = χV1 ∪V2 de sorte que µ(V1 ∪ V2 ) ≥ T (f1 + f2 ) ≥ µ(V1 ) + µ(V2 ) − ε. 114 On a donc µ(V1 ∪ V2 ) = µ(V1 ) + µ(V2 ) pour tout couple V1 , V2 d’ouverts disjoints. On en déduit qu’on a la propriété d’additivité sur les ouverts : pour toute famille finie d’ouverts disjoints V1 , ..., VN on a : µ N [ n=1  Vn = N X µ(Vn ). (6.3) n=1 Pour tout compact (i.e. fermé) K de X, on pose µ(K) := inf{µ(V ) : V ouvert, K ⊂ V }. Evidemment, µ ainsi définie sur les compacts est monotone pour l’inclusion (et par monotonie, on vérifie sans peine que si K est à la fois ouvert et fermé alors les deux définitions de µ(K) coı̈ncident). Soit K1 et K2 deux compacts, ε > 0 et V1 , V2 deux ouverts tels que K1 ⊂ V1 , K2 ⊂ V2 et ε ε µ(V1 ) ≤ µ(K1 ) + , µ(V2 ) ≤ µ(K2 ) + 2 2 on a alors avec (6.2) µ(K1 ∪ K2 ) ≤ µ(V1 ∪ V2 ) ≤ µ(V1 ) + µ(V2 ) ≤ µ(K1 ) + µ(K2 ) + ε. Supposons maintenant que les compacts K1 et K2 sont disjoints. Soit ε > 0 et V ouvert contenant K1 ∪ K2 tel que µ(V ) ≤ µ(K1 ∪ K2 ) + ε, il existe alors V1 et V2 ouverts disjoints contenant respectivement K1 et K2 tels que V1 ∪ V2 ⊂ V et donc µ(K1 ∪ K2 ) ≥ µ(V ) − ε ≥ µ(V1 ∪ V2 ) − ε = µ(V1 ) + µ(V2 ) − ε ≥ µ(K1 ) + µ(K2 ) − ε on a donc µ(K1 ∪K2 ) = µ(K1 ) +µ(K2 ) pour tout couple K1 , K2 de compacts disjoints et par suite, pour toute famille finie de compacts disjoints K1 , ..., KN on a : N N [  X µ Kn = µ(Kn ). (6.4) n=1 n=1 Etape 3 : mesure intérieure, mesure extérieure Pour tout A ⊂ X, on définit µ∗ (A) := sup{µ(K) : K compact, K ⊂ A} et µ∗ (A) := inf{µ(V ) : V ouvert, A ⊂ V }. 115 Il est facile de voir que µ∗ ≤ µ∗ et que µ∗ et µ∗ sont monotones pour l’inclusion. On pose ensuite B := {A ⊂ X : µ∗ (A) = µ∗ (A)} et l’on définit µ = µ∗ = µ∗ sur B. Notons que par construction, les compacts appartiennent à B. Montrons que B contient aussi les ouverts. Par construction, pour tout ouvert V on a µ(V ) = µ∗ (V ) ≥ µ∗ (V ). Il s’agit de montrer l’inégalité inverse, soit donc f ∈ C(X) tel que 0 ≤ f ≤ χV , posons K := supp(f ) et soit W un ouvert contenant K, d’adhérence incluse dans V . D’après le lemme d’Urysohn, il existe g ∈ C(X) tel que χK ≤ g ≤ χW . Comme W est compact et inclus dans V et par monotonie de T on a donc T f ≤ T g ≤ µ(W ) ≤ µ(W ) ≤ µ∗ (V ) passant au supremum sur f on a obtient µ(V ) ≤ µ∗ (V ). Ainsi B contient les ouverts de X. Etape 4 : premières propriétés de σ-additivité Soit (An )n ∈ B N disjoints on se propose de montrer que ∞ [ n=1 An ∈ B et µ ∞ [ n=1 ∞  X An = µ(An ). (6.5) n=1 Soit ε > 0 et pour tout n soit Kn un compact inclus dans An tel que µ(Kn ) ≥ µ(An ) − ε 2n on a alors (en utilisant la monotonie de µ∗ , le fait que les Kn soient disjoints et (6.4)) µ∗ ∞ [ n=1 N N [   [  An ≥ µ ∗ An ≥ µ Kn n=1 = N X n=1 et donc µ∗ ∞ [ n=1 n=1 µ(Kn ) ≥ N X n=1 µ(An ) − ε. ∞  X An ≥ µ(An ). n=1 Soit Vn un ouvert contenant An et tel que µ(Vn ) ≤ µ(An ) + 116 ε 2n (6.6) on a alors en utilisant (6.2) µ ∗ ∞ [ n=1  An ≤ µ ∞ [ n=1  Vn ≤ ≤ ∞ X ∞ X µ(Vn ) n=1 µ(An ) + ε n=1 Avec (6.6), et le fait que µ∗ ≤ µ∗ , on en déduit bien (6.5). Etape 5 : B est une σ-algèbre contenant les boréliens. Avec ce qui précède, il est facile d’établir que B = {A ⊂ X : ∀ε > 0, ∃K (compact) ⊂ A ⊂ V (ouvert) et µ(V \ K) ≤ ε} on en déduit immédiatement que B est stable par complémentaire et donc, avec l’étape 4 que B est une σ-algèbre. Comme B contient les ouverts (étape 3), B contient les boréliens. En outre, il résulte de l’étape 4 que µ est σadditive sur B et par construction µ est régulière (ou plus précisément sa restriction à BX est régulière). Etape 6 : µ représente T . R f dµ, par linéarité notons qu’il Soit f ∈ C(X), montrons que T (f ) = X R suffit de montrer T (f ) ≤ X f dµ. Comme T (1) = µ(X), on peut sans perte de généralité (ajout d’une constante à f et homogénéité) supposer que 0 ≤ f ≤ 1. Soit ε > 0 et N = Nε = [ε−1 ] + 1, pour tout k ∈ {0, ..., N } posons Ak := {x ∈ X : (k − 1)ε < f (x) ≤ kε}. Pour tout k soit Vk un ouvert contenant Ak et tel que µ(Vk \Ak ) ≤ ε/(N +1), sans perte de généralité on peut supposer que f ≤ (k + 1)ε sur Vk . On a alors Z X f dµ ≥ N X k=1 (k − 1)εµ(Ak ) ≥ N X k=1 (k − 1)εµ(Vk ) − ε. Soit g0 , ..., gN une partition de l’unité subordonnée au recouvrement de X par les Vk on a alors T (f ) = N X k=0 T (f gk ) ≤ N X k=0 (k + 1)εT (gk ) ≤ et donc on obtient bien que T (f ) ≤ ✷ R X N X (k + 1)εµ(Vk ) k=0 f dµ en faisant tendre ε vers 0. 117 Corollaire 6.1 Toute mesure borélienne finie sur un métrique compact est régulière. Définition 6.2 Soit (X, d) un espace métrique compact, on appelle mesure de Radon sur X toute forme linéaire continue sur C(X). On note M(X) := C(X)′ l’espace des mesures de Radon sur X et pour tout T ∈ M(X) : kT kM(X) := kT kC(X)′ = sup{T (f ), f ∈ C(X), kf k ≤ 1}. Evidemment pour une mesure de Radon positive T = Tµ on a kT kM(X) = T (1) = µ(X). Le théorème de Riesz nous a permis d’identifier les mesures de Radon positives sur X aux mesures boréliennes finies. Le résultat suivant permet de décomposer toute mesure de Radon en partie positive et négative et ce de manière canonique (minimale en un certain sens) : Proposition 6.3 Soit (X, d) un espace métrique compact et T une mesure de Radon sur X. Définissons pour tout f ∈ C(X), f ≥ 0 : T + (f ) := sup{T (g) : g ∈ C(X) 0 ≤ g ≤ f }, T − (f ) := − inf{T (g) : g ∈ C(X) 0 ≤ g ≤ f } et, pour tout f ∈ C(X) (en posant f+ = max(f, 0) et f− = max(−f, 0)) : T + (f ) := T + (f+ ) − T + (f− ), T − (f ) := T − (f+ ) − T − (f− ) alors T + et T − sont deux mesures de Radon positives (appelées respectivement partie positive et négative de T ). On a T = T + − T − et kT kM(X) = kT + kM(X) + kT − kM(X) = T + (1) + T − (1). (6.7) De plus la décomposition de T = T + − T − est minimale en ce sens que si T = T1 − T2 avec T1 et T2 , mesures de Radon positives alors T1 ≥ T + et T2 ≥ T − . Preuve: Montrons d’abord la linéarité de T + . Soit f1 et f2 dans C(X), positives, on a T + (f1 ) + T + (f2 ) = sup{T (g1 + g2 ), gi ∈ C(X), 0 ≤ gi ≤ fi } ≤ T + (f1 + f2 ). 118 Soit ε > 0 et g ∈ C(X), 0 ≤ g ≤ f1 + f2 tel que T + (f1 + f2 ) ≤ T (g) + ε. On a alors g = min(g, f1 )+(g −f1 )+ et comme 0 ≤ (g −f1 )+ ≤ f2 , min(g, f1 ) ≤ f1 , on a T + (f1 + f2 ) ≤ T (min(g, f1 )) + T ((g − f1 )+ ) + ε ≤ T + (f1 ) + T + (f2 ) + ε de sorte que T + (f1 + f2 ) = T + (f1 ) + T + (f2 ), ∀f1 , f2 continues et positives. Soit f1 et f2 dans C(X), positives, et f := f1 − f2 = f+ − f− , il découle de ce qui précède et de f1 + f− = f2 + f+ qu’on a T + (f1 ) + T + (f− ) = T + (f2 ) + T + (f+ ) et donc T + (f ) = T + (f1 − f2 ) = T + (f+ ) − T + (f− ) = T + (f1 ) − T + (f2 ) en particulier comme T + (0) = 0 on a T + (−f ) = −T + (f ) et comme T + (λf ) = λT + (f ) pour tout λ > 0 la linéarité de T + est établie. La continuité de T + découle immédiatement de sa positivité (T + (f − kf k) ≤ 0 et donc T + (f ) ≤ kf kT + (1) ≤ kf kkT kM(X) ). Ensuite, on remarque que si f ∈ C(X) et f ≥ 0 alors (T + − T )(f ) = sup{T (g − f ) : 0 ≤ g ≤ f } = sup{−T (h) : 0 ≤ h ≤ f } = T − (f ) on a donc T − (f ) = T + (f ) − T (f ) pour tout f ≥ 0 et ceci est également vrai pour tout f ∈ C(X) (écrire f = f+ − f− ). La linéarité et la continuité de T − en découlent (sa positivité est évidente) ainsi que l’identité T = T + − T − . D’une part, si f ∈ C(X) et kf k ≤ 1 on a T (f ) = T + (f ) − T − (f + ) + T − (f − ) ≤ T + (1) + T − (1) et donc kT kM(X) ≤ T + (1) + T − (1). D’autre part, on a T + (1) + T − (1) = sup{T (f − g) : 0 ≤ f, g ≤ 1} ≤ sup{T (h) : h ∈ C(X), khk ≤ 1} = kT kM(X) on a donc bien (6.7). Enfin, montrons que la décomposition T = T + − T − est minimale. Si T = T1 − T2 on a T ≤ T1 et donc pour tout f ≥ 0 on a T + (f ) ≤ sup{T1 (g) : g ∈ C(X), 0 ≤ g ≤ f } = T1 (f ) 119 et donc T+ ≤ T1 . ✷ En particulier T+ − T− est l’unique décompostion de T comme différence de mesures de Radon vérifiant la propriété (6.7). On déduit immédiatement de la proposition précédente et du théorème de Riesz 6.4 le théorème de représentation suivant : Théorème 6.5 (Théorème de représentation de Riesz, cas compact) Soit (X, d) un espace métrique compact et T une mesure de Radon sur X, alors il existe deux mesures boréliennes (positives) finies µ1 et µ2 telles que T = Tµ1 − Tµ2 . En outre, il existe une unique représentation sous la forme précédente vérifiant kT kM(X) = µ1 (X) + µ2 (X). Autrement dit, le théorème de Riesz 6.5 permet d’identifier les mesures de Radon sur X aux mesures signées c’est à dire différences de deux mesures boréliennes (positives) finies. Si µ est une mesure signée s’écrivant µ = µ1 −µ2 avec µ1 et µ2 positives, la proposition 6.3 fournit une manière minimale de décomposer µ en partie positive et négative : on décompose T = Tµ = Tµ1 − Tµ2 en sa partie positive et négative T = T + − T − = Tµ+ − Tµ− avec µ+ et µ− représentant respectivement T + et T − . On vérifie immédiatement que µ = µ+ − µ− , µ+ et µ− s’appellent respectivement partie positive et négative de µ. La décomposition µ = µ+ − µ− est minimale au sens où si µ = µ1 − µ2 avec µi positive alors µ1 ≥ µ+ et µ2 ≥ µ− . Intuitivement quand on décompose µ = µ1 − µ2 en µ+ − µ− on a retiré la masse commune à µ1 et µ2 ; on s’attend donc à ce que µ+ et µ− n’aient pas de partie en commun en un certain sens. On peut donner un sens précis à cette intuition au travers de la notion de mesures étrangères : Lemme 6.1 Soit µ une mesure signée sur le compact (X, d) de partie positive µ+ et de partie négative µ− . Alors µ+ et µ− sont étrangères : il existe un borélien A de X tel que µ+ (A) = µ+ (X) et µ− (A) = 0 (autrement dit µ+ est portée par A et µ− par X \ A). Preuve: Nous savons que Z Z f dµ− : f ∈ C(X), kf k ≤ 1} = µ+ (X) + µ− (X) sup{ f dµ+ − X X et donc pour tout k ≥ 1, n ≥ 1, il existe fk,n ∈ C(X), tel que kfk,n k ≤ 1 et Z Z 1 fk,n dµ− + n fk,n dµ+ − µ+ (X) + µ− (X) ≤ k2 X X 120 en posant Vk,n := {fk,n > 0} on a donc Z Z 1 (fk,n )+ dµ+ (fk,n )− dµ− + n µ+ (X) + µ− (X) ≤ k2 X X 1 ≤ µ+ (Vk,n ) + µ− (X \ Vk,n ) + n k2 et donc µ+ (X \ Vk,n ) + µ− (Vk,n ) ≤ Posons A := \[ n k Vk,n 1 . k2n (6.8)  il découle de (6.8) que µ− (A) = 0 et µ+ (X \ A) = 0. ✷ Soit µ = µ+ − µ− une mesure signée sur X et A, borélien tel que µ− (A) = µ+ (X \ A) = 0. La mesure positive |µ| := µ+ + µ− est appelée mesure de variation totale de la mesure µ. Pour tout B ∈ BX on a µ+ (B) = µ+ (B ∩ A) = µ(B ∩ A) = |µ|(B ∩ A), µ− (B) = µ− (B \ A) = −µ(B \ A) = |µ|(B \ A). On appelle variation totale de µ et l’on note kµkTV la norme kTµ kM(X) : Z f dµ = µ+ (X) + µ− (X) = |µ|(X). kµkTV = sup kf k≤1 X Enfin, on aurait tout aussi bien pu définir les parties positive et négatives de la mesure signée µ comme étant l’unique couple de mesures positives étrangères dont la différence est µ. Exercice 6.1 Montrer que kµkTV est le sup sur les familles finies de Boréliens disjoints (Ai ) de X de la quantité X |µ(Ai )|. i 6.3 Mesures de Radon dans le cas localement compact Dans tout ce paragraphe, nous supposerons que (X, d) est un espace métrique localement compact et σ-compact au sens où il existe une suite 121 strictement croissante de compacts (X S m )m d’intérieur non vide tels que Xm ⊂ int(Xm+1 ) pour tout m et et X = m Xm (autrement dit Xm est une suite exhaustive de compacts de X). Notons que ces hypothèses impliquent que X est non compact (sans quoi on pourrait extraire un recouvrement fini du recouvrement de X par les ouverts int(Xm ) ce qui contredirait le fait que Xm est strictement croissante). Notons également que tout compact de X est contenu dans Xm pour m assez grand. Le cadre localement compact couvre naturellement le cas où X = Rd ou plus généralement X, ouvert de Rd . Toutefois, l’hypothèse de compacité locale peut s’avérer restrictive et élimine de fait certaines applications intéressantes en dimension infinie, ce qui explique qu’on préfère parfois travailler dans le cadre plus général des espaces Polonais (métriques séparables et complets), nous renvoyons le lecteur intéressé aux notes de cours de Cédric Villani [21]. Exercice 6.2 Soit (X, d) vérifiant les hypothèses de ce paragraphe, montrer que X est séparable et complet. Comme X n’est pas compact, on est naturellement amenés à distinguer différents espaces de fonctions continues sur X (et à nous intéresser tout particulièrement à leur dual topologique respectif) : – Cc (X), l’espace des fonctions continues à support compact : c’est la réunion des espaces CXm (X) des fonctions continues à support dans Xm , Cc (X) est muni de sa topologie limite inductive des espaces CXm (X), ainsi une forme linéaire T est continue sur Cc (X) si et seulement si pour tout m, il existe une constante C = Cm telle que |T (f )| ≤ C sup |f (x)|, ∀f ∈ Cc (X) : supp(f ) ⊂ Xm x∈Xm ce qui revient aussi à dire que pour tout compact K de X, il existe une constante C = CK telle que |T (f )| ≤ C sup |f (x)|, ∀f ∈ Cc (X) : supp(f ) ⊂ K x∈K On appelle espace des mesures de Radon (localement finies) sur X et l’on note Mloc (X) le dual topologique de Cc (X), – Cb (X) est l’espace des fonctions continues bornées sur X, muni de la norme uniforme, c’est un espace de Banach (non séparable), – C0 (X) est l’espace des fonctions continues sur X, tendant vers 0 à l’infini, c’est à dire des fonctions f ∈ C(X) telles que pour tout ε > 0 il existe m tel que |f (x)| ≤ ε pour tout x ∈ X\Xm (ce qui est évidemment équivalent à : pour tout ε > 0 il existe un compact K de X tel que supx∈X\K |f (x)| ≤ ε) ; C0 (X) est un sev fermé de Cb (X) et donc est de Banach pour la norme uniforme. 122 Exercice 6.3 Montrer que C0 (X) est séparable mais que Cb (X) ne l’est pas, que C0 (X) est fermé dans Cb (X) et que Cc (X) est dense dans C0 (X) (pour la norme uniforme). Nous allons commencer par traiter le cas de Cc (X) et de son dual. Rappelons que Cc (X) muni de la topologie limite inductive des espaces CXm (X) est complet et séquentiellement séparable. Comme dans le paragraphe précédent on dit que la forme linéaire T sur Cc (X) est positive si T (f ) ≥ 0 pour tout f ∈ Cc (X), f ≥ 0. On vérifie facilement que toute forme linéaire positive sur Cc (X) est une mesure de Radon. On adapte facilement les arguments du paragraphe précédent pour montrer que toute mesure de Radon sur X se décompose en la différence de deux mesures de Radon positives. En adaptant les arguments du cas compact, on obtient alors le résultat de représentation suivant : Théorème 6.6 (Théorème de représentation de Riesz, cas non compact) Soit T une mesure de Radon sur X alors il existe couple de mesures boréliennes (positives) µ+ et µ− , finies sur les compacts de X telles que Z Z f dµ− , ∀f ∈ Cc (X). f dµ+ − T (f ) = X X Autrement dit, les mesures de Radon sur X se représentent par des mesures signées sur X de la forme µ+ − µ− avec µ+ et µ− positives et finies sur les compacts (par la suite nous appellerons simplement de telles mesures mesures signées). On a l’unicité dans la représentation précédente si on impose en plus que les restrictions de µ± à tout compact sont étrangères. Si Ω est un ouvert de Rd , les distributions d’ordre 0 sur Ω sont donc les mesures boréliennes signées, finies sur les compacts. On déduit des résultats généraux du chapitre 1, un premier résultat utile de compacité séquentielle : Proposition 6.4 Soit (Tn ) une suite de mesures de Radon sur X telle que (Tn (f ))n est bornée pour tout f ∈ Cc (X) alors il existe une mesure de Radon T et une sous-suite de (Tnk ) de (Tn ) telles que Tnk (f ) → T (f ), ∀f ∈ Cc (X). Preuve: Il résulte du théorème de Banach-Steinhaus (sous la forme de la proposition 1.7) que f ∈ Cc (X) 7→ p(f ) := sup |Tn (f )| n 123 est une semi-norme continue sur Cc (X). Comme Cc (X) est séquentiellement séparable, le résultat cherché découle du théorème de Banach-Alaoglu-Bourbaki (sous la forme du théorème 1.6). ✷ On peut évidemment traduire cette propriété de compacité en termes de mesures signées. Tout d’abord, on définit la convergence vague comme suit Définition 6.3 Si (µn )n et µ sont des mesures signées sur X, on dit que (µn ) converge vaguement vers X si Z Z f dµ, ∀f ∈ Cc (X). f dµn → X X R Ensuite la proposition 6.4 traduit le fait que si ( X f dµn ) est bornée pour tout f ∈ Cc (X) alors (µn ) possède une sous-suite qui converge vaguement. Par exemple, toute suite de mesure de probabilité possède une sous-suite qui converge vaguement (mais sa limite n’est pas forcément une mesure de probabilité, il peut y avoir perte de masse comme le montre l’exemple µn = δn sur R qui converge vaguement vers 0). On va maintenant s’intéresser au dual topologique de l’espace de Banach C0 (X) et montrer qu’il peut s’identifier à l’espace des mesures signées finies (i.e. de le forme µ+ − µ− avec µ± ≥ 0 et µ± (X) < +∞). Lemme 6.2 Soit T une forme linéaire positive sur C0 (X) alors T est continue. Preuve: Si T n’était pas continue on pourrait pour chaque n trouver fn ∈ C0 (X) telle que T (fn ) ≥ n et kfn k ≤ 1, quitte à remplacer n par sa partie positive on P f−2 peut en outre choisir les fn positifs. La série n fn converge normalement dans C0 (X) et donc converge car C0 (X) est de Banach, notons f sa somme on a alors pour tout N N X X 1 1 T (f ) ≥ T (fn ) ≥ → ∞ quand N → ∞ 2 n n n=1 n=1 ce qui est absurde. ✷ En procédant comme pour la proposition 6.3 on a 124 Lemme 6.3 Soit T ∈ C0 (X)′ , il existe un unique couple (T + , T − ) de formes linéaires positives sur C0 (X) telles que T = T + − T − et kT kC0 (X)′ = kT + kC0 (X)′ + kT − kC0 (X)′ . Il est clair que si µR = µ+ − µR− est une mesure signée finie alors Tµ : f ∈ C0 (X) 7→ Tµ (f ) = X f dµ+ − X f dµ− est une forme linéaire continue et que kTµ kC0 (X)′ ≤ |µ|(X) = µ+ (X) + µ− (X). Si en outre, on impose que µ+ et µ− sont étrangères alors kTµ kC0 (X)′ ≤ |µ|(X) = µ+ (X) + µ− (X). Le théorème suivant énonce que réciproquement tout élément de C0 (X)′ se représente par une mesure signée finie : Théorème 6.7 (Théorème de représentation de Riesz, cas non compact, dual de C0 (X)) Soit T ∈ C0 (X)′ , alors il existe couple de mesures boréliennes (positives) finies µ+ et µ− , telles que Z Z T (f ) = f dµ+ − f dµ− , ∀f ∈ C0 (X). X X Preuve: Comme T ∈ Cc (X)′ , il découle du théorème 6.6 qu’il existe des mesures boréliennes µ± , finies sur les compacts telles que Z Z + − f dµ− , ∀f ∈ Cc (X). (6.9) f dµ+ − T (f ) = T (f ) − T (f ) = X X Montrons que µ+ etP µ− sont finies. Supposons par l’absurde que µ+ (X) = P m (µ+ (∂Xm )+µ+ (int(Xm )\Xm−1 ) = +∞ de sorte que m µ+ (Xm \Xm ) = l’une des séries de terme général ηm = µ+ (∂Xm ) ou ηm = µ+ (int(Xm )\Xm−1 ) P diverge. Supposons que m ηm = +∞ avec ηm = µ+ (∂Xm ). Soit alors Vm des voisinages ouverts de ∂Xm deux P à deux disjoints et gm ∈ Cc (X) tel que χ∂Xm ≤ gm P ≤ χVm . Comme ηm = +∞, il existe une suite cm ≥ 0, cP m → 0 telle que m cm ηm = +∞ (choisir mk strictement croissante telle que mk+1 −1 −1 pour m ∈ {mk , ..., mk+1 − 1}). On pose alors mk P ηm ≥ 1 et cm = k g := m cm gm comme les gm ont des supports disjoints et comme cm → 0 on a g ∈ C0 (X) et donc + T (g) ≥ M X m=1 + cm T (gm ) ≥ 125 M X m=1 cm µ+ (∂Xm ) P ce qui constitue la contradiction recherchée. Si m ηm = +∞ avec ηm = µ+ (int(Xm ) \ Xm−1 ), on choisit pour chaque m un compact Km ⊂ int(Xm ) \ Xm−1 tel que µ+ (Km ) ≥ ηm − 2−m−1 , puis gm ∈ Cc (X) tel que χKm ≤ gm ≤ χint(Xm )\Xm−1 et l’on procède exactement comme dans le cas précédent. Comme µ± sont finies, le fait que µ+ − µ− représente effectivement T découle de (6.9) et de la densité de Cc (X) dans C0 (X). ✷ Comme dans le cas compact, on a unicité de µ+ et µ− si l’on impose en outre kTµ kC0 (X)′ ≤ |µ|(X) = µ+ (X) + µ− (X). Attention : dans le cas où X n’est pas compact, et en notant Cb (X) l’espace des fonctions continues bornées sur X (muni de la norme uniforme qui en fait un espace de Banach), on ne peut identifier les formes linéaires continues sur Cb (X) à des mesures. En effet soit F le sev de Cb (R) formé par les fonctions ayant une limite en +∞ et soit T (f ) := lim+∞ f pour tout f ∈ F . Comme T (f ) ≤ kf k pour tout f ∈ F , on peut, grâce au théorème de Hahn-Banach prolonger T en un élément (encore noté T ) de Cb (R)′ . Si T était représenté par une mesure µ, comme T (f ) = 0 pour tout f ∈ Cc (R) on aurait µ = 0 et donc aussi T = 0, ce qui est absurde. Définition 6.4 On dit qu’une suite de mesures (finies) (µn ) sur X converge étroitement vers une mesure (finie) µ sur X si Z Z f dµ, ∀f ∈ Cb (X). f dµn → X X L’important théorème suivant (qui présente certaines analogies avec le théorème de Dunford-Pettis) donne un critère (la tension, propriété qui assure que la masse ”ne part pas à l’infini” et qui exclut en particulier les cas du type µn = δn dans R) de compacité séquentielle pour la convergence étroite dans les mesures positives Théorème 6.8 (Théorème de Prokhorov) Soit (µn ) une suite de mesures positives sur X, si µn (X) est bornée et si (µn ) est tendue au sens où pour tout ε > 0, il existe un compact K tel que sup µn (X \ K) ≤ ε n alors (µn ) possède une sous-suite qui converge étroitement vers une mesure finie. 126 Preuve: Grâce à la proposition 6.4, on peut supposer (à une extraction encore notée (µn ) près) que (µn ) converge vaguement vers µ ∈ Mloc (X). Pour tout m, on a alors µ(Xm ) ≤ lim inf n µn (Xm ) ≤ C et donc µ(X) = supm µ(Xm ) ≤ C de sorte que µ est finie. Soit ε > 0, comme µ(Xm ) tend vers µ(X), il existe m tel que µ(X) ≤ µ(Xm ) + ε, ce qui montre que µ est tendue. Soit maintenant f ∈ Cb (X), ε > 0 et K un compact de X vérifiant supn µn (X \ K) ≤ ε et µ(X \ K) ≤ ε. Soit g ∈ Cc (X) tel que χK ≤ g ≤ 1, on a alors Z Z Z f d(µn − µ) ≤ f (1 − g)d(µn − µ) f gd(µn − µ) + X X X Z Z = f gd(µn − µ) + f (1 − g)d(µn − µ) X\K X Z f gd(µn − µ) + 2εkf k ≤ X R f gdµn → et on conclut en remarquant que puisque f g ∈ C (X), on a c X R f gdµ quand n → ∞. X ✷ Pour comprendre l’intérêt de la tension et du théorème de Prokhorov prenons l’exemple d’une suite de mesures de probabilité. Nous savons déjà qu’une telle suite possède (en sous-suite) une limite vague (positive) mais que cette limite vague n’est pas forcément de masse 1. Si la suite est en outre tendue, cette limite vague est une mesure de probabilité (prendre 1 comme fonction-test dans la convergence étroite). Mentionnons pour clore ce paragraphe l’important principe de concentrationcompacité dû à Pierre-Louis Lions. Nous renvoyons le lecteur aux articles célèbres ([14]) pour la preuve et les applications de ce principe en calcul des variations. Soit (µn ) une suite de mesures de probabilité sur Rd (pour faire simple) alors il y a trois comportements possibles : – l’évanescence : ∀R > 0, lim sup µn (B(x, R)) = 0, n x∈Rd – la concentration : il existe (xn ) tel que pour tout ε > 0, il existe R > 0 tel que pour tout n, on ait µn (B(xn , R)) ≥ 1 − ε, – la dichotomie : il existe α ∈]0, 1[ tel que pour tout ε > 0 il existe R > 0, Rn → ∞ et (xn ) tels que pour tout n |µn (B(xn , R) − α| ≤ ε et µn (B(xn , Rn ) \ B(xn , R)) ≤ ε. 127 6.4 Théorème de Radon-Nikodym, désintégration des mesures Soit (X, B) un espace mesurable, ν une mesure (positive) sur (X, B) et f une fonction mesurable et positive, l’application Z f dν B ∈ B 7→ B est σ-additive en vertu du théorème de convergence monotone, c’est donc une mesure µ notée sous la forme dµ = f dν. On dit que deux mesures µ et ν sont étrangères, ce que l’on note µ ⊥ ν si elles sont portées par deux ensembles mesurables disjoints i.e. s’il existe A et B dans B et disjoints tels que µ(X \ A) = 0 et ν(X \ B) = 0. On appelle mesure signée finie toute fonction de B dans R de la forme µ = µ+ − µ− avec µ+ et µ− mesures (positives) finies sur (X, B) et étrangères. Notons que si µ+ et µ− ne sont pas finies alors on ne peut définir µ+ − µ− pour les B ∈ B tels que µ+ (B) = µ− (B) = +∞ la définition µ = µ+ − µ− est alors purement formelle. Le théorème de Hahn permet d’identifier les fonctions σ-additives sur B à valeurs dans R aux mesures signées finies, nous nous limiterons donc ici aux mesures signées finies. On dira qu’une mesure signée finie µ = µ+ −µ− est absolument continue par rapport à une mesure ν (ce que l’on notera µ ≪ ν) si µ(B) = 0 pour tout B ∈ B tel que ν(B) = 0. Evidemment toute mesure de la forme dµ = f dν = f+ dν −f− dν avec f ∈ L1 (ν) est absolument continue par rapport à ν, le théorème de Radon-Nikodym énonce précisément la réciproque. On dit que la mesure signée finie µ = µ+ − µ− est portée par A ∈ B si et seulement si pour tout B ∈ B on a µ(B) = µ(B ∩ A) et que deux mesures signées finies µ1 et µ2 sont étrangères (notation µ1 ⊥ µ2 ) si µ1 et µ2 sont portées par deux ensembles mesurables disjoints. Notons que si la mesure signée finie µ = µ+ − µ− est portée par A alors µ+ , µ− et |µ| aussi. Enfin notons que si µ est une mesure signée finie et ν une mesure alors µ ≪ ν ⇒ µ+ ≪ ν, µ− ≪ ν et µ ⊥ ν et µ ≪ ν ⇒ µ = 0. Exercice 6.4 Soit µ et ν deux mesures positives finies montrer que µ ≪ ν si et seulement si pour tout ε > 0 il existe δ > 0 tel que pour tout B ∈ B si ν(B) ≤ δ alors µ(B) ≤ ε. 128 Théorème 6.9 (Théorème de décomposition de Lebesgue) Soit (X, B) un espace mesurable, ν une mesure positive σ-finie et µ une mesure signée finie sur (X, B). Il existe un unique couple (f, µs ) tel que f ∈ L1 (ν), µs est une mesure signée finie et dµ = f dν + dµs , avec µs ⊥ ν. Preuve: Montrons d’abord l’unicité, supposons que dµ = f1 dν + dµs1 = f2 dν + dµs2 , avec fi ∈ L1 (ν) et µsi ⊥ ν pour i = 1, 2, on a alors (f1 − f2 )dν = dµs2 − dµs1 et cette mesure est à la fois étrangère à ν et absolument continue par rapport à ν et par suite µs1 = µs2 et f1 = f2 dans L1 (ν). Pour l’existence, on peut sans perte de généralité supposer µ positive et ν finie et l’on procède comme suit (l’argument est dû à Von Neumann). On définit la forme linéaire T sur l’espace de Hilbert L2 (µ + ν) : Z ϕdµ, ∀ϕ ∈ L2 (µ + ν) T (ϕ) := X en utilisant l’inégalité de Cauchy-Schwarz, on a pour tout ϕ ∈ L2 (µ + ν) |T (ϕ)| ≤ kϕkL2 (µ+ν) µ(X)1/2 de sorte que T est continue. Le théorème de représentation de Riesz (dual d’un Hilbert) permet d’en déduire l’existence de g ∈ L2 (µ + ν) tel que Z Z ϕgd(µ + ν), ∀ϕ ∈ L2 (µ + ν) (6.10) ϕdµ = X X en particulier en prenant ϕ = χB pour B ∈ B on en déduit dµ = gd(µ + ν). Il est facile d’en déduire que 0 ≤ g ≤ 1 (µ + ν)-p.p. ; posons ensuite S := {g = 1}, T := {g < 1}, et µa (B) := µ(B ∩ T ), µs (B) := µ(B ∩ S), ∀B ∈ B 129 on a bien sûr µ = µa + µs et µs portée par S. Comme µ(S) = µ(S) + ν(S) on a ν(S) = 0 et donc µs ⊥ ν. Il ne nous reste plus qu’à montrer que dµa = f dν avec f ∈ L1 (ν). Réécrivons (6.10) sous la forme Z Z ϕgdν, , ∀ϕ ∈ L2 (µ + ν). ϕ(1 − g)dµ = X X Soit B ∈ B, n ∈ N en prenant ϕn := χB∩T (1 + .... + g n ) dans l’identité précédente il vient Z Z n+1 χT g(1 + ... + g n )dν χT (1 − g )dµ = B B par le théorème de convergence dominée le membre de gauche converge vers µ(B ∩ T ) = µa (B) et par convergence monotone celui de droite converge vers Z g χT dν 1−g B on en déduit que dµa = f dν avec f = χT g ∈ L1 (ν). 1−g ✷ On en déduit comme corollaire immédiat : Théorème 6.10 (Théorème de Radon-Nikodym) Soit (X, B) un espace mesurable, ν une mesure positive σ-finie et µ une mesure signée finie. Si µ ≪ ν alors il existe un unique f ∈ L1 (ν) tel que dµ = f dν. La fonction f ∈ L1 (ν) dans le théorème de Radon-Nikodym s’appelle densité de Radon-Nikodym de µ par rapport à ν et se note souvent sous la forme dµ f= . dν Une conséquence utile du théorème de Radon-Nikodym est le théorème de désintégration des mesures sur un espace produit. Nous nous limiterons ici aux mesures de probabilité car c’est ce cas qui nous sera utile pour le transport optimal (il existe des théorèmes de désintégration bien plus généraux nous ne traitons ici qu’un cas simple mais illustratif). Soit donc (X1 , B1 ) et (X2 , B2 ) deux espaces mesurables et munissons X1 × X2 de la tribu produit σ(B1 × B2 ). Si γ est une mesure de probabilité sur (X1 × X2 , σ(B1 × B2 )), on définit les marginales (ou marges) de γ, π1 γ et π2 γ par π1 γ(A1 ) := γ(A1 × X2 ), π2 γ(A2 ) := γ(X1 × A2 ) pour tout A1 ∈ B1 et tout A2 ∈ B2 . On vérifie immédiatement que πi γ est une mesures de probabilité sur (Xi , Bi ). 130 Théorème 6.11 (Désintégration d’une probabilité par rapport à l’une de ses marges) Soit X1 et X2 des espaces métriques compacts munis de leur tribu borélienne. Soit γ une mesure borélienne de probabilité sur X1 × X2 et µ := π1 γ alors il existe une famille de mesures de probabilité (γ x1 )x1 ∈X1 mesurable au sens où x1 7→ γ x1 (A2 ) est µ-mesurable pour tout A2 ∈ B2 et telle que γ = γ x1 ⊗ µ c’est à dire Z γ x1 (A2 )dµ(x1 ) γ(A1 × A2 ) = A1 pour tout A1 ∈ B1 et tout A2 ∈ B2 . Preuve: Nous n’allons donner que l’idée de départ, la preuve complète s’avérant assez longue (cf. Villani [21]). Fixons B ∈ BX2 et définissons µB (A) := γ(A × B), ∀A ∈ BX1 alors µB est une mesure borélienne positive sur X1 et µB ≪ µ de sorte que l’on peut définir dµB fB := dµ et l’on a bien Z fB (x)dµ(x) ∀A ∈ B1 . γ(A × B) = A La difficulté est que fB n’est définie qu’ à un ensemble µ-négligeable près qui dépend de B on ne peut donc pas définir directement γ x (B) := fB (x) car BX2 n’est généralement pas dénombrable (c’est là qu’interviennent les hypothèses de métrisabilité et de compacité sur X1 et X2 qui permettent de se ramener à une famille dénombrable de mesurables, on renvoie au chapitre 10 du cours de Villani [21] pour une démonstration complète). ✷ En termes probabilistes, en interprétant γ comme la loi d’un couple de variables aléatoires (X1 , X2 ), γ x1 n’est autre que la probabilité conditionnelle de X2 sachant X1 = x1 . Terminons ce paragraphe par une application immédiate du théorème de désintégration. Lemme 6.4 (Dudley’s gluing Lemma) Soit Xi , i = 1, 2, 3 des espaces métriques compacts munis de leur tribu borélienne, et µi une mesure borélienne de probabilité sur Xi . Soit γ12 (resp. γ23 ) une mesure borélienne de probabilité sur X1 × X2 (resp. X2 × X3 ) de marges µ1 , µ2 (resp. µ2 , µ3 ), alors il existe une mesure borélienne de probabilité γ sur X1 × X2 × X3 telle que π12 γ = γ12 et π23 γ = γ23 . 131 Preuve: On désintégre γ12 et γ13 par rapport à leur marge commune µ2 : γ12 = η x2 ⊗ µ2 , γ23 = θx2 ⊗ µ2 puis l’on définit γ par γ(A1 × A2 × A3 ) := Z η x2 (A1 )θx2 (A3 )dµ2 (x2 ) A2 pour tous boréliens A1 , A2 , A3 . On vérifie sans peine que γ vérifie les propriétés requises. ✷ 6.5 Dualité convexe et transport optimal L’objectif de ce paragraphe est triple : – donner un bref aperçu du transport optimal, sujet qui a connu un essor considérable ces dernières années tant sur le plan théorique que du point de vue applicatif (voir à ce sujet les excellents ouvrages de Cédric Villani), – en déduire des métriques explicites métrisant la topologie faible ∗ sur les mesures de probabilité : les distances de Wasserstein (il est à noter qu’il en existe beaucoup d’autres telles que la métrique de Lévy-Prokhorov) – fournir une introduction à la dualité convexe qui est un outil utile dans divers contextes notamment en calcul des variations. Encore une fois, par souci de simplicité nous nous restreindrons au cas compact et laisserons au lecteur le soin de généraliser ce qui suit à des cas plus généraux. Les données du problème du transport optimal de MongeKantorovich sont deux espaces métriques compacts X et Y , une fonction de coût de transport c ∈ C(X ×Y ) et deux mesures de probabilités (Boréliennes) µ et ν sur X et Y respectivement. On note Π(µ, ν) l’ensemble des plans de transport (entre µ et ν) c’est à dire l’ensemble des probabilités Boréliennes sur X × Y ayant µ et ν comme marginales. Autrement dit, γ, probabilité Borélienne sur X × Y est un plan de transport si : Z Z ϕ(x)dγ(x, y) = ϕ(x)dµ(x), ∀ϕ ∈ C(X) X×Y et Z X×Y X ψ(y)dγ(x, y) = Z X ψ(y)dµ(y), ∀ψ ∈ C(Y ). 132 Notons que Π(µ, ν) est non vide car µ ⊗ ν ∈ Π(µ, ν) et compact pour la topologie faible ∗ des mesures. Le problème de Monge-Kantorovich s’écrit alors Z c(x, y)dγ(x, y) (6.11) inf γ∈Π(µ,ν) X×Y L’existence d’une solution découle immédiatement de la compacité de Π(µ, ν) et du fait que l’objectif est donné par une forme linéaire continue (il s’agit d’un problème de programmation linéaire en dimension infinie). Un ingrédient important dans la théorie du transport optimal est sa formulation duale. Nous allons présenter ici un théorème général de dualité convexe qui a son intérêt en soi et a d’autres applications en calcul des variations, c’est également l’occasion d’insister une fois de plus sur l’importance de la convexité. Le problème de Monge-Kantorovich étant un bon exemple d’application de la dualité convexe, ceci justifie de nous éloigner provisoirement du transport optimal pour y revenir plus en détail plus tard. Soit E et F deux evn, Λ ∈ L(E, F ) et f et g deux fonctions convexes sci, F : E → R ∪ {+∞} et G : F → R ∪ {+∞} qu’on supposera propres c’està-dire non identiquement égales à +∞. On appelle transformée de Legendre de f et l’on note f ∗ la fonction définie par f ∗ (q) := sup{hq, xi − f (x)}, ∀q ∈ E ′ x∈E on définit de même la transformée de Legendre de G par g ∗ (p) := sup{hp, yi − g(y)}, ∀p ∈ F ′ . y∈F On s’intéresse alors au problème d’optimisation : inf {f (x) + g(Λx)} x∈E (6.12) ainsi qu’à son problème dual : sup {−f ∗ (−Λ∗ p) − g ∗ (p)}. (6.13) p∈F ′ Avant d’énoncer et de démontrer le théorème de dualité convexe de FenchelRockafellar, nous aurons besoin de quelques préliminaires d’analyse convexe. Étant donné f : E → R ∪ {+∞}, convexe sci propre et en notant f ∗ sa transformée de Legendre (dans la littérature on rencontre aussi le terme de transformée de Fenchel, de polaire ou de fonction convexe conjuguée), on a par définition même l’inégalité de Young : f (x) + f ∗ (q) ≥ hq, xi , ∀(q, x) ∈ E ′ × E, 133 (6.14) et donc pour tout x ∈ E : f (x) ≥ f ∗∗ (x) := sup {hq, xi − f ∗ (q)}. (6.15) q∈E ′ Lemme 6.5 Soit f : E → R ∪ {+∞}, convexe sci propre, alors f ∗ est convexe sci propre sur E ∗ . Preuve: Le fait que f ∗ soit convexe sci provient du fait que par définition c’est un supremum de fonctions affines continues et qu’une fonction est convexe (sci) si et seulement si son épigraphe est convexe (fermé). Il s’agit donc simplement de montrer que f ∗ n’est pas identiquement égale à +∞. Soit donc x0 ∈ E tel que f (x0 ) < +∞ et λ0 < f (x0 ) de sorte que (λ0 , x0 ) ∈ / Epi(f ) := {(λ, x) ∈ R × E : λ ≥ f (x)}. Comme f est convexe sci, Epi(f ) est convexe fermé, on peut donc séparer strictement (λ0 , x0 ) de Epi(f ) : il existe (k, p) ∈ R × E ′ et ε > 0 tels que kλ0 − hp, x0 i ≤ kλ − hp, xi − ε, ∀(λ, x) ∈ Epi(f ) (6.16) ceci implique que k > 0 et par homogénéité on peut donc supposer que k = 1 on a donc en particulier f ∗ (p) = sup{hp, xi − f (x)} ≤ hp, x0 i − λ0 − ε < +∞. x∈E ✷ Notons que le le lemme précédent implique que f admet une minorante affine continue (x 7→ hp, xi − f ∗ (p) avec f ∗ (p) < +∞) Exercice 6.5 Soit f : E → R ∪ {+∞}, f 6= ∞ montrer que f ∗∗ est la plus grande fonction convexe s.c.i minorant f (f ∗∗ s’appelle l’enveloppe convexe sci de f ). En déduire que f est convexe sci si et seulement si f = f ∗∗ . Théorème 6.12 (Théorème de dualité de Fenchel-Rockafellar) Supposons qu’il existe x0 ∈ E tel que f (x0 ) < +∞ et g est continue en Λ(x0 ) et que l’infimum du problème (6.12) soit fini, alors on a : inf {f (x) + g(Λx)} = max′ {−f ∗ (−Λ∗ p) − g ∗ (p)}. x∈E p∈F (En particulier le sup du problème dual (6.13) est atteint). 134 Preuve: Désignons par α et β respectivement l’infimum dans (6.12) et le supremum dans (6.13). Par l’inégalité de Young pour tout (x, p) ∈ E × F ′ on a : f (x) ≥ h−Λ∗ p, xi − f ∗ (−Λ∗ p), g(Λx) ≥ hp, Λxi − g ∗ (p) en sommant ces inégalités, on obtient donc α ≥ β. Posons C := {(λ, x, y) ∈ R × E × Y : λ ≥ g(Λx − y)} et notons A l’intérieur de C (lequel est non vide car g est continue en Λx0 ), on vérifie sans peine que C est convexe et dense dans A. Soit maintenant : B := {(µ, z, 0) : µ ∈ R, z ∈ E, α − µ ≥ f (z)}, B est convexe non vide et, par définition de α, A ∩ B = ∅. On peut ainsi séparer au sens large B de A (et donc de C par densité) : il existe (k, q, p) ∈ R × E ′ × F ′ \ {(0, 0, 0)} et a ∈ R tels que kλ + hq, xi + hp, yi ≥ a ≥ kµ + hq, zi , ∀(λ, x, y) ∈ C, ∀(µ, z, 0) ∈ B. (6.17) On en déduit que k ≥ 0 (faute de quoi le membre de gauche de (6.17) ne serait pas minoré). Si k = 0 alors toujours par continuité de g en Λx0 on aurait pour tout u ∈ E et v ∈ F suffisamment petits hq, ui + hp, vi ≥ 0 ce qui entrainerait p = 0 et q = 0, ce qui est absurde. On a donc k > 0 et sans perte de généralité on peut supposer k = 1. Ainsi, (6.17) se réecrit : inf (x,y)∈E×F {g(Λx−y)+hq, xi+hp, yi} ≥ a ≥ α+sup{hq, zi−f (z)} = α+f ∗ (q). z∈E (6.18) En particulier, pour tout u ∈ E on a hq, ui + hp, Λui ≥ a − g(Λx0 ) et donc q = −Λ∗ p, le membre de gauche de (6.18) se réecrit alors inf (x,y)∈E×F {g(Λx − y) − hp, Λx − yi} = −g ∗ (p) avec (6.18) on a donc −g ∗ (p) − f ∗ (−Λ∗ p) ≥ α ≥ β 135 ainsi α = β et p est solution de (6.13). ✷ Il est à noter que le problème précédent fournit un théorème d’existence de solutions pour le problème dual à partir d’hypothèses sur le problème primal, notons aussi que la preuve repose sur le théorème de séparation (et pas sur un argument de compacité). Le lecteur intéressé par la dualité convexe consultera avec profit l’ouvrage classique d’Ekeland et Temam [7] sur le sujet. Revenons maintenant au problème de transport optimal (6.11) et montrons qu’il s’écrit naturellement comme le dual d’un problème d’optimisation convexe sur C(X) × C(Y ). Soit Λ : C(X) × C(Y ) défini par Λ(ϕ, ψ) := ϕ ⊕ ψ pour tout (ϕ, ψ) ∈ C(X) × C(Y ) avec (ϕ ⊕ ψ)(x, y) := ϕ(x) + ψ(y), ∀(x, y) ∈ X × Y. L’adjoint de Λ, Λ∗ est donc l’opérateur linéaire continu M(X × Y ) → M(X) × M(Y ) donné par : pour tout γ ∈ M(X × Y ), Λ∗ γ = (πX γ, πY γ) avec pour tout (ϕ, ψ) ∈ C(X) × C(Y ) : Z Z ϕ(x)dγ(x, y) = ϕ(x)d(πX γ)(x), X×Y X Z Z . ψ(y)d(πY γ)(y) ψ(y)dγ(x, y) = X X×Y Autrement dit, πX γ, et πY γ sont les marges de γ. On considère maintenant le problème : inf (ϕ,ψ)∈C(X)×C(Y ) avec, pour tout θ ∈ C(X × Y ) g(θ) := f (Λ(ϕ, ψ)) + g(ϕ, ψ)  et f (ϕ, ψ) := − Un calcul immédiat donne que  0 ∗ ∗ f (−Λ γ) = +∞ 0 +∞ Z X si θ ≤ c sinon ϕdµ − Z ψdν. Y si (πX γ, πY γ) = (µ, ν) sinon 136 (6.19) et ∗ g (γ) =  R X×Y cdγ +∞ de sorte que le dual de (6.19) est Z cdγ = − sup − γ∈Π(µ,ν) X×Y si γ ≥ 0 sinon inf γ∈Π(µ,ν) Z cdγ X×Y en appliquant le théorème de Fenchel-Rockafellar on obtient donc que (6.11) possède des solutions (ce que nous savions déjà) et qu’on a la relation : Théorème 6.13 (Dualité de Kantorovich pour le problème de transport optimal) Z Z Z ψdν. ϕdµ + c(x, y)dγ(x, y) = sup min γ∈Π(µ,ν) X×Y (ϕ,ψ)∈C(X)×C(Y ) : ϕ⊕ψ≤c X Y Exercice 6.6 Montrer sous les hypothèses de ce paragraphe (X et Y compacts et c continue) que (6.19) possède des solutions (se ramener à une suite maximisante bornée et uniformément équicontinue en utilisant l’uniforme continuité de c et conclure par le théorème d’Ascoli-Arzelà). Exercice 6.7 Dans le cas X = Y ⊂ Rd montrer que  Z u d(µ − ν) : u 1-Lipschitz . inf |x − y|dγ(x, y) = sup γ∈Π(µ,ν) X Généraliser au cas d’une distance quelconque. Intéressons nous maintenant au cas particulier où X = Y (métrique compact pour simplifier) et où c est une puissance convexe de la distance d. Pour µ et ν des mesures de probabilité boréliennes sur X et p ≥ 1, on définit la p-distance de Wasserstein entre µ et ν par Z 1/p  p (6.20) d(x, y) dγ(x, y) Wp (µ, ν) := inf γ∈Π(µ,ν) X×X Le fait que Wp soit effectivement une distance sur l’ensemble des probabilités sur X et une propriété qui en justifie (entre autres) l’intérêt nous sont fournis par le 137 Théorème 6.14 Soit (X, d) un métrique compact. Pour tout p ≥ 1, Wp est une distance sur M+ 1 (X), ensemble des mesures de probabilité sur X. De plus si (µn )n et µ appartiennent à M+ 1 (X) alors (µn ) converge faible ∗ vers µ si et seulement si Wp (µn , µ) → 0 quand n → ∞. Preuve: Pour établir que Wp est une distance, seule l’inégalité triangulaire requiert vraiment une preuve. Soit donc µ1 , µ2 et µ3 dans M+ 1 (X) soit γ12 ∈ Π(µ1 , µ2 ) et γ23 ∈ Π(µ2 , µ3 ) tels que Z p d(x1 , x2 )p dγ12 (x1 , x2 ), Wp (µ1 , µ2 ) = 2 ZX Wp (µ2 , µ3 )p = d(x2 , x3 )p dγ23 (x2 , x3 ). X2 3 On déduit du lemme 6.4 qu’il existe γ ∈ M+ 1 (X ) tel que π12 γ = γ12 et π23 γ = γ13 de sorte que γ13 := π13 γ ∈ Π(µ1 , µ3 ) on a donc en utilisant l’inégalité triangulaire et l’inégalité de Minkowski : 1/p Z p d(x1 , x3 ) dγ13 (x1 , x3 ) Wp (µ1 , µ3 ) ≤ X×X 1/p Z p d(x1 , x3 ) dγ(x1 , x2 , x3 ) = X3 Z 1/p  (d(x1 , x2 ) + d(x2 , x3 ))p dγ(x1 , x2 , x3 ) ≤ X3 1/p Z d(x1 , x2 )p dγ(x1 , x2 , x3 ) ≤ X3 1/p Z d(x2 , x3 ))p dγ(x1 , x2 , x3 ) + X3 1/p Z d(x1 , x2 )p dγ12 (x1 , x2 ) = X2 1/p Z p d(x2 , x3 )) dγ23 (x2 , x3 ) + X2 =Wp (µ1 , µ2 ) + Wp (µ2 , µ3 ). Supposons que Wp (µn , µ) tende vers 0. Soit γn ∈ Π(µn , µ) tel que Z p Wp (µn , µ) = d(x, y)p dγn . X×X 138 Soit maintenant ϕ ∈ C(X) et soit ω un module de continuité de ϕ on a alors Z Z ϕd(µn − µ) = (ϕ(x) − ϕ(y))dγn (x, y) X X Z ≤ ω(d(x, y))dγn (x, y) X×X et donc lim sup Z X ϕd(µn − µ) ≤ lim sup Z ω(d(x, y))dγn (x, y) X×X on extrait enfin de (γn ) une sous-suite (encore notée γn ) qui converge faible ∗ vers une limite γ et telle que la limsup dans le membre de droite de l’inégalité précédente est en fait une limite. On a alors Z d(x, y)p dγ(x, y) = 0 X×X et donc lim sup Z ω(d(x, y))dγn (x, y) = Z ω(d(x, y))dγ(x, y) = 0 X×X X×X ce qui montre bien que (µn ) converge faible-∗ vers µ. Réciproquement, supposons maintenant que (µn ) converge faible-∗ vers µ et montrons que Wp (µn , µ) → 0. Tout d’abord quitte à diviser d par diam(X) on peut supposer que d ≤ 1 et donc que Wpp ≤ W1 . Il suffit donc de montrer que W1 (µn , µ) → 0. Or (en utilisant l’exercice 6.7) on a l’expression duale suivante pour W1 : Z W1 (µn , ν) = sup{ ϕ d(µn − µ) : ϕ-1-Lipschitz} X on déduit aisément du théorème d’Ascoli-Arzelà qu’il existe ϕn 1-Lipschitz tel que Z ϕn d(µn − µ) W1 (µn , ν) = X on peut en outre supposer que ϕn (x0 ) = 0 avec x0 un point fixé de X de sorte que (ϕn ) est uniformément bornée et uniformément équicontinue. En appliquant à nouveau le théorème d’Ascoli-Arzelà, on peut supposer (à une extraction près) que (ϕn ) converge uniformément vers un certain ϕ et que W1 (µn , µ) converge vers lim sup W1 (µn , µ) on a alors, grâce à la convergence faible-∗ de (µn ) vers (µ) Z ϕn d(µn − µ) = 0 lim sup W1 (µn , µ) = lim X ce qui achève la preuve. ✷ 139 Exercice 6.8 Soit Ω un ouvert convexe borné de Rd et f+ et f− deux densités de probabilités L1 sur Ω, montrer que Z sup{ u(f+ −f− ) : u 1-Lip. sur Ω} = inf{kσkL1 : σ ∈ L1 (Ω)d , div(σ) = f+ −f− }. Ω 140 Chapitre 7 Espaces de Sobolev et EDP’s elliptiques linéaires 7.1 Cas de la dimension 1 Soit p ∈ [1, ∞], I un intervalle ouvert de R, on définit Z Z 1,p p p ′ W (I) := {u ∈ L : ∃g ∈ L , u ϕ = − gϕ, ∀ϕ ∈ Cc1 (I)}. I I Par densité on peut dans la définition ci-dessus remplacer ”∀ϕ ∈ Cc1 (I)” par ”∀ϕ ∈ D(I)”. Autrement dit u ∈ W 1,p (I) si u ∈ Lp et u′ ∈ Lp , la fonction g intervenant dans la définition ci-dessus est évidemment unique ; on la note alors simplement g = u′ . W 1,p = W 1,p (I) est un espace vectoriel que l’on munit de la norme kukW 1,p := kukLp + ku′ kLp , ∀u ∈ W 1,p . Pour p = 2 on note H 1 := W 1,2 et l’on munit H 1 du produit scalaire Z hu, vi := (uv + u′ v ′ ), ∀(u, v) ∈ H 1 × H 1 . I On vérifie sans difficulté les propriétés suivantes : Théorème 7.1 W 1,p est un espace de Banach. W 1,p est réflexif pour 1 < p < ∞ et séparable pour 1 ≤ p < ∞. H 1 est un espace de Hilbert séparable. Exercice 7.1 Soit (un ) une suite de W 1,p . On suppose que (un ) converge vers u dans Lp et que (u′n ) converge dans Lp , montrer que u ∈ W 1,p et que (un ) converge vers u dans W 1,p . 141 Exercice 7.2 Soit u ∈ W 1,p (I) et ϕ ∈ Cc1 (I) montrer que uϕ ∈ W 1,p et (uϕ)′ = u′ ϕ + uϕ′ . Le résultat suivant permet d’identifier en un certain sens les fonctions W aux primitives de fonctions Lp : 1,p Théorème 7.2 Soit u ∈ W 1,p alors u admet un représentant que nous noterons encore u ∈ C(I) tel que Z y u′ (t)dt, ∀x, y dans I 2 . (7.1) u(y) − u(x) = x Preuve: Soit x0 ∈ I et v(x) := Z x x0 Cc1 (I) u′ (t)dt, ∀x ∈ I. Soit ϕ ∈ et [a, b] un segment inclus dans I et contenant supp(ϕ) on a alors Z bZ x Z x0  Z x 0 Z b Z   ′ ′ ′ ′ ′ u (t)dt ϕ′ (x)dx u (t)dt ϕ (x)dx + vϕ = − vϕ = I x0 x a a x0 avec le théorème de Fubini, il vient donc : Z bZ b Z x0  Z t Z   ′ ′ ′ ϕ′ (x)dx u′ (t)dt ϕ (x)dx u (t)dt + vϕ = − t x0 a I Z Za = − u′ ϕ = uϕ′ . I I on a donc {v − u}′ = 0 et donc il existe une constante C telle que v − u = C p.p., ce qui prouve (7.1). Pour p > 1 et u ∈ W 1,p , on a donc Z y ′ |u′ | ≤ ku′ kLp |x − y|1/p = ku′ kLp |x − y|1−1/p (7.2) |u(x) − u(y)| ≤ x ainsi les fonctions de W 1,p sont C 0,α avec α = 1−1/p. Par le même argument, pour p = ∞, on obtient que les fonctions W 1,∞ sont Lipschitziennes. Pour p = 1 et x, y ∈ I 2 on a Z |u′ | |u(x) − u(y)| ≤ ω(|x − y|) avec ω(t) := sup A : |A|≤t 142 A (noter que pour p = 1, on n’a pas de module de continuité universel de la forme ku′ kL1 ω). Dans tous les cas, on a bien que u est uniformément continue sur I et donc s’étend par continuité de manière unique à I. ✷ Les fonctions u ∈ W 1,p (I) admettant un représentant continu (et ce, jusqu au bord de I de sorte que si ∂I 6= ∅, on peut définir sans ambiguité les valeurs de u sur ∂I), dans la suite de ce paragraphe, nous identifierons u à ce représentant continu. Proposition 7.1 Soit u ∈ Lp avec 1 < p ≤ ∞ on a alors les équivalences entre : 1. u ∈ W 1,p , 2. il existe une constante C telle que Z u ϕ′ ≤ CkϕkLp′ , ∀ϕ ∈ Cc1 (I), I 3. il existe une constante C telle que pour tout ouvert ω ⊂⊂ I et tout h ∈ R tel que |h| < d(ω, R \ I) on ait kτh u − ukLp (ω) ≤ C|h|. De plus, on peut choisir C = ku′ kLp dans les assertions 2 et 3. Nous omettons la démonstration de ce résultat car nous démontrerons au paragraphe suivant sa généralisation à la dimension quelconque. Exercice 7.3 Montrer que pour p = 1, les assertions 2. et 3. de la proposition 7.1 sont équivalentes, sont vraies pour u ∈ W 1,1 mais n’entrainent pas que u ∈ W 1,1 . Supposons en outre I bornée, les fonctions L1 vérifiant les assertions 2. ou 3. de la proposition 7.1 sont appelées fonction à variation bornée. Montrer que u est à variation bornée si et seulement s’il existe une constante C telle que n−1 X k=0 |u(tk+1 ) − u(tk )| ≤ C pour toute suite t0 < t1 ... < tn de I. Montrer que u est à variation bornée si et seulement si u est différence de deux fonctions croissantes bornées sur I et que c’est encore équivalent à dire que la dérivée distribution de u est une mesure signée finie. Toujours dans le cas où I est borné, montrer que 143 u ∈ W 1,1 si et seulement si pour tout ε > 0, il existe S δ tel que pour toute suite d’intervalles disjoints (Ik )k=1,...,n , Ik =]ak , bk [, si | k Ik | ≤ δ alors X |u(bk ) − u(ak )| ≤ ε. k Exercice 7.4 Montrer que toute suite bornée de W 1,1 possède une sous-suite qui converge ponctuellement. Il peut s’avérer utile (pour la convolution ou la transformée de Fourier, par exemple) d’étendre les fonctions de W 1,p (I) à R entier, on a alors : Théorème 7.3 (Théorème de prolongement) Il existe un opérateur linéaire continu P : W 1,p (I) → W 1,p (R) tel que P u|I = u, pour tout u ∈ W 1,p (I). Preuve: Si I est non borné, on peut supposer I =]0, +∞[, on définit alors P en prolongeant u ∈ W 1,p (]0, +∞[) par parité (ou par réflexion : c’est à dire P u(x) = u(x) si x ≥ 0 et P u(x) = u(−x) si x < 0) à R entier, on vérifie immédiatement que kP ukW 1,p (R) ≤ 2kukW 1,p (I) . Dans le cas où I est borné, on peut supposer I =]0, 1[, pour u ∈ W 1,p (]0, 1[), on prolonge u par parité à ] − 1, 0[ puis par réflexion par rapport à 1 à l’intervalle ]1, 2[, on note ũ le prolongement de u à l’intervalle ] − 1, 2[ ainsi obtenu. Soit alors g ∈ Cc1 (R) une fonction cut-off vérifiant : χ[0,1] ≤ g ≤ χ[−1/2,3/2] et P u := gũ (prolongée par 0 en dehors de ] − 1, 2[). On vérifie sans difficulté que P a les propriétés voulues. ✷ Exercice 7.5 Soit ρ ∈ L1 (R) et u ∈ W 1,p (R) montrer que ρ ⋆ u ∈ W 1,p (R) et que (ρ ⋆ u)′ = ρ ⋆ u′ . Théorème 7.4 (Théorème de densité) Soit p ∈ [1, ∞[ et u ∈ W 1,p (I), il existe (un )n ∈ D(R)N tel que un |I converge vers u dans W 1,p (I). Preuve: Par prolongement si nécessaire, on peut se ramener au cas où I = R. On procède alors par troncature et régularisation par noyau convolutif. Soit η ∈ D(R) tel que χ[−1,1] ≤ η ≤ χ[−2,2] et ηn (t) := η(n−1 t) pour tout t ∈ R, soit 144 par ailleurs ρn un noyau régularisant. Soit maintenant u ∈ W 1,p (R) on pose un := ηn (ρn ⋆ u). Par construction, un ∈ D et u′n = ηn′ (ρn ⋆ u) + ηn (ρn ⋆ u′ ). On a un − u = ηn (ρn ⋆ u − u) + (ηn − 1)u ; chacun des deux termes dans l’expression précédente tend vers 0 dans Lp : le premier car ηn est borné dans L∞ et ρn ⋆ u → u dans Lp et le second par convergence dominée. Pour les dérivées, on a : |u′n − u| ≤ 1 ′ kη kL∞ |ρn ⋆ u| + |ηn (ρn ⋆ u′ ) − u′ | n de la même manière que précédemment on en déduit que u′n → u′ dans Lp et donc que un → u dans W 1,p . ✷ Théorème 7.5 (Injections de Sobolev en dimension 1) Soit I un intervalle ouvert de R, il existe une constante C = C(I) (indépendante de p) telle que pour tout p ∈ [1, ∞], et tout u ∈ W 1,p (I) on ait kukL∞ ≤ CkukW 1,p (7.3) autrement dit W 1,p (I) ⊂ L∞ avec injection continue. Si de plus I est borné, alors 1. pour tout p > 1, l’injection W 1,p ⊂ C(I) est compacte 2. l’injection W 1,1 (I) ⊂ Lq (I) est compacte pour tout q ∈ [1, ∞[. Preuve: Par prolongement, il nous suffit d’établir (7.3) pour I = R. Soit u ∈ Cc1 (R), pour p = 1 on a, pour tout x ∈ R : Z x |u′ | ≤ ku′ kL1 . |u(x)| ≤ −∞ Pour p ∈]1, ∞[ et x ∈ R, comme |u|p−1 u ∈ Cc1 (R) avec (|u|p−1 u)′ = p|u|p−1 u′ , on a : Z x p−1 p|u(s)|p−1 u′ (s)ds |u(x)| u(x) = −∞ avec l’inégalité de Hölder, il vient p ′ |u(x)|p ≤ pkukp−1 Lp ku kLp ≤ pkukW 1,p . 145 Utilisant le fait que p1/p ≤ e1/e pour tout p ≥ 1, on en déduit que kukL∞ ≤ e1/e kukW 1,p . Ainsi (7.3) est satisfaite pour tout u ∈ Cc1 (R). Soit maintenant u ∈ W 1,p et (un ) dans Cc1 (R) telle que un → u dans W 1,p , on déduit de ce qui précède que (un ) est de Cauchy dans L∞ et ainsi que u ∈ L∞ , un → u dans L∞ et u satisfait (7.3). Supposons maintenant que I soit borné, l’assertion 1. découle de (7.2) et du théorème d’Arzelà-Ascoli. Pour prouver l’assertion 2., on va montrer que B, la boule unité de W 1,1 , satisfait les conditions du théorème de RieszFréchet-Kolmogorov dans Lq pour tout q ∈ [1, ∞[. Soit ω ⊂⊂ I et h ∈ R tel que |h| < d(ω, Rd \ I), nous savons déjà (voir exercice 7.3) que kτh u − ukL1 (ω) ≤ |h|ku′ kL1 ≤ |h|, ∀u ∈ B. Avec (7.3) on en tire donc que pour tout u ∈ B on a kτh u − ukqLq (ω) ≤ (2kukL∞ )q−1 |h| ≤ (2C)q−1 |h| de sorte que B vérifie la première condition du théorème de Riesz-FréchetKolmogorov. Pour la seconde condition du théorème de Riesz-Fréchet-Kolmogorov, on remarque simplement que pour tout u ∈ B kukLq (I\ω) ≤ kukL∞ |I \ ω|1/q ≤ C|I \ ω|1/q . ✷ Exercice 7.6 Montrer que W 1,1 ⊂ C(I) avec injection continue mais que cette injection n’est pas compacte (même dans le cas où I est borné). Corollaire 7.1 Si I est non borné, 1 ≤ p < ∞ et u ∈ W 1,p (I) on a u(x) → 0, pour |x| → ∞, x ∈ I. Preuve: On sait qu ’il existe (un ) ∈ D(R)N telle que un |I → u dans W 1,p et donc avec (7.3), un |I → u dans L∞ . Pour tout x ∈ I on a |u(x)| ≤ kun − ukL∞ + |un (x)|, soit ε > 0, pour n assez grand, le premier terme est inférieur à ε et pour |x| assez grand, le second est nul, ce qui montre le résultat voulu. ✷ On vérifie par ailleurs facilement : 146 Corollaire 7.2 Soit 1 ≤ p ≤ ∞, u et v dans W 1,p (I) alors uv ∈ W 1,p (I) avec (uv)′ = u′ v + uv ′ et on a la formule d’intégration par parties Z y Z y 2 ′ u′ v + u(y)v(y) − u(x)v(x), ∀(x, y) ∈ I . uv = − x x Exercice 7.7 Soit G ∈ C 1 (R) telle que G(0) = 0 et u ∈ W 1,p (I) montrer que G ◦ u ∈ W 1,p (I) et que G ◦ u′ = (G′ ◦ u)u′ (noter aussi que l’hypothèse G(0) = 0 est inutile dans le cas où I est borné). Pour 1 ≤ p < ∞ on note W01,p = W01,p (I) l’adhérence de Cc1 (I) dans (W 1,p , k.kW 1,p ). On munit W01,p de la norme de W 1,p , comme, par définition, W01,p est fermé dans W 1,p , c’est un espace de Banach pour la norme W 1,p . On note aussi H01 := W01,2 . On sait déja que si I = R, Cc1 (R) est dense dans W 1,p (R) de sorte que W01,p (R) = W 1,p (R). Pour I 6= R, I a un bord non vide et les fonctions de W01,p (I) sont les fonctions W 1,p (I) nulles sur le bord de I : Théorème 7.6 Soit u ∈ W 1,p (I) alors u ∈ W01,p (I) si et seulement si u = 0 sur ∂I. Preuve: Si u ∈ W01,p (I), u est limite dans W 1,p (I) d’une suite (un ) ∈ D(I)N , il résulte du théorème 7.5 que (un ) converge uniformément vers u sur I et donc u = 0 sur ∂I. Réciproquement, si u = 0 sur ∂I, alors pour tout n ∈ N∗ , {x ∈ I : |u| ≥ 1/n} est compact, soit alors G ∈ C 1 (R), impaire, nulle sur [−1, 1] et telle que G(t) = t pour tout t ∈ R \ [−2, 2]. On pose alors un = n−1 G(nu) on a un ∈ W01,p car, par construction, supp(un ) ⊂ {x ∈ I : |u| ≥ 1/n}. On vérifie sans peine avec l’exercice 7.7 et le théorème de convergence dominée que (un ) converge vers u dans Lp (I) et que (u′n ) converge dans Lp , ceci implique que (un ) converge vers u dans W 1,p (I) et prouve que u ∈ W01,p (I). ✷ Exercice 7.8 Soit u ∈ W 1,p et c ∈ R montrer que u′ = 0 p.p. sur {u = c} (indication : s’inspirer de la preuve du théorème précèdent). Proposition 7.2 (Inégalité de Poincaré) Supposons I borné. Alors il existe une constante C telle que kukW 1,p ≤ Cku′ kLp , ∀u ∈ W01,p (I). 147 Preuve: En notant I =]a, b[ pour u ∈ W01,p et x ∈ I on a Z x |u′ | ≤ ku′ kL1 |u(x)| = |u(x) − u(a)| ≤ a et donc kukL∞ ≤ ku′ kL1 ; on conclut par l’inégalité de Hölder. ✷ Si I est borné on déduit de l’inégalité de Poincaré que uR 7→ ku′ kL2 est une norme équivalente (associée au produit scalaire (u, v) 7→ I u′ v ′ ) sur H01 à la norme H 1 usuelle. Exercice 7.9 (Inégalité de Poincaré-Wirtinger) Soit I un intervalle ouvert (borné ou non) et u ∈ W 1,1 (I), montrer que Z 1 ′ u. ku − ukL∞ ≤ ku kL1 où u := |I| I 7.2 Définitions et propriétés premières en dimension quelconque Soit maintenant Ω un ouvert de Rd , pour tout p ∈ [1, +∞], on définit W 1,p (Ω) := {u ∈ Lp (Ω) : ∂i {u} ∈ Lp (Ω), i = 1, ..., d} Autrement dit, u ∈ Lp (Ω) appartient à W 1,p (Ω) si et seulement s’il existe g1 , ..., gd dans Lp (Ω) tels que Z Z u ∂i ϕ = − gi ϕ, ∀ϕ ∈ Cc1 (Ω), ∀i = 1, ..., d Ω Ω (le fait qu’on puisse indifféremment des fonctions-test ϕ dans Cc1 (Ω) ou dans D(Ω) dans la définition précédente découle d’un argument désormais habituel de densité) on note alors simplement ∂i {u} = ∂i u = gi et ∇u = (∂1 u, ..., ∂d u)T . On munit W 1,p = W 1,p (Ω) de la norme suivante (ou de n’importe quelle autre équivalente) kukW 1,p := kukLp + k∇ukLp , ∀u ∈ W 1,p . Pour p = 2, on pose H 1 := W 1,2 et l’on munit H 1 du produit scalaire Z hu, vi := (uv + ∇u · ∇v), ∀(u, v) ∈ H 1 × H 1 . Ω On a de manière évidente : 148 Théorème 7.7 W 1,p est un espace de Banach. W 1,p est réflexif pour 1 < p < ∞ et séparable pour 1 ≤ p < ∞. H 1 est un espace de Hilbert séparable. Pour m ∈ N∗ et p ∈ [1, +∞] on définit de manière analogue : W m,p (Ω) := {u ∈ Lp (Ω) : ∂ α {u} ∈ Lp (Ω), ∀α ∈ Nd , |α| ≤ m} que l’on munit de la norme suivante (ou une autre équivalente) : X kukW m,p := kukLp + k∂ α ukLp , ∀u ∈ W m,p . α : 1≤|α|≤m On note W m,2 := H m et on le munit du produit scalaire : Z X Z ∂ α u ∂ α v, ∀(u, v) ∈ H m . uv + hu, vi := Ω 1≤|α|≤m Ω On laisse le lecteur formuler et démontrer l’analogue du théorème 7.7 pour les espaces W m,p . Théorème 7.8 (Théorème de densité de Friedrichs) Soit p ∈ [1, ∞[ et u ∈ W 1,p (Ω). Il existe (un )n ∈ D(Rd )N tel que un |Ω converge vers u dans Lp (Ω) et ∇un |ω converge vers ∇u|ω dans Lp (ω) pour tout ω ⊂⊂ Ω. Preuve: Soit η ∈ D(Rd ) telle que χB(0,1) ≤ η ≤ χB(0,2) et ηn (x) := η(n−1 x) pour tout n ∈ N∗ et x ∈ Rd et soit (ρn ) une suite régularisante. Pour u ∈ W 1,p (Ω) on pose  u(x) si x ∈ Ω u(x) := 0 sinon et l’on définit un := ηn (ρn ⋆ u). On a alors un ∈ D(Rd ) et kun − ukLp (Rd ) ≤ kηn (ρn ⋆ u − u)kLp (Rd ) + k(ηn − 1)ukLp (Rd ) d’où l’on déduit facilement que un → u dans Lp (Rd ) et donc que un |Ω → u dans Lp (Ω). Soit maintenant ω ⊂⊂ Ω, on commence par remarquer que pour n assez grand, on a ∇(ρn ⋆ u) = ρn ⋆ ∇u sur ω puis que ∇un = ηn (ρn ⋆ ∇u) + 1 . (ρn ⋆ u) sur ω ∇η n n 149 et donc k∇un − ∇ukLp (ω) ≤ kηn (ρn ⋆ ∇u) − ∇ukLp (ω) + k∇ηkL∞ kukLp (Ω) n ce qui permet d’en déduire que ∇un |ω converge vers ∇u|ω dans Lp (ω). ✷ Notons au passage que D(Rd ) est dense dans W 1,p (Rd ) pour p ∈]1, ∞[ (considérer un = ηn (ρn ⋆ u)). Nous verrons ultérieurement que pour Ω suffisamment régulier on peut améliorer le résultat précédent. Proposition 7.3 Soit u ∈ Lp avec 1 < p ≤ ∞ on a alors les équivalences entre : 1. u ∈ W 1,p , 2. il existe une constante C telle que Z u ∂i ϕ ≤ CkϕkLp′ , ∀ϕ ∈ Cc1 (Ω), ∀i = 1, ..., d, Ω 3. il existe une constante C telle que pour tout ouvert ω ⊂⊂ Ω et tout h ∈ Rd tel que |h| < d(ω, Rd \ Ω) on ait kτh u − ukLp (ω) ≤ C|h|. Preuve: L’équivalence entre les assertions 1 et 2 découle immédiatement des théorèmes 5.12 et 5.13 (pour p = ∞). Montrons maintenant que 1 implique 3, on commence par supposer que u ∈ Cc1 (Rd ) et p ∈]1, ∞[, on a alors pour tout x et h dans Rd Z 1 |∇u(x + th)|dt |τh u(x) − u(x)| ≤ |h| 0 en utilisant l’inégalité de Jensen on en déduit que Z 1 p p |∇u(x + th)|p dt |τh u(x) − u(x)| ≤ |h| 0 soit maintenant ω ⊂⊂ Ω et |h| < d(ω, Rd \ Ω) et soit ω ′ ⊂⊂ Ω tel que ω + th ⊂ ω ′ pour tout t ∈ [0, 1] (par exemple ω ′ = ω + B(0, |h|)), on a alors avec le théorème de Fubini : Z 1Z Z  p p |∇u(x + th)|p dx dt ≤ |h|p k∇ukpLp (ω′ ) |τh u − u| ≤ |h| ω 0 ω 150 il vient donc kτh u − ukLp (ω) ≤ |h|k∇ukLp (ω′ ) . (7.4) On déduit ensuite du théorème de densité de Friedrichs que (7.4) est satisfaite par tout u ∈ W 1,p (Ω). Le cas p = ∞ se déduit de ce qui précède en faisant tendre p vers +∞ dans (7.4). Montrons enfin que 3 entraine 2. Soit donc u ∈ Lp (Ω) satisfaisant 3, ϕ ∈ Cc1 (Ω), ω ⊂⊂ Ω tel que supp(ϕ) ⊂ ω et h ∈ Rd avec |h| < d(ω, Rd \ Ω), il découle de 3 et de l’inégalité de Hölder que Z (τh u − u)ϕ ≤ C|h|kϕkLp′ Ω on remarque ensuite que Z Z (τh u − u)ϕ = u(x)(ϕ(x − h) − ϕ(x))dx. Ω Il vient donc Ω Z Ω u(x) ϕ(x − h) − ϕ(x) ≤ CkϕkLp′ |h| en prenant h = tei (avec e1 , ..., ed la base canonique de Rd ) et en faisant tendre t vers 0 on en déduit exactement l’assertion 2. ✷ Exercice 7.10 Soit u et v dans L∞ (Ω)∩W 1,p (Ω) montrer que uv ∈ W 1,p (Ω) avec ∇(uv) = u∇v + v∇u. Exercice 7.11 Soit u ∈ W 1,p (Ω) et G ∈ C 1 (R) ∩ W 1,∞ (R) telle que G(0) = 0, montrer que G ◦ u ∈ W 1,p (Ω) avec ∇(G ◦ u) = (G′ ◦ u)∇u. Exercice 7.12 Soit u ∈ W 1,p (Ω) et c ∈ R montrer que ∇u = 0 p.p. sur {u = c}. Montrer que u+ , u− et |u| appartiennent à W 1,p (Ω) et calculer leur dérivée Lp . 151 Exercice 7.13 Soit Ω et U deux ouverts de Rd et X un C 1 -difféormorphisme bi-Lipschitzien de Ω sur U (c’est-à-dire que X et X −1 sont C 1 et Lipschitziennes). Soit u ∈ W 1,p (U ) montrer que (u ◦ X) ∈ W 1,p (Ω) et que ∂i (u ◦ X) = d X j=1 ((∂j u) ◦ X) ∂i Xj c’est à dire, en notant JX la jacobienne de X et JX T sa transposée : ∇(u ◦ X)(x) = JX(x)T ∇u(X(x)) p.p. x ∈ Ω. Exercice 7.14 Soit Ω′ un ouvert de Rd−1 , Ω− := Ω′ ×] − 1, 0[ et Ω := Ω′ ×] − 1, 1[. Pour tout u ∈ W 1,p (Ω− ) on définit pour tout x = (x′ , xd ) ∈ Ω :  u(x) si x ∈ Ω− ∗ ′ u (x , xd ) := u(x′ , −xd ) sinon Montrer que u∗ ∈ W 1,p (Ω) et ku∗ kLp (Ω) ≤ 2kukLp (Ω− ) , ku∗ kW 1,p(Ω) ≤ 2kukW 1,p (Ω− ) . Comme en dimension 1, il est souvent utile de se ramener au cas de l’espace entier et donc de chercher à prolonger les fonctions de W 1,p (Ω) (l’exercice précédent fournit un exemple de tel prolongement par réflexion). Ce n’est cependant pas toujours possible et dépend de la régularité de l’ouvert Ω. Nous allons cependant voir qu’un tel prolongement est possible pour Ω suffisamment régulier (par simplicité nous ne chercherons pas ici les hypothèses minimales de régularité). Dans ce qui suit, nous dirons que Ω est régulier s’il existe Φ ∈ C 1 (Rd ) telle que : Ω = {Φ < 0}, ∂Ω = {Φ = 0}, |∇Φ| = 6 0, sur ∂Ω. Théorème 7.9 (Théorème de prolongement) Soit Ω un ouvert régulier de Rd au sens précédent et tel que ∂Ω soit borné. Alors il existe un opérateur linéaire P : W 1,p (Ω) → W 1,p (Rd ) et une constante C ≥ 0 tels que, pour tout u ∈ W 1,p (Ω) on ait : 1. P u|Ω = u, 2. kP ukLp (Rd ) ≤ CkukLp (Ω) , 152 3. kP ukW 1,p (Rd ) ≤ CkukW 1,p (Ω) . Preuve: Comme dans la démonstration de la formule de Stokes, on remarque grâce au théorème de l’inversion locale, qu’en chaque point x de ∂Ω il existe U un voisinage ouvert de x, et un C 1 -difféomorphisme Ψ bilipschitzien : Q → U avec Q = Bd−1 ×] − 1, 1[ (en notant Bd−1 la boule unité ouverte de Rd−1 ) tels que ∂Ω ∩ U = Ψ(Bd−1 × {0}), Ω ∩ U = Ψ(Q− ) avec Q− = Bd−1 ×] − 1, 0[. Pour tout v ∈ W 1,p (Q− ) on définit par ailleurs v ∗ ∈ W 1,p (Q) par prolongement par réflexion comme dans l’exercice 7.14. Comme ∂Ω est compact, on le recouvre par un nombre fini d’ouverts Ui tel que pour chaque i, il existe un C 1 -difféomorphisme bilipschitzien Ψi de Q dans Ui tel que ∂Ω ∩ Ui = Ψi (Bd−1 × {0}), Ω ∩ Ui = Ψi (Q− ). Soit maintenant u ∈ W 1,p (Ω), d’après l’exercice 7.13 pour chaque i, vi := u ◦ Ψi ∈ W 1,p (Q− ) et donc on a aussi vi∗ ∈ W 1,p (Q), on pose alors ui (x) := vi∗ (Ψ−1 i (x)) pour tout x ∈ Ui , on a alors (cf. exercice 7.13 et 7.14) ui ∈ 1,p W (Ui ) et kui kLp (Ui ) ≤ Ci kukLp (Ui ∩Ω) , kui kW 1,p (Ui ) ≤ Ci kukW 1,p (Ui ∩Ω) pour une certaine constante Ci indépendante de u. Soit maintenant (θi )i une partition de l’unité subordonnée au recouvrement (Ui ). Définissons pour tout i et tout x ∈ Rd :  θi ui (x) si x ∈ Ui wi (x) := 0 sinon et notons par u le prolongement de u par 0 en dehors de Ω. Définissons enfin  X X  wi Pu = 1 − θi u + i i on vérifie sans difficulté que P a les propriétés cherchées. ✷ Le théorème de prolongement permet d’améliorer le résultat de densité fourni par le théorème 7.8 : Proposition 7.4 Soit Ω un ouvert régulier de Rd , p ∈ [1, +∞[ et u ∈ W 1,p (Ω). Il existe (un )n ∈ D(Rd )N tel que un |Ω converge vers u dans W 1,p (Ω) 153 Preuve: On note comme précédemment (ρn )n et (ηn )n respectivement une suite régularisante et une suite de troncatures. Dans le cas où ∂Ω est borné, on note P un opérateur de prolongement et on vérifie facilement que la suite un = ηn (ρn ⋆ P u) convient. Dans le cas où ∂Ω est non borné, pour ε > 0, on choisit d’abord n0 tel que kηn0 u − ukW 1,p (Ω) ≤ ε/2, puis on prolonge ηn0 u en une fonction v ∈ W 1,p (Rd ), on prend alors un := ηn (ρn ⋆ v) comme un → v dans W 1,p (Rd ) on a bien kun − ukW 1,p (Ω) ≤ ε pour n assez grand. ✷ 7.3 Injections de Sobolev Nous avons vu qu’en dimension 1, W 1,p s’injecte continûment dans L∞ , nous avions même vu que les fonctions W 1,p étaient continues (et même Höldériennes pour p > 1). Tout ceci n’est plus vrai en dimension supérieure. On peut s’en convaincre en prenant par exemple sur la boule unité en dimension deux, des puissances négatives de la norme : x 7→ |x|−α est dans W 1,p pour p < 2 et α < (2 − p)/p et pourtant cette fonction n’est ni continue, ni bornée. Nous allons d’abord considérer le cas de l’espace Rd entier (d ≥ 2) le cas d’un ouvert régulier dont le bord est borné s’en déduira aisément grâce au théorème de prolongement. Considérons d’abord le cas où 1 ≤ p ≤ d (et d ≥ 2 évidemment). Lemme 7.1 Soit f1 , ..., fd ∈ Ld−1 (Rd−1 ), pour tout x ∈ Rd et i = 1, ...., d on pose x−i = (x1 , ...., xi−1 , xi+1 , ..., xd ) ∈ Rd−1 . Soit f (x) := d Y i=1 1 d on a alors f ∈ L (R ) et kf kL1 (Rd ) ≤ fi (x−i ), ∀x ∈ Rd d Y i=1 kfi kLd−1 (Rd−1 ) . Preuve: Démontrons le résultat par récurrence sur d, pour d = 2 c’est évident. Supposons le résultat vrai en dimension d et démontrons le en dimension d + 1. 154 On commence par fixer xd+1 , puis on remarque que pour d′ = d/(d − 1) ′ on a |fi (., xd+1 )|d ∈ Ld−1 (Rd−1 ), en appliquant l’hypothèse de récurrence on Q ′ d obtient que x ∈ Rd 7→ i=1 |fi (x−i , xd+1 )|d ∈ L1 (Rd ) avec Z d Y Rd i=1 ′ |fi (x−i , xd+1 )|d dx1 .....dxd ≤ d Y i=1 ′ kfi (., xd+1 )kdLd (Rd−1 ) . Avec l’inégalité de Hölder, il vient donc : Z Rd |f (x1 , ..., xd , xd+1 )|dx1 ...dxd ≤ kfd+1 kLd (Rd ) d Y i=1 kfi (., xd+1 )kLd d on remarque ensuite que xd+1 7→ kfi (., d+1 )kLd est dans L et il résulte donc Qx d de l’inégalité de Hölder que xd+1 7→ i=1 kfi (., xd+1 )kLd est L1 et que : Z Rd+1 |f |dx1 ...dxd+1 ≤ kfd+1 kLd (Rd ) d Y i=1 kfi kLd (Rd ) . ✷ On peut alors en déduire un premier résultat d’injection continue : Théorème 7.10 (Sobolev, Gagliardo, Nirenberg) Soit 1 ≤ p < d on a alors ∗ W 1,p (Rd ) ⊂ Lp pour p∗ défini par 1 1 1 = − . ∗ p p d De plus l’injection précédente est continue et plus précisément, il existe une constante C telle que kukLp∗ ≤ Ck∇ukLp , ∀u ∈ W 1,p (Rd ). Preuve: Soit u ∈ Cc1 (Rd ), on a pour tout x ∈ Rd : Z |∂i u(x−i , t)|dt |u(x)| ≤ fi (x−i ) := R et donc |u(x)| d d−1 ≤ d Y i=1 155 1 fi (x−i ) d−1 (7.5) avec le lemme 7.1, il vient donc kuk d d−1 d L d−1 ≤ d Z Y i=1 fi (x−i )dx−i Rd−1 1  d−1 ≤ d Y i=1 1 k∂i ukLd−1 1 de sorte que kuk d L d−1 ≤ d Y i=1 k∂i ukL1  d1 ≤ k∇ukL1 . (7.6) Par un argument de densité, on en déduit que W 1,1 ⊂ Ld/(d−1) et que (7.6) est satisfaite pour tout u ∈ W 1,1 , on a ainsi établi (7.5) dans le cas p = 1. Supposons maintenant que p > 1 et que u ∈ Cc1 (Rd ) en appliquant (7.6) à v = |u|α−1 u (α > 1 sera fixé ultérieurement), il vient avec l’inégalité de Hölder : Z  p−1 Z (α−1)p p α α−1 p−1 kuk αd ≤ α |u| |∇u| ≤ αk∇ukLp |u| L d−1 Rd = αk∇ukLp kuk Rd α−1 L (α−1)p p−1 on choisit maintenant α tel que αd (α − 1)p αd = ⇒ = p∗ . d−1 p−1 d−1 On en déduit que (7.5) a lieu pour tout u ∈ Cc1 (Rd ) et, comme d’habitude, on conclut par densité. ✷ Corollaire 7.3 Soit 1 ≤ p < d on a alors W 1,p (Rd ) ⊂ Lq (Rd ) avec injection continue pour tout q ∈ [p, p∗ ]. Preuve: On sait déjà que le résultat est vrai pour q = p et q = p∗ pour q ∈]p, p∗ [, soit α ∈]0, 1[ tel que α 1−α 1 . = + q p p∗ Il découle de l’inégalité d’interpolation et de (7.5) que pour tout u ∈ W 1,p on a u ∈ Lq et 1−α kukW 1,p . kukLq ≤ kukαLp kukL1−α p∗ ≤ C ✷ 156 Proposition 7.5 (Le cas limite p = d) W 1,d (Rd ) ⊂ Lq (Rd ) avec injection continue pour tout q ∈ [d, +∞[. Preuve: Soit u ∈ Cc1 (Rd ), nous avons vu qu’en appliquant l’inégalité de Sobolev pour à v = |u|α−1 u (α > 1) on obtient : Z α kuk αd ≤ C k∇uk|u|α−1 ≤ Ck∇ukLd kukα−1 (α−1)d L d−1 Rd L d−1 avec l’inégalité de Young il vient donc kuk αd L d−1 1/α (α−1)/α ≤ C 1/α k∇ukLd kuk L (α−1)d d−1 ≤ Cα (k∇ukLd + kuk L (α−1)d d−1 ). (7.7) en prenant α = d on obtient kuk d2 L d−1 ≤ C(k∇ukLd + kukLd ) 2 et on en déduit que Ld /(d−1) ⊂ W 1,d avec injection continue et par interpolation que Lq ⊂ W 1,d avec injection continue pour tout q ∈ [d, d2 /(d − 1)]. On applique ensuite à nouveau (7.7) à α = d + 1, d + 2, d + 3... et on en déduit le résultat recherché. ✷ Passons maintenant au cas p > d : Théorème 7.11 (Morrey) Soit ∞ ≥ p > d on a alors W 1,p (Rd ) ⊂ L∞ (Rd ) avec injection continue. De plus, si u ∈ W 1,p (Rd ), u admet un représentant continu (encore noté u) et plus précisément, il existe une constante C telle que |u(x) − u(y)| ≤ Ck∇ukLp |x − y|α , ∀x, y ∈ Rd × Rd pour α = 1 − d/p. Preuve: Soit u ∈ Cc1 (Rd ), x et y dans Rd , soit Q un cube ouvert contenant x et y et dont les côtés sont de longueur r = 2|x − y| et parallèles aux axes de coordonnées. Dans tout ce qui suit C désignera une constante (ne dépendant ni de u ni de x ni de y) mais qui pourra varier d’une ligne à l’autre. Pour z ∈ Q on a : Z 1 Z 1 |∇u(x + t(z − x))|dt |∇u(x + t(z − x))||z − x|dt ≤ Cr |u(x) − u(z)| ≤ 0 0 157 en définissant u := |Q|−1 R Q |u(x) − u| ≤ Cr u et en intégrant l’inégalité précédente il vient 1−d = Cr1−d Z Z Z Q 1 0  |∇u(x + t(z − x))|dt dz 1 0 Z Qt  1 |∇u(y)|dy dt td où l’on a posé Qt := (1 − t)x + tQ ⊂ Q. En utilisant l’inégalité de Hölder, on a Z ′ ′ ′ |∇u(y)|dy ≤ k∇ukLp (Q) |Qt |1/p ≤ k∇ukLp td/p rd/p Qt et donc |u(x) − u| ≤ Ck∇ukLp r 1−d+d/p′ Z 1 0 1 td(1−1/p′ ) dt ≤ Ck∇ukLp r1−d/p de sorte que |u(x) − u(y)| ≤ Ck∇ukLp |x − y|1−d/p . Pour montrer l’estimation L∞ , on fixe un cube ouvert contenant x dont les côtés sont parallèles aux axes de coordonnées et de longueur 1, en utilisant ce qui précède et l’inégalité de Hölder, on obtient |u(x)| ≤ |u| + |u(x) − u| ≤ kukLp + Ck∇ukLp ≤ CkukW 1,p Enfin, on conclut facilement la preuve à nouveau par densité. ✷ Exercice 7.15 Soit u ∈ W 1,p (Rd ) avec p > d montrer que u(x) → 0 quand |x| → 0. Dans le cas d’un ouvert Ω de Rd régulier tel que ∂Ω soit borné, on peut étendre les résultats précédents grâce au théorème de prolongement. En résumé, cela donne : Théorème 7.12 Soit d ≥ 2, Ω un ouvert de Rd régulier tel que ∂Ω soit borné et p ∈ [1, ∞]. On a : 1. si p < d, W 1,p (Ω) ⊂ Lq (Ω) avec injection continue pour tout q ∈ [p, p∗ ] avec p∗ défini par 1 1 1 = − ∗ p p d 158 2. si p = d, W 1,p (Ω) ⊂ Lq (Ω) avec injection continue pour tout q ∈ [d, ∞[, 3. si p > d, W 1,p (Ω) ⊂ L∞ (Ω) avec injection continue. Dans le cas d’un domaine régulier borné, on a en outre des résultats d’injections compactes : Théorème 7.13 (Rellich-Kondrachov) Soit Ω un ouvert régulier et borné de Rd et p ∈ [1, ∞]. On a : 1. si p < d, W 1,p (Ω) ⊂ Lq (Ω) avec injection compacte pour tout q ∈ [1, p∗ [ avec p∗ défini par 1 1 1 = − ∗ p p d 2. si p = d, W 1,p (Ω) ⊂ Lq (Ω) avec injection compacte pour tout q ∈ [1, ∞[, 3. si p > d, W 1,p (Ω) ⊂ C(Ω) avec injection compacte. Preuve: Supposons p < d, et q ∈ [1, p∗ [. Il s’agit de montrer que la boule unité de W 1,p (Ω) vérifie les hypothèses du théorème de Riesz-Fréchet-Kolmogorov dans Lq (Ω). Soit α ∈]0, 1] tel que 1−α 1 . =α+ q p∗ Soit u ∈ W 1,p (Ω), ω ⊂⊂ Ω et h ∈ Rd tel que |h| ≤ d(ω, Rd \Ω) , par l’inégalité d’interpolation, et le fait que Ω soit borné, on a : kτh u − ukLq (ω) ≤ kτh u − ukαL1 (ω) kτh u − uk1−α Lp∗ (ω) ≤ |h|α k∇ukαL1 (Ω) (2kukLp∗ (Ω) )1−α ≤ C|h|α kukW 1,p (Ω) ce qui montre que la boule unité de W 1,p (Ω) vérifie la première hypothèse du théorème de Riesz-Fréchet-Kolmogorov. L’inégalité de Hölder donne par ailleurs ∗ kukLq (Ω\ω) ≤ kukLp∗ (Ω\ω) |Ω \ ω|1/q−1/p ce qui assure que la boule unité de W 1,p (Ω) vérifie aussi la seconde hypothèse du théorème de Riesz-Fréchet-Kolmogorov. Le cas p = d se traite de manière similaire. Enfin la compacité dans le cas p > d découle immédiatement des théorèmes de Morrey et d’Arzelà-Ascoli. ✷ 159 Notons en particulier que si Ω est régulier et borné, l’injection W 1,p (Ω) ⊂ L (Ω) est compacte ce qui implique que si (un ) converge faiblement vers u dans W 1,p (Ω) alors (un ) converge fortement vers u dans Lp (Ω). Notons aussi que si Ω n’est pas borné, l’injection W 1,p (Ω) ⊂ Lp (Ω) n’est généralement pas ∗ compacte. On peut aussi montrer que pour p < d, l’injection W 1,p (Ω) ⊂ Lp n’est jamais compacte (même si Ω est borné et régulier). p 7.4 Espace W01,p et traces de fonctions W 1,p Nous allons voir que les fonctions W 1,p ont une trace sur les hypersurfaces régulières c’est à dire que l’on peut donner un sens (Lp ) aux valeurs prises par une fonction W 1,p sur une telle hypersurface. Ceci est évident pour p > d, beaucoup moins pour p ≤ d. Lemme 7.2 Soit p ∈ [1, ∞[ et Ω := Rd−1 × R∗+ . Il existe une constante C telle que pour tout u ∈ Cc1 (Rd ), on ait Z 1/p |u(x′ , 0)|p dx′ ≤ CkukW 1,p . Rd−1 Preuve: Soit x′ ∈ Rd−1 on a alors ′ p |u(x , 0)| ≤ = Z ∞ Z0 ∞ 0 |∂d (|u(x′ , xd )|p−1 u(x′ , xd ))|dxd p|u(x′ , xd )|p−1 |∂d u(x′ , xd )|dxd pour p = 1 on en déduit immédiatement le résultat cherché en intégrant l’inégalité précédent par rapport à x′ . Pour p > 1, l’inégalité de Young et l’inégalité précédente donnent Z ∞ Z ∞  ′ p ′ p ′ p |∂d u(x , xd )| dxd |u(x , xd )| dxd + |u(x , 0)| ≤ C 0 0 et on bien obtient l’inégalité cherchée en intégrant par rapport à x′ . ✷ Le lemme précédent montre que lorsque Ω := Rd−1 × R∗+ , on peut prolonger l’opérateur u ∈ Cc1 (Ω) 7→ u|∂Ω en un opérateur linéaire continue de W 1,p (Ω) → Lp (∂Ω) = Lp (∂Ω, σ) avec σ la mesure superficielle sur ∂Ω (qui dans le cas du lemme précédent est simplement la mesure de Lebesgue d − 1dimensionnelle sur l’hyperplan ∂Ω). Ceci peut se généraliser comme suit aux 160 ouverts Ω réguliers (en définissant leur mesure superficielle σ sur ∂Ω comme au chapitre 2). En effet, en rectifiant ∂Ω par cartes locales on obtient le résultat suivant dont on laisse la preuve au lecteur : Lemme 7.3 Soit p ∈ [1, ∞[ et Ω un ouvert régulier de Rd tel que ∂Ω soit borné (pour simplifier). Il existe une constante C telle que pour tout u ∈ Cc1 (Rd ), on ait 1/p Z ≤ CkukW 1,p (Ω) . |u(x)|p dσ(x) kukLp (∂Ω) := ∂Ω On en déduit par densité l’existence d’opérateurs de trace : Théorème 7.14 (Théorème de trace) Soit p ∈ [1, ∞[ et Ω un ouvert régulier de Rd , alors il existe un opérateur (dit de trace) γ linéaire continu de W 1,p (Ω) dans Lp (∂Ω) tel que γu = u|∂Ω pour tout u ∈ Cc1 (Rd ). Par la suite nous noterons simplement γu = u|∂Ω pour u ∈ W 1,p (Ω). En raisonnant par densité, on peut en déduire diverses formules d’intégration par parties pour des fonctions W 1,p (Ω). Par exemple, si u = (u1 , ..., ud ) avec chaque ui ∈ W 1,1 (Ω), on a la formule de Stokes : Z Z u · ndσ. div(u) = ∂Ω Ω Ou encore, si u et v dont dans H 1 (Ω), on a la formule d’intégration par parties Z Z Z (uv)ni dσ. ∂i u v = − u ∂i v + Ω ∂Ω Ω Pour 1 ≤ p < ∞ on note W01,p (Ω) l’adhérence de Cc1 (Ω) (ou de D(Ω)) dans (W 1,p (Ω), k.kW 1,p (Ω) ). On munit W01,p de la norme de W 1,p , comme, par définition, W01,p est fermé dans W 1,p (et donc aussi faiblement fermé par convexité), c’est un espace de Banach pour la norme W 1,p . On note aussi H01 := W01,2 . On sait déja que si Ω = Rd , Cc1 (Rd ) est dense dans W 1,p (Rd ) de sorte que W01,p (Rd ) = W 1,p (Rd ). Proposition 7.6 (Inégalité de Poincaré) Soit p ∈ [1, ∞[ et Ω un ouvert borné dans une direction. Alors il existe une constante C telle que kukLp (Ω) ≤ Ck∇ukLp (Ω) , ∀u ∈ W01,p (Ω) 161 Preuve: Sans perte de généralité supposons que Ω ⊂ {x ∈ Rd : |x1 | ≤ M }. Soit u ∈ Cc1 (Ω) (prolongé par 0 en dehors de Ω), pour x ∈ Ω on a Z 1 ∂1 u(x − 2tM e1 )dt u(x) = u(x) − u(x − 2M e1 ) = 2M 0 et donc Z Z Z p p |u| ≤ (2M ) Ω Ω 0 1 Z  p |∇u|p . |∂1 u(x − 2tM e1 )| dt dx ≤ (2M ) p Ω On conclut par densité de Cc1 (Ω) dans W01,p (Ω). ✷ On peut montrer que l’inégalité de Poincaré est encore vraie dans le cas où |Ω| est fini. L’inégalité de Poincaré implique en particulier que sur W01,p (Ω), 1,p 1 u v) 7→ R 7→ k∇ukLp (Ω) est équivalente à la norme W (Ω) et que sur H0 (Ω), (u, 1 ∇u · ∇v est un produit scalaire et que la norme qu’il définit sur H (Ω) est 0 Ω 1 équivalente à la norme H (Ω). L’exercice suivant permet de relier les espaces W01,p (Ω) aux opérateurs de trace : W01,p (Ω) est simplement le noyau de l’opérateur de trace γ : W 1,p (Ω) → Lp (∂Ω). Exercice 7.16 Soit Ω un ouvert régulier de Rd , p ∈ [1, ∞[ et u ∈ W 1,p (Ω). Montrer que u ∈ W01,p (Ω) si et seulement si u|∂Ω = 0. Exercice 7.17 Soit Ω un ouvert régulier de Rd , p ∈ [1, ∞[ et u ∈ W 1,p (Ω). Montrer que u ∈ W01,p (Ω) si et seulement si la fonction qui prolonge u par 0 en dehors de Ω appartient à W 1,p (Rd ). Exercice 7.18 Soit Ω un ouvert régulier de Rd , p ∈]1, ∞[ et u ∈ Lp (Ω). Montrer les équivalences entre : 1. u ∈ W01,p (Ω), 2. il existe C tel que Z u ∂i ϕ ≤ CkϕkLp′ , ∀ϕ ∈ Cc (Rd ), ∀i = 1, ..., d. Ω Exercice 7.19 Soit Ω un ouvert régulier de Rd tel que ∂Ω soit borné, p ∈ [1, ∞[ et u ∈ W 1,p (Ω). Montrer que γ(u± ) = (γu)± et en déduire que si γu = u|∂Ω ≥ 0 alors u− ∈ W01,p (Ω). 162 7.5 Formulation variationnelle de quelques problèmes aux limites Soit Ω un ouvert régulier de Rd , on cherche à résoudre le problème elliptique linéaire avec condition de Dirichlet homogène :  −∆u + u = f dans Ω, u = 0 sur ∂Ω, Une solution classique est une fonction u ∈ C 2 (Ω) vérifiant ponctuellement l’EDP précédente et la condition de Dirichlet sur ∂Ω. Evidemment, l’existence d’une solution classique nécessite que f soit continue. Or, nous allons autoriser le cas f ∈ L2 (Ω) (et même f ∈ H −1 (Ω) où H −1 (Ω) désigne le dual topologique de H01 (Ω)). Pour f ∈ H −1 (Ω), une solution faible du problème précédent est par définition une fonction u ∈ H01 (Ω) vérifiant Z Z (7.8) ∇u · ∇ϕ + uϕ = f (ϕ), ∀ϕ ∈ H01 (Ω). Ω Ω Il est facile de voir qu’une solution faible est une fonction H01 solution de l’EDP au sens des distributions. On vérifie immédiatement, en utilisant la formule de Green que toute solution classique est solution faible (en supposant en plus Ω borné de sorte que cette solution classique est bien H01 ) et que si une solution faible est régulière (disons C 2 (Ω)) alors c’est une solution classique. L’existence et l’unicité d’une solution faible est ici simplement assurée par le théorème de Riesz. En effet, dire que u ∈ H01 est solution faible signifie exactement que u représente f , étant entendu que H01 est muni du produit scalaire usuel de H 1 : Z Z ∇u · ∇ϕ + uϕ. hu, ϕi := Ω Ω De plus, on vérifie immédiatement que u est solution faible si et seulement si J(v) ≥ J(u), ∀v ∈ H01 , avec J(v) := 1 hv, vi − f (v). 2 (7.9) On a donc : Théorème 7.15 Soit f ∈ H −1 (Ω), l’équation −∆u + u = f dans Ω, u = 0 sur ∂Ω, (7.10) possède une unique solution faible u ∈ H01 . De plus u est l’unique minimiseur de la fonctionnelle J définie par (7.9) sur H01 . 163 Si l’on note T l’opérateur de H −1 (Ω) → L2 (Ω) qui à f ∈ H −1 (Ω) associe u ∈ H01 (Ω) ⊂ L2 (Ω) la solution de (7.10), on a kT f kH 1 = kf kH −1 . Si en plus Ω est borné comme l’injection de H 1 dans L2 est compacte, on en déduit que T est un opérateur compact de H −1 (Ω) dans L2 (Ω). Exercice 7.20 Soit Ω un ouvert borné et régulier de Rd et f ∈ H −1 . Montrer que l’équation −∆u = f dans Ω avec condition de Dirichlet homogène possède une unique solution faible dans H01 . Montrer que pour λ > 0 assez petit (quantifier), il en est de même pour : −∆u − λu = f dans Ω, u = 0 sur ∂Ω. L’exemple précédent illustre de manière simple comment la formulation faible (ou variationnelle) permet de montrer l’existence et l’unicité (et caractérisation variationnelle c’est à dire en terme de minimisation d’une fonctionnelle d’énergie) d’une solution faible ; on a trivialisé la question en utilisant le théorème de Riesz, pour des cas un peu plus généraux, c’est le théorème de Lax-Milgram, que nous rappelons ci-dessous, qui permet de prouver l’existence et l’unicité d’une solution faible. Théorème 7.16 (Théorème de Lax-Milgram) Soit H un espace de Hilbert, a une forme bilinéaire continue et coercive (c’est à dire telle qu’il existe C > 0 tel que a(v, v) ≥ Ckvk2 = C hv, vi pour tout v ∈ H) et f ∈ H ′ . Il existe un unique u ∈ H vérifiant a(u, ϕ) = f (ϕ), ∀ϕ ∈ H. Si de plus a est symétrique alors u est l’unique minimiseur sur H de la fonctionnelle J définie par : 1 J(v) := a(v, v) − f (v), ∀v ∈ H. 2 A titre d’application immédiate, considérons Ω ouvert borné et régulier de Rd , f ∈ H −1 et le problème de Dirichlet :  X  − ∂j (aij ∂i u) + a0 u = f dans Ω,  1≤i,j≤d u = 0 sur ∂Ω, 164 avec a0 ∈ L∞ , a0 ≥ 0, les fonctions aij ∈ L∞ satisfaisant la condition d’ellipticité : il existe C > 0 tel que pour presque tout x, pour tout p ∈ Rd on a X aij (x)pi pj ≥ C|p|2 . (7.11) i,j Une solution faible est par définition une fonction u ∈ H01 (Ω) telle que Z Z X (7.12) aij ∂i u ∂j ϕ + a0 uϕ = f (ϕ), ∀ϕ ∈ H01 . Ω Ω i,j Au vu de la formulation variationnelle précédente, il est naturel de définir la forme bilinéaire Z X Z a(u, ϕ) := aij ∂i u ∂j ϕ + a0 uϕ, ∀u, ϕ ∈ H01 Ω i,j Ω les coefficients a0 , aij étant bornés, a est continue sur H01 et la condition d’ellipticité (avec l’inégalité de Poincaré) assure que a est coercive sur H01 (noter aussi que si a0 ≥ α > 0 l’hypothèse que Ω est borné est inutile). Le théorème de Lax-Milgram permet immédiatement d’en déduire l’existence et l’unicité d’une solution faible. On peut également considérer le problème de Dirichlet non homogène :  −∆u + u = f dans Ω, u = g sur ∂Ω, ou plus généralement (pour des fonctions a0 et aij vérifiant les mêmes hypothèses que précédemment)  X  − ∂j (aij ∂i u) + a0 u = f dans Ω,  1≤i,j≤d u = g sur ∂Ω, où g ∈ H 1 (Ω) et la condition de Dirichlet u = g sur ∂Ω est à interpréter au sens des traces c’est à dire au sens γ(u − g) = 0 (ou ce qui revient au même u − g ∈ H01 (Ω)). Une solution faible des équations précédentes est alors par définition un élément u de K := g + H01 (Ω) = {v ∈ H 1 (Ω) : γ(u − g) = 0} vérifiant (7.8) dans le cas de la première équation et (7.8) dans le cas de la seconde. L’existence et l’unicité d’une solution faible découle alors du fait que K est un sous-espace affine fermé de H 1 et du théorème de Stampacchia que nous rappelons ici : 165 Théorème 7.17 (Théorème de Stampacchia) Soit H un espace de Hilbert, a une forme bilinéaire continue et coercive, K un convexe fermé non vide de H et f ∈ H ′ . Il existe un unique u ∈ K vérifiant a(u, ϕ − u) ≥ f (ϕ − u), ∀ϕ ∈ K. (7.13) Si de plus a est symétrique alors u est l’unique minimiseur sur K de la fonctionnelle J définie par : 1 J(v) := a(v, v) − f (v), ∀v ∈ H. 2 En effet, dans le cas K = g + H01 (Ω), (7.13) se réécrit simplement a(u, ϕ) = f (ϕ), ∀ϕ ∈ H01 (Ω) qui est la forme variationnelle (ou faible) des EDP’s considérées plus haut. Exercice 7.21 (Conditions de Neumann) Soit Ω ouvert borné et régulier de Rd et f ∈ H −1 , on appelle solution faible du problème de Neumann  −∆u + u = f dans Ω, ∂u = 0 sur ∂Ω, ∂n toute fonction u ∈ H 1 vérifiant : Z Z ∇u · ∇ϕ + uϕ = f (ϕ), ∀ϕ ∈ H 1 . Ω Ω Montrer qu’il existe une unique solution faible du problème de Neumann précédent et que toute solution classique est une solution faible. Donner une caractérisation de la solution du problème précédent en termes de minimisation. Donner une condition nécessaire et suffisante pour que l’équation  −∆u = f dans Ω, ∂u = 0 sur ∂Ω, ∂n admette une solution faible. Exercice 7.22 Soit Ω ouvert borné et régulier de Rd , a ∈ L∞ (Ω) (pas de condition de signe) b ∈ L∞ (Ω, Rd ) et f ∈ L2 (Ω), on s’intéresse ici à l’équation : −∆u + b · ∇u + au = f dans Ω, u = 0 sur ∂Ω, 166 (7.14) 1. Montrer que pour λ > 0 assez grand l’équation −∆u + b · ∇u + au + λu = f dans Ω, u = 0 sur ∂Ω, (7.15) possède une unique solution faible que l’on notera T f . 2. Montrer que T est un endomorphisme compact de L2 . 3. Montrer que pour f = 0 l’ensemble des solutions de (7.15) est un sous espace-vectoriel de dimension finie d de H01 (Ω). Montrer que (7.15) possède des solutions si et seulement si f ∈ F ⊥ avec F un sev de dimension d de L2 (Ω). 4. Que peut-on dire de plus dans le cas où a ≥ 0, b ∈ Cc1 (Ω) et div(b) ≤ 0 ? 5. En utilisant le principe du maximum, que peut-on dire de plus dans le cas où a ≥ 0 ? 7.6 Principe du maximum et régularité elliptique Théorème 7.18 (Principe du maximum, cas sans dérive) Soit Ω un ouvert régulier de Rd , a0 ≥ 0, a0 ∈ L∞ , aij ∈ L∞ vérifiant la condition d’ellipticité (7.11), f ∈ H −1 (Ω) et u ∈ H 1 (Ω) solution faible de l’équation X − ∂j (aij ∂i u) + a0 u = f dans Ω. (7.16) 1≤i,j≤d Si f ≥ 0 (au sens ϕ ≥ 0 ⇒ f (ϕ) ≥ 0) et si u|∂Ω ≥ 0 alors u ≥ 0 dans Ω. Preuve: Comme u|∂Ω ≥ 0, on sait que u− ∈ H01 (Ω) (voir exercice 7.19) on peut donc prendre u− comme fonction test dans (7.16) (on dit aussi ”multiplier l’équation” par u− ), il vient alors Z  X  aij ∂i u ∂j u− + a0 uu− = f (u− ) ≥ 0 Ω 1≤i,j≤d en utilisant les identités ∂i u ∂j u− = −∂i u− ∂j u− , uu− = −u2− et la condition d’ellipticité (7.11), il vient donc Z Z 2 |∇u− | − a0 u2− ≥ 0 −C Ω Ω 167 de sorte que ∇u− = 0 et donc u− = 0, ce qui prouve le résultat voulu. ✷ Le principe du maximum joue un rôle fondamental dans les EDP’s elliptiques notamment pour obtenir des résultats d’unicité et ce, même (surtout en fait !) dans le cadre non-linéaire. Considérons par exemple le cas où Ω est un ouvert borné de Rd et considérons l’équation non-linéaire (de type Hamilton-Jacobi) suivante : F (x, D2 u) + H(x, ∇u) + u = 0. (7.17) Où F et H sont des fonctions continues et F est elliptique au sens où si M1 ≥ M2 (au sens des matrices symétriques) alors F (x, M1 ) ≤ F (x, M2 ). Supposons maintenant que u et v soient des fonctions C 2 (Ω), que u soit une sous-solution de l’équation préceédente : F (x, D2 u) + H(x, ∇u) + u ≤ 0 sur Ω et que v en soit une sur-solution : F (x, D2 v) + H(x, ∇v) + v ≥ 0 sur Ω. On a alors le principe du maximum (ou principe de comparaison) suivant : u ≤ v sur ∂Ω ⇒ u ≤ v sur Ω. Pour démontrer ce principe de comparaison, il s’agit de montrer que maxΩ (u− v) ≤ 0, si le maximum est atteint sur ∂Ω il n’y a rien à démontrer. Supposons donc qu’il est atteint en un point x0 ∈ ∂Ω et supposons par l’absurde que u(x0 ) > v(x0 ). On a alors ∇u(x0 ) = ∇v(x0 ), D2 u(x0 ) ≤ D2 v(x0 ) et donc en utilisant l’ellipticité de F : u(x0 ) ≤ −F (x0 , D2 u(x0 )) − H(x0 , ∇u(x0 )) ≤ −F (x0 , D2 v(x0 )) − H(x0 , ∇v(x0 )) = v(x0 ) ce qui constitue la contradiction recherchée. Notons que le principe de comparaison implique en particulier que le problème de Dirichlet : F (x, D2 u) + H(x, ∇u) + u = 0 dans Ω, u = g sur ∂Ω (7.18) admet au plus une solution classique. Cependant, le problème (7.18) n’ayant généralement pas de solution classique, il faut recourir à la notion de solution de viscosité développé par Michael Crandall et Pierre-Louis Lions (voir [3]). L’argument précédent valable pour les solutions classiques donne l’intuition que le principe du maximum devrait rester valable pour des équations linéaires ”avec un terme en ∇u” (ou terme de dérive). On a en effet : 168 Théorème 7.19 (Principe du maximum pour des équations elliptiques avec terme de dérive) Soit Ω un ouvert borné (pour simplifier) et régulier de Rd , a0 ≥ 0, a0 ∈ L∞ , ai ∈ L∞ , aij ∈ L∞ vérifiant la condition d’ellipticité (7.11), f ∈ H −1 (Ω) et u ∈ H 1 (Ω) solution faible de l’équation − X ∂j (aij ∂i u) + d X ai ∂i u + a0 u = f dans Ω. (7.19) i=1 1≤i,j≤d Si f ≥ 0 (au sens ϕ ≥ 0 ⇒ f (ϕ) ≥ 0) et si u|∂Ω ≥ 0 alors u ≥ 0 dans Ω. Preuve: Soit m := essinf u et supposons par l’absurde que m < 0 soit alors m < k < 0 et vk := (u − k)− on a alors vk ∈ H01 (Ω) et en multipliant (7.19) par vk et en utilisant la condition d’ellipticité, on obtient Z Z Z 2 |∇vk | ≤ C |∇vk ||vk | = C |∇vk ||vk | ≤ Ck∇vk kL2 kχAk vk kL2 Ω Ω Ak avec Comme vk ∈ H01 Ak := {∇u 6= 0, u < k}. et vk 6= 0 il vient donc k∇vk kL2 ≤ CkχAk vk kL2 soit maintenant q = 2∗ si d ≥ 3 et +∞ > q > 2 quelconque si d = 2, il résulte de l’inégalité de Poincaré, du fait que H 1 ⊂ Lq avec injection continue et de l’inégalité de Hölder que l’on a alors kvk kLq ≤ CkχAk vk kL2 ≤ Ckvk kLq |Ak |1/2−1/q . Ce qui implique que pour tout k > m on a |Ak | ≥ α > 0 et ceci est absurde car |Ak | → 0 quand k → m+ (c’est clair pour m = −∞ car u ∈ L2 et pour m > −∞, on a |Ak | → |{∇u 6= 0, u = m}| = 0 d’après l’exercice 7.12). ✷ On en déduit immédiatement : Corollaire 7.4 Sous les hypothèses du théorème 7.19, le problème de Dirichlet : − X 1≤i,j≤d ∂j (aij ∂i u) + d X ai ∂i u + a0 u = f dans Ω, u = 0 sur ∂Ω i=1 possède une unique solution pour tout f ∈ L2 (Ω). 169 (7.20) Preuve: On déduit de l’hypothèse d’ellipticité qu’il existe λ > 0 tel que la forme bilinéaire continue Z X  X aij ∂i u∂j ϕ + a(u, ϕ) := ai ∂i u ϕ + (a0 + λ)uϕ , ∀u, v ∈ H 1 Ω ij i soit coercive sur H 1 . Il résulte alors du théorème de Lax-Milgram que pour tout f ∈ L2 (Ω), l’équation − X 1≤i,j≤d ∂j (aij ∂i u) + d X ai ∂i u + (a0 + λ)u = f dans Ω, u = 0 sur ∂Ω (7.21) i=1 possède une unique solution que nous noterons T f . On vérifie sans peine que T est un endomorphisme compact de L2 . De plus, par construction u est solution faible de (7.20) si et seulement si u = T (f + λu) ce qui se réecrit encore (I − λT )v = f avec v = f + λu. Il découle alors du principe du maximum que (I − λT ) est injective. On déduit donc de l’alternative de Fredholm que (I − λT ) est surjective et ainsi le résultat cherché. ✷ Nous allons maintenant nous intéresser à la régularité des solutions faibles. Dans le cas Ω = Rd , il est facile de voir, par transformée de Fourier comme au chapitre 2, que si f ∈ L2 , la solution faible de −∆u + u = f est en fait H 2 . On a même mieux : kukH 2 ≤ Ckf kL2 pour une certaine constante C. On peut également itérer l’argument : f ∈ H 2 ⇒ u ∈ H 4 ,...., f ∈ H m ⇒ u ∈ H m+2 . En particulier, si f ∈ H m pour tout m alors u ∈ H m pour tout m ce qui entraine en particulier que u ∈ C ∞ . Nous allons maintenant généraliser ces résultats de régularité elliptique à des équations (linéaires) plus générales (avec des coefficients variables, ce qui rend inadaptée la résolution en Fourier) et pour des domaines plus généraux. Afin d’éviter les difficultés liées à la géométrie du domaine, nous allons nous limiter au cas de l’espace entier ou du demi-espace : Théorème 7.20 Supposons que Ω = Rd ou Ω = Rd−1 × R∗+ , soit aij ∈ W 1,∞ (Ω) vérifiant la condition d’ellipticité (7.11), f ∈ L2 (Ω) et u ∈ H01 (Ω) solution faible de l’équation X − ∂j (aij ∂i u) + u = f dans Ω. (7.22) 1≤i,j≤d 170 alors u ∈ H 2 (Ω) et il existe une constante C (indépendante de f !) telle que : kukH 2 (Ω) ≤ Ckf kL2 . Preuve: Commençons par traiter le cas Ω = Rd . Pour h ∈ Rd \ {0} et v ∈ H 1 , on note : τh v − v Dh v := ∈ H 1. |h| Multiplions l’équation par D−h (Dh u) il vient alors en utilisant les propriétés élémentaires de Dh et le fait que les aij sont Lipschitziennes : Z Z X f D−h (Dh u) = aij ∂i uD−h (Dh ∂j u) + uD−h (Dh u) Ω Ω 1≤i,j≤d = Z X Dh (aij ∂i u)(Dh ∂j u) + (Dh u)2 Ω 1≤i,j≤d ≥ Z X (τh aij )(∂i Dh u)(∂j Dh u) + Dh (aij )∂i uDh ∂j u Ω 1≤i,j≤d ≥C Z Ω |Dh ∇u|2 − C ′ k∇ukL2 kDh ∇ukL2 en remarquant ensuite que kDh ϕkL2 ≤ k∇ϕkL2 pour tout ϕ ∈ H 1 , on en déduit que kDh ∇ukL2 ≤ C(kf kL2 + k∇ukL2 ) ≤ Ckf kL2 on déduit alors de la proposition 7.3 que ∇u ∈ H 1 i.e. u ∈ H 2 et en prenant h = tei et en faisant tendre t vers 0 on obtient bien kukH 2 ≤ Ckf kL2 . Dans le cas où Ω est le demi-espace, il faut prendre garde à n’utiliser que des translations laissant invariantes Ω et la condition de Dirichlet, c’est à dire des h ∈ Rd−1 × {0} (des translations tangentielles). Pour de tels h, en procédant comme précédemment on obtient k∂ij ukL2 ≤ Ckf kL2 , i = 1, ..., d, j = 1, ...., d − 1. On estime enfin la dérivée seconde manquante ∂dd u en utilisant l’équation : avec ce qui précède on a add ∂dd u ∈ L2 et on conclut en utilisant le fait qu’avec (7.11) on a add ≥ C > 0. ✷ 171 Indiquons que par rectification par cartes locales, on peut aussi montrer (mais la preuve est un peu plus fastidieuse, consulter par exemple [2] ou [10]) que le résultat précédent est encore valable pour Ω ouvert borné de classe C 2 de Rd . Il est aussi facile d’adapter la preuve du cas Ω = Rd pour montrer des 2 résultats de régularité Hloc et en itérant l’argument d’obtenir des résultats de régularité d’ordre plus élevé, un exercice (bien noter la différence dans les hypothèses et aussi dans l’estimation par rapport au théorème précédent) pour s’en persuader : Exercice 7.23 Soit Ω un ouvert de Rd , aij ∈ W 1,∞ satisfaisant (7.11), ai ∈ L∞ , a0 ∈ L∞ , f ∈ L2 (Ω) et u ∈ H 1 (Ω) solution faible de : − X ∂j (aij ∂i u) + d X ai ∂i u + a0 u = f. i=1 1≤i,j≤d 2 Montrer que u ∈ Hloc (Ω) (i.e. u ∈ H 2 (ω) pour tout ω ⊂⊂ Ω) et que pour tout ω ⊂⊂ Ω il existe C = C(ω) telle qu’on ait l’estimation : kukH 2 (ω) ≤ C(kf kL2 (Ω) + kukL2 (Ω) ). Si on suppose en outre que aij , ai , a0 et f sont C ∞ montrer que u ∈ C ∞ (Ω). Terminons ce chapitre par une application importante du théorème de décomposition spectrale des opérateurs autoadjoints compacts : Théorème 7.21 Soit Ω un ouvert borné de Rd alors il existe une base Hilbertienne (un )n≥1 de L2 (Ω) et une suite (λn )n≥1 de réels vérifiant λn > 0 et λn → +∞ tels que un ∈ H01 (Ω) ∩ C ∞ (Ω) et −∆un = λn un . On appelle les λn les valeurs propres de −∆ sur Ω avec condition de Dirichlet et les fonctions un fonctions propres associées. Preuve: Soit T l’endomorphisme de L2 (Ω) qui à f ∈ L2 (Ω) associe u solution faible de −∆u = f, u ∈ H01 (Ω). Nous savons déjà que T est un endomorphisme compact de L2 . Soit f et g dans L2 (Ω) et u := T f , v := T g on a alors Z Z Z vf = hT g, f i ∇u∇v = ug = hT f, gi = Ω Ω Ω 172 ce qui montre que T est autoadjoint. On a également Z |∇u|2 ≥ 0, ∀f ∈ L2 (Ω) hT f, f i = Ω et ker(T ) = {0}. Il résulte alors du théorème 4.8 que L2 (Ω) possède une base hilbertienne (un )n≥1 de vecteurs propres de T associés à une suite (µn )n≥1 de valeurs propres vérifiant µn > 0 et µn → 0 quand n → ∞. On vérifie immédiatement que −∆un = λn un avec λn = 1 . µn Enfin comme −∆un ∈ L2 (Ω), il résulte des résultats de régularité elliptique vus précédemment que un ∈ H 2 (ω) pour tout ω ⊂⊂ Ω, en itérant l’agument on a un ∈ H 2m (ω) pour tout m ∈ N∗ et donc un ∈ C ∞ (Ω). ✷ Notons que si l’on dispose des fonctions propres de −∆ sur Ω (dans certains domaines simples, ces fonctions propres sont effectivement connues explicitement), alors la solution de −∆u = f, u ∈ H01 (Ω) est explicite et donnée par : u= ∞ X hf, un i n=1 λn un . La connaissance des fonctions propres de −∆ sur Ω permet également de résoudre simplement l’équation de la chaleur : ∂t u − ∆u = 0, u|t=0 = u0 , u|∂Ω = 0 par u(t, x) = ∞ X n=1 e−λn t hu0 , un i un (x). 173 Chapitre 8 Calcul des variations et EDP’s elliptiques non-linéaires Nous avons vu au chapitre précédent que sur une domaine régulier borné Ω, résoudre :  −∆u + u = f dans Ω, u = 0 sur ∂Ω, revenait à minimiser sur H01 la fonctionnelle  Z 1 2 2 |∇v| + v − f (v). J(v) := 2 Ω Une autre manière de formuler cette équivalence est de dire que les solutions faibles de l’EDP ci-dessus sont des points critiques de la fonctionnelles J. Notons aussi que J étant convexe, il y a équivalence entre être point critique de J et minimiser J et comme J est strictement convexe il y a aussi unicité du point critique. L’EDP ci-dessus apparait ainsi comme l’équation J ′ (u) = 0 : l’équation d’Euler-Lagrange correspondant à la condition du premier ordre de minimisation de J. De nombreuses EDP’s intéressantes sont des équations de points critiques de certaines fonctionnelles d’énergie. Nous allons exploiter ce lien dans ce chapitre en nous limitant aux méthodes de minimisation pour des EDP’s qui apparaissent naturellement comme équation de point critique (Euler-Lagrange) de fonctionnelles d’énergie. Mentionnons qu’il existe d’autres méthodes (mountain-pass, linking..) pour montrer l’existence de point critiques et donc de solutions aux EDP’s de type Euler-Lagrange. Nous aborderons aussi dans ce chapitre les méthodes de point-fixe pour l’existence de solutions à certaines EDP’s non-linéaires. Là aussi, il ne s’agit que d’une introduction au sujet et de nombreuses autres méthodes non variationnelles existent : méthodes de monotonie, de sous et sur-solutions (voir par exemple [8] pour un aperçu), méthodes d’inversion locale, de bifurcation.... 174 8.1 Méthode directe du calcul des variations Soit Ω un ouvert borné régulier de Rd , p ∈]1, +∞[ et considérons le problème de minimisation suivant Z   J(u), avec J(u) := F (∇u(x)) + G(u(x)) dx (8.1) inf 1,p u∈W0 (Ω) Ω Théorème 8.1 Supposons que F et G soient continues, que G soit minorée, qu’il existe A > 0 et B ∈ R tels que F vérifie (la condition de coercivité) : F (z) ≥ A|z|p + B, ∀z ∈ Rd et que F soit convexe sur Rd . Alors (8.1) possède au moins une solution. Preuve: Soit (un )n une suite minimisante de (8.1), c’est à dire une suite de W01,p (Ω) telle que J(un ) → inf(8.1). Il résulte de l’hypothèse de coercivité et du fait que G soit minorée que k∇un kLp est bornée et donc, avec l’inégalité de Poincaré on en déduit que (un )n est bornée dans W 1,p (Ω). Comme W 1,p (Ω) est réflexif, on peut supposer quitte à extraire une sous-suite, que (un ) converge faiblement vers u ∈ W 1,p (Ω). Comme W01,p (Ω) est faiblement fermé dans W 1,p (Ω), on a u ∈ W01,p (Ω). L’injection de W 1,p (Ω) dans Lp (Ω) étant compacte, on peut supposer que un → u dans Lp (Ω) et p.p., et l’on a ∇un ⇀ ∇u dans Lp . Le lemme de Fatou et le fait que G soit minorée permettent d’en déduire que Z Z G(u). G(un ) ≥ lim inf Ω Ω R Le même argument montre que v ∈ W 1,p (Ω) 7→ Ω F (∇v) est sci pour la topologie forte de W 1,p (Ω), comme F est convexe, cette fonctionnelle est convexe et donc aussi sci pour la topologie faible de W 1,p (Ω). On a donc Z Z F (∇u). F (∇un ) ≥ lim inf Ω Ω Ceci permet d’en conclure que u est solution de (8.1). ✷ Notons que l’hypothèse de convexité de F est essentielle dans la preuve précédente et ne peut être affaiblie, comme le montre le contre-exemple suivant dû à Bolza. Considérons Z 1  (1 − u̇2 )2 + u2 , u ∈ W01,4 (]0, 1[). inf J(u) := 0 175 Il est facile de construire une suite (un ) telle que J(un ) → 0 et donc d’en déduire que l’infimum du problème est 0 mais ce dernier n’est clairement pas atteint. Notons également que si en plus, J est strictement convexe (ce qui est le cas si par exemple F et G sont strictement convexes) alors (8.1) possède un unique minimiseur (l’argument est classique : si u1 et u2 sont deux minimiseurs distincts, (u1 + u2 )/2 a une valeur strictement plus petite de J, ce qui est absurde). Supposons maintenant que F et G soient de classe C 1 et qu’il existe une constante C telle que ∇F et G′ vérifient les conditions de croissance |∇F (z)| ≤ C(|z|p−1 + 1), ∀z ∈ Rd et, si p ≤ d : |G′ (u)| ≤ C(|u|q−1 + 1), ∀u ∈ R avec q > 1 tel que W 1,p (Ω) ⊂ Lq (Ω). Théorème 8.2 Sous les hypothèses précédentes, toute solution de (8.1) est solution faible de l’équation d’Euler-Lagrange : − div(∇F (∇u)) + G′ (u) = 0 dans Ω, u|∂Ω = 0 c’est à dire que Z Ω ∇F (∇u) · ∇ϕ + Z Ω G′ (u)ϕ = 0, ∀ϕ ∈ W01,p (Ω). (8.2) (8.3) Preuve: Soit ϕ ∈ W01,p (Ω) et 1 > ε > 0, on a  1 J(u + εϕ) − J(u) ≥ 0 ε (8.4) On a d’abord ηε := ε−1 (F (∇u + ε∇ϕ) − F (∇u)) → ∇F (∇u) · ∇ϕ p.p. quand ε → 0+ . Par ailleurs, l’inégalité des accroissement finis et l’hypothèse de croissance sur ∇F donnent : |ηε | ≤ |∇ϕ| sup [∇u,∇u+ε∇ϕ] |∇F | ≤ C|∇ϕ|(|∇u| + |∇ϕ|)p−1 ∈ L1 . Avec le théorème de convergence dominée, on en déduit que Z Z ∇F (∇u) · ∇ϕ. lim+ ηε = ε→0 Ω Ω 176 Exactement de la même manière, on obtient Z Z 1 G′ (u)ϕ lim (G(u + εϕ) − G(u)) = ε→0+ ε Ω Ω et donc en passant à la limite dans (8.4), on en déduit Z Z ∇F (∇u) · ∇ϕ + G′ (u)ϕ ≥ 0 Ω Ω changeant ϕ en −ϕ, on obtient que l’inégalité précédente est en fait une égalité, ce qui permet de conclure. ✷ Les hypothèses de croissance sur les dérivées sont un peu lourdes mais elles sont néanmoins importantes. Sans elles, il se pourrait qu’il existe des minimiseurs qui ne soient pas solution de l’équation d’Euler-Lagrange. Ce phénomène (un peu curieux) est appelé phénomène de Lavrentiev (voir par exemple [4]). Exercice 8.1 Soit d ≥ 3, Ω la boule unité de Rd , 1 < q < 2∗ , f ∈ L2 (Ω) à symétrie radiale (i.e. |x| = |y| ⇒ f (x) = f (y)), montrer que −∆u + |u|q−2 u = f, dans Ω, u ∈ H01 (Ω) admet une unique solution et que celle-ci est à symétrie radiale. Exercice 8.2 Soit Ω un ouvert borné régulier de Rd , p ∈]1, +∞[ et f ∈ ′ Lp (Ω) montrer que − div(|∇u|p−2 ∇u) + |u|p−2 u = f possède une unique solution dans u0 +W 1,p (Ω) pour tout u0 ∈ W 1,p (Ω). Même question pour l’équation − div(|∇u|p−2 ∇u) − ε|u|p−2 u = f avec ε > 0 assez petit. Exercice 8.3 Soit Ω un ouvert borné régulier de Rd , u0 ∈ H01 (Ω), f ∈ C(R, R) décroissante et vérifiant |f (u)| ≤ C(|u|+1) pour tout u ∈ R. Montrer que −∆u = f (u), u ∈ u0 + H01 (Ω) possède une unique solution. 177 Exercice 8.4 Soit F convexe : Rd → Rd vérifiant pour des constantes strictement positives M et m : M (|p|2 + 1) ≥ F (p) ≥ m(|p|2 − 1), ∀p ∈ Rd . Soit Ω un ouvert borné régulier de Rd et f ∈ L2 (Ω), montrer que Z Z (F (∇u) − f u) = max − F ∗ (σ(x))dx. min 1 u∈H0 (Ω) Ω σ∈L2 (Ω,Rd ) div(σ)=−f Ω Exercice 8.5 Soit Ω un ouvert borné régulier de Rd , montrer que le problème  inf k∇ukL2 (Ω) , u ∈ H01 (Ω), kukL2 (Ω) = 1 admet des solutions. Donner une EDP vérifiée par ces solutions. Quel est le lien entre la valeur de ce problème (i.e. la valeur de l’infimum), la première valeur propre du laplacien-Dirichlet sur Ω et la meilleure constante dans l’inégalité de Poincaré ? Exercice 8.6 Soit Ω un ouvert borné régulier de Rd , montrer que l’équation : −∆u + u = cos(u), u|∂Ω = 0 possède une unique solution H01 (Ω) et que celle-ci est de classe C ∞ . 8.2 Théorèmes de point-fixe et applications d d Notons B la boule euclidienne unité fermée de Rd et S d−1 = ∂B . On commence cette section par le théorème de non-rétraction (C 1 ) de la boule sur la sphère : d Théorème 8.3 Il n’existe pas d’application C 1 f : B → S d−1 telle que f (x) = x pour tout x ∈ S d−1 . Preuve: d Supposons au contraire que f : B → S d−1 soit C 1 et telle que f (x) = x pour tout x ∈ S d−1 . Pour t ∈ (0, 1) et x ∈ B, posons ft (x) := (1 − t)x + tf (x). 178 d d Par convexité, ft (B ) ⊂ B . De plus, f est M -Lipschitz avec M = sup kf ′ (x)k x∈B d et ft′ − id = t(f ′ − id). Pour t ∈ (0, t0 ) avec t0 = (1 + M )−1 , ft′ (x) est donc inversible pour tout x ∈ B d . En particulier, avec le théorème de l’inversion locale, pour tout x ∈ B d , ft est un C 1 -difféomorphisme d’un voisinage de x sur un voisinage de ft (x), en particulier ft (B d ) est ouvert . Soit x et y dans d B , on a kft (x) − ft (y)k = k(1 − t)(x − y) + t(f (x) − f (y))k ≥ ((1 − t) − tM )kx − yk et comme 1 > t(1 + M ), on en déduit que ft is injective. Ainsi ft est un C 1 difféomorphisme de B d sur ft (B d ) ⊂ B d . Prouvons maintenant que ft (B d ) = B d , supposons par l’absurde qu’il existe y ∈ B d \ ft (B d ) et soit z ∈ ft (B d ), comme ft (B d ) est ouvert, yλ := z + λ(y − z) ∈ ft (B d ) pour λ > 0 assez petit. Soit maintenant λ∗ := sup{λ ∈ [0, 1] : yλ ∈ ft (B d )}, y ∗ := yλ∗ . d Il est clair que y ∗ ∈ ft (B ) prouvons que y ∗ ∈ ft (B d ). Si ce n’était pas le cas, on aurait y ∗ = ft (x) avec x ∈ S d−1 et comme ft (x) = x pour x ∈ S d−1 on aurait y ∗ = x ∈ S d−1 contredisant le fait que (z, y] est inclus dans B d . Si λ∗ < 1, comme ft (B d ) est voisinage de y ∗ , yλ ∈ ft (B d ) pour λ > λ∗ proche de λ∗ contredisant ainsi la maximalité de λ∗ . Ainsi y ∗ = y ∈ ft (B d ). On a ainsi prouvé que pour t ∈ (0, t0 ), ft est un C 1 diffeomorphisme de B d dans elle-même. Posons maintenant pour tout t ∈ [0, 1] : Z det(Dft (x))dx P (t) = Bd Puisque ft est linéaire en t, P (t) est polynomial en t. Pour t ∈ (0, t0 ), par la formule du changement de variables, P (t) est la mesure de Lebesgue de ft (B d ) = B d , P (t) est donc constant sur (0, t0 ) et donc Z det(Df (x))dx = P (0) > 0. P (1) = Bd Mais det Df (x) = 0 partout (sinon par le théorème de l’inversion locale f (B d ) = S d−1 serait d’intérieur non vide), ce qui constitue la contradiction recherchée. ✷ On en déduit alors le théorème du point fixe de Brouwer : 179 Théorème 8.4 (Brouwer) Soit C une partie convexe compacte de Rd et soit f : C → C continue, alors il existe x ∈ C tel que f (x) = x. Preuve: d On va prouver le résultat dans le cas C = B et on déduit le cas général en remarquant que tout convexe compact est homéomorphe à une boule euclidienne de dimension finie. Supposons par l’absurde que f soit une application d continue de B dans elle-même sans point fixe d inf{kx − f (x)k, x ∈ B } > 0. (8.5) L’inégalité (8.5) restant satisfaite pour les fonctions suffisamment uniformément proches de f , on peut en outre supposer que f est de classe C 1 (en régularisant d par convolution). Pour x ∈ B soit g(x) l’intersection de S d−1 avec la demidroite {x + λ(f (x) − x), λ ≥ 0}. Avec (8.5), g est bien définie et de classe d C 1 . Par construction, g envoie B sur S d−1 et g(x) = x pour tout x ∈ S d−1 , ce qui contredit la conclusion du Théorème 8.5. ✷ Il va sans dire que la généralité du Théorème de Brouwer en fait un outil extrêmement puissant pour démontrer des résultats d’existence (en dimension finie toutefois). A titre d’exercice applicatif, on démontrera, le résultat suivant : Théorème 8.5 (Perron-Frobenius) Soit A ∈ Mn (R) une matrice à coefficients strictement positifs, alors A possède un vecteur propre à coordonnées strictement postives. d Exercice 8.7 Soit F ∈ C 0 (B , Rd ) tel que F (x) · x ≥ 0 pour tout x ∈ S d−1 . Montrer qu’il existe x ∈ B tel que F (x) = 0. En dimension infinie, le Théorème du point fixe de Schauder est très utile pour les EDP’s non linéaires et s’énonce comme suit Théorème 8.6 (Schauder) Soit C une partie convexe fermée bornée d’un espace de Banach E et f : C → C continue et telle que f (C) soit relativement compacte, alors il existe x ∈ C tel que f (x) = x. Preuve: Comme f (C) est relativement compacte, pour tout ε > 0, il existe Nε et ε ε des points xε1 , ..., xεN de C tels que : f (C) ⊂ ∪N i=1 B(f (xi ), ε) . Soit Eε le 180 sous espace vectoriel engendré par {f (xε1 ), ..., f (xεNε )}. Notons B c (f (xεi ), ε) le complémentaire de B(f (xεi ), ε) et posons pour tout x ∈ C et i : d(f (x), B c (f (xεi ), ε)) αiε (x) := PNε ε c j=1 d(f (x), B (f (xj ), ε)) de sorte que αiε (x) > 0 ssi kf (x) − f (xεi )k < ε. Soit Cε := C ∩ Eε et pour x ∈ Cε , posons Nε X fε (x) := αiε (x)f (xεi ) i=1 par convexité de C, fε (Cε ) ⊂ Cε et fε . Comme Eε est de dimension finie et Cε est convexe compact dans Eε , on déduit du Théorème de Brouwer qu’il existe xε ∈ Cε tel que xε = fε (xε ). Par construction, pour chaque ε, xε appartient à l’enveloppe convexe fermée de f (C), co(f (C)). Grâce au Lemme 8.1 ci-dessous, co(f (C)) est compact, en prenant ε = 1/n, xn := xεn , on peut donc, quitte à passer à une suite extraite, supposer que xn converge vers x ∈ co(f (C)) ⊂ C. Montrons que x est un point fixe de f . Pour tout n, on a f (x) − fεn (xn ) = Nεn X i=1 αiεn (xn )(f (x) − f (xn ) + f (xn ) − f (xεi n )) (8.6) Dans la somme précédente il n’y a que des termes tels que kf (xn )−f (xεi n )k < εn et donc kf (x) − fεn (xn )k ≤ kf (x) − f (xn )k + εn . Ceci implique que fεn (xn ) converge vers f (x). On en déduit donc que f (x) = x en passant à la limite dans fεn (xn ) = xn . ✷ Dans la preuve précédente, on a utilisé le résultat suivant : Lemme 8.1 Soit E un espace de Banach et K une partie relativement compacte de E, alors co(K) est compact. Preuve: Par complétude, il suffit de montrer que co(K) est précompact. Soit ε > 0, prouvons que co(K) peut être recouvert par un nombre fini de boules ouvertes de rayon ε. Comme K est relativement compacte, il existe p et x1 , ..., xp dans K tels que K ⊂ ∪pi=1 B(xi , ε/3). Soit C := co{x1 , ..., xp }, par compacité de C, il existe l et y1 , ...., yl dans C tels que C ⊂ ∪lj=1 B(yj , ε/3). Soit z ∈ co(K) z= m X k=1 181 λ k ak pour des ak dans K et des λk positifs de somme 1. On écrit ak sous la forme ε ak = xik + vk , pour un ik ∈ {1, ...., p}, et vk ∈ B(0, 1). 3 On a alors z= On remarque que m X m X ε λk xik + v, v := λk vk ∈ B(0, 1). 3 k=1 k=1 x= m X k=1 λk xik ∈ C de sorte qu’il existe j tel que x ∈ B(yj , ε/3) et donc z ∈ B(yj , 2ε/3). Ceci montre que co(K) ⊂ ∪lj=1 B(yj , 2ε/3) et donc co(K) ⊂ ∪lj=1 B(yj , ε). ✷ Le théorème du point fixe de Schauder est un outil puissant pour montrer l’existence de solutions à certaines EDP’s non linéaires. Illustrons celà sur l’exemple de l’équation quasi-linéaire suivante : − div(A(x, u)∇u) = f (x), dans Ω, u = 0 sur ∂Ω (8.7) on suppose ici que Ω est borné et régulier, que f ∈ H −1 , que A ∈ C(Ω × R), que A est bornée et vérifie la condition d’uniforme ellipticité qu’il existe C > 0 telle que hA(x, u)q, qi ≥ C|q|2 , ∀(x, u, q) ∈ Ω × R × Rd × Rd . Pour tout v ∈ L2 l’équation − div(A(x, v)∇u) = f, u = 0 sur ∂Ω (8.8) possède une unique solution faible u ∈ H01 (Ω) ⊂ L2 (Ω) on note u = T v cette solution et on cherche donc un point fixe de T (T : L2 → L2 ). Soit v ∈ L2 , u := T v est caractérisé par Z hA(x, v)∇u, ∇ϕi = hf, ϕi , ∀ϕ ∈ H01 Ω avec l’hypothèse d’ellipticité sur A on a donc, en prenant ϕ = u comme fonction-test ci-dessus : kukH01 := k∇ukL2 ≤ 1 kf kH −1 C et donc T (L2 ) est inclus dans la boule B fermée de centre 0 et de rayon C −1 kf kH −1 dans H01 , comme l’injection de H01 dans L2 est compacte, B est 182 relativement compacte dans L2 . On remarque ensuite que T : L2 → L2 est continue, en effet si vn → v dans L2 et un = T vn , en posant An := A(x, vn ), on a : Z hAn ∇un , ∇ϕi = hf, ϕi , ∀ϕ ∈ H01 Ω comme (un ) est bornée dans H01 on peut à une extraction près supposer que (un ) converge faiblement dans H01 et fortement dans L2 vers u ∈ H01 , on peut aussi supposer à une extraction près que vn converge p.p. vers v et donc que An converge p.p. et dans L2 vers A := A(x, v), on a alors Z hA∇u, ∇ϕi = hf, ϕi , ∀ϕ ∈ H01 Ω ce qui montre que u = T v et, par compacité, que toute la suite (un ) converge vers T v de sorte que T est continue. Avec l’inégalité de Poincaré, B est inclus dans une boule fermée B ′ de L2 , T (B ′ ) ⊂ B ⊂ B ′ et T (B ′ ) est relativement compacte dans L2 . On déduit donc du théorème de Schauder que T admet un point fixe dans B ′ et donc que l’EDP (8.7) possède au moins une solution. Exercice 8.8 Soit Ω un ouvert borné régulier de Rd et b une fonction 1Lipschitzienne de Rd dans R, montrer que −∆u + u = b(∇u), u|∂Ω = 0 possède une et une seule solution dans H01 (Ω). Montrer que si en plus, b est C ∞ alors cette solution est C ∞ . 183 Bibliographie [1] R. Adams, Sobolev Spaces, Academic Press, New York, 1975. [2] H. Brezis, Analyse fonctionnelle. Théorie et applications, Masson, Paris, 1983. [3] M. Crandall, P.-L. Lions, H. Ishii. User’s guide to viscosity solutions of second order partial differential equations. Bull. Amer. Math. Soc. (N.S.) 27 (1992), no. 1, 1-67. [4] B. Dacorogna, Direct Methods in the Calculus of Variations, SpringerVerlag, 1989. [5] K. Deimling, Nonlinear functional analysis. Springer-Verlag, Berlin, 1985. [6] N. Dunford, J. Schwartz, Linear operators, Wiley, 1971. [7] I. Ekeland, R. Temam, Convex Analysis and Variational Problems, North-Holland, 1976. [8] L.C. Evans, Partial differential equations. Graduate Studies in Mathematics, 19. American Mathematical Society, Providence, RI, 1998. [9] L.C. Evans, R.F Gariepy, Measure theory and fine properties of functions. Studies in Advanced Mathematics. CRC Press, Boca Raton, FL, 1992. [10] D. Gilbarg, N. trudinger, Elliptic Partial Differential Equations of Second Order, Springer-Verlag, Heidelberg, classics in Mathematics, reprint of the 1998 edition. [11] S. Lang, Analyse réelle, Dunod, Paris, 1977. [12] E. Lieb, M. Loss, Analysis. Second edition. Graduate Studies in Mathematics, 14. American Mathematical Society, Providence, RI, 2001. [13] J.-L. Lions, Problèmes aux limites dans les équations aux dérivées partielles, Presses de l’Université de Montréal, 1965. [14] P.-L. Lions, The concentration-compactness principle in the Calculus of Variations (Ann. Inst. H. Poincaré Anal. Non Linéaire 1 (1984), no.2, 184 109-145, no.4, 223-283, et Rev. Mat. Iberoamericana 1 (1985), no.1, 145-201 et no.2, 45-121). [15] F. Paulin, Topologie et Calcul différentiel, cours de la FIMFA. [16] W. Rudin, Functional analysis. Second edition, New York, 1991. [17] W. Rudin, Analyse réelle et complexe, 3ème édition, Dunod, Paris, 1998. [18] L. Schwartz, Topologie générale et analyse fonctionnelle, Hermann, 1970. [19] C. Villani, Topics in optimal transportation, AMS, 2004. [20] C. Villani, Optimal Transport, Old and New, Springer-Verlag, 2009. [21] C. Villani, Cours d’intégration et d’analyse de Fourier, ENS Lyon, 2008, http ://www.umpa.ens-lyon.fr/∼cvillani/Cours/iaf-2007.html [22] K. Yosida, Functional Analysis, Springer Classics in Mathematics. [23] C. Zuily, Distributions et équations aux dérivées partielles, Hermann, Paris, 1986. 185