Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Maths

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 50

Université Paris-Dauphine

M1 MMD-MA
Année 2012-2013

Analyse fonctionnelle et équations aux dérivées partielles


P. Cardaliaguet

Les démonstrations comportant le signe (*) sont à connaı̂tre.

Bibliographie : “Analyse fonctionnelle” H. Brézis, Masson.

Table des matières


1 Les espaces de Hilbert et le théorème de Lax-Milgram 5
1.1 Espaces vectoriels normés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.1 Normes sur un espace vectoriel . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.2 Espaces complets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.3 Applications linéaires continues . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.1.4 Produits d’EVN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2 Espaces de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2.1 Produit scalaire et norme associée . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2.2 Le théorème de projection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.3 Orthogonalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.2.4 Bases hilbertiennes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2.5 Dualité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.2.6 Le théorème de Lax-Milgram . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2 Espaces de Sobolev et équations elliptiques linéaires. 22


2.1 Espaces de Sobolev sur un intervalle . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.1.1 Définitions et exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.1.2 Approximation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.1.3 L’espace W01,p (I) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.2 Application aux équations elliptiques en dimension 1 . . . . . . . . . . . . . . . . . . 28
2.2.1 Existence et unicité d’une solution faible . . . . . . . . . . . . . . . . . . . . . 29
2.2.2 Régularité de la solution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.3 Application au problème avec conditions au bord de type Neumann . . . . . . . . . 31
2.4 Espaces de Sobolev en dimension supérieure - formulation faible . . . . . . . . . . . . 32
2.4.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.4.2 Exemples de formulation faible . . . . . . . . . . . . . . . . . . . . . . . . . . 34

3 Distributions tempérées et transformée de Fourier 35


3.1 Classe de Schwartz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.2 Distributions tempérées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.3 Applications à l’équation de Laplace . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

1
A Brefs rappels d’intégration 43
A.1 Quelques résultats fondamentaux en intégration . . . . . . . . . . . . . . . . . . . . . 43
A.2 Les espaces Lp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
A.3 Intégration sur un espace produit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
A.4 Un peu de calcul intégral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
A.5 Produit de convolution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
A.6 Régularisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

2
Introduction
De nombreux modèles en physique, chimie, biologie et économie sont régis par des équations : ce
peut être des équations différentielles ordinaires, mais aussi des équations aux dérivées partielles.
L’objet de ce cours est d’introduire quelques techniques simples d’analyse des équations aux dérivées
partielles.

Equations différentielles ordinaires


Les équations différentielles ordinaires servent à modéliser des systèmes qui évoluent avec le temps.
L’inconnue y est une fonction—scalaire ou vectorielle—qui ne dépend que de la variable temporelle.
Voici quelques exemples :

• Modèle logistique : x(t) est la population à l’instant t.

x0 (t) = x(t)(α − x(t))

α = taux de reproduction.

• Modèle proie-prédateur (Lotka-Volterra) si x(t) est la population de proies et y(t) la popula-


tion des prédateurs,  0
x (t) = x(t)(α − y(t))
y 0 (t) = −y(t)(β − x(t))

• Plus généralement,
x0 (t) = f (t, x(t))


x(t0 ) = x0
où x(t) = (x1 (t), . . . , xN (t)) ∈ RN , t est le temps et f : R × RN × RN champs de vecteurs.
Enfin, t0 est l’instant initial du système, x0 ∈ RN la position initiale.

Méthodes de résolution :

1. Calcul explicite (modèle logistique) ou semi-explicite (courbes intégrales)

2. Calcul numérique : nécessite en général une bonne connaissance des conditions d’existence,
d’unicité, de stabilité des solutions.
Pour l’EDO donnée ci-dessus, on montre l’existence et l’unicité en utilisant un théorème
de point-fixe : supposons par exemple que f soit continue et lipschitzienne en espace uni-
formément en temps :

kf (t, x) − f (t, y)k ≤ Ckx − yk ∀x, y ∈ RN , t ∈ R

Posons X = C 0 ([t0 − δ, t0 + δ]) (où δ > 0). Alors l’application Φ : X → X définie par
Z t
Φ(x)(t) = x0 + f (s, x(s))ds ∀t ∈ [t0 − δ, t0 + δ]
t0

est contractante pour δ > 0 suffisamment petit. Comme X est un espace de Banach pour la
norme k · k∞ , on en déduit que Φ possède un unique point fixe.

3
Exemples d’équations aux dérivées partielles
Dans les équations aux dérivées partielles, l’inconnue est une fonction qui dépend de plusieurs
variables et l’équation lie les dérivées partielles de l’inconnue.
• Equation de transport : un fluide (1 dimensionnel) avance avec la vitesse c. A l’instant initial
on ajoute un peu de sel (par exemple) dans ce fluide. Si u(t, x) est la concentration de sel
(gramme/litre par ex.), alors
∂u ∂u
(t, x) + c (t, x) = 0
∂t ∂x
On peut se fixer aussi la condition initiale u(0, x) = u0 (x) (concentration initiale de solvant).
• Equation de la chaleur : si u(t, x) est la température dans un fil infini de section nulle, alors
la chaleur se propage suivant l’équation :
∂u ∂2u
(t, x) − 2 (t, x) = 0
∂t ∂x
On peut se fixer aussi la condition initiale u(0, x) = u0 (x) (température initiale).
• Equation des ondes : la hauteur u(t, x) à l’instant t et à la position x d’une corde vibrante
évolue suivant l’équation :
∂2u 2 ∂2u
(t, x ) + (t, x) = 0
∂t2 ∂x2
On peut se fixer aussi la condition initiale u(0, x) = u0 (x) (Position initiale de la corde).
• Equation de Black-Scholes : le prix C(t, x) d’une option d’achat dépend du temps t et de la
valeur x de l’option suivant l’équation :
∂C 1 ∂2C ∂C
(t, x) + σ 2 x2 2 (t, x) + rx (t, x) − rC(t, x) = 0 x > 0, 0 < t < T
∂t 2 ∂x ∂x
où T est la maturité de l’option, σ est la volatilité de l’actif sous-jacent et r > 0 de taux de
l’actif sans risque. L’équation précédente est complémentée par une condition terminale
C(T, x) = max{0, x − K}
où K est le prix d’exercice.
Méthodes de résolution :
• Formules explicites : c’est le cas pour les modèle exposés ci-dessus.
– Pour l’équation de transport, par exemple, on note que toute fonction réelle φ, la fonction
u(t, x) = φ(x − ct) vérifie l’équation. Il suffit alors de prendre φ = u0 .
– Pour l’équation de la chaleurs, il existe une formule intégrale :
Z
1 (x−y)2
u(t, x) = √ e− 2t u0 (y)dy t > 0, x ∈ R
2π R
qui fonctionne dès que u0 est suffisamment régulière.
– Pour l’équation de Black-Scholes, formule assez lourde.
• Par contre, il n’existe pas de solution explicite pour la plupart des modèles plus complexes,
comme les options européennes avec des taux et volatilités non constantes, des modèles avec
des dividendes. Ce n’est pas le cas non plus pour les options américaines.
• Malheureusement, les techniques de résolution sont beaucoup plus complexes que pour les
EDO. Il n’y a pas de méthode générale, qui marche pour toutes les équations.
Nous verrons dans ce cours des techniques hilbertiennes (espaces de Sobolev), ainsi qu’une
approche très générale, fonctionnant pour les EDP linéaires : la théorie des distributions.

4
1 Les espaces de Hilbert et le théorème de Lax-Milgram
1.1 Espaces vectoriels normés
Dans tout le cours, K désigne soit l’ensemble des nombres réels R, soit l’ensemble des nombres
complexes C.

1.1.1 Normes sur un espace vectoriel


Définition 1.1 Soit E un espace vectoriel sur K. On dit qu’une application k · k : E → R est une
norme si

• kxk ≥ 0 pour tout x ∈ E,

• ∀x ∈ E, kxk = 0 ⇒ x = 0E ,

• (positive homogénéité) ∀x ∈ E, ∀λ ∈ K, kλxk = |λ| kxk

• (inégalité triangulaire) ∀x, y ∈ E, kx + yk ≤ kxk + kyk

Remarque 1.2 On dit que (E, k · k) est un espace vectoriel normé (EVN). La norme k · k définit
naturellement une notion de distance sur E : on mesure la distance entre deux points x et y de E
par kx − yk. Rappelons que cette distance induit les notions d’ouvert, fermé, compact, voisinage,
etc...
Voici quelques exemples classiques d’EVN. D’autres seront étudiés en TD.

1. RN , muni d’une des normes suivantes, est un EVN : pour p ∈ [1, +∞[,

N
!1/p
X
kxkp = |xi |p , kxk∞ = max |xi |, où x = (x1 , . . . , xN ) ∈ RN
i=1,...,N
i=1

2. Soit X un ensemble. L’espace vectoriel E des applications bornées de X dans K peut être
muni de la norme suivante :

kf k∞ = sup |f (x)| ∀f ∈ E .
x∈X

3. Soit K est un sous-ensemble compact de RN . L’espace vectoriel E des applications continues


de K dans K peut être muni de la norme suivante :

kf k∞ = max |f (x)| ∀f ∈ E .
x∈K

(rappelons que, puisque x → |f (x)| est continue, le maximum est atteint).

4. Soit `1 espace vectoriel des séries réelles absolument convergentes. Alors `1 peut-être muni
de la norme
X∞
kxk1 = |xi | ∀x = (x1 , x2 , . . . ) ∈ `1
i=1

Définition 1.3 On dit que deux normes k · k1 et k · k2 sur un espace vectoriel E sont équivalentes
s’il existe deux constantes C1 , C2 > 0 telle que

C1 kxk1 ≤ kxk2 ≤ C2 kxk1 ∀x ∈ E .

5
On rappelle que “être équivalent à” est une relation d’équivalence (d’où la terminologie).

Théorème 1.4 Si E est de dimension finie, toutes les normes sur E sont équivantes.
Lorsque E est de dimension infinie, ce résultat est toujours faux :

Théorème 1.5 Soit E un espace vectoriel. Si toutes les normes sur E sont équivalentes, alors E
est de dimension finie.
En fait, en dimension infinie, il est rare que deux normes soient équivalentes.

1.1.2 Espaces complets


Définition 1.6 Soit (E, k · k) un EVN sur K. On dit qu’une suite (xn ) d’éléments de E est de
Cauchy si
∀ > 0, ∃n0 ∈ N, ∀n ≥ n0 , ∀p ≥ 0 kxn − xn+p k ≤  .
Rappelons que toute suite convergente est de Cauchy. Lorsque (E, k·k) est un EVN quelconque,
la réciproque n’est pas forcément vraie.

Définition 1.7 On dit qu’un espace vectoriel normé E, muni de la norme k · k est complet pour
cette norme, si toute suite de Cauchy (pour cette norme) d’éléments de E converge. On dit aussi
que E est un espace de Banach.

Remarque 1.8 1. Si deux normes sont équivalentes sur un EV E et si E est complet pour l’une
des normes, autre E est complet pour l’autre (exercice).

2. Si E est de dimension finie, alors E est complet (pour toute norme).

3. En dimension infinie, il est souvent essentiel pour les applications de travailler avec un espace
complet (cf. la suite du cours).
Exemples :

1. Si X un ensemble et (E, k · k∞ ) est l’espace vectoriel des applications bornées de X dans K


être muni de la norme
kf k∞ = sup |f (x)| ∀f ∈ E ,
x∈X

alors E est un espace de Banach.

2. De même, si K est un sous-ensemble compact de RN et (E, k · k∞ ) est l’espace vectoriel des


applications continues de K dans K muni de la norme

kf k∞ = max |f (x)| ∀f ∈ E ,
x∈K

alors E est un espace de Banach.

Voici une condition nécessaire et suffisante pour être complet dans un sous-espace complet :

Proposition 1.9 Soit (E, k · k) un EVN complet et K ⊂ E non vide. Alors K est complet, si et
seulement si, K est fermé.

6
Preuve (*): Supposons K complet. Soit (xn ) une suite d’éléments de K qui admet une limite
x ∈ E. Comme (xn ) converge, (xn ) est une suite de Cauchy (exercice). Comme K est complet, (xn )
possède une limite x̄ dans K. Or la limite d’une suite est unique, ce qui prouve que x = x̄ ∈ K.
Donc K est fermé.
Supposons maintenant que K est fermé. Soit (xn ) une suite de Cauchy de K. Alors (xn ) est
une suite de Cauchy dans E, qui est complet. Donc (xn ) admet une limite x ∈ E. Comme K est
fermé et (xn ) est une suite d’éléments de K, la limite x est aussi dans K. Donc (xn ) possède une
limite dans K, et K est complet. 2

1.1.3 Applications linéaires continues


Soit (E, k · kE ) et (F, k · kF ) deux espaces vectoriels normés sur K.

Théorème 1.10 Soit L : E → F une application linéaire. Les assertions suivantes sont
équivalentes :

(i) L est continue sur E,

(ii) L est continue en 0E ,

(iii) il existe une constante K telle que

kL(x)kF ≤ KkxkE ∀x ∈ E

(iv) L est lipschitzienne sur E (c’est-à-dire, il existe une constante K ≥ 0 telle que kL(x)−L(y)k ≤
Kkx − yk pour tout x, y ∈ E).

Preuve (*): Il est clair que (i) ⇒ (ii) et (iv) ⇒ (i). L’implication (iii) ⇒ (iv) est aussi très
facile : soit K la constante de (iii). Alors, pour tout x, y ∈ E, on a par linéarité de L,

kL(x) − L(y)kF = kL(x − y)kF ≤ Kkx − ykE (par (iii)).

D’où (iv).
Le seul point sur lequel il faut un peu travailler est (ii) ⇒ (iii) : comme, d’après (ii), L est
continue en 0E , pour  = 1 > 0 il existe une constante η > 0 telle que, si ky − 0E kE ≤ η, alors
kL(y) − L(0E )kF ≤  = 1. Cela se réécrit kL(y)kF ≤ 1 si kykE ≤ η, puisque L est linéaire, et
x
donc L(0E ) = 0. Soit maintenant x ∈ E avec x 6= 0E . Notons que y = η kxk E
vérifie kykE ≤ η,
et donc kL(y)kF ≤ 1. On multiplie cette dernière inégalité par kxkE /η pour obtenir, par positive
homogénéité de la norme puis linéarité de L :
kxkE
(kxkE /η)kL(y)kF = k (kxkE /η)L(y) kF = kL((kxkE /η)y)kF = kL(x)kF ≤ .
η
Cette inégalité étant évidente pour x = 0E , il existe donc une constante K = 1/η pour laquelle
l’inégalité de (ii) a lieu. 2
Soit L(E, F ) l’ensembles de applications linéaires continues de E dans F . Notons que L(E, F )
est un K−espace vectoriel.

Proposition 1.11 L’espace vectoriel L(E, F ) est muni de la norme

kT (x)kF
kT kL(E,F ) = sup
x6=0E kxkE

Remarques :

7
1. Lorsque E et F sont de dimension finie, on retrouve la notion de norme matricielle.

2. On montre facilement (exercice) que

kT kL(E,F ) = sup {kT (x)kF | x ∈ E, kxkE ≤ 1}

3. Par la suite nous travaillerons fréquemment avec l’espace E ∗ := L(E, K). Cet espace s’appelle
le dual topologique de E.
Preuve de la proposition (*): Il est clair que L(E, F ) est un espace vectoriel. Montrons que
k · kL(E,F ) est une norme.
• il est clair que kT kL(E,F ) ≥ 0 pour tout T ,

• Supposons que kT kL(E,F ) = 0. Alors on a, pour tout x ∈ E, kT (x)kF ≤ kT kL(E,F ) = 0 ,


soit T (x) = 0F . Donc T est l’application linéaire nulle.

• (positive homogénéité) Soit T ∈ L(E, F ) et λ ∈ K. Comme, pour tout x ∈ E, on a


kλT (x)kF = |λ| kT (x)kF , on en déduit que
kT (x)k kT (x)k
kλT kL(E,F ) = sup |λ| = |λ| sup = |λ| kT kL(E,F ) .
x6=0E kxk x6=0E kxk

• (inégalité triangulaire) soient T1 , T2 ∈ L(E, F ). On utilise la définition équivalente donnée


dans la remarque. Pour tout x ∈ E, avec kxkE ≤ 1. On a

k(T1 + T2 )(x)kF = kT1 (x) + T2 (x)kF ≤ kT1 (x)kF + kT2 (x)kF ≤ kT1 kL(E,F ) + kT2 kL(E,F )

En prenant le supremum sur x, avec kxkE ≤ 1, on obtient :

kT1 + T2 kL(E,F ) ≤ kT1 kL(E,F ) + kT2 kL(E,F )

2
Voici quelques propriétés élémentaires de cette norme : si T ∈ L(E, F ), alors
(i) kT (x)kF ≤ kT kL(E,F ) kxkE ∀x ∈ E

(ii) en particulier, kT (x) − T (y)kF ≤ kT kL(E,F ) kx − ykE ∀x, y ∈ E

Théorème 1.12 Si F est un espace de Banach, alors L(E, F ) est également un espace de Banach.

Remarque 1.13 En particulier le dual d’un EVN est toujours complet : rappelons que le dual E ∗
d’un EVN E est l’ensemble des formes linéaires continues sur E :

E ∗ = {T : E → R, T linéaire continue}

Preuve : Supposons que (Tn ) soit une suite de Cauchy dans L(E, F ). Montrons d’abord que,
pour tout x ∈ E, la suite (Tn (x) est une suite de Cauchy dans F . Si x = 0E , alors Tn (x) = 0F , et le
résultat est évident. Supposons maintenant que x 6= 0. Fixons  > 0. Comme (Tn ) est de Cauchy,
il existe n0 ∈ N tel que

∀n ≥ n0 , ∀p ≥ 0, kTn − Tn+p kL(E,F ) ≤
kxkE
Par conséquent,

∀n ≥ n0 , ∀p ≥ 0, kTn (x) − Tn+p (x)kL(E,F ) ≤ kTn − Tn+p kL(E,F ) kxkE ≤ kxkE = 
kxkE

8
Donc la suite (Tn (x)) est de Cauchy dans l’espace complet E : elle admet une limite notée T (x).
Comme les Tn sont linéaires, on voit facilement que T l’est aussi. Montrons que T est continue.
Pour cela, on note que, puisque la suite (Tn ) est de Cauchy, la suite de nombres réels (kTn kL(E,F ) )
l’est aussi, puisque

kTn kL(E,F ) − kTn+p kL(E,F ) ≤ kTn − Tn+p kL(E,F ) ∀n, p ≥ 0 .

Donc, comme R est complet, cette suite (kTn kL(E,F ) ) converge et, en particulier, est bornée par
une constante M . On a alors

kTn (x)kF ≤ kTn kL(E,F ) kxkE ≤ M kxkE ∀x ∈ E, ∀n ∈ N .

On fait tendre n vers +∞, ce qui donne, puisque Tn (x) → T (x) et la norme k · kE est continue,

kT (x)kF ≤ M kxkE ∀x ∈ E .

Cela montre que T est continue.


Montrons finalement que Tn tend vers T pour la norme k · kL(E,F ) : fixons  > 0 et soit n0 ∈ N
tel que
∀n ≥ n0 , ∀p ≥ 0, kTn − Tn+p kL(E,F ) ≤ 
(un tel n0 existe puisque (Tn ) est de Cauchy). On a alors

kTn (x) − Tn+p (x)kF ≤  ∀n ≥ n0 , p ≥ 0, x ∈ E avec kxkE ≤ 1

On fait tendre p vers +∞ dans l’inégalité ci-dessus : Tn+p (x) tend vers T (x), ce qui donne

kTn (x) − T (x)kF ≤  ∀n ≥ n0 , x ∈ E avec kxkE ≤ 1

Donc
kTn − T kL(E,F ) = sup {kTn (x) − T (x)kF | x ∈ E, kxkE ≤ 1} ≤  ∀n ≥ n0 .
En conclusion, la suite de Cauchy (Tn ) tend vers T : cela prouve que L(E, F ) est complet. 2

1.1.4 Produits d’EVN


Soient (E, k · kE ) et (F, k · kF ) deux EVN. On munit (le plus souvent) le produit E × F d’une des
normes équivalentes suivantes :

k(x, y)k1 = kxkE + kykF , k(x, y)k∞ = max{kxkE , kykF },


1
k(x, y)k2 = kxk2E + kyk2F 2
∀(x, y) ∈ E × F .
(le fait que ces normes sont équivalentes vient juste du fait que, sur R2 , les normes k · k1 , k · k∞ et
k · k2 sont équivalentes).

Proposition 1.14 Si E et F sont des espaces de Banach, alors E × F (muni d’une des normes
ci-dessus), l’est également.
Preuve : exercice. 2

Définition 1.15 (Applications bilinéaires) Soient (E, k·kE ), (F, k·kF ) et (G, k·kG ) trois EVN.
On dit que l’application T : E × F → G est bilinéaire si l’applications x → T (x, y) est linéaire pour
tout y ∈ F et l’application y → T (x, y) est linéaire pour tout x ∈ E.

9
Remarque : Une application bilinéaire n’est linéaire... que si elle est nulle (car T (λx, λy) =
λ2 T (x, y)).

Proposition 1.16 Soit T : E × F → G est une application bilinéaire. Alors T est continue sur
E × F si et seulement si il existe une constante C telle que

kT (x, ykG ≤ CkxkE kykF ∀(x, y) ∈ E × F .

Preuve : exercice. 2

1.2 Espaces de Hilbert


1.2.1 Produit scalaire et norme associée
Commençons par le cas des espaces vectoriels réels.

Définition 1.17 (Produit scalaire réel) Soit H un R−espace vectoriel. On appelle produit
scalaire sur H toute application B : H × H → R bilinéaire, symétrique, définie positive, i.e.,

(i) B est une forme bilinéaire sur H,

(ii) B est symétrique, i.e., B(x, y) = B(y, x) ∀(x, y) ∈ H × H ,

(iii) B est définie positive : B(x, x) ≥ 0 ∀x ∈ H et si B(x, x) = 0, alors x = 0H .

Définition 1.18 (Produit scalaire complexe) Soit H un C−espace vectoriel. On appelle pro-
duit scalaire sur H toute application B : H ×H → C sesquilinéaire, hermitienne, définie positive,
i.e.,

(i) B est une forme sesquilinéaire sur H, i.e.,


a) pour tout y ∈ H, l’application x → B(x, y) (de H dans C) est linéaire,
b) pour tout x ∈ H, l’application y → B(x, y) (de H dans R) est anti-linéaire (B(x, λy + z) =
λ̄B(x, y) + B(x, z) pour tout x, y, z ∈ H, λ ∈ C),

(ii) B est hermitienne, i.e., B(x, y) = B(y, x) ∀(x, y) ∈ H × H ,

(iii) B est définie positive : B(x, x) ≥ 0 ∀x ∈ H et si B(x, x) = 0, alors x = 0H .

Remarque: si B est hermitienne, alors B(x, x) est réel puisque B(x, x) = B(x, x).

Le plus souvent un produit scalaire est noté h·, ·i au lieu de B.

Proposition 1.19 Soit H un espace vectoriel réel ou complexe muni d’un produit scalaire h·, ·i.
Alors, si on pose
1
kxk = (hx, xi) 2 ∀x ∈ H (1)
on a :

(i)
kx + yk2 = kxk2 + 2Re(hx, yi) + kyk2 ∀x, y ∈ H .

(ii) (Cauchy-Schwarz)
|hx, yi| ≤ kxk kyk ∀x, y ∈ H .

10
(iii) (Identité du parallélogramme)

2(kxk2 + kyk2 ) = kx + yk2 + kx − yk2 ∀x, y ∈ H .

(iv) k · k définit une norme sur H.

Preuve (dans le cas complexe par exemple) :

(i) Si x, y ∈ H, alors

kx + yk2 = hx + y, x + yi = hx, xi + hx, yi + hy, xi + hy, yi = kxk2 + hx, yi + hx, yi + kyk2


= kxk2 + 2Re(hx, yi) + kyk2

(ii) (Cauchy-Schwarz) soient x, y ∈ H. Si hx, yi = 0, le résultat est évident. Sinon, soit θ un


argument du nombre complexe hx, yi. On a alors, pour tout λ ∈ R,

kx + λeiθ yk2 = kxk2 + 2λRe(e−iθ hx, yi) + |λ|2 kyk2 = kxk2 + 2λ|hx, yi| + |λ|2 kyk2 .

Comme le polynôme à coefficients réels λ → kxk2 + 2λ|hx, yi| + λ2 kyk2 ne prend pas de valeur
négative, son discriminant est négatif ou nul : 4|hx, yi|2 − 4kxk2 kyk2 ≤ 0, ce qui donne
l’inégalité annoncée.

(iii) (Identité du parallélogramme) si x, y ∈ H, on a

kx + yk2 + kx − yk2 = kxk2 + 2Re(hx, yi) + kyk2 + kxk2 − 2Re(hx, yi) + kyk2 = 2(kxk2 + kyk2)

(iv) k · k définit une norme sur H. Nous ne montrons que l’inégalité triangulaire, le reste étant
laissé en exercice :
kx + yk2 = kxk2 + 2Re(hx, yi) + kyk2 ≤ kxk2 + 2kxk kyk + kyk2 (par Cauchy-Schwarz)
≤ (kxk + kyk)2

2
Exemples

• sur RN , le produit scalaire usuel est défini par :


N
X
hx, yi = x i yi ∀x = (x1 , . . . , xN ), y = (y1 , . . . , yN ) ∈ RN .
i=1

• de même sur CN , le produit scalaire usuel est défini par :


N
X
hx, yi = xi ȳi ∀x = (x1 , . . . , xN ), y = (y1 , . . . , yN ) ∈ CN .
i=1

• L’espace L2µ (X, R) est muni du produit scalaire


Z
hf, gi = f gdµ ∀f, g ∈ L2 ,
X

11
• En particulier, le prototype des espaces de Hilbert est l’espace `2 (R) (ou `2 (C)) des suites
P∞
réelles (resp. complexes) (xi )i∈N de carré sommable : i=1 |xi |2 < +∞. Cet espace est muni
du produit scalaire

X
hx, yi = x i yi ∀x = (xi )i∈N , y = (yi )i∈N ∈ `2 .
i=1


X
(Dans le cas complexe, le produit scalaire est hx, yi = xi yi ).
i=1

Définition 1.20 Soit H un espace vectoriel muni d’un produit scalaire h·, ·i. On dit que H est un
espace de Hilbert si H, muni de la norme associée au produit scalaire h·, ·i (par (1)) est un espace
complet.
Remarque: Tout espace de Hilbert est un espace de Banach. La réciproque est fausse : en
général une norme quelconque ne provient pas d’un produit scalaire (exercice : montrer que, si
H = RN , il n’existe pas de produit scalaire B tel que B(x, x) = kxk2∞ ).

1.2.2 Le théorème de projection


Rappelons d’abord quelques notions élémentaires sur les ensembles convexes.

Définition 1.21 (Ensemble convexe) Soit E un espace vectoriel. On dit qu’un sous-ensemble
C de E est convexe si
∀x, y ∈ C, ∀λ ∈ [0, 1], λx + (1 − λ)y ∈ C .
Par exemple, un sous-espace vectoriel de E est toujours convexe.

Définition 1.22 (Fonction convexe) Soit E un espace vectoriel et C un sous-ensemble convexe


de E. Une application f : C → R est convexe si

∀x, y ∈ C, ∀λ ∈ [0, 1], f (λx + (1 − λ)y) ≤ λf (x) + (1 − λ)f (y) .

Voici quelques propriétés classiques des ensembles convexes (leur preuve est un bon exercice) :

1. Une intersection quelconque de convexes est convexe.

2. Si f : E → R est convexe, alors, pour tout c ∈ R l’ensemble {x ∈ E | f (x) ≤ c} est convexe.

Le théorème suivant est le résultat une des propriétés les plus importantes des espaces de Hilbert.

Théorème 1.23 (de projection (cas réel)) Si H est un espace vectoriel muni d’un produit scalaire
h·, ·i et F est un sous-ensemble convexe complet non vide de H, pour tout x ∈ H il existe un unique
point ΠF (x) ∈ F (appelé le projeté de x sur F ) tel que

kx − ΠF (x)k = min ky − xk .
y∈F

De plus, ΠF (x) est caractérisé par l’inégalité suivante :

hx − ΠF (x), y − ΠF (x)i ≤ 0 ∀y ∈ F .

Remarques 1.24 1. Le théorème s’applique en particulier, lorsque H est un espace de Hilbert


et et F est un sous-ensemble convexe fermé non vide de H : en effet, un sous-ensemble fermé
d’un espace complet est complet.

12
2. Dans la cas où H est complexe et h·, ·i un produit scalaire complexe, le théorème s’applique
sous les mêmes hypothèses et la caractérisation prend la forme suivante :
Re(hx − ΠF (x), y − ΠF (x)i) ≤ 0 ∀y ∈ F .
Il faut connaı̂tre la preuve de la partie “unicité” du théorème.
Preuve : Commençons par l’unicité (*): soient z1 et z2 deux projections du points x sur F . Notons
que, par convexité de F , le point (z1 + z2 )/2 appartient aussi à F . Par définition du projeté, on a
donc
z1 + z2
k − xk ≥ kz1 − xk = kz2 − xk .
2
Appliquons maintenant l’identité du parallélogramme aux vecteurs z1 − x et z2 − x, on a
z1 + z2
kz1 + z2 − 2xk2 + kz1 − z2 k2 = 2(kz1 − xk2 + kz1 − xk2 ) ≤ 4k − xk2
2
Donc kz1 − z2 k2 ≤ 0, ce qui prouve que z1 = z2 .

Prouvons maintenant l’existence. Comme F est non vide, il existe un point z̄ ∈ F et donc
m̄ := inf z∈F kz − xk est bien défini. Soit (zn ) une suite minimisante du problème : zn ∈ F et
limn→+∞ kzn − xk = m̄. L’objectif est de montrer que (zn ) est une suite de Cauchy de F . Soit
 > 0 et N ≥ 0 tel que kzn − xk ≤ m̄ +  pour tout n ≥ N . Fixons n, m ≥ N . On applique l’égalité
du parallélogramme à zn − x et zm − x.
kzn + zm − 2xk2 + kz− n − zm k2 = 2(kzn − xk2 + kzm − xk2 ) ≤ 4(m̄ + )2
Or, comme le point zn +z 2
m
appartient à F par convexité de F , on a k zn +z
2
m
− xk ≥ m̄. L’inégalité
ci-dessus se réécrit donc
4m̄2 + kz− n − zm k2 ≤ 4(m̄ + )2 ,
ce qui donne
kz− n − zm k2 ≤ 4(m̄ + )2 − 4m̄2 = 4(2m̄ + ) .
Comme le membre de droite est arbitrairement petit lorsque  → 0, la suite (zn ) est bien de Cauchy.
Or F est complet, donc cette suite converge vers une limite z̄ ∈ F . La norme étant continue, on a
finalement,
m̄ = lim kx − zn k = kx − z̄k
n→+∞
et z̄ est la projection de x sur F .
Montrons maintenant la caractérisation. Vérifions d’abord que ΠF (x) satisfait l’inégalité :
fixons z ∈ F et, pour t ∈]0, 1], considérons le point (1 − t)ΠF (x) + tz, qui appartient à F puisque
F est convexe. On a donc, par définition du projeté,
kΠF (x)−xk2 ≤ k(1−t)ΠF (x)+tz−xk2 = kΠF (x)−xk2 +2thΠF (x)−x, z−ΠF (x)i+t2 kz−ΠF (x)k2 .
On simplifie par kΠF (x) − xk2 , on divise par t > 0 et on fait tendre t vers 0 pour obtenir 0 ≤
2hΠF (x) − x, z − ΠF (x)i. Ceci est l’inégalité voulue.
Inversement, soit z̄ ∈ F un point vérifiant l’inégalité de caractérisation. Montrons que z̄ est le
projeté de x sur F . On a, pour tout z ∈ F ,
kz − xk2 = kz − z̄ + z̄ − xk2 = kz − z̄k2 + 2hz − z̄, z̄ − xi + kz̄ − xk2
Comme kz − z̄k2 ≥ 0 et hz − z̄, z̄ − xi ≥ 0 par inégalité de caractérisation, on obtient kz − xk2 ≥
kz̄ − xk2 , ce qui prouve que z̄ est le projeté de x sur F .
2
Lorsque l’ensemble F est un sous-espace vectoriel fermé de l’espace de Hilbert H, le théorème
de projection prend la forme suivante :

13
Théorème 1.25 (Projection sur un SEV) On suppose que H est un espace de Hilbert et que
F est un sous-espace vectoriel fermé de H. Alors

(i) l’application x → ΠF (x) est linéaire continue, de norme 1 si F n’est pas réduit à {0H }.

(ii) c’est une projection : ΠF ◦ ΠF = ΠF

(iii) on a l’égalité
hx − ΠF (x), yi = 0 ∀y ∈ F .

(iv) cette égalité caractérise ΠF (x).

ΠF (x) s’appelle la projection orthogonale de x sur F .

Preuve (*): Montrons d’abord la caractérisation : vu le théorème de projection (cas convexe), il


suffit de vérifier que, lorsque F est un espace vectoriel, la condition

(∗) hx − z̄, y − z̄i ≤ 0 ∀y ∈ F .

est équivalente à la condition

(∗∗) hx − z̄, yi = 0 ∀y ∈ F .

Supposons d’abord (∗). Soit y ∈ F . Alors, comme F est un espace vectoriel et z̄ ∈ F , y + z̄


appartient aussi à F . Donc, par (∗), hx − z̄, y + z̄ − z̄i = hx − z̄, yi ≤ 0. Ceci est vrai aussi pour
−y, qui appartient aussi à F : hx − z̄, −yi ≤ 0. D’où (∗∗).
Inversement, si z̄ satisfait (∗∗), alors pour tout y ∈ F , on a y − z̄ ∈ F par linéarité de F , et
donc, par (∗∗), hx − z̄, y − z̄i = 0. D’où (∗).
Une fois connue la caractérisation du projeté, la linéarité de l’application x → ΠF (x) est
évidente : en effet, soient x1 , x2 ∈ H, λ ∈ R. On a alors, pour tout y ∈ H,

hx1 + λx2 − (ΠF (x1 ) + λΠF (x2 )), yi = hx1 − ΠF (x1 ), yi + λhx2 − ΠF (x2 ), yi = 0 ,

Donc ΠF (x1 + λx2 ) = ΠF (x1 ) + λΠF (x2 ) d’après la caractérisation, ce qui prouve la linéarité de
ΠF .
Montrons maintenant que kΠF k = 1. Soit z ∈ F , avec z 6= 0. On a ΠF (z) = z, et donc kΠF k ≥
kΠF (z)k/kzk = 1. Inversement, si x ∈ H, alors d’après la caractérisation, hx − ΠF (x), yi = 0 pour
tout y ∈ F . Donc, en prenant y = ΠF (x),

kΠF (x)k2 = hΠF (x), ΠF (x)i = hx, ΠF (x)i ≤ kxk kΠF (x)k

ce qui prouve que kΠF (x)k ≤ kxk. Donc kΠF k = 1.


Finalement, ΠF ◦ ΠF = ΠF par définition de la projection. 2

1.2.3 Orthogonalité
Soit (H, h·, ·i) un espace de Hilbert. On dit que deux vecteurs x, y ∈ H sont orthogonaux si
hx, yi = 0. On note alors x ⊥ y.

Définition 1.26 (Orthogonal d’une partie) Soit A un sous-ensemble non vide de H. L’orthogonal
de A est le sous-ensemble A⊥ de H défini par

A⊥ = {x ∈ H | hx, yi = 0 ∀y ∈ A}

14
Remarque 1.27 Si F est un sous-espace vectoriel fermé de H, alors, d’après la caractérisation de
la projection, on a x − ΠF (x) ∈ F ⊥ pour tout x ∈ F .

Proposition 1.28 Soit A un sous-ensemble non vide de H.


(i) A⊥ est toujours un sous-espace vectoriel fermé de H.
(ii) H ⊥ = {0H } et {0H }⊥ = H.
(iii) Si A ⊂ B, alors B ⊥ ⊂ A⊥ .
(iv) ( V ect(A) )⊥ = A⊥ (où V ect(A) est la fermeture de V ect(A)).
Preuve (*): Pour fixer les idées, on travaille dans le cas réel. (i) Montrons que A⊥ est un sous-
espace vectoriel : si z1 , z2 ∈ A⊥ et λ ∈ R, alors, pour tout y ∈ A, hz1 +λz2 , yi = hz1 , yi+λhz2 , yi = 0.
Donc z1 + λz2 ∈ A⊥ , ce qui prouve que A⊥ est un sous-espace vectoriel. Montrons maintenant que
A⊥ est fermé : si (yn ) est une suite d’éléments de A⊥ qui tend vers z ∈ F , on a, pour tout y ∈ A,
hz, yi = limn→+∞ hzn , yi = 0. Cela montre que z ∈ A⊥ , qui est donc fermé.
(ii) Si z ∈ H ⊥ , alors, comme z ∈ H, kzk2 = hz, zi = 0, ce qui prouve que z = 0. Donc
H = {0H }. Il est clair que {0H }⊥ = H.

(iii) est une application directe de la définition.


(iv) Comme A ⊂ V ect(A), l’inclusion ( V ect(A) )⊥ ⊂ A⊥ est immédiate. Soit P maintenant
z ∈ A⊥ . Alors, si y est une combinaison linéaire d’éléments de A, c’est-à-dire si y = ni=1 λi yi avec
yi ∈ A et λi ∈ R, on a
n
X n
X
hz, λi yi i = λi hz, yi i = 0 puisque hz, yi i = 0 car z ∈ A⊥ .
i=1 i=1

Donc z ∈ (V ect(A))⊥ . D’autre part, si y ∈ V ect(A), il existe une suite (yn ) d’éléments de V ect(A)
telle que yn → y. Or hz, yn i = 0 et le produit scalaire est continu. Donc hz, yi = 0, ce qui prouve
que z ∈ ( V ect(A) )⊥ . 2

Proposition 1.29 Soit F un sous-ensemble de H.


(i) F est un sous-espace vectoriel fermé de H si et seulement si (F ⊥ )⊥ = F .
(ii) Dans ce cas, H = F ⊕ F ⊥ et idH = ΠF + ΠF ⊥ .
Preuve (*): (i) Supposons que F est un sous-espace vectoriel fermé de H. Soit z ∈ F et
y ∈ F ⊥ . Alors hz, yi = 0, et donc F ⊂ (F ⊥ )⊥ . Inversement, soit z ∈ (F ⊥ )⊥ . Soit ΠF (z) le projeté
de z sur F . Par caractérisation, on a hz − ΠF (z), yi = 0 pour tout y ∈ F , et donc z − ΠF (z) ∈ F ⊥ .
Mais z ∈ (F ⊥ )⊥ , et donc 0 = hz − ΠF (z), zi. Rappelons que l’application linéaire continue ΠF est
de norme 1, ce qui prouve que kΠF (z)k ≤ kzk. D’où

kzk2 = ΠF (z), zi ≤ kΠF (z)k kzk ≤ kzk2 .

Il y a donc une égalité dans Cauchy-Schwarz, ce qui prouve que ΠF (z) = λz avec λ ≥ 0. De l’égalité
0 = hz − ΠF (z), zi on tire facilement que λ = 1, ce qui prouve que z = ΠF (z), c’est-à-dire que
z ∈ F.
Supposons maintenant que (F ⊥ )⊥ = F . Alors, comme (F ⊥ )⊥ = F est un sous-espace vectoriel
fermé de H, F est fermé.

(ii) On a, pour tout x ∈ H, x = ΠF (x) + x − ΠF (x) avec ΠF ∈ F et x − ΠF (x) ∈ F ⊥ . Donc


H = F + F ⊥ . Or F ∩ F ⊥ = {0H } car si z ∈ F ∩ F ⊥ , alors kzk2 = hz, zi = 0. D’où H = F ⊕ F ⊥ .
L’égalité x = ΠF (x) + x − ΠF (x) pour tout x ∈ H montre aussi que idH = ΠF + ΠF ⊥ . 2

15
1.2.4 Bases hilbertiennes
Soit (H, h·, ·i) un espace de Hilbert. On dit qu’une famille A de H est totale si l’adhérence de
l’espace vectoriel engendré par A est égal à H tout entier : , V ect(A) = H.

Proposition 1.30 A est totale si et seulement si A⊥ = {0H }.


Noter que c’est l’implication “A⊥ = {0H } ⇒ A est totale” qui est utile en pratique.

Preuve (*): Si A est totale, alors

A⊥ = ( V ect(A) )⊥ = H ⊥ = {0H }

Supposons maintenant que A⊥ = {0H }. Alors


 ⊥  ⊥
V ect(A) = ( V ect(A) )⊥ = A⊥ = ({0H })⊥ = H .

Définition 1.31 (Base hilbertienne) Soit (en )n∈N une suite d’éléments de H. On dit que cette
famille est une base hilbertienne de H si elle est totale et orthonormée :

⊥ 0 si n 6= m
(V ect({en , n ∈ N})) = {0H } et hen , em i = ∀n, m ∈ N .
1 si n = m

Définition 1.32 (Espace séparable) On dit qu’un EVN (E, k · k) est séparable si E contient une
famille dénombrable dense.
Exemples et contre-exemple : Une grande partie des espaces utilisés en analyse fonctionnelle
sont séparables.

1. si a < b, (C 0 ([a, b]), k · k∞ ) est séparable : en effet Q[X] est une famille dénombrable dense
(c’est une conséquence directe du théorème de Stone-Weierstrass, qui dit que toute fonction
continue sur [a, b] est limite uniforme d’une suite de polynômes).

2. les espaces `p (pour 1 ≤ p < +∞) sont séparables. En effet si on note D0 l’ensemble des
suites nulles à partir d’un certain rang et à coefficients dans Q, alors D0 est dénombrable et
dense dans `p (voir les exercices).

3. Si I est un intervalle non vide de R et 1 ≤ p < +∞, alors l’espace Lp (I) est séparable. (admis)

4. Par contre ni `∞ , ni L∞ ([a, b]) ne sont séparables. Montrons-le pour `∞ : soit Φ : P(N) → `∞
l’application qui à une partie E de N associe la suite

1 si i ∈ E
Φ(E) = (Φ(E)i )i∈N où Φ(E)i =
0 sinon

Alors, par définition,

kΦ(E) − Φ(E 0 )k∞ = 1 ∀E, E 0 ∈ P(N) avec E 6= E 0 . (2)

Montrons maintenant que cela implique que `∞ n’est pas séparable. En effet, raisonnons
par l’absurde en supposant qu’il existe une suite dénombrable dense (xn ) dans `∞ . A tout
E ∈ P(E) il existerait un plus petit entier nE tel que kxnE − Φ(E)k∞ ≤ 1/4 puisque (xn )

16
est dense dans `∞ . Notons que l’application E → nE est injective, puisque si nE = n0E , alors
0
xnE = xnE et
1
kΦ(E) − Φ(E 0 )k∞ ≤ kΦ(E) − xnE k∞ + kxn0E − Φ(E 0 )k∞ ≤ ,
2
ce qui implique que E = E 0 d’après (2). Mais comme P(N) est non dénombrable tandis que
N est dénombrable, il ne peut exister d’injection de P(N) dans N. Une contradiction.

Théorème 1.33 Tout espace de Hilbert séparable possède au moins une base hilbertienne.
Il faut connaı̂tre la preuve de ce résultat : elle fournit une procédure constructive d’une base
hilbertienne (procédé d’orthonormalisation de Schmidt).

Preuve (*): Soit (xn )n∈N S une suite dense dans H. On note Fn l’espace vectoriel engendré par
{x1 , . . . , xn }. Notons que n Fn est dense dans H, puisque cet espace vectoriel contient tous les xn .
Nous allons construire explicitement une suite (en )n∈N et une suite strictement croissante d’indices
(kn )n∈N telles que {e1 , . . . , en } est une base orthonormée de Fkn .
Sans perte de généralité on peut supposer que x1 6= 0. On pose alors e1 = x1 /kx1 k et {e1 } est
une base orthonormée de F1 . Supposons construits {e1 , . . . , en } et kn . Soit kn+1 le plus petit indice
k > kn tel que Fk 6= Fkn . Alors la famille {e1 , . . . , en , xkn+1 } est une base de Fkn+1 . Posons
n
X
e0n+1 = xkn+1 − hxkn+1 , ei iei .
i=1

Notons que he0n+1 , ej i = 0 pour tout j ≤ n et que e0n+1 6= 0 puisque xkn+1 n’est pas combinaison
linéaire des e1 , . . . , en . On pose alors en+1 = e0n+1 /ke0n+1 k. On montre facilement que {e1 , . . . , en+1 }
est une base orthonormée de Fkn+1 . On conclut à l’existence de la famille {en }n∈N par récurrence.
Par construction, S {en }n∈N est une famille orthornormée. Elle est également totale puisque
V ect(en , n ∈ N) = n Fn et que ce dernier espace est dense dans H. 2

Théorème 1.34 Soit H un espace de Hilbert séparable, muni d’une base hilbertienne (en )n∈N .
Alors l’application
Φ : H → `2
x 7→ (hx, en i)n∈N
est une application linéaire bijective et isométrique. En particulier, on a les égalités

X
• (Bessel) x = hx, en ien
n=1

X
• (Parseval) kxk2 = |hx, en i|2
n=1

Preuve (*): L’application Φ est clairement linéaire. Montrons qu’elle est continue : en effet,
Pnvectoriel engendré par {e1 , . . . , en }. Alors, si x ∈ H, alors on montre aisément
notons Fn l’espace
que ΠFn (x) = i=1 hx, ei iei et on sait que x = ΠFn (x) + ΠFn⊥ (x), où les deux vecteurs sont
orthogonaux. Donc, par Pythagore,
n
X
kxk2 = kΠFn (x)k2 + kΠFn⊥ (x)k2 ≥ kΠFn (x)k2 = hx, ei i2 .
i=1

Lorsque n → +∞, on a alors X


kΦ(x))k2 = hx, ei i2 ≤ kxk2 . (3)
i

17
Donc Φ est continue avec kΦk ≤ 1.
Montrons maintenant qu’en fait l’égalité a lieu dans (3). En effet comme la famille {en } est
totale, il existe une suite (yk ) de V ect(xn , n ∈ N) qui converge vers x. Par définition de Fn , pour
tout k, il existe nk telle que yk ∈ Fnk . Comme la suite des espaces vectoriels (Fn ) est croissante,
on peut supposer sans perte de généralité que la suite nk est strictement croissante, et donc tend
vers +∞. Alors, par définition de la projection, on a
nk
X
kxk2 − hx, ei i2 = kxk2 − kΠFnk (x)k2 = kx − xnk k2 ≤ kx − ynk k2 → 0 ,
i=1

ce qui prouve l’égalité de Bessel. Cette égalité affirme en particulier que Φ est une isométrie. En
passant, nous avons également montré l’égalité de Parseval :
n
X
lim hx, ei iei = lim xn = x .
n→+∞ n→+∞
i=1

Montrons maintenant que Φ est bijective. D’abord Φ est clairement injective, car si Φ(x) = 0,
alors
kxk = kΦ(x)k = k0k = 0 .
x = 0. Montrons finalement que Φ est surjective. Soit y = (yn )n∈N un élément de `2 . Posons
Donc P
xn = ni=1 yi ei . Alors la suite (xn ) est de Cauchy dans H puisque
n+p
X
2
kxn+p − xn k = |yi |2
i=n+1

et que la série i |yi |2 converge. Donc, comme H est complet, (xn ) converge vers un certain x ∈ H.
P
Notons que, pour tout i ∈ N,

hx, ei i = lim hxn , ei i = lim yi = yi .


n→+∞ n→+∞

Donc Φ(x) = y, ce qui prouve que Φ est surjective. 2


Exemples fondamentaux :

1. Si (`2 , h·, ·i2 ) est l’espace de Hilbert des suites de carré sommable, la famille (en )n∈N définie
par eni = δin est une base hilbertienne de `2 .
 
1 inx
2. La théorie des séries de Fourier nous apprend que la famille √ e est une base
2π n∈Z
hilbertienne de L2 ((0, 2π), C).
En particulier, toute fonction de L2 ((0, 2π), C) est limite, dans L2 , d’une suite de polynômes
trigonométriques.
   
1 1
3. Lorsque l’on revient aux espaces réels, on a : La famille √ cos(nx) ∪ √ sin(nx)
2π n∈N 2π n∈N∗
est une base hilbertienne de L2 ((0, 2π), R).

1.2.5 Dualité
Rappelons que le dual (topologique) E ∗ d’un EVN E est l’ensemble des applications linéaires
continues de E dans R. Pour les espaces de Hilbert, on peut identifier E ∗ et E, au sens suivant :

18
Théorème 1.35 (de représentation de Riesz) Soit (H, h·, ·i) un espace de Hilbert (réel ou com-
plexe). Pour tout f ∈ H ∗ , il existe un unique élément x̄ ∈ H tel que

f (y) = hy, x̄i ∀y ∈ H . (4)

De plus l’application f 7→ x̄ de H ∗ dans H est une application (anti)linéaire continue bijective (et
d’inverse continu).
Preuve : Soit f ∈ H ∗ . Si f est l’application nulle, alors x̄ = 0H est bien l’unique vecteur de H
vérifiant (4).
Supposons maintenant que f 6≡ 0. Avant de commencer la démonstration, notons que, si
x̄ existe, alors x̄ ∈ (Ker(f ))⊥ puisque, pour tout y ∈ Ker(f ), hx̄, yi = f (y) = 0. De plus,
f (x̄) = hx̄, x̄i = kx̄k2 . L’objet des calculs suivants est précisément de construire un tel x̄.
Comme f 6≡ 0, il existe x ∈ H tel que f (x) 6= 0. Soit z la projection orthogonale de x sur
Ker(f ) (qui est un sous-espace vectoriel fermé de H). Comme f (x) 6= 0, on a z 6= x. Posons
x̄ = (x − z)f (x)/kx − zk2 . Notons d’abord que

f (x) (f (x))2
f (x̄) = 2
(f (x) − f (z)) = = kx̄k2 6= 0 .
kx − zk kx − zk2
Par définition de la projection orthogonale, on a également
f (x)
hy, x̄i = hy, x − zi = 0 ∀y ∈ Ker(f ) .
kx − zk2
Soit maintenant y ∈ H quelconque. Alors y − f (y)x̄/f (x̄) appartient à Ker(f ). Donc

hy − f (y)x̄/f (x̄), x̄i = 0 ,

ce qui prouve que


kx̄k2
hy, x̄i = f (y)hx̄, x̄/f (x̄)i = f (y) = f (y) .
f (x̄)
Il existe donc x̄ ∈ H tel que hy, x̄i = f (y) pour tout y ∈ H.
Montrons l’unicité de x̄ : si x̄1 ∈ H est tel que hy, x̄1 i = f (y) pour tout y ∈ H, alors

hy, x̄ − x̄1 i = 0 ∀y ∈ H ,

ce qui implique que x̄ − x̄1 = 0H et donc que x̄ = x̄1 .


Finalement, l’application Φ : H → H ∗ définie par Φ(x)(y) = hy, xi est (anti)linéaire, continue
car
kΦ(x)k = sup{|Φ(x)(y)| | y ∈ H, kyk ≤ 1}
= sup{|hx, yi| | y ∈ H, kyk ≤ 1} (5)
≤ kxk
(par Cauchy-Schwarz). Nous avons montré ci-dessus que Φ est bijective. Notons aussi que Φ−1 est
continue car, si f ∈ H ∗ et x̄ vérifie (4), on a

kx̄k2H = hx̄, x̄i = f (x̄) ≤ kf kH ∗ kx̄kH

D’où
kx̄kH ≤ kf kH ∗ = kΦ(x̄)kH ∗ ∀x̄ ∈ H . (6)
En terme de Φ, les inégalités (5) et (6) donnent

kx̄kH = kΦ(x̄)kH ∗ ∀x̄ ∈ H ,

et donc Φ est une isométrie de H dans H ∗ . 2

19
1.2.6 Le théorème de Lax-Milgram
Un des outils de base pour démontrer l’existence de solution pour certaines équations aux dérivées
partielles est le théorème de Lax-Milgram. Pour l’énoncer, nous aurons besoin de la notion suivante :

Définition 1.36 Soit H un espace de Hilbert réel et a : H × H → R une forme bilinéaire continue.
On dit que a est coercive, s’il existe une constante α > 0 telle que

a(x, x) ≥ αkxk2 ∀x ∈ H .

Bien noter que la constant α doit être strictement positive, et ne dépend que de a (et pas de x).

Théorème 1.37 (de Lax-Milgram) Soit H un espace de Hilbert réel et a : H × H → R une


forme bilinéaire continue coercive. Alors, pour tout f ∈ H ∗ il existe un unique élément x̄ ∈ H tel
que
a(x̄, y) = f (y) ∀y ∈ H .
De plus, si a est symétrique, x̄ est l’unique minimum de la fonctionnelle
1
Φ(x) = a(x, x) − f (x)
2
Remarque (*): (Preuve connaı̂tre) Lorsque a est symétrique, le théorème possède une démonstration
très rapide : en effet, a définit un produit scalaire dont la norme associée, notée k·ka , est équivalente
à la norme initiale de H. En particulier, H, muni du produit scalaire a, est un espace de Hilbert
et f reste une forme linéaire continue sur H. Le théorème de représentation de Riesz affirme alors
qu’il existe un unique point x̄ ∈ H tel que

a(x̄, y) = f (y) ∀y ∈ H .

Preuve du théorème de Lax-Milgram : La preuve de l’unicité est à connaı̂tre (*): Supposons


qu’il existe x̄1 et x̄2 dans H tels que

a(x̄1 , y) = f (y) = a(x̄2 , y) ∀y ∈ H .

Alors on a a(x̄1 − x̄2 , y) = 0 pour tout y, et donc, en prenant y = x1 − x2 et en utilisant la coercivité


de a,
0 = a(x̄1 − x̄2 , x̄1 − x̄2 ) ≥ αkx̄1 − x̄2 k2 .
Comme α > 0, ceci prouve que x̄1 = x̄2 .

Montrons maintenant l’existence : comme a est continue, pour tout x ∈ H fixé, l’application
y → a(x, y) est une forme linéaire continue. D’après le théorème de représentation de Riesz, il
existe donc pour tout x ∈ H un unique élément A(x) ∈ H tel que

hA(x), yi = a(x, y) ∀y ∈ H .

On montre sans difficulté que A : H → H est linéaire et continue. Montrons que A est une bijection.

A est injective : Comme A est linéaire, il suffit de montrer que son noyau est réduit à {0H }. Soit
x ∈ H tel que A(x) = 0. Alors

0 = hA(x), xi = a(x, x) ≥ αkxk2

par coercivité. Donc x = 0H et A est injective.

20
Pour prouver que A est surjective, il suffit de montrer que l’image de A est fermée et dense, ce
qui implique que Im(A) = H. Dans ce but, notons que, si x ∈ H\{0} et si y = A(x), alors, par
hypothèse de coercivité,

αkxk2 ≤ a(x, x) = hA(x), xi = hy, xi ≤ kykkxk

Donc, comme x 6= 0, on a kxk ≤ kyk/α.

Im(A) est fermé : Soit yn ∈ Im(A) telle que yn → y. Par définition de Im(A) il existe xn ∈ H
tel que A(xn ) = yn . Notons que (xn ) est une suite de Cauchy : en effet, comme (yn ) converge, (yn )
est une suite de Cauchy. Donc, pour tout  > 0, il existe N ≥ 0 tel que

kyn − yn+p k ≤ α ∀n ≥ N, ∀p ≥ 0 .

Mais alors, comme par linéarité, A(xn − xn+p ) = (yn − yn+p ), on a

kyn − yn+p k α
kxn − xn+p k ≤ ≤ = ∀n ≥ N, ∀p ≥ 0 .
α α
Donc (xn ) est de Cauchy. Comme H est complet, (xn ) converge vers un vecteur x ∈ H, et, par
continuité de A, on a A(x) = y. Cela prouve que Im(A) est fermé.

Im(A) est dense : comme Im(A) est un espace vectoriel, il suffit d’établir que Im(A)⊥ = {0H }.
Soit x ∈ Im(A)⊥ . Alors hA(y), xi = 0 pour tout y ∈ H. En particulier, pour y = x, cela donne

0 = hA(x), xi = a(x, x) ≥ αkxk2

par coercivité. Donc x = 0H et Im(A) est dense. En conclusion, A est surjective.


En conclusion, A est une application linéaire bijective de H dans H. Si f ∈ H ∗ , le théorème
de Riesz affirme qu’il existe x0 ∈ H tel que f (y) = hy, x0 i. Mais par bijectivité de A il existe un
unique x̄ ∈ H tel que A(x̄) = x0 . D’où

a(x̄, y) = hA(x̄), y) = hx0 , yi = f (y) ∀y ∈ H .

On suppose finalement que a est symétrique. Soit x̄ ∈ H tel que a(x̄, y) = f (y) pour tout
y ∈ H. Alors, pour tout x ∈ H, on a
1 1
Φ(x) = a(x, x) − f (x) = [a(x̄, x̄) + 2a(x̄, x − x̄) + a(x − x̄, x − x̄)] − f (x̄) − f (x − x̄)
2 2
1
= Φ(x̄) + a(x̄, x − x̄) − f (x − x̄) + a(x − x̄, x − x̄)
2
≥ Φ(x̄) + 0 + α2 kx − x̄k2

ce qui prouve que x̄ est l’unique point de minimum de Φ. 2

21
2 Espaces de Sobolev et équations elliptiques linéaires.
La plus grande partie du chapitre se situe en dimension d’espace égale à 1 ; la dimension supérieure
n’est abordée que dans la dernière partie.

2.1 Espaces de Sobolev sur un intervalle


2.1.1 Définitions et exemples
Soit I un intervalle ouvert non vide de R et p ∈ [1, +∞]. On notera I¯ l’adhérence de I.
On cherche à décrire des fonctions qui n’ont pas de dérivée au sens usuel, mais qui vérifient
quand même des relations d’intégration par parties. Pour cela, nous aurons besoin des remarques
suivantes :

Lemme 2.1 Soit w ∈ Lp (I).


Z
1. Si w(x)φ(x)dx = 0 pour tout φ ∈ Cc1 (I), alors w = 0 p.p. dans I.
I
Z
2. Si w(x)φ0 (x)dx = 0 pour tout φ ∈ Cc1 (I), alors w est constante : il existe un réel C tel que
I
w = C p.p. dans I.
Remarque : Bien noter que la réciproque des assertions ci-dessus est évidente.

Preuve :
1. Fixons a < b, avec a, b ∈ I et montrons que w = 0 p.p. sur [a, b]. Notons que w ∈ L1 ([a, b])
puisque w ∈ Lp ([a, b]). L’étape-clé consiste à montrer qu’il existe une suite de fonctions
φn ∈ Cc1 (I), bornées par 1, telles que φn tend vers sign(w(x)) pour presque tout x ∈ [a, b].
En effet, comme Cc1 ([a, b]) est dense dans L1 ([a, b]), il existe une suite de fonction ψn ∈ Cc1 (I)
qui converge vers sign(w) dans L1 ([a, b]) et donc, à une sous-suite près encore notée (ψn ),
presque partout sur [a, b]. Soit θ : R → [−1, 1] une fonction C ∞ , croissante, telle que θ(0) = 0,
θ(−1) = −1 et θ(1) = 1. Alors la suite de fonctions (φn = θ ◦ ψn ) vérifie les conditions
demandées. Z
Par hypothèse, on a w(x)φn (x)dx = 0. Comme |w(x)φn (x)| ≤ |w(x)| et (w(x)φn (x)) tend
I
vers w(x)sign(w(x)
Z = |w(x)| dans [a, b] et vers 0 en dehors de [a, b], on a, par convergence
dominée, |w(x)|dx = 0, soit w = 0 p.p. dans I.
[a,b]

2. Soit maintenant Rφ ∈ Cc1 (I) et η ∈ Cc1 (I) avec I η = 1. Notons qu’il existe ψ ∈ Cc1 (I) tel que
R

ψ 0 (x) = φ(x) − ( I φ(y)dy)η(x), puisque la fonction x → φ(x) − ( I φ(y)dy)η(x) est à support


R

compact et d’intégrale nulle. On applique l’hypothèse à ψ pour obtenir


Z  Z 
w(x) φ(x) − ( φ(y)dy)η(x) dx = 0
I I
Comme Z Z Z Z
w(x)( φ(y)dy)η(x)dx = φ(x)( w(y)η(y)dy)dx
I I I I
par Fubini et changement de variable, on a
Z  Z 
φ(x) w(x) − ( w(y)η(y)dy) dx = 0
I I

Comme ceci est vrai pour toute fonction φ ∈ Cc1 (I), on en déduitR que w(x)−( I w(y)η(y)dy) =
R

0 p.p., et donc que w est égal presque partout à la constante ( I w(y)η(y)dy).

22
2

Définition 2.2 On dit qu’une fonction u est dans l’espace de Sobolev W 1,p (I) si u ∈ Lp (I) et s’il
existe une fonction w ∈ Lp (I) telle que
Z Z
0
u(x)φ (x)dx = − w(x)φ(x)dx ∀φ ∈ Cc1 (I) .
I I

L’espace le plus utilisé est lorsque p = 2, et on note plutôt H 1 (I) := W 1,2 (I).
Notons que, si I est borné, les fonctions de classe C 1 dans I¯ appartiennent à tous les espaces
W 1,p (I).Si I est non borné, c’est le cas de la restriction à I de toutes les fonctions de classe C 1 et
à support compact dans R.

Remarque : La fonction w est définie de façon unique. En effet, si w1 et w2 vérifient toutes deux
la relation
Z Z Z
u(x)φ0 (x)dx = − w1 (x)φ(x)dx = − w2 (x)φ(x)dx ∀φ ∈ Cc1 (I) ,
I I I

alors Z
(w1 (x) − w2 (x))φ(x)dx = 0 ∀φ ∈ Cc1 (I) .
I
On en déduit (grâce au Lemme 2.1) que w1 = w2 p.p.. On notera u0 = w dans toute la suite. La
relation caractérisant u0 est donc
Z Z
u(x)φ (x)dx = − u0 (x)φ(x)dx
0
∀φ ∈ Cc1 (I) .
I I

Lemme 2.3 Si u appartient à W 1,p (I), alors u possède u représentant continu dans I¯ et
Z y
u(y) − u(x) = u0 (t)dt ∀x, y ∈ I .
x

A partir de maintenant, nous choisirons systématiquement le représentant continu d’une fonc-


tion u ∈ W 1,p (I).
Rx
Preuve *: Pour fixer les idées, on suppose que I =]a, b[. Posons ξ(x) = a u0 (t)dt et fixons
φ ∈ Cc1 (I). On a par Fubini
Z Z Z x Z Z b Z Z
0 0 0 0 0 0
ξ(x)φ (x)dx = u (t)φ (x) dtdx = u (t) φ (x)dx = − u (t)φ(t)dt = u(x)φ0 (x)dx .
I I a I t I I
Z
Donc (ξ(x) − u(x))φ0 (x)dx = 0 pour toute fonction φ ∈ Cc1 (I). Le lemme 2.1 affirme alors qu’il
I
existe une constante C telle que
Z x
u(x) = C + ξ(x) = C + u0 (t)dt p.p. x ∈ I .
a

Montrons maintenant que la fonction ξ est continue dans I. ¯ Comme u0 ∈ Lp (I), on a u0 ∈


L1 ([a, b]). Alors si la suite (xn ) tend vers x dans [a, b], on a
Z
ξ(xn ) = u0 (t)1[a,xn ] (t)dt
[a,b]

23
La suite de fonction (u0 (t)1[a,xn ] (t)) tend p.p. vers la fonction u0 (t)1[a,x] (t) tandis que |u0 1[a,xn ] | ≤
|u0 | où |u0 | est dans L1 ([a, b]). Donc, par théorème de convergence dominée, on a
Z
lim ξ(xn ) = u0 (t)1[a,x] (t)dt = ξ(x) .
n→+∞ [a,b]

Ceci prouve que ξ est continue et, comme u = C + ξ p.p., que u possède un représentant continu.
De plus, par définition de ξ, on a
Z y
ξ(y) − ξ(x) = u0 (t)dt ∀x, y ∈ I .
x

2
En fait, lorsque p > 1, la régularité des fonctions u de W 1,p (I) peut être quantifiée :

Lemme 2.4 Si p > 1 et u ∈ W 1,p (I), alors

|u(y) − u(x)| ≤ ku0 kp |y − x|1−1/p ∀x, y ∈ I¯ .

Preuve *: Fixons x, y ∈ I avec, pour fixer les idées, x < y. En utilisant le résultat précédent ainsi
que l’inégalité de Hölder (avec les fonctions u0 ∈ Lp et v = 1[x,y] ) on obtient, en posant q = p/(p−1)
(i.e., 1/q = 1 − 1/p, avec convention 1/ + ∞ = 0),
Z Z 1/q Z 1/p
|u(y) − u(x)| = | 1[x,y] (t)u0 (t)dt| ≤ 1q[x,y] (t) |u0 (t)|p = |y − x|1−1/p ku0 kp
I I I

Théorème 2.5 L’espace W 1,p (I) est un espace de Banach lorsqu’on le munit de la norme
1/p
kukW 1,p (I) = kukpp + ku0 kpp

De plus, si p = 2, l’espace H 1 (I) = W 1,2 (I) est un espace de Hilbert pour le produit scalaire
Z Z
hu, vi = u(t)v(t)dt + u0 (t)v 0 (t)dt
I I

Preuve* : Le fait que W 1,p (I) est un espace vectoriel et que k · kW 1,p (I) est une norme sur
cet espace est laissé en exercice (facile... à condition de se souvenir que (a, b) → (|a|p + |b|p )1/p est
une norme dans R2 ).
Montrons que W 1,p (I) est complet pour cette norme. Soit (un ) une suite de Cauchy de W 1,p (I).
Alors, comme
kukp ≤ kukW 1,p et ku0 kp ≤ kukW 1,p ∀u ∈ W 1,p ,
les suites (un ) et (u0n ) sont de Cauchy dans Lp . Or Lp est complet, donc ces suites convergent vers
une limite u ∈ Lp et w ∈ Lp respectivement. Reste à montrer que u ∈ W 1,p et que (un ) tend vers
u dans W 1,p . Par définition de W 1,p (I), on a
Z Z
un (x)φ0 (x)dx = − u0n (x)φ(x)dx ∀φ ∈ Cc1 (I) .
I I

On passe facilement à la limite dans chacune des expressions, ce qui donne


Z Z
0
u(x)φ (x)dx = − w(x)φ(x)dx ∀φ ∈ Cc1 (I) .
I I

24
Comme u et w sont dans Lp (I), cela prouve que u ∈ W 1,p (I) et que u0 = w. La convergence de
(un ) vers u dans W 1,p (I) est alors une conséquence immédiate de la convergence de (un ) et (u0n )
vers u et w = u0 dans Lp (I). 2
On admettra par la suite que si u ∈ W 1,p (I), alors u admet une dérivée (usuelle) égale à u0 (x)
en presque tout point x de I. Donc, en pratique, pour montrer qu’une fonction donnée appartient
à W 1,p (I), il suffit

1. de vérifier que u ∈ Lp (I),

2. de prouver que la dérivée (usuelle) u0 (x) de u existe en presque tout point x de I et que
u0 ∈ Lp (I),
Rx
3. et enfin de vérifier qu’il existe x0 ∈ I et α ∈ R tels que u(x) = α + x0 u0 (t)dt.

Attention, le dernier point est essentiel. Par exemple, si u(x) vaut 0 sur [0, 1/2] et 1 sur [1/2, 1],
alors u0 (x) existe et vaut 0 pour tout x 6= 1/2, mais bien sûr, u n’est pas une primitive de 0.

Si u ∈ W 1,p (I) et x ∈ I, alors u est une fonction continue et la quantité u(x) est définie sans
ambiguité. On peut aller un peu plus loin lorsque p > 1 (et en particulier lorsque p = 2) :

Théorème 2.6 (Fonction évaluation) Pour tout x ∈ I, ¯ l’application ex : W 1,p (I) → R, qui à
u ∈ W 1,p (I) associe e0 (u) := u(x), est linéaire continue.
Preuve : L’application est clairement linéaire. Montrons qu’il existe une constante, qui ne
dépend que de I et de p, telle que |ex (u)| ≤ KkukW 1,p . Notons d le diamètre de I (on pose, par
exemple, d = 1 si le diamètre est infini). Comme I a un intérieur non vide, d est strictement positif.
¯ soit ]x − d/2, x] ⊂ I.
De plus, comme I est un intervalle, soit [x, x + d/2[⊂ I, ¯ On suppose pour fixer
les idées qu’on est dans le premier cas et on pose I0 := [x, x + d/2[. Alors, pour tout y ∈ I0 , on a

|u(y)| ≥ |u(x)| − |u(y) − u(x)| ≥ |u(x)| − |x − y|1/q ku0 kLp

d’après le lemme 2.4. Distinguons deux cas : si |u(x)| ≤ 2|d/2|1/q ku0 kLp , alors on a une estimation
de |u(x)|. Sinon, |u(x)| > 2|d/2|1/q ku0 kLp et donc

|u(y)| ≥ |u(x)| − |d/2|1/q ku0 kLp ≥ |u(x)| − |u(x)|/2 = |u(x)|/2.


x+d/2
|u(x)|p
Z
Mais alors, |u(y)|p ≥ (d/2) , et donc |u(x)| ≤ (2/d)1/p kukp .
x 2p
On a donc prouvé que

|ex (u)| = |u(x)| ≤ max{2|d/2|1/q ku0 kLp , (2/d)1/p kukp } ≤ KkukW 1,p

avec K = max{2|d/2|1/q , (2/d)1/p }. 2

2.1.2 Approximation
Commençons par le cas où I = R.

Théorème 2.7 On suppose que p ∈ [1, +∞[. Alors l’espace C ∞ (R) ∩ W 1,p (R) est dense dans
W 1,p (R).

Remarque 2.8 Comme souvent avec les résultats d’approximation, le résultat est faux pour p =
+∞. En fait on peut montrer aussi que Cc∞ (R) est aussi dense dans W 1,p (R).

25
Preuve *: La preuve se fait par convolution. Soit Rφ un noyau de convolution “standard” : φ est
de classe C ∞ , à support dansR [−1, 1], avec φ ≥ 0 et R φ = 1. On pose φ (x) = φ(x/)/. Alors φ
est à support dans [−, ] et R φ = 1.
Soit u ∈ W 1,p (R) et notons u = φ ? u. Rappelons que u est de classe C ∞ et converge vers u
dans Lp (R).
Nous montrons maintenant que u0 = φ ? u0 , ce qui prouve que u0 appartient à Lp (R) (puisque
c’est le cas de u0 ) et converge aussi vers u0 dans Lp (R). En effet, rappelons que u0 = φ0 ? u. Or,
pour tout x ∈ R, la fonction t → φ (x − t) est de classe Cc∞ (R) et, par définition de la dérivée au
sens des distributions, on a
Z Z Z
d
(φ0 ? u)(x) = φ0 (x − t)u(t)dt = − u(t) (φ(x − t))dt = u0 (t)φ (x − t)dt = (φ ? u0 )(x) .
R R dt R

Comme u et u0 convergent respectivement vers u et u0 dans Lp (R) lorsque  → 0, on a que u tend
vers u dans W 1,p (R). 2
On note C ∞ ([a, b]) la restriction à [a, b] des fonctions C ∞ (R).

Théorème 2.9 On suppose que I =]a, b[ est un intervalle ouvert borné. Alors l’espace C ∞ ([a, b])
est dense dans W 1,p (]a, b[) pour tout p ∈ [1, +∞[. Plus précisément, pour tout u ∈ W 1,p (I), il existe
une suite de fonction (un ) qui converge uniformément vers u dans [a, b] et telle que (u0n ) converge
vers u0 dans Lp (I).

Remarque 2.10 1. Comme précédemment, le résultat est faux pour p = +∞.


2. Il n’est pas vrai non plus que Cc∞ (]a, b[) est dense dans W 1,p ([a, b]). Nous verrons plus loin que
l’adhérence de Cc∞ (]a, b[) pour la norme de W 1,p ([a, b]) est l’ensemble W01,p ([a, b]) des fonctions
de W 1,p ([a, b]) qui s’annulent en a et en b.
Preuve * : La preuve se fait en utilisant le théorème précédent et un argument de prolongement
des fonctions de W 1,p (]a, b[) à W 1,p (R). Fixons u ∈ W 1,p (]a, b[) et  > 0. On affirme qu’il existe
w ∈ W 1,p (R) tel que u = w dans [a, b]. En effet, si on pose


 u(x) dans [a, b]
(x − a + 1)u(a) dans [a − 1, a]

w(x) =

 (b + 1 − x)u(b) dans [b, b + 1]
0 ailleurs

alors w est dans W 1,p (R) avec w0 (x) = u0 (x) p.p. dans [a, b], w0 (x) = u(a) dans ]a − 1, a[ et
w0 (x) = −u(b) dans [b, b + 1].
Comme C ∞ (R) ∩ W 1,p (R) est dense dans W 1,p (R), il existe w ∈ C ∞ (R) ∩ W 1,p (R) tel que
kw − w kW 1,p (R) ≤ . Rappelons que w est obtenu par simple convolution de la fonction continue à
support compact w, et donc w converge uniformément vers w dans R tandis que (w0 ) tend vers w
dans Lp (R). Définissons u comme la restriction de w à [a, b]. Alors u ∈ W 1,p ([a, b]), u converge
uniformément vers u dans [a, b] et
ku − u kW 1,p ([a,b]) = ku − u kLp ([a,b]) + ku0 − u0 kLp ([a,b]) ≤ kw − w kLp (R) + kw0 − w0 kLp (R) ≤ 
puisque w = u et w = u dans [a, b]. 2
Une application des techniques précédentes est la formule d’intégration par parties :

Proposition 2.11 On suppose que I =]a, b[ avec a < b réels et p ≥ 1. Si u, v ∈ W 1,p (I), alors
uv ∈ W 1,p (I) et (uv)0 = u0 v + uv 0 . De plus, on a
Z b Z b
0 b
u(x)v (x)dx = [u(x)v(x)]a − u0 (x)v(x)dx
a a

26
Preuve : Comme u et v sont dans W 1,p (I), u et v sont bornés et donc uv 0 + u0 v ∈ Lp (I). Le
reste de la preuve se fait en supposant que p = 1 sans perte de généralité.
Régularisons u et v par des fonctions (un ) et (vn ) de classe C ∞ qui convergent dans W 1,1 (I) et
uniformément sur [a, b] vers u et v respectivement. Comme, pour tout φ ∈ Cc1 (I), on a
Z b Z b Z b
0 0
un vn φ = − (un vn ) φ = − (u0n vn + un vn0 )φ
a a a

on obtient, en passant à la limite,


Z b Z b
0
uvφ = − (u0 v + uv 0 )φ
a a

ce qui prouve que (u0 v + uv 0 ) est la dérivée au sens des distributions de uv. Or uv est borné et
(u0 v + uv 0 ) est dans L1 , ce qui prouve que uv ∈ W 1,1 (I) (dans le cas où p ∈ [1, +∞], le même
argument montre que uv ∈ W 1,p (I)).
Montrons finalement la formule d’intégration par parties : elle est vraie pour un et vn :
Z b Z b
0 b
un (x)vn (x)dx = [un (x)vn (x)]a − u0n (x)vn (x)dx
a a

Comme (un ) (resp. (vn )) converge uniformément vers u (resp. v) et u0n (resp. (vn0 )) converge vers
u0 (resp. v 0 ) dans L1 , on peut passer à la limite dans l’égalité ci-dessus pour obtenir le résultat. 2

2.1.3 L’espace W01,p (I)


On suppose ici que I =]a, b[. On appelle W01,p (I) le sous-ensemble de W 1,p (]a, b[) constitué des
éléments u ∈ W 1,p (]a, b[) tels que u(a) = u(b) = 0.

Proposition 2.12 W01,p (]a, b[) est un sous-espace vectoriel fermé de W 1,p (]a, b[). En particulier,
muni de la distance de W 1,p (]a, b[), c’est un espace de Banach.
L’espace le plus utilisé est lorsque p = 2, et on note plutôt W01,2 (I) = H01 (I) ; c’est un espace
de Hilbert.
Preuve * : Lorsque p > 1, le résultat est évident, puisque l’application ea : W 1,p (]a, b[) → R et
eb : W 1,p (]a, b[) → R, qui à u associent u(a) et u(b), sont linéaires continues. Donc W01,p (]a, b[) est
fermé, comme intersection du noyau de ea et de celui de eb (qui sont fermés par continuité).
Lorsque p = 1, il suffit de prendre la définition : soit (un ) une suite de W01,1 (I) quiZ tend dans
x
W 1,1 vers une fonction u ∈ W 1,1 (I). Alors on sait que, pour tout x ∈ I, un (x) = u0n (t)dt.
a
Comme, en particulier, (un ) tend vers u dans L1 (I), il existe une sous-suite R(unk ) qui tend vers u
x 0
presque partout. Si x ∈ I est un tel élément, on a unk (x) → u(x)
Z x tandis que ( a unk (t)dt) tend vers
Rx 0 1 0 0
a u (t)dt par convergence L de (un ) vers u . Donc u(x) = u0 (t)dt pour presque tout x ∈ I et,
a
par continuité de u, pour tout x ∈ I. En particulier, u(a) = 0. On montre de même que u(b) = 0,
ce qui conclut la preuve de la fermeture de W01,1 (I). 2

Théorème 2.13 Soit p ∈ [1, +∞[. Alors l’espace Cc∞ (]a, b[) est dense dans W01,p (]a, b[).
Idée de la preuve : Quitte à faire une translation, on peut supposer que l’intervalle [a, b] est
symétrique par rapport à 0, i.e. b > 0 et a = −b. Soit u ∈ W01,p ([−b, b]) et δ > 0 fixé. Soit  ∈]0, 1[
et u (x) = u(x/(1−)) si x ∈]−b(1−), b(1−)[ et u (x) = 0 si x ∈ [−b, b]\]−b(1−), b(1−)[. Alors
il est facile de voir que u ∈ W01,p ([−b, b]) avec u0 (x) = u0 (x/(1−))/(1−) si x ∈]−b(1−), b(1−)[

27
et u0 (x) = 0 si x ∈ [−b, b]\] − b(1 − ), b(1 − )[. De plus, on peut montrer que (u ) tend vers u dans
W 1,p ([−b, b]) lorsque  → 0 : la convergence de (u ) vers u dans Lp est directe (en fait uniforme) ;
la partie plus délicate est la convergence de (u0 ) vers u0 , qui se montre comme pour la continuité
des translations dans L1 (R) (en utilisant la densité des fonctions continues dans Lp ).
En particulier, il existe  > 0 tel que ku − u kW 1,p ≤ δ/2. Maintenant u est à support contenu
dans [−b(1 − ), b(1 − )] et peut être approché par régularisation par convolution par une fonction
v ∈ Cc∞ (R) dont le support est continu dans l’intervalle un peu plus grand [−b(1 − /2), b(1 − /2)].
En particulier, on peut prendre v ∈ Cc∞ (] − b, b[) et kv − u kW 1,p ≤ δ/2. Alors ku − vkW 1,p ≤ δ. 2

Théorème 2.14 (Inégalité de Poincaré) Soit p ≥ 1. Il existe une constante C, qui ne dépend
que de b − a et de p, telle que

kukW 1,p (]a,b[) ≤ Cku0 kLp (]a,b[) ∀u ∈ W01,p (]a, b[)

Remarque 2.15 La conclusion de ce résultat est fausse pour W 1,p (]a, b[) (penser aux fonctions
constantes!). De façon à peine plus subtile, elle est fausse pour W 1,p (R) (alors que les fonctions
de W 1,p (R) tendent vers 0 à l’infini : voir exercice) : cela se voit par un argument d’échelle. En
effet, soit u n’importe quel élément de W 1,p (R) et posons u (x) = u(x). Alors u0 (x) = u0 (x), et
donc ku0 kp = 1−1/p ku0 kp , tandis que ku kp = −1/p kukp . Si u 6≡ 0, on ne peut espérer avoir une
constante C > 0 telle que −1/p kukp = ku kp ≤ Cku0 kp = 1−1/p ku0 kp pour tout  > 0.
Preuve : Vu la définition de la norme sur W 1,p (]a, b[), il suffit de montrer l’existence d’une
constante C telle que, pour tout u ∈ W01,p (]a, b[), on a kukp ≤ Cku0 kp . Or, comme u(a) = 0, on a
pour tout x ∈ [a, b],
Z x
|u(x)| = |u(x) − u(a)| = u0 (t)dt ≤ ku0 k1 ≤ (b − a)1−1/p ku0 kp
a

(où la dernière inégalité est obtenue par inégalité de Hölder). Donc

kukp ≤ (b − a)1/p kuk∞ ≤ (b − a)ku0 kp .

2.2 Application aux équations elliptiques en dimension 1


Soit I :=]a, b[ un intervalle de R, avec a < b. On s’intéresse ici aux équations de la forme

(P ) − u00 (x) + c(x)u(x) = f (x) dans ]a, b[, u(a) = u(b) = 0 ,

où c et f sont des applications continues de [a, b] dans R, avec c ≥ 0. Ce problème est le prototype
d’équation elliptique (mais une caricature d’EDP, puisqu’on peut trouver les solutions en résolvant
une EDO ! Attention cependant, ce n’est pas une EDO habituelle : en effet, dans la théorie classique
des EDO, on fixe une condition initiale du type (u(a), u0 (a)), l’EDO étant d’ordre 2. Ici on fixed
une condition initiale u(a) et une condition finale u(b)).

La méthode de résolution est la suivante :


1. on écrit le problème sous une forme faible (dans laquelle la dérivée seconde n’apparaı̂t pas).

2. on utilise le théorème de Lax-Milgram pour montrer que le problème sous sa formulation


faible possède une solution,

3. on montre que cette solution est régulière et solution classique du problème initial.

28
2.2.1 Existence et unicité d’une solution faible
Proposition 2.16 Si u une solution de classe C 2 du problème (P ), alors
Z Z
0 0
∀φ ∈ Cc∞ (I)

u (x)φ (x) + c(x)u(x)φ(x) dx = f (x)φ(x)dx (7)
I I

Preuve* : On multiplie l’équation par φ ∈ Cc∞ (I) et on intègre :


Z Z
00
(−u (x) + c(x)u(x))φ(x)dx = f (x)φ(x)dx ,
I I

ce qui donne, par intégration par parties dans le premier terme :


Z Z
 0 b
−u (x)φ(x) a + (u0 (x)φ0 (x) + c(x)u(x)φ(x))dx = f (x)φ(x)dx ,
I I

Or φ(a) = φ(b) = 0 puisque φ est à support compact. D’où le résultat. 2


Afin de pouvoir utiliser les résultats d’analyse fonctionnelle, on va chercher la solution u dans
un espace a priori plus large que C 2 . Comme l’expression (7) ne comporte que des dérivées d’ordre
1 et qu’on cherche une fonction qui s’annule en a et b, il est naturel de travailler avec H01 (I). Notons
que l’expression (7) a un sens si u et φ sont dans H01 (I) : dans ce cas, u0 et φ0 étant dans L2 , u0 φ0
est dans L1 ; de plus u et φ sont continues, ce qui garantit que cuφ ∈ L1 et f φ ∈ L1 , l’intervalle
I =]a, b[ étant borné. On parle alors de solution faible de (P) :

Définition 2.17 (Formulation faible) On dit que u ∈ H01 (I) est une solution faible de (P) si
Z Z
u0 (x)v 0 (x) + c(x)u(x)v(x) dx = f (x)v(x)dx ∀v ∈ H01 (I)

I I

Au vu de la formulation faible, on pose


Z
u0 (x)v 0 (x) + c(x)u(x)v(x) dx ∀u, v ∈ H01 (I) .

a(u, v) =
I

Lemme 2.18 On suppose que c ∈ L∞ ([a, b]). Alors a est une forme bilinéaire continue sur H01 (I)×
H01 (I).
Preuve* : Comme u0 , v 0 ∈ L2 , le produit u0 v 0 est dans L1 . D’autre part, comme c est dans L∞ ,
le produit cuv est dans L1 (en fait dans L∞ car les fonctions u et v sont continues sur [a, b], donc
bornées). En conséquence, l’intégrale définissant a(u, v) est bien définie. Comme a est clairement
bilinéaire, il suffit de montrer qu’il existe une constante C > 0 telle que
|a(u, v)| ≤ CkukH 1 (I) kvkH 1 (I) ∀u, v ∈ H01 (I) .
D’après Cauchy-Schwarz, on a
Z
u0 v 0 ≤ ku0 k2 kv 0 k2 ≤ kukH 1 (I) kvkH 1 (I) .
I

D’autre part,
Z Z Z
c(x)u(x)v(x) dx ≤ |c(x)u(x)v(x)| dx ≤ kck∞ |u(x)v(x)| dx
I I I
≤ kck∞ kuk2 kvk2 ≤ kck∞ kukH 1 (I) kvkH 1 (I)
Donc
|a(u, v)| ≤ (1 + kck∞ )kukH 1 (I) kvkH 1 (I) .
2

29
Lemme 2.19 On suppose maintenant que c ∈ L∞ ([a, b]), avec c ≥ 0 p.p.. Alors la forme bilinéaire
a est coercive.
Preuve* : On utilise ici l’inégalité de Poincaré, qui affirme l’existence d’une constante C > 0
telle que
kukH 1 (I) ≤ Cku0 k2 ∀u ∈ H01 (I) .
Pour tout u ∈ H01 (I), on a, puisque c ≥ 0,
Z
a(u, u) = ((u0 (x))2 + c(x)(u(x))2 )dx ≥ ku0 k22 ≥ (1/C)kukH 1 (I)
I
2

Proposition 2.20 On suppose que c ∈ L∞ ([a, b]), avec c ≥ 0 p.p. et que f ∈ L2 ([a, b]). Alors il
existe un unique solution faible u ∈ H01 (I) de (P) :
Z Z
0 0
(∗) (u (x)v (x) + c(x)u(x)v(x))dx = f (x)u(x)dx ∀v ∈ H01 (I) .
I I
Z
Preuve* : Posons F (v) = f (x)v(x)dx pour v ∈ H01 (I). Notons que F est une forme linéaire
I
continue puisque F est bien défini (car f et v sont borné), F est clairement linéaire et
Z
|F (v)| ≤ |f (x)| |v(x)| dx ≤ kf k2 kvk2 ≤ kf k2 kvkH 1 (I)
I

pour tout v ∈ H01 (I).


La relation (∗) se réécrit :

(∗∗) a(u, v) = F (v) ∀v ∈ H01 (I) .

Comme F est une forme linéaire continue sur H01 (I) et que a est une forme bilinéaire continue
coercive sur H01 (I) × H01 (I), où H01 (I) est un espace de Hilbert, le théorème de Lax-Milgram affirme
qu’il existe un unique élément u ∈ H01 (I) pour lequel (∗∗) est vrai. 2

2.2.2 Régularité de la solution


Dans cette partie, nous complétons le programme, en montrant que la solution faible construite
auparavant est en fait une solution au sens classique. En étape préliminaire, on a

Lemme 2.21 Sous les hypothèses de la proposition 2.20, si u ∈ H01 (I) est solution faible du
problème, alors u0 ∈ H 1 (I) et (u0 )0 (x) = c(x)u(x) − f (x) presque partout.
Preuve* : On utilise la définition de l’espace de Sobolev H 1 (I) et le fait que u est solution faible
pour déduire que
Z Z Z
0 0
u (x)φ (x)dx = a(u, φ) − c(x)u(x)φ(x)dx = (f (x) − c(x)u(x))φ(x)dx ∀φ ∈ Cc1 (I) .
I I I

Or f − cu est dans L2 (I), puisque c est dans L∞ , u est continue, et f dans L2 . Comme u0 ∈ L2
par hypothèse, on en déduit que u0 est dans H 1 (I) avec u0 = −(f − cu) = cu − f p.p.. 2
Nous pouvons maintenant compléter la démarche :

Théorème 2.22 On suppose que c et f sont continues dans [a, b] et que c ≥ 0 dans [a, b]. Alors
le problème (P ) possède une unique solution de classe C 2 .

30
Preuve* : Si u est une solution de classe C 2 de (P ), alors u est solution faible d’après la
proposition 2.16 et donc il y a au plus une telle solution.
D’autre part, si u ∈ H01 (I) est solution faible du problème, alors nous avons vu ci-dessus que
u ∈ H 1 (I) et (u0 )0 (x) = c(x)u(x) − f (x) presque partout. Or la fonction x → c(x)u(x) − f (x)
0

est continue, ce qui montre que (u0 )0 possède un représentant continu. Donc u est de classe C 2 et
satisfait −u00 + cu = f dans I. Finalement, u(a) = u(b) = 0 puisque u appartient à H01 (I). 2

2.3 Application au problème avec conditions au bord de type Neumann


La démarche décrite précédemment se généralise à de nombreux autres problèmes. On se contente
de décrire celui avec les conditions au bord de type Neumann. Soit I :=]a, b[. On s’intéresse
maintenant au problème
(N ) − u00 (x) + c(x)u(x) = f (x) dans ]a, b[, u0 (a) = u0 (b) = 0 ,
où c et f sont des applications continues de [a, b] dans R, avec c > 0 dans [a, b]. La différence
avec le problème précédent se lit dans les conditions aux limites u0 (a) = u0 (b) = 0 (qui remplace les
conditions de type Dirichlet u(a) = u(b) = 0).
Pour trouver la notion de solution faible, on suppose que la solution u est de classe C 2 et on
multiplie par φ ∈ C ∞ (pas nécessairement nulle au bord de I) : on a alors
Z Z
0 0
∀φ ∈ C ∞ (I)

u (x)φ (x) + c(x)u(x)φ(x) dx = f (x)φ(x)dx
I I
b
car le terme −u0 (x)φ(x) a dans l’intégration par parties est nul grâce aux conditions au bord


u0 (a) = u0 (b) = 0.
Cela conduit à la formulation faible :

Définition 2.23 On dit que u ∈ H 1 (I) est une solution faible de (N) si
Z Z
0 0
∀v ∈ H 1 (I)

u (x)v (x) + c(x)u(x)v(x) dx = f (x)v(x)dx
I I
Comme précédemment, on introduit la forme bilinéaire
Z
u0 (x)v 0 (x) + c(x)u(x)v(x) dx ∀u, v ∈ H 1 (I) .

a(u, v) =
I

Lemme 2.24 On suppose que c est dans L∞ et qu’il existe une constante c0 > 0 telle que c(x) ≥ c0
p.p. sur [a, b]. Alors la forme bilinéaire a est continue et coercive sur H 1 (I).
Noter que l’hypothèse sur c est bien sûr satisfaite dès que c est continue et positive sur [a, b].
Preuve * : La continuité de a se montre comme précédemment. La coercivité vient de l’hypothèse
c > 0 qui, par continuité de c devient c(x) ≥ c0 pour tout x ∈ I, où c0 > 0. D’où, pour tout
u ∈ H 1 (I),
Z Z
0 2 2
(u0 (x))2 + c0 (u(x))2 dx ≥ (1 ∧ c0 )kuk2H 1 .
 
a(u, u) = (u (x)) + c(x)(u(x)) dx ≥
I I
2
H 1 (I)
R
Comme l’application v → I f v est continue sur (cela se montre comme précédemment),
le théorème de Lax-Milgram affirme que le problème (N) possède une unique solution faible : il
existe un unique u ∈ H 1 (I) tel que
Z
a(u, v) = f v ∀v ∈ H 1 (I) .
I
Reste à montrer que u est une solution classique.

31
Lemme 2.25 Si u est la solution faible de (N), alors u0 appartient à H01 (I).
Preuve * : Le fait que u0 ∈ H 1 (I) et que (u0 )0 = f − cu se montre comme précédemment. Nous
montrons maintenant que u0 (a) = u0 (b) = 0. On choisit comme fonction test une fonction qui vaut
0 en b et 1 en a (par exemple v(x) = (b − x)/(b − a)) : alors par définition de la solution faible,
puis intégrations par parties
Z Z
u0 (x)v 0 (x) + c(x)u(x)v(x) dx

f (x)v(x)dx =
I I Z
 0 b
(f (x) − c(x)u(x))v 0 (x) + c(x)u(x)v(x) dx

= u (x)v(x) a −
I

Le choix de v implique que u0 (a) = 0. On fait de même avec une fonction test v qui vaut 1 en b et
0 en a pour obtenir u0 (b) = 0. 2
En conclusion, on a prouvé :

Théorème 2.26 Le problème (P) possède une unique solution classique.

2.4 Espaces de Sobolev en dimension supérieure - formulation faible


Les espaces de Sobolev en dimension supérieure se définissent de façon similaire à ce que nous avons
fait en dimension un. Cependant, nombre de propriétés ne se conservent pas : notamment il n’est
plus vrai que les fonctions de W 1,p soient continues, ni même bornées, pour toutes les valeurs de p.

2.4.1 Définitions
Soit Ω est un ouvert non vide de RN . Pour définir W 1,p (Ω), on part de la formule d’intégration par
parties : si u ∈ C 1 (Ω), v ∈ Cc1 (Ω), alors, pour tout i = 1, . . . , N , on a
Z Z
∂v ∂u
u(x) (x)dx = − (x)v(x)dx
Ω ∂x i Ω ∂x i

C’est une conséquence directe de la formule d’intégration par parties dans R et du théorème de
Fubini.

Définition 2.27 Soit p ∈ [1, +∞]. On dit que u ∈ W 1,p (Ω) si u ∈ Lp (Ω) et s’il existe g1 , . . . , gN ∈
Lp (Ω) tels que Z Z
∂v
u(x) (x)dx = − gi (x)v(x)dx ∀v ∈ Cc1 (Ω) .
Ω ∂xi Ω
Les fonctions gi sont définies de façon unique et s’appellent les dérivées aux sens des distributions
∂u
de u. On utilise par abus de notation l’écriture standard = gi .
∂xi
Notons que, si Ω est borné, les fonctions de classe C 1 dans Ω̄ appartiennent à tous les espaces
W 1,p (Ω). Si Ω est n’est pas borné, c’est le cas de la restriction à Ω de toutes les fonctions de classe
C 1 et à support compact dans RN . L’unicité des dérivées faibles se montre comme en dimension 1.

Contrairement au cas de la dimension 1 d’espace, les fonctions de l’espace de Sobolev u ∈


W 1,p (Ω) ne sont pas continues en général (sauf si p > N , où N est la dimension de l’espace am-
biant : c’est l’inégalité de Morrey (cf. Brézis)).

Par exemple, supposons que Ω est la boule unité de RN et u(x) = kxk−α (avec α > 0). Notons que
∂u
u ∈ Lp (Ω) dès que N − 1 > αp et, comme (x) = −αkxk−α−2 xi (au sens usuel) pour x 6= 0, on a
∂xi

32
∂u
∈ Lp (Ω) lorsque N − 1 > (α + 1)p. On montre aisément que −αkxk−α−2 x1 , . . . , −αkxk−α−2 xN
∂xi
sont les dérivées au sens distribution de u (il suffit d’approcher u par la suite de fonctions un (x) :=
(kxk2 + 1/n)−α/2 qui sont de classe C ∞ et de passer à la limite dans la formule d’intégration par
parties pour un ). Si p = 1 et N ≥ 3 par exemple, on peut prendre α = N − 5/2 et la fonction
(discontinue, non bornée) u appartient à W 1,1 (Ω). En dimension N = 2, on montre de même que
la fonction u(x) = ln(kxk) est dans W 1,p (Ω) si p ∈ [1, 2[.

Proposition 2.28 L’espace W 1,p (Ω) est un espace de Banach lorsqu’on le muni de la norme (pour
p 6= 2)
N
X ∂u
kukW 1,p = kukLp +
∂xi Lp
i=1

Lorsque p = 2, on pose H 1 (Ω) := W 1,2 (Ω) et on choisit plutôt

N
!1/2
2
X ∂u
kukH 1 = kuk2L2 +
∂xi L2
i=1

L’espace H 1 (Ω) est un espace de Hilbert.


La preuve est identique à celle de la dimension 1.

Le fait que les fonctions de u ∈ W 1,p (Ω) n’ont pas de représentant continu implique qu’on ne
peut pas définir de valeur ponctuelle à u(x) pour tout x. En particulier, l’espace W01,p (Ω) (les
fonctions de W 1,p (Ω) qui, au moins heuristiquement, sont nulles sur le bord de Ω) doit être défini
de façon indirecte. Nous avons vu en dimension 1 que W01,p (]a, b[) est l’adhérence des fonctions
Cc∞ (]a, b[) pour la norme W 1,p (]a, b[) : nous utilisons cette idée pour définir W01,p (Ω).

Définition 2.29 W01,p (Ω) est l’adhérence, pour la norme W 1,p , de l’espace Cc∞ (Ω) (ou, de façon
équivalente, de Cc1 (Ω)). Pour p = 2, on pose H01 (Ω) := W 1,2 (Ω).
Par densité, W01,p (Ω) est aussi l’adhérence, pour la norme W 1,p , de l’espace Cc1 (Ω). On interprète
W01,p (Ω) comme l’ensemble des fonctions de W 1,p (Ω) qui sont nulles sur le bord de Ω. Par exemple,
si Ω est un ouvert borné et si u est une fonction constante, alors u appartient à W01,p (Ω), si et
seulement si, u est identiquement nulle (ce qui est rassurant, à défaut d’être convaincant). En effet,
si (un ) est une suite de fonctions de Cc∞ (Ω) qui converge vers u pour la norme W 1,p , par intégration
par parties classique, et en prenant vi (x) = xi ,
Z Z Z
∂vi ∂un
un (x)dx = un (x) (x)dx = − (x)vi (x)dx
Ω Ω ∂xi Ω ∂xi

Or un → u dans Lp (et donc dans L1 puisque Ω est borné) et, de même, ∂u ∂u


∂xi tend vers 0 = ∂xi dans
n

L p 1
R et donc dans L . Comme vi est bornée sur Ω (toujours parce que Ω est borné) , on a finalement
Ω u(x)dx = 0. Comme u est constante, cela implique que u est nulle.

Remarque 2.30 Comme, par définition, W01,p (Ω) est fermé dans W 1,p (Ω) et que W 1,p (Ω) est
complet, W01,p (Ω) est lui-même un espace de Banach, tandis que H01 (Ω) est un espace de Hilbert.

33
2.4.2 Exemples de formulation faible
Une des applications les plus simples est la résolution d’équations de la forme

(E) − ∆u + u = f dans Ω, u = 0 dans ∂Ω


N
X ∂2u
où Ω est un ouvert borné de RN , ∆u = (le laplacien) et f ∈ L2 (Ω).
i=1
∂x2i
Afin de tenir compte du fait qu’on cherche une fonction u qui soit nulle au bord de Ω, il est
naturel de travailler dans l’espace H01 (Ω). Comme en dimension 1, on cherche une formulation
faible : on multiplie l’équation par une fonction v ∈ Cc∞ (Ω) et on intègre pour obtenir
N
!
∂2u
Z X Z
v(x) − (x) + v(x)u(x) dx = f (x)v(x)dx .
Ω i=1
∂x2i Ω

Par intégration par parties, on a


N N Z N Z
!
∂2u ∂2u
Z X X X ∂u ∂v
v(x) − 2 (x) dx = − v(x) 2 (x)dx = (x) (x)dx
Ω ∂xi ∂xi ∂xi ∂xi
i=1 i=1 Ω i=1 Ω

D’où
N Z Z Z
X ∂u ∂v
(x) (x)dx + v(x)u(x) dx = f (x)v(x)dx ∀v ∈ Cc∞ (Ω) .
Ω ∂xi ∂xi Ω Ω
i=1

Comme cette relation a encore un sens si v ∈ H01 (Ω), on introduit la notion de la formulation faible :

Définition 2.31 On dit que u est une solution faible de l’équation (E) si u ∈ H01 (Ω) et si
N Z Z Z
X ∂u ∂v
(x) (x)dx + v(x)u(x) dx = f (x)v(x)dx ∀v ∈ H01 (Ω) .
Ω ∂xi ∂xi Ω Ω
i=1

Le résultat suivant est alors immédiat.

Théorème 2.32 Il existe une unique solution faible à l’équation (E).


Preuve* : La formulation faible se réécrit plus simplement comme
Z
(Ef ) hu, viH 1 = f (x)v(x)dx ∀v ∈ H01 (Ω) .

Comme l’application v → Ω f v est linéaire continue sur H01 (Ω) (par une application directe de
R

Cauchy-Schwarz), le théorème de représentation de Riesz affirme qu’il existe un unique élément


u ∈ H01 (Ω) vérifiant (Ef). Il existe donc une unique solution faible de l’équation. 2

34
3 Distributions tempérées et transformée de Fourier
Les distributions sont des objets mathématiques qui sont définis par leur action sur des fonctions
très régulières : les fonctions de la classe de Schwartz. On pourra alors transposer les actions qui
l’on fait usuellement sur ces fonctions régulières aux distributions “par dualité”.

3.1 Classe de Schwartz


On s’intéresse dans cette partie aux fonctions très régulières sur RN et qui tendent vers 0 à l’infini
plus rapidement que n’importe quelle puissance de 1/kxk. Le prototype de ces fonctions dans R
x2 2
(i.e., en dimension N = 1) est la fonction x → e− 2 . Dans RN , c’est la fonction x → e−kxk /2 .
Nous aurons besoin de la notation suivante : soit α = (α1 , . . . , αN ) ∈ NN un multi-indice et
u ∈ C ∞ (RN ), on pose
∂ |α| u
∂ α u(x) = (x)
∂xα1 1 . . . ∂xαNN
On notera |α| = α1 + . . . αN l’ordre de dérivation. Nous parlerons aussi de polynômes de plusieurs
variables, en définissant le monôme xα = xα1 1 . . . xαNN : un polynôme sur RN sera juste une combi-
naison linéaire finie de tels monômes.

Définition 3.1 On dit que φ appartient à la classe de Schwartz S(RN ) si φ : RN → C est de classe
C ∞ sur RN et si, pour tout entiers naturel n et k,

(1 + kxk2 )n |∂ α φ(x)| < +∞



Nn,k (φ) := sup
x∈RN , α∈NN , |α|=k

On dit qu’une suite de fonctions (φp ) de la classe de Schwartz converge vers φ ∈ S(RN ) si

lim Nn,k (φ − φp ) = 0 ∀n, k ∈ N .


p→+∞

Remarques :

1. Par exemple, les fonctions Cc∞ (RN ) appartiennent à S(RN ). Notons que le seul polynôme de
S(RN ) est le polynôme nul.

2. Nous utiliserons à de multiples reprises le fait que les Nk,n sont positivement homogènes et
vérifient l’inégalité triangulaire :

Nn,k (λφ) = |λ|Nn,k (φ) et Nn,k (φ + ψ) ≤ Nn,k (φ) + Nn,k (ψ) ∀φ, ψ ∈ S(RN ), ∀λ ∈ C .

En particulier S(RN ) est un espace vectoriel sur C.

3. Même si les Nn,k sont en fait des normes sur S(RN ) (car si Nn,k (φ) = 0 alors φ est un polynôme
de degré au plus k ; or le seul polynôme de S(RN ) est le polynôme nul, donc φ = 0), la notion
de convergence dans S(RN ) introduite plus haut ne se réduit pas à la convergence dans une
seule de ces normes. Bien garder en tête que S(RN ) n’est pas un espace vectoriel normé.

Proposition 3.2 On a S(RN ) ⊂ Lp (RN ) pour tout p ∈ [1, +∞]. Plus précisément, pour tout
p ∈ [1, +∞] et pour tout n > N/(2p), il existe une constante Cn,p ≥ 0 telle que

kφkp ≤ Cn,p Nn,0 (φ) ∀φ ∈ S(RN ) .

35
Preuve (*) : En effet, soit p ∈ [1, +∞[ et φ ∈ S(RN ). Pour n > N/(2p), on a Nn,0 (φ) :=
supx∈RN (kxk2 + 1)n |φ(x)| < +∞. En particulier,
+∞
rN −1
Z Z Z
dx
|φ(x)|p dx ≤ (Nn,0 (φ))p = (Nn,0 (φ))p CN dr < +∞
RN RN (kxk + 1)np
2
0 (r2 + 1)np

puisque N − 1 − 2np < −1 (on utilise ici que n > N/(2p)). Pour p = +∞, notons que, par définition
de Nn,0 , on a |φ(x)| ≤ Nn,0 (φ) pour tout x ∈ RN et pour tout n ∈ N. Donc φ ∈ L∞ (RN ). 2
Une des propriétés importantes de la classe de Schwartz est la stabilité par rapport à la dérivation
et la multiplication par un polynôme :

Proposition 3.3 1. Si φ ∈ S(RN ), alors pour tout α ∈ NN , ∂ α φ ∈ S(RN ). De plus, si (φp )


tend vers φ dans S(RN ), alors ∂ α φp tend vers ∂ α φ dans S(RN ).

2. Si P est un polynôme sur RN et φ ∈ S(RN ), alors l’application x → (P φ)(x) := P (x)φ(x)


appartient à S(RN ). De plus, si (φn ) tend vers φ dans S(RN ), alors P φn tend vers P φ dans
S(RN ).
Preuve:

1. (*) Notons que, pour tout n, k,


 0

Nn,k (∂ α φ) := sup (1 + kxk2 )n |∂ α (∂ α φ)(x)| ≤ Nn,k+|α| (φ) < +∞
x∈RN , |α0 |≤k

De plus, si (φp ) tend vers φ dans S(RN ), alors, pour tout n, k,

Nn,k (∂ α φp − ∂ α φ) ≤ Nn,k+|α| (φ − φp ) → 0 .

Donc (∂ α φp ) tend vers ∂ α φ dans S(RN ).

2. Pour simplifier l’exposé, on ne fait la preuve qu’en dimension N = 1. Comme S(R) est un
espace vectoriel, il suffit de montrer le résultat pour un monôme de la forme P (x) = xα ,
α ∈ N∗ . Par formule de Leibnitz, on a, pour tout k,
k
X
(P φ)(k) = Ckr φ(r) P (k−r)
r=0

α!
où P (k−r) (x) = xα−k+r si k − r ≤ α, 0 sinon. Donc, pour tout n, k,
(α − k + r)!
k
X α!  
Nn,k (P φ) ≤ Ckr sup (1 + x2 )n |x|α−k+r φ(r) (x)
(α − k + r)! x∈R
r=max{0,k−α}
k
X α!
≤ Ckr Nr,n+α−k+r (φ) < +∞
(α − k + r)!
r=max{0,k−α}

De même, si (φp ) dans vers φ dans S(R), alors, quand p → +∞,


k
X α!
Nn,k (P φ − P φp ) ≤ Ckr Nr,n+α−k+r (φ − φp ) → 0 .
(α − k + r)!
r=max{0,k−α}

Donc (P φp ) tend vers P φ dans S(R).

36
2
Une autre propriété importante de la classe de Schwartz est la stabilité par transformée de
Fourier : rappelons que, si φ ∈ L1 (RN ), alors la transformée de Fourier de φ est la fonction
continue et bornée Z
F(φ)(x) = eihx,yi φ(y)dy ∀x ∈ RN ,
RN
tandis que la transformée de Fourier inverse de φ est donnée par
Z
1
F(φ)(x) = e−ihx,yi φ(y)dy ∀x ∈ RN .
(2π)N RN
1 1
Notons F(f )(x) = N
F(f )(−x) = F(f ] )(x) pour tout x ∈ RN , où f ] (x) = f (−x). Dans
(2π) (2π)N
ce qui suit, on utilise les notations suivantes :(−ix)α := (−i)|α| xα et (ix)α := i|α| xα .

Théorème 3.4 La transformée de Fourier F est une application linéaire continue bijective de
S(RN ) dans lui-même, et a pour inverse F :

FF(φ) = FF(φ) = φ ∀φ ∈ S(RN ) .

De plus, pour tout multi-indice α ∈ NN , on a

F(∂ α φ)(x) = (−ix)α F(φ)(x) ∀x ∈ RN (8)

tandis que
F((ix)α φ)(x) = ∂ α F(φ)(x) ∀x ∈ RN . (9)
Enfin, on peut remplacer F par F dans les énoncés ci-dessus.
Preuve : A nouveau, pour simplifier les notations, on travaille en dimension N = 1. On
rappelle que F est une bijection de L2 (R) dans lui-même, d’inverse F. D’autre part, il est bien
connu que, si f ∈ C 1 (R) est tel que f ∈ L1 (R) et f 0 ∈ L1 (R), alors F(f 0 )(x) = (−ix)F(f )(x) pour
tout x ∈ R. Comme F(f 0 ) est bornée, cela prouve que (1 + |x|)F(f ) est bornée. Inversement, si
(1 + |x|)f ∈ L1 (R), alors F(f ) ∈ C 1 (R) avec F(f )0 = F((ix)f ).
Lorsque φ ∈ S(R), alors on montre par récurrence que, comme φ est de classe C ∞ et que toutes
ses dérivées sont dans L1 (R), la fonction (1 + |x|)n F(φ) est bornée pour tout n ∈ N. D’autre part,
comme (1 + x2 )n φ est borné pour tout n, la fonction F(φ) est de classe C ∞ . On montre également
par récurrence les relations (8) et (9). Quant à la preuve, un peu plus calculatoire, de la continuité
de F, elle vient de la définition de la convergence dans S(RN ) combinée à (8) et de (9). 2

Proposition 3.5 Si f, g ∈ S(RN ), alors


Z Z
F(f )g = f F(g)
RN RN

Preuve (*) : C’est une conséquence directe du théorème de Fubini : comme (x, t) →
iht,xi
f (t)e g(x) est dans L1 (R2N ) (car f et g sont dans L1 (RN )), on a
Z Z Z  Z Z  Z
iht,xi iht,xi
F(f )g = f (t)e dt g(x)dx = f (t) e g(x)dx dt = f F(g) .
RN RN RN RN RN RN

37
Proposition 3.6 (Stabilité par convolution) L’application qui, à tout couple (φ, ψ) ∈ S(RN )×
S(RN ) associe φ ? ψ est bilinéaire et continue de S(RN ) × S(RN ) dans S(RN ). De plus, si φ, ψ ∈
S(RN ), alors
F(φ ? ψ) = F(φ)F(ψ), F(φψ) = (2π)−N F(φ) ? F(ψ)
Preuve : Montrons d’abord les deux dernières égalités : on a, pour tout t ∈ RN et en utilisant
le théorème de Fubini
Z Z Z 
iht,xi iht,yi iht,x−yi
F(φ ? ψ)(t) = φ(x − y)ψ(y)e dydx = ψ(y)e φ(x − y)e dx dy
ZR2N Z RN Z RN

= ψ(y)eiht,yi φ(z)eiht,zi dz dy = ψ(y)eiht,yi F(φ)(t)dy


RN RN RN
= F(φ)(t)F(ψ)(t) .

(où on a effectué le changement de variable z = x − y dans la troisième égalité).


Lorsque l’on fait exactement le même calcul avec F à la place de F, on obtient :

F(φ ? ψ) = (2π)N F(φ)F(ψ)

Pour montrer la seconde égalité de la proposition, prenons l’image F de l’égalité F(φ ? ψ) =


F(φ)F(ψ). On a, d’après la remarque précédente (utilisée pour F(φ) et F(ψ) à la place de φ et
ψ) :
F (2π)−N F(φ) ? F(ψ) = FF(φ) FF(ψ) = φψ


On reprend l’image par F de l’égalité précédente pour obtenir (2π)−N F(φ) ? F(ψ) = F(φψ).
Montrons finalement que φ?ψ ∈ S(RN ). Comme φ, ψ ∈ S(RN ), on a aussi F(φ), F(ψ) ∈ S(RN ).
Donc F(φ)F(ψ) ∈ S(RN ) (ceci se montre facilement en utilisant la formule de Leibnitz). Comme
F(φ ? ψ) = F(φ)F(ψ), on a φ ? ψ = FF(φ ? ψ) ∈ S(RN ), puisque S(RN ) est stable pour F. La
continuité se prouve de même. 2

3.2 Distributions tempérées


Définition 3.7 Une distribution tempérée est une application linéaire continue de S(RN ) dans C.
L’espace des distributions tempérées est noté (fort logiquement) S 0 (RN ).
Remarques :

1. L’ensemble S 0 (RN ) des distributions tempérées forme un espace vectoriel sur C.

2. On peut démontrer (mais nous ne le ferons pas) que, si T est une forme linéaire sur S(R),
alors T ∈ S 0 (RN ) (i.e., T est continue), si et seulement si, il existe deux entiers m et n et une
constante C > 0 tels que
X
|T (φ)| ≤ C Nn,k (φ) ∀φ ∈ S(RN ) .
k≤m

Dans ce cas, on dit que T est d’ordre m si m est le plus petit indice pour lequel l’inégalité
ci-dessus a lieu.

3. Si T ∈ S 0 (RN ), le support de T est le plus petit fermé K ⊂ RN tel que

∀φ ∈ S(RN ) ∩ Cc∞ (RN \K), T (φ) = 0.

Exemples

38
1. Si f ∈ Lp (RN ), avec p ∈ [1, +∞], alors
Z
Tf (φ) = f (x)φ(x)dx ∀φ ∈ S(RN )
RN

définit une distribution tempérée d’ordre 0 (grâce à la proposition 3.2 et l’inégalité de Hölder).
Son support est celui de f .

2. La masse de Dirac : L’application

T (φ) = φ(0) ∀φ ∈ S(RN )

définit aussi une distribution tempérée d’ordre 0. Notons qu’on peut l’identifier à la masse
de Dirac δ0 en 0 : Z
T (φ) = φ(x)dδ0 (x)
RN
Par abus de langage, nous dirons que T = δ0 et verrons δ0 comme une distribution tempérée
particulière.

3. Valeur principale : On suppose que N = 1. Pour tout φ ∈ S(R), la limite


Z
φ(x)
T (φ) = lim dx
→0+ R\]−,[ x

existe. Cette limite définit une distribution tempérée d’ordre 1, habituellement notée vp.

φ(x)
Preuve : La fonction x → est clairement intégrable sur R\] − , [. Notons que
x
φ(x) − φ(0)
l’application x → est continue en 0, avec pour limite φ0 (0) lorsque x → 0. Donc,
x
pour  ∈]0, 1[,
φ(x) − φ(0)
Z Z Z
φ(x) φ(0)
dx = dx + dx
[−1,1]\]−,[ x [−1,1]\]−,[ x [−1,1]\]−,[ x

où le premier terme à droite possède une limite lorsque  → 0+ tandis que le second est nul
car 1/x est impaire. En particulier,
Z
φ(x)
dx ≤ kφ0 k∞ .
[−1,1]\]−,[ x

tandis que
Z
φ(x)
dx ≤ kφkL1 (R)
R\[−1,1] x
Ceci montre que T est continue et d’ordre au plus 1. Pour montrer que T est d’ordre 1,
supposons au contraire que T soit d’ordre 0. Alors il existe n ∈ N et C > 0 tels que

|T (φ)| ≤ C sup (1 + x2 )n φ(x) ∀φ ∈ S(RN ) .


x∈R

Pour p ∈ N∗ > 0, on définit φp comme étant la fonction de S(R) donnée par φp (x) =
th(px)ψ(x) où ψ est une fonction Cc∞ (R), qui vaut 1 sur [−1, 1], 0 en dehors de [−2, 2],
positive sur R. Alors φp est positive sur R+ et négative sur R− et on a, puisque |th(x)| ≤ 1
sur R,
|T (φp )| ≤ C sup (1 + x2 )n φp (x) ≤ C 0
x∈R

39
où C 0 est une constante indépendante de p. Alors, comme φp (x)/x est positif sur R∗ , on a,
par Fatou, Z 1 Z 1
th(px) dx
C 0 ≥ lim inf T (φp ) ≥ lim inf dx ≥ = +∞ ,
p→+∞ p→+∞ 0 x 0 x
ce qui est impossible. 2

Proposition 3.8 Soit P un polynôme de RN et T ∈ S 0 (RN ). Alors l’application P T définie par

(P T )(φ) = T (P φ) ∀φ ∈ S(RN )

est une distribution tempérée.


Preuve (*) : Nous avons vu ci-dessus que P φ ∈ S(RN ) pour tout φ ∈ S(RN ). De plus
l’application φ → P φ est continue de S(RN ) dans lui-même. Ceci prouve que P T est continue de
S(RN ) dans R. 2

Proposition 3.9 (Dérivée d’une distribution tempérée) Si T ∈ S 0 (RN ) et α ∈ NN un multi-


indice. La distribution tempérée ∂ α T est définie par

∂ α T (φ) = (−1)|α| T (∂ α φ) ∀φ ∈ S(RN )

Preuve (*) : La preuve est identique à la démonstration de la proposition précédente. 2


Exemple : Si N = 1 et T = δ0 , alors

T 0 (φ) = −φ0 (0) ∀φ ∈ S(R)

Définition 3.10 (Transformée de Fourier d’une distribution) Pour tout T ∈ S 0 (RN ), l’application
FT définie par
FT (φ) = T (F(φ)) ∀φ ∈ S(RN )
est une distribution tempérée. De plus, pour tout multi-indice α ∈ NN ,

F(∂ α T ) = (−ix)α FT et F((ix)α T ) = (FT )(α)

Preuve (*) : C’est une conséquence directe des propriétés des fonctions de la classe de
Schwartz. 2
Exemples : On suppose ici que N = 1 pour fixer les idées.
1. La distribution Fδ0 est donnée par définition par
Z
F(δ0 )(φ) = F(φ)(0) = φ(x)dx = T1 (φ).
R

Donc on peut assimiler la distribution F(δ0 ) à la fonction constante égale à 1 : F(δ0 ) = 1.

2. Inversement, si T = 1, i.e., T est la distribution


Z
T (φ) = φ(x)dx ∀φ ∈ S(R) ,
R

alors F(T ) = 2πδ0 . En effet, comme F(δ0 ) = 1, on a δ0 = FF(δ0 ) = F(T ), où


Z
F(T )(φ) = T (F(φ)) = F(φ)(x)dx
Z R
1 1 1
=√ F(φ)(−x)dx = F(φ)(x)dx = F(T )(φ)
2π R 2π 2π

40
On peut également définir la convolution d’une distribution pondérée avec une fonction de la
classe de Schwartz : pour cela, notons que, pour tout ψ ∈ S(R) et pour tout x ∈ R, la fonction
y → ψ(x − y) est également dans S(R).

Proposition 3.11 Soit T ∈ S 0 (R) et ψ ∈ S(R), on pose

(T ? ψ)(x) = T (ψ(x − ·)) ∀x ∈ R .

Alors nous admettrons que T ? ψ est aussi la distribution tempérée donnée par

(T ? ψ)(φ) = T (ψ ] ? φ) ∀φ ∈ S(R) ,

où ψ ] (x) = ψ(−x). De plus


F(T ? ψ) = F(ψ)F(T ) . (10)
Exemple : Si on prend T = δ0 , alors

(δ0 ? ψ)(x) = δ0 (ψ(x − ·)) = φ(x)

Donc δ0 ? ψ = ψ pour tout ψ ∈ S(RN ).

Preuve de l’égalité (10) (*) : On rappelle (cf. Proposition 3.6) que F(a) ? F(b) = (2π)N F(ab)
et F(a) = (2π)N F(a) pour tout a, b ∈ S(RN ). Donc pour tout φ ∈ S(RN ), on a
] ]
F(T ? ψ)(φ) = (T? ψ)(F(φ))
 = T (ψ? F(φ)) =T (FF(ψ ) ? F(φ))

= T (2π)N F F(ψ ] )φ = F(T ) (2π)N F(ψ ] )φ = F(T ) (F(ψ)φ)
= (F(ψ)F(T )) (φ) ,

ce qui prouve l’égalité F(T ? ψ) = F(ψ)F(T ) . 2

3.3 Applications à l’équation de Laplace


Soit f ∈ S(RN ). On cherche à résoudre l’équation de Laplace

(L) − ∆u = f dans RN

avec u(x) → 0 lorsque kxk → +∞.

Définition 3.12 On appelle solution fondamentale de l’équation de Laplace une distribution tempérée
E ∈ S 0 (RN ) telle que
−∆E = δ0
au sens des distributions.
Un des intérêts de la solution fondamentale est de permettre de résoudre (L) directement :

Proposition 3.13 Si E est une (la) solution fondamentale de l’équation de Laplace et f ∈ S(RN ),
alors u = E ? f vérifie −∆u = f .
Preuve (*) : En effet, on a

−∆(E ? f ) = (−∆E) ? f = δ0 ? f = f .

41
La relation −∆E = δ0 s’écrit en Fourier : F(−∆E) = F(δ0 ) = 1. Or
N
X
F(∆E) = (−ixk )2 F(E) = −kxk2 F(E) ,
k=1

d’où kxk2 F(E) = 1. En particulier, si F(E) = 1/kxk2 , on obtient une solution de notre problème.
En dimension N ≥ 3, la fonction x → 1/kxk2 est localement intégrable et tend vers 0 à l’infini.
Donc elle définit une distribution T par la formule
Z
φ(x)
T (φ) = 2
dx ∀φ ∈ S(RN ) .
RN kxk

Par inversion de Fourier, on a alors E = FF(E) = F(T ). On peut vérifier (mais cela demande un
peu de calcul) que F(T ) = cN kxk2−N où cN est une constante qui dépend de la dimension.

Proposition 3.14 En dimension N = 2, la distribution distribution tempérée définie par


Z
1
E(φ) = − ln(kxk)φ(x)dx
2π R2

est une solution fondamentale de l’équation de Laplace.


Preuve : Posons φ̃(r, θ) = φ(r cos(θ), r sin(θ)) pour (r, θ) ∈]0, +∞[×]0, 2π[. Alors

∂ 2 φ̃ 1 ∂ φ̃ 1 ∂ 2 φ̃
∆φ = + +
∂r2 r ∂r r2 ∂θ2
Comme x → ln(kxk)∆φ(x) est dans L1 (R2 ), on a, par passage en coordonnées polaires,
Z Z
ln(kxk)∆φ(x)dx = lim ln(kxk)∆φ(x)dx
R2 →0+ kxk>

où !
2π +∞
∂ 2 φ̃ 1 ∂ φ̃ 1 ∂ 2 φ̃
Z Z Z
ln(kxk)∆φ(x)dx = r ln(r) + +
kxk> 0  ∂r2 r ∂r r2 ∂θ2

∂ 2 φ̃
Z
Notons que dθ = 0 pour tout r > 0 et que, pour tout θ ∈]0, 2π[,
0 ∂θ2
" #+∞
+∞ +∞
∂ 2 φ̃
Z Z
∂ φ̃ ∂ φ̃
r ln(r) 2 = r ln(r) − (1 + ln(r)) dr
 ∂r ∂r  ∂r
 Z +∞
∂ φ̃ ∂ φ̃
= − ln() (, θ) + φ̃(, θ) − ln(r) dr
∂r  ∂r

car φ et toutes ses dérivées sont à décroissance rapide. Donc


!
Z Z 2π
∂ φ̃
ln(kxk)∆φ(x)dx = − ln() (, θ) + φ̃(, θ) dθ → 2πφ(0) = 2πδ0 (φ)
kxk> 0 ∂r

lorsque  → 0. Donc on a bien −∆E = δ0 . 2

42
A Brefs rappels d’intégration
A.1 Quelques résultats fondamentaux en intégration
Soit (X, A, µ) un espace mesuré : X est un ensemble, A une tribu sur X et µ une mesure sur A.
Un exemple typique est le triplet (R, B, λ), où B est la tribu borélienne de R (i.e., la plus petite
tribu contenant les ouverts de R) et où la mesure λ est la mesure de Lebesgue de R (i.e., l’unique
mesure sur B vérifiant λ(]a, b[) = b − a pour tout couple de réels a < b).
Rappelons qu’une fonction f : X → R est dite mesurable si

f −1 (S) ∈ A ∀S ∈ B 1

ou, de façon équivalente,


∀a ∈ R, f −1 (] − ∞, a]) ∈ A .
La mesurabilité est une propriété stable par addition, par multiplication, par passage au sup, et
par limite simple : si f et g sont mesurables et λ est un scalaire, alors f + g, f g, λf , sup{f, g} le
sont, et si (fn ) est une suite de fonctions mesurables qui converge simplement vers une fonction f ,
alors f est également mesurable.
R
Rappelons également que, si f : X → R est une fonction mesurable et positive, alors X f (x)dµ(x)
est une quantité bien définie, qui appartient à [0, , +∞]. Lorsque cette quantité est finie, on dit
que f est intégrable. Plus généralement, si f : X → R, on dit encore que f est intégrable si |f | est
intégrable (noter que |f | = max{f, −f }, donc |f | est encore mesurable). Dans ce cas
Z Z Z
f (x)dµ(x) := +
f (x)dµ(x) − f − (x)dµ(x) où f + = max{f, 0} et f − = max{−f, 0} .
X X X

Rappelons enfin qu’une propriété P(x) définie pour x ∈ X est vraie µ−presque partout s’il existe
un ensemble de mesure nulle N telle que P(x) est vraie pour tout x ∈ X\N .

Voici quelques inégalités classiques qui permettent de majorer des intégrales :

Proposition A.1 Soit (X, A, µ) un espace mesuré.

• (inégalité triangulaire) si f est intégrable, alors


Z Z
f dµ ≤ |f |dµ
X X

• (inégalité de Jensen) Soit µ(X) = 1 et f intégrable. On suppose que a < f < b µ−p.p. (où
−∞ ≤ a < b ≤ +∞). Soit Φ :]a, b[→ R une fonction convexe. Alors
Z  Z
Φ f dµ ≤ Φ(f )dµ
X X

où le membre de droite est bien défini et appartient à ] − ∞, +∞].

Voici trois résultats de convergence qu’il faut très bien connaı̂tre :

Proposition A.2 (Convergence monotone) Si (fn ) est une suite croissante de fonctions mesurables,
positives, alors Z Z
lim fn (x)dµ(x) = lim fn (x)dµ(x) .
n→+∞ X X n→+∞

43
Lemme A.3 (de Fatou) Si (fn ) est une suite de fonctions mesurables positives, alors
Z Z
lim inf fn (x)dµ(x) ≤ lim inf fn (x)dµ(x)
X n→+∞ n→+∞ X

Théorème A.4 (Convergence dominée) Si (fn ) une suite de fonctions mesurables qui converge
presque partout vers une fonction f et pour laquelle il existe une fonction intégrable g telle que

|fn (x)| ≤ g(x) pour µ−presque tout x ∈ X, pour tout n ∈ N.

Alors f est intégrable et Z Z


lim fn dµ = f dµ .
n X X

Remarque A.5 De plus, la convergence de (fn ) vers f a lieu au sens L1 :


Z
lim |f − fn |dµ = 0 .
n→+∞ X

A.2 Les espaces Lp


Soit (X, A, µ) un espace mesuré et p un réel supérieur ou égal p
Z à 1. L’espace L (X, µ) est l’ensemble
des fonctions mesurables f : X → R telles que l’intégrale |f (x)|p dµ(x) est finie. Sur Lp (X, µ),
X
on définit la relation d’équivalence f ∼ g si f = g µ−p.p. On note Lp (X, µ) l’ensemble des classes
d’équivalences de ∼. L’idée est que l’on peut manipuler les éléments de Lp (X, µ) à peu près comme
ceux de Lp (X, µ) : en particulier, si f, g ∈ Lp (X, µ), on peut définir f + g en prenant la classe
d’équivalence de n’importe somme f˜ + g̃ où f˜ et g̃ sont des représentants de f et g (exercice).

Lorsque p = +∞, on définit L∞ (X, µ) l’ensemble des (classes d’équivalence de) fonctions qui
sont essentiellement bornées : f ∈ L∞ (X, µ) si f est mesurable et s’il existe une constante C ≥ 0
telle que |f | ≤ C µ−p.p. La norme kf k∞ est alors la plus petite constante C pour laquelle cette
inégalité est vérifiée.

Soit p ∈]1, +∞[. On appelle exposant conjugué de p le nombre réel p0 tel que
1 1 p
+ 0 =1 i.e., p0 = p−1 .
p p

En particulier, p0 > 1. Si par exemple p = 2, alors p0 = 2. Lorsque p = 1, on pose par convention


p0 = +∞, tandis que lorsque p = +∞, on pose p0 = 1.
0
Lemme A.6 (Inégalité de Hölder) Soit p ∈ [1, +∞] et f ∈ Lp (X, µ) et g ∈ Lp (X, µ), alors
f g ∈ L1 (X, µ) et
Z Z  1 Z  10
p p
p p0
f g dµ ≤ |f | dµ |g| dµ
X X X

Remarque : Une conséquence très importante de l’inégalité de Hölder, est la suite d’inclusion
suivantes :

si µ(X) < +∞, alors L∞ (X) ⊂ Lp (X) ⊂ Lr (X) ⊂ L1 (X) ∀1 ≤ r ≤ p ≤ +∞ .

Par contre, aucune de ces inclusions n’est vraie si µ(X) = ∞.

44
Pour montrer ces inclusions (*), il suffit de prendre r < p et, si u ∈ Lp (X), on peut appliquer
l’inégalité de Hölder aux fonctions f = |u|r et g = 1 avec le coefficient θ = p/r > 1 et θ0 = θ/(θ −1) :
Z Z 1/θ Z 1/θ0 Z 1/θ0
r rθ θ0 1/θ0 p
|u| dµ ≤ |u| dµ 1 = (µ(X)) |u| dµ < +∞
X X X X

Donc u ∈ Lr (X). 2
Pour f ∈ Lp (X, µ), on pose
Z 1
p
p
kf kp = |f (x)| dµ(x)
X

Rappelons l’inégalité de Minkowski : si f, g ∈ Lp (X, µ), alors f + g ∈ Lp (X, µ) et

kf + gkp ≤ kf kp + kgkp .

En particulier, k · kp est une norme sur Lp (X, µ).

Théorème A.7 (Riesz-Fischer) L’espace Lp (X, µ), muni de la norme k · kp , est un espace de
Banach. Lorsque p = 2, l’espace L2 (X, µ) est un espace de Hilbert lorsqu’on le munit du produit
scalaire Z
hf, gi = f (x)g(x)dµ(x) ∀f, g ∈ L2 (X, µ) .
X

Rappelons que la convergence dans Lp n’implique pas en général la convergence ponctuelle,


ni même la convergence presque partout. Par contre, si (fn ) converge vers f dans Lp (pour p ∈
[1, +∞]), alors il existe une sous-suite (fnk ) qui converge presque partout vers f .
En effet, supposons que p < +∞ (pour p = +∞ c’est évident). Comme (fn ) est une suite de
Cauchy dans Lp , il existe une sous-suite (fnk ) telle que
1
kfnk+1 − fnk kp ≤ ∀k ≥ 0 .
2k
Pn
Donc, si on pose gn = k=0 |fnk+1 − fnk |, on a kgn kp ≤ 1. Par convergence monotone, cela
implique que la limite ponctuelle g de la suite croissante (gn ) vérifie également kgkp ≤ 1. En
particulier
P X∞ := {x ∈ X , g(x) = +∞} est P de mesure nulle. Pour tout x ∈ X\X∞ , on a
k |fnk+1 (x) − fnk (x)| < +∞, et donc la série k (fnk+1 (x) − fnk (x)) est absolument convergente,
donc convergente. On en déduit que la limite f¯(x) de la suite (fnk (x)) existe pour presque tout x.
Mais, d’après le lemme de Fatou, on a
Z Z
|f (x) − f¯(x)|p dµ(x) ≤ lim inf |f (x) − fnk (x)|p dµ(x) = 0
X k→+∞ X

où la dernière égalité vient du fait que (fnk ) tend vers f dans Lp . On en déduit que f¯ = f p.p., et
donc que la suite (fnk ) tend vers f p.p.. 2

A.3 Intégration sur un espace produit


Soient (X1 , A1 , µ1 ) et (X2 , A2 , µ2 ) deux espace mesurés. On appelle tribu produit de A1 et A2 la
tribu engendrée par le produit A1 × A2 (qui n’est pas une tribu en général). On note cette tribu
produit A1 ⊗ A2 .
On montre qu’il existe une unique mesure µ sur X1 × X2 telle que

µ(A1 × A2 ) = µ1 (A1 )µ2 (A2 ) ∀(A1 , A2 ) ∈ A1 × A2 .

Cette mesure est notée µ1 ⊗ µ2 et est appelée la mesure produit de µ1 et µ2 .

45
Théorème A.8 (Fubini 1—pour les fonctions positives) Soit f : X1 × X2 → R une applica-
tion mesurable par rapport à la tribu produit A1 ⊗ A2 et positive. Alors
R
1. L’application h1 (x1 ) := X2 f (x1 , x2 )dµ2 (x2 ) est mesurable et
Z Z
h1 (x1 )dµ1 (x1 ) = f (x1 , x2 )d(µ1 ⊗ µ2 )(x1 , x2 ) .
X1 X1 ×X2

R
2. L’application h2 (x2 ) := X1 f (x1 , x2 )dµ1 (x1 ) est mesurable et
Z Z
h2 (x2 )dµ2 (x2 ) = f (x1 , x2 )d(µ1 ⊗ µ2 )(x1 , x2 ) .
X2 X1 ×X2

3. En particulier,
Z
f d(µ1 ⊗ µ2 )
X1 ×X2Z Z  Z Z 
= f (x1 , x2 )dµ2 (x2 ) dµ1 (x1 ) = f (x1 , x2 )dµ1 (x1 ) dµ2 (x2 ) .
X1 X2 X2 X1

Toutes les intégrales ci-dessus sont bien définies, et appartiennent à [0, +∞].

Remarque A.9 En pratique, le résultat ci-dessus permet de montrer qu’une fonction f = f (x1 , x2 )
est intégrable. Lorsque c’est le cas, on peut alors appliquer le théorème de Fubini 2 :

Théorème A.10 (Fubini 2—pour les fonctions intégrables) Soit f : X1 × X2 → R une ap-
plication intégrable par rapport à la mesure produit µ1 ⊗ µ2 . Alors
R
1. L’application h1 (x1 ) := X2 f (x1 , x2 )dµ2 (x2 ) est définie pour µ1 −presque tout x1 , est intégrable,
et Z Z
h1 (x1 )dµ1 (x1 ) = f d(µ1 ⊗ µ2 ) .
X1 X1 ×X2
R
2. L’application h2 (x2 ) := X1 f (x1 , x2 )dµ1 (x1 ) est définie pour µ2 −presque tout x2 , est intégrable,
et Z Z
h2 (x2 )dµ2 (x2 ) = f d(µ1 ⊗ µ2 ) .
X2 X1 ×X2

3. En particulier,
Z
f d(µ1 ⊗ µ2 )
X1 ×X2Z Z  Z Z 
= f (x1 , x2 )dµ2 (x2 ) dµ1 (x1 ) = f (x1 , x2 )dµ1 (x1 ) dµ2 (x2 ) .
X1 X2 X2 X1

Remarque A.11 Un exemple particulièrement simple d’application est lorsque f1 et f2 sont


intégrables par rapport à µ1 et µ2 respectivement. Alors la fonction f (x1 , x2 ) = f1 (x1 )f2 (x2 )
est intégrable par rapport à à la mesure produit µ1 ⊗ µ2 et
Z Z  Z 
f (x1 , x2 )d(µ1 ⊗ µ2 )(x1 , x2 ) = f1 (x1 )dµ1 (x1 ) f2 (x2 )dµ2 (x2 ) .
X1 ×X2 X1 X2

46
A.4 Un peu de calcul intégral
Nous aurons besoin de faire un tout petit peu de calcul intégral dans RN (pour N ≥ 2) et d’utiliser le
passage en coordonnées polaires. Pour cela, on gardera en tête que, si u : RN → R est une fonction
radiale, i.e., s’il existe une fonction ũ : [0, +∞[→ R telle que u(x) = ũ(kxk), alors u ∈ L1 (RN ), si
et seulement si, la fonction r → rN −1 ũ(r) appartient à L1 ([0, +∞[). Dans ce cas, on a
Z Z +∞
u(x)dx = CN rN −1 ũ(r)dr
RN 0

où CN est le volume (pour la mesure de Lebesgue) de la boule unité de RN .


Dans le cas particulier où N = 2, si u : R2 → R, on pose ũ(r, θ) = u(r cos(θ), r(sin(θ)) pour
(r, θ) ∈ [0, +∞[×[0, 2π[, Alors on a par changement de variables que u ∈ L1 (R2 ), si et seulement si
l’application (r, θ) → rũ(r, θ) est dans L1 ([0, +∞[×[0, 2π[). Dans ce cas
Z Z 2π Z +∞
u(x)dx = rũ(r, θ) drdθ
R2 0 0

A.5 Produit de convolution


On travaille ici dans RN muni de la tribu borélienne et de la mesure de Lebesgue. Soient f et g
deux applications de RN dans RN , positives. On appelle produit de convolution de f et g, noté
f ? g, l’application
Z Z
(f ? g)(x) = f (y)g(x − y)dy = f (x − y)g(y)dy ,
RN RN

lorsque ces quantités sont bien définies et qu’on peut appliquer le théorème de Fubini.

Proposition A.12 Voici trois cas où le produit de convolution est bien défini.

• Si f et g sont intégrables, alors (f ? g)(x) est défini pour presque tout x ∈ RN , f ? g est
également intégrable et
Z Z  Z 
(f ? g)(x)dx = f (x)dx g(x)dx .
RN RN RN

0
• Si f ∈ Lp (RN ) et g ∈ Lp (RN ) (avec p ∈ [1, +∞] et p0 l’exposant conjugué de p), alors f ? g(x)
est défini pour presque tout x ∈ RN et f ? g ∈ L∞ (RN ) avec kf ? gk∞ ≤ kf kp kgkp0 .

• Si f ∈ Lp (RN ) et g ∈ L1 (RN ) (avec p ∈ [1, +∞]), alors (f ? g)(x) est défini pour presque tout
x ∈ RN , f ? g ∈ Lp (RN ) et kf ? gkp ≤ kf kp kgk1 .

Remarque A.13 En particulier, si f et g sont des densités de probabilité, i.e., f ≥ 0 et g ≥ 0 p.p.


avec Z Z
f (x)dx = g(x)dx = 1 ,
R R
alors f ? g est également une densité de probabilité. Rappelons que si X et Y sont des variables
aléatoires réelles de densité respectives f et g, et si X et Y sont indépendantes, alors la variable
aléatoire X + Y a pour densité f ? g.

47
Preuve de la proposition (*): On suppose d’abord que f, g ∈ L1 (RN ). Notons d’abord que
l’application (x, t) → f (y)g(x − y) est bien intégrable sur RN × RN (on admet la mesurabilité). En
effet, en utilisant le théorème de Fubini 1 puis un changement de variable, on a
Z Z Z  Z Z 
|f (y)g(x − y)|dxdy = |f (y)| |g(x − y)|dx dy = |f (y)| |g(x)|dx dy
RN ×RN RN Z RN RN RN
= kgk1 |f (y)|dy = kgk1 kf k1 < +∞ .
RN

Donc (x, t) → f (y)g(x


R − y) est intégrable sur RN × RN , et on a, d’après le théorème de Fubini
2, que l’intégrale RN f (y)g(x − y) est définie pour presque tout x (ce qui défini (f ? g)(x) pour
presque tout x) et
Z Z Z  Z Z 
(f ? g)(x)dx = f (y)g(x − y)dy dx = f (y) g(x − y)dx dy
RN ZRN RNZ  Z RN  RZN 
= f (y) g(x)dx dy = g(x)dx f (y)dy .
RN RN RN RN
0
Supposons maintenant que f ∈ Lp (RN ) tandis que g ∈ Lp (RN ). Alors pour tout x ∈ RN , on a par
inégalité de Hölder,
Z Z 1/p Z 1/p0
p p0
|f (y)g(x − y)|dy ≤ |f (y)| |g(x − y)| = kf kp kgkp0 < +∞ .
RN RN RN

Donc la fonction y → f (y)g(x − y) est intégrable, avec


Z Z
f (y)g(x − y)dy ≤ |f (y)g(x − y)|dy ≤ kf kp kgkp0 .
RN RN

Supposons pour finir que f ∈ Lp (RN ) et g ∈ L1 (RN ) (avec p ∈ [1, +∞]). Par Hölder, on a
Z Z
0
|f (x − y)| |g(y)|dy = |f (x − y)| |g(y)|1/p |g(y)|1/p dy
RN RZ
N
1/p Z 1/p0
p
≤ |f (x − y)| |g(y)|dy |g(y)|dy ,
RN RN

où la fonction |f |p est dans L1 (RN ). Donc


Z Z p Z Z
p p−1
kf ? gkp ≤ |f (x − y)| |g(y)|dy dx ≤ kgk1 |f (x − y)|p |g(y)|dy
RN RN RN R
≤ kgkp−1 p
1 k|f | k1 kgk1 = kf kp kgk1

d’après la première partie du théorème. 2

A.6 Régularisation
Fonction continue à support compact : soit ]a, b[ un intervalle ouvert de R, avec −∞ ≤ a < b ≤
+∞. On dit qu’une fonction mesurable f :]a, b[→ R est à support compact s’il existe un sous-
intervalle [b, c] fermé et borné de ]a, b[ en dehors duquel la fonction f est nulle p.p..

Plus généralement, si Ω est un ouvert de RN , on dit qu’une fonction mesurable f : Ω → R est


à support compact s’il existe un compact K ⊂ Ω tel que f est nulle p.p. en dehors de K. On
appelle support de f le plus petit compact (au sens de l’inclusion) en dehors duquel f est nulle p.p..

48
Rappelons qu’il existe des fonctions de classe C ∞ non identiquement nulles et à support compact
dans R : pour construire une telle fonction, on remarque d’abord que la fonction

0 si x ≤ 0
φ(x) = −1/x
e si x > 0
est de classe C ∞ sur R, est strictement positive dans ]0, +∞[ et nulle dans ] − ∞, 0]. On pose
alors f (x) = φ(x)φ(1 − x). La fonction f est de classe C ∞ , positive sur R. De plus f (x) > 0 si
et seulement si x > 0 et 1−x > 0 : donc f est à support compact et son support est le compact [0, 1].

Un tel exemple se généralise aisément à RN : il suffit de prendre par exemple f˜(x) = f (kxk2 )
où f est la fonction construite ci-dessus et kxk est la norme euclidienne dans RN . La fonction f˜
est de classe C ∞ et a pour support la boule unité de RN qui est compacte.

Si Ω est un ouvert de RN et k ≥ 0, on note Cck (Ω) l’ensemble des fonctions de classe C k qui sont
à support compact dans Ω.

Fonctions localement intégrables : soit Ω un sous-ensemble de RN . On dit qu’une fonction


mesurable f : Ω → R est localement intégrable si la restriction de f à tout compact de RN est
intégrable. On note f ∈ L1loc (Ω).

Par exemple, les constantes sont localement intégrables dans RN (mais seule la constante nulle
est intégrable). Notons aussi que, si Ω est un ouvert de RN , f ∈ L1loc (Ω) et g ∈ Cc0 (Ω), alors le
produit f g est intégrable dans Ω.

Proposition A.14 Si f ∈ L1loc (R) et g ∈ Cck (R), alors f ? g est bien défini et de classe C k dans R.
De plus, (f ? g)(r) = f ? g (r) pour tout r = 1, . . . , k.
De même, si f ∈ L1loc (RN ) et g ∈ Cck (RN ), alors f ? g est bien défini et de classe C k dans RN .
De plus,
∂ r (f ? g) ∂rg
 
=f?
∂xα1 1 . . . ∂xαNN ∂xα1 1 . . . ∂xαNN
pour tout multi-indice (α1 , . . . , αN ) ∈ NN avec α1 + . . . αN = r ≤ k.
Preuve * : On ne fait la preuve qu’en dimension N = 1, la preuve dans le cas général étant
identique. Par argument de récurrence, il suffit aussi de faire la démonstration pour k = 1. Comme
g est à support compact, il existe un intervalle [c, d] en dehors duquel g est nulle. Pour x ∈ R,
h ∈ R, |h| < 1 et h 6= 0, on a
 
(f ? g)(x + h) − (f ? g)(x) g(x + h − t) − g(x − t)
Z
= f (y) dt
h ZRx+1−c  h 
g(x + h − t) − g(x − t)
= f (y) dt
x−1−d h
  
Or, si hn → 0, on a que la suite f (y) g(x+hn −t)−g(x−t)
hn tend vers f (y)g 0 (x − t) pour presque
tout t ∈ [x − 1 − d, x + 1 − c] et
 
g(x + hn − t) − g(x − t)
f (y) ≤ |f (y)|kg 0 k∞ p.p.t t ∈ [x − 1 − d, x + 1 − c] .
hn
Or f est intégrable sur le compact [x − 1 − d, x + 1 − c] et on peut donc appliquer le théorème de
convergence dominée :
Z x+1−c
(f ? g)(x + hn ) − (f ? g)(x)
lim = f (y)g 0 (x − t)dt = (f ? g 0 )(x) .
n→+∞ hn x−1−d

49
Comme ceci est vrai pour toute suite (hn ) qui tend vers 0, on a montré que f ? g est dérivable sur
R, avec (f ? g)0 = f ? g 0 . Par un argument de convergence dominée, on a aussi que l’application
x → (f ? g 0 )(x) est continue, ce qui prouve que f ? g est de classe C 1 . 2
Rappelons un résultat essentiel de densité :

Théorème A.15 Soit Ω un ouvert non vide de RN et p ∈ [1, +∞[. Alors Cc0 (Ω) est dense dans
Lp (Ω) au sens où : pour tout f ∈ Lp (Ω) et pour  > 0, il existe f ∈ Cc0 (Ω) tel que kf − f kp ≤ .
Ce résultat, qui repose sur la construction de l’intégrale de Lebesgue, ne sera pas montré ici.

Approximation par convolution : Soit φ : RN → Z R une fonction de classe C ∞ , à support


compact inclus dans la boule unité B(0, 1), avec φ ≥ 0 et φ(x)dx = 1. Pour tout  > 0, on pose
RN Z
−N x
φ (x) =  φ( ). On note que φ a un support inclus dans la boule B(0, ) et que φ (x)dx = 1.
 RN

Théorème A.16 Soit u ∈ Lp (RN ) et u = φ ?u. Alors u tend vers u dans Lp (RN ) lorsque  → 0.

Remarques A.17 1. Si u a un support contenu dans un compact K, alors u est également à


support compact, avec un support contenu dans l’ensemble K := {x ∈ RN , ∃y ∈ K, kx −
yk ≤ } (par exemple, si N = 1 et K = [a, b], alors le support de u est contenu dans
[a − , b + ]).
2. Si u est continue et à support compact, la convergence de u vers u est uniforme sur RN .
Preuve * : On suppose d’abord que u ∈ Cc0 (RN ). Alors, comme RN φ = 1, on a
R

Z
u(x) − u (x) = (u(x) − u(x − z))φ (z)dz
RN

Comme u est continue et a un support compact, u est uniformément continue : pour tout δ > 0,
il existe η > 0 tel que |u(x) − u(y)| ≤ δ dès que |x − y| ≤ η. Pour tout  ∈]0, η[, on a, puisque le
support de φ est contenu dans la boule B(0, ) et φ ≥ 0,
Z
|u(x) − u (x)| = (u(x) − u(x − z))φ (z)dz
Z B(0,) Z
≤ |u(x) − u(x − z)|φ (z)dz ≤ δ φ (z)dz = δ .
B(0,) RN

Donc u tend uniformément vers u sur RN . Comme, pour  ∈]0, 1], u et u ont un support contenu
dans un même compact K (cf. la remarque ci-dessus), u tend aussi vers u dans Lp (RN ) par con-
vergence dominée.

Nous traitons maintenant le cas général : soit u ∈ Lp (RN ). On veut montrer que ku − u kp → 0
lorsque  → 0. Fixons δ > 0. Alors il existe w ∈ Cc0 (Ω) tel que ku − wkp ≤ δ/3. Posons w = φ ? w.
Alors, comme (w − u) ∈ Lp tandis que φ ∈ L1 , on a

kw − u kp = k(w − u) ? φ kp ≤ kw − ukp kφ k1 = kw − ukp ≤ δ/3 ,

puisque φ ≥ 0 et φ = 1. D’autre part, comme w tend vers w dans Lp , il existe 0 > 0 tel que
R

pour  ∈]0, 0 [, kw − wkp ≤ δ/3. Alors, pour  ∈]0, 0 [, on a

ku − u kp ≤ ku − wkp + kw − w kp + kw − u kp ≤ δ .

50

Vous aimerez peut-être aussi