L3 2013 PDF

Formation Interuniversitaire de Physique
Année 2013-2014
Mathématiques pour physiciens
Jean-Bernard Zuber
Figure 1 –
6 mathématiciens qui ont laissé des contributions fondamentales dans le sujet de ce cours.
Pierre-Simon Laplace (1749 - 1827) et (Jean-Baptiste) Joseph Fourier (1768 - 1830) ;
Siméon Denis Poisson (1781 - 1840) et Augustin-Louis Cauchy (1789 - 1857) ;
Henri Lebesgue (1875 - 1941) et Laurent Schwartz (1915 - 2002)
J.-B. Z L3 FIP 2013 30 janvier 2014
Bibliographie
[1] Walter Appel, Mathématiques pour la physique et les physiciens !, H& K Éditions
[2] Claude Aslangul, Des mathématiques pour les sciences, Cours et Exercices, de Broeck, 2011
[3] Claude Aslangul, Des mathématiques pour les sciences, Exercices corrigés, de Broeck, 2013
[4] Henri Cartan, Théorie élémentaire des fonctions analytiques d’une ou plusieurs variables
complexes, Hermann 1961
[5] Jacques Gapaillard, Intégration pour la licence, Dunod 2002
[6] John Lamperti, Probability, Benjamin 1966
[7] W. Rudin, Analyse réelle et complexe, Masson 1977.
[8] Laurent Schwartz, Méthodes mathématiques pour les sciences physiques, Hermann, 1965.
[9] Laurent Schwartz, Théorie des distributions, Hermann, 1966.
[10] Laurent Schwartz, Analyse I. Topologie Générale et Analyse Fonctionnelle, Hermann, 1991.
Parmi ces ouvrages, certains sont écrits dans un esprit assez proche de celui du présent
cours, en particulier [1], dont je me suis beaucoup inspiré. Le lecteur trouvera d’innombrables
applications et exercices dans [2] et [3].
ii BIBLIOGRAPHIE
Plan du cours
– 1 Rappels, convergence, séries, fonctions 1 cours

– 2 Intégration 2 cours
– 3 Distributions 1 12 cours
– 4 Transformation de Fourier 1 12 cours
– 5 Probabilités 2 12 cours
– 6 Séries entières. Fonctions d’une variable complexe 1 cours
– 7 Fonctions holomorphes. Théorème de Cauchy 2 12 cours
– 8 Fonctions de variables complexes, applications 1 12 cours
– 9 Transformation de Laplace 1 12 cours
– 10 Aspects de la théorie des groupes 1 cours
Table des matières
1 Rappels, convergence, séries, fonctions 1

1.1 Topologie de la droite réelle (rappels) . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 Suites convergentes. Suites de Cauchy . . . . . . . . . . . . . . . . . . . . 1
1.1.2 Ouverts, fermés. Points d’accumulation . . . . . . . . . . . . . . . . . . . 2
1.1.3 Les deux propriétés fondamentales de R . . . . . . . . . . . . . . . . . . 3
1.1.4 Compléments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Bribes de topologie générale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.1 Petit glossaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.2 Espaces vectoriels normés . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.3 Suites convergentes, suites de Cauchy dans un espace normé . . . . . . . 6
1.3 Suites et séries de fonctions. Convergence simple, uniforme, en norme. . . . . . . 7
1.3.1 Convergence d’une suite de fonctions . . . . . . . . . . . . . . . . . . . . 7
1.3.2 Continuité d’une limite de fonctions continues . . . . . . . . . . . . . . . 8
1.3.3 Dérivabilité d’une limite de fonctions dérivables. . . . . . . . . . . . . . . 8
1.3.4 Intégrabilité d’une limite de fonctions intégrables. . . . . . . . . . . . . . 9
1.3.5 Séries. Séries de fonctions . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2 Intégration 17
2.1 Intégrale de Riemann . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.1 Rappels sur l’intégrale de Riemann . . . . . . . . . . . . . . . . . . . . . 17
2.1.2 Intégrales impropres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.1.3 Problèmes avec l’intégrale de Riemann . . . . . . . . . . . . . . . . . . . 19
2.2 Intégrale de Lebesgue. Mesure . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2.1 Idée intuitive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2.2 Mesure (Bribes de théorie de la) . . . . . . . . . . . . . . . . . . . . . . . 21
2.2.3 Retour à l’intégrale de Lebesgue . . . . . . . . . . . . . . . . . . . . . . . 24
2.2.4 Intégrales de Lebesgue sur R2 ou Rn . . . . . . . . . . . . . . . . . . . . 26
iv TABLE DES MATIÈRES
2.2.5 Espaces Lp et Lp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.2.6 Comparaison entre intégrales de Riemann et de Lebesgue . . . . . . . . . 28
2.3 Intégrales dépendant d’un paramètre . . . . . . . . . . . . . . . . . . . . . . . . 31
3 Distributions 35
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.1.1 Distributions de charges électriques. . . . . . . . . . . . . . . . . . . . . 35
3.1.2 Diffusion cohérente par un réseau. Peigne de Dirac . . . . . . . . . . . . 36
3.1.3 Choc élastique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.1.4 Autres exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.2 Définitions et premières propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.2.1 Espace des fonctions-tests. Définition des distributions. . . . . . . . . . . 39
3.3 Opérations sur les distributions . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.3.1 Translation, dilatation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.3.2 Dérivation d’une distribution . . . . . . . . . . . . . . . . . . . . . . . . 43
3.4 Distribution delta et distributions reliées . . . . . . . . . . . . . . . . . . . . . . 44
3.4.1 Fonction de Heaviside, fonction signe . . . . . . . . . . . . . . . . . . . . 44
3.4.2 Relations fonctionnelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.4.3 δ sur une courbe, une surface, . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.5 Produit de distributions. Convolution . . . . . . . . . . . . . . . . . . . . . . . . 48
3.6 Exemple : Fonction de Green et potentiel de Coulomb en dimension d. . . . . . 51
4 Transformation de Fourier 55
4.0 Préambule physique. Équation des ondes . . . . . . . . . . . . . . . . . . . . . . 55
4.1 Séries de Fourier. Rappels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.2 Transformation de Fourier dans L1 . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.2.1 Définition. Conventions . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.2.2 Existence et premières propriétés . . . . . . . . . . . . . . . . . . . . . . 59
4.2.3 Autres propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.2.4 Transformation de Fourier dans L2 . . . . . . . . . . . . . . . . . . . . . 63
4.2.5 Transformation de Fourier et convolution . . . . . . . . . . . . . . . . . . 65
4.2.6 Diffraction par une fente, par un réseau . . . . . . . . . . . . . . . . . . . 66
4.3 Transformées de Fourier des distributions . . . . . . . . . . . . . . . . . . . . . . 66
5 Probabilités 71
5.1 Événements. Espace des épreuves. . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.2 Probabilités et mesure. Vocabulaire . . . . . . . . . . . . . . . . . . . . . . . . . 72
TABLE DES MATIÈRES v
5.2.1 Axiomes de Kolmogorov . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

5.2.2 Probabilité conditionnelle. Événements indépendants . . . . . . . . . . . 73
5.3 Variables aléatoires. Distributions de v.a. . . . . . . . . . . . . . . . . . . . . . . 74
5.3.1 Définition d’une variable aléatoire ; loi de probabilité . . . . . . . . . . . 74
5.3.2 Les quantités et fonctions importantes attachées à une v.a. . . . . . . . . 75
5.3.3 Plusieurs variables aléatoires . . . . . . . . . . . . . . . . . . . . . . . . . 80
5.3.4 Changement de variable aléatoire . . . . . . . . . . . . . . . . . . . . . . 83
5.3.5 Fonction caractéristique . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
5.4 Distributions classiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
5.4.1 Distribution uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
5.4.2 Distribution binomiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
5.4.3 Distribution normale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
5.4.4 Distribution de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
5.4.5 Quelques autres lois rencontrées dans les sciences naturelles . . . . . . . . 93
5.4.6 Limites de la loi binomiale . . . . . . . . . . . . . . . . . . . . . . . . . . 94
5.4.7 Quelques exemples concrets . . . . . . . . . . . . . . . . . . . . . . . . . 96
5.5 Théorèmes limites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
5.5.1 Convergence presque sûrement, convergence en probabilité, convergence
en loi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
5.5.2 Loi des grands nombres . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
5.5.3 Théorème limite central . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
5.5.4 Marche aléatoire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
6 Séries entières. Fonctions analytiques 115

6.1 Séries entières . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
6.1.1 Séries formelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
6.1.2 Rayon de convergence . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
6.1.3 Continuité, intégrabilité et dérivabilité de la somme . . . . . . . . . . . . 118
6.1.4 Vitesse de convergence . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
6.2 Les fonctions exp et log . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
6.3 Séries de Taylor. Fonctions analytiques . . . . . . . . . . . . . . . . . . . . . . . 121
6.3.1 Séries de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
6.3.2 Fonctions analytiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
6.3.3 Prolongement analytique . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
6.4 Lacunes de ce chapitre. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
6.4.1 Séries divergentes. Séries asymptotiques . . . . . . . . . . . . . . . . . . 125
vi TABLE DES MATIÈRES
6.4.2 Produits infinis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
7 Fonctions holomorphes. Théorème de Cauchy 127

7.1 Fonctions holomorphes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
7.1.1 Rappel : fonctions différentiables de Rn dans Rp . . . . . . . . . . . . . . 127
7.1.2 Holomorphie. Conditions de Cauchy–Riemann . . . . . . . . . . . . . . . 128
7.1.3 Dérivations ∂, ∂¯ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
7.2 Intégrales sur des chemins . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
7.2.1 Chemins et lacets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
7.2.2 Intégrales de formes sur des chemins. . . . . . . . . . . . . . . . . . . . . 133
7.2.3 Intégration sur des chemins dans C . . . . . . . . . . . . . . . . . . . . . 137
7.3 Théorème de Cauchy et conséquences . . . . . . . . . . . . . . . . . . . . . . . . 139
7.3.1 Théorème de Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
7.3.2 Intégrale de Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
7.4 Autres propriétés des fonctions holomorphes . . . . . . . . . . . . . . . . . . . . 141
7.4.1 Fonctions holomorphes et fonctions analytiques . . . . . . . . . . . . . . 141
7.4.2 Fonctions entières. Principe du maximum . . . . . . . . . . . . . . . . . . 142
7.5 Zéros et singularités des fonctions de variable complexe . . . . . . . . . . . . . . 143
7.5.1 Zéros d’une fonction holomorphe . . . . . . . . . . . . . . . . . . . . . . 143
7.5.2 Pôles, singularités essentielles . . . . . . . . . . . . . . . . . . . . . . . . 144
7.5.3 Séries de Laurent. Fonctions méromorphes. Résidus . . . . . . . . . . . . 145
8 Fonctions de variables complexes, applications 153

8.1 Calcul d’intégrales, de transformées de Fourier, de sommes etc . . . . . . . . . . 153
8.1.1 Calcul pratique des résidus . . . . . . . . . . . . . . . . . . . . . . . . . . 153
8.1.2 Lemmes de Jordan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
8.1.3 Intégrales sur l’axe réel . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
8.1.4 Intégrales de fractions rationnelles trigonométriques . . . . . . . . . . . . 155
8.1.5 Transformées de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
8.1.6 Sommes infinies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
8.1.7 Intégrales sur un arc. Pôles sur l’axe réel . . . . . . . . . . . . . . . . . . 157
8.2 Fonctions multivaluées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
8.2.1 Points de branchement, feuillets, surface de Riemann . . . . . . . . . . . 158
8.2.2 Intégrales de Cauchy de fonctions multivaluées . . . . . . . . . . . . . . . 161
8.3 Fonctions harmoniques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
8.4 Méthode du col . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
TABLE DES MATIÈRES vii
8.4.1 Méthode du col . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164

8.4.2 Commentaires et variantes . . . . . . . . . . . . . . . . . . . . . . . . . . 165
8.4.3 Fonction Γ. Formule de Stirling . . . . . . . . . . . . . . . . . . . . . . . 166
9 Transformation de Laplace 169

9.1 Définitions et premières propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . 169
9.1.1 Abscisse de sommabilité et transformée de Laplace . . . . . . . . . . . . 169
9.1.2 Holomorphie de fˆ, etc . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
9.1.3 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
9.2 Inversion, dérivation, convolution etc . . . . . . . . . . . . . . . . . . . . . . . . 173
9.2.1 Inversion de la transformation de Laplace . . . . . . . . . . . . . . . . . . 173
9.2.2 Translation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
9.2.3 Convolution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
9.2.4 Opérations de dérivation et intégration . . . . . . . . . . . . . . . . . . . 175
9.2.5 Autres exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
9.3 Transformée de Laplace des distributions . . . . . . . . . . . . . . . . . . . . . . 176
9.4 Applications de la transformée de Laplace . . . . . . . . . . . . . . . . . . . . . 177
9.4.1 Équations différentielles, problème de Cauchy . . . . . . . . . . . . . . . 177
9.4.2 Exemple : Circuit LRC . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
9.4.3 Équations linéaires aux dérivées partielles . . . . . . . . . . . . . . . . . 181
10 Aspects de la théorie des groupes 183

10.1 Représentations linéaires des groupes . . . . . . . . . . . . . . . . . . . . . . . . 184
10.1.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184
10.1.2 Représentations réductibles ou irréductibles . . . . . . . . . . . . . . . . 184
10.1.3 Lemme de Schur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
10.2 Groupes et algèbres de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
10.2.1 Groupes R, U(1) et SO(3). Algèbre de Lie . . . . . . . . . . . . . . . . . 185
10.2.2 Groupe de rotation à deux dimensions SO(2) . . . . . . . . . . . . . . . . 186
10.2.3 Générateurs infinitésimaux de SO(3) . . . . . . . . . . . . . . . . . . . . 188
10.3 Algèbre de Lie de SO(3) et ses représentations . . . . . . . . . . . . . . . . . . . 190
10.3.1 Algèbre de Lie so(3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
10.3.2 Représentations de l’algèbre so(3) et représentations du groupe SO(3)). . 192
Chapitre 1
Rappels, convergence, séries, fonctions
1.1 Topologie de la droite réelle (rappels)
1.1.1 Suites convergentes. Suites de Cauchy

On rappelle les définitions d’une suite convergente un dans R :
un → ` ∈ R ⇐⇒ ∀ ∃N tel que ∀n > N |un − `| <
(c’est-à-dire tous les un sont arbitrairement près de `, dès que n est suffisamment grand) et
d’une suite de Cauchy un ∈ R :
∀, ∃N tel que ∀n, n0 > N |un − un0 | < .
Toute suite convergente est de Cauchy (par l’inégalité triangulaire), mais la réciproque n’est
pas évidente. Ainsi elle n’est en général pas vraie dans Q : une suite de Cauchy de rationnels
ne converge pas toujours dans Q. Par exemple, la suite dans Q définie par la fraction continue
1
un = 2 +
1
2+
1
2+
2 + ···
tronquée au n-ième dénominateur, ou encore définie par la relation de récurrence u0 = 2, un =

1 , est une suite de Cauchy (le vérifier), mais ne converge pas dans Q (puisqu’elle converge
2+ un−1
√
vers 1 + 2 ∈ / Q) : on dit que Q n’est pas complet. Au contraire, toute suite de Cauchy de réels
converge dans R par construction, voir plus bas. R est complet : c’est cette non-convergence de
certaines suites de Cauchy dans Q qu’on corrige par l’introduction des nombres réels.
30 janvier 2014 J.-B. Z L3 FIP 2013

2 Chap.1. Rappels, convergence, séries, fonctions
Théorème 1.1 : (a) Toute suite de Cauchy est bornée : ∃M ∀n |un | < M .
(b) Toute suite de Cauchy un admettant une sous-suite convergeant vers ` converge elle-même
vers `.
Exercice : le démontrer. (Noter que ces résultats s’appliquent à des suites dans R ou Q).
• Rappel : Définition de R par suites de Cauchy de rationnels équivalentes

Rappelons la construction des nombres réels par les classes d’équivalence de suites de Cauchy de rationnels.
On considère l’ensemble des suites u de Cauchy (un ∈ Q) et on dit que u ∼ v si un − vn → 0. On vérifie
aisément qu’il s’agit bien d’une relation d’équivalence et on considère alors l’ensemble des classes d’équivalence.
On montre qu’on peut le doter des lois d’addition et de multiplication (par addition et multiplication des suites
et compatibilité avec la relation ∼), qu’il forme un corps, qu’il contient un sous-corps isomorphe à Q, etc. Au
final l’ensemble R est défini comme l’ensemble de ces classes d’équivalence. Une propriété utile est que deux
suites adjacentes (un ) et (vn ), c’est-à-dire l’une croissante, l’autre décroissante, avec |un − vn | → 0, convergent
vers un même réel x.
1.1.2 Ouverts, fermés. Points d’accumulation

Sur R on définit les intervalles
– ouverts, ]a, b[ : x ∈]a, b[ ⇔ a < x < b, avec éventuellement a = −∞ et/ou b = +∞
– fermés, [a, b] : x ∈ [a, b] ⇔ a ≤ x ≤ b, a et b finis.
Un sous-ensemble borné E de R est un ensemble à la fois majoré et minoré :
∃m, M ∀x ∈ E m≤x≤M .
La borne supérieure B (resp. inférieure b) d’un ensemble borné E est par définition le plus petit
majorant (resp. le plus grand minorant) de E. Ce nombre B (resp. b) existe et est unique. (La
preuve, classique mais un peu longue, procède par dichotomie ; elle ne sera pas reproduite ici.)
Soit E ⊂ R un sous-ensemble (de cardinal 1 ) infini de R. Par définition, ξ est un point
d’accumulation de E s’il existe des points de E arbitrairement proches de ξ mais distincts de
ξ, autrement dit
∀ ∃x ∈ E, x 6= ξ tel que x ∈]ξ − , ξ + [ . (1.1)
Le point d’accumulation ξ peut appartenir ou non à l’ensemble E.
Théorème 1.2 (Bolzano–Weierstrass) : Tout ensemble E ⊂ R infini borné possède au

moins un point d’accumulation.
1. la définition de cardinal est rappelée à l’Appendice A.1

§ 1.1. Topologie de la droite réelle (rappels) 3
Ou de façon équivalente, toute suite (un ) dans E admet une sous-suite convergeant dans E.
Esquisse de preuve : Par dichotomie : si E ⊂ [b1 , B1 ], on coupe [b1 , B1 ] en deux moitiés, dont l’une au
moins, notons-la [b2 , B2 ], a une intersection infinie avec E, et on itère ; cela définit une suite d’intervalles
[bn , Bn ] emboı̂tés, dont les extrémités forment deux suites adjacentes (cf ci-dessus) définissant un point ξ. On
montre aisément que ξ est point d’accumulation de E.
On définit alors les sous-ensembles ouverts ou fermés de R :
Un sous-ensemble O ⊂ R est ouvert si tout point de O est le centre d’un intervalle ouvert
entièrement contenu dans O.
Un ensemble fermé F ⊂ R est un ensemble qui contient tous ses points d’accumulation. Un
intervalle fermé [a, b] est clairement un ensemble fermé.
Le complémentaire dans R d’un ouvert est un fermé (exercice : le vérifier).
L’union d’un nombre quelconque d’ouverts est un ouvert. L’union d’un nombre fini de fermés
est un fermé. En revanche, une union dénombrable 2 de fermés peut ne pas être fermée, par
exemple ∪n∈N∗ [ n1 , 1] =]0, 1].
Par passage au complémentaire : l’intersection d’un nombre quelconque de fermés est un
fermé. L’intersection d’un nombre fini d’ouverts est un ouvert. En revanche, une intersection
dénombrable d’ouverts peut ne pas être ouverte, par exemple ∩n∈N∗ ] − n1 , n1 [= {0} = [0, 0].
1.1.3 Les deux propriétés fondamentales de R

Théorème 1.3 : Q est dense dans R, c’est-à-dire tout réel est limite de nombre rationnels.
Théorème 1.4 : R est complet : toute suite de Cauchy y converge.
Le théorème 1.3 découle de la construction de R que nous avons rappelée, comme ensemble
des classes d’équivalence de suites de Cauchy dans Q : pour tout réel x, il existe une suite de
Cauchy de rationnels qui converge vers x, ce qui établit la propriété de densité.
Pour le théorème 1.4, soit une suite un de Cauchy de nombres réels. Par le théorème 1.3,
pour tout up , il existe un rationnel rp , |up − rp | < . Une nouvelle fois, l’inégalité triangulaire
vient à la rescousse et nous dit que l’on peut rendre |rp −rq | ≤ |rp −up |+|up −uq |+|uq −rq | < 3
pour p et q assez grands, donc rn est une suite de Cauchy de rationnels qui définit un nombre
réel x, rn converge vers x et |un − x| ≤ |un − rn | + |rn − x| < 2, donc lim un = x.
1.1.4 Compléments
On considère aussi parfois la droite “achevée” R = R ∪ {−∞, ∞}, voir App. A.3.
Autres notations : R+ = {x ∈ R; x ≥ 0}, R∗ = R\{0}, etc.
2. Voir la définition 1.8 ci-dessous à l’Appendice A.

1.2 Bribes de topologie générale

L’étude de la topologie de la droite réelle nous amène tout naturellement à des généralisations
et à des définitions. Une introduction très complète à la topologie peut être trouvée dans [10].
1.2.1 Petit glossaire

Espace topologique (e.t.) : ensemble E doté d’une collection de sous-ensembles Oi , dits ouverts,
avec la propriété que toute union d’ouverts ou toute intersection d’un nombre fini d’ouverts est
un ouvert, et que E et ∅ sont des ouverts. Soit O l’ensemble des ouverts Oi . C’est en fait le
couple (E, O) qui constitute l’e.t. Tout sous-ensemble F ⊂ E est un e.t. (un sous-e.t. de E)
pour la topologie définie par l’ensemble d’ouverts {Oi ∩ F } (noté abusivement O ∩ F ).
Exemple E = R, intervalles ouverts ]a, b[ et leurs unions (“topologie usuelle” de R) ;
Fermé de E : complémentaire d’un ouvert dans E.

Exemple E = R, fermés [a, b] et leurs unions finies.
o
Intérieur A de A ⊂ E : plus grand ouvert contenu dans A.
Adhérence (ou fermeture) Ā de A : plus petit fermé contenant A.
o
Exemple A = [a, b[, A=]a, b[, Ā = [a, b].
Voisinage d’un point x : sous-ensemble de E contenant un ouvert contenant x. On notera V(x)
l’ensemble des voisinages de x. Exemple E = R, tout V =]x − 1 , x + 2 [ est un voisinage de x, mais aussi
tout [x − 1 , x + 2 ].
Un espace topologique est séparé (ou de Hausdorff) si deux points distincts possèdent deux
voisinages disjoints.
Base de voisinages B(x) d’un point x : sous-ensemble de V(x) tel que tout V ∈ V(x) contient
un W ∈ B(x). (Intuitivement, une base B(x) est constituée de “suffisamment” de voisinages de
x.)
Exemple E = R, B(x) = {]x − n1 , x + n1 [}n∈N
Continuité : Une fonction f d’un e.t. E dans un e.t. F est continue si pour tout ouvert O ⊂ F ,
l’ensemble f −1 (O) = {x ∈ E tel que f (x) ∈ O} est ouvert dans E.
Exemple E = F = R, on retrouve bien la définition usuelle de la continuité en a :
∀ ∃η |x − a| < η (c’est-à-dire x ∈]a − η, a + η[) ⇒ |f (x) − f (a)| < (c’est-à-dire f (x) ∈]f (a) − , f (a) + [).
Voir TD.
Densité : Un sous-ensemble X d’un e.t. E est dense dans E si ∀a ∈ E, tout voisinage de a a

une intersection non nulle avec X.
Exemple : Q est dense dans R : on peut approcher arbitrairement près tout réel par un rationnel.
Connexité : Un e.t. E est connexe s’il ne peut pas être écrit comme union disjointe de deux
ouverts non vides. Ou de façon équivalente (vérifier !), si les seuls de ses sous-ensembles à la

§ 1.2. Bribes de topologie générale 5
fois ouverts et fermés sont E et ∅.
Espace compact E : espace topologique (séparé) tel que de tout recouvrement de E par des
ouverts, on peut extraire un recouvrement fini.
Conséquences : si E est compact,
– toute suite infinie de points de E admet un point d’accumulation (généralisation du théorème
de Bolzano–Weierstrass) ;
– si f : E 7→ F est continue, f (E) est compact ;
– toute fonction réelle continue sur E est bornée.
Si E est un sous-espace de Rn , E compact ⇔ E borné et fermé (théorème de Heine–Borel).
Espace localement compact : espace topologique (séparé) dont tout point a au moins un voisinage
compact.
Exemples : R n’est pas compact mais localement compact ; Q n’est ni compact ni localement compact. On
peut “compactifier” R en lui ajoutant un point à l’infini ; et de même, on peut compactifier C (le plan complexe)
en lui ajoutant un point à l’infini, le transformant en la “sphère de Riemann”, voir plus bas au Chap. 7, § 7.5.3.
1.2.2 Espaces vectoriels normés
Un espace vectoriel E sur R ou C (de dimension finie ou infinie) est dit normé si on peut y
définir une norme.
Définition 1.1 : Norme :
kxk ≥ 0
kxk = 0 ⇒ x = 0 (1.2)
kλxk = |λ| kxk
kx + yk ≤ kxk + kyk inégalité triangulaire
Dans la définition d’une semi-norme, on relâche le deuxième axiome, kxk = 0 n’implique pas
x = 0.
Distance. Dans un e.v. normé E, on peut définir la distance d(x, y) = kx − yk.
Exemple : les espaces Rn (ou C, considéré comme un e.v. de dimension 2 sur les réels) sont
1
des espaces normés par la norme euclidienne kxk = ( ni=1 |xi |2 ) 2 , où les xi sont les composantes
P
de x dans une base orthonormée. Dans C, cette norme est le module du nombre complexe.

• Espaces de fonctions normés
Sur l’espace C([a, b]) des fonctions continues sur [a, b] à valeurs dans R ou C, on peut définir
des normes
Z b
kf k1 = |f (x)|dx
a
Z b 21
2
kf k2 = |f (x)| dx (1.3)
a
kf k∞ = sup |f (x)|
x∈[a,b]
Sur l’espace des fonctions continues par morceaux (avec un nombre fini de discontinuités sur
[a, b]), kf k1 et kf k2 sont des semi-normes, kf k∞ est une norme, pourquoi ?
1.2.3 Suites convergentes, suites de Cauchy dans un espace normé

Les définitions de suite convergente ou de Cauchy du § 1.1.1 s’étendent à tout espace normé.
Soit E un espace vectoriel normé et une suite un ∈ E.
Définition 1.2 : La suite (un ) admet une limite u ∈ E, ou converge vers la limite u, et on
écrit limn→∞ un = u ou simplement un → u, si la différence un − u tend vers zéro en norme
quand n tend vers l’infini
∀ > 0 ∃N tel que ∀n > N kun − uk < . (1.4)
Définition 1.3 : Une suite un est dite suite de Cauchy (ou elle satisfait le critère de Cauchy)
si
∀ ∃N tel que ∀n, n0 > N kun − un0 k < . (1.5)
Comme précédemment, toute suite convergente est de Cauchy. La réciproque n’est en général
pas vraie comme on a vu, une suite de Cauchy peut ne pas converger.
Définition 1.4 : Un espace vectoriel normé E est un espace complet ssi toute suite de Cauchy
y converge. Un tel espace est appelé espace de Banach.
Cette notion prend son importance dans l’étude des espaces de fonctions, comme on va le
voir. En dimension finie, un corollaire simple du Théorème 1.4 est que
C ou tout espace vectoriel Rn de dimension finie sur R est complet.
Preuve : Il suffit de prendre la norme euclidienne : la condition de Cauchy dans Rn implique que chaque
composante est de Cauchy dans R donc converge.

§ 1.3. Suites et séries de fonctions. Convergence simple, uniforme, en norme. 7
1.3 Suites et séries de fonctions. Convergence simple,

uniforme, en norme.
1.3.1 Convergence d’une suite de fonctions
On considère l’espace des fonctions à valeurs dans R ou dans C, définies sur un sous-ensemble
X de R ou C, et bornées. Cet espace est muni de la norme kf k∞ = supx∈X |f (x)|, voir ci-dessus.
Soit fn une suite de telles fonctions (toutes définies sur le même X).
On peut définir deux notions de convergence fn → f .
Définition 1.5 : La suite fn converge simplement vers f si ∀x ∈ X, fn (x) converge vers f (x).
∀ > 0 ∀x ∈ X ∃N tel que ∀n > N |fn (x) − f (x)| < (1.6)

CV.S.
et on note fn −→ f .
Définition 1.6 : La suite fn converge uniformément vers f si
∀ > 0 ∃N tel que ∀x ∈ X ∀n > N |fn (x) − f (x)| < (1.7)
ou encore
∀ > 0 ∃N tel que ∀n > N kfn − f k∞ <
CV.U.
et on note fn −→ f .
Bien comprendre que dans le cas de la CVU, le nombre N est indépendant de x, alors qu’a
priori, il en dépend dans la CVS. La convergence uniforme implique la convergence simple (le
vérifier), mais la réciproque n’est pas vraie.
La définition de convergence CVS, CVU s’étend sans difficulté à des suites de fonctions à
valeurs dans tout espace normé : il suffit de remplacer dans (1.6,1.7) la valeur absolue par la
norme k · k.
Exemples et contre-exemples.
Exemples : 1. Soit la suite de fonctions fn (x) = xn définies sur l’intervalle [0, 1]. Pour tout
x < 1, xn → 0, tandis que pour x = 1, la valeur limite est 1. La fonction limite f (x) est donc
la fonction discontinue qui vaut 0 sur [0, 1[ et 1 en 1 (c’est la fonction partie entière E(x),
restreinte à l’intervalle [0, 1]). La convergence des fn n’est pas uniforme vers f (x) = E(x),
comme on va le montrer plus bas, par l’absurde.
Mais il est instructif de le comprendre directement. Montrons que ∀a fixé, avec 0 ≤ a < 1, la suite
fn (x) = xn converge uniformément vers 0 sur l’intervalle [0, a]. En effet
∀n > N ∀x ∈ [0, a] |xn − 0| = xn ≤ an < aN ,

par des inégalités triviales. Pour assurer que |xn − 0| < , il suffit de choisir N tel que aN < ou encore de façon
− ln
équivalente, N > − ln a . Ce choix de N assure bien la convergence uniforme des fn vers 0 dans l’intervalle [0, a].
Mais noter que ce N augmente sans limite quand a s’approche de 1. En conséquence, la convergence uniforme
ne peut être maintenue sur tout l’intervalle [0, 1[, même ouvert à droite.

(n − 1)x si x ∈ [0, 1 ]
n
2. Soit la suite de fonctions fn (x) = . Pour x = 0, fn (0) = 0 donc
1 − x 1
si x ∈ [ n , 1]
lim fn (0) = 0. Pour tout x 6= 0, il existe un n assez grand à partir duquel tous les fn (x) = 1 − x.
La suite converge donc simplement vers la fonction discontinue f (0) = 0; f (x) = 1 − x, x 6= 0,
mais la convergence n’est pas uniforme.
3. En revanche les fonctions fn (x) = n sin nx convergent uniformément vers f (x) = x sur l’in-
tervalle [0, 1].
3
En effet |fn (x) − x| = x − n sin nx ≤ 6nx 1
2 < 6n2 quel que soit x ∈ [0, 1]. On peut démontrer l’inégalité
déf 3
φ(α) = sin α − α + α6 ≥ 0 utilisée dans cet argument par étude des fonctions dérivées successives φ0 (α) et
φ00 (α), ou encore par utilisation de la formule de Taylor-Lagrange.
p
4. Autres exemples importants, les fonctions fn (x) = np=0 xp! , et gn (x) := (1 + nx )n , convergent,
déf P
pour tout x réel, vers la fonction exponentielle ex . La convergence est-elle uniforme ?
1.3.2 Continuité d’une limite de fonctions continues

Théorème 1.5 : Une suite uniformément convergente de fonctions continues définies dans un
domaine D de R ou C et à valeurs dans un espace normé E a pour limite une fonction continue.
Preuve. Prenons E = R pour simplifier les notations. Soit f la limite uniforme d’une suite de fonctions fn
continues sur [a, b]. Montrons la continuité de f en tout c ∈ D. Par la convergence uniforme,

∀ ∃N tel que ∀n > N ∀x ∈ D |fn (x) − f (x)| < .
3
Choisissons un tel n > N . La continuité de fn dit que

∀ ∃η tel que ∀x : |c − x| < η |fn (x) − fn (c)| <
3
et l’inégalité triangulaire dit alors que

|f (x) − f (c)| ≤ |f (x) − fn (x)| + |fn (x) − fn (c)| + |fn (c) − f (c)| < + + =, CQFD.
3 3 3
Voir ci-dessus deux exemples de suites non uniformément convergentes de fonctions conti-
nues dont la limite n’est pas continue.
1.3.3 Dérivabilité d’une limite de fonctions dérivables.

Soit une famille de fonctions fn définies dans un intervalle I de R à valeurs dans R ou C,
ce qu’on notera dans la suite fn : I → R (ou C). On suppose les fn dérivables.

CV.S. CV.U.
Théorème 1.6 : Si les fn −→ f et les fn0 −→ g, alors f est dérivable et f 0 = g.
Pn 2
Contre-exemple (voir [1] p19, 246) : fn (x) = π8 k=1 sin nx
4n2 −1 dont on montre qu’elles convergent unifor-
0
mément vers f (x) = | sin x|. Les fn ne convergent pas uniformément et la fonction f n’est pas dérivable en 0.
Remarque. Ces notions de convergence absolue et de continuité ou dérivabilité associées ne

sont pas qu’un problème académique pour le physicien. En Mécanique Statistique, la fonction
P
de partition d’un système à N degrés de liberté Z = C exp −βE(C) est la somme de poids de
Boltzmann sur un nombre N de configurations, grand mais fini. Cette somme d’exponentielles
est une fonction infiniment différentiable (et même “analytique”, voir Chap. 6) du paramètre
β (= 1/kB T , kB la constante de Boltzmann), donc de la température T . Mais dans la “limite
thermodynamique” N → ∞, la convergence n’est en général pas uniforme, ce qui peut occa-
sionner l’apparition de discontinuités ou de singularités associées à des transitions de phase.
L’étude de ces singularités dans les “phénomènes critiques” est un chapitre important de la
physique contemporaine.
1.3.4 Intégrabilité d’une limite de fonctions intégrables.

Théorème 1.7 : Soit une suite de fonctions fn définies et intégrables (au sens de Riemann)
sur un même compact K ⊂ R, convergeant uniformément vers f sur K. Alors f est intégrable
(au sens de Riemann) sur K et
Z Z
lim fn (x)dx = f (x)dx (1.8)
n→∞ K K
Autrement dit, sous l’hypothèse de convergence uniforme,“intégration et limite commutent”.

On donnera une preuve de ce théorème au chapitre 2. Mais on peut amoindrir l’hypothèse de
convergence uniforme (“théorème de convergence dominée”), voir Chap. 2.
1.3.5 Séries. Séries de fonctions

P
Le problème de la convergence d’une série “numérique” uk , où uk ∈ R ou C, relève de la
discussion de la convergence des suites : on s’intéresse à la convergence de la suite des sommes
partielles sn = nk=1 uk . On se rappelle que la convergence absolue est une condition suffisante
P
P P
de convergence |uk | converge ⇒ k uk converge. Cela s’étend à des suites dans un e.v.
P P
normé complet : kuk k converge ⇒ k uk converge : on parle de convergence en norme (ou
convergence normale) CVN.
Preuve : on utilise l’inégalité triangulaire pour écrire
Pn Pn0 Pn0
CVN : s̃n = 1 kuk k converge ⇒ s̃n est de Cauchy : pour n, n0 assez grands n kuk k < ⇒ k n uk k ≤
Pn0 Pn
n kuk k < donc sn = 1 uk est de Cauchy donc converge dans l’espace complet.

De même pour des séries de fonctions, on peut définir la CVS ou la CVU comme on l’a fait
au § 1.3.1, et aussi une convergence normale CVN dans la norme k · k∞ du sup. Soit une série
P
fk de fonctions de X (⊂ R ou C) dans un e.v. normé E.
P
Définition 1.7 : La série fk converge
n
X
simplement vers F si ∀ ∀x ∈ X ∃N tel que ∀n > N k fk (x) − F (x)k <
k=1
n
X
uniformément vers F si ∀ ∃N tel que ∀x ∈ X ∀n > N k fk (x) − F (x)k <
k=1
n
X
c’est-à-dire lim k fk − F k∞ = 0
n→∞
k=1
X
normalement si kfn k∞ converge .
N.B. Ne pas confondre la norme k k (sans indice) de l’espace normé E et la norme k k∞ de

l’espace des fonctions dans E.
Théorème 1.8 : Toute série normalement convergente à valeurs dans un e.v. normé complet
est uniformément convergente, donc simplement convergente.
Donc CVN ⇒ CVU ⇒ CVS. (Exercice : le vérifier)

On est alors en mesure d’appliquer à la somme F (x) les théorèmes sur la continuité, la
dérivabilité ou l’intégrabilité vus plus haut.
On rencontre souvent en Physique deux types de séries de fonctions : les séries entières
ak xk et les séries de Fourier ak eikx . On y reviendra plus bas aux Chapitres 6 et 4, respec-
P P
tivement.
Appendix A. Notations et rappels

• A.1. Notations sur les ensembles
Complémentaire de A dans E : {E A noté aussi Ā quand il n’y a pas d’ambiguı̈té sur E.
Identités classiques : {E (A ∩ B) = {E A ∪ {E B et {E (A ∪ B) = {E A ∩ {E B ;
distributivité A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) et A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C).
déf
Si B ⊂ A, A\B = {A B = {x|x ∈ A, x ∈ / B}. Plus généralement, si A
déf
A, B ⊂ E, A\B = A ∩ {E B = {A (A ∩ B), voir figure ci-contre.
B

Exercice : si A, B, C ⊂ E et la barre désignant le complémentaire dans E, montrer que

A\(B\C) = (A ∩ B̄) ∪ (A ∩ C).
Ensemble des parties (= sous-ensembles) de E : P(E) = {A|A ⊂ E).
Fonction indicatrice χA d’un sous-ensemble A ⊂ E : fonction E → {0, 1}

1 si x ∈ A
χA (x) = (A.1)
0 si x ∈ E\A
Exercice : démontrer que l’ensemble des points de discontinuité de χA pour A ⊂ E e.t. est la
o
“frontière de A”, soit Ā\ A.
Pour un ensemble E fini, on appelle card (E) (cardinal de E) le nombre d’éléments de
E. Deux ensembles finis E et F sont en bijection ssi ils ont même cardinal. Cette notion
s’étend à des ensembles infinis, voir sous-§ suivant. Pour E fini, card (E) = n fini, montrer que
card (P(E)) = 2n (Indication : pour chaque A ∈ P(E) on code chaque élément a de E par 1
ou 0 selon que a ∈ A ou non, autrement dit, A ↔ ensemble des χA (a)|a∈E , qui est dans {0, 1}n .
On a donc une bijection P(E) ↔ {0, 1}n . )
• A.2. Ensembles dénombrables et non dénombrables. Ensemble de

Cantor
Définition 1.8 : Un ensemble est dénombrable s’il est en bijection avec N.
Autrement dit on peut “numéroter” ses éléments. Ou encore, dans l’énumération de ses éléments,
on atteint tout élément au bout d’un nombre fini d’opérations. Exemples : N, bien sûr, est
dénombrable ; Z l’est aussi, il suffit d’énumérer 0, 1, −1, 2, −2, 3, −3, · · · . Q est aussi dénombrable,
ce qui est moins évident. On écrit tout rationnel positif sous la forme p/q, avec p et q premiers
entre eux. On énumère ces fractions positives selon les valeurs croissantes de p + q, (en sautant
toutes les paires où p et q ne sont pas premiers) 1/1, 1/2, 2/1, 1/3, 3/1, 4/1, 3/2, etc. Il est clair
que tout rationnel > 0 est atteint au bout d’un nombre fini de pas. On recombine ensuite
Q+ et Q− comme dans Z. Plus généralement, toute union finie d’ensembles dénombrables est
dénombrable, par le même type d’argument.
On étend la notion de cardinal à un ensemble dénombrable. Par définition, le cardinal de N (ou
de tout ensemble dénombrable) est noté ℵ0 (aleph zéro).
Définition 1.9 : Un nombre algébrique est un nombre (réel ou complexe) solution d’une équation algébrique
à coefficients entiers a0 z n + a1 z n−1 + · · · + an = 0, où ai ∈ Z.

Exercice. Montrer que l’ensemble des nombres algébriques est dénombrable.
Le point est que tout ensemble n’est pas dénombrable. Ainsi l’ensemble des réels n’est
pas dénombrable. Pour s’en convaincre, on procède par l’absurde (argument de Cantor). On
considère les réels de l’intervalle [0, 1[, décrits par leur développement décimal 0,abcd · · · . On
suppose qu’on a trouvé une énumération de ces réels sous la forme
x1 = 0,a1 b1 c1 · · ·
x2 = 0,a2 b2 c2 · · · (A.2)
x3 = 0,a3 b3 c3 · · ·
..
.
et on construit alors un nombre 0, α1 α2 α3 · · · où α1 6= a1 , α2 6= b2 , α3 6= c3 , . . .. Ce nombre

n’est pas dans la liste (A.2) puisqu’il n’est pas à la première ligne car α1 6= a1 , ni à la deuxième
car α2 6= b2 , ni à la troisième etc 3 . Il y a contradiction, et l’ensemble des réels de [0, 1[ n’est pas
dénombrable. On dit qu’il a la puissance du continu et on note c son cardinal. On montre que
tout intervalle de R non vide est en bijection avec P(N∗ ) et on écrit c = 2ℵ0 , voir par exemple
[5], Appendice A.2.
Plus généralement, un théorème de Cantor affirme que pour tout ensemble A, card (A) <
card (P(A)) avec une inégalité stricte. Ainsi P(R) a pour cardinal 2c > c, ce qui signifie qu’il
ne peut être en bijection avec R.
Ensemble de Cantor. Il s’agit d’un ensemble remarquable, qui nous fournira des exemples
et contre-exemples dans la suite. On le construit de façon récursive à partir de l’intervalle [0, 1].
À l’étape 1, on retranche le tiers médian ] 13 , 23 [ ce qui laisse l’union de deux segments fermés
[0, 13 ] ∪ [ 32 , 1]. Puis à chaque étape on retranche le tiers médian ouvert de chaque segment. À la
limite on obtient l’ensemble de Cantor K.
Plus précisément soit γ l’opération qui au segment I = [a, b] associe l’union des deux segments [a, a + b−a
3 ]∪
b−a n n
[a + 2 3 , b]. Plus généralement pour une union finie de segments disjoints ∪k=1 Ik , on définit γ(∪k=1 Ik ) =
∪nk=1 γ(Ik ). Alors si Kn = γ n ([0, 1]), K = ∩∞
n=0 Kn .
1
L’ensemble de Cantor n’est pas vide (par exemple il contient tous les nombres 3n
) et a les
propriétés remarquables suivantes (que nous admettrons pour la plupart) :
– il est compact (puisque fermé et borné) et n’a que des points d’accumulation (ensemble
“parfait”) ;
– il est non dénombrable, il a la puissance du continu (voir [5] Appendice A) ;
3. Il faut noter que dans la notation décimale, on identifie les paires de nombres 0, ab · · · c9999 · · · avec c < 9
et 0, ab · · · (c + 1). Vérifier que cela n’affecte pas l’argument de Cantor.

– il est d’intérieur vide et de “mesure nulle” : on définira plus précisément cette notion au
Chapitre 2, contentons-nous ici de noter que la somme des longueurs des segments à la n-ième
étape de construction de K vaut ( 32 )n , donc tend vers zéro quand n → ∞ ;
– les points de discontinuité de son indicatrice χK forment l’ensemble K lui-même ;
– il a des propriétés d’auto-similarité (fractal) : K1 ∩ K2 ≡ 13 K1 , etc.
Ces propriétés semblent contradictoires et cet ensemble est assez déroutant !
• A.3. Bornes. Limites supérieure et inférieure

On rappelle que R = R ∪ {−∞, ∞} (“droite réelle achevée”), qui est compact. L’intérêt de
cette compactification est clair :
–Tout sous-ensemble de R possède une borne inférieure et une borne supérieure.
–Toute suite croissante (resp. décroissante) dans R converge dans R :
lim un = sup un , resp. lim un = inf n≥1 un , . (A.3)

n→∞ n≥1 n→∞
Définition 1.10 : On appelle limite supérieure, resp. limite inférieure, d’une suite (un ) d’éléments
de R l’élément de R
limn→∞ un = inf k≥1 (sup un ) = lim (sup un ) (A.4)

n≥k k→∞ n≥k
resp. limn→∞ un = sup(inf n≥k un ) = lim (inf n≥k un ) . (A.5)

k≥1 k→∞
Ces limites supérieure et inférieure existent dans R pour toute suite ! En effet la suite
(supn≥k un ) est une suite en k décroissante, donc convergente dans R, on peut donc lui appliquer
(A.3), et sa limite, notée limn→∞ un est inf k≥1 (supn≥k un ), et vice versa pour la limite inférieure
limn→∞ un .
Une caractérisation utile de la limite supérieure d’une suite un > 0 (pour l’inférieure, changer
les signes d’inégalité) est la suivante :
` = limn→∞ un finie si ∀ ∃N tel que ∀n > N un < ` +

et pour une infinité de n > N , un > ` − ; (A.6)
` = ∞ si ∀M > 0 il existe une infinité de un > M .
Cette notion nous sera utile en particulier dans l’étude de la convergence des séries entières.

• A.4. Fonctions numériques continues

Fonctions “numériques” = fonctions E ⊂ R → R.
– toute fonction continue f : [a, b] → R (ou encore de R → R à support compact) est
bornée, m ≤ f (x) ≤ M , avec M = supx∈[a,b] f (x) resp. m = inf x∈[a,b] f (x), et prend toutes les
valeurs entre m et M . (On rappelle que support = domaine où la fonction est non nulle).
– toute fonction continue f : [a, b] → R est majorée et minorée par des fonctions en escalier.
Rappel : une fonction en escalier est par définition une fonction “constante par morceaux”,
c’est-à-dire prenant une valeur constante sur des intervalles ]ai , bi [ ;
– toute fonction continue f : [a, b] → R est limite uniforme d’une suite de fonctions en
escalier ;
– toute fonction continue f : [a, b] → R est limite uniforme d’une suite de polynômes
(théorème de Weierstrass). . . .
Classes de continuité. Théorèmes de Taylor et al
Une fonction numérique E ⊂ R → R est dite de classe C n si toutes les dérivées f (k) ,
k = 1, · · · , n existent sur E et sont continues.
Rappelons alors les différentes formes du théorème de Taylor, qui dit que sous des hypothèses
adéquates, une fonction est approximée par son développement de Taylor
n
X (x − x0 )k (x − x0 )n
f (x) = f (k) (x0 ) + Rn (x)
k=0
k! n!
avec un “reste” Rn qui peut prendre plusieurs formes :

n
X (x − x0 )k (x − x0 )n
Taylor–Young ∃ϕn (x), lim ϕn (x) = 0 : f (x) = f (k) (x0 ) + ϕn (x)
x→x0
k=0
k! n!
n
X(x − x0 )k (k) (x − x0 )n+1 (n+1)
Taylor–Lagrange ∃ ξ , a < ξ < x : f (x) = f (x0 ) + f (ξ)
k=0
k! (n + 1)!
n Z x
X (x − x0 )k (k) (x − t)n (n+1)
Taylor avec reste intégral f (x) = f (x0 ) + f (t)dt
k=0
k! x 0
n!
Hypothèses : Dans tous les cas, on suppose f n fois dérivable sur un intervalle I, x0 ∈ I,
donc f est (au moins) de classe C n−1 . Pour les deux dernières formes, on suppose en outre que
f est de classe C n sur I et que f (n+1) existe sur l’intérieur de I. Pour Taylor-Young, l’existence
k
de la n-ième dérivée suffit à assurer que f (x) − nk=0 (x−x 0)
f (k) (x0 ) = o((x − x0 )n ), ce qui est
P
k!
bien le résultat énoncé. Noter que la forme dite de Taylor–Lagrange généralise la formule dite
“des accroissements finis” (qui correspond au cas n = 0).

Lectures complémentaires
L’ouvrage de L. Schwartz [10] est une mine d’informations sur les questions d’analyse et de
topologie.


Chapitre 2
Intégration
2.1 Intégrale de Riemann

2.1.1 Rappels sur l’intégrale de Riemann
Pour une fonction définie et disons, pour l’instant, continue sur un intervalle [a, b], on in-
troduit d’abord une subdivision de l’intervalle [a, b] en N intervalles Ik = [xk−1 , xk ], x0 = a,
xN = b, d’union ∪Ik = [a, b], voir figure 2.1, on choisit un point ξk ∈ Ik , et on construit la
somme de Riemann
XN
(R)
Σ = (xk − xk−1 )f (ξk ) . (2.1)
k=1
Si quand N → ∞ et quand le découpage devient de plus en plus fin : supk (xk − xk−1 ) → 0, la
somme Σ(R) a une limite indépendante du choix des intervalles Ik et des points ξk , cette limite
Rb
est appelée intégrale de Riemann et notée a f (x)dx. Son interprétation est claire : on a coupé
l’aire sous la courbe de f en tranches verticales de plus en plus fines.
On démontre aisément que toute fonction en escalier sur [a, b] est intégrable au sens de
Riemann ; mais aussi toute fonction réglée (limite uniforme de fonctions en escalier de supports
contenus dans un même compact K), ce qui inclut les fonctions continues ou les fonctions
monotones sur [a, b], etc ; ou plus généralement toute fonction “pas trop discontinue” en un
sens qu’on précisera plus bas au § 2.2.6 où on donnera un critère (condition nécessaire et
suffisante) d’intégrabilité au sens de Riemann.
Intégrale et primitive
Toute fonction F de dérivée F 0 = f est appelée primitive de f . Le calcul intégral fournit

une méthode de calcul des primitives d’une fonction donnée f . Pour toute fonction continue f

18 Chap.2. Intégration
x
x =a x ! x
0 1 x k x N!1 xN= b
k!1 k
Figure 2.1 – Découpage de l’aire dans l’intégration de Riemann
sur un intervalle [a, b], la famille de ses primitives, égales à l’addition d’une constante près, est
R
dénotée par l’intégrale indéfinie f (x)dx, et une primitive quelconque est de la forme
Z x
F (x) = f (x0 )dx0 + C x ∈ [a, b], C constante arbitraire . (2.2)
a
Il en découle que l’intégrale entre a et b est donnée par la variation d’une primitive quelconque
F :
Z b
f (x)dx = F (b) − F (a) . (2.3)
a
2.1.2 Intégrales impropres

On étend ensuite cette intégrale de Riemann d’un intervalle compact [a, b] à un intervalle
Rb
[a, b[ avec éventuellement b = ∞. L’intégrale “impropre” a f (x)dx est par définition la limite,
Rc R
si elle existe, de a f (x)dx quand c → b− . De même pour la borne inférieure −∞ f (x)dx, etc.
R∞ Rb
Noter que −∞ f (x)dx est défini par la limite double lim a→−∞ a f (x)dx avec a et b tendant
b→∞
indépendamment vers −∞ et ∞. Rappelons les notions de convergence simple (CVS) et de
Rc Rc
convergence absolue (CVA) : a f (x)dx, resp a |f (x)|dx, converge quand c → b− , la CVA
impliquant la CVS mais pas l’inverse ; on parle d’intégrale semi-convergente si on a CVS mais
R1
pas CVA. Exemple : vérifier (par intégration par parties) que 0 dx x
sin x1 est CVS mais pas
CVA.

§ 2.2. Intégrale de Lebesgue. Mesure 19
2.1.3 Problèmes avec l’intégrale de Riemann

– Certaines fonctions sont trop irrégulières pour être intégrables au sens de Riemann.
Exemple : fonction 1 − χQ qui vaut 0 sur les rationnels et 1 sur les irrationnels de R\Q :
son intégrale de Riemann entre 0 et 1 n’est pas définie.
Il suffit pour s’en convaincre de prendre les ξk dans (2.1) soit tous rationnels, soit tous irrationnels. On
obtient Σ(R) = 0 ou 1 selon le cas !
– L’intégrale de la limite f d’une suite de fonctions fn peut être différente de la limite
des intégrales. Exemple : fn (x) = 2n si 2−n < x < 2−(n−1) , 0 ailleurs : dxfn (x) = 1, mais
R
fn → f = 0. En effet Intégration sur un compact et limite commutent si la convergence est

uniforme, mais pas toujours sinon, cf le Théorème 1.7 du Chap 1.
– Considérons la (semi-)norme sur les fonctions définie par l’intégrale de Riemann et l’espace
1
L des fonctions de norme k k1 finie : une suite de Cauchy n’y converge pas toujours, l’espace
R∞
L1 n’est pas complet. Exemple : fonctions définies sur R+ , kf k1 = 0 |f (x)|dx ; suite fn (x) =
1
e(i− n )x , n = 1, 2, · · · , kfn k1 = n est finie, mais limn→∞ fn = eix est de norme infinie.
2.2 Intégrale de Lebesgue. Mesure

2.2.1 Idée intuitive
Considérons d’abord une fonction f continue et positive. Au lieu de couper en tranches
verticales l’aire sous la courbe de f (Riemann), on effectue une découpe horizontale : soient
α0 < α1 < · · · < αN une subdivision des valeurs prises par une fonction positive f (x), et on
suppose connue une mesure µ(Ak ) de l’ensemble Ak des x tels que αk−1 ≤ f (x) < αk . On définit
PN −1
la somme de Lebesgue ΣN (α) = k=0 µ(Ak )αk−1 . Si quand la subdivision devient de plus en
plus fine : N → ∞ avec supk (αk − αk−1 ) → 0, la somme ΣN (α) a une limite indépendante de la
R
subdivision α, cette limite définit l’intégrale de Lebesgue notée f dµ et la fonction f est dite
intégrable (au sens de Lebesgue). Voir figure 2.2.
Il est sans doute bon à ce point de citer Lebesgue lui-même 1 :
Les géomètres du XVIIème siècle considéraient l’intégrale de f (x) –le mot intégrale n’était pas
encore inventé, mais peu importe– comme la somme d’une infinité d’indivisibles 2 dont chacun
était l’ordonnée, positive ou négative, de f (x). Eh bien ! nous avons tout simplement groupés
les indivisibles de grandeur comparable ; nous avons, comme on dit en algèbre, fait la réunion, la
réduction des termes semblables. On peut dire encore que, avec le procédé de Riemann, on essayait
de sommer les indivisibles en les prenant dans l’ordre où ils étaient fournis par la variation de x,
1. Henri Lebesgue, Sur le développement de la notion d’intégrale, Conférence à la Société Mathématique,

Copenhague, 1926. Œuvres Scientifiques, L’Enseignement Mathématique, Genève 1972.
2. nous dirions aujourd’hui . . . infinitésimaux

!k
!
k!1
!1
!
0
x
Ak
Figure 2.2 – Découpage de l’aire dans l’intégration de Lebesgue
on opérait donc comme le ferait un commerçant sans méthode qui compterait pièces et billets
au hasard de l’ordre où ils lui tomberaient sous la main ; tandis que nous opérons comme le
commerçant méthodique qui dit :
j’ai µ(1) pièces de 1 couronne valant 1 · µ(1),
j’ai µ(2) pièces de 2 couronnes valant 2 · µ(2),
j’ai µ(5) pièces de 5 couronnes valant 5 · µ(5),
etc, j’ai donc en tout
S = 1 · µ(1) + 2 · µ(2) + 5 · µ(5) + · · ·
Les deux procédés conduiront, certes, le commerçant au même résultat parce que, si riche qu’il
soit, il n’a qu’un nombre fini de billets à compter ; mais pour nous, qui avons à additionner une
infinité d’indivisibles, la différence entre les deux façons de faire est capitale.
Pour une fonction continue (qui peut être approchée de façon uniforme par des fonctions en
escalier) et en prenant la mesure sur les intervalles fermés µ([α, β]) = β − α, on retrouve
l’intégrale de Riemann comme on le vérifiera plus bas. Mais l’idée permet de définir une
intégration plus générale. Elle repose bien sûr sur une définition plus précise de la mesure
µ.

2.2.2 Mesure (Bribes de théorie de la)

• Tribu de Borel
On se donne un sous-ensemble X de R, et on cherche à donner une “mesure” à des familles

de sous-ensembles de X. On impose à une telle famille T de sous-ensembles de X, appelée tribu
(ou σ-algèbre), de satisfaire les axiomes suivants :
– X ∈T, ∅∈T.
– Si A ∈ T , son complémentaire dans X : Ā = {X A ∈ T .
– Si {An } est un ensemble fini ou dénombrable d’éléments de T , ∪n An ∈ T .
Autrement dit, une tribu est une famille de sous-ensembles stable par passage au complémentaire
et par union finie ou dénombrable, et contenant ∅.
Exercice : montrer que si An ∈ T , (ensemble fini ou dénombrable), ∩n An ∈ T .
Noter que la tribu est stable par les seules unions (finies ou) dénombrables d’éléments. Cela diffère de la
propriété des ouverts d’un e.t., pour lesquels toute union est un ouvert.
Dans la suite, en théorie de l’intégration mais aussi en théorie des probabilités, on fera sou-
vent appel à la tribu borélienne B(R), qui est la plus petite tribu contenant O(R), l’ensemble des
ouverts ]a, b[ de R, y compris les cas où a = −∞ ou b = +∞. Par passage au complémentaire,
on vérifie que tout [a, +∞[, ] − ∞, a] ou [a, b] appartient à B(R), qui contient donc tous les
ouverts, tous les fermés, et toutes les unions finies ou dénombrables d’ouverts et/ou de fermés
(et bien plus encore). On appelle borélien un élément de B(R).
On peut définir de façon analogue la tribu borélienne B(E) de tout espace topologique E, comme “tribu
engendrée par les ouverts” de E, c’est-à-dire la plus petite tribu contenant ces ouverts. Pour un sous-e.t. F ⊂ E,
B(F ) = B(E) ∩ F (avec à nouveau une notation un peu abusive).
• Mesure de Lebesgue.
On suppose donnée une tribu T de X ⊂ R.

+ déf
Définition 2.1 : Une mesure sur (X, T ) est une fonction µ sur T à valeurs dans R = R+ ∪
{∞} telle que
– µ(∅) = 0 ;
– pour toute famille finie ou dénombrable (An ) d’éléments de T deux à deux disjoints :
Ai ∩ Aj = ∅ si i 6= j, on a
X
µ(∪n An ) = µ(An ) . (2.4)
n
La propriété (2.4) est appelée additivité dénombrable (ou σ-additivité).

Exemples de mesures : Tout (X, T ) possède (au moins) une mesure µ, par exemple la mesure
triviale nulle ; ou encore la mesure µ(A) = card(A), finie ou infinie ; ou bien encore, si a ∈ X, la

mesure de Dirac δa telle que pour A ∈ T , δa (A) = 1 ou 0 selon que a ∈ A ou a ∈ / A. On parle

de “masse de Dirac”, une notion que nous retrouverons dans l’étude des distributions. On peut
P
finalement faire des combinaisons linéaires de telles masses de Dirac µ = n αn δan , avec une
suite (finie ou infinie) de points an ∈ X et des poids αn ∈ R+ .
L’existence de mesure sur tout (X, T ) permet les définitions suivantes
Définition 2.2 : Un couple (X, T ) est dit mesurable ; le triplet (X, T , µ) est dit mesuré une
fois que l’on a choisi une mesure µ.
Exercice : montrer que les axiomes précédents sur la mesure impliquent sa monotonicité :
si B ⊂ C, µ(B) ≤ µ(C) (écrire C = B ∪ (C\B)) ; et sa sous-additivité : pour B, C ∈ T ,
µ(B ∪ C) ≤ µ(B) + µ(C), qui se généralise à tout ensemble fini ou dénombrable ∪n Bn .
Les notions précédentes de tribu de Borel, de mesure et d’espace mesuré s’étendent à des espaces topologiques
plus généraux que R.
En fait on va s’intéresser surtout à une mesure sur R généralisant la mesure naturelle pour
un intervalle : µ([a, b]) = |b − a|. On peut démontrer le
Théorème 2.1 (Mesure de Lebesgue sur les boréliens de R) : L’ensemble (R, B) admet
une unique mesure µ telle que ∀a, b ∈ R, µ([a, b]) = |b − a|.
Il en découle que pour un point {a} = [a, a], µ({a}) = 0, puis par union dénombrable, que
pour tout sous-ensemble Y fini ou dénombrable de R, µ(Y ) = 0. En particulier
µ(N) = µ(Z) = µ(Q) = 0 . (2.5)
Un exemple d’ensemble de mesure nulle mais non dénombrable est offert par l’ensemble de
Cantor K, voir Appendice A du chap. 1.
Un ensemble A tel que µ(A) = 0 est dit négligeable ou de mesure nulle.
Remarques
1. La propriété énoncée dans le Théorème est non triviale. Il s’agit de démontrer que la définition de µ s’étend des
intervalles à tout borélien. L’idée est de prendre le sup(µ(K)) pour tout compact K ⊂ A, ou encore l’inf(µ(O))
pour tout ouvert O ⊃ A, [5] et la difficulté est de s’assurer que la σ-additivité est bien satisfaite.
2. Il existe des sous-ensembles de R non mesurables pour la mesure de Lebesgue, en ce sens qu’aucune extension
de la mesure sur les intervalles ne peut être définie sur eux sans incohérence. Leur construction est délicate et
pas explicite, faisant appel à l’axiome du choix (Zermelo), voir quelques indications dans [1] (p. 62 et note p.
55).
3. Il peut arriver qu’un ensemble A ∈ B(R) soit de mesure nulle, mais qu’il possède des sous-ensembles B
non mesurables ! Ainsi si toute partie de l’ensemble de Cantor K était mesurable, elle serait de mesure nulle
puisque contenue dans K de mesure nulle, donc serait dans la tribu de Borel B(R). Mais card (P(K)) = 2c >
c = card (B(R)) contredit P(K) ⊂ B(R). Noter que cet argument n’est pas “constructif”, il affirme l’existence

de sous-ensembles non mesurables de K, mais sans les donner explicitement.

On peut donc souhaiter étendre la mesure de Lebesgue à une “tribu de Lebesgue” contenant la tribu de Borel,
de telle façon que tout sous-ensemble d’un ensemble de mesure nulle soit lui-même mesurable et de mesure
nulle. Le lecteur curieux est renvoyé à la littérature sur cette extension [5].
La mesure de Lebesgue définie sur les boréliens est ensuite étendue à une tribu plus large,
que nous ne préciserons pas davantage. Dans la suite la mesure considérée sera cette mesure de
Lebesgue, et “ensemble mesurable” signifiera ensemble mesurable pour la mesure de Lebesgue.
• Propriétés vraies presque partout
Définition 2.3 : Une proposition P (x), x ∈ X ⊂ R, est vraie presque partout (vraie p.p.) si
elle est vraie pour tout x sauf sur un ensemble contenu dans un ensemble de mesure nulle.
On dit encore que P (x) est vraie pour presque tout x ∈ X.

Exemples. 1. La fonction partie entière, notée E(x) (ou bxc),
E(x) = n si n ≤ x < n + 1 (2.6)
est dérivable et de dérivée nulle en tout point x ∈

/ Z, elle est donc dérivable p.p.
2. La fonction de Dirichlet D(x) = χQ (x), égale à 1 sur Q, à 0 sur R\Q, est nulle p.p.
• Fonctions mesurables
déf
Définition 2.4 : Une fonction f : R → R est mesurable si ∀B ⊂ R mesurable, f −1 (B) = {x ∈
R : f (x) ∈ B} est mesurable.
On comparera cette définition à celle donnée plus haut d’une fonction continue (l’image inverse
de tout ouvert est un ouvert).
Un exemple utile de fonction mesurable est celui d’une fonction constante, ∀x ∈ R, f (x) = a :
pour tout B mesurable, ou bien a ∈ B et f −1 (B) = R, ou bien a ∈ / B et f −1 (B) = ∅, et dans les
deux cas, f −1 (B) est mesurable. On montre que toute fonction f : R → R qui est soit continue,
soit monotone, est mesurable ([5], p. 30) ; que si f : R → R est mesurable, f ± = sup(±f, 0) le
sont, donc aussi |f | = f + + f − .
La réciproque n’est pas vraie : |f | peut être mesurable sans que f le soit. Soit A ⊂ R mais A ∈
/ B(R) (un ensemble
non mesurable comme ci-dessus un sous-ensemble de l’ensemble de Cantor K). Considérons la fonction f prenant
la valeur ±1 selon que x appartient ou non à A. Puisque f −1 (1) = A n’est pas mesurable, f ne l’est pas. Mais
|f | l’est puisque c’est une fonction constante.
Énonçons un fait d’expérience : toutes les fonctions rencontrées en Physique sont mesurables.
Cela est dû à la grande difficulté, mentionnée plus haut, de construire des ensembles non
mesurables, et donc à leur caractère très artificiel, jamais réalisé en physique. Pour cette raison,
nous ne nous étendrons pas davantage sur cette notion.

• Mesures sur Rn
Sur R2 , on définit la tribu notée B(R) ⊗ B(R) “engendrée par” (c’est-à-dire la plus petite
tribu contenant) tous les produits A × B de boréliens. Il existe sur cette tribu une mesure
héritée de la mesure µ sur les boréliens : µ2 (A × B) = µ(A)µ(B). Un résultat très utile est
l’invariance de la mesure µ2 non seulement par translation ou réflexion, mais aussi par rotation
ou plus généralement par déplacement dans R2 . Cela se généralise bien sûr à Rn .
2.2.3 Retour à l’intégrale de Lebesgue

On va reprendre et préciser la construction du § 2.2.1. Dans ce qui suit, E est un espace mesuré
quelconque (donc en fait on se donne (E, B, µ)). On peut penser de façon concrète à E = R ou
une partie de R, ou E = Rn , ou E = C, avec la mesure de Lebesgue, comme on l’a vu.
• a. Fonctions étagées
Définition 2.5 : Une fonction de E dans R est dite étagée s’il existe un nombre fini d’ensembles
mesurables deux à deux disjoints Aj , j = 1, · · · , n et des nombres α1 , · · · , αn ∈ R tels que
n
X
f= αj χAj , (2.7)
j=1
où χA est la fonction indicatrice de l’ensemble A, cf (A.1). Elle est donc mesurable et ne prend
qu’un ensemble fini de valeurs. Exemple : la fonction de Dirichlet D = 0χR + 1χQ .
Un cas particulier de fonctions étagées est celui des fonctions en escalier. Rappelons la
définition déjà donnée à l’App. A.4 :
Définition 2.6 : Une fonction de R dans R est dite en escalier si elle est constante par mor-
ceaux.
C’est donc une fonction étagée dont les ensembles Aj sont des intervalles bornés.
Par exemple, la fonction de Dirichlet déjà rencontrée, D(x) = χQ (x), est étagée mais pas
en escalier.
Un théorème important pour la construction de l’intégrale de Lebesgue est le suivant
+
Théorème 2.2 : Soit E un espace mesuré. Toute fonction mesurable f : E → R est limite
simple d’une suite croissante (fn ) de fonctions étagées positives.
“Suite croissante” signifie que pour tout n, on a fn ≤ fn+1 . Autrement dit,

Corollaire : L’ensemble des fonctions étagées est dense dans l’ensemble des fonctions mesu-
rables pour la “topologie de la convergence simple”.

La “topologie de la convergence simple” sur l’espace des applications d’un e.t. X dans un e.t. Y est définie
comme suit : les ouverts en sont les unions quelconques d’intersections finies de parties de la forme W (x, V ) où
V est un ouvert quelconque de Y , x un point quelconque de X et W (x, V ) l’ensemble des fonctions f : X → Y
telles que f (x) ∈ V .
Preuve du théorème 2.2 ([7], p. 15) : Considérons d’abord une fonction mesurable f positive ; pour tout
entier n ≥ 1 et tout entier i tel que 1 ≤ i ≤ n 2n on définit
" "!
−1 i−1 i
En,i = f , et Fn = f −1 ([n, ∞])
2n 2n
et la fonction
n 2n
X i−1
fn = χEn,i + nχFn .
i=1
2n
f étant mesurable, les ensembles En,i et Fn sont mesurables, cf. Déf. 2.4. Vérifier que les fonctions fn sont bien
étagées et que la suite fn est bien croissante. Soit x ∈ E. Si f (x) est fini, fn (x) ≥ f (x) − 2−n pour n assez
grand. Si f (x) est infini, fn (x) = n. Donc dans tous les cas, fn (x) → f (x). Si f est bornée sur E, cette même
construction fournit une suite uniformément convergente de fonctions étagées positives, puisque |f − fn | < 2−n .
Pour une fonction mesurable non positive, on écrit f = f+ − f− , avec f± ≥ 0 mesurables, etc.
• b. Intégrale de Lebesgue
+
Pour une fonction étagée positive, f : E → R , donc satisfaisant (2.7) avec αi ≥ 0, l’intégrale
de Lebesgue est définie comme le nombre positif
Z n
X
déf
f dµ = αi µ(Ai )
i=1
(avec la convention que si αi = ∞ et µ(Ai ) = 0, αi µ(Ai ) = 0 et vice versa). Pour s’assurer de la

cohérence de cette définition, il faut vérifier son indépendance par rapport au choix des Ai dans
R R R
(2.7), ce que nous admettrons. On note de façon équivalente f dµ = E f dµ = E f (x)dµ(x) ou
R R R
même = E f (x)dx. Donc pour la fonction de Dirichlet, D dµ = µ(Q) = 0, [0,1] (1−D)dµ = 1,
R
(1 − D)dµ = +∞.
Soit une fonction f mesurable à valeurs positives ; on définit son intégrale par
Z Z
déf
f dµ = sup g dµ | g étagée et 0 ≤ g ≤ f . (2.8)
+
C’est un nombre de R , donc éventuellement infini !
Définition 2.7 : Si ce nombre est fini, f est dite intégrable (ou sommable) au sens de Lebesgue.
Finalement pour une fonction mesurable de signe quelconque, on définit ses parties positive
et négative comme ci-dessus, f + = max (f, 0) et f − = max (−f, 0), toutes deux positives (ou

nulles) et mesurables. On a f = f + − f − , |f | = f + + f − . Alors f est intégrable (ou sommable)

si séparément f + et f − le sont, autrement dit si |f | est intégrable, et on écrit l’intégrale de
Lebesgue de f comme
Z Z Z
f dµ = f dµ − f − dµ .
+
(2.9)
Retenons donc que par définition,

f est intégrable de Lebesgue ssi |f | l’est.
Pour une fonction à valeurs dans C, on procède de même : on sépare partie réelle et partie imaginaire et f
R R R
est intégrable si <e f et =m f le sont, avec f dµ = <e f dµ + i =m f dµ.
2.2.4 Intégrales de Lebesgue sur R2 ou Rn

On a mentionné plus haut la mesure produit µ2 définie sur les boréliens de R2 . Cette
mesure est invariante par translation, rotation ou plus généralement par déplacement. On peut
alors définir une intégrale de Lebesgue pour les fonctions R2 = R × R → R qu’on notera
R
R2
f (x, y)dµ2 (x, y). Ici encore, la fonction f est dite intégrable (de Lebesgue) ssi |f | l’est. Pour
un changement de variable arbitraire {xj }7→ {yi } dans Rn , la formule de changement de
variable implique le jacobien J = det ∂y∂xi (x)j
, voir Appendice B.
Un résultat très utile est le Théorème de Fubini qui justifie l’interversion des intégrations.
Théorème 2.3 (Fubini) : Pour A, B ∈ B(R), et f intégrable sur A × B

Z Z Z Z Z
dµ2 (x, y) f (x, y) = dµ(y) dµ(x)f (x, y) = dµ(x) dµ(y)f (x, y) . (2.10)
A×B B A A B
Inversement le fait que les deux intégrales du milieu et de droite ne soient pas égales signale
que f n’est pas intégrable. Voir des exemples en TD.
En fait l’hypothèse que f est intégrable découle elle-même de l’hypothèse que l’une ou
l’autre des “intégrales itérées” du milieu ou de droite dans (2.10) est absolument convergente
(théorème de Tonelli).
R
Autrement dit Fubini nous dit : si f est intégrable, alors x 7→ dyf (x, y) existe p.p. et est intégrable (et
R R
ibid avec x ↔ y) et on peut intervertir les intégrations ; Tonelli nous dit : si soit B dµ(y) A dµ(x)|f (x, y)| ,
R R
soit A dµ(x) B dµ(y)|f (x, y)| est finie, alors f est intégrable et le théorème de Fubini s’applique !
Mais cette condition n’est pas toujours remplie, même en physique, donc prudence ! Voir
des exemples en TD.

2.2.5 Espaces Lp et Lp
• a. Espaces Lp
Pour f une fonction mesurable E → R (E désignant toujours un espace mesuré), on se

R +
rappelle que |f |dµ est défini dans R . On définit pour p réel ≥ 1
Z p1
déf p
kf kp = |f | dµ . (2.11)
Proposition 2.4 : k kp est une semi-norme. En particulier
kf kp = 0 ⇔ f nulle p.p. . (2.12)
Preuve : c’est évident dans le sens ⇐ ; dans le sens ⇒, on procède par l’absurde. La propriété kλf kp = |λ|kf kp
est évidente et l’inégalité triangulaire est laissée en exercice (inégalité de Minkowski, voir TD).
On note Lp (E) l’espace vectoriel des fonctions mesurables f telles que |f |p soit intégrable.
(Bien noter qu’on prend la valeur absolue de f , ce qui évite des problèmes quand f a des valeurs
négatives et que p est non entier. . .) Si E est de mesure finie, on montre que 1 ≤ p ≤ q implique
1 1
que kf kp ≤ µ(E) p − q kf kq et donc que Lq (E) ⊂ Lp (E) ⊂ L1 (E) (cf [5], p.75). Par exemple, pour
√
E =]0, 1[, x 7→ 1/ x ∈ L1 (]0, 1[) mais ∈ / L2 (]0, 1[). Noter que la condition “E est de mesure
finie” exclut E =]1, ∞[ ou R. Ainsi x 7→ 1/x ∈ / L1 (]1, ∞[) mais ∈ L2 (]1, ∞[). Donc attention !
il n’existe pas de relation d’inclusion entre les Lp (R).
Exercice : trouver un exemple de fonction qui ∈ L1 (R) mais ∈ / L2 (R) ; qui ∈
/ L1 (R) mais
∈ L2 (R) ; qui ∈ L1 (R) et ∈ L2 (R) .
Il conviendrait alors d’étudier les questions de convergence : quand une suite fn ∈ Lp convergeant p.p.
vers f a-t-elle une limite f ∈ Lp ? (théorème de Fatou) ; quelles sont les relations entre la convergence p.p.
et la convergence dans la semi-norme k kp (ou “convergence en moyenne d’ordre p”) ? ; l’espace Lp est-il
complet ? (théorème de Riesz–Fischer), voir plus bas. Pour toutes ces questions, nous renvoyons à la littérature
mathématique, voir références en fin de chapitre, et nous nous contenterons d’énoncer un résultat remarquable
et très utile, dû à Lebesgue :
Théorème 2.5 de Lebesgue de convergence dominée : Soit (fn ) une suite de fonctions
mesurables de E, sous-ensemble mesurable de R, dans R, qui converge simplement p.p. vers une
fonction f . On suppose qu’il existe une fonction g intégrable t.q. ∀n ≥ 1, |fn | ≤ g p.p. Alors f
R R
est intégrable, (fn ) converge pour la semi-norme k k1 vers f et l’on a lim E fn dµ = E f dµ.
La preuve, un peu technique, peut être trouvée par exemple dans [5] pp 94-95, qui en donne aussi une
version pour des fonctions fn et g ∈ Lp .

Autrement dit, l’existence d’une majoration des |fn | (“domination”) par une même fonction
g indépendamment de n suffit à assurer l’intégrabilité L1 de la limite et l’égalité des intégrales
à la limite, sans supposer de convergence uniforme comme dans le Théorème 1.8.
Ce théorème a d’importantes conséquences pratiques sur l’intégration terme à terme d’une
série, la continuité et la dérivabilité d’une intégrale par rapport à un paramètre, etc, voir ci-
dessous § 2.3.
2 /n2 x
e−x cos
Exemple : ([1] p. 65). Soit fn (x) = 1+x2
n
qui converge simplement vers f (x) = 1/(1+x2 )
R∞
qui est intégrable et est dominée par ce f pour tout x. On en conclut que limn→∞ −∞ fn (x)dx =
R∞ ∞
−∞
f (x)dx = Arctan x −∞ = π. Voir d’autres exemples en TD.
• b. Espaces Lp
On a vu que si deux fonctions intégrables f et g sont égales p.p., leurs intégrales sont égales.
On va maintenant identifier deux fonctions égales p.p. et on est amené à la
Définition 2.8 : Espaces Lp . Soit E un espace mesuré. L’espace Lp (E) est l’espace vectoriel
des fonctions (à valeurs dans R ou C) définies à une égalité p.p. près et telles que f p soit
intégrable.
Exemple. La fonction de Dirichlet χQ (x) s’identifie dans L1 à la fonction nulle.

déf R
On peut munir ces espaces de la norme kf kp = |f |p dµ. Nous aurons à travailler tout
particulièrement avec les espaces L1 et L2 .
Théorème 2.6 (Riesz–Fischer) : L’espace Lp (E) des fonctions intégrables (à valeurs dans
R
R ou C), muni de la norme kf kp = ( |f |p dµ)1/p est un e.v. normé complet. L’espace C([a, b]),
resp. C[R] des fonctions continues sur [a, b], resp. R, est dense dans L1 ([a, b]), resp. L1 (R).
On a donc résolu une des difficultés de l’intégrale de Riemann mentionnée au § 2.1.3.
2.2.6 Comparaison entre intégrales de Riemann et de Lebesgue

1. Propriétés communes aux intégrales de Riemann et Lebesgue
L’intégrale de Lebesgue possède les propriétés suivantes :

– (a) linéarité : l’ensemble des fonctions intégrables (sur un certain espace mesuré E) est
R
un espace vectoriel et f 7→ f dµ est une forme linéaire ;
R R
– (b) croissance : si f et g sont réelles et intégrables
R et f ≤
R g, alors f dµ ≤ gdµ ;
– (c) si f est intégrable (à valeurs dans R ou C), f dµ ≤ |f |dµ ;


– (d) domination : si g ≥ 0 est intégrable et si f mesurable satisfait p.p. |f | ≤ g, alors f

est intégrable.
– (e) additivité : si A et B sont mesurables et A ∩ B est fini ou de mesure nulle, et si f est
R R R
intégrable sur A ∪ B, A∪B f dµ = A f dµ + B f dµ.
R R
– (f) si f et g sont égales p.p. sur A mesurable, A f dµ = A gdµ ;
– (g) si une fonction mesurable f positive sur A a une intégrale sur A nulle, elle y est nulle
p.p.
Les propriétés (a), (b), (c) sont aussi satisfaites par l’intégrale de Riemann ; (e) généralise
Rb Rc Rb
a
f (x)dx = a
f (x)dx + c
f (x)dx si c ∈]a, b[. Les propriétés (f) et (g) généralisent au sens du
“p.p” des propriétés de l’intégrale de Riemann. La propriété (d) (qui découle du Théorème de
Lebesgue de convergence dominée) ne se transpose pas naı̈vement à l’intégrale de Riemann 3 .
Une fois encore, un contre-exemple nous est fourni par la fonction f = χQ∩[0,1] qui n’est pas
intégrable de Riemann mais satisfait |f | < χ[0,1] et est intégrable de Lebesgue.
2. Changement de variable
Soit f une fonction intégrable sur B ⊂ R. Soit ϕ une fonction de classe C 1 (continûment
différentiable) et de dérivée non nulle sur A = ϕ−1 (B). Alors f ◦ ϕ est intégrable sur A et
Z Z
f (y)dµ(y) = f (ϕ(x))|ϕ0 (x)|dµ(x) . (2.13)
B A
Pour l’intégrale de Riemann sur un intervalle image par ϕ monotone de [α, β] on reconnaı̂t la
formule familière de changement de variable par y = ϕ(x)
Z ϕ(β) Z β
f (y)dy = f (ϕ(x))ϕ0 (x)dx .
ϕ(α) α
La formule (2.13) s’étend aux intégrales dans Rn , voir App. B.
3. Intégrabilité à la Riemann, à la Lebesgue
Un théorème dû à Lebesgue affirme
Théorème 2.7 (Critère de Lebesgue) : Soit f une fonction définie et bornée sur [a, b] et
soit ∆ l’ensemble des points de discontinuité de f sur [a, b]. Alors f est intégrable au sens de
Riemann si et seulement si ∆ est contenu dans un ensemble de mesure de Lebesgue nulle.
3. Il existe aussi des versions du théorème de convergence dominée pour l’intégrale de Riemann, voir par
exemple, http://jf.burnol.free.fr/convergencedominee_v2.pdf

Exemples : la fonction indicatrice de l’ensemble de Cantor χK est intégrable de Riemann

bien que non réglée (déf. § 2.1.1), et bien qu’ayant une infinité non dénombrable de points de
discontinuité ; celle de X = Q ∩ [0, 1] ne l’est pas.
En effet on se rappelle (App A.1) que l’ensemble des points de discontinuité de χX est la “frontière” de X, soit
o o
∆ = X̄\ X. Ici X̄ = [0, 1], X= ∅, µ(∆) = 1.
Ce critère permet aussi de démontrer le théorème 1.7 du chapitre 1 sur la commutation de
l’intégration et de la limite, sous l’hypothèse de convergence uniforme.
En effet fn intégrable de R. ⇒ ∆n est de mesure nulle ; la CVU implique que f est continue à tous les points
où les fn sont continues ⇒ ∆ ⊂ ∪n ∆n est de mesure nulle ⇒ f intégrable de R.
On a vu que toute fonction réglée est intégrable de Riemann ; on montre qu’elle est aussi
intégrable de Lebesgue, par application du théorème de Lebesgue de convergence dominée, (voir
[5] p 104), et leurs intégrales sont égales. Plus généralement
Théorème 2.8 : Toute fonction R → R qui est intégrable au sens de Riemann l’est aussi au
sens de Lebesgue et leurs intégrales sont égales
Z Z
f (x)dx = f dµ .
R R
Mais bien sûr, et c’est l’intérêt de l’intégrale de Lebesgue, il existe des fonctions non
intégrables au sens de Riemann mais intégrables au sens de Lebesgue. Exemple, la fonction
de Dirichlet D = χQ∩[0,1] .
Par ailleurs, la condition R → R du Théorème précédent exclut le cas des intégrales im-
propres de fonctions sur [a, b[, avec b fini ou infini, cf ci-dessus § 2.1.2. Il faut donc reprendre
l’analyse dans ce cas-là.
Pour une fonction f : [a, b[→ R, on note f ∗ son prolongement à R\[a, b[ par 0. Par définition
Rb
de l’intégrale de Lebesgue, f ∗ est intégrable de Lebesgue ssi a f dx est absolument convergente.
R∞
Par conséquent les intégrales semi-convergentes, telle 1 dx x
sin x, ne peuvent être in-
terprétées comme intégrales de Lebesgue.
Remarque. L’intégrale fonction de sa borne supérieure.
Comme on l’a rappelé plus haut, pour l’intégrale de Riemann, intégration et dérivation sont
des opérations inverses l’une de l’autre : si f est continue donc intégrable au sens de Riemann
Rx
sur [a, b], pour tout x ∈]a, b[ F (x) := a f (x0 )dx0 est dérivable et F 0 (x) = f (x). De plus
Rb
a
f (x0 )dx0 = F (b) − F (a). Pour l’intégrale de Lebesgue, cela n’est plus toujours le cas : on
verra plus bas, au Chap. 5, le cas de la fonction de Cantor F telle que F (1) − F (0) = 1 mais
R1
dont la dérivée est définie et nulle p.p. Clairement on ne peut avoir F (1) − F (0) = 0 F 0 (x)dx.
Rx
D’une manière générale, si f est intégrable de Lebesgue, l’intégrale de Lebesgue a f (x0 )dx0 est
dérivable avec pour dérivée f (x) sauf sur un ensemble de mesure nulle.

§ 2.3. Intégrales dépendant d’un paramètre 31
2.3 Intégrales dépendant d’un paramètre

On considère une fonction de deux variables réelles f : R × [a, b] → R (si c’est → C, il
suffit de séparer partie réelle et partie imaginaire), on suppose x 7→ f (x, t) mesurable pour tout
t ∈ [a, b], et on s’intéresse à la fonction φ définie par l’intégrale
Z
φ(t) = dx f (x, t) t ∈ [a, b] (2.14)
R
et à ses propriétés de continuité, de dérivabilité et d’intégrabilité etc.
Théorème 2.9 : Pour t0 ∈ [a, b], si pour presque tout x ∈ R, t 7→ f (x, t) est continue en t0 ,
et s’il existe une fonction g : R → R+ , intégrable et dominant |f | dans un voisinage V de t0
|f (x, t)| ≤ g(x) p.p. en x ∈ R
alors t 7→ φ(t) est continue en t0 .
La preuve repose sur le théorème de convergence dominée de Lebesgue, ([1], p 66).

Avec les mêmes notations
Théorème 2.10 : Si dans un voisinage de t0 la fonction x 7→ f (x, t) est intégrable et la

fonction t 7→ f (x, t) est dérivable pour presque tout x ∈ R et que la dérivée est dominée

∂f
(x, t) ≤ g(x) ∀t ∈ V et p.p. en x ∈ R ,
∂t
avec g intégrable, alors la fonction t 7→ φ(t) est dérivable en t0 et

Z Z
d ∂f
f (x, t)dx = (x, t0 )dx , (2.15)

dt R t=t0 R ∂t
autrement dit, on peut “dériver sous le signe somme”.
Il s’agit là d’un résultat important en pratique en physique, où on est souvent amené à
dériver sous le signe somme. Il importe donc de connaı̂tre les conditions qui justifient cette
opération.
En ce qui concerne l’intégrabilité de φ(t), on a vu plus haut le Théorème de Fubini.
Dans le même esprit, quand peut-on intégrer terme à terme une série de fonctions ? Un théorème donne une
condition suffisante
P∞ R
Théorème 2.11 (B. Levi) : Si une suite de fonctions fn de L1 (R) est telle que n=1 R |fn (x)|dx < +∞,
P R PR
alors la série fn converge absolument p.p., sa somme f est intégrable et f dx = fn dx.

Exemples, contrexemples
a) Considérons la fonction f : f (x, 0) = 0 et si t 6= 0, f (x, t) = √12π exp − 12 (x − 1t )2 . La

fonction t 7→ f (x, t) est continue pour tout x ∈ R. Pour t 6= 0, la fonction x 7→ f (x, t) est une
gaussienne d’intégrale φ(t) = 1. Mais pour t = 0, f = 0 a une intégrale nulle. La fonction φ est
discontinue en t = 0. Dans ce cas, on n’a pas de fonction g dominante.
R∞
b) Considérons la fonction φ(t) = 0 dx cos(xt)
1+x2
, dont on montrera (Chap. 8, § 8.1.5) qu’elle
π −|t|
vaut φ(t) = 2 e , et donc qu’elle est continue mais non dérivable en t = 0. Voir TD2.
Appendice B. Changements de variables dans une intégrale

sur un domaine de Rn. Jacobien
Nous admettrons les résultats suivants, qui constituent une généralisation à Rn du résultat
bien connu (2.13) sur les fonctions R → R.
Soient Ω et Ω0 deux ouverts de Rn et ϕ une application bijective et continûment différentiable
(= de classe C 1 ) de Ω sur Ω0
(x1 , x2 , · · · , xn ) 7→ (y1 , y2 , · · · , yn ) = ϕ(x1 , · · · , xn ) . (B.1)
Définition 2.9 : On appelle matrice jacobienne la matrice des dérivées partielles

D(y1 , y2 , · · · , yn ) déf ∂yi
Jϕ ≡ = , (B.2)
D(x1 , x2 , · · · , xn ) ∂xj 1≤i,j≤n
et on appelle Jacobien le déterminant de la matrice jacobienne
Jϕ = det Jϕ . (B.3)
Si ce jacobien Jϕ ne s’annule pas sur Ω, la fonction inverse ϕ−1 : Ω0 → Ω est aussi continûment
différentiable sur Ω0 . On appelle un tel ϕ un difféomorphisme de Ω.
Avec ces notations, on a le
Théorème 2.12 (changement de variables) : Supposons que le jacobien Jϕ ne s’annule

pas sur Ω. Soit f une fonction Ω0 → Rp . Alors
f intégrable sur Ω0 ⇔ f ◦ ϕ intégrable sur Ω
et Z Z
n
f (y)d y = (f ◦ ϕ)(x)|Jϕ (x)|dn x .
Ω0 Ω

§ 2.3. Intégrales dépendant d’un paramètre 33
Cela s’applique en particulier aux changements de coordonnées rectangulaires ↔ polaires

dans R2 ou ↔ cylindriques ou sphériques dans l’espace R3 .
Coordonnées polaires dans R2
(x = r cos θ, y = r sin θ), r ≥ 0, 0 ≤ θ < 2π dx dy = rdr dθ (B.4)
Coordonnées cylindriques dans R3
(x = r cos θ, y = r sin θ, z), r ≥ 0, 0 ≤ θ < 2π dx dy dz = rdr dz dθ (B.5)
Coordonnées sphériques dans R3
(x = r cos φ sin θ, y = r sin φ sin θ, z = cos θ) , r ≥ 0, 0 ≤ φ < 2π, 0 ≤ θ ≤ π,

dx dy dz = r2 dr sin θ dθ dφ . (B.6)
Exercice : écrire les coordonnées sphériques et leur jacobien dans Rn , n arbitraire.
Voir Appel [1], et pour plus de précisions mathématiques, Gapaillard [5] et Rudin, [7].


Chapitre 3
Distributions
3.1 Introduction
Le physicien rencontre fréquemment des situations où les fonctions régulières –continues,
une fois, deux fois . . . différentiables– de l’analyse classique s’avèrent insuffisantes. Ce sont en
général des limites singulières de problèmes bien définis, voir ci-dessous des exemples, et le
physicien a donc à sa disposition une “régularisation” naturelle de la singularité, fournie par le
problème étudié avant d’en prendre la limite. Cette régularisation n’est pas toujours évidente
dans une formulation mathématique générale. Cela va nous amener à introduire des objets
mathématiques nouveaux, les fonctions généralisées ou distributions.
Ces concepts ont été intuités par le physicien P.A.M. Dirac et développés par les mathémati-
ciens Sergei Sobolev et Laurent Schwartz, dans les années 1935-1945.
Commençons par présenter quelques problèmes physiques où se rencontrent ces problèmes.
Il s’agit en général d’idéalisations de situations bien définies : limite de charge électrique ponc-
tuelle, de réseau diffuseur infiniment étendu, de choc infiniment bref avec changement instantané
de la vitesse, etc.
3.1.1 Distributions de charges électriques.

On considère le potentiel créé en r ∈ R3 par une charge électrique q isolée et localisée en r0
1 q
V0 (r) = (3.1)
4π0 kr − r0 k
et on le compare au potentiel créé par une distribution continue de charges, de densité ρ(r),
i.e. telle que la charge contenue dans un petit volume d3 r autour de r est ρ(r)d3 r
Z 0
1 3 0 ρ(r )
V (r) = dr . (3.2)
4π0 kr − r0 k

36 Chap.3. Distributions
Comment passer de (3.2) à (3.1) quand la charge est localisée en le seul point r0 ? Il faut imaginer
que la fonction ρ(r) a un support de plus en plus restreint quand un paramètre , par exemple
le diamètre de ce support, tend vers zéro, et est telle que lim→0 d3 r0 ρ(r0 )ϕ(r0 ) = qϕ(r0 ) pour
R
toute fonction ϕ “pas trop singulière” comme 1 ou comme 1/kr − r0 k. A la limite, ρ devrait
donc être nulle presque partout. On voit qu’au sens de l’intégrale de Lebesgue du chapitre 2,
son intégrale devrait alors être nulle, alors qu’on attend que cette intégrale vaille q. Cette limite
de ρ ne peut donc pas s’assimiler à une fonction. On écrira lim→0 ρ(r0 ) = qδ(r0 − r0 ), et δ, la
distribution delta de Dirac, nulle p.p. et d’intégrale égale à 1, nous offre un premier exemple
de distribution.
3.1.2 Diffusion cohérente par un réseau. Peigne de Dirac

Notre deuxième exemple concerne la diffusion d’une onde électromagnétique, supposée monochromatique de
vecteur d’onde k et de pulsation ω = 2πν, (avec |k| = ω/c), incidente selon un angle α sur un réseau supposé ici
unidimensionnel et constitué de 2L + 1 centres diffuseurs, espacés d’une longueur a. Un calcul classique montre
que l’onde diffusée dans la direction β a une amplitude multipliée par
L
X ei(L+1)k∆ − e−iLk∆ sin(2L + 1)k ∆
ei`k∆ = = 2
(3.3)
`=−L
eik∆ − 1 sin k ∆
2
où ∆ = a(sin α − sin β) est la différence de chemins optiques entre deux rayons lumineux incidents sur des
centres adjacents, voir Fig. 3.1.
(a)
!La 0 La
"
"
a sin " !
a sin "
(b) a sin! (c)
! a sin!
Figure 3.1 – (a) Diffusion par un réseau fini fait de 2L + 1 centres diffuseurs. (b-c) Différence de
chemin optique entre deux rayons lumineux adjacents observés en transmission (b) ou en réflexion (c).
Dans la limite où le nombre 2L + 1 de diffuseurs tend vers l’infini, le facteur (3.3) apparaissant dans
l’amplitude devient de plus en plus “piqué” et grand au voisinage de toute valeur 2πK de x, cf Fig 3.2. La limite
(dans un sens qui devra être précisé) est donc infinie en tout point 2πK, nulle ailleurs. On notera 2πδP (x) cette
limite, où l’indice “P ” rappelle sa nature périodique, de période 2π,
∞
? 1 X i`x
δP (x) = e .
2π
`=−∞

§ 3.1. Introduction 37
1 1
0.8 0.8
0.6 0.6
0.4 0.4
0.2 0.2
-3 -2 -1 1 2 3 -3 -2 -1 1 2 3
-0.2 -0.2
-0.4 -0.4
Figure 3.2 – La fonction sin(2L + 1) x2 /[(2L + 1) sin x2 ] entre −π et π pour deux valeurs de L = 10 et
L = 50. On voit que la fonction n’est d’ordre 1 que dans un intervalle |∆x| ≈ O( L1 ) autour de chaque
multiple de 2π.
Noter que son intégrale vaut 1 sur tout intervalle de longueur 2π (on intervertit hardiment intégration et
sommation infinie, il faudrait revenir à la somme de −L à L)
Z π ∞
Z π X ∞
1 X
δP (x)dx = ei`x dx = δ`0 = 1 , (3.4)
−π 2π −π
`=−∞ `=−∞
et on peut donc écrire –toujours de façon très heuristique– δP comme une superposition linéaire de distributions
de Dirac localisées aux multiples de 2π
∞
X
δP (x) = δ(x − 2πK) .
K=−∞
On donne pour cela à cette fonction généralisée, dont on a tenté de dessiner le graphe à la figure 3.3, le nom de
“peigne de Dirac”, et on remplace souvent la notation δP par celle, plus suggestive, de X (la lettre cyrillique
“cha”). On y reviendra plus bas, équ. (3.7).
x/2
2 1 0 1 2
Figure 3.3 – Le “peigne de Dirac”
3.1.3 Choc élastique

Une balle rebondit élastiquement sur un obstacle. Sa vitesse avant le choc est v0 , elle est −v0 après (hy-
pothèse de choc élastique, sans perte d’énergie cinétique). Supposons pour simplifier que le profil de vitesse

pendant l’intervalle ∆t du choc est linéaire, voir figure 3.4. Par la loi de Newton, la force à laquelle la balle
est soumise est F = mv̇ = m∆v/∆t, donc F = −2mv0 /∆t. La variation de la quantité de mouvement,
∆21 p = p2 − p1 = −2mv0 = F∆t est indépendante de ∆t. Dans le cas limite où ∆t → 0, la force F est mal
définie, mais son intégrale sur tout intervalle de temps [t1 , t2 ] qui mesure cette variation de la quantité de mouve-
Rt R
ment ∆21 p = p2 −p1 = t12 dt F(t) reste, elle, bien définie. En particulier, pour tout 6= 0, − dt F(t) = −2mv0 .
À nouveau l’analyse usuelle faisant appel à des fonctions ordinaires ne peut rendre compte de ce F(t).
v v
t t
!t
Figure 3.4 – (a) profil de vitesse lors d’un choc élastique ; (b) limite d’un choc instantané
3.1.4 Autres exemples

On rencontrera d’autres exemples en mécanique quantique, en physique statistique, puis par la suite, en
théorie quantique des champs.
3.2 Définitions et premières propriétés

L’idée est de définir des objets dont l’intégrale avec des fonctions suffisamment régulières
est bien définie. Plutôt que de définir une fonction f par sa valeur en chaque point, on veut
en donner la moyenne locale obtenue par intégration avec une “fonction-test” de support suf-
fisamment concentré. Ainsi dans les exemples précédents, la densité de charge peut être un
objet singulier à la limite ponctuelle, mais la charge totale est bien définie ; la force dans un
choc instantané est mal définie, mais son intégrale sur le temps de la collision, c’est-à-dire la
variation de quantité de mouvement, est bien définie, etc. Pour donner un sens plus précis à
cette idée, il faut dire avec quelles fonctions f , quelles “fonctions-tests”, on va travailler.
Remarque : L’intégration d’une fonction est une opération linéaire : si ϕ est une fonction
de Rn dans C d’une classe D à préciser, et f une fonction telle que f (x)ϕ(x) soit intégrable,
R
(fonction “localement intégrable”, voir plus bas), l’application ϕ 7→ Rn dn xf (x)ϕ(x) est une
forme linéaire, c’est-à-dire une application linéaire de D dans C. On va exploiter cette remarque
pour définir les distributions comme formes linéaires sur des espaces de fonctions bien choisis.

§ 3.2. Définitions et premières propriétés 39
3.2.1 Espace des fonctions-tests. Définition des distributions.

Définition 3.1 : D(Rn ) (en général on écrira plus simplement D) est l’espace des fonctions
lisses, c’est-à-dire des fonctions de Rn dans C de classe C ∞ (infiniment différentiables), et de
support borné.
Un exemple standard sur R est fourni par la fonction de support (a, b) :


 c exp 1
(x−a)(x−b)
si a < x < b
φ(x) = (3.5)
0 sinon ,
voir figure 3.5.
0.015
0.010
0.005
!0.5 0.5 1.0 1.5
Figure 3.5 – La fonction (3.5) pour a = 0, b = 1, c = 1
Définition 3.2 : Une distribution est une forme linéaire continue sur D. L’espace des distri-
butions est noté D0 , c’est le dual de D.
Si T ∈ D0 est une distribution, on notera h T, ϕ i la forme linéaire T (ϕ).

Mais qu’entend-on par forme linéaire (ou fonctionnelle) continue ?
Définition 3.3 : Une suite de fonctions-tests ϕn ∈ D converge dans D vers ϕ ∈ D si les

supports des ϕn sont contenus dans un même ensemble borné indépendant de n et si toutes les
CVU
dérivées partielles des ϕn convergent uniformément vers celles de ϕ, ∂ (p) ϕn −→ ∂ (p) ϕ .
Définition 3.4 : Une forme linéaire (ou “fonctionnelle”) sur D est continue ssi pour toute
suite de fonctions-tests ϕn ∈ D convergeant dans D vers ϕ ∈ D, h T, ϕn i −→ h T, ϕ i .

Ce point complète la définition des distributions. Retenir qu’une distribution doit être une
fonctionnelle linéaire et continue. Ce dernier point est souvent le plus délicat à vérifier.
Commentaire sur le choix de l’espace D. Pourquoi ce choix, qui semble assez restrictif ? Noter
que plus on restreint la classe des fonctions-tests, plus grand sera l’espace des distributions
définies sur ces fonctions 1 . Le fait que les fonctions-tests soient de classe C ∞ n’est pas très
restrictif, toute fonction continue à support borné étant limite uniforme de telles fonctions 2 ;
le fait qu’elles soient de support borné sera levé plus tard : on considérera au Chap. 4 l’espace S
des fonctions-tests lisses (c’est-à-dire de classe C ∞ ) et à “décroissance rapide” ainsi que toutes
leurs dérivées (S pour Schwartz), et l’espace dual S 0 qui en résultera sera plus petit que D0 .
• Distributions régulières
Définition 3.5 : Une fonction mesurable f de Rn dans C est localement intégrable si pour
R
tout compact K ⊂ Rn , la fonction f · χK est intégrable, autrement dit K f (x)dx existe. On
note L1loc (Rn ) l’ensemble des fonctions localement intégrables sur Rn .
Si la propriété d’intégrabilité est vraie sur tout Rn , la fonction est intégrable. Par exemple
√
la fonction 1/ x, ou la fonction constante 1, sont localement intégrables sur R mais pas
intégrables. La fonction 1/x n’est pas localement intégrable. Toute fonction de Lp (Rn ), p ≥ 1,
est localement intégrable.
Toute fonction localement intégrable définit une distribution par intégration :
Théorème 3.1 : Si f est localement intégrable, elle définit une distribution, notée également
f , par Z ∞
∀ϕ ∈ D h f, ϕ i = f (x)ϕ(x)dx .
−∞
Cette distribution est appelée la distribution régulière associée à la fonction localement intégrable
f.
Preuve : Il est clair que l’intégrale existe, puisque restreinte à un intervalle compact, le support de ϕ. La
fonctionnelle est bien linéaire. Elle est continue car si la suite ϕn ∈ D converge vers ϕ ∈ D, avec des supports
R R R R
contenus dans un compact K, | f (ϕn −ϕ)| ≤ |f | |ϕn −ϕ| ≤ kϕn −ϕk∞ K |f | = M kϕn −ϕk∞ , où M = K |f |
existe puisque f est localement intégrable. Mais l’hypothèse CVU : kϕn − ϕk∞ → 0 donc h f, ϕn i → h f, ϕ i.
Ces distributions régulières expliquent en quoi les distributions sont des “fonctions généralisées”.
Elles vont nous guider dans la définition des opérations de dérivation, etc, des distributions.
1. au contraire du cas d’un espace vectoriel E de dimension finie, pour lequel dim E 0 = dim E, cf App. B
2. c’est le théorème de Stone–Weierstrass, une généralisation du théorème de Weierstrass cité à l’App. A.4
du Chap. 1.

Noter que deux fonctions localement intégrables égales p.p. définissent la même distribution
régulière.
• Distributions singulières
Ce sont les distributions que l’on ne peut pas associer à des fonctions localement intégrables.
Exemples :
1. Distribution de Dirac sur R. C’est la distribution notée δx0 ou encore δ(x − x0 ) définie
par
h δx0 , ϕ i = ϕ(x0 ) (3.6)
comme anticipé plus haut dans les exemples physiques.

2. Distribution de Dirac sur Rn : ibidem, définie par h δr0 , ϕ i = ϕ(r0 ).
3. Peigne de Dirac, cf § 3.1.2. Pour ϕ ∈ D(R), c’est la distribution définie par
∞
X
déf
h X, ϕ i = ϕ(n) . (3.7)
n=−∞
P∞
On peut donc écrire X = n=−∞ δn .
Exercice : calculer la somme Σ(x) = ∞ 2πikx
P
k=−∞ e en la testant sur une fonction ϕ périodique
de période 1 donnée par son développement en série de Fourier : on n’intégrera d’abord que sur
une période puis on rétablira la périodicité ; vérifier que Σ(x) est égal à X(x). Comparer avec
la discussion du § 3.1.2.
4. Partie principale de Cauchy de 1/x. Soit ϕ ∈ D(R). On définit la distribution PP x1 ,
partie principale de Cauchy, (certains auteurs parlent de “valeur principale”), par
Z Z
1 ϕ(x) déf ϕ(x)
h PP , ϕ i = PP dx = lim dx . (3.8)
x x →0+ |x|> x
(On note aussi l’intégrale de partie principale - ϕ(x)

R
x
dx. ) Bien noter que l’intégrale est calculée
1
de façon symétrique en x = 0. On définit par extension la PP x−a en tout point a.
• Support d’une distribution

Soit O un ouvert de Rn , D(O) l’espace des fonctions lisses de support contenu dans O et T ∈ D0 (O) une
distribution. On dit que T est nulle sur un ouvert U ⊂ O si ∀ϕ ∈ D(O) de support contenu dans U , on a
hT, ϕi = 0.
Définition 3.6 : On appelle support d’une distribution T sur O le complémentaire du plus grand ouvert sur
lequel T est nulle.

Remarque : Le support est bien défini, car si une distribution est nulle sur chacun des ouverts d’une famille,
elle est nulle sur leur réunion ; son support est donc le complémentaire de la réunion de tous les ouverts sur
lesquels elle est nulle.
Exemples : Si T est une distribution régulière associée à une fonction continue, alors le support qu’on vient
de définir s’identifie au support défini précédemment pour les fonctions continues. Si T est une distribution δ
ou n’importe laquelle de ses dérivées, son support se réduit au point 0.
3.3 Opérations sur les distributions

On se propose de définir sur les distributions un certain nombre d’opérations : translation,
réflexion, dilatation de la variable, dérivation, changement de variable, . . . La méthode est
d’écrire d’abord ces opérations sur des distributions régulières en les exprimant dans le langage
des distributions, puis de les étendre comme définitions dans les cas non réguliers.
3.3.1 Translation, dilatation

Pour une fonction f : R → R, on définit l’action sur f d’une translation de la variable
x → x0 = x + a par fa (x0 ) = f (x), soit fa (x) = f (x − a). Pour une fonction f localement
R R
intégrable et ϕ ∈ D, on a donc h fa , ϕ i = R f (x − a)ϕ(x)dx = f (x)ϕ(x + a)dx = h f, ϕ−a i.
En général, pour toute distribution T ∈ D0 , on définit sa translatée Ta par
déf
h Ta , ϕ i = h T, ϕ−a i (3.9)
qui est bien une fonctionnelle linéaire et continue.

1
Exemple : la partie principale PP x−a est la translatée de PP x1 .
Cette opération de translation s’étend bien évidemment à Rn .
Pour le changement de variable par dilatation, x 7→ x0 = x/k, on procède de même. On
définit d’abord la transformation de la fonction f : R → R, f(k) (x0 ) = f (x), donc f(k) (x) =
1
R
f (kx), puis h f(k) , ϕ i = R f (kx)ϕ(x)dx = · · · = |k| h f, ϕ(k−1 ) i, qu’on généralise à une distribu-
0
tion quelconque T ∈ D en posant par définition
1
h T(k) , ϕ i = h T, ϕ(k−1 ) i , (3.10)
|k|
ou encore
1 D x E
h T (kx), ϕ(x) i = T (x), ϕ . (3.11)
|k| k
Ainsi par exemple, pour la distribution δ de Dirac, on écrira
1
δ (kx) = δ(x) . (3.12)
|k|

§ 3.3. Opérations sur les distributions 43
1
À nouveau, l’extension à Rn est aisée, mais attention, le jacobien est maintenant |k|n
!
1 −1
dans Rn h T(k) , ϕ i = n
h T, ϕ(k ) i . (3.13)
|k|
3.3.2 Dérivation d’une distribution

On part d’une fonction f localement intégrable ainsi que sa dérivée : f, f 0 ∈ L1loc (R). On
écrit alors pour la distribution régulière associée à f 0
Z ∞ Z ∞
0 0
hf ,ϕi = f (x)ϕ(x)dx = − f (x)ϕ0 (x)dx = −h f, ϕ0 i , (3.14)
−∞ −∞
où on a utilisé une intégration par parties, sans terme de bord puisque ϕ est à support borné.
Cela suggère la
Définition 3.7 : La dérivée d’une distribution T de D0 est définie par
h T 0 , ϕ i = −h T, ϕ0 i
déf
(3.15)
(Elle est appelée d-dérivée dans les TD)
Cette définition, que nous allons beaucoup utiliser, s’étend très naturellement aux dérivées
d’ordre supérieur, mais aussi aux dérivées partielles pour des distributions sur Rn , etc. Nous
nous intéresserons plus bas au laplacien de T ∈ D0 (Rn )
ϕ∈D : h ∆T, ϕ i = h T, ∆ϕ i .
On voit que la dérivabilité des distributions ne pose pas de problème. En fait même si une
fonction (localement intégrable) n’est pas dérivable comme fonction, elle est toujours dérivable
en tant que distribution ! Exemple : la fonction “saut” de Heaviside,

0 si x < 0



H(x) = 1 (3.16)
2
si x = 0


1

si x > 0
est une fonction localement intégrable ; elle est discontinue en 0 et n’est donc pas dérivable en
ce point. Sa dérivation en tant que distribution, cependant, ne pose pas de problème :
Z ∞
0 0
h H , ϕ i = −h H, ϕ i = − ϕ0 (x)dx = [−ϕ]∞0 = ϕ(0) = h δ, ϕ i
0
donc
H0 = δ (3.17)
La dérivée de H est la distribution de Dirac ! Noter que selon une remarque faite plus haut, on
peut modifier la “valeur” de H en x = 0 sans modifier la distribution H.

3.4 Distribution delta et distributions reliées

3.4.1 Fonction de Heaviside, fonction signe
On vient de rencontrer la distribution de Heaviside H(x) ou fonction saut, notée aussi
souvent θ(x) par les physiciens. Une fonction ou distribution reliée est la fonction signe

−1 si x < 0



(x) ≡ sgn(x) = −1 + 2H(x) = 0 si x = 0 (3.18)


1

si x > 0
C’est au signe près et à une dilatation verticale près la fonction qui décrit la discontinuité de
vitesse dans l’exemple du choc du § 3.1.3.
Par le même calcul que plus haut, on a 0 = 2δ.
Les dérivées successives de la distribution δ de Dirac se définissent de même et peuvent être
rencontrées en physique.
3.4.2 Relations fonctionnelles

• Anticipant un peu sur la suite, on peut définir le produit de toute distribution T par
une fonction ψ de classe C ∞ : h T ψ, ϕ i = h T, ψϕ i, voir ci-dessous § 3.5. L’opération est
particulièrement simple pour la distribution δ : δ(x)ψ(x) = ψ(0)δ(x). En particulier on a
xδ = 0 ; réciproquement, il est naturel de se demander : quelles distributions T ∈ D0 sont telles
que xT = 0 ? ou telles que xn T = 0 ? Voir TD.
• Composition d’une distribution avec une fonction f
Rappelons d’abord la formule de changement de variable dans une intégrale de fonctions or-
dinaires (cf Chap. 2). Soient g une fonction localement intégrable et f : R → R une fonction
dérivable et monotone, donc inversible au sens des fonctions (f −1 existe). On supposera aussi
que f 0 ne s’annule pas. La composée g ◦ f est localement intégrable et pour toute ϕ ∈ D
Z Z
−1
dy D g −1
E
h g ◦ f, ϕ i = g (f (x)) ϕ(x)dx = g(y)ϕ f (y) = ,ϕ ◦ f
R R |f 0 (f −1 (y)) | |f 0 ◦ f −1 |
où le dénominateur vient du jacobien dans le changement de variable x 7→ y = f (x)

dx
J = = |f 0 (x)|−1 = |f 0 f −1 (y) |−1 .

dy
De la même façon, pour une distribution T ∈ D0 , on définit

déf T −1
h T ◦ f, ϕ i = ,ϕ ◦ f . (3.19)
|f 0 ◦ f −1 |

§ 3.4. Distribution delta et distributions reliées 45
C’est en particulier le cas pour la distribution δ
ϕ (f −1 (0))

δ −1
h δ ◦ f, ϕ i = , ϕ ◦ f = , (3.20)
|f 0 ◦ f −1 | |f 0 (f −1 (0)) |
ou encore
1
δ(f (x)) = δ(x − x0 ) (3.21)
|f 0 (x 0 )|
avec x0 l’unique zéro de la fonction (supposée monotone) f . (Si f ne couvre pas tout R et n’a
pas de zéro, l’intégrale est nulle). Noter qu’on a besoin de l’hypothèse que f 0 ne s’annule pas
au zéro x0 de f : f 0 (x0 ) 6= 0. Ainsi f (x) = x3 est exclue.
On peut généraliser au cas d’une fonction f n’ayant que des zéros isolés xi ∈ R où sa
dérivée ne s’annule pas. Il suffit de couper le domaine d’intégration en sous-domaines où f est
monotone, et la formule (3.21) donne alors
déf
X 1
δ(f (x)) = δ(x − xi ) . (3.22)
xi |f 0 (x i )|
f (xi )=0
Cette identité est très utile au physicien, on la rencontrera chaque fois qu’on imposera une
contrainte par l’intermédiaire d’une distribution δ, voir ci-dessous § 3.4.3 des exemples d’appli-
cation.
On peut retrouver la relation (3.22) par un argument qualitatif (“heuristique”) : la distribution δ ◦ f “localise”
l’intégration dans h δ ◦ f, ϕ i au voisinage des zéros xi de f . Au voisinage de chacun de ces zéros, on développe
au premier ordre non nul f (x) ≈ f (xi ) + (x − xi )f 0 (xi ) + · · · = (x − xi )f 0 (xi ) + · · · puisque f (xi ) = 0 et qu’on
suppose f 0 (xi ) 6= 0 ; on conçoit que l’on puisse écrire δ(f (x)) = i δ(f 0 (xi )(x − xi )) = i δ(x−x i)
P P
|f 0 (xi )| (par (3.12)),
qui n’est autre que (3.22).
• δ comme limite de fonctions variées
Définition 3.8 : (Convergence faible dans D0 ) : Une suite Tn de distributions de D0

converge faiblement dans D0 si ∀ϕ ∈ D, la suite h Tn , ϕ i converge dans C.
Cela définit une fonctionnelle linéaire T , on peut montrer que cette fonctionnelle est continue,
D0
c’est donc une distribution de D0 et on écrit Tn → T .
On montre aussi la compatibilité entre limite faible et dérivation au sens des distributions :
D0 (p) D0
si Tn → T , il y a aussi convergence faible de toutes les dérivées Tn → T (p) .
Exemples. Considérons les deux suites de fonctions
p n − nx2
– gaussiennes fn (x) = 2π e 2 , ce sont des fonctions de classe C ∞ ;
– fonctions “porte” gn (x) = n2 (H(x + n1 ) − H(x − n1 )), égales à n2 pour − n1 ≤ x ≤ n1 , nulles
ailleurs : ce sont des fonctions en escalier.

2.0
1.5
2
1.0
-2 -1 1 2
-1
0.5
-2
-3
-2 -1 0 1 2
Figure 3.6 – Les fonctions gaussiennes fn de plus en plus piquées, de n = 1 à n = 5, et leurs dérivées
premières de n = 1 à n = 3.
R R
Ces fonctions fn et gn sont positives et normalisées par fn dx = 1, gn dx = 1. Elles
prennent des valeurs ≥ O(1) (en un sens qu’il faudrait préciser) dans un intervalle de longueur
tendant vers 0 quand n → ∞. Elles définissent des distributions régulières qui tendent faible-
ment dans D0 vers δ quand n → ∞. Inversement elles peuvent constituer des “régularisations”
utiles de la distribution de Dirac.
Exercice : étudier analytiquement et avec le logiciel Maple ou Mathematica la convergence
des fonctions trigonométrico-rationnelles : hn (x) = sin2 (πnx)/nπx2 et de leurs dérivées. Le cas
des fonctions sin nx/ sin x rencontrées dans l’introduction, ou celui des sin nx/x (cf [1] p. 210)
est plus délicat, mais permet aussi de construire les distributions X ou δ par une limite.
3.4.3 δ sur une courbe, une surface, . . .

• Courant linéique
On apprend en électromagnétisme qu’une particule de charge q suivant une trajectoire d’espace

x(t) crée en tout point y = (y, t) un vecteur courant d’expression
dx(t) 3
j(y, t) = qδ (y − x(t)) .
dt
On peut aussi écrire la densité de charge au point y comme
ρ(y, t) = qδ 3 (y − x(t)) .
Cette formule admet une intéressante généralisation relativiste. Une particule de charge q suivant une
trajectoire d’espace-temps xµ (τ ), avec τ le temps propre, ds2 = c2 dτ 2 , crée en tout point y = (y, t) d’espace-
temps un quadri-vecteur courant d’expression
dxµ (τ ) 3 dxµ (τ ) 4
Z
j µ (y, t) = q δ (y − x(τ ))|t=x0 (τ ) = q dτ δ (y − x(τ )) .
dt dτ

§ 3.4. Distribution delta et distributions reliées 47
Noter que dans la 3ème expression on a récrit le courant sous forme explicitement covariante, en passant
d’une distribution de Dirac à trois dimensions δ 3 à une distribution δ 4 . Exercice : vérifier l’équivalence entre
les 2ème et 3ème expressions en utilisant (3.21). Ce courant a une composante temporelle, la densité de charge,
j 0 (y, t) = qδ 3 (y − x(τ ))|t=x0 (τ ) qui satisfait bien d3 y j 0 (y, t) = q et on vérifie qu’il est de (quadri)divergence
R
nulle : ∂µ j µ (y) = 0.
On pourrait discuter de même une distribution “surfacique” de charges, etc.
• Particule relativiste sur sa “couche de masse”
En mécanique relativiste, on apprend qu’une particule de masse au repos m a une énergie

E et une impulsion p reliées par la relation E 2 = p2 c2 + m2 c4 qui se réduit, pour une particule
au repos, au célébrissime E = mc2 . On peut redire cela en termes du quadri-vecteur impulsion
p = (p0 = E/c, p) dont la longueur minkovskienne carrée est p2 = (p0 )2 − p2 = m2 c2 . On choisit
généralement des unités où c = 1 et finalement
p2 = (p0 )2 − p2 = m2 . (3.23)
On a parfois à intégrer sur des quadri-impulsions contraintes à satisfaire la condition (3.23),

c’est-à-dire à être sur la “couche de masse” dans le jargon des physiciens, en fait un hyperboloı̈de
à deux nappes dans l’espace de Minkowski. On peut imposer cela en insérant dans l’intégration
une distribution δ(p2 − m2 ). En suivant (3.22) on récrit
p p
2 2 δ(p0 − p2 + m2 ) δ(p0 + p2 + m2 )
δ(p − m ) = p + p
2 p2 + m2 2 p2 + m2
mais on accompagne en général la condition (3.23) de la condition que l’énergie p0 est positive,
en d’autres termes on s’intéresse à
p
2 2 0 δ(p0 − p2 + m2 )
δ(p − m ) H(p ) = p .
2 p2 + m2
La mesure d’intégration sur la couche de masse s’écrit donc
d3 p
d4 p δ(p2 − m2 ) H(p0 ) = p (3.24)
2 p2 + m2
où l’expression du membre de gauche, qui est évidemment invariante relativiste, nous garantit
que celle du membre de droite l’est aussi. Il faut comprendre (3.24) au sens des distributions,
c’est-à-dire testé dans une intégration avec une fonction ϕ ∈ D(R4 ) arbitraire
d3 p
Z Z p
4 2 2 0 0
d p δ(p − m ) H(p ) ϕ(p , p) = p ϕ( p2 + m2 , p) .
2 p2 + m2

3.5 Produit de distributions. Convolution

Il faut faire attention à ce que l’on entend par produit de distributions. Plusieurs définitions
sont en effet possibles
1. Le produit d’une distribution T par une fonction ψ de classe C ∞ ne pose pas de problème :
déf
h T ψ, ϕ i = h T, ψϕ i, puisque si ϕ ∈ D, ψϕ ∈ D et l’expression de droite est bien définie,
c’est une fonctionnelle continue et linéaire de ϕ, elle définit donc la distribution T ψ.
Exemple : pour toute fonction ψ ∈ C ∞ , δ(x) ψ(x) = δ(x) ψ(0), δa (x) ψ(x) = δa (x) ψ(a).
2. Pour deux fonctions localement intégrables f et g de R → R, (et donc pour les distributions régulières
associées) on peut définir aussi un produit “direct” (ou “tensoriel”) f ⊗ g qui est une fonction R2 → R
définie très naturellement par (f ⊗ g)(x, y) = f (x)g(y). Plus généralement, pour deux distributions S
et T de D0 (R), l’une “agissant” sur la variable x, l’autre sur y, ce qu’on note par S(x) ⊗ T (y) est
la distribution de D0 (R2 ) agissant sur des fonctions ϕ(x, y) par h S ⊗ T, ϕ i = dxdyS(x)T (y)ϕ(x, y).
R
Exemple, δ(x) ⊗ δ(y) n’est autre que la distribution notée plus haut δ 2 (x).
3. En revanche, le produit de deux distributions T1 , T2 ∈ D0 (R) n’est en général pas défini.

Cela apparaı̂t déjà sur le produit de deux fonctions localement intégrables, qui n’a aucune
raison d’être lui-même localement intégrable : ainsi ψ(x) = √1x est localement intégrable,
mais ψ 2 (x) = x1 ne l’est pas. En général les distributions, rappelons-le, prennent leur sens
quand elles sont testées sur des fonctions régulières (appartenant à D), pas sur d’autres
distributions. Rien d’étonnant donc à ce que le produit inconsidéré de deux distributions
amène à des résultats incontrôlables . . . L’exemple le plus simple est donné par le produit
?
de deux distributions de Dirac : δδ =δ(0)δ qui n’est pas défini.
On rencontrera ce genre de situations en physique, en Mécanique Quantique par exemple dans le calcul
de la “règle d’or de Fermi”, ou en théorie quantique des champs où apparaissent des “divergences
ultraviolettes”, nécessitant la mise en œuvre de l’opération de renormalisation. Quand il est confronté à
cette situation, le physicien doit chercher à revenir au problème de départ et à “régulariser” la quantité
responsable de l’apparition des infinis. Ainsi une distribution delta pourra être remplacée par une courbe
en cloche très pointue, telle une gaussienne de largeur tendant vers 0, comme on a vu plus haut.
4. Finalement venons-en au produit le plus naturel sur des distributions, celui de convolution.
D’abord pour des fonctions f et g localement intégrables, on définit leur produit de convo-
lution f ∗ g par l’intégrale suivante, si elle existe,
Z
(f ∗ g)(x) = dyf (x − y)g(y) . (3.25)
Il est aisé de trouver des conditions suffisantes pour que cette intégrale existe : par exemple si
f et g sont définies p.p. et localement intégrables et de support borné à gauche, (resp. à droite,
ou a fortiori à gauche et à droite !), l’intégrale en y est restreinte à un ensemble borné et existe
presque partout, cf [5], p. 164

§ 3.5. Produit de distributions. Convolution 49
Exemples : La fonction de Heaviside H a un support borné à gauche (par 0). Son carré de
convolution H ∗ H existe donc. En revanche, H(x) ∗ H(−x) n’existe pas.
Intuitivement, l’effet de la convolution d’une fonction f par une fonction g ∈ D est de
“lisser” les singularités de f . Voir sur la figure 3.7 la convoluée d’une fonction “porte” χ par
une fonction φ du type (3.5).
y
1.5 Φ
1.0 Χ
0.5
Φ* Χ
x
-2 -1 1 2 3
Figure 3.7 – Convoluée de la fonction porte χ[ 1 , 3 ] avec la fonction (3.5) pour a = 0, b = 1. La

4 4
convoluée a un support décalé vers la droite, pourquoi ?
Exercice (facile !) : Vérifier que le produit de convolution, s’il existe, est commutatif : f ∗ g =
g ∗ f.
Une fois cette définition acquise, on peut envisager de l’étendre à des distributions. Pour
deux fonctions localement intégrables f et g et ϕ ∈ D(R) considérons
Z Z Z Z Z
h f ∗ g, ϕ i = dx(f ∗ g)(x)ϕ(x) = dx dyf (x − y)g(y)ϕ(x) = dx dyf (x)g(y)ϕ(x + y)
par un changement de variable évident x → x + y de jacobien 1. Supposons que les supports de

f et g sont tels que les domaines d’intégration sur x et sur y sont bornés. Par exemple si f est
à support borné, comme ϕ l’est aussi, les intégrations sur x et sur y ont lieu sur des domaines
bornés. Le théorème de Fubini s’applique et on peut écrire
ZZ
h f ∗ g, ϕ i = dxdyf (x)g(y)ϕ(x + y)
(= h f ⊗g, ϕ(x+y) i avec la notation ⊗ du point 2 précédent.) Une fois encore nous généralisons
cette relation à un produit de deux distributions.

Définition 3.9 : Le produit de convolution de deux distributions T1 et T2 est défini par

l’intégrale suivante
déf
h T1 ∗ T2 , ϕ i = h T1 (x)T2 (y), ϕ(x + y) i
si elle existe ! À nouveau on peut trouver des conditions suffisantes d’existence. Par exemple,
(exercice !) T1 et T2 sont toutes deux à support borné à gauche (resp. à droite). Ou bien l’une
des deux est à support borné. (Voir la définition du support d’une distribution au § 3.2.1.)
Exercice : vérifier que le produit de convolution de distributions est commutatif et associatif :
(T1 ∗ T2 ) ∗ T3 = T1 ∗ (T2 ∗ T3 ) = T1 ∗ T2 ∗ T3 , à condition que T1 ∗ T2 , T1 ∗ T3 et T2 ∗ T3 soient
définis. En revanche, examiner le cas de 1 ∗ δ 0 ∗ H où 1 est la distribution régulière associée à
la fonction constante 1 et montrer que dans ce cas, on n’a pas associativité !
Importance des convolutions en mathématiques et en physique.

L’intérêt des convolutions est d’abord d’ordre mathématique : nous verrons que par transfor-
mation de Fourier, produit de convolution et produit ordinaire sont échangés ; la convolution
apparaı̂t aussi dans la théorie des probabilités, etc. Mais ce produit est aussi très naturel
dans les systèmes linéaires, en physique. Considérons un système physique, représenté par une
“boı̂te noire”, qui peut être de nature mécanique, électrique, optique, acoustique, etc. Un signal
d’entrée dépendant du temps, noté X(t) (qui peut être multidimensionnel) est transformé par
le système en un signal de sortie Y (t) et la transformation X 7→ Y est supposée linéaire, mais
non instantanée, Y = KX. Donc Y (t) à un temps t donné est fonction linéaire des X(t0 ), t0 < t
pour respecter la causalité. On suppose que l’opération K n’implique pas de dérivation (nous
verrons plus tard comment lever cette restriction). On écrit donc Y (t) = dt0 K(t, t0 )X(t0 ). Si on
R
suppose de plus qu’il y a “invariance par translation dans le temps” K(t + τ, t0 + τ ) = K(t, t0 ),
le “noyau” K ne dépend en fait que de la différence de ses arguments et, gardant la même
notation K, on écrit finalement
Z
Y (t) = dt0 K(t − t0 )X(t0 )
qui n’est autre qu’un produit de convolution de K et de X. Pour une discussion plus approfon-
die de cette problématique, voir [8] et [1].
Autre exemple rencontré au début de ce chapitre : le potentiel électrique créé par une distri-
bution de charges de densité ρ est, voir (3.2), le produit de convolution de ρ par le noyau de
1 1
Coulomb 4π 0 |r|
. Cette fois, c’est l’invariance par translation spatiale qui jointe à la linéarité
dicte la forme de convolution.

§ 3.6. Exemple : Fonction de Green et potentiel de Coulomb en dimension d. 51
3.6 Exemple : Fonction de Green et potentiel de Cou-

lomb en dimension d.
On apprend dans le cours d’électromagnétisme que le potentiel électrique V , ou le champ
~ , satisfont à l’équation de Poisson
électrique E qui en dérive, E = −∇V
ρ
divE = −∆V = (3.26)
0
où ρ est la densité de charge.
Rappelons que cette équation de Poisson est l’expression locale du fait que le flux du vecteur E à travers
une surface fermée S est égale (au facteur 1/0 près) à la charge totale Q contenue dans le volume englobé par
S (théorème de Gauss-Ostrogradsky)
ZZ ZZZ ZZZ
3 ρ Q
dS.E = d x divE = d3 x = . (3.27)
0 0
Pour une densité discrète de charges, c’est-à-dire localisée sur des charges ponctuelles en ri ,
cela nous apprend que ∆V s’annule, donc que V est une fonction harmonique (voir ci-dessous
au Chap. 8), en tout point en dehors des charges.
Mais plus précisément, le potentiel coulombien V créé par les charges ponctuelles qi en ri
doit satisfaire
1 X 3
∆V (x) = − qi δ (x − ri ) , (3.28)
0 i
en accord avec (3.27).
Généralisant le problème à d dimensions, cherchons une solution de l’équation
∆x G(x − y) = δ d (x − y) (3.29)
où x, y ∈ Rd . (On donne le nom de “fonction de Green” à une telle solution.) Montrons que

− Cd−1 si d 6= 2
kxkd−2
G(x) = (3.30)
− 1 ln( 1 ) si d = 2
2π kxk
est solution, où Cd = (d − 2)Ωd−1 , Ωd−1 l’aire de la sphère unité S d−1 dans Rd :
d
2π 2
Ωd−1 = d . (3.31)
Γ( 2 )
Γ désigne une “fonction spéciale” que l’on étudiera en détail plus bas (Chap. 6 et 8). Qu’il
suffise de dire ici que Γ(x) généralise à x réel quelconque la fonction factorielle, Γ(n) = (n − 1)!
√
si n ∈ N et pour n = p + 21 demi-entier, Γ(p + 12 ) = (2p−1)(2p−3)···1
2 p π. On retrouve en particulier
Ω1 = 2π, Ω2 = 4π etc.

Remarque. Comme pour des fonctions de la seule variable r,
∂2 d−1 ∂ 1 ∂ ∂
∆= 2
+ = d−1 rd−1 , (3.32)
∂r r ∂r r ∂r ∂r
1 1 ∂ 1
(vérifier !), on pourrait penser que ∆ rd−2 = −(d − 2) rd−1 ∂r
(rd−1 rd−1 ) ≡ 0. En fait cela n’est
vrai que pour r 6= 0, et il nous faut faire un calcul de dérivées au sens des distributions pour
obtenir le résultat correct.
Preuve de (3.30) : Pour d 6= 2 et ϕ une fonction test de D(Rd ), on veut calculer I = dd x ϕ(x)∆ kxk1d−2 .
R
Comme ∆ kxk1d−2 est invariant par rotation et ne dépend que de la variable radiale r = kxk, seule contribue à
cette intégrale la moyenne angulaire ϕ(r) de ϕ sur la sphère de rayon r
Z
Ωd−1 rd−1 ϕ(r) = dd x ϕ(x) ,
kxk=r
1
dr Ωd−1 rd−1 ϕ(r)∆ rd−2 . Noter que ϕ est de classe C ∞ sur R+ , avec ϕ(0) = ϕ(0). On a alors
R
et I =
Z ∞ Z ∞
1 ∂ ∂ 1 ∂
I = Ωd−1 dr rd−1 ϕ(r) d−1 rd−1 = −(d − 2)Ωd−1 dr ϕ(r) 1
0 Z ∞ r ∂r ∂r rd−2 0 ∂r
distrib.
= Ωd−1 (d − 2) dr ϕ0 (r) = −Ωd−1 (d − 2)ϕ(0) = −Cd ϕ(0) ,
0
comme annoncé en (3.30).

On effectue un calcul analogue en d = 2 (vérifier !).
On trouvera dans [8] ou [1] une autre démontration, faisant appel aux dérivées (au sens des distributions)
de fonctions discontinues.
On note que la solution (3.30) contient bien la loi de Coulomb en 1/r à trois dimensions,
mais que le “potentiel coulombien à deux dimensions” est logarithmique !
La référence de base est bien sûr [9], ou dans une version plus proche de ce cours, [8].
L’exposé de [1] est très clair et complet.
Pour l’histoire du développement des distributions, lire Jean-Michel Kantor, MATHEMA-
TIQUES D’EST EN OUEST, théorie et pratique : l’exemple des distributions, disponible sur
http://www.math.jussieu.fr/∼kantor/
Appendice C. Rappels d’algèbre

Outre les structures algébriques classiques, groupe, anneau, corps, espace vectoriel,. . ., on
utilise dans les notes celle d’algèbre : une algèbre A sur un corps K est un espace vectoriel
sur K qui a aussi un produit interne associatif qui en fait un anneau ; les structures d’espace

§ 3.6. Exemple : Fonction de Green et potentiel de Coulomb en dimension d. 53
vectoriel et d’anneau sont compatibles en ce sens que la multiplication par un scalaire λ de K

commute avec le produit interne ; et le produit interne est supposé bilinéaire. Donc
(λx + µy)z = λxz + µyz bilinéarité

x(λy + µz) = λxy + µxz ” ” ” (C.1)
x(yz) = (xy)z associativité
(λx)y = λ(xy) = x(λy)
Exemples : les polynômes d’une variable à coefficients dans R forment une algèbre sur R
notée R[x] ; l’ensemble Mn (R) des matrices n × n à éléments dans R est une algèbre sur R. On
rencontrera au Chap. 6 l’algèbre des séries entières.
Dual d’un espace vectoriel (e.v.)
Soit E un e.v. sur R. L’espace dual E 0 est par définition l’espace vectoriel des formes linéaires
sur E, T : E → R, c’est-à-dire des applications linéaires de E dans R. Si dim E = n, soit ei , i =
1, · · · n, une base de E : ∀X ∈ E, X = ni=1 xi ei , et si T est une forme linéaire de E 0 , on note
P
T (X) ou h T |X i son action sur X, c’est une fonction linéaire des xi : T (X) = h T |X i = i xi ti
P
avec des coefficients ti ∈ R, ce qu’on peut récrire comme T (X) = h T |X i = i,j xi tj h f j |ei i
P
avec f j tels que h f j |ei i = δij . On montre aisément que ces f j sont linéairement indépendants
et qu’ils forment une base de E 0 , c’est la base duale des ei dans E 0 . On note aussi que dim E 0 =
dim E = n. Cette propriété qui est vraie en dimension finie ne l’est plus forcément en dimension
infinie, comme on a vu au § 3.2.1.


Chapitre 4
Transformation de Fourier
On va étudier la transformation intégrale f˜(k) = dxeikx f (x) qui fait passer d’une fonction
R
f : R → R ou C à une autre fonction f˜ : R → C. Elle étend la décomposition en série de Fourier

inx
P
n∈Z An e des fonctions périodiques, dans laquelle n’apparaissent que des modes multiples
d’un fondamental, en une superposition continue de modes. Cette transformation de Fourier
est extrêmement utile et d’usage constant pour le physicien. Elle permet l’analyse en modes
d’un signal, d’un phénomène. Elle joue donc un rôle naturel en optique, en cristallographie, en
analyse du signal, . . . Elle est aussi très utile dans l’étude des systèmes linéaires (c’est-à-dire
régis des équations différentielles ou aux dérivées partielles linéaires) : ce n’est pas pour rien
qu’elle porte le nom de Joseph Fourier, qui est un des premiers à avoir étudié l’équation de la
chaleur. En physique quantique, elle relie des descriptions alternatives dans des variables x de
position et p = ~k d’impulsion. Elle intervient aussi en théorie des groupes, en probabilités,
etc.
En préambule nous montrons comment l’équation des ondes conduit naturellement aux
représentations de Fourier, puis nous rappelons la représentation d’une fonction périodique par
sa série de Fourier.
4.0 Préambule physique. Équation des ondes

L’équation des ondes à une dimension s’écrit
∂2 2

2 ∂
− v u(x, t) = 0 . (4.1)
∂t2 ∂x2
Toute fonction de la forme F (x+vt)+G(x−vt), F et G arbitraires (différentiables) est solution,

et réciproquement, ces fonctions constituent les solutions générales de (4.1). Si on cherche une

56 Chap.4. Transformation de Fourier
solution sous la forme u(x, t) = X(x)T (t), on trouve que

1 ∂ 2 X(x) 1 ∂ 2 T (t)
=
X(x) ∂x2 v 2 T (t) ∂t2
dont le membre de gauche (resp. de droite) doit être indépendant de t (resp. de x), donc au
total, être une constante notée −k 2 , k ∈ C. Finalement on a à résoudre
1 ∂ 2X 1 ∂ 2T
= = −k 2 (4.2)
X ∂x2 v 2 T ∂t2
dont les solutions sont des superpositions linéaires de
X(x) = e±ikx T (t) = e±ivkt .
Pour k réel, A(k) exp(−ik(x − vt)) décrit une onde progressive, monochromatique de vecteur
d’onde k, se déplaçant vers la droite à la vitesse v. Mais toute superposition
Z
dkA(k) exp(−ik(x − vt))
est aussi solution de (4.1) : cette solution a une amplitude qui est la transformée de Fourier
de l’amplitude A(k) dans l’espace des vecteurs d’onde. Noter que la vitesse v est la vitesse de
propagation de l’onde, lumineuse, acoustique, mécanique etc.
Équation d’une corde vibrante.
Cherchons maintenant une solution de (4.1) décrivant les vibrations d’une corde de longueur L
et d’extrémités fixées. L’amplitude (transverse) de vibration de la corde est une fonction u(x, t),
0 ≤ x ≤ L, t ≥ 0, sujette aux conditions aux limites
∂u(x, t)
u(x, 0) = f (x) = g(x) u(0, t) = u(L, t) = 0 , (4.3)
∂t t=0
où les fonctions f et g décrivent comment la corde est excitée à l’instant t = 0. Cherchant
des solutions réelles et factorisées en X(x)T (t) comme ci-dessus, on prend k 2 ∈ R et on écarte
les cas où k 2 n’est pas positif car ils ne peuvent décrire une amplitude bornée d’une onde de
vibration, X(x) = A cos kx + B sin kx, T (t) = a cos kvt + b sin kvt. (On notera kv = ω dans la
suite.) Les conditions aux limites d’espace restreignent à X(x) = B sin kx, kL = nπ, n ∈ N,
donc ∞
X nπ πv
u(x, t) = (an cos ωn t + bn sin ωn t) sin kn x kn = ωn = n
n=1
L L
et les conditions initiales à t = 0 se reflètent dans les coefficients an et bn via les développements
en série de Fourier de f et g 1
∞ ∞
X nπ X nπ
f (x) = an sin x g(x) = bn ωn sin x.
n=1
L n=1
L
1. ou plus précisément les développements en série de Fourier des prolongements des fonctions f et g en
fonctions impaires sur l’intervalle [−L, L], périodiques de période 2L.

§ 4.1. Séries de Fourier. Rappels 57
Les deux types de développements que nous allons discuter maintenant sont donc intimement
liés à la physique des ondes.
4.1 Séries de Fourier. Rappels

• Développements en série de Fourier : développement en cos et sin, développement
en exponentielles.
On démontre en Analyse que toute fonction f : R → C “suffisamment régulière” (voir

ci-dessous) qui est périodique de période 2π, f (x + 2π) = f (x), peut être décomposée sur une
base de fonctions périodiques de période 2π, {cos kx, sin kx}k∈N ou {exp ikx}k∈Z
∞
1 X
f (x) = a0 + (an cos nx + bn sin nx) (4.4)
2 n=1
ou encore ∞
X
f (x) = An einx . (4.5)
n=−∞
En utilisant les propriétés d’orthogonalité des fonctions trigonométriques ou exponentielles : si

n, m ∈ N
Z π Z π Z π
cos mx cos nxdx = π(δmn +δ0n δ0m ) , sin mx sin nxdx = πδmn , cos mx sin nxdx = 0
−π −π −π
(4.6)
ou avec n, p ∈ Z Z π
dx i(n−p)x
e = δnp , (4.7)
−π 2π
on voit que ces développements, s’ils existent, impliquent les relations suivantes
1
Rπ 1
Rπ 1
Rπ
a0 = π −π
f (x)dx an = π −π
f (x) cos nxdx bn = π −π
f (x) sin nxdx (4.8)
et Z π
1
An = f (x)e−inx dx . (4.9)
2π −π
Mais il s’agit de savoir si ces séries convergent, et si oui, si leur somme reproduit bien la fonction
f donnée.
• Théorème de Dirichlet : condition suffisante de convergence
Théorème 4.1 : Si f (x) est définie sur [−π, π] et n’y a qu’un nombre fini de discontinuités
finies et a ailleurs une dérivée continue, (fonction C 1 par morceaux), alors le développement

converge pour tout x ∈ [−π, π] ; sa somme est 12 f (x− ) + f (x+ ) en tout point de ] − π, π[,

et 12 f (−π+ ) + f (π− )) en ±π. Dans tout sous-intervalle où la fonction f est continue, la

convergence de la série de Fourier vers f est uniforme.
• Relation entre la régularité de la fonction et les propriétés asymptotiques des

coefficients.
Pour une fonction satisfaisant les conditions du théorème de Dirichlet, les coefficients an ,
bn décroissent en valeur absolue au moins comme |an | ∼ 1/n, |bn | ∼ 1/n pour n grand, ce qui
n’assure pas en général la convergence absolue de la série de Fourier, mais n’exclut pas la conver-
gence simple pour certaines valeurs de x. Ces coefficients peuvent décroı̂tre plus rapidement, si
la fonction est plus régulière. En fait on peut démontrer le
Théorème 4.2 (Stokes) : Si f (k) est la première des dérivées de f à avoir une discontinuité
1
(ou un nombre fini de discontinuités) alors |an |, |bn |, |An | ∼ nk+1 .
Propriétés de parité, de conjugaison des coefficients

Si la fonction f est réelle, les coefficients an , bn sont réels, A−n = A∗n et an = 2<e An , bn =
−2=m An . Si la fonction f est paire (resp. impaire), les bn (resp. an ) s’annulent.
Phénomène de Gibbs. Considérons une fonction périodique, ayant un point de discontinuité x0 sur sa
période. Comment sa série de Fourier, somme de fonctions continues, approxime-t-elle cette discontinuité ? Une
expérience numérique avec Mathematica sur une série de Fourier tronquée au 10ème, 20ème, 50ème ordre,
montre que la somme présente au voisinage du point x0 une variation de plus en plus rapide, qui approxime
le saut de manière excessive ! C’est le très intéressant phénomène de Gibbs, pour lequel nous renvoyons à la
littérature, par exemple [1].
4.2 Transformation de Fourier dans L1
4.2.1 Définition. Conventions

Si f est une fonction R → R (ou → C), on définit
Z ∞
f˜(k) = dx eikx f (x) (4.10)
−∞
avec k ∈ R, si cette intégrale existe (voir plus bas), et on appelle f˜, notée aussi f˜ = F[f ], la
transformée de Fourier de la fonction f . C’est une fonction R → C.

§ 4.2. Transformation de Fourier dans L1 59
• Autres conventions. Extension à Rn
On rencontre plusieurs conventions dans la définition de cette transformée de Fourier, selon

le domaine scientifique concerné.
R∞
– signe de l’exponentielle −∞ dx e±ikx f (x)
R∞ R∞
1
– normalisation globale : √12π −∞ dx eikx f (x) ou 2π −∞
dx eikx f (x)
R∞
– normalisation de la variable k : −∞ dx e2πikx f (x)
– et diverses combinaisons de ces variantes, dont chacune a ses avantages, comme on verra.
Donc attention en utilisant des formules puisées dans la littérature ! !
La transformation de Fourier s’étend sans difficulté à des fonctions Rn → R (ou → C) : on
écrit pour k ∈ Rn , Z ∞
˜
f (k) = dn x eik.x f (x) (4.11)
−∞
sous réserve que cette intégrale soit bien définie.
• Premiers exemples.
Transformée de Fourier de
– une fonction “porte” Π(x) = χ[−1,1] (x), la fonction indicatrice de l’intervalle [−1, 1]. On
calcule (exercice : vérifier !) que Π̃(k) = 2 sink k . Noter que cette fonction Π̃ n’est pas
intégrable (de Lebesgue) sur R, même si son intégrale est “semi-convergente” ;
– une fonction “lorentzienne” f (x) = 2a/(x2 + a2 ) où a > 0, f˜ = 2πe−|k|a , comme on le
verra plus tard par un calcul de résidu (Chap. 8, équ. (8.4)) ;
2
– une fonction gaussienne f (x) = exp − (x−a)2b2
a pour transformée de Fourier
√ 1 2 2
f˜(k) = 2π|b| eiak− 2 k b
comme on le trouve par un changement de la variable x par une translation complexe

x0 = x − (a + ikb2 ), ce qu’on justifiera au chapitre 7 par un “changement de contour” ; etc
L’analyse complexe et ses méthodes puissantes nous seront de grande utilité pour les calculs de
transformées de Fourier.
Certaines de ces fonctions et de ces formules vont jouer un rôle dans la suite : on rencontre
les fonctions lorentziennes en probabilités et en mécanique quantique, les gaussiennes sont
omniprésentes en probabilités et statistiques, en mécanique statistique, etc.
4.2.2 Existence et premières propriétés

On se rappelle la définition au Chap. 2 de l’espace L1 (R) des fonctions intégrables de
Lebesgue (c’est-à-dire absolument intégrables sur (−∞, ∞)), et de l’espace L1 (R) de ces mêmes

fonctions définies à égalité p.p. près. On introduit une nouvelle notation commode : L∞ (R)
désigne l’espace (de Banach) des fonctions définies p.p. et bornées sur R.
Théorème 4.3 : Si f ∈ L1 (R), f˜ est définie et continue sur R. Elle est bornée, donc f˜ ∈ L∞
et kf˜k∞ ≤ kf k1 .
Cela découle du théorème 2.9 du chapitre 2, sur la continuité d’une fonction définie par une intégrale
:
R ∞
ici, f (x)eikx est bien dominée par |f (x)| qui est intégrable. En outre on a |f˜(k)| = −∞ dx eikx f (x) ≤

R∞
−∞
dx |f (x)| = kf k1 pour tout k ∈ R, d’où kf˜k∞ = supk∈R |f˜(k)| ≤ kf k1 .
Bien noter que le fait qu’une fonction de L1 est définie p.p. n’influe pas sur l’intégrale
définissant f˜. Ainsi, pour la fonction porte d’un exemple ci-dessus, qui est non définie en ±1,
l’intégrale f˜ est bien définie. (En revanche, sa transformée de Fourier f˜ = sin k/k est bornée,
|f˜| ≤ 1, f˜ ∈ L∞ , mais non intégrable de Lebesgue, f˜ ∈ / L1 .)
Théorème 4.4 : La transformation de Fourier est une opération linéaire et continue de L1 (R)
dans L∞ (R).
Qu’elle est continue signifie que pour toute suite de fonctions fn tendant (au sens de la norme
k.k1 ) dans L1 vers une fonction f ∈ L1 , F[fn ] → F[f ], au sens de la norme k.k∞ . Par linéarité,
cela découle du Théorème 4.3 : kF[fn ] − F[f ]k∞ = kF[fn − f ]k∞ ≤ kfn − f k1 → 0 . On peut
réexprimer ce théorème en disant : la transformée de Fourier transforme la convergence en
moyenne (au sens de L1 ) en convergence uniforme (au sens de L∞ ).
Noter encore que la transformation de Fourier fait passer de l’espace L1 à L∞ : comme
l’a montré l’exemple de la fonction Π plus haut, la transformée de Fourier n’appartient pas
toujours à L1 (R) !
Théorème 4.5 (Riemann–Lebesgue) : Pour f ∈ L1 (R), la transformée de Fourier f˜ tend

vers zéro à l’infini
lim |f˜(k)| = 0 .
k→±∞
L’idée de la preuve repose sur une astuce, l’insertion dans l’intégrale de e−iπ = −1 sous la forme :
Z Z Z Z
1 πk 1 1 πk 1 πk
f˜(k) = eikx 1−e−ik. k2 f (x)dx = eikx f (x)dx− eik(x− k2 ) f (x)dx = eikx f (x)−f x+ 2 dx
2 2 2 2 k
Quand |k| → ∞, l’intégrand de la dernière intégrale tend vers zéro et nous admettrons que cela assure la
convergence vers zéro de l’intégrale, voir [5] § 7.3.

• Inversion de la transformée de Fourier
Dans les cas où f˜ ∈ L1 , on peut inverser la transformation de façon tout à fait explicite :
Théorème 4.6 d’inversion : Si f ∈ L1 a une transformée de Fourier f˜ intégrable, f˜ ∈ L1 ,

alors Z ∞
1
f (x) = dk e−ikx f˜(k) p.p. en x.
2π −∞
De plus il y a égalité en tout point x où f est continue.
Autrement dit, au facteur 1/2π près, l’inversion de la transformation de Fourier est simplement
la transformation de Fourier complexe conjuguée : F −1 = 2π 1
F, sauf peut-être aux points de
discontinuité de f .
Esquisse de la preuve : elle fait appel à l’identité R f g̃dx = R f˜gdx pour toute paire de fonctions f et g
R R
de L1 , conséquence du théorème de Fubini (le vérifier !) ; on applique ce lemme à la fonction f donnée et à la

suite de gaussiennes gn (y) = exp −y 2 /n2 e−iyx qui tendent vers la fonction e−ixy quand n → ∞, tandis que leurs
√ 2 2
transformées de Fourier g̃n (k) = n πe−n (k−x) /4 tendent vers la distribution 2πδ(k − x), cf Chap. 3, § 3.4.2.
Donc 2πf (x) = lim R f (k)g̃n (k)dk = lim R f˜(k)gn (k)dk = R dk f˜(k)e−ikx .
R R R

On démontre aussi que la condition d’intégrabilité de f˜ dans le théorème d’inversion est

remplie dès que f est de classe C 2 et que f, f 0 et f 00 sont intégrables, cf Th. 4.8 ci-dessous.
Exemple : la fonction lorentzienne f (x) = 2a/(x2 + a2 ) vue plus haut. Les fonctions f 0 et f 00
sont continues et intégrables (se comportant respectivement comme x−3 , x−4 à l’infini), et on
tire du théorème d’inversion une transformation de Fourier qu’on vérifie aisément :
Z
2a
= dk e−ikx e−a|k| .
x 2 + a2 R
4.2.3 Autres propriétés

• Conjugaison, translation, dilatation
On lit sur l’expression de f˜(k) = F[f ](k) = R dkeikx f (x) les propriétés suivantes de
R
conjugaison F[f (−x)] = F(f (x)) = f˜(−k), F[f (x)] = f˜(−k), F[f (x − a)] = eika f˜(k) et
F[f (x)e−i`x ] = f˜(k − `).
f (x) f˜(k)
f (x) = f (−x) paire f˜(k) = f˜(−k) paire
f (x) = −f (−x) impaire f˜(k) = −f˜(−k) impaire
f (x) = f (x) réelle f˜(k) = f˜(−k) “hermitienne”
f (x) = −f (x) imaginaire f˜(k) = −f˜(−k) anti-hermitienne

De même un changement d’échelle sur la variable x se traduit simplement par le changement

d’échelle inverse sur la variable k de la t.F., à un préfacteur près !

1 ˜ k
a 6= 0 F[f (ax)] = f .
|a| a
• Dérivation
On a les relations suivantes entre les transformées de Fourier des dérivées :
f (x), xf (x), · · · , xn f (x) ∈ L1 ⇒ f˜ n fois dérivable et f˜(`) (k) = F[(ix)` f (x)], ` = 1, · · · , n

(4.12)
par application de la dérivation sous le signe somme (Théorème 2.10). Inversement, si f ∈ L1 ,
f de classe C m et f (`) ∈ L1 pour ` = 1, · · · , m, alors
F[f (`) (x)] = (−ik)` f˜(k) pour ` = 1, · · · , m (4.13)
par intégrations par parties répétées de la formule de définition (4.10). (En effet : si g, g 0 ∈ L1 ,
|g(x)| → 0 quand x → ±∞. Exercice : le vérifier.)
En particulier
d ˜
F[f 0 (x)] = −ik f˜(k) et F[ixf (x)] = f (k)
dk
Cela implique des relations importantes entre l’existence de dérivées d’une fonction et le com-
portement asymptotique de sa transformée de Fourier. Ainsi
Proposition 4.7 : Si f ∈ L1 est à support borné, sa transformée de Fourier est de classe C ∞ .
En effet si f ∈ L1 est à support borné, tous les xn f ∈ L1 , donc tous les f˜(n) existent par (4.12).
Pour la réciproque, voir plus bas, Prop. 4.9.
On a vu plus haut (Théorème 4.5 de Riemann–Lebesgue) que si f est continue, f˜(k) s’annule
à l’infini. Peut-on affiner ce résultat et dire comment f˜ s’annule ? Comme conséquence de (4.12-
4.13), on a le
Théorème 4.8 : (a) Si f et ses dérivées f (`) , ` = 1, · · · , m sont intégrables, alors

Z
∀k ∈ R ˜
|f (k)| ≤ |k| −m
|f (m) (x)|dx ;
R
(b) si f et les fonctions x` f , ` = 1, · · · , n sont intégrables, alors

Z
∀k ∈ R ˜(n)
|f (k)| ≤ |xn f (x)|dx ,
R

qui nous dit que des propriétés de régularité (existence d’une dérivée intégrable) d’une fonction
se traduisent par des propriétés de décroissance de sa transformée de Fourier et vice versa.
Ces résultats sont l’analogue des résultats concernant le comportement asymptotique des
coefficients de la série de Fourier (théorème 4.2 de Stokes).
• Fonctions à décroissance rapide
Si dans le (b) du théorème précédent, l’entier ` n’est pas borné, on est dans la classe des
fonctions à décroissance rapide.
Définition 4.1 : Une fonction f est dite à décroissance rapide si ∀` ∈ N, limx→±∞ |x` f (x)| = 0.
2
Exemples : f (x) = e−x est à décroissance rapide et de classe C ∞ ; f (x) = e−|x| est à
décroissance rapide, mais pas de classe C ∞ . Toute fonction à support borné est à décroissance
rapide.
Par la proposition précédente, si f est intégrable à décroissance rapide, alors toutes les
dérivées de f˜ existent.
Proposition 4.9 : La transformée de Fourier f˜ d’une fonction intégrable à décroissance rapide

est de classe C ∞ . Réciproquement, si une fonction intégrable est de classe C ∞ , et si toutes ses
dérivées sont intégrables, alors f˜ est à décroissance rapide.
4.2.4 Transformation de Fourier dans L2

• L’espace S
Définition 4.2 : On désigne par S (espace de Schwartz) l’espace des fonctions de classe C ∞
qui sont à décroissance rapide ainsi que toutes leurs dérivées.
Exemple : si f ∈ D, f˜ est de classe C ∞ (Prop. 4.7) ; toute dérivée f (n) existe et est intégrable,
donc par le Théorème 4.8(b), f˜ décroı̂t au moins comme 1/|k|n pour tout n, donc f˜ ∈ S.
Dans cet espace, on dit qu’une suite de fonctions fn converge vers 0 si, pour tous p, q ∈ N,
lim sup |xp fn(q) (x)| = 0

n→∞ x∈R
ce qui implique la convergence uniforme de f et de toutes ses dérivées vers 0.

L’intérêt d’introduire ce nouvel espace apparaı̂t clairement dans le
Théorème 4.10 : La transformée de Fourier est un opérateur linéaire continu de S dans S.

Preuve : La transformation de Fourier applique S dans S : en effet si f ∈ S, f˜ est de classe C ∞ (Prop. 4.9) ;
toute dérivée f (k) est à décroissance rapide et intégrable, donc par le théorème 4.8, f˜ est aussi à décroissance
rapide. Il en est de même de toutes ses dérivées f˜(n) , puisqu’elles sont les transformées de Fourier des xn f (x),
à qui l’argument précédent s’applique aussi. La continuité annoncée dans le théorème équivaut au fait que pour
toute suite fn ∈ S qui tend vers 0 au sens défini plus haut, les f˜n tendent aussi vers 0.
Au lieu de la situation précédente où la transformation de Fourier F faisait passer de L1

dans L∞ , F est maintenant un endomorphisme de S. De plus, la transformation de Fourier
inverse F −1 = 2π
1
F a la même propriété de continuité. F est donc une application bijective et
bicontinue (continue ainsi que son inverse) de S dans S.
• Transformation de Fourier dans L2
Ces résultats sur S vont nous permettre de définir maintenant la transformée de Fourier sur
l’espace L2 (R) des fonctions de carré intégrable (ou “sommable”).
Il convient à ce point de souligner l’importance en physique de cette classe de fonctions. En électromagnétisme
et en théorie des ondes, comme en théorie du signal, dt|f (t)|2 donne l’énergie de l’onde ou du signal d’am-
R
plitude f (t). En mécanique quantique, les états d’un système sont décrits par des fonctions d’onde complexes
ψ, fonctions d’une (ou plusieurs) variable(s) de position ou d’impulsion, et ψ est requis à être de module carré
intégrable.
On montre, et nous admettrons, (voir [1] p. 269 ou [5] p. 173 et 199 ff. pour plus de détails),
que
– l’espace S est dense dans l’espace L2 (R) pour la norme de L2 ; ce dernier est complet (cf
Chap. 2, Théorème 2.6) ;
– cela permet d’étendre l’opérateur F de S à L2 : c’est un opérateur linéaire continu sur L2 .
Théorème 4.11 : La transformée de Fourier est un opérateur linéaire continu de L2 dans L2 .
Enfin on a l’important
Théorème 4.12 (Parseval–Plancherel) : Si f et g sont dans L2 , f˜ et g̃ le sont aussi et

Z Z
1
f (x)g(x)dx = f˜(k)g̃(k)dk (4.14)
R 2π R
En particulier pour g = f , |f |2 = (2π)−1 |f˜|2 , ou encore, kf k2 = (2π)−1 kf˜k2 .

R R
Preuve : Pour f, g ∈ C 2 (R) à support borné, f, g ∈ L1 ∩ L2 ainsi que f˜, g̃ (cf. Th. 4.8) et on a :
F ubini 1 R
1
g(x)dx dk e−ikx f˜(k) = 2π dk f˜(k) g(x)e−ikx dx = 2π 1
dk f˜(k)g̃(k).
R R R R R
f (x)g(x)dx = 2π Pour
2 2
f, g ∈ L quelconques, on les approche par des fonctions de C à support borné, etc, cf [8] p. 216.

On peut redire cette propriété en termes plus géométriques : la transformation de Fourier

1
f ↔ (2π)− 2 f˜ conserve la norme L2 , c’est une isométrie. Sur un plan plus physique, ce théorème
R
nous apprend que l’énergie d’un signal d’amplitude f (t) peut se calculer soit par |f (t)|2 dt,
soit par la somme des modules carrés des modes de Fourier |f˜(ω)|2 dω
R
2π
.
Enfin, et heureusement pour nous, la transformée de Fourier définie dans L2 coı̈ncide avec
celle définie dans L1 pour toute fonction de L1 ∩ L2 .
Il peut arriver que f soit de carré intégrable (c’est-à-dire dans L2 ) sans être intégrable (dans
L1 ). Par exemple la fonction “sinus cardinal” rencontrée plus haut (transformée de Fourier de
la fonction porte), sin x/x, n’est pas (absolument) intégrable sur R, comme on sait, mais son
carré l’est (pourquoi ?). On peut toutefois le plus souvent calculer la transformée de Fourier de
f en prenant la “partie principale à l’infini”, c’est-à-dire que ([1], p. 263)
Z M
˜
f (k) = lim f (x)eikx pour presque tout k ∈ R .
M →+∞ −M
4.2.5 Transformation de Fourier et convolution

On a introduit au Chap. 3 la convolution de deux fonctions f et g localement intégrables
Z
(f ∗ g)(x) = dyf (x − y)g(y) .
R
Comment cela se marie-t-il avec la transformation de Fourier ?
Théorème 4.13 : Si f et g sont intégrables ainsi que leur convoluée f ∗ g, alors

(a) F[f ∗ g] = F[f ]F[g] ou encore f]∗ g(k) = f˜(k)g̃(k)
et si f˜ et g̃ peuvent être convoluées
(b) F[f.g] = 2πF[f ] ∗ F[g] ou encore f.g(k)
f = 2π f˜(k) ∗ g̃(k)
En d’autres termes, produit ordinaire et convolution sont échangés par transformation de Fou-
rier !
Preuve : Calculons la transformée de Fourier de f ∗ g :
Z ∞ Z ∞ Z ∞ Z ∞
ikx Fubini ikx
F[f ∗ g](k) = f (x − y)g(y)dy e dx = f (x − y)g(y)e dx dy
−∞ −∞ −∞ −∞
Z ∞ Z ∞ Z ∞
= f (x − y)eik(x−y) dx g(y)eiky dy = f˜(k)g(y)eiky dy
−∞ −∞ −∞
= f˜(k)g̃(k) cqfd . (4.15)
La formule F[f.g] = F[f ]∗F[g] s’obtient de la même manière si f˜ et g̃ sont intégrables. Nous l’admettrons plus
généralement sous les hypothèses ci-dessus.

Ce théorème est de grande importance pratique en physique : c’est lui qui permet le
découplage des modes dans l’analyse d’un système linéaire. On a vu au Chap. 3 que dans
un système linéaire décrit par un “noyau” K(t − t0 ) et soumis à une excitation F (t), la réponse
au temps t est de la forme Z
G(t) = dt0 K(t − t0 )F (t0 ) ,
c’est-à-dire est la convolée G = K ∗ F . En passant aux transformées de Fourier, G̃(ω) =

K̃(ω)F̃ (ω), il y a découplage des différentes valeurs de ω, c’est-à-dire des différents modes.
4.2.6 Diffraction par une fente, par un réseau

En Optique, on étudie la diffraction d’une onde lumineuse monochromatique u(x, t) =
Aei(kx−ωt) par une fente de largeur d = 2a. A grande distance, l’amplitude diffractée est donnée
par les “formules de Fraunhofer” 2 qui reposent sur la transformée de Fourier.
L’amplitude de l’onde incidente de longueur d’onde λ et de vecteur d’onde k = 2π/λ étant décrite par la
fonction scalaire f (x), on écrit que l’onde diffractée est la superposition d’ondes sphériques émises par tous les
points de l’objet diffractant, ici la fente. Donc l’amplitude diffractée en ~x est, pour r = |x| a et dans la
direction θ Z a
0
fd (~x) = fd (r, θ) = ψk (r) dx0 f (x0 )eikx sin θ
,
−a
avec un préfacteur ψk (r) qui ne nous concerne pas ici. On voit que la transformée de Fourier f˜ de l’onde incidente
f donne, à un facteur près, l’amplitude à grande distance de la lumière diffractée par la fente, l’intensité diffractée
étant proportionnelle à |f˜(k sin θ)|2 . Voir TD pour les détails du calcul.
4.3 Transformées de Fourier des distributions

• Préambule
On aimerait maintenant étendre ces transformées de Fourier pour pouvoir les utiliser sur
les distributions telles δ, X ou H souvent rencontrées en physique. L’idée première est de
partir à nouveau d’une fonction localement intégrable, qui définit une distribution régulière,
d’en calculer la transformée de Fourier et de l’appliquer à une fonction test. Mais on se rap-
pelle que l’intégrabilité locale ne suffit pas à assurer l’existence d’une transformée de Fourier.
Restreignons-nous donc à des fonctions f intégrables (dans L1 ). Selon le Théorème 4.3, sa
2. “The equation was named in honor of Joseph von Fraunhofer although he was not actually involved in
the development of the theory. ” (sic) [Wikipedia]. À ce titre, elle constitue une illustration de la fameuse loi de
Stigler qui affirme Une découverte scientifique ne porte jamais le nom de son auteur, . . . et cette loi s’applique
à elle-même !

§ 4.3. Transformées de Fourier des distributions 67
transformée de Fourier f˜ existe et est continue donc localement intégrable. On écrit alors, pour
toute fonction-test ϕ
Z Z Z
˜
h f, ϕ i = ˜
f (k)ϕ(k)dk = ikx
f (x)e dx ϕ(k)dk ,
R R R
mais on peut utiliser le théorème de Fubini (grâce à l’intégrabilité de f et ϕ) pour intervertir

les deux intégrales et écrire
Z Z Z
˜
h f, ϕ i = f (x) ikx
e ϕ(k)dk dx = f (x)ϕ(x)dx
e .
R R R
Ceci suggère, pour tout distribution T , la définition suivante de F[T ]

déf
h F[T ], ϕ i=h T, F[ϕ] i . (4.16)
Mais une dernière difficulté nous attend là ! La transformée de Fourier F[ϕ] d’une fonction
ϕ ∈ D n’est pas toujours dans D, et le membre de droite n’existe pas toujours ! (le support de
F[ϕ] n’est pas nécessairement borné) : la transformée F[T ] n’est pas toujours définie. Il nous
faut donc élargir la classe de fonctions-tests.
• Distributions tempérées
On a introduit plus haut (sect. 4.2.4) l’espace S des fonctions ϕ à décroissance rapide, telles
que pour tout k ∈ N, ϕ et toutes ses dérivées ϕ(m) satisfont
lim |xk ϕ(m) (x)| = 0 .

x→±∞
Définition 4.3 : Soit S 0 le dual topologique de S (espace des formes linéaires continues sur
S). On appelle distribution tempérée tout élément de S 0 .
Vérifions d’abord que S 0 ⊂ D0 : toute distribution tempérée est une distribution “ordinaire”.
Cela découle de D ⊂ S et du fait que la continuité en un sens implique celle dans l’autre (à
vérifier). Cela implique que les propriétés déjà établies (translation, dilatation, dérivabilité, etc)
pour les distributions ordinaires demeurent valables dans S 0 .
Qu’est-ce qui remplace dans S 0 les distributions “régulières” associées à une fonction loca-
lement intégrable ? Définissons les fonctions à croissance lente comme les fonctions croissant au
plus à l’infini comme une puissance de x. Le produit d’une telle fonction par une fonction test
de S est encore intégrable. On établit donc
Proposition 4.14 : Toute fonction localement intégrable à croissance lente définit une distri-
bution de S 0 .

Mais de même que D0 contenait des distributions non régulières, S 0 en contient aussi qui ne
sont pas associées à des fonctions intégrables à croissance lente.
Exemples. La distribution δ de Dirac est évidemment dans S 0 , son application sur toute
ϕ ∈ S étant bien définie (et linéaire et continue). Mais elle n’est pas une fonction à croissance
lente.
• Transformées de Fourier des distributions tempérées
Nous avons maintenant un résultat important qui justifie la démarche adoptée :
Théorème 4.15 : Toute distribution tempérée admet une transformée de Fourier au sens des
distributions (4.16) qui est elle aussi une distribution tempérée.
Autrement dit (4.16) s’applique pour tout T ∈ S 0 et ϕ ∈ S et définit F[T ] ∈ S 0 . On

vérifie aussi que cette transformée de Fourier coı̈ncide bien avec celle définie plus haut pour les
distributions régulières de L1 ou de L2 ([1], p 273).
On vérifie enfin que les formules d’inversion du Théorème 4.6 s’appliquent encore aux dis-
tributions tempérées : si T ∈ S 0 , soit T̃ = F[T ], alors
2πT = F[T̃ ]
avec F la transformation conjuguée. Ou encore, de façon plus cavalière, si T̃ (k) = F[T ](k),
2πT (x) = F[T̃ ](−x).
• Exemples et applications. Transformée de Fourier de δ, etc
Considérons la fonction constante 1, x 7→ 1 : c’est une fonction à croissance lente, donc

dans S 0 . Calculons sa transformée de Fourier. Soit ϕ ∈ S une fonction à décroissance rapide.
déf R
On a h 1̃, ϕ i = h 1, ϕ
e i = R ϕ(k)dk,
e ce qui, par les formules d’inversion (Théorème 4.6), vaut
R
R
ϕ(k)dk
e = 2πϕ(0) = 2πh δ, ϕ i. On en conclut que 1̃ = 2πδ. Exercice : établir selon la même
méthode que F[e−ika ] = 2πδa .
Proposition 4.16 : La transformée de Fourier de 1 est 2πδ
F[1] = 2πδ , F[e−ika ] = 2πδa . (4.17)
Réciproquement la transformée de Fourier de δ est la fonction 1.

§ 4.3. Transformées de Fourier des distributions 69
La preuve de la réciproque s’effectue de la même manière :

Z
h δ̃, ϕ i = h δ, ϕ e = ei0 ϕ(x)dx = h 1, ϕ i .
e i = ϕ(0)
Des théorèmes de dérivation et de translation découlent alors des formules utiles
F[δ 0 ] = −ik , F[δ (m) ] = (−ik)m F[δa ] = eika .
(Attention : ces formules dépendent des conventions dans la définition de F !)

Exercice. Établir les formules suivantes pour les distributions fréquemment rencontrées H,
X, P P , . . .
1 1 1
F[H(x)] = i PP + πδ F[PP ] = iπ sgn k F[sgn (x)] = 2i PP ,
k x k
k
e (k) = X
X .
2π
On verra d’autres exemples en TD.
Mon exposé a suivi de très près celui de [1]. Pour plus de détails, preuves, etc, voir [5], [7],
[8].
Exercices
1. Calculer la transformée de Fourier des fonctions suivantes :
(a) : 1/(p2 + m2 ), p ∈ R3 , qui représente (à un facteur près) l’amplitude d’une particule de
masse m et d’impulsion p.
−mkrk
(b) e krk , pour r ∈ R3 .
Ces fonctions jouent un rôle considérable en théorie quantique des champs.
2. Changement de normalisation.
R
b ] = A eiBxk dx, que
Si on définit une transformée de Fourier avec d’autres normalisations F[f R
peut-on dire de
– la transformée inverse ?
– le théorème de Parseval–Plancherel ?


Chapitre 5
Probabilités
5.1 Événements. Espace des épreuves.
La théorie des probabilités s’est construite à partir de considérations sur la théorie des jeux.
Dans ces cas-là, (jeux de dés, de cartes, paris, etc), on cherche à évaluer la probabilité d’observer
un type d’événements donné dans un ensemble fini d’événements possibles. Par exemple dans
un jeu où on lance deux dés, quelle est la probabilité que la somme des deux dés soit 6 ? Il
suffit d’énumérer tous les événements possibles (ici 62 ) et tous les “événements favorables” (ici
5 : 1+5, 2+4, 3+3, 4+2, 5+1) : si tous ces événements se produisent a priori de façon . . .
équiprobable ( !), (dés non pipés), on définit la probabilité comme le rapport
#cas favorables
P= . (5.1)
#cas possibles
En général, dans ce genre de situations, évaluer une probabilité équivaut à un problème de

dénombrement, relevant de la combinatoire –élémentaire ou non 1 –.
On souhaite généraliser cette définition à une classe d’événements décrits par une ou des
variables prenant des valeurs, discrètes ou continues, en nombre infini. Se pose la question
de compter, ou plutôt de mesurer ces événements. On voit réapparaı̂tre la notion de mesure
abordée au chapitre 2.
On va donc devoir axiomatiser un peu notre approche.
1. Exemple d’un problème simple à énoncer mais très ardu, le problème des ménages : n couples sont placés
de façon aléatoire autour d’une table circulaire. Quelle est la probabilité qu’aucune femme ne soit assise à côté
de son conjoint ?

72 Chap.5. Probabilités
• Espace des épreuves (ou univers) Ω
Cet “espace” (qui n’est en général ni vectoriel, ni topologique !) est la donnée de base d’un
problème de probabilités. C’est l’ensemble de tous les événements possibles. Plus précisément,
on appellera événement élémentaire (ou atomique) tout élément de Ω, et épreuve le choix d’un
élément a dans Ω. En général, un événement (événement composé) est associé à une partie (ou
sous-ensemble) de Ω. On va chercher à associer une probabilité P(A) à tout A ⊂ Ω. En fait
cela n’est pas toujours possible et on doit se contenter de le faire pour des sous-ensembles bien
particuliers, des sous-ensembles “mesurables”.
Exemples : (a) Ω ensemble fini des résultats de lancers de deux dés, où on tient compte de
l’ordre (on distingue les deux dés) ; le cardinal de Ω est 62 = 36 ; A = sous-ensemble des lancers
contenant un 2 ; |A| = 11 ; P(A) = 11/36.
(b) Ω = R, A = Q, comment définir P(Q), la probabilité qu’un réel “tiré au hasard” (il faudra
préciser) soit un rationnel ?
5.2 Probabilités et mesure. Vocabulaire

5.2.1 Axiomes de Kolmogorov
Dans le cas où l’espace d’épreuves Ω n’est pas un ensemble fini, nous venons de voir que le
concept de probabilités sur Ω est lié à celui de mesure sur cet ensemble. En général on dira
qu’on a probabilisé l’espace Ω si on a pu définir une famille F de ses parties (sous-ensembles)
A et leur attacher un nombre 0 ≤ P(A) ≤ 1, la probabilité a priori de l’événement A, avec les
axiomes suivants (Kolmogorov)
K(i) : ∅ ∈ F, et P(∅) = 0 ;
K(ii) : Ω ∈ F et P(Ω) = 1 ;
déf
K(iii) : Si A ∈ F, son complémentaire Ā = Ω \ A ∈ F, et P(Ā) = 1 − P(A) ;
K(iv) : Si A, B ∈ F, A ⊂ B implique P(A) ≤ P(B) ;
K(v) : F est stable par union dénombrable ; si A, B ∈ F, donc A ∩ B et A ∪ B ∈ F, on a
P(A ∪ B) = P(A) + P(B) − P(A ∩ B) ;
toutes propriétés qui généralisent celles familières pour un ensemble fini.

On voit que F satisfait les axiomes de définition d’une tribu (cf Chap. 2) et P ceux d’une
mesure, avec la condition supplémentaire de normalisation
P(Ω) = 1 .

§ 5.2. Probabilités et mesure. Vocabulaire 73
On peut alors transcrire dans ce nouveau contexte le vocabulaire introduit au chapitre 2 :

– Une propriété vraie p.p. devient une propriété vraie presque sûrement (p.s.) ;
– A tel que P(A) = 0 est un événement presqu’impossible, A tel que P(A) = 1 est presque
sûr ;
– une fonction mesurable X sur l’espace (l’univers) Ω à valeurs réelles est appelée variable
aléatoire, voir § suivant ;
R
– l’intégrale d’une telle v.a. X est son espérance E(X) = Ω XdP . En physique, on dit aussi sa
valeur moyenne et on la note généralement h X i, ou quelquefois X, donc h X i ≡ E(X) ≡ X.
A cela s’ajoutent quelques éléments de terminologie propres aux probabilités :
– on vient de le voir, un élément de F (donc une partie probabilisée de Ω) est un événement ;
– deux événements A et B tels que A∩B = ∅ sont dits incompatibles ou mutuellement exclusifs ;
– A ∩ B est l’événement “A et B” ; A ∪ B est l’événement “A ou B”.
Dans le cas où Ω est un ensemble fini, on retrouve les définitions et résultats de la théorie
élémentaire des probabilités. La donnée de la “loi” P se ramène à celle des probabilités des
P
événements élémentaires pa = P({a}), complétée par P(A) = a∈A pa , selon l’axiome K(v).
P
La loi de probabilité est bien normalisée a∈Ω pa = P(Ω) = 1, etc.
Remarques. On n’a pas cherché à donner une liste minimale d’axiomes, de laquelle les
autres axiomes découlent. L’axiome K(v) se généralise en une formule de Poincaré pour une
union finie P (∪i Ai ) = · · · , voir TD.
5.2.2 Probabilité conditionnelle. Événements indépendants

On l’a dit, P(A) représente la probabilité a priori de l’événement A, compte tenu de la
seule information dont nous disposons : A ⊂ Ω. Si maintenant une information supplémentaire
est apportée, à savoir qu’un événement B s’est produit, le calcul de la probabilité de A est à
reconsidérer, et on peut parler de probabilité a posteriori, ou de probabilité de A conditionné
par B, ce qu’on symbolise par A|B. La définition suivante semble naturelle
Définition 5.1 : (Axiome de Bayes) Si A, B ∈ Ω sont deux événements, avec P(B) 6= 0,

la probabilité conditionnelle de A sachant B (ou “A si B”) est
P(A ∩ B)
P(A|B) = .
P(B)
Il découle de cette définition une propriété simple mais utile à laquelle on donne aussi le
nom de Bayes : P(A ∩ B) = P(A|B)P(B) = P(B|A)P(A) donc
P(B|A)P(A)
Proposition 5.1 (Bayes) : P(A|B) = .
P(B)

Définition 5.2 : Deux événements A et B de Ω sont indépendants si
P(A|B) = P(A) ou de façon équivalente P(B|A) = P(B) ou encore P(A ∩ B) = P(A)P(B) .

(5.2)
Une famille finie d’événements Ai est dite indépendante si pour toute sous-famille des Ai ,
Q
P(∩i Ai ) = i P(Ai ).
N.B. Bien noter le “toute sous-famille”, et non pas seulement toutes les intersections deux à
deux, ou l’intersection de tous les Ai !
5.3 Variables aléatoires. Distributions de v.a.

Dans de nombreux cas concrets, en physique notamment, l’espace Ω est gigantesque et ne
se prête pas bien à une description quantitative directe. (Qu’on pense aux O(1023 ) variables
de vitesse des molécules dans un volume macroscopique d’un gaz. . .) On va alors chercher à
décrire les propriétés (statistiques) de ce système à l’aide d’une ou de quelques fonctions à
valeurs réelles sur l’espace Ω. Cela nous amène à la définition d’une variable aléatoire.
5.3.1 Définition d’une variable aléatoire ; loi de probabilité
Définition 5.3 : Si Ω est un espace probabilisé, une variable aléatoire (v.a) (unidimensionnelle)
X est une fonction mesurable de Ω dans R. On définit de même une v.a. n-dimensionnelle
X : Ω → Rn .
Dans la suite, sauf mention explicite et pour la simplicité des notations, nous discuterons le
cas d’une v.a. unidimensionnelle. Par l’hypothèse de mesurabilité de X, pour toute partie
borélienne B de R (c’est-à-dire tout élément de la tribu (borélienne) B(R)), A = X −1 (B) ∈ F,
la tribu de Ω. Cela permet alors de définir une probabilité pour toute partie B ∈ B(R) :
déf
PX = P ◦ X −1 , une notation un peu cavalière signifiant PX (B) = P(A). Autrement dit on a
remplacé l’espace probabilisé initial (Ω, F, P) par l’espace (R, B(R), PX ), et on dit que X “suit
la loi” (de probabilité) PX . Ce PX n’est pas en général la mesure de Lebesgue. Bien sûr, la
nouvelle loi PX obéit tous les axiomes de Kolmogorov, en particulier PX (R) = 1, condition de
normalisation qui exprime que X prend sûrement une valeur réelle. Donc
Définition 5.4 : On appelle loi de probabilité PX de la v.a. X : Ω → R la probabilité image
déf
de P par X, PX = P ◦ X −1 .
(Dans la suite on notera P au lieu de PX chaque fois qu’il n’y aura pas d’ambiguı̈té.)

§ 5.3. Variables aléatoires. Distributions de v.a. 75
5.3.2 Les quantités et fonctions importantes attachées à une v.a.

• Valeur moyenne, moments, variance et écart-type, etc.
Comme on l’a vu plus haut, on définit l’espérance ou valeur moyenne d’une v.a. X par
Z Z
déf
E(X) ≡ h X i = XdP = xdPX (x) (5.3)
Ω R
ou plus généralement celle de toute fonction G(X), pourvu qu’elle soit intégrable !
Z Z
déf
E(G) = h G(X) i = G(X)dP = G(x)dPX (x) . (5.4)
Ω R
En particulier on définit les moments

déf
µk = h X k i . (5.5)
Attention ! certains de ces moments peuvent ne pas exister : µk existe si X ∈ Lk . On verra

par la suite des exemples (distribution lorentzienne) de loi pour lesquelles seuls les moments les
plus bas existent.
Dans le cas d’une v.a. discrète, pour laquelle la loi PX est donnée par les probabilités pi
que X prenne la valeur xi , i = 1, 2, · · · , les expressions de ces espérance/valeur moyenne et
moments se réduisent à
X X
E(X) = h X i = p i xi , µk = pi xki ,
i i
sous réserve que si i prend une infinité de valeurs, ces sommes convergent !
Le deuxième moment entre dans la définition de la variance, notée var(X) ou σ 2 (X) :
déf
var(X) ≡ σ 2 (X) = h X 2 i − h X i2 = µ2 − µ21 (5.6)
ou encore, en développant le carré
var(X) ≡ σ 2 (X) = h (X − h X i)2 i . (5.7)
L’écart-type σ(X) est la racine carrée positive de cette variance.

L’intérêt de ces deux quantités –variance ou écart-type– est de donner une indication sur la
dispersion des valeurs de X autour de sa valeur moyenne h X i. Une variance (donc un écart-
type) faible signale des valeurs de la v.a. resserrées autour de la moyenne hXi. À l’inverse, une
variance élevée signifie que X peut prendre (avec une probabilité non négligeable) des valeurs
éloignées de hXi.

Il est utile d’observer comment se transforment h X i, µk , σ 2 par translation ou dilatation

de la v.a. X : La variance est insensible à une translation de la v.a. X par une constante c. En
effet, si X 0 = X + c, hX 0 i = hXi + c et X − hXi = X 0 − hX 0 i, donc les variances de X et X 0
sont les mêmes. Par une dilatation par un facteur λ, la moyenne et l’écart-type sont dilatées
par ce même facteur X 7→ λX, hXi 7→ λhXi, varX 7→ λ2 varX, µk 7→ λk µk , donc hXi/σ, µk /σ k
sont invariants.
On peut aussi construire des combinaisons des moments, homogènes de degré k par dilatation et invariantes
par translation : ce sont les cumulants. Par exemple, κ3 = h (X −h X i)3 i est le cumulant d’ordre 3 (ou skewness) ;
κ4 = h (X − h X i)4 i − 3σ 4 est le cumulant d’ordre 4, qui intervient en physique, et κ4 /σ 4 est le kurtosis, qui
décrit de façon plus fine la forme de la distribution de probabilité. Voir TD ?
On peut encore définir d’autres quantités qui donnent telle ou telle information quantitative sur la v.a. X.
La médiane de la loi d’une v.a. X est par définition la valeur xm telle que P(X ≤ xm ) = P(X > xm ) = 21 . À
ne pas confondre avec la valeur moyenne.
1
Exemple. Considérons une v.a. discrète prenant les valeurs {0, 1, 2, 3, 4} avec les probabilités 12 {1, 5, 1, 2, 3}.
Sa moyenne est 25/12 > 2, tandis que sa médiane est entre 1 et 2.
• Inégalité de Tchebychev
Supposons que la v.a. est de classe Lk (R), donc E(|X|k ) existe. Pour a > 0,
k
k
P(|X| > a) = E(θ(|X| − a)) ≤ E(θ(|X| − a) Xa ) ≤ E Xa
(on rappelle que θ ≡ H, la distribution de Heaviside), donc

1
P(|X| > a) ≤ k
E(|X|k ) . (5.8)
a
Cette inégalité nous sera très utile dans l’étude des Théorèmes limites, voir § 5.5.
• Covariance, coefficient de corrélation.
Considérons maintenant deux v.a. X et Y attachées au même espace Ω. On définit leur

covariance et leur coefficient de corrélation par les formules
cov (X, Y ) = h (X − h X i)(Y − h Y i) i = h XY i − h X ih Y i (5.9)

cov (X, Y )
r(X, Y ) = (5.10)
σ(X)σ(Y )
Ces quantités servent à évaluer la corrélation, au sens commun du mot, entre les deux variables.
Noter que si les deux variables sont indépendantes, le numérateur cov (X, Y ) se factorise en
?
h X − h X i ih Y − h Y i i = 0 puisque h X − h X i i = 0. Mais la réciproque : “cov (X, Y ) = 0 ⇒
X, Y indépendantes” n’est en général pas vraie, on en verra un contre-exemple plus bas.

• Fonction de répartition
On définit alors la fonction de répartition 2 F (x)
F (x) = P(X ≤ x) (5.11)
correspondant donc à un intervalle (borélien) (−∞, x] 3 . Il en découle par l’axiome K(v) que
pour tout intervalle ]a, b] (attention au sens des crochets !)
P(]a, b]) ≡ P(a < X ≤ b) = F (b) − F (a) ,
et par passage au complémentaire, P(X > x) = 1 − F (x).

Cette fonction jouit des propriétés suivantes
– elle est positive et prend ses valeurs dans [0, 1] (c’est une probabilité !) ;
– F (−∞) = 0 ; F (∞) = 1.
Plus précisément, si la v.a. prend ses valeurs dans l’intervalle (a, b) (a, b finis ou infinis),
F (a) = 0, F (b) = 1 ;
– F est monotone croissante au sens large (“non décroissante”) : si x < y, F (x) ≤ F (y).
Cela découle de l’axiome K(v) :
F (y) = P(X ≤ y) = P(X ≤ x) + P(x < X ≤ y) ≥ P(X ≤ x) = F (x) ;
– F est partout continue à droite : ∀ F (x + ) − F (x) = P(x < X ≤ x + ) donc à la

limite → 0, la mesure de l’intervalle ]x, x + ] tend vers zéro,
lim F (x + ) = F (x) ,
→0
ce qui est la définition de la continuité à droite.

Ces propriétés sont caractéristiques, en ce sens que toute fonction F les possédant peut être
considérée comme la fonction de répartition d’une v.a.
F est donc continue à droite. En revanche, elle peut ne pas être continue à gauche. C’est le
cas quand la variable X peut prendre des valeurs discrètes xk avec une probabilité non nulle
pk = P(X = xk ) :
lim(F (xk ) − F (xk − )) = lim(P(xk − < X ≤ xk )) = lim P({xk }) = pk .

→0
Exemple. La fonction de répartition d’un dé bien équilibré est représentée sur la figure 5.1.
Elle est discontinue en x = 1, 2, 3, 4, 5, 6.
2. appelée aussi “fonction de distribution cumulative”, le danger étant que “fonction de distribution” est
aussi utilisé dans un autre sens, voir plus bas.
3. Autre définition fréquemment rencontrée dans la littérature : F (x) = P(X ∈ (−∞, x[) avec une inégalité
stricte X < x !

F(x)
1 ...
1/6
...
1 2 3 4 5 6 x
Figure 5.1 – Fonction de répartition d’un dé bien équilibré. Elle est partout continue à droite,
discontinue à gauche aux 6 points marqués.
En général on peut démontrer (Lebesgue) que la fonction F peut être décomposée de façon
unique en la somme de trois composantes
F = Fat. + Fabs. cont + Fsing cont (5.12)
– chaque composante est non-décroissante ;

– la composante atomique Fat. est une fonction en escalier, somme des contributions d’un
nombre fini ou dénombrable de sauts en xk : elle représente la partie discontinue de F ,
F − Fat. est continue ;
– la composante absolument continue Fabs.cont est une fonction continue et dérivable p.p.,
0
Fabs.cont est intégrable de Lebesgue et on peut écrire
Z x
Fabs. cont (x) = f (x0 )dx0 (5.13)
−∞
0
avec une fonction f égale p.p. à Fabs.cont , positive ou nulle (puisque Fabs.cont est non-
décroissante) ;
– enfin la composante singulière continue Fsing.cont décrit le reste ! Elle est continue mais
non dérivable, et elle ne varie que sur un ensemble de mesure nulle. On peut rencontrer
à l’occasion cette situation “exotique” en physique. . . 4
Compléments.
1. On dit que la fonction F est absolument continue sur l’intervalle [a, b] si, pour tout réel > 0, il existe un
P
η > 0 tel que, pour toute suite ([an , bn ])n∈N de sous-intervalles de [a, b] d’intérieurs disjoints, n≥0 (bn − an ) <
P
η ⇒ n≥0 |F (an ) − F (bn )| < .
On montre (théorème dû à Lebesgue) que
Rx
F abs. continue sur [a, b] ⇔ F dérivable p.p., F 0 intégrable au sens de Lebesgue et F (x) − F (a) = a F 0 (x0 )dx0 ;
alors F absolument continue ⇒ F continue, et dérivable p.p.
4. Voir par exemple S. Aubry, J. Physique, 44 (1983) 147-162.

2. Fonction de Cantor ou escalier du Diable : exemple de fonction continue F sur [0, 1] telle que F (0) = 0,
F (1) = 1, qui est dérivable presque partout, la dérivée étant presque partout nulle. On reprend la construction
de l’ensemble de Cantor K (cf App. A2) et on construit à chaque étape une fonction linéaire par morceaux : à
l’étape 0, c’est la fonction f0 (x) = x ; à l’étape 1, f1 est la fonction continue affine par morceaux qui vaut 0 en
0, 1 en 1, et 12 sur [ 13 , 23 ] ; à la n + 1-ième étape, la fonction fn+1 = fn sur les intervalles où fn est constante,
et sur chaque intervalle [a, b] où fn n’est pas constante, fn+1 est la fonction linéaire par morceaux qui vaut
fn (a)+fn (b) −n
sur 2a b a 2b

2 3 +P 3 , 3 + 3 . Il est aisé de voir que pour tout x, |fn+1 (x) − fn (x)| ≤ 2 , ce qui montre que
la série de fonctions n≥0 (fn+1 − fn ) converge uniformément, et donc que la suite fn converge uniformément.
La fonction limite F est continue, monotone, et l’on a F (0) = 0 , F (1) = 1. De plus, F a une dérivée nulle
sur le complémentaire de l’ensemble de Cantor K, puisque ce complémentaire est une réunion d’intervalles sur
lesquels f , par construction, est constante (d’où le nom d’escalier du Diable !). Elle a donc bien les propriétés
annoncées : F (0) = 0, F (1) = 1, F 0 = 0 p.p. ; les points où elle n’est pas dérivable sont les points de l’ensemble
de Cantor, non dénombrable mais de mesure nulle. Comme anticipé au § 2.2.6, cette fonction est telle que
R1
1 = F (1) − F (0) 6= 0 F 0 (x)dx = 0. Clairement cette fonction n’est pas absolument continue ! Voir son graphe
sur la figure 5.2.
3. La fonction de Cantor est la fonction de répartition d’une variable aléatoire réelle X entre 0 et 1 dont les chiffres
du développement en base trois sont obtenus par des tirages indépendants équiprobables avec P(0) = P(2) = 21 ,
P(1) = 0.
Mais ces cas exotiques mis à part, la situation rencontrée le plus souvent concerne une
fonction de répartition de la forme F = Fat + Fabs.cont , ce qu’on peut encore récrire sous la
forme unifiée (5.13) à condition d’autoriser dans f des contributions de distributions delta
P
f (x) → f (x) + k pk δ(x − xk ).
Figure 5.2 – Graphe de la fonction de Cantor

• Fonction de répartition continue et dérivable
Supposons maintenant que la fonction F (x) ne comporte que la composante absolument

continue : elle est non seulement continue mais aussi dérivable. Soit f (x) = F 0 (x). Inversement
F (x) est la primitive de f (x) s’annulant pour x → −∞, donc
Z x
F (x) = f (x0 )dx0 , (5.14)
−∞
et en général Z b
P(a ≤ X ≤ b) = f (x)dx . (5.15)
a
La fonction f , appelée densité de probabilité 5 , est positive (puisque F est croissante) et telle
R∞
que P(R) = −∞ f (x)dx = 1 , on dit qu’elle est normalisée. Noter que f (x)dx représente la
probabilité que la v.a. X appartienne à l’intervalle (x, x + dx).
Remarques.
1. Bien comprendre que dans ce cas d’une v.a. continue X à fonction de répartition F absolu-
ment continue, on ne parle pas de la probabilité que X prenne une valeur x, mais seulement
qu’elle soit dans un intervalle, qu’il soit fini (a, b), infini (−∞, a) ou infinitésimal (x, x + dx).
2. Le mode de la loi d’une v.a. X est par définition la (ou les) valeur(s) de x où f (x) atteint
son maximum. Par extension, pour une v.a. discrète, c’est la (ou les) valeur(s) de k telles que
P(X = k) = pk soit maximale. Bien voir que les trois notions de valeur moyenne, mode et
médiane sont distinctes. Exercice : dessiner le graphe d’une loi f dont le mode est inférieur à
la valeur moyenne.
3. L’espérance et les moments s’expriment aisément en termes de f
Z Z
E(X) ≡ h X i = xf (x)dx , µk = xk f (x)dx .
Graphe d’une loi f . Il est commode de visualiser une loi de probabilité par le graphe de la fonction f . Noter
la relation entre ce graphe et les histogrammes que l’on peut construire à partir d’échantillons de N événements :
tout histogramme à N fini donne (à un facteur N près) une approximation du graphe de f . Intuitivement, on
s’attend à ce que dans la limite où N → ∞ et où la largeur des intervalles tend vers 0, l’histogramme approche
F (x+h)−F (x)
le graphe, puisque f (x) = limh→0 h , donc pour h petit, f (x)h ≈ P(x ≤ X < x + h), mais cela
mériterait d’être justifié plus précisément . . .
5.3.3 Plusieurs variables aléatoires

Ce qui vient d’être dit pour une v.a. continue peut être répété pour deux v.a., qui appliquent
l’espace Ω sur R2 . Ce R2 peut être visualisé comme le plan muni de deux coordonnées x et y, et
5. appelée aussi probability distribution fonction, ou PDF, en anglais. . .

les deux v.a. X, Y prenant des valeurs x et y avec une certaine loi décrivent un point aléatoire
dans le plan.
La fonction de répartition F (x, y) est alors définie comme
F (x, y) = P(X ≤ x ∩ Y ≤ y) ; (5.16)
quand F est continue et dérivable en x et en y, on lui associe la densité de probabilité jointe

f (x, y)
f (x, y)dxdy = P(x < X ≤ x + dx ∩ y < Y ≤ y + dy) , (5.17)
f dxdy est la probabilité que le point aléatoire soit dans le “pavé” infinitésimal (x, x + dx) ×
Rx Ry
(y, y + dy), et F (x, y) = −∞ −∞ f (x0 , y 0 )dx0 dy 0 .
Si f est factorisée, f (x, y) = f1 (x)f2 (y), les deux v.a. X et Y sont indépendantes, puisque
Z b Z d Z b Z d
P(a ≤ X < b ∩ c ≤ Y < d) = dx dyf (x, y) = f1 (x)dx f2 (y)dy = P(a ≤ X < b) P(c ≤ Y < d)
a c a c
qui est bien la définition de l’indépendance, voir plus haut, (5.2). Réciproquement, vérifier que
si X et Y sont indépendantes, leur loi f est factorisée.
• Distributions marginales
Soit f (x, y) la densité de probabilité d’une paire de v.a. (X, Y ). On étudie la “loi marginale”
sur la seule v.a. X quand on ne s’intéresse pas à la v.a. Y , autrement dit quand on somme
sur les valeurs possibles de Y . La valeur moyenne/espérance de toute fonction G(X) est donc
donnée par Z Z Z
hG(X)i = dxdyf (x, y)G(x) = dxG(x) dyf (x, y)
ou encore Z Z
déf
hG(X)i = dxf1 (x)G(x) avec f1 (x) = dyf (x, y) .
R
La loi marginale en x a donc pour densité dyf (x, y), le mot ”marginal” venant des tableaux
comptables à deux entrées où les sommes selon une variable étaient reportées dans la . . . marge
du tableau !
• Fonctions de corrélation de plusieurs v.a.
Quand on dispose de plusieurs v.a., comme X et Y ci-dessus, on s’intéresse à leur fonction de

corrélation h X Y i qui vaut Z
hXY i = f (x, y) xy dxdy . (5.18)

Sous l’hypothèse de factorisation de la densité f (x, y) = f1 (x)f2 (y), donc d’indépendance des
v.a. X et Y , on a
hXY i = hXihY i .
Inversement si hXY i =
6 hXihY i, cela implique que X et Y ne peuvent être indépendantes. Le
calcul de
déf
hXY ic = hXY i − hXihY i (5.19)
fournit donc une mesure de la non-indépendance, ou de la corrélation, des v.a. X et Y . Plus

généralement, on peut bien sûr définir des fonctions de corrélation plus compliquées, telles
hP (X)Q(Y )i où P et Q sont par exemple des polynômes, pourvu que ces valeurs moyennes
soient bien définies.
Remarque importante : hXY ic = 0 est une condition nécessaire pour que les v.a. X et
Y soient indépendantes, mais elle n’est pas suffisante : elle n’implique pas que X et Y sont
indépendantes. Ainsi soit ϕ une v.a. angulaire prenant des valeurs sur [0, 2π[ avec une densité
1
uniforme f (ϕ) = 2π . Soient les v.a. X = cos ϕ et Y = sin ϕ. Montrer que hXY ic = 0. Il
est pourtant clair que X et Y ne sont pas indépendantes, étant toutes deux liées à la v.a.
ϕ. Exercice : montrer dans cet exemple que h X 2 Y 2 i 6= h X 2 ih Y 2 i, ce qui vérifie la non-
indépendance de X et Y .
On passe sans difficulté de 2 à n v.a. X1 , · · · , Xn . On rencontrera souvent dans la suite le
cas de n v.a. indépendantes et de même loi, ou “également distribuées” 6 , donc dotées d’une
densité factorisée fn (x1 , · · · xn ) = ni=1 f (xi ).
Q
Exemple physique : dans un barreau de fer, l’aimantation est due aux moments magnétiques m ~ i portés
par les N atomes, plus précisément à l’effet coopératif de ces moments microscopiques. Selon les lois de la
Mécanique Statistique, on peut décrire un tel système par une approche probabiliste. À chaque configuration
de moments magnétiques {m ~ i }, on associe son énergie E({m
~ i }) qui dépend de tous ces moments et de leurs
interactions, et aussi d’éventuels champs magnétiques appliqués, etc. Le principe fondamental de la Mécanique
Statistique est qu’à l’équilibre à une température T (température absolue, mesurée en Kelvin), la probabilité
de cette configuration est
1
P({m~ i }) = e−βE({m ~ i })
(5.20)
Z
déf
où β = (kB T )−1 , avec kB la constante de Boltzmann, kB = 1, 380 10−23 J K−1 . Le facteur exponentiel
e−βE({m~ i })
est appelé poids de Boltzmann de la configuration. Le facteur Z, appelé fonction de partition du
système, est défini par
X
Z= e−βE({m
~ i })
(5.21)
config.
où on somme sur toutes les configurations des moments magnétiques, de telle façon que la probabilité (5.20)
P
~ i }) = 1. Le résultat de l’analyse théorique, en accord avec l’observation, est
est bien normalisée : config. P({m
qu’à haute température les moments microscopiques sont désordonnés, “pointant” dans toutes les orientations,
6. Les probabilistes anglo-saxons parlent de variables i.i.d, independent, identically distributed.

l’aimantation totale est alors nulle et le corps est dans sa phase paramagnétique ; à température inférieure à la
température de Curie, en revanche, les moments magnétiques ont tendance à s’orienter parallèlement les uns
aux autres, créant ainsi une aimantation macroscopique M ~ : on est dans la phase ferromagnétique. La valeur
moyenne hm ~ i i du moment de l’atome i est nulle dans la phase paramagnétique, et non nulle et égale à N1 M ~
(par définition) dans la phase ferromagnétique. La fonction de corrélation hm ~ j i des moments de deux atomes
~ im
i et j distants s’annule avec leur séparation dans la phase paramagnétique, elle tend vers le carré de hmi~ dans
la phase ferromagnétique.
5.3.4 Changement de variable aléatoire

On considère un phénomène aléatoire dont les événements sont décrits par une v.a. X réelle,
par exemple une coordonnée d’un point M . Pour une raison ou une autre, on peut être intéressé
à changer la description du phénomène en passant de la variable X à une autre, par exemple
Y = aX + b ou toute autre fonction (monotone croissante) Y = φ(X). Comment la loi de
X se modifie-t-elle par ce changement de variable (ce changement de coordonnée) ? Appelons
f (x) et fˆ(y) les densités de probabilité qui décrivent le phénomène dans les deux variables. La
quantité f (x)dx qui fournit la probabilité que x < X ≤ x + dx doit être indépendante du choix
de variable, en ce sens que
P(M ∈ I) = P(x < X < x + dx) = P(y < Y < y + dy)
donc
f (x)dx = fˆ(y)dy avec y = φ(x) et dy = φ0 (x)dx (5.22)

dy f (x)
donc f (x) = fˆ(y) = fˆ(y)φ0 (x) ⇐⇒ fˆ(y) = 0 . (5.23)
dx φ (x)
Noter que l’on a supposé explicitement que y est une fonction croissante de x, sinon que faudrait-
il faire ?
Exemples 1. Un point aléatoire sur le segment [−1, 1] est décrit par une coordonnée X ou
par un angle Θ, − 21 π ≤ Θ ≤ 21 π, avec X = sin Θ. Les densités sont reliées par fˆ(θ) = f (x) dx
dθ
=
ˆ
f (sin θ) cos θ ou f (x) = √f1−x
(θ)
2.
2. Passage en coordonnées radiales. Supposons qu’on se donne une distribution aléatoire de

points dans le plan, décrits par une densité (de probabilité) f (x, y). En coordonnées polaires,
(x, y) 7→ (r, θ), on va écrire
f (x, y) dx dy = fˆ(r, θ) dr dθ
mais on sait bien que l’élément de surface infinitésimal dxdy = rdrdθ, donc fˆ(r, θ) = rf (x, y).
Si la distribution en θ est uniforme, on peut se réduire à la seule coordonnée radiale r et écrire
fˆ(r) = 2πrf (x, y). Exemple : des points sont distribués dans le plan avec la densité f (x, y) =

A exp −α(x2 + y 2 ) (loi gaussienne, voir paragraphe suivant). Cette densité est évidemment
invariante par rotation dans le plan (elle ne dépend que de la distance de l’origine au point M
p
de coordonnées (x, y)), et il est naturel d’utiliser la coordonnée radiale r = x2 + y 2 . La densité
dans la v.a. R correspondante est fˆ(r) = 2πAr exp −αr2 . De la même façon, une distribution
dans l’espace R3 peut se récrire en coordonnées sphériques (r, θ, ψ), avec 0 ≤ θ ≤ π, 0 ≤ ψ ≤ 2π.
On a alors fˆ(r, θ, ψ) = r2 sin θf (x, y, z), ou s’il y a invariance par rotation (indépendance en
θ, ψ), fˆ(r) = 4πr2 f (x, y, z). On verra plus bas (§ 5.4.7) une application de ces considérations à
la distribution de Boltzmann des vitesses des molécules d’un gaz.
5.3.5 Fonction caractéristique

Un outil très utilisé en probabilités est la fonction caractéristique de la v.a., qui est la
transformée de Fourier de la densité f , notée ici ϕ
Z ∞
ϕ(u) = eiux f (x)dx . (5.24)
−∞
R R R
Cette intégrale converge absolument puisque | eiux f (x)dx| < |eiux |f (x)dx = f (x)dx = 1.
En étendant aux fonctions complexes la notion d’espérance
ϕ(u) = E(eiuX ) .
Comme on a vu, la fonction ϕ (supposée intégrable) détermine complètement la fonction f ,

donc la loi de probabilité, grâce aux formules d’inversion
Z ∞
1
f (x) = e−iux ϕ(u)du . (5.25)
2π −∞
L’utilité de cette fonction caractéristique tient au résultat suivant :
Proposition 5.2 : La somme de N v.a. indépendantes a pour fonction caractéristique le pro-

duit des fonctions caractéristiques.
Preuve : Soient n v.a. indépendantes X1 , · · · , Xn de densités de probabilité f1 , · · · fn . La densité

Q P
de probabilité jointe est, on l’a vu, le produit i fi (xi ). La v.a. X = n Xi a pour densité
Z Z Y X
f (x) = dx1 · · · dxn fi (xi ) δ(x − xi )
i i
comme on le vérifie en calculant l’espérance de toute fonction G de X seule :

Z Y X Z Y Z X Z
h G(X) i = (dxi fi (xi ))G( xi ) = (dxi fi (xi )) dxδ(x− xi )G(x) = dxf (x)G(x) .
i i i i

§ 5.4. Distributions classiques 85
La v.a. X a donc pour fonction caractéristique

Z ∞ Z ∞ Z Z Y X
iux iux
ϕ(u) = e f (x)dx = dxe dx1 · · · dxn fi (xi )δ(x − xi )
−∞ −∞ i i
Z Z Y Y
= dx1 · · · dxn fj (xj )eiuxj = ϕj (u) . (5.26)
j j
En particulier
La somme de N v.a. indépendantes et de même loi f a pour fonction caractéristique la
puissance N -ième de la fonction caractéristique de f
ϕN (u) = ϕ(u)N . (5.27)
On peut définir aussi cette fonction caractéristique dans le cas d’une variable discrète entière :
soit X une v.a. discrète prenant la valeur entière k avec la probabilité pk . On a ϕ(u) = k pk eiuk
P
ou, de façon équivalente, φ(z = eiu ) = k pk z k . Sous cette dernière forme, comme fonction de
P
z, on l’appelle aussi fonction génératrice des probabilités pk . En effet on retrouve les pk à partir
de cette fonction génératrice par différentiation
k
1 d
pk = φ(z) . (5.28)

k! dz z=0
Exemple : loi binomiale. Une v.a. prend la valeur 0 avec la probabilité 1 − p et 1 avec la
probabilité p, donc φ(z) = 1 − p + pz. La somme de N v.a. indépendantes et de même loi a
pour fonction caractéristique φN (z) = φ(z)N = N k N −k k k
P
k=0 CN (1 − p) p z . Cela donne la réponse
à un problème classique : si on tire à pile (0) ou face (1), quelle est la probabilité d’un score
total k après N tirages ? Réponse, pk = (1 − p)N −k pk CNk . On reviendra sur cette loi binomiale
au paragraphe suivant.
5.4 Distributions classiques

Dans ce paragraphe nous définissons et étudions quelques distributions usuelles, ou lois, de
variables aléatoires discrètes ou continues.
5.4.1 Distribution uniforme

C’est la plus simple des distributions de v.a. : la densité est constante et non nulle dans un
Rb
intervalle [a, b]. La valeur de cette constante p est fixée par la normalisation a f (x)dx =

1 F(x)
f(x)
x
a b
Figure 5.3 – Densité et fonction de répartition d’une distribution uniforme sur l’intervalle [a, b].
1
(b − a)p = 1 soit p = b−a , voir Fig. 5.3. La fonction de répartition F (x) est nulle pour x ≤ a,
croı̂t linéairement de a à b et vaut 1 pour x ≥ b.
Dans sa version discrète, où la v.a. prend un nombre fini de valeurs xi avec des probabilités
pi , les pi sont égales, les valeurs xi sont équiprobables. C’est le cas d’une pièce (au jeu de pile
ou face) ou d’un dé bien équilibrés, avec des probabilités respectives de pp = pf = 12 ou de
pi = 16 . Dans sa version continue, c’est la distribution des générateurs de nombres aléatoires
usuels, qui engendrent des nombres xi de l’intervalle [0, 1] avec une densité de probabilité
constante. À partir de cette densité sur [0, 1], on fabrique une distribution uniforme sur tout
autre intervalle [a, b] en translatant et dilatant la variable en y = x(b − a) + a et en prenant
f˜(y) = b−a 1 1
f (x) = b−a f ( y−a
b−a
) pour y ∈ [a, b].
• Moyenne, variance, moments, fonction caractéristique
Le calcul de la moyenne, de la variance et des moments est aisé

Z b
1 a+b
hXi = dx x = (5.29)
b−a a 2
Z b
1 bk+1 − ak+1 1
mk = hX k i = dx xk = = (ak + ak−1 b + · · · + bk ) (5.30)
b−a a (k + 1)(b − a) k+1
1
var X = hX 2 i − hXi2 = (a − b)2 (5.31)
12
Z b
1 eiub − eiua
ϕ(u) = dxeiux = (5.32)
a b−a iu(b − a)
(5.33)

5.4.2 Distribution binomiale
C’est la distribution rencontrée au paragraphe § 5.3.2 dans la discussion des sommes des valeurs
de pile ou face : si on a tiré à pile ou face n fois, quelle est la probabilité de k “faces” ?
Supposons la pièce mal équilibrée, avec une probabilité p de tomber sur face, 0 < p < 1
et q = 1 − p de tomber sur pile. Dans une série de n lancers, les résultats successifs sont des
variables indépendantes (la pièce ne garde pas le souvenir si elle est tombée sur pile ou face
les fois précédentes !). Par conséquent la probabilité d’une suite donnée de k faces et donc de
n − k piles est indépendante de l’ordre de ces faces ou piles et elle est factorisée de la forme
pk q n−k . Comme deux suites de k faces différant par leur ordre sont des événements A et B
mutuellement exclusifs, la probabilité de A ∪ B est la somme des probabilités de A et de B,
(n)
chacune égale à pk q n−k , et plus généralement la probabilité totale cherchée pk est pk q n−k fois
le nombre total de suites avec k faces, soit Cnk , d’où
(n) déf
B(n, p) : P(X = k) = pk = Cnk pk q n−k . (5.34)
(n) Pn
Cnk pk q n−k = (p + q)n = 1.
P
La loi est bien normalisée : pk = k=0
La distribution (5.34) est la loi binomiale B(n, p).
0.25
0.25
0.20
0.20
0.15
0.15
0.10
0.10
0.05 0.05
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
Figure 5.4 – Distribution binomiale pour p = 0, 5 et pour p = 0, 3 et n = 10.
Elle se rencontre chaque fois qu’on s’intéresse à n occurrences d’un événement se produisant
ou non avec une probabilité p ou 1 − p. Par exemple, on considère n noyaux radioactifs dont
chacun a la probabilité p de se désintégrer pendant un intervalle ∆t. Quelle est la probabilité que
k noyaux se soient désintégrés au bout de ce temps ? (on suppose que les désintégrations sont des
phénomènes aléatoires indépendants, c’est-à-dire qu’elles ne s’influencent pas mutuellement.)
Nous reviendrons en détail sur cet exemple au § 5.4.7.

• Moyenne, variance, moments. Fonction caractéristique
À nouveau, le calcul de la moyenne et de la variance est un bon exercice

X (n)
hXi = kpk = np (5.35)
k
X (n)
hX 2 i = k 2 pk = n(n − 1)p2 + np (5.36)
k
varX = hX 2 i − hXi2 = n(p − p2 ) = npq (5.37)
(5.38)
k−1
dans lequel on pourra utiliser de façon répétée l’identité kCnk = nCn−1 . Pour la fonction ca-
iuk
P
ractéristique ϕ(u) = k pk e , on a pour la distribution binomiale
X n
X
(n)
ϕBin(n) (u) = pk eiuk = Cnk eiuk pk q n−k = (1 − p + peiu )n . (5.39)
k k=0
Nous ferons usage de cette expression dans la suite.
5.4.3 Distribution normale

Rappelons d’abord que Z ∞ √
2
I= e−x dx = π. (5.40)
−∞
C’est la très fameuse intégrale gaussienne.

Cette formule très utile se démontre aisément de la façon suivante : calculons le carré de l’intégrale, considéré
comme une intégrale dans le plan et appliquons lui le changement de variables en coordonnées polaires.
R∞ 2 R∞ 2 2 2 2 R∞ 2
Explicitement I 2 = −∞ dx e−x −∞ dy e−y = R2 dxdy e−x −y = R2 rdrdθ e−r = 2π 0 12 d(r2 ) e−r =
R R
R∞
π 0 du e−u = π, cqfd.
Par un simple changement de variable, on en déduit que pour tout α > 0
Z ∞ r
−αx2 π
I(α) = e dx = (5.41)
−∞ α
et en particulier Z ∞
1 x2
√ e− 2σ2 dx = 1 . (5.42)
2πσ 2 −∞
On définit alors une v.a. gaussienne x par sa densité
1 (x−µ)2
N (µ, σ) : fGauss (x) = √ e− 2σ2 . (5.43)
2πσ 2

0.12
0.10
0.08
0.06
0.04
0.02
!5 5 10
Figure 5.5 – Densité d’une distribution gaussienne, µ = 2, σ = 3 et σ = 5. Le maximum est atteint

en x = µ, la largeur du pic (par exemple à la hauteur e−1 fois le maximum) est proportionnelle à σ.
On parle de la loi normale N (µ, σ). Elle dépend de deux paramètres µ et σ 2 que nous allons
maintenant interpréter. Calculons pour cela la moyenne et la variance de cette v.a.
Z ∞ Z ∞
hXi = dx x fGauss (x) = dx (x − µ) + µ fGauss (x) = 0 + µ :
−∞ −∞
le premier terme est nul car dans le calcul de hx−µi on peut effectuer le changement de variable
02
d’intégration x0 = x−µ et l’intégrale qui en résulte d’une fonction impaire x0 e−ax sur (−∞, ∞)
est nulle ; le deuxième terme de la moyenne est égal à µ car l’intégrale est bien normalisée.
Pour le calcul de la variance, remarquons d’abord qu’en différentiant les deux membres
2
∂
I(α) = dxx2 e−αx = 2α 1
R
de I(α) dans (5.41) 7 par rapport à α on obtient − ∂α I(α). Prenant
2 −1
α = (2σ ) , on est alors en mesure de calculer
Z ∞
dx0 02 −x022
Z Z
2 dx 2
−(x−µ)2
varX = dx (x − µ) fGauss (x) = √ (x − µ) e 2σ2 = √ x e 2σ = σ 2 .
2πσ 2 2πσ 2
−∞
Par conséquent les deux paramètres µ et σ 2 dont dépend la loi gaussienne (5.43) s’interprètent
respectivement comme sa moyenne et sa variance.
Le graphe de f (x) a une allure caractéristique de courbe en cloche, voir Fig. (5.5). Elle
est “centrée” en x = µ, et est d’autant plus étroite que l’écart-type σ (ou la variance σ 2 ) est
plus faible. Cette variance peut être mesurée par la “largeur du pic”, définie comme la distance
√ √
2 2σ entre les points x = µ ± 2σ où f est réduit d’un facteur e par rapport à son maximum :
√ f (µ)
f (µ ± 2σ) = .
e
Définition 5.5 : On dit qu’une v.a. X a une loi normale centrée normalisée si elle est gaus-
sienne avec µ = 0 et σ 2 = 1 (loi normale N (0, 1)).
7. La “dérivation sous le signe somme” est ici parfaitement justifiée, pourquoi ?

• Moments.
Les calculs qui précèdent ont préparé le terrain au calcul des moments d’ordre arbitraire.
Par changement de variable on ramène tout calcul de moment de X à celui de X 0 = X −µ. Pour
la variable X 0 qui est centrée, tous les moments impairs sont nuls, par l’argument de parité
donné pour la moyenne. Ses moments pairs s’obtiennent à nouveau par différentiation répétée
par rapport à α dans (5.41).
Exercice. Selon ce principe, vérifier les formules suivantes
hX 2 i = µ2 + σ 2 ; hX 3 i = µ3 + 3µσ 2 ; hX 4 i = µ4 + 6µ2 σ 2 + 3σ 4 .
On verra plus bas une autre manière de calculer ces moments.

La conclusion importante est que pour la distribution gaussienne, tous les moments existent
et sont calculables explicitement.
Au vu de l’inégalité de Tchebychev (5.8), l’existence de moments d’ordre quelconque implique que la pro-
babilité P(|X| > a) s’annule très vite quand a croı̂t, plus vite que toute puissance inverse a−k ; ceci est en
accord avec notre intuition : dans la distribution gaussienne les événements très éloignés de la moyenne sont
extrêmement rares.
• Fonction caractéristique
Puisque la fonction caractéristique est une transformée de Fourier, on connaı̂t par le Chap. 4 le résultat
pour la loi normale : la transformée de Fourier d’une gaussienne centrée (µ = 0) est une gaussienne centrée, et
en général, pour tout µ
2
1
σ2
ϕGauss (u) = eiuµ e− 2 u , (5.44)
une expression qui permet aussi de calculer aisément tous les moments de la distribution gaussienne. En effet
la fonction caractéristique ϕ(u) peut être considérée comme une fonction génératrice des moments, en ce sens
que sa dérivée n-ième en 0 vaut Z
(n)
ϕGauss (0) = in dxxn f (x)
(2p)
qui s’annule pour n impair, comme on a vu ; donc ϕGauss (0) = (−1)p m2p est au signe près, le 2p-ième moment
de la distribution N (µ, σ). Montrer en utilisant l’expression (5.44) que si µ = 0
m2p = (2p − 1)!! σ 2p , (5.45)

déf
où (2p − 1)!! = 1.3. · · · .(2p − 3)(2p − 1). Ces calculs prendront une grande importance en mécanique statistique
et en théorie quantique des champs. . .
• Importance des variables gaussiennes
Pour des raisons que l’on va voir, cette distribution joue un rôle particulièrement important.
La distribution gaussienne joue un rôle central aussi bien en probabilités et statistiques qu’en

physique. En probabilités et statistiques, cela tient en particulier au théorème limite central,

que nous étudierons au paragraphe suivant, selon lequel cette distribution apparaı̂t comme
limite de nombreux phénomènes aléatoires. En physique, elle est au cœur de très nombreuses
considérations ; en physique statistique, en relation avec les poids de Boltzmann : pour un
P1 2
système de particules sans interactions, tel un gaz parfait, l’énergie cinétique est E = 2
mvi ,
et les vitesses considérées comme des v.a. obéissent à une loi gaussienne dictée par le poids
− k ET Q − 2kmvi2T
de Boltzmann e B = i e B , (voir ci-dessous § 5.4.7) ; c’est le cas encore avec l’étude
d’ensembles d’oscillateurs harmoniques, que l’on rencontre en physique des solides et en théorie
quantique des champs, etc etc.
5.4.4 Distribution de Poisson
Soit λ un paramètre réel positif, et k une v.a. discrète à valeurs entières ≥ 0. La distribution
de Poisson est définie par la loi de probabilité
déf λk −λ
P(λ) : P(X = k) = pPoisson
k = e . (5.46)
k!
P∞
Il convient d’abord de vérifier que cette loi est bien normalisée, ce qui est immédiat : k=0 pk =
e−λ ∞ λk
P
k=0 k! = 1.
0.25
0.08
0.20
0.06
0.15
0.04
0.10
0.02
0.05
0 1 2 3 4 5 6 7 8 9 10 0 5 10 15 20 25 30 35 40 45 50
Figure 5.6 – Distribution de Poisson pour λ = 2, 5 et λ = 20.

• Moyenne, variance, moments, fonction caractéristique
Une fois encore, on calcule aisément les moyenne et variance de la distribution et sa fonction
caractéristique :
∞
X e−λ
hXi = kλk =λ (5.47)
k=0
k!
∞
X e−λ
hX 2 i = k 2 λk = λ2 + λ (5.48)
k=0
k!
varX = hX i − hXi2 = λ
2
(5.49)
λ(eiu −1) λ(z−1)
ϕ(u) = e ou φ(z) = e . (5.50)
Exercices : vérifier ces formules. Chercher le ou les mode(s) de P(λ), au sens du § 5.3.2. Montrer
que si λ est un entier n, les modes sont les deux valeurs n − 1 et n ; et que si λ n’est pas entier,
le mode est bλc (partie entière de λ).
• Importance de la loi de Poisson
La loi de Poisson apparaı̂t dans de nombreux phénomènes naturels ou de la vie pratique,

chaque fois que des événements indépendants se produisent à un taux constant λ (dans l’espace
et/ou le temps) : la loi pPoisson
k donne alors la probabilité d’avoir k occurrences de l’événement.
Ainsi supposons que N objets ont été distribués au hasard pendant un temps T donné (cela
peut s’appliquer à des appels téléphoniques, à des impacts de particules émises par une source,
à des gouttes de pluie ou autres projectiles supposés répartis à un rythme constant, etc). On
s’attend donc à en recevoir en moyenne λ = N/T par unité de temps. La probabilité d’en
recevoir k pendant un temps t ≤ T est donnée par la loi de Poisson de paramètre λt. Exemple :
je reçois en moyenne 50 e-mails par jour, répartis grosso modo de façon uniforme dans le temps.
Quelle est la probabilité que j’en reçoive k un certain jour ? Réponse : pPoisson
k avec λ = 50. Que
j’en reçoive 9 en une demi-journée ? Réponse : pPoisson
9 avec λ0 = N t/T = 25.
Pour se convaincre que cette interprétation est correcte, montrons que la loi de Poisson jouit
d’une propriété d’invariance par “divisibilité” dans le sens suivant. Considérons un processus
décrivant l’occurrence d’événements dans un intervalle de temps (ou un intervalle de droite,
n
un élément de surface, etc) suivant une loi de Poisson P(X = n) = λn! e−λ , et supposons qu’on
subdivise cet intervalle en m sous-intervalles de même taille. On s’attend à ce que les événements
se répartissent dans ces sous-intervalles de façon indépendante et avec la même loi. Si le nombre
total d’événements X est fixé, le nombre Xi d’événements dans le i-ième sous-intervalle donné
suit la loi binomiale : un événement a une probabilité 1/m de se produire dans l’intervalle
considéré, et la probabilité (m − 1)/m de se produire en dehors, donc P(Xi = k|X = n) =

n−k n!(m−1)n−k λn −λ
Cnk m1k ( m−1
m
)n−k = n!(m−1)
k!(n−k)!mn
. Par la formule de Bayes, P(Xi = k ∩ X = n) = k!(n−k)!mn n!
e
et la probabilité P(Xi = k) est donc
∞ ∞
X e−λ λk X λn−k (m − 1)n−k
P(Xi = k) = P(Xi = k ∩ X = n) =
n=k
k! mk n=k (n − k)!mn−k
λ k
e−λ λk λ m−1 e− m λ
= e m = (5.51)
k! mk k! m
λ
qui est une loi de Poisson de paramètre λ/m, cqfd. Bien entendu, h Xi i = var(Xi ) = m .
Cette même distribution de Poisson s’applique aussi aux phénomèmes quantiques. Ainsi le
nombre de particles ou de photons émis par une source avec un taux moyen donné suit une loi
de Poisson. On parle de bruit (par exemple de photons) poissonnien.
Cette apparition de la loi de Poisson tient au fait qu’elle décrit une certaine limite de la loi
binomiale, comme on le verra au § 5.4.6.
5.4.5 Quelques autres lois rencontrées dans les sciences naturelles

• Loi exponentielle
Pour α ∈ R+ , on définit la loi exponentielle de paramètre α par
fexp (x) = αe−αx si x > 0 , 0 sinon . (5.52)

Rx
Sa fonction de répartition est F (x) = −∞ fexp (x0 )dx0 = 1 − e−αx . Une propriété remarquable de cette loi est
son “absence de mémoire” : P(X > x + y | X > y) = P(X > x) ∀x, y ≥ 0 .
• Loi lorentzienne ou de Cauchy

Pour λ ∈ R+ , on définit la loi lorentzienne de paramètre λ (aussi appelée loi de Cauchy) par
1 λ
fLorentz (x) = x ∈ R. (5.53)
π x + λ2
2
Rx
Sa fonction de répartition est F (x) = −∞ fLorentz (x0 )dx0 = 12 + π1 Arctan λx .
Calcul de l’espérance ? On voit immédiatement que E(X) ≡ h X i n’est pas définie. La lorentzienne est un
exemple de “loi large” dont l’espérance n’est pas définie.
• Loi de Pareto
Une variable aléatoire X suit la loi de Pareto de paramètre α > 0 si elle prend des valeurs réelles supérieures
à un réel positif xm et que la probabilité P(X > x) est de la forme
x α
m
P(X > x) = pour x > xm , 0 sinon . (5.54)
x
α
avec k un réel positif. On en déduit la fonction F (x) de répartition de X, F (x) = p(X ≤ x) = 1 − xxm
xα
et la densité de probabilité f (x) de X, f (x) = F 0 (x) = α xα+1
m
. Cette loi intervient beaucoup en économie

2.0
1.5
1.0
0.5
1.5 2.0 2.5 3.0
-0.5
Figure 5.7 – Densité de probabilité de la loi de Pareto, α = 1 (courbe en tirets), α = 2 (continue),

avec xm = 1.
(distribution des richesses) mais aussi en géophysique (distributions des ressources en minerais, des tailles des
météorites, . . .), etc.
Exercice : déterminer pour quelles valeurs de α les moments d’ordre ≤ k sont définis. Calculer la probabilité
P(X > x + y|X > y) pour x > 0, y > xm et sa limite quand y → ∞.
On verra en TD d’autres de ces lois.
5.4.6 Limites de la loi binomiale

• Limite gaussienne.
Comme le suggère le graphe de la distribution binomiale (voir Fig. (5.4)), avec sa forme en
cloche très proche de celle de la gaussienne, la distribution gaussienne est une bonne approxi-
(n)
mation de la loi binomiale pk dans la limite des n grands, et pour k ∼ np, avec p et q = 1 − p
finis, donc n 1, k 1, n − k 1. C’est donc la partie centrale de la distribution que l’on
explore là.
La démonstration repose sur l’étude dans la limite considérée des fonctions caractéristiques calculées plus
haut, cf (5.39) et (5.44). Calculons le logarithme de ϕBin(n) (u) pour u petit (qui seul nous intéresse si k 1)

1
ln ϕBin(n) (u) = n ln(1 + p(eiu − 1)) ' n p(eiu − 1) − p2 (eiu − 1)2 + · · ·
2
2

u 1
= n p(iu − + · · · ) + p2 u2 + O(u3 ) (5.55)
2 2
u2

= n iup − p(1 − p) + · · · .
2
et comparons-le à celui de ϕGauss (u), cf (5.44)
1
ln ϕGauss (u) = iuµ − u2 σ 2
2
Pour k 1, donc u 1, on voit que les deux fonctions caractéristiques coı̈ncident pourvu que d’une part les
valeurs moyennes h X i = np et µ, de l’autre les variances var X = np(1 − p) et σ 2 coı̈ncident.

En pratique, pour comparer la distribution (discrète) binomiale et la distribution (continue)

gaussienne, il faut calculer numériquement à l’aide de cette dernière la probabilité que la variable
x soit dans un intervalle de longueur 1 centré sur l’entier k
Z k+ 1
0 1 1 2 1 1
pk = P(k − < x < k + ) = dxfGauss (n) = F (k + ) − F (k − )
2 2 k− 21 2 2
(n)
et la comparer à pk calculé avec la loi binomiale. Par exemple pour n = 50 et p = 0, 2, on
(n)
trouve que p0k diffère de pk d’au plus 8% dans l’intervalle 6 ≤ k ≤ 16, voir la figure 5.8.
"
0.14 ! !
" "
!
0.12 !
" "
!
0.10
!
0.08 " "
!
0.06 !
" "
!
0.04
"
! !
"
0.02 !
"
! "
" !
" !
0.00 " !
! " !
" ! " !
"
5 10 15 20
Figure 5.8 – Comparaison de la distribution binomiale (n = 50, p = 0, 2 : petits disques) et de la

p
gaussienne (µ = 10, σ = np(1 − p) : petits carrés) intégrée dans chaque intervalle de longueur 1.
Limite poissonnienne
Il peut être aussi intéressant d’étudier la limite de la loi binomiale quand p est très petit et
np (la valeur moyenne de k) est finie, tandis que n 1. Il faut bien comprendre que l’on explore
maintenant le bord de la distribution binomiale, loin de son maximum. Poisson a montré que
l’on trouve alors la distribution qui porte son nom.

(n) λk
pk ' pPoisson
k = e−λ (5.56)
n1 k!
avec λ = np supposée finie tandis que n → ∞.
Démonstration de cette limite :
(n) n! n(n − 1) · · · (n − k + 1) (np)k np n−k
pk = pk (1 − p)n−k = 1 − (5.57)
k!(n − k)! k! nk n
k
n(n − 1) · · · (n − (k − 1)) λ λ
= (1 − )n−k (5.58)
k! nk n
n −k
λk

λ 1 2 k−1 λ
= 1− × 1− 1− ··· 1 − 1−
k! n n n n n
λk −λ
1 + O(n−1 )

' e (5.59)
k!

λ n
= e−λ .

en se rappelant que limn→∞ 1 − n
A nouveau une petite expérience numérique est utile. Pour n = 50, p = 0, 02, on voit que la
distribution de Poisson pour λ = np = 1 approxime à moins de 2% la binomiale pour 0 ≤ k ≤ 3,
comme le montre cette table
k 0 1 2 3 4 5
(50)
Binomiale pk 0, 36417 0, 37160 0, 18580 0, 06067 0, 01454 0, 002731

Poisson pPoisson
k

λ=1
0, 36788 0, 36788 0, 18394 0, 06131 0, 01533 0, 003066
Table 5.1 – Comparaison des lois binomiale et de Poisson
Récapitulons. Pour n très grand et p finie, la loi binomiale est bien approximée par une
gaussienne pour les valeurs de k les plus probables, k ≈ pn ∼ n : les sommets des deux cloches
binomiale et gaussienne se superposent bien. Pour p très petit et hki = pn fini, les événements
à k n (le bord gauche de la cloche binomiale) sont bien décrits par la loi de Poisson.
5.4.7 Quelques exemples concrets

• L’aiguille de Buffon
Voici le problème posé par Buffon : on laisse tomber une aiguille sur un parquet, quelle est la probabilité que
l’aiguille chevauche deux lames du parquet ?
De façon plus précise, soit un ensemble de droites parallèles à l’axe des x, espacées d’une distance `. Quelle
est la probabilité pour un segment de longueur b ≤ ` uniformément distribué en position et en orientation d’être
sécant à une de ces droites ?
Dans la bande (la lame du parquet) où se trouve le milieu du segment, soit y la distance de ce milieu au
bord inférieur. Soit θ l’angle qu’il fait avec le bord, 0 ≤ θ < π.
L’hypothèse de distribution uniforme en position et angle signifie que la densité de probabilité autour du
R ` R π dθ
point (y, θ) est f (y, θ) = 1` π1 qui est bien normalisée puisque dydθf (y, θ) = 0 dy
R
` 0 π = 1.
La condition que le segment recoupe un bord est y < 2 b sin θ (bord inférieur) ou ` − y < 12 b sin θ (bord
1
supérieur). La probabilité pour le segment de ne pas être sécant est donc

Z π 1
dθ `− 2 b sin θ dy
Z
PN C =
0 π 12 b sin θ `
Z π
dθ b
= (1 − sin θ) (5.60)
0 π `
2b
= 1− .
π`
La probabilité de croisement est donc
2b
PC = .
π`

• Distribution de Maxwell–Boltzmann des vitesses dans un gaz

Dans un gaz (parfait) à l’équilibre, soit f (vx , vy , vz ) la densité de probabilité des vitesses d’une molécule.
Montrons que des considérations de symétrie et d’indépendance conduisent à l’expression de f . Supposons en
effet que les v.a. vx , vy et vz sont indépendantes, une hypothèse qu’il faudrait justifier soigneusement. . . La
fonction f est donc factorisée, cf § 5.3.3, et le gaz étant isotrope, les trois directions d’espace jouent le même
rôle et les trois fonctions sont identiques
f (vx , vy , vz ) = g(vx )g(vy )g(vz ) .
Par ailleurs, par invariance par rotation, la fonction f (vx , vy , vz ) doit n’être fonction que de ~v 2 = vx2 + vy2 + vz2 .
On cherche donc une fonction
f (vx , vy , vz ) = h(vx2 + vy2 + vz2 ) = g(vx )g(vy )g(vz ) . (5.61)
Seule la fonction exponentielle a cette propriété :

2 2 2
f (vx , vy , vz ) = Ae−α(vx +vy +vz )
et c’est donc une distribution gaussienne !

0
g 0 (vy )
Preuve. Dérivant (5.61) par rapport à vx ou vy , on a 2vgx(v x)
g(vx ) = 2vy g(vy ) , dont le membre de droite ne
dépend pas de vx et est donc une constante. On intègre alors l’équation différentielle ordinaire par rapport à vx
avec le résultat g(vx ) = a exp(−αvx2 ) etc.
32
La normalisation de f fixe A = α π et le coefficient α est identifié avec 12 mβ, β = (kB T )−1 , de telle sorte
1
qu’apparaı̂t dans l’exponentielle β × 2 m~v 2 = kB1T × énergie cinétique de la molécule,
32 2 +v 2 +v 2 )
m(vx
m − y z
f (vx , vy , vz ) = e 2kB T
. (5.62)
2πkB T
√
Enfin il peut être utile d’exprimer cette loi en termes de la seule variable v = ~v 2 . Pour cela on effectue un
changement de variable des coordonnées (vx , vy , vz ) 7→ (v, θ, φ), cf § 5.3.4, on intègre sur les angles θ et φ dont
la densité f ne dépend pas et on trouve finalement
32
m mv
− 2k
2
f (v) = 4π v2 e BT
, (5.63)
2πkB T
c’est la distribution de Maxwell-Boltzmann des vitesses d’un gaz, que l’on étudie en Mécanique Statistique.
Exercice : utiliser la dérivation sous le signe somme pour calculer h v 2 i et montrer que h v 2 i = 3h vx2 i où la
moyenne de vx2 est calculée avec la distribution (5.62). Cela n’était-il pas attendu ?
• Désintégrations radioactives
On s’intéresse ici à la désintégration de noyaux d’un isotope X → X0 . On décrit en général le phénomène par
une loi “empirique” : le nombre de désintégrations par unité de temps est proportionnel au nombre N (t) de
noyaux X présents à l’instant t, avec un taux de désintégration constant κ, caractéristique du noyau étudié X
et de son mode de désintégration X → X0 . Pendant le temps dt, le nombre de noyaux se désintégrant selon ce
mode est
|dN | = κN dt = −dN . (5.64)

Autrement dit, la fonction N (t) satisfait l’équation différentielle Ṅ (t) = −κN (t). En l’intégrant, on trouve
N (t) = N (0)e−κt , (5.65)
la quantité de l’isotope considéré décroı̂t exponentiellement. On définit la demi-vie, notée τ , par le temps au
bout duquel le nombre N a décrû par un facteur 2. On a donc N (τ ) = N (0)/2, ce qui conduit à
ln 2
τ= N (t) = N (0) e−t ln 2/τ = N (0)2−t/τ . (5.66)
κ
ln 1000
Le nombre de noyaux de l’isotope aura décrû d’un facteur 1000 au bout d’un temps ln 2 τ ≈ 10 τ (se rappeler
que 210 ≈ 103 ).
238
Par exemple, pour l’isotope naturel U de l’Uranium, qui se désintègre en Thorium selon
238 α
92 U −→ 234
90 Th
en émettant un noyau d’Helium (particule α), la demi-vie est τ = 4, 5 Gans, (1 “Gan”= 1 milliard d’années !)
donc le nombre N aura décrû d’un facteur 1000 au bout d’un temps t = 45 Gans, soit trois fois l’âge actuel de
l’Univers. . . En revanche, pour les isotopes 131 I et 137 Cs, les demi-vies sont respectivement de 8j et 30 ans. . .
Le problème de désintégration de noyaux atomiques peut et doit en fait être traité par une approche
probabiliste, puisque c’est bien là le fond de la question : un noyau (comme tout système individuel de nature
quantique) a une probabilité de transition de tel ou tel état vers tel autre. Le traitement qui a précédé s’est
appliqué implicitement à une vaste population de noyaux (dont le nombre a été traité comme une variable
continue, et non comme un entier discret), et a concerné en fait le nombre moyen (la valeur moyenne ou
espérance au sens probabiliste) de la v.a. nombre total de noyaux de l’isotope X. L’équation (5.64) se redit en
termes probabilistes comme suit : la probabilité d’un noyau donné de subir la désintégration étudiée pendant le
temps dt est P(X → X0 ; dt) = κdt. Notons PN (t) la probabilité d’avoir N noyaux dans l’état initial (radioactif)
X au temps t. Les désintégrations des différents noyaux étant supposées des événements indépendants, on a
PN (t + dt) = (1 − κdt)N PN (t) + κ(N + 1)PN +1 (t)dt + O(dt2 ) ,

somme des probabilités des événements exclusifs suivants : aucune désintégration des N noyaux (probabilité
(1 − κdt) pour chacun, factorisation pour l’ensemble puisque événements indépendants) + une désintégration
d’un des N + 1 noyaux avec la probabilité κdt fois la probabilité que les N autres restent inchangés + des
d
désintégrations multiples d’ordre plus élevé en dt. Écrivant PN (t + dt) = PN (t) + dt dt PN (t) + O(dt2 ) et ne
gardant que les termes d’ordre dt, on a donc
d
PN (t) = κ (N + 1)PN +1 (t) − N PN (t) (5.67)
dt
On se donne (avec probabilité 1) la valeur initiale N0 au temps 0, PN (t = 0) = δN N0 . On résout l’équation

(5.67) en considérant la fonction caractéristique, fonction génératrice des PN (t)
N0
X
φ(x, t) = xN PN (t) . (5.68)
N =0

Calculons les dérivées partielles de φ(x, t)
N0
∂ X d
φ(x, t) = xN PN (t) ,
∂t dt
N =0
N0 0 −1
NX N0
∂ X X
φ(x, t) = N xN −1 PN (t) = (N + 1)xN PN +1 (t) = (N + 1)xN PN +1 (t)
∂x
N =1 N =0 N =0
↑ car pN0 +1 (t) = 0 ! (5.69)
N0
∂ X
x φ(x, t) = N xN PN (t) .
∂x
N =0
On a donc fait apparaı̂tre les trois termes de l’équation (5.67), ce qui conduit donc à une équation aux
dérivées partielles pour φ
∂ ∂
φ(x, t) = κ(1 − x) φ(x, t) . (5.70)
∂t ∂x
La méthode systématique de résolution fait appel à la “transformation de Laplace”, qui sera étudiée au chapitre
9. Contentons-nous d’observer que toute fonction de la forme φ(x, t) = G((1 − x)ψ(t)), avec G une fonction
arbitraire, est solution de (5.70) à condition que ψ̇(t) = −κψ(t), soit ψ(t) = ae−κt , a une constante quelconque.
La fonction jusque là arbitraire G est fixée par la condition initiale φ(x, 0) = xN0 = G(a(1 − x)), soit G(ax) =
(1 − x)N0 , et finalement la solution unique de (5.70) complétée par cette condition initiale est
N0 N0
φ(x, t) = 1 − (1 − x)e−κt = (1 − e−κt ) + xe−κt (5.71)
N0
X
N N −N κt
= CN 0
x e (1 − e−κt )N0 −N (5.72)
N =0
qui permet d’identifier

N −N κt
PN (t) = CN0
e (1 − e−κt )N0 −N .
On voit apparaı̂tre la loi binomiale B(N0 , p(t)) pour une probabilité p(t) = e−κt ! On peut alors calculer
l’espérance de la variable aléatoire N
N0
X ∂φ(x, t)
h N i(t) = N PN (t) = = N0 e−κt .
∂x

x=1
N =0
On retrouve bien le résultat obtenu plus haut à partir de l’équation différentielle (5.64), qui s’appliquait donc
en fait à h N i.
Si N0 est très grand et p = e−κt petit, on peut remplacer la loi binomiale B(N0 , p(t)) par sa limite poisson-
nienne P(λ = N0 e−κt ), dont l’espérance est encore h N i(t) = λ = N0 e−κt .
On pourrait aussi étudier maintenant ce que sont les fluctuations de la v.a. N autour de cette valeur
moyenne.

5.5 Théorèmes limites

5.5.1 Convergence presque sûrement, convergence en probabilité,
convergence en loi
Considérons d’abord une suite infinie Xn de v.a. réelles, n = 1, 2, · · · , définies sur le même
espace d’épreuves Ω. On peut définir plusieurs types de convergence de ces v.a.
– On dira que la suite Xn converge presque sûrement vers la v.a. X définie sur Ω s’il existe
un Ω0 ⊂ Ω de mesure nulle : P(Ω0 ) = 0 tel que ∀ω ∈ / Ω0 , Xn (ω) converge vers X(ω).
∀ω ∈
/ Ω0 ∀ ∃N : ∀n > N |Xn (ω) − X(ω)| < . (5.73)
– On dira que la suite Xn converge en probabilité vers la v.a. réelle X si pour tout h,
P(|Xn − X| > h) → 0 :
∀h > 0, ∀ > 0, ∃N : ∀n > N ∀ω ∈ Ω P(|Xn (ω) − X| > h) < . (5.74)
– Enfin on dira que la suite Xn converge en loi vers X si la suite des fonctions de répartition
Fn converge (simplement) vers celle, notée F , de X (en tout point de continuité de F )
pour presque tout x , ∀ > 0, ∃N : ∀n > N |P(Xn ≤ x) − P(X ≤ x)| < . (5.75)
On démontre la
Proposition 5.3 : CV ps ⇒ CV p ⇒ CV l .
• Moyenne arithmétique de N v.a.
Soient X1 , X2 , · · · , XN N v.a. réelles indépendantes et distribuées selon la même loi de pro-

babilité. (Elles ont donc en particulier même valeur moyenne h Xi i = m et même variance
varXi = σ 2 , si cette moyenne et cette variance existent). Ce peut être par exemple le résultat
de N lancers successifs d’un même dé (qu’il soit “honnête” ou pipé), la taille de N individus
choisis au hasard dans une population homogène, N mesures répétées d’une quantité physique
entachées d’erreurs, etc. On définit alors une nouvelle v.a., leur moyenne arithmétique,
1
Y = (X1 + X2 + · · · + XN ) . (5.76)
N
Bien distinguer cette moyenne arithmétique Y des Xi , qui est une v.a., de leur valeur moyenne
h Xi i, qui est un nombre réel.
On se propose d’étudier la loi que suit Y dans la limite où N est grand.

§ 5.5. Théorèmes limites 101
De façon qualitative (nous allons préciser les hypothèses et démontrer précisément les choses
ci-dessous)
– la loi des grands nombres nous dit que la v.a. Y converge en probabilité quand N → ∞ vers
la valeur commune des h Xi i ;
– le théorème limite central affirme que la v.a. Y converge en loi vers une v.a. normale (gaus-
sienne) de moyenne h X i et de variance N1 var(Xi ) dans la limite N → ∞.
5.5.2 Loi des grands nombres

Le théorème et sa preuve
Théorème 5.4 : Soient X1 , X2 , · · · XN une suite de v.a. indépendantes et de même loi. On

suppose que la valeur moyenne m est bien définie. Alors la moyenne arithmétique Y de (5.76)
converge en probabilité vers sa valeur moyenne m quand N → ∞.
Preuve : Pour simplifier la preuve, on va faire l’hypothèse supplémentaire que la variance

2
σ commune des Xi existe aussi. Par l’hypothèse que les Xi sont indépendantes et ont même
loi, donc même valeur moyenne (ou espérance) h Xi i = m, on a d’abord
N
1 X
hY i = h Xi i = m .
N i=1
Calculons alors la variance de Y
D 1 X N 2 E
2
varY = h (Y − m) i = (Xi − m)
N i=1
1
X 2
2 X
= (X i − m) + h (Xi − m)(Xj − m) i
N2 i N 2 i<j
1
X 2
2 X
= (X i − m) + h (Xi − m) ih (Xj − m) i (indépendance)
N2 i N 2 i<j
1
X 2 1
= 2 N σ2

= 2
(X i − m) puisque h (Xi − m) i = 0 (5.77)
N i
N
1 2 1
donc var Y =
σ = varX (5.78)
N N
On est maintenant en mesure d’appliquer l’inégalité de Tchebychev ((5.8), avec k = 2) à la
v.a. Y − m
h (Y − m)2 i σ2
P(|Y − m| > h) ≤ = . (5.79)
h2 N h2
Quel que soit h > 0, la probabilité P(|Y − m| > h) tend vers zéro quand N → ∞, CQFD.
Sous des hypothèses plus fortes, (par exemple existence du 4ème moment), on peut démontrer (Kolmogorov)
la CV ps de Y vers m : c’est la “loi forte des grands nombres”.

Deux illustrations
1. Évaluation empirique de la probabilité ou de la moyenne h X i

La loi des grands nombres nous permet de justifier a posteriori la définition “intuitive” d’une
probabilité d’un événement comme une fréquence d’occurrence de cet événement. Soit A un
événement aléatoire se réalisant avec la probabilité p, associons lui une v.a. X prenant la
valeur X = 1 si A se réalise, X = 0 sinon. Donc P(X = 1) = p, P(X = 0) = 1 − p,
h X i = 1 · p + 0 · (1 − p) = p. Effectuons un grand nombre d’épreuves Xi , i = 1, · · · , N et
considérons leur moyenne arithmétique Y = N1 (X1 + X2 + · · · + XN ). Cette v.a. est la fréquence
de réalisation de A dans nos N épreuves. La loi des grands nombres nous dit que Y tend en
probabilité vers h X i = p et elle fournit donc une estimation de cette probabilité.
C’est bien de cette façon que nous nous assurons qu’un dé est “honnête” : chacun des
6 nombres vient avec une fréquence ≈ 61 dans une série d’un grand nombre de lancers. La
même méthode permet d’estimer la (valeur) moyenne d’une v.a. X, en “mesurant” la moyenne
(arithmétique) d’un échantillon de taille N suffisamment grande.
Les sondages d’opinion procèdent de manière analogue. Pour savoir quel pourcentage de
la population aime les savonnettes Truc, ou a une opinion favorable de M. X, etc, c’est-à-dire
quelle est la probabilité qu’un individu tiré au hasard ait telle ou telle opinion, on prend un
échantillon de taille N et on mesure l’opinion moyenne de cet échantillon. Noter que (5.77) nous
enseigne que l’écart-type de Y (c’est-à-dire la largeur de la distribution des Y ) décroı̂t comme
1 1
N − 2 : la précision d’un sondage est donc d’ordre N − 2 , c’est-à-dire que pour gagner un facteur
10 sur l’incertitude, il faut multiplier la taille de l’échantillon par 100 !
Grâce à l’inégalité de Tchebychev (5.79), on peut même estimer la taille de l’échantillon
nécessaire pour obtenir une précision donnée. Quelle doit être cette taille N (ou le nombre
d’épreuves ou de mesures dans les exemples précédents) pour que la probabilité que Y fournisse
la valeur de m = h X i avec une erreur relative de moins de 1% soit de 95%, autrement dit pour
2 4 σ 2 σ 2
que P(|Y − m| > 0,01m) < 0,05 ? Il suffit que Nσh2 = 10N m

< 0,05, soit N > 200 000 m .
σ
On a déjà noté que la quantité “sans dimension” m est la bonne façon de mesurer l’étalement
de la distribution d’une v.a. On voit que c’est elle encore qui donne la taille de l’échantillon
requise pour atteindre une précision donnée.
2. Évaluation Monte-Carlo d’une intégrale.
Supposons les v.a. X1 , · · · , XN uniformément distribuées entre 0 et 1, (donc avec une densité
de probabilité f (x) = 1). Soit g(x) une fonction (de carré intégrable), g(Xi ) est une nouvelle
v.a. dont la valeur moyenne et la variance se calculent aisément
Z 1
mg = h g(Xi ) i = g(x)dx
0

Z 1
σg2 = (g(x) − mg )2 dx . (5.80)
0
La loi (forte) des grands nombres nous dit que la moyenne arithmétique des g(Xi )
1
(g(X1 ) + · · · + g(XN ))
N
R1
converge (p.s) vers la valeur moyenne mg = h g(X) i = 0 g(x)dx et que l’écart-type de la
1
différence est σg = σ/N 2 . Cela signifie qu’on a une approximation
Z 1
1
(g(x1 ) + · · · + g(xN )) ≈ g(x)dx (5.81)
N 0
dans laquelle les xi sont des valeurs tirées de tables de nombres aléatoires uniformément dis-
1
tribués entre 0 et 1 ; la précision de cette approximation se comporte en N − 2 .
1
Cette méthode de calcul est appelée méthode de Monte-Carlo. La convergence en N − 2 n’est
pas très rapide et nécessite beaucoup de points. La méthode prend toute son importance pour
des intégrales multiples et est très utilisée. On peut lui apporter toutes sortes d’améliorations
et de raffinements. . .
5.5.3 Théorème limite central

On a vu au chapitre précédent que la limite quand N 1 d’une loi binomiale au voisinage de
son maximum est une loi normale. Or cette loi binomiale décrit la distribution des événements
quand on répète N fois une épreuve dont la probabilité de succès est p. Le théorème limite
central, appelé encore (incorrectement) “théorème de la limite centrale”, généralise ce résultat.
• Énoncé et remarques
Théorème 5.5 : Soient N v.a. X1 , · · · , XN indépendantes et de même loi, dont la valeur

moyenne m et la variance σ 2 existent (c’est-à-dire sont finies). Leur moyenne arithmétique Y ,
définie en (5.76), est une v.a. dont la loi f˜ tend quand N → ∞ vers une loi normale de moyenne
m et de variance σ 2 /N (convergence en loi)
(N ) 1 (y − m)2
f˜(y) ≈ fG (y) = √ exp − 2 . (5.82)
2π √σN 2 √σ N
Les hypothèses excluent donc une loi lorentzienne f (x) = π(x2λ+λ2 ) dont la valeur moyenne
et la variance n’existent pas, cf supra.
(N )
Il faut d’abord noter que la fonction gaussienne fG qui apparaı̂t au second membre
de (5.82) est de plus en plus “piquée” quand N → ∞ : en effet elle est bien normalisée,

R∞ (N ) 2
−∞
dyfG (y) = 1, sa variance est de plus en plus petite σN 2
= σN et son maximum de plus en
(N )
√ (N )
plus grand fG (m) ∝ N . Le graphe de fG est donc un pic de plus en plus haut et de plus
en plus étroit au dessus de la valeur y = m, mais toujours d’aire 1. On a vu au chap. 3 que la
(N ) (N )
suite des fonctions fG tend vers la distribution δm : fG (y) → δ(y − m).
On voit alors que le théorème central limite implique la loi des grands nombres : la loi de
la moyenne Y est de plus en plus concentrée en Y = m, autrement dit la v.a. Y converge en
probabilité vers la valeur moyenne m des v.a. Xi .
• Éléments de preuve du théorème

La méthode de preuve est analogue à celle suivie pour la limite de la loi binomiale dans (5.55). Elle repose sur
la comparaison des fonctions caractéristiques de la v.a. Y et de la loi normale, quand N → ∞ . Puisque Y est
la somme de N v.a. indépendantes N1 Xi de même loi, sa fonction caractéristique vaut
ϕY (u) = (ϕX/N (u))N .
On sait que
iu u2 u3
eiuX/N = 1 + h X i − h X 2 i + O( 3 )

ϕX/N (u) = 2
N 2N N
u u2 2 2 u3
= 1 + im − (σ + m ) + O( 3 ) (5.83)
N 2N 2 N
et donc pour le logarithme de la fonction caractéristique de Y
u2 u3

u 2 2
ln ϕY (u) = N ln ϕX/N (u) = N ln 1 + im − (σ + m ) + O( )
N 2N 2 N3
2 3
u u u
σ 2 + O( 3 )

= N im −
N 2N 2 N
u2 2 u3
= imu − σ + O( 2 )
2N N
(N ) u3
= ln ϕGauss (u) + O( 2 ) (5.84)
N
(N ) 1 2 2
où ϕGauss (u) = eium e− 2 u σ /N est la fonction caractéristique de la loi normale de moyenne m et de variance
σ 2 /N , cf équ. (5.44). Ce calcul montre que dans la limite N → ∞, la fonction caractéristique de la moyenne
arithmétique Y des N v.a. Xi tend vers la fonction caractéristique de la loi normale attendue. Nous admettrons
que cela suffit à démontrer la convergence de la loi de Y vers la loi normale, c’est-à-dire le théorème limite
central (P. Lévy).
• Illustrations
Le résultat du théorème central limite est remarquable : quelle que soit la loi des v.a. X1 , · · · , XN ,
la loi limite de leur moyenne (5.76) est une loi normale ! La loi normale a ainsi un caractère
d’universalité. Testons numériquement ce résultat sur des lois simples : les figures qui suivent
présentent la densité de probabilité de la v.a. Y pour N v.a. X obéissant à une loi simple f ,

soit la loi uniforme, soit la loi “triangle”


4x


 si 0 ≤ x ≤ 21
f (x) = 4(1 − x) si 12 ≤ x ≤ 1 (5.85)


0

sinon
1
dont la moyenne est 12 et la variance 24 . Pour chacune de ces lois, nous calculons numériquement
la densité de Y donnée par l’expression que nous admettrons
Z
f˜(y) = N dx1 · · · dxN −1 f (x1 )f (x2 ) · · · f (xN −1 )f (N y − x1 − · · · − xN −1 )
À titre d’exercice, effectuons ce calcul de f˜ pour N = 2 v.a. obéissant à une loi uniforme entre 0 et 1
Z 1
f˜(y) = 2 dx1 f (x1 )f (2y − x1 ) .
0
La première fonction f (x1 ) est non nulle (et égale à 1) ssi 0 ≤ x1 ≤ 1, la deuxième f (2y −x1 ) ssi 0 ≤ 2y −x1 ≤ 1.
Il faut prendre l’intersection des deux domaines 0 ≤ x1 ≤ 1 et 2y − 1 ≤ x1 ≤ 2y, ce qui diffère selon que y < 21
R 2y
ou y > 21 . Si 0 ≤ y ≤ 12 , 2y − 1 ≤ 0 mais 2y ≤ 1, donc f˜(y) = 2 0 dx = 4y, tandis que si 21 ≤ y ≤ 1, 2y ≥ 1 mais
R1
2y − 1 ≥ 0 donc f˜(y) = 2 2y−1 = 4(1 − y). On constate que la loi f˜ obtenue n’est autre que la “loi triangle” de
(5.85), cf figure de gauche de la Fig. 5.9.
2.0
3.0
2.0
2.5
1.5
1.5 2.0
1.0 1.5
1.0
1.0
0.5
0.5
0.5
0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0
Figure 5.9 – Distribution f˜(y) de la moyenne de N v.a. de loi uniforme, et comparaison avec la loi
1 1
normale de même moyenne m = 2 et de variance 12N (en ligne brisée). Successivement N = 2, 3, 5.
2.0
2.5
3.0
1.5 2.0 2.5
2.0
1.5
1.0
1.5
1.0
1.0
0.5
0.5
0.5
0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0
Figure 5.10 – Distribution f˜(y) de la moyenne de N v.a. de loi “triangle” (5.85), et comparaison
avec la loi normale de même moyenne m = 12 et de variance 24N
1
(en ligne brisée). Successivement
N = 1, 2, 3.

• Évaluations de l’erreur
Réexprimons le théorème en termes de la v.a.

P
Y −m Xi − N m
Z= σ = 1
N
1
2
σN 2
Elle est centrée h Z i = 0 et le théorème nous dit qu’elle obéit asymptotiquement (quand
N → ∞) à une “loi normale centrée normalisée” (de variance 1). On en déduit que
Z ∞
2 s2
P(|Z| > ζ) → √ e− 2 ds (5.86)
2π ζ
ou de façon équivalente, dans les variables de départ,

Z ∞
1X 2 s2
P(|Y − m| > ξ) = P(| (Xi − m)| > ξ) → √ e− 2 ds (5.87)
N 2π 1
ξN 2 /σ
En raison de leur importance en probabilités et en statistiques, on a donné un nom aux intégrales

gaussiennes incomplètes
Z x
2 2
erf(x) = √ dt e−t
π Z0
∞
2 2
erfc(x) = √ dt e−t = 1 − erf(x) . (5.88)
π x
Ce sont respectivement la fonction d’erreur erf et la fonction d’erreur complémentaire erfc. Le

graphe de la seconde est représenté sur la figure (5.11) et leurs valeurs sont tabulées dans la
Table 1. On peut donc récrire (5.86) et (5.87)
1
!
ζ ξN 2 /σ
P(|Z| > ζ) → erfc √ ou P(|Y − m| > ξ) → erfc √ . (5.89)
2 2
P
Avec (5.86) et (5.87) on a retrouvé la loi des grands nombres : la somme (Xi − m) est
1
approximativement normale et centrée avec un écart-type N − 2 σ. Mais les expressions (5.86)
et (5.87) permettent d’affiner l’estimation faite au paragraphe précédent de la taille d’un
échantillon nécessaire pour atteindre une précision donnée. Reprenons l’exemple du § 5.5.2 :
quel N permet
1 d’obtenir P(|Y − m| > 0,01m) < 0,05 ? D’après (5.89) il faut chercher N tel
N √m
2
√
que erfc 100 2σ
< 0,05. On lit sur la Table 1 que erfc(x) = 0,05 pour x ≈ 2, (en fait
1 1
σ σ 2
x = 1, 386), donc N 2 > N02 ≈ 200 m soit N0 ≈ 40 000( m ) . On a gagné un facteur 5 par
rapport à l’estimation plus grossière venant de l’inégalité de Tchebychev !

2.0
1.5
1.0
0.5
!3 !2 !1 1 2 3
√ √
Figure 5.11 – Graphe de la fonction erfc(x/ 2). On y voit que erfc(1, 96/ 2) ' 0, 05 (plus exacte-
ment=0,0499958 !)
x erf(x) erfc(x) x erf(x) erfc(x)

0. 0 1.000000 1.3 0.9340079 0.06599206
0.05 0.05637198 0.9436280 1.4 0.9522851 0.04771488
0.1 0.1124629 0.8875371 1.5 0.9661051 0.03389485
0.15 0.1679960 0.8320040 1.6 0.9763484 0.02365162
0.2 0.2227026 0.7772974 1.7 0.9837905 0.01620954
0.25 0.2763264 0.7236736 1.8 0.9890905 0.01090950
0.3 0.3286268 0.6713732 1.9 0.9927904 0.00720957
0.35 0.3793821 0.6206179 2. 0.9953223 0.00467773
0.4 0.4283924 0.5716076 2.1 0.9970205 0.00297947
0.45 0.4754817 0.5245183 2.2 0.9981372 0.00186285
0.5 0.5204999 0.4795001 2.3 0.9988568 0.00114318
0.55 0.5633234 0.4366766 2.4 0.9993115 0.00068851
0.6 0.6038561 0.3961439 2.5 0.9995930 0.00040695
0.65 0.6420293 0.3579707 2.6 0.9997640 0.00023603
0.7 0.6778012 0.3221988 2.7 0.9998657 0.00013433
0.75 0.7111556 0.2888444 2.8 0.9999250 0.00007501
0.8 0.7421010 0.2578990 2.9 0.9999589 0.00004110
0.85 0.7706681 0.2293319 3. 0.9999779 0.00002209
0.9 0.7969082 0.2030918 3.1 0.9999884 0.00001165
0.95 0.8208908 0.1791092 3.2 0.9999940 6.025 10−6
1. 0.8427008 0.1572992 3.3 0.9999969 3.057 10−6
1.1 0.8802051 0.1197949 3.4 0.9999985 1.522 10−6
1.2 0.9103140 0.08968602 3.5 0.9999993 7.43 10−7
Table 1. Table des valeurs des fonctions erf(x) et erfc(x)
Remarques finales
1. Comme noté plus haut, le théorème central limite ne s’applique pas à des “lois larges” comme
la loi lorentzienne, dont la moyenne ou la variance n’existent pas.

2. Le fait que des lois normales apparaissent empiriquement (et approximativement) dans de
très nombreux phénomènes naturels, taille ou poids d’individus dans une certaine population,
erreurs dans les mesures successives d’une même grandeur, etc, pourrait trouver son origine
dans le fait que le phénomène en question résulte d’un grand nombre de variables aléatoires
indépendantes et de même loi. Mais ceci explique-t-il vraiment cela ? . . .
5.5.4 Marche aléatoire.

Une large classe de phénomènes physiques est modélisée par le problème de la marche au hasard, où les pas suc-
cessifs d’un marcheur sont des v.a. indépendantes, tirées selon une certaine loi. On s’intéresse au comportement
asymptotique de telles marches, dans la limite d’un grand nombre de pas élémentaires. C’est par exemple le cas
du célèbre mouvement brownien 8 qu’accomplissent des particules en suspension dans un fluide, sous l’effet des
chocs avec les molécules de ce fluide : voir le site
http://www.phy.ntnu.edu.tw/ntnujava/index.php?topic=24 ou le site de Wikipedia “Brownian motion”
pour une très jolie simulation du phénomène ou un fac-simile de son observation par le physicien Jean Perrin.
Figure 5.12 – Observation du mouvement brownien par le physicien Jean Perrin (1908) : la position
de trois particules colloı̈dales (de diamètre 0,53 µm), est observée sous le microscope et notée toutes
les 30 secondes. Le pas de la grille est de 3,2 µm. (Source : Wikipedia)
On va d’abord s’intéresser à une version simple du problème, où la marche se fait sur une grille, un réseau
régulier.
• Marche au hasard sur un réseau

On considère un réseau carré de maille a, de vecteurs de base ~e1 et ~e2 (de norme a), voir figure 5.13 9 . Chaque site
du réseau a 4 voisins. On considère un mobile (“marcheur”) qui à chaque instant tn = nτ , n = 1, 2, 3, · · · , saute
8. du nom du botaniste Robert Brown (1773–1858) qui a le premier observé le phénomène sous le microscope
9. Toute la discussion qui suit pourrait être menée en dimension arbitraire, sur un réseau “hypercubique”
de dimension d. Nous nous restreignons à d = 2 dimensions pour la commodité de l’exposition et des dessins.

e r0
2
e1
Figure 5.13 – Marche aléatoire sur un réseau carré
du site où il se trouve vers un des 4 sites voisins. On suppose ce saut aléatoire et équidistribué : la probabilité de
sauter sur n’importe lequel des sites adjacents est égale à 1/4. Les sauts successifs sont supposés indépendants.
Soit P(r, tn |r0 , t0 ) la probabilité conditionnelle que le marcheur se trouve au point r du réseau à l’instant
tn , sachant qu’il était en r0 à l’instant t0 . On va s’intéresser à la détermination de cette probabilité et à ses
propriétés, en particulier dans la limite n 1.
On observe d’abord que cette probabilité satisfait une condition initiale
P(r, t0 |r0 , t0 ) = δr,r0 (4.90)
où δr,r0 = 1 si r = r0 , = 0 sinon, c’est un “delta de Kronecker” à deux dimensions : δr,r0 = δx,x0 δy,y0 en termes
des composantes x et y des vecteurs r et r0 . La probabilité P satisfait aussi une condition de normalisation
X
P(r, tn |r0 , t0 ) = 1 (4.91)
r
où l’on somme sur tous les sites du réseau, condition qui exprime qu’à l’instant tn , le marcheur se trouve bien
quelque part !
Moins trivial est le fait que P satisfait aussi une relation de récurrence entre les temps tn et tn+1 , qui
exprime que le marcheur ne peut être en r au temps tn+1 que s’il était au temps tn en un des points voisins sur
le réseau, r ± ~ej , j = 1, 2. Comme les événements correspondants (être en r ± ~ej à l’instant tn ) sont exclusifs,
leurs probabilités s’ajoutent et on a donc
1 X
P(r, tn+1 |r0 , t0 ) = P(r0 , tn |r0 , t0 ) (4.92)
4 0
r =r±~
ej
(Cette relation rappelle et généralise la relation de récurrence du triangle de Pascal, qui correspondrait à un
réseau à une dimension.) Cette relation de récurrence, complétée par la condition initiale, suffit en principe à
déterminer complètement la probabilité P.
Notons encore que le problème étant invariant par translation d’espace et de temps, la fonction P(r, tn |r0 , t0 )
ne dépend que des différences r−r0 et tn −t0 = nτ , et que pour des raisons dimensionnelles, elle ne peut dépendre
que des rapports a1 (r − r0 ) et tn −t
τ
0
=n
r − r 0 tn − t0
P(r, tn |r0 , t0 ) = F ( , ). (4.93)
a τ

• Processus stochastiques, propriété de Markov

La marche au hasard sur un réseau que nous venons de définir est un exemple de processus aléatoire ou processus
stochastique, c’est-à-dire d’un système dont l’évolution temporelle est probabiliste, au contraire d’un système
déterministe. La marche au hasard a de plus la propriété de Markov, ce qui signifie que l’évolution au temps t ne
dépend pas de l’histoire passée du système. (Ce ne serait pas le cas si on imposait que le marcheur ne recroise
jamais sa trajectoire passée.)
Dans notre problème de marche au hasard sur le réseau, on a aussi la propriété que si t0 > t > t0 ,
X
P((r0 , t0 |r0 , t0 ) = P((r0 , t0 |r, t)P((r, t|r0 , t0 ) (4.94)
r
qui exprime qu’entre les instants t0 et t0 le marcheur passe en un temps intermédiaire t par un point r, que
les événements correspondant à des r différents sont exclusifs et ont des probabilités qui s’ajoutent, et que les
évolutions entre les temps t0 et t et entre t et t0 étant indépendantes (processus de Markov), leurs probabilités
se multiplient.
• Limite continue et équation de la chaleur

Si on soustrait aux deux membres de l’équation (4.92) la quantité P(r, tn |r0 , t0 ), elle peut être récrite sous la
forme suivante :
1 X
P(r, tn+1 |r0 , t0 ) − P(r, tn |r0 , t0 ) = (P(r0 , tn |r0 , t0 ) − P(r, tn |r0 , t0 )) (4.95)
4 0
r =r±~ ej
X
= 41 (P(r + ~ej , tn |r0 , t0 ) + P(r − ~ej , tn |r0 , t0 ) − 2P(r, tn |r0 , t0 )) . (4.96)
j=1,2
Supposons maintenant qu’on laisse les incréments de temps et d’espace τ et a tendre vers zéro. Dans cette
limite, les coordonnées de temps et d’espace, qui étaient discrétisées, tendent vers des variables continues. On
regarde donc la limite continue du problème initial. (De façon équivalente au vu de (4.93), cette limite décrit
la situation où les séparations d’espace r − r0 ou de temps tn − t0 = nτ sont très grandes par rapport à a et
∂
τ .) Dans la limite τ → 0 et a → 0, le membre de gauche de (4.95) est approximé par τ ∂t P(r, tn |r0 , t0 ), celui de
1 2
droite par 4 a ∆P(r, tn |r0 , t0 ) où ∆ est le laplacien à 2 dimensions
∂2 ∂2
∆= + (4.97)
∂x2 ∂y 2
agissant sur les coordonnées x et y de r. Dans cette limite l’équation (4.92) devient
∂ 1
τ P = a2 ∆P (4.98)
∂t 4
qui est une équation fondamentale de la physique, décrivant les phénomènes de diffusion, (diffusion de particules
dans un milieu, de chaleur etc). Selon le contexte, cette équation est appelée équation de Fick, équation de la
chaleur, . . .
La solution de l’équation (4.98) complétée par une condition initiale qui est la version continue de (4.90),
voir plus bas, est bien connue :
r − r 2
0 t − t0 Aτ −
(r−r0 )
F , = P(r, t|r0 , t0 ) = e a2 (t−t0 )/τ (4.99)
a τ (t − t0 )

où on suppose t − t0 > 0 et où la constante A va être fixée plus bas. Exercice : vérifier que cette fonction est
bien solution de (4.98).
Dans la limite qui nous occupe où r est une variable (aléatoire) continue, il faut remplacer la probabilité
du marcheur d’être en un point donné r par une densité de probabilité,
1
p(r, tn |r0 , t0 ) = P(r, tn |r0 , t0 ) (4.100)
a2
(qui a bien la dimension d’une densité à deux dimensions). La condition de normalisation (4.91), r a2 P(r,tna2|r0 ,t0 ) =
P
P 2
r a p(r, tn |r0 , t0 ) = 1 peut être considérée comme une somme de Riemann de l’intégrale de p et donne donc
dans la limite a → 0 Z
d2 r p(r, tn |r0 , t0 ) = 1 , (4.101)
qui est bien la condition de normalisation d’une densité de probabilité, comme nous l’avons vu, mais ici pour
une v.a. à deux dimensions r. Cette condition fixe la constante A = π1 , (cf les intégrales gaussiennes du § 5.4.3),
donc
(r−r )2
τ − a2 (t−t0 )/τ
p(r, tn |r0 , t0 ) = e 0 .
πa2 (t − t0 )
Le calcul jusqu’ici a supposé que les limites a → 0 et τ → 0 étaient indépendantes. Afin de se débarrasser
complètement de ces échelles “microscopiques”, on voit qu’il convient de prendre τ ∝ a2 . On choisira l’échelle
de temps de telle sorte que
1
τ = a2 (4.102)
4
1 2
(et plus généralement, en dimension d’espace d, on prendrait τ = 2d a ). L’expression finale de la densité de
probabilité p est donc
1 (r−r0 )2
−
p(r, tn |r0 , t0 ) = e 4(t−t0 ) , (pour t > t0 ) (4.103)
4π(t − t0 )
(et plus généralement, en dimension d’espace d, le préfacteur serait (4π(t − t0 ))d/2 ).

La condition initiale satisfaite par cette solution est obtenue en prenant la limite tn − t0 → 0. Cette limite
est une distribution delta de Dirac, cf § 3.4.2. On écrit donc
lim p(r, tn |r0 , t0 ) = δ(r − r0 ) = δ(x − x0 )δ(y − y0 ) (4.104)

tn −t0 →0
qui est la version continue de la condition initiale (4.90).

Notons enfin que si t0 > t > t0 , la propriété (4.94) se récrit pour p selon
Z
d2 r p(r0 , t0 |r, t)p(r, t|r0 , t0 ) = p(r0 , t0 |r0 , t0 )
comme on le vérifiera en calculant cette convolution d’intégrales gaussiennes, un calcul qui après un changement
de variables adéquat se ramène à nouveau à une intégrale d’une gaussienne.
L’apparition d’une gaussienne, c’est-à-dire d’une loi normale pour p, comme solution de notre marche au
hasard ne doit pas surprendre : elle découle du théorème limite central, la trajectoire de r0 à r résultant de
l’addition d’un grand nombre n = (t − t0 )/τ de pas élémentaires (qui sont des v.a. indépendantes et de même
loi).

• Lois d’échelle dans la marche au hasard

Une propriété très remarquable de la solution (4.103) est son invariance par le changement simultané
r − r0 → λ(r − r0 ) ; t − t0 → λ2 (t − t0 )
p(r, tn |r0 , t0 ) → λ−2 p(r, tn |r0 , t0 )
p(r, tn |r0 , t0 )d2 r → p(r, tn |r0 , t0 )d2 r (4.105)
où nous avons souligné que par cette dilatation, la densité de probabilité p est multipliée par un facteur λ−2 ,
tandis que la probabilité p d2 r que r soit dans un petit domaine au voisinage de r est invariante. Cette propriété
qui relie les dilatations de l’espace et du temps apparaissait déjà dans la relation (4.102) entre les échelles
microscopiques a et τ .
1
Une conséquence de cette invariance est que l’écart-type de la loi (4.103), h (r−r0 )2 i 2 , qui décrit l’étalement
de la distribution, c’est-à-dire le rayon typique R de la région couverte par le marcheur dans sa marche au hasard,
croı̂t comme
1 1
R = h (r − r0 )2 i 2 ∼ |t − t0 | 2 . (4.106)
Inversement la relation |t − t0 | ∼ R2 est interprétée en disant que la marche au hasard a une dimension
fractale, (plus précisément une dimension de Hausdorff), égale à 2 : si le marcheur déroule une bobine de fil
(fil d’Ariane ?) le long de sa trajectoire, à un taux constant par unité de temps, il aura consommé une quantité
∝ R2 de fil quand il se sera éloigné de R de son point de départ. . .
Cette invariance de dilatation (4.105) est un exemple de ce que l’on appelle une loi d’échelle et le nombre
ν = 21 qui apparaı̂t dans la puissance de (t − t0 ) dans (4.106) est un exemple d’exposant critique. Il est tout à
fait remarquable que cet exposant soit indépendant du détail de la marche au hasard : pas discrets égaux à ±
les vecteurs de base du réseau, ou mouvement brownien avec des pas de longueur arbitraire, etc. Il ne dépend
pas non plus de la dimension de l’espace où s’effectue cette marche. La raison étant une fois encore le théorème
limite central et l’universalité de la loi gaussienne qui en découle. En revanche, cet exposant serait modifié si on
imposait que le marcheur ne recoupe jamais sa trajectoire passée. . .
L’étude de systèmes ayant un comportement d’échelle et des exposants critiques est un thème majeur de la
physique contemporaine, qui s’applique par exemple au comportement d’un ferromagnétique au point de Curie,
mais cela est une autre histoire !

Figure 5.14 – Deux marches aléatoires sur réseau, vues à des échelles différentes. Sur la première, où
on distingue bien les pas sur le réseau discret, on constate que le mouvement ne s’étale pas beaucoup,
le marcheur revenant souvent sur ses pas. Cela est encore plus visible sur la seconde, où apparaı̂t
aussi une propriété remarquable du mouvement brownien continu, son invariance d’échelle (propriétés
fractales) : le grossissement d’une petite partie de la “courbe” est de même nature que la courbe
originale.


Chapitre 6
Séries entières. Fonctions analytiques
Ce chapitre est le premier d’une série qui va porter sur différents aspects des fonctions d’une
variable complexe. On va s’intéresser d’abord à des séries k ak z k d’une variable complexe z.
P
Sauf mention du contraire, ces sommes seront supposées commencer à k = 0.
6.1 Séries entières
6.1.1 Séries formelles

En préambule, mentionnons d’abord que l’on peut s’intéresser aux objets algébriques S(X) =
n
P
n an X et aux opérations que l’on peut effectuer sur eux, sans se soucier de la nature de la
variable X ni de la convergence de la somme. C’est ce qu’on appelle une série formelle. Ces
séries (avec les coefficients an appartenant à un corps K de nombres, typiquement R ou C)
forment une algèbre notée K[[X]] : on peut les ajouter, les multiplier par un nombre de K, les
multiplier entre elles selon les règles familières. On peut aussi prendre l’inverse de toute série
ayant a0 6= 0 : l’inverse de S(X) = n an X n (a0 6= 0) est la série formelle T (X) = n bn X n
P P
t.q. S(X).T (X) = 1. On peut composer deux séries S(X) = n an X n et T (Y ) = n bn Y n

P P
en considérant que Y = S(X), à condition que a0 = 0 : on obtient une nouvelle série formelle
T ◦ S(X). Sous les hypothèses a0 = 0, a1 6= 0 sur S, on peut aussi définir la série réciproque T
de S (c’est-à-dire inverse pour la composition) : T ◦ S = I (la fonction identité I : x 7→ x).
L’intérêt de ces séries formelles est qu’elles dissocient les questions de convergence de ces
manipulations algébriques. C’est par exemple intéressant dans des applications à des problèmes
de combinatoire, où on définit des “fonctions génératrices”. Si on a une collection de nombres
an indexés par un entier n, il est souvent utile de considérer la fonction génératrice des an ,
définie comme la série formelle n an X n .
P

116 Chap.6. Séries entières. Fonctions analytiques
Exemple. Le nombre de partitions Pn d’un entier n est le nombre de façons de l’écrire comme
somme non ordonnée n = p1 .1 + p2 .2 + · · · + pn .n, pi ≥ 0. Par exemple P5 = 7 (vérifier). Montrer
que la fonction génératrice des Pn est donnée par la formule d’Euler
∞
X 1
Pn X n = Q ∞ m
. (6.1)
n=0 m=1 (1 − X )
Or on peut √montrer (Hardy et Ramanujan, voir aussi plus bas la méthode du col) qu’asymptotiquement
2n
Pn ∼ 4n1√3 eπ 3 , une croissance beaucoup trop rapide pour que la série converge, pour quelque valeur de X
que ce soit. On dira dans la suite que la série a un rayon de convergence nul. La série est et reste une série
formelle. Mais telles quelles, ces fonctions génératrices séries formelles sont très utiles.
Q∞
Exemple : En factorisant le produit m=1 (1 − X m ) en deux produits sur les m pairs et impairs, démontrer
Q∞ Q∞
l’identité entre séries formelles (en fait produits formels . . .) m=1 (1 − X 2m−1 ) m=1 (1 + X m ) = 1. En déduire,
en écrivant leurs fonctions génératrices, que les nombres de partitions d’un entier en nombres impairs ou en
nombres distincts sont égaux. Par exemple pour n = 5, Pdistincts (5) = 3 : {5}, {4, 1}, {3, 2, 1} et Pimpairs (5) =
3 : {1, 1, 1, 1, 1}, {3, 1, 1}, {5}. Pour le physicien, les nombres de partitions en nombres distincts sont reliées au
comptage d’états fermioniques d’énergie donnée, dans un potentiel harmonique. . .
6.1.2 Rayon de convergence

ak z k où les ak ∈ C.
P
On considère la série entière k
Définition 6.1 : Le rayon de convergence de la série k ak z k est le nombre R réel positif ou

P
nul, (éventuellement infini), défini par

déf
X
R = sup{t ∈ R+ tel que |an |tn est borné} . (6.2)
n
(L’ensemble de ces t n’est pas vide puisqu’il contient au moins 0, donc son sup est bien défini
1
dans R.) Par exemple, si la suite |an | n a une limite `, alors R = `−1 .
Mais plus généralement, on va montrer que (formule d’Hadamard)
1
= lim |an |1/n (6.3)
R n→∞
où la limite supérieure d’une suite a été définie à l’Appendice 1.3.5,
lim un = lim (sup un ) .

n→∞ k→∞ n≥k
La preuve de (6.3) repose sur la “règle de Cauchy” (comparaison avec une série géométrique) : soit une suite
1/n P 1/n P
bn > 0 ; si limn→∞ bn < 1, n bn < +∞, et si limn→∞ bn > 1, n bn = +∞ (vérifier en utilisant (A.6) ).
On applique cela à bn = |an |rn et on en conclut que |an |rn converge pour r−1 > limn→∞ |an |1/n , et diverge
P
−1 1/n
si r < limn→∞ |an | ce qui, compte tenu de la définition (6.2) établit (6.3).
On appellera disque de convergence le domaine ouvert |z| < R, appellation justifiée par le
théorème fondamental

§ 6.1. Séries entières 117
Théorème 6.1 : La série entière k ak z k converge normalement et uniformément dans tout

P
disque |z| ≤ r intérieur au disque de convergence (0 < r < R) ; elle converge absolument pour
tout z dans le disque de convergence |z| < R et diverge pour tout z hors de ce disque, |z| > R ;
sur le bord du disque, |z| = R, la série peut être convergente ou divergente.
(Pour les définitions des différents types de convergence, se reporter à la Définition 1.7.) Si
R = 0, la série ne converge que pour z = 0. Si R = ∞, elle converge dans tout le plan.
||ak z k || = |ak |rk < ∞
P P
La convergence normale est claire : pour la norme du sup, si |z| ≤ r < R,
par définition du rayon de convergence ; et les CVU et CVA découlent du Théorème 1.8. Bien noter que la
convergence normale et la convergence uniforme ne sont établies que dans tout disque plus petit que le disque
de convergence.
Exemples.
zn
– 1. La série n!
est convergente dans tout le plan, puisque ` = 0, donc R = ∞.
1 |z|n mm |z|
n
Rappelons l’argument : pour tout entier m supérieur à |z|, on a |z n /n!| = m! (m+1)···n < m! mn dès que
1
mm n
n > m d’où |z n /n!| n < |z|
1
m m! qui tend vers |z|/m < 1. cqfd
– 2. A l’inverse, z n n! est telle que ` = ∞, R = 0, donc la série ne converge qu’en 0.
n
– 3. zr , r 6= 0. On a ` = 1/r, donc un rayon de convergence R = r. Sur le cercle de
convergence, pour |z| = r, la série ne converge en aucun point (puisque le terme d’ordre
n ne s’annule pas).
n
– 4. zn , R = 1, la série converge pour tout z, |z| < 1, elle diverge pour |z| > 1 ; pour
z = 1 elle est divergente ; pour z = −1, elle est semi-convergente (convergente mais pas
absolument convergente) en tant que série alternée, et plus généralement elle converge
(mais pas absolument) sur tout le bord du disque sauf en z = 1. On reconnaı̂t la série de
− log(1 − z).
n
– 5. zn2 , R = 1. Sur tout le bord du disque de convergence, y compris z = ±1, convergence
absolue.
– 6. nz n , R = 1, la série diverge sur tout le bord du disque.
Il ressort de cette série d’exemples que le comportement sur le bord du disque est une question
délicate à étudier avec soin.
On peut additionner, multiplier ou inverser des séries entières de rayon de convergence non nul et on obtient
an z n il faut supposer que a0 6= 0.)
P
une autre série entière de rayon de convergence non nul. (Pour l’inverse de
On peut aussi composer la série T (ζ) = n=0 bn ζ n par S(z) = k=1 ak z k , 1 c’est-à-dire construire T (S(z)) qui
P P
est de rayon de convergence non nul si S et T le sont. En particulier si a1 6= 0 la série réciproque U de la série
S(z), telle que U (S(z)) = z, existe et a un rayon de convergence non nul.
1. bien noter que la sommation sur k démarre à 1 !

6.1.3 Continuité, intégrabilité et dérivabilité de la somme

Une série entière convergeant uniformément dans tout disque fermé contenu dans son
disque de convergence, on peut lui appliquer les théorèmes de continuité, de dérivabilité et
d’intégrabilité énoncés au chapitre 1, en se restreignant d’abord à une variable réelle : pour x
réel et r < R, (inégalité stricte !), sur le segment −r ≤ x ≤ r, la somme S(x) de la série an xn
P
P an n+1
an xn , la série entière
P
est continue. En intégrant terme à terme la série n+1
x converge
Rx 0 0
nan xn−1 , est
P
pour |x| < R vers l’intégrale 0 S(x )dx . Enfin la série dérivée terme à terme,
convergente pour |x| < R et a pour somme S 0 (x). En fait on démontre que ces séries dérivée et
intégrée ont le même rayon de convergence que la série initiale. (Exercice : le vérifier.)
Exemple. En intégrant terme à terme entre 0 et x la série géométrique ∞ n n
P
n=0 (−1) x qui
converge vers 1/(1 + x) pour x ∈] − 1, 1[, on obtient
∞
X xn
ln(1 + x) = (−1)n−1 (6.4)
n=1
n
qui converge pour |x| < 1. Pour x = 1, la série converge encore, et on a 1 − 12 + 13 − · · · = ln 2.

On peut en fait étendre cette dérivation à la série de la variable complexe z. On y reviendra
au chapitre suivant. Si S(z) = ∞ n
P
n=0 an z est la somme d’une série de rayon R, la dérivée de S
par rapport à la variable z
S(z + h) − S(z)
S 0 (z) = lim
h∈C, h→0
h6=0
h
existe 2 et est donnée par la série dérivée

∞
X
0
S (z) = nan z n−1 (6.5)
n=1
qui converge dans le même disque de rayon R. (Preuve, voir [4], chap. I.)
Coefficients de la série entière
On peut donc dériver terme à terme une série entière à l’intérieur de son disque de conver-
gence, puis dériver à nouveau, etc. La somme de la série S(z) = an z n est donc indéfiniment
P
dérivable et ses dérivées successives en z = 0 sont données par S (n) (0) = n!an , soit an =
S (n) (0)
an z n s’identifie au développement de Taylor(–
P
n!
. Pour |z| < R, la série entière S(z) =
Maclaurin) de S(z)
0 z 2 00 z n (n)
S(z) = S(0) + zS (0) + S (0) + · · · + S (0) + · · · (6.6)
2 n!
2. Bien noter que h est un complexe quelconque tendant vers 0.

§ 6.2. Les fonctions exp et log 119
6.1.4 Vitesse de convergence

Étant donnée une série entière de rayon de convergence R 6= 0 connu, un problème pratique est celui de
la vitesse de convergence de cette série. Intuitivement, cette vitesse peut s’évaluer à nouveau par comparaison
de séries, et nous nous attendons à ce qu’une série dont le terme général an se comporte par exemple comme
an ∼ n−α converge d’autant plus vite que α est plus grand. Peut-on aller au delà de cette simple observation ?
Combien de termes de la série faut-il garder pour avoir une approximation d’ordre donné de la somme ? Y a-t-il
des moyens d’accélérer cette convergence par des procédés de resommation ? Toutes ces questions sont d’un
grand intérêt pour le physicien . . . mais nous ne pourrons pas nous y arrêter.
6.2 Les fonctions exp et log

Comme on l’a vu plus haut, la série
∞
z
X 1 n
e = z
n=0
n!
a un rayon de convergence infini. D’après (6.5)
S 0 (z) = S(z)
et on retrouve l’équation différentielle satisfaite par la fonction exponentielle.

On vérifie aussi aisément que
0 0
ez ez = ez+z , ez e−z = e0 = 1 .
ce qui implique que

∀z ∈ C ez 6= 0 . (6.7)
On peut restreindre la variable z à des valeurs réelles, retrouver les propriétés et inégalités
familières (positivité, convexité,. . .) de la fonction exponentielle réelle, définir la fonction récipro-
que log sur R+ etc etc.
On peut aussi restreindre z à des valeurs purement imaginaires, R 3 y 7→ eiy ce qui fournit un
homomorphisme 3 du groupe additif R dans le groupe multiplicatif U(1) des nombres complexes
de module 1 (que l’on peut voir aussi comme le cercle unité) :
0 0
eiy eiy = ei(y+y ) .
3. Rappelons qu’un homorphisme d’un groupe G dans un groupe H est une application ρ de G dans H qui
est compatible avec les deux structures de groupe : ∀g, g 0 ρ(g ∗ g 0 ) = ρ(g) · ρ(g 0 ) .

Le noyau de cet homomorphisme, c’est-à-dire les y qui sont appliqués sur l’élément 1 sont les
multiples de 2π : y = 2πk, k ∈ Z. Autrement dit à tout nombre u de module 1 (à tout point
du cercle unité) correspond une famille de y définis modulo 2π tels que u = eiy : ce sont les
différentes déterminations de l’argument de u.
y = arg u mod 2π .
On étend alors la fonction argument à tout le plan “pointé” à l’origine C∗ = C\{0} par
w 6= 0 arg w = arg(w/|w|) .
Logarithme complexe
Finalement intéressons-nous à la fonction réciproque de l’exponentielle (complexe). Étant

donné w ∈ C, on cherche z tel que ez = w. Il est clair par (6.7) que z n’existe que si w 6= 0 et
que si z est solution, tout z + 2πik l’est aussi. Si on note z = log w, z n’est défini que modulo
2πi. En identifiant les modules et arguments on a
ez = ex+iy = w = |w|ei arg w ⇒ x = log |w|, y = arg w mod 2π
donc
z = log w = | log w| + i arg w (6.8)
Attention : on a utilisé la même notation log pour la fonction déjà bien définie sur les réels et
pour le logarithme complexe. De plus, il faut garder à l’esprit que la partie imaginaire de ce
log w est défini à l’addition près d’un multiple entier de 2πi.
Ainsi il faut prendre garde que les identités familières du logarithme peuvent être affectées
par ces déterminations multiples, telle
log ww0 = log w + log w0 mod 2πi .
Le logarithme complexe ainsi défini est, comme la fonction arg ci-dessus, un exemple de
fonction multivaluée. Dans un domaine ouvert connexe du plan complexe, ne contenant pas O
et “simplement connexe” (heuristiquement, domaine “sans trou”, on verra plus précisément au
chapitre suivant ce qu’il faut entendre par là), le logarithme admet une détermination qui est
une fonction continue de la variable w. Et toute autre détermination en diffère par un multiple
entier de 2πi.
Par exemple, dans le domaine ouvert D : |w| > r > 0, | arg w| < π − α (r et α petits : plan
“coupé” le long de l’axe réel négatif), (6.8) fournit la détermination principale du logarithme
log w.

§ 6.3. Séries de Taylor. Fonctions analytiques 121
Développement en série du logarithme
La série entière ∞
X un
T (u) = (−1)n−1
n=1
n
a pour rayon de convergence 1 (cf supra). Elle donne la détermination principale de log(1 + u).
En effet, comme on le sait bien, cette série est la série réciproque de celle de l’exponentielle ;
donc eT (u) = 1 + u ; c’est bien la détermination principale : si |u| < 1, w = 1 + u a une partie
réelle > 0 donc appartient au domaine D ci-dessus, et en u = 0, T (u) s’annule, tout comme la
détermination principale.
6.3 Séries de Taylor. Fonctions analytiques

6.3.1 Séries de Taylor
Soit Ω un ouvert de R ou C. Soit f une fonction définie sur Ω, et z0 ∈ Ω.
Définition 6.2 : La fonction f est développable en série entière centrée en z0 s’il existe un
ouvert Ω0 ⊂ Ω contenant z0 et une suite an ∈ C tels que
∞
X
∀z ∈ Ω0 f (z) = an (z − z0 )n . (6.9)
n=0
Restreignons-nous (pour le moment) au cas réel. Soient I un ouvert de R, x0 ∈ I, f une

fonction de I dans C développable en série entière centrée en x0 , f (x) = ∞ n
P
n=0 an (x − x0 ) ,
de rayon de convergence R. Comme on l’a vu plus haut en (6.6), la fonction est de classe C ∞
(infiniment dérivable) dans l’ouvert ]x0 − R, x0 + R[, avec
∞
(k)
X n!
∀k f (x) = an (x − x0 )n−k (6.10)
n=k
(n − k)!
f (n) (x0 ) P∞ f (n) (x0 )

et donc an = n!
. On appelle la série n=0 n!
(x − x0 )n série de Taylor(–MacLaurin) de
f en x0 .
6.3.2 Fonctions analytiques

Soit une fonction f d’un ouvert Ω de R ou C dans C.
Définition 6.3 : La fonction f est analytique sur Ω si pour tout z0 ∈ Ω, elle admet un
développement en série entière centré en z0 .

D’après ce qui précède, si f est analytique dans Ω, elle y est indéfiniment dérivable et
ses dérivées successives y sont analytiques ; 1/f est analytique dans Ω privé des points z0 où
f (z0 ) = 0 ; si f admet une primitive dans Ω connexe (définie à une constante additive près),
cette primitive est aussi analytique.
Exemples : les polynômes de z sont analytiques dans C ; les fractions rationnelles de z sont
analytiques dans le plan privé des zéros du dénominateur. On va voir que la classe des fonctions
analytiques est bien plus vaste :
an z n de rayon de convergence R > 0 est

P
Théorème 6.2 : La somme d’une série entière
analytique en tout point z0 du disque ouvert de convergence.
Autrement dit, si n an z n est convergente dans le disque ouvert |z| < R, la fonction f (z) =
P
n
P
n an z est analytique en tout point z0 de ce disque, donc tel que |z0 | < R. Cela est non
trivial : l’existence du développement en série entière centré en 0 n’implique pas évidemment
la même propriété en tout point du disque !
Exemple. Soit la série ∞ n
P
n=0 x . Elle converge dans le disque de rayon 1 vers la fonction
1 1
f (x) = 1−x . Pour tout x0 , −1 < x0 < 1, on peut écrire f (x) = 1−x0 −(x−x 0)
et développer
P∞ (x−x0 )n
f (x) = n=0 (1−x0 )n+1 . Quel est le domaine de convergence de ce nouveau développement ?
1 (n)
(z0 )un a un rayon de convergence R0 ≥ R − |z0 | et
P
Preuve du Théorème. Montrons que la série n n! f
que
X 1
f (z) = f (n) (z0 )(z − z0 )n pour |z − z0 | < R − |z0 | . (6.11)
n
n!
En effet si r0 = |z0 |, αn = |an |, on a

X (m + p)!
f (m) (z0 ) = am+p z0p
p
p!
X (m + p)!
|f (m) (z0 )| ≤ αm+p r0p
p
p!
Si r0 ≤ r < R,
X 1 X (m + p)!
|f (m) (z0 )|(r − r0 )m ≤ αm+p r0p (r − r0 )m
m
m! m,p
m!p!
X X n! X
≤ αn r0n−m (r − r0 )m = αn rn < ∞ ,
n
m!(n − m)! n
0≤m≤n
n!
r0n−m (r − r0 )m converge donc, ce qui justifie a posteriori
P P
La série à coefficients positifs n αn 0≤m≤n m!(n−m)!
la modification de l’ordre des termes qu’on a effectuée. Cela prouve que la série (6.11) a un rayon de convergence
R0 ≥ r − r0 , et puisque r peut être arbitrairement près de R, R0 ≥ R − r0 .
P (m+p)! p m
On considère maintenant z tel que |z − z0 | < R − r0 . La série double m,p m!p! am+p z0 (z − z0 ) étant

§ 6.3. Séries de Taylor. Fonctions analytiques 123
absolument convergente d’après ce qui précède, on peut la resommer de deux façons différentes :
X (m + p)! X X n! X
am+p z0p (z − z0 )m = an z0n−m (z − z0 )m = an z n = f (z)
m,p
m!p! n
m!(n − m)! n
0≤m≤n
X (z − z0 )m X (m + p)! X (z − z0 )m
= am+p z0p = f (m) (z0 )
m
m! p
p! m
m!
P (z−z0 )m (m)
d’où f (z) = m m! f (z0 ) q.e.d.
Remarques.
1. Le rayon R0 de convergence de la série (6.11) peut être plus grand que R − r0 . Exemple,
1
considérer la série f (z) = n (iz)n = 1−iz
P
de rayon R = 1 et en étudier le développement en un
p
point réel x0 < 1. Montrer que le nouveau rayon de convergence est R0 = 1 + x20 > 1 − |x0 |.
2. Pour une fonction de variable réelle, l’hypothèse d’analyticité est plus forte que celle de
2
différentiabilité C ∞ . Ainsi, soit la fonction f (x) = e−1/x pour x 6= 0, f (0) = 0. La fonction
est C ∞ , toutes ses dérivées s’annulent en 0, et la série de Taylor est donc convergente, mais
sa somme est nulle donc ne converge pas vers f : la fonction n’est pas analytique ! L’origine
du problème est que, au voisinage de 0, (dans les directions imaginaires) la fonction et ses
2
dérivées croissent très vite (comme e1/|x| ). . . Il existe des conditions (nécessaires et/ou suffi-
santes) d’analyticité d’une fonction f de classe C ∞ , typiquement des conditions majorant la
croissance des dérivées f (n) au voisinage du point considéré ([4], chap. 1).
6.3.3 Prolongement analytique

Problème : Étant donnée une fonction f analytique dans Ω, ouvert connexe, et Ω0 ⊃ Ω un
ouvert connexe contenant Ω, existe-t-il une fonction g analytique dans Ω0 telle que g = f sur
Ω?
Si c’est le cas, on dit que g est un prolongement analytique de f à Ω0 . Exemple : la fonction
f (z) = n z n = (1 − z)−1 est analytique dans |z| < 1. Elle admet donc un développement en
P
série autour de tout point du disque Ω : |z| < 1, par exemple z0 = 12 + 3i4 (voir figure 6.1) et ce
q √
développement a un rayon donné par la distance de z0 au point 1, soit r0 = 14 + 16 9
= 413 : soit
D le disque de centre z0 et de rayon r0 . La fonction est analytique en tout point de Ω0 = Ω ∪ D.
Ce nouveau domaine Ω0 déborde largement les limites de Ω : on a donc bien prolongé f au
delà du disque initial. On pourrait itérer cette opération et de proche en proche, prolonger
analytiquement f au plan privé du point 1.
Un théorème nous garantit l’unicité de ce prolongement, s’il existe :
Théorème 6.3 : Soit f une fonction analytique dans un ouvert connexe Ω et soit z0 ∈ Ω. Les
trois conditions suivantes sont équivalentes

1. ∀n ≥ 0 f (n) (z0 ) = 0 ;
2. f ≡ 0 dans un voisinage de z0 ;
3. f ≡ 0 dans Ω.
Rappelons la définition d’un ensemble connexe E : tout sous-ensemble X de E à la fois ouvert

et fermé est E lui-même ou ∅.
Preuve. Il est clair que 3. ⇒ 1. Par ailleurs 1. ⇒ 2. selon (6.11) et 2. ⇒ 1. est évident. Enfin pour établir
2. ⇒ 3., considérons l’ensemble Ω0 des points z 0 de Ω au voisinage desquels f ≡ 0 ; Ω0 est non vide (par 2.), et
ouvert (par définition). Pour démontrer qu’il est aussi fermé, considérons un point z1 ∈ Ω0 de son adhérence
(déf. § 1.2.1) ; il existe des points z 0 de Ω0 arbitrairement proches de z1 et pour lesquels donc f (n) (z 0 ) = 0 pour
tout n (en appliquant 2. ⇒ 1. à z 0 ), et par continuité des f (n) , il en découle que f (n) (z1 ) = 0, et (par 1. ⇒ 2.
appliqué à z1 ) f ≡ 0 au voisinage de z1 , donc z1 ∈ Ω0 qui est bien fermé. Ω étant connexe, on a Ω0 = Ω q.e.d.
z0
0 1
n
P
Figure 6.1 – Prolongement analytique de la somme de la série nz au delà de son disque de
convergence.
Corollaire : Si deux fonctions f et g analytiques dans un ouvert connexe Ω coı̈ncident au

voisinage d’un point de Ω, elles sont identiques sur Ω.
Exemples et contre-exemple de prolongement analytique

Considérons la série f (z) = ∞ n
P
n=0 z , convergente et analytique pour |z| < 1 et la fonction
1
g(z) = 1−z définie et analytique dans le plan pointé C\{1}. Elles coı̈ncident dans le disque
|z| < 1 et g définit donc le prolongement analytique de f au plan pointé.
Considérons ensuite le développement en série de P la fonction logarithme. On peut effectuer ce
développement autour du point 1, f0 (z) = log z = ∞ n−1 n
n=1 (−1) P(z −1) /n, qui converge dans le
∞
disque D0 = |z −1| < 1, ou autour du point e , f1 (z) = 4 + n=1 (−1)n−1 e−inπ/4 (z −eiπ/4 )n /n
iπ/4 iπ
qui converge dans le disque D1 = |z − eiπ/4 | < 1, etc. Ces deux fonctions coı̈ncident au voisinage
de z0 = iπ8 (vérifier !) donc dans tout D0 ∩D1 selon la Proposition précédente. f1 est donc l’unique
prolongement de log z au domaine D1 . On pourrait itérer et définir de proche en proche les
prolongements fk dans les disques Dk : |z − eikπ/4 | < 1. Mais attention ! rien ne nous dit que

§ 6.4. Lacunes de ce chapitre. . . 125
le prolongement au domaine D8 autour de ei2π = 1 coı̈ncide avec la fonction f0 = log de départ.

En fait comme on sait f8 définit une autre détermination de la fonction log, différant de f0 par
2πi.
À l’inverse, le prolongement analytique d’une fonction somme d’une série entière n’est pas toujours possible.
déf P∞ n
Considérons par exemple la fonction f (z) = n=1 z 2 . Elle converge pour |z| < 1, diverge pour tout z, |z| > 1
et aussi pour z = 1, point où elle a une “singularité” 4 . En fait on démontre aisément (cf Exercice) qu’elle a une
singularité pour toute racine 2p -ième de l’unité. Ces racines étant denses sur le cercle unité |z| = 1, ce cercle
constitue une frontière essentielle de la fonction, au delà de laquelle un prolongement analytique est impossible.
On conçoit qu’en général, un prolongement analytique n’est possible que s’il est possible de “se glisser entre les
singularités”. . .
Applications physiques
A côté des applications mathématiques, le prolongement analytique d’une fonction peut aussi être utile en
physique.
Exemple : les notions d’impédance Z et de son inverse Y , l’admittance, qui décrivent la réponse d’un circuit
électrique à une excitation, sont familières : il s’agit de fonctions (complexes) de la variable réelle de fréquence
(“angulaire”) ω. Il se trouve que le prolongement de Z(ω) et de Y (ω) à des valeurs complexes de ω est possible,
en faisant appel à la causalité, et qu’il contient une information utile. On verra au chapitre 8 d’autres exemples
de ce cas (relations de dispersion).
D’autres exemples concernent le prolongement de quantités physiques définies pour une variable entière à des
valeurs réelles ou complexes arbitraires : c’est le cas du moment cinétique J qui en mécanique quantique prend
des valeurs quantifiées, multiples entières ou demi-entières de ~, mais qui sous des hypothèses adéquates sur le
potentiel de diffusion, peut être prolongé dans le plan complexe (Regge) ; là encore, les propriétés d’analyticité
dans la variable J peuvent être riches d’informations . . . C’est encore le cas avec d’autres nombres au départ
entiers –nombre Q d’états dans le modèle de Potts de la mécanique statistique ; dimension d’espace-temps
prolongée à partir de d = 4 en mécanique statistique et théorie des champs, etc.
6.4 Lacunes de ce chapitre. . .
6.4.1 Séries divergentes. Séries asymptotiques

Il conviendrait de discuter aussi le cas des “séries asymptotiques”, qui sont divergentes et qui apparaissent
par exemple en mécanique céleste, ou dans les développements “perturbatifs” de mécanique quantique ou de
théorie quantique des champs. On se bornera à dire ici qu’une série de rayon de convergence nul peut néanmoins
contenir une information utile . . . et utilisable avec des outils de “resommation” adéquats et mathématiquement
justifiés.
4. On donnera au chapitre 7 un sens précis à ce terme. Contentons-nous pour le moment de la définition

ak z k est un point où la série diverge.
P
suivante : une singularité d’une fonction définie par une série

6.4.2 Produits infinis

z
Q
Il conviendrait aussi d’étudier comment on peut donner un sens aux produits infinis n≥1 (1 − an ). Parmi
toutes les belles formules que l’on peut démontrer, n’en citons qu’une
∞
z2
Y
sin πz = πz 1− . (6.12)
n=1
n2
Exercices
1. Considérer la série
∞ k
X 1 4 2 1 1
S= − − − (6.13)
k=0
16 8k + 1 8k + 4 8k + 5 8k + 6
Quel est le comportement asymptotique du terme général ? La convergence est-elle lente ou

rapide ?
Pour déterminer sa somme, construire la série entière
∞ 8 k
2x4 x5 x6

X x 4x
S(x) = − − − . (6.14)
k=0
16 8k + 1 8k + 4 8k + 5 8k + 6
– a) Quel est son rayon de convergence ? ;

– b) Montrer que la fonction S(x) satisfait S 0 (x) = (4 − 2x3 − x4 − x5 )/(1 − x8 /16) et
S(0) = 0 ;
déf
– c) Vérifier que la fonction ϕ(x) = −4Arctan (1 − x) + 2 ln(2 − x2 ) − 2 ln(x2 − 2x + 2)
satisfait la même équation différentielle et ϕ(0) = −π. On pourra utiliser un logiciel de
calcul formel comme Mathematica ou Maple pour vérifier les points b) et c), un peu
fastidieux à la main. . .
En conclure que S(x) = ϕ(x) + π, et en déduire la valeur de la somme S de (6.13). Tester
numériquement la convergence de la série (6.13) vers sa limite.
2. Soit I un intervalle de R et f une fonction f : I → C analytique dans I. Montrer qu’on
peut la prolonger en une fonction analytique dans un ouvert Ω ⊂ C contenant I.
3. Soit f (z) = ∞ 2n
déf P
n=1 z .
Montrer qu’elle converge dans le disque |z| < 1 et qu’elle a une singularité en z = 1.
Montrer que f satisfait les relations fonctionnelles f (z) = z 2 + f (z 2 ), et plus généralement
p p
f (z) = z 2 + z 4 + z 8 + · · · + z 2 + f (z 2 ) pour tout p entier. En déduire que f a aussi des
singularités en toute racine 2p -ième de l’unité.

Chapitre 7
Fonctions holomorphes. Théorème de

Cauchy
On va voir dans ce chapitre que la condition qu’une fonction de variable complexe est
dérivable est très contraignante. Les fonctions dérivables ou holomorphes possèdent des pro-
priétés remarquables que nous allons explorer.
7.1 Fonctions holomorphes
7.1.1 Rappel : fonctions différentiables de Rn dans Rp

Soit Ω un ouvert de Rn , a ∈ Ω et soit une fonction f : Ω → Rp . On dit que f est différentiable
en a s’il existe une application linéaire notée dfa de Rn dans Rp telle que
∀h ∈ Rn f (a + h) − f (a) − dfa (h) = o(khk) , (7.1)
où o(khk)/khk → 0 quand h → 0. dfa est appelée la différentielle (ou l’application linéaire
tangente) de f en a. Si on note xi , i = 1, · · · , n, des coordonnées dans (une base de) Rn , et si
h = (h1 , · · · , hn ) dans cette base, l’application linéaire dfa s’écrit
n
X ∂f
dfa (h) = hi (7.2)
i=1
∂xi a
∂f

et les ∂xi a
s’identifient aux dérivées partielles en a comme définies usuellement. La différentiabilité
en a implique donc l’existence des dérivées partielles en a ; l’inverse n’est pas vrai, voir ci-
dessous. (Remarque : h = (hi ) est ce que l’on appellera plus tard un vecteur tangent.)

128 Chap.7. Fonctions holomorphes. Théorème de Cauchy
On peut aussi introduire les (formes) différentielles dxi , telles que dxi (h) = hi . (Ce sont des
“formes” (linéaires) car elles sont à valeurs dans R, et elles agissent sur les vecteurs tangents,
ici h). On récrit alors (7.2) sous la forme
n
X ∂f
dfa = dxi . (7.3)
i=1
∂x i a
P
Plus généralement on aura à considérer plus bas des formes différentielles ω = i Fi (x)dxi .
Si f est différentiable en tout point de Ω et que l’application a 7→ dfa est continue, on
dit que f est continûment différentiable (ou de classe C 1 ). Si n = 1 (fonction d’une variable
réelle), la notion de différentiabilité s’identifie à celle de dérivabilité, définie par l’existence de la
dérivée. Si n > 1, cependant, cela n’est plus toujours vrai : f peut avoir des dérivées partielles
en a sans être différentiable. Considérons par exemple la fonction de R2 dans R :

y 3 /(x2 + y 2 ) si (x, y) 6= (0, 0)
f (x, y) = .
0 si (x, y) = (0, 0)
Elle est continue en (0, 0), y admet des dérivées partielles . . . mais n’est pas différentiable ! En
effet ∂x f (0, 0) = 0, ∂y f (0, 0) = 1, mais (f (h, k) − 0 − k)/k(h, k)k = −kh2 /(h2 + k 2 )3/2 ne tend
pas vers 0 indépendamment de la direction suivie.
Dans la suite de ce chapitre, on va s’intéresser à n = 2, p = 1 ou 2 (fonctions réelles ou
complexes d’une variable complexe).
7.1.2 Holomorphie. Conditions de Cauchy–Riemann

Dans ce qui suit, Ω désigne un ouvert du plan complexe C, et f : Ω → C une fonction (à
valeurs complexes) de z ∈ Ω.
Définition 7.1 : La fonction f : Ω → C est dérivable ou holomorphe en z0 ∈ Ω si
f (z) − f (z0 )
f 0 (z0 ) = lim
déf
z→z0 z − z0
existe, c’est-à-dire s’il existe un nombre complexe noté f 0 (z0 ) tel que
f (z) − f (z0 ) − f 0 (z0 )(z − z0 ) = o(|z − z0 |) . (7.4)
f est holomorphe sur Ω si elle est holomorphe en tout point de Ω.

Bien voir que l’hypothèse est que la limite existe et est indépendante de la façon dont z approche
z0 . Si on écrit z = x + iy et que l’on considère f comme une fonction f˜ des deux variables
réelles x et y, f˜(x, y) = f (x + iy), on va voir que cette condition de dérivabilité de f est plus
forte (plus contraignante) que celle de différentiabilité de f˜.

§ 7.1. Fonctions holomorphes 129
Théorème 7.1 (conditions de Cauchy–Riemann 1) : Si f : Ω → C et si f˜ : Ω ⊂ R2 → C

est la fonction de x et y correspondante, alors f est dérivable en z0 = x0 + iy0 ∈ Ω ssi
∂ f˜ ∂ f˜
f˜ est différentiable dans R2 et (x0 , y0 ) = −i (x0 , y0 ) , (7.5)
∂x ∂y
∂ f˜
et alors, f 0 (z0 ) = ∂x
(x0 , y0 ) .
Preuve. Supposons f dérivable et notons z − z0 = h + ik et c = f 0 (z0 ) : (7.4) se réexprime en termes de f˜

selon p
f˜(x0 + h, y0 + k) − f˜(x0 , y0 ) − c(h + ik) = o( h2 + k 2 ) (7.6)
˜ ˜
ce qui prouve que f˜ est différentiable, qui identifie ∂∂xf = c, ∂∂yf (x0 , y0 ) = ic, et qui établit (7.5). Réciproquement
˜
si f˜ satisfait (7.5), alors on a bien (7.6) avec c = ∂∂xf (x0 , y0 ) et la fonction f (z) est donc dérivable en z0 avec
f 0 (z0 ) = c.
Contre-exemple : Soit f (z) = z z̄, f˜(x, y) = x2 + y 2 . La fonction f˜ est bien différentiable : ∂x f˜(1, 0) =
2, ∂y f˜(1, 0) = 0 et f˜(x, y) − f˜(1, 0) = (1 + h)2 + k 2 − 1 − 2h = h2 + k 2 . Examinons la dérivabilité en z0 = 1.
f (z)−f (1) z z̄−1 z̄−1
z−1 = z−1 = z̄ + z−1 . Quand z → 1, le premier terme → 1 mais le second est une phase qui dépend de
la direction d’approche.
Dans la suite on ne distinguera plus f et f˜. Il est souvent commode d’écrire
f = P + iQ avec P = <e f , Q = =m f .
Les conditions de Cauchy–Riemann se récrivent alors sous la forme
Théorème 7.2 (conditions de Cauchy–Riemann 2) : Si f : Ω → C est dérivable en

z0 ∈ Ω, et f = P + iQ avec P = <e f , Q = =m f , alors
∂P ∂Q ∂Q ∂P
(x0 , y0 ) = (x0 , y0 ) (x0 , y0 ) = − (x0 , y0 ) (7.7)
∂x ∂y ∂x ∂y
Interprétation géométrique : les deux courbes <e f (z) = const. et =m f (z) = const. sont
orthogonales au point z0 .
Preuve (de cette interprétation) : voir TD.
Notons finalement que par les formules de Cauchy–Riemann, nous avons plusieurs expres-
sions équivalentes pour la dérivée d’une fonction holomorphe :
∂P ∂Q ∂Q ∂P ∂P ∂P ∂Q ∂Q
f 0 (z) = +i = −i = −i = +i . (7.8)
∂x ∂x ∂y ∂y ∂x ∂y ∂y ∂x
Exemples, contre-exemples. Tout polynôme R(z) (à coefficients dans C) est dérivable donc
holomorphe en tout point z de C. Les fonctions ez , sin z, cos z etc sont holomorphes sur C.
déf
La fonction f : z 7→ 1/z est holomorphe sur C∗ = C\{0}. En revanche la fonction f : z 7→ z̄

n’est pas dérivable/holomorphe. En effet pour tout z0 , examinons la limite ζ = z̄−z̄ 0

z−z0
quand
iθ(z) −2iθ(z)
|z − z0 | → 0. Posant z − z0 = ρ(z)e , on voit que ζ = e qui peut prendre toute valeur
selon la façon dont z approche z0 . Le rapport ζ n’a pas de limite bien définie et la fonction
n’est pas dérivable. Pour la même raison, les fonctions z 7→ |z|, z 7→ <e z, z 7→ =m z, ne sont
pas non plus holomorphes.
De façon heuristique, sont holomorphes les fonctions (suffisamment régulières) “de z seule-
ment”. On voit apparaı̂tre une idée intéressante : les variables z et z̄ peuvent être considérées
comme indépendantes, une idée que l’on retrouvera dans la suite.
7.1.3 Dérivations ∂, ∂¯
Comme on l’a rappelé plus haut en (7.3), pour une fonction f : R2 → R2 différentiable au
point (x0 , y0 ), on peut écrire la différentielle en (x0 , y0 ) comme

∂f ∂f
df = dx + dy . (7.9)
∂x (x0 ,y0 ) ∂y (x0 ,y0 )
Appliquons cela à des fonctions f : Ω → C d’une variable z = x + iy. Pour les fonctions
z 7→ z et z 7→ z̄ on a dz = dx + idy et dz̄ = dx − idy, soit encore dx = 21 (dz + dz̄) et
dy = 2i1 (dz − dz̄). L’expression (7.9) conduit alors à
1 ∂f 1 ∂f
df = (dz + dz̄) + (dz − dz̄)
2 ∂x 2i ∂y

1 ∂f ∂f 1 ∂f ∂f
= −i dz + +i dz̄ . (7.10)
2 ∂x ∂y 2 ∂x ∂y
Il est donc naturel de noter

∂ déf 1 ∂ ∂ ∂ déf 1 ∂ ∂
= −i = +i (7.11)
∂z 2 ∂x ∂y ∂ z̄ 2 ∂x ∂y
et ces opérateurs différentiels seront notés aussi ∂z et ∂z̄ , ou plus simplement ∂ et ∂¯ chaque fois
qu’il n’y aura pas d’ambiguı̈té.
On a donc finalement pour la différentielle de f l’expression compacte
∂f ∂f
df = dz + dz̄
∂z ∂ z̄
à nouveau en accord avec la remarque ci-dessus : les variables z et z̄ peuvent être considérées
comme indépendantes.
Ce qui a précédé n’a fait usage que de la différentiabilité dans R2 de la fonction f . Supposons
maintenant la fonction f dérivable dans Ω ⊂ C (holomorphe) :

§ 7.2. Intégrales sur des chemins 131
Théorème 7.3 (conditions de Cauchy–Riemann 3) : Si f : Ω → C est dérivable en

z0 ∈ Ω, alors
∂f ∂f
(z0 ) = f 0 (z0 ) et (z0 ) = 0 , (7.12)
∂z ∂ z̄

∂f 1 ∂f
puisque compte tenu de (7.10) et (7.5), ∂z (z0 ) = 2 ∂x (x0 , y0 ) − i ∂y (x0 , y0 ) = ∂f
∂f
∂x
(x0 , y0 ) =

f 0 (z0 ), (Théorème 7.1), tandis que ∂f (z ) = 12 ∂f
∂ z̄ 0 ∂x
(x0 , y0 ) + i ∂f
∂y
(x0 , y0 ) = 0, cette dernière
relation exprimant à nouveau l’“indépendance de f par rapport à z̄ ”.
Exercice. Vérifier à l’aide de cette nouvelle forme des conditions de Cauchy–Riemann que
la fonction z 7→ |z| n’est pas holomorphe.
Application. Utilisons ce qui précède pour établir la
Proposition 7.4 : Soit f holomorphe dans un ouvert connexe Ω ; si <e f est constante, alors
f est constante.
Preuve. Comme <e f = 21 (f + f¯), on a d(f + f¯) = 0, ce qui compte tenu de l’holomorphie ∂z̄ f = 0 et (par
conjugaison) ∂z f¯ = 0, conduit à ∂z f dz + ∂z̄ f¯ dz̄ = 0. Mais cela n’est possible que si séparément ∂z f = 0 et
∂z̄ f¯ = 0. Donc df = 0 et f est constante.
On démontre de même (voir TD) que sous la même hypothèse f holomorphe dans Ω connexe,
=m f = const. =⇒ f = const., |f | = const. =⇒ f = const. ; si f 6= 0 dans Ω, log |f | =
const. =⇒ f = const., arg f = const. =⇒ f = const.
7.2 Intégrales sur des chemins

7.2.1 Chemins et lacets
On appelle chemin différentiable γ dans un ouvert Ω de C une application continûment différen-
tiable d’un intervalle [a, b] de R (avec a < b) dans Ω. (On peut penser au paramètre t ∈ [a, b]
comme à une variable de temps quand on parcourt le chemin. . .) Par abus de notation, γ désigne
à la fois la fonction et son image dans le plan C. Les points γ(a) et γ(b) sont appelés l’origine
et l’extrémité de γ. Le chemin est fermé si γ(a) = γ(b) (on parle aussi de lacet). Il est simple
s’il ne se recoupe pas (l’application γ est injective), sauf en a et b s’il est fermé.
On est souvent amené à effectuer un changement de paramétrisation : si t ∈ [a, b] et t = ϕ(u),
u ∈ [a1 , b1 ] avec ϕ : [a1 , b1 ] → [a, b], fonction continue, différentiable et strictement croissante,
les deux paramétrisations t 7→ γ(t) et u 7→ (γ ◦ ϕ)(u) décrivent des chemins équivalents. Par
exemple les fonctions t 7→ e2iπt de [0, 1] → C et u 7→ e−2iπ cos u de [0, 21 π] → C définissent deux
chemins équivalents, c’est-à-dire de même image γ (ici le cercle unité) parcourue dans le même
sens.

Pour décrire des chemins ayant un nombre fini de points anguleux, tel le bord d’un rectangle,
on doit un peu généraliser les définitions qui précèdent et considérer des chemins différentiables
par morceaux : l’intervalle [a, b] peut être subdivisé en un nombre fini p d’intervalles adjacents
[ai , ai+1 ], a0 = a, ap = b, tels que γ soit continue sur [a, b] et continûment différentiable sur
chaque [ai , ai+1 ]. Cela sera implicite dans la suite quand on parlera de chemin.
Chemins homotopes dans Ω
Définition 7.2 : On dit que deux chemins γ0 : [0, 1] → Ω et γ1 : [0, 1] → Ω de mêmes

extrémités γ0 (0) = γ1 (0) et γ0 (1) = γ1 (1) sont homotopes dans Ω s’il existe une déformation
continue de γ0 en γ1 , c’est-à-dire une fonction ζ : [0, 1] × [0, 1] → Ω telle que
∀t ∈ [0, 1] ζ(t, 0) = γ0 (t) ζ(t, 1) = γ1 (t) (7.13)

∀u ∈ [0, 1] ζ(0, u) = γ0 (0) = γ1 (0) ζ(1, u) = γ0 (1) = γ1 (1) (7.14)
Autrement dit dans ζ(t, u), u est le paramètre de déformation, et tous les chemins γ(·, u)
interpolant entre γ0 et γ1 ont mêmes extrémités. La relation d’homotopie est une relation
d’équivalence entre chemins, qu’on notera simplement γ0 ∼ γ1 .
Définition 7.3 : Un ouvert Ω de C est dit simplement connexe si tout chemin fermé est
homotope à un point.
Heuristiquement, dire que Ω est simplement connexe signifie qu’il n’“a pas de trou”, contrairement au cas
représenté sur la Fig. 7.1. Noter que le “trou” peut être réduit à un point : le plan complexe pointé C∗ n’est
pas simplement connexe. Remarque : les notions de chemins, d’homotopie et de simple connexité s’étendent à
tout espace topologique E.
2 2
1
Figure 7.1 – Le chemin γ1 est homotope à γ2 dans Ω, mais pas à γ3 . Le domaine Ω n’est pas
simplement connexe ; il a pour bord orienté Γ1 ∪ Γ2 .

Bord d’un domaine compact
Soit B un domaine compact du plan. On dit qu’il a pour bord orienté Γ = ∪i Γi , où chaque
chemin Γi est simple et différentiable par morceaux, et où les images des différents Γi sont
o
disjointes, si Γ est la frontière de B (c’est-à-dire Γ = B̄− B, cf Chap. 1) et (orientation) si
quand on parcourt chaque Γi dans le sens des t croissants, on a localement à sa gauche des
points de B et à sa droite des points de son complémentaire. Cette définition qui peut être
formalisée davantage (cf [4] p. 65-66) recouvre un fait assez intuitif, illustré sur la figure 7.1 où
le bord de Ω est constitué de Γ = Γ1 ∪ Γ2 . En général, il est commode de noter ∂B le bord
orienté de B.
7.2.2 Intégrales de formes sur des chemins.

Considérons maintenant une forme différentielle dans l’ouvert Ω, c’est-à-dire une expression
ω = P dx + Qdy
où P et Q sont à valeurs réelles ou complexes. Par définition l’intégrale de la forme ω sur un
chemin différentiable γ : t ∈ [a, b] 7→ (x(t), y(t)) est
Z Z b
γ ∗ (ω)
déf
ω= (7.15)
γ a
où la forme γ ∗ (ω) est donnée par
γ ∗ (ω) = P (x(t), y(t))x0 (t) + Q(x(t), y(t))y 0 (t) dt .

(7.16)
On note qu’un changement de paramétrisation de la courbe ne modifie pas cette intégrale :

si t = ϕ(u), γ ∗ (ω) = P (x(ϕ(u)), y(ϕ(u)))x0 (t)ϕ0 (u) + Q(x(ϕ(u)), y(ϕ(u)))y 0 (t)ϕ0 (u) du =

(P (x̃(u), ỹ(u))x̃0 (u)+Q(x̃(u), ỹ(u))ỹ 0 (u))du. Ces considérations s’étendent à des chemins différen-
tiables par morceaux : l’intégrale de ω est la somme des intégrales sur les morceaux différentiables
successifs de la courbe, γ ω = pi=1 γi ω.
R P R
Si γ : [0, 1] → Ω est un chemin d’origine α et d’extrémité β, on note −γ le chemin parcouru en sens inverse
R R
−γ(t) = γ(1 − t) ; il a pour origine β et pour extrémité α. On a bien sûr −γ ω = − γ ω. Dans le même ordre
d’idées, si le chemin γ2 a pour origine l’extrémité du chemin γ1 , on peut composer les deux chemins en un
chemin γ1 + γ2 1 d’origine γ1 (0) et d’extrémité γ2 (1). Enfin, si γ1 et γ2 ont même origine α et même extrémité
β, le chemin γ1 − γ2 est un chemin fermé de α à α.
Bien comprendre qu’une intégrale sur un chemin d’extrémités α et β données
dépend en général de ce chemin. C’est une question qui va nous occuper maintenant
1. une notation pas très heureuse, puisqu’on ne peut pas en général définir γ2 + γ1 . . .

de trouver quelles conditions doivent être satisfaites pour que l’intégrale ne dépende pas du
chemin, et qu’on puisse déformer le chemin (ou contour) d’intégration.
Formes exactes, formes fermées, primitives
Supposons que ω est une forme exacte dans l’ouvert Ω, c’est-à-dire qu’elle y est la différentielle
d’une fonction f : ω = df , continûment différentiable, appelée la primitive de la forme ω ; alors
pour un chemin γ (différentiable par morceaux)
Z
df = f (γ(b)) − f (γ(a)) . (7.17)
γ
R
En particulier, pour un chemin fermé (complètement contenu dans Ω), on voit que γ
df = 0.
Attention que la définition de la primitive f de la forme exacte ω impose que f est définie dans tout Ω. Une
condition plus faible serait que localement, c’est-à-dire dans un voisinage de tout point, il existe une fonction f
telle que ω = df . Une telle forme ω peut être appelée fermée 2 . Évidemment toute forme exacte est fermée, la
réciproque n’étant en général pas vraie. Exemple, dans Ω = C∗ (plan “pointé” à l’origine), ω = dz/z est fermée,
R
puisque localement ω = d log z, mais pas exacte. En effet comme on vérifie aisément, γ ω = 2πin où n est le
nombre algébrique de fois où le chemin γ tourne autour de l’origine, voir ci-dessous (7.23).
Proposition 7.5 : Si ω = df est exacte dans Ω, son intégrale le long du chemin γ est la même
pour tous les chemins homotopes à γ.
R R
La preuve est simple : si γ0 ∼ γ1 , γ0 ω − γ1 ω peut être considérée comme l’intégrale le long
du chemin fermé γ0 − γ1 obtenu en composant γ0 et −γ1 , c’est-à-dire le chemin γ1 parcouru en
R
sens inverse. Il découle de la remarque suivant (7.17) que γ0 −γ1 df = 0. cqfd.
Proposition 7.6 : Pour qu’une forme différentielle ω admette une primitive dans Ω, il faut et
R
il suffit que γ ω = 0 pour tout chemin fermé γ différentiable par morceaux et contenu dans Ω.
Preuve. On vient de voir que la condition est nécessaire. Qu’elle est suffisante résulte de la construction suivante :
soit ω = P dx + Qdy une forme satisfaisant la condition du Théorème ; on se donne un point (x0 , y0 ) ∈ Ω
R
quelconque dans Ω et on définit f (x, y) = γ ω où γ est un chemin différentiable dans Ω d’origine (x0 , y0 ) et
d’extrémité (x, y). Sous l’hypothèse de la Proposition, f (x, y) ne dépend pas du choix de γ, puisque pour un
R R R
autre chemin γ1 de (x0 , y0 ) à (x, y), γ ω − γ1 ω = γ−γ1 ω et que γ − γ1 est un chemin fermé. On vérifie alors
aisément que f est continûment différentiable dans Ω et que ∂f ∂f
∂x = P (x, y), ∂y = Q(x, y). (Idée : calculer ces
dérivées partielles en intégrant ω le long de segments de droite entre x et x + dx etc.) f est bien la primitive de
ω, cqfd.
Remarque. La condition précédente, qui porte sur tout chemin fermé γ, semble d’application difficile. En fait il
suffit d’assurer une condition moins forte :
2. Par la suite on donnera une définition différente : ω est fermée si sa différentielle que nous ne définirons
pas ici s’annule : dω = 0, une condition qu’on montre être équivalente à “ω est localement exacte”.

R
Proposition 7.7 : Soit D un disque ouvert. Si γ ω = 0 pour tout chemin γ qui est le bord
d’un rectangle complètement contenu dans D, alors ω a une primitive dans D (elle est exacte).
Par “rectangle complètement contenu . . . ”, on veut dire que l’intérieur et la frontière du
rectangle sont contenus dans D, voir Fig. 7.2(a).
La preuve est instructive : Soit (x0 , y0 ) le centre du disque. Tout point (x, y) de D définit avec (x0 , y0 ) un
rectangle complètement contenu dans D, voir Fig. 7.2(a). Les deux intégrales de (x0 , y0 ) à tout (x, y) ∈ Ω le
R
long des deux contours (x0 , y0 ) → (x, y0 ) → (x, y) ou (x0 , y0 ) → (x0 , y) → (x, y) sont égales puisque γ ω = 0 et
définissent une primitive F (x, y) de ω (même calcul que dans la Prop. 7.6).
Si au lieu d’un disque on prend un ouvert Ω quelconque, on peut appliquer un raisonnement
du même genre, en prenant un point de base (x0 , y0 ) ∈ Ω tel que le rectangle de sommets
(x0 , y0 ) et (x, y) soit complètement contenu dans Ω, ce qui est toujours possible pour tout point
(x, y) de l’ouvert Ω. Mais la construction sera locale, et la fonction f ainsi construite ne sera
pas nécessairement une primitive définie dans tout Ω. Donc
R
Proposition 7.8 : Soit Ω un ouvert. La forme ω est fermée si et seulement si γ ω = 0 chaque
fois que γ est le bord d’un petit rectangle contenu dans l’ouvert Ω.
(x0 ,y) ( x,y )

(a1,b2) (a2 ,b2)
A
(x0 ,y0) (x,y0)
(a1,b1) (a2 ,b1)
(a) (b)
Figure 7.2 – (a) Contour rectangulaire γ partant du centre (x0 , y0 ) du disque D ; (b) Rectangle A
contenu dans l’ouvert Ω.
Formule de Green–Riemann
Théorème 7.9 (Green–Riemann) : Soit ω = P dx + Qdy une forme différentielle définie

dans un ouvert Ω, avec ∂P
∂y
et ∂Q
∂x
continues dans Ω. Soit K un domaine compact contenu dans
Ω, γ = ∂K son bord orienté supposé simple (ne se recoupant pas). Alors
Z ZZ
∂Q ∂P
(P dx + Q dy) = − dx dy . (7.18)
γ K ∂x ∂y

Ce théorème qu’on a déjà rencontré à travers ses applications physiques (la circulation d’un vecteur le long
d’un chemin fermé γ égale le flux de son rotationnel à travers la surface dont γ est le bord orienté. . .) est un
cas particulier d’une classe de résultats auxquels on donne le nom de théorème de Stokes, de la forme générale
R R
Ω
dω = ∂Ω ω pour des domaines Ω et des formes différentielles ω de dimension plus élevée, cf le théorème de
Gauss-Ostrogradsky rencontré en électromagnétisme : le flux d’un vecteur à travers une surface fermée égale
l’intégrale de sa divergence dans le volume limité par la surface, etc. Nous n’aurons malheureusement pas le
temps d’aborder ces questions.
Preuve de la formule de Green–Riemann. On ne donnera la preuve que dans le cas d’un rectangle de côtés
parallèles aux axes des x et des y, voir Fig. 7.2(b). Soient a1 < a2 les abscisses des sommets du rectangle, b1 < b2
leurs ordonnées. Le chemin fermé γ est fait de 4 segments orientés : [(a1 , b1 ) → (a2 , b1 )], [(a2 , b1 ) → (a2 , b2 )],
[(a2 , b2 ) → (a1 , b2 )], [(a1 , b2 ) → (a1 , b1 )]. On a
ZZ Z a2 Z b2 Z a2 Z a2 Z
∂P ∂P
dxdy = dx dy = P (x, b2 )dx − P (x, b1 )dx = − P dx
A ∂y a1 b1 ∂y a1 a1 γ
RR ∂Q
et une expression analogue pour ∂x dxdy. En remettant tout ensemble, on a bien (7.18).
Nous ferons par la suite usage de la Proposition suivante :
Proposition 7.10 : Soit une forme différentielle ω = P dx + Qdy définie dans un ouvert
connexe Ω, telle que ∂P
∂y
et ∂Q
∂x
sont continues dans Ω. Alors
∂P ∂Q
= (7.19)
∂y ∂x
est une condition nécessaire pour que ω = df dans Ω. Elle est suffisante localement (forme
fermée) ; elle est suffisante globalement dans tout Ω (forme exacte) si Ω est un disque ouvert.
Preuve : Dire que ω = df = ∂f ∂f ∂f ∂f
∂x dx + ∂y dy équivaut à dire que P = ∂x et Q = ∂y , un système de deux
équations aux dérivées partielles dont la condition nécessaire et suffisante d’intégrabilité (locale) est ∂Q ∂P
∂x = ∂y =
∂2f
∂x∂y , cf Appendice D. Ou encore, autre méthode, si (7.19) est satisfaite, alors le théorème de Green–Riemann
R
nous dit que γ ω= 0 pour tout chemin rectangulaire γ et la Proposition 7.8 nous dit que ω admet localement
une primitive (elle est fermée). La condition (7.19) est nécessaire : si ω est fermée, la Proposition 7.8 et le
∂Q
théorème de G-R nous disent que A ( ∂P
RR
∂y − ∂x ) = 0 pour tout petit rectangle A ⊂ Ω, ce qui implique (par
∂Q
l’absurde) que ( ∂P
∂y − ∂x ) = 0 en tout point (x, y) de Ω. Si le domaine est un disque, (7.19) est une condition
suffisante pour que ω soit exacte, car on applique la Proposition 7.7. Comme on va le voir ci-dessous, c’est aussi
une condition suffisante pour un domaine Ω simplement connexe.
Exemple : la forme ω = dz/z satisfait bien (7.19) dans C∗ , elle est fermée (localement
exacte) ω = d log z, mais pas exacte dans tout C∗ , en raison une fois encore des déterminations
multiples du log, ou du fait que C∗ n’est pas simplement connexe.
Nous avons finalement le théorème suivant
Théorème 7.11 : Soit ω une forme différentielle fermée dans un ouvert connexe Ω. Alors
R R
(i) pour deux chemins homotopes γ1 et γ2 (de mêmes extrémités), γ1 ω = γ2 ω ; ou de façon
R
équivalente, pour tout chemin fermé γ homotope à un point, γ ω = 0 ;
(ii) si Ω est simplement connexe, ω y est exacte (elle admet une primitive dans Ω).

Éléments de preuve : (i) La forme est fermée, donc (Proposition 7.10 et Théorème de Green–Riemann),
R
γ
ω = 0 le long de tout chemin fermé simple complètement contenu dans Ω. Cela s’applique au chemin fermé
γ1 − γ2 qu’on supposera simple (quitte à le décomposer en un nombre fini de lacets simples s’il a des points
R R
multiples). Donc γ1 ω = γ2 ω, cqfd. Pour le point (ii), on observe que si Ω est simplement connexe, tout
R
chemin fermé γ y est homotope à un point, donc γ ω = 0, et on applique alors la Proposition 7.6. Pour une
démonstration plus soigneuse, se reporter à [4], p. 60-61.
7.2.3 Intégration sur des chemins dans C

Examinons maintenant comment ces formules se transcrivent en variables complexes.
Définition 7.4 : Soit ω = ω1 dz + ω2 dz̄ une forme définie sur Ω, et γ un chemin dans Ω.
L’intégrale de ω sur le chemin γ est définie par
Z Z b
(ω1 (γ(t)) γ 0 (t) + ω2 (γ(t)) γ̄ 0 (t)) dt .
déf
ω= (7.20)
γ a
Le chemin γ est appelé contour d’intégration dans le plan complexe.

Rb
En particulier, si ω = f dz, (f pas nécessairement holomorphe), γ f (z)dz = a f (γ(t))γ 0 (t)dt.
R
R
Si ω = df , γ df = f (γ(b)) − f (γ(a)) comme en (7.17).
Cette définition est l’équivalent des formules (7.15, 7.16) et en découle via les formules
exprimant dx et dy en termes de dz et dz̄. Elle est également insensible à un reparamétrage du
chemin γ, grâce aux formules de changements de variable dans une intégrale (Vérifier !).
Avec cette notation, on a le résultat important
Théorème 7.12 : Soit f : Ω → C une fonction holomorphe et γ : [a, b] → C un chemin dans

Ω. Alors Z
∂f
f (γ(b)) − f (γ(a)) = (z)dz . (7.21)
γ ∂z
Autrement dit, sous les hypothèses du théorème, l’intégrale de contour ne dépend pas du contour
γ mais seulement de ses extrémités.
∂f
Preuve : La relation (7.17) s’applique à df , mais f étant holomorphe, df = ∂z (z)dz.
Attention : cette formule n’est valable que pour f holomorphe.
Exemple d’intégrale de contour : soit γ le cercle de centre a ∈ C et de rayon R, qu’on
paramétrise par exemple par θ ∈ [0, 2π] 7→ γ(θ) = a + Reiθ . Si f est une fonction (holomorphe
ou non) définie dans un ouvert Ω contenant γ, alors (7.20) appliqué à ω = f (z)dz donne
Z Z 2π
f (z)dz = f (a + Reiθ ) iReiθ dθ
γ 0

Cas particulier : intégrons f (z) = 1/z sur le cercle γ de centre O et de rayon R, (ici Ω = C∗ ) :
Z Z 2π iθ
1 dz 1 ie
= dθ = 1 , (7.22)
2πi γ z 2πi 0 eiθ
puisque z = Reiθ . On note que le résultat ne dépend pas de R.
1 dz
R
Proposition 7.13 : Pour tout chemin fermé γ ne passant pas par l’origine, 2πi γ z
est un
entier.
Preuve : la forme dz/z n’est pas exacte, mais localement elle admet comme primitive log z. On
se rappelle (chap. 6) que la fonction log admet plusieurs déterminations. L’intégrale de contour
1
R dz
2πi γ z
est donc égale à la différence de deux déterminations du logarithme divisée par 2πi,
soit un entier.
1
R xdy−ydx
Corollaire : Pour tout chemin γ ne passant pas par l’origine, 2π γ x2 +y 2
est un entier.
y
Preuve : calculer la différentielle de =m log z = arg z = Arctan x .
Indice d’un chemin fermé par rapport à un point
Théorème 7.14 : Soit γ un chemin fermé et soit U le complémentaire de γ dans le plan

complexe. Soit z un point n’appartenant pas à γ (donc z ∈ U ). L’indice de γ par rapport à z,
défini par Z
déf 1 dζ
Indγ (z) = (7.23)
2πi ζ −z
est un nombre entier, constant dans chaque composante connexe de U , nulle sur la composante
connexe non bornée de U et variant de ±1 à chaque traversée du chemin γ en dehors des points
multiples.
Heuristiquement l’indice mesure le nombre algébrique de tours qu’effectue le chemin γ autour

du point z.
Preuve du Théorème. Que ce soit un entier découle de la proposition 7.13. Par ailleurs
l’indice est une fonction continue de z tant que z ∈ / U et sa valeur est un entier, donc c’est
une constante dans chaque composante connexe de U . Ou inversement, c’est une fonction qui
ne varie pas quand γ est déformé sans passer par z. Si z appartient à la composante connexe
non bornée de U , γ peut être déformé en un point sans croiser z, donc l’indice est nul. Enfin
la traversée par z de γ en dehors d’un point multiple équivaut à modifier γ en γ + γ1 , avec γ1
déformable en un cercle parcouru une fois dans le sens positif ou négatif, voir Figure 7.3 droite.
On a fait ici appel à des déformations de contour d’intégration, une méthode très utilisée dans
la suite. Pour une autre démonstration, voir [1], Annexe D.

§ 7.3. Théorème de Cauchy et conséquences 139
2 z1 z1 z1 z1
0 2 z 1 1
1
0
Figure 7.3 – À gauche : L’indice du chemin γ par rapport à un point est constant dans chaque
composante connexe du complémentaire U de γ. À droite : La traversée par z du contour γ équivaut
à ajouter la contribution du lacet γ1 : Indγ (z) = Indγ 0 (z1 ) = Indγ (z1 ) + Indγ1 (z1 ) = Indγ (z1 ) + 1.
7.3 Théorème de Cauchy et conséquences

7.3.1 Théorème de Cauchy
Proposition 7.15 : Soit f une fonction holomorphe sur un ouvert Ω, γ un chemin fermé dans
Ω, alors γ f 0 (z)dz = 0.
R
En effet cela est une conséquence du Théorème 7.12, γ f 0 (z)dz = f (γ(b)) − f (γ(a)) = 0
R
puisque le chemin est fermé. En revanche, si f n’est pas holomorphe, ∂f

H
∂z
dz n’a aucune raison
H
de s’annuler. (Remarquer la notation qui signale que l’on intègre sur un chemin fermé.)
∂f
Exemple : f = z z̄, l’intégrale de ∂z = z̄ le long du cercle de centre O et de rayon R est (on
R 2π
paramétrise z = Reiθ comme ci-dessus) 0 iR2 dθ = 2πiR2 . Noter que sur le cercle, z̄ = R2 /z,
et on vient juste de répéter le calcul de (7.22) !
R
Corollaire : Pour tout chemin fermé γ et tout entier n 6= −1, on a γ z n dz = 0. (Pour n < 0
on suppose que γ ne passe pas par 0.)
La preuve est claire : pour n 6= −1, z n a pour primitive z n+1 /n + 1, qui est holomorphe dans C
(resp. C∗ si n < −1) et la proposition précédente s’applique.
Théorème 7.16 (Cauchy) : Si f est une fonction holomorphe sur Ω, la forme f (z)dz est
fermée dans Ω : localement elle admet une primitive f (z)dz = dF (z).
Il s’agit là d’un théorème fondamental dont vont découler beaucoup de conséquences et d’ap-
plications. Démontrons-le en faisant l’hypothèse supplémentaire que ∂f ∂x
et ∂f
∂y
sont continues
dans Ω. (On verra plus bas que cette propriété est en fait toujours satisfaite par une fonction
holomorphe. Mais on peut aussi établir directement, avec un peu plus d’effort, le théorème de
Cauchy sous la seule hypothèse d’holomorphie, voir [4], p. 70–71.) Il suffit alors d’écrire la forme

f (z)dz = f (z)dx + if (z)dy, soit dans les notations de la Prop. 7.10, P = f (z), Q = if (z). Les
conditions d’holomorphie de Cauchy–Riemann ∂f ∂y
= i ∂f
∂x
et la Proposition 7.10 nous assurent
alors que f dz est fermée.
R
Corollaire : Si f est holomorphe dans Ω, on a γ f (z)dz = 0 pour tout chemin fermé homotope
à un point dans Ω. De façon équivalente, pour deux chemins γ1 et γ2 de mêmes extrémités et
R R
homotopes, γ1 f (z)dz = γ2 f (z)dz.
C’est la transcription en variables complexes du Théorème 7.11, et c’est sous cette forme, ou
sous l’une des formes équivalentes ci-dessous, que le théorème de Cauchy va nous être le plus
utile. La deuxième formulation de ce corollaire implique que l’on peut déformer continûment
le contour d’intégration d’une fonction holomorphe, à extrémités fixes, ce qui généralise ce que
l’on a vu au Théorème 7.12. Une forme plus faible de ce corollaire (elle aussi découlant du
Théorème 7.11) consiste à dire
R
Corollaire : Si f est holomorphe dans un ouvert Ω simplement connexe, on a γ f (z)dz = 0
pour tout chemin fermé dans Ω.
7.3.2 Intégrale de Cauchy

Théorème 7.17 : Soit f holomorphe dans Ω, a ∈ Ω, et γ un chemin fermé dans Ω ne passant
pas par a et homotope à un point dans Ω. Alors
Z
1 f (z)dz
= Indγ (a) f (a) . (7.24)
2πi γ z − a
Voilà un résultat qui va nous être extrêmement utile ! Donnons-en la preuve.

Soit g(z) la fonction définie par

 f (z) − f (a) si z 6= a
g(z) = z−a (7.25)
 f 0 (a) si z = a ,
elle est définie et continue pour tout z ∈ Ω, et holomorphe pour z 6= a. Un théorème de Riemann
(voir plus bas Théorème 7.23) assure alors qu’elle est holomorphe sur tout Ω. On a donc par le
corollaire du théorème de Cauchy :
Z Z Z Z
f (z)dz f (a)dz f (z)dz
0 = g(z)dz = − = − 2πi Indγ (a)f (a)
γ γ z −a γ z −a γ z −a
ce qui établit (7.24).

Nous verrons au chapitre suivant des applications concrètes de cette formule au calcul
d’intégrales. Dans le reste de ce chapitre nous en discutons quelques conséquences fondamen-
tales.

§ 7.4. Autres propriétés des fonctions holomorphes 141
Théorème 7.18 (théorème de la moyenne) : Si f est holomorphe sur Ω, pour tout a ∈ Ω

et r > 0 tel que le disque fermé de centre a et de rayon r soit contenu dans Ω, on a
Z π
dθ
f (a) = f (a + reiθ ) . (7.26)
−π 2π
Autrement dit la valeur de f en tout point a est égale à sa moyenne sur un cercle centré en a.
La preuve découle simplement de l’intégrale de Cauchy : si γ est le bord du disque orienté dans
le sens positif
π
f (a + reiθ )ireiθ dθ
Z Z Z
1 f (z)dz 1 dθ
f (a) = = = f (a + reiθ ) .
2πi γ z−a 2πi γ reiθ −π 2π
7.4 Autres propriétés des fonctions holomorphes

7.4.1 Fonctions holomorphes et fonctions analytiques
Théorème 7.19 : Une fonction est holomorphe dans un ouvert Ω ssi elle est analytique sur
Ω.
Résultat remarquable : deux conditions sur les fonctions de variable complexe –dérivabilité et
analyticité– ont finalement abouti à la même classe de fonctions ! !
Preuve : Soit f une fonction holomorphe dans Ω. Soit z0 ∈ Ω, il existe un disque ouvert de
centre z0 et de rayon R contenu dans Ω. Pour r < R, soit z : |z − z0 | < r et prenons pour γ un
0 z−z0
cercle de centre z0 et de rayon r0 , r < r0 < R. Si ζ ∈ γ, on a z−z
ζ−z0
= r0 < 1, donc la série
P∞ (z−z0 )n
géométrique n=0 (ζ−z0 )n+1 converge et a pour somme (ζ − z)−1 . Selon (7.24),
∞
(z − z0 )n
Z Z X
1 f (ζ) 1
f (z) = dζ = n+1
f (ζ)dζ
2πi γ ζ −z 2πi γ n=0 (ζ − z0 )
et la convergence uniforme (car normale) de la série pour |z| ≤ r et |ζ − z0 | = r0 fait qu’on peut
l’intégrer terme à terme (c’est-à-dire permuter intégration et sommation)
∞ Z ∞
X 1
n f (ζ) X
f (z) = (z − z0 ) dζ = an (z − z0 )n (7.27)
n=0
2πi γ (ζ − z0 )n+1 n=0
ce qui établit bien que f est développable en série entière en z0 , avec

Z
1 f (ζ)
an = dζ .
2πi γ (ζ − z0 )n+1

Cela étant vrai en tout point z0 ∈ Ω, f est bien analytique dans Ω. Et comme (7.27) converge
pour tout r < R, le rayon de convergence de la série est au moins égal à R. Selon la formule
(6.6), on a de plus Z
1 (n) 1 f (ζ)
f (z0 ) = an = dζ . (7.28)
n! 2πi γ (ζ − z0 )n+1
Réciproquement on veut montrer que si f est analytique dans Ω, elle est indéfiniment dérivable
en tout point de Ω, donc holomorphe. Cela a été mentionné au Chap. 6 pour des fonctions
analytiques de variable réelle, mais la démonstration doit être reprise pour établir l’holomorphie.
Considérons le développement en série de f au point z0 qu’on prendra égal à 0 sans perte de généralité :
n
P
f (z) = n an z qui converge dans un disque ouvert de rayon R. On a vu au § 6.1.3 que la série dérivée
n−1
P
n nan z a aussi R comme rayon de convergence. Pour z tel que |z| < R, soient r : |z| < r < R et h ∈ C :
0 6= h ≤ r − |z|. Formons
f (z + h) − f (z) X X
− nan z n−1 = un (z, h)
h n n≥1
avec
un (z, h) = an (z + h)n−1 + z(z + h)n−2 + · · · + z n−1 − nz n−1

Puisque |z|, |z + h| ≤ r, on a |un (z, h)| ≤ 2n|an |rn−1 et comme r < R, cette série converge, donc ∀, il existe
n0 tel que n>n0 2n|an |rn−1 ≤ 21 . Quant à la somme finie n≤n0 un (z, h), elle s’annule en h = 0 donc peut
P P
être rendue ≤ 21 en prenant |h| < η. Avec ces choix de n0 et de η, on a donc rendu f (z+h)−f (z)
− n nan z n−1
P
h
arbitrairement petite, et donc établi que f 0 (z) = limh→0 f (z+h)−f
h
(z)
, c’est-à-dire l’holomorphie de f .
Complément : Principe de symétrie de Schwarz. Soit Ω un ouvert connexe de C symétrique par

rapport à l’axe réel. Soit Ω0 , resp. Ω00 , l’intersection de Ω avec le demi-plan supérieur y ≥ 0, resp. inférieur
y ≤ 0. Soit une fonction f continue dans Ω0 , holomorphe aux points de Ω0 tels que y > 0 et à valeurs réelles
sur l’axe réel. On va montrer que f peut être prolongée de façon unique en une fonction holomorphe sur Ω.
Sur Ω00 on définit g(z) = f (z̄). Elle est continue dans Ω00 et on vérifie qu’elle est holomorphe en tout point non
réel de Ω00 . La fonction h(z) égale à f (z) sur Ω0 et à g(z) sur Ω00 est continue dans Ω et holomorphe sur Ω\R.
Une réciproque (théorème de Morera) du théorème de Cauchy affirme alors qu’elle est aussi holomorphe en tout
point de Ω. Elle prend des valeurs complexes conjuguées en des points symétriques par rapport à l’axe réel. Elle
est unique (prolongement analytique).
7.4.2 Fonctions entières. Principe du maximum

Définition 7.5 : On appelle fonction entière une fonction holomorphe dans le plan C tout
entier.
Exemple : la fonction ez qui est analytique avec un rayon de convergence infini est holo-
morphe dans tout C donc entière.
Théorème 7.20 (Liouville) : Une fonction entière bornée est constante.

§ 7.5. Zéros et singularités des fonctions de variable complexe 143
Autrement dit, une fonction entière non constante doit tendre vers l’infini dans certaines di-
rections du plan complexe. Voir l’exemple de exp z qui tend vers l’infini quand |z| → ∞ avec
<e z > 0. Inversement ce théorème de Liouville est utile pour établir des identités entre fonc-
tions analytiques : si on peut montrer qu’une combinaison de fonctions analytiques n’a pas de
singularité et demeure bornée, c’est une constante. (Exemple, voir TD.)
Preuve. Soit f entière et bornée, |f (z)| < M . Calculons f 0 (z) par Cauchy, ou plutôt par (7.28) : f 0 (z) =
H f (ζ) R 2π |f (ζ)|
1
2πi γ (ζ−z)2
dζ le long d’un cercle de rayon R autour de z. Donc |f 0 (z)| ≤ 2π
1
0 |(ζ−z|2
Rdθ ≤ M
R . Comme R
0
peut être pris arbitrairement grand, |f (z)| = 0 et f est une constante.
Application : théorème de d’Alembert. Montrons que le théorème fondamental de l’algèbre,
tout polynôme P à coefficients complexes et non constant possède au moins une racine complexe,
découle de ce théorème de Liouville. Raisonnons par l’absurde et supposons que P ne s’annule
pas. Alors 1/P (z) serait holomorphe dans C et borné. En effet P (z) = z n (an + an−1 z
+· · ·+ zan0 ) →
∞ quand |z| → ∞, donc il existe un disque compact à l’extérieur duquel 1/P (z) est borné
(puisque |P | → ∞ à l’infini) et à l’intérieur duquel il est également borné en tant que fonction
continue. Donc (Liouville) P serait constant ce qui est contraire à l’hypothèse. q.e.d.
Théorème 7.21 (Principe du maximum) : Soit f continue dans Ω et satisfaisant la pro-

priété de moyenne, (par exemple f holomorphe dans Ω). Si |f | a un maximum local en un point
a ∈ Ω, c’est-à-dire |f (z)| ≤ |f (a)| au voisinage de a, alors f est constante dans ce voisinage.
Esquisse de preuve. On peut toujours supposer f (a) réel > 0, quitte à multiplier la fonction par exp −i arg(f (a)).
déf
Pour r ≥ 0 assez petit, M (r) = supθ |f (a + reiθ )| ≤ f (a) par l’hypothèse de maximum. Mais la pro-
1
R 2π
priété de moyenne donne f (a) = 2π 0
f (a + reiθ )dθ = [· · · ] ≤ M (r). Donc f (a) = M (r). La fonction
déf
g(z) = <e (f (a) − f (z)) est donc ≥ 0 pour |z − a| = r assez petit [. . . ] ; de plus [. . . ] g(z) = 0 ssi f (z) = f (a)
. Mais g(z), qui est ≥ 0 et continue, ayant une valeur moyenne nulle sur le cercle de centre a et de rayon r est
identiquement nulle sur ce cercle. Donc f (z) = f (a) q.e.d. (Exercice : compléter les [. . . ] de cette preuve.)
Noter que ce théorème n’interdit pas un minimum local : ainsi la fonction z 7→ z a un
minimum de son module en z = 0.
Ce théorème du maximum s’applique aussi aux fonctions harmoniques, de grand intérêt par
exemple en électrostatique (potentiel), voir Chap. 8.
7.5 Zéros et singularités des fonctions de variable com-

plexe
7.5.1 Zéros d’une fonction holomorphe
déf
Soit f holomorphe dans un ouvert connexe Ω, et soit Z(f ) = {a ∈ Ω : f (a) = 0} l’ensemble
des zéros de f dans Ω. Cet ensemble peut être vide, cf la fonction exponentielle.

Théorème 7.22 : (i) Les zéros d’une fonction holomorphe non nulle sont isolés : tout zéro a
possède un voisinage sans autre zéro. Autrement dit, si Z(f ) possède un point d’accumulation
dans Ω, f = 0 sur Ω.
(ii) Si f 6= 0, Z(f ) est fini ou dénombrable. En chaque zéro a ∈ Z(f ), on peut écrire pour tout
∀z ∈ Ω,
f (z) = g(z) (z − a)m(a) (7.29)
où g est holomorphe dans Ω et ne s’annule pas au voisinage de a, et l’entier m(a) ≥ 1 est l’ordre
du zéro a.
Exemple, la fonction f (z) = sin z a des zéros isolés en zk = kπ. Contre-exemple : la fonction
f (z) = 1 + exp z1 est holomorphe dans Ω = C\{0} et a des zéros en zk = −i((2n + 1)π)−1 qui
s’accumulent en 0, mais 0 ∈ / Ω.
Éléments de preuve. Soit a un zéro de f analytique dans Ω. Nous admettrons que si toutes les dérivées
de f en a s’annulent, alors f ≡ 0. Si f 6= 0, soit m ≥ 1 le plus petit entier k tel que f (k) (a) 6= 0 et donc
dans le développement en série de f en a : f (z) = k≥m ck (z − a)k , cm = f (k) (a)/m! 6= 0. La fonction g(z)
P
définie par fz−a

(z)
est holomorphe dans Ω sauf peut-être en a, égale à cm en a, donc selon le même théorème
de Riemann déjà invoqué, (voir ci-dessous Th. 7.23), est holomorphe dans tout Ω, ce qui prouve (ii). De plus,
g(z) = am + k>m ck (z − a)k−m est non nul dans un voisinage de a, ce qui établit le caractère isolé des zéros
P
de f . Et des points isolés dans Ω ⊂ C forment nécessairement un ensemble fini ou dénombrable (vérifier !).
Application au problème de prolongement : si on connaı̂t une fonction f , supposée holo-

morphe dans Ω connexe, sur un ensemble E non dénombrable, par exemple R ∩ Ω, elle est (en
principe) déterminée dans tout Ω.
Autrement dit son prolongement de E à Ω est unique. En effet si on avait deux fonctions f1 et f2 la
prolongeant de E dans Ω, leur différence g = f1 − f2 serait holomorphe dans Ω et y posséderait un ensemble
non dénombrable de zéros, donc par le Théorème précédent serait nulle.
Exemple : la fonction f (z) = sin2 z + cos2 z − 1 est entière ; elle s’annule sur R, elle s’annule
donc partout. L’identité sin2 z + cos2 z = 1 est donc vraie sur tout C.
En revanche, si la fonction f n’est connue que sur les entiers de N (ou de Z), son prolonge-
ment à C n’est pas unique, on peut par exemple la multiplier par e2πiz .
7.5.2 Pôles, singularités essentielles

Supposons qu’une fonction f est holomorphe dans un ouvert privé d’un point a : on parle de
singularité isolée en a. (On verra plus bas qu’une singularité peut ne pas être isolée : il n’existe
pas de disque ouvert pointé 0 < |z − a| < r dans lequel la fonction est holomorphe ; c’est le
cas des “points de branchement” des fonctions multi-valuées, voir § 8.2 3 .) Dans le cas d’une
3. C’est le cas aussi pour une fonction telle que (1 + exp z1 )−1 dont les pôles en zk = −i((2n + 1)π)−1
s’accumulent en 0.

singularité isolée, des théorèmes dus à Riemann, Weierstrass, Picard, . . . permettent d’affirmer
que trois cas sont possibles.
Théorème 7.23 : Soit f holomorphe dans Ω\{a} :

1. ou bien f reste bornée au voisinage de a ; alors elle admet une limite en a et on peut la
prolonger en une fonction holomorphe sur Ω : on parle de singularité apparente 4 ;
2. ou bien limz→a |f (z)| existe (dans R) et vaut +∞ : on parle de pôle en a ;
3. ou bien, si limz→a |f (z)| n’existe pas dans R, l’image par f de tout disque ouvert pointé
0 < |z − a| < r contenu dans Ω est dense dans C (Weierstrass). En fait (Picard) cette
image est le plan C tout entier ou le plan C privé d’un point. On parle de singularité
essentielle.
Nous nous contenterons d’indications et d’exemples. Un exemple de singularité apparente

est fourni par la fonction f (z) = g(z)−g(a)
déf
z−a
si z 6= a, avec g holomorphe dans Ω. Il est clair que
0
la fonction prolongée par f (a) = g (a) est holomorphe dans tout Ω, cf § 7.3.2.
déf
Un exemple de singularité essentielle est donné par la fonction f (z) = exp z1 , qui est holo-
morphe dans C\{0}. Exercice : montrer que toute valeur w 6= 0 est atteinte (une infinité de
fois) par f (z).
On rencontre cette situation en physique dans des problèmes aussi variés que les singularités en température
de grandeurs thermodynamiques au voisinage de certaines transitions de phase (modèle XY de rotateurs à deux
dimensions, énergie de marche dans la “transition rugueuse”, . . . ; ou que les propriétés d’analyticité de certains
développements “perturbatifs” en mécanique quantique ou théorie quantique des champs.
Définition 7.6 : Une fonction définie dans Ω qui n’y a que des pôles comme singularités est
dite méromorphe sur Ω.
Le cas des pôles des fonctions méromorphes est celui qui va le plus nous occuper dans la
suite. Pour ne donner qu’un exemple, toute fraction rationnelle P (z)/Q(z) est une fonction
méromorphe, ses pôles sont les zéros (racines) du dénominateur.
7.5.3 Séries de Laurent. Fonctions méromorphes. Résidus

Définition 7.7 : On appelle série de Laurent une expression de la forme
∞
X
an z n (7.30)
−∞
4. ou artificielle, ou effaçable, . . .

Quand on discute la convergence d’une telle expression, il faut bien comprendre qu’elle doit
être considérée comme la somme de deux séries, l’une portant sur les indices ≥ 0, l’autre sur les
négatifs, et que la convergence de (7.30) signifie la convergence de chacune de ces deux sous-
séries. Supposons que n≥0 an z n a pour rayon de convergence R1 et que n<0 an ζ −n a pour
P P
rayon 1/R2 en ζ, donc que n<0 an z n converge pour |z| > R2 . Supposons aussi que R2 < R1 .
P
Alors (7.30) converge (uniformément et absolument) dans la couronne R2 < |z| < R1 . Noter
que l’on peut avoir R2 = 0 et/ou R1 = ∞.
Théorème 7.24 : Toute fonction f holomorphe dans la couronne R2 < |z| < R1 y est
développable en série de Laurent
∞
X
f (z) = an z n , (7.31)
−∞
avec des coefficients I

1 f (ζ)
an = dζ , (7.32)
2πi 0 ζ n+1
le long d’un contour entourant (une fois dans le sens positif) l’origine mais contenu dans la
couronne.
Nous avons centré la couronne en 0, mais rien n’interdit de la centrer en un autre point z0 ,
avec un développement de Laurent en puissances de (z − z0 ), f (z) = ∞ n
P
−∞ an (z − z0 ) .
La preuve de ce théorème est instructive. On considère le contour

d’intégration γ représenté sur la figure, complètement contenu dans la
couronne d’holomorphie, donc avec des rayons intérieur et extérieur res- 1
pectivement r1 < R1 et r2 > R2 , et parcouru dans le sens positif. Les 2
deux petits segments parallèles, choisis dans une direction différente de

0
celle de z, sont distants de , que l’on fait tendre vers zéro. Dans cette
limite, leurs contributions se compensent et seules demeurent celles des z
deux cercles γ1 et γ2 de rayon r1 et r2 .
La formule de Cauchy nous donne (dans la limite où → 0)

Z Z Z
f (ζ) f (ζ) f (ζ)
2πif (z) = dζ = dζ − dζ
γ ζ − z γ1 ζ − z γ2 ζ −z
P∞ zn
Pour ζ ∈ γ1 , |ζ/z| > 1 et on développe (ζ −z)−1 = n=0 ζ n+1 , et sur γ2 de même, (ζ −z)−1 = −z −1 (1−ζ/z)−1 =
P−∞ zn
− n=−1 ζ n+1 , ce qui établit le théorème, y compris l’expression de an comme intégrale sur le contour γ1 ∼ γ2
ou tout autre contour homotope contenu dans la couronne.
Les différents cas du Théorème 7.23 se lisent maintenant sur le développement de Laurent
au voisinage de z0 , c’est-à-dire dans une “couronne” 0 < |z − z0 | < r :
– si le développement de Laurent en z0 n’a que des termes d’indice ≥ 0, z0 n’est pas une

singularité, f est holomorphe en z0 ;

– s’il n’a qu’un nombre fini de termes d’indice < 0, et que le plus petit de ces indices vaut m,
f a un pôle d’ordre m en z0 ; si m = 1, on parle de pôle simple ;
– enfin s’il a un nombre infini de termes d’indice < 0, f a une singularité essentielle en z0 .
2 exemples de développement de Laurent

1
1. Fraction rationnelle f (z) = (z−a)(z−b) avec par exemple |a| < |b|, dont on cherche le
développement de Laurent dans la couronne |a| < |z| < |b|. On peut soit utiliser directement
(7.32), nous y reviendrons plus bas (Exercice 3), soit “décomposer en éléments simples”

1 1 1 1
f (z) = = −
(z − a)(z − b) a−b z−a z−b
1 zn
P
et se ramener au développement de Laurent d’un pôle simple z−b = − n≥0 bn+1 pour |z| < |b|,
1 an zn n
P P P
ou z−a = n≥0 zn+1 = n<0 an+1 pour |z| > |a|. Au total f (z) = n∈Z cn z avec

1

bn+1 (a−b)
si n ≥ 0
cn = . (7.33)
 n+11 si n < 0
a (a−b)
Bien entendu, si |a| 6= 0, cette même fraction rationnelle f (z) admet aussi un développement
en série entière en z = 0, valable pour |z| < |a| < |b|.
t 1
2. Fonction génératrice des fonctions de Bessel Jn : f (z) = e 2 (z− z ) , t ∈ C, admet un
développement de Laurent dans le plan pointé C∗ (c’est-à-dire R2 = 0, R1 = ∞)
t 1
X
e 2 (z− z ) = Jn (t)z n (7.34)
n∈Z
avec des coefficients Jn (t) fonctions de t appelés fonctions de Bessel. Selon (7.32),
t 1
e 2 (ζ− ζ )
I
1
Jn (t) = dζ
2πi 0 ζ n+1
sur un contour arbitraire entourant (une fois) l’origine, par exemple le cercle unité paramétrisé
par ζ = eiθ , d’où Z 2π
1
Jn (t) = e−inθ eit sin θ dθ n ∈ Z, (7.35)
2π 0
qui est souvent pris comme définition des fonctions de Bessel d’indice entier Jn . Prenant z = eiα
dans (7.34) on voit que l’on a obtenu le développement de Fourier de
X
eit sin α = Jn (t)einα .
n∈Z

Résidus
Soit f une fonction holomorphe dans une couronne R2 < |z| < R1 centrée à l’origine.
Définition 7.8 : On appelle résidu de f à l’origine le coefficient a−1 de (7.31), soit

I
déf 1
Res (f, 0) = a−1 = f (ζ)dζ . (7.36)
2πi 0
1
H
Plus généralement le résidu en une (éventuelle) singularité z0 est Res (f, z0 ) = 2πi z0
dζf (ζ)
avec un contour entourant le point z0 une seule fois et dans le sens positif.
k
zk
1 z1
Figure 7.4 – La partie hachurée est le complémentaire de A dans Ω. L’intégrale sur le bord orienté
γ de A est la somme des intégrales sur les γi entourant des singularités.
Théorème 7.25 (théorème des résidus) : Soit f une fonction holomorphe sur Ω, sauf peut-
être en des singularités isolées zk . Soit γ le bord orienté d’un compact A contenu dans Ω, ne
passant par aucun des zk . Alors les zk contenus dans A sont en nombre fini et
Z X
f (z)dz = 2πi Res (f, zk ) . (7.37)
γ k
zk ∈A
La preuve repose une fois encore sur la déformation du contour γ : avec les hypothèses faites,
l’intégrale sur γ est une somme d’intégrales sur des contours γ1 , · · · , γk encerclant les points
z1 , · · · , zk , voir figure 7.4. Chacun de ces intégrales donne lieu au résidu correspondant.
Ce théorème est très utile pour calculer des intégrales comme sommes de résidus, ou inver-
sement des sommes, considérées comme sommes de résidus, comme des intégrales. Cela va être
amplement illustré au Chap. 8 et en TD.

Sphère de Riemann. Résidu à l’infini
Il est souvent utile de considérer le plan complexe complété par le point à l’infini : comme la
limite |z| → ∞ ne doit pas dépendre de arg z, ce point est unique ! Cela revient à “compactifier”
le plan C ' R2 en une sphère, la sphère de Riemann C ' S 2 .
u
S2 N
M
R2 = C
w
z
Figure 7.5 – Projections stéréographiques d’un point M depuis les pôles Nord N et Sud S.
Ceci peut être vu très explicitement par la projection stéréographique, voir Fig 7.5. Un point M de la sphère
unité S 2 de coordonnées (x, y, u), x2 + y 2 + u2 = 1, est projeté depuis le pôle Nord N en un point du plan
(complexe) d’affixe z. Vérifier que z = x+iy 1−u . Le pôle Nord a pour image le point à l’infini dans le plan. La
projection depuis le pôle Sud S donne de même w = x−iy 1+u , et on a pour un même point M la relation z.w = 1.
Le pôle Nord a cette fois pour image 0, tandis que S est appliqué à l’infini. Dans le langage de la géométrie
différentielle, on dit que l’on a besoin de deux cartes M 7→ z et M 7→ w pour décrire la sphère. Quand on
s’intéresse au voisinage du point z infini, on utilise la coordonnée w = 1/z.
On définit sur cette sphère C = S 2 les notions d’ouvert, de chemin différentiable, de chemin
fermé, de bord orienté d’un compact, etc : à distance finie, ce sont les notions déjà rencontrées,
et au voisinage de l’infini, on utilise la variable w = 1/z.
On dit alors qu’une fonction f (z) est holomorphe (resp. est méromorphe, a une singularité
déf
essentielle) à l’infini si g(w) = − w12 f (z = 1/w) est holomorphe (resp. est méromorphe, a une
singularité essentielle) au voisinage de w = 0. Pour une fonction f (z) méromorphe à l’infini, le
résidu à l’infini se définit par
I
1 1 1
Res (f, ∞) = − 2
f dw = Res (g(w), 0) (7.38)
2πi 0 w w
avec un contour autour de l’origine, ou encore, si n an z n est le développement de Laurent de
P
f (z) au voisinage de l’infini, Res (f, ∞) = − a−1 . Attention au signe ! ! Ce signe, qui provient du
changement de variable dans f (z)dz = g(w)dw, peut aussi être vu comme lié au changement
d’orientation d’un contour positif dans le plan complexe quand il est repoussé autour du point
à l’infini : il entoure alors ce point à l’infini dans le sens négatif (faites l’expérience avec un
élastique sur une orange !).

Par exemple, la fonction f (z) = z1 a un pôle simple à l’infini de résidu −1. En effet g(w) =
− w1 , donc (7.38) donne Res (f, ∞) = Res (g(w), 0) = −1.
Théorème des résidus généralisé
Le théorème des résidus admet une généralisation au cas où le contour est dessiné sur la sphère
de Riemann. Il s’énonce essentiellement comme le théorème 7.25 :
Théorème 7.26 (théorème des résidus généralisé) : Soit Ω un ouvert de la sphère de
Riemann et f une fonction holomorphe sur Ω, sauf peut-être en des singularités isolées zk . Soit
γ le bord orienté d’un compact A de S 2 contenu dans Ω, ne passant par aucun des zk ni par le
point à l’infini. Alors les zk contenus dans A sont en nombre fini et
Z X
f (z)dz = 2πi Res (f, zk ) (7.39)
γ k
zk ∈A
où la somme court sur tous les points singuliers zk ∈ A, y compris éventuellement le point à
l’infini.
Preuve : Si ∞ ∈ / A, on est dans le cadre du Théorème 7.25. Si ∞ ∈ A, soit Γ un contour fermé homotope à
un cercle, orienté positivement, contenu dans A, ne passant pas par ∞ et englobant le bord γ de A. On suppose
que ∞ est à l’extérieur de ce Γ (au sens de C) et que toutes les singularités autres que ∞ sont à l’intérieur
de Γ, (par exemple, on peut prendre pour Γ un cercle |z| = R suffisamment grand pour entourer toutes les
singularités à distance finie, tout en étant dans A.) Voir Fig. 7.6. On peut alors appliquer le théorème des
H P H
résidus au contour γ ∪ Γ. L’intégrale γ∪Γ f dz = 2πi zk ∈A Res (f, zk ), tandis que Γ f dz = −2πiRes (f, ∞).
zk 6=∞
H P
On a donc γ f dz = k 2πiRes (f, zk ), y compris l’éventuel zk à l’infini, q.e.d.
Plus simplement, on peut aussi arguer qu’il existe toujours un changement de variable z 7→ w qui ramène à
distance finie toutes les singularités contenues dans le compact A (en nombre fini !), voir Exercice 4. On se
ramène donc au théorème des résidus ordinaire.
k
zk
1 z1
8
Figure 7.6 – La partie hachurée est le complémentaire de A.
Exemple : reprenons la fonction f (z) = z1 et calculons I = γ f (z)dz le long d’un contour

H
positif n’entourant ni 0 ni ∞. Le théorème des résidus ordinaire nous dit que I = 0 (pas de

pôle à l’intérieur de γ) ; le théorème des résidus généralisé après déformation du contour en

deux contours entourant 0 et ∞ dans le même sens négatif nous dit I = −2πi(Res (f, 0) +
Res (f, ∞)) = −2πi(−1 + 1) d’après le calcul ci-dessus. On a bien I = 0. En général, par
le même argument, montrer que la somme des résidus (y compris à l’infini) d’une fraction
rationnelle s’annule.
Dans ce chapitre, je me suis largement inspiré de [4] et de [1], deux excellentes références
qui l’une et l’autre contiennent beaucoup d’informations supplémentaires.
Exercices
1. Justifier par un argument de déformation de contour le calcul de la transformation de
Fourier de la fonction gaussienne effectué aux chap.4 et 5.
déf 1
2. f holomorphe dans Ω, soit F (z) = f (z) . Montrer que F est méromorphe dans Ω.
3. Armé(e) du théorème des résidus, reprendre le calcul de (7.33) par (7.32). Montrer que
selon que n < 0 ou n ≥ 0, on peut refermer le contour soit autour a soit autour de b (et
l’infini ?).
4. Soit f une fonction holomorphe dans un ouvert Ω avec un nombre fini de singularités en
zk (y compris peut-être à l’infini). Montrer qu’il existe un changement de variable z = ϕ(w) qui
applique tous les zk sur des wk à distance finie. Soit f˜ = f ◦ϕ ; comparer les résidus Res (f, zk ) et
déf
Res (f˜.ϕ0 , wk ) et les théorèmes des résidus pour les fonctions f et f˜ϕ0 . Montrer que le théorème
des résidus généralisé découle alors du théorème usuel.
Appendix D. Système différentiel

Soit une fonction f : Ω ⊂ R2 → R (ou C) satisfaisant le système de deux équations aux
dérivées partielles
∂f (x, y) ∂f (x, y)
= P (x, y) = Q(x, y) , (D.1)
∂x ∂y
où P et Q sont des fonctions données de classe C 1 . Montrons qu’une condition nécessaire et
suffisante pour que le système admette (au moins) une solution locale est que
∂P (x, y) ∂Q(x, y)
= , (D.2)
∂y ∂x

la condition d’intégrabilité du système.

2 f (x,y) 2 f (x,y)
Il est clair que la condition est nécessaire, puisque ∂ ∂x∂y = ∂ ∂y∂x . Montrons qu’elle est
Rx
suffisante. Intégrons la première équation (D.1) en f (x, y) = P (x0 , y)dx0 + ϕ(y) où ϕ est une
fonction de y seulement, de classe C 1 . Avec les hypothèses, on peut dériver sous le signe somme
R x ∂P (x0 ,y) 0
et la deuxième équation (D.1) donne ∂f∂y (x,y)
= ∂y
dx + ϕ0 (y) = Q(x, y), qui est bien
R x ∂P (x0 ,y) 0
cohérente car ψ(x, y) := Q(x, y)− ∂y
dx ne dépend pas de x : ∂ψ(x,y) ∂x
= ∂Q(x,y)
∂x
− ∂P∂Y
(x,y)
=
Ry x 0
∂P (x ,y )0

Q(x, y 0 ) − dx0 dy 0 + const. et
R
0 par (D.2). On peut donc déterminer ϕ(y) = ∂y
finalement
Z x Z y Z x
∂P (x0 , y 0 ) 0

0 0 0
f (x, y) = P (x , y)dx + Q(x, y ) − dx dy 0 + const. (D.3)
∂y
qui satisfait bien (D.1).

Remarque. Cette construction est une construction locale, puisqu’implicitement, on a intégré P ou ψ le long de
segments à y ou x constants à partir d’un point de base donné, et que tout point de Ω ne peut pas toujours
être atteint ainsi à partir du même point de base. La construction est globale, en revanche, si Ω est un disque
ouvert ou un “pavé” ]a, b[×]c, d[ , pourquoi ?
On a retrouvé le résultat de la Proposition 7.10 : la forme ω = P dx + Qdy est fermée ssi (D.2) ; de plus elle
est exacte si le domaine est un disque ou un pavé ouvert.

Chapitre 8
Fonctions de variables complexes,

applications
8.1 Calcul d’intégrales, de transformées de Fourier, de

sommes etc
8.1.1 Calcul pratique des résidus
Par définition, le résidu Res (f, z0 ) d’une fonction en z0 est le coefficient a−1 de son développement
de Laurent au voisinage de z0 . Si f a un pôle simple en z0
Res (f, z0 ) = lim (z − z0 )f (z)

z→z0
et cette formule se généralise au cas où le pôle est d’ordre m, comme on s’en convainc aisément
1 dm−1
Res (f, z0 ) = lim ((z − z0 )m f (z)) . (8.1)
z→z0 (m − 1)! dz m−1
Si f est une fraction rationnelle P (z)/Q(z), avec un pôle simple en z0 , zéro simple de Q, il
peut être plus aisé de faire appel à la règle de L’Hospital

P P (z0 )
Res , z0 = 0 .
Q Q (z0 )
8.1.2 Lemmes de Jordan

Introduisons des notations commodes :
soit S(θ1 , θ2 ) le secteur du plan complexe {z = reiθ , r > 0, 0 ≤ θ1 ≤ θ ≤ θ2 } ; et γ(r; θ1 , θ2 )
l’arc de cercle |z| = r dans S(θ1 , θ2 ).

154 Chap.8. Fonctions de variables complexes, applications
Lemmes de Jordan : Soit f une fonction continue f : S(θ1 , θ2 ) → C.

1. Si zf (z) tend uniformément vers 0 sur l’arc γ(r; θ1 , θ2 ), θ2 ≤ 2π, quand r → 0, resp. r → ∞,
alors Z
lim+ f (z)dz = 0 ; (8.2)
r→0
resp.r→+∞
γ(r;θ1 ,θ2 )
2. Si f (z) tend uniformément vers 0 sur l’arc γ(r; θ1 , θ2 ), θ2 ≤ π, quand r → ∞, alors

Z
lim eiz f (z)dz = 0 ; (8.3)
r→∞ γ(r;θ1 ,θ2 )
Preuve du 2ème lemme : on prend le secteur S(0, π) (qui est le cas le plus défavorable). Comme |eiz | =
iθ
|eire | = e−r sin θ , avec sin θ ≥ 0 avec l’hypothèse sur le secteur, on peut majorer
Z Z
π Z π/2
iz
e f (z)dz ≤ |f (reiθ )re−r sin θ dθ ≤ |f (reiθ )| + |f ((rei(π−θ) )| re−r sin θ dθ .

γ(r;0,π) 0 0
Comme f → 0 uniformément à l’infini, ∀ > 0, ∃R tel que ∀r > R ∀θ ∈ [0, π], |f (reiθ )| ≤ . Donc pour r > R
Z Z π/2

e iz
f (z)dz ≤ 2 re−r sin θ dθ

γ(r;0,π) 0
Mais si 0 ≤ θ ≤ π/2, 0 ≤ 2θ/π ≤ sin θ comme on s’en convainc immédiatement. Donc

Z π/2 Z π/2
π π
re−r sin θ dθ ≤ re−2rθ/π dθ = (1 − e−r ) < ,
0 0 2 2
R
d’où il découle que pour tout r ≥ R, γ(r;0,π) eiz f (z)dz ≤ π, arbitrairement petit, q.e.d.

La preuve du premier lemme, plus facile, est laissée en exercice. Voir aussi TD.
8.1.3 Intégrales sur l’axe réel

R ∞ P (x)
Considérons l’intégrale sur l’axe réel d’une fraction rationnelle I = −∞ Q(x) dx. On suppose
que Q n’a pas de racine réelle. L’intégrale converge à l’infini si deg Q ≥ deg P + 2, ce que nous
supposerons. Procédons selon les étapes suivantes :
R R P (x)
– On considère l’intégrale −R Q(x) dx qui converge vers I quand R → ∞ ;
– on la remplace par l’intégrale sur le contour R R , où la contribution du cercle

tend vers zéro quand R → ∞, par le lemme de Jordan 1 ;
– le théorème des résidus nous donne alors
X
I = 2πi Res (P/Q, zj )
zéros zj de Q dans
demi-plan supérieur

§ 8.1. Calcul d’intégrales, de transformées de Fourier, de sommes etc 155
On aurait pu aussi refermer le contour dans le demi-plan inférieur, mais attention au signe ! (le
P
contour est alors orienté négativement). Donc aussi bien : I = −2πi zéros zj de Q dans Res (P/Q, zj ).
demi-plan inférieur
Question : que vaut dans ce cas le résidu à l’infini de P/Q ?
Nous rencontrerons beaucoup d’autres exemples de ce genre de calculs dans la suite.
8.1.4 Intégrales de fractions rationnelles trigonométriques

Considérons l’intégrale Z 2π
dt
I=
0 a + sin t
−it
avec a réel > 1. On écrit sin t = (e − e )/2i et on récrit cette intégrale en termes de z = eit
it
sur le cercle unité. Il vient

I I
2dz 2dz 2 2
I= 2
= = 2πi Res , z+ = 2πi
0 z + 2iaz − 1 0 (z − z+ )(z − z− ) (z − z+ )(z − z− ) z+ − z−
√
où z± = −ia ± i a2 − 1 sont les deux pôles, z+ étant le seul à l’intérieur du cercle. Finalement
I = √a2π2 −1 (qui est positif comme il se doit !).
R 2π
La même méthode s’applique à toute intégrale 0 R(cos t, sin t) dt où R est une fraction
rationnelle.
8.1.5 Transformées de Fourier

On s’intéresse à une intégrale de la forme
Z ∞
I= f (x)eikx dx k∈R
−∞
qui est la transformée de Fourier de f . On va à nouveau remplacer cette intégrale sur l’axe réel
par une intégrale de contour dans le demi-plan supérieur ou inférieur, selon que le signe de k
est > 0 ou < 0. En effet quand |z| → ∞, eikz f (z) tend vers zéro si <e ikz < 0 et si f (z) croı̂t
moins vite qu’une exponentielle (par exemple polynomialement) ; pour cela, si k > 0, il faut que
=m z > 0. On peut alors appliquer le 2ème lemme de Jordan, remplacer I par l’intégrale sur le
contour R R et utiliser le théorème des résidus. À l’inverse si k < 0, il faut refermer

le contour dans le demi-plan inférieur (en n’omettant pas le signe venant de l’orientation du
contour !).
Prenons comme exemple le cas de la fonction “lorentzienne” rencontrée aux chap. 4 et 5,
1 2 2 −1
f (x) = x2 +a 2 , a ∈ R, a > 0. La fonction f (z) = (z + a ) a deux pôles en ±ia de résidus

1
respectifs ± 2ia . Selon la discussion précédente

Z ∞
1 2πi Res (f (z)eikz , ia) = π e−ka si k > 0
ikx a
2 + a2
e dx =
−∞ x  −2πi Res (f (z)e , −ia) = π eka
ikz
si k < 0
a
ce que l’on regroupe en une formule unique

Z ∞
1 π
2 2
eikx dx = e−|k|a (8.4)
−∞ x + a a
en accord avec un résultat annoncé au § 4.2.1.

Notons qu’en prenant la partie réelle de I, nous obtenons une autre intégrale non triviale
R∞ 1 π −|k|a
I = −∞ x2 +a2 cos kx dx = a e .
8.1.6 Sommes infinies

Notons en préambule que cos πz est une fonction entière, que sin πz a des zéros en z = n ∈ Z,
et que cotan πz = cos πz/ sin πz n’a que des pôles de résidu 1/π en ces mêmes z = n.
Considérons alors la série X
S= f (n)
n∈Z
où f est une fonction méromorphe qui n’a pas de pôle réel et qui tend suffisamment vite vers
zéro à l’infini pour assurer la convergence. On peut écrire f (n) = Res (πf (z)cotan πz, n) et
la somme S, limitée d’abord à −N ≤ n ≤ N , peut être vue comme venant de l’intégrale de
1
2i
f (z)cotan πz sur l’un des contours successifs figurés ici
N N
où la contribution des deux demi-cercles tend vers zéro quand N → ∞ (Jordan 1 !) ; à la limite,
le dernier contour entoure les pôles de f (z) en dehors de l’axe réel dans le sens négatif. Donc
X
S=− Res (πf (z)cotan πz, zj ) .
pôles zj de f
en dehors de l’axe réel

§ 8.1. Calcul d’intégrales, de transformées de Fourier, de sommes etc 157
1 π
P
Exemple. S = n∈Z n2 +a 2 avec a > 0. Les pôles non réels de z 2 +a2 cotan πz sont en z = ±ia
π
et ont pour résidu − 2a coth πa. Finalement S = πa coth πa. On vérifie que quand a → 0,
S ∼ 1/a2 comme attendu. Exercice : dans la limite a → 0, soustraire le terme n = 0 et vérifier
que l’on retrouve l’expression bien connue n≥1 n12 = π 2 /6.
P
n
Par une méthode analogue faisant appel au 1/ sin plutôt qu’au cotan , calculer n≥1 (−1)
P
n4
,
réponse dans [1], p. 111.
8.1.7 Intégrales sur un arc. Pôles sur l’axe réel

Supposons que f est holomorphe dans un secteur du type défini plus haut au § 8.1.2 :
S = {z : |z| > 0, 0 ≤ θ1 ≤ arg z ≤ θ2 ≤ π} avec un pôle simple à l’origine, et qu’on veuille
calculer limr→0 γ(r;θ1 ,θ2 ) f (z)dz. On écrit f (z) = az + g(z) où g est holomorphe à l’origine et
R
R
a = Res (f, 0). Par Jordan.1, limr→0 γ(r) g(z)dz = 0 et donc
Z Z
dz
lim f (z)dz = a = ia(θ2 − θ1 ) . (8.5)
r→0 γ(r;θ1 ,θ2 ) γ(r;θ1 ,θ2 ) z
R∞ sin x
Application au calcul de I = 0 x
dx. On écrit
∞ − ∞
eix eix
Z Z Z
1 sin x 1
I= dx = lim dx + dx . (8.6)
2 −∞ x 2i →0 −∞ x x
eix
Mais l’intégrale de x
sur le contour ci-dessous est nulle
r r
puisque le contour n’enclôt aucun pôle. Dans cette intégrale de contour, la contribution sur l’axe
réel tend vers 2iI quand r → ∞ et → 0, d’après (8.6) ; la contribution du grand cercle s’annule
par Jordan.2 quand r → ∞ ; et celle sur le petit cercle est donnée par le calcul précédent (8.5).
Il reste dans cette limite
eiz
Z
2iI = dz = iπ
γ(,0,π) z
d’où finalement I = π2 .

8.2 Fonctions multivaluées
8.2.1 Points de branchement, feuillets, surface de Riemann
On a déjà rencontré au § 6.2 la notion de fonction multivaluée avec le logarithme complexe,

dont les différentes déterminations dans le plan complexe privé de l’origine (plan “pointé”
C∗ = C\{0}) diffèrent d’un multiple entier de 2πi. Considérons le plan privé d’une demi-droite,
par exemple C\R− , donc −π < arg z < π : c’est un domaine simplement connexe, le logarithme
y admet une détermination unique, dite détermination principale. Mais on peut très bien choisir
une autre demi-droite ∆ partant de l’origine, ou toute courbe C joignant l’origine à l’infini. Dans
le plan privé de cette demi-droite ou courbe, le logarithme admet une détermination unique.
C\C est dit plan coupé le long de C, C est la “coupure”, l’origine et le point à l’infini en sont les
points de branchement. (Que l’infini est un point de branchement du log se voit comme toujours
par changement de variable z 7→ w = z1 : log z = − log w. . .)
Le logarithme n’est pas la seule fonction multivaluée. La fonction racine carrée (ou toute
autre racine) donne un autre exemple. En effet quand on écrit z = ρeiθ , on peut penser définir
1 √ √ √ √
z 2 alias z par z = ρiθ/2 . Mais θ étant défini à 2π près, θ/2 l’est à π près et z est
défini à un signe près. C’est un problème que nous connaissons bien sur les réels ; mais ici sur
les complexes, il prend une nouvelle dimension puisqu’en suivant un chemin continu dans le
plan complexe, on peut passer d’une détermination à l’autre. On va à nouveau introduire une
coupure du plan complexe partant de l’origine et définir une détermination de la racine carrée
dans ce plan coupé. Par exemple, en coupant le long de l’axe réel négatif, donc en prenant à
nouveau −π < arg z < π, on obtient dans C\R− la détermination usuelle de la racine, telle que
√
pour z réel > 0, z > 0.
Les points de branchement dépendent de la fonction considérée et peuvent être n’importe
√
où dans le plan complexe complété. Par exemple 1 − z a un point de branchement en 1 et un
√ p
à l’infini. Les points de branchement de 1 − z 2 sont ±1 ; ceux de (z 2 − a2 )(z 2 − b2 ) sont en
±a et ±b, et les coupures peuvent être choisies entre a et −a d’une part, et b et −b de l’autre,
(ou entre −a et −b et entre a et b, justifier ce point), etc.
Plutôt que de parler de fonction univaluée dans le plan (coupé), on peut préférer une autre
présentation. Étant donnée un choix de coupure(s) et une détermination, on peut associer les
autres déterminations à d’autres copies du plan coupé –on parle des différents feuillets de la
fonction considérée–, puis recoller ces feuillets le long de la (ou des) coupure(s), en suivant
par continuité les déterminations de la fonction. L’objet obtenu par ce recollement est appelé
surface de Riemann de la fonction considérée. Sur cette surface, qui est un revêtement à plusieurs
feuillets du plan complexe initial, la fonction est univaluée.

§ 8.2. Fonctions multivaluées 159
0 x 0 x
feuillet 1 feuillet 2
√
Figure 8.1 – Les deux feuillets de la fonction z : le bord inférieur de la coupure du feuillet 1 est
recollé avec le bord supérieur de celle du feuillet 2 et vice versa.
√
Figure 8.2 – La surface de Riemann de la fonction z : les deux feuillets sont recollés le long du
demi-axe réel négatif (en bleu).
√
Par exemple pour z dans le plan coupé le long de R− , la figure 8.1 représente les deux
feuillets, la figure 8.2 montre la surface de Riemann. Noter que (contrairement aux apparences)
cette surface de Riemann est simplement connexe : un chemin fermé faisant deux fois le tour de
l’origine est homotope à zéro, puisqu’il peut être contracté sans rencontrer de singularité (de la
fonction). Cela apparaı̂t peut-être plus clairement sur la Fig. 8.3 qui représente le voisinage de
l’origine, une fois la surface de Riemann dépliée. La position des coupures est arbitraire et le
point O n’est pas singulier. Le même dessin devrait être effectué (dans une autre coordonnée)
au voisinage du point à l’infini, avec la même conclusion. En définitive la surface de Riemann
√
de la fonction z est identifiée à la sphère de Riemann. Elle est donc simplement connexe. 1
La même construction s’applique à toute fonction multivaluée. La surface de Riemann de la
racine carrée a deux feuillets, celle du logarithme en a une infinité. Celle de z 1/3 en a trois, celle
p
de z α , α réel irrationnel en a une infinité. Celle de la fonction (z 2 − a2 )(z 2 − b2 ) en a quatre
etc. On trouve sur le web d’admirables figures de ces surfaces de Riemann . . . par exemple
http://en.wikipedia.org/wiki/File:Riemann surface log.jpg
1. Cela n’est pas le cas général, la surface de Riemann d’une fonction plus compliquée n’est en général pas
simplement connexe, elle a un genre (= nombre de “poignées”) qui dépend du nombre et de l’ordre des points
de branchement

I
II
II I
I
II
III
III
II I
1 1
Figure 8.3 – La surface de Riemann des fonctions z 2 (en haut) et z 3 (en bas) au voisinage de 0.
A gauche, les trois feuillets avec en hâchures ou en couleurs les prescriptions de recollement ; à droite,
après dépliement et recollement.

§ 8.2. Fonctions multivaluées 161
8.2.2 Intégrales de Cauchy de fonctions multivaluées

Une fonction multivaluée comme z α ou log z est holomorphe en dehors de ses points de
branchement (et de ses éventuelles autres singularités). Rien n’interdit d’utiliser le théorème de
Cauchy et ses corollaires le long de chemins fermés évitant ces singularités et continus dans les
différents feuillets.
r x
0
Figure 8.4 –
R∞
Considérons par exemple l’intégrale I = 0 Fx(x) α dx où 0 < α < 1 et où F est une fraction
rationnelle sans pôle sur le demi-axe x ≥ 0 ; on suppose (pour la convergence) que F → 0

à l’infini (donc au moins aussi vite que 1/z). Pour étendre f (z) = F (z)/z α à des valeurs
complexes de z, on choisit une détermination de z α , par exemple dans le plan coupé le long de
l’axe réel positif, 0 < arg z < 2π. Considérons alors l’intégrale γ Fz(z)
H
α dz le long du contour de
la figure 8.4. Comme zf (z) → 0 quand |z| → 0 et → ∞, les deux arcs de cercle γ(r) et γ(R)
ne contribuent pas dans les limites r → 0 et R → ∞ (Jordan-1), la détermination de f sur le
contour réel supérieur est réelle, celle sur le contour inférieur a un facteur relatif e−2πiα . On a
donc
X
(1 − e−2πiα )I = 2πi Res (f (z))
où la somme court sur tous les pôles de F , réels négatifs ou complexes.
R ∞ dx
Exemple : I = 0 xα (1+x) . Le seul pôle est en −1 = eiπ (choix de la détermination !), son
résidu est e−iπα , d’où I = sinππα .
R∞
Autre exemple : J = 0 F (x) log x dx où F est une fraction rationnelle sans pôle sur le
demi-axe x ≥ 0 ; on suppose (pour la convergence) que xF (x) → 0 à l’infini. L’astuce est
cette fois de considérer f (z) = F (z)(log z)2 avec un choix de coupure du log le long de l’axe
réel positif. On intègre sur le même contour de la figure 8.4. À nouveau les deux arcs de
cercle ne contribuent pas, les deux déterminations de log2 z le long de l’axe réel sont log2 x
R∞
(bord supérieur) et (log x + 2πi)2 (bord inférieur), donc 0 F (x)(log2 x − (log x + 2πi)2 )dx =
R∞ R
−4πiJ −4π 2 0 F (x)dx = 2πi Res (F (z)(log z)2 ). Il reste à calculer F (x)dx. Toutefois si F
P
est réel (sur l’axe réel), cette dernière intégrale est réelle et en prenant les parties réelle et imagi-

R∞
F (x) log x dx = − 21 <e Res (F (z)(log z)2 ),
P
naire de la relation précédente on obtient J = 0
R∞ 1
Res (F (z)(log z)2 ).
P
0
F (x)dx = − 2π =m
8.3 Fonctions harmoniques

Définition 8.1 : Une fonction de deux variables réelles x et y définie dans un ouvert Ω de R2
est dite harmonique dans Ω si elle est de classe C 2 (deux fois continûment différentiable) et
satisfait l’équation
∆f = 0 (8.7)
où le laplacien ∆ est l’opérateur différentiel
∂2 ∂2
∆= + . (8.8)
∂x2 ∂y 2
En raison de l’apparition du laplacien dans de nombreuses équations de la physique, équation

de Poisson (3.26), équation des ondes, équation de la chaleur, . . . les fonctions harmoniques y
jouent un rôle important.
Introduisant comme au § 7.1.3 les variables z = x + iy et z̄ = x − iy et les opérateurs
∂
différentiels ∂z et ∂∂z̄ , on vérifie immédiatement que
∂2
∆=4 . (8.9)
∂z∂ z̄
∂2f
Une fonction f (z, z̄) satisfaisant ∂z∂ z̄
= 0 est donc harmonique.
Théorème 8.1 : Toute fonction holomorphe est harmonique.
En effet si f est holomorphe (dans Ω) elle est indéfiniment dérivable ; on a ∂f

∂ z̄
= 0, donc aussi
∆f = 0.
En prenant les parties réelle et imaginaire de f il en découle :
Corollaire : La partie réelle et la partie imaginaire d’une fonction holomorphe sont harmo-
niques.
Exemple : En tout point non nul du plan complexe, log z est holomorphe, donc sa partie réelle
log |z| est harmonique.
La réciproque n’est vraie que localement :
Proposition 8.2 : Toute fonction réelle g(x, y) harmonique dans un ouvert Ω est au voisinage
de chaque point de Ω la partie réelle d’une fonction f , holomorphe au voisinage de ce point,
déterminée à l’addition d’une constante près.

§ 8.4. Méthode du col 163
Cette propriété locale devient globale (vraie en tout point) dans un ouvert Ω simplement
connexe. Pour la preuve, voir [4] p. 125 ; voir aussi [1] p.124-125.
On se rappelle (cf Théorème 7.18) qu’une fonction holomorphe satisfait la propriété de
moyenne : en tout point, sa valeur au centre d’un petit disque fermé contenu dans Ω égale la
moyenne de ses valeurs sur le bord du disque.
Théorème 8.3 : Toute fonction harmonique satisfait en tout point de Ω la propriété de

moyenne : pour r assez petit
Z π
1
u(x0 , y0 ) = u(x0 + r cos θ, y0 + r sin θ)dθ .
2π −π
Cela découle de la Proposition 8.2 : pour toute fonction harmonique réelle u et tout point
de Ω il existe une fonction f holomorphe dans un disque centré en ce point, de partie réelle u
et qui satisfait la propriété de moyenne ; en prenant la partie réelle on voit que u satisfait la
propriété de moyenne.
Au chapitre 7, Théorème 7.21, nous avons montré que toute fonction possédant la propriété
de moyenne obéit aussi au principe de maximum. Il en est donc ainsi pour toute fonction
harmonique :
Proposition 8.4 : Toute fonction u réelle harmonique dans Ω est ou bien constante, ou bien
n’a en aucun point de Ω un maximum local ou un minimum local.
Cela s’interprète facilement en termes des dérivées secondes de u. Un maximum (resp. minimum)
2 2
local en a ∈ Ω signifierait que ∂∂xu2 et ∂∂yu2 sont non nuls et de même signe, en contradiction avec
l’équation (8.7).
Ces propriétés trouvent des applications physiques, par exemple en électrostatique, dans
l’étude du potentiel créé par une distribution de charges. Comme on l’a rappelé au chapitre 3.6,
la loi de Gauss implique que le potentiel électrostatique créé par une distribution de charges
est une fonction harmonique en tout point distinct des positions des charges. Une autre appli-
cation est en aérodynamique dans le calcul de la portance d’une aile d’avion, voir [1], chap. 7.
Malheureusement le manque de temps ne permettra pas d’explorer les nombreuses applications
des considérations précédentes.
8.4 Méthode du col

On est souvent confronté en physique au problème suivant : on cherche à calculer la limite
d’une intégrale de la forme Z
Iα = e−αf (z) dz (8.10)
γ

quand le paramètre α tend vers l’infini. f est supposée holomorphe sur un ouvert Ω indépendant
de α, γ est un chemin contenu dans Ω.
Il existe plusieurs versions de ce problème, la méthode du col, la méthode de Laplace, la
méthode de la phase stationnaire, etc. Nous nous bornerons à une discussion sommaire et à un
exemple.
8.4.1 Méthode du col

L’idée intuitive est de chercher à minimiser la partie réelle de αf tout en empêchant sa
partie imaginaire de varier trop rapidement, ce qui risquerait de causer des compensations dans
l’intégrale. On va préciser cette idée.
Étant donnée l’intégrale (8.10), où nous prendrons α réel positif, supposons que f est holo-
morphe dans un ouvert Ω contenant le contour γ et qu’on sache déformer continûment γ en γ 0
sans rencontrer de singularité de f de telle façon que
– (i) le long de γ 0 , =m f est constante ;
– (ii) il existe le long de γ 0 un point z0 , dit col, tel que f 0 (z0 ) = 0 ;
– (iii) <e f (z) passe par un minimum local en z0 ;
La condition =m f = const. détermine en général le chemin γ 0 . La phase de l’exponentielle est
alors constante. Développons alors f (z) au voisinage du col. Puisque f 0 (z0 ) = 0,
1
f (z) = f (z0 ) + (z − z0 )2 f 00 (z0 ) + o(z − z0 )2
2
et avec f 00 (z0 ) = ρeiθ , z − z0 = reiϕ ,
1 2
<e (f (z) − f (z0 )) = r ρ cos(2ϕ + θ) + o(r2 )
2
1 2
=m (f (z) − f (z0 )) = r ρ sin(2ϕ + θ) + o(r2 ) (8.11)
2
sur lequel on lit que, pour satisfaire (i), le chemin γ 0 doit être tel que sin(2ϕ + θ) = 0 ce qui
donne deux directions possibles, orthogonales l’une à l’autre. Les directions médianes, où le cos
s’annule, sont celles où la partie réelle change de signe, voir Fig. 8.5. Pour assurer que la partie
réelle passe bien par un minimum et non un maximum, c’est le chemin passant dans les zones
II qu’on doit choisir. Quand α → ∞, le minimum de <e (αf ) est de plus en plus accentué, de
plus en plus “piqué”, d’où le nom de “steepest descent” donné à la méthode dans la littérature
anglo-saxonne. C’est ce qui fait que la contribution dominante à l’intégrale vient de ce chemin.
Finalement on s’attend à un comportement asymptotique (et on peut justifier précisément avec
des hypothèses adéquates sur f que nous ne détaillerons pas ici)
Z ∞
1 00 2
−αf (z0 )
Iα ≈ e e− 2 αf (z0 )u du
−∞

12
−αf (z0 ) 2π
≈ e . (8.12)
αf 00 (z0 )
Re f
I
II
II
I
Figure 8.5 – Col de <e f et trajectoires de =m f constant.
8.4.2 Commentaires et variantes
Dans l’intégrale (8.10) le paramètre α prenant de grandes valeurs était explicite et factorisé
dans l’exponentielle. Il peut aussi arriver que l’on s’intéresse au comportement d’une intégrale
où cette dépendance n’est pas aussi manifeste. Mais l’idée est la même : on cherche les points
stationnaires (cols) de la fonction en exponentielle. On en verra un exemple ci-dessous avec
la fonction Γ. La méthode du col possède aussi des variantes dont il est utile de connaı̂tre
l’existence mais que nous ne ferons que mentionner brièvement :
Méthode de Laplace, col réel
C’est la situation où on intègre dans (8.10) une fonction f réelle.

Z
Jα = e−αf (x) dx (8.13)
R
On n’a plus la liberté de déformer le contour d’intégration, mais un résultat similaire s’applique :
le comportement dominant de l’intégrale est à nouveau donné par le point x0 où f est minimale.
Comme dans le cas complexe, on développe f au voisinage de ce point
1
f (x) ≈ f (x0 ) + (x − x0 )2 f 00 (x0 ) + o(x − x0 )2
2

et l’intégrale est approximée par une intégrale gaussienne

s
Z ∞
− 21 αf 00 (x0 )x2 2π
Jα ≈ e−αf (x0 ) e dx = e−αf (x0 ) .
−∞ αf 00 (x0 )
Voir ci-dessous l’exemple de la fonction Γ.
Méthode de la phase stationnaire

Une autre variante est celle d’une intégrale sur R d’une exponentielle d’une fonction imaginaire
Z
0
Jα = eiαf (x) dx (8.14)
R
où f est réelle. Cette fois encore il s’agit de chercher un extremum ou un point stationnaire de f , où les
oscillations de la phase αf sont moins rapides.
On parle de méthode de phase stationnaire, et on écrit
12
2πi
Jα0 ≈e iαf (x0 )
00
.
f (x0 )
On rencontrera la méthode du col et ses avatars dans de nombreux domaines de la physique,

en Mécanique Statistique (limite thermodynamique, modèles à grand nombre d’états, . . .), en
Mécanique Quantique et en Optique (vitesse de groupe, limite de courte longueur d’onde. . .),
en théorie des champs (méthode semi-classique, où le paramètre grand est 1/~), etc.
8.4.3 Fonction Γ. Formule de Stirling

Nous illustrerons la méthode du col (réel) sur le cas de la fonction Gamma d’Euler
Z ∞
us−1 e−u du .
déf
Γ(s) = (8.15)
0
Observons d’abord que cette intégrale est absolument convergente pour <e s > 0. On calcule
aisément Γ(1) = 1 et, par intégration par parties,
Γ(s + 1) = sΓ(s)
d’où il découle immédiatement que pour s = n ≥ 1 entier
Γ(n) = (n − 1)!
Γ(s) extrapole donc à des valeurs réelles ou complexes la fonction factorielle.

Intéressons-nous à l’asymptotique de la fonction Γ(s + 1). Selon la méthode précédente, on
écrit l’intégrand ef (u) et on cherche les points stationnaires de f (u) = s log u − u, soit ici u0

solution de s/u0 = 1, donc u0 = s. On développe alors f (u) = f (u0 ) + (u − u0 )f 0 (u0 ) + 21 (u −

u0 )2 f 00 (u0 ) + · · · mais f 0 (u0 ) = 0, et f 00 (u0 ) = −1/s, donc
f (u0 )
Z ∞
1 2 00 √
Γ(s + 1) ≈ e e 2 v f (u0 ) dv = 2πs es log s−s
−∞
ou encore s s √
Γ(s + 1) = 2πs (1 + O(1/s)) ,
e
où on reconnaı̂t la formule de Stirling pour la factorielle asymptotique. . . Le lecteur courageux
peut-il/elle calculer le terme suivant en 1/s ? Attention, il faut pour cela développer la fonction
f jusqu’au terme (u − u0 )4 (et non pas seulement (u − u0 )3 , pourquoi ?).
La discussion a suivi H. Cartan [4] et W. Appel [1]. Pour plus de détails sur les subtilités
de la méthode du col, consulter C. Aslangul [2], chap. 7.


Chapitre 9
Transformation de Laplace
La transformation de Laplace fait passer d’une fonction f à valeurs réelles ou complexes

d’une variable t réelle non négative : f R+ → R ou C, à une fonction d’une variable complexe
R∞
p, fˆ(p) = 0 e−pt f (t)dt, avec bien sûr des conditions sur f pour assurer la convergence. Elle
est donc apparentée à la transformation de Fourier, mais en diffère par quelques points que
nous allons examiner. Comme la transformation de Fourier, la transformation de Laplace est
un outil puissant dans l’étude des équations différentielles ou aux dérivées partielles et des
systèmes linéaires en physique.
9.1 Définitions et premières propriétés
9.1.1 Abscisse de sommabilité et transformée de Laplace

On rencontre souvent en physique des fonctions définies seulement sur la demi-droite réelle
positive R+ . C’est par exemple le cas dans un système dynamique soumis au temps t = 0 à
une excitation (une “source”) : on s’intéresse à sa “réponse” f (t) aux temps ultérieurs t ≥ 0.
On peut aussi considérer que la fonction f est définie pour tout t ∈ R mais n’est non nulle que
pour t ≥ 0. D’où la
Définition 9.1 : On appelle fonction causale une fonction t 7→ f (t) nulle pour t < 0.
Définition 9.2 : Pour une fonction causale, on définit la transformée de Laplace par
Z ∞
ˆ déf
f (p) = e−pt f (t)dt (9.1)
0

170 Chap.9. Transformation de Laplace
R∞
mais aussi, compte tenu de l’hypothèse d’annulation à t < 0, par −∞ e−pt f (t)dt.
La transformée de Lapace est notée selon les auteurs (et les circonstances !) fˆ(p), L[f ](p),
Lf (p), etc, et la transformation parfois f (t) A fˆ(p).
Il reste à préciser les conditions de convergence. On va d’abord supposer que f est localement
intégrable (c’est-à-dire intégrable sur tout compact, cf Déf. 3.5), ce qui n’interdit pas à la
1
fonction d’avoir une singularité intégrable à distance finie, comme par exemple |t − 1|− 2 . Par
0
ailleurs on observe que si |f (t)|e−st est intégrable pour s ∈ R, il en est de même de |f (t)|e−s t
pour tout s0 > s. (On rappelle que la fonction f est causale, seule nous intéresse la convergence
en +∞.) Cela conduit à la
Définition 9.3 : On appelle abscisse de sommabilité de f la borne inférieure α des s ∈ R tels

que f (t)e−st est intégrable.
α = inf{s ∈ R : |f (t)|e−st est intégrable} .

déf
(9.2)
Cette abscisse de sommabilité peut être infinie, voir plus bas.

Plus précisément, si on pose p = x+iω, l’intégrabilité de f (t)e−pt équivaut à celle de f (t)e−xt ,
et est assurée pour x > α. La transformée de Laplace est donc définie pour x = <e (p) > α 1 .
Inversement l’intégrale ne converge certainement pas pour x < α. Pour x = α, on peut avoir
R∞
ou non intégrabilité au sens de Lebesgue ; l’intégrale impropre −∞ e−pt f (t)dt peut être non
intégrable de Lebesgue mais semi-convergente pour certaines valeurs de p, permettant ainsi
d’étendre la transformée de Laplace à ces valeurs : il faut se livrer à une étude cas par cas pour
le déterminer. En résumé,
Proposition 9.1 : La transformée de Laplace est définie dans le demi-plan ouvert de somma-
bilité, <e (p) > α.
Heuristiquement, l’existence d’une abscisse de sommabilité finie ou −∞ signifie que f a une

croissance au plus exponentielle à l’infini.
Exemples : a) Une fonction constante a une abscisse de sommabilité nulle ; la transformée de
Laplace est définie pour x = <e (p) > 0. Ainsi pour f = 1 (pour t ≥ 0 c’est-à-dire en fait pour
la fonction de Heaviside H !).
Z ∞ Z ∞
−pt 1
H(p) =
b H(t)e dt = e−pt dt = [−e−pt ]∞0
−∞ 0 p
donc H(p)
b = p1 pour <e (p) > 0. On note que dans ce cas, H b peut être étendue (prolongée) à
1
tout p 6= 0, en particulier pour <e (p) = 0, =m (p) = ω 6= 0 avec le résultat H(iω)
b = iω .
1. Certains auteurs appellent original une fonction f ayant les propriétés énumérées ci-dessus : causalité,
intégrabilité locale, existence d’une abscisse de sommabilité, et image sa transformée de Laplace.

b) f (t) = 1/(1 + t2 ) a aussi une abscisse de sommabilité nulle ; mais la transformée de Laplace
est définie pour tout x = <e (p) ≥ 0. (Son expression implique des “fonctions spéciales”, le
sinus intégral et le cosinus intégral.)
2
c) La fonction e−at pour a > 0 a une abscisse de sommabilité α = −∞ : la transformée de
Laplace existe pour tout p ; à l’inverse pour a < 0, f n’a pas d’abcisse de sommabilité (ou si on
veut, α = ∞) et la transformée de Laplace n’est définie pour aucun p. Nous verrons d’autres
exemples au § 9.1.3 ci-dessous.
9.1.2 Holomorphie de fˆ, etc

Proposition 9.2 : La transformée de Laplace fˆ(p) est une fonction holomorphe, donc analy-
tique, de la variable p dans le demi-plan ouvert de sommabilité.
Preuve : Établissons d’abord que l’abscisse de sommabilité α0 de tf (t) égale celle de f notée α. Heuristiquement,
si |f | a une croissance exponentielle en eαt à l’infini, il en est de même de t|f (t)|. Plus précisément, utilisons
une évidence utile : si g domine f (|f | < |g|) pour t assez grand, l’intégrabilité de g e−st assure celle de
f e−st , donc l’abscisse de sommabilité de f est inférieure ou égale à celle de g. Ici, si t > 1, |tf (t)|e−st >
|f (t)|e−st , donc α ≤ α0 ; mais par ailleurs comme t|f | < et |f | pour tout > 0 et t assez grand, α0 ≤ α +
R∞
quel que soit , donc finalement α = α0 , qed. Donc dans le demi-plan ouvert <e (p) > α, 0 tf (t)e−pt est
absolument convergente, on peut donc dériver fˆ(p) sous le signe somme par rapport à <e (p) ou à =m (p) ; on
∂ fˆ(p) R∞ −pt ∂ fˆ(p)
trouve ∂<e (p) = − 0 tf (t)e = −i ∂=m (p) , les conditions de Cauchy–Riemann sont satisfaites et on a donc
dfˆ(p) ˆ
R∞
0
dp = f (p) = − 0 tf (t)e
−pt
. fˆ est dérivable dans le demi-plan, c’est-à-dire holomorphe, donc analytique.
R∞
Par récurrence la dérivée n-ième vaut fˆ(n) (p) = (−1)n 0 tn f (t)e−pt .
Relation avec la transformée de Fourier
On aura noté que la transformée de Fourier d’une fonction causale est sa transformée de
Laplace à <e (p) = 0, c’est-à-dire sur l’axe imaginaire.
Z ∞ Z ∞
˜
f (k) = F[f ](k) = ikt
e f (t)dt = eikt f (t)dt = fˆ(−ik) . (9.3)
−∞ 0
Selon le type de croissance de la fonction f pour t → +∞, on peut voir si l’axe imaginaire est
ou non dans le domaine de définition de fˆ et conclure à l’existence ou non de la transformée
de Fourier :
– si f croı̂t moins vite qu’une exponentielle, α < 0, donc la transformée de Fourier existe ;
– si f croı̂t plus vite que toute puissance mais au plus comme une exponentielle, on a α > 0,
l’axe imaginaire n’est pas dans le domaine de définition de fˆ et la transformée de Fourier
n’existe pas ;
– dans le cas intermédiaire où α = 0, la transformée de Fourier n’existe pas toujours au
sens des fonctions.

Comportement asymptotique de fˆ
Proposition 9.3 : Soit f une fonction causale d’abscisse de sommabilité α et fˆ sa transformée

de Laplace. Si x > α, alors fˆ(x + iω) → 0 quand ω → ±∞
Cela résulte du lemme 4.5 de Riemann–Lebesgue,

Z ∞
f (t)e−xt e−iωt dt = 0

lim
ω→±∞ 0
puisque f (t)e−xt ∈ L1 (R).
9.1.3 Exemples
a) On a vu la transformée de Laplace de f = 1 plus haut. Considérons maintenant celle
de f (t) = t. Un calcul immédiat, par intégration par parties ou par dérivation sous le signe
somme, donne pour <e (p) > 0
Z ∞ Z ∞
ˆ −pt d 1
f (p) = te dt = − e−pt dt = 2 ,
0 dp 0 p
qui est prolongeable en une fonction méromorphe avec un pôle en 0. Plus généralement, quelle
est la transformée de tn ?
b) f (t) = cos t a pour abscisse de sommabilité α = 0 et pour <e (p) > 0 :
∞ ∞ ∞
1 e(i−p)t e−(i+p)t
Z Z
1 p
fˆ(p) = −pt
e cos t dt = e −pt it it
(e + e ) dt = − = 2 ,
0 2 0 2 i−p i+p 0 p +1
qui est prolongeable en une fonction méromorphe avec deux pôles en ±i.
c) f (t) = eat , avec a ∈ C a pour abscisse de sommabilité α = <e (a) et pour <e (p) > <e (a) :
Z ∞
ˆ 1
f (p) = e−(p−a)t dt = ,
0 p−a
à nouveau prolongeable en une fonction méromorphe avec un pôle en a.

d) Au vu de ces exemples, il est tentant de penser que la transformée de Laplace est toujours prolongeable
en une fonction méromorphe. Cela est souvent le cas mais n’est pas vrai en général. Ainsi f (t) = 1/(t + 1) (fois
R∞
H(t), fonction causale !) a une transformée de Laplace ep p e−u du p
u (e fois la “fonction Gamma incomplète”)
bien définie pour <e (p) > 0 mais dont on montre qu’elle a un point de branchement en 0.
Cela apparaı̂t aussi sur la transformée de Laplace de la fonction f (t) = tκ , κ réel, dont l’abcisse de sommabilité
est α = 0. Se rappelant la définition de la fonction Γ dans (8.15), on a pour κ > −1 et p réel d’abord fˆ(p) =
R ∞ −pt κ R∞
0
e t dt = p−κ+1 0 e−u uκ du = Γ(κ+1) ˆ Γ(κ+1)
pκ+1 . On invoque alors l’holomorphie pour dire que f (p) = pκ+1 reste
vrai dans le demi-plan complexe, <e (p) > 0. Pour κ > −1 non entier, fˆ(p) a un point de branchement en 0.

§ 9.2. Inversion, dérivation, convolution etc 173
9.2 Inversion, dérivation, convolution etc

9.2.1 Inversion de la transformation de Laplace
La transformée de Laplace de f en p = x + iω peut s’écrire comme une transformée de
Fourier d’une fonction reliée à f :
Z ∞
ˆ
f (x + iω) = H(t)f (t)e−xt e−iωt dt = F[H(t)e−xt f (t)](−ω) .
−∞
Utilisant alors la formule d’inversion de la transformée de Fourier, pour t un point où H(t)f (t)
est continue (cf Théorème 4.6)
Z ∞
1
H(t)f (t)e−xt
= fˆ(x + iω)eiωt dω ,
2π −∞
donc Z ∞ Z
1 1
H(t)f (t) = (x+iω)t
e fˆ(x + iω)dω = fˆ(p)ept dp (9.4)
2π −∞ 2πi Dx
où l’intégration en p est effectuée le long d’une droite de Bromwich
déf
Dx = {x + iω; ω ∈ R} . (9.5)
Bien noter que cette formule donne un résultat indépendant de x > α, domaine où la trans-
formée de Laplace est holomorphe, grâce au théorème de Cauchy. Il convient aussi de s’assurer
que cette expression s’annule bien pour t < 0. En effet pour t < 0, le lemme de Jordan 2 nous dit
que l’on peut refermer le contour d’intégration par un grand cercle dans le demi-plan à droite
de la droite <e (p) = x, mais le contour est complètement dans le domaine d’holomorphie, donc
le résultat est nul, comme attendu pour une fonction causale.
Théorème 9.4 : Soit f une fonction causale d’abscisse de sommabilité α et fˆ sa transformée

de Laplace. Alors en tout point de continuité de f et avec x > α quelconque
Z x+i∞
1
f (t) = fˆ(p)ept dp
2πi x−i∞
Exemple : Prenons fˆ(p) = p−a 1

(transformée de Laplace de eat , voir plus haut). Pour x >
<e (a), on calcule
Z x+i∞ Z x+iR
1 ˆ pt 1 1 pt
f (t) = f (p)e dp = lim e dp
2πi x−i∞ R→∞ 2πi x−iR p − a
Si t > 0, on peut refermer le contour par un demi-cercle dans le demi-plan à gauche de la droite
<e (p) = x, qui ne contribue pas quand R → ∞ (lemme de Jordan 2) et qui englobe le pôle en

p = a ; le théorème des résidus donne alors le résultat eat comme attendu. Si t < 0, le résultat
est nul, par l’argument précédent.
D’une façon générale, la formule de Laplace inverse combinée avec la formule des résidus fournit
le plus souvent le résultat cherché.
9.2.2 Translation
Soit f une fonction causale d’abscisse de sommabilité α, et fˆ sa transformée de Laplace.
On vérifie alors aisément que la transformée de Laplace de f (t)e−at n’est autre que fˆ(p + a)
Z ∞ Z ∞
−at −pt
f (t)e e dt = f (t)e−(p+a)t dt = fˆ(p + a)
0 0
pour <e (p) > α − <e (a). Exemple, de L[1](p) = p1 on tire L[eat ](p) = p−a1
comme on a vu.
Attention qu’inversement fˆ(p)e−τ p est la transformée de Laplace de H(t − τ )f (t − τ ) et non
de H(t)f (t − τ ) !
Z ∞ Z ∞ Z ∞
−pt
H(t − τ )f (t − τ )e dt = −pt
f (t − τ )e dt = f (t)e−p(t+τ ) dt = fˆ(p)e−τ p .
−∞ τ 0
9.2.3 Convolution
Pour deux fonctions causales f et g, le produit de convolution
Z ∞ Z t
f ∗ g(t) = f (s)g(t − s)ds = f (s)g(t − s)ds
0 0
ne dépend que des valeurs de f et g dans l’intervalle [0, t] pour t ≥ 0 et s’annule pour t < 0. La
convolution préserve donc le caractère causal. On démontre alors comme pour la transformation
de Fourier le
Théorème 9.5 : Soit f et g deux fonctions causales d’abscisses de sommabilité α et α0 , et fˆ et

ĝ leurs transformées de Laplace, définies respectivement dans les demi-plans ouverts <e (p) > α,
<e (p) > α0 . Alors
L[f ∗ g](p) = fˆ(p)ĝ(p)
est définie pour <e (p) > max(α, α0 ). Inversement pour <e (p) > α + α0 et avec x0 > α
Z x0 +i∞
1
L[f.g](p) = fˆ(q)ĝ(p − q)dq .
2πi x0 −i∞
La démonstration s’effectue comme au Théorème 4.13.

§ 9.2. Inversion, dérivation, convolution etc 175
9.2.4 Opérations de dérivation et intégration

Soit une fonction causale qu’on suppose dérivable (au sens des fonctions !), α l’abscisse
de sommabilité de f , on suppose que f 0 a une abscisse de sommabilité α0 . Attention ! par
transformée de Laplace de f 0 , on entend transformée de Laplace de H(t)f 0 (t), et non de (Hf )0 !
Par intégration par parties, pour <e (p) > max (α, α0 )
Z ∞ Z ∞
0 −pt 0
∞
e−pt f (t)dt + f (t)e−pt 0 = pL[f ](p) − f (0+ )

L[Hf ](p) = e f (t)dt = p
0 0
car limt→∞ e−pt f (t) = 0 2 .

Donc avec les hypothèses ci-dessus (f dérivable, α, resp. α0 les abscisses de sommabilité de
f et f 0 )
Proposition 9.6 : L[Hf 0 ](p) = pL[f ](p) − f (0+ ) pour <e (p) > max (α, α0 ).
La propriété se généralise aux dérivées d’ordre supérieur, cf. [1]
Proposition 9.7 : La transformée de Laplace de f (n) égale pn fˆ(p) −

Pn−1
m=0 pn−1−m f (m) (0+ ).
Comme on l’a observé plus haut, si f a pour abscisse de sommabilité α, pour tout n ∈ N,
n
t f (t) est aussi causale avec la même abscisse de sommabilité et
dn
L[(−t)n f (t)](p) = L[f ](p) . (9.6)
dpn
On peut aussi intégrer
Proposition 9.8 : Si f a pour abscisse de sommabilité α et fˆ pour transformée de Laplace,

alors pour <e (p) > max (α, 0)
t
fˆ(p)
Z
L f (u)du (p) = .
0 p
Inversement, si fˆ(p) décroı̂t plus vite que 1/p à l’infini et si <e (p) > max (α, 0)
Z ∞
f (t)
L (p) = fˆ(z)dz ,
t p
avec un chemin d’intégration de p à l’infini arbitraire dans le demi-plan de sommabilité, en

vertu de l’holomorphie de fˆ.
2. On a supposé <e (p) > max (α, α0 ), et l’intégrabilité de f e−pt et de sa dérivée implique que
limt→∞ e−pt f (t) = 0, selon un argument déjà utilisé dans la transformation de Fourier, cf remarque après
(4.13).

9.2.5 Autres exemples

Les exemples de la section 9.1.3 peuvent être retrouvés ou combinés avec les propriétés de
dérivation, d’intégration et de linéarité de la transformation de Laplace pour obtenir d’autres
formules (où le H(t) est implicite)
1
L[e±iωt ](p) =
p ∓ iω
p ω
L[cos(ωt)](p) = , L[sin(ωt)](p) = (9.7)
p2
+ ω2 p2
+ ω2
p ω
L[cosh(ωt)](p) = 2 , L[sinh(ωt)](p) = 2 ,
p − ω2 p − ω2
toutes formules initialement valables pour <e (p) > 0, puis prolongeables comme on a vu. De
même pour <e (p) > <e (a),
1
L[H(t)eat ](p) =
p−a
puis par dérivation
tn−1

at 1
L H(t)e (p) = . (9.8)
(n − 1)! (p − a)n
En décomposant en pôles simples toute fraction rationnelle, on reconstruit son “original”, c’est-
à-dire la fonction dont elle est la transformée de Laplace, etc etc.
9.3 Transformée de Laplace des distributions

On a vu plus haut le cas de la transformée de Laplace de la fonction de Heaviside. Plus
généralement pour une fonction causale f localement sommable, la modification sur un ensemble
de mesure nulle ne modifie pas l’intégrale de définition de la transformée de Laplace. Cette
dernière est donc attachée à la distribution régulière définie par f . Plus généralement encore,
0
pour T une distribution de support contenu dans R+ , (T ∈ D+ ), telle qu’il existe un α réel tel
que pour tout x > α, e−xt T ∈ S 0 , (distribution tempérée), on définit la transformée de Laplace
de T par
Tb(p) = h T, e−pt i pour <e (p) > α . (9.9)
En effet si x = <e (p) > α, il existe un y : α < y < x et h e−yt T, e−(p−y)t i existe bien et définit h T, e−pt i
indépendamment de y.
On appelle encore α abscisse de sommabilité de T , et on démontre qu’à nouveau, Tb(p) est
une fonction holomorphe de p dans le demi-plan ouvert <e (p) > α. Exemples : La distribution
de Dirac a un support dans R+ , elle est tempérée et δe−xt l’est aussi pour tout x : α = −∞ et
donc pour tout p, L[δ] = 1, L[δ (m) ] = pm , L[δt−a ] = e−pa .

§ 9.4. Applications de la transformée de Laplace 177
Les propriétés de la transformation de Laplace étudiées plus haut –convolution, translation,

relation Laplace–Fourier, etc– s’étendent aux distributions. Le seul point nécessitant un peu
0
d’attention concerne la dérivation. Si T ∈ D+ , et si T 0 est la distribution dérivée, alors L[T 0 ](p) =
pT̂ (p), sans le terme supplémentaire qui apparaissait à la Prop. 9.6. Cela est dû au fait que
la dérivée au sens des distributions de la distribution régulière T = H(t)f (t) a deux termes :
T 0 = δ(t)f (0) + H(t)f 0 (t). Le calcul de la Prop. 9.6 ne retenait que le deuxième terme, celui
que nous faisons maintenant au sens des distributions les prend en compte tous les deux.
9.4 Applications de la transformée de Laplace

La transformée de Laplace, comme celle de Fourier, a pour effet de transformer les dérivées en
multiples de la fonction. Elle simplifie donc considérablement l’étude des équations différentielles
ou aux dérivées partielles et permet de prendre aisément en compte les conditions aux limites,
comme on va voir. La transformée de Laplace a de plus l’avantage (par rapport à celle de
Fourier) de demander moins de régularité à la fonction : intégrabilité locale et comportement
exponentiel à +∞, là où Fourier demande l’intégrabilité au sens L1 .
9.4.1 Équations différentielles, problème de Cauchy

Rappelons d’abord ce qu’on entend par problème de Cauchy pour une équation différentielle.
Considérons par exemple le cas d’une variable dynamique f (t) satisfaisant une équation différen-
tielle linéaire du second ordre, à coefficients constants, comme on en rencontre couramment en
Mécanique, en Électricité, etc. Cette équation est complétée par deux conditions au bord (ou
conditions initiales), ce nombre étant bien sûr égal à l’ordre de l’équation. On considère donc
le système
a2 f¨ + a1 f˙ + a0 f = g(t)

f (t) = f0 (9.10)

t=0
d
f (t) = f1 .

dt t=0
Au final, la fonction f satisfaisant (9.10) est unique, et on dit que le problème de Cauchy
admet une solution unique. D’un point de vue physique, cette unicité de la solution pour des
conditions initiales données est étroitement liée à la question du déterminisme de la physique
classique : une fois données la position et la vitesse de départ et les équations du mouvement,
la dynamique du système est complétement déterminée à tous les temps ultérieurs.
On connaı̂t le principe de résolution : recherche de la solution générale de l’équation “ho-
mogène” (sans second membre g), puis recherche d’une solution particulière de l’équation avec

second membre, enfin détermination des constantes d’intégration en utilisant les conditions
initiales.
La transformation de Laplace va nous permettre de mener toutes ces opérations simul-
tanément. Soit fˆ(p) la transformée de Laplace de f . On a
a2 (p2 fˆ(p) − pf0 − f1 ) + a1 (pfˆ(p) − f0 ) + a0 fˆ(p) = ĝ(p)
d’où l’on tire

ĝ(p) a2 (pf0 + f1 ) + a1 f0
fˆ(p) = + , (9.11)
a2 p2 + a1 p + a0 a2 p2 + a1 p + a0
et il ne reste plus qu’à effectuer une transformation de Laplace inverse pour obtenir f (t)
Z Z
1 pt ĝ(p) 1 a2 (pf0 + f1 ) + a1 f0
f (t) = e dp + ept dp , (9.12)
2πi Bx a2 p 2 + a1 p + a0 2πi Bx a2 p 2 + a1 p + a0
avec une intégration le long d’une droite de Bromwich. Le premier terme peut être considéré
comme une solution particulière de l’équation avec second membre (la solution à f0 = f1 = 0),
tandis que le second est la solution générale (si f0 et f1 sont considérés comme des paramètres
arbitraires) de l’équation sans second membre. L’intérêt de la méthode est son caractère général
et systématique : pas besoin de chercher une solution particulière, (9.12) nous la fournit gra-
cieusement ! En pratique, le calcul explicite des intégrales dans (9.12) est mené avec l’aide du
théorème des résidus.
Un exemple simple
Soit à résoudre le système
f¨ + f = 2 cos t f (0) = 0 f˙(0) = −1 .
Selon ce qui précède, g(t) = 2 cos t, ĝ(p) = 2p/(p2 + 1), donc (9.11) donne
2p 1
fˆ(p) = − 2
(p2 + 1) 2 (p + 1)
dont il faut prendre la transformée de Laplace inverse. On peut faire ce calcul par le théorème des
résidus, mais il est plus simple d’observer que (p21+1) = L[sin t] et (p22p
+1)2
d
= − dp 1
(p2 +1)
= L[t sin t]
(cf (9.6-9.7)), d’où la solution du problème f (t) = (t−1) sin t, obtenue avec une grande économie
de moyens !

Fonction de transfert, susceptibilité, etc
Examinons la structure générale des formules (9.11-9.12). On appelle fonction de transfert

la fonction (de la variable de Laplace p)
Z(p) = a2 p2 + a1 p + a0
(ou plus généralement, pour une équation différentielle linéaire du n-ième ordre à coefficients
constants aq , Z(p) = nq=0 aq pq ). Les zéros zk de Z(p) donnent des pôles (simples ou multiples)
P
à fˆ(p), qui par transformation de Laplace inverse, donnent des exponentielles ezk t , (fois peut-
être des puissances de t, cf (9.8)).
Dans le cas où Z(p) n’a que des pôles simples, Z(p) = 2k=1 (p − zk ), la solution a la forme
Q
générale f (t) = 2k=1 Z 0A(zkk ) ezk t où Ak incorpore les conditions initiales.
P
1
Il est aussi d’usage de définir la susceptibilité χ̂(p) = Z(p) , qui décrit la réponse du système
f à la source g ; par transformée de Laplace inverse, on construit χ(t), et la dépendance de la
Rt
réponse f (t) dans la source g est via une intégrale de convolution f (t) = 0 dsχ(t − s)g(s) + · · · ,
où les points de suspension contiennent la dépendance dans les conditions initiales, cf (9.12).
9.4.2 Exemple : Circuit LRC

Un exemple typique du problème précédent est celui du circuit LRC se chargeant ou se
déchargeant, voir Fig. 9.1. La tension u aux bornes du condensateur satisfait
LC ü + RC u̇ + u = v
où v est la tension appliquée aux bornes du circuit. Les conditions initiales spécifient les valeurs
de u(0) = u0 et de u̇(0) = u1 = − iC0 , i0 le courant initial dans le circuit.
L
R
C
Figure 9.1 – Circuit LRC.
On va considérer deux situations différentes.

1. Le circuit n’est pas chargé et le courant y est nul, u0 = u1 = 0. On le branche au temps

t = 0 à un générateur v = V eiωt (comme toujours, on prendra la partie réelle de u à la fin des

calculs.)
2. Le circuit est alimenté pour t ≤ 0 par un générateur v = V = const ; au temps t = 0, on
ouvre le circuit (on déconnecte le générateur). Donc les conditions initiales sont u0 = V , u1 = 0.
La forme générale de la solution (9.11-9.12) fournit, avec Z(p) = LCp2 + RCp + 1
v̂(p) LCu0 p + LCu1 + RCu0

û(p) = + . (9.13)
Z(p) Z(p)
q
R 1
Les zéros de Z(p) sont en z± = − 2L ± 2L R2 − 4L
C
. La susceptibilité du circuit se calcule
explicitement, selon le signe de ∆ = R2 − 4L/C (qu’on supposera non nul)
 √
1
Z
1 X e pt  √2 e−Rt/2L sinh( ∆ t) si ∆ > 0
2L
χ(t) = dpept = Res , z± = H(t)× C ∆ √
2πi γ Z(p) z±
Z(p)  √2 e−Rt/2L sin( −∆ t) si ∆ < 0 .
C −∆ 2L
1. fermeture du circuit : le deuxième terme de la solution (9.13) est nul, il reste

Z t
u(t) = V dsχ(t − s)eiωs
0
et on calcule
V eiωt ez+ t e z− t

V
u(t) = + − . (9.14)
Z(iω) LC(z+ − z− ) z+ − iω z− − iω
Aux grands temps, comme <e (z± ) < 0, seul subsiste le premier terme, proportionnel à la
source, tandis que les deux derniers termes décrivent le comportement transitoire du circuit.
1.0
0.5
2 4 6 8 10
-0.5
-1.0
Figure 9.2 – Les courbes pointillée, resp. brisée, représentent le premier, resp le second terme de
(9.14), et la courbe pleine, la somme, c’est-à-dire la solution u(t). On a pris R = C = L = ω = V = 1.

2. ouverture du circuit : cette fois, l’équation est homogène, seul demeure le deuxième terme
de (9.13).

LCp + RC 1 1 1
û(p) = V = (LCp + RC) − V
Z(p) LC(z+ − z− ) p − z+ p − z−
d’où
V z+ t
R z− t
R
u(t) = e z+ + −e z− + .
z+ − z− L L
Là encore, puisque <e (z± ) < 0, u(t) → 0 pour t → ∞, comme on s’y attend pour ce processus
de décharge.
1.0
0.8
0.6
0.4
0.2
2 4 6 8
Figure 9.3 – La courbe de décharge du circuit, dans le cas (2), toujours avec R = C = L = ω =
V = 1.
Il faudrait compléter cette discussion par le cas où ∆ = 0, R2 = 4LC. Comme on sait bien
et comme on le retrouve ici via la transformation de Laplace, apparaissent alors des fonctions
teat . . .
9.4.3 Équations linéaires aux dérivées partielles

La méthode faisant appel à la transformation de Laplace peut aussi s’appliquer aussi à des équations
différentielles à coefficients non constants, ou à des équations aux dérivées partielles linéaires. Illustrons-le sur
le cas de la désintégration radioactive rencontré au chap 5.
PN
On y considérait la fonction génératrice φ(x, t) = N0=0 xN PN (t) des probabilités d’avoir N noyaux dans
l’état initial au temps t ; on avait montré à l’équation (5.70) que φ satisfait l’équation aux dérivées partielles
linéaire
∂ ∂
φ(x, t) = κ(1 − x) φ(x, t) . (5.70)
∂t ∂x
avec des conditions aux limites qu’on va préciser. Considérons la transformée de Laplace φ̂(x, p) de H(t)φ(x, t)
par rapport à la variable t (ce qui est naturel puisque dans ce problème t ≥ 0). Elle satisfait l’équation

différentielle ordinaire (φ̂0 est la dérivée par rapport à x)
κ(1 − x)φ̂0 (x, p) = pφ̂(x, p) ,
équation “à variables séparées” qu’on intègre en
φ̂(x, p) = φ̂(0, p)(1 − x)−p/κ . (9.15)
C’est le moment de préciser les conditions aux limites. À x = 0, φ(0, t) = P0 (t) = (1 − e−κt )N0 puisque
chaque noyau a la probabilité 1 − e−κt de s’être désintégré au temps t et que ces noyaux se désintègrent
PN0 N N −N κt
de façon indépendante. Donc H(t)φ(0, t) = N =0 CN0 (−1) e H(t) dont la transformée de Laplace est
PN0 N N 1
φ̂(0, p) = N =0 CN0 (−1) p+κN . Après insertion dans (9.15) et transformation de Laplace inverse, on obtient
pour t ≥ 0 et ∀a > 0
Z N0
a+i∞ X
1 1
φ(x, t) = N
CN (−1)N (1 − x)−p/κ ept dp
2πi a−i∞ N =0
0
p + κN
N0
X
= N
CN0
(−1)N (1 − x)N e−N κt
N =0
N0
= 1 − (1 − x)e−κt (9.16)
N
qui est le résultat obtenu en (5.71), d’où l’on tire la probabilité cherchée PN (t) = CN 0
(1 − e−κt )N0 −N e−κtN .
On voit que la transformée de Laplace nous a permis de réduire une équation aux dérivées partielles (PDE
dans l’acronyme anglo-saxon) en une équation différentielle ordinaire (ODE), et de déduire la solution à x fini
de celle à x = 0.
J’ai suivi la discussion de W. Appel [1] complétée par celle de L. Schwartz [8], qu’on pourra
consulter pour plus de détails. Le livre de C. Aslangul [2] contient de très nombreuses applica-
tions physiques.

Chapitre 10
Aspects de la théorie des groupes
Rôle fondamental de la théorie des groupes en physique : transformations d’un système (par
rotations, réflexions, translations. . .), éventuellement invariances. Groupe des transformations,
groupe d’invariance d’un système donné.
Différents types de groupes et leur importance en physique
– groupes finis : par ex. groupe d’invariance de rotation d’une molécule ou d’un cristal, sous-
groupe du groupe SO(3) des rotations de R3
– groupes infinis discrets : par ex. groupe d’invariance d’un cristal infini (rotations, réflexions,
translations,. . .)
– groupes continus compacts : groupes U(n), SU(n), O(n), SO(n),. . . (U(1) groupe “de jauge”
de l’électrodynamique, groupe SO(3) des rotations, groupes SU(2) et SU(3) en physique des
particules, etc)
– groupes continus non compacts : groupe de Galilée d’invariance de la Mécanique classique,
groupes de Lorentz et de Poincaré de la Relativité restreinte, . . .
On va se borner à introduire et étudier sommairement deux concepts fondamentaux :
◦ représentations linéaires d’un groupe
avec la notion de représentation irréductible et le lemme de Schur ;
◦ groupes de Lie et algèbres de Lie
générateurs infinitésimaux, et représentations de l’algèbre de Lie
et les illustrer sur l’exemple de l’
◦ algèbre de Lie de SO(3) et ses représentations
ce qui fera la jonction avec le cours de Mécanique Quantique.

184 Chap.10. Aspects de la théorie des groupes
10.1 Représentations linéaires des groupes

10.1.1 Définition
Dans de nombreuses situations en physique ou en mathématiques, on a à considérer l’action
d’un groupe G dans un espace vectoriel E. Le groupe agit par des opérations linéaires du groupe
linéaire de E, noté GL(E) (ou plus précisément GL(E, R) ou GL(E, C), selon les cas). À tout
élément g ∈ G on associe un opérateur linéaire inversible D(g) ∈ GL(E). E peut être l’espace
physique, comme R3 , ou un espace de tenseurs sur R3 , ou être plus général encore. (Il faut bien
voir qu’un groupe peut aussi agir sur des ensembles qui ne sont pas des e.v., cf par exemple
l’action du groupe des rotations SO(3) sur la sphère S 2 ⊂ R3 .)
Il est naturel d’imposer que la loi de composition du groupe est compatible avec celle dans le
groupe GL(E), ou en termes plus mathématiques, que l’application G → GL(E) : g 7→ D(g)
est un homomorphisme de groupes
∀g1 , g2 ∈ G D(g1 .g2 ) = D(g1 )D(g2 ) . (10.1)
On appelle représentation du groupe G dans l’espace E un tel homomorphisme G → GL(E).

Noter que (10.1) implique que si e est l’élément neutre de G, D(e) = I, l’opérateur identité
dans E, et que D(g)−1 = D(g −1 ).
L’étude et la classification des représentations des groupes est un domaine important des
mathématiques, aux très nombreuses applications physiques.
10.1.2 Représentations réductibles ou irréductibles

Supposons qu’une représentation G → (E, D) laisse un sous-espace E1 de E invariant
∀x ∈ E1 ∀g ∈ G D(g)x ∈ E1 .
Une telle représentation est dite réductible. Dans le cas contraire (pas de sous-espace invariant)
on dit que la représentation est irréductible. Dans les cas qui vont nous occuper (groupes finis
ou continus compacts), on peut toujours se ramener à une situation où une représentation
réductible D laisse aussi un sous-espace E2 supplémentaire de E1 invariant. Autrement dit (si
E est de dimension finie), la matrice de D(g) s’écrit dans une certaine base sous forme de blocs
!
D1 (g) 0
D(g) =
0 D2 (g)
où D1 , resp. D2 , est une représentation de G dans E1 , resp. E2 .

§ 10.2. Groupes et algèbres de Lie 185
Inversement on voit que toute paire de représentations D1 et D2 d’un groupe G donné, dans
des espaces E1 et E2 permet de construire une autre représentation dans l’espace E1 ⊕E2 somme
directe de E1 et E2 . Il va suffire de savoir construire (et classifier si possible) les représentations
irréductibles pour construire les représentations les plus générales.
10.1.3 Lemme de Schur

Un lemme important que nous admettrons énonce que
Lemme de Schur : Dans une représentation irréductible de G dans GL(E, C), tout opérateur
commutant avec tous les D(g) est un multiple de l’identité.
Donc si ∃V tel que ∀g ∈ G, D(g)V = V D(g), alors V = λI. Le lemme est en défaut si la
représentation!n’est pas irréductible, ou si elle est sur les réels. Exemple G = SO(2), D(α) =
cos α − sin α
, cf ci-dessous, groupe commutatif (“abélien”), donc D(α)D(β) = D(β)D(α)
sin α cos α
semble un contre-exemple au lemme, mais ici la représentation
! n’est pas irréductible sur C,
1
puisque les sous-espaces colinéaires aux vecteurs sont invariants par les D(α).
±i
10.2 Groupes et algèbres de Lie

Un groupe de Lie est un groupe “topologique” 1 doté de propriétés de différentiabilité. On
va donc être naturellement conduit à y considérer des opérations infinitésimalement proches
de l’identité. La propriété remarquable d’un groupe de Lie est que la connaissance de ces
transformations infinitésimales et de l’algèbre de Lie qu’elles forment suffit essentiellement à
reconstruire tout le groupe. C’est ce que nous allons illustrer sur trois exemples de complexité
croissante.
10.2.1 Groupes R, U(1) et SO(3). Algèbre de Lie

Le plus simple des groupes continus est celui des translations à une dimension :
t(a) : x 7→ x0 = x + a, avec x et a des variables réelles x, a ∈ R. Pour toute fonction réelle
f (x), définissons la nouvelle fonction f 0 = t(a)f par f 0 (x0 ) = f (x) ou de façon équivalente,
f 0 (x) = f (x − a). La loi de composition de ces transformations (loi de groupe) est
t(b) ◦ t(a) = t(a + b) . (10.2)
1. Un groupe topologique est un groupe muni d’une topologie, telle que les opérations de produit et de
passage à l’inverse soient continues.

La loi est commutative, le groupe est abélien. Ce groupe est en fait R avec la loi de groupe
fournie par l’addition des réels. C’est un groupe de dimension (réelle) égale à 1.
Si a est infinitésimal, on peut écrire f 0 (x) ≈ f (x) − a dx
d
f (x) ou encore

d
f 0 (x) = 1 − a f (x)
dx
soit encore, en définissant la variation de la fonction

0 d
∆f (x) = f (x) − f (x) = −a f (x) .
dx
La variation infinitésimale de la fonction est linéaire dans le paramètre a (on travaille au 1er
ordre !) et dans la fonction f , et donnée par l’action du générateur infinitésimal Ta = −aT =
d

−a dx .
Noter que la loi de groupe (10.2) et sa propriété de commutativité se traduisent au niveau
infinitésimal par la commutativité des générateurs
[Ta , Tb ] = Ta Tb − Tb Ta = 0 .
Les transformations continues (et différentiables) du groupe impliquent donc l’existence des
générateurs infinitésimaux avec des propriétés qui reflètent la loi de groupe. Inversement une
d
fois connu le générateur infinitésimal T = − dx , il est possible de reconstruire la transformation
finie par action exponentielle
1 −a3 3
exp(−aT )f (x) = (1 − aT + a2 T 2 + T + · · · )f (x)
2 3! !
2 3
a2 d (−a)3 d

d
= 1−a + + + · · · f (x)
dx 2 dx 3! dx
= f (x − a)
qui n’est autre que la série de Taylor, que nous supposons convergente (f analytique réelle).
Ces considérations s’étendent sans difficulté à des translations t(a) dans l’espace Rd et à des
fonctions f des d variables (coordonnées) x1 , · · · , xd . La loi de groupe est toujours additive et
donc commutative t(a) ◦ t(b) = t(a + b) = t(b) ◦ t(a), le groupe n’est autre que Rd avec son
addition. L’opérateur infinitésimal
est maintenant
l’opérateur différentiel Ta = −a.T avec T le
vecteur gradient T = ∇ ~ = d , · · · d , et la formule de Taylor à d variables s’applique.
dx1 dxd
10.2.2 Groupe de rotation à deux dimensions SO(2)

Considérons maintenant le groupe des rotations à deux dimensions, noté SO(2). L’élément
générique R(α) dépend d’un paramètre continu, l’angle α de rotation défini modulo 2π. La

rotation R(α) agit sur les vecteurs x du plan par
x 7→ x0 = R(α)x (10.3)
où la notation doit être comprise comme l’action d’un opérateur linéaire sur le vecteur x, ou en-
core, dans un repère orthogonal, comme l’action d’une matrice orthogonale sur les composantes
x1 , x2 de x ! ! !
0
x cos α − sin α x 1
x0 = 1
= (10.4)
x02 sin α cos α x2
(la matrice est orthogonale par définition de SO(2), ou encore, géométriquement, parce que les
transformations considérées préservent la norme k x0 k=k x k, or x0 .x0 = xT (RT (α).R(α))x =
x.x donc RT (α).R(α) = 1l). Ces rotations se composent comme on sait bien
R(α)R(β) = R(α + β) = R(β)R(α) (10.5)
de façon à nouveau additive (en α) et commutative.

On peut aussi étudier ce groupe des rotations du plan autour de l’origine à l’aide de la coordonnée complexe
z = x1 + ix2 . La transformation (10.4) s’exprime par z 0 = eiα z et on parle alors du groupe U(1), groupe
multiplicatif des nombres de module 1. On a donc l’isomorphisme de groupes SO(2)∼ = U(1).
Dans le groupe SO(2), les générateurs infinitésimaux sont des opérateurs, ou des matrices
2 × 2. En effet, prenant α infinitésimal et développant au premier ordre, cos α ≈ 1, sin α ≈ α,
donc ! !
0 −i 0 −i
α1 R(α) = 1l − iαJ = 1l − iα avec J = (10.6)
i 0 i 0
où l’apparition du i peut paraı̂tre curieuse dans ce problème réel, mais est utile si on veut
considérer le générateur infinitésimal J comme hermitien (plutôt qu’antisymétrique réel donc
antihermitien).
Considérons maintenant la loi de groupe (10.5) pour β = dα infinitésimal, en faisant usage
de (10.6) :
R(α + dα) = R(dα)R(α) = (1l − idαJ)R(α) = R(α) − idαJR(α)
donc dR(α) = −idαJR(α). On obtient donc l’équation différentielle

d
R(α) = −iJR(α) (10.7)
dα
où J est, rappelons le, une matrice fixe, indépendante de α. Cette équation différentielle du
premier ordre à coefficients constants et homogène, complétée par la condition initiale R(0) = 1l,
se résout immédiatement en
R(α) = exp −iαJ . (10.8)

!
0 −i
Exercice. Pour J = , vérifier que l’exponentiation de −iαJ reproduit bien la matrice de R(α) donnée
i 0
plus haut. (Indication : calculer les puissances successives J 2 , J 3 , · · · , J n et construire exp iαJ par son
développement en série.)
L’action (10.3) des rotations de SO(2) sur les vecteurs x ∈ R2 nous donne un exemple de
représentation. Cette représentation est irréductible (sur les réels). D’autres représentations
(irréductibles ou non) seraient fournies par l’action de SO(2) sur des tenseurs.
10.2.3 Générateurs infinitésimaux de SO(3)

Étudions maintenant le groupe SO(3) des rotations de l’espace euclidien R3 et ses générateurs
infinitésimaux. Une rotation de SO(3) est spécifiée par son axe porté par un vecteur unitaire
n̂ et l’angle de rotation ψ. On la notera Rn̂ (ψ). Attention que Rn̂ (ψ) = R−n̂ (−ψ), il faut donc
choisir 0 ≤ ψ ≤ π, et n̂ quelconque sur la sphère unité, n̂ ∈ S 2 . Une rotation de R3 dépend
donc de 3 paramètres réels, et on dit que le groupe SO(3) est de dimension 3.
Pour un angle dψ infinitésimal, Rn̂ (dψ) diffère de l’opérateur identité par un terme d’ordre
dψ, définissant le générateur infinitésimal (un opérateur). Comme dans le cas de SO(2) nous
suivons l’usage des physiciens en écrivant les générateurs infinitésimaux des rotations comme
des opérateurs hermitiens J = J † . Ainsi on écrit au premier ordre en dψ
Rn̂ (dψ) = (I − idψJn̂ ) (10.9)
où Jn̂ est le générateur de ces rotations 2 , une matrice 3 × 3, qui est hermitique comme
conséquence de l’unitarité (ou simplement ici, de l’orthogonalité) de Rn̂ : Rn̂ .Rn̂† = I.
Pour trouver l’expression explicite de ces générateurs infinitésimaux, on peut les considérer
soit comme des matrices 3 × 3 agissant sur les composantes des vecteurs x de R3 (comme on a
fait pour SO(2)), soit comme des opérateurs différentiels agissant sur les fonctions de x (cf le
cas du groupe R). Pour une rotation infinitésimale Rn̂ (dψ) agissant sur x, le vecteur transformé
x0 est tel que x0 − x est orthogonal à x et à n̂, donc s’écrit
x0 = x + dψ n̂ ∧ x . (10.10)
Une fonction scalaire de x se transforme selon f 0 (x0 ) = f (x) soit pour une rotation infinitésimale
~ (x) = (1 − idψ n̂ · J)f (x) (10.11)
f 0 (x) = f (R−1 x) = f (x − dψ n̂ ∧ x) = (1 − dψ n̂ · x ∧ ∇)f
∂
avec Jn̂ = −in̂ · x ∧ ∂x
soit encore
∂
Jn̂ = n̂ · J avec J = −ix ∧ ∂x
. (10.12)
2. Ne pas confondre Jn̂ indexé par le vecteur n̂, avec Jk , kième composante de J. La relation entre les deux
va être donnée ci-dessous.

Remarque. Dans le cours de mécanique quantique, on s’est intéressé à l’opérateur de moment

cinétique orbital L qui diffère du présent générateur J par un facteur ~ : L = ~J. Attention !
J, opérateur de moment angulaire total du cours de mécanique quantique, ne doit pas être
confondu avec le présent J.
Par ailleurs, introduisons les trois matrices de base J1 , J2 et J3 qui décrivent les rotations
infinitésimales autour des axes correspondants. De (10.10) on tire
     
0 0 0 0 0 i 0 −i 0
J1 = 0 0 −i J2 =  0 0 0 J3 =  i 0 0 (10.13)
     
0 i 0 −i 0 0 0 0 0
ce qu’on peut exprimer par une formule unique
(Jk )ij = −iijk (10.14)
à l’aide du tenseur complètement antisymétrique ijk . Les trois matrices Ji , i = 1, 2, 3 satisfont

les très importantes relations de commutation suivantes
[Ji , Jj ] = iijk Jk (10.15)
qu’on vérifie aussi sur la forme (10.12). On a utilisé la convention de sommation sur les indices
répétés, il y a donc un 3k=1 implicite au membre de droite de (10.15). Par exemple (10.12)
P
∂ ∂ ∂ ∂
nous donne J1 = Jx = −i(y ∂z − z ∂y ), J2 = Jy = −i(z ∂x − x ∂z ) d’où on tire [J1 , J2 ] = iJ3 .
Les générateurs infinitésimaux étant déterminés, comment reconstruit-on les rotations fi-
nies ? Les rotations Rn̂ (ψ) autour d’un axe n̂ donné forment un sous-groupe (on parle de sous-
groupe à un paramètre) ; ces matrices commutent, le sous-groupe est commutatif (ou abélien).
Par la propriété de groupe,
Rn̂ (ψ + dψ) = Rn̂ (dψ)Rn̂ (ψ) = (I − idψJn̂ )Rn̂ (ψ) , (10.16)
ou encore
∂Rn̂ (ψ)
= −iJn̂ Rn̂ (ψ) (10.17)
∂ψ
équation différentielle, qui, compte tenu de R(0) = I, s’intègre en
Rn̂ (ψ) = e−iψJn̂ . (10.18)
Comme l’a montré (10.12), on peut toujours écrire

X P
Jn̂ = nk Jk donc Rn̂ (ψ) = e−iψ k nk Jk . (10.19)
k

Attention ! En raison de la non-commutation des générateurs infinitésimaux J1 , J2 et J3 ,

cf (10.15), la propriété “bien connue” de la fonction exponentielle ea eb = ea+b ne s’applique
P ? Q
pas : il ne faut pas écrire e−iψ k nk Jk = k e−iψnk Jk .
Une autre façon d’écrire une rotation finie en termes des générateurs Ji est d’utiliser la
paramétrisation des angles d’Euler, cf Fig. 10.1. On a R(α, β, γ) = Rz (α)Ry (β)Rz (γ), avec
Ry = e−iβJy , Rz (α) = e−iαJz .
z
Z=R u ( ) z Y=R ( ) u
Z
x u=Rz( ) y
Figure 10.1 – Angles d’Euler
10.3 Algèbre de Lie de SO(3) et ses représentations

10.3.1 Algèbre de Lie so(3)
Récapitulons : nous venons d’introduire l’algèbre de commutation des générateurs infinitésimaux
(ou algèbre de Lie) du groupe SO(3), notée so(3). Elle est définie par les relations (10.15). On
utilise aussi beaucoup les trois combinaisons
Jz ≡ J3 , J+ = J1 + iJ2 , J− = J1 − iJ2 . (10.20)
Il est immédiat de calculer

[J3 , J+ ] = J+ (10.21a)
[J3 , J− ] = −J− (10.21b)
[J+ , J− ] = 2J3 . (10.21c)
On vérifie aussi que l’opérateur
J2 = J12 + J22 + J32 = J32 + J3 + J− J+ (10.22)

§ 10.3. Algèbre de Lie de SO(3) et ses représentations 191
commute avec tous les J

[J2 , J. ] = 0 . (10.23)
J2 est l’opérateur de Casimir de l’algèbre de Lie so(3).

L’expression des générateurs infinitésimaux a été trouvée dans la représentation (10.13) du
groupe SO(3) sur les vecteurs de R3 (la représentation de définition de SO(3)) ou dans celle
(10.12) sur les fonctions. On démontre que dans toute représentation du groupe, les générateurs
infinitésimaux Ji , i = 1, 2, 3, satisfont les mêmes relations de commutation. De même qu’une
représentation d’un groupe était définie par un homomorphisme D du groupe G dans un groupe
linéaire GL(E), de même on appelle représentation de l’algèbre de Lie so(3) un homomorphisme
d de so(3) dans l’espace End(E) des opérateurs linéaires sur un certain e.v. E, c’est-à-dire
une application de so(3) dans End(E) compatible avec les relations de commutation, donc
satisfaisant
d[Ji , Jj ] = [d(Ji ), d(Jj )] = iijk d[Jk ] (10.24)
(toujours avec la sommation sur k implicite). Dans la suite, on omettra le d et on parlera de la

représentation de so(3) par les générateurs infinitésimaux Ji agissant dans l’espace E.
De même que les transformations finies des groupes de Lie SO(2) et SO(3) ont été recons-
truites par exponentiation des transformations infinitésimales, de même on peut espérer que la
connaissance des représentations de l’algèbre de Lie suffit à reconstruire les représentations du
groupe. C’est vrai . . . à une petite subtilité près que nous allons voir plus bas dans le cas de
SO(3).
En physique, nous sommes surtout intéressés par les “représentations unitaires”, où les
générateurs Ji , i = 1, 2, 3 sont hermitiques, donc
Ji† = Ji , i = 1, 2, 3 J±† = J∓ . (10.25)
L’importance de l’opérateur de Casimir J2 est liée au lemme de Schur : J2 commutant avec tous
les générateurs infinitésimaux, il commute avec leur exponentielle, donc avec les opérateurs de
rotation, et ce, dans toute représentation. Dans une représentation irréductible, J2 est donc un
multiple de l’identité, J2 = λI. L’opérateur J2 étant semi-défini positif, ce coefficient λ est réel
non négatif et on peut l’écrire sous la forme j(j + 1), j réel ≥ 0.
La construction des représentations de l’algèbre so(3) consiste alors à considérer des vecteurs
propres de Jz et à montrer que leur valeur propre m est bornée : −j ≤ m ≤ j, et que j ± m
doivent être des entiers, donc que j et m sont simultanément entiers ou demi-entiers, cf le cours
de Mécanique Quantique.

10.3.2 Représentations de l’algèbre so(3) et représentations du groupe

SO(3)).
L’étude qui a été menée dans le cours de Mécanique Quantique a donc eu pour effet de
construire toutes les représentations irréductibles de l’algèbre de Lie so(3).
Théorème 10.1 : Une représentation irréductible de l’algèbre de Lie so(3) est spécifiée par
un entier ou demi-entier non négatif, le spin j de la représentation. La représentation de spin
j est de dimension 2j + 1, et une base est fournie par les états propres de Jz notés |j, m i avec
m = −j, −j + 1, · · · , j − 1. Parmi ces représentations, seules celles de spin j entier sont des
représentations du groupe SO(3).
Le point subtil de cette construction est que toutes ces représentations de l’algèbre de Lie
ne fournissent pas par exponentiation une bonne représentation (au sens de la Déf. du 10.1.1)
du groupe des rotations SO(3). Cela se voit aisément sur la façon dont une rotation de 2π, en
principe l’identité, est représentée : D(Rz (2π)) = exp −2πiJz = (1)2j I qui vaut I si le spin j est
entier mais −I s’il est demi-entier. À la rotation identité, ce D associe la matrice −I. Ces D ne
forment donc pas vraiment une représentation du groupe SO(3) et on parle de représentation
au signe près. La cause profonde de cette curiosité, la relation entre les groupes SO(3) et SU(2),
le rôle de leur topologie en tant que variétés (simplement connexes ou non), et finalement la
raison de l’apparition de ces représentations à un signe près en Mécanique Quantique (théorème
de Wigner), autant de sujets passionnants . . . que nous ne pourrons pas aborder ici !
Lectures supplémentaires
Il existe de nombreux textes d’introduction à la théorie des groupes pour les physiciens.
On pourra consulter les notes de l’un des cours que j’ai donnés sur le sujet, sur ma page
http ://www.lpthe.jussieu.fr/∼zuber/Z Notes.html

Index
abélien, groupe, 189 Cauchy, règle de, 116

abscisse de sommabilité, 170 Cauchy, suite de, 1, 6
absolument continue, fonction, 79 Cauchy, théorème de, 139
accumulation, point d’, 2 Cauchy–Riemann, conditions de, 128, 130
achevée, droite réelle, 3, 13 changement de variable, 32
additivité dénombrable, 21 chemin, 131
adhérence, 4 circuit LRC, 179
adjacentes, suites, 2 col, méthode du, 163
ℵ0 (aleph zéro), 11 compact, espace, 5
algèbre, 53
complet, ensemble, 3
algèbre de Lie so(3), 190
connexe, espace, 5
analytique, fonction, 121
continue, fonction, 4, 14
argument arg, fonction, 120
contour d’intégration, 137
Banach, espace de, 6 convergence dominée, théorème de, 27
Bayes, axiome de, 73 convergence en probabilité, 100
Bessel, fonctions de, 147 convergence en loi, 100
Bolzano–Weierstrass, théor eme de, 3 convergence normale (CV.N.), 10, 116
bord orienté, 133 convergence presque sûrement, 100
Borel, tribu de, 21 convergence simple (CV.S.), 7, 10
borélien, 21 convergence uniforme (CV.U.), 7, 10, 116
Bromwich, droite de, 173 convolution de distributions, 49
Buffon, aiguille de, 96 convolution de fonctions, 48
Cantor, ensemble de, 12, 79 convolution et transformation de Fourier, 65
Cantor, fonction de, 79 coordonnées cylindriques, 33
caractéristique, fonction, 84 coordonnées polaires, 33
cardinal, 11 coordonnées sphériques, 33
Casimir, opérateur de, 191 corrélation, fonction de, 81
Cauchy, intégrale de, 140 covariance, 76
Cauchy, partie principale de, 41 cumulant, 76
194 INDEX
d’Alembert, théorème de, 143 événement élémentaire, 72

décroissance rapide, fonction à, 63
dénombrable, 11 fermé, ensemble, 3, 4
dense, ensemble, 3, 4 fermé, intervalle, 2
fonction Γ, 125, 166
densité de probabilité, 80
fonction causale, 169
densité de probabilité jointe, 81
fonction d’erreur complémentaire erfc, 106
désintégration radioactive, 97, 181
fonction d’erreur erf, 106
difféomorphisme, 32
fonction de transfert, 179
différentiable, fonction, 127
fonction exponentielle, 119
différentielle, forme, 127
fonction logarithme, 120
Dirac, distribution de, 36, 41
fonction multivaluée, 120
Dirac, masse de, 22
fonction saut, 43
Dirac, peigne de, 36, 41
fonction signe, 44
Dirichlet, fonction de, 23
fonction-test, 38
Dirichlet, théorème de, 57
forme exacte, 134
disque de convergence, 116
forme linéaire, 39, 53
distribution, 35, 39
Fourier, série de, 57
distribution marginale, 81
Fourier, transformée de, 58
distribution régulière, 40
fraction continue, 1
distribution singulière, 41
frontière, 11
distribution tempérée, 67
frontière essentielle, 125
domination, 27, 29
Fubini, théorème de, 26
dual, espace, 39, 53
générateur infinitésimal, 186
écart-type, 75
générateur infinitésimal des rotations, 188
équation de la chaleur, 110
génératrice, fonction, 85
escalier du Diable, 79
Γ, fonction , 125, 166
escalier, fonction en, 14, 24
Green, fonction de, 51
espérance, 75
Green–Riemann, formule de, 135
espace des épreuves, 72
espace topologique (e.t.), 4 harmonique, fonction, 51
étagée, fonction, 24 Hausdorff, espace de, 4
Euler, angles d’, 190 Heaviside, fonction de, 43
Euler, formule d’, 116 Heine–Borel, théorème de, 5
événement atomique, 72 hermitienne, fonction, 62
événement composé, 72 histogramme, 80
INDEX 195
holomorphe, fonction, 128 marche aléatoire, 108

homomorphisme de groupe, 119, 184 maximum, principe du, 143
homomorphisme de groupes, 119 Maxwell–Boltzmann, distribution de, 97
homotopes, chemins, 132 médiane, 76
méromorphe, 145
impropre, intégrale, 18
mesurable, ensemble, 23
indépendants, événements, 74
mesurable, espace, 22
indicatrice, fonction, 11
mesurable, fonction, 23
indice d’un chemin, 138
mesure, définition, 21
intégrable au sens de Lebesgue, fonction, 25
mesuré, espace, 22
irréductible, représentation, 184
mode, 80
Jacobien, 32 moments, 75
Monte-Carlo, 103
Kolmogorov, axiomes de, 72
mouvement brownien, 108
kurtosis, 76
négligeable, ensemble, 22
Laplace, transformation de, 169
norme, 5
Laplace, transformation inverse, 173
normé, espace, 5
Laurent, série de, 146
Lebesgue, critère de, 30 ondes, équation des, 55
Lebesgue, intégrale de, 19, 24 ordre d’un pôle, 147
Lebesgue, mesure de, 21 ordre d’un zéro, 144
Lebesgue, théo. de convergence dominée, 27 original, 170
Lie, groupe de, 185 ouvert, ensemble, 3, 4
limite supérieure, inférieure, 13 ouvert, intervalle, 2
Liouville, théorème de, 143
lisse, fonction, 39 pôle, 145
localement compact, espace, 5 pôle simple, 147
localement intégrable, 40 Parseval–Plancherel, théorème de, 64
logarithme complexe, 120 partie principale de Cauchy, 41
loi binomiale, 85, 87 partitions, 116
loi de probabilité, 74 PDF, 80
loi de Poisson, 91 phase stationnaire, méthode de la, 166
loi des grands nombres, 101 pointé, plan, 120
loi forte des grands nombres, 101 Poisson, équation de, 51
loi normale, 88 presque partout, 23
lois d’échelle, 112 presque sûr, p.s., 73
196 INDEX
primitive, 17 sphère de Riemann, 5, 149

primitive d’une forme, 134 spin d’une représentation, 192
principe de symétrie de Schwarz, 142 Stokes, théorème de, 136
probabilité conditionnelle, 73 support, 14
prolongement analytique, 123 support d’une distribution, 41
propriété de Markov, 110 susceptibilité, 179
réglée, fonction, 17 Taylor, séries de, 121

répartition, fonction de, 77 Taylor, théorèmes de, 14
résidu, 148 Tchebychev, inégalité de, 76, 102
résidus, théorème des, 148 théorème limite central, 103
rayon de convergence, 116 théorème des résidus, 148
représentation à un signe près, 192 tribu, 21
représentation d’un groupe, 184 tribu borélienne, 21
représentation de l’algèbre so(3), 191 tribu engendrée par . . ., 21
représentation réductible, irréductible, 184
U(1), 186
Riemann, intégrale de, 17
univers, 72
Riemann, sphère de, 5, 149
Riemann–Lebesgue, théorème de, 60 valeur moyenne, 73, 75
variable aléatoire (v.a.), 74
série entière, 115
variance, 75
série formelle, 115
voisinage, 4
Schur, lemme de, 185
Schwarz, principe de symétrie, 142 Weierstrass, théorème de, 14
semi-norme, 5
séparé, espace, 4
série de Laurent, 146
série réciproque, 115
σ-additivité, 21
simplement connexe, 132
singularité apparente, 145
singularité essentielle, 145
singularité isolée, 145
sinus cardinal, 65
SO(2), 186
SO(3), 188
sommable, fonction, 25

L3 2013 PDF

Transféré par

Droits d'auteur :

Formats disponibles

L3 2013 PDF

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

L3 2013 PDF

Transféré par

Droits d'auteur :

Formats disponibles

Formation Interuniversitaire de Physique

Mathématiques pour physiciens

– 1 Rappels, convergence, séries, fonctions 1 cours

1 Rappels, convergence, séries, fonctions 1

5.2.1 Axiomes de Kolmogorov . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

6 Séries entières. Fonctions analytiques 115

6.4.2 Produits infinis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

7 Fonctions holomorphes. Théorème de Cauchy 127

8 Fonctions de variables complexes, applications 153

8.4.1 Méthode du col . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164

9 Transformation de Laplace 169

10 Aspects de la théorie des groupes 183

Rappels, convergence, séries, fonctions

1.1 Topologie de la droite réelle (rappels)

1.1.1 Suites convergentes. Suites de Cauchy

un → ` ∈ R ⇐⇒ ∀ ∃N tel que ∀n > N |un − `| < 

∀, ∃N tel que ∀n, n0 > N |un − un0 | <  .

tronquée au n-ième dénominateur, ou encore définie par la relation de récurrence u0 = 2, un =

30 janvier 2014 J.-B. Z L3 FIP 2013

• Rappel : Définition de R par suites de Cauchy de rationnels équivalentes

1.1.2 Ouverts, fermés. Points d’accumulation

Le point d’accumulation ξ peut appartenir ou non à l’ensemble E.

Théorème 1.2 (Bolzano–Weierstrass) : Tout ensemble E ⊂ R infini borné possède au

J.-B. Z L3 FIP 2013 30 janvier 2014

1.1.3 Les deux propriétés fondamentales de R

Théorème 1.4 : R est complet : toute suite de Cauchy y converge.

30 janvier 2014 J.-B. Z L3 FIP 2013

1.2 Bribes de topologie générale

1.2.1 Petit glossaire

Fermé de E : complémentaire d’un ouvert dans E.

Densité : Un sous-ensemble X d’un e.t. E est dense dans E si ∀a ∈ E, tout voisinage de a a

J.-B. Z L3 FIP 2013 30 janvier 2014

fois ouverts et fermés sont E et ∅.

1.2.2 Espaces vectoriels normés

Définition 1.1 : Norme :

30 janvier 2014 J.-B. Z L3 FIP 2013

• Espaces de fonctions normés

1.2.3 Suites convergentes, suites de Cauchy dans un espace normé

∀ > 0 ∃N tel que ∀n > N kun − uk <  . (1.4)

J.-B. Z L3 FIP 2013 30 janvier 2014

1.3 Suites et séries de fonctions. Convergence simple,

∀ > 0 ∀x ∈ X ∃N tel que ∀n > N |fn (x) − f (x)| <  (1.6)

Définition 1.6 : La suite fn converge uniformément vers f si

∀ > 0 ∃N tel que ∀x ∈ X ∀n > N |fn (x) − f (x)| <  (1.7)

∀n > N ∀x ∈ [0, a] |xn − 0| = xn ≤ an < aN ,

30 janvier 2014 J.-B. Z L3 FIP 2013

pour tout x réel, vers la fonction exponentielle ex . La convergence est-elle uniforme ?

1.3.2 Continuité d’une limite de fonctions continues

1.3.3 Dérivabilité d’une limite de fonctions dérivables.

J.-B. Z L3 FIP 2013 30 janvier 2014

Remarque. Ces notions de convergence absolue et de continuité ou dérivabilité associées ne

1.3.4 Intégrabilité d’une limite de fonctions intégrables.

Autrement dit, sous l’hypothèse de convergence uniforme,“intégration et limite commutent”.

1.3.5 Séries. Séries de fonctions

30 janvier 2014 J.-B. Z L3 FIP 2013

N.B. Ne pas confondre la norme k k (sans indice) de l’espace normé E et la norme k k∞ de

Donc CVN ⇒ CVU ⇒ CVS. (Exercice : le vérifier)

Appendix A. Notations et rappels

J.-B. Z L3 FIP 2013 30 janvier 2014

un → ` ∈ R ⇐⇒ ∀ ∃N tel que ∀n > N |un − `| <

∀, ∃N tel que ∀n, n0 > N |un − un0 | < .

∀ > 0 ∃N tel que ∀n > N kun − uk < . (1.4)

∀ > 0 ∀x ∈ X ∃N tel que ∀n > N |fn (x) − f (x)| < (1.6)

∀ > 0 ∃N tel que ∀x ∈ X ∀n > N |fn (x) − f (x)| < (1.7)

` = limn→∞ un finie si ∀ ∃N tel que ∀n > N un < ` +