Formes Modulaires
Formes Modulaires
Formes Modulaires
Les deux premiers cours seront consacrés aux propriétés élémentaires des formes
modulaires. Il s’agit uniquement d’un survol, très loin d’être une présentation
sérieuse de ce sujet. Des références excellentes sont le livre de Serre, les notes
de Gaëtan Chenevier (cf. sa page web), le livre de Diamond-Shurman ou l’excellent
article de Diamond-Im. Pour plus d’exemples et des applications plus "exotiques"
des formes modulaires, cf. l’article de Zagier dans 1,2,3 of modular forms.
sur H , via !
a b az + b
.z = .
c d cz + d
On vérifie en effet que
!
az + b Im(z)
Im = det g · > 0.
cz + d |cz + d|2
Pour tout entier k on peut définir une action (à droite) "de poids k" du groupe
G = SL2 (R) sur l’espace O(H ) des fonctions holomorphes sur H en posant
!
1 a b
f |k γ(z) = f (γ.z), γ = .
(cz + d)k c d
1
Des exemples importants sont le sous-groupe de congruence principal Γ(N ) de
niveau l’entier N ≥ 1, formé des matrices g ∈ Γ(1) telles que g ≡ 1 (mod N ), et
surtout (pour la théorie des formes modulaires) les groupes Γ0 (N ) (resp. Γ1 (N ))
formé des matrices g ∈ Γ(1) dont la réduction modulo N est triangulaire supérieure
(resp. triangulaire supérieure unipotente).
Exercice 1.2. Vérifier que Γ(N ) est distingué d’indice fini dans Γ(1), que Γ1 (N ) est
distingué dans Γ0 (N ) et que Γ0 (N )/Γ1 (N ) ' (Z/N Z)∗ via g = ( ac db ) → d.
Dans toute la suite de ce texte Γ sera un sous-groupe arithmétique de
Γ(1).
Le sous-espace
F Mk (Γ) = {f ∈ O(H )| f |k γ = f, ∀γ ∈ Γ}
des fonctions fixées par l’action de Γ est appelé l’espace des formes faiblement
modulaires de poids k et niveau Γ. Il s’agit souvent d’un espace de dimension
infinie. Pour se ramener à des espaces de dimension finie et enfin définir la notion
de forme modulaire, nous introduisons:
Definition 1.2. On dit qu’une fonction f ∈ O(H ) est à croissance modérée si
pour tout α ∈ Γ(1) la fonction f |k α possède une limite finie quand Im(z) → ∞. On
dit que f est nulle aux pointes de Γ si de plus cette limite est nulle.
Voir le paragraphe 5.2 pour les considérations géométriques implicites dans la
définition un peu étrange ci-dessus. Le point à retenir est que le quotient Γ\H
est une surface de Riemann non compacte, et que l’on peut la compactifier en lui
ajoutant un nombre fini de points, appelés pointes. La condition de croissance
modérée (resp. annulation aux pointes) est celle qu’il faut pour éviter qu’une telle
fonction explose (resp. s’annule) quand elle s’approche des pointes de la surface.
Definition 1.3. Soit Γ un sous-groupe arithmétique de Γ(1).
a) L’espace Mk (Γ) des formes modulaires de poids k pour Γ est le sous-
espace de F Mk (Γ) formé des fonctions à croissance modérée.
b) L’espace Sk (Γ) des formes cuspidales ou paraboliques de poids k et
niveau Γ est le sous-espace de Mk (Γ) formé des fonctions nulles aux pointes.
Nous verrons plus loin dans ces notes que grâce aux conditions de croissance
imposées, les espaces Mk (Γ) sont de dimension finie (c’est tout sauf évident vu leur
définition!).
Remarque 1.3. a) Prenons Γ = Γ(1). Il est classique (et pas difficile) de vérifier que
Γ est engendré par S = ( 01 −1 1 1
0 ) et T = ( 0 1 ), qui agissent par z → −1/z et z → z + 1
sur H . Ainsi
F Mk (Γ(1)) = {f ∈ O(H )| f (z + 1) = f (z), f (−1/z) = z k f (z)}
et Mk (Γ(1)) est le sous-espace des fonctions ayant une limite finie quand Im(z) → ∞.
b) Il est immédiat, mais très utile de voir que si f ∈ Mk (Γ) et g ∈ Ml (Γ),
alors f g ∈ Mk+l (Γ). Si g ∈ Sl (Γ) on a f g ∈ Sl (Γ). Voir l’exercice ci-dessous pour
P
une re-interprétation. Ainsi M (Γ) = k Mk (Γ) est une sous-algèbre de O(H ) et
P
S(Γ) = k Sk (Γ) en est un idéal.
Exercice 1.4. Montrer que les sous-espaces Mk (Γ) (k ∈ Z variable) sont en somme
directe dans O(H ).
Exercice 1.5. Montrer que Mk (Γ(1)) = 0 si k est impair.
Exercice 1.6. Si f ∈ Mk (Γ) et α ∈ Γ(1), alors f |k α ∈ Mk (α−1 Γα).
2
2 q-développement d’une forme modulaire
Soit Γ un sous-groupe arithmétique de Γ(1) et soit f ∈ F Mk (Γ). Comme Γ est
d’indice fini dans Γ(1), on a
Γ∞ := Γ ∩ ( 10 Z1 ) = ( 10 hZ
1 )
pour un (unique) entier h > 0. Alors f ∈ O(H ) et f (z) = f (z +h). Soit en utilisant
l’analyse de Fourier sur R combinée aux équations de Cauchy-Riemann, soit de
∗
manière plus savante en utilisant le biholomorphisme entre ( 10 hZ 1 ) \H et D =
2iπz/h
{z ∈ C|0 < |z| < 1} induit par z → qh : (z → e ), on obtient l’existence d’une
P n ∗
fonction holomorphe n∈Z an q dans D (la série étant absolument convergente sur
tout compact de D∗ ) telle que
an qhn , qh := e2iπz/h .
X
f (z) =
n∈Z
X −2πyn 2iπnx
f (x + iy) = an e h ·e h
n∈Z
et donc
1Zh
−2πyn 2iπnx
an · e h f (x + iy)e− h .
=
h 0
Une application fort utile de cette discussion est l’énoncé suivant, qui explique
mieux la notion de croissance modérée.
Proposition 2.1. Soit f = n∈Z an qhn le q-développement à l’infini de f ∈ M Fk (Γ),
P
avec Γ∞ = ( 10 hZ
1 ). Les assertions suivantes sont équivalentes:
a) limIm(z)→∞ f (z) existe et est finie.
b) Il existe N ≥ 1 et c > 0 tels que |f (x + iy)| ≤ cy N pour tous x ∈ R et y ≥ 1.
c) On a an = 0 pour n < 0.
Les assertions suivantes sont équivalentes:
a) limIm(z)→∞ f (z) = 0
b) an = 0 pour n ≤ 0.
c) Il existe c > 0 tel que |f (x + iy)| ≤ ce−2πy/h pour x ∈ R et y ≥ 1.
Proof. Il est clair que a) entraîne b) et que c) entraîne a) (la limite est a0 , bien sûr).
Le fait que b) entraîne c) se déduit en faisant, pour n < 0, y → ∞ dans
Z h
2πny 2iπnx
h|an |e− h =| f (x + iy)e− h dx| ≤ cy N h.
0
ii) Vu ce qui précède, le seul point non évident est que b) entraîne c). Mais il
est aussi clair, car a1 + a2 q + ... est bornée sur le disque unité, et donc |f (z)| =
O(|qh |) = O(e−2πy/h ) uniformément en x.
3
Attention: il ne suffit pas de tester l’annulation des an pour n < 0 pour conclure
que f est modulaire. En effet, il faut vérifier le même genre d’annulation pour les
q-développements à l’infini de toutes les fonctions f |k α, avec α ∈ Γ(1). Cela peut
être très pénible, mais on le résultat suivant permet d’éviter la fatigue inutile:
Théorème 2.1. Soit f (z) = n≥0 an qhn ∈ F Mk (Γ) telle que an = O(nN ) pour un
P
f (u + iv)|
|an |e−2πnv/h .
X
|F (x + iy)| = ≤ |f (u + iv)| ≤
(cz + d)k n≥0
qui est bien Γ-invariante...si la série converge. Prenons ϕ bornée et notons que si
deux matrices dans Γ diffèrent par un élément de Γ∞ (à gauche), alors elles ont la
même deuxième ligne, dont les éléments sont des entiers premiers entre eux. Donc
X X 1 X 1
|f (z)| = | ϕ|k γ(z)| ≤ ||ϕ||∞ · k
≤ ||ϕ||∞ .
γ∈Γ∞ \Γ pgcd(c,d)=1
|cz + d| (c,d)∈Z2 −{(0,0)}
|cz + d|k
4
Proof. Soit A un compact de H , il existe donc ε > 0 tel que y ≥ ε et |x| ≤ ε−1
pour z = x + iy ∈ A. Si (c, d) ∈ Z2 − {(0, 0)} et z = x + iy ∈ A on obtient
|cz + d| ≥ |c||y| ≥ ε|c|, mais aussi1
2 2 d2 y 2 2 2
|cz + d| = (cx + d) + c y ≥ 2 2
≥ Cd2
x +y
1 P
pour une constante C (dépendant de ε). Comme la série c,d max(|c|,|d|) k converge
(−2iπ)k X
Gk (z) = 2ζ(k) + 2 σk−1 (n)q n .
(k − 1)! n≥1
2
La fonction qhn en est un exemple!
5
Lemme 3.2. (Euler) Si k ≥ 2 et z ∈ H , on a
X 1 (−2iπ)k X k−1 d
k
= d q .
n∈Z (n + z) (k − 1)! d≥1
2iπ
Noter que le terme à gauche vaut (avec q = e2iπz ) iπ − 1−q = −iπ − 2iπ d≥1 q d ,
P
P 1
alors que le terme à droite "vaut" n∈Z z+n (bien sûr, la série ne converge pas, mais
elle converge une fois que l’on dérive...).
Pour pas mal de questions il est convenable de re-normaliser les Gk , en définissant
(pour k ≥ 4 pair)
Gk
Ek := ,
2ζ(k)
ainsi le coefficient a0 du q-développement à l’infini de Ek est 1, en particulier Ek ∈
/
Sk (Γ(1)). On a par exemple
Proof. Il faut voir que ζ(k)/(2iπ)k ∈ Q pour k ≥ 2 pair, un résultat célèbre d’Euler.
Rappelons l’argument magique: on re-écrit l’identité d’Euler ci-dessous sous la forme
1
1 − πzcot(πz) = 2z 2 = 2z 2 (ζ(2) + z 2 ζ(4) + z 4 ζ(6) + ...).
X
n≥1 n2 − z2
X X Xn X 1 X2 1 X4
= Bn = 1 − + · − · + ...
eX − 1 n≥0 n! 2 6 2 30 24
On vérifie sans problème que Bn ∈ Q pour tout n, et d’autre part l’identité ci-dessus
montre que
Bk
ζ(k) = − (2iπ)k ,
2k!
ce qui permet de conclure.
6
Théorème 4.1. (Gauss) L’ensemble
D = {z ∈ C| |z| ≥ 1, |Re(z)| ≤ 1/2}
est un domaine fondamental de Γ(1) agissant sur H , i.e. H = ∪γ∈Γ(1) γ.D et les
ensembles γ.Int(D) sont deux à deux disjoints.
Proof. Je donne la preuve de la première partie uniquement, car elle est très jolie (et
c’est cette partie que l’on utilisera dans la suite). Soit z ∈ H . Comme Im(γz) =
Im(z)
|cz+d|2
et zZ + Z est discret, il est clair que l’ensemble S des z 0 ∈ Γ(1)z tels que
Im(z 0 ) soit maximal est non vide. De plus, S est stable par z 0 → z 0 + 1, donc S
0)
contient un élément z 0 tel que |Re(z 0 )| ≤ 1/2. On a Im(z 0 ) ≥ Im(−1/z 0 ) = Im(z0
|z | 2 ,
donc |z | ≥ 1 et donc z ∈ D ∩ Γ(1)z, ce qui montre que H = ∪γ∈Γ(1) γ.D.
0 0
n≤x
Proof. Comme ϕf est bornée, il existe C > 0 tel que |f (x + iy)| ≤ Cy −k/2 pour tous
x + iy ∈ H . Comme f (x + iy) = n≥1 an e−2πny/h e2iπnx/h , la formule de Parseval
P
|an |2 ≤ c0 N k . Cela
P
Si N > 0 est un entier, en prenant y = 1/N on obtient n≤N
finit la preuve du théorème.
7
Remarque 4.4. La méthode de Rankin-Selberg (que l’on ne discutera pas ici) permet
de montrer que la majoration n≤N |an |2 = O(N k ) est optimale. En revanche, la
P
8
L’expression 1 − 24 n≥1 σ1 (n)q n ressemble drôlement au q-développement d’une
P
hypothétique série d’Eisenstein G2 , qui n’existe pas vraiment en tant que forme
modulaire... Ceci étant dit, on va voir que l’on peut définir
!
X X 1
G2 (z) :=
c d (cz + d)2
en tant que série convergente (mais pas absolument convergente!) et que l’on a
π2
σ1 (n)q n ),
X
G2 (z) = (1 − 24
3 n≥1
dq |c|d = 2 dq cd = 2 σ1 (n)q n ,
XX X X
Notons que cette fonction G2 est nettement plus délicate que les G4 , G6 , ..., à
cause de l’absence de convergence absolue des séries utilisées. Passons au coeur de
l’argument et montrons que
X 1 XX 1 X 1 XX 1
= 2
+ 2
= 2
+ 2
,
d6=0 d c6=0 d (cz + d) (cz + d + 1) d6=0 d d c6=0 (cz + d) (cz + d + 1)
9
Ensuite, on a
1 XX 1 XX 1 X 1 XX 1
G2 (−1/z) = = = + ,
d (dz − c)
2 2 2 2 2
z c c d (dz + c) c6=0 c d c6=0 (cz + d)
N −1 X
1 1 1
XX X
= = lim − .
c6=0 (cz + d)(cz + d + 1) d=−N c6=0 cz + d cz + d + 1
N →∞
d
!
X 1 1 2X 1 1
= lim − = lim − N + N =
N →∞
c6=0 cz − N cz + N N →∞ z c≥1 z
−c z
+c
2 πN z 2iπ
lim − π cot − = .
N →∞ z z N z
Cela permet de conclure.
π
Exercice 5.2. Montrer que la fonction (pas holomorphe!) f (z) = G2 (z)− Im(z) vérifie
f |2 γ = f pour γ ∈ Γ(1).
Le résultat précédent a beaucoup d’applications concernant la structure des es-
paces Mk := Mk (Γ(1)) et Sk := Sk (Γ(1)), qui sont résumés dans le théorème et les
deux corollaires ci-dessus:
Théorème 5.3. a) On a S0 = 0, M0 = C, Mk = 0 pour k < 0 et Sk = 0 pour
k < 12. De plus, Mk = CEk pour k = 4, 6, 8, 10, M2 = 0 et S12 = C∆.
b) Pour tout k on a Sk = ∆ · Mk−12 . De plus, pour tout k ≥ 2 pair dim Mk est
k k
b 12 c si k ≡ 2 (mod 12) et 1 + b 12 c sinon.
Proof. Nous allons utiliser les observations suivantes plusieurs fois:
• Mk = CEk ⊕ Sk pour k ≥ 4 pair. En particulier dim Mk = 1 + dim Sk .
• Si f ∈ Sk , alors f /∆ ∈ Mk−12 , en particulier Sk = ∆Mk−12 . En effet,
l’invariance par Γ(1) pour l’action de poids k−12 est claire, tout comme l’holomorphie
(noter le point crucial: ∆ ne s’annule pas sur H ). Pour ce qui est de la croissance
à l’infini, il suffit de noter que f = O(q) et ∆ = q(1 + O(q)) (deuxième propriété
essentielle de ∆!).
a) On a déjà vu que S0 = 0 et M0 = C. Si k < 0 et f ∈ Mk , alors f 12 ∆−k ∈ S0 =
0, donc f = 0. Ensuite, si k < 12 et f ∈ Sk , alors f /∆ ∈ Mk−12 = 0 (deuxième
observation ci-dessus). On en déduit aussi que Mk = CEk pour k = 4, 6, 8, 10
(première observation ci-dessus!). Si f ∈ S12 , alors f /∆ ∈ M0 = C, donc S12 = C∆.
Il reste à voir que M2 = 0. Or si f ∈ M2 , on a f 2 ∈ M4 et f 3 ∈ M6 , donc
f 2 = αE4 , f 3 = βE6 pour des nombres α, β ∈ C. Si f 6= 0, on obtient alors
E43 = γE62 pour un γ ∈ C. En regardant le q-développement on voit que cela est
impossible.
b) Le premier point a été déjà vu. On montre la relation concernant dim Mk par
récurrence sur k, en passant de k à k + 12. Pour 0 ≤ k ≤ 10 cela a été vérifié, et on
passe de k à k + 12 en utilisant les relations Mk = CEk ⊕ Sk et Sk = ∆Mk−12 pour
k ≥ 12, qui montrent que dim Mk = 1 + dim Mk−12 .
10
Corollaire 5.1. On a
E43 − E62
∆= .
1728
Proof. Les deux termes sont dans S12 = C∆, donc sont proportionnels. Pour iden-
tifier la constante, on regarde le coefficient de q dans le q-développement.
Corollaire 5.2. Si k ≥ 4 est pair, une base de Mk est donnée par les E4r E6s pour
les entiers r, s ≥ 0 tels que 4r + 6s = k.
Proof. On vérifie sans mal que le nombre de paires (r, s) est le même que dim Mk ,
donc il suffit de montrer que la famille en question est génératrice. Il est facile de
voir que pour tout k ≥ 4 pair il existe r, s ≥ 0 tels que k = 4r + 6s. Fixons une telle
paire (r, s) et notons que pour tout f ∈ Mk on a f − f (∞)E4r E6s ∈ Sk = ∆Mk−12 .
E43 −E62
Comme ∆ = 1728 , on peut conclure par récurrence sur k.
Exercice 5.4. a) Montrer que E42 = E8 . En déduire que pour tout n ≥ 2
n−1
X
σ7 (n) = σ3 (n) + 120 σ3 (j)σ3 (n − j).
j=1
b) Montrer que E4 E6 = E10 et écrire l’identité analogue à celle dans a) qui s’en
déduit.
Soit f ∈ Mk . Si z ∈ H on note vz (f ) l’ordre d’annulation de f en z, et on
note v∞ (f ) = vq (f ) (si f = a0 + a1 q + ... est le q-développement de f , vq (f ) est
le plus petit n tel que an 6= 0). Soit aussi ez le cardinal du stabilisateur de z dans
PSL2 (Z). Les quantités vz (f ) et ez ne dépendent que de Γ(1)z, et ez = 1 sauf si
z ∈ Γ(1)i ∪ Γ(1)ρ, avec ez = 2 pour z ∈ Γ(1)i et ez = 3 pour z ∈ Γ(1)ρ.
Proof. Voir le livre de Serre ou les notes de Chenevier. L’idée est d’intégrer f 0 /f le
long de la frontière de D, mais les détails sont assez pénibles...
Une application importante du théorème ci-dessus est le:
Proof. (merci à Gaëtan Chenevier pour cette preuve élégante) Prenons un en-
k
tier N > 12 [Γ(1) : Γ] et considérons z1 , .., zN ∈ Int(D) (D étant le domaine
fondamental usuel). On va montrer que l’application Mk (Γ) → CN envoyant f
sur (f (z1 ), ..., f (zN )) est injective, ce qui permettra de conclure. Supposons que
f ∈ Mk (Γ) est non nulle et f (zi ) = 0 pour i = 1, ..., N . Alors N (f ) := α∈Γ\Γ(1) f |k α
Q
est clairement dans Mk[Γ(1):Γ] (Γ(1)) et s’annule aussi en chacun des zi . Par le
théorème précédent cela force N (f ) = 0. Comme O(H ) est intègre, on doit avoir
f |k α = 0 pour un α ∈ Γ(1), et donc f = 0. Cela permet de conclure.
11
5.1 Séries theta et sommes de carrés
Soit rk (n) le nombre de (n1 , ..., nk ) ∈ Zk tels que n21 + ... + n2k = n.
Théorème 5.7. (Jacobi) La fonction Fk (z) = n≥0 rk (n)q n (avec q = e2iπz ) est un
P
C’est une application de la formule de Poisson4 , pour la fonction (on fixe t > 0)
4
Si f : R → C est continue et L1 et si g(x) =
P
n∈Z f (x + n) converge absolument et
uniformément sur tout compact, et si g est lisse, alors g(x) =
P ˆ 2iπnx
, avec fˆ(t) =
n∈Z f (n)e
−2iπxt ˆ
R P P
R
f (x)e dx. En particulier n∈ZP f (n) = n∈Z f (n). Pour démontrer la formule noter que
g est 1-périodique et lisse, donc g(x) = n∈Z ĝ(n)e2iπnx , or
Z 1 XZ 1
ĝ(n) = g(u)e−2iπnu du = f (u + k)e−2iπn(u+k) du = fˆ(n).
0 k∈Z 0
12
2
f (x) = e−πx t , dont la transformée de Fourier est donnée par la formule classique
πx2
fˆ(x) = √1 e− t .
t
On peut montrer (on ne le fera pas) que M2k (Γ0 (4)) est de dimension k + 1
pour k ≥ 1. En particulier θ4 , θ8 vivent dans des espaces de dimension 2 (resp.
3), pour lesquels il n’est pas trop difficile de construire des bases à partir de séries
d’Eisenstein. L’observation essentielle est que si f ∈ Mk (Γ(1)), alors f (N z) ∈
π
Mk (Γ0 (N )) (immédiat). En appliquant cela à f (z) = G2 (z) − Im(z) , on obtient
[N ]
G2 (z) := G2 (z) − N G2 (N z) ∈ M2 (Γ0 (N )),
avec un q-développement
[N ] π2
(1 − N ) − 8π 2 d)q n .
X X
G2 (z) = (
3 n≥1 d|n,d∈N
/ Z
[2] [4]
Cela montre en particulier que G2 et G2 forment une famille libre, et donc une base
[2] [4]
de M2 (Γ0 (4)). En écrivant θ4 = aG2 + bG2 et en regardant les q-développements,
[4]
G2
on obtient θ4 = − π2
, puis le beau:
Théorème 5.9. (Jacobi) On a
X
r4 (n) = 8 d.
d|n,d∈4Z
/
Exercice 5.10. a) On admet que M4 (Γ0 (4)) est de dimension 3. Montrer que E4 (z), E4 (2z), E4 (4z)
en forment une base.
b) Ecrire θ8 comme une combinaison linéaire de ces trois fonctions, et en déduire
la formule (avec la convention σ3 (x) = 0 pour x ∈/ Z)
(−1)n−d d3 .
X
r8 (n) = 16
d|n
En particulier r8 (p) = 16(p3 + 1) pour tout premier p, et r8 /16 est une fonction
multiplicative.
Y (Γ) = Γ\H ,
13
que l’on munit de la topologie quotient. Le groupe Γ agit proprement discontinu-
ment sur H , i.e. tout x ∈ H a un voisinage ouvert Ux tel que {γ ∈ Γ|γUx ∩Ux 6= ∅}
soit égal à Γx := StabG (x), et Γx est un groupe fini, cyclique. En combinant cela
avec la théorie des surfaces de Riemann, on obtient
Théorème 6.1. L’espace topologique Y (Γ) est séparé, localement compact et pos-
sède une unique structure de surface de Riemann telle que p : H → Y (Γ) soit
holomorphe. Les fonctions holomorphes sur un ouvert U de Y (Γ) sont les fonctions
holomorphes Γ-invariantes sur p−1 (U ).
Les espaces Y (Γ) sont tout à fait remarquables. On a par exemple le résultat
miraculeux suivant:
Théorème 6.2. (d’uniformisation) Soit Γ = SL2 (Z). Alors Y (Γ) est biholomor-
phe à C et est naturellement en bijection avec d’une part l’ensemble des réseaux
de C, à homothétie près, d’autre part l’ensemble des courbes elliptiques sur C, à
isomorphisme près.
L’espace Y (Γ) n’est pas compact. Cela se voit clairement pour Γ = Γ(1) en
utilisant le théorème 4.1. On peut "compactifier" la surface de Riemann Y (Γ) en
ajoutant un nombre fini de "pointes". Le groupe Γ(1) agit transitivement (comme on
le pense) sur P1 (Q) = Q∪{∞}, le stabilisateur Γ(1)∞ de ∞ étant Γ(1)∞ = ± ( 10 Z1 ).
On a donc une identification P1 (Q) = Γ(1)/Γ(1)∞ . L’ensemble des pointes est en
bijection avec Γ\P1 (Q) = Γ\Γ(1)/Γ(1)∞ , qui est bien fini car Γ est d’indice fini
dans Γ(1).
Décrivons plus précisément la compactification X(Γ) de Y (Γ). Soit
H ∗ = H ∪ P1 (Q) ⊂ P1 (C),
que l’on munit d’une topologie comme suit:
• on conserve les ouverts de H .
• Une base de voisinages de ∞ est donné par les UT = {z ∈ H |Im(z) >
T } ∪ {∞}, avec T > 0. Une base de voisinages de α.∞ (α ∈ Γ(1)) est donnée par
les αUT .
On pose alors
X(Γ) = Γ\H ∗ ,
muni de la topologie quotient et on note C(Γ) = X(Γ) \ Y (Γ) l’ensemble des pointes
(ou cusps) de X(Γ). On montre (c’est un peu pénible...) que X(Γ) est un espace
topologique séparé, connexe et compact. La partie la plus pénible est le caractère
séparé, la connexité est claire, car X(Γ) est l’image du connexe H ∗ . De plus, la
compacité se déduit du caractère séparé de X(Γ) et du théorème 4.1: si D est le
domaine fondamental ci-dessus, l’espace D ∪ {∞} est compact (par définition de
la topologie sur H ∗ ), il en est donc de même de l’union finie de ses translatés
∪γ∈Γ(1)/Γ γ(D ∪ {∞}). Comme X(Γ) est l’image continue de cette réunion par la
projection canonique, et comme il est séparé (le fait admis ci-dessus...), il est com-
pact.
On peut munir X(Γ) d’une structure de surface de Riemann compacte étendant
celle sur Y (Γ). Si U ⊂ X(Γ) est un ouvert, les fonctions holomorphes sur U sont les
fonctions continues f : U → C dont la restriction à U ∩ Y (Γ) est holomorphe. Soit
Γ∞ = Γ ∩ Γ(1)∞ , il existe alors un unique entier h > 0 tel que ±Γ∞ = ± ( 10 hZ 1 ).
2iπz/h
Alors qh = e est une coordonée locale en la pointe Γ∞.
14
7 Opérateurs de Hecke
Nous allons travailler dans la suite en niveau
Γ = Γ1 (N ),
la somme portant sur les caractères de Dirichlet χ modulo N tels que χ(−1) = (−1)k ,
avec
Mk (N, χ) = {f ∈ Mk (N )| f |k γ = χ(γ)f, ∀ γ ∈ Γ0 (N )}.
On se propose de construire des algèbres commutatives (de Hecke) T(N ) ⊂ T
d’endomorphismes des espaces Mk (N, χ), qui préservent Sk (N, χ) et dont l’étude
des espaces propres simultanés fournit un tas de renseignements sur l’arithmétique
des formes modulaires.
15
1ΓgΓ de ΓgΓ ⊂ G, quand g varie dans G. C’est un exercice amusant (ou pas) de
vérifier que le produit de convolution
Φ1 (x)Φ2 (x−1 g)
X
(Φ1 ∗ Φ2 )(g) =
x∈G/Γ
munit H (G, Γ) d’une structure de A-algèbre associative (son élément neutre est
1Γ ), pas forcément commutative. De plus, M Γ devient naturellement un H (G, Γ)-
module, via
Φ ∈ H (G, Γ), m ∈ M Γ .
X
m.Φ := Φ(g) · (m.g),
g∈Γ\G
Noter déjà que l’expression à droite a bien un sens, grâce aux hypothèses faites sur
Φ et parce que l’on prend m ∈ M Γ (donc m.g ne dépend que de l’image de g dans
Γ\G). Toute cette discussion un peu formelle est une manifestation d’une technique
standard en théorie des représentations, la réciprocité de Frobenius, qui fournit
dans notre situation une identification HomA[G] (A[Γ\G], M ) ' M Γ (on envoie un
élément à gauche sur sa valeur en 1), montrant que M Γ est un module à droite sur
EndA[G] (A[Γ\G]) ' A[Γ\G]Γ ' A[Γ\G/Γ], l’action de la double classe ΓgΓ étant
X
m.(ΓgΓ) = m.h.
h∈Γ\ΓgΓ
Remarquons que cet opérateur n’est rien d’autre qu’un opérateur "trace". En effet,
si f ∈ F Mk (Γ), alors clairement f |k α ∈ F Mk (Γα ), avec Γα = Γ ∩ α−1 Γα, et Tα (f )
est simplement la "trace" de f |k α:
X
Tα (f ) = (f |k α)|k β.
β∈Γα \Γ
16
Definition 7.1. a) Le p-ième opérateur de Hecke Tp sur Mk (N ) (ou Sk (N ), ou
Mk (N, χ) ou...) est
Tp = T 1 0 .
0 p
Pour rendre ces opérateurs plus explicites, par exemple pour calculer le q-
développement à l’infini de Tp (f ) en fonction de celui de f , on commence par vérifier5
que
p−1 a
1 j
a
1 0 p 0
Γ 0 p Γ= Γ 0 p Γσ 0 1
j=0
avec
1 p−1
!
X z+j
Up f (z) = f , Vp f (z) = f (pz).
p j=0 p
an q n
P
Au niveau du q-développement à l’infini, cela s’écrit pour f = n
anp q n , an q np ,
X X
Up f = Vp f =
n
(anp + χ(p)pk−1 a np )q n .
X
Tp (f ) =
n
En particulier a1 (Tp (f )) = ap (f ).
5
C’est élémentaire mais assez pénible, cf. tout livre sur les formes modulaires.
17
Exercice 7.2. a) Si f = n an q n ∈ Mk (N ), montrer que Vp ◦ Up (f ) = p|n an q n .
P P
Vp ◦ Up (f ) ∈ Mk (N p2 )).
1 n−1
X z+j 1 n−1
X dz + dj 1 n−1
X dz + j
Un Vd f (z) = Vd f ( )= f( )= f( ) = Vd Un f (z),
n j=0 n n j=0 n n j=0 n
Il suffit donc de comprendre les opérateurs Tpr quand p est premier et r ≥ 0. Ils
sont décrits par:
18
Proof. Notons pour simplifier U = Up , V = Vp et x = χ(p), donc par définition
r
xj pj(k−1) V j U r−j .
X
Tpr =
j=0
j=1 j=1
r−1 r+1
= xpk−1 xj pj(k−1) V j U r−1−j + xj pj(k−1) V j U r+1−j = xpk−1 Tpr−1 + Tpr+1 .
X X
j=0 j=0
χ(d)dk−1 a mn
X
bm = d2
(f ).
d|pgcd(m,n)
dk−1 χ(d)T mn
X
Tm ◦ Tn = d2
d|pgcd(m,n)
19
8 Le produit de Petersson, diagonalisation de T(N )
Nous allons montrer dans ce paragraphe que les opérateurs Tn ∈ End(Sk (N, χ)),
avec n premier à N sont simultanément diagonalisables. Pour cela on construira
un produit hermitien sur Sk (N, χ) pour lequel ces opérateurs sont normaux (i.e.
commutent à leur adjoint). On verra plus tard une interprétation nettement plus
naturelle de tout ceci, en termes d’espaces L2 .
La mesure dµ(z) = dxdy y2
sur H est invariante6 sous l’action de GL2 (R)+ et
descend en une mesure sur Y (1) = Γ(1)\H . De manière concrète (mais pas toujours
utile...), on a Z Z
f (x)dµ(x) = f (z)dµ(z)
Y (1) D
dµ(z) < ∞.
R
où VΓ = Y (Γ)
La quantité hf, giΓ ne dépend pas du choix de Γ tel que f et g soient toutes les
deux modulaires de niveau Γ, une propriété cruciale de ce produit:
6 dzdz̄ det(α)dz
Exercice, utiliser le fait que dxdy = −2i et les formules d(α.z) = (cz+d)2 et Im(α.z) =
det(α)Im(z)
|cz+d|2 .
20
Proposition 8.1. Si [Γ : Γ0 ] < ∞, alors VΓ = [Γ(1) : Γ̄]VΓ(1) et hf, giΓ = hf, giΓ0
pour f, g ∈ Mk (Γ), au moins une étant cuspidale.
Proof. Le premier point découle de l’identité (∗) en prenant la fonction constante
1. Ensuite, on a (noter que Φf,g = Φf,g ◦ γ pour γ ∈ Γ)
1 Z 1 Z X
hf, giΓ0 = Φf,g dµ = Φf,g ◦ γ dµ
VΓ0 Γ0 \H VΓ0 Γ\H γ∈Γ̄0 \Γ̄
a Γui ∩ vi Γ 6= ∅, sinon Γui ⊂ ∪j6=i vj Γ, donc ΓαΓ = Γui Γ ⊂ ∪j6=i vj Γ, ce qui est
absurde. Si on choisit αi ∈ Γui ∩ vi Γ, alors ΓαΓ = αi Γ = Γαi .
` `
7
Rappelons que Γα = α−1 Γα ∩ Γ; on a donc f |k α ∈ Sk (Γα ) si f ∈ Sk (Γ).
21
Nous sommes presqu’arrivés au bout de nos peines: le résultat suivant montre
que les Tn sont normaux et ils commutent deux à deux, donc ils sont simultanément
diagonalisables.
Théorème 8.3. Pour n premier à N , l’adjoint de Tn sur Sk (N, χ) est χ(n)−1 Tn , i.e.
pour f, g ∈ Sk (N, χ) on a hTn f, gi = χ(n)hf, Tn gi. Les T ∈ T(N ) sont simultanément
diagonalisables.
Proof. Par multiplicativité des Tn on se ramène au cas de Tpr , avec p premier à N .
En utilisant
la proposition 6.2 on se ramène ensuite à r = 1. Comme Tp = Tαp , avec
αp = 0 p , le théorème précédent fournit Tp∗ = Tα∗p = T p 0 . Pour comprendre la
1 0
0 1
double classe8 Γ p 0
0 1 Γ, introduisons une matrice σ = ( Np n
m) ∈ Γ0 (N ) (elle existe
−1
p 0 1 n
car p, N sont premiers entre eux!) et posons γ = 10 p0 σ 0 1 = N mp . Alors
γ ∈ Γ et (rappelons que Γ est distingué dans Γ0 (N ))
p 0 p 0 1 0 1 0
Γ 0 1 Γ = Γγ 0 1 Γ=Γ 0 p σΓ = Γ 0 p Γσ,
1 0 ` p 0 `
donc si Γ 0 p Γ= Γαi , alors Γ 0 1 Γ= Γαi σ, et au bout du compte
Tp∗ f =
X
f |k αi σ = (Tp f )|k σ = χ(m)Tp (f ).
22
Théorème 8.4. (Atkin-Lehner) Soit f ∈ Sk (N ), f = n≥1 an q n . S’il existe D ≥ 1
P
P
tel que an = 0 pour tout n premier à D, alors f (z) = p|N gp (pz) pour certaines
gp ∈ Sk (N/p).
X an
L(f, s) = s
,
n≥1 n
qui converge dans le demi-plan Re(s) > 1 + k2 grâce à la borne de Hecke, et y définit
une fonction holomorphe. Notons que si f est T-propre et normalisée, i.e. a1 = 1,
alors le théorème 6.3 fournit immédiatement
Y 1
L(f, s) = .
p 1 − ap · p−s + χ(p)pk−1−2s
9
C’est l’analogue pour GL2 , i.e. dans la théorie des formes modulaires de l’ensemble des
caractères de Dirichlet primitifs pour GL1 .
23
Cependant, si est seulement T(N ) -propre et normalisée, tout ce que l’on peut dire
est que
Y 1 X an
L(f, s) = −s k−1−2s
· ,
p-N
1 − ap · p + χ(p)p n|N ∞
ns
i.e. on n’a aucun contrôle sur les coefficients dont l’indice a tous ses facteurs premiers
parmi ceux de N . Cette discussion combinée avec celle du paragraphe ci-dessus
fournit le beau:
Théorème 9.1. (Atkin-Lehner) L’espace Sk (N, χ)new possède une base orthogonale
de formes primitives. Si f = n≥1 an q n est primitive, on a une factorization de la
P
En particulier, comme S12 := S12 (Γ(1)) est de dimension 1, ∆ ∈ S12 est automa-
tiquement T-propre et on obtient ainsi
Y 1
L(∆, s) = .
p 1− τ (p)p−s + p11−2s
Ainsi, en écrivant
(1 − q n )24 = τ (n)q n ,
Y X
∆=q
n≥1 n≥1
encore moins évident... Ces résultats avaient été conjecturés par Ramanujan et dé-
montrés par Mordell, mais le formalisme a été ensuite dégagé par Hecke. Ramanujan
avait aussi conjecturé que
11
|τ (p)| ≤ 2p 2 ,
conjecturé qui a fallu atteindre le tour de force de Deligne. Il a prouvé de manière
k−1
plus générale que si f ∈ Sk (N, χ) est primitive, alors |ap (f )| ≤ 2p 2 (un cas
particulier mais hautement important de la fameuse conjecture de Ramanujan-
Petersson). On ne peut rien dire sur la preuve dans ces notes, sauf qu’elle utilise
beaucoup de géométrie algébrique très dure...
La fonction L complète de f est
Théorème 9.2. (Hecke) La fonction Λ(f, s) s’étend en une fonction holomorphe sur
C tout entier, bornée dans les bandes verticales10 et vérifiant l’équation fonctionnelle
24
La preuve de ce théorème fait intervenir une construction très utile. Soit Φ :
R>0 → C une fonction C ∞ telle que Φ(t) = O(e−ct ) quand t → ∞ et Φ(t) = O(t−v )
quand t → 0 (pour des c, v > 0 convenables) La transformée de Mellin de Φ est
Z ∞
dt
M Φ(s) = Φ(t)ts .
0 t
Si C est tel que |Φ(t)| ≤ Cect pour t ≥ 1 et |Φ(t)| ≤ Ct−v pour 0 < t ≤ 1, on a
Z ∞ Z 1 Z ∞
dt
|Φ(t)ts | ≤ C( tRe(s)−v−1 dt + e−ct tRe(s)−1 dt),
0 t 0 1
ce qui montre que M Φ est bien définie pour Re(s) > v, holomorphe dans ce demi-
plan, et bornée dans les bandes verticales de ce demi-plan.
Prenons alors Φ(t) = f (it) = n≥1 an e−2πnt . Il est clair que Φ(t) = O(e−2πt )
P
quand t → ∞, et on a vu que Φ(t)tk/2 est bornée sur R>0 . De plus11 pour Re(s) >
1 + k2 on a
Z ∞ Z ∞
−2πnt s dt dt X an
e−2πnt ts
X X
M Φ(s) = an e t = an = s
Γ(s) = Λ(f, s).
0 n≥1 t n≥1 0 t n≥1 (2πn)
Cela fournit la première partie du théorème. Pour la deuxième, il faut une nouvelle
idée: on écrit Z 1 Z ∞
s dt dt
M Φ(s) = Φ(t)t + Φ(t)ts
0 t 1 t
et on fait un changement de variable t = 1/x dans la première intégrale, d’où
Z ∞ dx
M Φ(s) = Φ(1/x)x−s + Φ(x)xs .
1 x
La modularité de f fournit f (−1/z) = z k f (z), qui se traduit par Φ(1/t) = ik tk Φ(t),
donc Z ∞
dx
M Φ(s) = Φ(x)(ik xk−s + xs ) .
1 x
2k
En se rappelant que k est pair (donc i = 1), sinon il n’y a rien à faire, on voit
tout de suite que M Φ(s) se prolonge en une fonction holomorphe sur C, vérifiant
M Φ(s) = ik M Φ(k − s), ce qui permet de conclure la preuve du théorème.
La preuve du théorème suivant est plus délicate.
possède un prolongement holomorphe à C tout entier, borné dans les bandes verti-
cales et satisfaisant Λ(s) = ik Λ(k − s) pour s ∈ C. Alors f ∈ Sk (Γ(1)).
11
On laisse au lecteur les justifications faciles concernant l’interversion somme/intégrale...
25
Proof. Il s’agit de voir que f (−1/z) = z k f (z), ce qui se ramène (par prolongement
analytique) à vérifier que Φ(1/t) = ik tk Φ(t), où Φ(t) = f (it) = n≥1 an e−2πnt . Noter
P
−k 1 Z
(it) Φ(1/t) = i−k Λ(s)t−(k−s) ds =
2iπ Re(s)=σ
1 Z −k −s 1 Z
i Λ(k − s)t ds = Λ(s)t−s ds
2iπ Re(s)=k−σ 2iπ Re(s)=k−σ
et il suffit de montrer que Re(s)=σ Λ(s)t−s ds = Re(s)=k−σ Λ(s)t−s ds. La fonction
R R
a) Montrer que Φ est C ∞ sur ]0, ∞[ et que Φ(t) = O(e−t ) pour t → ∞, Φ(t) =
O(t−v−1 ) pour t → 0. R
b) Soit M Φ(s) = 0∞ Φ(t)ts dtt . Montrer qu’elle est bien définie et holomorphe
pour Re(s) > 1 + v, et que M Φ(s) = Γ(s)L(s).
c) Vérifier que M Φ(c+iu) = R f (x)eixu dx pour c > 1+v. En déduire la formule
R
26
d) Montrer que si Re(s) > 1 + v + j alors
(−1)j
M Φ(s) = M Φ(j) (s),
s(s + 1)...(s + j − 1)
et en déduire que M Φ(s) = |s|1j quand |s| → ∞ et s reste dans une bande verticale
contenue dans Re(s) > 1 + v + j.
e) Supposons que Φ(1/t) = tk Ψ(t), avec k ∈ R, où Ψ est une fonction du même
genre que Φ, i.e. Ψ(t) = n≥1 bn e−nt , avec bn = O(nw ). Montrer que M Φ se
P
Montrer que Λ(f, s), Λ(g, s) possèdent un prolongement holomorphe√à C, avec Λ(f, s) =
ik Λ(g,
√k − s). Indication: regarderk les fonctions Φ(t) = f (it/ N ) et Ψ(t) =
g(it/ N ) et noter que Φ(1/t) = (it) Ψ(t).
Exercice 9.6. Soit χ : (Z/N Z)∗ → C∗ un caractère de Dirichlet et χ̄ = χ−1 son
conjugué complexe. Soit wN = ( N0 −10 ). √
a) Montrer que l’application f → f |k wN = (z → ( N z)−k f (−1/(N z))) induit
un isomorphisme d’espaces vectoriels Sk (N, χ) ' Sk (N, χ̄), en particulier elle induit
une involution de Sk (Γ0 (N )).
b) En utilisant l’exercice précédent, montrer que si f ∈ Sk (N, χ), alors Λ(f, s)
possède un prolongement holomorphe à C, avec l’équation fonctionnelle
Λ(f, s) = ik Λ(k − s, f |k wN ).
27