Cours Relat
Cours Relat
Cours Relat
Bibliographie sommaire
Voici une courte liste de références bibliographiques (classées par ordre d’utilité décroissante
pour le cours) :
— Introduction à la relativité par D. Langlois (Vuibert, 2011).
— Special relativity par A. P. French, M.I.T. Introductory Physics Series, 1968.
— Théorie des champs par L. Landau et E. Lifchitz. Volume 2 du cours de physique théorique
(Mir, 1989). Noter que les unités des grandeurs électromagnétiques ne sont pas les unités
internationales utilisées en cours.
— Classical electrodynamics par J. D. Jackson (John Wiley, 1975).
Vtrain b
c −c
a b d a c −c d
Pour un passager du train. Pour la vache (on a légèrement décalé le
point b vers le haut pour améliorer la
lisibilité du schéma).
On doit donc redéfinir la notion de simultanéité : deux évènements sont simultanés dans un
référentiel si des rayons lumineux issus de chacun sont détectés ensemble au point milieu 1 . De
même, deux horloges immobiles l’une par rapport à l’autre sont synchronisées si elles indiquent la
même heure lorsqu’elles sont atteintes par des rayon lumineux émis simultanément par un point
situé à mi chemin entre elles.
1. Milieu géométrique des deux parties spatiales.
1
I.2 Transformation spéciale de Lorentz (“Lorentz boost”)
On considère deux référentiels inertiels : R = {O, x, y, z, t} “immobile” et R0 = {O0 , x0 , y 0 , z 0 , t0 }
“en mouvement”. Le boost de Lorentz correspond à l’arrangement :
la vitesse de R0 par rapport à R est V ~ex , V est algébrique, mais nous allons raisonner dans la
configuration où V > 0. On a choisi les repères spatiaux de sorte que les points origines et les 3
axes des deux repères soient confondus à l’instant t = 0 = t0 . Les lois de transformation associées
au boost de Lorentz sont linéaires 2 et peuvent donc s’écrire sous la forme :
0
ct A B ct
= . (I.1)
x0 C D x
Si maintenant on change x en −x et x0 en −x0 , c’est R qui bouge à vitesse V > 0 par rapport à R0
le long du nouvel axe horizontal (maintenant orienté vers la gauche). On doit donc avoir :
0 0
ct A B ct ct A −B ct
= 0 , soit = . (I.2)
−x C D −x x −C D x0
Remarquons au passage que la mécanique de Galilée vérifie bien-sûr toutes ces contraintes
et correspond à t0 = t, c.a.d. à B = 0 et A = D = 1 et donc C = −β (c.a.d. x0 = x − V t).
2
donne ct0 = (A + B)ct et x0 = (−βA + A)ct : puisqu’on doit avoir x0 = c t0 cela impose donc
B = −βA (différent de Galilée, c’est normal). La contraintepA2 − BC = 1 (avec B = C = −β A)
s’écrit donc A2 (1 − β 2 ) = 1. Cela impose β 2 < 1 et 3 A = 1/ 1 − β 2 . D’où les relations
0
ct γ −βγ ct V 1
0 = où β = et γ = p . (I.4)
x −βγ γ x c 1 − β2
Le facteur γ (≥ 1) est appelé facteur de Lorentz. La loi de transformation (I.4) est obtenue de
manière géométrique (et plus physique) dans l’annexe I.6.a.
t0
L
t
t+
t
=V
x0D = γL
=V
x0O0 = 0
0
xD
xO
← dans R
L L0 = γ L
0
dans R →
x x0
On utilise les lois de transformation (I.4) pour obtenir les lois horaires dans R0 . On obtient
immédiatement : x0O0 = 0 et x0D = γL. Les lignes d’univers correspondantes sont tracées dans le
diagramme ci-dessus (figure de droite).
La longueur de la règle est plus petite dans R que dans le référentiel R0 où elle est au repos :
c’est le phénomène de contraction des longueurs (dont une autre dérivation est présentée en I.6.b).
3
On appelle la transformation (I.5) une “transformation de Lorentz” et Λ est une matrice de Lorentz.
Il est facile de vérifier que pour inverser la relation entre X et X 0 il suffit de changer le signe de β
dans (I.5). À partir de l’expression (I.5) qui correspond au cas particulier du boost de Lorentz, on
e e
peut construire une version générale de la transformation, cf. annexe I.6.e.
Il est plus naturel de raisonner en exprimant ~v en fonction de ~v 0 ; pour inverser les relations (I.8) il
suffit de changer le signe de V . On obtient ensuite : si vx0 = c (vy0 = vz0 = 0) alors vx = c. Si vy0 = c
(vx0 = vz0 = 0) alors vx2 + vy2 + vz2 = c2 . Si vx0 = 0.9 c (vy0 = vz0 = 0) et V = 0.9 c, alors vx = 1.81
1.8
c<c:
en composant des vitesses proches de celle de la lumière, on ne dépasse jamais c. On va donc se
cantonner aux vitesses sub-luminales 5 .
4. La relation est bien-sûr symétrique : si l’on considère l’observateur immobile à l’origine dans R (xO = 0), on
trouve x0O = −V t0O et tO = t0O /γ.
5. L’existence de particules aux vitesses supralumineuses (des “tachyons”) a été suggérée dans plusieurs contextes
théoriques, sans jamais induire de conséquences enthousiasmantes.
4
I.3 Différents types d’intervalle. Causalité. Cône de lumière
On se place du point de vue de l’observateur situé à l’origine des coordonnées. Soit un évènement
P = (ct, ~r ) tel que s2 = c2 t2 − ~r 2 > 0 : on dit que l’intervalle entre l’origine O et P est de “genre
temps”.
e On peut trouver un référentiel dans lequel O et P ont la même position e : eil suffit de con-
sidérer la transformation de Lorentz avec V ~ = ~r/t (àe 1+1edimension V = x/t). Mais par contre, si
t > 0, P sera toujours dans le futur de O. En effet on a 6 (en prenant ~r = x ~ex , avec x > 0) :
e e
c t > x > x V /c (∀ V < c) donc t0 = γ(t − V x/c2 ) > 0 . (I.9)
Pour les intervalles de “genre espace” (s2 < 0) la situation est renversée : on peut trouver des
référentiels dans lesquels O et P sont simultanés (en prenant V = c2 t/x) 7 mais aucun dans lequel
ils ont la même position. Lorsque
e e s2 = 0 on dit que l’intervalle est de “genre lumière”.
Revenons sur la chronologie entre deux évènements : on dira que O précède P si t > 0 et si
s2 > 0 (cette dernière condition est absente en physique non relativiste).
e e
t
Ci-contre : représentation (en 1+1 dimension) du P3
“cône de lumière” dans un diagramme de Min-
futur
e
kowski. P 1 est simultané dans R avec l’origine. Si
par exemplee x = 150 × 106 km = distance Terre- t2
1 P2
Soleil, l’intervalle entre O et P 2 (x2 = x1 et t2 = 8 ct
ailleurs = e
x
mn) est de genre lumière. e P e est dans le futur de
3 x
O : il peut y avoir un lien dee causalité entre O et
O P1
P
e .
3
e
e e
Le futur et le passé sont à l’intérieur du cône de
e
lumière, cf. illustration en 2+1 dimensions sur la passé
page de couverture.
Il va sans dire que les transformations de Lorentz, conservant la valeur d’un intervalle, ne
changent pas son genre.
5
Il est facile de vérifier qu’il s’agit d’un groupe (non commutatif) : le groupe de Lorentz O(3, 1).
De (I.10) on tire que detΛ = ±1. De là il vient que l’élément de volume de l’hyper-espace d4 X =
dX 0 dX 1 dX 2 dX 3 est invariant par transformation de Lorentz (on dit que c’est un “invariant de
Lorentz”), puisque d4 X 0 = |detΛ| d4 X. Les transformations de Lorentz conservent donc l’hyper-
volume.
En pratique on ne considère que le “groupe de Lorentz restreint” qui conserve l’orientation de
l’espace et la direction du temps mais cette remarque n’a pas d’incidence dans le suite du cours.
Le lectorat intéressé par les aspects plus mathématiques pourra lire l’annexe I.6.f.
La quadri-impulsion est
P = m U . On a P 2 = m2 c2 . (I.12)
e e e
• Pour une particule de trajectoire ~r = ξ(t) ~ et de charge q on peut définir la distribution de
~
charge ρ(~r, t) et la densité de courant J(~r, t) :
~
~ r, t) = q dξ δ (3) ~r − ξ(t)
~
ρ(~r, t) = q δ (3) ~r − ξ(t) , et J(~ ~ . (I.13)
dt
L’objet
dξ dX
J (~r, t) = cρ(~r, t), J(~ ~
~ r, t) = q δ (3) ~r − ξ(t) e = ρ(~r, t) e (I.14)
e dt dt
est un champ quadri-vectoriel : le quadri-courant.
Cela résulte de la conservation de la charge électrique : la charge élémentaire d3 q = ρ(~r, t)d3 v
contenue à l’instant t dans l’élément de volume d3 v situé autour de ~r doit être un invariant de
Lorentz. Il en découle que -phased3 q dX est un quadri-vecteur. Comme ce quadri-vecteur peut être
mis sous la forme ρ d3 v dX = 1c d4Xρ dX /dt et que d4X est un invariant de Lorentz (cf. section
e
I.4.a), J = ρ dX /dt est bien e un quadri-vecteur.
e
e e
• Pour une onde plane monochromatique (pas nécessairement lumineuse) de pulsation ω et de
vecteur d’onde ~k, l’objet K = (ω/c, ~k ) est un quadri-vecteur 8 : le quadri-vecteur d’onde. Remarquer
que pour une onde lumineuse e se propageant dans le vide, K est de genre lumière : K 2 = 0 9 .
e e
8. La démonstration de cette propriété est détaillée dans un exercice du TD2. On peut la justifier rapidement
comme suit : la phase de l’onde, qui se met sous la forme ωt − ~k · ~r = K · X , doit être un invariant de Lorentz (puisque
deux maxima consécutifs sont séparés par une phase de 2π dans tous e les
e référentiels). Il en découle alors que K est
un quadri-vecteur, cf. une démonstration dans l’annexe I.6.i. e
9. Noter au passage que la relation de dispersion des ondes lumineuses est invariante de Lorentz.
6
I.4.c Notations covariantes
On définit X0 = X 0 , X1 = −X 1 , X2 = −X 2 , X3 = −X 3 . Xµ = (X0 , −X) ~ est la forme
~ sa forme contra-variante. On écrit X 2 = X µ Xµ , c’est
covariante du quadri-vecteur, X µ = (X 0 , X)
la convention d’Einstein : sommation sur les indices répétés situés à des altitudes
e différentes. La
relation (I.5) s’écrit donc
X 0µ = Λµν X ν . (I.15)
On a également Xµ = gµν X ν et X µ = g µν Xν où la matrice (g) est définie en I.4.a. Notons au
passage que la relation (g)(g) = 14 s’écrit gµν g να = δµα , où δµα est un symbole de Kronecker (égal à
1 si α = µ, 0 sinon). Attention, avec nos conventions de notation δαα = tr (14 ) = 4.
Il est démontré en section I.6.h que la forme covariante d’un quadri-vecteur se transforme comme
Xµ0 = Λµν Xν , où Λµν est défini par (I.29).
Montrer en exercice que la conservation (I.10) de l’intervalle sécrit sous la forme :
La version non relativiste de ce résultat est obtenue en remplaçant dans (I.17) γ par 1, mais en
gardant β = V /c 6= 0 (cf. section I.6.g).
Considérons 3 cas particuliers :
q
→ θ = 0. ω = ω0 1+β > ω0 : blue shift. Le résultat non relativiste est ω = ω0 /(1 − β).
q1−β
→ θ = π. ω = ω0 1−β 10
1+β < ω0 : red shift . Le résultat non relativiste est ω = ω0 /(1 + β).
p
→ θ = π2 . ω = ω0 1 − β 2 : red shift. Le résultat non relativiste est ω = ω0 .
7
I.6 Annexes
I.6.a Démonstration alternative des relations (I.4)
/2
On considère les deux référentiels R et R0
+L
+L
représentés sur la première figure de la sec- t
Vt
Vt
Vt
tion I.2. Dans cette section nous allons utili-
x=
x=
x=
ser le diagramme espace-temps (x, t) dans R
afin de montrer que
0
x=
x0=
x= F 2
où γ est le facteur de Lorentz. La relation −c t = V x/c
t E t =00
(I.18) est bien-sûr équivalente à (I.4) ; elle est
établie par le raisonnement suivant : A B D x
Soient 3 points a, b et d, immobiles dans R0 (b est le milieu de ad). Leurs lignes d’univers dans
R sont représentées ci-dessus (on note L l’espacement entre a et d dans R). A est l’évènement qui
correspond à la position de a à t = t0 = 0. B et F sont des évènements situés en b. D et E sont
situés en d. Un rayon lumineux émis depuis A arrive en F en même temps qu’un rayon lumineux
émis depuis E : A et E sont donc simultanés dans R0 . On détermine les coordonnées dans R des
évènements F puis E : tF = 21 L/(c − V ), xF = c tF ; tE = LV /(c2 − V 2 ), xE = Lc2 /(c2 − V 2 ). On
remarque que tE = V xE /c2 : cela définit la droite t0 = 0. La relation entre (x0 , t0 ) et (x, t) étant
linéaire (cf. note 2) on est fondé à écrire :
La vitesse de la lumière étant la même dans les deux référentiels, il faut que lorsque x = c t on ait
également x0 = c t0 ; cela impose f ≡ g.
On remarque ensuite 11 que f (−V ) = f (V ) : Supposons en effet qu’un troisième référentiel R00
se déplace à une vitesse −V ~ex par rapport à R. Si un évènement se produit dans R à l’origine à
l’instant t, il aura lieu dans R0 à la position x0 = −f (V )V t et dans R00 à la position x00 = f (−V )V t.
L’isotropie de l’espace impose que x00 = −x0 , donc f (−V ) = f (V ).
La transformation de R0 vers R, qui s’obtient en faisant V → −V dans (I.19), s’écrit alors :
En reportant (I.19) dans (I.20) on se rend compte que [f (V )]2 (1 − V 2 /c2 ) = 1, ce qui achève de
démontrer (I.18) 12 .
8
Soit une règle horizontale immobile dans R0 . La longueur L = xD − xA de la règle mesurée dans
R sera mesurée dans R0 comme la distance entre A et E (simultanés dans R0 ). On a xE = Lγ 2 ,
tE = V xE /c2 donc L0 = x0E − x0A = γL. On appelle L0 la “longueur au repos” de la règle (c’est
sa longueur dans le référentiel où elle est immobile). γ > 1 et donc L < L0 : la règle apparaı̂t
plus courte dans le référentiel R, c’est à dire pour un observateur par rapport auquel elle est en
mouvement : c’est le phénomène de contraction des longueurs.
9
~ )V
On peut faire la même opération sur les positions en écrivant ~r = ~rk + ~r⊥ , où ~rk = (~r · V ~ /V 2
est la composante de ~r colinéaire à V~ et ~r⊥ = ~r − ~rk est la composante orthogonale à V ~ . D’après
0
la discussion de la section I.6.c on a ~r⊥ = ~r⊥ . On obtient après une courte réflexion
" #
~
r · ~
V ~
V
~r 0 = ~r + (γ − 1) − γV t . (I.23)
V V
Les relations (I.22) et (I.23) peuvent s’écrire sous une forme matricielle qui généralise la relation
(I.5) ; cf. par exemple la page wikipedia sur les transformations de Lorentz qui présente le résultat
lorsqu’on choisit la même base dans R et R0 .
SiΛ00> 1 on dit que la transformation est orthochrone : sous son action le signe de la composante
temporelle d’un quadri-vecteur de genre temps est inchangé.
où l’on a utilisé l’inégalité de Schwarz, puis la relation (I.24) et enfin le fait que le qua-
drivecteur est de genre temps. On a (avec sommation implicite sur indices répétés et
lettres romaines réservées aux indices spatiaux) : X 00 = Λ0ν X ν = Λ00 X 0 + Λ0i X i . La
relation (I.25) montre que |Λ00 X 0 | > |Λ0i X i | et que donc sgn(X 00 ) = sgn(Λ00 X 0 ). Pour
une transformation orthochrone Λ00 > 1, et donc sgn(X 00 ) = sgn(X 0 ).
L’ensemble O+ (3, 1) [parfois noté Oo (3, 1)] des transformations orthochrones est un sous-groupe de
O(3, 1).
• Enfin l’ensemble SO+ (3, 1) des transformations orthochrones et propres est le groupe de Lorentz
restreint. On peut montrer que c’est le groupe engendré par les boosts de Lorentz et les rotations
d’espace.
14. On utilise ici les notations covariantes introduites en section I.4.c
10
I.6.g Une autre dérivation de l’effet Doppler
On travaille dans le référentiel R de l’observateur. Soit te l’instant d’émission par la source d’un
−→
signal lumineux qui sera reçu à l’instant tr par l’observateur. On a tr = te + r/c où ~r = OS. Si deux
signaux successifs sont émis avec un intervalle de temps dte , ils sont réceptionnés avec un intervalle
dtr dont l’expression est obtenue en différentiant :
√ ~r · d~r
dtr = dte + dr/c , où dr = d ~r · ~r = , avec ~ dte .
d~r = V
r
L’angle entre ~r/r et V~ est π − θ (cf. figure section I.5), on obtient donc dtr = dte (1 − β cos θ).
Avec la dilatation des durées on a bien sûr dte = γ dt0e , où dt0e est l’intervalle de temps entre les
deux émissions dans le référentiel propre de la source 15 . On doit donc avoir, pour les périodes
temporelles, la relation
T = γ T 0 (1 − β cos θ) , (I.26)
où T est la période mesurée par l’observateur, et T 0 la période propre du signal 16 . Cette formule
est équivalente à (I.17). On voit bien ici que dans la description non relativiste du phénomène le
facteur γ doit être remplacé par 1 dans (I.26) et (I.17).
On a juste écrit une loi de transformation linéaire en respectant les conventions d’Einstein, sans
savoir a priori ce qu’est la quantité Λαβ (mais ne soyons pas naı̈fs : elle est certainement reliée à
Λµν comme l’exemple (I.27) nous le suggère). On écrit Xα0 = gαµ X 0µ = gαµ Λµν X ν = gαµ Λµν g νβ Xβ .
En comparant avec (I.28) il vient
Λαβ = gαµ Λµν g νβ . (I.29)
15. Pour retrouver cette expression, écrivez l’égalité de l’intervalle ds entre les deux évènements d’émission dans le
référentiel R et dans R0 .
16. Pour pouvoir, comme on vient de le faire, appliquer la relation différentielle à la transformation des périodes,
on a fait l’hypothèse implicite que, dans R, le déplacement de la source pendant T est petit devant r = OS, ce qui
est toujours légitime (essayez de trouver une situation dans laquelle cette hypothèse est violée).
11
• Le lectrice attentif aura remarqué que la matrice impliquée dans la transformation (I.27)
correspond à l’inverse de la matrice de (I.5). Ce n’est pas un hasard, et c’est relié à la conservation
de la pseudo-norme.
En effet on doit avoir X 0α Xα0 = X µ Xµ . Or, d’après (I.15) et (I.28) on a X 0α Xα0 = Λαµ Λαν X µ Xν .
En comparant les deux expressions précédentes il vient
Ce résultat peut également être obtenu en utilisant les expressions matricielles utilisées dans la
section I.4.a : en multipliant (I.10) à gauche par (g), et en se souvenant que (g)(g) = 14 , on obtient
(Λ−1 ) = (g) (tΛ) (g), qui est effectivement équivalent à (I.30) écrite sous la forme Λαν = (Λ−1 )ν α .
Donc, en appliquant Λαµ aux deux membres de (I.28), on obtient grâce à (I.30) :
Cette égalité étant vraie pour tout X 0 il en découle que K 0α = Λαµ K µ . K a donc les “bonnes”
propriétés de transformation : c’est un
e quadri-vecteur. e
17. On est ici un peu esclave des conventions : on utilise la notation K sans faire l’hypothèse que cette quantité à
4 composantes est un quadri-vecteur. Même remarque pour le produit eX · K qui n’est pas à proprement parler un
pseuo-produit scalaire puisqu’initialement, seul X est supposé être un “bon”e equadri-vecteur.
18. Cette propriété a été utilisée dans la section I.4.b pour justifier que le quadri-vecteur d’onde est bien un
e
quadri-vecteur, cf. note 8.
12
Chapitre II : Mécanique et cinématique relativiste
Dans le terme de droite de (II.1) le préfacteur (−mc2 ) et son signe permettent de retrouver le
résultat non relativiste aux basses vitesses.
P L’impulsion associée à ce lagrangien est p~ où pi = ∂L/∂vi
avec i = x, y ou z. L’énergie est E = i pi vi − L (revoir le cours de mécanique). Ces relations
s’écrivent sous forme condensée
~ ~v L = p m ~v m c2
p~ = ∇ , E = p~ · ~v − L = p . (II.2)
1 − ~v 2 /c2 1 − ~v 2 /c2
L’énergie de la particule immobile est appelée “énergie au repos” ou “énergie de masse” et vaut
mc2 . L’énergie cinétique de la particule est T = E − mc2 (cf. la discussion de la section II.3.a). On
remarque que 1
E
, p~ = P , (II.3)
c e
cf. (I.11) et (I.12). On obtient alors facilement les formules très utiles :
E
E 2 = p2 c2 + m2 c4 , p~ = ~v . (II.4)
c2
La première découle de l’écriture (II.3) et de P 2 = m2 c2 , la seconde de la comparaison de (II.3)
avec (I.11) et (I.12) : P = mγ(c, ~v ). e
On peut définir une
e quadri-impulsion pour les photons, non pas à partir de (II.2) qui est
singulière (m = 0 et v = c), mais en utilisant (II.4). On aura alors E = c p et P 2 = 0 ; il est souvent
utile d’écrire ce quadrivecteur sous la forme P = (p , p~ ). e
Un autre quadri-vecteur associé au rayonnement (monochromatique) a une pseudo-norme nulle,
e
c’est le quadri-vecteur d’onde K = (ω/c, ~k ). Il est physiquement clair que p~ (impulsion d’un photon)
et ~k (vecteur d’onde de l’onde électromagnétique correspondante) doivent être colinéaires : on peut
e
les supposer proportionnels ; E et ω le seront donc également, et on postule la relation 2 P = ~ K .
e e
1. Ce n’est pas un accident si la combinaison de E/c et p ~ forme un quadri-vecteur. C’est une conséquence de
l’invariance de Lorentz de l’action et du principe variationnel, comme il est démontré dans l’annexe II.3.b.
2. C’est une relation quantique qui a été écrite pour la première fois par Planck sous la forme E = h ν pour donner
la valeur du quantum d’énergie dans son analyse du rayonnement du corps noir (1901), puis réinterprétée comme
énergie du photon (“Lichtquant” dans le texte) par Einstein dans son article de 1905 sur l’effet photo-électrique. On
l’appelle relation de Planck-Einstein.
13
II.2 Collisions et conservation de la quadri-impulsion
En l’absence de champ extérieur, l’impulsion d’un système composé de N points matériels en
interaction est une quantité conservée. C’est une loi fondamentale de la mécanique newtonienne
qui découle du principe d’inertie. Si l’on veut en donner une version relativiste, le premier postulat
d’Einstein nous impose de dire que la bonne quantité conservée est la quadri-impulsion. Ainsi, lors
d’une collision on aura 3 : X X
Pi = Pn . (II.5)
i
e initial n e
final
Donc, non seulement on conserve la somme des vecteurs impulsion, mais également la somme des
énergies (composante temporelle de la quadri-impulsion). Il en ressort naturellement (mais surpre-
namment) que la masse n’est pas une quantité conservée au cours d’une collision : la masse d’une
particule est une mesure de l’énergie qu’elle contient 4 , cf. exo 1 du TD3. Ainsi un changement de
masse traduit l’inélasticité d’un choc, et au cours d’une collision on peut même créer des particules
(c’est à dire de la masse).
P γ + P e = P 0γ + P 0e . (II.6)
e e e e
On en déduit que P 0e2 = (P γ + P e − P 0γ )2 . Le premier terme
e (m c)2e, le second
de cette égalité vaut e ese calcule presque aussi
e
simplement et l’on obtient (en notant Eγ et Eγ0 l’énergie du
photon avant et après le choc)
p~e0
me c2 Eγ
Eγ0 = , (II.7)
me c2 + Eγ (1 − cos θ)
soit, en écrivant Eγ = hc/λ et Eγ0 = hc/λ0 :
θ
λ0 = λ + λC (1 − cos θ) = λ + 2 λC sin2 , (II.8)
2
où λC = h/(me c) = 0.0243 Å est appelée la longueur d’onde de Compton de l’électron. Dans
l’expérience originelle (1923) Compton envoyait des rayons γ avec λ = 0.022 Å : c’est parce que λ
est du même ordre de grandeur que λC que l’effet est significatif : (λ0 − λ)/λ = O(1).
3. Les impulsions “initiales” et “finales” peuvent être définies sans ambiguı̈té longtemps avant et longtemps après
la collision, lorsque les particules sont suffisamment éloignées les unes des autres pour qu’on puisse négliger leurs
interactions.
4. Einstein 1905 : “L’inertie d’un corps dépend-elle de son contenu en énergie ?”. La réponse à cette question (“Ist
die Trägheit eines Körpers von seinem Energiegehalt abhängig ?” dans le texte) est : Ja, Herr Professor !
5. On pourrait ergoter sur l’utilisation du mot “inélastique” dans ce contexte : après tout, aucune masse ne change.
Cependant, il y a un transfert d’énergie cinétique puisque la longueur d’onde du photon est modifiée, et c’est pour
rendre compte de cet effet qu’on parle d’inélasticité, cf. https://en.wikipedia.org/wiki/Inelastic_scattering.
14
Pour obtenir le résultat (II.7) on a utilisé une technique souvent efficace : on exprime la quadri-
impulsion de la particule qui ne nous intéresse pas (ou qui n’est pas observée dans l’experience :
ici c’est l’électron diffusé) en fonction des autres, puis on prend la pseudo-norme 6 .
Il faut démontrer que ce référentiel existe 7 : prenons le cas de deux particules, d’impulsions P 1 et
P 2 , dont l’une au moins a une masse (par exemple la particule 1). (P 1 +P 2 )2 = P 21 +P 22 +2 P 1 ·P e >
2
2 P 1 · P 2 > 0. La dernière inégalité est obtenue en calculant le pseudo-produit scalaire dans
e e e e e e e le
référentiel propre de la particule massique : dans ce référentiel P 1 = (E1 /c, ~0 ) et alors il est clair
e e
que P 1 · P 2 = E1 E2 /c2 > 0. Donc P = P 1 + P 2 est de genre “temps” e (et même “futur”, cad. que
P > 0), et on peut, avec une transformation spéciale de Lorentz annuler sa partie spatiale 8 .
0 e e e e e
1 + 2 + .... → a + b + ....
où i désigne une particule quelconque (masse mi ). Le seuil de réaction (ou seuil de production)
est défini comme la configuration pour laquelle les particules a, b, ... sont créées au repos dans le
référentiel du centre de masse. Il est donc clair que, dans ce référentiel, l’énergie seuil est ma c2 +
mb c2 +.... Pour une configuration d’énergie totale plus faible, on ne pourra pas observer les particules
a, b etc...
• À titre d’exemple, étudions la création d’anti-protons (notés p̄), de masse mp égale à celle du
proton (noté p) à partir de la collision de deux protons. La configuration minimale qui conserve la
6. Tester cette méthode dans le cas suivant : un π − au repos se désintègre en un muon µ− et un anti-neutrino ν̄µ
qui n’est pas détecté. La masse de cet anti-neutrino est négligeable devant les masses du pion (140 MeV/c2 ) et du
muon (106 MeV/c2 ). Calculer l’énergie du µ− émis (réponse : 110 MeV).
7. C’est d’autant plus important que la notion de centre d’inertie n’est pas pertinente en relativité, cf. par exemple
l’exercice A du partiel 2021/2022.
8. Montrez-le en exercice.
15
charge électrique est
p + p → p + p + p + p̄ .
L’énergie seuil dans le centre de masse est donc 4mp c2 .
Dans la réaction ci-dessus, on repèrera les protons par les indices 1, 2, 3, 4, 5 et 6 (pour l’anti-
proton). Dans le référentiel du laboratoire, un des deux protons initiaux est au repos, on l’appelle le
proton cible et on l’affuble de l’indice 1. L’autre est le “projectile” (indice 2) ; il est en mouvement,
notons E2 son énergie dans le labo. On veut déterminer la valeur de E2 au seuil de réaction (soit
E2 |seuil ). En écrivant la conservation de la pseudo-norme de la quadri-impulsion totale on a :
(P 1 + P 2 )2 = (P 3 + P 4 + P 5 + P 6 )2 .
e e e e e e
On veut évaluer les deux termes de cette égalité au seuil de réaction. Pour évaluer le terme de
droite, on se place dans le référentiel du centre de masse 9 et, au seuil, on obtient immédiatement
(4mp c)2 . Pour le terme de gauche, on travaille dans le référentiel du laboratoire, ce qui donne 10
tique, T2 |seuil = 6 mp c2 . Dans le labo, l’énergie totale au seuil de réaction 11 vaut E2 |seuil + mp c2 =
8mp c2 .
• Deuxième exemple : la coupure GZK. C’est aujourd’hui un fait attesté que l’on ne détecte
presque pas de rayonnement cosmique dont l’énergie soit supérieure à environ 1020 eV. Cette cou-
pure haute avait été prédite dès 1966 en considérant la collision de protons de haute énergie avec
le fond diffus cosmologique (observé en 1965), selon la réaction : p + γ → n + π + . La différence
d’énergie de masse (mn + mπ )c2 − mp c2 est positive, de sorte qu’il faut que les composants initiaux
aient une énergie suffisamment élevée pour que la réaction ait lieu.
Décrivons sa cinématique. On doit avoir (P n + P π )2 = (P γ + P p )2 . Plaçons nous au seuil de
production dans le référentiel du centre de masse. e Danse ce cas e le neutron
e et le pion sont produits au
repos : P ∗n = (mn c, ~0 ) et P ∗π = (mπ c, ~0 ), de sorte que (P ∗n + P ∗π )2 = (mn + mπ )2 c2 . Revenons dans
le référentiel
e du “laboratoire”
e (ou plutôt du vide intersidéral).
e e La pseudo-norme étant un invariant
de Lorentz on a, au seuil,
(mn + mπ )2 c4 − m2p c4
Ep = .
2Eγ (1 − cos θ)
9. On a le droit de travailler dans le référentiel de notre choix : la pseudo-norme est un invariant de Lorentz.
10. La formule est toujours valable, pas seulement au seuil.
11. C’est, à un facteur c près, la composante temporelle de la quadri-impulsion totale au seuil.
16
L’énergie de seuil est Ep |seuil = minθ {Ep }. Elle bien-sûr obtenue pour θ = π (collision frontale). En
prenant mn = 939.6 MeV/c2 , mπ = 139.6 MeV/c2 et mp = 938.3 MeV/c2 on obtient Ep |seuil '
1.0 × 1020 eV. 12
II.3 Annexes
II.3.a Énergie cinétique
On voit chaque année dans quelques copies des horreurs que je n’ose pas reproduire ici. Cette
annexe est destinée à prévenir ces rares erreurs en clarifiant le concept d’énergie cinétique en
relativité restreinte et surtout en donnant quelques formules permettant de faire le distinguo avec
le cas non relativiste. L’énergie cinétique T de la particule libre est définie par
T = E − mc2 , (II.10)
c’est la différence entre son énergie totale [définie en (II.2)] et son énergie de masse. Elle est bien-sûr
nulle pour la particule au repos, et elle coı̈ncide à basse vitesse (plus précisément, lorsque p mc,
cf. plus bas) avec l’expression non relativiste T = 21 mv 2 . Attention cependant, comme on va le voir,
cette dernière expression n’est pas valide dans le cas général !
2 2 −1/2 alors v = |~ v | = (γ 2 − 1)1/2 c/γ et donc, d’après (II.2), on peut
Si l’on note γ = (1p− v /c )
écrire p = |~ p | = mc γ 2 − 1. On a également T = E − mc2 = m(γ − 1)c2 . En exprimant γ en
fonction de p cela donne
r ! p2
p2 + O(p4 /m3 c2 ) si p mc ,
T = mc2 1 + 2 2 − 1 ' 2m (II.11)
m c 2 2 3
pc − mc + O(m c /p) si p mc .
Tultra rel.
0
0 1 2 3 4
p/mc −→
12. Noter que Ep |seuil mp c2 , ce qui légitime a posteriori l’approximation ultra-relativiste pour le proton.
17
II.3.b Pourquoi la combinaison de E/c et p~ forme-t-elle un quadri-vecteur ?
• Version pédestre : Considérons une particule libre qui va de 0 à ~r en un temps t à vitesse ~v = ~r/t.
Si on déplace l’évènement final X = (ct, ~r ) de δX = (cδt, δ~r ), il faudra changer ~v . La nouvelle
pr −~v δt)/t. La variation
vitesse sera ~v + δ~v = (~r + δ~r )/(t +eδt) et cela donne eau premier ordre δ~v = (δ~
correspondante de l’action le long de la trajectoire physique (S = −mc2 t 1 − v 2 /c2 ) sera
p m c2 t ~v · δ~v m c2 δt m ~v · δ~r
δS = −m c2 δt 1 − v 2 /c2 + p 2
= − p +p = −E δt + p~ · δ~r .
1 − v /c c
2 2 2
1 − v /c 2 1 − v 2 /c2
Cette relation se met sous la forme δS = −(E/c, p~ ) · δX . Comme δS est un invariant de Lorentz,
et δX un quadri-vecteur, (E/c, p~ ) = P est également une “bon quadri-vecteur” d’après le théorème
du quotient
e I.6.i. e
• Version plus formelle : On utilise l’approche variationnelle, qui est rappelée ci-dessous :
On considère une ligne d’univers X µ (t) (peut-être non physique) qui conduit la particule R de
(ta , ~ra ) à (tb , ~rb ). On étudie les variations de S lorsque X µ → X µ + δX µ . δS = −mc δds,
p
où, puisque ds = dX µ dXµ
donne alors Z b
δS = − [Pµ δX µ ]ba + δX µ dPµ . (II.13)
a
Avec les hypothèses du principe variationnel µ
= δX µ (b) = 0] le premier terme est
[δX (a)
nul et on voit que le principe d’action extrémale impose que dPµ = 0 : la quadri-impulsion
de la particule libre se conserve pour la trajectoire physique.
a. Cela se comprend bien en divisant par dt par exemple : δ dt d
X µ = dt
d
δX µ : lorsqu’on fait varier
la trajectoire, même si elle est non physique, la position et la vitesse changent de manière coordonnée :
d
δ ~v = dt δ~r.
18
Chapitre III : Électrodynamique
∇ ~ + 1 ∂t φ = 0 ,
~ ·A (III.1)
c2
les équations de Maxwell permettent de relier les potentiels aux charges selon la relation (démontrée
en annexe III.6.b) :
φ ~
, A = µ0 c ρ, J~ . (III.2)
c
Comme l’opérateur est un opérateur invariant et comme le terme de droite de (III.2) est un
~ ) est donc également
champ quadri-vectoriel [puisqu’il s’écrit µ0 J , cf. (I.14)], la quantité (φ/c, A
un champ quadri-vectoriel : le quadri-potentiel A(~r, t). On remarquera que la condition (III.1) de
e
jauge de Loren(t)z s’écrit ∂µ Aµ = 0 : elle est donc
e invariante de Lorentz.
19
~ On peut utiliser cette dernière relation pour démontrer
cinétique qui s’écrit ici dElibre /dt = q ~v · E.
à partir de (III.5) que dE/dt = q(∂t φ − ~v · ∂t A ~ ) = −∂t L. Ce résultat, bien connu en mécanique
analytique, montre que l’énergie est conservée si le lagrangien ne dépend pas explicitement du
temps. Noter donc que l’énergie E est conservée lorsque les champs ne dépendent pas du temps,
mais qu’elle ne l’est pas en général.
Le hamiltonien est simplement l’énergie (III.5) exprimée en fonction des variables canoniques 2
~π et ~r :
r 2
~ r, t) c2 + m2 c4 + q φ(~r, t) vc 1 2
~ + q φ . (III.6)
H(~π , ~r, t) = ~π − q A(~ ' m c2 + ~π − q A
2m
Un tenseur est un objet à n indices (on appelle n le “rang” du tenseur), dont certains sont
covariants et d’autres contravariants, et qui se transforme comme suit lors d’un changement
de référentiel a (exemple pour 3 indices, dont 2 contravariants) :
Bien-sûr la quantité T ανγ = g νβ T αβ γ est également un tenseur qui a les bonnes propriétés
de transformation (on dit qu’il est 3 fois contravariant), idem pour T αβσ etc.
a. La loi de transformation pour les objets covariants a été introduite section I.6.h.
20
un tenseur de rang 1, c’est à dire un quadri-vecteur). Pour un tenseur à deux indices, T µµ est un
invariant de Lorentz, ce n’est plus vraiment un tenseur, on parle de “scalaire de Lorentz”. 3
Il est clairement anti-symétrique sous l’échange de ses deux indices. On obtient par un calcul
explicite de chaque coordonnée 4 :
0 Ex /c Ey /c Ez /c 0 −Ex /c −Ey /c −Ez /c
−Ex /c 0 −Bz By −Bz
, F µν = Ex /c 0 By
Fµν = −Ey /c Bz
. (III.9)
0 −Bx Ey /c Bz 0 −Bx
−Ez /c −By Bx 0 Ez /c −By Bx 0
Comme F est antisymétrique, sa trace vaut F µµ = 0. On peut construire des scalaires de Lorentz
~ 2 − 12 E
plus intéressants : Fµν F µν = 2(B ~ 2 ) , et également 5 : det F µν = (E
~ · B/c)
~ 2.
c
Les équations de Maxwell s’écrivent sous forme covariante 6 :
On peut remarquer que l’équation du mouvement (III.4) d’une particule test se met sous la forme 7
dP µ
= q F µν Uν . (III.11)
dτ
Le même type de raisonnement que celui qui a été utilisé à la section II.3.b montre qu’il est naturel
que l’équation (III.4) puisse être mise sous la forme covariante (III.11), comme l’exige le premier
postulat d’Einstein : cela découle de l’invariance de Lorentz de l’action et du principe variationnel.
On introduit parfois la quantité F µ = q F µν Uν qui est appelée la quadri-force. On pourra vérifier
que F µ = γ (F~ · ~v /c, F~ ), où F~ est la force de Lorentz [membre de droite de (III.4)]. Cf. l’exercice
3 du TD3.
21
calcul explicite pour la transformation spéciale de Lorentz (I.5). On trouve
0 0
Ex = Ex Bx = Bx
Ey0 = γ(Ey − V Bz ) , B 0 = γ(By + βEz /c) . (III.12)
0 y0
Ez = γ(Ez + V By ) Bz = γ(Bz − βEy /c)
III.6 Annexes
III.6.a ~
Démonstration de la contravariance de ∂ µ = ( 1c ∂t , −∇)
• Version pédestre : On considère la transformation spéciale de Lorentz (I.5) et on se place en 1+1
dimension pour faire simple. En utilisant l’expression de la dérivée des fonctions composées à deux
variables, on peut écrire :
∂(..) ∂(..) ∂(..) ∂t ∂(..) ∂x ∂t ∂x 1
∂ 0 0 (..) ≡ 0 = 0
= 0
+ 0
= 0 ∂ 0 (..) − ∂ (..) ,
∂X0 c ∂t c ∂t ∂t ∂x c ∂t ∂t c ∂t0
(III.14)
∂(..) ∂(..) ∂(..) ∂t ∂(..) ∂x c ∂t ∂x
∂ 0 1 (..) ≡ 0 =− 0
=− 0
− 0
= − 0 ∂ 0 (..) + 0 ∂ 1 (..) .
∂X1 ∂x ∂t ∂x ∂x ∂x ∂x ∂x
Les dérivées partielles apparaissant dans les membres les plus à droites de (III.14) se calculent à
partir de la relation de passage (I.5) écrite sous la forme
c dt0
c dt γ βγ c ∂t
= 0 , ainsi par exemple = βγ .
dx βγ γ dx ∂x0
Les relation (III.14) conduisent alors immédiatement à
0 0 0
∂ γ −βγ ∂
0 1 = , (III.15)
∂ −βγ γ ∂1
qui est la relation de transformation attendue pour un vecteur contravariant.
• Version plus formelle : Le gros du travail a été fait dans l’annexe I.6.h : la relation (I.31) (reproduite
ici par soucis de lisibilité) Λαµ Xα0 = Xµ conduit immédiatement à ∂Xµ /∂Xα0 = Λαµ . On peut donc
mettre la loi de changement de variable
∂(..) ∂(..) ∂Xµ ∂Xµ µ
∂ 0α (..) ≡ 0
= 0
= ∂ (..) , (III.16)
∂Xα ∂Xµ ∂Xα ∂Xα0
sous la forme ∂ 0α (..) = Λαµ ∂ µ (..), ce qui prouve que ∂ µ est un “bon quadri-vecteur contravariant”.
22
III.6.b Démonstration de la relation (III.2)
Les équations de Maxwell-flux et de Maxwell-Faraday montrent qu’il existe deux champs, l’un
~ r, t), l’autre scalaire φ(~r, t) tels que
vectoriel A(~
~ =∇
B ~ ∧A
~ et E ~ − ∇φ
~ = −∂t A ~ . (III.17)
~ ∇∧
En reportant ces relations dans Maxwell-Ampère, en utilisant la relation ∇∧( ~ A)
~ = ∇(
~ ∇·
~ A)−∆
~ A~
on obtient
~ = µ0 J~ + 1 ∂t −∂t A
~ ∇
∇( ~ · A)
~ − ∆A ~ − ∇φ
~ ,
c2
ce qui s’écrit
~ ~ ~ ~ ~ 1
A = µ0 J − ∇ ∇ · A + 2 ∂ t φ . (III.18)
c
~ dans Maxwell-Gauss on obtient
En reportant l’expression (III.17) de E
ρ ~ ~ 1
φ = + ∂t ∇ · A + 2 ∂t φ . (III.19)
ε0 c
Les champs A ~ et φ ne sont pas définis de manière univoque par les relations (III.17) : quel que
soit le champ scalaire G(~r, t), les champs A ~∗ = A~ + ∇G~ et φ∗ = φ − ∂t G conduisent aux mêmes
champs E ~ et B.
~ C’est ce qu’on appelle l’invariance de jauge. Nous allons travailler dans la “jauge
de Loren(t)z” pour laquelle on impose la relation (III.1). Dans cette jauge les relations (III.18) et
(III.19) se mettent directement sous la forme (III.2).
Or, d’après (I.30) on a Λµα Λµβ = δαβ . La relation (III.20) s’écrit donc
23
III.6.d Dérivation de l’équation du mouvement (III.4)
Commençons par un rapide rappel de mécanique analytique. Pour un système à n degrés de
liberté q1 , q2 , ... qn (pour nous n = 3) décrit par le lagrangien L(q1 , q2 , ..., q̇1 , q̇2 , ..) on définit les
moments conjugués πi = ∂L/∂ q̇i et les n équations du mouvement se mettent sous la forme
dπi ∂L
= . (III.22)
dt ∂qi
~
et des relations similaires pour πy et πz . Ces trois relations se mettent sous la forme ~π = p~ + q A,
où p~ est l’impulsion relativiste (II.2). On a donc d~π /dt = d~ ~
p/dt + q dA/dt avec
~
dA ~ dx + ∂y A
= ∂x A ~ dy + ∂z A
~ dz + ∂t A
~ = (~v · ∇)
~ A~ + ∂t A
~.
dt dt dt dt
Donc les équations d’Euler Lagrange (III.22) s’écrivent
d~
p ~ A ~ = d~π = ∇(L
~ + q ∂t A ~ 0 + Lint ) = ∇L
~ int = −q ∇φ
~ + q ∇(
~ A~ · ~v ) .
+ q (~v · ∇) (III.23)
dt dt
~ A
Le dernier terme du membre de droite de (III.23) s’écrit 8 ∇( ~ · ~v ) = (~v · ∇
~ )A
~ + ~v ∧ (∇
~ ∧A
~ ). En
reportant dans (III.23) il vient
d~
p ~ − ∂t A)
~ + q ~v ∧ (∇
~ ∧A
~).
= q (−∇φ (III.24)
dt
C’est exactement l’équation du mouvement (III.4).
q 1 q ~r 0
φ0 (~r 0 , t0 ) = , ~ 0 (~r 0 , t0 ) = 0 ,
A ~ 0 (~r 0 , t0 ) =
E , ~ 0 (~r 0 , t0 ) = 0 .
B (III.25)
4πε0 r0 4πε0 r0 3
Pour déterminer les champs dans R on peut utiliser les lois de transformation obtenues en III.5. Avec
la transformation inverse de (III.12) on obtient Ex = Ex0 ∝ x0 , Ey = γEy0 ∝ γy 0 et Ez = γEz0 ∝ γz 0 ,
où le coefficient de proportionnalité est chaque fois le même : q/(4πε0 r03 ). Grâce à (I.5) on a
~ constant (il joue le rôle de ~v ), alors on peut
8. Cette formule se démontre “à l’envers” : on considère un vecteur C
~ ~ ~ ~ ~ ~ ~ ~
vérifier directement que C ∧ (∇ ∧ A ) = ∇(A · C ) − (C · ∇ )A. ~
24
~ = vt e~x , de sorte
également x0 = γ(x − vt), y 0 = y et z 0 = z. Dans R la particule a une position ξ(t)
qu’on peut écrire
~ r, t) = γq
~ 0
p
E(~ ~
r − ξ(t) où r = γ 2 (x − vt)2 + y 2 + z 2 . (III.26)
4πε0 r03
Le champ électrique est également radial dans R, mais il n’est pas isotrope 9 .
On peut déterminer E ~ d’une autre façon : on fait d’abord la transformation sur les potentiels
avec la matrice de Lorentz appropriée. On obtient
0
φ = γφ0 et ~ = βγ φ ~ex = β φ ~ex .
A (III.27)
c c
Ensuite on utilise E~ = −∇φ~ − ∂t A,~ mais avant de faire ce calcul il faut exprimer φ et A ~ en fonction
des coordonnées ~r et t dans R. Vérifiez par vous même qu’on retrouve (III.26).
On peut faire le même travail pour le champ magnétique. En particulier, sur la base des relations
inverses de (III.12) il est facile de démontrer 10 que dans R on a B ~ = ~v ∧ E/c
~ 2 . Vérifiez que dans
la limite non relativiste (γ → 1) on retrouve Biot et Savart : B ~ = (µ0 q/4π)~v ∧ (~r − ξ~ )/|~r − ξ~ |3 .
25