Principe de moindre action et relativité générale

On doit à David Hilbert, en 1915, la première utilisation du principe de moindre action pour obtenir les équations de la relativité générale, notamment les équations du champ gravitationnel[1].

Pour la relativité générale, comme pour la relativité restreinte, les équations peuvent être obtenues sans faire appel au principe de moindre action : le principe d'équivalence, exprimé sous la forme « on peut toujours trouver un référentiel annulant localement le champ de gravitation », permet de retrouver directement les équations du mouvement d'une particule ; et l'unicité de la forme du tenseur géométrique qui s'annule par la dérivée covariante, unicité prouvée par Élie Cartan[2], permet de trouver les équations du champ de gravitation, ce qui fut la méthode originelle d'Einstein (bien que l'unicité en question ne fût pas encore prouvée à l'époque).

Si les équations de la relativité générale sont données, on peut en déduire l'action permettant d'appliquer le principe. En particulier, avec les équations des géodésiques on peut retrouver la métrique d s 2 {\displaystyle ds^{2}\,} associée.

Particule

Particule dans un champ de gravitation

Dans ce travail, on utilise l'hypothèse que la particule ne modifie pas son environnement : la masse de la particule ni sa position ne changent le champ de gravitation, cette masse doit donc être « petite ».

En vertu du principe d'équivalence d'Einstein, la gravitation est localement équivalente au choix d'un référentiel accéléré.

Dans le cadre de la relativité restreinte, en prenant un référentiel accéléré (coordonnées   ( x 0 ; x 1 ; x 2 ; x 3 ) {\displaystyle \ (x'_{0};x'_{1};x'_{2};x'_{3})} ), la perception locale est donc un champ de gravitation, et le changement de référentiel par rapport à un référentiel inertiel (coordonnées   ( x 0 ; x 1 ; x 2 ; x 3 ) {\displaystyle \ (x_{0};x_{1};x_{2};x_{3})} ) impose une métrique aux coefficients non triviaux :   d s 2 = ( x 0 ) 2 ( x 1 ) 2 ( x 2 ) 2 ( x 3 ) 2 = g i j ( x ) x i x j {\displaystyle \ ds^{2}=(x_{0})^{2}-(x_{1})^{2}-(x_{2})^{2}-(x_{3})^{2}=g^{ij}(x')x'_{i}x'_{j}} . Elle suffit pour déterminer les équations du mouvement dans ce référentiel du fait du principe de moindre action en relativité restreinte.

Le principe d'équivalence permet de dire qu'un champ gravitationnel réel (non dû au choix du référentiel) est aussi déterminé par la métrique   d s 2 {\displaystyle \ ds^{2}} (et la métrique est déterminée par le champ de gravitation) ; bien que l'utilisation d'une métrique   d s 2 = g i j ( x ) x i x j = g i j x i x j {\displaystyle \ ds^{2}=g^{ij}(x)x_{i}x_{j}=g^{ij}x_{i}x_{j}} qui ne soit pas causée, et donc pas compensable au-delà d'un domaine local de l'espace-temps, par un changement de référentiel implique que l'espace-temps n'est pas euclidien (voir l'expérience par la pensée du disque en rotation, décrit dans relativité générale), et que l'on sort alors du cadre de la relativité restreinte pour construire une nouvelle théorie : la relativité générale.

On peut donc rester dans la continuité de la relativité restreinte, et affirmer que l'action infinitésimale d'une particule ponctuelle, influencée par la seule gravitation, en relativité générale est :

d S = m c g i j d x i d x j {\displaystyle dS=-mc{\sqrt {g^{ij}dx_{i}dx_{j}}}}

où on suppose que   g i j = g j i {\displaystyle \ g^{ij}=g^{ji}} sans rien enlever à la généralité.

En utilisant le fait que   d s = g i j d x i d x j {\displaystyle \ ds={\sqrt {g^{ij}dx_{i}dx_{j}}}} est le temps propre de la particule, l'action minimisée entre deux points de l'espace-temps   S = m c A B d s {\displaystyle \ S=-mc\int _{A}^{B}ds} montre que, comme en relativité restreinte, c'est le temps propre pour aller du point A au point B qui est maximisé (localement) par le principe. Les géodésiques sont les chemins qui maximisent (localement) le temps propre de la particule.

Pour garder la cohérence physique, on a besoin de supposer que les   g i j {\displaystyle \ g^{ij}} sont continus ; pour pouvoir travailler avec des outils connus, c'est-à-dire des dérivations, mais aussi pour supposer que le champ gravitationnel est continu, on doit supposer qu'ils sont différentiables. Par la suite, pour les équations d'Einstein, il sera indispensable de supposer qu'ils sont C2.

En considérant un temps   t 0 {\displaystyle \ t_{0}} quelconque :

d S d t 0 = L 0 = m c g i j V i V j {\displaystyle {\frac {dS}{dt_{0}}}=L_{0}=-mc{\sqrt {g^{ij}V_{i}V_{j}}}}

On utilise toujours les équations d'Euler-Lagrange   d     d t 0 L 0 V k     L 0 x k   =   0     {\displaystyle \ {\frac {d~~}{dt_{0}}}{\frac {\partial L_{0}}{\partial V_{k}}}\ -\ {\frac {\partial L_{0}}{\partial x_{k}}}\ =\ 0~~} après avoir divisé par le coefficient   m c {\displaystyle \ -mc} ici inutile.

Détails de la démonstration

On obtient :   d     d t 0 ( 2. g i k V i 2. g i j V i V j )   k g i j . V i V j 2. g i j V i V j   =   0     {\displaystyle \ {\frac {d~~}{dt_{0}}}\left({\frac {2.g^{ik}V_{i}}{2.{\sqrt {g^{ij}V_{i}V_{j}}}}}\right)-\ {\frac {\partial ^{k}g^{ij}.V_{i}V_{j}}{2.{\sqrt {g^{ij}V_{i}V_{j}}}}}\ =\ 0~~}

En prenant dès maintenant t 0 = {\displaystyle t_{0}=} temps propre, on peut utiliser l'égalité g i j V i V j = c {\displaystyle {\sqrt {g^{ij}V_{i}V_{j}}}=c} qui simplifie la dérivation   d     d t 0 {\displaystyle \ {\frac {d~~}{dt_{0}}}} ,

sans changer le résultat si on dérive avant, et on obtient

  d     d t 0 ( g i k V i g i j V i V j ) = 1 c . ( n g i k . V n V i + g i k V i ˙ ) {\displaystyle \ {\frac {d~~}{dt_{0}}}\left({\frac {g^{ik}V_{i}}{\sqrt {g^{ij}V_{i}V_{j}}}}\right)={\frac {1}{c}}.(\partial ^{n}g^{ik}.V_{n}V_{i}+g^{ik}{\dot {V_{i}}})}

En remarquant que n g i k . V n V i = 1 2 . ( n g i k . V n V i + i g n k . V n V i ) {\displaystyle \partial ^{n}g^{ik}.V_{n}V_{i}={\frac {1}{2}}.(\partial ^{n}g^{ik}.V_{n}V_{i}+\partial ^{i}g^{nk}.V_{n}V_{i})} , que nous utiliserons essentiellement par souci d'esthétisme, et en changeant les indices pour n'utiliser que i, j et k,

Les équations d'Euler-Lagrange donnent : g i k V i ˙ + 1 2 . ( k g i j + i g j k + j g i k ) V i V j = 0 {\displaystyle g^{ik}{\dot {V_{i}}}+{\frac {1}{2}}.(-\partial ^{k}g^{ij}+\partial ^{i}g^{jk}+\partial ^{j}g^{ik})V_{i}V_{j}=0}

Avec l'égalité   g k m g k i = δ m i {\displaystyle \ g_{km}g^{ki}=\delta _{m}^{i}} et le symbole de Christoffel : Γ m i j = 1 2 . g k m ( k g i j + i g j k + j g i k ) {\displaystyle \Gamma _{m}^{ij}={\frac {1}{2}}.g_{km}(-\partial ^{k}g^{ij}+\partial ^{i}g^{jk}+\partial ^{j}g^{ik})}

 

On obtient l'équation :

V ˙ m + Γ m i j V i V j = 0 {\displaystyle {\dot {V}}_{m}+\Gamma _{m}^{ij}V_{i}V_{j}=0}

que l'on peut aussi écrire :

d 2 x k d s 2 + Γ k i j d x i d s x j d s = 0 {\displaystyle {\frac {d^{2}x_{k}}{ds^{2}}}+\Gamma _{k}^{ij}{\frac {dx_{i}}{ds}}{\frac {x_{j}}{ds}}=0}

ou encore :

D V k d s = 0 {\displaystyle {\frac {DV_{k}}{ds}}=0}

avec la « dérivée covariante » : D V k = d V k + Γ k i j V i d V j {\displaystyle DV_{k}=dV_{k}+\Gamma _{k}^{ij}V_{i}dV_{j}} et D V k = d V k + Γ i j k V i d V j {\displaystyle DV^{k}=dV^{k}+\Gamma _{ij}^{k}V^{i}dV^{j}} , où   V k = d x k d t 0 {\displaystyle \ V_{k}={\frac {dx_{k}}{dt_{0}}}} pour   t 0 = {\displaystyle \ t_{0}=} temps propre.

Le symbole de Christoffel Γ k i j {\displaystyle \Gamma _{k}^{ij}} s'impose comme la manifestation de la gravitation dans les équations du mouvement.

Les équations du mouvement ne dépendent pas de la masse de la particule (nommée ainsi car nous avons négligé son étendue spatiale et son influence sur son environnement) : toutes les particules suivent les mêmes trajectoires (à conditions initiales identiques), c'est l'équation des géodésiques en relativité générale, en présence de la seule gravitation.

Toutefois, ces équations du mouvement ne sont pas valables pour une particule de masse nulle car dans ce cas, on a dès le départ   d S = 0     {\displaystyle ~dS=0~~} , ce qui interdit tous les calculs menés ci-dessus ; on a aussi   d s = c . d t 0 = 0     {\displaystyle ~ds=c.dt_{0}=0~~} car le temps propre ne s'écoule pas pour une particule de masse nulle (voir Relativité restreinte), le terme V ˙ m {\displaystyle {\dot {V}}_{m}} ne peut en aucun cas avoir de sens. Il faut considérer l'onde associée à la particule pour avoir une équation ayant un sens, d'ailleurs la lumière était comprise comme une onde (électromagnétique) plutôt que comme une particule (le photon, de masse nulle) lorsque la relativité générale a été écrite.

Particule dans un champ électromagnétique

De manière similaire à la relativité restreinte, la définition de l'action relativiste infinitésimale d'une particule ponctuelle de charge   e {\displaystyle \ e} dans un champ électromagnétique est   L . d t =   m c . g i j d x i . d x j e . A j . d x j {\displaystyle \ L.dt=\ -mc.{\sqrt {g^{ij}dx_{i}.dx_{j}}}-e.A^{j}.dx_{j}} .

Par des calculs parfaitement similaires, on en tire les équations du mouvement :

m . ( V ˙ k + Γ i j k V i V j ) = e . V j . F k j {\displaystyle m.({\dot {V}}^{k}+\Gamma _{ij}^{k}V^{i}V^{j})=e.V_{j}.F^{kj}}

que l'on peut écrire :

m c . ( d 2 x k d s 2 + Γ i j k d x i d s d x j d s ) = e . F k j d x j d s {\displaystyle mc.\left({\frac {d^{2}x^{k}}{ds^{2}}}+\Gamma _{ij}^{k}{\frac {dx^{i}}{ds}}{\frac {dx^{j}}{ds}}\right)=e.F^{kj}{\frac {dx_{j}}{ds}}}

ou encore :

m c . D V k d s = e . F k j V j {\displaystyle mc.{\frac {DV^{k}}{ds}}=e.F^{kj}V_{j}}

Champ de gravitation

Afin d'en déterminer la densité lagrangienne, puis les équations, il est nécessaire de développer un peu certaines considérations abordées ci-dessus, et même quelques nouvelles.

Densité lagrangienne dans l'espace courbe

Du fait de l'invariance de la trajectoire du champ par rapport aux référentiels d'où on l'observe, l'action qui la caractérise S g = L d Ω {\displaystyle S_{g}=\int Ld\Omega } doit être invariante par changement de référentiel.

Détails justifiants la densité lagrangienne

Soient S g = L d Ω = L d Ω {\displaystyle S_{g}=\int Ld\Omega =\int L'd\Omega '} l'action dans deux référentiels différents.

On a :   d Ω = d x 0 . d x 1 . d x 2 . d x 3 {\displaystyle \ d\Omega =dx_{0}.dx_{1}.dx_{2}.dx_{3}} et   d Ω = d x 0 . d x 1 . d x 2 . d x 3 = J . d x 0 . d x 1 . d x 2 . d x 3 {\displaystyle \ d\Omega '=dx'_{0}.dx'_{1}.dx'_{2}.dx'_{3}=J.dx_{0}.dx_{1}.dx_{2}.dx_{3}}

  J {\displaystyle \ J} est le jacobien du changement de variables.

On a : J = | det ( x i x j ) |   {\displaystyle J=\left|\det \left({\frac {\partial x'_{i}}{\partial x_{j}}}\right)\right|~}

Or : d s 2 = g i j d x i d x j = g k l d x k d x l   g k l = x i x k . x j x l g i j g = J 2 . g {\displaystyle ds^{2}=g^{ij}dx_{i}dx_{j}=g'^{kl}dx'_{k}dx'_{l}\to \ g^{kl}={\frac {\partial x'_{i}}{\partial x_{k}}}.{\frac {\partial x'_{j}}{\partial x_{l}}}g'^{ij}\to g=J^{2}.g'} , en prenant les déterminants.

Donc : J = | g | 1 2 | g | 1 2 {\displaystyle J={\frac {|g|^{\frac {1}{2}}}{|g'|^{\frac {1}{2}}}}}

Ainsi S g = L d Ω = L d Ω = L . J d Ω L = L . J L . | g | 1 2 = L . | g | 1 2 = Λ {\displaystyle S_{g}=\int Ld\Omega =\int L'd\Omega '=\int L'.Jd\Omega \to L=L'.J\to L.|g|^{-{\frac {1}{2}}}=L'.|g'|^{-{\frac {1}{2}}}=\Lambda } est une constante du champ par rapport aux changements de référentiels.

L'objectif est donc de trouver les scalaires du champ, invariants par rapport aux changements de référentiels.

 

En notant   Λ {\displaystyle \ \Lambda } le scalaire du champ, invariant par rapport aux changements de référentiels, la densité lagrangienne sera :   L = Λ . | g | 1 2 {\displaystyle \ L=\Lambda .|g|^{\frac {1}{2}}}

Définitions des tenseurs de Riemann, de Ricci, et de la courbure

À la manière d'Élie Cartan

En termes mathématiques, l'espace quadri-dimensionnel défini par les considérations ci-dessus est une variété C2 où les quadri-vitesses sont des vecteurs appartenant à l'espace vectoriel tangent au point où on a dérivé, cet espace vectoriel étant muni de la métrique   g i j {\displaystyle \ g^{ij}} .

Rappelons que les coordonnées ( x 0 ; x 1 ; x 2 ; x 3 ) {\displaystyle (x_{0};x_{1};x_{2};x_{3})} sont les coordonnées des points de la variété, munie d'un système de coordonnées quelconque, représentant le choix arbitraire du référentiel physique de l'observateur.

La mesure de la gravitation, qui influe sur les géodésiques, peut se faire à travers la différence d'orientation entre deux vecteurs résultant du transport d'un seul vecteur d'origine par deux chemins géodésiques différents vers un même point final.

  • L'équation des géodésiques V ˙ m + Γ m i j V i V j = 0 {\displaystyle {\dot {V}}_{m}+\Gamma _{m}^{ij}V_{i}V_{j}=0} est équivalente à d V k d t 0 = Γ k i j V i V j {\displaystyle {\frac {dV_{k}}{dt_{0}}}=-\Gamma _{k}^{ij}V_{i}V_{j}} .
Du fait que V j = d x j d t 0 {\displaystyle V_{j}={\frac {dx_{j}}{dt_{0}}}} , on déduit : d V k = Γ k i j V i d x j {\displaystyle dV_{k}=-\Gamma _{k}^{ij}V_{i}dx_{j}}  ; sachant que l'on a Γ k i j = Γ k j i {\displaystyle \Gamma _{k}^{ij}=\Gamma _{k}^{ji}} comme on le voit à partir de sa définition, on pourrait aussi bien écrire d V k = Γ k i j d x i V j {\displaystyle dV_{k}=-\Gamma _{k}^{ij}dx_{i}V_{j}} .
De manière similaire, on obtient d V k = Γ i j k V i d x j {\displaystyle dV^{k}=-\Gamma _{ij}^{k}V^{i}dx^{j}}
  • Un vecteur ( A i ) {\displaystyle \left(A_{i}\right)} est dit transporté parallèlement le long d'une géodésique si les variations de ses coordonnées vérifient d A k = Γ k i j A i d x j {\displaystyle dA_{k}=-\Gamma _{k}^{ij}A_{i}dx_{j}} quand il est déplacé de   ( d x j ) j = 0 ; 1 ; 2 ; 3 {\displaystyle \ (dx_{j})_{j=0;1;2;3}} le long de la géodésique.
Détails de la méthode d'Élie Cartan
  • À partir d'un point M quelconque de la variété, considérons deux variations infinitésimales   d {\displaystyle \ d} et   δ {\displaystyle \ \delta } le long de deux géodésiques quelconques, et considérons les deux trajets distincts qui utilisent alternativement l'une puis l'autre de ces géodésiques.
1er trajet : M ( x i ) M 1 ( x i + d x i ) M 2 ( x i + d x i + δ ( x i + d x i ) ) {\displaystyle M(x_{i})\to M_{1}(x_{i}+dx_{i})\to M_{2}(x_{i}+dx_{i}+\delta (x_{i}+dx_{i}))}
2e trajet : M ( x i ) M 1 ( x i + δ x i ) M 2 ( x i + δ x i + d ( x i + δ x i ) ) {\displaystyle M(x_{i})\to M'_{1}(x_{i}+\delta x_{i})\to M'_{2}(x_{i}+\delta x_{i}+d(x_{i}+\delta x_{i}))}
Afin que ces deux trajets aboutissent au même point, on suppose que   d δ x i = δ d x i {\displaystyle \ d\delta x_{i}=\delta dx_{i}} , ce qui est réalisable car les géodésiques utilisées à partir des points   M 1 {\displaystyle \ M_{1}} et   M 1 {\displaystyle \ M'_{1}} sont quelconques.
  • Étudions les variations des coordonnées d'un vecteur ( A i ) {\displaystyle \left(A_{i}\right)} transporté parallèlement le long de chacun des chemins :
1er trajet :   A i A i + d V i A i + d A i + δ ( A i + d A i ) = A i + d A i + δ A i + δ d A i = W i {\displaystyle \ A_{i}\to A_{i}+dV_{i}\to A_{i}+dA_{i}+\delta (A_{i}+dA_{i})=A_{i}+dA_{i}+\delta A_{i}+\delta dA_{i}=W_{i}}
2e trajet :   A i A i + δ A i A i + δ A i + d ( A i + δ A i ) = A i + δ A i + d A i + d δ A i = W i {\displaystyle \ A_{i}\to A_{i}+\delta A_{i}\to A_{i}+\delta A_{i}+d(A_{i}+\delta A_{i})=A_{i}+\delta A_{i}+dA_{i}+d\delta A_{i}=W'_{i}}
On a : W i W i = δ d A i d δ A i = δ ( Γ k i j A i d x j ) d ( Γ k i j A i δ x j ) {\displaystyle W_{i}-W'_{i}=\delta dA_{i}-d\delta A_{i}=\delta (-\Gamma _{k}^{ij}A_{i}dx_{j})-d(-\Gamma _{k}^{ij}A_{i}\delta x_{j})}
Après quelques calculs, on obtient : W i W i = ( j Γ i l k l Γ i j k + Γ p l k Γ i j p Γ p j k Γ i l p ) d x j δ x k A l {\displaystyle W_{i}-W'_{i}=(\partial ^{j}\Gamma _{i}^{lk}-\partial ^{l}\Gamma _{i}^{jk}+\Gamma _{p}^{lk}\Gamma _{i}^{jp}-\Gamma _{p}^{jk}\Gamma _{i}^{lp})dx_{j}\delta x_{k}A_{l}}
  • On définit le tenseur de Riemann par : R i j k l = j Γ i l k l Γ i j k + Γ p l k Γ i j p Γ p j k Γ i l p {\displaystyle R_{i}^{jkl}=\partial ^{j}\Gamma _{i}^{lk}-\partial ^{l}\Gamma _{i}^{jk}+\Gamma _{p}^{lk}\Gamma _{i}^{jp}-\Gamma _{p}^{jk}\Gamma _{i}^{lp}}
L'égalité W i W i = R i j k l d x j δ x k A l {\displaystyle W_{i}-W'_{i}=R_{i}^{jkl}dx_{j}\delta x_{k}A_{l}} indique que ce tenseur mesure la différence entre deux vecteurs issus du même vecteur d'origine ( A i ) {\displaystyle \left(A_{i}\right)} par transport parallèle par deux chemins différents.
 
  • On définit le tenseur de Riemann par :

R i j k l = j Γ i l k l Γ i j k + Γ p l k Γ i j p Γ p j k Γ i l p {\displaystyle R_{i}^{jkl}=\partial ^{j}\Gamma _{i}^{lk}-\partial ^{l}\Gamma _{i}^{jk}+\Gamma _{p}^{lk}\Gamma _{i}^{jp}-\Gamma _{p}^{jk}\Gamma _{i}^{lp}}

  • Le tenseur de Ricci est une contraction du tenseur de Riemann : R i j = R k i k j {\displaystyle R^{ij}=R_{k}^{ikj}}
Sa formule montre que c'est un tenseur symétrique :   R i j = R j i {\displaystyle \ R^{ij}=R^{ji}}
  • La courbure riemannienne est le nombre obtenu par contraction du tenseur de Ricci :   R = g i j R i j {\displaystyle \ R=g_{ij}R^{ij}}
  • Toutes les égalités utilisées dans « détails de la méthode d'Élie Cartan » étant indépendantes du référentiel choisi, et c'est aussi le cas pour les définitions des tenseurs de Riemann et de Ricci (c'est d'ailleurs pourquoi on se permet de les nommer tenseur). C'est aussi le cas de la courbure   R {\displaystyle \ R} qui est donc candidat pour être   Λ {\displaystyle \ \Lambda } le scalaire invariant du champ de gravitation.
  • Élie Cartan a démontré que les scalaires invariants par changement de référentiel sont de la forme   α R + β   {\displaystyle \ \alpha R+\beta ~} .
    α {\displaystyle ~\ \alpha } indique simplement qu'un changement d'unité est toujours possible,   β {\displaystyle \ \beta } permet d'introduire la constante cosmologique.

Outils analytiques

Une application du principe d'inertie dans l'espace courbe

Pour que notre travail soit bien une conséquence du principe de moindre action, la méthode utilisée ici consiste à déterminer les propriétés de la variété à partir de la métrique de ses espaces tangents.

  • Les espaces vectoriels tangents (de dimension 4) sont munis de leur base « naturelle » {     e   0 ; e   1 ; e   2 ; e   3 {\displaystyle \ \ {{\vec {e}}^{~0};{\vec {e}}^{~1};{\vec {e}}^{~2};{\vec {e}}^{~3}}} }  : si   M ( x 0 ; x 1 ; x 2 ; x 3 ) {\displaystyle \ M(x_{0};x_{1};x_{2};x_{3})} est le point où l'on considère l'espace tangent, on pose e   i = (   x j x i   ) j = 0 , 1 , 2 , 3 {\displaystyle {\vec {e}}^{~i}=\left(~{\frac {\partial x_{j}}{\partial x_{i}}}~\right)_{j=0,1,2,3}}  ; ce que l'on écrit souvent e   i =   x i {\displaystyle {\vec {e}}^{~i}={\frac {\partial ~}{\partial x_{i}}}} .
Les équations des géodésiques sont des propriétés concernant les coordonnées d x i d t o {\displaystyle {\frac {dx_{i}}{dt_{o}}}} ou d x i d s {\displaystyle {\frac {dx_{i}}{ds}}} de la quadri-vitesse le long de cette trajectoire, elles ne donnent pas d'indication pour la variation (la dérivation) d'un quadri-vecteur e   i {\displaystyle {\vec {e}}^{~i}} d'un point à un autre de l'espace, ni même pour la dérivation du quadri-vecteur vitesse V = V i e   i {\displaystyle {\vec {V}}=V_{i}{\vec {e}}^{~i}} .
Pour cela, nous pouvons utiliser un principe physique réécrit sur mesure pour la relativité générale :
  • Principe d'inertie : le long d'une géodésique, et en l'absence d'intervention extérieure, le (quadri-)vecteur vitesse d'une particule est constant.
C'est-à-dire : d V = 0 {\displaystyle d{\vec {V}}={\vec {0}}}
On en tire : d V = 0 = d V i . e   i + V i . d e   i = Γ i j k d x j V k . e   i + V i . d e   i {\displaystyle d{\vec {V}}={\vec {0}}=dV_{i}.{\vec {e}}^{~i}+V_{i}.d{\vec {e}}^{~i}=-\Gamma _{i}^{jk}dx_{j}V_{k}.{\vec {e}}^{~i}+V_{i}.d{\vec {e}}^{~i}}
Le quadri-vecteur vitesse initial étant quelconque, on obtient :

d e   i = Γ k i j d x j e   k {\displaystyle d{\vec {e}}^{~i}=\Gamma _{k}^{ij}dx_{j}{\vec {e}}^{~k}}

En analysant les équations des géodésiques ou en tenant compte du fait que les « axes » des coordonnées ne sont pas obligatoirement des géodésiques, on ne peut pas affirmer que les coordonnées du quadri-vecteur vitesse sont constantes.
À propos du choix d V = 0 {\displaystyle d{\vec {V}}={\vec {0}}}
  • Dériver signifie « déterminer la droite qui indique la direction du mouvement ». Tout le problème est de savoir ce qu'est une droite quand le système de coordonnées est quelconque, voire dans un espace courbe ; une fois les droites déterminées, la dérivation peut être définie.
  • Dans le cadre qui nous intéresse, quand l'expérimentateur est dans un espace de Minkowski et qu'il a choisi un système de coordonnées quelconque, ce qui y induit éventuellement une gravitation, les droites de la dérivation sont celles de l'espace de Minkowski, qui sont aussi celles du mouvement inertiel. À moins de définir une nouvelle dérivation, l'égalité d V = 0 {\displaystyle d{\vec {V}}={\vec {0}}} s'impose.
  • Quand l'expérimentateur est dans un référentiel où il y a de la gravitation, et en l'absence d'information sur les causes de cette gravitation (due à une masse ou due à un référentiel accéléré, ou les deux) les seules droites auxquelles il a accès, en tant que physicien, sont celles du mouvement inertiel : la dérivation est donc définie par d V = 0 {\displaystyle d{\vec {V}}={\vec {0}}} .
Mais ce choix est basé sur l'hypothèse que, dans son référentiel, le mouvement inertiel suit bien une droite. Si l'expérimentateur choisit comme droites les axes de son référentiel, il impose donc d e   i = 0 {\displaystyle d{\vec {e}}^{~i}={\vec {0}}} , le mouvement « inertiel » observé n'est pas droit ( d V 0 {\displaystyle d{\vec {V}}\neq {\vec {0}}} ) et est interprétable comme dû à une force (de gravitation).
Ces deux choix, comme d'autres que l'on peut imaginer, ne sont valables que localement :Le premier assimile localement la gravitation à un référentiel accéléré dans un espace de Minkowski, le deuxième émet l'hypothèse d'une force dans un espace initialement droit ; deux choix qui redressent à leur manière l'espace-temps, ce qui ne peut se faire que localement.
 

La dérivée covariante

Soit A ( x ) = A i e   i {\displaystyle {\vec {A}}(x)=A_{i}{\vec {e}}^{~i}} un quadri-vecteur dans l'espace tangent au point   M ( x 0 ; x 1 ; x 2 ; x 3 ) {\displaystyle \ M(x_{0};x_{1};x_{2};x_{3})} .

On a : d A ( x ) = ( d A i ) e   i + A i d ( e   i ) = ( j A i + A k Γ i j k ) e   i d x j = D j A i . e   i d x j {\displaystyle d{\vec {A}}(x)=(dA_{i}){\vec {e}}^{~i}+A_{i}d({\vec {e}}^{~i})=(\partial ^{j}A_{i}+A_{k}\Gamma _{i}^{jk}){\vec {e}}^{~i}dx_{j}=D^{j}A_{i}.{\vec {e}}^{~i}dx_{j}}

En définissant la dérivée covariante par :

D j A i = j A i + Γ i j k A k {\displaystyle D^{j}A_{i}=\partial ^{j}A_{i}+\Gamma _{i}^{jk}A_{k}}

Propriété :

D j A i l = j A i l + Γ i j k A k l + Γ l j k A i k {\displaystyle D^{j}A_{il}=\partial ^{j}A_{il}+\Gamma _{i}^{jk}A_{kl}+\Gamma _{l}^{jk}A_{ik}}

D j A i l = j A i l + Γ i j k A k l Γ k j l A i k {\displaystyle D^{j}A_{i}^{l}=\partial ^{j}A_{i}^{l}+\Gamma _{i}^{jk}A_{k}^{l}-\Gamma _{k}^{jl}A_{i}^{k}}

Et ainsi de suite avec tous les indices d'un tenseur, suivant leurs positions.

Où l'on retrouve les tenseurs de Riemann, etc.

À l'aide de la dérivée covariante, et après quelques calculs, on trouve : ( D i D j D j D i ) A k = R k l , i j d x i d x j A l {\displaystyle \left(D^{i}D^{j}-D^{j}D^{i}\right)A_{k}=R_{k}^{l,ij}dx_{i}dx_{j}A_{l}} .

On obtient donc les notions déjà introduites « à la manière d'Élie Cartan ».

Égalités et propriétés utiles

  • Théorème de Ricci :   D k g i j = 0     {\displaystyle \ D_{k}g^{ij}=0~\quad ~} et   D k g i j = 0   {\displaystyle ~\quad D_{k}g_{ij}=0~}
  • En posant   g = det ( g i j ) {\displaystyle \ g=\det(g^{ij})\qquad } , on a : | g | = g g i j . g i j = δ i i = 4   d g = g   g i j   d g i j {\displaystyle |g|=-g\qquad g^{ij}.g_{ij}=\delta _{i}^{i}=4\qquad \ dg=g~g_{ij}~dg^{ij}}
  • Théorème d'Ostrogradski : V g   D i A i   d Ω = V g A i   d S i {\displaystyle \int _{V}{\sqrt {-g}}~D_{i}A^{i}~d\Omega =\oint _{\partial V}{\sqrt {-g}}A^{i}~dS_{i}} , quand   A i {\displaystyle \ A^{i}} est un tenseur.
Ébauches de démonstrations des égalités
Cette section est vide, insuffisamment détaillée ou incomplète. Votre aide est la bienvenue ! Comment faire ?
 
  • La somme, la différence et la sommation d'Einstein de tenseurs définis dans le même espace tangent donnent un tenseur ; par contre s'il s'agit de tenseurs définis dans des espaces tangents différents, il n'est pas sûr que cela donne un tenseur.
Par exemple : le symbole de Christoffel est défini à partir du tenseur métrique. L'équation des géodésiques Γ i j k . V k = j V i {\displaystyle \Gamma _{i}^{jk}.V_{k}=\partial ^{j}V_{i}} nous montre qu'il peut être défini à l'aide de   j V i {\displaystyle \ \partial ^{j}V_{i}} qui, bien que tenseur, est construit par une différence entre deux tenseurs (les quadri-vecteurs   V l ( x m ) {\displaystyle \ V_{l}(x_{m})} et   V l ( x m + d x m ) {\displaystyle \ V_{l}(x_{m}+dx_{m})} ) définis dans deux espaces tangents différents : le symbole de Christoffel, lui, n'est pas un tenseur (sauf cas particuliers), comme on peut le montrer à l'aide de sa formule de définition.
  • Une égalité tensorielle démontrée en un point quelconque, mais en utilisant un référentiel particulier, est une égalité vraie en ce point et pour tous les référentiels : c'est là le principal intérêt d'utiliser des tenseurs.
Par exemple, en tout point il existe un référentiel en apesanteur (en chute libre dans le champ de pesanteur), c'est-à-dire pour lequel Γ i j k = 0 {\displaystyle \Gamma _{i}^{jk}=0} . Dans un tel référentiel, on a R i j , k l = j Γ i l k l Γ i j k {\displaystyle R_{i}^{j,kl}=\partial ^{j}\Gamma _{i}^{lk}-\partial ^{l}\Gamma _{i}^{jk}} et D j A i = j A i {\displaystyle D^{j}A_{i}=\partial ^{j}A_{i}} quand   A i {\displaystyle \ A_{i}} est un tenseur : ce qui est plus simple à utiliser pour justifier une égalité tensorielle qui sera vraie quel que soit le référentiel.

Les équations d'Einstein du champ de gravitation dans le cas extérieur

Les tenseurs sont utilisés pour s'assurer que les égalités sont vraies quel que soit le point d'observation du physicien et quel que soit son référentiel. Les tenseurs ne transportent que des informations liées au point d'observation et à son espace tangent, du coup, les informations qui y sont utilisées et qui en sont produites ne sont que locales : ce sont des informations sur les tenseurs, mis à part les données universellement valables comme les constante c, G, et autres que l'on pourra y trouver.

Le premier cas des équations du champ est le cas où il n'y a pas de matière (localement) : on parle du « cas extérieur », sous entendu « à la matière ».

Dans ce cas, la seule composante de l'action est la composante du champ gravitationnel   S g = K . g . R . d Ω {\displaystyle \ S_{g}=K.\int {\sqrt {-g}}.R.d\Omega } , où   K {\displaystyle \ K} est une constante liée au choix des unités : pour les unités MKSA, on prend   K = c 3 4 π G {\displaystyle \ K=-{\frac {c^{3}}{4\pi G}}} , le signe   {\displaystyle \ -} étant dû au principe de minimisation de l'action.

Pour trouver les équations du champ de gravitation sous la forme de tenseurs de densité d'énergie qui soient symétriques, il est plus simple de transformer le lagrangien sous l'intégrale de l'action que d'utiliser les équations d'Euler-Lagrange. Le principe variationnel est appliqué en faisant varier les termes de la métrique   g i j {\displaystyle \ g^{ij}} , qui est la manifestation lagrangienne de la gravitation, d'après le principe d'équivalence tel qu'appliqué plus haut.

Démonstration des équations d'Einstein dans le cas extérieur

En utilisant l'égalité   R = g i j R i j {\displaystyle \ R=g_{ij}R^{ij}} , on a

δ S g = K . δ ( g . g i j . R i j ) d Ω {\displaystyle \delta S_{g}=K.\int \delta \left({\sqrt {-g}}.g_{ij}.R^{ij}\right)d\Omega } = K [ δ ( g ) g i j R i j d Ω + g . δ ( g i j ) . R i j d Ω + g . g i j . δ ( R i j ) d Ω ] {\displaystyle =K[\int \delta ({\sqrt {-g}})g_{ij}R^{ij}d\Omega +\int {\sqrt {-g}}.\delta (g_{ij}).R^{ij}d\Omega +\int {\sqrt {-g}}.g_{ij}.\delta (R^{ij})d\Omega ]}

On a δ ( g ) = δ g 2 g = 1 2 g g . g i k . δ g i k = 1 2 g . g i k δ g i k {\displaystyle \delta ({\sqrt {-g}})={\frac {-\delta g}{2{\sqrt {-g}}}}=-{\frac {1}{2{\sqrt {-g}}}}g.g_{ik}.\delta g^{ik}=-{\frac {1}{2}}{\sqrt {-g}}.g^{ik}\delta g_{ik}} car g i k . g i k = 4 δ ( g i k ) . g i k = g i k . δ ( g i k ) {\displaystyle g^{ik}.g_{ik}=4\to \delta (g^{ik}).g_{ik}=-g^{ik}.\delta (g_{ik})}

Pour la 1re intégrale, on a δ ( g ) g i j R i j d Ω = δ ( g ) R d Ω = 1 2 g i j . R . g . δ g i j d Ω {\displaystyle \int \delta ({\sqrt {-g}})g_{ij}R^{ij}d\Omega =\int \delta ({\sqrt {-g}})Rd\Omega =-{\frac {1}{2}}\int g^{ij}.R.{\sqrt {-g}}.\delta g_{ij}d\Omega }

La 2e égalité est laissée inchangée.

Pour la 3e intégrale, pour simplifier les calculs, on se place dans un référentiel en apesanteur et on a donc   R i j = l Γ l i j i Γ l l j {\displaystyle \ R^{ij}=\partial ^{l}\Gamma _{l}^{ij}-\partial ^{i}\Gamma _{l}^{lj}} . (Mais en général l Γ l i j D l Γ l i j {\displaystyle \partial ^{l}\Gamma _{l}^{ij}\neq D^{l}\Gamma _{l}^{ij}} car le symbole de Christoffel n'est pas un tenseur).

D'où δ ( R i j ) = δ l Γ l i j δ i Γ l l j = l δ Γ l i j i δ Γ l l j {\displaystyle \delta \left(R^{ij}\right)=\delta \partial ^{l}\Gamma _{l}^{ij}-\delta \partial ^{i}\Gamma _{l}^{lj}=\partial ^{l}\delta \Gamma _{l}^{ij}-\partial ^{i}\delta \Gamma _{l}^{lj}} en supposant que la variation des   g i j {\displaystyle \ g^{ij}} laisse le référentiel en apesanteur en ce point, ce qui laisse encore une infinité de variations possibles pour les   g i j {\displaystyle \ g^{ij}} .

Dans n'importe quel référentiel, δ Γ l i j = Γ l i j ( Γ l i j ) {\displaystyle \delta \Gamma _{l}^{ij}=\Gamma _{l}^{ij}-\left(\Gamma _{l}^{ij}\right)'} où le symbole ( Γ l i j ) {\displaystyle \left(\Gamma _{l}^{ij}\right)'} est le symbole de Christoffel au même point que   Γ l i j {\displaystyle \ \Gamma _{l}^{ij}} mais avec des termes   g i j {\displaystyle \ g^{ij}} modifiés

on a Γ k i j . V j = j V i δ Γ k i j . V j = Γ l i j . V j ( Γ l i j ) . V j = j V i ( j V i ) {\displaystyle \Gamma _{k}^{ij}.V_{j}=\partial ^{j}V_{i}\to \delta \Gamma _{k}^{ij}.V_{j}=\Gamma _{l}^{ij}.V_{j}-\left(\Gamma _{l}^{ij}\right)'.V_{j}=\partial ^{j}V_{i}-\left(\partial ^{j}V_{i}\right)'} ce qui est une différence entre deux tenseurs définis au même point, donc δ Γ k i j {\displaystyle \delta \Gamma _{k}^{ij}} est un tenseur (contrairement au symbole de Christoffel).

Et pour ce tenseur, dans le référentiel en apesanteur (et laissé comme tel, au point considéré, par la variation des   g i j {\displaystyle \ g^{ij}} ), l δ Γ k i j = D l δ Γ k i j {\displaystyle \partial ^{l}\delta \Gamma _{k}^{ij}=D^{l}\delta \Gamma _{k}^{ij}} , d'où δ ( R i j ) = l δ Γ l i j i δ Γ l l j = D l δ Γ l i j D i δ Γ l l j {\displaystyle \delta \left(R^{ij}\right)=\partial ^{l}\delta \Gamma _{l}^{ij}-\partial ^{i}\delta \Gamma _{l}^{lj}=D^{l}\delta \Gamma _{l}^{ij}-D^{i}\delta \Gamma _{l}^{lj}}

g . g i j . δ R i j = g . [ g i j . D l δ Γ l i j g i j . D i δ Γ l l j ] = g . [ D l ( g i j . δ Γ l i j ) D i ( g i j . δ Γ l l j ) ] {\displaystyle {\sqrt {-g}}.g_{ij}.\delta R^{ij}={\sqrt {-g}}.[g_{ij}.D^{l}\delta \Gamma _{l}^{ij}-g_{ij}.D^{i}\delta \Gamma _{l}^{lj}]={\sqrt {-g}}.[D^{l}\left(g_{ij}.\delta \Gamma _{l}^{ij}\right)-D^{i}\left(g_{ij}.\delta \Gamma _{l}^{lj}\right)]}

car   D k g i j = 0   {\displaystyle ~\quad D_{k}g_{ij}=0~} et aussi   D k g i j = 0   {\displaystyle ~\quad D^{k}g_{ij}=0~}

d'où   g . g i j . δ R i j = g . D l ( g i j . δ Γ l i j g l j . δ Γ i i j ) = g . D l A l {\displaystyle ~\quad {\sqrt {-g}}.g_{ij}.\delta R^{ij}={\sqrt {-g}}.D^{l}\left(g_{ij}.\delta \Gamma _{l}^{ij}-g_{lj}.\delta \Gamma _{i}^{ij}\right)={\sqrt {-g}}.D^{l}A_{l}} .

D'où, en utilisant le théorème d'Ostrogradski, g . g i j . δ R i j d Ω = g . D l A l d Ω = g . A l . d S l = 0 {\displaystyle \int {\sqrt {-g}}.g_{ij}.\delta R^{ij}d\Omega =\int {\sqrt {-g}}.D^{l}A_{l}d\Omega =\int {\sqrt {-g}}.A_{l}.dS^{l}=0}

La nullité de la dernière intégrale est due au fait qu'elle est calculée sur l'hypersurface délimitant le volume d'intégration et au fait que les variations des   g i j {\displaystyle \ g^{ij}} sont nulles sur la frontière d'intégration.

On obtient : δ S g = K . ( R i j 1 2 g i j R ) g . δ g i j d Ω {\displaystyle \delta S_{g}=K.\int \left(R^{ij}-{\frac {1}{2}}g^{ij}R\right){\sqrt {-g}}.\delta g_{ij}d\Omega }

Le principe de moindre action disant que   δ S g = 0 {\displaystyle \ \delta S_{g}=0} et les variations   δ g i j {\displaystyle \ \delta g_{ij}} étant quelconques, on obtient   R i j 1 2 g i j R = 0 {\displaystyle \ R^{ij}-{\frac {1}{2}}g^{ij}R=0} , ce que l'on écrit (et démontre) souvent en baissant les indices.

 

Les équations déduites sont :

  R i j 1 2 g i j R = 0 {\displaystyle \ R_{ij}-{\frac {1}{2}}g_{ij}R=0}

En faisant la « contraction »   g i j R i j 1 2 g i j . g i j R = 0 {\displaystyle \ g^{ij}R_{ij}-{\frac {1}{2}}g^{ij}.g_{ij}R=0} , on obtient   R = 0 {\displaystyle \ R=0} , ce qui ne signifie pas que l'espace est plat, mais plutôt qu'il s'agit d'une surface minimale à quatre dimensions, tendue entre les différentes masses qui y évoluent.

Les équations d'Einstein dans le cas extérieur sont donc :

  R i j = 0 {\displaystyle \ R_{ij}=0}

Les équations d'Einstein du champ de gravitation dans le cas intérieur

Le deuxième cas des équations du champ est le cas où il y a de la matière (localement) : on parle du « cas intérieur », c'est-à-dire « dans la matière ».

Dans ce cas, l'action est composée de l'action du champ gravitationnel   S g = K . g . R . d Ω {\displaystyle \ S_{g}=K.\int {\sqrt {-g}}.R.d\Omega } et de l'action de la matière, en y incluant le champ électromagnétique, que l'on écrit   S m = 1 c g . Λ m d Ω {\displaystyle \ S_{m}={\frac {1}{c}}\int {\sqrt {-g}}.\Lambda _{m}d\Omega } .

Démonstration des équations d'Einstein dans le cas intérieur

En utilisant la même méthode variationnelle, en sachant que   δ = δ {\displaystyle \ \delta \partial =\partial \delta } , en utilisant l'intégration par parties, et le théorème d'Ostrogradski qui permet d'écrire dans un référentiel en apesanteur l [ ( g Λ m ) ( l g i k ) ] d Ω = l [ g ( Λ m ) ( l g i k ) ] d Ω = g ( Λ m ) ( l g i k ) d S l = 0 {\displaystyle \int \partial _{l}[{\frac {\partial \left({\sqrt {-g}}\Lambda _{m}\right)}{\partial \left(\partial _{l}g_{ik}\right)}}]d\Omega =\int \partial _{l}[{\sqrt {-g}}{\frac {\partial \left(\Lambda _{m}\right)}{\partial \left(\partial _{l}g_{ik}\right)}}]d\Omega =\int {\sqrt {-g}}{\frac {\partial \left(\Lambda _{m}\right)}{\partial \left(\partial _{l}g_{ik}\right)}}dS_{l}=0}

En définissant le tenseur impulsion-énergie   T i j {\displaystyle \ T^{ij}} par l'égalité 1 2 T i j g = ( g Λ m ) g i k l [ ( g Λ m ) ( l g i k ) ] {\displaystyle {\frac {1}{2}}T^{ij}{\sqrt {-g}}={\frac {\partial \left({\sqrt {-g}}\Lambda _{m}\right)}{\partial g_{ik}}}-\partial _{l}[{\frac {\partial \left({\sqrt {-g}}\Lambda _{m}\right)}{\partial \left(\partial _{l}g_{ik}\right)}}]}

On obtient : δ S m = 1 c 1 2 T i j g δ g i j d Ω {\displaystyle \delta S_{m}={\frac {1}{c}}\int {\frac {1}{2}}T^{ij}{\sqrt {-g}}\delta g_{ij}d\Omega }

D'où, en posant χ = 1 2 c . K {\displaystyle \chi =-{\frac {1}{2c.K}}} , et on conclut de la même manière que dans le cas extérieur.

 

Les équations déduites sont :

  R i j 1 2 g i j R = χ T i j {\displaystyle \ R_{ij}-{\frac {1}{2}}g_{ij}R=\chi T_{ij}}

Avec la contraction similaire au cas extérieur, sachant que   g i j g i j = 4 {\displaystyle \ g_{ij}g^{ij}=4} et en posant   T = g i j T i j {\displaystyle \ T=g^{ij}T_{ij}} , on a   R = χ T {\displaystyle \ R=-\chi T} . La courbure principale est donc proportionnelle à la densité d'énergie totale   T = g i j T i j {\displaystyle \ T=g^{ij}T_{ij}} (ou trace du tenseur   T i j {\displaystyle \ T_{ij}} ).

On peut donc aussi écrire :

  R i j = χ ( T i j 1 2 g i j T ) {\displaystyle \ R_{ij}=\chi \left(T_{ij}-{\frac {1}{2}}g_{ij}T\right)}

Notes

  1. Jean-Claude Boudenot date à 1916, page 162 de son livre Électromagnétisme et gravitation relativistes, ellipse (1989), (ISBN 2-7298-8936-1); dans Lev Landau et Evgueni Lifchits, Physique théorique, t. 2 : Théorie des champs [détail des éditions], §93 note en bas de page du début de paragraphe, il est dit que cette méthode a été suggérée par Hilbert dès 1915, ce que confirme Jean-Paul Auffray p. 247 (paragraphe Hilbert part à la pêche) de son livre Einstein et Poincaré, édition Le Pommier, 1999, (ISBN 2 746 50015 9).
  2. Elie Cartan, Journal de Mathématiques Pures et Appliquées, 1, 1922, p. 141-203.

Sources

  • Jean-Claude Boudenot ; Électromagnétisme et gravitation relativistes, ellipse (1989), (ISBN 2-7298-8936-1)
  • Jean-Louis Basdevant ; Principes variationnels & dynamique, Vuibert (2005), (ISBN 2711771725).
  • Edgard Elbaz ; Relativité générale et gravitation, ellipse (1986).

Bibliographie

Articles connexes

  • icône décorative Portail de la physique