Sur le caractère extrémal des géodésiques pour la métrique de Minkowski

Publié le

Sur la propriété " une géodésique de la métrique de Minkowski maximise l'intervalle d'espace temps entre deux points fixés "
 
Ce texte est constitué de plusieurs parties . Chacune de ses parties établit et/ou discute une propriété utile dans le présent contexte . Certaines des propriétés ou relations évoquées ici seront valides pour un tenseur métrique quelconque, d'autres ne le seront que pour un tenseur métrique constant ( le texte le précisera chaque fois ) .
 
Note au lecteur : dans la version précédente du texte, j'utilisais la lettre "S" pour les intégrales "ΔS, ΔS0, ΔS' et ΔS'0 " et, par ailleurs, la lettre "τ" ( inspirée par "Temps propre" ) pour l'élément infinitésimal de distance/temps-propre  : "dτ" . Un choix maladroit qui pouvait prêter à confusion . J'ai modifié cela et n'utilise plus que la lettre générique "S" pour ces entités . Et, au passage, j'insiste sur le fait que "S" N'EST PAS une coordonnée ( c'est toujours bon de le rappeler, on ne sait jamais ... )
 
1 Equation des géodésiques pour un tenseur métrique constant
 
Pour un tenseur métrique "G" quelconque, l'équation des géodésiques s'écrit :
 
Σ(j) Gij . d2Xj/dσ2  + Σ(k,l) { (∂Gik/Xl)  -  (1/2). (∂Gkl/Xi) } (dXk/dσ).(dXl/dσ)= 0          [1]
 
où les Gij sont les coefficients du tenseur métrique exprimé dans le système de coordonnées Xi .
C'est l'équation [5_2] du texte :
 
 
lorsque la matrice "a" est le tenseur métrique, ( noté G ici ) .
 
Commentaire :
Dans le présent texte, je ne me conforme pas particulièrement aux règles très strictes de "placement" des indices ( inférieurs, supérieurs ) qui sont d'usage en calcul tensoriel en fonction des propriétés mathématiques des tenseurs ( covariance, contravariance ... ) .
Le terme Gij présent dans l'expression [1] désigne le coefficient de ligne "i" et colonne "j" du tenseur métrique tel qu'il apparaît dans la définition de la "distance" S :
dS2 = Σ(i,j) Gij . dX. dXj
Je n'utilise pas non plus la convention de sommation implicite .
 
Si le tenseur métrique est à coefficients constants, l'équation se ramène à :
Σ(j) Gij . d2Xj/dσ2   = 0
la matrice G étant inversible, c'est équivalent à :
d2Xi/dσ2 = 0 , pour tout i       [2]
 
conséquence : Xi = ai .σ + bi , pour tout i .     [3]
 
la géodésique est donc une droite analytique dans ce système de coordonnées : une dénomination que j'avais choisie dans des textes antérieurs pour désigner une "courbe" qui, dans un système de coordonnées donné, admet au moins une représentation paramétrique constituée de fonctions affines du paramètre .
 
Trivialement, deux droites analytiques distinctes ne peuvent concourir qu'une fois au plus . Et donc, si le tenseur métrique est constant dans un système de coordonnées, une seule géodésique joint deux points distincts ( et cela reste vrai dans n'importe quel autre système de coordonnées, bien sûr )  .
 
Commentaire :
Cette propriété est toujours vérifiée dans le cas d'une métrique à courbure nulle .
 
2 Expression intégrale de la "distance" entre deux points fixés . Cas général . 
 
Considérons un tenseur métrique quelconque G exprimé dans un système de coordonnées Xi , et deux points de l'espace P et Q
Considérons aussi une courbe paramétrée joignant P à Q, j'appelle σ le paramétrage de la courbe, avec les relations :
 
XiP) = Pi  et  XiQ) = Qi .        [4]
 
Appelons   ΔS la "distance" le long de l'élément de courbe entre P et Q .
 
ΔS =  σp   σq[ (dX/dσ)T . G . (dX/dσ) ]1/2 . dσ       [5]
Ici, la fonction intégrée est homogène de degré 1 en " dXi/dσ ", en conséquence l'intégrale ΔS est indépendante du paramétrage ( à points extrêmes P et Q fixés ) .
 
Vérifions cette propriété : 
Soit une fonction "f" strictement monotone ( mettons croissante, pour faire simple ) et définissons η par : 
η = f(σ) ,  ηp = f(σp)  et ηq = f(σq)
alors :  
    ΔS =  σp   σq  {  [ (dX/dη)T . G . (dX/dη) ].( dη/dσ )2  }1/2 . dσ
  =  σp   σq  [ (dX/dη)T . G . (dX/dη) ]1/2 ( dη/dσ ) . dσ
et donc :
 
ΔS =   ηp   ηq  [ (dX/dη)T . G . (dX/dη) ]1/2 . dη      , CQFD .
 
3 Contrainte de positivité 
 
Dans l'expression [ (dX/dσ)T . G . (dX/dσ) ]1/2  , la puissance 1/2 désigne la racine carrée "classique", ce qui sous-entend que la quantité entre crochets doit toujours être ≥ 0 .
 
Ici, il convient d'imposer une positivité stricte . Pourquoi ? Parce que la propriété d'extremum que le présent texte a pour but d'établir invoque une courbe "de référence" ( ce sera la géodésique) et d'autre part une courbe   "quelconque" que l'on peut considérer comme résultant d'une "perturbation" de la géodésique . Et raisonner sur la "perturbation" d'une courbe suppose que les quantités qui dépendent de la courbe ( perturbée ou non ) aient de "bonnes" propriétés analytiques . Ici la quantité qui dépend de la courbe, c'est l'intégrale  . Par ailleurs, la puissance 1/2 ( c.a.d. la racine carrée ) est requise ici car le raisonnement porte effectivement sur la DISTANCE définie par la métrique ( contrairement à la démarche adoptée pour établir l'équation des géodésiques, où on peut effectivement omettre la racine carrée ) . Et la racine carrée a un comportement problématique au voisinage de zéro, comme on sait .... 
 
La contrainte de positivité sera donc stricte :
On ne considérera que les "courbes" de l'espace qui vérifient 
(dX/dσ)T . G . (dX/dσ) > 0      [6]
en chacun de leurs points .
 
4 Expression de la distance sur une géodésique entre deux points fixés . Cas d'un tenseur métrique constant .
 
On considère l'expression de l'intégrale ΔS sur la géodésique (unique)  qui joint P et Q :
ΔS =  σp   σq[ (dX/dσ)T . G . (dX/dσ) ]1/2 . dσ   ,  ( avec G constant )     [7]
 
Cette géodésique est une droite analytique dans les coordonnées Xi, elle admet donc au moins une représentation paramétrique constituée de fonctions affine du paramètre et on choisit CE paramètre ( nommé σ ) comme paramétrage ( et variable d'intégration de l'intégrale ΔS ) . Un tel choix est tout à fait possible puisque l'intégrale ΔS ne dépend pas du paramétrage ( Cf paragraphe 2 ) .
 
La représentation paramétrique de la géodésique PQ est :
 
Xi = ai .σ + bi , pour tout i .
et donc dXi/dσ = ai
ΔS =  σp   σq[  Σ(i,j) ai . Gij . aj  ]1/2 . dσ     [9]
et, puisque G est constant ici : 
ΔS = [ Σ(i,j) ai . Gij . aj ]1/2 .  σp   σq dσ  =  [ Σ(i,j)  ai . Gij . aj ]1/2(σq - σp)
 =  [ Σ(i,j) ai .(σq - σp) . Gij . aj .(σq - σp) ]1/2    [10] 
 
 
or, pour tout i,  ai .(σq - σp) = Xi(Q) - Xi(P) que l'on nommera ΔX pour simplifier .
On a donc : 
ΔS =  [ Σ(i,j) ΔX. Gij ΔX]1/2
ou encore  :  ΔS2 =  Σ(i,j) ΔX. Gij ΔXj     [11]
Cette relation exhibe la même apparence formelle que celle qui constitue la définition de la métrique : 
  dS2 =  Σ(i,j) dX. Gij . dX   [12]
Mais attention à ne pas confondre les deux . La relation [12] implique des variations infinitésimales et définit la métrique dans le cas général d'un tenseur métrique quelconque ( pas nécessairement constant ) . La relation [11] implique des variations finies ( pas infinitésimales ) et ne découle de [12] que si le tenseur métrique est constant dans le système de coordonnées X ET si la "courbe" en question est une géodésique ( dans ce contexte : une droite analytique ) .
 
5 démonstration de la propriété-titre :
 
On considère un espace à quatre dimensions, appelé "espace-temps" . On considère en outre un système de coordonnées "X,Y,Z,T" tel que l'expression du tenseur métrique dans ce système est l'expression classique :
            1   0   0   0
            0  -1   0   0
            0   0  -1   0
G   =    0   0   0  -1         [13]
 
On choisit S comme lettre générique pour désigner la distance définie par la métrique . L'expression du tenseur métrique est donc équivalente à la définition :
 
dS2 = dT2 - dX2 - dY2 - dZ2     [14]
 
Commentaire : il s'agit bien de la métrique de Minkowski mais avec "c=1" . Un choix qui allège sensiblement certains calculs sans perdre en généralité ( la valeur effective de la "vitesse limite" n'est qu'une question d'unités ) . D'autre part la contrainte de positivité s'applique à toutes les courbes envisagées dans le texte, et s'applique donc aussi à tous les segments infinitésimaux de courbe .
 
 
Soient deux points distincts P,Q dans l'espace-temps .
 
On sait qu'une seule géodésique joint les points P et Q ( voir début du texte ) . De plus, puisque le tenseur métrique exprimé dans les coordonnées T,X,Y,Z est constant, la géodésique est une droite analytique dans ce système de coordonnées. Considérons une représentation paramétrique en  σ  :
 
 T0(σ) = e .σ + ε 
 X0(σ) = a .σ + α
 Y0(σ) = b .σ + β
 Y0(σ) = c .σ + γ            [15]
( Pour fixer un peu les choses posons : e > 0 , c.a.d. T0(σ) est une fonction croissante de σ ) .
 
l'indice inférieur "0" est pour indiquer qu'il s'agit de la géodésique PQ ( c'est la "courbe de référence" ici ) .
 
ΔS0 = σp   σq [ (dT0/dσ)2 - (dX0/dσ)2 - (dY0/dσ)2 - (dZ0/dσ)2 ]1/2.dσ 
 =  σp   σq [ e2 - a2 - b2 - c2 ]1/2.dσ     [16]
 
Considérons à présent une autre courbe, quelconque, entre les points P et Q . Ce n'est pas une géodésique et son paramétrage ne "sort" pas de la résolution d'une équation différentielle . Simplement, elle est supposée paramétrée "par défaut" ( parce qu'il faut bien un paramétrage pour les raisonnements ...) . Appelons η le paramètre associé et posons ηq > ηp .
 
Désignons par : T(η),X(η),Y(η),Z(η) cette représentation paramétrique "par défaut" .
 
La manip suivante va consister à : 
a) introduire un nouveau système de coordonnées "prime" .
b) adopter une nouvelle variable d'intégration commune aux deux intégrales ( et qui sera implicitement un nouveau paramétrage associé aux deux courbes )
 
a) Introduction d'un nouveau système de coordonnées :
 
Supposons l'existence d'une matrice J 4X4 à coefficients réels constants, ayant les deux propriétés suivantes : 
 JT . G . J  = G    [17]
 
                e                  ρ 
                a                  0
                b                  0
 J          c         =       0           [18]    
 
avec ρ = ( e2 - a2 - b2 - c2 )1/2
 
Introduisons les coordonnées T',X',Y',Z' définies comme suit :
 
 
                dT                  dT' 
                dX                  dX'
                dY                  dY'
 J          dZ         =       dZ'              [19]
 
avec, pour compléter la définition, le même point origine pour les deux systèmes : le point de coordonnées (0,0,0,0) dans le système T,X,Y,Z a également (0,0,0,0) pour coordonnées dans le système "prime" T',X',Y',Z' .
 
On conserve dans le système de coordonnées "prime" T',X',Y',Z' l'indice inférieur"0" pour désigner la géodésique entre P et Q
 
D'après [17] et [18] , on a donc :
 
(dT0/dσ)2 - (dX0/dσ)2 - (dY0/dσ)2 - (dZ0/dσ)2 = [ dT02 - dX02 - dY02 - dZ02 ]/dσ2
 
                                                      dT0                                                                                e
                                                      dX0                                                                                a
                                                      dY0                                                                                b    
= (dT0,dX0,dY0,dZ0)   .  G  .   dZ0   .    (1/dσ2)   =   (e ,  a ,  b , c)  .  G  .   c 
 
                                                        e                                                      ρ
                                                        a                                                      0
                                                        b                                                      0
=  (e ,  a ,  b , c)  .  JT . G  .  J  .   c      =  (ρ , 0 , 0 , 0 , 0)  .  G  .    0
 
 =  ρ2  ( qui est égal à e2 -a2 -b2 -c2 , comme prévu )   [20]
 
Pas de surprise, donc . Mais ici, la propriété utile est : 
 
dT'0/dσ) = ρ  et  dX'0/dσ = dY'0/dσ = dZ'0/dσ = 0 .  [21]
 
L'intégrale ΔS0 peut donc s'écrire : 
ΔS0 = σp   σq [ (dT'0/dσ)2 ]1/2.dσ = σp   σq (dT'0/dσ).dσ    [22] 
 
Effectuons le même changement de coordonnées dans l'intégrale ΔS associée à la courbe quelconque entre P et Q :
ΔS =   ηp   ηq  [  (dT/dη)2 - (dX/dη)2 - (dY/dη)2 - (dZ/dη)2  ]1/2 . dη 
 
La courbe est quelconque et donc , le long de cette courbe, les dX',dY', et dZ' ne seront pas nuls en général. On obtient : 
ΔS =   ηp   ηq  [  (dT'/dη)2 - (dX'/dη)2 - (dY'/dη)2 - (dZ'/dη)2  ]1/2 . dη 
 
b) Choix d'une variable d'intégration commune aux deux intégrales :
 
L'expression [22] suggère bien sûr d'adopter T' comme variable  d'intégration commune aux deux intégrales . Par souci d'homogénéité de notations ( et pour distinguer fonctions et variable(s) d'intégration ), je la désigne par la lettre minuscule t'  ( mais en fait c'est la coordonnée T' ) .
 
On obtient ainsi : 
ΔS0 = t'p   t'qdt'    [23]
( bien entendu, c'est égal à t'q - t'p , mais ce n'est pas ce qui nous intéresse ici )
 
et ΔS = t'p   t'q [ 1 - (dX'/dt')2 -  (dY'/dt')2  -  (dZ'/dt')2  ]1/2  dt'    [24]
 
Trivialement : [ 1 - (dX'/dt')2 -  (dY'/dt')2  -  (dZ'/dt')2  ]1/2   1
 
Si on considère que notre courbe quelconque est "raisonnablement lisse", alors les dérivées dX'/dt' etc ... ne seront pas toutes nulles sur un ou plusieurs sous-intervalles finis de [t'p , t'q ], et l'inégalité sera stricte pour les intégrales : 
 
t'p   t'q [ 1 - (dX'/dt')2 -  (dY'/dt')2  -  (dZ'/dt')2  ]1/2  dt' <  t'p   t'qdt'     [25]
 
soit : ΔS   <    ΔS0
 
La propriété est établie sous réserve de l'existence de la matrice J, ce qui fait l'objet du paragraphe suivant :
 
6) Expression et nature mathématiques de la matrice J .
 
La matrice J = 
 
                        r2e             -r2a                  -r2b                      -r2c
                      -r2a      ea2+ρb2+ρc2      (e-ρ)ab               (e-ρ)ac
                      -r2.b        (e-ρ)ab        ρa2+eb2+ρc2          (e-ρ)bc
(r2ρ)-1  .       -r2.c        (e-ρ).ac            (e-ρ).bc         ρa2 + ρb2 + ec2     [26]
 
avec : r = (a2 + b2 + c2)1/2 et (rappel) : ρ = ( e2 - a2 - b2 - c2 )1/2
 
vérifie bien les propriétés [17] et [18] . On peut le vérifier directement ( pour être franc, la vérification de [17] est un peu longue, mais sans difficultés notables ) . 
 
Détails et commentaires : 
Cette matrice est "fabriquée" à partir de l'expression [17] du texte :
 
 
Je reproduis cette expression ici, après remplacement des lettres "a,b,c" qui y figurent par les lettres "α,β,γ", car il y a d'autres lettres "a,b,c" utilisées dans le présent texte .
 
ch(λk)                          sh(λk)α/k                          sh(λk)β/k                         sh(λk)γ/k
sh(λk)α/k      [α2ch(λk)+ β2+ γ2]/k2         [ch(λk)-1]αβ/k2             [ch(λk)-1]αγ/k2
sh(λk)β/k           [ch(λk)-1]αβ/k2         [β2ch(λk)+ α2γ2]/k2        [ch(λk)-1] βγ/k2 
sh(λk)γ/k           [ch(λk)-1]αγ/k2              [ch(λk)-1] βγ/k2          [γ2ch(λk)+α2β2]/k2       [27]
 
avec k = (α2+ β2+ γ2)1/2 soit la norme ( euclidienne) du "vecteur" (α, β, γ). Ce vecteur représente la "direction spatiale" de la transformation de Lorentz, transformation exprimée ici sous sa forme trigonométrique hyperbolique ( le texte cité en lien ci-dessus précise comment obtenir la formulation classique en "vitesse limite" ) . Et ici encore cette "vitesse limite" vaut 1 .
 
Dans l'expression [27] , le "vecteur" (α,β,γ) n'est pas normé ( au sens euclidien ), on constate d'ailleurs que sa norme k "interfère" avec λ qui est une sorte de "paramètre d'amplitude" de la transformation ( pour λ = 0, [27] est l'identité ). λ et k font double emploi en quelque sorte, aussi est-il plus clair ( et plus simple ) de normer euclidiennement le vecteur (α,β,γ) :
en posant : α2 + β2 + γ2 = 1 , c.a.d. : k = 1 . Le seul "paramètre d'amplitude" est alors λ ( il porte un nom précis dans la littérature, en français en tout cas, mais j'ai oublié, désolé ...).
 
L'expression [27]  devient : 
 
ch(λ)                     sh(λ)α                          sh(λ)β                 sh(λ)γ
sh(λ)α      α2ch(λ)+ β2+ γ2        [ch(λ)-1]αβ             [ch(λ)-1]αγ
sh(λ)β         [ch(λ)-1]αβ         β2ch(λ)+ α2γ2        [ch(λ)-1] βγ 
sh(λ)γ         [ch(λ)-1]αγ             [ch(λ)-1] βγ        γ2ch(λ)+α2β2        [28]
 
( A partir d'ici, la mention"[17]" désignera la propriété ainsi numérotée dans le présent texte ) .
 
Par construction, [28] ( ou [27] ) est la matrice jacobienne d'une transformation de Lorentz qui est un cas particulier d'isométrie pour la métrique de Minkowski ( voir texte mentionné plus haut ), et donc [17] est vérifiée d'office . 
Il ne reste qu'à adapter l'expression [28] pour qu'elle satisfasse [18], comme suit :
 
on pose λ = Argsh(-r/ρ) équivalent à sh(λ) = -r/ρ   [29]
on pose aussi α = a/[ (a2+b2+c2)1/2 ]  = a/r
de même :    β = b/r   et   γ = c/r     [30]
Le vecteur (α , β , γ) est bien 'normé" ( euclidiennement ), comme prévu .
On sait que ch(λ)2 - sh(λ)2 = 1
donc :  ch(λ)2 = 1 + sh(λ)2 = 1 + r22  = ( ρ2+ r2)/ρ2 = e22
( l'erreur sur la ligne précédente a été corrigée )
et puisque ch(λ) > 0 , ch(λ) = e/ρ   [31]
 
En utilisant  [29][30] et [31] dans l'expression [28], on obtient bien la matrice J [26] . Voilà .
 
Pour être informé des derniers articles, inscrivez vous :
Commenter cet article