( dΓ(λ)/dλ )(λ=0) =
Σ(i) 0 ∫ b{ (∂L/∂Xi)U (X0(σ),dX0(σ)/dσ) . X1i(σ) +
(∂L/∂Ui)X (X0(σ),dX0(σ)/dσ) . [dX1i(σ)/dσ] } . dσ
L'expression (∂L/∂Xi)U (X0(σ),dX0(σ)/dσ) désigne la valeur de la fonction (∂L/∂Xi)U au point de l'espace Exu défini par : X = X0(σ) et U = dX0(σ)/dσ
Puis, on transforme le second terme via une banale intégration par parties. Sachant que X1i(0) = X1i (a) = 0, pour tout i, on obtient :
( dΓ(λ)/dλ )(λ=0) =
Σ(i) 0 ∫ b{ (∂L/∂Xi)U (X0(σ),dX0(σ)/dσ) - d[ (∂L/∂Ui)X (X0(σ),dX0(σ)/dσ) ]/dσ } . X1i(σ). dσ
A présent, on impose à cette quantité d'être nulle, c'est à dire : on impose à l'action ( l'intégrale, donc ) d'être stationnaire au 1er ordre par rapport à une perturbation " X1" quelconque, à points extrêmes fixés . L'action ne doit donc varier qu'aux ordres supérieurs ou égaux à 2 en λ .
Cela n'est possible que si l'expression entre accolades est identiquement nulle en tous points de la courbe de référence, soit :
d[ (∂L/∂Ui)X (X0(σ),dX0(σ)/dσ) ]/dσ = (∂L/∂Xi)U (X0(σ),dX0(σ)/dσ) pour tout i .
L'hypothèse de stationnarité a été exploitée, on peut donc abandonner les indexations "0" et adopter la notation X(σ) pour la courbe de référence :
d[ (∂L/∂Ui)X (X(σ),dX(σ)/dσ) ]/dσ = (∂L/∂Xi)U (X(σ),dX(σ)/dσ)
ou encore l'écrire sous la forme d'un système de 2N ( N + N ) équations :
dXi(σ)/dσ = Ui(σ) ( ou : dX (σ)/dσ = U(σ) )
d[ ( ∂L(X (σ),U (σ) )/∂Ui)X ]/dσ = ( ∂L(X(σ),U(σ) )/∂Xi)U
, pour tout i .
Si on se rappelle clairement "qu'est-ce qui dépend de quoi", on peut se permettre une écriture plus concise encore :
dX/dσ = U [1_1]
d[ ( ∂L/∂Ui)X ]/dσ = ( ∂L/∂Xi)U , pour tout i . [1_2]
Ce sont les équations de Lagrange .
De l'équation [1_2], on peut déduire :
Σ(j) (∂2L/∂Ui∂Uj)X . (dUj/dσ) + Σ(j) (∂2L/∂Ui∂Xj) .(dXj/dσ) - ( ∂L/∂Xi)U = 0 [1_3]
que l'on peut réécrire, en invoquant [1_1] :
Σ(j) (∂2L/∂Ui∂Uj)X . (d2Xj/dσ2) + Σ(j) (∂2L/∂Ui∂Xj) .(dXj/dσ) - ( ∂L/∂Xi)U = 0 [1_4]
Commentaire : les N équations [1_4] sont équivalentes aux 2N équations [1_1] et [1_2] .
En outre, on obtient une équation intéressante en "projetant" [1_2] sur U :
Σ(i){ Ui . d[ (∂L/∂Ui)X ]/dσ - Ui . ( ∂L/∂Xi)U } = 0
ou :
Σ(i){ d[ Ui . ( ∂L/∂Ui)X]/dσ - (dUi/dσ).(∂L/∂Ui)X - Ui . ( ∂L/∂Xi)U } = 0
ou encore :
Σ(i){ d[ Ui . ( ∂L/∂Ui)X]/dσ - (dUi/dσ).(∂L/∂Ui)X - dXi/dσ . ( ∂L/∂Xi)U } = 0
c'est à dire :
Σ(i) {d[ Ui . ( ∂L/∂Ui)X]/dσ } - dL/dσ = 0
et finalement :
d [ Σ(i) {Ui . ( ∂L/∂Ui)X} - L ]/dσ = 0 [1_5]
La dérivée par rapport à σ ( le long de la courbe optimale donc ) de l'expression Σ(i) {Ui . ( ∂L/∂Ui)X} - L est nulle. Cette expression est la transformée de Legendre de L, et est constante le long de la courbe optimale ( Je reviendrai sur ce point ultérieurement dans le texte ) .
2-Quelques considérations sur l'exploitabilité des équations de Lagrange .
Revenons aux équations [1_1] et [1_2] ou à la forme équivalente [1_4] . J'appellerai ici courbe "L-optimale" toute courbe qui satisfait les équations de Lagrange .
Hormis dans quelques cas particuliers, les équations sont résolues numériquement, en général . La stratégie la plus naturelle consiste à fixer des conditions initiales ( 2N valeurs pour "X initial" et "U initial" et à lancer un algorithme d'intégration numérique qui "tracera" la courbe . Il existe d'autres stratégies pour construire de telles courbes ( par optimisation par exemple ) mais dans le contexte des raisonnements du texte, je ne me référerai qu'à l'approche par "traçage" à partir des conditions initiales .
D'emblée, une question :
Peut-on toujours calculer une courbe L-optimale avec les seules équations [1_1] et [1_2] ( ou la forme équivalente [1_4] ) plus des valeurs initiales de X et U ?
Réponse : et ben non, pas toujours . Avec [1_1] et [1_2], les X et U courants sont requis à chaque pas d'intégration, or pour connaître le "nouveau" U, il faut l'extraire des "nouveaux" ( ∂L/∂Ui)X . Pour certains types de lagrangien L, on ne peut pas "remonter" des ∂L/∂Ui)X à U (c.a.d. aux Ui ) : une partie de l'information est perdue . Adopter la formulation [1_4] ne résout rien, bien entendu, car la "matrice" (∂2L/∂Ui∂Uj)X n'est pas inversible dans un tel cas : on ne peut donc en déduire les (d2Xj/dσ2) au complet et donc impossible de connaître complètement les nouveaux dXj/dσ etc ...
Avant d'examiner plus en détail le point évoqué ci-dessus, une petite pause récréative ( et utile ) :
Pause récréative :
Soit un espace à N dimensions, doté d'un système de coordonnées "par défaut" Ui , et une fonction F dont la forme explicite dans les coordonnées Ui est homogène de degré p en U :
F(k . U) = kp . F(U) ; pour tout nombre réel k . [2_1]
La fonction dérivée partielle de F par rapport à la iéme variable est également homogène par rapport à U (de degré p-1 ) . On vérifie aisément cette propriété sur des cas simples ( F polynomiale en Ui , par exemple ), mais une telle fonction F homogène n'est pas forcément simple et n'est pas toujours un polynôme . Pour démontrer cette propriété en général il importe de comprendre CLAIREMENT ce que dit [2_1] :
Dans les termes de droite et de gauche, la MÊME fonction F est évaluée en deux points distincts, distincts mais pas indépendants : pour chaque "point" U ( variable ) , le "point" k.U, image de U par une homothétie de centre l'origine des Ui , varie concomitamment à U . Etablir la propriété d'homogénéité pour une fonction dérivée partielle de F vs la ième coordonnée, signifie établir le MÊME genre de propriété géométrique, propriété qui implique les valeurs de cette fonction dérivée en les deux points DISTINCTS U et k.U .
En U, la valeur de la dérivée partielle vs la ième composante est ∂F(U)/∂Ui ; en k.U cette même fonction dérivée partielle vaut : ∂F(k.U)/∂(k.Ui) ( Ne pas oublier "k" au dénominateur ! )
Bon . Par ailleurs, dans [2_1], les deux termes sont deux écritures de la MÊME expression explicite "en U" ( par hypothèse ). Dérivons le tout par rapport à Ui , on obtient :
∂F(k.U)/∂Ui = kp . ∂F(U)/∂Ui
divisant par k :
(1/k) . ∂F(k.U)/∂Ui = kp-1 . ∂F(U)/∂Ui
et donc, puisque k est constant :
∂F(k.U)/∂(k.Ui) = kp-1 . ∂F(U)/∂Ui [2_2]
qui est bien une relation entre les valeurs de la MÊME fonction dérivée partielle en les deux points DISTINCTS "k.U" et "U" respectivement .
Conclusion : chaque fonction dérivée partielle de F vs une ième composante est homogène de degré p-1 en U .
Commentaire : j'ai "mis le paquet" question détails pour cette démonstration car je pense qu'on peut aisément se tromper pour l'expression de la dérivée partielle en différents points de l'espace ....
Une autre propriété :
Dérivons [2_1] par rapport à k :
dF(k.U)/dk = p.kp-1. F(U)
en détails :
Σ(i) [ ∂F(k.U)/∂(k.Ui) ] . [d(k.Ui)/dk] = p.kp-1. F(U)
ou : Σ(i) ( ∂F(k.U)/∂(k.Ui) ) . Ui = p.kp-1. F(U)
et posant k = 1 :
Σ(i) ( ∂F(U)/∂Ui ) . Ui = p. F(U)
Autrement dit : si F est homogène d'un certain degré en les coordonnées Ui , la fonction Σ(i) ( ∂F(U)/∂Ui ) . Ui
est proportionnelle à F . J'utiliserai abondamment cette propriété dans la suite du texte . A noter que cela reste valable pour p = 0 .
une (petite) propriété encore : si F est homogène en U de degré 0 : F(k . U) = F(U) pour tout k non nul, F ne dépend donc pas du module (euclidien) de U et dans un tel cas , il n'est JAMAIS possible d'extraire complètement U de F(U) [2_4].
Pour terminer cette pause récréative, considérons le cas F homogène de degré 1 . Alors, ∂F(U)/∂Ui est homogène de degré 0 d'après [2_2] et on peut en déduire deux choses :
D'abord on ne peut reconstituer complètement les Ui à partir des ∂F(U)/∂Ui ( d'après [2_4] , aucun des ∂F(U)/∂Ui ne dépend du module de U ) .
Ensuite, d'après [2_3] : Σ(i) ( ∂2F/∂Ui∂Uj ) . Ui = 0 [2_5]
Fin de la pause récréative .
Revenons au sujet :
D'après [2_4], si le lagrangien L est homogène de degré 1 par rapport au Ui, les équations [1_1] et [1_2] ne sont pas exploitables seules . Par ailleurs, d'après [2_5], on a : Σ(j) (∂2L/∂Ui∂Uj)X . Uj = 0 et donc l'équation [1_4] seule ne détermine pas la composante longitudinale ( ou tangente à la courbe ) de (d2Xj/dσ2) .
Est-ce un cas de figure exceptionnel ?
Non seulement, ce n'est pas exceptionnel, mais c'est assez usuel . Voyons un exemple :
Associons à l'espace Ex ( à N dimensions ) une métrique définissant l'élément de "distance" ds :
ds2 = Σ(i,j) aij . dXi . dXj
On se place soit dans le cas d'un tenseur métrique strictement positif, soit au moins dans le cas où les directions concernées des dXi sont telles que l'expression quadratique ci-dessus est positive .
Et posons L(X,U) = ( Σ(i,j) aij . Ui . Uj )1/2
Ainsi, L est bien homogène de degré 1 en U .
C'est simple en fait : si L(X,U) est homogène de degré 1 en U, le paramétrage σ N'EST PAS contraint par les équations de Lagrange . Pour l'exemple retenu ici, cette particularité peut être "anticipée" dès l'introduction de l'intégrale sur laquelle est appliquée le postulat de stationnarité :
l'élément intégré est ( Σ(i,j) aij . (dXi/dσ).(dXj/dσ) )1/2 .dσ qui est TOUJOURS égal à ds quelque soit le comportement du paramètre "de service" σ qui n'est contraint par rien .
Bien entendu, on peut exploiter les équations de Lagrange dans un tel cas A CONDITION d'imposer une contrainte au paramétrage σ . Par exemple, en imposant au lagrangien intégré d'être toujours égal à 1 : ainsi, le paramétrage σ laisse la place à la distance "s" définie par la métrique .
3-Lagrangien homogène en U, de degré différent de 1 .Considérations sur les conditions initiales .
Cette partie aura pour but d'établir la propriété suivante :
Si le lagrangien est homogène en U, de degré différent de 1 , alors la restriction aux coordonnées Xi de la courbe L-optimale NE DEPEND QUE du point initial "Xinit" du calcul et de LA DIRECTION du vecteur U initial ( pas de sa norme ) . Il va de soi que le paramètrage σ "natif" ( c.a.d. donné par la résolution des équations en même temps que les X et U ) dépendra, lui, du choix de la norme du U initial .
( Cette partie est en préparation )
4- Une propriété des lagrangiens homogènes en U, de degré différent de 1 .
Soit L un lagrangien dont la forme explicite dans les coordonnées Xi et Ui est homogène en U de degré p différent de 1 et de zéro .
réécrivons ici les équations de Lagrange [1_1] et [1_2] :
dX/dσ = U [1_1]
d[ ( ∂L/∂Ui)X ]/dσ = ( ∂L/∂Xi)U , pour tout i . [1_2]
Ces équations, jointes à des valeurs initiales de X et U, caractérisent complètement une courbe L-optimale ET son paramétrage σ .
La propriété [1_5] nous dit que la quantité Σ(i) {Ui . ( ∂L/∂Ui)X} - L est constante le long de la courbe L-optimale .
Par ailleurs, d'après [2_3], on a :
Σ(i) {Ui . ( ∂L/∂Ui)X} - L = (p-1).L
et p diff de 1 ( par hypothèse ) donc : la valeur de L est constante le long de la courbe optimale . Dans ce paragraphe, je me placerai dans le cas où cette valeur est non nulle ( et positive pour éviter les complications ) .
Deux commentaires : L ici est constante le long de la courbe L-optimale et sa valeur ( constante non nulle, donc) sera celle au point initial de la courbe et dépendra donc de la norme du "U" initial ( puisque p est diff de 1 ET de zéro ) .
Au fait, j'ai exclu ici le cas d'une valeur nulle du lagrangien le long de la courbe L-optimale . Y-a-t il des contextes mathématico-physiques pour lesquels les courbes L-optimales sont caractérisées, entre autres, par une valeur nulle du lagrangien ? Réponse : oui .
Supposons que nous avons effectivement calculé une courbe L-optimale "C" à l'aide des équations [1_1] et [1_2] et des conditions initiales Xinit et Uinit ( et σinit = 0 ) .
Définissons dans l'espace Exu une fonction Λ comme suit : Λn = L , où n est un nombre rationnel non nul et positif . En explicitant sur les coordonnées X et U :
L(X,U) = [ Λ(X,U) ]n
Les conditions initiales pour la courbe "C" ainsi que l'équation [1_1] ne sont pas concernées par l'introduction de cette fonction Λ .
Transformons l'écriture de l'équation [1_2] en y faisant apparaître Λ ( et non L ), on obtient :
(n-1) Λn-2 .(dΛ /dσ).( ∂Λ/∂Ui )X + Λn-1.{ d[ ( ∂Λ/∂Ui )X ]/dσ - ( ∂ Λ/ ∂Xi )U } = 0 [4_1]
Discussion :
L'équation [4_1] est simplement la nouvelle écriture de [1_2] lorsqu'on remplace L par Λn . Puisque L est constant ( et > 0 ) le long de la courbe "C" , Λ est lui-même constant ( et > 0 ) le long de cette même courbe et donc dΛ /dσ = 0 : la 1ère expression du membre de gauche de [4_1] disparaît . Λn-1 n'est jamais nul et on aboutit finalement à :
d[ ( ∂Λ/∂Ui )X ]/dσ - ( ∂ Λ/ ∂Xi )U = 0
c'est à dire : la courbe C est Λ-optimale .
Attention : on parvient à cette conclusion à condition que la valeur constante de L le long de la courbe " C" soit différente de zéro .
Un cas particulier intéressant :
Si L(X,U) = Σ(i,j) aij . Ui . Uj
et n = 2 , c'est à dire Λ(X,U) = ( Σ(i,j) aij . Ui . Uj )1/2
Les courbes L-optimales ( caractérisées par une valeur strictement positive de L sur la courbe) sont également Λ-optimales
. Et si Σ(i,j) aij . Ui . Uj doit être positif pour que le lagrangien Λ soit défini ( et même strictement positif pour que Λ soit viable car la racine carrée est singulière en zéro ...) , il n'y a pas, par contre, de telles limitations pour le lagrangien L qui n'a pas besoin d'être positif ni n'est affecté de singularités : les courbes L-optimales sont définies de la même façon par les équations de Lagrange, que la valeur ( constante sur chacune ) du lagrangien L soit positive, négative ou nulle n'a pas d'importance .
5- Equations des géodésiques ( un peu sommaire pour le moment )
Reprenons l'exemple L(X,U) = Σ(k,l) akl(X). Uk . Ul
( "aij" symétrique : aij = aji ) et réécrivons ici l'équation [1_3] :
Σ(j) (∂2L/∂Ui∂Uj)X . (dUj/dσ) + Σ(j) (∂2L/∂Ui∂Xj) .(dXj/dσ) - ( ∂L/∂Xi)U = 0
calculs intermédiaires :
(∂L/∂Ui)X = 2Σ(k) aik . Uk
(∂2L/∂Ui∂Uj)X = 2aij
(∂2L/∂Ui∂Xj) = 2Σ(k) (∂aik/∂Xj). Uk
(∂L/∂Xi)U = Σ(k,l) (∂akl/∂Xi) . Uk . Ul
[1_3] s'écrit donc :
2Σ(j) aij . (dUj/dσ) + 2Σ(j,k) (∂aik/∂Xj).Uk .Uj - Σ(k,l) (∂akl/∂Xi).Uk.Ul = 0
c'est à dire, en renommant quelques indices :
2Σ(j) aij . (dUj/dσ) + Σ(k,l) { 2(∂aik/∂Xl) - (∂akl/∂Xi) } .Uk.Ul = 0 [5_1]
ou encore :
2Σ(j) aij . (d2Xj/dσ2) + Σ(k,l) { 2(∂aik/∂Xl) - (∂akl/∂Xi) } . (dXk/dσ).(dXl/dσ) = 0 [5_2]
Appelons "bij" les coefficients de la matrice inverse de "aij" , on a :
Σ(i) bim . aij = δjm ( symbole de Kronecker : δjm = 1 si j=m, zéro sinon )
et de [5_2], on déduit :
d2Xm/dσ2 + Σ(i,k,l) bim.{ (∂aik/∂Xl) - (1/2). (∂akl/∂Xi) } (dXk/dσ).(dXl/dσ)= 0 [5_3]
Si aik est un tenseur métrique, les équations [5_3] caractérisent les géodésiques associées à la métrique .