Quelques considérations sur les formalismes lagrangien et hamiltonien .

Publié le

Avertissement : 
 
Le texte qui suit N'A PAS l'ambition de rivaliser avec les exposés "classiques" , plus ou moins fouillés, que l'on peut trouver facilement un peu partout, dans la littérature physico/mathématique ou sur internet . D'abord parce que seuls quelques thèmes en rapport sont abordés, ensuite parce que ce texte est plutôt "pensé" pour convenir à certains types bien particuliers de lagrangiens , et pas n'importe quel lagrangien . Aussi, si  certains passages du texte peuvent avoir une validité assez générale, d'autres passages seront surtout pertinents pour les lagrangiens particuliers auxquels j'ai fait allusion . Par ailleurs, j'ai suivi ma manière habituelle : basique tant que c'est possible, avec juste le "zeste" de généralité qui peut être pertinent , et TOUJOURS avec des détails, et des commentaires .
 
1- Principe de stationnarité , équations de Lagrange .
 
Soit un espace à N dimensions, nommé Ex et doté d'un système de coordonnées par défaut "Xi" . Soient A et B deux points de l'espace Ex . Je n'envisagerai pas ici, de changements de coordonnées affectant les X ( et l'espace Ex en général, aussi ne distinguerai-je pas le point A de l'ensemble de ses coordonnées mises en "vecteur colonne" OK ? ( même remarque pour B ) . 
Il y a dans Ex une infinité de courbes joignant A à B . Par la pensée, je ne retiens que les courbes relativement "tranquilles" entre ces deux points , pas de loopings, pas de discontinuités de tangente etc .... Bref, des courbes raisonnables, sympathiques, idéales ...
 
Je distingue une de ces courbes ( la courbe de référence si l'on veut ), paramétrée par sigma et décrite par le "vecteur colonne" X0, constitue des N composantes X0i ( N fonctions de sigma donc ) .
 
Je "cale" le paramétrage sigma en prenant son origine au point A : X0(0) = A .
Je nomme b la valeur de sigma pour laquelle le point B est atteint :  X0(b) = B .
Ensuite, j'introduis un autre "vecteur colonne" X1( σ ), c.ad. N autres fonctions X1i(σ) dotées comme les X0i )  de caractéristiques de continuité et dérivabilité idéales et vérifiant : X1i(0) = X1i (b) = 0 .
J'introduis un paramètre  λ réel et les N fonctions Xi(σ,λ ) telles que :
Xi( σ,λ) = X0i(σ) + λ.X1i( σ) . Ou encore X( σ,λ) = X0(σ) + λ.X1( σ)  si on écrit tout en "colonne de composantes" .
 
Si λ = 0, X( σ,0) décrit la courbe de référence entre A et B . Si λ non nul, X( σ,λ ) décrit une AUTRE courbe allant de A à B .
 
Ainsi, la variation de λ de part et d'autre de zéro décrit un continuum mono-dimensionnel de courbes ( et donc pas TOUTES les courbes dans un "voisinage" de la courbe de référence si Ex a plus de 2 dimensions, mais ça suffit pour le raisonnement ... )
 
Ces choses étant définies, plongeons à présent l'espace N-dimensionnel Ex dans un espace à 2N dimensions "Exu" doté nativement de 2N coordonnées réparties en deux ensembles : les N "Xi" et les N "Ui" . Comme pour les Xi
et X , je noterai U l'ensemble des Ui .
 
Commentaire : la vocation des Xi est d'être des coordonnées "spatiales" de natures variées  . Si dans un contexte physico-mathématique donné, le temps est présent , il peut très bien faire partie de ces coordonnées "spatiales"; ce mot doit donc être compris dans un sens assez général...
                                     ***********
 
Dans cet espace "étendu" Exu, j'introduis un acteur fondamental du raisonnement : Une fonction de 2N variables L(X,U), appelée lagrangien , ou fonction de Lagrange . La nota tion " L(X,U) " représentera toujours la forme explicite de la fonction L dans le système de coordonnées par défaut de Exu .
 
Dans la suite, les dérivées partielles de L seront invoquées : 
 
 (∂L/∂Xi)U désigne la dérivée partielle aux AUTRES Xk constants (k diff de i donc ) et à TOUS les Uconstants. Signification analogue ( symétrique ) pour (∂L/∂Ui)X
 
Commentaire : la convention de conditions constantes "par défaut" pour un systèmes de coordonnées Xi, Ui "présenté comme tel dès le départ" ( 2N coordonnées, donc) aurait pu être utilisée ici, permettant d'omettre la mention des 2N-1 quantités constantes qui définissent chaque dérivée partielle et rendre l'écriture plus concise . Mais j'introduirai ultérieurement la formulation hamiltonienne associée et, avec elle, un AUTRE système privilégié de coordonnées "Xi, Pi", je préfère être explicite d'emblée ...
                                ***************
 
Ensuite, pour chaque valeur de λ, j'introduis une intégrale curviligne entre les points A et B : intégrale de la quantité L[ X(σ,λ) , ( ∂X(σ,λ)/∂σ )λ ], σ étant la variable d'intégration . Je nomme Γ cette intégrale, que l'on appelle traditionnellement l'action ( entre A et B ). Soit, en clair :  
 
Γ(λ) =   0  bL[ X(σ,λ) , ( ∂X(σ,λ)/∂σ )λ ] . dσ
 =  0  bL[ X0(σ) + λ.X1(σ) , dX0(σ)/dσ + λ.dX1(σ)/dσ  ] . dσ
 
Ensuite, on "perturbe" la courbe au premier ordre . En détails, on exprime la dérivée de Γ(λ) par rapport à λ, en λ = 0 : 
 
 
( dΓ(λ)/dλ )(λ=0) =   
Σ(i) 0  b{ (∂L/∂Xi)(X0(σ),dX0(σ)/dσ) . X1i(σ)     +
                      (∂L/∂Ui)X (X0(σ),dX0(σ)/dσ) . [dX1i(σ)/dσ] . dσ

L'expression (∂L/∂Xi)(X0(σ),dX0(σ)/dσ) désigne la valeur de la fonction (∂L/∂Xi)U au point de l'espace Exu défini par :  XX0(σ) et U = dX0(σ)/dσ

Puis, on transforme le second terme via une banale intégration par parties. Sachant que X1i(0) = X1i (a) = 0, pour tout i, on obtient : 

( dΓ(λ)/dλ )(λ=0) =   
Σ(i) 0  b{ (∂L/∂Xi)(X0(σ),dX0(σ)/dσ)  - d[ (∂L/∂Ui)X (X0(σ),dX0(σ)/dσ)  ]/dσ } . X1i(σ). dσ
A présent, on impose à cette quantité d'être nulle, c'est à dire : on impose à l'action ( l'intégrale, donc ) d'être stationnaire au 1er ordre  par rapport à une perturbation " X1" quelconque, à points extrêmes fixés . L'action ne doit donc varier qu'aux ordres supérieurs ou égaux à 2 en λ .
 
Cela n'est possible que si l'expression entre accolades est identiquement nulle en tous points de la courbe de référence, soit :
 
d[ (∂L/∂Ui)X (X0(σ),dX0(σ)/dσ)  ]/dσ = (∂L/∂Xi)(X0(σ),dX0(σ)/dσ)   pour tout i .
L'hypothèse de stationnarité a été exploitée, on peut donc abandonner les indexations "0" et adopter la notation X(σ) pour la courbe de référence :
 
d[ (∂L/∂Ui)X (X(σ),dX(σ)/dσ)  ]/dσ = (∂L/∂Xi)(X(σ),dX(σ)/dσ) 
 
ou encore l'écrire sous la forme d'un système de 2N ( N + N ) équations :
 
dXi(σ)/dσ = Ui(σ)      ( ou : d(σ)/dσ = U(σ) )
d[ ( ∂L((σ),(σ) )/∂Ui)X ]/dσ = ( ∂L(X(σ),U(σ) )/∂Xi)
, pour tout i .
 
Si on se rappelle clairement "qu'est-ce qui dépend de quoi", on peut se permettre une écriture plus concise encore : 
 
dX/dσ = U                                                                          [1_1]
d[ ( ∂L/∂Ui)X ]/dσ = ( ∂L/∂Xi)  , pour tout i .         [1_2]
 Ce sont les équations de Lagrange .
 
De l'équation [1_2], on peut déduire : 
 
 
Σ(j) (∂2L/∂Ui∂Uj)X . (dUj/dσ) + Σ(j) (∂2L/∂Ui∂Xj) .(dXj/dσ)  -  ( ∂L/∂Xi) = 0     [1_3]
que l'on peut réécrire, en invoquant [1_1]
 
Σ(j) (∂2L/∂Ui∂Uj)X . (d2Xj/dσ2) + Σ(j) (∂2L/∂Ui∂Xj) .(dXj/dσ)  -  ( ∂L/∂Xi) = 0       [1_4]
 
Commentaire :  les N équations [1_4] sont équivalentes aux 2N équations [1_1] et [1_2] .
 
En outre, on obtient une équation intéressante en "projetant" [1_2] sur U
 
 
Σ(i){ Ui . d[ (∂L/∂Ui)X ]/dσ -  Ui . ( ∂L/∂Xi)} = 0 
ou  : 
Σ(i){ d[ Ui . ( ∂L/∂Ui)X]/dσ - (dUi/dσ).(∂L/∂Ui)X -  Ui . ( ∂L/∂Xi) } = 0
ou encore : 
Σ(i){ d[ Ui . ( ∂L/∂Ui)X]/dσ - (dUi/dσ).(∂L/∂Ui)X -  dXi/dσ . ( ∂L/∂Xi) } = 0
c'est à dire : 
 
Σ(i) {d[ Ui . ( ∂L/∂Ui)X]/dσ }  -  dL/dσ = 0 
et finalement : 
 
d [ Σ(i) {Ui . ( ∂L/∂Ui)X}  -  L ]/dσ = 0   [1_5]
 
La dérivée par rapport à σ ( le long de la courbe optimale donc ) de l'expression Σ(i) {Ui . ( ∂L/∂Ui)X}  -  L  est nulle. Cette expression est la transformée de Legendre de L, et est constante le long de la courbe optimale ( Je reviendrai sur ce point ultérieurement dans le texte ) .
 
2-Quelques considérations sur l'exploitabilité des équations de Lagrange .
 
Revenons aux équations [1_1] et [1_2] ou à la forme équivalente [1_4] . J'appellerai ici courbe "L-optimale" toute courbe qui satisfait les équations de Lagrange .
Hormis dans quelques cas particuliers, les équations sont résolues numériquement, en général . La stratégie la plus naturelle consiste à fixer des conditions initiales ( 2N valeurs pour "X initial" et "U initial" et à lancer un algorithme d'intégration numérique qui "tracera" la courbe . Il existe d'autres stratégies pour construire de telles courbes ( par optimisation par exemple ) mais dans le contexte des raisonnements du texte, je ne me référerai qu'à l'approche par "traçage" à partir des conditions initiales .
 
D'emblée, une question :
Peut-on toujours calculer une courbe L-optimale avec les seules équations [1_1] et [1_2] ( ou la forme équivalente [1_4] ) plus des valeurs initiales de X et U ?
 
Réponse : et ben non, pas toujours . Avec [1_1] et [1_2], les X et U courants sont requis à chaque pas d'intégration, or pour connaître le "nouveau" U, il faut l'extraire des "nouveaux" ( ∂L/∂Ui)X . Pour certains types de lagrangien L, on ne peut pas "remonter" des ∂L/∂Ui)X à U (c.a.d. aux Ui ) : une partie de l'information est perdue . Adopter la formulation [1_4] ne résout rien, bien entendu, car la "matrice" (∂2L/∂Ui∂Uj)X n'est pas inversible dans un tel cas : on ne peut donc en déduire  les (d2Xj/dσ2) au complet et donc impossible de connaître complètement les nouveaux dXj/dσ etc ...
 
Avant d'examiner plus en détail le point évoqué ci-dessus, une petite pause récréative ( et utile ) : 
 
Pause récréative : 
Soit un espace à N dimensions, doté d'un système de coordonnées "par défaut" Ui , et une fonction F dont la forme explicite dans les coordonnées Ui est homogène de degré p en U :
 
F(k . U) = kp . F(U) ; pour tout nombre réel k .     [2_1]

 La fonction dérivée partielle de F par rapport à la iéme variable est également homogène par rapport à U (de degré p-1 ) . On vérifie aisément cette propriété sur des cas simples ( F polynomiale en Ui , par exemple ), mais une telle fonction F homogène n'est pas forcément simple et n'est pas toujours un polynôme . Pour démontrer cette propriété en général il importe de comprendre CLAIREMENT ce que dit [2_1]

Dans les termes de droite et de gauche, la MÊME fonction F est évaluée en deux points distincts, distincts mais pas indépendants : pour chaque "point" U ( variable ) , le "point" k.U, image de U par une homothétie de centre l'origine des U, varie concomitamment à U . Etablir la propriété d'homogénéité pour une fonction dérivée partielle de F vs la ième coordonnée, signifie établir le MÊME genre de propriété géométrique, propriété qui implique les valeurs de cette fonction dérivée en les deux points DISTINCTS U et k.U .
En U, la valeur de la dérivée partielle vs la ième composante est ∂F(U)/∂Ui ; en k.U cette même fonction dérivée partielle vaut : ∂F(k.U)/∂(k.Ui)   ( Ne pas oublier "k" au dénominateur ! ) 
Bon . Par ailleurs, dans [2_1], les deux termes sont deux écritures de la MÊME expression explicite "en U" ( par hypothèse ). Dérivons le tout par rapport à Ui , on obtient :
∂F(k.U)/∂Ui = kp . ∂F(U)/∂Ui
divisant par k :
(1/k) . ∂F(k.U)/∂Ui = kp-1 . ∂F(U)/∂Ui
et donc, puisque k est constant :
∂F(k.U)/∂(k.Ui) = kp-1 . ∂F(U)/∂Ui         [2_2]
qui est bien une relation entre les valeurs de la MÊME fonction dérivée partielle en les deux points DISTINCTS "k.U" et "U" respectivement .
Conclusion : chaque fonction dérivée partielle de F vs une ième composante est homogène de degré p-1 en U .
 
Commentaire : j'ai "mis le paquet" question détails pour cette démonstration car je pense qu'on peut aisément se tromper pour l'expression de la dérivée partielle en différents points de l'espace ....
 
Une autre propriété
Dérivons [2_1] par rapport à k : 
dF(k.U)/dk = p.kp-1. F(U)
en détails : 
Σ(i) [ ∂F(k.U)/∂(k.Ui) ] . [d(k.Ui)/dk] = p.kp-1. F(U)
ou :   Σ(i) ( ∂F(k.U)/∂(k.Ui) ) . Ui = p.kp-1. F(U)
et posant k = 1 : 
Σ(i) ( ∂F(U)/∂Ui ) . Ui = p. F(U)       
 
Autrement dit : si F est homogène d'un certain degré en les coordonnées Ui , la fonction  Σ(i) ( ∂F(U)/∂Ui ) . Ui
est proportionnelle à F . J'utiliserai abondamment cette propriété dans la suite du texte . A noter que cela reste valable pour p = 0 .
 
une (petite) propriété encore : si F est homogène en U de degré 0 : F(k . U) =  F(U) pour tout k non nul, F ne dépend donc pas du module (euclidien) de U et dans un tel cas , il n'est JAMAIS possible d'extraire complètement U de F(U   [2_4].
 
Pour terminer cette pause récréative, considérons le cas F homogène de degré 1 . Alors, ∂F(U)/∂Ui  est homogène de degré 0 d'après [2_2] et on peut en déduire deux choses :
D'abord on ne peut reconstituer complètement les Ui à partir des ∂F(U)/∂Ui ( d'après [2_4] , aucun des  ∂F(U)/∂Ui ne dépend du module de U ) . 
Ensuite, d'après [2_3]   : Σ(i)  ( ∂2F/∂Ui∂Uj ) . Ui = 0     [2_5]
Fin de la pause récréative .
 
Revenons au sujet : 
D'après [2_4], si le lagrangien L est homogène de degré 1 par rapport au Ui, les équations [1_1] et [1_2] ne sont pas exploitables seules . Par ailleurs, d'après [2_5], on a   : Σ(j) (∂2L/∂Ui∂Uj)X . Uj = 0 et donc l'équation [1_4] seule ne détermine pas la composante longitudinale ( ou tangente à la courbe ) de (d2Xj/dσ2) .
 
Est-ce un cas de figure exceptionnel ? 
Non seulement, ce n'est pas exceptionnel, mais c'est assez usuel . Voyons un exemple :
 
Associons à l'espace Ex ( à N dimensions ) une métrique définissant l'élément de "distance" ds :
 
ds2Σ(i,j) aij . dXi . dXj
On se place soit dans le cas d'un tenseur métrique strictement positif, soit au moins dans le cas où les directions concernées des dXi sont telles que l'expression quadratique ci-dessus est positive .
 
Et posons L(X,U) = (  Σ(i,j) aij . Ui . Uj )1/2
Ainsi, L est bien homogène de degré 1 en U .
 
C'est simple en fait : si L(X,U) est homogène de degré 1 en U, le paramétrage σ N'EST PAS contraint par les équations de Lagrange . Pour l'exemple retenu ici, cette particularité peut être "anticipée" dès l'introduction de l'intégrale sur laquelle est appliquée le postulat de stationnarité :
l'élément intégré est (  Σ(i,j) aij . (dXi/dσ).(dXj/dσ) )1/2 .dσ  qui est TOUJOURS égal à ds quelque soit le comportement du paramètre "de service" σ qui n'est contraint par rien . 
 
Bien entendu, on peut exploiter les équations de Lagrange dans un tel cas A CONDITION d'imposer une contrainte au paramétrage σ . Par exemple, en imposant au lagrangien intégré d'être toujours égal à 1 : ainsi, le paramétrage σ laisse la place à la distance "s" définie par la métrique .
 
3-Lagrangien homogène en U, de degré différent de 1 .Considérations sur les conditions initiales .
 Cette partie aura pour but d'établir la propriété suivante : 
Si le lagrangien est homogène en U, de degré différent de 1 , alors la restriction aux coordonnées Xi de la courbe L-optimale NE DEPEND QUE du point initial "Xinit" du calcul et de LA DIRECTION du vecteur U initial ( pas de sa norme ) . Il va de soi que le paramètrage σ "natif" ( c.a.d. donné par la résolution des équations en même temps que les X et U ) dépendra, lui, du choix de la norme du U initial .
 
( Cette partie est en préparation )
 
4- Une propriété des lagrangiens homogènes en U, de degré différent de 1 .
 
Soit L un lagrangien dont la forme explicite dans les coordonnées Xi et Ui est homogène en U de degré p différent de 1 et de zéro .
 
réécrivons ici les équations de Lagrange  [1_1] et [1_2] :
dX/dσ = U                                                                         [1_1]
d[ ( ∂L/∂Ui)X ]/dσ = ( ∂L/∂Xi)  , pour tout i .                    [1_2]
Ces équations, jointes à des valeurs initiales de X et U,  caractérisent complètement une courbe L-optimale ET son paramétrage σ .
La propriété [1_5] nous dit que la quantité  Σ(i) {Ui . ( ∂L/∂Ui)X}  -  L  est constante le long de la courbe L-optimale .
Par ailleurs, d'après [2_3], on a : 
Σ(i) {Ui . ( ∂L/∂Ui)X}  -  L  =  (p-1).L
et p diff de 1 ( par hypothèse ) donc : la valeur de L est constante le long de la courbe optimale . Dans ce paragraphe, je me placerai dans le cas où cette valeur est non nulle ( et positive pour éviter les complications ) .
 
Deux commentaires : L ici est constante le long de la courbe L-optimale et sa valeur ( constante non nulle, donc) sera celle au point initial de la courbe et dépendra donc de la norme du "U" initial ( puisque p est diff de 1 ET de zéro ) .
 Au fait, j'ai exclu ici le cas d'une valeur nulle du lagrangien le long de la courbe L-optimale . Y-a-t il des contextes mathématico-physiques pour lesquels les courbes L-optimales sont caractérisées, entre autres, par une valeur nulle du lagrangien ? Réponse : oui .
 
Supposons que nous avons effectivement calculé une courbe L-optimale "C" à l'aide des équations [1_1] et [1_2] et des conditions initiales Xinit et Uinit ( et σinit = 0 ) .
 
Définissons dans l'espace Exu une fonction Λ comme suit : Λn = L , où n est un nombre rationnel non nul et positif . En explicitant sur les coordonnées X et U : 
L(X,U) = [ Λ(X,U) ]n
Les conditions initiales pour la courbe "C" ainsi que l'équation [1_1] ne sont pas concernées par l'introduction de cette fonction Λ .
 
 Transformons l'écriture de l'équation [1_2] en y faisant apparaître Λ ( et non L ), on obtient : 
 
(n-1) Λn-2 .(dΛ /dσ).( ∂Λ/∂Ui )X +  Λn-1.{ d[ ( ∂Λ/∂Ui )X ]/dσ - ( ∂ Λ/ ∂Xi )U } = 0       [4_1]
 
Discussion :
L'équation [4_1] est simplement la nouvelle écriture de [1_2] lorsqu'on remplace L par Λn . Puisque L est constant ( et > 0 ) le long de la courbe "C" , Λ est lui-même constant ( et > 0 ) le long de cette même courbe et donc dΛ /dσ = 0 : la 1ère  expression du membre de gauche de [4_1] disparaît . Λn-1 n'est jamais nul et on aboutit finalement à :
 
d[ ( ∂Λ/∂Ui )X ]/dσ - ( ∂ Λ/ ∂Xi )U = 0 
c'est à dire : la courbe C est Λ-optimale .
 
Attention : on parvient à cette conclusion à condition que la valeur constante de L le long de la courbe " C"  soit différente de zéro .
 
Un cas particulier intéressant : 
Si L(X,U) =  Σ(i,j) aij . Ui . Uj
et n = 2 , c'est à dire Λ(X,U) = (  Σ(i,j) aij . Ui . Uj )1/2
Les courbes L-optimales ( caractérisées par une valeur strictement positive de L sur la courbe) sont également Λ-optimales
. Et si Σ(i,j) aij . Ui . Uj doit être positif pour que le lagrangien Λ soit défini ( et même strictement positif pour que Λ soit viable car la racine carrée est singulière en zéro ...) , il n'y a pas, par contre, de telles limitations pour le lagrangien L qui n'a pas besoin d'être positif ni n'est affecté de singularités : les courbes L-optimales sont définies de la même façon par les équations de Lagrange, que la valeur ( constante sur chacune ) du lagrangien L soit positive, négative ou nulle n'a pas d'importance .
 
5- Equations des géodésiques   ( un peu sommaire pour le moment ) 
 
Reprenons l'exemple L(X,U) =  Σ(k,l) akl(X). Uk . Ul
 ( "aij" symétrique : aij = aji ) et réécrivons ici l'équation [1_3]
 
Σ(j) (∂2L/∂Ui∂Uj)X . (dUj/dσ) + Σ(j) (∂2L/∂Ui∂Xj) .(dXj/dσ)  -  ( ∂L/∂Xi) = 0  
calculs intermédiaires :
(∂L/∂Ui)X =  2Σ(k) aik . Uk
(∂2L/∂Ui∂Uj)X  = 2aij
(∂2L/∂Ui∂Xj)  =   2Σ(k) (∂aik/Xj). Uk
(∂L/∂Xi)U  =  Σ(k,l) (∂akl/Xi) . Uk . Ul
[1_3] s'écrit donc : 
2Σ(j) aij . (dUj/dσ)   +  2Σ(j,k) (∂aik/Xj).Uk .Uj  -  Σ(k,l) (∂akl/Xi).Uk.Ul = 0
c'est à dire, en renommant quelques indices :
2Σ(j) aij . (dUj/dσ)   +  Σ(k,l) { 2(∂aik/Xl)  -  (∂akl/Xi) } .Uk.Ul = 0    [5_1]
 
ou encore :
2Σ(j) aij . (d2Xj/dσ2)   +  Σ(k,l) { 2(∂aik/Xl)  -  (∂akl/Xi) }(dXk/dσ).(dXl/dσ) = 0    [5_2]
 
Appelons "bij" les coefficients de la matrice inverse de "aij" , on a :
Σ(i)  bim . aij = δjm ( symbole de Kronecker : δjm = 1 si j=m, zéro sinon )
 
et de [5_2], on déduit :
 d2Xm/dσ2  + Σ(i,k,l) bim.{ (∂aik/Xl)  -  (1/2). (∂akl/Xi) } (dXk/dσ).(dXl/dσ)= 0       [5_3]
 
Si  aik est un tenseur métrique, les équations [5_3] caractérisent les géodésiques associées à la métrique .
 
 

6-Transformation de Legendre, hamiltonien et équations de Hamilton .

 
D'après [1_5], l'expression Σ(i) {Ui . ( ∂L/∂Ui)X} -  L  est constante sur chaque courbe L-optimale .
 
Cette expression est une fonction définie à partir de L, des Xi et des U, c'est à dire à partir de 2N+1 autres fonctions définies sur Exu ( chaque coordonnée est une fonction définie sur l'espace, et oui ... ) . 
Techniquement ( et indépendamment du rôle de L ) , je décide de l'appeler "transformée de Legendre de L par rapport aux Ui dans le système de coordonnées Xi, Ui " .  [6_1]
La mention " dans le système de coordonnées Xi, Ui " ne sert qu'à indiquer implicitement que pour chaque dérivée partielle (∂L/∂Ui)X , les quantités constantes sont celles "par défaut ".
 
Par ailleurs, en tenant compte du fait que L joue le rôle d'un lagrangien, on nomme traditionnellement Pi la quantité (∂L/∂Ui)X et on nomme hamiltonien la quantité H = Σ(i) {Ui . ( ∂L/∂Ui)X} -  L .       [6_2]
Tout de suite un cas particulier "singulier" : 
Si L(X,U) est homogène en U de degré 1 , alors Σ(i) {Ui . ( ∂L/∂Ui)X} = L , d'après [2_3] et donc H = 0 dans ce cas .
 
Commentaire : cette conclusion H= 0 signifie que le hamiltonien H est la fonction identiquement nulle dans l'espace Exu et qu'il n' y aura pas de formulation hamiltonienne associée . Rien d'étonnant à cela d'ailleurs lorsqu'on connaît la forme des équations d'Hamilton . Elles sont plus simples que celles de Lagrange et aucune "indétermination" ne peut y être cachée . Or lorsqu'elles existent, elles sont parfaitement équivalentes à celles de Lagrange ... et nous savons que ces dernières souffrent d'indétermination pour un lagrangien homogène de degré 1 en U . Il y aurait contradiction logique si les équations d'Hamilton existaient dans ce cas .
 
Mise sur pied des équations d'Hamilton .
 
Quelques éclaircissements sur les dérivations partielles et leur notation dans les développements qui suivent :
 
L'espace Exu a été jusqu'à présent doté d'un système de coordonnées "natif" Xi, Ui . Ici, j'introduis un autre ensemble de 2N fonctions définies sur l'espace et "candidat" à être un AUTRE système de coordonnées pour le MÊME espace Exu : à savoir les Xi et Pi . Bien entendu les Xi et Pi seront effectivement un système de coordonnées alternatif seulement si les formules de passage existent effectivement . Illustrons cette question :
Si le lagrangien L est homogène en U de degré 1, aucun des (∂L/∂Ui)X ne dépend de la norme (euclidienne) de U, on ne peut donc extraire les Ui au complet des Pi . Pas de formules de passage complètes dans ce cas et les Xi,Pi ne peuvent donc pas être un système de coordonnées alternatif pour l'espace Exu ( et comme on l'a vu, l'hamiltonien H est identiquement nul dans ce cas, donc ça tombe bien ....) .
 Certains des développements qui suivent sont valables même dans ce cas "singulier" , mais pour les dérivations partielles, j'adopte d'emblée des définitions et notations semi-implicites qui sont "familières" dans le cas où les Xi,Ui ET les Xi,Pi sont effectivement DEUX systèmes de coordonnées valides pour l'espace ( Exu). OK ?
En détails :
 
(∂ . /∂Uk)X désigne la dérivation par rapport à Uk aux autres Ui constants et à tous les Xi constants .
(∂ . /∂Pl)X désigne la dérivation par rapport à Pl aux autres Pi constants et à tous les Xi constants .
(∂ . /∂Xl)U désigne la dérivation par rapport à Xl aux autres Xi constants et à tous les Ui constants .
(∂ . /∂Xl)P désigne la dérivation par rapport à Xl aux autres Xi constants et à tous les Pi constants .

Dans l'espace Exu à 2N dimensions, chaque dérivation partielle est définie par une quantité dérivante et 2N-1 quantités constantes . Vu le principe ?

Un développement préalable :

écrivons [6_2] comme suit  : Σ(i) {Ui . ( ∂L/∂Ui)X} = H + L
et appliquons l'opérateur de dérivation (∂ . /∂Uk)X , on obtient : 
 PkΣ(i) { (Pi/∂Uk)X.Ui }  =  (∂H/∂Uk)X  +  (∂L/∂Uk)X
 
or, Pk =  (∂L/∂Uk)X , par définition de Pk ( [6_2] ) . On en déduit donc : 
Σ(i) { (Pi/∂Uk)X.Ui }  =  (∂H/∂Uk)X     [6_3]
 
Ce résultat est valable même dans le cas où L est homogène en U de degré 1 : H identiquement nul dans ce cas et le terme de droite est nul . Le terme de gauche peut s'écrire Σ(i) { (∂2L/∂Ui∂Uk)X.Ui } , nul d'après [2_5] .
 
A présent, plaçons-nous dans le cas idéal où les Xi et Pi sont un système de coordonnées valide conjointement aux Xi, Ui.
L'opérateur de dérivation (∂ . /∂Pl)X peut se décomposer ainsi :
(∂ . /∂Pl)X =  Σ(k) {  (∂Uk/∂Pl)X . (∂ . /∂Uk)X +  (∂ Xk /∂Pl)X . (∂ . /∂Xk)U }
Et puisque  les (∂Xk/∂Pl)X sont nuls par nature, l'identité se ramène à :
(∂ . /∂Pl)X = Σ(k) (∂Uk/∂Pl)X . (∂ . /∂Uk)X       [6_4]
 
De [6_3], on déduit : 
  Σ(k) (∂Uk/∂Pl)X .{Σ(i) { (∂Pi/∂Uk)X.Ui } } = Σ(k) (∂Uk/∂Pl)X . (∂H/∂Uk)X 
c.a.d : Σ(i,k) (∂Uk/∂Pl)X. (∂Pi/∂Uk)X.Ui  = (∂H/∂Pl)X 
et puisque Σ(i,k) (∂Uk/∂Pl)X. (∂Pi/∂Uk) =  δil   ( symbole de Kronecker )
on obtient :   Ul  = (∂H/∂Pl)X      [6_5]
 
Repartons de [6_2]
H + L =  Σ(i) Ui . Pi
d'où :  (∂ H/∂Xl)U +  (∂ L/∂Xl)U =  Σ(i) Ui .(∂Pi/∂Xl)U      [6_6]
utilisons l'identité classique reliant les dérivées versus Xl
respectivement à U et P constants : 
(∂H/∂Xl)U = (∂H/∂Xl)P +  Σ(i) (∂H/∂Pi)X.(∂Pi/∂Xl)U
invoquant [6_5], on déduit : 
(∂H/∂Xl)U = (∂H/∂Xl)P +  Σ(i) Ui.(∂Pi/∂Xl)U       [6_7]
[6_6] et [6_7] nous donnent :
(∂H/∂Xl)P +  Σ(i) Ui.(∂Pi/∂Xl)U  +  (∂L/∂Xl)U =  Σ(i) Ui .(∂Pi/∂Xl)U   
c'est à dire : 
(∂H/∂Xl)P +  (∂L/∂Xl)U = 0      [6_8]
 
Synthèse : [1_1], [1_2], [6_2], [6_5] et [6_8] donnent :
 
 dXi/dσ = (∂H/∂Pi)X             [6_9]
 dPi/dσ =  - (∂H/∂Xi)P          [6_10]
Ce sont les équations d'Hamilton .
 
Quelques définitions peuvent être écrites ou présentées de façon symétrique ( ce qui les rend plus aisément mémorisables, à mon avis ...) :
De façon analogue à Pi = (∂L/∂Ui)X , on a Ui = (∂H/∂Pi)X 
et 
H+L = Σ(i) Pi.Ui = Σ(i) (∂L/∂Ui)X. (∂H/∂Pi)X = Σ(i)  (∂L/∂Ui)X.UΣ(i) (∂H/∂Pi)X.Pi
De façon analogue à [6_1], L est transformée de Legendre de H par rapport aux Pi " dans le système de coordonnées Xi, Pi " ( mention qui sous-entend les quantités constantes par défaut ) .
 
Voyons le cas d'un lagrangien L(X,U) homogène de degré p ( diff de 1 ) en U : d'après [2_3], H = (p-1).L . H et L sont donc deux fonctions proportionnelles , leurs formes explicites dans le MÊME système de coordonnées seront proportionnelles, donc .
Et si p = 2, H et L sont IDENTIQUES : une seule et même fonction définie sur Exu, donc .
Clarifions tout de suite cette question dans un cas intéressant :
soit L = Σ(ij) aij(X) . Ui.Uj /2 homogène de degré 2 en U ( avec aij symétrique ) , donc H = Σ(ij) aij(X) . Ui.Uj /2 également .
 
Cela dit, de même que les coordonnées "naturelles" pour les équations de Lagrange sont les Xi et Ui , les coordonnées "privilégiées" pour les équations d'Hamilton sont les Xi et Pi . "Privilégiées" ne veut pas dire "obligatoires", on peut TOUJOURS expliciter fonctions ou équations dans le système de coordonnées de son choix ( mais les équations d'Hamilton sont plus simples lorsqu'explicitées en "Xi,Pi" ) .
Dans le présent exemple, écrivons avec les conventions matricielles : 
L = H = UT.A.U /2  où A est la matrice symétrique de coefficients aij(X)
alors, P = A.U et U = A-1 . P
et donc L = H = PT.A-1.A . A-1. P /2 = PT.A-1.P /2
Pour résumer, dans le présent exemple, L et H sont une seule et même fonction dont les formes explicites dans les coordonnées Xi,Ui  et  Xi,Pi respectivement seront DIFFERENTES . OK ?
 
Commentaire : J'ai introduit un facteur multiplicatif "1/2" dans la forme explicite de L ( ou H ) dans les coordonnées X,U  afin d'obtenir un similaire coefficient pour sa forme explicite dans les coordonnées X,P , c'est tout . Un souci de "symétrie" si l'on veut . Mais bien sûr, les courbes L-optimales sont toujours les mêmes avec ou sans le "1/2" : L est défini à une constante multiplicative non nulle près . Cela étant dit, le critère retenu pour choisir la norme du vecteur U initial doit éventuellement en tenir compte . Par exemple : si L = UT.A.U ( non nul si U non nul ) et si la norme de U initial est choisie de façon à ce que le L initial soit égal à 1, alors L vaudra 1 le long de la courbe et on obtiendra par intégration numérique un certain paramétrage . pour obtenir le même paramétrage avec L = UT.A.U /2 il faudra choisir la norme du U initial de telle manière que L soit égal à 1/2; ça va de soi, je pense .
 
***************************************************************
Pour être informé des derniers articles, inscrivez vous :
Commenter cet article