Hamiltons virkningsprinsipp

Hamiltons virkningsprinsipp gir en mer generell formulering av de fundamentale lovene i klassisk mekanikk enn den som ble innført av Isaac Newton. Det ble utviklet av den irske fysiker og matematiker William Rowan Hamilton rundt 1840 da han fant en ny definisjon av virkningen til et system basert på dets Lagrange-funksjon. Prinsippet sier at denne virkningen skal være minimal, og det er derfor tett knyttet opp mot variasjonsregning.

Ofte blir det omtalt som prinsippet om minste virkning selv om dette navnet i noen tilfeller kan være misvisende da den klassiske bevegelsen kan tilsvare en maksimal verdi av virkningen. Mer korrekt er å si at virkningen skal ha en ekstremalverdi som kan være et minimum eller et maksimum. Det er ekvivalent med å si at den skal være stasjonær. Prinsippet er en videreføring av Maupertuis' virkningsprinsipp som ble innført hundre år tidligere for mekaniske systemer. Dets store fordel kommer mest tydelig frem i beskrivelsen av kontinuumsmekanikk og i feltteorier.

Euler-Lagrange-ligningene som følger fra Hamiltons prinsipp, er differensialligninger av andre orden med hensyn på tiden. De sier noe om hvordan systemets energi fordeler seg mellom å være kinetisk T og potensiell V energi. Mens den totale energien for systemet er E = T + V, viste Hamilton at differensen L = T - V definerer en ny virkningen for systemets bevegelse. Den avhenger av variable som posisjon og hastighet og er Lagrange-funksjonen for systemet. For hvert tidspunkt t antar denne funksjonen en viss verdi avhengig av hvor systemet befinner seg og hvor raskt det forandrer seg. Beveger systemet seg fra et punkt A til et punkt B, er virkningen for bevegelsen gitt ved integralet

S = A B d t L {\displaystyle S=\int _{A}^{B}\!dt\,L}

Vet man ikke nøyaktig hvordan systemet beveger seg, kan man beregne virkningen for hver tenkelig bevegelse. Av alle slike tenkelige bevegelser, velger så systemet den banen som vanligvis har den minste virkningen. Alltid skal virkningen ha en ekstremalverdi for den klassiske bevegelsen. Dette uttrykkes matematisk ved at variasjonen

δ S = 0 {\displaystyle \delta S=0}

Dermed er virkningen S stasjonær for små variasjoner rundt denne banen.

En dypere forståelse av dette virkningsprinsippet i klassisk fysikk kom først med formuleringen til Richard Feynman av kvantemekanikken. Denne er basert på veiintegral som er bygd opp av virkningene for hver tenkelig bevegelse. Hva som er alternative, matematiske bevegelser i den klassiske beskrivelsen går over til å bli virkelige, fysiske bevegelser i den kvantemekaniske beskrivelsen.

Hamilton viste også at Euler-Lagrange-ligningene kan erstattes med det dobbelte antall første ordens differensialligninger. Disse er basert på Hamilton-funksjonen som er definert ved H = T + V. Dette er energien for systemet slik at H også kan kalles for energifunksjonen. Denne formuleringen av klassisk mekanikk kalles Hamilton-mekanikk og danner grunnlaget for kvantemekanikken. Sammen med den ekvivalente Lagrange-mekanikken inngår Hamilton-mekanikken i det som vanligvis omtales som analytisk mekanikk.

Lagrange-mekanikk har en stor fordel fremfor Hamilton-mekanikk. Det er at den automatisk kan formuleres i overensstemmelse med Einsteins relativitetsteori og derfor også kan beskrive relativistiske systemer. Den kan også brukes til beskrivelse av kontinuerlige systemer hvor Lagrange-funksjonen er gitt som et volumintegral over en Lagrange-tetthet. Moderne kvantefeltteorier formuleres alle på denne måten.

Euler-Lagrange-likningen

En liten variasjon δq av koordinaten q(t) tas med konstant tid t.

I det enkleste tilfellet kan det mekaniske systemet vi betrakter, beskrives ved bare en koordinat q = q(t). Det kan for eksempel være en partikkel med masse m hvor q angir dens posisjon. Den kinetiske energien er da

T = 1 2 m q ˙ 2 , {\displaystyle T={1 \over 2}m{\dot {q}}^{2},}

hvor q ˙ {\displaystyle {\dot {q}}} = dq/dt, mens den potensielle energien er gitt ved en funksjon V = V(q). Man kan også tenke seg at dette potensialet varierer med tiden slik at man mer generelt har at V = V(q,t). Lagrange-funksjonen for systemet er nå

L = T V = L ( q , q ˙ , t ) {\displaystyle L=T-V=L(q,{\dot {q}},t)}

For mer kompliserte situasjoner er det ikke mulig å splitte Lagrange-funksjonen slik opp i en kinetisk og en potensiell del. Hvordan Lagrange-funksjonen da ser ut, kan bli en mer vanskelig oppgave å finne ut av.[1]

For å beregne bevegelsen fra et punkt A = (tA , qA) til et punkt B = (tB , qB) fra Hamiltons virkningsprinsipp må man bestemme en stasjonær verdi for virkningen

S [ q ] = t A t B d t L ( q , q ˙ , t ) {\displaystyle S[q]=\int _{t_{A}}^{t_{B}}\!dtL(q,{\dot {q}},t)}

Integralet er en funksjon av funksjonen q(t) og er derfor en funksjonal som angis ved firkantparentesen S[q].

Det gjøres systematisk ved variasjonsregning hvor man betrakter en liten variasjonen q(t) → q(t) + δq av banen som vist i figuren. Variasjonen av virkningen blir dermed

δ S = t A t B d t [ L q δ q + L q ˙ δ q ˙ ] {\displaystyle \delta S=\int _{t_{A}}^{t_{B}}\!dt{\Big [}{\partial L \over \partial q}\delta q+{\partial L \over \partial {\dot {q}}}\delta {\dot {q}}{\Big ]}}

når man ser bort fra høyere ordens ledd. I siste ledd i integranden kan man nå foreta en partiell integrasjon som gir

δ S = t A t B d t [ L q d d t L q ˙ ] δ q + | L q ˙ δ q | A B {\displaystyle \delta S=\int _{t_{A}}^{t_{B}}\!dt{\Big [}{\partial L \over \partial q}-{d \over dt}{\partial L \over \partial {\dot {q}}}{\Big ]}\delta q+{\Big |}{\partial L \over \partial {\dot {q}}}\delta q{\Big |}_{A}^{B}}

Da alle baner skal gå gjennom endepunktene A og B, må variasjonen δq oppfylle kravene δq(tA) = δq(tB) = 0. Randleddet forsvinner derfor, og firkantparentesen i det første integralet må være null for at δS = 0. Dette gir Euler-Lagrange-ligningen

L q d d t L q ˙ = 0 {\displaystyle {\partial L \over \partial q}-{d \over dt}{\partial L \over \partial {\dot {q}}}=0}

Den er den samme for alle systemer. Men Lagrange-funksjonen L vil være forskjellig fra system til system.[2]

Hvis Lagrange-funksjonen får et ekstra tillegg L → L + dG/dt som er en totalderivert med hensyn på tiden, vil det gi opphav til et ekstra bidrag

δ S = | G ( q , t ) q δ q | A B {\displaystyle \delta S={\Big |}{\partial G(q,t) \over \partial q}\delta q{\Big |}_{A}^{B}}

til variasjonen av virkningen. Men dette er null da variasjonene δq(tA) og δq(tB) begge er null i randpunktene. Euler-Lagrange-ligningen forblir derfor uforandret. Legg merke til at dette holder kun når funksjonen G(q,t) er uavhengig av den tidsderiverte av q(t).

Bevegelseskonstanter

Et generelt system er beskrevet ved N generelle koordinater q = (q1, q2, ... , qN). Disse behøver ikke å være komponenter av forskjellige posisjonsvektorer, men kan for eksempel oppstå ved bruk av ikke-kartesiske koordinatsystem. Begynnelsespunkt A og sluttpunkt B for bevegelsen er da begge angitt ved N slike koordinater. Virkningen må nå være stasjonær under variasjon q n(t)q n(t) + δq n(t) av alle disse koordinatene. Dermed får man en Euler-Lagrange-ligning for hver slik dynamisk variabel,

L q n d d t L q ˙ n = 0 {\displaystyle {\partial L \over \partial q_{n}}-{d \over dt}{\partial L \over \partial {\dot {q}}_{n}}=0}

Det siste leddet i denne ligningen inneholder den tidsderiverte av hva som kalles den konjugerte impuls p n til koordinaten q n, det vil si at

p n = L q ˙ n {\displaystyle p_{n}={\partial L \over \partial {\dot {q}}_{n}}}

Hvis Lagrange-funksjonen av en eller annen grunn ikke inneholder en koordinat q k slik at ∂ L/∂ qk = 0, så betyr det at dpk/dt = 0. Den tilhørende, konjugerte impuls er derfor uavhengig av tiden og dermed er

p k = k o n s t {\displaystyle p_{k}=konst}

en bevegelseskonstant. Den tilsvarende variabel sies å være syklisk. Det kan i prinsippet være flere av dem, og de kan være til stor hjelp ved løsningen av Euler-Lagrange-ligningene for de andre koordinatene.

Fra den generelle variasjonsregningen vet man også at når tiden t ikke eksplisitt opptrer i Lagrange-funksjonen, vil størrelsen

H = n p n q ˙ n L {\displaystyle H=\sum _{n}p_{n}{\dot {q}}_{n}-L}

være en bevegelseskonstant. Derfor er H = E en konstant når ∂ L/∂ t = 0. Denne bevegelseskonstanten er ikke noe annet enn energien for systemet. Uttrykker vi hastigheten q ˙ n {\displaystyle {\dot {q}}_{n}} ved den tilsvarende, konjugerte impulsen p n, blir da H = H(q,p) Hamilton-funksjonen for systemet.[1]

Virkningsfunksjonen

Euler-Lagrange-ligningen for en ikke-relativistisk partikkel med masse m som beveger seg fritt i en dimensjon, er q ¨ = 0 {\displaystyle {\ddot {q}}=0} . Ligningen sier altså at den har konstant hastighet. Beveger den seg fra punkt A til B, er denne q ˙ c l {\displaystyle {\dot {q}}_{cl}} = (qB - qA)/(tB - tA). Dette er hastigheten partikkelen har i klassisk mekanikk i motsetning til i kvantemekanikken. Man sier at det er dens klassiske hastighet. Virkningen for den klassiske bevegelsen er derfor

S c l ( q B , t B ; q A , t A ) = 1 2 m q ˙ c l 2 ( t B t A ) = m ( q B q A ) 2 2 ( t B t A ) {\displaystyle S_{cl}(q_{B},t_{B};q_{A},t_{A})={1 \over 2}m{\dot {q}}_{cl}^{2}(t_{B}-t_{A})={m(q_{B}-q_{A})^{2} \over 2(t_{B}-t_{A})}}

Normalt er den en funksjon av tre variable ta de to tidspunktene vil opptre sammen i differensen tB - tA . Hamilton kalte denne klassiske virkningen for den prinsipale funksjonen.[3]

Denne funksjonen har to interessante og viktige egenskaper. Tar man den deriverte med hensyn på en av koordinatene, finner man impulsen til partikkelen på samme sted,

S c l q B = m q ˙ c l {\displaystyle {\partial S_{cl} \over \partial q_{B}}=m{\dot {q}}_{cl}}

Den deriverte med hensyn på tiden gir tilsvarende

S c l t B = m 2 ( q B q A ) 2 ( t B t A ) 2 = 1 2 m q ˙ c l 2 {\displaystyle {\partial S_{cl} \over \partial t_{B}}=-{m \over 2}{(q_{B}-q_{A})^{2} \over (t_{B}-t_{A})^{2}}=-{1 \over 2}m{\dot {q}}_{cl}^{2}}

som er energien til partikkelen, med motsatt fortegn. Selv om dette eksempelet er så enkelt at det ikke en gang er noen forskjell mellom Lagrange- og Hamilton-funksjonene, er de to resultatene for de deriverte av den klassiske virkningen eksempler på mer generelt gyldige egenskaper ved virkningsfunksjonen.

For å vise det, kan man betrakte to nærliggende klassiske baner q(t) og q'(t) = q(t) + δq(t) som begge starter i punktet A, men med litt forskjellig endepunkt B.

Hvis bevegelsene langs de to banene tar samme tid, men ankommer på litt forskjellig steder separert med δqB, vil de dermed ha litt forskjellig virkning

δ S c l = t A t B d t [ L q d d t L q ˙ ] δ q + L q ˙ δ q | B {\displaystyle \delta S_{cl}=\int _{t_{A}}^{t_{B}}\!dt{\Big [}{\partial L \over \partial q}-{d \over dt}{\partial L \over \partial {\dot {q}}}{\Big ]}\delta q+{\partial L \over \partial {\dot {q}}}\delta q{\Big |}_{B}}

som utledes direkte som ved variasjonsregningen over. Det første leddet er null da begge banene er klassiske og oppfyller Euler-Lagrange-ligningen. I det siste leddet er den partiellderiverte gitt ved impulsen pB i sluttpunktet B. Resultatet δScl = pB δqB betyr at

S c l q B = p B {\displaystyle {\partial S_{cl} \over \partial q_{B}}=p_{B}}

Denne utledningen kan lett utvides til å gi et tilsvarende resultat for begynnelsepunktet A .

Alternativt kan man tenke seg at de to klassiske banene har samme endepunkt pB , men at q'(t) ankommer dette punktet δtB senere sammenlignet med q(t). Forskjellen i virkning δScl for disse to bevegelsene får da et bidrag før tiden tB av samme type pB δqB som beregnet over da de to banene ved dette tidspunktet ennå ikke er i samme punkt. For den korte tiden δtB etterpå oppstår ganske enkelt bidraget LB δtB. Her er LB verdien av Lagrange-funksjonen i sluttpunktet B. Tilsammen er dermed

δ S c l = p B δ q B + L B δ t B {\displaystyle \delta S_{cl}=p_{B}\delta q_{B}+L_{B}\delta t_{B}}

I første leddet kan man skrive δqB = - q ˙ B {\displaystyle {\dot {q}}_{B}} δtB. Derfor er

S c l t B = H B {\displaystyle {\partial S_{cl} \over \partial t_{B}}=-H_{B}}

da man finner kombinasjonen av variable pB q ˙ B {\displaystyle {\dot {q}}_{B}} - LB = HB som er Hamilton-funksjonen i sluttpunktet B.

Disse to generelle resultatene for de deriverte av virkningsfunksjonen spiller en sentral rolle i Hamiltons alternative formulering av Lagrange-mekanikken som naturligvis kalles Hamilton-mekanikk.

Ikke-relativistisk partikkel

La oss betrakte en ikke-relativistisk partikkel med masse m som beveger seg i tre dimensjoner hvor dens posisjon i et kartesisk koordinatsystem er angitt ved posisjonsvektoren r. Den påvirkes av et ytre potensial slik at den har en potensiell energi gitt ved en funksjon V = V(r). Partikkelens bevegelse kan nå beregnes fra Lagrange-funksjonen

L = 1 2 m r ˙ 2 V ( r ) {\displaystyle L={1 \over 2}m{\dot {\mathbf {r} }}^{2}-V(\mathbf {r} )}

Den har en kanonisk impuls

p = L r ˙ = m r ˙ {\displaystyle \mathbf {p} ={\partial L \over \partial {\dot {\mathbf {r} }}}=m{\dot {\mathbf {r} }}}

slik at Euler-Lagrange-ligningen blir

d p d t = V ( r ) {\displaystyle {d\mathbf {p} \over dt}=-{\boldsymbol {\nabla }}V(\mathbf {r} )}

Dette er ikke noe annet enn Newtons andre lov da F = - V er kraften som virker på partikkelen.

Potensialet V er antatt å være uavhengig av tiden. Derfor er partikkelens energi

H = p r ˙ L = 1 2 m r ˙ 2 + V ( r ) {\displaystyle H=\mathbf {p} \cdot {\dot {\mathbf {r} }}-L={1 \over 2}m{\dot {\mathbf {r} }}^{2}+V(\mathbf {r} )}

konstant, H = E. Uttrykt ved impulsen p er dette Hamilton-funksjonen for dette systemet,

H ( r , p ) = p 2 2 m + V ( r ) {\displaystyle H(\mathbf {r} ,\mathbf {p} )={\mathbf {p} ^{2} \over 2m}+V(\mathbf {r} )}

I kvantemekanikken danner denne grunnlaget for å skrive ned den tilsvarende Schrödinger-ligningen for partikkelens bevegelse.

Mer interessant er dette systemet når den potensielle energien V  ikke avhenger av retningen til posisjonsvektoren r, men bare av dens lengde r = |r|. Da er V = V(r), og systemet er symmetrisk under rotasjoner. De tilsvarende rotasjonsvinklene er derfor sykliske variable som gir opphav til at den konjugerte dreieimpulsen L = r × p er konstant. En annen måte å forstå det på er at i dette tilfellet peker kraften F = -V på partikkelen i radiell retning slik at dreiemomentet r × F på den er null og lar derfor dreieimpulsen forbli konstant. Dette kan generaliseres til å gjelde for lignende situasjoner i andre system og går under navnet Noethers teorem.

Relativistisk partikkel

Fra den spesielle relativitetsteorien følger at Lagrange-funksjonen for en fri, relativistisk partikkel med masse m er

L = m c 2 1 v 2 / c 2 {\displaystyle L=-mc^{2}{\sqrt {1-\mathbf {v} ^{2}/c^{2}}}}

hvor c er lyshastigheten og v = dr/dt er partikkelens hastighet. Man kan nå beregne dens konjugerte impuls,

p = L v = m v 1 v 2 / c 2 {\displaystyle \mathbf {p} ={\partial L \over \partial \mathbf {v} }={m\mathbf {v} \over {\sqrt {1-\mathbf {v} ^{2}/c^{2}}}}}

Kun i den ikke-relativistiske grensen v << c stemmer dette med det valige resulatet p = mv fra newtonsk mekanikk.[4]

Energien til partikkelen følger nå fra

E = p v L = m v 2 1 v 2 / c 2 + m c 2 1 v 2 / c 2 = m c 2 1 v 2 / c 2 {\displaystyle E=\mathbf {p} \cdot \mathbf {v} -L={m\mathbf {v} ^{2} \over {\sqrt {1-\mathbf {v} ^{2}/c^{2}}}}+mc^{2}{\sqrt {1-\mathbf {v} ^{2}/c^{2}}}={mc^{2} \over {\sqrt {1-\mathbf {v} ^{2}/c^{2}}}}}

Ekspanderer man kvadratroten her i den ikke-relativistiske grensen v << c, finner man at

E = m c 2 1 v 2 / c 2 = m c 2 + 1 2 m v 2 + 3 m 8 c 2 ( v v ) 2 + {\displaystyle E={mc^{2} \over {\sqrt {1-\mathbf {v} ^{2}/c^{2}}}}=mc^{2}+{1 \over 2}m\mathbf {v} ^{2}+{3m \over 8c^{2}}(\mathbf {v} \cdot \mathbf {v} )^{2}+\cdots }

Det første leddet tilsvarer partikkels hvileenergi E0 = mc2, mens andre leddet er den vanlige, kinetiske energien som brukes i ikke-relativistisk mekanikk. De høyere leddene blir viktige når partikkelens hastighet blir stor som man for eksempel har for elektronene i atomet.

Fra disse resultatene ser man at energi E og impuls p er forbundet ved relasjonen

E 2 = p 2 c 2 + m 2 c 4 {\displaystyle E^{2}=p^{2}c^{2}+m^{2}c^{4}}

i relativistisk mekanikk. Den kommer naturlig frem i den kovariante beskrivelsen av 4-dimensjonal tidrom.

Partikkel i elektromagnetiske felt

En partikkel med ladningen q påvirkes av elektriske og magnetiske krefter som er konsekvens av det elektriske Φ = Φ(r,t) og det magnetiske potensialet A = A(r,t). Disse varierer i alminnelighet med tiden t og posisjonen r til partikkelen.[5] Har partikkelen massen m og beveger seg ikke-relativistisk, er den fra klassisk elektrodynamikk beskrevet ved Lagrange-funksjonen

L = 1 2 m v 2 q Φ ( r , t ) + q v A ( r , t ) {\displaystyle L={1 \over 2}m\mathbf {v} ^{2}-q\Phi (\mathbf {r} ,t)+q\mathbf {v} \cdot \mathbf {A} (\mathbf {r} ,t)}

hvor v = dr/dt er dens hastighet. Lagrange-funksjonen er invariant under elektromagnetiske gaugetransformasjoner. Impulsen til partikkelen er dermed

p = L v = m v + q A {\displaystyle \mathbf {p} ={\partial L \over \partial \mathbf {v} }=m\mathbf {v} +q\mathbf {A} }

Det eksisterer ikke lenger en direkte sammenheng mellom partikkelens impuls og dens hastighet. Dette kommer klarest til uttrykk når den resulterende bevegelsen blir beskrevet i kvantemekanikken.[6]

I Euler-Lagrange-ligningen dp/dt = ∂L/∂ r behøver man nå

d p d t = m d v d t + q d A d t = m d v d t + q ( A t + ( v ) A ) {\displaystyle {d\mathbf {p} \over dt}=m{d\mathbf {v} \over dt}+q{d\mathbf {A} \over dt}=m{d\mathbf {v} \over dt}+q\left({\partial \mathbf {A} \over \partial t}+(\mathbf {v} \cdot {\boldsymbol {\nabla }})\mathbf {A} \right)}

og

L r = q Φ + q ( v A ) {\displaystyle {\partial L \over \partial \mathbf {r} }=-q{\boldsymbol {\nabla }}\Phi +q{\boldsymbol {\nabla }}(\mathbf {v} \cdot \mathbf {A} )}

Euler-Lagrange-funksjonen blir dermed

m d v d t = q ( Φ A t ) + q ( ( v A ) ( v ) A ) {\displaystyle m{d\mathbf {v} \over dt}=q{\Big (}-{\boldsymbol {\nabla }}\Phi -{\partial \mathbf {A} \over \partial t}{\Big )}+q{\Big (}{\boldsymbol {\nabla }}(\mathbf {v} \cdot \mathbf {A} )-(\mathbf {v} \cdot {\boldsymbol {\nabla }})\mathbf {A} {\Big )}}

I det siste kan man nå bruke det vektorielle trippelproduktet

v × ( × A ) = ( v A ) ( v ) A {\displaystyle \mathbf {v} \times ({\boldsymbol {\nabla }}\times \mathbf {A} )={\boldsymbol {\nabla }}(\mathbf {v} \cdot \mathbf {A} )-(\mathbf {v} \cdot {\boldsymbol {\nabla }})\mathbf {A} }

til å skrive bevegelsesligningen på den enklere formen

m d v d t = q ( E + v × B ) {\displaystyle m{d\mathbf {v} \over dt}=q(\mathbf {E} +\mathbf {v} \times \mathbf {B} )}

når man innfører det elektriske feltet

E = Φ A t {\displaystyle \mathbf {E} =-{\boldsymbol {\nabla }}\Phi -{\partial \mathbf {A} \over \partial t}}

og det magnetiske feltet

B = × A {\displaystyle \mathbf {B} ={\boldsymbol {\nabla }}\times \mathbf {A} }

Den totale kraften på høyresiden av denne bevegelsesligningen er Lorentz-kraften.[7]

Hamilton-funksjonen for partikkelen følger nå fra

H = p v L = 1 2 m ( p q A ) 2 + q Φ {\displaystyle H=\mathbf {p} \cdot \mathbf {v} -L={1 \over 2m}{\Big (}\mathbf {p} -q\mathbf {A} {\Big )}^{2}+q\Phi }

og danner grunnlaget for beskrivelsen av hvordan atomer vekselvirker med elektromagnetiske felt og absorpsjon/emisjon av lys.

Kontinuerlig system

La oss betrakte en lang kjede av massepunkt m fordelt langs x-aksen fra x = - L/2 til x = L/2 i avstand a fra hverandre. Med elastiske fjærer er hvert massepunkt knyttet til sine to nabopunkt. Alle fjærer er antatt å ha samme fjærkonstant k. Massepunktene er nummererte fra origo x = 0 hvor massepunkt med n = 0 er plassert. Massepunkt nummer n er i posisjon xn = na når det er i ro. Indeksen n kan anta både positive og negative verdier.

Disse massepunktene kommer nå i bevegelse langs x-aksen. Dette kan for eksempel skje ved at punkt nummer n kommer ut av sin likevektsposisjon med et utslag Qn. Alle punktene kommer da i bevegelse med den kinetiske energien

T = m 2 n Q ˙ n 2 {\displaystyle T={m \over 2}\sum _{n}{\dot {Q}}_{n}^{2}}

og den potensielle energien

V = k 2 n ( Q n + 1 Q n ) 2 {\displaystyle V={k \over 2}\sum _{n}(Q_{n+1}-Q_{n})^{2}}

Dermed blir Lagrange-funksjonen for denne svingende kjeden

L = 1 2 n [ m Q ˙ 2 k ( Q n + 1 Q n ) 2 ] {\displaystyle L={1 \over 2}\sum _{n}[m{\dot {Q}}^{2}-k(Q_{n+1}-Q_{n})^{2}]}

Bevegelsen til hvert massepunkt kan nå finnes ved å løse de resulterende Euler-Lagrange-ligningene.

I stedet skal vi betrakte grensen hvor massepunktene ligger veldig tett. Matematisk tilsvarer det at avstanden a → 0 slik at massepunktene danner en kontinuerlig kjede hvor hver del kan bevege seg litt langs x-aksen. Skrives Lagrange-funksjonen om på formen

L = 1 2 n a [ m a Q ˙ 2 k a ( Q n + 1 Q n a ) 2 ] , {\displaystyle L={1 \over 2}\sum _{n}a\left[{m \over a}{\dot {Q}}^{2}-ka{\Big (}{Q_{n+1}-Q_{n} \over a}{\Big )}^{2}\right],}

kan man da innføre massetettheten ρ = m/a og elastisitetsmodulen E = ka. I denne grensen blir utslaget Qn(t) en funksjon Q(t,xn) → Q(t,x) slik at

Q ˙ n Q t {\displaystyle {\dot {Q}}_{n}\rightarrow {\partial Q \over \partial t}}

og differensen

Q n + 1 Q n a Q x {\displaystyle {Q_{n+1}-Q_{n} \over a}\rightarrow {\partial Q \over \partial x}}

I stedet for en sum kan da Lagrange-funksjonen skrives som et integral

L = L / 2 L / 2 d x L ( Q / t , Q / x ) {\displaystyle L=\int _{-L/2}^{L/2}\!dx{\mathcal {L}}(\partial Q/\partial t,\partial Q/\partial x)}

hvor Lagrange-tettheten for den kontinuerlige kjeden nå kan skrives som

L = ρ 2 ( Q t ) 2 E 2 ( Q x ) 2 {\displaystyle {\mathcal {L}}={\rho \over 2}\left({\partial Q \over \partial t}\right)^{2}-{E \over 2}\left({\partial Q \over \partial x}\right)^{2}}

Den totale virkningen over et tidsintervall fra tA = - T/2 til tB = T/2 er gitt ved integralet

S [ Q ] = T / 2 T / 2 d t L / 2 L / 2 d x L ( Q , t , Q , x ) {\displaystyle S[Q]=\int _{-T/2}^{T/2}\!dt\!\int _{-L/2}^{L/2}\!dx{\mathcal {L}}(Q,_{t},Q,_{x})}

hvor den tidsderiverte er skrevet som Q,t = ∂Q/∂ t og den romlige deriverte som Q,x = ∂Q/∂ x. Under variasjonen QQ + δQ forandres dermed virkningen med

δ S = T / 2 T / 2 d t L / 2 L / 2 d x [ L Q , t δ Q , t + L Q , x δ Q , x ] {\displaystyle \delta S=\int _{-T/2}^{T/2}\!dt\!\int _{-L/2}^{L/2}\!dx\left[{\partial {\mathcal {L}} \over \partial Q,_{t}}\delta Q,_{t}+{\partial {\mathcal {L}} \over \partial Q,_{x}}\delta Q,_{x}\right]}

Nå er igjen δQ,t = ∂δQ/∂ t og δQ,x = ∂δQ/∂ x slik at man kan foreta partielle integrasjoner i t- og x-retning. Da variasjonen δQ skal være null ved alle integrasjonsgrenser, forsvinner randleddene fra integrasjonene. På samme måte som for tilfellet med en partikkel, må den gjenværende integranden være null og man står igjen med Euler-Lagrange-ligningen

t L Q , t + x L Q , x = 0 {\displaystyle {\partial \over \partial t}{\partial {\mathcal {L}} \over \partial Q,_{t}}+{\partial \over \partial x}{\partial {\mathcal {L}} \over \partial Q,_{x}}=0}

Setter man inn her for Lagrange-tettheten til den svingende kjeden, finner man lett

ρ 2 Q t 2 E 2 Q x 2 = 0 {\displaystyle \rho {\partial ^{2}Q \over \partial t^{2}}-E{\partial ^{2}Q \over \partial x^{2}}=0}

Dette er bølgeligningen i en dimensjon for en bølge hvor

v = E ρ {\displaystyle v={\sqrt {E \over \rho }}}

er hastigheten som utslagene eller svingningene til kjeden brer seg utover med langs x-aksen.

Kontinuerlig felt i tre dimensjoner

Dette resultatet kan lett utvides til å gjelde for et kontinuerlig medium i tre romlige dimensjoner hvor utslaget i hvert punkt x er funksjonen Q = Q(t,x). Dette er et skalart felt med Lagrange-tettheten

L = ρ 2 ( Q t ) 2 E 2 ( Q ) 2 {\displaystyle {\mathcal {L}}={\rho \over 2}\left({\partial Q \over \partial t}\right)^{2}-{E \over 2}({\boldsymbol {\nabla }}Q)^{2}}

Et eksempel på et slikt system er lydfeltet i luft eller et fast materiale. Beregningen av den tilsvarende Euler-Lagrange-ligningen foregår på samme måte.[3]

For å være litt mer generell kan man betrakte en virkning

S [ Q ] = d t d 3 x L ( Q , Q / t , Q / r ) {\displaystyle S[Q]=\int \!dt\!\int \!d^{3}x{\mathcal {L}}(Q,\partial Q/\partial t,\partial Q/\partial \mathbf {r} )}

Fra variasjonen QQ + δQ kommer man da frem til den generelle Euler-Lagrange-ligningen

L Q t L Q , t x j L Q , j = 0 {\displaystyle {\partial {\mathcal {L}} \over \partial Q}-{\partial \over \partial t}{\partial {\mathcal {L}} \over \partial Q,_{t}}-{\partial \over \partial x_{j}}{\partial {\mathcal {L}} \over \partial Q,_{j}}=0}

for et skalart felt. Her i siste ledd er Q,j = ∂ Q/∂ xj og man summerer over de tre romlige retningene med koordinater xj = (x,y,z). Dette er et eksempel på bruk av Einsteins summekonvensjon. Fra Lagrange-tettheten for lydfeltet finner man ∂ L / {\displaystyle {\mathcal {L}}/} Q,j = - E Q,j slik at (∂/∂xj )(∂ L {\displaystyle {\mathcal {L}}} /∂Q,j) = - E ∇2Φ. Dermed resulterer Euler-Lagrange-ligningen i

ρ 2 Q t 2 E 2 Q = 0 {\displaystyle \rho {\partial ^{2}Q \over \partial t^{2}}-E\nabla ^{2}Q=0}

som er den skalare bølgeligningen i tre dimensjoner

Klein-Gordon-feltet

I kvantefeltteori er partikler med masse m og uten spinn kvantene til et skalart felt Φ = Φ(t,x) beskrevet ved Lagrange-tettheten

L = 2 2 c 2 ( Φ t ) 2 1 2 2 ( Φ ) 2 1 2 m 2 c 2 Φ 2 {\displaystyle {\mathcal {L}}={\hbar ^{2} \over 2c^{2}}\left({\partial \Phi \over \partial t}\right)^{2}-{1 \over 2}\hbar ^{2}({\boldsymbol {\nabla }}\Phi )^{2}-{1 \over 2}m^{2}c^{2}\Phi ^{2}}

hvor c er lyshastigheten og {\displaystyle \hbar } er Planck-Dirac-konstanten. Innsatt i den generelle tre-dimensjonale Euler-Lagrange-ligningen, gir denne nå bølgeligningen

1 c 2 2 Φ t 2 2 Φ + ( m c ) 2 Φ = 0 {\displaystyle {1 \over c^{2}}{\partial ^{2}\Phi \over \partial t^{2}}-\nabla ^{2}\Phi +{\Big (}{mc \over \hbar }{\Big )}^{2}\Phi =0}

Denne kalles vanligvis for Klein-Gordon-ligningen og gjelder blant annet for Higgs-partikkelen. Størrelsen / m c {\displaystyle \hbar /mc} som opptrer her, er Compton-bølgelengden for partikkelen med masse m.[8]

Elektromagnetiske felt

Bevegelsesligningene for det elektromagnetiske feltet er Maxwells ligninger. Disse må kunne utledes fra en Lagrange-funksjon som man a priori ikke kjenner til. De fundamentale feltene må være det elektriske potensialet Φ = Φ(r,t) og det magnetiske vektorpotensial A = A(r,t) som bestemmer både det elektriske feltet

E = Φ A t {\displaystyle \mathbf {E} =-{\boldsymbol {\nabla }}\Phi -{\partial \mathbf {A} \over \partial t}}

og det magnetiske feltet

B = × A {\displaystyle \mathbf {B} ={\boldsymbol {\nabla }}\times \mathbf {A} }

Denne siste ligningen ble innført for å oppfylle B = 0 som er Maxwells 2. ligning. Tilsvarende inneholder uttykket for det elektriske feltet Maxwells 3. ligning. Det ser man ved å ta curl av begge sider av ligningen. Det gir

× E = B t {\displaystyle {\boldsymbol {\nabla }}\times \mathbf {E} =-{\partial \mathbf {B} \over \partial t}}

Her har vi først benyttet at curl av en gradient er null, altså at ∇×∇ = 0 slik at det elektriske potensialet ikke bidrar. I leddet med det magnetiske potensialet har vi byttet om de to derivasjonene, det vil si skrevet at ×(∂A/∂t) = (∂/∂t)(×A) og brukt uttrykket for magnetfeltet. De to resterende Maxwell-ligninger er derfor Euler-Lagrange-ligninger som kan finnes fra variasjoner av den elektromagnetiske virkningen.[3]

Utledning

Virkningen er gitt ved integralet av Lagrange-tettheten till feltet. Den må inneholde den elektriske energitettheten

u E = ε 0 2 E 2 {\displaystyle u_{E}={\varepsilon _{0} \over 2}\mathbf {E} ^{2}}

hvor ε0 er dielektrisitetskonstanten i vakuum. Likedan må den inneholde den magnetiske energitettheten

u B = 1 2 μ 0 B 2 {\displaystyle u_{B}={1 \over 2\mu _{0}}\mathbf {B} ^{2}}

hvor μ0 er permeabilitetskonstanten for vakuum. Da den elektriske delen inneholder tidsderiverte av vektorpotensialet, mens den magnetiske ikke inneholder slike variable, er det naturlig å anta at den elektriske energitettheten uE gir den kinetiske energien til Lagrange-tettheten. Den magnetiske energitettheten uB kan sies å beskrive den potensielle energien til feltene.

I tillegg må man ta med leddene som beskriver koblingen til elektrisk ladete partikler. De beskrives ved en ladningstetthet ρ = ρ(r,t) og en tilsvarende J = J(r,t). Den første gir et elektrisk bidrag ρΦ til energien, mens strømtettheten bidrar -JA som finnes fra den magnetiske vekselvirkningen. Begge bidragene kan utledes fra kravet om gaugeinvarians og bidrar med motsatte fortegn i Lagrange-tettheten. Denne tar dermed formen

L = ε 0 2 E 2 1 2 μ 0 B 2 ρ Φ + J A {\displaystyle {\mathcal {L}}={\varepsilon _{0} \over 2}\mathbf {E} ^{2}-{1 \over 2\mu _{0}}\mathbf {B} ^{2}-\rho \Phi +\mathbf {J} \cdot \mathbf {A} }

og vil gi de resterende Maxwell-ligningene. Det følger fra å gjøre først vi en variasjon av det skalare potensialet Φ. Det gir

L Φ = ρ {\displaystyle {\partial {\mathcal {L}} \over \partial \Phi }=-\rho }

Lagrange-tettheten inneholder ingen tidsderiverte av dette potensialet, men derimot de romlige deriverte Φ,j i den elektriske delen. Den bidrar med

L Φ , i = ε 0 E i {\displaystyle {\partial {\mathcal {L}} \over \partial \Phi ,_{i}}=-\varepsilon _{0}E_{i}}

slik at

x i L Φ , i = ε 0 i E i = ε 0 E {\displaystyle {\partial \over \partial x_{i}}{\partial {\mathcal {L}} \over \partial \Phi ,_{i}}=-\varepsilon _{0}\partial _{i}E_{i}=-\varepsilon _{0}{\boldsymbol {\nabla }}\cdot \mathbf {E} }

hvor man igjen bruker Einsteins summekonvensjon og summerer over de to like indeksene i. Kombineres disse to delresultatene, finner man

D = ρ {\displaystyle {\boldsymbol {\nabla }}\cdot \mathbf {D} =\rho }

som er Maxwells 1. ligning uttrykt ved forskyvningsfeltet D = ε0E.

Variasjon av vektorpotensialet gir ligninger som er litt mer komplisert å utlede. Enklest å beregne er

L A i = J i {\displaystyle {\partial {\mathcal {L}} \over \partial A_{i}}=J_{i}}

Likedan finner man lett fra den elektriske delen i Lagrange-tettheten at de tidsderiverte komponentene Ai ,t gir

L A i , t = ϵ 0 E i {\displaystyle {\partial {\mathcal {L}} \over \partial A_{i,t}}=-\epsilon _{0}E_{i}}

Den magnetiske delen av Lagrange-tettheten inneholder de romlige deriverte Ai ,j. Fra den får man

L A i , j = 1 μ 0 B k B k A i , j {\displaystyle {\partial {\mathcal {L}} \over \partial A_{i,j}}=-{1 \over \mu _{0}}B_{k}{\partial B_{k} \over \partial A_{i,j}}}

når man benytter Einsteins summekonvensjon igjen og summerer over de to like indeksene k. Den deriverte av den magnetiske komponenten Bk finnes nå enklest ved å benytte formalismen med Levi-Civita-symbolet εi j k slik at man kan skrive curl på formen

B k = ( × A ) k = ε k j i j A i = ε k j i A i , j {\displaystyle B_{k}=({\boldsymbol {\nabla }}\times \mathbf {A} )_{k}=\varepsilon _{kji}\partial _{j}A_{i}=\varepsilon _{kji}A_{i,j}}

Dermed er ∂ Bk/∂ Ai ,j = εk j i slik at man har

L A i , j = 1 μ 0 ε k j i B k {\displaystyle {\partial {\mathcal {L}} \over \partial A_{i,j}}=-{1 \over \mu _{0}}\varepsilon _{kji}B_{k}}

Euler-Lagrange-ligningen for denne romlige komponenten Ai  blir derfor

J i = ϵ 0 E i t 1 μ 0 ε k j i B k x j {\displaystyle J_{i}=-\epsilon _{0}{\partial E_{i} \over \partial t}-{1 \over \mu _{0}}\varepsilon _{kji}{\partial B_{k} \over \partial x_{j}}}

Det siste leddet her er i-te komponent av curl til det magnetiske feltet H = B/μ0 med et minus fortegn. Resultatet av beregningen blir dermed på vektorform

× H = J + D t {\displaystyle {\boldsymbol {\nabla }}\times \mathbf {H} =\mathbf {J} +{\partial \mathbf {D} \over \partial t}}

som er Maxwells 4. ligning.

Se også

Referanser

  1. ^ a b H. Goldstine: A History of the Calculus of Variations from the 17th through the 19th Century, Springer, New York (1980). ISBN 1-4613-8106-8.
  2. ^ L. N. Hand and J. D. Finch, Analytical Mechanics, Cambridge University Press, England (1998). ISBN 0-5215-7572-9
  3. ^ a b c H. Goldstein, Classical Mechanics, Addidon-Wesley Publishing Company, Reading, Massachusetts (1959).
  4. ^ L.D. Landau and E.M. Lifshitz, Merchanics, Pergamon Press, London (1959).
  5. ^ J. D. Jackson, Classical Electrodynamics, John Wiley & Sons, New York (1998). ISBN 0-4713-0932-X.
  6. ^ R.P. Feynman, The Schrödinger Equation in a Classical Context: A Seminar on Superconductivity, The Feynman Lectures on Physics, Volume III, Chapter 21.
  7. ^ L.D. Landau and E.M. Lifshitz, Classical Theory of Fields, Pergamon Press, London (1959).
  8. ^ J.J. Sakurai, Advanced Quantum Mechanics, Addison-Wesley Publishing Company, Reading, Massachusetts (1967).

Litteratur

  • A. Sommerfeld, Vorlesungen über Theoretische Physik, Band I: Mechanik, Akademische Verlagsgellschaft, Leipzig (1964).
Oppslagsverk/autoritetsdata
Encyclopædia Britannica · NKC