Kapitel 5
Ungelöste Rätsel

4   Quantenfeldtheorie und Eichfelder

4   Die kanonische Quantisierung des freien elektromagnetischen Feldes

4.1   Die Maxwellgleichungen

Das letzte Kapitel hat uns zwei Möglichkeiten gezeigt, wie man zu einer vorgegebenen klassischen Theorie eine Quantentheorie konstruieren kann, die im klassischen Grenzfall in die klassische Theorie übergeht. Die klassische Theorie wird dabei über ein Wirkungsfunktional und das Prinzip der kleinsten Wirkung formuliert.

Die erste Möglichkeit zur Quantisierung trägt den Namen kanonische Quantisierung. Dazu wird zunächst die klassische Theorie umformuliert: Ausgehend von der Lagrangefunktion im Wirkungsfunktional der klassischen Theorie werden mit Hilfe der Legendre-Transformation sogenannte kanonisch konjugierte Variablen und eine Hamiltonfunktion im Phasenraum definiert. Die Bewegungsgleichungen können dann mit Hilfe der Poissonklammer auf dem Phasenraum formuliert werden. In der zugehörigen Quantentheorie werden die Operatoren analog zu den klassischen Phasenraum-Funktionen aufgestellt. Die Poissonklammern werden durch Kommutatoren mit Vorfaktor ersetzt und definieren so die zeitliche Dynamik der Quantentheorie. Aus der Hamiltonfunktion wird dabei der Hamiltonoperator, der die zeitliche Dynamik bestimmt.

Die zweite Möglichkeit stammt von Richard Feynman und wird als Pfadintegralmethode bezeichnet. Hier formuliert man die zeitliche Dynamik der Quantentheorie über Propagatoren. Der Propagator wird nun als Pfadintegral formuliert, d.h. es wird ein Integral über alle Möglichkeiten aufgestellt, die zu der Propagation (z.B. der Teilchenbewegung) beitragen können. Die komplexe Phase jeder dieser Möglichkeiten ist dabei bestimmt durch das Wirkungsfunktional dieser Möglichkeit, dividiert durch das Plancksche Wirkungsquantum. Bei sehr großen Wirkungen tragen daher nur noch die Möglichkeiten in der Nähe der klassischen Lösung konstruktiv zum Pfadintegral bei, d.h. die Möglichkeiten mit ungefähr minimaler Wirkung. Auf diese Weise wird der Übergang zum klassischen Grenzfall besonders schön sichtbar. Wir werden uns die Pfadintegralmethode allerdings erst im nächsten Kapitel ansehen.

Wir haben beide Methoden im Rahmen der klassischen nichtrelativistischen Mechanik eines Teilchens kennengelernt. Die zugehörige Quantentheorie wird als nichtrelativistische Quantenmechanik (eines Teilchens) bezeichnet. Nun wollen wir einen Schritt weiter in Richtung Eichtheorie gehen und versuchen, die einfachste Eichtheorie zu quantisieren: die relativistische Elektrodynamik ohne elektrische Ladungen, also die Beschreibung freier elektromagnetischer Felder (z.B. elektromagnetische Wellen) im Rahmen der speziellen Relativitätstheorie. Die entsprechende Quantentheorie wird als Quantenelektrodynamik (ohne geladene Teilchen) bezeichnet. Dabei wollen wir die elektrischen Ladungen so spät wie möglich weglassen -- zunächst werden wir also die volle klassische Elektrodynamik inclusive Ladungen betrachten.


Die Elektrodynamik ist die Theorie der elektrischen und magnetischen Kräfte, Ladungen und Felder. Die Bewegungsgleichungen dieser Theorie sind die Maxwell-Gleichungen.



James Clerk Maxwell (1831 - 1879), Quelle: Wikipedia

Diese Gleichungen beschreiben vollständig die physikalischen Gesetze der elektrischen und magnetischen Kräfte, indem sie den Begriff des elektrischen und magnetischen Feldes verwenden. Dabei zeigt sich, dass elektrische und magnetische Kräfte bei einem Bezugssystemwechsel ineinander übergehen, und dass dabei die Postulate der speziellen Relativitätstheorie erfüllt sind. Man kann elektrische und magnetische Felder nur gemeinsam beschreiben und spricht daher auch allgemeiner von der elektromagnetischen Wechselwirkung.

Im Einzelnen sagen die Maxwellgleichungen Folgendes (siehe z.B. Das Unteilbare, Kap.2.4 Kräfte und Wechselwirkungen ):

  1. Definition des elektrischen und des magnetischen Feldes:
    Das elektrische Feld E wird durch seine Kraftwirkung F auf eine punktförmige elektrische Probeladungen Q definiert, die sich am Ort x befindet:   F(x) = Q · E(x)  . Ebenso wird ein Magnetfeld B(x) durch seine Kraftwirkung F(x) auf eine punktförmige elektrische Probeladungen Q am Ort x definiert (die genaue mathematische Definition lautet:   F = Q · v/c × B   mit der Geschwindigkeit v der Probeladung; dabei sind F, v und B dreidimensionale Vektoren und × bezeichnet das dreidimensionale Vektorprodukt). Zusammen haben wir also für die Gesamtkraft auf eine Probeladung Q im elektromagnetischen Feld:

    F   =   Q · (E + v/c × B)

    (c ist wie immer die Lichtgeschwindigkeit; die Division durch c bewirkt, dass das magnetische Feld dieselbe physikalische Dimension wie das elektrische Feld hat).

  2. Ladungen erzeugen elektrische Felder:
    Eine punktförmige Ladung q erzeugt am Ort x ein elektrisches Feld   E = k q er / r2  . Dieses Feld ist radial von der Ladung weg orientiert (Coulomb-Gesetz), d.h.   er = r / |r|   und r ist der Vektor von der Ladung q zum Raumpunkt x, für den das elektrische Feld angegeben wird.
    Dazu gleichwertig ist die folgende Formulierung (Gauss-Gesetz): Der Fluss des elektrischen Feldes durch eine geschlossene Oberfläche ist proportional der von dieser Fläche umschlossenen elektrischen Ladung.
    Wiederum gleichwertig dazu: Die Divergenz des elektrischen Feldes E ist proportional zur Ladungsdichte ρ (gemessen in Ladungseinheiten pro Volumeneinheit), d.h. die Ladungsdichte wirkt als Quelle des Feldes:

    div E   =   ρ

    (wir verwenden Heaviside-Maßeinheiten, d.h. die Konstante k im Coulomb-Gesetz oben ist gleich 1/(4π) -- in diesen Einheiten lassen sich die Maxwellgleichungen besonders einfach formulieren) .

  3. Es gibt keine magnetischen Ladungen:
    Es gibt keine magnetischen Ladungen (Monopole), d.h. es gibt beispielsweise keinen Punkt, von dem aus die magnetischen Feldlinien alle radial nach außen zeigen.
    Man kann auch sagen: Der Fluss des magnetischen Feldes durch eine geschlossene Oberfläche ist Null (es fließt genausoviel hinein wie hinaus).
    Oder alternativ: Die Divergenz des magnetischen Feldes ist Null (es gibt keine Quellen):

    div B   =   0

  4. Faradaysches Induktionsgesetz:
    Ein sich verstärkendes oder abschwächendes Magnetfeld erzeugt ein elektrisches Feld, dessen Richtung senkrecht zum Magnetfeld orientiert ist. Je schneller die zeitliche Veränderung des Magnetfeldes ist, umso stärker ist das dadurch erzeugte elektrische Feld.
    Oder genauer: Ein sich verändernder magnetischer Fluss durch eine umrandete Fläche erzeugt ein elektrisches Feld entlang des Randes der Fläche. Dazu gleichwertig ist die folgende differentielle Gleichung:

    rot E   =   − dB/(c dt)

  5. elektrische Ströme und veränderliche elektrische Felder erzeugen Magnetfelder:
    Ein stromdurchflossener Leiter (genauer: die sich darin bewegenden elektrischen Ladungen) erzeugt ein magnetisches Feld, das den Leiter ringförmig umschließt und dessen Stärke proportional zur Stromstärke ist. Ebenso erzeugt ein sich verstärkendes oder abschwächendes elektrisches Feld ein Magnetfeld, dessen Richtung senkrecht zum elektrischen Feld orientiert ist. Je schneller die zeitliche Veränderung des elektrischen Feldes ist, umso stärker ist das dadurch erzeugte Magnetfeld.
    Hier die präzise Formulierung: Ein sich verändernder elektrischer Fluss durch eine umrandete Fläche sowie ein Strom j elektrischer Ladungen durch diese Fläche erzeugen ein magnetisches Feld entlang des Randes der Fläche. Dazu gleichwertig ist die folgende differentielle Gleichung:

    rot B   =   j/c + dE/(c dt)

    Die Stromdichte j bezeichnet den Durchfluss elektrischer Ladung pro Zeiteinheit pro Flächeneinheit.

Aus den obigen Gleichungen folgt, dass elektrische Ladung nicht erzeugt oder vernichtet werden kann. Die Veränderung elektrischer Ladung in einem Volumen entspricht dem Durchfluss von Ladung durch die Oberfläche des Volumens. Dies wird durch die folgende differentielle Gleichung ausgedrückt, die man auch als Gleichung der Stromerhaltung bezeichnet:

dρ/dt   =   − div j

Zu den Maxwellgleichungen kommt noch das Newtonsche Bewegungsgesetz hinzu, das in seiner nichtrelativistischen Form F = m a (Kraft = Masse mal Beschleunigung) lautet (siehe letztes Kapitel). Verwendet man dieses Gesetz in dieser Form, so stellt man allerdings fest, dass sein Transformationsverhalten nicht zum Transformationsverhalten der elektrischen und magnetischen Felder passt -- gleichförmig bewegte Bezugssysteme wären nicht mehr gleichwertig zueinander. Das ganze System wird aber wieder konsistent, wenn man die Masse m durch das Produkt   m γ   mit   γ = 1/Ö[(1-(v/c)2)]   ersetzt (siehe Kapitel 5.4.2) und γ ebenfalls nach der Zeit ableitet. Dabei ist c wie immer die Lichtgeschwindigkeit. Das korrekte Bewegungsgesetz lautet also:

F   =   d/dt (m γ v)

wie Albert Einstein im Jahr 1905 herausfand. Für Geschwindigkeiten deutlich unterhalb der Lichtgeschwindigkeit wird dabei γ nahezu gleich 1, so dass sich im nichtrelativistischen Grenzfall wieder Newtons ursprüngliches Bewegungsgesetz ergibt.


4.2   Relativistische Formulierung Maxwellgleichungen

Man kann die obigen Gleichungen in eine sehr viel übersichtlichere Form bringen, indem man analog zum Vierervektor   x = (ct, x)   auch elektrische und magnetische Felder sowie Ladungsdichte und Stromdichte in vierkomponentigen Vektoren bzw. in vier-mal-vierkomponentigen Matrizen (genauer: Tensoren) unterbringt.

Beginnen wir mit den Quellen der elektrischen und magnetischen Felder: der Ladungsdichte ρ(t,x) und der Stromdichte j(t,x) . Wir fassen diese Felder zu einem vierkomponentigen Vektor j(x) zusammen mit   x = (ct, x)  :

j(x)   =   (cρ(t,x) , j(t,x))

oder in Kurzform   j = (cρ, j)   . Die Komponenten dieses Vektors bezeichnen wir wie üblich mit jμ, wobei μ die Werte 0, 1, 2 und 3 annimmt (der Index wird hier oben geschrieben; zur Bedeutung der Indexstellung und dem Hoch- und Herunterziehen von Indices möchte ich auf Die Symmetrie der Naturgesetze, Kapitel 3.1 Die Poincare-Gruppe verweisen, in dem diese Methode im Detail erklärt wird). Es ist also j0 = cρ .

Wie verändert sich nun der Vektor j(x), wenn wir eine Poincaretransformation durchführen? Dabei wollen wir eine aktive Interpretation wählen, d.h. wir nehmen beispielsweise eine Ladungs- und Stromdichteverteilung j(x) und verfrachten diese komplett in ein gleichmäßig dahingleitendes Raumschiff. Wie geht die mit dem Raumschiff dahingleitende neue Ladungs- und Stromdichteverteilung j'(x) aus der alten Verteilung j(x) hervor?

An dieser Stelle muss man physikalisch-anschaulich argumentieren und sich j(x) beispielsweise als Wolke geladener Teilchen vorstellen, die sich auch bewegen dürfen. Außerdem muss man sicherstellen, dass auch im fahrenden Zug Ladung nicht erzeugt oder vernichtet werden kann (auch dies ist eine physikalische Forderung), d.h. dρ'/dt   =   − div j' muss gelten. Als Konsequenz dieser Überlegungen findet man folgendes aktives Transformationsgesetz für die Viererstromdichte j(x) bei einer Poincaretransformation   x' = Λ x + a   :

j'(x)   =   Λ j (Λ-1(x-a))

Man kann sich dieses Transformationsverhalten beipielsweise an den Spezialfällen Drehung und Boost (Geschwindigkeitstransformation) veranschaulichen. Dieses Transformationsverhalten ist der Grund dafür, warum in den Komponenten von jμ der Index oben geschrieben wird -- damit kennzeichnet man gleichsam durch die Indexstellung das Transformationsverhalten des Vierervektors. Man sagt auch, der Vektor transformiert sich kovariant.

Wie sieht es mit der Ladungserhaltung   dρ/dt = − div j   aus? Dazu schreiben wir diese Gleichung etwas um, indem wir die Ableitungen nach Zeit und Raum ebenfalls zu einem vierkomponentigen Vektor zusammenfassen (die Komponenten des Vierervektors   x = (ct, x)   bezeichnen wir dabei mit   xμ   mit μ = 0, 1, 2 oder 3 und   x0 = ct ):   δμ := d/dxμ   , also   δ0 = d/(c dt)   und   δk := d/dxk   mit k = 1, 2 oder 3. Damit haben wir die Gleichung

δμ jμ(x)   =   0

wobei wir die Einsteinsche Summenkonvention verwenden, die besagt, dass über doppelt vorkommende Indices summiert wird. Die obige Gleichung bedeutet also   dj0/(c dt) + dj1/dx1 + dj2/dx2 + dj3/dx3 = 0   und ist damit gerade unsere Gleichung der Ladungserhaltung. Man kann nun relativ leicht nachrechnen, dass aus   δμ jμ(x) = 0   und der Transformationsgleichung   j'(x) = Λ j (Λ-1(x-a))   auch   δμ j'μ(x) = 0   folgt, d.h. auch im dahingleitenden Raumschiff können keine Ladungen erzeugt oder vernichtet werden.


Wie sieht es nun mit den beiden Maxwellgleichungen aus, die elektrisches und magnetisches Feld in Beziehung mit Ladungsdichte und Stromdichte setzen (man spricht von den inhomogenen Maxwellgleichungen)? Es geht also um die Gleichungen   div E = ρ   und   rot B = j/c + dE/(c dt)  . Um diese Gleichungen geeignet umzuschreiben, definieren wir die vier-mal-vier-komponentige Matrix


(Fμν)   =   æ
ç
è
0
E
E
  B
ö
÷
ø

Dabei ist E der dreikomponentige elektrische Feldvektor und B ist eine 3-mal-3-komponentige schiefsymmetrische Matrix, die die Komponenten des magnetischen Feldes B enthält, so dass   ∑k=13   δk Bkj   =   (rot B)j   ist. Die inhomogenen Maxwellgleichungen können wir damit so schreiben:

δμ Fμν   =   jν / c

(wieder mit der Einsteinschen Summenkonvention zu lesen, also Summe über den Index μ).

Analog kann man auch die beiden homogenen Maxwellgleichungen   div B = 0   und   rot E = − dB/(c dt)   , die nicht von Ladungs- und Stromdichten abhängen, umschreiben. Dazu definiert man die vier-mal-vier-komponentige Matrix   (*Fμν)   einfach dadurch, dass man E und B in   (Fμν)   vertauscht. Für Mathematiker: der Stern * deutet an, dass man den Wechsel von F zu *F über den sogenannten Hodge-Sternoperator * erhalten kann, wenn man mit sogenannten 2-Differentialformen arbeitet. Analog dazu kann man auch das sogenannte antisymmetrische Levi-Civita-Symbol verwenden. Auf Details wollen wir hier verzichten.

Die homogenen Maxwellgleichungen können wir nun in der folgenden Form schreiben:

δμ *Fμν   =   0

Wie transformieren sich nun die elektrischen und magnetischen Felder, wenn man die Ladungs-Stromverteilung in ein dahingleitendes Raumschiff verfrachtet?

Die obigen Gleichungen sowie das Transformationsverhalten der Viererstromdichte j ergeben das folgende Transformationsverhalten, wobei wir die Matrixkomponenten der Lorentzmatrix Λ als Λμν schreiben und wieder die Einsteinsche Summenkonvention verwenden:

(F')μν(x)   =   Λμρ Λνσ Fρσ-1(x-a))
(*F')μν(x)   =   Λμρ Λνσ *Fρσ-1(x-a))

Dieses Transformationsverhalten ist letztlich die Rechtfertigung dafür, die Indices oben zu schreiben. Um nicht immer alle Indices ausschreiben zu müssen, wollen wir für die beiden Gleichungen die folgende Kurzschreibweise einführen:

F'(x)   =   (Λ × Λ) F-1(x-a))
*F'(x)   =   (Λ × Λ) *F-1(x-a))

Nun wirken umgekehrt die Felder auch auf die Ladungen und Ströme zurück -- dies hatten wir durch Newtons Bewegungsgleichung oben ausgedrückt. Wir wollen an dieser Stelle nun eine Vereinfachung machen, indem wir die Ladungsdichte und Stromdichte als fest von außen vorgegeben betrachten. Man könnte beispielsweise an eine stromdurchflossene Spule oder eine fix im Raum verankerte Ladungsverteilung denken. Später wollen wir ja sowieso den Spezialfall betrachten, dass es überhaupt keine Ladungen und Ströme gibt, denn wir interessieren uns zunächst nur für eine Quantentheorie des freien elektromagnetischen Feldes.


4.3   Ableitung der Maxwellgleichungen aus dem Prinzip der kleinsten Wirkung

Um zu einer Quantentheorie zu gelangen, müssen wir nun versuchen, die Maxwellgleichungen aus einem Variationsprinzip abzuleiten. Wir brauchen also geeignete dynamische Variablen und ein geeignetes Wirkungsfunktional. Das Wort dynamische Variablen bedeutet dabei, dass wir n Funktionen der Zeit suchen und ihre Zeitabhängigkeit aus dem Wirkungsprinzip ableiten wollen. Jede dieser n Funktionen bezeichnen wir dabei als einen Freiheitsgrad der Theorie. Dabei kann n (die Zahl der Freiheitsgrade) auch unendlich groß werden.

Es ist naheliegend, das elektrische und magnetische Feld als dynamische Variablen der Theorie zu verwenden, denn genau diese Felder möchte man ja also Lösung der Maxwellgleichungen bei gegebenen Ladungs- und Stromdichten ausrechnen. So wie man in der klassischen Mechanik nach der Bahnkurve x(t) eines Teilchens gefragt hatte, so fragt man nun nach den Funktionen E(t,x) und B(t,x) .

Wie sieht es mit der Zahl der Freiheitsgrade aus?

In der klassischen Mechanik eines Teilchens im dreidimensionalen Raum hatten wir es mit drei Freiheitsgraden zu tun, nämlich mit den drei Komponenten der Funktion x(t) . Im Fall der elektromagnetischen Felder haben wir es jedoch mit unendlich vielen Freiheitsgraden zu tun, nämlich an jedem Raumpunkt x mit den zeitabhängigen Funktionen E(t,x) und B(t,x) . Der Ort x wirkt dabei wie ein kontinuierlicher Index. Das wird besonders deutlich, wenn man den Raum diskretisiert (also mit einem feinen Gitter überzieht) und nur die Felder an den Gitterpunkten betrachtet. Die dynamischen Variablen sind dann die zeitabhängigen Werte der Felder an diesen Gitterpunkten.

Schauen wir uns noch einmal die Lagrangefunktion der klassischen Mechanik eines Teilchens an, wobei wir als Beispiel das Potential des harmonischen Oszillators verwenden wollen (die Kraft ist also proportional zum Abstand vom Ursprung):   L(x, v) = m v2/2 − b x2  . Die Skalarprodukte der dreidimensionalen Vektoren bewirken, dass über alle drei Freiheitsgrade  xk(t)   und deren zeitlicher Ableitung summiert wird. Ähnlich ist es bei mehreren Teilchen: In den Geschwindigkeiten wird über alle Freiheitsgrade summiert, und das Potential verkoppelt verschiedene Freiheitsgrade miteinander, wenn die Teilchen Kräfte aufeinander ausüben.

Analog wollen wir auch eine Lagrangefunktion für die elektromagnetischen Felder formulieren. Es soll über alle Freiheitsgrade summiert werden, und es sollen Freiheitsgrade miteinander verkoppelt werden.

Gehen wir dazu wieder davon aus, dass wir den Raum mit einem feinen Gitter überziehen und die Felder an den Gitterpunkten als dynamischen Variablen ansehen, deren Zeitabhängigkeit wir bestimmen wollen. Nun wird die Summe über alle Gitterpunkte immer mehr Summanden enthalten, je feiner wir das Gitter machen. Um dies zu kompensieren, so dass die Summe bei feiner werdendem Gitter einem sinnvollen Grenzwert zustrebt, wollen wir in der Summe die Summanden mit dem Raumvolumen (Δx)3 einer Gitterzelle multiplizieren und sie so mit dem Gitterzellenvolumen gewichten. Nun können wir den Grenzwert bis zu unendlich kleinen Gitterzellen in der Summe über alle Raumpunkte ausführen und erhalten ein Integral über den dreidimensionalen Raum.

Was aber ist mit dem Verkoppeln von Freiheitsgraden durch das Potential? Auch hier wollen wir eine Vereinfachung machen: Wir fordern, dass nur die Felder unmittelbar benachbarter Raumpunkte miteinander verkoppelt werden. Genauer meinen wir damit, dass in der Summe keine Terme wie beispielsweise das Skalarprodukt   E(xi) E(xj) mit nicht benachbarten Gitterpunkten xi und xj auftreten. Wenn benachbarte Gitterpunkte (nennen wir sie xk und xk+1) miteinander verkoppelt werden, so soll dies in einer Weise geschehen, die einen sinnvollen Grenzwert für ein unendlich feines Gitter ergibt. Das ist für Terme der Form   (Ei(xk+1) − Ei(xk)) / |xk+1 - xk|   der Fall, die im Grenzwert gegen eine Richtungsableitung der Feldkomponente Ei gehen.

Man bezeichnet diese Forderungen als Lokalitätsforderung. In Theorien, die diese Forderung nicht erfüllen, treten schwerwiegende Probleme auf, beispielsweise in Bezug auf die Kausalität der Theorie. Dies kann man leicht einsehen, denn wenn sich die Felder entfernter Raumpunkte direkt gegenseitig beeinflussen könnten, so wäre sicher die Übertragung von Informationen mit Überlichtgeschwindigkeit kaum zu vermeiden, im Widerspruch zu den Forderungen der speziellen Relativitätstheorie.

Die Lokalitätsforderung bewirkt, dass die Summe über alle Raumgitterpunkte in ein einfaches Integral über den gesamten Raum übergeht (es gibt also keine mehrfachen Integrale wie z.B.   ∫ d3x ∫ d3x' ...   ). Die Lagrangefunktion kann also als Integral über den gesamten Raum geschrieben werden, wobei wir die Funktion, über die integriert wird, als Lagrangedichte bezeichnen. Wir wollen im Folgenden die Lagrangedichte mit L und die Lagrangefunktion mit Lf bezeichnen.

Die Lagrangedichte kann aufgrund der Lokalitätsforderung nur von den Feldwerten am Ort x und deren ersten Ableitungen nach den drei Raumkoordinaten sowie nach der Zeitkoordinate abhängen. Die Ableitungen nach der Zeitkoordinate entsprechen den Geschwindigkeiten in der klassischen Mechanik, und die Ableitungen nach den Raumkoordinaten spiegeln die Verkoppelung unmittelbar benachbarter Gitterpunkte wieder. In der klassischen Mechanik wäre dies analog zu einer großen Ansammlung von Teilchen, bei denen sich nur benachbarte Teilchen über das Wechselwirkungspotential zwischen ihnen gegenseitig beeinflussen können.

Um im Folgenden nicht ständig die Felder E und B einzeln schreiben zu müssen, wollen wir allgemeiner von Feldkomponenten   Φk(ct,x)   sprechen und alle (sagen wir n) Feldkomponenten zu einem Vektor   Φ := (Φ1, Φ2, ... , Φn)   zusammenfassen (also ist k irgendein Index von 1 bis n). Analog fassen wir für alle Indexkombinationen von μ und k die Komponenten δμ Φk zu einem Vektor δ Φ zusammen. Die Lagrangefunktion Lf kann also geschrieben werden als

Lf [Φ(ct, . ), δ0Φ(ct, . )]   =   ∫ d3x   L( Φ(ct,x) , (δ Φ(ct,x)) )

Wir nehmen dabei an, dass die Felder und ihre ersten Ableitungen im Unendlichen so schnell verschwinden, dass das Raumintegral konvergiert. Die Schreibweise   Lf [Φ(ct, . ), δ0Φ(ct, . )]   bedeutet, dass Lf von einem unendlich-dimensionalen Vektor Φ(ct, . ) und dessen zeitlicher Ableitung abhängt, wobei dieser Vektor Φ(ct, . ) aus allen Feldkomponenten an allen Raumpunkten zusammengesetzt ist (man stelle sich z.B. wieder das Gitternetz im Raum vor). Die Lagrangefunktion ist also eigentlich keine Funktion mehr, sondern ein Funktional, das der Funktion Φ(ct, . ) und deren zeitlicher Ableitung eine reelle Zahl zuordnet. Die Funktion Φ(ct, . ) ist dabei zu lesen als eine Funktion, die von einem Parameter t abhängt und die dem Raumpunkt x die reelle Zahl Φ(ct,x) zuordnet. Man hätte auch Φt statt Φ(ct, . ) schreiben können, um das deutlich zu machen.

Wir sehen hier eine allgemeine Vorgehensweise, die darin begründet ist, dass wir von endlich vielen Freiheitsgraden zu unendlich vielen Freiheitsgraden übergegangen sind:

In der nichtrelativistischen Mechanik war nun das Wirkungsfunktional als ein Integral der Lagrangefunktion über ein Zeitintervall von t1 bis t2 gegeben, wobei die Werte der dynamischen Variablen an diesen Zeitpunkten fest vorgegeben waren. Im Fall der Felder werden wir dieses Zeitintervall unendlich ausdehnen und dabei verlangen, dass die Variation der Felder   dΦk/dε   (genaue Bedeutung kommt gleich ... ) für unendlich ferne Zeiten und unendlich ferne Raumpunkte hinreichend schnell gegen Null geht (was das genau heisst, sehen wir etwas weiter unten). Das Integral über die Zeit und das Integral über den dreidimensionalen Raum können wir schließlich noch als Integral über die vierdimensionale Raumzeit schreiben, d.h. wir integrieren über den Raum der Vektoren x = (ct, x). Insgesamt können wir also das Wirkungsfunktional schreiben als

S[Φ]   =   ∫ dt   Lf [Φ(ct, . ), δ0Φ(ct, . )]   =   ∫ d4x   L( Φ(x) , (δ Φ(x)) )

Wie sehen die entsprechenden Euler-Lagrange-Gleichungen aus?

Dazu machen wir analog zur klassischen Mechanik den Ansatz   Φk(x) = Φk,0(x) + ε ηk(x)   wobei Φk,0(x) die gesuchten Felder sind und ε ηk(x) die Abweichung von diesen gesuchten Feldern darstellt. Wir suchen nun das Minimum von S[Φ] über die Bedingung

d/dε S[(Φk,0 + ε ηk)] |ε = 0   =   0

(später werden wir sehen, dass dies gerade die Funktionalableitung ergibt). Analog zur klassischen Mechanik folgt:

d/dε S[Φ]   =   d/dε ∫ d4x   L( Φ(x) , (δ Φ(x)) )   =  

... wir ziehen d/dε unter das Zeitintegral:

  =   ∫ d4x   d/dε   L( Φ(x) , (δ Φ(x)) )   =  

... wir führen d/dε mit Hilfe der Kettenregel aus (für die Indices k und μ gilt wieder die Einsteinsche Summenkonvention, d.h. es wird über doppelt vorkommende Indices summiert):

  =   ∫ d4x     (dL/dΦk   dΦk/dε   +   dL/d(δμ Φk)   d(δμ Φk)/dε)   =  

... wir verwenden   d(δμ Φk)/dε   =   δμ   dΦk/dε :

  =   ∫ d4x     (dL/dΦk   dΦk/dε   +   dL/d(δμ Φk)   δμ   dΦk/dε)   =  

... im zweiten Term verwenden wir, dass nach der Produktregel
δμ [ dL/d(δμ Φk)   dΦk/dε ]   =   [δμ dL/d(δμ Φk)]   dΦk/dε   +   dL/d(δμ Φk)   δμk/dε
ist, so dass wir den zweiten Term schreiben können als
dL/d(δμ Φk)   δμk/dε   =   δμ [dL/d(δμ Φk)   dΦk/dε]   −   [δμ dL/d(δμ Φk)]   dΦk/dε
also:

  =   ∫ d4x     { dL/dΦk   dΦk/dε   +   δμ [dL/d(δμ Φk)   dΦk/dε]   −   [δμ dL/d(δμ Φk)]   dΦk/dε }   =  

... Der zweite Term liefert das Integral einer Divergenz. Dies ist nach dem Gauss'schen Satz gleich dem Integral der Funktion
  dL/d(δμ Φk)   dΦk/dε  
über den unendlich fernen Rand des vierdimensionalen Raums. Wir haben oben gefordert, dass für unendlich ferne Zeiten und unendlich ferne Raumpunkte die Variation dΦk/dε der Felder hinreichend schnell verschwindet. Dies können wir nun präzisieren: die Variation soll so schnell gegen Null gehen, dass das obige Integral des zweiten Terms gleich Null ist. Also:

  =   ∫ d4x     { dL/dΦk   dΦk/dε   −   [δμ dL/d(δμ Φk)]   dΦk/dε }   =  

  =   ∫ d4x     { dL/dΦk     −   [δμ dL/d(δμ Φk)] }   dΦk/dε }

Dieser Ausdruck soll nach dem Prinzip der kleinsten Wirkung für die Lösungen der klassischen Feldgleichung gleich Null sein, und zwar für beliebige Variationen dΦk/dε . Das geht nur, wenn der Term in der geschweiften Klammer gleich Null ist:


dL
k
  −   δμ   dL
d(δμ Φk)
  =   0

Auch diese Gleichungen bezeichnet man wieder als Euler-Lagrange-Gleichungen. Für jede Feldkomponente Φk gibt es eine solche Gleichung und über den doppelt vorkommenden Index μ wird summiert.

Eine kurze Randbemerkung: Mit Hilfe der unten definierten Funktionalableitung kann man die Euler-Lagrange-Gleichungen auch vollkommen analog zur klassischen Mechanik aufstellen. Dabei treten Funktionalableitungen der Lagrangefunktion Lf auf. Rechnet man diese Funktionalableitungen aus (analoge Rechnungen findet man unten bei den Hamiltonschen Bewegungsgleichungen) und verwendet die Lagrangedichte, so erhält man die obigen Gleichungen.


Unser Ziel war es, die Maxwell-Gleichungen   δμ Fμν   =   jν / c   und   δμ *Fμν   =   0   aus einem Wirkungsprinzip herzuleiten, d.h. sie als Euler-Lagrange-Gleichungen in der Form   dL/dΦk     −   δμ dL/d(δμ Φk)   =   0   schreiben zu können.

Wenn man nun versucht, die einzelnen Matrixelemente Fμν (also letztlich die Komponenten des elektrischen und magnetischen Feldes) mit den Feldkomponenten Φk gleichzusetzen, so stößt man auf Schwierigkeiten. Es treten in den Euler-Lagrange-Gleichungen je nach Ansatz für L sehr schnell zweite Ableitungen der Felder nach Raum und/oder Zeit auf, und es ist kaum möglich, für L eine geeignete Form zu finden, die die Maxwellgleichungen reproduziert, in denen nur erste Ableitungen nach Raum und Zeit vorkommen. Wir erinnern uns: Auch die Euler-Lagrange-Gleichungen der klassischen Mechanik enthielten zweite Ableitungen nach der Zeit, denn in den Newtonschen Bewegungsgleichungen steht die Beschleunigung!

An dieser Stelle hilft ein Trick: Statt den Feldkomponenten verwenden wir die elektromagnetischen Potentiale und identifizieren sie mit den Feldern in den Euler-Lagrange-Gleichungen. Das hat den Vorteil, dass zweite Ableitungen nicht mehr stören, denn drückt man die Maxwellgleichungen mit Hilfe der Potentiale aus, so enthalten sie solche zweiten Ableitungen.

Die elekromagnetischen Potentiale (oder kurz: das elektromagnetische Potential) sind ein Vierervektor Aμ(x) , also ein Vektor mit vier Komponenten, die jeweils Funktionen von Raum und Zeit sind. Dieser Potentialvektor soll so definiert sein, dass sich der Feldstärketensor Fμν(x) als Ableitung von Aμ(x) schreiben lässt, und zwar so:

Fμν(x)   =   δμ Aν(x) − δν Aμ(x)

mit δμ := gμν δν (Einsteinsche Summenkonvention; die Matrix (gμν) ist außerhalb der Diagonale gleich Null und hat in der Diagonalen von links oben nach rechts unten die Werte   1, -1, -1, -1 ). Anders gesagt:   δ0 = δ0 = d/dt   und   δk = - δk = - d/dxk   mit dem Index k = 1, 2 oder 3 .

Damit diese Gleichung mit Poincaretransformationen verträglich ist, fordern wir, dass sich Aμ(x) bei diesen Transformationen genauso wie die Stromdichte jμ(x) verhält:   A'(x)   =   Λ A(Λ-1(x-a))  . Damit ist dann das richtige Transformationsverhalten des Feldstärketensors Fμν(x) gesichert (Randbemerkung: das obige Transformationsverhalten für Aμ(x) ist nicht die einzige Möglichkeit, für Fμν(x) das richtige Transformationsverhalten zu sichern, denn man könnte zusätzlich noch Eichtransformationen auf Aμ(x) anwenden, ohne Fμν(x) zu ändern -- dies wird wichtig, wenn eine nicht-kovariante Eichfixierung gewählt wird; wir gehen weiter unten noch genauer darauf ein).

Die Rechtfertigung dafür, dass man Fμν(x) derart als Ableitung eines Potentials schreiben kann, liefern die homogenen Maxwellgleichungen   δμ *Fμν   =   0 , die sich unmittelbar aus   Fμν(x)   =   δμ Aν(x) − δν Aμ(x)   ableiten lassen. Insofern brauchen wir die homogenen Maxwellgleichungen nicht mehr weiter zu betrachten, sobald wir die Potentiale eingeführt haben, denn sie stecken automatisch mit drin. Auch hier verzichten wir auf weitere Details.

Wenn man die obige Gleichung mit Hilfe des elektrischen und magnetischen Feldes komponentenweise ausschreibt, erkennt man, dass A0 das bekannte elektrische Potential ist, und dass Ak   (k = 1, 2, 3) die Komponenten des magnetischen Potentialvektors sind.

Eine spezielle Lösung der obigen Gleichungen ist

Aμ(x)   =   − ∫[0, 1]   dλ   λ Fμν(λx) xν

(den Nachweis wollen wir hier nicht führen, da diese Formel nicht weiter gebraucht wird). Allerdings gibt es noch andere Funktionen Aμ(x) , die zum selben Fμν(x) führen. Generell führen alle Funktionen der Form

Aμ(x)   +   δμ χ(x)

mit einer beliebigen differentierbaren Funktion χ(x) zum selben Feldstärketensor Fμν(x) , denn der Term   δμ δν χ(x) − δν δμ χ(x)   ist Null. Man bezeichnet die Addition des Terms   δμ χ(x)   zum Potential Aμ(x) als Eichtransformation des Potentials. Alle Potentiale, die durch Eichtransformationen ineinander umwandelbar sind, führen zum selben Feldstärketensor Fμν(x) , sind also in Bezug auf die Maxwellgleichungen gleichwertig.

Wie sehen nun die inhomogenen Maxwellgleichungen aus (die homogenen Maxwellgleichungen haben sich ja durch die Einführung des Potentials nebenbei erledigt)? Setzen wir dazu   Fμν(x)   =   δμ Aν(x) − δν Aμ(x)   in   δμ Fμν   =   jν / c   ein (es gilt wieder die Summation über doppelte Indices) und verwenden im zweiten Term   δμ δν Aμ(x) = δν δμ Aμ(x)  , so ergibt sich:

δμ δμ Aν(x) − δν δμ Aμ(x)   =   jν(x) / c

Wie gewünscht enthält diese Form der Maxwellgleichung zweite Ableitungen, so dass gewisse Chancen bestehen, sie als Euler-Lagrange-Gleichung einer passenden Lagrangedichte schreiben zu können. Im ersten Term ist   δμ δμ = (d/dt)2 − (d/dx)2   der bekannte Wellenoperator (auch d'Alembert-Operator genannt), denn   δμ δμ f(x) = 0   ist die bekannte Wellengleichung, deren Lösungen als Superpositionen ebener Wellen geschrieben werden können. Der zweite Term dagegen enthält die Viererdivergenz   δμ Aμ(x)   des Potentialvektors.

Man kann leicht nachrechnen, dass die obige Gleichung mit Eichtransformationen verträglich ist: erfüllt   Aμ(x)   die Gleichung, so erfüllt auch   Aμ(x) + δμ χ(x)   die Gleichung. Das überascht uns nicht, denn Eichtransformationen ändern den Feldstärketensor   Fμν(x)   nicht, und von diesem sind wir in der inhomogenen Maxwellgleichung ja ausgegangen.

Kann man nun diese Form der inhomogenen Maxwellgleichung, ausgedrückt durch den Potentialvektor, als Euler-Lagrange-Gleichung schreiben? Kann man die Potentiale Aμ(x) mit den Feldkomponenten Φk identifizieren?

Versuchen wir, einen geeigneten Ansatz für die Lagrangedichte L zu finden, wobei L von den Potentialen Aμ(x) und deren Ableitungen   δν Aμ(x)   sowie der extern vorgegebenen Stromdichte jμ(x) abhängen darf. Dabei sind nur die Potentiale dynamische Variablen der Theorie, denn wir hatten ja die Vereinfachung gemacht, die Stromdichte als vorgegeben zu betrachten, also keine Rückwirkungen der elektromagnetischen Felder auf Ladungs- und Stromdichte zu betrachten. Was für Terme wollen wir nun in L zulassen?

Überlegen wir zunächst, was bei Poincaretransformationen mit der Lagrangedichte geschehen soll. Bei einer Poincaretransformation   x' = Λ x + a   wird aus dem Potentialvektor A(x) der neue Potentialvektor   A'(x) = Λ A(Λ-1(x-a))  . Wenn A(x) eine Lösung der Maxwellgleichungen zu vorgegebener Stromdichte j(x) ist, so ist A'(x) eine Lösung zur Stromdichte j'(x) . Wenn also A(x) ein Minimum der Wirkung zur Stromdichte j(x) ist, so soll auch A'(x) ein Minimum der Wirkung zur Stromdichte j'(x) sein. Das erreichen wir am Einfachsten, wenn wir für die Wirkung fordern:   S[A, j] = S[A', j']   . Die Wirkung soll sich also bei Poincaretransformationen nicht ändern. Das ist auf jeden Fall gegeben, wenn sich die Lagrangedichte bei Poincaretransformationen ebenfalls nicht ändert. Versuchen wir es also mit einer Lagrangedichte, deren Terme invariant sind unter Poincaretransformationen.

Wie sieht es mit Eichtransformationen der Potentiale aus? Auch hier gilt: Wenn A(x) eine Lösung der Maxwellgleichungen zu vorgegebener Stromdichte j(x) ist, so ist   A(x) + δχ(x)   ebenfalls eine Lösung zur Stromdichte j(x) (wir verwenden für den Vierervektor mit Komponenten   Aμ(x) + δμχ(x)   die Kurzschreibweise   A(x) + δχ(x)  ). Wenn also A(x) ein Minimum der Wirkung ist, so soll auch   A(x) + δχ(x)   ein Minimum der Wirkung sein. Wieder ist die einfachste Forderung, die das gewährleistet: Die Wirkung soll invariant unter Eichtransformationen sein -- oder kurz: die Wirkung soll eichinvariant sein, d.h. S[A, j] = S[A + δχ, j] . Eine eichinvariante Lagrangedichte würde das garantieren. Man kann auch etwas allgemeiner fordern, dass die Lagrangedichte sich bei Eichtransformationen der Felder nur um die Vierer-Divergenz eines Vierer-Vektorfeldes ändern darf, wobei dieses Vierer-Vektorfeld im Unendlichen schnell genug gegen Null gehen soll, so dass das Oberflächenintegral über den unendlich fernen Rand der vierdimensionalen Raumzeit gleich Null wird (das Raumintegral der Divergenz kann man ja nach dem Gauss'schen Satz in ein Oberflächenintegral umwandeln). Die Vierer-Divergenz trägt dann nichts zur Wirkung bei. Wir werden sehen, ob wir eine eichinvariante Lagrangedichte konstruieren können, oder ob eine Viererdivergenz unvermeidlich ist.

An dieser Stelle müsste nun eine ausführliche Konstruktion einer Lagrangedichte, die mit den obigen Forderungen verträglich ist, folgen. Man kann aus einer solchen Konstruktion viel darüber lernen, welche Forderungen man genau verwenden muss, um eine Lagrangedichte zu erzeugen, die die Maxwellgleichungen hervorbringt. Außerdem wird dabei klar, in wieweit die Lagrangedichte überhaupt eindeutig ist. Eine solche Diskussion würde jedoch den Rahmen dieses Kapitels sprengen, und wir wollen sie deshalb überspringen.

Das Ergebnis lautet: Die einfachste Lagrangedichte, die die obigen Forderungen erfüllt und die Maxwellgleichungen hervorbringt, ist gegeben durch

L(A(x), δA(x), j(x))   =   -1/4   [δμ Aν(x) − δν Aμ(x)]   [δμ Aν(x) − δν Aμ(x)]   −   jμ(x) Aμ(x) / c

mit der Schreibweise   δA   für den Vektor mit den 16 Komponenten   δμ Aν . Die Kurzform der Lagrangedichte lautet:

L   =   -1/4 Fμν Fμν   −   jμ Aμ / c

wobei wieder über doppelte Indices summiert wird.

Die Lagrangedichte enthält also zwei Summanden. Der erste Summand enthält nur die Ableitungen der Potentiale und ähnelt damit dem Term   m v2 / 2   in der Lagrangefunktion der klassischen Mechanik, der die zeitliche Ableitung   v = dx/dt   enthält. Man nennt den Term   -1/4 Fμν Fμν   daher auch den kinetischen Term der Lagrangedichte. Analog bezeichnet man den zweiten Term   jμ(x) Aμ(x) / c   manchmal als potentiellen Term. Nur dieser zweite Term enthält direkt das Potential A(x) und die von außen vorgegebene Quelle des Potentials, die Stromdichte j(x) . Ausgeschrieben mit Hilfe des elektrischen Feldes E, des magnetischen Feldes B, der Ladungsdichte ρ und der Dreier-Stromdichte j lautet die Lagrangedichte:

L   =   1/2 (E2B2)   −   ρ A0 + j A/c

Überprüfen wir die Euler-Lagrange-Gleichungen (für die Rechnung ist es wichtig, die Felder sowie ihre Ableitungen als unabhängige Variablen von   L(A(x), δA(x), j(x))   =   -1/4   [δμ Aν − δν Aμ]   [δμ Aν − δν Aμ]   −   jμ Aμ / c   aufzufassen, denn genau so sind die Euler-Lagrange-Gleichungen gemeint; es gilt wieder die Summenkonvention für doppelte Indices):

0   =   dL/dAρ     −   δσ dL/d(δσAρ)   =  

  =   1/4   δσ d/d(δσAρ)   [δμ Aν − δν Aμ]   [δμ Aν − δν Aμ]   −     d/dAρ   jμ Aμ / c   =  

  =   δσ   [δσ Aρ − δρ Aσ]   −   jρ / c   =  

  =   δσ   Fσ ρ   −   jρ / c

Das ist genau die inhomogene Maxwellgleichung (nur die Indices tragen andere Namen)! Unser Ansatz war also erfolgreich: mit der obigen Lagrangedichte und den Potentialen als dynamische Variable sind die Euler-Lagrange-Gleichungen gerade die inhomogenen Maxwellgleichungen.

Schauen wir uns die Lagrangedichte   L = -1/4 Fμν Fμν   −   jμ Aμ / c   noch einmal im Hinblick auf Ihre Transformationseigenschaften bei Poincaretransformationen und bei Eichtransformationen an:

Unter Poincaretransformationen ist die Sache klar: L ist invariant, d.h.   L(A, δA, j) = L(A', δA', j')   mit   A'(x) = Λ A(Λ-1(x-a))  . Dies erkennt man schon daran, dass in den Summen über doppelte Indices immer ein Index oben und ein Index unten steht.

Wie sieht es bei Eichtransformationen aus? Zunächst einmal ändert sich der Feldstärketensor Fμν dabei nicht, d.h. der erste Term ist von Eichtransformationen nicht betroffen. Der zweite Term jedoch verändert sich: aus   jμ Aμ / c   wird   jμ (Aμ + δμ χ) / c   , d.h. es entsteht ein zusätzlicher Term   jμμ χ) / c  . Die Lagrangedichte ist also nicht eichinvariant!

Dieser zusätzliche Term trägt jedoch nichts zur Wirkung S bei, d.h. die Wirkung ist eichinvariant. Warum das so ist, sieht man so:

Es ist nach der Produktregel   δμ (jμ χ) = (δμ jμ) χ + jμμ χ) = jμμ χ)   , denn wegen der Ladungserhaltung ist   δμ jμ = 0  . Also gilt für den Zusatzterm in der Lagrangedichte:   jμμ χ) / c = δμ (jμ χ) / c  . Der Zusatzterm ist also gleich der Viererdivergenz des Vektorfeldes jμ χ . Bildet man in der Wirkung das Integral dieser Funktion über die Raumzeit, so kann man dieses Integral nach dem Gauss'schen Satz wieder in ein Oberflächen-Flussintegral des Vektorfeldes jμ χ durch den unendlich fernen Rand der Raumzeit umschreiben. Wir nehmen nun an, dass die Stromdichte j(x) multipliziert mit dem Eichterm χ(x) für unendlich ferne Raumpunkte und unendlich ferne Zeiten schnell genug gegen Null geht, so dass das Oberflächen-Flussintegral gleich Null ist. Obwohl die Lagrangedichte bei gegebener Stromdichte nicht eichinvariant ist, ist die Wirkung also eichinvariant, wenn wir die Stromerhaltung   δμ jμ = 0   als Nebenbedingung für die Stromdichte j(x) voraussetzen. Anders ausgedrückt: Die Stromerhaltung δμ jμ = 0 garantiert die Eichinvarianz der Theorie.


4.4   Kanonisch konjugierte Variablen und die Funktionalableitung

Gehen wir nun zur Hamiltonschen Formulierung der klassischen Theorie über, indem wir eine Legendre-Transformation analog zur klassischen Mechanik durchführen. Schauen wir uns dazu noch einmal die Vorgehensweise in der klassischen Mechanik an:

Im Falle eines Teilchens im dreidimensionalen Raum war die Lagrangedichte eine Funktion des Ortes x und der Geschwindigkeit v des Teilchens: L(x,v). Wir haben den zu x kanonisch konjugierten Impuls p definiert durch p := dL/dv , d.h. für jeden der drei Freiheitsgrade gilt pk := dL/dvk .

Von oben wissen wir: In der Feldtheorie hängt die Lagrangefunktion Lf (nicht die Lagrangedichte!) von unendlich vielen Freiheitsgraden ab, nämlich im Fall der Elektrodynamik von den Potentialen Aμ und deren zeitlicher Ableitung an jedem Raumpunkt x . Man kann μ und x dabei als einen kontinuierlichen Doppelindex ansehen, der die Freiheitsgrade gleichsam durchnummeriert -- wobei ein wirkliches Durchnummerieren wegen des kontinuierlichen Charakters von x natürlich nicht möglich ist. Die Lagrangefunktion Lf ist also ein Funktional, das wir oben als   Lf [Φ(ct, . ), δ0Φ(ct, . )]   geschrieben haben.

Wie sieht nun das Analogon zu pk := dL/dvk bei unendlich vielen Freiheitsgraden aus? Dazu müssen wir den Begriff der Funktionalableitung einführen (siehe z.B. Funktionalableitungen in a nutshell, http://www.physik.uni-augsburg.de/~gruber/Teach/funktionale.pdf):

  • Funktionalableitung:
    Wir betrachten ein Funktional F , das einer reellen Funktion Φ eine reelle Zahl F[Φ] zuordnet. Die Funktionalableitung dF/dΦ|Φ des Funktionals F an der Stelle Φ definieren wir dabei über die Beziehung

    dF/dΦ|Φ[η]   :=   limε → 0   (F[Φ + ε η] - F[Φ]) / ε   =   d/dε   F[Φ + ε η] |ε = 0

Wir sehen also, dass die Funktionalableitung dF/dΦ|Φ selbst ein lineares Funktional ist, das auf die Funktion η angewendet die Richtungs-Funktionalableitung von F an der Stelle Φ in Richtung von η ergibt, ganz analog zur Definition des Gradienten bei Funktionen endlich vieler Freiheitsgrade. Man bezeichnet lineare Funktionale auch als Distributionen.

Im Grunde haben wir die Funktionalableitung bereits angewendet, nämlich bei der Herleitung der Euler-Lagrange-Gleichungen, als wir das Minimum des Wirkungs-Funktionals gesucht haben. Man nennt die Funktionalableitung daher auch Variation von F[Φ] nach Φ oder auch Variationsableitung. In der mathematischen Literatur der Funktionalanalysis spricht man auch von Frechetableitung.

In der physikalischen Literatur schreibt man lineare Funktionale gerne als Integrale. Der Grund dafür ist, dass man jeder (gutartigen) Funktion f im n-dimensionalen reellen Raum über das Integral   ∫ dnx   f(x) g(x) das lineare Funktional

F[g]   :=   ∫ dnx   f(x) g(x)

zuordnen kann (wir nehmen wie immer an, dass die Funktionen im Unendlichen hinreichend stark abfallen, so dass das Integral Sinn macht). Allerdings gilt die Umkehrung nicht! Man kann nicht jedem linearen Funktional F[g] über die obige Gleichung eine Funktion f zuordnen. Ein Beispiel ist das Delta-Funktional (auch Delta-Distribution genannt)   δa[g] = g(a)  , das jeder Funktion g (diesmal im eindimensionalen reellen Raum) den Funktionswert von g an der Stelle a zuordnet. Das Delta-Funktional lässt sich nicht als Integral von Funktionen schreiben. Zum Entsetzen mancher Mathematiker tun es die Physiker aber dennoch und schreiben

δa[g]   =:   ∫ dx   δ(x-a) g(x)

Dabei ist δ(x-a) keine Funktion, denn dann wäre δ(x-a) = 0 für x ungleich a und δ(x-a) = unendlich für x = a, und unendliche Funktionswerte sind nicht zulässig. Streng genommen ist die obige Schreibweise mit δ(x-a) also mathematisch nicht definiert.

Dennoch ist diese Schreibweise sehr nützlich -- deshalb lieben Physiker sie so. Sie berücksichtigt automatisch den linearen Charakter des Funktionals. Und: Jedes lineare Funktional lässt sich als Grenzwert einer Folge von Funktionalen   Fi[g] := ∫ dnx   fi(x) g(x)   verstehen, bei dem die fi gewöhnliche Funktionen sind. Für i gegen Unendlich existiert also der Grenzwert von   Fi[g] = ∫ dnx   fi(x) g(x)   und liefert ein lineares Funktional F[g], das dann formal als   F[g] := ∫ dnx   f(x) g(x)   geschrieben wird. Der Grenzwert der fi muss allerdings dabei selbst nicht existieren, d.h. f(x) muss keine Funktion sein, sondern kann ein recht singuläres Objekt werden. Mathematisch bedeutet das, dass der Grenzwert i gegen Unendlich und die Integration nicht immer miteinander vertauschbar sind. Physiker tun formal so, als wären sie es doch, was ok ist, wenn man i einfach nur sehr groß werden lässt, ohne den Grenzübergang bis zuletzt durchzuführen. Die Integralschreibweise für lineare Funktionale wird daher oft anschaulich in dem Sinn verstanden, dass man i sehr groß werden lässt.

Beispiel: Im Fall der Delta-Distribution kann man für die Funktionenfolge fi auf Eins normierte Gauss-Glockenkurven wählen, deren Breite mit wachsendem i gegen Null schrumpft und deren Höhe entsprechend zunimmt, so dass die Fläche unter der Kurve gleich Eins bleibt.

Ein anderes Argument für die Integralschreibweise ist ihre Analogie zum Fall endlich vieler Freiheitsgrade. Aus dem Integral wird dabei die Summe über alle Freiheitsgrade, und jede lineare Funktion lässt sich als
F[g]   :=   f g   =   ∑k   fk gk
mit den n-komponentigen reellen Vektoren f und g schreiben.

Da die Funktionalableitung ein lineares Funktional ist, verwenden Physiker auch für sie die Integralschreibweise:

dF/dΦ|Φ[η]   =:   ∫ dnx   dF/dΦ(x)|Φ   η(x)

Oft wird an Stelle von dF/dΦ(x)|Φ einfach dF/dΦ(x) geschrieben. Die Bedeutung dieser Ausdrücke kann man sich jeweils anhand der obigen Definition überlegen. Wichtig ist dabei immer, sich Terme wie dF/dΦ(x) als Integralkerne im obigen Sinn vorzustellen, wobei nur das Integral als Ganzes Sinn macht. Man darf übrigens die Funktionalableitung nicht mit der distributiven Ableitung linearer Funktionale verwechseln, die im eindimensionalen Fall über   F'[Φ] := - F[dΦ/dx] definiert ist.

Die Integralschreibweise für die Funktionalableitung ist wieder durch ihre Ähnlichkeit mit dem Fall endlich vieler Freiheitsgrade motiviert. Für n-komponentigen reelle Vektoren Φ und η hat man für die Richtungsableitung

dF/dΦ|Φ[η]   :=   limε → 0   (F[Φ + ε η] - F[Φ]) / ε   =:   ∑k   dF/dΦk|Φ   ηk

Der partiellen Ableitung dF/dΦk|Φ im endlichdimensionalen Fall entspricht im unendlichdimensionalen Fall also die Funktionalableitung dF/dΦ(x)|Φ. Wieder sehen wir, wie der Ort x die Rolle eines kontinuierlichen Indexes spielt und den diskreten Index k ersetzt.

Die Integralschreibweise ist ebenfalls naheliegend, wenn man die Kettenregel naiv vom endlich-dimensionalen Fall auf den unendlich-dimensionalen Fall übertragen möchte:

dF/dΦ|Φ[η]  =   d/dε   F[Φ + ε η] |ε = 0   =   ∫ dnx   dF/dΦ(x)|Φ dΦ(x)/dε|ε = 0   =   ∫ dnx   dF/dΦ(x)|Φ η(x)

Schauen wir uns zur Übung ein Beispiel an und betrachten ein lineares Funktional   F[Φ] = ∫ dx   f(x) Φ(x)  . Wie sieht die Funktionalableitung dieses Funktionals aus?

Es ist wegen der Linearität von F:
  (F[Φ + ε η] - F[Φ]) / ε   =   (F[Φ] + ε F[η] - F[Φ]) / ε   =   F[η]
und damit   dF/dΦ|Φ[η]   =   F[η]   . Übersetzt in die Integralschreibweise bedeutet das:
∫ dx   dF/dΦ(x)|Φ   η(x)   =   ∫ dx   f(x) η(x)
und damit   dF/dΦ(x)|Φ = f(x)  . Schreibt man F darin als Integral   ∫ dx'   f(x') Φ(x')   und zieht d/dΦ(x) formal unter das Integral, so ergibt sich   ∫ dx'   f(x') dΦ(x')/dΦ(x)   =   f(x)   und somit   dΦ(x')/dΦ(x) = δ(x' - x)  . Anschaulich gesprochen sagt man, dass die Freiheitsgrade Φ(x') und Φ(x) an verschiedenen Raumpunkten unabhängig voneinander sind.


Nun sind wir gerüstet, auch im unendlichdimensionalen Fall das Analogon zu   pk := dL/dvk   aufzustellen. Für die Elektrodynamik haben wir:

πμ(ct,x)   :=   dLf / d(δ0Aμ(ct,x))

im Sinne der oben definierten Funktionalableitung. Wir können πμ auch mit Hilfe der Lagrangedichte L ausdrücken. Die Definition der Funktionalableitung liefert:

dLf / d(δ0Aμ) [η]   =
  =   d/dε   Lf [.., δ0Aμ + ε η, ..]   =
  =   d/dε   ∫ d3x   L(.., δ0Aμ(ct,x) + ε η(ct,x), ..)   =
  =   ∫ d3x   d/dε   L(.., δ0Aμ(ct,x) + ε η(ct,x), ..)   =
  =   ∫ d3x   dL/d(δ0Aμ(ct,x))   η(ct,x)  

Der Vergleich mit der Integralschreibweise   dLf / d(δ0Aμ) [η]   =   ∫ d3x   dLf / d(δ0Aμ(ct,x))   η(x)   der Funktionalableitung liefert:

πμ(ct,x)   =   dLf / d(δ0Aμ(ct,x))   =   dL / d(δ0Aμ(ct,x))

wobei die Ableitung der Lagrangefunktion Lf im Sinne der Funktionalableitung eines Funktionals gemeint ist, die Ableitung der Lagrangedichte dagegen die gewöhnliche partielle Ableitung einer Funktion ist (die Lagrangedichte war ja eine gewöhnliche reelle Funktion von 20 reellen Variablen; in die ersten 4 setzt man die Potentialwerte Aμ(ct,x) und in die übrigen 16 die Werte der Ableitungen δν Aμ(ct,x) ein; die partielle Ableitung leitet L einfach nach der entsprechenden Variable ab). Fassen wir Zeit und Raum wieder zum vierdimensionalen Vektor x = (ct, x) zusammen, so ist also

πμ(x)   =   dL / d(δ0Aμ(x))

Wir hatten oben bereits ausgerechnet, dass   dL/d(δσAρ)   =   − Fσ ρ   ist. Also ist

πμ   =   − F   =   Fμ0

Also ist der Vierervektor π = (πμ) gleich der ersten Spalte des Feldstärketensors, d.h. π = (0, E). Für die Komponente π0 bedeutet dies eine unangenehme Überaschung:   π0 = F00 = 0  , d.h. diese Komponente ist als dynamische konjugierte Impulsvariable, deren Zeitabhängigkeit wir ermitteln wollen, ungeeignet.


4.5   Eichfreiheit

Woran liegt es, dass es nur drei konjugierte Impulsvariablen gibt? Zur Klärung wollen wir die Lagrangefunktion zunächst explizit mit Hilfe der Potentiale und deren Ableitungen auschreiben.

Man rechnet leicht nach, dass die Beziehung   Fμν   =   δμ Aν − δν Aμ   ausgeschrieben mit den Feldern E und B die Gleichungen

E   =   − dA0/dx − δ0 A
B   =   rot A

ergibt. Daraus folgt   1/4 Fμν Fμν = (-1/2) (E2B2)   mit   B = rot A  , so dass man die Lagrangefunktion schreiben kann als.

Lf   =   ∫ d3x   { 1/2 [ ( dA0/dx + δ0 A )2 − ( rot A )2 ]   −   ρ A0 + j A/c }

Nun können wir es sehen: Die Ursache für   π0 = 0   liegt darin, dass die Lagrangefunktion nicht von   δ0 A0   abhängt. Nur die Zeitableitung der räumlichen Komponenten   δ0 A   kommt vor.

Das Analogon in der klassischen Mechanik wäre, dass A0 einem Lagrange-Multiplikator λ in der Lagrangefunktion entspricht, denn auch dort kommt dλ/dt nicht in der Lagrangefunktion vor. Ein Term   λ g(x,v)   in der Lagrangefunktion der klassischen Mechanik bewirkt, dass die Freiheitsgrade x und v = dx/dt die Nebenbedingung   g(x,v) = 0   erfüllen müssen, denn die entsprechende Lagrangegleichung für den Lagrange-Multiplikator lautet   g(x,v) = dL/dλ = d/dt dL/d(dλ/dt) = 0  .

Genau genommen entspricht   A0(ct,x)   für jeden Wert x einem Lagrange-Multiplikator λk , d.h. wir haben es hier mit unendlich vielen Lagrange-Multiplikatoren zu tun (die Interpretation von x als kontinuierlichen Index kennen wir ja bereits). Analog entspricht der Term   G(λk, x, v)   :=   ∑k λk gk(x,v)   für die k Nebenbedingungen   gk(x,v) = 0   aus der klassischen Mechanik nun in der Lagrangefunktion dem A0 -abhängigen Anteil

∫ d3x   { (dA0/dx)2 / 2   +   (dA0/dx) (δ0 A)   −   ρ A0 }   =:   G[A0, A, δ0 A ]

So wie man in der klassischen Mechanik die Nebenbedingungen aus den Gleichungen   gk(x,v) = dG/dλk = dL/dλk = 0   gewinnen kann, kann man auch hier die Nebenbedingungen angeben (im letzten Schritt erfolgt wieder die partielle Integration mit der Annahme, dass die Randterme wegfallen, weil die Variation η entsprechend gewählt ist):

dG/dA0[η]   =   d/dε G[.., A0 + ε η, ...]   =  
  =   ∫ d3x   dG/dA0(ct,x)   η(ct,x)   =  
  =   ∫ d3x   { (dA0/dx) (dη/dx)   +   (δ0 A) (dη/dx)   −   ρ η }   =  
  =   ∫ d3x   { − d/dx ( dA0/dx   +   δ0 A)   −   ρ } η   =   0

d.h. die Nebenbedingung lautet

dG/dA0(ct,x)   =   − d/dx ( dA0/dx   +   δ0 A)   −   ρ   =   div E   −   ρ   =   0

Halten wir fest:

  • Die Tatsache, dass   π0 = 0   ist, können wir also dadurch erklären, dass nicht alle vier Potentiale Aμ als voneinander unabhängige dynamische Variablen betrachtet werden können. Sie unterliegen der Nebenbedingung   − d/dx ( dA0/dx   +   δ0 A)   −   ρ   =   div E   −   ρ   =   0   , die zugleich eine der inhomogenen Maxwellgleichungen ist. Dabei spielt A0 die Rolle der Lagrange-Multiplikatoren.

Dieser Umstand hängt damit zusammen, dass alle Potentiale Aμ, die durch Eichtransformationen ineinander übergehen, zum selben Feldstärketensor und damit zu denselben dynamischen Größen führen. Schauen wir uns an, wie man diese Mehrdeutigkeit der Potentiale loswerden kann. Es gibt hier mehrere Möglichkeiten, von denen wir uns eine genauer ansehen wollen:

Unter den vielen zueinander gleichwertigen Potentialen wollen wir diejenigen auswählen, die die Bedingung

δμ Aμ(x)   =   0

erfüllen. Man bezeichnet diese Bedingung als Lorentzeichung. Die Maxwellgleichung für diese Potentiale nimmt die einfache Form der inhomogenen Wellengleichung

δμ δμ Aν(x)   =   jν(x) / c

an, denn der zweite Term   δν δμ Aμ(x)   fällt aufgrund der Eichbedingung weg. Dies war auch eine Motivation dafür, die Eichbedingung gerade so zu wählen.

Die Lorentzeichungs-Bedingung kann man durch eine entsprechende Eichtransformation der Potentiale immer erfüllen: Wir starten mit einer beliebigen Lösung   A' μ(x)   der Maxwellgleichungen und definieren einen dazu gleichwertigen eichtransformierten Potentialvektor   Aμ(x) = A' μ(x) + δμ χ(x)  . Wählen wir nun die Eichfunktion χ(x) so, dass   δμ A' μ(x) + δμ δμ χ(x) = 0   ist (d.h. die Eichfunktion χ(x) erfüllt diese inhomogene Wellengleichung), so gilt   δμ Aμ(x) = 0 . Die Bedingung   δμ Aμ(x) = 0   fixiert also in diesem Sinn die Eichung, d.h. sie lässt unter den vielen zueinander gleichwertigen Potentialen nur noch bestimmte Potentiale zu. Diese Eichfixierung ist allerdings noch nicht vollständig, denn die Gleichung   δμ A' μ(x) + δμ δμ χ(x) = 0   hat nicht nur eine Lösung (ist   χ(x)   eine Lösung dieser Gleichung, so ist auch   χ(x) + ξ(x)   eine Lösung, wenn ξ(x) die homogenen Wellengleichung   δμ δμ ξ(x) = 0   erfüllt).

Wie kann man nun die Eichung eindeutig fixieren? Welche weitere Bedingung benötigt man, um unter den übrig gebliebenen gleichwertigen Potentialen (die bereits die Lorentzeichung   δμ Aμ(x) = 0   erfüllen) eindeutig einen Vektor auszuwählen?

Da   π0 = 0   ist, könnte man versuchen, diejenigen Potentiale auszuwählen, die   A0 = 0   erfüllen, d.h. bei denen das elektrische Potential gleich Null ist. Dies ist allerdings nicht immer möglich, denn ein Potentialvektor mit   A0 = 0   ist im Allgemeinen keine Lösung der Maxwellgleichung   δμ δμ Aν(x) = jν(x) / c   mehr. Wenn allerdings keine Ladungen und Ströme vorhanden sind (also   jν(x) = 0  ), dann lässt sich   A0 = 0   erreichen (daher nennt man die Bedingung   A0 = 0   zusammen mit der Lorentzeichung auch Strahlungseichung), wie die folgende Überlegung zeigt:

Starten wir mit einer Lösung A' μ(x) der Maxwellgleichungen mit   jν(x) = 0  , wobei zusätzlich die Lorentzeichung erfüllt sein soll, und gehen zu einem eichtransformierten Potential   Aμ(x) = A' μ(x) + δμ χ(x)   über, das ebenfalls die Lorentzeichung erfüllt (d.h. χ(x) erfüllt die homogene Wellengleichung   δμ δμ χ(x) = 0   ). Wir wollen χ(x) nun so wählen, dass   A0 = 0   ist:   A0(x) = A' 0(x) + δ0 χ(x) = 0  , d.h.   dχ(x)/(c dt) = − A' 0(x)   mit der Lösung

χ(ct,x)   =   − ∫[0,t] c dt' A' 0(ct',x)

Bleibt zu überprüfen, ob dieses χ wie gefordert auch die Bedingung   δμ δμ χ(x) = 0   erfüllt, so dass die Lorentzeichung weiterhin gegeben ist. Rechnen wir nach:

δμ δμ χ(ct,x)   =   − δμ δμ   ∫[0,t] c dt' A' 0(ct',x)   =   − ∫[0,t] c dt' δμ δμ A' 0(ct',x)   =   0

wobei im letzten Term der Wellenoperator δμ δμ natürlich nach t' ableitet. Der letzte Term ist aufgrund der Maxwellgleichung (mit Lorentzeichung)   δμ δμ Aν(x) = jν(x) / c   nur deswegen Null, weil wir   jν(x) = 0   gefordert haben. Hier sehen wir noch einmal explizit, dass   jν(x) = 0   für diese Eichung erforderlich ist.

Die beiden Strahlungseichung-Bedingungen   δμ Aμ(x) = 0   sowie   A0(x) = 0   legen die Eichung im ladungsfreien Raum eindeutig fest. Damit sehen wir, dass im ladungsfreien Raum nur zwei Komponenten von Aμ(x) voneinander unabhängige Freiheitsgrade repräsentieren.

Natürlich gibt es noch andere Möglichkeiten, die Eichung der Potentiale festzulegen. Eine solche Möglichkeit ist die Coulomb-Eichung   div A = 0  , die auch mit Ladungen funktioniert (die Lorentzbedingung   δμ Aμ(x) = 0   wird hier nicht zusätzlich verlangt). Ohne Ladungen und mit der Eichung A0 = 0 sind Lorentzeichung und Coulombeichung dagegen gleichwertig zueinander.

Sowohl Strahlungseichung als auch Coulombeichung haben den Nachteil, dass sie das Transformationsverhalten des Potentialvektors Aμ(x) bei Poincaretransformationen komplizierter machen. Oben hatten wir das Transformationsverhalten   A'(x) = Λ A(Λ-1(x-a))   angegeben. Dieses Verhalten ist mit der Lorentzeichung   δμ Aμ(x) = 0   verträglich: erfüllt A(x) die Lorentzeichung, so auch A'(x). Aber: ist A0(x) = 0, so ist nach der Poincaretransformation nicht ebenfalls A' 0(x) = 0 . Man müsste erst zusätzlich zur Poincaretransformation noch eine Eichtransformation durchführen, um die Eichbedingung wieder herzustellen. Das ist zwar prinzipiell alles machbar, aber der Umgang mit Poincaretransformationen wird dadurch umständlicher. Man sagt, die Theorie ist nicht mehr manifest kovariant.

Will man eine manifest kovariante Theorie beibehalten, so kann man lediglich die Lorentzbedingung   δμ Aμ(x) = 0   zur teilweisen Eichfixierung verwenden. Es ist sogar möglich (und für die Quantisierung später auch nützlich), diese Bedingung direkt in die Wirkung einzubauen. Dazu orientiert man sich an der Vorgehensweise, wie man Extremwerte von Funktionen unter Nebenbedingungen gewinnt. Hier eine kurze Wiederholung (siehe z.B. http://www.math.tu-cottbus.de/INSTITUT/lsing2/hmbiw2/skript6/node12.html ):

Nehmen wir an, wir suchen einen n-dimensionalen reellen Vektor x, für den eine reelle Funktion f(x) einen Extremwert (Maximum, Minimum oder Sattelpunkt) annimmt, wobei x gleichzeitig die reelle Nebenbedingung g(x) = 0 erfüllt. Zur Veranschaulichung betrachten wir den zweidimensionalen Fall. Dann können wir in der zweidimensionalen x-Ebene die Höhenlinien von f einzeichnen. Zusätzlich können wir die Höhenlinie von g einzeichnen, für die g(x) = 0 ist. Auf dieser Nebenbedingungslinie suchen wir nach einem Extremwert von f. Ein solcher Extremwert ist dann erreicht, wenn die Nebenbedingungslinie g(x) = 0 gerade eine Höhenlinie von f tangential berührt, denn dann verändert sich f in erster Ordnung nicht, wenn wir entlang der Nebenbedingungslinie weitergehen. Nun steht der Gradientenvektor df/dx in jedem Punkt senkrecht auf der Höhenlinie von f durch diesen Punkt. Analog ist es bei g. Die Nebenbedingungslinie berührt also gerade in den Punkten eine Höhenlinie von f tangential, wenn die Gradientenvektoren von f und g dieser Punkte parallel zueinander sind. Es muss also eine reelle Zahl λ geben, so dass   df/dx = λ dg/dx   ist. Die Hilfsvariable λ heisst auch Lagrange-Multiplikator (siehe auch oben).

Einen Extremwert von f(x) unter der Nebenbedingung g(x) = 0 können wir also finden, indem wir das Gleichungssystem   df/dx = λ dg/dx   sowie   g(x) = 0   lösen. Dieses Gleichungssystem erhalten wir, wenn wir einen Extremwert der neuen Funktion   F(x, λ) := f(x) + λ g(x)   suchen, indem wir   dF/dx = 0   sowie   dF/dλ = 0   lösen.

Versuchen wir, diese Vorgehensweise auf den unendlichdimensionalen Fall zu übertragen. An die Stelle des n-dimensionalen Vektors x tritt die Potentialvektorfunktion A mit den vier Funktionswerten Aμ(x) für jeden Raum-Zeit-Punkt x = (ct,x) , und an die Stelle von f tritt das Wirkungsfunktional S[A] . Gesucht ist nach dem Variationsprinzip das Minimum von S[A] unter der Nebenbedingung   δμ Aμ(x) = 0  , denn wir wollen unter den gleichwertigen Lösungspotentiale der Maxwellgleichungen diejenigen ermitteln, die zugleich die Lorentzeichung erfüllen.

Es ist sinnvoll, die Nebenbedingung zunächst umzuformulieren und sie in einer ähnlichen Form wie die Wirkung zu schreiben. An Stelle von   δμ Aμ(x) = 0   fordern wir deshalb die Bedingung   g[A]   :=   − 1/2 ∫ d4x (δμ Aμ(x))2   =   0   (der Faktor − 1/2 erweist sich später als nützlich). Diese neue Bedingung ist gleichwertig zur Lorentzeichung, denn der Integrand   (δμ Aμ(x))2   ist immer größer oder gleich Null, so dass das Integral nur Null werden kann, wenn auch der Integrand gleich Null ist.

Wir wollen nun S[A] unter der Nebenbedingung g[A] = 0 minimieren. Nach der obigen Vorgehensweise ist dies gleichwertig zu der Aufgabe, das Minimum von   S'[A, λ] := S[A] + λ g[A]   in den Variablen A und λ zu ermitteln.

Schreiben wir S' zunächst einmal explizit auf:

S'[A, λ]   =   ∫ d4x   [ L( A(x) , δ A(x) )   −   λ/2 (δμ Aμ(x))2 ]

In den Euler-Lagrange-Gleichungen   dL/dAρ   − δσ dL/d(δσAρ)   =   δσ   [δσ Aρ − δρ Aσ]   −   jρ / c   =   0   (siehe oben) kommt daher beim Term   − δσ dL/d(δσAρ)   der neue Term   − δσ d/d(δσAρ) [− λ/2 (δμ Aμ(x))2]   =   λ δρμ Aμ(x))   hinzu, so dass die Maxwellgleichungen nun   δσ   [δσ Aρ − δρ Aσ]   −   jρ / c   +   λ δρμ Aμ)   =   0   lauten. Etwas anders geschrieben (mit Umbenennung der Indices: ρ wird zu ν, und doppelt vorkommende Indices heißen μ) erhalten wir:

δμ δμ Aν   +   (λ − 1)   δνμ Aμ)   =   jν / c

Dies sind die modifizierten Maxwellgleichungen, die aus dem Wirkungsprinzip und damit aus der Funktionalableitung   dS'[A]/dAν(x) = 0   folgen. Sie entsprechen der Gleichung   dF/dx = 0   im endlichdimensionalen Fall mit   F(x, λ) := f(x) + λ g(x)   (siehe oben). Die Gleichung   dF/dλ = 0   dagegen entspricht der Geichung   dS'[A, λ]/dλ = 0  , wobei wir es hier mit einer gewöhlichen partiellen Ableitung zu tun haben. Schauen wir uns diese Gleichung an:

dS'[A, λ]/dλ   =   g[A]   =   0

Diese Gleichung reproduziert die Lorentz-Eichbedingung δμ Aμ = 0, so dass sich damit auch wieder die üblichen Maxwellgleichungen   δμ δμ Aν   =   jν / c   in Lorentzeichung ergeben.

Schauen wir uns nochmal die modifizierten Maxwellgleichungen   δμ δμ Aν   +   (λ − 1)   δνμ Aμ)   =   jν / c   an. Wir bilden auf beiden Seiten die Viererdivergenz δν(..) und verwenden die Stromerhaltung δν jν = 0  . Ergebnis:   δμ δμ δν Aν   +   (λ − 1)   δν δνμ Aμ)   =   0  . Der erste und der letzte Term heben sich gegenseitig auf, so dass nur der λ-Term übrig bleibt. Division durch λ liefert dann

δν δνμ Aμ)   =   0

Dies ist eine homogene Wellengleichung für δμ Aμ . Verlangen wir nun zusätzlich die Randbedingung, dass δμ Aμ für große Zeitbeträge |t| gegen Null geht, so folgt aus der Wellengleichung, dass für alle Zeiten δμ Aμ = 0 gilt. Die Randbedingung genügt also, um zusammen mit den modifizierten Maxwellgleichungen (die eine Folge des Variationsprinzips sind) die Lorentzeichung zu reproduzieren. Damit erhalten wir auch die normalen Maxwellgleichungen zurück. Diesen Umstand kann man später für die Quantisierung nutzen.

Fassen wir kurz zusammen:


4.6   Hamiltonsche Formulierung der Elektrodynamik

Nach diesem ausführlichen und sicher nicht ganz einfachen Ausflug in verschiedene Aspekte der Eichfreiheit von A(x) wollen wir nun zu unserem eigentlichen Ziel zurückkehren: der Formulierung einer Quantentheorie der freien elektromagnetischen Felder.

Wir hatten oben bereits die kanonisch zu A(x) konjugierte Impulsvariable   πμ(x)   =   dLf / d(δ0Aμ(x))   =   dL / d(δ0Aμ(x))   =   Fμ0   formuliert, d.h. es ist   π = (πμ) = (0, E). Nun können wir weitergehen und auch die Hamiltonfunktion sowie die Poissonklammern konstruieren, vollkommen analog zur klassischen Mechanik, aber unter Verwendung der Funktionalableitung.

In der klassischen Mechanik war die Hamiltonfunktion H gegeben durch   H(p,v) := p v - L  . Analog ist jetzt das Hamiltonfunktional gegeben durch

Hf [π(ct, . ), A(ct, . )]   :=   ∫ d3x πμ0 Aμ)   −   Lf   =  

  =   ∫ d3x   [ Fμ00 Aμ)   +   1/4 Fμν Fμν   +   jμ Aμ / c ]

(das Integral ist das Analogon zur Indexsumme in   p v = ∑k pk vk ). Das Hamiltonfunktional ist als Funktional der Funktionen πμ(ct, . ) und Aμ(ct, . ) zu sehen, nicht aber von δ0 Aμ , denn δ0 Aμ soll ja gerade durch die obige Legendre-Transformation durch πμ ersetzt werden. Daher wollen wir H noch entsprechend umschreiben, so dass wir sehen, wie δ0 Aμ wegfällt.

Oben hatten wir bereits notiert, dass die Beziehung   Fμν   =   δμ Aν − δν Aμ   ausgeschrieben mit den Feldern E und B die Gleichungen

E   =   − dA0/dx − δ0 A
B   =   rot A

ergibt, so dass   1/4 Fμν Fμν = (-1/2) (E2B2)   mit   B = rot A   ist. Weiterhin ist   πμ0 Aμ)   =   − π δ0A   =   E ( dA0/dx + E )   . Insgesamt ist also

Hf   =   ∫ d3x   [ E ( dA0/dx + E )   −   (E2B2) / 2   +   jμ Aμ / c ]   =  

  =   ∫ d3x   [ E dA0/dx   +   (E2 + B2) / 2   +   jμ Aμ / c ]   =  

  =:   ∫ d3x   H( πμ(ct,x), Aμ(ct,x), δk Aμ(ct,x) )

mit der Hamiltondichte H sowie   E = π   und   B = rot A  . Es stört nicht, dass diese Formulierung nicht manifest kovariant ist, denn im Hamiltonformalismus ist (im Gegensatz zu den Euler-Lagrange-Gleichungen) die Zeit sowieso gegenüber dem Raum ausgezeichnet. Dies ist ein Nachteil des Hamiltonformalismus bei relativistischen Feldtheorien!

Schauen wir uns als nächstes die Hamiltonschen Bewegungsgleichungen an. Bei der klassischen Mechanik hatten wir   dp/dt = − dH/dx   sowie   dx/dt = dH/dp   . Das Analogon dazu in der Feldtheorie sind die Gleichungen   δ0 πμ(ct,x) = − dHf / dAμ(ct,x)   sowie   δ0 Aμ(ct,x) = dHf / dπμ(ct,x)   im Sinne der oben definierten Funktionalableitung. Analog zur Vorgehensweise oben bei der Definition von πμ können wir versuchen, die Funktionalableitungen des Hamiltonfunktionals Hf durch die partiellen Ableitungen der Hamiltondichte H ersetzen. Dabei muss man aber aufpassen, da es auch räumliche Ableitungen der Felder gibt. Die Hamiltondichte hängt nicht nur von πμ und Aμ ab, sondern auch von räumlichen Ableitungen von Aμ .

Räumliche Ableitungen von πμ treten in der Hamiltondichte nicht auf. Daher ist   dHf / dπμ(ct,x) = dH / dπμ(ct,x)   und somit

δ0 Aμ(ct,x)   =   dH / dπμ(ct,x)

Schauen wir uns nun den Term   dHf / dAμ(ct,x)   in der zweiten Hamilton-Gleichung an. Die Definition der Funktionalableitung ergibt:

dHf / dAμ [η]   =
  =   d/dε   Hf [.., Aμ + ε η, ..]   =
  =   d/dε   ∫ d3x   H(.., Aμ(ct,x) + ε η(ct,x), δk Aμ(ct,x) + ε δk η(ct,x) ..)   =
  =   ∫ d3x   d/dε   H(.., Aμ(ct,x) + ε η(ct,x), δk Aμ(ct,x) + ε δk η(ct,x) ..)   =
  =   ∫ d3x   [ dH/dAμ(ct,x))   η(ct,x)   +   dH/d(δkAμ(ct,x))   δk η(ct,x) ]   =
  =   ∫ d3x   [ dH/dAμ(ct,x))     −   δk dH/d(δkAμ(ct,x)) ]   η(ct,x)

Dabei haben wir im letzten Schritt den zweiten Term partiell integriert und angenommen, dass der Term   ∫ d3x   δk [dH/d(δkAμ(ct,x)) η(ct,x) ]   gleich Null ist. Dies ist nach dem Gauss'schen Satz gleichbedeutend damit, dass das Oberflächenintegral des Flusses   dH/d(δkAμ(ct,x)) η(ct,x)   über den unendlich fernen Rand des dreidimensionalen Raums verschwindet. Dieses Argument kennen wir bereits von der Herleitung der Euler-Lagrange-Gleichungen: es entspricht einer Forderung an die Variation η(ct,x) , die für unendlich ferne Raumpunkte hinreichend schnell gegen Null gehen muss.

Der Vergleich mit der Integralschreibweise   dHf / dAμ [η]   =   ∫ d3x   dHf / dAμ(ct,x)   η(ct,x)   der Funktionalableitung liefert:

dHf / dAμ(ct,x)   =   dH/dAμ(ct,x))     −   δk dH/d(δkAμ(ct,x))

mit der üblichen Summation über doppelte Indices (der Index k läuft dabei wie immer von 1 bis 3). Die Gleichung   δ0 πμ(ct,x) = − dHf / dAμ(ct,x)   wird damit zu

δ0 πμ(ct,x)   =   − dH/dAμ(ct,x))     +   δk dH/d(δkAμ(ct,x))

Rechnen wir nun die Terme aus -- wir beginnen mit der einfacheren Hamiltongleichung   δ0 Aμ(ct,x)   =   dH / dπμ(ct,x)   mit
  H   =   E dA0/dx   +   (E2 + B2) / 2   +   jμ Aμ / c  
und   B = rot A   sowie   (πμ) = (0, E)  .
Diese Gleichung macht nur für μ ungleich Null Sinn, denn π0 ist keine dynamische Variable (es war ja generell π0 = 0 ). Für μ = k (mit Werten von 1 bis 3) haben wir
  dH / dπk   =   − dH / dπk   =   − dH / dEk   =   − (δk A0 + Ek)  
d.h. die erste Hamiltongleichung   δ0 Aμ(ct,x)   =   dH / dπμ(ct,x)   lautet:

δ0 A   =   − (dA0/dx + E)

Diese Gleichung entspricht der Gleichung   E   =   − dA0/dx − δ0 A  , die wir oben aus der Gleichung   Fμν   =   δμ Aν − δν Aμ   erhalten haben. Damit repräsentiert die Gleichung gleichsam die homogenen Maxwellgleichungen, die eine Einführung der Potentiale erst ermöglichen. Die andere Gleichung   B = rot A   ist sowieso implizit mit dabei, denn im Hamiltonformalismus gibt es ja nur die dynamischen Variablen   (πμ) = (0, E)   sowie   Aμ   , d.h.   B   ist genau genommen oben immer durch   rot A   zu ersetzen.

Schauen wir uns nun die zweite Hamiltongleichung   δ0 πμ(ct,x)   =   − dH/dAμ(ct,x))     +   δk dH/d(δkAμ(ct,x))   an. Für μ = 0 ergibt sich wegen   δ0 π0 = 0   die Gleichung   − j0/c + div E = 0  , d.h. wir erhalten die bekannte inhomogene Maxwellgleichung

div E   =   j0/c   =   ρ

und haben damit unsere Nebenbedingung   dG/dA0(ct,x)   =   − d/dx ( dA0/dx   +   δ0 A)   −   ρ   =   div E   −   ρ   =   0   von weiter oben reproduziert.

Nun zu den räumlichen Komponenten μ = k :   Der erste Term ergibt
  − dH/dAk   =   dH/dAk   =   d/dAk (ρ A0j A/c)   =   − jk/c  
Der zweite Term ergibt
  δp dH/d(δpAk)   =   − δp d/d(δpAk) 1/2 (rot A)2   =   − δp (rot A)q d/d(δpAk) (rot A)q   =   [rot (rot A)]k
so dass sich insgesamt die Gleichung

δ0 π   =   δ0 E   =   − j/c + rot (rot A)

ergibt. Dies ist gerade die zweite inhomogene Maxwellgleichung   rot B   =   j/c + dE/(c dt)  .

Fassen wir zusammen:

  • Der zu Aμ kanonisch konjugierte Impuls lautet

    πμ(ct,x)   :=   dLf / d(δ0Aμ(ct,x))   =   dL / d(δ0Aμ(ct,x))   =   Fμ0

    so dass   (πμ)   =   (0,E)   ist.

  • Das Hamiltonfunktional der Elektrodynamik lautet

    Hf   =   ∫ d3x   [ E dA0/dx   +   (E2 + (rot A)2) / 2   +   jμ Aμ / c ]   =  

      =:   ∫ d3x   H( πμ(ct,x), Aμ(ct,x), δk Aμ(ct,x) )

    mit der Hamiltondichte H .

  • Die erste Hamilton-Gleichung

    δ0 Aμ(ct,x)   =   dHf / dπμ(ct,x)     =   dH / dπμ(ct,x)

    macht wegen   π0 = 0   nur für die räumlichen Komponenten   μ = k   Sinn und reproduziert die Gleichung

    δ0 A   =   − (dA0/dx + E)

    was in der Gleichung   Fμν   =   δμ Aν − δν Aμ   enthalten ist. Diese Gleichung repräsentiert die homogenen Maxwellgleichungen.

  • Die zweite Hamilton-Gleichung

    δ0 πμ(ct,x)   =   − dHf / dAμ(ct,x)   =   − dH/dAμ(ct,x))     +   δk dH/d(δkAμ(ct,x))

    reproduziert die Gleichungen

    div E   =   j0/c   =   ρ

    δ0 π   =   δ0 E   =   − j/c + rot (rot A)

    Dabei haben wir für die erste Gleichung das Zusatzwissen   π0 = 0   verwendet. Diese beiden Gleichungen repräsentieren die inhomogenen Maxwellgleichungen.


4.7   Poissonklammern und kanonische Quantisierung: Vorüberlegungen

Für die Quantisierung im Hamiltonformalismus benötigen wir die Poissonklammern, die wir in die entsprechenden Kommutatoren von zugehörigen Operatoren übersetzen müssen. Die Poissonklammer der klassischen Mechanik lautete   { H, f }   :=   df/dx dH/dp − df/dp dH/x   =   ∑k df/dxk dH/dpk − df/dpk dH/xk  , so dass aufgrund der Hamiltonschen Bewegungsgleichungen die Zeitentwicklung von f als   df/dt = { H, f }   geschrieben werden kann. Sowohl f als auch H sind auf dem Phasenraum definierte Funktionen, also bei einem Teilchen im dreidimensionalen Raum abhängig von x und p.

Versuchen wir, analog eine Poissonklammer für Funktionale der Funktionen πμ(ct, . ) und Aμ(ct, . ) abzuleiten. Starten wir also mit einem Funktional   F[ πμ(ct, . ), Aμ(ct, . ) ]   und untersuchen die zeitliche Ableitung:

δ0 F   =   ∫ d3x   { dF/dπμ(ct,x)   δ0 πμ(ct,x)   +   dF/dAμ(ct,x)   δ0 Aμ(ct,x) }

  =   ∫ d3x   { − dF/dπμ(ct,x)   dHf /dAμ(ct,x)   +   dF/dAμ(ct,x)   dHf /dπμ(ct,x) }

In diesem Ausdruck gibt es allerdings ein Problem: Funktionalableitungen nach   πμ(ct,x)   sind nur für die drei räumlichen Komponenten definiert, nicht aber für   μ = 0   , denn   π0 = 0   ist keine dynamische Variable des Systems. Andererseits war die Information   π0 = 0   in den Hamiltonschen Bewegungsgleichungen auch gar nicht enthalten, sondern sie musste separat hinzugefügt werden. Erst dann ergab sich aus der Gleichung   δ0 π0(ct,x)   =   − dHf / dA0(ct,x)   die inhomogene Maxwellgleichung   div E   =   j0/c  . Irgendwie spielen also sowohl π0 als auch A0 eine Sonderrolle. Sie scheinen beide als dynamische Variable ungeeignet zu sein.

Schauen wir uns zunächst noch einmal das Hamiltonfunktional an:

Hf   =   ∫ d3x   [ E dA0/dx   +   (E2 + (rot A)2) / 2   +   jμ Aμ / c ]

Den ersten Term können wir umschreiben:   E dA0/dx   =   div (E A0) − (div E) A0  . Der Term   ∫ d3x div (E A0)   ist nach dem Gauss'schen Satz gleich dem Integral des Flusses   E A0   durch den unendlich fernen Rand des dreidimensionalen Raums. Wie immer nehmen wir an, dass E sowie A0 zusammen hinreichend schnell im Unendlichen verschwinden, so dass dieses Integral gleich Null ist. Damit können wir das Hamiltonfunktional wie folgt umschreiben:

Hf   =   ∫ d3x   [ A0 (div E + j0/c)   +   (E2 + (rot A)2) / 2   −   j A / c ]

Gleichwertig zu   π0 = 0   können wir   div E   =   j0/c   als Randbedingung fordern und damit formal den Freiheitsgrad A0 eliminieren. Auf den Feldern, die die Randbedingung erfüllen, lautet dann das Hamiltonfunktional

Hf [E(ct, . ), A(ct, . )] |div E = j0/c   =   ∫ d3x   [ (E2 + (rot A)2) / 2   −   j A / c ]

Es enthält nur noch die raumlichen Komponenten   E(ct, . ) = π(ct, . )   sowie   A(ct, . )  . Die Hamiltongleichungen bleiben dabei dieselben, nur die Gleichung   δ0 π0(ct,x)   =   − dHf / dA0(ct,x)   entfällt und wird durch die Randbedingung   div E   =   j0/c   ersetzt.

Können wir nun die Poissonklammer aufstellen? Die erste Idee wäre, in der Poissonklammer einfach die Terme mit   μ = 0   wegzulassen. Doch was ist mit der A0-Abhängigkeit von F ? Die Poissonklammer kann nicht mehr erfassen, wenn sich F aufgrund der Zeitabhängigkeit von A0 mit der Zeit ändert. Generell hat man auch keine Gleichung für die Zeitabhängigkeit von A0 mehr, denn das Hamiltonfunktional auf dem Raum der Felder mit Nebenbedingung enthält A0 nicht mehr. Es sieht so aus, als ob man eine Zusatzbedingung für Aμ benötigt, um aus A den Wert von A0 bestimmen zu können, so dass die A0-Abhängigkeit von F auf die Abhängigkeit von A zurückgeführt werden kann. Solche Bedingungen kennen wir bereits: wir haben sie oben als Eichbedingungen bezeichnet. Sie dienen dazu, die Eichfreiheit von Aμ einzuschränken.

Um all diese Fragen systematisch zu klären, muss man untersuchen, wie der Übergang vom Lagrangeformalismus zum Hamiltonformalismus funktioniert, wenn im Lagrangeformalismus Nebenbedingungen auftreten. Die entsprechende Theorie wird als Dirac's Theorie der Nebenbedingungen (Dirac's Theory of Constraints) bezeichnet. Als Ergebnis liefert sie eine passende Poissonklammer (Dirac-Klammer), die die Randbedingungen berücksichtigt.

Es würde zu weit führen, diesen Zugang hier konsequent weiterzuverfolgen, zumal die kanonische Quantisierung bei allgemeineren (nichtlinearen) Yang-Mills-Theorien sowieso zu Problemen führt. In der physikalischen Literatur geht man hier meist recht pragmatisch vor: Man legt eine Eichung für Aμ ganz oder teilweise fest und versucht, eine passende Poissonklammer zu erraten, die damit verträglich ist. Anschließend geht man zur Quantentheorie über, indem man die dynamischen Variablen durch Operatoren und die Poissonklammer durch den Kommutator dieser Operatoren ersetzt. Nun muss man noch einen passenden Hilbertraum dazu finden. Sollte die Eichfreiheit nur teilweise fixiert worden sein, so muss man nun die Eichfreiheit vollständig fixieren, indem man durch eine passende Bedingung einen Unterraum des Hilbertraums auswählt. Nur Vektoren aus diesem Unterraum entsprechen quantenmechanischen Zuständen.


4.8   Poissonklammern und kanonische Quantisierung in der Eichung A0 = 0

Ein erstes Beispiel: Wir gehen zur freien Theorie über, indem wir   jμ = 0   setzen. Von oben wissen wir, dass wir dann die Eichung teilweise durch die Bedingung   A0 = 0   festlegen können, was gut zu   π0 = 0   passt. Damit sind zeitabhängige Umeichungen ausgeschlossen. Zeitunabhängige Umeichungen sind dagegen weiterhin möglich und müssen später fixiert werden.

Die Eichbedingung   A0 = 0   hat den Vorteil, dass wir in unserer obigen Poissonklammer die Terme mit μ = 0 weglassen können, denn sowohl π0 als auch A0 sind aus der Theorie eliminiert worden. Wir setzen außerdem noch π = E ein und erhalten für die Poissonklammer:

δ0 F[ E(ct, . ), A(ct, . ) ]   =  

  =   ∫ d3x   { − dF/dEk(ct,x)   dHf /dAk(ct,x)   +   dF/dAk(ct,x)   dHf /dEk(ct,x) }   =  

  =:   {Hf , F}

mit     Hf [E(ct, . ), A(ct, . )]   =   ∫ d3x   [ (E2 + (rot A)2) / 2   −   j A / c ]   und   A0 = 0

sowie der Nebenbedingung   div E   =   0  

mit der Summe über den doppelten Index k (von 1 bis 3). Die Zeitentwicklung aufgrund dieser Poissonklammer führt dann nicht aus der Eichung   A0 = 0   heraus, denn die Poissonklammer beeinflusst A0 überhaupt nicht -- wir haben durch die Eichung ja A0 als dynamische Variable komplett elimimiert.

Die Nebenbedingung   div E = 0   wollen wir erst zu einem späteren Zeitpunkt (nach der Quantisierung) explizit einbauen, da sie ja in der Eichung   A0 = 0   nicht mehr durch irgendeine Hamiltongleichung reproduziert werden kann und auch in der Zeitentwicklung aufgrund der Poissonklammer nicht enthalten ist. Wir sollten aber überprüfen, ob die Zeitentwicklung mit der Nebenbedingung verträglich ist. Dazu können wir beispielsweise   F = ∫ d3x (div E)2   setzen und die Poissonklammer {Hf , F} ausrechnen. Es ergibt sich, dass wenn   F = 0   für eine Zeit t gilt (d.h.   div E = 0   für eine Zeit t ), daraus   δ0 F = {Hf , F} = 0   folgt, so dass   F = 0   und damit   div E = 0   für alle Zeiten gilt.

Für die Quantisierung benötigen wir die Poissonklammer zwischen den dynamischen Variablen Am(ct,x) und En(ct,x) . In der klassischen Mechanik sind pm(t) und xn(t) selbst bereits Funktionen auf dem Phasenraum, so dass man direkt zur Poissonklammer übergehen kann. Dies ist bei den Feldern anders. Wir müssen hier zunächst passende Funktionale definieren und können dann erst zur Poissonklammer übergehen.

Oben haben wir gesehen, wie man jeder Funktion über ein Integral ein lineares Funktional zuordnen kann. Entsprechend definieren wir die folgenden linearen Funktionale:

Am[φ]   :=   ∫ d3x   Am(ct,x) φ(x)

En[ξ]   :=   ∫ d3x   En(ct,x) ξ(x)

Dabei bezeichnet man φ(x) und ξ(x) als Testfunktionen. Sie dienen letztlich dazu, einen gewissen Raumbereich mit einer bestimmten Empfindlichkeit (gegeben durch φ(x) bzw. ξ(x) ) gleichsam nach den Feldern Am(ct,x) bzw. En(ct,x) abzutasten.

Nun können wir die Poissonklammer   {En[ξ] , Am[φ]}   berechnen:

  {En[ξ] , Am[φ]}   =  
  =   ∫ d3x   { − dAm[φ]/dEk(ct,x)   dEn[ξ] /dAk(ct,x)   +  
                  +   dAm[φ]/dAk(ct,x)   dEn[ξ] /dEk(ct,x) }   =  
  =   ∫ d3x   φ(x) δmk   ξ(x) δnk   =   ∫ d3x φ(x) ξ(x) δnm

mit dem Kroneckersymbol δnm = 1 für n = m und Null sonst. Im letzten Schritt haben wir verwendet, dass für ein lineares Funktional   F[Φ] = ∫ dx   f(x) Φ(x)   gilt:   dF/dΦ(x)|Φ = f(x)   (dies hatten wir weiter oben bereits hergeleitet).

Nun ist die Poissonklammer zweier linearer Funktionale insgesamt selbst ein bilineares Funktional, das den beiden Testfunktionen ξ und φ eine reelle Zahl zuordnet. Also liegt es nahe, dieses bilineare Funktional analog zu den linearen Funktionalen als Integral mit einem Integralkern zu schreiben, allerdings als zweifaches Integral:

  {En[ξ] , Am[φ]}   =  
  =:   ∫ d3x   ∫ d3x'   {En(ct,x) , Am(ct,x')}   ξ(x) φ(x')

Diese Gleichung definiert den Integralkern   {En(ct,x) , Am(ct,x')}  . Der Vergleich mit unserem Ergebnis oben ergibt:

{En(ct,x) , Am(ct,x')}   =   δnm δ(x - x')

Diese Gleichung ist das Analogon zu   {pn , xm} = δnm   aus der Mechanik, wobei der kontinuierliche Index zur zusätzlichen Delta-Funktion (genauer: Distribution) führt. Man muss allerdings bei Gleichungen wir der obigen aufpassen, denn hier werden in der Poissonklammer zwei lineare Funktionale (Distributionen) miteinander multipliziert, um ein bilineares Funktional zu konstruieren. Der Integralkern   {En(ct,x) , Am(ct,x')}   dieses bilinearen Funktionals ist ein singuläres Objekt, also keine Funktion mehr. Bei einer mathematisch sauberen Vorgehensweise müsste man nun untersuchen, was bei der Multiplikation von Distributionen zu beachten ist. In der Physik tut man dies meist nicht, sondern geht recht unbefangen mit solchen Ausdrücken um, da die mathematisch saubere Vorgehensweise recht aufwendig ist. Dies kann aber zu Problemen führen, wenn man zur Quantentheorie übergeht, denn es treten oft Singularitäten auf, die die berechneten Ausdrücke zunächst unbrauchbar machen können. In diesem Fall muss man nachträglich den Aufwand betreiben, der Theorie durch das Verfahren der Renormierung wieder einen Sinn zu geben. Dabei werden die Singularitäten schrittweise aus den physikalisch beobachtbaren Größen entfernt (siehe auch Das Unteilbare, Kapitel 7.3 Der Umgang mit divergierenden Graphen: Renormierung ).

Nun können wir versuchen, mit Hilfe der kanonischen Quantisierung zu einer Quantentheorie der freien Elektrodynamik überzugehen. Erinnern wir uns an das Rezept dazu aus dem letzten Kapitel:

  • Kochrezept zur Konstruktion von Quantentheorien, die im klassischen Grenzfall in eine bekannte klassische Theorie übergehen sollen (kanonische Quantisierung):
    Beim Übergang von einer klassischen Theorie zu der entsprechenden Quantentheorie werden die Poissonklammern   { , }   der Phasenraumfunktionen durch Kommutatoren   i / h/2 π [ , ]   der entsprechenden quantenmechanischen Operatoren ersetzt.

Wir ordnen also den linearen Funktionalen   Am[φ(ct, . )]   und En[ξ(ct, . )]   lineare Operatoren zu, die wir mit den gleichen Buchstaben bezeichnen wollen. Genauer müsste man bei Am und En von operatorwertigen Distributionen sprechen, also von linearen Abbildungen, die einer Testfunktion einen linearen Operator auf einem Hilbertraum zuordnen.

Diese Operatoren müssen nun die Vertauschungsrelation

  [ En[ξ] , Am[φ] ]   =   h/2 π i   ∫ d3x   φ(x)   ξ(x)   δnm

erfüllen. Physiker verwenden wieder gerne die Integralschreibweise und definieren die Operatoren   Am(x)   und   En(x)   analog zu oben über
Am[φ]   :=   ∫ d3x   Am(x) φ(x)
  En[ξ]   :=   ∫ d3x   En(x) ξ(x)

Dabei sind   Am(x)   und   En(x)   als Integralkerne operatorwertiger Distributionen zu verstehen, so wie wir das oben definiert hatten. Es gilt die Vertauschungsrelation

[ En(x) , Am(x') ]   =   h/2 π i   δnm δ(x - x')

wobei dieser Ausdruck für   x = x'   zunächst gar nicht definiert ist. Einen Sinn erhält er erst über die Integralschreibweise weiter oben.


Bleibt die Aufgabe, einen Hilbertraum zu konstruieren, auf dem sich die Operatoren mit den gewünschten Vertauschungsrelationen realisieren lassen. Dies ist im Allgemeinen keineswegs einfach. Es bedeutet letztlich, die Existenz einer entsprechenden Quantentheorie (konstruktiv) nachzuweisen. Genau dies ist für allgemeinere Eichtheorien der Inhalt des Millenium Prize Problems.

Im Fall des freien elektromagnetischen Feldes ist es glücklicherweise möglich, den Hilbertraum explizit anzugeben. In der oben gewählten Eichung mit   A0 = 0   geht das vollkommen analog zum Hilbertraum der Mechanik (siehe z.B. Quantisation of Gauge Fields, http://w3.physics.uiuc.edu/~efradkin/phys483/483-chapter9.ps):

An die Stelle der komplexwertigen Wellenfunktion ψ(x) der Mechanik tritt nun ein komplexwertiges Funktional ψ[A] , denn die unendlich vielen dynamischen Größen   A(ct,x)   der klassischen Feldtheorie (gesehen als Funktion der Zeit t mit dem Index x ) entsprechen den drei Funktionen xi(t) mit i = 1, 2, 3 der klassischen Mechanik. Das Funktional ψ[A] ordnet also jeder reellen Funktion   A(x)   (gesehen als unendlich-dimensionalen Vektor mit Index x ) eine komplexe Zahl zu.

In der Quantenmechanik ist das Skalarprodukt gegeben durch

áφ|ψñ   =   ∫ d3x [φ(x)]* ψ(x)

wobei der Stern die komplexe Konjugation bezeichnet (also (a + i b)* = a - i b ). Analog dazu ist das Skalarprodukt zwischen zwei Funktionalen der Elektrodynamik in der Eichung   A0 = 0   gegeben durch

áφ|ψñ   =   ∫ DA (φ[A])* ψ[A]

Dabei ist das Integrationsmaß DA das unendlich-dimensionale Analogon zum Maß d3x . Das Maß DA misst in gewissem Sinn das Volumen im unendlich-dimensionalen Funktionenraum der Funktionen   A(x)   . Die mathematisch präzise Definition dieses Maßes ist nicht unproblematisch, da es wegen der unendlich vielen Dimensionen des Funktionenraums schnell zu Divergenzen kommt. Physiker lassen sich zumeist von der Analogie zum dreidimensionalen Maß d3x leiten. Dazu kann man beispielsweise den Raum mit einem feinen Gitter überziehen und nur die Felder   A(x)   an den Gitterpunkten xi betrachten -- wir kennen diese Überlegung bereits von oben. Aus dem Integral wird dann:

áφ|ψñ   =   ∫   d3A1 d3A2 d3A3 ...   (φ[A1, A2, ...])*   ψ[A1, A2, ...]

mit   Ai = A(xi)  . Auf Details wollen wir hier nicht eingehen.

Bezeichnen wir den Feldoperator mit Ajop(x) , um ihn vom Argument des Funktionals zu unterscheiden. Wir definieren ihn als   (Ajop(x) ψ)[A] := Aj(x) ψ[A]   analog zum Ortsoperator in der Mechanik. Entsprechend definieren wir auch das Analogon zum Impulsoperator als   (Ejop(x) ψ)[A] := h / 2 π i   dψ[A] / dAj(x)   im Sinne der Funktionalableitung. Man kann nun nachrechnen, dass die Vertauschungsrelationen erfüllt sind -- wir wollen das hier überspringen.

Schaut man sich den gerade konstruierten Hilbertraum näher an, so stellt man fest, dass er zu groß ist, denn der Raum der Funktionen A(x) umfasst sehr viele physikalisch gleichwertige Potentiale. Erinnern wir uns: zeitunabhängige Eichtransformationen der Potentiale sind immer noch möglich.

Um den Hilbertraum geeignet einzuschränken, erinnern wir uns daran, dass wir die Nebenbedingung   div E = 0   noch gar nicht in die Theorie eingebaut haben. Dies können wir nun dadurch versuchen, dass wir für die physikalisch sinnvollen Hilbertraumvektoren die Nebenbedingung

(div Eop) ψ[A])   =   0

fordern und dadurch einen Hilbert-Unterraum definieren. Die Divergenz des Operators kann man dabei beispielsweise durch Fouriertransformation definieren. Auf Details möchte ich hier wieder verzichten. Die obige Forderung garantiert, dass im eingeschränkten Hilbertraum der Erwartungswert des Operators   div Eop   gleich Null ist und somit die Nebenbedingung im klassischen Grenzfall reproduziert wird.

Interessant ist, dass der Operator   div Eop   die zeitunabhängigen Eichtransformationen generiert. Die Bedingung   (div Eop) ψ[A]) = 0   fixiert in diesem Sinne in der Quantentheorie die Eichung der Zustände. Das wird auch in der klassischen Theorie deutlich, denn es gilt ja die allgemeine Gleichung (siehe die erste Hamiltonsche Gleichung oben)   E   =   − dA0/dx − δ0 A  . In der Eichung   A0 = 0   wird daraus   E   =   δ0 A  . Diese Gleichung ist in unseren Zeitentwicklungsgleichungen mit der Poissonklammer enthalten, d.h. wir können sie hier verwenden. Die Nebenbedingung   div E = 0   bewirkt demnach die Eichung   div A = const  , was mit   A0 = 0   nach Wahl der Konstante die Eichung endgültig festlegt. Umgekehrt bewirkt die Wahl der Konstanten (z.B. in Form der Coulombeichung   div A = 0  , siehe weiter unten) und damit die Festlegung der Eichung (zusammen mit   A0 = 0  ) automatisch, dass   div E = 0   gilt.

Als weiteren Schritt muss man sich nun die Zeitentwicklung der Zustände aufgrund des Hamiltonoperators ansehen. Diese Zeitentwicklung muss man auf den Unterraum der erlaubten Zustände projezieren, so dass die Nebenbedingung   (div Eop) ψ[A]) = 0   beibehalten wird. Diese Projektion entspricht damit einer Umeichung, die das zeitliche Herauslaufen aus der Eichbedingung korrigiert.

Man kann nun alle Operatoren in Fourierkomponenten zerlegen, die nur auf dem physikalischen Hilbert-Unterraum wirken. Dies kann man so durchführen, dass Operatoren entstehen, die bestimmte einfache Vertauschungsrelationen erfüllen. Man bezeichnet diese Operatoren als Erzeugungs- und Vernichtungsoperatoren, denn sie sorgen für die Besetzung (bzw. die Nicht-Besetzung) von Hilbertraumzuständen, die man direkt mit physikalischen Teilchen identifizieren kann. Diese Zustände besitzen nämlich ein bestimmtes Transformationsverhalten bei Poincaretransformationen, so dass man ihnen eine Masse und eine Helizität zuordnen kann. Wir erinnern uns an den allgemeinen Rahmen von Quantenfeldtheorien aus dem vorletzten Kapitel: Die Darstellungstheorie der Poincaregruppe auf Hilberträumen führt dazu, dass es in jedem Hilbertraum Basisvektoren gibt, die sich durch Zahlen wie Impuls und Masse sowie Spin bzw. Helizität kennzeichnen lassen. Diese Vektoren interpretiert man als Zustände physikalischer Teilchen. Um also eine Quantentheorie physikalisch interpretieren zu können, muss man am Schluss in der Lage sein, solche Teilchenzustände im Hilbertraum zu identifizieren und die Wirkung der Operatoren auf diesen Zuständen angeben zu können (z.B. indem man sie mit Hilfe von Erzeugungs- und Vernichtungsoperatoren schreibt, die sich auf diese Zustände beziehen). Dies ist im Fall der freien Elektrodynamik alles möglich! Damit wäre die Quantisierung der freien Elektrodynamik erfolgreich durchgeführt.


4.9   Poissonklammern und kanonische Quantisierung in der Strahlungseichung

Es gibt noch weitere Möglichkeiten, zu einer Quantentheorie der freien Elektrodynamik zu gelangen. Eine sehr beliebte Methode besteht darin, vor der Quantisierung die Eichung des Potentials komplett festzulegen, und dann erst die Quantisierung durchzuführen. Eine Möglichkeit, die Eichung bei Abwesenheit von Ladungen und Strömen vollständig zu fixieren, haben wir oben bereits kennengelernt: die Strahlungseichung. Dabei wird neben   A0 = 0   noch die Lorentzbedingung   δμ Aμ(x) = 0   gefordert. Wegen   A0 = 0   kann man statt der Lorentzbedingung auch die Coulombeichung   div A = 0   verwenden.

In der Strahlungseichung muss man sich genaue Gedanken über die Poissonklammer machen, damit die damit verbundene Zeitentwicklung nicht aus der Eichbedingung hinausführt. Methodisch sauber müsste man dazu Dirac's Theorie der Nebenbedingungen (Dirac's Theory of Constraints) anwenden -- in der Physik geht man meist pragmatischer vor und errät eine passende Poissonklammer. Dazu stellen wir die folgende Überlegung an:

Allgemein kann man die Funktion   A(x)   in zwei Bestandteile aufteilen: einen divergenzfreien transversalen Anteil   AT(x)   mit   div AT = 0   und einen rotationsfreien longitudinalen Anteil   AL(x)   mit   rot AL = 0   . Dabei ist   A(x) = AL(x) + AT(x)  .

Um diese Aufteilung konkret zu machen, geht man durch Fouriertransformation zur Impulsdarstellung aller Größen über:

  A(x)   =   N   ∫ d3p ei px A'(p)  

mit dem Normierungsfaktor   N = 1/(2 π)3/2  . Das hat den Vorteil, dass Gradienten, Divergenzen usw. durch normale Multiplikationen ersetzt werden. Die Bedingung   div AT(x) = 0   wird dann zur Bedingung   p A'T(p) = 0  , und   rot AL(x) = 0   wird zur Bedingung   p × A'L(p) = 0  .

Wir können nun in der Impulsdarstellung leicht Projektionsoperatoren definieren, die den longitudinalen bzw. den transversalen Anteil herausprojezieren:

  A'L(p)   =   PL(p) A'(p)   =   (p A'(p)) p / p2

  A'T(p)   =   PT(p) A'(p)   =   (1 − PL(p)) A'(p)

mit p2 = p2 . Anschaulich ermittelt PL(p) die Komponente des Vektors A'(p) in Richtung von p, während PT(p) die Komponente senkrecht zu diesem Vektor ergibt. Die Projektionsoperatoren PL(p) und PT(p) kann man dabei auch als reelle 3 × 3 -Matrizen schreiben (was die obigen Formeln reproduziert):

  [PL(p)]i j   =   pi pj / p2

  [PT(p)]i j   =   δi j − pi pj / p2

Analog definieren wir im Ortsraum dann die Operatoren PL und PT :

  AL(x)   =   [PL A](x)   =   N   ∫ d3p ei px PL(p) A'(p)

  AT(x)   =   [PT A](x)   =   N   ∫ d3p ei px PT(p) A'(p)

Dies können wir nun für die Zeitentwicklung verwenden. In der Eichung   A0 = 0   war diese Zeitentwicklung gegeben durch die Poissonklammer von oben, d.h. (siehe oben)   δ0 F[ E(ct, . ), A(ct, . ) ]   =   {Hf , F}   mit der Nebenbedingung   div E   =   0  . Für F setzen wir nun das Funktional   Am[φ]   =   ∫ d3x   Am(ct,x) φ(x)   ein:

  δ0 ∫ d3x   Am(ct,x) φ(x)   =   {Hf , ∫ d3x   Am(ct,x) φ(x) }   =:   ∫ d3x   {Hf , Am(ct,x)} φ(x)

wobei das letzte Gleichheitszeichen die Poissonklammer   {Hf , Am(ct,x)}   definiert (was wegen der Bi-Linearität der Poissonklammer kein Problem ist). Da diese Gleichung für beliebige Testfunktionen φ gelten muss, folgt:

  δ0 Am(ct,x)   =   {Hf , Am(ct,x)}

oder in Vektorschreibweise (die alle drei Gleichungen oben zusammenfasst)

  δ0 A(ct,x)   =   {Hf , A(ct,x)}

Nun wollen wir verhindern, dass die Zeitentwicklung von A aus der Eichung   div A = 0   herausführt. Wir definieren daher eine neue Zeitentwicklung δ0T, die anschließend an die obige Zeitentwicklung noch eine Projektion auf die transversale Komponente enthält (was einer Umeichung von A entspricht, so dass die Eichbedingung wieder erfüllt ist):

  δ0T A(ct,x)   :=   [PT δ0 A](ct,x)   =   PT {Hf , A(ct,x)}   =:   {Hf , A(ct,x)}T

wobei wir mit dem letzten Term die transversale Poissonklammer   { , }T   definiert haben. Halten wir also fest:

  • Um die Eichbedingung   div A = 0   zu gewährleisten, muss die Poissonklammer   { , }   durch die transversale Poissonklammer   { , }T   ersetzt werden. Diese transversale Poissonklammer bestimmt nun die Zeitentwicklung.

Dies ist glücklicherweise konsistent mit der Nebenbedingung   div E = 0  , die damit gleichzeitig ebenfalls berücksichtigt ist, denn die transversale Poissonklammer sorgt dafür, dass die Zeitentwicklung   δ0T E(ct,x)   =   {Hf , E(ct,x)}T   nicht aus dieser Nebenbedingung hinausführt.

Generell ist durch die Strahlungseichung   div A = 0   und   A0 = 0   sowieso gewährleistet, dass die Nebenbedingung   div E = 0   erfüllt ist (dies haben wir weiter oben bereits gesehen). Grund war die erste Hamiltonsche Gleichung   E   =   − dA0/dx − δ0 A  , die in der Strahlungseichung direkt   div E = 0   ergibt. In der Strahlungseichung braucht man also die Nebenbedingung   div E = 0   nicht mehr separat zu betrachten.

Schauen wir uns die folgende transversale Poissonklammer an:

  {En[φ] , A(ct,x)}T   =  
  =:   ∫ d3x'   {En(ct,x') , A(ct,x)}T   φ(x')   =  
  =   PT {En[φ] , A(ct,x)}   =:  
  =   PT   ∫ d3x'   {En(ct,x') , A(ct,x)}   φ(x')   =  

... wir verwenden nun, dass (siehe oben)  { En(ct,x') , Am(ct,x)}   =   δnm δ(x' - x)   ist und somit   {En(ct,x') , A(ct,x)}   =   en δ(x' - x)   mit dem Einheits-Basisvektor en, d.h.   (en)m = δnm :

  =   PT   ∫ d3x'   en δ(x' - x)   φ(x')   =  
  =   PT     en φ(x)   =  

... wir verwenden   φ(x)   =   N   ∫ d3p   ei p x   φ'(p)   und die Definition von PT

  =   N   ∫ d3p   ei p x   PT(p)   en φ'(p)   =  

... nun verwenden wir   φ'(p)   =   N   ∫ d3x'   e-i p x'   φ(x')  

  =   N2   ∫ d3x'   ∫ d3p   ei p (xx')   PT(p)   en φ(x')

Vergleichen wir diesen Ausdruck mit der zweiten Zeile unserer Berechnung, so erhalten wir
  ∫ d3x'   {En(ct,x') , A(ct,x)}T   φ(x')   =   N2   ∫ d3x'   ∫ d3p   ei p (xx')   PT(p)   en φ(x')
und somit
  {En(ct,x') , A(ct,x)}T   =   N2   ∫ d3p   ei p (xx')   PT(p)   en

Nun ist die m-te Komponente
  [PT(p)   en]m   =   [PT(p)]mn   =   δmn − pm pn / p2
(siehe oben), so dass wir schließlich das folgende Ergebnis für die transversale Poissonklammer erhalten:

{En(ct,x') , Am(ct,x)}T   =   N2   ∫ d3p   ei p (xx')   (δmn − pm pn / p2)

Vergleichen wir dies mit der ursprünglichen (nichttransversalen) Poissonklammer

{En(ct,x') , Am(ct,x)}   =   δmn δ(xx')   =   N2   ∫ d3p   ei p (xx')   δmn

so erkennen wir den Unterschied: Im Fourierintegral der Deltafunktion wird die Einheitsmatrix durch die Projektionsmatrix PT(p) ersetzt. Man spricht auch von der transversalen Deltafunktion.

Nun sind wir vorbereitet, in der Strahlungseichung zur Quantentheorie überzugehen. Dazu ersetzen wir die transversale Poissonklammer durch den entsprechenden Kommutator (mit Vorfaktor), der ja in der Quantentheorie die Zeitentwicklung der Erwartungswerte von Operatoren bestimmt (siehe vorheriges Kapitel). Dadurch wird sichergestellt, dass die Quantentheorie im klassischen Grenzfall in die freie Elektrodynamik in Strahlungseichung übergeht. Insbesondere gilt:

[ En(x) , Am(x') ]   =   h/2 π i   N2   ∫ d3p   ei p (xx')   (δmn − pm pn / p2)

Dieser Ausdruck sieht zunächst etwas unhandlich aus, aber man kann die Feldoperatoren geeignet umschreiben, so dass man schließlich sehr einfache Kommutatoren für neue Operatoren erhält, die man als Erzeugungs- und Vernichtungsoperatoren für Photonen interpretieren kann. Damit lässt sich der Hilbertraum explizit aufbauen, und die Vektoren dieses Raums haben eine unmittelbar anschauliche physikalische Interpretation als Zustandsvektoren von Photonen. Ein wichtiger Schritt dabei ist die Definition des Grundzustandes (Vakuum genannt), der als der Zustand niedrigster Energie definiert ist. Der Erwartungswert des Hamiltonoperators bezogen auf den Grundzustand soll also minimal sein. Dies führt noch zu einigen technischen Besonderheiten: So muss man beispielsweise den Hamiltonoperator normalordnen, was gleichbedeutend damit ist, die Energieskala so zu justieren, dass der Grundzustand die Energie Null hat. Die Details dazu findet man in vielen Büchern zur Quantenelektrodynamik -- daher möchte ich hier nicht näher darauf eingehen.

Die Vertauschungsrelation   [ En(x) , Am(x') ]   in der Strahlungseichung hat einen teilweise nichtlokalen Charakter. Klassisch äußert sich dies darin, dass in der Eichung   div A = 0   das Potential A0 instantan (also ohne jede Zeitverzögerung) von der Ladungsverteilung abhängt. Dennoch ist auch in der klassischen Theorie alles in Ordnung, wenn man zu den Feldern E und B übergeht. So ist das auch nach der Quantisierung, denn in den Kommutatoren zwischen E und B steht wieder die normale Deltafunktion (bzw. deren erste Ableitung). Diese Andeutung soll hier genügen, ohne dass wir ihre Bedeutung sowie den Begriff nichtlokal genauer betrachten wollen.


4.10   Poissonklammern und kanonische Quantisierung in der Lorentzeichung (Gupta-Bleuler-Formalismus)

Die Quantisierung in Strahlungseichung hat den Vorteil, dass der Hilbertraum relativ einfach gefunden werden kann, denn es sind keine weiteren Nebenbedingungen im Hilbertraum mehr nötig, mit denen man unphysikalische Teilräume entfernen müsste. Dafür bezahlt man allerdings den Preis, dass die Formulierung nicht mehr manifest kovariant ist. Man muss also noch den Nachweis führen, dass die Quantentheorie mit den Axiomen der speziellen Relativitätstheorie verträglich ist. Dies kann man tun, erfordert jedoch einigen technischen Aufwand.

Man kann versuchen, die manifeste Kovarianz der Theorie beizubehalten, indem man die kovariante Lorentzeichbedingung   δμ Aμ = 0   verwendet. Diese Eichung wollen wir aber erst nach der Quantisierung fixieren, denn zunächst müssen wir ein Grundproblem lösen, das einer kovarianten Formulierung im Wege steht. Das Grundproblem lautet:   π0 = 0   . Für eine kovariante Formulierung benötigen wir jedoch einen vierkomponentigen Vektor πμ als Gegenstück zu Aμ , damit wir die Poissonklammer auch über alle vier Komponenten definieren können (in der Eichung A0 = 0 hatten wir uns ja auf die räumlichen Komponenten beschränkt). Wir haben oben bereits gesehen, wie sich das Problem lösen lässt: In der Lagrangedichte wird ein neuer Term hinzugefügt:

L'( A(x) , δ A(x) )   :=   L( A(x) , δ A(x) )   −   λ/2 (δμ Aμ(x))2

Damit haben wir die Dynamik verändert. Sie geht in die alte Dynamik über, wenn wir die Lorentz-Eich-Nebenbedingung   δμ Aμ(x) = 0   fordern. Dies tun wir aber erst nach der Quantisierung, denn der Zusatzterm sorgt nun dafür, dass L' von   δ0 A0   abhängt, so dass   π0   =   dL'/d(δ0A0)   =   − λ δ0 A0   ungleich Null ist. Damit wäre das Problem   π0 = 0   beseitigt, man kann die Poissonklammer entsprechend unserem allerersten Ansatz oben aufstellen, zu Operatoren und Kommutatoren übergehen und den Hilbertraum zu der so abgeänderten Theorie formulieren.

Allerdings entspricht die so aufgestellte Quantentheorie nicht der benötigten Quantentheorie, denn sie geht im klassischen Grenzfall in die modifizierte klassische Theorie über und nicht in die ursprüngliche Elektrodynamik. Außerdem stellt man fest, dass der Hilbertraum Vektoren mit negativem Skalarprodukt enthält, also mathematisch nicht die benötigte Struktur aufweist. Die Ursache ist klar: die Lorentz-Eichbedingung   δμ Aμ = 0   muss noch eingebaut werden.

Für die Operatoren dürfen wir allerdings nicht einfach   δμ Aμ = 0   fordern, denn dies ist nicht verträglich mit der Zeitentwicklung durch den Kommutator. Das überascht uns nicht, denn bereits die klassische Poissonklammer würde zu einer Zeitentwicklung der Felder führen, die aus der Eichbedingung herausläuft. Wir haben ja in der klassischen Theorie die Eichbedingung extra noch nicht eingebaut, um das Problem   π0 = 0   lösen zu können.

Von den Physikern Gupta und Bleuler stammt die Idee, das Problem dadurch zu lösen, dass man im obigen Hilbertraum wieder einen Unterraum identifiziert: den Raum aller Vektoren, die   áy| δμ Aμ(x) yñ   =   0   erfüllen, so dass der Erwatrtungswert von δμ Aμ gleich Null ist und sich somit im klassischen Grenzfall die gewünschte Lorentz-Eichbedingung ergibt. Man bezeichnet diese Vorgehensweise als Gupta-Bleuler-Formalismus. Auf diese Weise lassen sich alle Probleme lösen und man kann eine Quantentheorie der Elektrodynamik mit kovarianter Eichung konstruieren.

Eine kurze persönliche Randbemerkung: Ich habe mit Konrad Bleuler (1912-1992) einen der beiden großen Physiker, die diese Methode entwickelt haben, noch persönlich während meiner Promotion am Institut für theoretische Kernphysik in Bonn kennengelernt. Konrad Bleuler hatte das Institut in Bonn gegründet, war bereits emeritiert und besuchte das Institut immer wieder gerne, um mit uns über sein Lieblingsthema zu diskutieren: die theoretische Physik. Leider verstarb er noch während meiner Promotionszeit.


4.11   Der klassische Grenzfall: wie aus Photonen elektromagnetische Felder werden

Wir sind in diesem Kapitel einen weiten Weg gegangen, um von den Maxwellgleichungen des elektromagnetischen Feldes zu einer Quantentheorie der Elektrodynamik zu gelangen. Dabei habe ich Wert darauf gelegt, die Grundlagen der kanonischen Quantisierung an diesem Beispiel ausführlich darzustellen, da dies in den meisten Büchern zu diesem Thema eher knapp ausgeführt ist. Das Kapitel ist dabei recht lang geworden -- deutlich länger, als ich erst beabsichtigt hatte. Und dennoch sind natürlich viele Fragen noch offen: Sind die oben dargestellten Quantisierungsmöglichkeiten zueinander gleichwertig? Führen sie zu denselben physikalischen Aussagen (sie tun es zum Glück!)? Ist die Theorie verträglich mit den Aussagen der speziellen Relativitätstheorie (sie ist es!)? Wie geht man mit so einer Quantentheorie um, um Wahrscheinlichkeitsamplituden auszurechnen? Wie sieht der Hilbertraum genau aus, und wie können seine Zustände physikalisch interpretiert werden im Sinne einer Mehr-Teilchen-Interpretation (Stichwort: Photon)?

Um diese Fragen zu beantworten, wären weitere lange Kapitel notwendig. Unser Ziel war es jedoch, die Grundlagen der Quantisierung zu verstehen, damit wir in den nächsten Kapiteln für das Millenium Problem (gibt es eine Quantentheorie bei Eichtheorien?) gerüstet sind. Dazu müssen wir uns im nächsten Kapitel allerdings noch einen weiteren Zugang zur Quantisierung ansehen: die Pfadintegralmethode von Richard Feynman, die wir im letzten Kapitel bereits im Rahmen der Quantenmechanik kennengelernt haben.

Bevor wir dies tun, wollen wir uns am Schluss dieses Kapitels noch einmal der Frage zuwenden, wann die Quantentheorie der Elektrodynamik in die klassische Theorie der elektromagnetischen Felder übergeht. Wann also geht die Beschreibung durch Teilchen (Photonen) in die Beschreibung durch Felder über?

Die folgenden Gedanken dazu stammen im Wesentlichen aus diesen zwei Quellen:

Die Quantenelektrodynamik beschreibt die elektromagnetische Wechselwirkung durch Hilbertraumzustände, die physikalischen Teilchen entsprechen: den Photonen. Ein Photon hat einen Impuls und eine Polarisation, wobei der Impuls einer Wellenlänge und einer Frequenz der zugehörigen Wahrscheinlichkeitsamplitude zugeordnet werden kann (siehe vorletztes Kapitel). Der klassische Grenzfall ergibt sich, wenn sehr viele Photonen an einem Prozess beteiligt sind. Dabei dürfen die Photon-Amplituden aber nicht über alle möglichen Frequenzbereiche wild verteilt sein, da sich sonst ihre Beiträge zum großen Teil gegenseitig aufheben (die entsprechenden Wahrscheinlichkeitsamplituden mitteln sich weg). Insbesondere dürfen hohe Frequenzen und damit kurze Wellenlängen nicht zu stark vertreten sein, da diese sich besonders stark wegmitteln können.

Um sinnvoll darüber sprechen zu können, dass mehrere Photonen an einem Prozess beteiligt sind, muss man die Wirkung der Photonen über einen kurzen Zeitraum Δt aufsammeln, beispielsweise bei dem Versuch, ein elektrisches Feld zu messen. Dann können nur Photonen-Amplituden beitragen, die in dieser Zeitspanne nur wenig oszillieren, denn sonst heben sie sich gegenseitig auf. Die zur Verfügung stehende Energie muss sich also auf diese niederfrequenten Photonen konzentrieren, damit viele Photonen gemeinsam zu einer Gesamtwirkung beitragen können und sich so der klassische Grenzfall ergeben kann. Diese Photon-Energiedichte muss im klassischen Grenzfall ungefähr der Energiedichte des elektromagnetischen Feldes entsprechen, denn die meisten Photonen sollen sich ja durch die Wirkung dieses Feldes ersetzen lassen. Daraus ergibt die folgende Abschätzung:   |E| >> A / Δt   mit einem Faktor A, der das Planck'sche Wirkungsquantum h und die Lichtgeschwindigkeit c enthält. Die Abschätzung bedeutet:

Fassen wir zusammen: Der klassische Grenzfall tritt ein, wenn eine große Anzahl Photonen, die sich nur wenig unterscheiden (also ähnliche Impulse und damit Wellenlängen und Frequenzen haben), zu einem physikalischen Prozess beitragen.

Damit wollen wir dieses recht umfangreiche Kapitel abschließen und uns im nächsten Kapitel ansehen, wie man auf anderem Wege zu einer Quantentheorie der elektromagnetischen Felder kommen kann.


Literatur zu dem Thema:


zurück zum Inhaltsverzeichnis

last modified on 18 December 2008