Kapitel 4
Die Quantentheorie

10  Darstellungen der Poincaregruppe

Im letzten Kapitel haben wir zu den Drehungen und den Raum-Zeit-Translationen die nichtrelativistischen Boosts als Symmetrieoperationen hinzugenommen, was uns zur Galileigruppe und ihren Darstellungen geführt hat. Nun wissen wir aber, dass nichtrelativistische Boosts nur bei kleinen Boostgeschwindigkeiten eine näherungsweise Symmetrie der Raumzeit sind. Die korrekten Symmetrieoperationen sind die relativistischen Boosts, wie wir sie in Kapitel 3.3 bereits kennengelernt haben. Zusammen mit den Drehungen und den Raum-Zeit-Translationen bilden sie die Poincaregruppe (siehe Kapitel 3.1 und Folgende). Lässt man die Raum-Zeit-Translationen weg, spricht man von der Lorentzgruppe. Genau genommen gehören zu dieser Gruppe noch die Raum- und Zeitspiegelungen hinzu. Diese werden wir jedoch in diesem Kapitel nicht weiter betrachten. Wenn also im Folgenden von der Lorentzgruppe und der Poincaregruppe die Rede ist, dann sind Raum- und Zeitspiegelungen immer ausgenommen.

Das vorliegende Kapitel ist recht umfangreich, obwohl ich versucht habe, mich auf die meiner Meinung nach wichtigsten Aspekte zu beschränken. Daran sieht man, dass man leicht ganze Bücher über die Darstellungstheorie der Poincaregruppe schreiben kann. Wer sich aber die Mühe macht, dieses Kapitel genauer durchzugehen, der hat in den nächsten Kapiteln die Chance, Pauli- und Diracmatrizen wowie Klein-Gordon- und Diracgleichung in einem etwas anderen und umfassenderen Sinn kennenzulernen, als man dies normalerweise in Physikvorlesungen tun kann.


relativistische Boosts (Wiederholung):

Zunächst eine kurze Wiederholung von Kapitel 3.3. Die Notation erfolgt diesmal in natürlichen Einheiten, d.h. h-quer = 1 und c = 1 in den Formeln -- Geschwindigkeiten werden also relativ zur Lichtgeschwindigkeit angegeben, Zeiten werden durch die Strecke repräsentiert, die das Licht in dieser Zeit zurücklegt, und Wirkungen werden relativ zu h-quer angegeben.

relativistische Boosts:

Relativistische Boosts Λb bilden einen Raumzeitvektor   x = (t, x)   auf den Vektor   Λb x   ab. Dabei ist Λb eine reelle symmetrische 4-mal-4-Matrix, die die folgenden Block-Darstellungen hat:


Lb   =   exp  æ
ç
è
0
α
α
0
ö
÷
ø
Λb   =   æ
ç
è
(cosh a)
(sinh ae
(sinh ae
(1 + ((cosh a)-1) e eT)
ö
÷
ø

Lb   =   æ
ç
è
g
gu
gu
1+(g-1)e eT
ö
÷
ø

mit der Rapidität   α   , also   α = α e   mit   |e| = 1   (in Kapitel Kapitel 3.3 hatten wir die Bezeichnung a statt α verwendet, aber a wollen wir hier für den räumlichen Translationsvektor verwenden). Weiter ist   γ = cosh α   sowie   u = u e   die Boostgeschwindigkeit mit

  u   =   sinh α / cosh α

Nützlich sind noch die Formeln

  |u|   =   1 − 1/γ2
  (cosh α)2 − (sinh α)2   =   1
  γ   =   √ ( 1 / (1 − u2) )
  u γ   =   sinh α  

Es folgt, dass der Betrag der Boostgeschwindigkeit u in natürlichen Einheiten immer kleiner-gleich Eins sein muss, d.h. die maximal erreichbare Boostgeschwindigkeit ist die Lichtgeschwindigkeit. Führt man hintereinander zwei Boosts in derselben Richtung mit Boostgeschwindigkeiten u und u' aus, so entspricht das nicht einem Boost mit Boostgeschwindigkeit u + u' . Die Boostgeschwindigkeiten addieren sich in diesem Sinn also nicht!

Will man einen additiven Parameter haben, so muss man die Rapidität α verwenden. Führt man hintereinander zwei Boosts in derselben Richtung mit Rapidität α und α' aus, so entspricht das einem Boost mit Rapidität α + α' . Im diesem Sinn sowie im Sinn der Exponentialdarstellung ist daher die Rapidität bzw. der Rapiditätsvektor α die natürliche Parameterwahl!


Generatoren und Zentralladungen:

Zur Schreibweise der Generatoren in diesem Kapitel:

Für die Generatoren der Drehgruppe werden wir

    A(Jk)   =   − Ak

schreiben, so dass   R(w) = e− i w A(J)   ist. Beim Übergang zu den unitären Darstellungsoperatoren müssen wir dann nur noch J statt A(J) schreiben. Vergleich mit der Schreibweise in Kapitel 4.8 ergibt   − i w A(J) x   =   G(w) x   =   w × x   , also auch
  − i ek A(J) x   =   − i A(Jk) x   =   G(ek) x   =   ek × x  
Diese Gleichung brauchen wir etwas weiter unten für den Kommutator zweier Boostgeneratoren.

Bei Boosts schreiben wir analog zum vorherigen Kapitel   Λb = ei α A(K)   wobei statt der Boostgeschwindigkeit hier die Rapidität als Parametervektor verwendet wird.

Bei den Drehungen war die reelle Matrix im Exponenten antisymmetrisch. Für die Generatoren bedeutete das:   i A(Jk)T   =   − i A(Jk)
Komplexes Konjugieren ergibt   (i A(Jk)T)*   =   − (i A(Jk))*
Da   (i A(Jk))   reell ist, können wir rechts den Stern wieder weglassen. Links dagegen verwenden wir   (i A(Jk)T)*   =   − i (A(Jk)T)*   =   − i A(Jk)+   .
Linke und rechte Seite zusammen ergeben also   − i A(Jk)+   =   − i A(Jk)   und somit
  A(Jk)+   =   A(Jk)
Die Generatoren der Drehgruppe sind also hermitesche Matrizen. Genau darin lag der Sinn, den Faktor i herauszuziehen. Beim Übergang zur Quantentheorie werden aus den Matrizen hermitesche Operatoren, so dass man eine unitäre Darstellung der Überlagerungsgruppe erhält. Da die Gruppe kompakt ist, liefern die unitären Darstellungen zugleich sämtliche möglichen Matrixdarstellungen.

Bei den Boosts ist die Matrix im Exponenten nun symmetrisch:

i A(Kk)   =   æ
ç
è
0
ek
ek
0
ö
÷
ø

Daher ergibt sich für die Generatoren der Boosts die Beziehung
  A(Kk)+   =   − A(Kk)
d.h. die Generatoren der Boosts sind anti-hermitesche Matrizen.

Schauen wir uns die Kommutatoren der Boost-Generatoren an:

[i A(Ki) , i A(Kj)]   =   æ
ç
è
0
0
0
  ei ejTej eiT
ö
÷
ø

Offenbar wirkt der Kommutator nur auf die räumlichen Komponenten, so dass wir kurz schreiben:

  [i A(Ki) , i A(Kj)] x   =   (ei ejTej eiT) x   =   ei xjej xi

Es ist interessant, dass der Kommutator der Boost-Generatoren nicht gleich Null ist, anders als im nichtrelativistischen Fall. Um den Ausdruck rechts besser verstehen zu können, schauen wir uns zum Vergleich den folgenden Ausdruck an (mit Summen über doppelte Indices):

  εijk (− i) A(Jk) x   =   εijk G(ek) x   =   εijk ek × x   =   εijk ek × el xl   =  
  =   εijk εklm em xl   =   (δil δjm − δim δjl) em xl   =   ej xiei xj   =  
  =   − [i A(Ki) , i A(Kj)] x   =   [A(Ki) , A(Kj)] x

Damit haben wir unser Ergebnis:

Kommutator der Boost-Generatoren:

  [A(Ki) , A(Kj)]   =   − i εijk A(Jk)

Das Vertauschen von Boosts in verschiedenen Richtungen hat also etwas mit Drehungen zu tun! Der Kommutator zweier Boostgeneratoren sieht fast genauso aus wie der Kommutator zweier Drehgeneratoren (siehe Kapitel 4.8)

  [A(Ji) , A(Jj)]   =   i εijk A(Jk)

mit einem wichtigen Unterschied: das Vorzeichen!

Man kann nun weiter zeigen, dass sich A(K) bei Drehungen wie ein Vektor verhält. Das war schon bei der Galileigruppe so. Also haben wir:

  [A(Ji) , A(Kj)]   =   i εijk A(Kk)

Damit ist die Lie-Algebra der Lorentzgruppe bereits komplett. Hinzu kommen noch die Kommutatoren mit den Generatoren A(Pμ) der Raum-Zeit-Translationen, wobei wir den Operator-Vierervektor   (Pμ) := (H, P)   verwenden. Dass dieser sich wirklich wie ein Vierervektor transformiert, muss man natürlich mit Hilfe der Gruppenstruktur noch nachweisen, was wir weiter unten tun werden.

Man kann nun zeigen, dass die Lie-Algebra dieser Generatoren das Auftreten von Zentralladungen nicht zulässt, anders als bei der Galileigruppe. Die Poincaregruppe ist in dieser Hinsicht einfacher als die Galileigruppe, bei der man sich ständig mit projektiven Phasen herumschlagen muss. Den Beweis findet man z.B. in Steven Weinbergs Buch The Quantum Theory of Fields, Vol. 1, Kapitel 2.7 (Seite 84). Das bedeutet, dass beim Übergang zu quantenmechanischen Darstellungen keine projektiven Phasen mehr auftreten, wenn wir zur einfach-zusammenhängenden Überlagerungsgruppe übergehen. Einen direkten Nachweis, dass eine solche projektive Phase hier nicht auftritt, findet man in John F. Dawson: Quantum Mechanics: Fundamental Principles and Applications, Kapitel 4.7 (am Schluss davon, Seite 65).

Schauen wir uns nun also an, wie die Überlagerungsgruppe der Poincaregruppe aussieht. Da für Raum-Zeit-Translationen keine Überlagerung notwendig ist (siehe Kapitel 4.7 ), genügt es, wenn wir uns zunächst mit der Lorentzgruppe beschäftigen und Raum-Zeit-Translationen weglassen. Dabei werden wir feststellen, dass sich viele Ähnlichkeiten zur Drehgruppe ergeben. Die Ähnlichkeit des Kommutators   [A(Ki) , A(Kj)]   =   − i εijk A(Jk)   mit der Drehimpulsalgebra   [A(Ji) , A(Kj)]   =   i εijk A(Kk)   deutet bereits in diese Richtung. Außerdem werden wir sehen, dass die Drehungen der Grund dafür sind, dass eine Überlagerungsgruppe notwendig ist (siehe auch Kapitel 4.8 ).


Die Überlagerungsgruppe der Lorentzgruppe:

Die Überlagerungsgruppe der Lorentzgruppe lässt sich weitgehend analog zur Überlagerungsgruppe der Drehgruppe konstruieren (siehe Kapitel 4.8 ). Dabei werde ich wie schon bei den Drehungen das Ergebnis einfach angeben -- wie man auf dieses Ergebnis kommt, möchte ich erst in einem späteren Kapitel im Zusammenhang mit Clifford-Algebren und Spingruppen diskutieren. Hier ist das Ergebnis:

  • Zusammenhang zwischen der Lorentzgruppe und ihrer universellen Überlagerungsgruppe SL(2,C):

    Die Überlagerungsgruppe der Lorentzgruppe (ohne Raum-Zeit-Spiegelungen) ist die Gruppe der komplexen 2-mal-2-Matrizen g mit Determinante 1. Diese Gruppe wird SL(2,C) genannt (SL steht für speziell linear, wobei speziell aussagt, dass die Determinante gleich 1 ist; C steht für komplex). Man beachte: im Gegensatz zu SU(2) muss hier die Matrix nicht unitär sein. SU(2) bildet eine Untergruppe von SL(2,C).

    Man kann jeder Matrix g aus SL(2,C) über die folgende Gleichung eindeutig eine Lorentzmatrix Λ (aus der Zusammenhangskomponente mit der 1) zuordnen:

      g σ(x) g+   =   σ(Λ x)

    Dabei ist g+ ist die zu g transponierte und komplex konjugierte Matrix und

      σ(x)   =   xμ σμ

    (mit Summe über μ von 0 bis 3) ist eine hermitesche 2-mal-2-Matrix (Spur Null wird hier nicht gefordert), die mit Hilfe der drei Paulimatrizen   σi   und der Einheitsmatrix   σ0 = 1   gebildet wird. Jede hermitesche 2-mal-2-Matrix lässt sich so einem Vierervektor x zuordnen und umgekehrt. Insbesondere ist

      det σ(x)   =   (x0)2x2   =:   x2   =   g(x,x)

    die Minkowski-Metrik des Vierervektors   x = (x0, x)   (Vorsicht: g ist in dieser Formel die Minkowski-Metrik und nicht die SL(2,C)-Matrix).

Hier sind noch einmal die Paulimatrizen:

 

Ausgeschrieben lautet die Matrix σ(x) also:

 

Man rechnet leicht nach, dass wegen   det(g) = 1   die so definierte Matrix Λ die Minkowskimetrik eines Vierervektors nicht ändert:

  (Λ x)2   =   det( σ(Λ x) )   =   det( g σ(x) g+ )   =   det(g) det(σ(x)) det(g+)   =   det(σ(x))   =   x2

Also ist Λ eine Lorentz-Matrix. Dass Raum-Zeit-Spiegelungen ausgeschlossen sind, weist man nach, indem man g und damit Λ über einen stetigen Weg mit der Einheitsmatrix verbindet. Man kann auch beweisen, dass man tatsächlich jede Lorentz-Matrix Λ aus der Zusammenhangskomponente mit der 1 durch ein passendes g so erreichen kann. Außerdem ist gesichert, dass dem Produkt zweier Gruppenelemente g und g' aus SL(2,C) auch das Produkt der entsprechenden Lorentz-Matrizen zugeordnet wird, d.h. die Gruppenstruktur wird berücksichtigt. Mehr dazu siehe beispielsweise die ersten Seiten von Vorlesungssammlung 1 von H.R. Petry (ITKP, Universität Bonn, .ps, 525 kB) sowie in Kapitel 6 im Skript zur Vorlesung Quantentheorie II von Prof. Schütte im SS 1992 (ITKP, Uni Bonn), Schwerpunkt: die Poincaré-Gruppe, Poincaréskript (.ps, 807kb).

Wie bei den Drehungen ist die Zuordnung von SL(2,C) zu den Lorentz-Matrizen nicht eindeutig: Den beiden SL(2,C)-Matrizen   g   und   − g   wird dieselbe Lorentz-Matrix zugeordnet! Daher ist SL(2,C) eine Überlagerungsgruppe der Lorentzgruppe (genauer: der Zusammenhangskomponente mit der Eins).

Die Gleichung   g σ(x) g+   =   σ(Λ x)   definiert also eine surjektive Projektion

  ρ:   SL(2,C)   →   SO(1,3)

die mit der Gruppenstruktur verträglich ist. Dabei haben wir wie üblich für die Zusammenhangskomponente der Lorentzgruppe mit der 1 die Bezeichnung SO(1,3) verwendet. Die Schreibweise SO(1,3) steht für die reellen 4-mal-4-Matrizen mit Determinante 1 (daher das S in SO(1,3) -- so werden Raum-Zeit-Spiegelungen ausgeschlossen), die die Metrik mit einer +1 und drei −1 -en in der Diagonale der metrischen Matrix invariant lassen.


Vergleich mit Drehungen, Topologie:

Wenn wir die obigen Zeilen mit dem entsprechenden Text für die Drehgruppe und ihre Überlagerungsgruppe SU(2) aus Kapitel 4.8 vergleichen, so stellen wir eine große Ähnlichkeit fest. Tatsächlich habe ich Teile des Textes fast unverändert übernommen und im Wesentlichen SU(2) durch SL(2,C), u durch g, σ(x) durch σ(x) und R durch Λ ersetzt. Warum geht das?

Schauen wir uns dazu die Matrix g an: Sie enthält 4 komplexe Matrixelemente. Die Bedingung Determinante gleich Eins bewirkt, dass nur drei dieser Matrixelemente unabhängig sind. Das entspricht 6 reellen Parametern. So muss es auch sein, denn die zu g gehörende Lorentzmatrix Λ hängt ebenfalls von 6 reellen Parametern ab (drei Drehwinkel und drei Boostparameter).

Man kann nun jede beliebige invertierbare komplexe Matrix g nach dem Polar Decomposition Theorem (Polarzerlegungs-Satz) in eindeutiger Weise in eine unitäre Matrix u und eine exponentierte hermitesche Matrix h aufteilen:

  g   =   u eh     mit   u+ u = 1   und   h+ = h

(man kann auch   g   =   eh' u'   schreiben, wobei aber eh' und u' andere Matrizen mit derselben Determinante wie eh und u sind). Das ist das Matrix-Analogon zur Zerlegung einer komplexen Zahl z in ihren Betrag und eine Phase:   z = ei φ |z|   , wobei ei φ der unitären Matrix u und |z| der Matrix eh entspricht. Nun ist die Determinante von   g   gerade eine solche komplexe Zahl z, also gilt   det g   =   ei φ |det g|   . Man kann sich nun überlegen, dass ei φ gerade gleich   det u   ist, und dass   |det g|   gerade gleich   det eh   ist (kurze Begründung: die Determinante ist das Produkt der Eigenwerte, und die sind bei   u   komplexe Phasen, während sie bei   eh   positive reelle Zahlen sind). Also:

  det g   =   (det u) (det eh)   =   ei φ |det g|
  mit   det u = ei φ   und   det eh = |det g|

Kommen wir nun zu den Matrizen g aus SL(2,C), d.h. betrachten wir die Zusatzbedingung   det g = 1   . Aus den obigen Formeln folgt sofort

  det u = 1     d.h.   u ∈ SU(2)

Für die andere Matrix   eh   folgt   det eh = 1   und mit der Formel   det eh   =   eSpur h   folgt

  Spur h = 0

Was bedeutet das für unsere Formel   g σ(x) g+   =   σ(Λ x)   ? Da diese Formel die Gruppenstruktur respektiert, folgt für   g   =   u eh   die Formel   (u eh) σ(x) (u eh)+   =   σ(Λu Λb x)   mit   u σ(x) u+   =:   σ(Λu x)   und   eh σ(x) eh   =:   σ(Λb x)   . Zeigen wir, dass Λu eine Drehung und Λb ein Boost ist:

  u σ(x) u+   =   u x0 1 u+   +   u σ(x) u+   =   x0   +   u σ(x) u+   =   x0   +   σ(R x)   =   σ(Λu x)  

Dabei haben wir aus Kapitel 4.8 die Formel   u σ(x) u+   =   σ(R x)   verwendet, die jeder SU(2)-Matrix u eine Drehmatrix R zuordnet. Man sieht nun, wie diese Formel wunderbar in unser Konzept für die Lorentz-Transformationen hineinpasst und wie sie in diesem erweiterten Formalismus aufgeht. Die Matrix Λu dreht also die räumlichen Komponenten von x und lässt die Zeitkomponente unverändert -- sie ist also eine Lorentz-Drehmatrix. Aus Kapitel 4.8 wissen wir, dass wir schreiben können:

Drehung:     u   =   e−i/2 σ(w)   =   cos(ω/2) 1   −   i σ(e) sin(ω/2)

mit   w = ω e   , d.h.   ω = |w|   und   e = w / |w|   .

Nun zu   eh σ(x) eh   =:   σ(Λb x)   . Da h eine hermitesche spurlose Matrix ist, können wir sie mit Hilfe der drei Paulimatrizen und dreier reeller Parameter α = (αi) schreiben als   h = σ(α)/2   . Den Faktor 1/2 haben wir herausgezogen, damit α später wieder die Bedeutung der Rapidität erhält. Man kann die Exponentialreihe nun wieder explizit aufsummieren (siehe z.B. Kapitel 6 im Skript zur Vorlesung Quantentheorie II von Prof. Schütte im SS 1992 (ITKP, Uni Bonn), Schwerpunkt: die Poincaré-Gruppe, Poincaréskript (.ps, 807kb) ) und erhält:

Boost:     eh   =   e1/2 σ(α)   =   cosh(α/2) 1   +   σ(e) sinh(α/2)

mit   α = α e   und   |e| = 1   . Diese Formel sieht sehr ähnlich zu der Formel für u oben aus, und tatsächlich kann man sie auch aus der Formel für u durch analytische Fortsetzung erhalten, indem man   ω = i α   einsetzt und   cos(i α/2)   =   cosh(α/2)   sowie   − i sin(i α/2)   =   sinh(α/2)   verwendet (kann man mit den entsprechenden Reihenentwicklungen nachrechnen). Hier zeigt sich ein generelles Phänomen: Boosts und Drehungen hängen über analytische Fortsetzung in den Parametern miteinander zusammen! Das werden wir später noch ausnutzen, wenn wir nach den endlich-dimensionalen Darstellungsmatrizen D(g) der Gruppe SL(2,C) fragen.

Nun müssen wir noch nachweisen, dass die über   e1/2 σ(α) σ(x) e1/2 σ(α)   =:   σ(Λb x)   definierte Matrix Λb die Gestalt einer Boostmatrix hat, so wie wir sie am Anfang des Kapitels angegeben haben. Die Rechnung ist etwas länglich und soll hier übersprungen werden (man findet sie z.B. in Kapitel 6 im Skript zur Vorlesung Quantentheorie II von Prof. Schütte im SS 1992 (ITKP, Uni Bonn), Schwerpunkt: die Poincaré-Gruppe, Poincaréskript (.ps, 807kb) ). Tatsächlich ergibt sich für Λb genau die gewünschte Gestalt mit α als Rapiditätsvektor.

Halten wir fest:

Zerlegung von Lorentztransformationen in Boosts und Drehungen:

Man kann jede Lorentztransformation Λ eindeutig als Produkt einer Drehung Λu und eines Boosts Λu schreiben:

  Λ   =   Λu Λb

oder alternativ auch anders herum:   Λ   =   Λb' Λu'   (mit anderen Dreh- und Boostmatrizen). Für die zugehörigen Matrizen der Überlagerungsgruppe SL(2,C) gilt:

  g   =   u eh

mit   u+ u = 1   und   h+ = h   sowie   Spur h = 0   . Es gelten die Formeln

  g σ(x) g+   =   σ(Λ x)  
  u σ(x) u+   =   σ(Λu x)  
  eh σ(x) eh   =   σ(Λb x)  

Die SU(2)-Matrix u repräsentiert also die Drehungen, während eh die Boosts darstellt:

  u   =   e−i/2 σ(w)   =    cos(ω/2) 1   −   i σ(e) sin(ω/2)
  eh   =   e1/2 σ(α)   =   cosh(α/2) 1   +    σ(e) sinh(α/2)

Man sieht hier noch einmal explizit, dass die Überlagerungsgruppe SL(2,C) nicht unitär ist, denn die Boostmatrizen   eh   sind nicht unitär. Da SL(2,C) eine Darstellung seiner selbst ist, gibt es demnach (mindestens eine) nicht-unitäre Darstellung. Das unterscheidet SL(2,C) von kompakten Gruppen wie SU(2). Für diese galt ja (siehe Kapitel 4.8):

SL(2,C) ist aufgrund der Boosts aber nicht kompakt, denn die Rapidität α kann beliebige Werte in R3 annehmen und liefert für jeden Wert eine andere Boostmatrix. Daher läuft die Suche nach unitären Darstellungen auch anders ab als bei der Drehgruppe bzw. bei SU(2). Insbesondere sind die unitären Darstellungen bei nicht-kompakten Gruppen unendlich-dimensional -- wir kommen etwas weiter unten darauf zurück.

Die SL(2,C)-Boostmatrix   eh   =   e1/2 σ(α)   =   cosh(α/2) 1   +    σ(e) sinh(α/2)   nimmt für jedes α einen anderen Wert an (denn sinh(α/2) nimmt für jedes α einen anderen Wert an, siehe Kapitel 3.3 ). Genauso ist es mit der Lorentz-Boostmatrix Λb (aus demselben Grund). Bei den Boostmatrizen gibt es also eine eins-zu-eins-Zuordnung zwischen   α   ,   e1/2 σ(α)   und   Λb   . Die Überlagerungsproblematik wie bei den Drehungen tritt hier nicht auf. Das sieht man auch daran, dass   −eh   keine Boostmatrix ist (dagegen ist   −u   auch eine Drehmatrix aus SU(2) ). Die Überlagerungsproblematik hat aber ihren Ursprung gerade darin, dass g und −g dieselbe Lorentzmatrix Λ ergeben.

Als Mannigfaltigkeit entsprechen Boosts also dem dreidimensionalen reellen Raum R3 , unabhängig davon, ob wir Lorentz-Boostmatrizen oder SL(2,C)-Boostmatrizen betrachten. Die Drehungen entsprechen dagegen der 3-Sphäre S3 , wenn wir die Überlagerungsgruppe betrachten, bzw. der 3-Sphäre mit Identifikation von bestimmten Punkten, wenn wir die Drehgruppe selbst betrachten (siehe Kapitel 4.8 ). Da wir nun jede Lorentzmatrix eindeutig als Produkt einer Drehung und eines Boosts schreiben können, ist die Mannigfaltigkeit der Lorentzgruppe (bzw. SL(2,C)) einfach die Menge aller Punktepaare   (w, α)   mit α aus R3 und w aus dem Parameterraum von S3 (w ist der Drehvektor). Man sagt auch, die Mannigfaltigkeit der Lorentzgruppe ist das Produkt von R3 und der Mannigfaltigkeit der Drehgruppe.

Nun ist R3 einfach zusammenhängend, macht also keine Probleme. Die Mannigfaltigkeit der Drehgruppe ist dagegen nicht einfach zusammenhängend, die Mannigfaltigkeit ihrer Überlagerungsgruppe SU(2) dagegen schon (siehe Kapitel 4.8). Es sind also die Drehungen, die den Übergang zur einfach zusammenhängenden Überlagerungsgruppe SL(2,C) erzwingen, wenn man alle projektiven unitären Darstellungen der Lorentzgruppe in der Quantentheorie erfassen möchte.


Unitäre Einteilchen-Darstellungen der Poincaregruppe:

Wenn wir analog zur Behandlung der Drehgruppe in Kapitel 4.8 vorgehen wollten, so müssten wir jetzt die Lie-Algebra der Lorentzgruppe untersuchen, eine hermitesche Darstellung der Lie-Algebra konstruieren, über die Exponentialfunktion dann unitäre Darstellungen der Lorentzgruppe gewinnen und dann die Wirkung dieser Darstellungen zusammen mit Raum-Zeit-Translationen betrachten. Das führt jedoch zu Problemen, denn es gibt keine endlich-dimensionalen unitären Darstellungen der Poincaregruppe, denn diese ist nicht kompakt. So werden die Boost-Generatoren im endlich-dimensionalen Fall typischerweise durch anti-hermitesche Matrizen dargestellt, so dass daraus über die Exponentialabbildung keine unitären Matrizen entstehen.

Es ist daher sinnvoll, bei der Suche nach unitären Darstellungen hier anders vorzugehen: Man bezieht Raum-Zeit-Translationen von Anfang an mit ein, so dass man Eigenvektoren zu Energie und Impuls zur Verfügung hat. Die Wirkung von bestimmten Boosts kann man dann sehr einfach auf diesen Vektoren angeben, was automatisch zu unendlich-dimensionalen Darstellungen führt (nur diese können hier unitär sein). Beispielsweise betrachtet man bei Masse größer Null Boosts in das Ruhesystem und aus dem Ruhesystem heraus. In dem Ruhesystem selbst braucht man dann nur noch Drehungen zu betrachten, und deren Darstellung kennt man. Wir sind in Kapitel 3.5 bereits darauf eingegangen. Ich möchte in diesem Kapitel aber versuchen, die Bezeichnungen etwas zu vereinfachen.

Die folgende Darstellungsweise orientiert sich an Steven Weinberg: The Quantum Theory of Fields, Vol. 1, Kapitel 2.5 (Seite 63). Man findet ähnliche Darstellungen in vielen Texten zur Poincaregruppe.

In Kapitel 4.7 haben wir die Eigenvektoren   |E, pñ   von H und P kennengelernt. Wir fassen nun H und P zu einem Vierervektor   P := (Pμ) = (H, P)   zusammen (ob der Begriff Vierervektor gerechtfertigt ist, werden wir noch sehen). Analog schreiben wir für den Eigenvektor   |E, pñ   als   |p,σñ   mit

  Pμ   |p,σñ   =   pμ   |p,σñ  

Der Zusatzindex σ soll andeuten, dass es mehrere Vektoren geben kann, die diese Gleichung erfüllen (nicht mit den Paulimatrizen verwechseln!). Das kennen wir bereits von den Drehungen in Kapitel 4.8 im Zusammenhang mit dem Spin. Analog ist es auch hier. Eine kurze Wiederholung: Der Sammelindex σ berücksichtigt die Möglichkeit, dass es neben dem Impuls weitere Freiheitsgrade des Systems gibt, die sich bei einer Poincaretransformation verändern. Allgemein könnte σ sogar kontinuierlich sein (beispielsweise wenn σ den Relativimpuls zweier freier Teilchen darstellt -- dann wäre p der Gesamt-Viererimpuls der beiden Teilchen). Wir wollen nun an dieser Stelle davon ausgehen, dass für einen Einteilchen-Zustand ein diskretes σ ausreicht (das definiert den Begriff Einteilchen-Zustand letztlich). Achtung: Wir haben nicht von einem Elementarteilchen gesprochen! Auch ein gebundenes System wie ein Wasserstoffatom kann als ein Teilchen angesehen werden. Siehe dazu auch Steven Weinberg: The Quantum Theory of Fields Vol. 1, Kapitel 2.5 .

Alle Zustände, die sich durch Poincare-Transformationsoperatoren ineinander überführen lassen, stellen geboostete oder gedrehte Zustände desselben Teilchens dar. Zustände, die sich so nicht erreichen lassen, gehören zu einem anderen Teilchen bzw. Teilchentyp. Die Zustände zu einem Teilchen bilden also bei Poincare-Transformationen einen irreduziblen Raum, d.h. sie lassen sich durch geeignete Poincare-Transformationen ineinander umrechnen.

Eine Raum-Zeit-Translation   h(a) x   =   x + a   (der Buchstabe g ist schon für die SL(2,C)-Matrizen vergeben) um die Zeit τ = a0 und den räumlichen Vektor a entspricht nun dem Operator

  Th(a0) Th(a)   =   ei a0 H e− i a P   =   ei g(a,P)   =   ei aμ Pμ   =   ei a P   =:   Th(a)

Dabei steht g(a,P) für die Minkowski-Metrik. Nun sieht man auch, warum wir in Kapitel 4.7 die Vorzeichen gerade so gewählt haben: Man kann jetzt Raum- und Zeittranslationen sehr schön zu einer einzigen Raum-Zeit-Translation zusammenfassen (H und P vertauschen ja).

In Kapitel 4.8 hatten wir uns angesehen, wie sich eine Drehung auf einen Eigenzustand zum Impulsoperator auswirkt. Analog schauen wir uns jetzt an, wie sich eine Lorentztransformation Λ auf einen solchen Zustand auswirkt. Auf diese Weise können wir verifizieren, dass der Operator   Pμ   sich wie ein Vierervektor verhält. Für den Operator der Lorentztransformation schreiben wir Tg , analog zum Drehoperator Tu . Dabei steht g für eine SL(2,C)-Matrix, die zu Λ gehört.

Gehen wir analog zu Kapitel 4.8 vor und schauen uns dazu an, ob Lorentz-Transformationen und Raum-Zeit-Translationen vertauschen:

  Λ h(a) x   =   Λ (x + a)   =   Λ x + Λ a   =   h(Λ a) Λ x

Translationen und Lorentz-Transformationen vertauschen also nicht miteinander. Die obige Gleichung können wir eins-zu-eins auf die quantenmechanischen Operatoren übertragen. Das geht, da es hier keine Zentralladungen gibt (anders als bei der Galileigruppe). Phasen können nur über die Überlagerungsgruppe auftreten. Das berücksichtigen wir, indem wir Λ durch Tg ersetzen, wobei g aus der Überlagerungsgruppe SL(2,C) ist:

  Tg ei g(a,P)   =   ei g(Λa, P) Tg

(das g im Exponenten bezeichnet die Lorentz-Metrik, das tiefgestellte g bezeichnet die SL(2,C)-Matrix). Auf der rechten Seite können wir nun   g(Λa, P)   =   g(a, Λ−1 P)   verwenden:

  Tg ei g(a,P)   =   ei g(a, Λ−1 P) Tg

Abgeleitet nach den einzelnen aμ ergibt das

  Tg P   =   (Λ−1 P) Tg

und multipliziert mit Λ dann

  Tg (Λ P)   =   P Tg

Damit können wir nun angeben, wie sich eine Lorentztransformation auf einen Eigenvektor   |p,σñ   des Vierer-Impulsoperators auswirkt:

  P   Tg   |p,σñ   =   Tg   (Λ P)   |p,σñ   =   Tg   (Λ p)   |p,σñ   =   (Λ p)   Tg   |p,σñ

d.h. der Lorentz-transformierte Zustand   Tg   |p,σñ   ist ein Eigenzustand zum Vierer-Impulsoperator P zum Eigenwert   (Λ P)   . Der Vierer-Impuls des Zustandes wurde also genau so transformiert, wie wir das für einen Vierervektor erwarten -- eine nachträgliche Rechtfertigung für unsere Notation! Man könnte nun versucht sein, deshalb   Tg   |p,σñ   =   |Λp,σñ   zu schreiben. Doch Vorsicht: Der Index σ deutet ja bereits an, dass es mehrere Zustände zu einem Viererimpuls geben kann. Wir wissen nur, dass   Tg   |p,σñ   eine Linearkombination der   |Λp,σñ   sein muss:

  Tg   |p,σñ   =   ∑σ'   |Λp,σ' ñ   Cσ'σ(g,p)

mit entsprechenden Entwicklungskoeffizienten   Cσ'σ(g,p)   , die von g und p abhängen können. Versuchen wir, mehr über diese Koeffizienten herauszufinden. Dazu ist es nützlich, die Vierervektoren p in Klassen zu unterteilen, so dass sich die p in einer Klasse alle per Lorentztransformation ineinander umwandeln lassen. Anschaulich kann man sich vorstellen, dass man ein Teilchen allen möglichen Boosts und Drehungen unterwirft und so alle möglichen Viererimpulse erzeugt, die das Teilchen aufweisen kann. Die verschiedenen Impulsklassen entsprechen dann verschiedenen Teilchen, denn ihre Impulse lassen sich nicht durch Boosts und Drehungen ineinander umwandeln.

In jeder Impulsklasse kann man nun einen Repräsentanten k auswählen, eine Art Standard-Viererimpuls, der die Klasse repräsentiert. Für jeden anderen Viererimpuls p aus dieser Klasse gibt es dann mindestens eine Lorentztransformation Λp , so dass

  p = Λp k

ist (natürlich hängt Λp auch noch von k ab, aber da wir k pro Klasse fest vorgeben werden, wollen wir diese Abhängigkeit in der Schreibweise hier unterdrücken, sonst wird es unleserlich).

Welche Viererimpulsklassen und damit welche k gibt es überhaupt? Nun, zunächst einmal lässt Λp die Minkowskimetrik von p invariant, d.h. jeder Wert von g(p,p) =: p2 liefert eine eignene Impulsklasse. Da wir außerdem nur die Zusammenhangskomponente mit der Eins betrachten (also die Lorentztransformationen, zu denen es ein g aus SL(2,C) gibt -- keine Raum-Zeit-Spiegelungen), ändert sich für   p2 > 0   und   p2 = 0  auch das Vorzeichen der Energie p0 nicht.


   


Ein massives Teilchen entspricht der oberen Massenschale im Bild links. Standardvektor ist   k   =   (m, 0)   . Das ist der Viererimpuls im Ruhesystem, denn der räumliche Impuls ist Null und die Energie ist positiv und gleich der Masse (in natürlichen Einheiten).

Ein masseloses Teilchen entspricht dem oberen Lichtkegel im mittleren Bild (so dass die Energie positiv ist). Standardvektor ist   k   =   (κ, κ e3)   . Ein Ruhesystem gibt es hier nicht.

Die unteren Massenschalen entsprechen negativen Energien. Für Einteilchenzustände sehen wir diese negativen Energien als unphysikalisch an -- zumindest wenn wir positive Energien als physikalisch ansehen. Wenn nämlich Teilchen negative Energien besitzen könnten und andere Teilchen positive Energien, so könnte beispielsweise aus dem Nichts heraus ein Teilchen mit positiver Energie und ein Teilchen mit gleich großer negativer Energie und entgegengesetztem räumlichen Impuls entstehen, ohne dass die Energie-Impuls-Erhaltung verletzt wäre. In diesem Sinne wäre das Vakuum instabil, denn es könnte ständig solche Teilchenpaare erzeugen. Daher betrachten wir negative Teilchenenergien hier nicht weiter. Beim Aufbau einer Quantenfeldtheorie mit Wechselwirkung werden sie aber später wieder ins Spiel kommen und müssen geeignet in den Formalismus eingebracht werden -- das Ergebnis sind die Antiteilchen. Dabei muss man dafür sorgen, dass kein Teilchen- oder Antiteilchen-Zustand eine niedrigere Energie als das Vakuum hat, was letztlich auch eine Bedingung für den Vakuumzustand ist. Eine zweite Bedingung an den Vakuumzustand   |0ñ   ist, dass für ihn   Pμ |0ñ = 0   gilt. Das hat zur Folge, dass Poincaretransformationen den Vakuumzustand nicht ändern, d.h. die Poincaregruppe wird auf diesem Zustand trivial dargestellt.

Der Fall 3 mit negativem   p2   entspäche bei Anwendung der Formel   p = m u   einer Überlicht-Vierergeschwindigkeit u . Man spricht hier von sogenannten Tachyonen. Überlichtgeschwindigkeit führt aber zu Kausalitätsproblemen und muss daher hier ebenfalls als unphysikalisch angesehen werden. Aber auch ohne die Formel   p = m u   wäre ein negatives   p2   unphysikalisch: Durch einen Boost könnte eine positive Teilchenenergie p0 in eine negative Teilchenenergie oder auch auf Null verändert werden -- wieder mit dem Ergebnis, dass beliebig viele Teilchenpaare aus dem Vakuum entstehen könnten, ohne die Energie-Impuls-Erhaltung zu verletzen. Bei bosonischen Stringtheorien tauchen solche Zustände mit negativem   p2   tatsächlich auf und signalisieren damit eine Inkonsistenz in der Theorie (man spricht wegen der möglichen Teilchenpaarerzeugung aus dem Nichts heraus von einem instabilen Vakuum). Erst die Einführung von Fermionen über die Supersymmetrie behebt dieses Problem in der Stringtheorie (siehe Kapitel 6.2).

Zurück zu unseren Impuls-Zuständen. Die Zustände für die Standardvektoren k lauten   |k,σñ   . Da   p = Λp k   ist, führt die Anwendung von Tg(p) auf   |k,σñ   zu einem Zustand mit Impuls p (dabei ist g(p) eine SL(2,C)-Matrix zu Λp ). Um die σ-Indices für verschiedene Impulse in Beziehung zueinander zu setzen, können wir festlegen:

  |p,σñ   :=   Np   Tg(p)   |k,σñ

mit einer p-abhängigen reellen Normierung   Np   , die wir später passend wählen werden. Wenden wir nun irgendeine Lorentztransformation   Tg   mit zugehörigem Λ auf diese Gleichung an, fügen rechts die Identität   Tg(Λp)   Tg(Λp)−1   ein und nutzen die Darstellungseigenschaft von T, so erhalten wir.

  Tg   |p,σñ   =   Np   Tg   Tg(p)   |k,σñ   =  
  =   Np   Tg(Λp)   Tg(Λp)−1   Tg   Tg(p)   |k,σñ   =  
  =   Np   Tg(Λp)   Tg(Λp)−1 g   g(p)   |k,σñ   =   .....   (*)

Die SL(2,C)-Matrix   g(Λp)−1 g   g(p)   entspricht einer Lorentztransformation, die die Impulse folgendermaßen umwandelt:

  k   ->   p   ->   Λ p   ->   k

Das war der Sinn der Umformung oben. Diese Lorentztransformation ändert den Standardvektor k nicht! Man nennt die Gruppe dieser Lorentztransformationen zu festem k die kleine Gruppe (little group) oder auch Stabilitätsgruppe. Mathematiker sprechen auch von der isotropy subgroup (siehe z.B. John Baez: Unitary representations of the Poincare group). Die entsprechenden SL(2,C)-Matrizen wollen wir mit u bezeichnen (da sie z.B. für Teilchen mit Masse unitär sind, wie wir noch sehen werden):

Die kleine Gruppe (little group):

Die SL(2,C)-Matrizen

  u   :=   g(Λp)−1 g   g(p)  

zu festem Standard-Viererimpulsvektor k bilden die sogenannte kleine Gruppe zu k. Die zugehörige Lorentzmatrix Λu verändert k nicht:

  Λu k = k

Man bezeichnet u bzw. Λu auch als Wigner-Rotation. Dabei hängt   u   natürlich von p und k ab, denn p und k gehen in die Definition von g(p) und g(Λp) ein:     p = Λp k   und g(p) ist die SL(2,C)-Matrix zu Λp . Zur Schreibweise:   u   kann, muss aber nicht zwingend unitär sein -- hängt von k ab, schauen wir uns noch an.

Die Gleichung   u   =   g(Λp)−1 g   g(p)   kann man übrigens zu

  g   =   g(Λp) u   g(p)−1  

umformen, was sich sehr schön interpretieren lässt: Erst wandelt man p mit g(p)−1 zum Standardvektor k um (man geht bei massiven Teilchen beispielsweise ins Ruhesystem), dann dreht man sich mit u um k herum in eine passende Richtung (ohne k zu ändern), so dass man schließlich mit g(Λp) zum Zielvektor Λp gelangt.

Wozu brauchen wir die kleine Gruppe? Da sie k nicht ändert, kann sie sich bei   |k,σñ   nur noch auf die σ-Indices auswirken, so wie sich der Spin-Drehungsoperator   e− i w S   in Kapitel 4.8 nur auf die Spin-Indices ausgewirkt hat. Da wir in Kapitel 4.8 nur Drehungen und keine Boosts hatten, mussten wir dies dort für den Spinoperator explizit fordern. Bei der kleinen Gruppe dagegen bewirkt die Konstruktion dieser Gruppe automatisch, dass der Standardimpuls nicht geändert wird. Wir haben also

  Tu   |k,σñ   =   ∑σ'   |k,σ'ñ   Dσ'σ(u)

mit einer entsprechenden Darstellungsmatrix   Dσ'σ(u)   der kleinen Gruppe (so wie die Drehmatrizen eine Matrixdarstellung von SU(2) liefern). Man beachte: nur für unitäres u ist   Dσ'σ(u)   (ggf. nach Ausreduktion und Basiswahl) eine Drehmatrix -- wir kommen noch darauf zurück.

Damit können wir nun oben bei   (*)   weiterrechnen:

  Tg   |p,σñ   =  
  =   Np   Tg(Λp)   Tg(Λp)−1 g   g(p)   |k,σñ   =  
  =   Np   Tg(Λp)   Tu   |k,σñ   =  
  =   Np   Tg(Λp)   ∑σ'   |k,σ'ñ   Dσ'σ(u)

Hier können wir nun die Definition   |p,σñ   :=   Np   Tg(p)   |k,σñ   von oben verwenden und rechts   |Λp,σ'ñ   =   NΛp   Tg(Λp)   |k,σ'ñ   einsetzen:

  Tg   |p,σñ   =   Np / NΛp   ∑σ'   |Λp,σ'ñ   Dσ'σ(u)

Damit haben wir die Entwicklungskoeffizienten   Cσ'σ(g,p)   in   Tg   |p,σñ   =   ∑σ'   |Λp,σ' ñ   Cσ'σ(g,p)   (bis auf die Normierung) eindeutig bestimmt. Es genügt dafür, die Darstellungen der kleinen Gruppe zu kennen. Man spricht daher auch von einer induzierten Darstellung, denn die Darstellungen der kleinen Gruppe induzieren Darstellungen für die gesamte Poincaregruppe. Siehe dazu auch http://theory.gsi.de/~vanhees/faq/qm/node59.html. Vorsicht: Die kleine Gruppe ist als Untergruppe von SL(2,C) zu sehen, denn insgesamt wollen wir ja eine Darstellung   Tg   von SL(2,C) haben. Daher sind nicht alle Darstellungen der jeweiligen kleinen Gruppe zulässig (wird bei masselosen Teilchen wichtig, siehe unten).


Normierung und Skalarprodukt:

Nun zur Normierung: Unser Ziel ist es ja, eine unitäre Darstellung der Überlagerungsgruppe zu erreichen (projektive Phasen hatten wir oben bereits ausgeschlossen, da die Lie-Algebra keine Zentralladungen zulässt). Also müssen wir uns über das Skalarprodukt und die Normierung der Zustände Gedanken machen.

Die Zustände   |p,σñ   wollen wir als Einteilchenzustände interpretieren, was insbesondere bedeuten soll, dass σ nur endlich viele diskrete Werte annehmen kann. Nun kommutiert der Hamiltonoperator   H = P0   als Darstellungsoperator des Zeittranslations-Generators mit P (und natürlich mit sich selbst). Daher ändert sich der Viererimpuls   p = (E p)   des Zustandes   |p,σñ   zeitlich nicht, wie wir am Ende von Kapitel 4.7 gesehen haben. Man spricht entsprechend von einem freien Teilchen. Äußere Einflüsse, die Energie und Impuls des Teilchens ändern könnten, sind ausgeschlossen. Diese Einflüsse (z.B. äußere Felder) würden ja auch die Raum-Zeit-Symmetrie zerstören, von der wir in diesem Kapitel ausgehen.

Übrigens: Nur bei einem freien Teilchen ist es überhaupt möglich, Energie und Impuls genau zu messen, denn dafür benötigt man eine bestimmte Messzeit, in der sich beides nicht ändert. Diese Messzeit ist umso länger, je genauer man Energie und Impuls bestimmen möchte. Man kann auch sagen: Nur bei einem freien Teilchenzustand sind Energie und Impuls definierte und beliebig genau messbare Größen. Mehr dazu siehe Das Unteilbare, Kapitel 6.1 (relativistische Quantenfeldtheorien) sowie Landau, Lifschitz: Lehrbuch der theoretischen Physik, Band IV (Quantenelektrodynamik), Akademie-Verlag Berlin 1986. Besonders interessant ist Hendrik van Hees: Unschärferelation und relativistische Quantentheorie, speziell das Kapitel über Impulsmessung.

Wir wissen aus Kapitel 4.5: Das Skalarprodukt liefert die Wahrscheinlichkeitsamplitude für ein Messergebnis, und der quadrierte Betrag der Wahrscheinlichkeitsamplitude liefert die entsprechende Wahrscheinlichkeit. Wenn wir also zur Zeit t einen Einteilchenzustand   |p,σñ   haben, so werden wir zu dieser Zeit den Impuls p und den Messwert σ mit der Wahrscheinlichkeit 1 messen, andere Impulse oder Werte von σ dagegen überhaupt nicht. Für die Wahrscheinlichkeitsamplitude und das entsprechende Skalarprodukt würden wir daher erwarten:   á p',σ' | p, σ ñ   =   δp,p' δσ,σ'   . Das wäre auch korrekt, wenn der Viererimpuls nur diskrete Werte annehmen könnte. Da der Impuls aber kontinuierliche Werte annehmen kann, ist die Wahrscheinlichkeit, einen ganz bestimmten Impuls zu messen, gleich Null, denn man wird immer eine (wenn auch beliebig kleine) Abweichung haben. Bei kontinuierlichen Größen muss man nach der Wahrscheinlichkeit dafür fragen, dass diese Größe in einem bestimmten Bereich liegt, den man dann beliebig klein (aber endlich) wählen kann. Um diesen Fall zu erfassen, müssen wir unseren quantenmechanischen Formalismus etwas erweitern.

In Kapitel 4.5 haben wir die Zerlegung   |ψñ   =   ∑n   an   |nñ   kennengelernt mit den Normierungen   án|n'ñ   =   δn,n'   sowie   ∑n   |an|2   =   1   . Dabei ist   an   =   án|ψñ   die Wahrscheinlichkeitsamplitude dafür, bei dem Zustand   |ψñ   die Messwerte zu finden, die den Zustand   |nñ   kennzeichnen. Dabei steht n für einen Satz diskreter Messwerte und die Summe geht über alle diese diskreten Messwertsätze. Diesen Formalismus müssen wir nun auf kontinuierliche Messwerte übertragen. Wie das geht, kennen wir aus Kapitel 4.7, wo wir das für die kontinuierlichen Impulse bereits getan haben:

  |ψñ   =   ∫ d3p   f(p)   |pñ

Aus der Summe wird also ein Integral, und aus der Amplitude   an   wird die Amplitudendichte   f(p)   . Entsprechend ist   ∫G d3p   |f(p)|2   die Wahrscheinlichkeit dafür, den Impuls im Gebiet G zu finden, wobei man G beliebig klein (aber endlich) machen kann. Die Normierung lautet dann   ∫ d3p   |f(p)|2   =   1   , wenn man über alle Impulse integriert, denn irgendeinen Impuls wird man messen. Um analog zu   an   =   án|ψñ   nun   f(p)   =   ápñ   mit einer entsprechenden Linearform   áp|   schreiben zu können, muss gelten:

  |ψñ   =   ∫ d3p   f(p)   |pñ   =   ∫ d3p   ápñ   |pñ   =   ∫ d3p   |pñ   ápñ

d.h. analog zur Formel   1   =   ∑n   |nñ án|   aus Kapitel 4.5 haben wir hier die Formel

  1   =   ∫ d3p   |pñ áp|

Diese Formel führt zu der folgenden Normierung für   áp'|pñ :

  f(p')   =   áp'|ψñ   =   áp'|   ∫ d3p   f(p)   |pñ   =     ∫ d3p   f(p)   áp'|pñ   =     ∫ d3p   f(p)   δ3(p' − p)

denn nur so ergibt das Integral rechts wieder   f(p')   . Es muss also

  áp'|pñ   =   δ3(p' − p)

gelten, analog zur Normierung   án|n'ñ   =   δn,n'   im diskreten Fall. Dabei ist   δ3(p' − p)   die bekannte Delta-Funktion (besser wäre Delta-Funktional oder Delta-Distribution). Man kann sich die Delta-Funktion als sehr spitze Funktion vorstellen, die aus dem Integral gleichsam nur die Werte eines unendlich dünnen Bereichs herausfischt. Details zur Delta-Funktion findet man in Die Grenzen der Berechenbarkeit, Kapitel 5.4.4 sowie unter Wikipedia: Delta-Distribution (hier findet man auch eine anschauliche Erläuterung).

Es wird sich etwas später als nützlich erweisen, einen Faktor   1/a(p)   mit einer impulsabhängigen positiven reellen Funktion a(p) im Integrationsmaß   d3p   einzufügen, also   d3p / a(p)   im Integral zu verwenden. Dabei wird später a(p) die Komponente p0 sein, so dass das Integrationsmaß invariant unter Poincare-Transformationen wird. Wenn wir dies in den Formeln oben berücksichtigen, so erhalten wir:

  |ψñ   =   ∫ d3p / a(p)   f(p)   |pñ   =   ∫ d3p / a(p)   |pñ   ápñ
    1   =   ∫ d3p / a(p)   |pñ áp|
  f(p')   =   áp'|ψñ   =   áp'|   ∫ d3p / a(p)   f(p)   |pñ   =     ∫ d3p / a(p)   f(p)   áp'|pñ   =     ∫ d3p   f(p)   δ3(p' − p)
  áp'|pñ   =   a(p)   δ3(p' − p)

Allerdings ist dann   |f(p)|2   nicht mehr die Wahrscheinlichkeits-Dichte für den Impuls, sondern   |f(p)|2 / a(p)   ist diese Dichte, denn es gilt:

  1   =   áψ|ψñ   =   ∫ d3p / a(p)   áψ|pñ ápñ   =   ∫ d3p   |f(p)|2 / a(p)


Anmerkung:
Bei einer dreidimensionalen kontinuierlichen Zufallsgröße x mit Wahrscheinlichkeitsdichte   η(x)   ist allgemein   ∫G d3x   η(x)   die Wahrscheinlichkeit dafür, dass die Zufallsgröße x in Gebiet G liegt. Genau so ist der Begriff Wahrscheinlichkeitsdichte definiert. Die Formel stellt beispielsweise sicher, dass Wahrscheinlichkeiten additiv sind: Bei zwei nicht-überlappenden Gebieten G und G' ist die Wahrscheinlichkeit dafür, dass die Zufallsgröße x in Gebiet G oder G' liegt, gerade gleich der Summe der Wahrscheinlichkeiten für die Gebiete G und G':
  ∫G + G' d3x   η(x)   =   ∫G d3x   η(x)   +   ∫G' d3x   η(x)  
Natürlich muss dann   ∫ d3x   η(x)   =   1   sein und   η(x) > 0   für alle x gelten, damit für jedes beliebige Gebiet G die Wahrscheinlichkeit positiv ist. Damit kann man ablesen, dass man oben   |f(p)|2 / a(p)   als Wahrscheinlichkeitsdichte für die Zufallsgröße p interpretieren kann. Wir werden bei der Diskussion der Orts-Wahrscheinlichkeitsdichte unten noch einmal darauf zurückkommen. Mehr zum Begriff der Wahrscheinlichkeitsdichte siehe Wikipedia: Dichtefunktion.


Wir wollen nun einen allgemeinen Einteilchenzustand   |ψñ   durch Überlagerung der Impuls-Einteilchenzustände   |p,σñ   konstruieren. Neben dem kontinuierlichen Vierervektor p taucht noch die diskrete Größe σ auf. Diese Größe können wir einfach dadurch berücksichtigen dass wir nicht nur über p integrieren, sondern auch über σ summieren, so wie wir das vorher mit   n   gemacht haben. Bleibt die vierdimensionale Größe p. Müssen wir womöglich zu vierdimensionalen Integralen übergehen?

Im Normalfall hat man es in der Physik mit Zuständen einer bestimmten Masse zu tun. Es gibt zwar selten auch den Fall, dass man Zustände verschiedener Massen überlagern kann (Stichwort Neutrino-Oszillation, siehe Kapitel 4.5), aber solche Zustände wollen wir hier nicht betrachten. Man kann sie ggf. durch Superposition von Zuständen mit definierter Masse aufbauen. Im Folgenden wollen wir also die Einschränkung machen, dass alle Viererimpulse, die wir überlagern wollen, zur selben Masse gehören:   g(p,p) = p2 = m2   mit einer reellen Masse m. Der Einteilchenzustand   |ψñ   hat dann ebenfalls diese Masse, d.h.   P2ñ   =   m2ñ   . Außerdem wollen wir nur physikalisch interpretierbare Viererimpulse zulassen, d.h. p2 und p0 dürfen nicht negativ sein (siehe oben). So ist sichergestellt, dass bei einer Energie-Impulsmessung am Zustand   |ψñ   nur physikalisch interpretierbare Messwerte möglich sind, und dass   p0 = √(m2 + p2)   ist, so wie das bei einem Teilchen mit Masse m und Impuls p sein muss.

Bei fester Masse ist   p0 = √(m2 + p2)   nun keine unabhängige Variable mehr, sondern eine Funktion von p . Wir integrieren also über den dreidimensionalen Vektor p und nicht über den Vierervektor p. Allerdings wäre es hilfreich, denn wir ein Poincare-invariantes Integrationsmaß verwenden könnten. In Kapitel 4.8 war es nämlich bei der Betrachtung von Drehungen auch sehr nützlich, dass das Integrationsmaß d3p drehinvariant war.

Wie findet man ein solches Integrationsmaß? Starten wir mit dem vierdimensionalen Intergationsmaß   d4p   =   dp0 d3p   , das wir verwendet hätten, wenn p0 unabhängig von p wäre. Dieses Integratonsmaß verändert sich nicht bei Lorentztransformationen: Wenn   p' = Λ p   ist, so ist   d4p'   =   |det(dp'/dp)| d4p   =   |det(Λ)| d4p   =   d4p   , denn   |det(Λ)| = 1   (das folgt aus   ΛT g Λ   =   g   (siehe Kapitel 3.1), denn dann ist   det(ΛT) det(g) det(Λ)   =   det(g)   und somit   (det(Λ))2   =   1   ). Nun soll aber   p0 = √(m2 + p2)   sein. Das erreichen wir, wenn wir in das Integrationsmaß eine Delta-Funktion sowie eine Theta-Funktion einfügen (die Theta-Funktion Θ(x) ist eins für x größer-gleich 0 und Null sonst):   d4p   δ(p2 − m2)   Θ(p0)   . Die Integration läuft damit nur noch über die oben dargestellten dreidimensionalen Unterräume im Vierer-Impulsraum, die sich physikalisch interpretieren lassen. Man kann auch sagen: Die Integration läuft über p mit   p0 = √(m2 + p2)   . Dabei ist das Integrationsmaß   d4p   δ(p2 − m2)   Θ(p0)   Poincare-invariant (Zeitspiegelungen hatten wir ausgeschlossen und m ist eine reelle Zahl).

Nun ist die Schreibweise mit   δ(p2 − m2)   Θ(p0)   noch etwas unhandlich. Es wäre schön, wenn man diese Distributionen explizit auswerten könnte und ein invariantes dreidimensionales Integrationsmaß angeben könnte. Dazu müssen wir die Integration über p0 ausführen:

  ∫ d4p   δ(p2 − m2)   Θ(p0)   F(p)   =  
  =     ∫ d3p   ∫ dp0   δ((p0)2p2 − m2)   Θ(p0)   F(p0,p)   =  
  =     ∫ d3p   ∫ dp0 / 2√(m2 + p2)   δ(p0 − √(m2 + p2))   F(p0,p)
  =     ∫ d3p / 2p0     F(p0,p)

wobei in der letzten Zeile   p0   =   √(m2 + p2)   einzusetzen ist. Dabei haben wir die Rechenregeln für die Delta-Funktion angewendet, wie sie beispielsweise in Wikipedia: Delta-Distribution dargestellt sind. Hier eine kurze Motivation der angewendeten Regel in Physiker-Kurzschreibweise für eine Funktion g(x) mit nur einer einfachen Nullstelle und positiver Ableitung (die Theta-Funktion oben sorgt dafür):
  ∫ dx δ(g(x)) F(x)   =   ∫ dx/dg dg δ(g) F(x(g))   =   ∫ 1/(dg/dx) dg δ(g) F(x(g))   =   1/(dg/dx(x0)) F(x0)  
mit   g(x0) = 0   oder anders gesagt   x0 = x(0)   . Statt x haben wir oben die Variable p0,   g(p0)   =   (p0)2p2 − m2   und die Theta-Funktion sorgt dafür, dass nur positive p0 inclusive Null eine Rolle spielen.

Damit haben wir unser dreidimensionales Poincare-invariantes Integrationsmaß:

Poincare-invariantes Integrationsmaß für die Integration über p:

  d3p / 2p0     mit   p0   =   √(m2 + p2)     (den Faktor 2 kann man auch weglassen)

Jetzt wird auch klar, warum wir oben das Integrationsmaß   d3p / a(p)   betrachtet haben. Wir setzen nun   a(p)   =   2 p0   =   2 √(m2 + p2)   in allen Formeln oben ein, berücksichtigen zusätzlich den Freiheitsgrad σ, schreiben   |pñ   statt   |p,σñ   (denn p0 ist ja bei fester Masse keine unabhängige Größe wegen   p0   =   √(m2 + p2)   ) und erhalten:

Skalarprodukt, Superposition und Normierung von Impulszuständen mit einem Poincare-invarianten Integrationsmaß:

In allen folgenden Formeln gilt   p0   =   √(m2 + p2)  

  |ψñ   =   ∑σ   ∫ d3p / 2p0   fσ(p)   |pñ

    1   =   ∑σ   ∫ d3p / 2p0   |pñ áp,σ|

  fσ(p)   =   áp,σ | ψñ   sowie   [fσ(p)]*   =   áψ | pñ

  áp',σ' | pñ   =   2p0   δ3(p' − p)   δσ,σ'

  áψ'|ψñ   =   ∑σ   ∫ d3p / 2p0   áψ' |pñ áp,σ|ψñ   =   ∑σ   ∫ d3p / 2p0   [f 'σ(p)]*   fσ(p)

Dabei ist   |fσ(p)|2 / 2p0   die Impuls-Wahrscheinlichkeits-Dichte für vorgegebenes σ.

Diese Konventionen und Normierungen sind analog gewählt zu Sexl, Urbantke: Relativität, Gruppen, Teilchen, spezielle Relativitätstheorie als Grundlage der Feld- und Teilchenphysik, Springer-Verlag 1992. Steven Weinberg verwendet in seinem Buch The Quantum Theory of Fields, Vol. 1, Kapitel 2.5 andere Konventionen.

Die Formeln gelten auch für Masse Null. Für p = 0 wird dabei allerdings p0 = 0 . Wegen der Division durch p0 müsste man daher formal den Nullpunkt im Integrationsgebiet ausschließen. Da ein Punkt den Wert des Integrals nicht beeinflusst (ist ja eine Menge vom Maß Null), können wir das problemlos tun. Letztlich ist ja das Integrationsmaß für m = 0 über   ∫ d4p   δ(p2)   Θ(p0)   F(p)   =     ∫ d3p / 2p0     F(p0,p)   sauber definiert.

Nun zu unserer Normierungsfunktion   Np   (wir nehmen an, sie ist reell). Diese Funktion müsste nun festliegen, denn wir haben ja die Normierung   áp',σ' | pñ   =   2p0   δ3(p' − p)   δσ,σ'   bereits oben festgelegt. Schauen wir uns zum Vergleich die folgende Formel von oben an, wobei wir für den räumlichen Anteil des Vierervektors Λp die Schreibweise Λp und für den Energie-Anteil die Schreibweise (Λp)0 verwenden wollen, d.h.   Λ p   =   ( (Λp)0 , Λp )   .:

  Tg   |pñ   =   Np / NΛp   ∑σ'   |Λp,σ'ñ   Dσ'σ(u)

Nun soll   Tg   unitär sein, d.h. es soll   Tg+ Tg = 1  . sein. Damit folgt aus der Normierung:

  2p0   δ3(p' − p)   δσ,σ'   =  
  =   áp',σ' | pñ   =  
  =   á Tg p',σ' | Tg pñ   =  
  =   Np' / NΛp'   ∑α'   á Λp',α' |   [Dα'σ'(u)]*   Np / NΛp   ∑α   |Λpñ   Dασ(u)   =  
  =   Np' / NΛp'   Np / NΛp   ∑α', α   á Λp',α' |Λpñ   [Dσ'α'(u)]+   Dασ(u)   =  
  =   Np' / NΛp'   Np / NΛp   ∑α', α   2(Λp)0   δ3p' − Λp)   δα',α   [Dσ'α'(u)]+   Dασ(u)   =  
  =   (Np / NΛp)2   ∑α   2(Λp)0   δ3p' − Λp)   [Dσ'α(u)]+   Dασ(u)

Schauen wir uns die Delta-Funktion an: Es gilt

  2(Λp)0   δ3p' − Λp)   =   2p0   δ3(p' − p)

Es ist nämlich einerseits
  f(p')   =   ∫ d3p / 2p0   2p0   δ3(p' − p)   f(p)       (*)

Andererseits ist
  f(p')   =   ∫ d3k / 2k0   2k0   δ3p' − k)   f(Λ− 1 k)   =   ...
... wir setzen   k = Λ p   und verwenden die Invarianz des Integrationsmaßes:
  ......   =   ∫ d3p / 2p0   2(Λp)0   δ3p' − Λp)   f(p)       (**)

Vergleich von (*) und (**) ergibt die gewünschte Gleichung. Setzen wir diese Gleichung nun oben ein, so erhalten wir:

  2p0   δ3(p' − p)   δσ,σ'   =   (Np / NΛp)2   2p0   δ3(p' − p)   ∑α   [Dσ'α(u)]+   Dασ(u)

Wir setzen   Np = NΛp = 1   (Weinberg macht das anders!), so dass   ∑α   [Dσ'α(u)]+   Dασ(u)   =   δσ,σ'   oder in Matrixschreibweise

  D(u)+   D(u)   =   1  

sein muss. Die Darstellungsmatrix   D(u)   der kleinen Gruppe muss also eine unitäre Matrix sein! Unser Ergebnis lautet also:

Unitäre Einteilchen-Darstellung der Poincaregruppe:

  Tg   |pñ   =   ∑σ'   |Λp,σ'ñ   Dσ'σ(u)

mit einer unitären impulsabhängigen Matrix   D(u)   als Darstellungsmatrix der kleinen Gruppe. Das so definierte   Tg   ist eine unitäre Darstellung der Überlagerungsgruppe SL(2,C) , wobei wir die Normierung   áp',σ' | pñ   =   2p0   δ3(p' − p)   δσ,σ'   voraussetzen. Die Darstellung der Raum-Zeit-Translationen h(a) hatten wir weiter oben schon kennengelernt:

  Th(a)   |pñ   =   ei g(a,P)   |pñ   =   ei g(a,p)   |pñ

mit der Minkowski-Metrik g(a,p) .

Wichtig ist dabei, dass   D(u)   vom Impuls p abhängt, denn u hängt von p ab! Zwar ist   D(u)   eine endlich-dimensionale unitäre Darstellung der kleinen Gruppe, aber das ergibt keine endlich-dimensionale unitäre Darstellung der Gruppe SL(2,C), sondern wegen der p-Abhängigkeit eine unendlich-dimensionale unitäre Darstellung. Genau deshalb können wir auch nicht   D(g)   schreiben. Tatsächlich kann man zeigen, dass es (abgesehen von der trivialen Darstellung durch die Identität) keine endlich-dimensionalen unitären Darstellungen der Gruppe SL(2,C) und damit auch der Lorentzgruppe gibt! Die obige Darstellung ist wegen der Impulsabhängigkeit unendlich-dimensional.

Bei der kompakten Drehgruppe ist das anders, wie wir am Schluss von Kapitel 4.8 gesehen haben. Mit Hilfe der Kugelflächenfunktionen und Integration über den Winkelanteil von p lassen sich dort Vektoren bilden, die sich wie die Basisvektoren eines Tensorproduktes bei Drehungen verhalten. Mit Hilfe der Clebsch-Gordan-Koeffizienten lassen sich dann endlich-dimensionale ausreduzierte Darstellungen der Drehungen bilden. Das geht bei den Lorentztransformationen so offenbar nicht. Darin spiegelt sich wieder, dass die Lorentzgruppe und ihre Überlagerungsgruppe wegen der Boosts nicht-kompakt sind.


Darstellung der Poincaregruppe auf Funktionen des Impulses:

Wie bei der Drehgruppe in Kapitel 4.8 können wir nun auch unitäre Darstellungen auf Funktionen des Impulses und des Ortes definieren. Die Rechnung verläuft vollkommen analog zu der entsprechenden Rechnung bei der Drehgruppe. Ausgangspunkt ist die Formel (siehe oben)

  |ψñ   =   ∑σ   ∫ d3p / 2p0   fσ(p)   |pñ

Anwendung von   Tg   ergibt:

  Tg   |ψñ   =  
  =   ∑σ   ∫ d3p / 2p0   fσ(p)   Tg   |pñ   =  
  =   ∑σ   ∫ d3p / 2p0   fσ(p)   ∑σ'   |Λp,σ'ñ   Dσ'σ(u)   =   ...

Wir substituieren nun die Integrationsvariable   p' := Λ p   und lassen den Strich wieder weg. Dabei verwenden wir die Invarianz des Integrationsmaßes. Vorsicht: u ist impulsabhängig:   u   =   g(Λp)−1 g   g(p)   . Daraus wird   u'   =   g(p)−1 g   g(Λ−1p)   (Anmerkung: Die Matrix u' entspricht einem Element der kleinen Gruppe, dass k auf die folgende Weise auf sich selbst abbildet:   k   ->   Λ−1 p   ->   p   ->   k   ). Außerdem vertauschen wir die Bezeichnungen für σ' und σ:

  =   ∑σ', σ   ∫ d3p / 2p0   fσ'− 1p)   |pñ   Dσσ'(u')   =  
  =:   ∑σ   ∫ d3p / 2p0   [Tg f]σ(p)   |pñ

mit

  [Tg f]σ(p)   :=   ∑σ'   Dσσ'(u')   fσ'− 1p)     mit     u'   =   g(p)−1 g   g(Λ−1p)  

Diese Formel sieht analog zu der entsprechenden Formel bei den Drehungen aus. Allerdings tritt die unitäre impulsabhängige Matrix   D(u')   der kleinen Gruppe auf, nicht aber eine impulsunabhängige Darstellungsmatrix   D(g)   der Poincaregruppe selbst. Wir können aber leicht eine neue Funktion   Fσ(p)   definieren, bei der das anders ist. Dazu verwenden wir von oben die Formel   u'   =   g(p)−1 g   g(Λ−1p)   und gehen weiter davon aus, dass es endlich-dimensionale Darstellungsmatrizen D(g) der Lorentzgruppe gibt, die nicht unbedingt unitär sein müssen (dass das so ist, sehen wir weiter unten). In Matrixschreibweise haben wir dann   D(u')   =   D(g(p))−1   D(g)   D(g(Λ−1p))   . Setzen wir dies in die Gleichung oben ein, die wir ebenfalls in Matrixschreibweise schreiben, um die vielen Indices zu vermeiden:

  [Tg f](p)   =   D(u')   f(Λ− 1p)   =   D(g(p))−1   D(g)   D(g(Λ−1p))   f(Λ− 1p)

Multiplikation von links mit der Matrix   D(g(p))   ergibt

  D(g(p))   [Tg f](p)   =   D(g)   D(g(Λ−1p))   f(Λ− 1p)

Wir definieren nun

  F(p)   :=   D(g(p))   f(p)

mit   p0 = √(m2 + p2)   (vgl. dazu z.B. http://theory.gsi.de/~vanhees/faq/qm/node59.html Gleichung (9.80) ). Diese Formel legt es nahe, auf der Funktion F eine Darstellung folgendermaßen zu definieren:

  [Tg F](p)   :=   D(g(p))   [Tg f](p)   =   D(g)   D(g(Λ−1p))   f(Λ− 1p)   =   D(g)   F(Λ− 1p)

Die rechte Seite zeigt, dass wir so tatsächlich eine Darstellung der Lorentzgruppe (genauer von SL(2,C) definiert haben. Man spricht auch von der Darstellung auf Feldern. Fassen wir zusammen:

Von der unitären Darstellung zur Darstellung auf Feldern:

Die unitäre Darstellung

  [Tg f](p)   =   D(u')   f(Λ− 1p)

mit der Impuls-abhängigen Wigner-Rotation   u'   =   g(p)−1 g   g(Λ−1p)   und der unitären Matrix D(u') liefert über die Definitionen

         F(p)   :=   D(g(p))   f(p)
  [Tg F](p)   :=   D(g(p))   [Tg f](p)

(mit   p0 = √(m2 + p2)   ) die Darstellung

  [Tg F](p)   =   D(g)   F(Λ− 1p)

auf den sogenannten Feldern F(p). Die Darstellungsmatrix D(g) muss für allgemeine g aus SL(2,C) nicht unitär sein.

Wie sieht es mit der Interpretation aus? Erinnern wir uns: Wegen der Normierung
  áp',σ' | pñ   =   2p0   δ3(p' − p)   δσ,σ'   und der Definition
  |ψñ   =   ∑σ   ∫ d3p / 2p0   fσ(p)   |pñ   (d.h.   fσ(p)   =   áp,σ | ψñ   ) ist
  |fσ(p)|2 / 2p0   die Impuls-Wahrscheinlichkeits-Dichte und
  áψ'|ψñ   =   ∑σ   ∫ d3p / 2p0   áψ' |pñ áp,σ|ψñ   =   ∑σ   ∫ d3p / 2p0   [f 'σ(p)]*   fσ(p)   das Skalarprodukt.

Umgeschrieben mit F(p) ist demnach

  |(D(g(p))− 1 F(p))σ|2 / 2p0   die Impuls-Wahrscheinlichkeits-Dichte und

  áψ'|ψñ   =   ∫ d3p / 2p0   [D(g(p))− 1 F'(p)]+   D(g(p))− 1 F(p)   =  
  =   ∫ d3p / 2p0   F'(p)+   [D(g(p))− 1]+   D(g(p))− 1 F(p)     das Skalarprodukt.

Für eine nicht-unitäre Matrix   D(g(p))− 1   fällt das Matrixprodukt nicht weg und das Skalarprodukt hat eine recht komplizierte Gestalt, wenn man es durch die Felder F(p) ausdrückt. Für F(p) gilt also ein einfaches Transformationsgesetz bei Poincaretransformationen, aber es geht auf komplizierte Weise in das Skalarprodukt ein. Das wird uns bei der Betrachtung der Klein-Gordon-Gleichung und der Diracgleichung wieder begegnen.


Darstellung auf ortsabhängigen Funktionen:

Da die Wigner-Rotation   u'   impulsabhängig ist, liefert eine Fouriertransformation von f(p) kein einfaches Transformationsgesetz für die so gebildete ortsabhängige Funktion. Man kann aber für die Felder F(p) eine solche Fouriertransformation durchführen, die zu einem einfachen Transformationsgesetz für das Fourier-transformierte Feld führt:

  ψ(x)   :=  
  =   N   ∫ d4p   F(p)   e− i p x   δ(p2 − m2)   Θ(p0)   =  
  =   N   ∫ d3p / 2p0   F(p0,p)   e− i p0 t   ei p x

mit   p0 = √(m2 + p2)   in der unteren Zeile, der Normierung   N = (2π)−3/2   und der Minkowski-Metrik   p x = g(p,x)   . Die Delta-Funktion sorgt wie oben dafür, dass nur Impulse zur gleichen Masse m überlagert werden, und die Theta-Funktion sorgt dafür, dass p0 größer-gleich Null sein muss. Analog zu unserer Vorgehensweise bei den Drehungen und den Translationen definieren wir:

  [Tg ψ](x)   :=  
  =   N   ∫ d4p   [Tg F](p)   e− i p x   δ(p2 − m2)   Θ(p0)   =  
  =   N   ∫ d4p   D(g)   F(Λ− 1p)   e− i p x   δ(p2 − m2)   Θ(p0)   =   ...

wir setzen   p' := Λ− 1p   und verwenden   d4p = d4p'   sowie   p' 2 = p2   ,   Θ(p' 0) = Θ(p0)   und   (Λp') x   =   p' (Λ− 1x)  

  =   N   ∫ d4p'   D(g)   F(p')   e− i p' (Λ− 1x)   δ(p' 2 − m2)   Θ(p' 0)   =  
  =   D(g)   ψ(Λ− 1x)

Wir können auch noch zusätzlich Raum-Zeit-Translationen h(a) berücksichtigen, indem wir   Tg,a   :=   Tg Th(a)   setzen. In der obigen Rechnung müssen wir dann   e− i p x   durch   e− i p x   ei p a   ersetzen mit dem Ergebnis:

Darstellung auf Feldern im Ortsraum:

  [Tg,a ψ](x)   =   D(g)   ψ(Λ− 1(x − a))

Diese Formel entspricht genau der Vorstellung davon, wie sich eine Orts-Zeit-abhängige Funktion bei einer Poincaretransformation verhalten sollte. Dies rechtfertigt auch die Interpretation von x als Raum-Zeit-Variable.

Allerdings können wir das Feld   ψ(x)   nicht als Amplitude für die Aufenthaltswahrscheinlichkeit des Teilchens interpretieren -- anders als in der nichtrelativistischen Quantentheorie, bei der die Division durch   2p0   im Integrationsmaß nicht notwendig ist, um ein invariantes Integrationsmaß zu erhalten. Erst die relativistischen Boosts machen das notwendig.

Welche Größe aber könnte man -- zumindest im Prinzip -- als Aufenthaltswahrscheinlichkeit eines Teilchens interpretieren? Die Antwort kennen wir aus der nichtrelativistischen Quantenmechanik: Wir brauchen die (gewöhnliche) dreidimensionale Fouriertransformation der Impuls-Wahrscheinlichkeitsamplitude. Diese war gegeben durch   |fσ(p)|2 / 2p0   . Die entsprechende fouriertransformierte Größe ist

  Ψσ(x)   :=   N   ∫ d3p   fσ(p) / √(2p0)   ei p x

mit   N = (2π)−3/2   . Warum diese Größe sich als Wahrscheinlichkeitsdichten-Amplitude eignet, sehen wir am Skalarprodukt. Es ist nämlich in Matrixschreibweise

  ∫ d3x   Ψ(x)+   Ψ(x)   =  
  =   N2   ∫ d3x   ∫ d3p'   f(p')+ / √(2p'0)   e−i p' x   ∫ d3p   f(p) / √(2p0)   ei p x   =  
  =   N2   ∫ d3p'   ∫ d3p   f(p')+ f(p) / (√(2p'0) √(2p0))   ∫ d3x   ei (pp' ) x   =  
  =   N2   ∫ d3p'   ∫ d3p   f(p')+ f(p) / (√(2p'0) √(2p0))   ∫ d3x   (2π)3   δ3(pp')   =  
  =   ∫ d3p   f(p)+ f(p) / 2p0     =  
  =   áψ|ψñ   =   1

wobei wir die Formel   ∫ d3x   ei (pp' ) x   =   (2π)3   δ3(pp')   verwendet haben (siehe Wikipedia: Delta-Distribution ). Nach dem, was wir oben über sie Wahrscheinlichkeitsdichte einer kontinuierlichen Zufallsgröße gelernt haben, wäre   Ψ(x)+   Ψ(x)   ein Kandidat für eine solche Wahrscheinlichkeitsdichte der Zufallsgröße x, die wir als Teilchenort interpretieren wollen. Genau so kennen wir das aus der nichtrelativistischen Quantenmechanik, und so muss es auch in der relativistischen Quantenmechanik sein.

Wir können die Orts-Wahrscheinlichkeitsamplitude   Ψ(x)   durch das Feld   ψ(0,x)   ausdrücken (zur Vereinfachung wählen wir t = 0 ):

  Ψ(x)   =  
  =   N   ∫ d3p   f(p) / √(2p0)   ei p x   =  
  =   N   ∫ d3p   D(g(p))− 1 F(p) / √(2p0)   ei p x   =  
  =   N   ∫ d3p / 2p0   ∫ d3p'   δ3(p' − p)   D(g(p'))− 1   √(2p'0)   F(p)   ei p x   =  
  =   N   ∫ d3p / 2p0   ∫ d3p'   N2   ∫ d3x'   ei (p' − p ) x'   D(g(p'))− 1   √(2p'0)   F(p)   ei p x   =  
  =   N ∫ d3x'   N ∫ d3p / 2p0   F(p)   ei p (xx' )   N ∫ d3p'   ei p' x'   D(g(p'))− 1   √(2p'0)     =  
  =   N ∫ d3x'   ψ(0, xx' )   N ∫ d3p'   ei p' x'   D(g(p'))− 1   √(2p'0)     =  
  =   N ∫ d3x'   ψ(0, xx' )   D(x')

mit     D(x')   =   N ∫ d3p'   ei p' x'   D(g(p'))− 1   √(2p'0)  

Orts-Wahrscheinlichkeitsamplitude und ortsabhängiges Feld hängen also über ein Faltungsintegral zusammen, d.h. erst das mit   D(x')   verschmierte Feld ψ ergibt die Orts-Wahrscheinlichkeitsamplitude   Ψ(x)   . Dies ist die präzise Version der Aussage, dass das Feld   ψ(0,x)   nur ungefähr angibt, wo sich das Teilchen aufhalten kann. Wegen dem Faltungsintegral ist die Orts-Wahrscheinlichkeitsamplitude   Ψ(x)   insgesamt eine relativ unpraktische Größe in der relativistischen Quantentheorie. Das Feld ψ ist viel angenehmer zu handhaben, aber nicht unmittelbar zu interpretieren. Hinzu kommen andere Aspekte: So ist eine beliebig genaue Ortsmessung bei einem Teilchen prinzipiell nicht möglich, da dafür viel Energie auf kleinem Raum konzentriert werden muss, was zur Bildung von neuen Teilchen-Antiteilchen-Paaren führt mit der Folge, dass man oft nicht mehr weiß, welches das ursprüngliche Teilchen war (siehe Das Unteilbare, Kapitel 6.1 ). Auch aus diesem Grund ist es nur begrenzt sinnvoll, überhaupt von dem Aufenthaltsort eines relativistischen Teilchens zu reden. Das ist beim Impuls eines freien Teilchens anders -- er lässt sich beliebig genau messen, solange man beliebig viel Messzeit zur Verfügung hat. Siehe dazu auch beispielsweise http://theory.gsi.de/~vanhees/faq/qm/node57.html.

Soviel dazu. Bleibt noch die Frage: Wie sehen die Darstellungsmatrizen D(u) und D(g) denn nun wirklich aus? Beginnen wir mit D(u). Wie wir oben bereits gesehen haben, gibt es zwei physikalisch relevante Fälle:   p2 > 0   und   p2 = 0   (und   p0 > 0   in beiden Fällen). Der Standardvektor k sieht in beiden Fällen verschieden aus, so dass auch die kleine Gruppe jeweils verschieden ist. Beginnen wir mit dem Fall   p2 > 0   :


Die kleine Gruppe für Teilchen mit Masse größer Null:

Für   p2 = m2 > 0   können wir als Standardvektor den Vektor   k = (m, 0)   wählen. Dies ist der Viererimpuls eines Teilchens mit Masse m und räumlichem Impuls Null -- das Teilchen ruht also bewegungslos. Die Lorentztransformationen, die k nicht verändern, sind damit gerade die räumlichen Drehungen (Boosts scheiden ja aus, denn sie würden einen räumlichen Impuls ergeben). Die kleine Gruppe ist also SO(3), und die entsprechenden SL(2,C)-Matrizen u stammen aus der zugehörigen Überlagerungsgruppe SU(2). Damit sind auch die Darstellungsmatrizen D(u) für eine ausreduzierte Darstellung klar: Es handelt sich um die (2s + 1)-dimensionalen SU(2)-Darstellungsmatrizen Ds(u) zum Spin s, so wie wir sie in Kapitel 4.8 kennengelernt haben (warum wir hier das Wort Spin verwenden, wird etwas weiter unten noch klar werden). Diese Darstellungsmatrizen sind in geeigneter Basis unitär, so wie wir das oben von D(u) auch verlangt haben (da die Gruppe SU(2) kompakt ist, liefern die unitären Darstellungen zugleich sämtliche möglichen Matrixdarstellungen, wenn man die Basis geeignet wählt).

Warum haben wir oben vom Spin gesprochen? In Kapitel Kapitel 4.8 hatten wir die Spinquantenzahlen s und ms eines Zustandes   | p s ms ñ   dadurch definiert, dass sich der Zustand bei Drehungen   Tu(w) = e−i w J   folgendermaßen transformiert:

  Tu(w)   | p s ms ñ   =     ∑ms'   | R(w) p , s ms' ñ   Dsms' ms(u(w))  

Dabei haben wir extra u(w) statt u geschrieben, um die Drehung u(w) von der Wigner-Rotation u zu unterscheiden. Zum Vergleich: Oben hatten wir für die unitären Einteilchendarstellungen der Poincaregruppe die Gleichung

  Tg   |pñ   =   ∑σ'   |Λp,σ'ñ   Dσ'σ(u)

gefunden mit der Wigner-Rotation   u   :=   g(Λp)−1 g   g(p)   . Diese Formel können wir uns nun für eine Drehung   g = u(w)   und zugehörigem   Λ p   =   R(w) p   anschauen. Dabei wählen wir die Basis durch Ausreduktion der Darstellung so, dass   |pñ   =   | p s ms ñ   und   Dσ'σ(u) = Dsms' ms(u)   ist:

  Tu(w)   | p s ms ñ   =     ∑ms'   | R(w) p , s ms' ñ   Dsms' ms(u)  

Das sieht schon fast so aus wie die Spin-Drehungsformel von oben aus Kapitel 4.8. Allerdings steht rechts die Wigner-Rotation u, die zur Drehung u(w) gehört, und nicht die Drehung u(w) selbst. Rechnen wir also die Wigner-Rotation u zur Drehung u(w) aus. Dazu müssen wir allerdings noch eine weitere Konvention treffen. Die Gleichung   p = Λp k   legt nämlich die Lorentz-Transformation   Λp   und das zugehörige   g(p)   noch nicht eindeutig fest, so dass auch die Wigner-Rotation noch nicht eindeutig definiert ist. So kann man beispielsweise bei   k = (m, 0)   erst eine beliebige Drehung und dann einen Boost in p-Richtung durchführen und erhält jeweils ein gültiges   Λp   . Die beliebigen Drehungen wollen wir nun ausschließen. Wir fordern daher, dass   Λp   ein reiner Boost sein muss. Gleichwertig dazu ist die Forderung, dass   g(p)   eine hermitesche Matrix sein muss. Erst dadurch ist unsere Basis nach der Formel

  | p s ms ñ   :=   Tg(p)   | (m,0), s ms ñ

von oben nun eindeutig festgelegt. Mit dieser Konvention können wir die Wigner-Rotation   u   :=   g(Λp)−1 u(w)   g(p)   für die Drehung u(w) nun ausrechnen. Das kann man auf verschiedene Art tun. Bereits anschaulich ist am Beispiel von   k = (m,0)   klar:   R p   =   R Λp (m,0)   =   ΛRp R (m,0)   . Anhand der Matrizen kann man explizit nachrechnen, dass auch allgemein   R Λp   =   ΛRp R   ist. Übersetzt auf die Überlagerungsgruppe bedeutet das:   u(w) g(p)   =   g(Rp) u(w)   oder umgestellt   u(w)   =   g(Rp)−1 u(w)   g(p)   . Die rechte Seite ist aber gerade unsere Definition der Wigner-Rotation u, so dass wir u = u(w) haben. Für eine Drehung ist die Wigner-Rotation gerade identisch mit dieser Drehung. Und damit können wir auch oben u(w) = u setzen und haben

  Tu(w)   | p s ms ñ   =     ∑ms'   | R(w) p , s ms' ñ   Dsms' ms(u(w))  

Das ist genau die Drehvorschrift für Spin-Zustände und liefert die Begründung dafür, den Index   σ = (s, ms)   als Spinquantenzahl zu bezeichnen.


Die kleine Gruppe für masselose Teilchen:

Erst wollte ich den masselosen Fall recht kurz abhandeln. Dann aber habe ich festgestellt, dass man später (z.B. bei der Weyl-Gleichung oder bei Eichfeldern mit Spin 1) die Details doch braucht. Es hilft also nichts -- schauen wir uns die Details doch genauer an. Es wird dann sogar recht interessant, denn der masselose Fall hält doch einige Überaschungen bereit! Die genaue Analyse findet man übrigens beispielsweise in Steven Weinberg: The Quantum Theory of Fields, Vol. 1, Kapitel 2.5 (ab Seite 69). oder in Hendrik van Hees: Introduction to Relativistic Quantum Field Theory.

Zunächst einmal gibt es für masselose Teilchen kein Ruhesystem, so dass wir nicht   k = (m,0)   wählen können (es muss ja   p2 = k2 = 0   sein). Statt dessen kann man beispielsweise   k   =   (κ, κ e3)   verwenden mit einer beliebigen Energie κ . Wie üblich setzen wir   κ = 1  . Anschaulich kann man sich vorstellen, dass k einen Standardlichtstrahl in z-Richtung mit Photonenergie 1 (in natürlichen Einheiten) darstellt. Dabei sollte man sich keinen dünnen Lichtstrahl vorstellen, sondern ein paralleles Bündel von Lichtstrahlen (auf der Erde liefert das Sonnenlicht annähernd so ein paralleles Lichtbündel, allerdings mit verschiedenen Photonenergien).

Wir suchen also nun die Lorentzmatrizen Λu , die den Standardlichtstrahl in z-Richtung und somit k invariant lassen:   Λu k = k   . Im Fall mit Masse hatten wir sie als Wigner-Rotationen bezeichnet. Diese Bezeichnung wollen wir auch im masselosen Fall beibehalten, auch wenn Λu nun nicht mehr unbedingt eine Rotation sein muss.

Betrachten wir zunächst die Wirkung von Λu auf den Basisvektor   e0 = (1, 0)   , d.h. wir interessieren uns für die erste Spalte von Λu . Für diese Spalte und damit für den Vektor   Λue0   machen wir den Ansatz (als Spaltenvektor zu lesen)

  Λue0   =   (γ, δ, η, ζ)

mit vier reellen Zahlen γ, δ, η und ζ. Für die Lorentzmetrik g von   e0 = (1, 0)   und   k   =   (1, e3)   gilt dann:

  1   =   g(e0, k)     =   g(Λue0, Λuk)   =   g(Λue0, k)   =   γ − ζ

Es ist also   1 = γ − ζ   oder umgestellt   γ = 1 + ζ   . Außerdem gilt:

  1   =   g(e0, e0)   =     g(Λue0, Λue0)   =   γ2 − δ2 − η2 − ζ2   =   (1 + ζ)2 − δ2 − η2 − ζ2   =   1 + 2ζ − δ2 − η2

und somit   ζ = (δ2 + η2)/2   . Insgesamt ist also

  Λue0   =   (1 + ζ , δ , η , ζ)     mit     ζ = (δ2 + η2)/2

Damit kennen wir nun die erste Spalte der Matrix Λu , denn diese ist ja gerade gleich   Λue0   . Eine (nicht unbedingt mit Λu identische) Lorentzmatrix   ΛN(δ,η)   , die auch diese erste Spalte besitzt, ist

  ΛN(δ,η)   =  

 

(siehe z.B. Alejandro Jenkins: Topics in Theoretical Particle Physics and Cosmology Beyond the Standard Model, Kapitel 2.2.3 -- im Internet). Wir bezeichnen   ΛN(δ,η)   oder auch abgekürzt   ΛN   als Nulldrehung, was schon mal das tiefergestellte N in der Bezeichnung erklärt -- mehr dazu später. Da   Λu   und   ΛN   beide dieselbe erste Spalte besitzen, ist natürlich   Λu e0   =   ΛN e0   (dieser Vektor ist ja die erste Spalte). Wir multiplizieren diese Gleichung von links mit   ΛN− 1   und erhalten   ΛN− 1 Λu e0   =   e0   . Die Lorentztransformation   ΛN− 1 Λu   verändert also den Zeitvektor   e0 = (1, 0)   nicht. Die einzigen Lorentztransformationen, die das tun, sind die Drehungen, d.h.   ΛN− 1 Λu   ist eine Drehung. Außerdem ist   ΛN   genau wie   Λu   eine Wigner-Rotation, lässt also den Standardvektor   k   =   (1, e3)   unverändert (das kann man der Matrix   ΛN   sofort ansehen, denn   ΛN k   ist gleich der ersten Spalte plus der vierten Spalte dieser Matrix). Damit muss auch die Drehung   ΛN− 1 Λu   eine Wigner-Rotation sein -- sie lässt den Standardlichtstrahl in z-Richtung also unverändert. Das tun aber nur die Drehungen um die z-Achse, die wir mit   R(φ)   bezeichnen wollen. Es ist also   ΛN(δ,η)− 1 Λu   =   R(φ)   oder nach   Λu   freigestellt   Λu   =   ΛN(δ,η) R(φ)   . Halten wir dieses wichtige Ergebnis fest:

Die kleine Gruppe bei masselosen Teilchen:

Zur Festlegung der kleinen Gruppe für Masse Null wählen wir als Standardimpuls den Vektor   k   =   (1, e3)   (Lichtstrahl mit Energie 1 in natürlichen Einheiten in z-Richtung). Die kleine Gruppe umfasst alle Lorentzmatrizen Λu , die diesen Lichtstrahl nicht verändern, d.h. es gilt   Λu k = k   . Dann kann man jedes Λu dieser kleinen Gruppe als eine Drehung R(φ) um die k-Achse (hier die z-Achse) und eine anschließende Nulldrehung ΛN(δ,η) schreiben:

  Λu   =   ΛN(δ,η)   R(φ)

mit der oben angegebenen Nulldrehungs-Matrix   ΛN(δ,η)   .


Nulldrehungen:

Die Drehungen um die z-Achse R(φ) sind uns gut vertraut. Schauen wir uns daher die Nulldrehungen (die auch lichtartige Drehungen genannt werden) genauer an. Die Lorentzmatrix   ΛN(δ,η)   für diese Nulldrehungen hatten wir oben bereits angegeben.

Zunächst wollen wir versuchen, anschaulich zu verstehen, was Nulldrehungen sind und warum es sie überhaupt gibt. Man könnte ja zunächst meinen, die einzigen Lorentztransformationen, die einen Lichtstrahl in z-Richtung mit Photonen-Energie 1 (also   k   =   (1, e3)   ) unverändert lassen, seien die Drehungen um die z-Achse. Es gibt aber noch weitere Lorentztransformationen, die den Lichtstrahl invariant lassen und die man wie alle Lorentztransformationen aus einem Boost und anschließender Drehung zusammensetzen kann. Überlegen wir uns, wie dieser Boost und diese Drehung aussehen könnten, so dass sich k nicht ändert.

Dazu wählen wir zunächst irgendeine beliebige Boostrichtung e aus und führen einen Boost mit Boost-Geschwindigkeit   u = u e   in diese Richtung durch -- wir bewegen uns also nach dem Boost mit der Boost-Geschwindigkeit u, wobei u auch negativ sein kann (Boost in die umgekehrte Richtung). Lichtstrahlen, die von vorne auf uns zukommen, sehen wir dann blauverschoben, also mit größerer Energie als zuvor. Lichtstrahlen, die von hinten auf uns zukommen, sehen wir dagegen rotverschoben, also mit geringerer Energie als zuvor. Und der Standardlichtstrahl mit Photonimpuls k, der irgendwie schräg auf uns zukommt -- wie sehen wir ihn? Er scheint nach dem Boost mehr von vorne auf uns zuzukommen als zuvor -- man nennt das Aberration. Und er könnte nach dem Boost irgendeine Energie zwischen maximal rotverschoben und maximal blauverschoben besitzen. Wenn wir die Boostgeschwindigkeit u passend wählen, können wir bei vorgegebener Boostrichtung e immer erreichen, dass seine Energie sich überhaupt nicht ändert -- weder rot- noch blauverschoben. Dabei müssen wir das Vorzeichen von u so wählen, dass der Standard-Lichtstrahl vor dem Boost eher von hinten auf uns zukommt, nach dem Boost aber aufgrund der Aberration eher von vorne. Es ist sogar so: Wenn der Standard-Lichtstrahl vor dem Boost einen Winkel ψ mit der Rückwärts-Richtung einschließt, so muss er nach dem Boost mit der Vorwärtsrichtung denselben Winkel ψ einschließen -- genau so müssen wir u bei gegebener Richtung e wählen. Die Energie des Standard-Lichtsstrahls ändert sich dabei überhaupt nicht, wohl aber seine Richtung. Wir können die alte Richtung aber nun durch eine anschließende Rotation wiederherstellen und haben damit eine Nulldrehung hinter uns, die den Standardlichtstrahl nicht verändert. Diese Vorgehensweise funktioniert für beliebige Boostrichtungen. Als Parameter der Nulldrehung können wir den Winkel φ wählen, den die Boostrichtung e in Kugelkoordinaten projeziert auf die x-y-Ebene relativ zur x-Achse besitzt, sowie die Boost-Rapidität α, die zugleich den Winkel ψ zwischen e und der z-Achse festlegt. φ und α können wir dann im Wesentlichen als Polarkoordinaten (Winkel und Radius) in der δ - η -Ebene auffassen und so in die karthesischen Parameter δ und η umrechnen (vgl. Re: Measurement and Observers). Man sieht also: Auch anschaulich ist klar, dass es Nulldrehungen gibt. Mehr dazu im Internet beispielsweise unter Greg Egan: Null Rotations in 2+1 dimensions sowie Re: Measurement and Observers. Auch Wikipedia: Lorentz group sagt Einiges über Nulldrehungen.



Wie sieht die Gruppenstruktur der kleinen Gruppe bei Masse Null aus? Bei der Multiplikation zweier Nulldrehungen addieren sich die zugehörigen reellen Parameter δ und η der beiden Nulldrehungen, so wie das die Verschiebungsvektoren bei Translationen tun. Insgesamt findet man, dass sich die kleine Gruppe bei masselosen Teilchen genauso verhält wie die Gruppe ISO(2) der Drehungen und Translationen in einer zweidimensionalen reellen Ebene, wobei δ und η das Analogon der Translationsparameter sind (dieser zweidimensionale Raum hängt aber nur indirekt mit der Raumzeit zusammen, siehe oben). Zu den Nulldrehungen gehören daher analog zum Impuls zwei kontinuierliche Quantenzahlen, die die Eigenwerte der Nulldrehungs-Generatoren sind (Details siehe z.B. Steven Weinberg: The Quantum Theory of Fields, Vol. 1). Allerdings treten in der Natur solche kontinuierlichen Quantenzahlen bei masselosen Teilchen nicht auf, so dass wir diese bei physikalisch relevanten Zuständen gleich Null setzen müssen. Der physikalische Zustand   |pñ   enthält nur die sogenannte Helizität σ, die sich bei Drehungen um die z-Achse auswirkt, aber keine kontinuierlichen Nulldrehungs-Quantenzahlen. Die Nulldrehungen spielen also bei der Darstellungsmatrix D(u) der kleinen Gruppe keine Rolle. Auf den Impuls des Zustandes wirken sie sich dagegen aus, wie jede andere Lorentztransformation auch. Die Matrix D(u) ist also eine Darstellungsmatrix für die Drehung R(φ) um die z-Achse, die in der Wigner-Rotation enthalten ist. Diese Darstellungsmatrix lautet

  Dσ'σ(u)   =   e−i φ σ   δσ'σ  

Wir haben also:

  Tg   |pñ   =   |Λpñ   e−i φ σ

mit einem Drehwinkel φ , der wie u von g und p abhängt, sowie einer reellen Zahl σ , die wir als Helizität bezeichnet haben (Vorsicht: nicht mit den Pauli-Matrizen verwechseln!). Man kann sich vorstellen, dass die Helizität die Spinkomponente in Bewegungsrichtung ist (Begründung kommt später). Von der Lie-Algebra der kleinen Gruppe her könnte σ eine beliebige reelle Zahl sein -- aus Kapitel 4.6 wissen wir ja, dass der Spin in 2 Dimensionen nicht quantisiert ist (Stichwort Anyonen). Klar: Die Lie-Algebra der Drehungen um die z-Achse hat nur einen Generator, so dass es keine Nebenbedingungen wie bei den dreidimensionalen Drehungen gibt, die bestimmte Drehimpulswerte erzwingen. Da aber   Tg   eine Darstellung von SL(2,C) sein soll, kann σ wie jede andere Drehimpulskomponente nur halb- und ganzzahlige positive und negative Werte inclusive Null annehmen. Man sagt, die Helizität ist quantisiert. Erst wenn wir also die kleine Gruppe als Untergruppe von SL(2,C) verstehen und nach der entsprechenden Untergruppe der Darstellungsmatrizen von SL(2,C) fragen, ergibt sich eine Bedingung für die Quantisierung der Helizität. Außerdem zeigt die obige Formel, dass sich bei Lorentztransformationen (ohne Spiegelungen) die Helizität nicht ändert (anders als die Drehimpulskomponente eines massiven Teilchens). Das hängt damit zusammen, dass man ein masseloses Teilchen nicht überholen kann. Die Phase eines masselosen Zustandes ändert sich bei Lorentztransformationen aber sehr wohl in Abhängigkeit von der Helizität -- das merkt man beispielsweise bei der Superposition von Zuständen entgegengesetzter Helizität, z.B. bei polarisiertem Licht.

Nulldrehungen gehen bei masselosen Zuständen also nicht in die Darstellungsmatrix D(u) der kleinen Gruppe ein -- so erfordert es die physikalische Realität, die wir vorfinden (die Mathematik erzwingt das dagegen so nicht). Wenn wir nun zu Impulsamplituden und weiter zu Feldern übergehen, so wird sich diese Forderung in Nebenbedingungen für die Felder niederschlagen. Für Vektorfelder ergeben sich so beispielsweise die sogenannten Eichbedingungen. Man sieht, wie eine Forderung für die Raum-Zeit-Transformationseigenschaften masseloser Zustände so ganz nebenbei eine Begründung für die Eichbedingungen von Feldern liefert. Mehr zu Eichtheorien siehe Die Grenzen der Berechenbarkeit Kapitel 5.4.4 und folgende. Details zum Zusammenhang zwischen Nulldrehungen und Eichtransformationen kommen später in Kapitel 4.14.

Die Lorentzmatrizen Λu für die Wigner-Rotationen in masselosen Fall haben wir oben bereits kennengelernt. Wir wollen nun noch die entsprechende SL(2,C)-Matrix u ausrechnen, wobei u im masselosen Fall nicht unitär zu sein braucht. Dazu verwenden wir die allgemeine Formel   g σ(p) g+   =   σ(Λp)   und setzen darin Λu für Λ , k für p und u für g ein (vorsicht: u ist hier nicht unitär!):   u σ(k) u+   =   σ(Λuk)   . Da Λu eine Wigner-Rotation ist, haben wir darin   Λuk = k   . Mit   k = (1,0,0,1)   folgt:   u (1 + σ3) u+   =   (1 + σ3)   . Die 2-mal-2-Matrix   (1 + σ3)   ist nun eine sehr einfache Matrix: Sie hat nur links oben eine 2 und ansonsten nur Nullen. Für die vier Matrixelemente uij der Matrix u folgt damit:

  u11 u11*   =   1
  u11 u21*   =   0
  u21 u11*   =   0
  u21 u21*   =   0

Aus der vierten Gleichung folgt   u21 = 0   . Damit sind die zweite und dritte Gleichung automatisch erfüllt. Die erste Gleichung besagt, dass   |u11| = 1   sein muss, d.h. u11 ist eine komplexe Phase. Wir schreiben daher   u11 = e−i φ/2   (ja, man erahnt schon die Drehmatrix zu R(φ) ). Und schließlich muss u auch noch aus SL(2,C) sein, also   det u = 1   erfüllen:   u11 u22 + u12 u21 = 1   . Setzten wir hier ein, was wir bereits wissen, so folgt   u22 = ei φ/2   . Das einzige Matrixelement, für das es keine Einschränkungen gibt, ist u12 , welches wir als   u12 = b ei φ/2   schreiben wollen. Unsere Wigner-Rotation u sieht also bei masselosen Teilchen so aus:


u   =   æ
ç
è
e−i φ/2
  b ei φ/2
0
ei φ/2
ö
÷
ø

(siehe z.B. Hendrik van Hees: Introduction to Relativistic Quantum Field Theory, Kapitel B.4.2 mit etwas anderen Vorzeichenkonventionen). Analog zur Gleichung   Λu   =   ΛN(δ,η)   R(φ)   können wir u also auch schreiben als

SL(2,C)-Matrix zur Wigner-Rotation bei masselosen Teilchen:

  u   =   uN(δ,η)   e−i φ/2 σ3  

uN   =   æ
ç
è
1
b
0
1
ö
÷
ø

wobei die komplexen Zahl b mit den reellen Parametern δ und η zusammenhängt. Diesen Zusammenhang können wir leicht ausrechnen, indem wir in   g σ(p) g+   =   σ(Λp)   für p den Vektor   e0 einsetzen, für Λ die Matrix ΛN und für u die Matrix uN :   uN σ(e0) uN+   =   σ(ΛNe0)   . Rechts steht der erste Spaltenvektor von ΛN , umgewandelt in die entsprechende hermitesche Matrix (vergleiche ganz oben die explizite Formel für die Matrix σ(x) ). Links ist σ(e0) = 1. Schreibt man die Matrizen aus, so liest man ab:

  b = δ − i η  

Das passt gut dazu, dass sich bei Multiplikation von zwei Nulldrehungen die Parameter addieren müssen. Analog addieren sich auch die komplexen Zahlen b und b', wenn man zwei Matrizen uN und uN' multipliziert.


Spin und Helizität, Darstellung auf Feldern bei Masse Null:

Damit wäre eigentlich alles zum masselosen Fall gesagt. Es ist jedoch nützlich, sich noch einmal einige Gedanken zur Darstellung auf Feldern zu machen, so wie wir sie oben hergeleitet haben. Das Problem bei masselosen Teilchen ist nämlich: Die Helizität ändert sich bei Poincaretransformationen nicht, d.h. sie eignet sich nicht als Matrixindex, so wie dies bei Masse größer Null beim Spinindex noch der Fall war. Als Komplikation kommt hinzu, dass Nulldrehungen sich nur auf den Teilchenimpuls, nicht aber über die Phase auswirken. Die oben hergeleiteten Formeln für die Darstellung auf Feldern ergeben also keine besonders nützlichen Ergebnisse, wenn wir die Helizität als Matrixindex verwenden.

Schön wäre es, wenn wir wieder einen Spinindex wie beim Fall mit Masse größer Null einführen könnten. Das macht besonders dann Sinn, wenn wir den masselosen Fall als Grenzfall des massiven Falls mit Grenzübergang Masse gegen Null betrachten wollen. Starten wir also mit den Zustandsvektoren   | p s ms ñ   , die wir im Fall massiver Teilchen betrachtet haben (siehe oben die Betrachtung der kleinen Gruppe bei Masse größer Null), und versuchen wir, eine Verbindung von den so definierten Spinzuständen   | p s ms ñ   zu den Helizitätszuständen   |pñ   herzustellen, die wir bei den masselosen Teilchen verwendet haben, wobei σ die Helizität und ms die Spinkomponente in z-Richtung ist.

Die Idee ist nun Folgende: Die Helizität wird oft auch als Spinkomponente in Impulsrichtung bezeichnet. Wenn wir also nur Impulse in z-Richtung betrachten, wo müssten Spin und Helizität identisch sein. Die Poincaretransformationen, die den Impuls in z-Richtung belassen, müssten sich dann auf Spinzustände und Helizitätszustände in gleicher Weise auswirken. Diese Poincaretransformationen lassen sich aus Drehungen um die z-Achse und Boosts in z-Richtung zusammensetzen. Bei masseloser Teilchen kommen noch die Nulldrehungen hinzu. Überprüfen wir also, wie sich in diesen Fällen Spinzustände und Helizitätszustände mit Impuls in z-Richtung transformieren. Dazu müssen wir jeweils die zugehörige Wigner-Rotation berechnen. Dabei kommt uns zu Gute, dass die SL(2,C)-Matrizen g bei Boosts in z-Richtung und bei Drehungen um die z-Achse jeweils reine Diagonalmatrizen sind -- daher vertauschen sie miteinander. Das werden wir ausnutzen.

Drehungen um die z-Achse:

Setzen wir für Λ eine Drehung R(φ) um die z-Achse ein, und entsprechend für g die zugehörige Matrix u(φ). Die Matrix g(p) ist ein Boost in z-Richtung, der k in p umwandelt (p liegt ja in z-Richtung). Außerdem ist   Λp = R(φ)p = p   , so dass   g(Λp) = g(p)   ist. Sowohl g(p) als auch u(φ) sind diagonal, vertauschen also miteinander. Damit lautet die Wigner-Rotation:

  u   =   g(Λp)− 1 g g(p)   =   g(p)− 1 u(φ) g(p)   =   g(p)− 1 g(p) u(φ)   =   u(φ)

d.h. die Wigner-Rotation u ist selbst die Drehung u(φ) um die z-Achse. Diese Drehung wird bei Spinzuständen und bei Helizitätszuständen durch die gleiche Diagonal-Matrix D(u(φ)) dargestellt, wenn wir σ = ms setzen.

Boost in z-Richtung:

Schauen wir uns nun bei Impuls in z-Richtung an, wie die Wigner-Rotation bei einem Boost Λ = Λb mit zugehörigem g = gb in z-Richtung aussieht. Dazu brauchen wir insbesondere g(Λbp). Das ist ein Boost in z-Richtung, der aus k den Vektor Λbp macht. Diesen Boost können wir zusammensetzen aus dem Boost g(p), der aus k den Impuls p macht, und dem Boost gb, der aus p den Impuls Λbp macht. Also ist g(Λp) = gb g(p) . Setzen wir dies ein:

  u   =   g(Λbp)− 1 gb g(p)   =   g(p)− 1 gb− 1 gb g(p)   =   1

Die Wigner-Rotation ist also die Identität und die wird bei Helizitätszuständen und bei Spinzuständen durch D(u) = 1 dargestellt.

Nulldrehungen:

Bei den Drehungen um die z-Achse und den Boosts in z-Richtung spielte es in der obigen Betrachtung keine Rolle, ob wir massive oder masselose Zustände betrachten. Bei den Nulldrehungen ist das anders: Nur bei masselosen Teilchen belassen sie den Impuls in z-Richtung.

Für eine Nulldrehung   Λ = ΛN   und entsprechend   g = uN   ist   Λp = ΛN p0k = p0 ΛNk = p0k = p   , d.h. der Impuls in z-Richtung ändert sich nicht -- vorausgesetzt, die Masse ist Null! Entsprechend ist wie bei den Drehungen   g(Λp) = g(p)   beides derselbe Boost in z-Richtung. Diese Boostmatrix hat die Form

  g(p)   =   diag( cosh α/2 + sinh α/2 , cosh α/2 − sinh α/2 )   =   diag( eα/2 , e− α/2 )  

wobei diag bedeutet, dass es sich um eine Diagonalmatrix mit den folgenden beiden Diagonalelementen handelt. Außerdem haben wir die Darstellung   cosh x = (ex + e− x) / 2   und   sinh x = (ex − e− x) / 2   verwendet (siehe Wikipedia: Hyperbelfunktion). Damit lautet die Wigner-Rotation:

  u   =   g(Λp)− 1 g g(p)   =   g(p)− 1 uN g(p)   =   diag( e− α/2 , eα/2 )   uN   diag( eα/2 , e− α/2 )   =   uN'

Dabei ist uN' eine Nulldrehungsmatrix mit dem Matrixelement   b' = b e− α   oben rechts. Die Wigner-Rotation einer Nulldrehung ist also bei Impuls in k-Richtung bei masselosen Teilchen wieder eine Nulldrehung. Die Darstellungsmatrix D(uN') ist dann gleich 1, denn Nulldrehungen wirken sich nach Definition nicht auf die Helizität aus.

Was macht eine Nulldrehung mit Spinzuständen bei Impuls in z-Richtung? Diese wollen wir ja als Grenzfall massiver Zustände mit Masse gegen Null auffassen. Bei massiven Teilchen ist nun die Wigner-Rotation immer eine Drehmatrix aus SU(2) -- eine Nulldrehung gehört nicht dazu. Wir müssen uns also ansehen: Was geschieht mit der Wigner-Rotation einer Nulldrehung bei massiven Teilchen mit Impuls in z-Richtung, wenn die Masse gegen Null geht? Wiederholen wir also die obige Berechnung der Wigner-Rotation bei massiven Teilchen mit Masse gegen Null. Man kann leicht mit Hilfe der ΛN-Matrix nachrechnen, dass bei Masse gegen Null der Term   ΛNp   gegen p geht (mit p in z-Richtung) -- so wie in der Analyse für masselose Teilchen. Die Berechnung der Wigner-Rotation geht also genauso wie im masselosen Fall und wir können wieder mit der obigen Formel arbeiten, d.h.   u = uN'   mit   b' = b e− α  . Das wäre allerdings keine SU(2)-Matrix, aber bei massiven Teilchen muss die Wigner-Rotation eine SU(2)-Matrix sein. Was läuft hier schief?

Ganz einfach: Der masselose Grenzfall wirkt sich zusätzlich noch auf die Rapidität α aus. Es muss nämlich   p = Λp (m,0)   sein. Setzt man hier die Boostmatrix von ganz oben ein, so erhält man   (p0, |p|e3)   =   (m (cosh α) , m (sinh α) e3)   . Wenn hier die Masse gegen Null geht, so muss die Rapidität α gegen Unendlich gehen. Das ist auch anschaulich klar: Je leichter ein Teilchen ist, umso größer muss seine Geschwindigkeit sein, um eine vorgegebene Energie p0 zu erreichen, d.h. umso stärker muss der Boost ausfallen, um vom Ruhesystem aus diese Geschwindigkeit zu erreichen. Noch ein Hinweis: Die Teilchengeschwindigkeit bleibt natürlich immer kleiner-gleich der Lichtgeschwindigkeit, wobei die Lichtgeschwindigkeit erst bei unendlicher Rapidität erreicht wird. Im Grenzfall masseloser Teilchen können wir also in der obigen Formel für u die Rapidität α gegen Unendlich gehen lassen. Damit geht   b' = b e− α   →   0   und die Wignerrotation u geht gegen 1 (zum Glück - eine SU(2)-Matrix!). Die entsprechende Darstellungsmatrix D(uN) ist dann bei den Spinzuständen im masselosen Grenzfall ebenfalls 1 -- wie bei den Helizitätszuständen. Übrigens: Gäbe es kontinuierliche Nulldrehungs-Quantenzahlen, so wäre D(uN) bei den Helizitätszustanden nicht einfach 1, anders als bei den Spinzuständen. Man kann also masselose Helizitätszustände nur dann als masselosen Grenzfall massiver Teilchenzustände verstehen, wenn es keine kontinuierlichen Nulldrehungs-Quantenzahlen gibt. Offenbar hat sich die Natur dafür entschieden, dass masselose Teilchen von Teilchen mit sehr geringer Masse kaum unterscheidbar sein sollen -- eine physikalisch sicher nachvollziehbare Forderung.

Damit habe wir das gewünschte Ergebnis: Alle Poincaretransformationen, die bei masselosen Teilchen den Impuls in z-Richtung belassen, wirken sich auf Spinzustände und Helizitätszustände gleich aus, wobei wir masselose Spinzustände als masselosen Grenzfall massiver Spinzustände verstehen. Wir setzen also

  | |p| e3 , σ ñ   =   | |p| e3 , s ms ñ     mit   σ = ms

Welchen Wert wir für den Gesamtspin s auf der rechten Seite nehmen sollen, ist erst einmal nicht festgelegt (er muss nur größer-gleich σ sein, damit σ = ms sein kann). Normalerweise aber betrachtet man nicht nur einen, sondern gleich mehrere Helizitätswerte gemeinsam, z.B. 1 und −1 . Dann wird man s=1 wählen. Meist kommt man auch umgekehrt von einer Darstellung mit bestimmtem Gesamtspin s und betrachtet den masselosen Grenzfall -- dann ist s sowieso vorgegeben.

Wie kommt man nun zu beliebigen Impulsen? Den Impulsbetrag können wir schon in z-Richtung passend wählen. Also brauchen wir nur noch eine Drehung R(w), die den Impuls von der z-Achse in die gewünschte Richtung dreht (die entsprechende SU(2)-Matrix nennen wir u(w) ). Es ist also   p = R(w) |p| e3   . Dabei parametrisiert w wie gewohnt die Drehachse und den Drehwinkel. Anschaulich ist klar, dass die Drehachse senkrecht auf der Impulsrichtung und der z-Achse steht, und dass der Drehwinkel gleich dem Winkel zwischen Impulsrichtung und z-Achse ist. Wenden wir also die Drehung auf die obige Gleichung an:

  Tu(w)   | |p| e3 , σ ñ   =   Tu(w)   | |p| e3 , s ms ñ  

Bei den Spinzuständen wissen wir von oben, dass für eine Drehung u(w) die Wigner-Rotation u gerade identisch mit der Drehung u(w) ist: u = u(w) . Diese Aussage bleibt auch im masselosen Grenzfall gültig (sonst würde es auch keinen Sinn mehr machen, ms in diesem Grenzfall als Spinindex zu interpretieren). Also ist auf der rechten Seite

  Tu(w)   | |p| e3 , s ms ñ   =   ∑ms'   | p , s ms' ñ   Dsms' ms(u(w))  

Nun zur linken Seite. Als erstes müssen wir die Wigner-Rotation u für masselose Teilchen bei der Drehung R(w) ausrechnen, wobei der Impuls in z-Richtung   |p| e3   bzw. der zugehörige Viererimpuls   p0k   verwendet wird. Wir können die Konvention treffen, dass g(p0k) ein Boost in z-Richtung sein soll (d.h. wir schließen Nulldrehungen aus, so wie wir bei massiven Teilchen Drehungen im Ruhesystem für g(p) ausgeschlossen haben). Wie sieht es mit   g(R(w) p0k) = g(p)   aus? Das ist eine Lorentztransformation, die aus k den Impuls p macht. Diese können wir zusammensetzen aus dem Boost g(p0k) in z-Richtung, der die Energie auf p0 einstellt, und der anschließenden Drehung u(w), die den Impuls ausrichtet. Also ist   g(R(w) p0k) = g(p) = u(w) g(p0k)   . Damit können wir die Wigner-Rotation ausrechnen:
  u   =   g(R(w) p0k)− 1   u(w)   g(p0k)   =   g(p0k)− 1   u(w)− 1   u(w)   g(p0k)   =   1  
Die Wigner-Rotation ist also die Identität! Das ist auch anschaulich klar, denn die Wigner-Rotation im masselosen Fall muss ja eine Drehung um die z-Achse mit anschließender Nulldrehung sein. Nulldrehungen können wir ignorieren, da sie in D(u) nicht berücksichtigt werden, und eine Drehung um die z-Achse tritt hier nicht auf, da die Drehachse w senkrecht zur z-Achse steht.

Wir haben hier also den interessanten Fall, dass die Wigner-Rotation im masselosen Fall nicht identisch ist mit der Wigner-Rotation im massiven Fall mit Masse gegen Null. Die Ursache liegt in dem Term   g(R(w) p0k) = g(p)   in der Wigner-Rotation. Das ist die Lorentztransformation, die aus dem Standardimpuls k den Impuls   p = R(w) p0k   macht. Im massiven Fall können wir hierfür einen Boost in p-Richtung wählen, denn k = 0. Im masselosen Fall ist dagegen k = e3, so dass wir neben dem Boost zusätzlich die Drehung u(w) mit einbauen müssen, die dann den anderen Term u(w) neutralisiert.

Da die Wigner-Rotation im masselosen Fall die Identität ist, haben wir für die linke Seite oben die Gleichung:

  Tu(w)   | |p| e3 , σ ñ   =   |pñ

Insgesamt folgt also aus   Tu(w)   | |p| e3 , σ ñ   =   Tu(w)   | |p| e3 , s ms ñ   folgender Zusammenhang:

Zusammenhang zwischen masselosen Helizitätszuständen und Spinzuständen im Grenzfall Masse gegen Null:

  |pñ   =   ∑ms'   | p , s ms' ñ   Dsms' ms(u(w))  

mit   ms = σ   . Dabei gehört die SU(2)-Matrix   u(w)   zur Lorentz-Drehmatrix   R(w)   mit   p = R(w) |p| e3   , d.h.   R(w)   dreht die z-Achse in Impulsrichtung.

Anschaulich kann man sich vorstellen, dass auf der rechten Seite der Formel der Spin durch die Matrix D(u(w)) von der z-Richtung in die p-Richtung gedreht wird, so dass seine Projektion auf p wieder gleich der Helizität σ ist, so wie das zuvor in z-Richtung der Fall war. Ein Operator, der diese Projektion des Spins auf die Impulsrichtung darstellen sollte, ist der Helizitätsoperator   SP/|P|   . Also müsste der Helizitätsoperator, angewendet auf den Helizitätszustand, als Eigenwert diese Helizität haben. Überprüfen wir es (wobei wir immer wieder die Darstellungseigenschaft verwenden, die Darstellungsmatrix des Spinoperators Si gleich der Darstellungsmatrix des entsprechenden SU(2)-Generators σi/2 setzen,   ms = σ   verwenden, die Gleichung   u(w)− 1 σ(p) u(w)   =   σ(R(w)− 1 p)   =   σ(|p| e3)   =   |p| σ3   sowie die Linearität der Darstellung benutzen):

  SP/|P|   |pñ   =  
  =     SP/|P|     ∑ms'   | p , s ms' ñ   Dsms' ms(u(w))     =  
  =     ∑ms' ms''   | p , s ms'' ñ   Dsms'' ms' (SP/|P|)   Dsms' ms(u(w))     =  
  =     ∑ms' ms''   | p , s ms'' ñ   Dsms'' ms' (σ(p)/2|p|)   Dsms' ms(u(w))     =  
  =     ∑ms''   | p , s ms'' ñ   Dsms'' ms ( σ(p) u(w) ) / 2|p|     =  
  =     ∑ms''   | p , s ms'' ñ   Dsms'' ms ( u(w) u(w)− 1 σ(p) u(w) ) / 2|p|     =  
  =     ∑ms''   | p , s ms'' ñ   Dsms'' ms ( u(w) σ3 ) / 2     =  
  =     ∑ms' ms''   | p , s ms'' ñ   Dsms'' ms'(u(w))   Dsms' ms(S3)     =  
  =     ∑ms''   | p , s ms'' ñ   Dsms'' ms(u(w))   ms     =  
  =     σ   |pñ

Nochmal zusammengefasst:

  SP/|P|   |pñ   =   σ   |pñ


Nun zu den Impulsamplituden und den Feldern: Einen allgemeinen masselosen Zustand mit Helizität σ können wir analog zum Zustand mit Masse schreiben als

  |ψ,σñ   =   ∫ d3p / 2p0   hσ(p)   |pñ

Diese Gleichung definiert die Impulsamplitude in Helizitätsdarstellung   hσ(p)   , wobei wir den Helizitätsindex hier oben schreiben wollen. Vorsicht: es gibt hier keine Summe über die Helizität, denn da diese poincare-invariant ist, haben wir sie (wie die Masse Null) als invariante Eigenschaft des Gesamtzustandes   |ψ,σñ   gewählt. Drücken wir nun wieder die Helizitätszustände durch die Spinzustände aus, so haben wir

  |ψ,σñ   =   ∑ms'   ∫ d3p / 2p0   hσ(p)   | p , s ms' ñ   Dsms' σ (u(w))  

wobei wir   σ = ms   explizit eingesetzt haben. Dies können wir mit der Definition der Impulsamplituden in Spindarstellung vergleichen, wobei wir zusätzlich die Helizität festlegen und diese als Index oben an den Impulsamplituden anbringen (dazu sagen wir etwas weiter unten noch Genaueres):

  |ψ, σñ   =   ∑ms'   ∫ d3p / 2p0   f σs ms'(p)   | p , s ms' ñ

Der Vergleich der beiden Formeln ergibt:

Zusammenhang zwischen Impulsamplituden in Helizitätsdarstellung und Impulsamplituden in Spindarstellung:

  hσ(p)   Dsms' σ (u(w))   =   f σs ms'(p)  

Vorsicht: in der Formel steht keine Summe über σ , auch wenn der Index doppelt vorkommt. Die Matrix   Dsms' σ (u(w))   ist eine Funktion von p , denn u(w) gehört zu der Drehung R(w), die die z-Richtung in p-Richtung dreht.

Natürlich können wir diesen Zusammenhang mit der inversen D-Matrix auch nach   hσ(p)   freistellen. Die Bedeutung des hochgestellten σ-Indexes in   f σs ms'(p)   kann man sich noch etwas genauer klarmachen, denn er bedeutet, dass die Impulsamplituden   f σs ms'(p)   Nebenbedingungen erfüllen müssen (sonst würden sie nicht zur Helizität σ gehören). Es gibt nämlich insgesamt   2 (s+1)   Werte für ms' , also auch   2 (s+1)   Impulsamplituden   f σs ms'(p)   . Die obige Gleichung sagt aber, dass nur eine von ihnen unabhängig sein kann, denn alle lassen sich aus einer einzigen Funktion   hσ(p)   berechnen.

Der Helizitätsoperator liefert eine naheliegende Möglichkeit, die Nebenbedingungen für die Impulsamplituden zu formulieren. Dazu definieren wir den Helizitätsoperator wie gewohnt auf den Impulsamplituden:

  SP/|P|   |ψ, σñ   =:   ∑ms'   ∫ d3p / 2p0   [ SP/|P| f ] σs ms'(p)   | p , s ms' ñ

Wegen     SP/|P|   |ψ, σñ   =   σ   |ψ, σñ   gilt dann

  [ Sp/|p| f ] σs ms'(p)   =   σ   f σs ms'(p)

Andererseits ist

  SP/|P|   |ψ, σñ   =  
  =   ∑ms'   ∫ d3p / 2p0   f σs ms'(p)   SP/|P|   | p , s ms' ñ   =  
  =   ∑ms' ms   ∫ d3p / 2p0   f σs ms'(p)   | p , s ms ñ   Dsms ms'(Sp/|p|)     =  
  =   ∑ms ms'   ∫ d3p / 2p0   Dsms' ms(Sp/|p|)   f σs ms(p)   | p , s ms' ñ

so dass Verglleich mit oben   [ Sp/|p| f ] σs ms'(p)   =   Dsms' ms(Sp/|p|)   f σs ms(p)   ergibt. Weglassen der Spin-Indices ergibt damit in Matrixschreibweise die Bedingung:

Helizitätsbedingung für die Impulsamplituden in Spindarstellung:

  [ Sp/|p| f ] σs(p)   =   Ds(Sp/|p|)   f σs(p)   =   σ   f σs(p)

d.h. der Spinor der Impulsamplituden ist Eigenvektor der Matrix   Ds(Sp/|p|)   zur Helizität σ als Eigenwert. Dabei bedeutet die Schreibweise   Ds(Sp/|p|)   , dass die Darstellungsmatrizen der drei Spinoperatoren gebildet werden, dann die Linearkombination dieser Matrizen mit den drei Impulskomponenten gebildet wird und zum Schluss noch durch den Impulsbetrag dividiert wird.

Nun zu den Feldern. Diese hatten wir aus den Impulsamplituden über die Gleichung   F(p)   :=   D(g(p))   f(p)   (mit   p0 = √(m2 + p2)   ) definiert. Diese Definition gilt bei Masse größer Null. Wir müssen nun den Grenzübergang Masse gegen Null durchführen. Das kann allerdings problematisch werden, denn g(p) ist ein Boost des Ruheimpulses   (m,0)   zum Impuls p , und oben hatten wir bereits gesehen, dass bei Masse gegen Null die Rapidität des Boosts gegen Unendlich geht. Es ist also unklar, ob sich masselose Felder überhaupt so einfach definieren lassen.

Schauen wir uns dazu einige Details an. Oben hatten wir festgestellt, dass die Impulsamplitude zur Helizität σ allgemein die Form   hσ(p)   Dsms' σ (u(w))   =   f σs ms'(p)   hat. Die Äbhängigkeit der Impulsamplitude vom Spinindex ist also durch die Drehmatrix Ds vollkommen festgelegt. Sie entspricht der Spalte mit Nummer σ in dieser Drehmatrix. Für die Felder haben wir dann (wir schreiben die Indices und alle Summen hier aus)

  F σs ms(p)   :=   ∑ms'   Dsms ms'(g(p))   f σs ms'(p)   =   ∑ms'   Dsms ms'(g(p))   hσ(p)   Dsms' σ (u(w))  

Analog zu den Drehmatrizen haben wir dabei auch bei den Boosts die Schreibweise   Ds(g(p))   verwendet, also oben einen Spinindex s hinzugefügt. Genau genommen ist das bisher nur für Drehungen definiert. Wir wollen das hier so verstehen: Wir verwenden eine Darstellung D(g) für ganz SL(2,C), die für Drehungen g = u die üblichen Drehmatrizen   Ds(u)   ergibt. Ob damit die Darstellungsmatrix auch für Boosts eindeutig festliegt, werden wir unten noch sehen. Es wird sich herausstellen, dass sie nicht eindeutig festliegt.

Die obige Formel besagt: Um den Feld-Spaltenvektor   F σs(p)   zu bilden, wird das Matrixprodukt   Ds(g(p))   Ds(u(w))   gebildet, dann die Spalte Nummer σ davon genommen und mit der skalaren Funktion   hσ(p)   multipliziert. Wegen der Darstellungseigenschaft ist   Ds(g(p))   Ds(u(w))   =   Ds(g(p) u(w))   . Bei der Untersuchung der kleinen Gruppe massiver Teilchen hatten wir oben außerdem die Formel   u(w) g(p)   =   g(Rp) u(w)   abgeleitet. Sie besagt: Man kann erst in p-Richtung boosten und dann drehen, oder erst drehen und dann in die gedrehte Richtung Rp boosten. In dieser Formel können wir   Rp =: p'   bzw.   p = R−1p'   setzen und den Strich wieder weglassen, d.h.   u(w) g(R−1p)   =   g(p) u(w)   . Das können wir nun in der Darstellungsmatrix verwenden:   Ds(g(p) u(w))   =   Ds(u(w) g(R−1p))   . Nun ist aber rechts   R−1p = p0 (1,e3)   . Wir haben also:

Zusammenhang zwischen einem Feld und der Impulsamplitude in Helizitätsdarstellung:

  F σs ms(p)   =   ∑ms'   hσ(p)   Dsms ms'(u(w))   Dsms' σ (g(p0 (1,e3)))  

Es wird also ein Boost in z-Richtung ausgeführt, um die Energie p0 zu erreichen, und die Spalte Nummer σ der entsprechenden Darstellungsmatrix gebildet. Dieser Spaltenvektor wird mit der skalaren Funktion   hσ(p)   multipliziert und mit der Drehmatrix   Ds(u(w))   gedreht. Für Masse gegen Null geht dabei die Rapidität des Boosts in z-Richtung gegen unendlich, was zu Divergenzen führen kann. Wir können versuchen, diese Divergenzen durch einen Normierungsfaktor N(m) aufzufangen, den wir formal von der Masse m abhängig wählen können und der im masselosen Grenzfall geeignet gegen Null gehen muss, so dass der folgende Ausdruck konvergiert:

  H σs ms(p)   =   N(m)   F σs ms(p)   =   N(m)   ∑ms'   hσ(p)   Dsms ms'(u(w))   Dsms' σ (g(p0 (1,e3)))  

Der Normierungsfaktor N(m) hat ja weiter keine Auswirkungen auf die Transformationseigenschaften des Feldes, so dass diese Vorgehensweise legitim ist. Mehr dazu in den nächsten Kapiteln am Beispiel von Spin 0, 1/2 und 1.



Endliche-dimensionale Darstellungsmatrizen der Lorentzgruppe:

Wir hatten oben bereits die Darstellung der Poincaregruppe auf Feldern im Ortsraum und im Impulsraum kennengelernt. Im Ortsraum hatten wir beispielsweise

  [Tg,a ψ](x)   =   D(g)   ψ(Λ− 1(x − a))

hergeleitet. Dabei war   D(g)   eine endlich-dimensionale komplexe Darstellungsmatrix der Lorentzgruppe bzw. genauer deren Überlagerungsgruppe SL(2,C). Für zwei Elemente g und g' aus SL(2,C) soll also   D(g g') = D(g) D(g')   sein. Endlich-dimensional sollte sie sein, um etwas mit einer Einteilchen-Darstellung zu tun zu haben, bei der der Index σ nur endlich viele diskrete Werte annehmen kann. Die Aspekte unendlich-dimensionaler Darstellungen kommen über die Abhängigkeit der Funktion ψ vom kontinuierlichen Vierervektor x ins Spiel (so kann man ψ nach einem vollständigen Funktionensystem entwickeln, das aus unendlich vielen Basisfunktionen besteht).

Da die Lorentzgruppe wegen der Boosts nicht kompakt ist, sind alle unitären Darstellungen unendlich-dimensional (bis auf die triviale Darstellung). Oben hatten wir diese Darstellungen bereits kennengelernt. Da   D(g)   aber eine endlich-dimensionale Darstellungsmatrix sein soll, kann sie nicht (immer) unitär sein. Das unterscheidet D(g) von den Darstellungsmatrizen D(u), die unitär gewählt werden können. Für die SL(2,C)-Untergruppe SU(2) kann man natürlich für D(g) die Drehmatrizen D(u) nehmen. Bei den Boosts geht das nicht -- hier sehen die Matrizen D(g) anders aus!

Um die möglichen Matrizen D(g) zu ermitteln, kann man wie bei der Drehgruppe über die Darstellungen der Lie-Algebra gehen. Dazu haben wir oben bereits alles Wichtige kennengelernt. Sammeln wir es noch einmal:

Insbesondere sind die drei Generatoren A(Ji) der Drehungen hermitesch, die drei Generatoren A(Ki) der Boosts dagegen antihermitesch. Das gilt auch für die Generatoren der Gruppe SL(2,C), die wir direkt anhand der obigen Formeln für u und eh ablesen können:

Natürlich erfüllen auch die Matrizen   σk / 2   und   − i σk / 2   die obige Lie-Algebra, denn SL(2,C) hat ja als Überlagerungsgruppe der Lorentzgruppe dieselbe Lie-Algebra wie diese. Der Faktor   − i   führt dabei zu dem negativen Vorzeichen im Kommutator der Boost-Generatoren.

Eine allgemeine Lorentztransformation kann man nun schreiben als

  Λ   =   ei α A(K) − i w A(J)  

Grund: die Exponentialabbildung ist für die Lorentzgruppe surjektiv (siehe Lie Groups, Lie Algebras and the Exponential Map). Vorsicht: das ist nicht dasselbe wie   ei α A(K) e− i w A(J)   , da die Generatoren für Boosts und Drehungen nicht vertauschen.

Im Exponenten steht ein allgemeines Element der Lie-Algebra:   i α A(K) − i w A(J)   (das i führen wir hier mit). Dabei umfassen die Vektoren α und w insgesamt 6 reelle Parameter. Es ist nun nützlich, neue Generatoren J(1)k und J(2)k einzuführen (der Grund für diese Bezeichnungsweise wird gleich noch sichtbar):

  Jk(1)   :=   ( A(Jk)   +   i A(Kk) ) / 2
  Jk(2)   :=   ( A(Jk)   −   i A(Kk) ) / 2

Vorsicht: da hier ein i vorkommt, sind dies keine Elemente der reellen Lie-Algebra der Lorentzgruppe mehr, die ja nur Linearkombinationen der Generatoren mit reellen Koeffizienten zulässt. Das macht aber nichts: Bei der Drehgruppe hatten wir in Kapitel 4.8 auch Leiteroperatoren J+ und J außerhalb der reellen Lie-Algebra gebildet. Die Umkehrung der obigen Formeln lautet nun:

  A(Jk)   =          Jk(1) + Jk(2)
  A(Kk)   =   − i (Jk(1) − Jk(2))

Damit können wir das Element der Lie-Algebra im Exponenten umschreiben:

  i α A(K) − i w A(J)   =  
  =   i α (− i) (J(1)J(2))   −   i w (J(1) + J(2))     =  
  =   (α − i w) J(1)   −   (α + i w) J(2)

Rechnen wir die Kommutatoren der neuen Generatoren aus. Dazu schreiben wir etwas kürzer Ji statt A(Ji) usw., d.h. wir haben

  − [Ki, Kj]   =   [Ji, Jj]   =   i εijk Jk
  [Ji, Kj]   =     − [Kj, Ji]   =     − [Jj, Ki]   =     [Ki, Jj]   =   i εijk Kk

Damit ist

  [Ji(1), Jj(1)]   =  
  =   [Ji + i Ki , Jj + i Kj] / 4   =  
  =   ( [Ji, Jj]   +   i [Ji, Kj]   +   i [Ki, Jj]   −   [Ki, Kj] ) / 4   =  
  =   ( 2 i εijk Jk   +   2 i i εijk Kk ) / 4   =  
  =   i εijk ( Jk   +   i Kk ) / 2   =  
  =   i εijk Jk(1)

Die Rechnung für   [Ji(2), Jj(2)]   geht genauso, nur dass wir überall   K   durch   −K   (mit entsprechendem Index) ersetzen müssen. Das Ergebnis lautet   [Ji(2), Jj(2)]   =   i εijk Jk(2)   . Bei der Rechnung für   [Ji(1), Jj(2)]   müssen wir im Vergleich zu   [Ji(1), Jj(1)]   überall   Kj   durch   − Kj   ersetzen (nur für den Index j, nicht für den Index i). Der erste und vierte sowie der zweite und dritte Term löschen sich dann aus, anstatt sich zu addieren, so dass   [Ji(1), Jj(2)]   =   0   ist, d.h. die J(1) 's und J(2)'s vertauschen miteinander. Fassen wir zusammen:

Umgeschriebene Lie-Algebra der Lorentzgruppe:

Die neuen Generatoren

  Jk(1)   :=   ( A(Jk)   +   i A(Kk) ) / 2
  Jk(2)   :=   ( A(Jk)   −   i A(Kk) ) / 2

erfüllen die Vertauschungsrelationen

  [Ji(1), Jj(1)]   =   i εijk Jk(1)  
  [Ji(2), Jj(2)]   =   i εijk Jk(2)  
  [Ji(1), Jj(2)]   =   0  

d.h. die J(1) 's und J(1) 's erfüllen getrennt für sich jeweils die Lie-Algebra der Drehgruppe (bzw. ihrer Überlagerungsgruppe SU(2) ). Sie verhalten sich also wie zwei Drehimpulsoperatoren, die getrennt voneinander in einem entsprechenden Tensorprodukt-Raum operieren (siehe Kapitel 4.8). Darin lag der Sinn, die neuen Generatoren einzuführen.

Die endlich-dimensionalen Darstellungen der Überlagerungsgruppe SL(2,C) können nun aus den endlich-dimensionale Darstellungen der Lie-Algebra über die Exponentialreihe gebildet werden (bis auf eine Feinheit, auf die wir gleich zurückkommen). Wir suchen also die endlich-dimensionalen Darstellungen dieser Lie-Algebra, d.h. wir suchen Matrizen   D(Ji(1))   und   D(Ji(1))   , die die obigen Vertauschungsrelationen erfüllen. Wie das geht, wissen wir aus Kapitel 4.8, wo wir die Darstellung der Drehgruppe auf Tensorprodukten untersucht haben. Dort haben wir zwei Drehimpulsoperatoren J(1) und J(2) betrachtet, die beide für sich getrennt die Drehimpulsalgebra erfüllen und die miteinander vertauschen. Ein Beispiel dafür waren der Bahndrehimpuls L und der Spin S . Analog wählen wir auch hier einen komplexen Darstellungs-Vektorraum mit Basisvektoren

  | j m ñ ο | j' m' ñ     =     | j m, j' m' ñ

so dass wir die gesuchten Matrizen wie folgt wählen können:

  Dj,j'nn',mm'(Ji(1))   =   á j n, j' n' | Ji(1) | j m, j' m' ñ   =   á j n | Ji(1) | j m ñ   á j' n' | j' m' ñ   =   Djnm(Ji)   δn'm'
  Dj,j'nn',mm'(Ji(2))   =   á j n, j' n' | Ji(2) | j m, j' m' ñ   =   á j n | j m ñ   á j' n' | Ji(2) | j' m' ñ   =   Dj'n'm'(Ji)   δnm

Dabei sind   Dj(Ji)   und   Dj'(Ji)   die Drehimpulsmatrizen zum Drehimpuls j und j', die wir aus Kapitel 4.8 kennen. Die Indexpaare nn' und mm' kann man als Doppelindex ansehen. Der gesamte Darstellungsraum ist also (2j+1) mal (2j'+1) - dimensional.

Mit diesen konkreten Ausdrücken für die Matrizen können wir nun sofort konkrete Ausdrücke für die Darstellungsmatrizen der Boost- und Drehgeneratoren ableiten:

  Dj,j'(Jk)   =           Dj,j'(Jk(1))   +   Dj,j'(Jk(2))
  Dj,j'(Kk)   =   − i ( Dj,j'(Jk(1))   −   Dj,j'(Jk(2)) )

Die obere Zeile entspricht formal der Addition zweier Drehimpulsoperatoren zu einem Gesamt-Drehimpulsoperator. Die obigen Matrizen kann man nun verwenden, um mit Hilfe der Exponentialreihe die Darstellungsmatrizen D(g) für Lorentztransformationen zu gewinnen, beispielsweise für Boosts oder Drehungen. Man kann die Darstellungsmatrizen D(g) auch in einen Zusammenhang mit den Darstellungsmatrizen Dj(u) für Drehungen bringen, und zwar so: Die Darstellung der Lorentztransformationen

  Λ   =   ei α A(K) − i w A(J)   =   e(α − i w) J(1)   −   (α + i w) J(2)

(siehe oben) überträgt sich auf die Darstellungsmatrizen D(g), die wir nun als   Dj,j'(g)   bezeichnen wollen:

  Dj,j'(g)   :=   ei α Dj,j'(K) − i w Dj,j'(J)   =   e(α − i w) Dj,j'(J(1))   −   (α + i w) Dj,j'(J(2))   =  
  =   Dj( i(α − i w)) ο Dj'( −i(α + i w))

mit den Drehmatrizen Dj und Dj' aus Kapitel 4.8 sowie der Schreibweise
  [Dj ο Dj']nn',mm'   =   Djnm Dj'n'm'
ganz analog zur Tensorprodukt-Darstellung von Drehungen. Es gibt allerdings einen Unterschied: Die Drehmatrizen Dj und Dj' hängen jetzt nicht mehr von reellen Zahlen (den Drehwinkeln) ab, sondern von komplexen Zahlen (α und w sind reell)! Das ergibt sich ganz zwanglos oben aus den Exponentialreihen, die eine entsprechende analytische Fortsetzung der Drehmatrizen definieren. Man kann nun wie bei den Drehungen einen Basiswechsel mit Hilfe der Clebsch-Gordan-Koeffizienten durchführen und so die Matrix   Dj,j'(g)   in Blockform bringen (also die endlich-dimensionale Darstellung ausreduzieren).

Die Drehimpulsmatrizen sind hermitesch -- zumindest kann man die Basis immer so wählen, dass sie es sind, denn jede Darstellung von SU(2) kann durch Basiswechsel unitär gemacht werden. Entsprechend sind die Darstellungsmatrizen der Lorentz-Drehgeneratoren nach den obigen Formeln auch hermitesch, während die Darstellungsmatrizen der Lorentz-Boostgeneratoren antihermitesch sind. Dies zeigt, dass   Dj,j'(g)   im Allgemeinen keine unitäre Matrix ist (sie ist nur bei Drehungen unitär, aber nicht bei Boosts). Darin spiegelt sich wieder, dass es bei nicht-kompakten Gruppen wie der Lorentzgruppe keine endlich-dimensionalen unitären Darstellungen gibt. Es ist nicht schlimm, dass   Dj,j'(g)   nicht unitär ist, denn wir betrachten hier ja Darstellungen auf Feldern und nicht auf Zustandsvektoren im Hilbertraum.

Schauen wir uns konkret die Darstellung mit j = 1/2 und j' = 0 an. Hier können wir die gestrichenen Indices weglassen und direkt schreiben

  D1/2, 0(g)   =   D1/2( i(α − i w))   =   e− i σ( i(α − i w)) / 2   =   eσ(α)/2 − i σ(w))/2

Für α = 0 haben wir also die Drehmatrix u von oben, und für w = 0 die Boostmatrix eh von oben. Wir wollen daher diese Formel als die Standard-Parametrisierung für ein Element g aus SL(2,C) ansehen und schreiben

  g   =   D1/2( i(α − i w))   =   eσ(α)/2 − i σ(w))/2

(genauer legt dies die Abhängigkeit von g von den Parametern α und w fest). Analog schauen wir uns die Darstellung mit j = 0 und j' = 1/2 an. Hier können wir die ungestrichenen Indices weglassen und direkt schreiben

  D0, 1/2(g)   =   D1/2( −i(α + i w))   =   e− i σ( −i(α + i w)) / 2   =  
  =   e−σ(α)/2 − i σ(w))/2   =   ((eσ(α)/2 − i σ(w))/2)+ )− 1   =   (g+ )− 1

Die beiden Darstellungen

  D1/2, 0(g)   =   g
  D0, 1/2(g)   =   (g+ )− 1

kann man nicht durch Basiswechsel ineinander umrechnen. Durch mehrfache Tensorproduktbildung dieser Matrizen und anschließende Ausreduktion kann man alle anderen Darstellungsmatrizen erzeugen (so wie man bei der Drehgruppe mit mehreren Spin 1/2 jeden anderen Drehimpuls aufbauen kann). Man bezeichnet sie deshalb als Fundamentaldarstellungen.

Noch eine interessante Anmerkung am Rande: Wir haben oben   g   =   eσ(α)/2 − i σ(w))/2   geschrieben. Tatsächlich ist es aber so, dass nicht jede Matrix g aus SL(2,C) so geschrieben werden kann! Die Exponentialabbildung von der Lie-Algebra von SL(2,C) nach SL(2,C) ist nicht surjektiv. Anders bei der Lorentzgruppe: dort ist die Exponentialabbildung surjektiv (siehe oben). Hier ist eine Matrix aus SL(2,C), die man nicht als Exponentialreihe schreiben kann:


− uN   =   − æ
ç
è
1
b
0
1
ö
÷
ø

Die dazu negative Matrix uN kann man dagegen als Exponentialreihe schreiben. Wir kennen diese Matrix von oben: es handelt sich um die Nulldrehungen. Allgemein ist es bei der Gruppe SL(2,C) so, dass man immer entweder g oder −g (oder beide) als Exponentialreihe schreiben kann. Da beide zur selben Lorentzmatrix gehören, ist verständlich, dass sich eine Lorentzmatrix immer als Exponentialreihe schreiben lässt. Mehr dazu siehe Lie Groups, Lie Algebras and the Exponential Map (speziell Seite 435) sowie Henrik van Hees: Introduction to Relativistic Quantum Field Theory, Appendix B.

Ist es für die obige Analyse nun schlimm, dass sich nicht jede Matrix g als Exponentialreihe schreiben lässt? Vermutlich nicht: Die Nulldrehungen sind eigentlich nur bei masselosen Teilchen interessant, und für diese Teilchen haben wir festgelegt, dass sie auf den physikalischen Zuständen trivial durch den Eins-Operator dargestellt werden. Außerdem kann man jede Matrix g als Produkt einer hermiteschen und einer unitären Matrix schreiben, und da sich diese jeweils als Exponentialreihe schreiben lassen, kann man jedes Element aus SL(2,C) zumindest als Produkt zweier Exponentialreihen von Matrizen aus der Lie-Algebra schreiben. Notfalls hat man demnach eben ein Produkt der entsprechenden Darstellungsmatrizen. Anders ausgedrückt: Hat man eine Matrix g, die sich nicht als Exponentialreihe schreiben lässt, so kann man mit einer 360-Grad-Drehung daraus die Matrix −g machen, und die lässt sich dann als Exponentialreihe schreiben.

Hört sich alles plausibel an, aber wer weiß: Diese Begründungen sind doch typische handwaving arguments, und der Teufel steckt oft im Detail. Es würde aber zu weit führen, hier in eine detaillierte Analyse einzusteigen.

Damit sind wir am Ende dieses recht umfangreichen Kapitels angekommen. Natürlich gäbe es noch sehr viel mehr über die Poincaregruppe, ihre Überlagerungsgruppe und deren Darstellungen zu sagen. Einige Beispiele für offene Fragen:

Wir werden diese Fragen nicht allgemein beantworten, sondern uns in den nächsten Kapiteln die wichtigsten Beispiele dazu ansehen. Außerdem wollen wir uns noch einmal mit der Frage beschäftigen, wie man auf die Gruppe SL(2,C) als Überlagerungsgruppe der Lorentzgruppe kommt.


zurück zum Inhaltsverzeichnis

last modified on 29 December 2008