Kapitel 4
Die Quantentheorie

6  Darstellung von Symmetrien in der Quantentheorie

Seit ich das vorhergehende Kapitel 4.5 geschrieben habe, sind über 4 Jahre ins Land gegangen. Daher habe ich inzwischen das Thema Symmetrien in der Quantentheorie bereits an mehreren anderen Stellen zumindest kurz angerissen:

Um die Beschreibung von Symmetrien in der Quantentheorie wirklich verstehen zu können, muss man sich aber in aller Ruhe die Details ansehen. Auf diese Details möchte ich in diesem und den nächsten Kapiteln genauer eingehen. Dabei möchte ich möglichst präzise die theoretischen Grundlagen darstellen -- in den üblichen Physikvorlesungen werden diese Grundlagen leider oft nur angedeutet oder manchmal gar so weit vereinfacht, dass sie sogar falsch dargestellt sind. Hoffentlich gelingt es mir, das zu vermeiden.

Damit das Thema nicht ausufert, werde ich keine expliziten Berechnungen zeigen. Wo immer möglich, werde ich aber sagen, wo man diese Berechnungen finden kann. Eine sehr gute Quelle für solche Details ist Steven Weinbergs Standardwerk The Quantum Theory of Fields, speziell Vol. 1.


Was ist eine Symmetrie in der Quantentheorie?

Im Physikstudium lernt man in der Vorlesung über Quantenmechanik irgendwann die Drehimpuls-Operatoren kennen. Man befasst sich sogar mit der Drehimpulsalgebra und stößt dabei auf die Möglichkeit, dass es auch halbzahlige Drehimpulse geben kann (sogenannte Fermionen). Vielleicht lernt man sogar, wie sich Wellenfunktionen bei Drehungen transformieren. Im Grunde betreibt man damit schon genau das, worum es in den nächsten Kapiteln gehen soll: Darstellungstheorie von Gruppen.

Aus Zeitgründen kann man aber das Thema meist nicht vertiefen. Wer kennt schon Begriffe wie Überlagerungsgruppe oder Strahldarstellung, und wer hat sich nicht bisweilen die Frage gestellt, was einen Spinor eigentlich von einem Vektor unterscheidet. Vielleicht gelingt es mir hier, diese Fragen zu beantworten, wobei es mir um die Klärung der Begriffe und Ideen und nicht um technische Details geht.

Erinnern wir uns, was in der Physik eine Symmetrie ist (siehe Kapitel 2.3): Bei einer Symmetrietransformation wechselt man von einer Beschreibung eines physikalischen Vorgangs zu einer anderen, dazu gleichwertigen Beschreibung des Vorgangs. So kann man ein Experiment auch aus einem gleichförmig fahrenden Zug betrachten und in den Koordinaten dieses Zuges beschreiben. Alternativ kann man das Experiment auch auf den Zug montieren und das fahrende Experiment vom Bahnhof aus betrachten. In den vorhergehenden Kapiteln haben wir uns das am Beispiel der Mechanik genauer angesehen.

Auch in der Quantentheorie geht das. Ein konkretes Beispiel: Betrachten wir ein quantenmechanisches System, das wir durch den Zustandsvektor   |ψñ   darstellen können, und betrachten wir einen Satz von Messwerten, wie sie durch einen Zustandsvektor   |φñ   angegeben werden. Dann wissen wir aus dem letzten Kapitel: die Wahrscheinlichkeit, diesen Satz von Messwerten zu finden, ist durch das quadrierte Skalarprodukt   |áφ|ψñ|2   gegeben. Das Skalarprodukt hatten wir als Wahrscheinlichkeitsamplitude bezeichnet.

Wenn wir nun das quantenmechanische System in einem fahrenden Zug unterbringen und dasselbe Experiment dort ausführen, so erwarten wir, dass die Wahrscheinlichkeit für unseren Satz Messwerte sich dadurch nicht ändert. In diesem Fall wäre der Boost des ruhenden Systems in den Zug eine Symmetrietransformation.

Nun wird aber das im Zug fahrende quantenmechanische System sicher nicht mehr durch denselben Zustandsvektor   |ψñ   beschrieben wie das ruhende System zuvor. Wir werden es mit einem neuen Zustandsvektor   |ψ' ñ   zu tun haben. Und auch die Messwerte werden nicht genau dieselben sein wie zuvor. Wenn wir im ruhenden System nach der Wahrscheinlichkeit fragen, einen bestimmten Impuls p zu messen, so müssen wir bei dem mitfahrenden System nach einem anderen Impuls   p'   fragen, der die Eigenbewegung des Zuges berücksichtigt. Also werden wir es auch mit einem neuen Zustandsvektor   |φ' ñ   zu tun haben.


In dieser Grafik wird ein ruhendes quantenmechanisches System durch die obere blaue Welle psi dargestellt. Setzt man das System in einen fahrenden Zug, so wird es durch die untere mitbewegte blaue Welle psi' dargestellt, die man im Prinzip aus psi berechnen kann. Die hier dargestellte Symmetrietransformation bezeichnet man als Boost.


Wir haben es also mit einer Symmetrie zu tun, wenn gilt:

  |áφ|ψñ|2   =   |áφ' |ψ' ñ|2  

(dies ist im Grunde die Definition einer quantenmechanischen Symmetrie).


Der Satz von Wigner (Wigner-Theorem):

Für den Wechsel von den alten Zustandsvektoren   |ψñ   und   |φñ   zu den neuen (beispielsweise im Zug mitfahrenden oder gedrehten) Zustandsvektoren   |ψ' ñ   und   |φ' ñ   benötigen wir eine Umrechnungsvorschrift, die ich   Tg   nennen möchte. Es gilt also:

  |ψ' ñ   =   Tgñ  
  |φ' ñ   =   Tgñ  

Der Index   g   deutet an, dass   Tg   von einem Gruppenelement g aus einer Symmetriegruppe G abhängt. So könnte g einen Boost oder eine Drehung darstellen -- mehr dazu weiter unten. Der Operator hängt nicht vom Zustand ab, der umgerechnet werden soll, sondern nur von der Art der Symmetrietransformation g, die durchgeführt wird.

Manchmal findet man in physikalischen Lehrbüchern an dieser Stelle einen Fehler: Es wird behauptet, dass   Tg   ein unitärer Operator sein muss, damit das Skalarprodukt   áφ|ψñ   sich nicht ändert. Das ist aber so nicht korrekt: Das Betragsquadrat des Skalarproduktes ändert sich nicht (das Quadrieren ist dabei unwichtig, aber der Betrag des Skalarproduktes ist wichtig, denn der Wert des Skalarproduktes ist i.a. eine komplexe Zahl)! Die korrekte Aussage lautet:

  • Satz von Wigner (Wigner-Theorem):

    Die Forderung

      |áφ|ψñ|2   =   |á Tgφ | Tgψ ñ|2  

    an den Operator   Tg   (mit beliebigen Hilbertraumvektoren) lässt sich immer entweder durch einen unitären oder aber durch anti-unitären Operator erfüllen.

Wenn   Tg   über das Gruppenelement g stetig mit   g = 1   verbunden ist, dann können diese Operatoren   Tg   sogar unitär gewählt werden (beispielsweise bei Drehungen, Translationen und Boosts). Das bedeutet aber nicht, dass die   Tg   eine unitäre Darstellung der Gruppe bilden, denn man kann zwar für zwei Gruppenelemente g und h (und ihr Produkt   h g   ) unitäre Operatoren   Tg ,   Th   und   Thg   finden, aber es muss nicht zwangsläufig   Th Tg   =   Thg     sein. Der Operator   Tg   muss noch nicht einmal stetig von g abhängen (siehe Beispiel etwas weiter unten)!

Ein Beispiel für ein anti-unitäres   Tg   ist die Zeitspiegelung.

Beim Beweis des Wigner-Theorems kommt es darauf an, dass man die komplexen Phasen der Vektoren geeignet wählen kann, so dass   Tg   unitär oder antiunitär wird. Wir erinnern uns: Vektoren, die sich nur durch eine komplexe Phase   e   unterscheiden, repräsentieren denselben quantenmechanischen Zustand! Der Beweis ist elementar, benötigt aber doch einige Schritte. Man findet ihn beispielsweise hier:


Beispiel: räumliche Drehungen um die z-Achse als Untergruppe der Drehgruppe:

Betrachten wir ein konkretes Beispiel: räumliche Drehungen um die z-Achse, die wir als Untergruppe der Drehgruppe auffassen. Es genügt dabei, nur die räumlichen Koordinaten x und y zu betrachten. Um die Schreibweise zu vereinfachen, bietet es sich an, mit komplexen Zahlen zu arbeiten, da sich mit ihnen Drehungen in der x-y-Ebene besonders elegant schreiben lassen. Wir schreiben also   z = x + iy   und für die komplexe Konjugation   z* = x − iy   . Eine räumliche Drehungen um die z-Achse ist dann gegeben durch

  g z   =   e z

(dabei ist φ der reelle Drehwinkel und hat nichts mit dem Zustand   |φñ   von oben zu tun).

Weiter betrachten wir in unserem Beispiel einen sehr einfachen Hilbertraum, der nur 2 Zustände besitzt, d.h. Vektoren aus diesem Hilbertraum sind zweikomponentige komplexe Vektoren (der Hilbertraum ist also C2, wobei C die komplexen Zahlen sind). Wir uns hier ein Teilchen mit Spin 1/2 vorstellen, das sich in einem quantenmechanischen Superpositionszustand aus den Spinkomponenten +1/2 und −1/2 befindet, wobei wir räumliche Abhängigkeiten nicht betrachten. Den Zustand   |ψñ   schreiben wir also als Spaltenvektor   (a, b)   , wobei a und b komplexe Zahlen sind. Wie wir später noch sehen werden, führt eine Drehung um die z-Achse für einen Spin-1/2-Zustandsvektor zu der folgenden Umrechnungsformel:

  Tg   (a, b)   =   (eiφ/2 a ,   e−iφ/2 b)

(ich erlaube mit, den Spaltenvektor einfach als Zeilenvektor zu schreiben -- ist in html einfacher) d.h.   Tg   ist die folgende komplexe 2-mal-2-Matrix:


Tg   =   æ
ç
è
eiφ/2
0
0
e−iφ/2
ö
÷
ø

Die Amplitude a wird also genau entgegengesetzt zur Amplitude b gedreht, aber beide nur mit dem halben Drehwinkel. Der Zusammenhang zwischen   Tg   und   g   ist demnach gegeben durch


Tg Tg   =   æ
ç
è
g
0
0
g*
ö
÷
ø

Wir sehen schon: Die Drehung   g   legt in dieser Gleichung den Umrechnungsoperator   Tg   nicht eindeutig fest. Die Matrix   −Tg   erfüllt die Gleichung ebenfalls.

Vielleicht fühlt sich mancher Leser an die Wurzelfunktion in der Funktionentheorie erinnert. Der Term   g' := eiφ/2   in Tg ist ja gerade die Wurzel von   g = e  , denn   (g')2 = g  . Man kann die Wurzelfunktion auf einer sogenannten Riemannschen Fläche definieren, die die komplexe Ebene zweimal überdeckt -- wie eine Wendeltreppe, die zweimal herumführt und bei der man nach zwei Stockwerken wieder in das Ausgangsstockwerk zurückspringt. Der Drehwinkel φ auf dieser Wendeltreppe läuft von 0 bis 4π. Die Wendeltreppe (genauer: die Linie im Abstand 1 von der Mittelachse) ist gleichsam die Gruppenmannigfaltigkeit der g'-Gruppe, denn jedem Punkt der Wendeltreppen-Linie kann man eindeutig ein Gruppenelement g' zuordnen (einfach indem man den Drehwinkel φ nimmt und   g'(φ) = eiφ/2   setzt). Senkrecht unter der Wendeltreppenlinie liegt dann ein Kreis, und senkrecht unter jedem g' der Wendeltreppenlinie liegt auf dem Kreis das zugehörige g. Analog in der Funktionentheorie: Senkrecht unter der Riemannschen Fläche (Wendeltreppe) liegt die komplexe Ebene der z, und senkrecht über dem z liegen auf der Riemannschen Fläche die beiden möglichen Wurzeln von z. Wenn man alle Wurzel von z durchläuft (also die Riemannsche Fläche komplett durchgeht), dann durchläuft man die z-Ebene darunter doppelt. Man sagt auch, die Riemannsche Fläche der Quadratwurzel ist eine doppelte Überlagerung der komplexen Ebene. Ein schönes Bild dazu findet man unter Wikipedia: Riemann surface.

Ist   Tg   ein unitärer Operator? So einen Operator muss es ja nach dem Satz von Wigner geben, denn   Tg   lässt sich stetig mit der Eins verbinden (dazu muss man nur den Drehwinkel φ auf Null herunterfahren). Prüfen wir es nach und verwenden dazu das übliche Skalarprodukt in C2:     á(a,b)|(a',b')ñ   =   a* a'   +   b* b'   . Dann ist

  áTg(a,b)| Tg(a',b')ñ   =   (eiφ/2a)* eiφ/2a'   +   (e−iφ/2b)* e−iφ/2b'   =   a* a'   +   b* b'   =   á(a,b)|(a',b')ñ

d.h.   Tg   ist ein unitärer Operator.

Wenn wir   φ   von   0   langsam bis auf den Wert   2π   (360 Grad) erhöhern, so landet   g = e   wieder beim Eins-Element der Gruppe. Nicht so bei   g'   bzw.   Tg   , denn   Tg   landet für   φ = 2π   bei der negativen Einheitsmatrix   − 1. Wenn wir also eine eindeutige Zuordnung zwischen   g   und   Tg   haben wollen, dann müssen wir in   Tg   statt φ beispielsweise den Winkel

  M(φ)   :=   (φ mod 2π)

verwenden, also von φ solange 2π abziehen, bis das Ergebnis kleiner als 2π wird. Eine Drehung um 3π ist ja genauso gut wie eine Drehung um π. Nur so wird dem Gruppenelement   g = 1   eindeutig der Operator   Tg = 1   zugeordnet. Wenn man allerdings mit φ den Wert 2π überschreitet, so springt   Tg   plötzlich von − 1 auf 1, während g keinen Sprung macht.

Bezogen auf das obige Bild mit der Wendeltreppe bedeutet das: Wir nehmen nur die erste Drehung der Wendeltreppe und springen dann wieder auf das untere Stockwerk zurück. Das ist unschön, denn in diesem Sinn hängt   Tg   nicht stetig vom Gruppenelement g ab. Ein geschlossener Weg in der Gruppe G (aus der g stammt) führt nicht immer zu einem geschlossenen Weg im Raum der Operatoren   Tg   . Der tiefere Grund dafür liegt darin, dass wir einen geschlossenen Weg in G gewählt haben, der sich nicht stetig in G auf einen Punkt zusammenziehen lässt -- wir kommen noch darauf zurück.


Strahldarstellung von Symmetriegruppen:

Wir hatten bereits angedeutet, dass   Tg   von einem Gruppenelement g aus einer Gruppe G abhängt -- gerade haben wir beispielsweise eine Untergruppe der Drehgruppe betrachtet. Ein anderes Beispiele ist die Gruppe der affinen Abbildungen in der Raumzeit (siehe Kapitel 2.3), die als Untergruppe beispielsweise die Galileigruppe (siehe Kapitel 2.4) und die Poincaregruppe (siehe Kapitel 3.1) umfasst. Die Drehgruppe ist wiederum eine Untergruppe beider Gruppen. Hinzu kommen zu den Drehungen die Raum-Zeit-Translationen sowie nichtrelativistische oder relativistische Boosts.

All diese Gruppen sind Lie-Gruppen, d.h. die Gruppenelemente hängen kontinuierlich von Parametern ab (z.B. Drehwinkel, Boostgeschwindigkeit und Translationsvektor). Präziser kann man sagen: eine Lie-Gruppe ist eine differenzierbare Mannigfaltigkeit (siehe Kapitel 5.1.3) mit einer zusätzlichen Gruppenstruktur. Die Parameter fungieren dabei als Koordinaten auf dieser Mannigfaltigkeit. Wir sind darauf bereits in Kapitel 3.5 kurz eingegangen, als wir uns die topologische Struktur der Poincaregruppe (also der entsprechenden Gruppenmannigfaltigkeit) angesehen haben.

Gruppenstruktur bedeutet: Man kann Symmetrietransformationen hintereinander ausführen und erhält wieder eine Symmetrietransformation. Mathematisch kann man dies durch die Multiplikation der Gruppenelemente darstellen. Mehr dazu siehe z.B. Wikipedia: Gruppentheorie.

Betrachten wir ein konkretes Gruppenelement   g   , z.B. eine Drehung. Dann gehört dazu in der Quantentheorie ein entsprechender Operator   Tg   zum Umrechnen der Zustandsvektoren im Hilbertraum (um das ursprüngliche quantenmechanische System in das gedrehte System umzurechnen). Zu einem anderen Gruppenelement h (z.B. einer anderen Drehung) gehört ein anderer Operator   Th  . Nun führen wir beide Symmetrietransformationen hintereinander aus -- erst g, dann h. Entsprechend rechnen wir einen Zustand   |ψñ   erst mit   Tg   und dann mit   Th   in einen neuen Zustand um.

Alternativ können wir aber auch die beiden Symmetrietransformationen g und h durch die Symmetrietransformation   h g   ersetzen (dabei steht zwischen h und g die Multiplikation der Gruppenelemente und das Produkt ist von rechts nach links zu lesen). So können wir die Drehungen g und h durch eine einzige Drehung   h g   ersetzen. Der entsprechende Umrechnungsoperator wäre dann   Thg   .

Muss nun der Umrechnungsoperator   Thg   dieselbe Umrechnung von   |ψñ   bewirken wie die Hintereinanderschaltung von   Tg   und   Th   ? Die Antwort lautet: Nein! Es muss nur gewährleistet sein, dass der Zustandsvektor, der bei der Umrechnung herauskommt, in beiden Fällen denselben Quantenzustand repräsentiert. Bei der Wahl eines Zustandsvektors für einen Quantenzustand haben wir jedoch eine gewisse Freiheit: zwei Vektoren, die sich nur durch eine komplexe Phase   e   unterscheiden, repräsentieren denselben Quantenzustand. Es muss also gelten:

  Thg   |ψñ   =     ei α (h,g)   Th Tg   |ψñ  

Man nennt deshalb die Operatoren   Tg   eine Strahldarstellung oder projektive Darstellung der Gruppe. Die Gruppenstruktur überträgt sich bis auf eine komplexe Phase auf die Operatoren.

Dabei kann die Phase α wie angegeben von g und h abhängen, nicht aber vom Zustand |ψñ (denn die Symmetrietransformation darf ja Interferenzen zwischen Zuständen nicht ändern) -- so zumindest steht es in vielen Texten. In Steven Weinbergs Buch The Quantum Theory of Fields findet man dazu Genaueres: So stellt man experimentell fest, dass nicht alle Quantenzustände zu neuen Zuständen überlagert werden können (Superauswahlregeln -- wir sind bereits im letzten Kapitel 4.5 darauf eingegangen.). So kann man keine Quantenzustände präparieren, die eine Überlagerung von Zuständen mit unterschiedlicher elektrischer Ladung sind. Die elektrische Ladung eines quantenmechanischen Objektes ist immer bekannt, da sie über ihr weitreichendes elektrisches Feld makroskopische Auswirkungen hat. Entsprechend gibt es auch keine Interferenz zwischen Zuständen verschiedener Ladung.

Ähnlich ist es mit dem Gesamtspin: Die Experimente legen nahe, dass es keine Superposition und Interferenz zwischen Zuständen mit halbzahligem und ganzzahligem Spin gibt. Entsprechend könnte die Phase α durchaus vom Quantenzustand abhängen, und zwar von seiner Eigenschaft, ob sein Gesamtspin ganz- oder halbzahlig ist. Man sieht also, dass die Details hier oft gar nicht so klar sind, wie sie manchmal dargestellt werden. Etwas Misstrauen gegenüber manchen handwaving arguments ist durchaus angebracht.

Schauen wir uns an, ob in unserem Beispiel von oben (Drehungen um die z-Achse) der Operator   Tg   eine Strahldarstellung ergibt. Dazu schreiben wir   g = e   und   h = e   und entsprechend für die Operatoren   Tg   und   Th   , wobei wir aber als Winkel   M(φ)   :=   (φ mod 2π)   verwenden, um die Zuordnung zwischen   g   und   Tg   eindeutig zu machen. Für die Phase schreiben wir   α (θ,φ)  . Die obige Bedingung für eine Strahldarstellung lautet dann:

  T[ei M(θ+φ)]   =     ei α (θ,φ)   T[ei M(θ)] T[ei M(φ)]  

Ausgeschrieben mit Hilfe der Matrizen ergibt diese Gleichung die beiden Gleichungen

  ei M(θ+φ)/2   =   ei α (θ,φ)   ei M(θ)/2   ei M(φ)/2
  e−i M(θ+φ)/2   =   ei α (θ,φ)   e−i M(θ)/2   e−i M(φ)/2

Wir wollen es nicht zu kompliziert machen und nur den Fall   0 ≤ θ, φ < 2π   betrachten, so dass   M(θ) = θ   und   M(φ) = φ   ist. Dagegen ist

  M(θ+φ)   =   θ + φ − 2π Θ(θ+φ−2π)  

Die Θ-Funktion rechts ist dabei gleich 1 für   θ+φ ≥ 2π   und Null sonst. Damit vereinfachen sich die beiden Gleichungen zu

  e−iπ Θ(θ+φ−2π)   =   ei α (θ,φ)
  eiπ Θ(θ+φ−2π)   =   ei α (θ,φ)

Da die Θ-Funktion nur die Werte 0 und 1 annimmt, spielt das Vorzeichen im Exponenten keine Rolle, denn   e−iπ   =   e   =   − 1  . Wir können also wählen:

  α (θ,φ)   =   π Θ(θ+φ−2π)

d.h. sobald die Summe von θ und φ eine Umdrehung übersteigt, springt die Phase α auf den Wert π und fängt so den Vorzeichenwechsel zwischen   T[ei M(θ)] T[ei M(φ)]   und   T[ei M(θ+φ)]   auf (denn   T[ei M(θ+φ)]   springt ja plötzlich von −1 auf 1 zurück).

Insgesamt ist das alles ziemlich unpraktisch. Schöner wäre es, wenn man auf dieses Zurückspringen von   Tg   nach einer Umdrehung verzichten könnte -- dann bräuchte man auch die Phase zum Kompensieren nicht mehr. Allerdings würde das bedeuten, dass bei einer Umdrehung   Tg   von 1 nach −1 wandert, und erst bei der zweiten Umdrehung würde dann   Tg   von −1 wieder nach 1 wandern. Damit wäre einer Drehung g nicht mehr eindeutig ein Operator   Tg   zugeordnet. Statt dessen braucht man so etwas wie die Gruppe G' der Doppeldrehungen, bei der sich die Gruppenelemente der ersten Drehung von denen der zweiten Drehung unterscheiden. So etwas nennt man Überlagerungsgruppe. Die Wendeltreppe oben ist genau diese Überlagerungsgruppe! Den Gruppenelementen   g' = eiφ/2   der Überlagerungsgruppe kann man dann eindeutig den Operator   Tg'   mit   Tg' (a, b)   =   (g' a,   g'* b)   sowie das Gruppenelement   g = (g')2   der ursprünglichen Gruppe G zuordnen. Man hat nun allerdings keine direkte Strahldarstellung von G mehr (in dem Sinn, dass man jedem g ein Tg zuordnen kann), sondern man hat eine unitäre Darstellung der Überlagerungsgruppe G', denn es gilt   Th' g'   =   Th'   Tg'   . Damit ließe sich die störende Phase vermeiden.

Die unitäre Darstellung der Überagerungsgruppe liefert aber immer noch eine (indirekte) Strahldarstellung der ursprünglichen Gruppe G, wobei man aber auf eine eindeutige Zuordnung zwischen dieser Gruppe und Hilbertraum-Operatoren verzichtet. Eine solche eindeutige Zuordnung braucht man auch nicht. Wichtig ist nur: Wenn g' und h' aus der Überlagerungsgruppe G' zum selben g aus G gehören, so müssen   Tg'ñ   und   Th'ñ   denselben quantenmechanischen Zustand beschreiben, dürfen sich also nur durch eine Phase unterscheiden. Das ist in unserem Beispiel der Fall, denn wenn   (g')2 = (h')2 = g   ist, dann ist   Tg'   =   ± Th'  .


Die universelle Überlagerungsgruppe:

Wie sieht das im allgemeinen Fall aus? Wir haben Glück, denn man kann zeigen, dass es zu jeder zusammenhängenden Lie-Gruppe G eine eindeutige universelle Überlagerungsgruppe gibt, die zudem topologisch einfach zusammenhängend ist, d.h. man kann jeden geschlossenen Weg in der Gruppenmannigfaltigkeit stetig zu einem Punkt zusammenziehen und man kann zwei verschiedene Wege mit gleichem Start- und Endpunkt stetig ineinander umformen (siehe dazu auch Die Grenzen der Berechenbarkeit, Kapitel 5.3: Die 3-Sphäre und die Poincaré-Vermutung). Das ist günstig, denn in unserem Beispiel oben haben wir ja gerade gesehen, dass diejenigen geschlossenen Wege Probleme machen, bei denen das nicht geht. Die Drehgruppe und mit ihr die Galileigruppe und die Poincaregruppe sind nämlich nicht einfach zusammenhängend (siehe Kapitel 3.5). Eine Drehung um den Winkel 0 ist gleichwertig zu einer Drehung um den Winkel 2π (eine volle Drehung). Geht man langsam alle Drehwinkel von Null bis 2π durch, so erhält man einen geschlossenen Weg im Raum der Gruppenelemente, den man nicht stetig auf einen Punkt (ein Gruppenelement) zusammenziehen kann.

Den Begriff der Überlagerungsgruppe wollen wir noch präzisieren:

universelle Überlagerungsgruppe:

Zu jeder (zusammenhängenden) Lie-Gruppe G gibt es eine eindeutige universelle Überlagerungsgruppe G', die einfach zusammenhängend ist (d.h. geschlossene Wege darin lassen sich stetig zu einem Punkt zusammenziehen).

Eindeutig bedeutet dabei: Jede andere zusammenhängende Lie-Gruppe, die dieselbe Lie-Algebra wie G hat, hat dieselbe universelle Überlagerungsgruppe wie G. Auch die universelle Überlagerungsgruppe G' selbst hat diese Lie-Algebra. Zum Begriff der Lie-Algebra kommen wir etwas weiter unten.

Überlagerung bedeutet: Man kann die Überlagerungsgruppe G' gleichsam über die Gruppe G legen und G damit komplett abdecken, wobei ein mehrlagiges Abdecken erlaubt ist. Mathematisch ausgedrückt: Es gibt eine surjektive Projektion

  ρ:   G'   →   G

die mit der Gruppenstruktur verträglich ist (d.h. ρ ist ein Gruppenhomomorphismus):

  ρ(h') ρ(g')   =   ρ(h' g')     mit g' und h' aus der Überlagerungsgruppe G'.

Surjektiv heißt: Zu jedem Gruppenelement aus G' gibt es ein eindeutiges Gruppenelement aus G, und zu jedem Gruppenelement aus G gibt es ein oder mehrere Gruppenelemente aus G'. Es kann also sein (und ist auch meist so), dass mehrere (meist zwei) Gruppenelemente der Überlagerungsgruppe G' zum selben Gruppenelement von G gehören.

Die Projektion ρ hat die Eigenschaft, dass ihr Kern eine endliche Gruppe ist. Die Elemente der Überlagerungsgruppe, die zum Eins-Element von G gehören, bilden also eine endliche Gruppe (typischerweise bestehend aus den Elementen 1 und −1 ).


Lie-Algebra:

Den Begriff der Lie-Algebra, der oben erwähnt wird, müssen wir noch erklären. Abstrakt ist die Lie-Algebra gegeben durch den Tangentialraum der Lie-Gruppe im Einselement, wobei die Lie-Klammer eine multiplikative Struktur liefert (siehe Kapitel 5.1: Gekrümmte Räume (über die Grundlagen der Differentialgeometrie)). Diese Formulierung ist allerdings etwas gewöhnungsbedürftig. In den meisten Fällen kann man jedoch Elemente der Lie-Algebra einfach als Matrizen schreiben, und zwar dann, wenn die Gruppe g eine Matrixgruppe ist, d.h. wenn jedes Gruppenelement g als Matrix geschrieben werden kann. Tatsächlich gilt, dass jede Liegruppe zumindest lokal zu einer Matrixgruppe isomorph (also gleichwertig) ist.

Auch Poincaregruppe und Galileigruppe können als Matrixgruppen geschrieben werden. Erinnern wir uns: Ein Gruppenelement g ist bei diesen Gruppen zunächst durch eine 4-mal-4-Matrix A und einen Translationsvektor c eindeutig gekennzeichnet, denn die Wirkung auf die Raumzeit ist durch die Abbildung   g x = A x + c   gegeben. Die Gruppenmultiplikationsregel können wir dann leicht ausrechnen:

  g' g x   =   A' (A x + c) + c'   =   A' A x + A c + c'   =:   A'' x + c''   =:   g'' x

d.h. das Gruppenelement   g'' = g' g   wird durch die 4-mal-4-Matrix   A'' = A' A   und den Translationsvektor   c'' = A c + c'   gekennzeichnet. Genau das können wir erreichen, wenn wir g durch die 5-mal-5-Matrix


g   =   æ
ç
è
A
c
0
1
ö
÷
ø

darstellen (analog für g' und g'', wobei wir keine neue Bezeichnung für die Matrix eingeführt haben), denn dann ergibt die Matrixmultiplikation genau den gewünschten Zusammenhang für die Gruppenmultiplikation. Die Wirkung auf die Raumzeit können wir darstellen, indem wir die g-Matrix auf den 5-komponentigen Vektor   (x, 1)   wirken lassen. Die 5-te Dummy-Komponente (also die 1) ändert sich dabei nicht.

Für jeden reellen Gruppenparameter ai (z.B. Drehwinkel) können wir nun direkt einen Tangentialvektor Ai im Einselement der Gruppe definieren, wobei es in der Physik üblich ist, einen Faktor   −i   (die negative imaginäre Einheit) einzufügen (ist in der Quantentheorie nützlich, da man so später hermitesche Operatoren erhält). Die Bezeichnungen ai und Ai haben übrigens nichts mit dem gerade verwendeten A im Term   A x + c   zu tun. Es ist also:

  Ai   :=   −i dg/dai |a = 0

wobei g als Matrix zu sehen ist, die von den Gruppenparametern a = (ai) abhängt, und wir   g(0) = 1   voraussetzen (Vorsicht: die hoch- und tiefgestellten i-s sind natürlich Indices, das davorstehende i ist die imaginäre Einheit). Man bezeichnet die   Ai   als Generatoren der Lie-Gruppe, denn die Kommutatoren der   Ai   legen die Gruppenstruktur der Lie-Gruppe zumindest in der Nähe des 1-Elementes fest (dabei ist der Kommutator zweier Matrizen definiert durch   [A, B]   :=   A B − B A  ). Das liegt daran, dass man in einer Umgebung des 1-Elementes die Gruppenelemente schreiben kann als

  g(a)   =   ei ai Ai   =   1   +   i ai Ai   −   1/2 ai Ai aj Aj   +   ....

(mit Summation über doppelte Indices). Die Exponentialfunktion ist also durch die übliche Reihenentwicklung definiert. Diese Reihenentwicklung konvergiert immer für Matrizen (siehe Wikipedia: Matrix exponential ). Für das Produkt von zwei Exponentialreihen gilt nun die Baker-Campbell-Hausdorff Formel:

exp(A)   exp(B)   =   exp( A   +   B   +   1/2 [A, B]   +   1/12 [[A, B], B]   −   1/12 [[A, B], B]   +   ...)

wobei die Punkte unendlich viele komplexere, ineinander geschachtelte Kommutatorterme andeuten, in denen A und B immer öfter vorkommen. Für A und B kann man nun Elemente der Lie-Algebra einsetzen (also reelle Linearkombinationen der Form   ai Ai   mit Summe über i ) und erhält so links das Produkt zweier Gruppenelemente der Lie-Gruppe. Dieses Produkt ist nun durch die obige Formel dann eindeutig festgelegt, wenn die unendliche Summe von Kommutatoren im Exponenten rechts konvergiert. Das ist insbesondere dann der Fall, wenn die Parameter ai klein sind, denn in der Summe tauchen immer höhere Potenzen der Parameter auf. Damit legen die Kommutatoren der Generatoren bei kleinen Gruppenparametern fest, wie aus der Multiplikation zweier Gruppenelemente ein neues Gruppenelement entsteht, d.h. die Lie-Algebra legt die Gruppenstruktur zumindest in der Nähe des 1-Elementes fest.

Wenn zwei Gruppen dieselbe Lie-Algebra haben, bedeutet das also, dass die Gruppen in der Nähe des Eins-Elementes gleich aussehen. Genau genommen sehen die Gruppen dann sogar überall lokal gleich aus, denn die Nähe eines Gruppenelementes g erreicht man ja durch Multiplikation mit einem Gruppenelement h aus der Nähe des Eins-Elementes.

Man könnte sich nun vorstellen, dass man viele kleine Gruppenelemente (also Elemente aus der Nähe der Eins) multipliziert und so zu immer größeren Gruppenelementen gelangt, also zu Gruppenelementen, die immer weiter weg von der Eins liegen. So könnte man sich mit vielen kleinen Drehungen zu immer größeren Drehungen vorarbeiten. Diese größeren Gruppenelemente sind dann Produkte vieler kleinerer Gruppenelemente, die sich wiederum als Exponentialreihe schreiben lassen. Man kann sich vorstellen, dass man auf diese Weise alle Gruppenelemente erreicht, die sich stetig mit der Eins verbinden lassen (also die Zusammenhangskomponente der Gruppe mit dem Einselement). Tatsächlich lässt sich jedes Gruppenelement einer zusammenhängenden Lie-Gruppe als endliches Produkt von Exponentialreihen schreiben. (es reichen sogar nur zwei Exponentialreihen, wie M.Moskowitz und R.Sacksteder in 2003 gezeigt haben). Nach der Baker-Campbell-Hausdorff Formel oben müsste sich daraus eigentlich eine einzige Exponentialreihe machen lassen, aber man weiß nicht, ob die unendliche Summe von Matrixkommutatoren im Exponenten auf der rechten Seite immer konvergiert! Ist die Lie-Gruppe zusätzlich noch kompakt, so sind die Parameterbereiche zumeist endliche abgeschlossene reelle Intervalle -- die Parameter werden also nicht beliebig groß. Die Baker-Campbell-Hausdorff Formel ist dann tatsächlich in der Lage, Produkte von Exponentialreihen zu einer einzigen Exponentialreihe zu vereinen, so dass die Exponentialabbildung sogar surjektiv ist, d.h. jedes Gruppenelement kann als Exponentialreihe geschrieben werden. Siehe dazu u.a. Wikipedia: Lie group, speziell den Abschnitt The exponential map.

Der Begriff der Algebra im Wort Lie-Algebra bezieht sich auf den Kommutator, denn dieser wirkt wie ein Produkt innerhalb der Lie-Algebra:

  [Ai, Aj]   =   i f kij Ak

(mit Summierung über doppelte Indices) mit den reellen Strukturkonstanten   f kij  , die durch diese Gleichung definiert werden. Diese Strukturkonstanten erfassen also die Kommutator-Struktur der Lie-Algebra. Dass   [Ai, Aj]   tatsächlich in der Lie-Algebra (also im Tangentialraum der Gruppe bei 1) liegt und sich demnach als Linearkombination der Ak schreiben lässt, sieht man so (vergleiche auch Die Grenzen der Berechenbarkeit, Kapitel 5.4.6 ):
Der Term   ei s Aj   ei t Ai   e− i s Aj   ist für festes s eine Kurve im Gruppenraum mit Kurvenparameter t, die bei t=0 durch das Einselement läuft. Die Ableitung dieser Kurve nach t bei t=0 ergibt also ein Element des Tangentialraums am Einselement, und zwar dieses:
  ei s Aj   (i Ai)   e− i s Aj   =   d/dt|t=0 ei s Aj   ei t Ai   e− i s Aj  
Dieser Ausdruck stellt nun eine Kurve im Tangentialraum mit Kurvenparameter s dar. Man kann diese Kurve nun nach s in s=0 ableiten und erhält wieder einen Tangentialvektor (innerhalb eines Vektorraums ergibt die Differenz von Vektoren ja wieder einen Vektor, und so ist es auch im Differentialquotienten bei der Ableitung). Der Tangentialvektor lautet:
  [Ai, Aj]   =   d/ds|s=0 ei s Aj   (i Ai)   e− i s Aj    
Wichtig ist dabei: Obwohl der Kommutator   [Ai, Aj]   im Tangentialraum liegt, gilt dies nicht für Produkte der Generatoren. Das Produkt   Ai Aj   liegt im Allgemeinen nicht im Tangentialraum der Gruppe im Einselement.

Eine Darstellung der Lie-Algebra auf einem Hilbertraum sind nun lineare Operatoren   T(Ai)   , die

  [T(Ai), T(Aj)]   =   i f kij T(Ak)  

erfüllen. Unten werden wir auf Strahldarstellungen der Lie-Algebra treffen, bei denen dabei noch ein Zusatzterm auftritt. Vorsicht: Wir haben nicht   T(Ai) T(Aj)   =   T(Ai Aj)   gefordert -- der Term rechts wäre gar nicht definiert, denn das Produkt   Ai Aj   liegt i.a. gar nicht im Tangentialraum.

Die (Strahl-)Darstellung   Tg(a)   einer Lie-Gruppe ergibt automatisch eine (Strahl-)Darstellung   T(Ai)   der Lie-Algebra über die Formel

  T(Ai)   :=   −i d/dai Tg(a) |a = 0

Umgekehrt ergibt eine (Strahl-)Darstellung der Lie-Algebra auch eine (Strahl-)Darstellung der Gruppe über die Formel

  Tg(a)   :=     ei ai T(Ai)

Wichtig ist nun der folgende Zusammenhang: Wenn   Tg(a)   unitär ist, so ist   T(Ai)   hermitesch und umgekehrt. Das sieht man so: Wir definieren zu einem Operator   A   den dazu hermitesch adjungierten Operator   A+   über die Gleichung

  á A+φ | ψñ   :=   áφ | A ψñ

Wenn wir A als (unendlich-dimensionale) Matrix schreiben (siehe vorheriges Kapitel), so wäre A+ dann die transponierte und komplex konjugierte Matrix. A ist hermitesch, wenn   A+ = A   ist, und A ist unitär, wenn   A+A = 1   ist.

Wenn nun   U := ei t A   unitär ist, so können wir die Gleichung   U+ U = 1   nach   t   in t=0 ableiten und erhalten   −i A+ + i A   =   0   und damit   A+ =   A , d.h.   A   ist hermitesch. Umgekehrt: Wenn   A   hermitesch ist, so ist   U+ U   =   e−i t A+ ei t A   =   e−i t A ei t A   =   1   und U ist unitär. Für A können wir nun eine Linearkombination   A = ai T(Ai)   (mit Summe über i und beliebigen reellen ai ) einsetzen und t = 1 wählen, so dass   U = Tg(a)   ist. A ist genau dann hermitesch, wenn die T(Ai) hermitesch sind. Damit folgt: Die Generator-Operatoren T(Ai) sind genau dann hermitesch, wenn der Gruppenoperator Tg(a) unitär ist.

Nun wissen wir aus dem vorherigen Kapitel, dass beobachtbare Größen (Observable) durch hermitesche Operatoren dargestellt werden. Die hermiteschen Darstellungsoperatoren T(Ai) der Generatoren Ai einer Symmetriegruppe sind also gute Kandidaten für beobachtbare Größen in der zugehörigen Quantentheorie. Eine Analyse des Eigenwertspektrums der Operatoren T(Ai) ergibt dabei die möglichen Messwerte. Interessant ist dabei, dass die Kommutatoren (also die Struktur der Lie-Algebra und damit die lokale Struktur der Symmetriegruppe) dieses Eigenwertspektrum bereits festlegen, wie wir noch sehen werden. Heute geht man meist davon aus, dass alle Observablen in einer Quantentheorie zu Generatoren einer entsprechenden Symmetriegruppe gehören. Dabei können neben der Raum-Zeit-Symmetrie noch weitere Symmetrien auftreten, z.B. Eichsymmetrien. Die Symmetriegruppen bestimmen dann komplett die Struktur der zugehörigen Quantentheorie (Hilbertraum plus Observablen mit ihrem Eigenwertspektrum).


Beispiel Teil 2 (räumliche Drehungen um die z-Achse):

Der Begriff der Überlagerungsgruppe sieht vielleicht noch etwas abstrakt aus. Wir werden aber später anhand von Beispielen sehen, dass es eigentlich recht einfach ist. Beispielsweise ist SU(2) die Überlagerungsgruppe der Drehgruppe SO(3), wobei die beiden SU(2)-Elemente 1 und −1 zum 1-Element von SO(3) gehören. Ein Spinor (eines Spin-1/2-Teilchens) wird bei Drehungen mit der entsprechenden SU(2)-Matrix umgerechnet, und eine 360-Grad-Drehung führt zur SU(2)-Matrix   −1  . Genau das haben wir am Beispiel der Drehungen um die z-Achse bereits gesehen. Details dazu im nächsten Kapitel.

Schauen wir uns noch einmal die Drehungen um die z-Achse an und wiederholen das Wichtigste: Zu einer Drehung   g   =   e   gehört einfach das Gruppenelement   g'   =   eiφ/2   aus der Überlagerungsgruppe, und die Projektion ρ ist einfach definiert durch die Gleichung

  ρ(g')   =   (g')2   =   g

Die beiden Gruppelemente   g'   und   −g'   führen dabei zur selben Drehung g. Der Kern von ρ ist also durch 1 und −1 gegeben, d.h. die beiden Gruppenelemente   1   und   −1   aus der Überlagerungsgruppe G' gehören zur Drehung   g = 1   (also Drehwinkel Null oder 360 Grad).

Das Beispiel zeigt sehr schön, wie die Drehungen um die z-Achse durch die Gruppe G' überlagert wird: Wenn wir den Drehwinkel φ von 0 auf 4π hochfahren, so startet   g'   bei   1   , erreicht bei   2π   die   −1   und kommt erst bei   4π   wieder bei   1   an. Dabei durchläuft   g = e   aber 2 komplette Drehungen. In diesem Sinn liefert die Überlagerungsgruppe G' tatsächlich die gewünschten Doppeldrehungen, denn g' weiß, ob es sich noch in der ersten oder schon in der zweiten Drehung des zugehörigen g befindet. Die Projektion ρ vergisst diese Information gleichsam.

Wir hatten oben bereits die Überlagerungsgruppe G' als Linie auf einer Wendeltreppe (Riemannsche Fläche) dargestellt und senkrecht darunter die Gruppe G der Drehungen um die z-Achse als Kreis dargestellt. Die Abbildung ρ entspricht dann der senkrechten Projektion von der Wendeltreppenlinie herunter auf den Kreis. Man kann diesen Zusammenhang aber grafisch auch noch etwas anders darstellen. Dazu zeichnen wir die Überlagerungsgruppe G' diesmal als Kreis, wobei der Kreiswinkel durch   2φ   gegeben ist -- man muss also mit φ von 0 bis 4π laufen, um den ganzen Kreis zu durchlaufen. Die Gruppe G kann man nun erhalten, indem man gegenüberliegende Punkte des Kreises miteinander identifiziert. Ein gegenüberliegendes Punktepaar (also g' und −g') entspricht also einer Drehung g um die z-Achse. Dreht man das Punktepaar um 180 Grad (φ läuft also von 0 bis 2π), so erhält man wieder das ursprüngliche Punktepaar zurück (die beiden Punkte werden ja nicht unterschieden).


Die Überlagerungsgruppe G' mit Elementen   g'   =   eiφ/2   kann man als Kreis darstellen mit Winkel 2φ.
Die Gruppe G mit Elementen   g   =   e   entsteht aus G durch Identifikation gegenüberliegender Punkte.


Auch bei komplexeren Gruppen ist der Zusammenhang zwischen Überlagerungsgruppe G' und überlagerter Gruppe G ähnlich. Die Überlagerungsgruppe entspricht einem einfach zusammenhängenden Raum (z.B. einer Kugeloberfläche), und man identifiziert gewisse Punkte so miteinander, dass dies mit der Gruppenstruktur verträglich ist -- so erhält man alle überlagerten Gruppen G mit diesem G' als Überlagerungsgruppe. Dieses Bild macht klar, dass die Gruppen lokal gleich aussehen, aber nicht global.

Die obige Beispiel-Gruppe G' liefert auch eine Strahldarstellung der Drehungen um die z-Achse auf den 2-komponentigen komplexen Vektoren. Wir definieren dazu mit Hilfe von   Tg ' (a, b)   :=   (g' a,   g'* b)   zunächst eine Darstellung von G'. Wie können wir   Tg '   nun mit der Strahldarstellung   Tg   von oben (mit M(φ) als Drehwinkel) in Verbindung bringen? Ganz einfach: Für   0 ≤ φ < 2π   ist     Tg ' = Tg   , und für   2π ≤ φ < 4π   ist     Tg ' = − Tg   . Damit bekommen wir genau die obige Strahldarstellung der Drehungen.

Anmerkung: Falls sich jemand fragt, ob G' im obigen Beispiel einfach zusammenhängend ist: Wir haben G' einfach als Untergruppe einer größeren Gruppe herausgefischt. Diese größere Gruppe -- die universelle Überlagerungsgruppe SU(2) der Drehgruppe SO(3) -- ist einfach zusammenhängend, wie wir in einem späteren Kapitel noch sehen werden. In unserem Beispiel haben wir also in G = SO(3) die Drehungen um die z-Achse als einparametrige Untergruppe herausgenommen und aus der Überlagerungsgruppe G' = SU(2) dann die zugehörige einparametrige Untergruppe herausgefischt. Es ist aber nicht so, dass diese Untergruppe von G' die universelle Überlagerungsgruppe zur Untergruppe von G ist. Siehe dazu beispielsweise die Bemerkung Therefore a one-parameter group or one-parameter subgroup has to be distinguished from a group or subgroup itself in Wikipedia: One-parameter group.
Es gibt jedoch auch Situationen, in denen nur die Drehungen um die z-Achse eine Symmetrie des Systems sind (z.B. bei einem äußeren Magnetfeld in z-Richtung). Dann ist tatsächlich SO(2) die Symmetriegruppe und nicht SO(3), und wir würden nach der universellen Überlagerungsgruppe von SO(2) fragen. Diese Überlagerungsgruppe von SO(2) ist R mit der Addition als Gruppenmultiplikation. Das liegt einfach daran, dass SO(2) eine einparametrige Gruppe ist und dass   g(φ) =: ρ(φ)   direkt die Projektion von R nach SO(2) liefert. Man muss also auf R die Punkte im Abstand von 2π miteinander identifizieren, um nach SO(2) zu gelangen.
Die irreduzible Darstellung von R ist   Tg(φ)   =   ei s φ   mit einem beliebigen reellen s. Man sagt deshalb auch, der Spin s ist in 2 Dimensionen nicht quantisiert. So etwas ist tatsächlich für die Beschreibung von quantenmechanischen Systemen in einem äußeren Magnetfeld interessant (siehe Anyonen sowie Klaus Fredenhage: Quantenmechanik II, S.52).


Strahldarstellungen der Überlagerungsgruppe ergeben Strahldarstellungen der ursprünglichen Lie-Gruppe:

Nehmen wir an, wir haben eine Strahldarstellung der Überlagerungsgruppe G' auf dem Hilbertraum, d.h.

  Th' g'   =     ei α (h',g')   Th' Tg'

(noch können wir nicht ausschließen, dass die Phase unnötig ist). Schauen wir uns an, was geschieht, wenn zwei Gruppenelemente g' und h' zum selben g gehören -- in diesem Fall wollen wir g'' statt h' schreiben. Es soll also   ρ(g') = ρ(g'') = g   sein. Da ρ mit der Gruppenstruktur verträglich ist, gilt:

  ρ(g' g''−1)   =   ρ(g') ρ(g''−1)   =   ρ(g') ρ(g'')−1   =   g g−1   =   1

d.h.   g' g''−1   gehört zum Kern von ρ. Nennen wir   g' g''−1   =:   e'   , d.h.   ρ(e') = 1  . Freigestellt nach g' haben wir dann   g'   =   e' g''   . Fassen wir zusammen:

Wenn   ρ(g') = ρ(g'') = g   ist, dann gibt es ein Element e' aus dem Kern von ρ (also   ρ(e') = 1   ) mit

  g'   =   e' g''  

In unserem Beispiel war e entweder 1 oder −1. Aus   g'   =   e' g''   und der Strahldarstellungseigenschaft folgt:

  Tg '   =   ei α (e',g'')   Te'   Tg''

Jetzt wird es ein wenig kniffelig (und ich bin mir auch nicht ganz sicher, ob ich das hier korrekt darstelle). Man muss voraussetzen, dass man eine irreduzible Darstellung der Überlagerungsgruppe hat. Das bedeutet, dass man von jedem Vektor des Hilbertraums jeden anderen Vektor über einen Transformationsoperator erreichen kann. Es darf also keine Unter-Hilberträume geben, die sich nur in sich transformieren. Ggf. muss man eben einen solchen Unter-Hilbertraum als Darstellungsraum nehmen. Dann muss man noch zeigen, dass   Te'   und   Tg''   vertauschen und das zweite Schursche Lemma anwenden. Und schließlich muss man noch verwenden, dass man nach dem Satz von Wigner die   Tg '   und damit   Te'   unitär wählen kann (siehe z.B. Darstellungstheorie der Drehgruppe von Prof. Schütte (ITKP Bonn), Kapitel 10, S.58). Als Ergebnis erhält man, dass   Te' = ei β(e')   ist.

Wir können nun aus der Überlagerungsgruppe einen Teilraum herausgreifen, der sich eindeutig auf G abbilden lässt (beispielsweise die Drehwinkel   0 ≤ φ < 2π   ). Man kann sich vorstellen, dass es sich gleichsam um die erste Überlagerungsschicht handelt. Die anderen Überlagerungsschichten in G' lassen sich dann aus dieser ersten Schicht durch Multiplikation mit den verschiedenen e' aus dem Kern von ρ erzeugen.

Bezeichnen wir das zu g gehörende eindeutige Element aus der ersten Überlagerungsschicht als g'. Für die Gruppenelemente g definieren wir die Darstellung einfach durch die Darstellung des entsprechenden eindeutigen g' (genau so haben wir es auch ganz oben bei den Drehungen um die z-Achse gemacht):

  Tg   :=   Tg '

Für ein anderes Gruppenelement g'', das auch zu g gehört, können wir nun   Te' = eiβ(e')   mit einem passenden e' aus dem Kern von ρ verwenden:

  Tg   =   Tg '   =   ei α (e',g'')   Te'   Tg''   =   ei α (e',g'')   ei β(e')   Tg''

Freigestellt nach   Tg''   ergibt sich:

  Tg''   =   Tg   e−i α (e',g'')   e−i β(e')

g.h. die Darstellungsoperatoren der ursprünglichen Gruppenelemente und der zugehörigen Überlagerungs-Gruppenelemente unterscheiden sich nur um eine Phase. Allerdings hängt diese Phase von e' und g'' ab. Daher lässt sich die Strahldarstellung von G' nicht unmittelbar eins-zu-eins in eine Strahldarstellung von G umschreiben, bei der die Phase nur von g und h (statt von g' und h' bzw. g'' und h'') abhängt. Es ist (zumindest mir) aber auch nicht klar, ob das notwendig ist. So hatten wir oben ja bereits angemerkt, dass wegen der Superauswahlregeln die Phase bei der Strahldarstellung von G auch von Zustandsklassen abhängen kann -- deshalb wurde bei der Herleitung eben auch die Forderung nach einer irreduziblen Darstellungen erhoben, bei der man sich nämlich auf so eine Zustandsklasse beschränkt. Offenbar ist hier eine weitere sorgfältige Analyse notwendig, die beispielsweise auch bestimmte Superauswahlregeln zur Folge haben kann. Wesentlich ist, dass ein Darstellungsoperator die Phasen von Zustandsvektoren, die sich superponieren (also addieren) lassen, in gleicher Weise ändert. Zustandsvektoren, bei denen er das nicht tut, darf man nicht zu neuen Zustandsvektoren addieren, wenn der Darstellungsoperator eine Symmetrie sein soll. Bei Drehungen wird das zur Folge haben, dass man ganzzahlige und halbzahlige Spinzustände nicht superponieren kann, wenn man von SU(2) als Symmetriegruppe ausgeht.

Weitere Infos dazu findet man in Steven Weinbergs Buch The Quantum Theory of Fields, Vol. 1, insbesondere in Kapitel 2.7. Wir gehen im Folgenden einfach davon aus, dass eine Strahldarstellung der Überlagerungsgruppe G' auch eine Strahldarstellung der ursprünglichen Gruppe G impliziert. Feinheiten kann man sich dann am konkreten Beispiel ansehen, und das werden wir insbesondere bei der Drehgruppe in einem späteren Kapitel auch tun.


Strahldarstellungen der Überlagerungsgruppe durch (weitgehend) unitäre Darstellungen:

Die Überlagerungsgruppe ist einfach zusammenhängend. Daher können wir die Gruppenelemente g' immer über einen Weg mit dem Einselement verbinden. Der Satz von Wigner sagt dann, dass die Operatoren   Tg'   unitär gewählt werden können. Wir wissen aber noch nicht, ob wir auch eine unitäre Darstellung der Überlagerungsgruppe auf dem Hilbertraum erreichen können, d.h. ob wir in jeder Strahldarstellung die Phase weglassen können und

  Th' g'   =     Th' Tg'

schreiben dürfen. Das wäre natürlich eine deutliche Vereinfachung. Eine Analyse zeigt (siehe z.B. Hendrik van Hees: Prinzipien der Quantentheorie, GSI Darmstadt 2003, Kapitel 3):

Es hängt von der Überlagerungsgruppe ab, ob man die Phase in jeder Strahldarstellung dieser Überlagerungsgruppe weglassen kann und eine unitäre Darstellung erreichen kann. Bei der Überlagerungsgruppe der Drehgruppe oder der Poincaregruppe geht das, bei der Überlagerungsgruppe der Galileigruppe dagegen nicht. Hier eine kurze Zusammenfassung der entsprechenden Analyse aus Hendrik van Hees: Prinzipien der Quantentheorie, GSI Darmstadt 2003, Kapitel 3 (steht auch in Steven Weinbergs Buch ausführlich drin):

Man beginnt mit einer beliebigen Strahldarstellung der Überlagerungsgruppe

  Th' g'   =     ei α (h',g')   Th' Tg'

und entwickelt die Operatoren sowie die Phase in eine Taylorreihe nach den Parametern der Gruppe -- so kommen die Darstellungsoperatoren der Generatoren   T(Ai) der Gruppe ins Spiel, also die Elemente der Lie-Algebra (siehe oben). Dabei entsteht eine lineare Strahldarstellung dieser Generatoren aus der Strahldarstellung der Gruppenelemente über die Gleichung

  T(Ai)   :=   −i d/dai Tg(a) |a = 0

Für den Kommutator der Strahldarstellungen der Generatoren erhält man die Gleichung

  [T(Ai), T(Aj)]   =   i f kij T(Ak)   +   i Cij 1

(mit Summierung über doppelte Indices) mit den reellen Strukturkonstanten   f kij   (siehe oben) und den sogenannten Zentralladungen der Strahl-Lie-Algebra Cij. Über die Exponentialdarstellung sieht man mit Hilfe der Baker-Campbell-Hausdorff Formel (siehe oben sowie Kapitel 6.1), dass es der Term   i Cij 1   ist, der zur Phase in der Strahldarstellung der Gruppe führt. Wegen diesem Zusatzterm spricht man bei den T(Ak) auch von einer Strahldarstellung (oder projektiven Darstellung) der Lie-Algebra.

In bestimmten Fällen kann man nun die Darstellungen der Generatoren T(Ai) so umdefinieren, dass dieser störende Term verschwindet, so dass man eine richtige Darstellung der Lie-Algebra erhält. In diesen Fällen kann man die Phase in jeder Strahldarstellung der Gruppe eliminieren und eine unitäre Darstellung der Überlagerungsgruppe erreichen. Dass man wirklich eine unitäre Darstellung erreichen kann, erfordert noch eine gewisse Sorgfalt, wobei auch wichtig ist, dass die Überlagerungsgruppe einfach zusammenhängend ist -- siehe Hendrik van Hees: Prinzipien der Quantentheorie, GSI Darmstadt 2003, Kapitel 3 sowie Steven Weinberg: The Quantum Theory of Fields, Vol. 1. Halten wir fest:

Satz von Wigner-Bargmann:

Wir betrachten eine einfach zusammenhängende Lie-Gruppe G' (z.B. eine universelle Überlagerungsgruppe) und wir betrachten eine beliebige Strahldarstellung ihrer Lie-Algebra, d.h. es gilt

  [T(Ai), T(Aj)]   =   i f kij T(Ak)   +   i Cij 1

Nun untersuchen wir, ob man die Operatoren T(Ai) so umdefinieren kann, dass die umdefinierten Operatoren T'(Ai) eine (richtige) Darstellung der Lie-Algebra bilden:

  [T'(Ai), T'(Aj)]   =   i f kij T'(Ak)

so dass also keine Zusatzsummanden proportional zum Eins-Operator mehr auftreten (also keine Zentralladungen). Wenn das geht, dann kann man die Phase der Strahldarstellung in die Darstellungsoperatoren der Gruppe integrieren und damit jede Strahldarstellung in eine gleichwertige unitäre Darstellung der Gruppe G' auf dem Hilbertraum umwandeln, d.h. man kann lineare unitäre Operatoren finden, für die gilt:

  Th' g'   =     Th' Tg'

Bei einer Gruppe G mit Überlagerungsgruppe G' erzeugt die unitäre Darstellung der Überlagerungsgruppe G' auch eine Strahldarstellung der Gruppe G (ggf. mit möglichen Zusatzbedingungen für die Superposition von Zuständen, also Superauswahlregeln).

Was aber, wenn man die Zentralladungen nicht wegdefinieren kann? Dann gibt es Strahldarstellungen der Gruppe G', die nicht äquivalent zu einer unitären Darstellung von G' sind. Man kann dann aber in

  [T(Ai), T(Aj)]   =   i f kij T(Ak)   +   i Cij 1

die Terme   Cij 1   einfach in die Darstellung der Lie-Algebra integrieren, indem wir neue Operatoren hinzunehmen, die Cij als Eigenwerte auf dem Hilbertraum besitzen. Für jede Zentralladung Cij entsteht so ein weiterer Operator Tneu in der Darstellung der Lie-Algebra, der mit allen anderen Darstellungsoperatoren der bisherigen Generatoren vertauscht. Nun kann man die bisherige Lie-Algebra so um neue Generatoren Aneu erweitern, dass die neuen Operatoren Darstellungsoperatoren von neuen Generatoren sind:   Tneu = T(Aneu)   . Mit Hilfe dieser erweiterten Lie-Algebra können wir dann die zugehörige einfach zusammenhängende Gruppe über die Exponentialabbildung konstruieren. Diese Gruppe ist gleichsam eine einfache Erweiterung der ursprünglichen Gruppe um neue Gruppenelemente und wird als Zentrale Erweiterung der Gruppe bezeichnet. Die Darstellung der Lie-Algebra dieser neuen Gruppe enthält nun keine Zentralladungen mehr (denn diese sind ja nun Darstellungen der neuen Generatoren), so dass wir den obigen Satz wieder anwenden können und eine unitäre Darstellung dieser Gruppe erreichen können. Im allgemeinsten Fall kann man also Strahldarstellungen einer Lie-Gruppe G konstruieren, indem man die zentrale Erweiterung der universellen Überlagerungsgruppe aufsucht und deren unitäre Darstellungen konstruiert. Oder aber man bleibt bei der universellen Überlagerungsgruppe und lebt mit der meist recht einfachen Phase in der fast-unitären Strahldarstellung dieser Gruppe. So habe ich in John F. Dawson: Quantum Mechanics: Fundamental Principles and Applications, Kapitel 4.4 auf S.45 den Satz gefunden: There seems to be no particular advantage in using this extended scheme (gemeint ist die zentrale Erweiterung der Galileigruppe). Wir werden uns das am Beispiel der Galileigruppe in einem späteren Kapitel noch genauer ansehen.

Damit sind wir nun gerüstet, um uns mit den Strahldarstellungen der beiden wichtigsten Gruppen zu befassen: Der Galileigruppe und der Poincaregruppe. Als Vorbereitung schauen wir uns dazu aber zunächst wichtige Untergruppen dieser beiden Gruppen an: die Raum-Zeit-Translationen und die Drehungen. Im nächsten Schritt können wir dann die nichtrelativistischen Boosts hinzunehmen und so zur Galileigruppe vorstoßen, oder aber über die relativistischen Boosts zur Poincaregruppe gelangen. Bei den Drehungen wird dabei die Überlagerungsgruppe der Drehgruppe ins Spiel kommen, und bei den nichtrelativistischen Boosts die zentrale Erweiterung der Gruppe.


zurück zum Inhaltsverzeichnis

last modified on 13 December 2008