Kapitel 4
Die Quantentheorie

8  Drehungen, Spin und Drehimpuls

Die Darstellung der Drehgruppe im Hilbertraum ist fester Bestandteil der Quantenmechanik-Vorlesungen. Daher werde ich in diesem Kapitel diese Standard-Anteile relativ kurz darstellen -- man findet sie in jedem Vorlesungsskript zur Quantenmechanik. Es gibt aber auch wichtige Aspekte der Drehgruppe, die meist nur knapp dargestellt werden können. Auf diese Aspekte möchte ich hier genauer eingehen.

Versuchen wir, möglichst analog zu den Translationen im vorherigen Kapitel vorzugehen. Wir beginnen also mit der Darstellung der Drehungen im dreidimensionalen Raum. In Kapitel 3.4 haben wir bereits gesehen, wie das geht. Hier eine kurze Wiederholung:

Drehungen im dreidimensionalen Raum:

Eine Drehung im dreidimensionalen Raum ist eine lineare Abbildung R(w), die die Länge von Vektoren nicht ändert und die sich stetig mit der Eins verbinden lässt (wir schließen also Spiegelungen aus). Dabei hängt R von drei reellen Parametern   w = (w1, w2, w3)   (die Drehwinkel) ab. Wir können jede Drehung durch folgende Matrix aus SO(3) (die speziell orthogonalen Matrizen) darstellen:

  R(w) x   :=   eG(w) x

mit   G(w) x   =   w × x   . In Komponenten bedeutet das:   G(w)ik xk   =   εijk wj xk   (mit Summierung über doppelte Indices und dem total antisymmetrischen Levi-Civita-Symbol   εijk   aus dem vorherigen Kapitel). Die Matrix G(w) ist also gegeben durch   G(w)ik   =   εijk wj :


G(w)   =   æ
ç
ç
ç
è
0
-w3
w2
w3
0
-w1
-w2
w1
0
ö
÷
÷
÷
ø

Man kann die Exponentialreihe komplett aufsummieren (siehe Kapitel 3.4) und erhält als allgemeine Darstellung für eine Drehung:

eG(w) x   =   -(cos w) ((ex)e - x)   +   (ex)e   +   (sin we ×x

mit   w = ω e   , d.h.   ω = |w|   und   e = w / |w|   . In Kapitel 3.4 hatten wir gesehen, dass wir e als Drehachse und ω als Drehwinkel um diese Achse interpretieren können. Der Vektor w ist also in Richtung der Drehachse orientiert, und sein Betrag gibt den Drehwinkel entgegen dem Uhrzeigersinn an, wenn wir die Drehung von der Spitze von w aus betrachten.

Wie sieht die Lie-Algebra der Drehgruppe aus? Das können wir sofort an der Exponentialdarstellung ablesen. Dazu schreiben wir G(w) als   G(w) =: i wj Aj  , d.h.   R(w)   =   ei wj Aj   (mit Summe über j). Aus   G(w)ik   =   εijk wj   =:   i wj (Aj)ik   lesen wir ab:   i (Aj)ik   =   εijk   . Wenn man die Matrizen   i (Aj)ik   explizit hinschreiben will, so nimmt man am Besten einfach die Matrix G(w) von oben und verwendet   G(ei) = i Ai   .

Rechnen wir den Kommutator der Ai -Matrizen aus. Das kann man explizit machen, oder aber man rechnet über   G(w) x   =   w × x   und den bekannten Formeln für das doppelte Kreuzprodukt nach, dass gilt:

  [G(v), G(w)]   =   G(v × w)

In diese Formel können wir   G(ei) = i Ai   einsetzen:

  [G(ei), G(ej)]   =   G(ei × ej)   =   G(εijkek)   =   εijk G(ek)     und somit
  [i Ai , i Aj]   =   εijk i Ak

also

  [Ai , Aj]   =   −εijk i Ak

(das negative Vorzeichen bekommt man weg, wenn man die Ai mit umgekehrtem Vorzeichen definiert -- so werden wir es weiter unten bei den Drehimpulsen machen).

Im Gegensatz zur Translationsgruppe bilden die Drehungen keine abelsche Gruppe. Zwei verschiedene Drehungen vetauschen i.a. nicht miteinander. Dafür ist die Drehgruppe aber (anders als die Translationsgruppe) kompakt. Man kann nämlich den Drehvektor w auf alle Vektoren mit Betrag kleiner-gleich π einschränken. Damit erfasst man tatsächlich alle Drehungen, denn eine Drehung um 3/2 π mit Drehachse e entspricht einer Drehung um 1/2 π mit Drehachse −e . Aus der Kompaktheit der Drehgruppe folgt, dass sich jede Drehung als Exponentialreihe schreiben lässt, so wie wir es oben getan haben (siehe dazu Kapitel 4.6 )

Man kann sich den Raum der Drehungen daher durch den Raum der Drehvektoren w veranschaulichen, also durch eine Kugel mit Radius π . Jeder Punkt in dieser Kugel entspricht einem Drehvektor w und damit einer Drehung. Es gibt allerdings eine wichtige Besonderheit: Ein Punkt auf der Oberfläche mit Drehvektor   w = π e   und sein gegenüberliegender Punkt mit Drehvektor   −w = − π e   stellen dieselbe Drehung dar, denn es ist egal, ob man eine halbe Drehung rechts oder links herum durchführt. Die Mannigfaltigkeit der Drehgruppe entspricht also einer Kugel mit Radius π, bei der man gegenüberliegende Punkte miteinander identifizieren muss. Berührt man auf einem Weg durch die Kugel die Oberfläche, so taucht man sofort auf der gegenüberliegenden Seite wieder in die Kugel ein. Insofern hat die Mannigfaltigkeit der Drehgruppe auch keinen Rand!

Es gibt nun geschlossene Wege in dieser Kugel, die sich nicht stetig auf einen Punkt zusammenziehen lassen. So kann man vom Ursprung aus radial nach außen gehen. Sobald man den Kugelrand erreicht (halbe Drehung), taucht man auf der gegenüberliegenden Seite wieder in die Kugel ein und kann radial wieder nach innen bis zum Ursprung laufen. Dies entspricht dem Durchlaufen aller Drehungen um eine feste Drehachse mit Drehwinkeln von 0 bis 360 Grad. Am Schluss hat man eine Umdrehung geschafft, die gleichwertig mit gar keiner Umdrehung ist. Dieser geschlossene Weg lässt sich nicht stetig zu einem Punkt zusammenziehen. Daher ist die Drehgruppe zwar zusammenhängend, aber nicht einfach zusammenhängend. Siehe dazu auch Kapitel 3.5.


Die beiden Kurven A und B sind geschlossene Kurven im Raum der Drehungen. Bei Kurve A muss man sich vorstellen, dass man wieder in die Kugel eintritt, wenn man genau gegenüber aus ihr austritt. Kurve B lässt sich stetig im Raum der Drehungen auf einen Punkt zusammenziehen, Kurve A dagegen nicht. Daraus folgt auch, dass sich Kurve A nicht stetig in Kurve B umformen lässt (man müsste Kurve A dazu einmal zerreißen und neu zusammenkleben).



keine Zentralladungen:

Nun zu Strahl-Darstellungen der Drehgruppe durch Operatoren auf einem Hilbertraum. Zunächst zu den Zentralladungen: Lassen sich diese immer wegdefinieren? Schauen wir uns dazu den allgemeinen Fall aus Kapitel 4.6 an:

  [T(Ai), T(Aj)]   =   i f kij T(Ak)   +   i Cij 1

Die Strukturkonstanten f kij sind über   [Ai , Aj]   =   i f kij Ak   definiert. In unserem Fall ist also   f kij = −εijk   .

Wie bei den Translationen im vorherigen Kapitel gilt wieder: Da der Kommutator antisymmetrisch in i und j ist, gilt dies auch für Cij , d.h. nur 3 der 9 Zahlen Cij sind unabhängig und ungleich Null. Wir können daher allgemein schreiben:

  Cij   =   εijk Ck

mit geeigneten drei Zahlen Ck (und Summe über k). Setzen wir beides oben ein, so haben wir

  [T(Ai), T(Aj)]   =   −i εijk ( T(Ak)   −   Ck 1 )

Jetzt brauchen wir nur noch neue Operatoren zu definieren:

  T'(Ai)   :=   T(Ak)   −   Ck 1

(man beachte den kleinen Strich in T'(Ai) links). Da der additive Term   Ck 1   im Kommutator wegfällt, kann man leicht nachrechnen, dass im Kommutator der neuen Operatoren keine Zentralladung mehr auftritt:

  [T'(Ai), T'(Aj)]   =   −i εijk T'(Ak)

Aus einer beliebigen Strahldarstellung der Lie-Algebra der Drehgruppe kann man also immer eine echte Darstellung der Lie-Algebra machen. Man kann also die Zentralladungen wegdefinieren.

Bei einer einfach zusammenhängenden Gruppe würde das bedeuten, dass man die Phase in der Strahldarstellung weglassen kann und eine unitäre Darstellung ausreicht, um alle Strahldarstellungen zu erfassen. Leider ist die Drehgruppe nicht einfach zusammenhängend, d.h. nicht jede projektive Darstellung der Drehgruppe ist eine unitäre Darstellung der Drehgruppe. Erst wenn wir zur universellen Überlagerungsgruppe der Drehgruppe übergehen, decken deren unitäre Darstellungen alle projektiven Darstellungen der Drehgruppe ab. Was also ist die universelle Überlagerungsgruppe der Drehgruppe?


Überlagerungsgruppe:

Überlegen wir uns, wie die Mannigfaltigkeit dieser Gruppe aussehen könnte. Sie muss einfach zusammenhängend sein und sie muss lokal so aussehen wie die Mannigfaltigkeit der Drehgruppe. Das kann man leicht durch einen einfachen Trick erreichen:

Wir starten mit der Mannigfaltigkeit der Drehgruppe, also mit der Kugel mit Radius π, bei der die gegenüberliegenden Punkte miteinander identifiziert werden. Da es gerade diese Identifikation der Punkte ist, die zu den nicht-kontrahierbaren geschlossenen Kurven führt, wollen wir sie loswerden, ohne dass dabei die Mannigfaltigkeit einen Rand bekommt. Man kann also die Identifikation nicht einfach weglassen, da man sonst beim Durchstoßen der Kugeloberfläche nicht wieder in die Kugel hineinkäme -- muss man aber, da Drehungen keinen Rand (also keine größte Drehung) haben. Die Lösung ist:
Wir verdoppeln die Kugel und wandern einfach beim Durchstoßen der Oberfläche in die zweite Kugel hinein, und zwar am genau gegenüberliegenden Punkt! Wenn wir also am Nordpol die erste Kugeloberfläche durchstoßen, so tauchen wir augenblicklich am Südpol in die zweite Kugel ein. Die folgende Grafik stellt dies dar (siehe dazu im Internet auch beispielsweise Topological lensing in spherical spaces sowie Visualizing the N-Sphere ):


Der Punkt A auf der linken Kugeloberfläche entspricht dem Punkt A' auf der rechten Kugeloberfläche usw.. Die dargestellte Kurve ist daher tatsächlich eine geschlossene Kurve! Man kann sich anhand von Beispielen nun davon überzeugen, dass man jede geschlossene Kurve nun tatsächlich auf einen Punkt zusammenziehen kann, d.h. die Mannigfaltigkeit dieser 2 Kugeln ist einfach zusammenhängend. Zudem sieht jede der beiden Kugeln lokal eben wie eine Kugel aus -- so wie gefordert.

Das obige Bild macht auch unmittelbar den Überlagerungsbegriff anschaulich: Die Mannigfaltigkeit der beiden Kugeln mit identifizierten Oberflächenpunkten kann man surjektiv auf die eine Kugel mit identifizierten gegenüberliegenden Oberflächenpunkten abbilden, indem man einfach vergisst, von welcher Kugel ein Punkt herkommt. Man legt die beiden Kugeln einfach übereinander (besser: ineinander), als ob sie aus Luft wären, wobei wir dafür sorgen, dass ein Punkt A' der rechten Kugel genau gegenüber dem damit identifizierten Punkt A der linken Kugel zu liegen kommt.

Wir kennen das obige Bild bereits aus Die Grenzen der Berechenbarkeit, Kapitel 5.3. Dort erfahren wir, dass es sich bei der obigen Mannigfaltigkeit um die 3-Sphäre handelt, also um das 3-dimensionale Analogon zur 2-dimensionalen Kugeloberfläche. Auch die 2-dimensionalen Kugeloberfläche ist ja einfach zusammenhängend. Die Topologie der 2-dimensionalen Kugeloberfläche kann man analog durch 2 Vollkreise darstellen, deren Randpunkte man miteinander identifiziert. Der eine Vollkreis ist die plattgedrückte Oberfläche der linken Halbkugel, der andere die plattgedrückte Oberfläche der rechten Halbkugel und der Kreisrand entspricht der Schnittlinie zwischen den beiden Halbkugeloberflächen. Mehr dazu siehe Die Grenzen der Berechenbarkeit, Kapitel 5.3 und unter der externen Webseite Visualizing the N-Sphere.

Darstellung der Kugeloberfläche (2-Sphäre) durch zwei 2 Vollkreise, deren Randpunkte man miteinander identifiziert. Beult man die beiden Vollkreise zu Halbkugel-Oberflächen aus und klebt sie am Rand aneinander, so entsteht eine Kugeloberfläche (2-Sphäre, siehe Bild rechts). Analog können wir oben die 3-Sphäre durch 2 Vollkugeln darstellen, deren Oberflächenpunkte man miteinander identifiziert. Sowohl 2-Sphäre als auch 3-Sphäre sind einfach zusammenhängend.


Nun wissen wir also, dass die Mannigfaltigkeit der universellen Überlagerungsgruppe topologisch so wie die 3-Sphäre aussehen sollte. Schön wäre es, wenn wir ein Konstruktionsverfahren hätten, um die Überlagerungsgruppe explizit herzuleiten. So etwas gibt es, und ich werde versuchen, dies in einem späteren Kapitel darzustellen (Stichwort: Clifford-Algebren und Spingruppen). Alternativ kann man auch über die Lie-Algebra gehen, die ja bei der Überlagerungsgruppe genauso aussehen muss wie bei der Drehgruppe. Eine der Darstellungen der Lie-Algebra sollte dann über die Exponentialreihe die Überlagerungsgruppe ergeben. Genau so geht man in den Quantenmechanik-Vorlesungen auch vor -- meist ohne den Begriff der Überlagerungsgruppe explizit zu erwähnen. Wir werden diese Vorgehensweise etwas weiter unten noch kennenlernen.

Das oben erwähnte Konstruktionsverfahren (ohne den üblichen Weg über die Lie-Algebra) liefert das folgende Ergebnis, das an dieser Stelle gleichsam vom Himmel fällt und das wir nur nachträglich überprüfen können (siehe auch Kapitel 6.1 ): Die Überlagerungsgruppe der Drehgruppe ist die Gruppe SU(2), also die komplexen unitären 2-mal-2-Matrizen mit Determinante Eins. Hier die Details:

  • Zusammenhang zwischen der Drehgruppe und ihrer universellen Überlagerungsgruppe SU(2):

    Man kann jeder Matrix u aus SU(2) (die unitären 2-mal-2-Matrizen mit Determinante Eins) über die folgende Gleichung eindeutig eine Drehmatrix R aus SO(3) zuordnen:

      u σ(x) u+   =   σ(R x)

    Dabei ist u+ ist die zu u transponierte und komplex konjugierte Matrix und

      σ(x)   =   xi σi

    (mit Summe über i) ist eine hermitesche 2-mal-2-Matrix mit Spur Null, die mit Hilfe der drei Paulimatrizen σi   gebildet wird. Insbesondere ist   det σ(x)   =   − x2   die euklidische Norm des Vektors x.

Hier sind noch einmal die Paulimatrizen:

 

Ausgeschrieben lautet die Matrix σ(x) also (wobei wir in der folgenden Formel eine Null statt x0 setzen müssen -- die Formel entsteht, wenn man noch x0 mal der Einheitsmatrix hinzuaddiert, was wir erst bei der Lorentzgruppe brauchen werden):

        mit x0 = 0

Man rechnet leicht nach, dass wegen   det(u) = 1   die so definierte Matrix R die euklidische Norm eines Vektors nicht ändert:

  (R x)2   =   − det( σ(R x) )   =   − det( u σ(x) u+ )   =   − det(u) det(σ(x)) det(u+)   =   − det(σ(x))   =   x2

Also ist R eine orthogonale Matrix. Dass Spiegelungen ausgeschlossen sind, weist man nach, indem man u und damit R über einen stetigen Weg mit der Einheitsmatrix verbindet. Man kann auch beweisen, dass man tatsächlich jede Drehmatrix R durch ein passendes u so erreichen kann. Außerdem ist gesichert, dass dem Produkt zweier Gruppenelemente u und u' aus SU(2) auch das Produkt der entsprechenden Drehmatrizen zugeordnet wird, d.h. die Gruppenstruktur wird berücksichtigt. Details dazu siehe z.B. D. Schütte: Darstellungstheorie der Drehgruppe, speziell Kapitel 10.

Allerdings ist die Zuordnung von SU(2) zu den Drehmatrizen nicht eindeutig: Den beiden SU(2)-Matrizen   u   und   − u   wird dieselbe Drehmatrix zugeordnet! Daher ist SU(2) eine Überlagerungsgruppe der Drehgruppe. Wir haben das am Beispiel der Drehungen um die z-Achse bereits in Kapitel 4.6 gesehen.

Die Gleichung   u σ(x) u+   =   σ(R x)   definiert also eine surjektive Projektion

  ρ:   SU(2)   →   SO(3)

die mit der Gruppenstruktur verträglich ist -- so wie es in Kapitel 4.6 für eine Überlagerungsgruppe verlangt wird.

Bleibt die Frage: Hat SU(2) als Mannigfaltigkeit auch die gewünschte Topologie, ist also einfach zusammenhängend wie die 3-Sphäre? Das sieht man tatsächlich sehr einfach, denn man kann jede Matrix u aus SU(2) so schreiben:


u   =   æ
ç
è
a
b
−b*
a*
ö
÷
ø

Dabei sind a und b komplexe Zahlen, deren Real- und Imaginärteile wir als karthesische Koordinaten des R4 auffassen können, in den die Gruppenmannigfaltigkeit eingebettet ist. Wir schreiben also   a = y1 + iy2   und   b = y3 + iy4   mit reellen Koordinaten yi . Die Bedingung   det(u) = 1   bedeutet dann, dass   |a|2 + |b|2   =   y12 + y22 + y32 + y42   =   1   ist. Die Koordinaten erfüllen also die Bedingung einer 3-Sphäre im vierdimensionalen Raum. Man kann SU(2) also als 3-Sphäre auffassen -- so wollten wir es ja haben!

Man kann auch einen expliziten Zusammenhang der SU(2)-Matrizen mit den beiden Vollkugeln oben herstellen. Ich will es aber nicht übertreiben, daher hier nur ein kleines Beispiel: Wir laufen vom Mittelpunkt der linken Kugel (Drehung um Null Grad, u = 1) radial nach Norden (Drehung links herum um die z-Achse), erreichen die Kugeloberfläche am Nordpol (halbe Drehung nach links um die z-Achse), tauchen auf der rechten Kugeloberfläche am Südpol ein (mehr als eine halbe Drehung nach links um die z-Achse) und erreichen schließlich den Mittelpunkt der rechten Kugel (ganze Drehung nach links um die z-Achse, u = −1). Im Raum der SU(2)-Matrizen ist eine ganze Drehung nach links um die z-Achse nicht identisch mit einer Drehung um 0 Grad. Die linke Kugel gibt die Drehungen mit Drehwinkel kleiner als π an, während die rechte Kugel die Drehungen mit Drehwinkel von π bis 2π darstellt (die Drehachse zeigt dabei bei der rechten Kugel radial nach innen). Der Drehwinkel 2π liegt im Mittelpunkt der rechten Kugel. Die folgende Grafik aus Die Grenzen der Berechenbarkeit, Kapitel 5.3 stellt dies dar (siehe Topological lensing in spherical spaces sowie Visualizing the N-Sphere, ), wobei allerdings der halbe Drehwinkel angegeben wird (Grund: der halbe Drehwinkel entspricht gerade der Kugelkoordinate χ, die hier radial nach außen dargestellt ist -- Details siehe Die Grenzen der Berechenbarkeit, Kapitel 5.3):



Der Gürteltrick von Dirac (Dirac belt trick):

Die Tatsache, dass sich jede Kurve in der Überlagerungsgruppe der Drehgruppe stetig auf einen Punkt zusammenziehen kann, lässt sich sehr anschaulich demonstrieren, beispielsweise mit einem Gürtel (Dirac belt trick). Wir nehmen also einen Gürtel und legen ihn schön gerade von links nach rechts vor uns hin. Auf den Gürtel können wir nun Pfeile senkrecht zur Gürtelausrichtung mit einer kleinen Pfeilspitze zur entfernteren Gürtelkante malen, so dass der Gürtel aussieht wie eine Strickleiter. Diese Pfeile zeigen alle in dieselbe Richtung. Nun nehmen wir das rechte Ende und drehen es zweimal um die Ausrichtungsachse des Gürtels. Der Gürtel ist also nun doppelt verdreht. Entsprechend sind nun auch die aufgemalten Pfeile nicht mehr parallel zueinander, sondern sie drehen sich zweimal um die Gürtelachse, wenn wir den Gürtel von links nach rechts durchlaufen. Die Pfeile am linken Ende, in der Mitte und am rechten Ende liegen aber noch parallel zueinander:



Jeder einzelne Pfeil auf dem verdrehten Gürtel repräsentiert nun eine Drehung im dreidimensionalen Raum, nämlich die Drehung, die beim Verdrehen des Gürtels auf diesen Pfeil wirkt und ihn in die neue räumliche Ausrichtung bringt. Dabei repräsentieren benachbarte Pfeile auch benachbarte Drehungen, denn die Pfeilausrichtung und damit die zugehörige Drehung ändert sich stetig, wenn wir den Gürtel entlanglaufen. Die Pfeile auf dem verdrehten Gürtel repräsentieren insgesamt eine doppelt geschlossene Kurve im Raum der Drehungen: Man startet mit dem unverdrehten Pfeil am linken Gürtelende (also mit der Drehung um 0 Grad), läuft dann nach rechts auf dem Gürtel entlang und durchläuft zugleich die entsprechenden Drehungen, bis man am rechten Gürtelende bei einem Pfeil ankommt, der um 720 Grad gedreht wurde, was identisch mit einer Drehung um Null Grad ist. Auch in der Gürtelmitte trifft man auf einen dazu parallel ausgerichteten Pfeil, der um 360 Grad gedreht wurde (entsprechend einer Drehung um Null Grad). Man durchläuft also bei den Drehungen eine geschlossene Kurve, die zweimal durch die Identität geht. Anders gesagt: Der doppelt verdrehte Gürtel entspricht einer stetigen Kurve, die alle Drehungen um die Gürtelachse von 0 Grad bis 720 Grad (eine Doppeldrehung) durchläuft.

Dieser Kurve im Raum der Drehungen entspricht auch in der Überlagerungsgruppe SU(2) eine geschlossene Kurve, die allerdings nur einmal durch die Identität geht, denn in der Überlagerungsgruppe können wir ja eine Drehung um Null Grad und eine um 360 Grad voneinander unterscheiden -- genau wie auf dem Gürtel, wenn wir den Verlauf der Drehung von links nach rechts berücksichtigen. Jeden Pfeil auf dem Gürtel können wir also einem Element der Überlagerungsgruppe SU(2) umkehrbar eindeutig zuordnen -- anhand der Verdrehung des Gürtels erkennen wir ja, ob ein Pfeil einmal oder zweimal verdreht wurde. Der Gürtel mit seinen Pfeilen erlaubt es also, anschaulich eine geschlossene Kurve in der Überlagerungsgruppe SU(2) darzustellen.

Und nun kommt Diracs Trick: Wir dürfen das rechte Gürtelende im Raum bewegen, ohne dabei die Ausrichtung des Gürtelendes zu verändern. Der Pfeil am Gürtelende (und am Gürtelanfang) darf also nicht räumlich verdreht werden und repräsentiert weiter die Drehung um Null Grad. Beim Bewegen des Gürtelendes ändert sich aber die Orientierung der Pfeile zwischen Gürtelanfang und Gürtelende, denn der Gürtel verändert seine Lage im Raum. Insgesamt verändern wir also die geschlossene Kurve in der Überlagerungsgruppe. Das Erstaunliche ist nun: Man kann die Doppelverdrehung des Gürtels komplett zurücknehmen, alleine durch Bewegung des rechten Gürtelendes und ohne jede weitere Verdrehung des Gürtels! Probieren Sie es mit einem realen Gürtel einmal aus! Man muss das rechte Gürtelende nur geschickt um die ursprüngliche Gürtelachse herumbewegen. Hier ist ein Versuch von mir, die Vorgehensweise einigermaßen darzustellen:



Den Schritt von Bild 1 nach Bild 2 macht der Gürtel fast automatisch aufgrund seiner inneren Spannung durch die Verdrehung, wenn man die beiden Enden einander annähert. Der Gürtel merkt gleichsam schon selbst, dass er sich ent-drehen kann und bildet eine Schlaufe. Nun muss man nur noch das hintere Ende nach vorne bringen (Bild 3) und es dann unter statt über dem Gürtel wieder nach hinten ziehen. Man merkt, wie dabei die Spannung im Gürtel nachlässt und wie er sich schließlich in Bild 5 vollkommen glatt strecken lässt. Natürlich kann man die Schritte auch von rechts nach links ausführen und so aus einem unverdrehten einen doppelt verdrehten Gürtel machen, ganz ohne ein Gürtel-Ende drehen zu müssen.

Statt eines Gürtels kann man übrigens auch gut einen Papierstreifen nehmen, auf den man sogar kleine Pfeile aufmalen kann (so habe ich es gemacht, um die Bilder oben zeichnen zu können). Im Internet findet man übrigens viele schöne Animationen zu dem Thema (einfach nach den Worten belt trick oder Dirac belt trick suchen oder auch direkt unter http://gregegan.customer.netspace.net.au/APPLETS/21/21.html ).

Der doppelt verdrehte Gürtel lässt sich also stetig in den unverdrehten Gürtel umwandeln, ohne dabei die Pfeile an den Gürtelenden verdrehen zu müssen. Bei der Bewegung des rechten Gürtelendes verändert sich die zugehörige Kurve in der Überlagerungsgruppe stetig, bleibt aber ständig eine geschlossene Kurve durch die Identität, denn die Pfeile auf den Gürtelenden werden ja nicht verdreht. Am Schluss hat man einen unverdrehten Gürtel, bei dem sich von Pfeil zu Pfeil die Ausrichtung nicht ändert, d.h. jeder Pfeil repräsentiert dort die Drehung um Null Grad. Damit hat man die geschlossene Kurve in der Überlagerungsgruppe stetig auf einen Punkt (die Drehung um Null Grad) zusammengezogen.

Wenn man den Gürtel nur einfach verdreht, dann geht das nicht! Diesen Gürtel kann man nicht wie oben in einen unverdrehten Gürtel umwandeln. Der einfach verdrehte Gürtel entspricht einer geschlossenen Kurve im Raum der Drehungen, die sich nicht stetig auf einen Punkt zusammenziehen lässt. In der Überlagerungsgruppe stellt diese Gürtel aber noch keine geschlossene Kurve dar. Erst der doppelt verdrehte Gürtel entspricht hier einer geschlossenen Kurve, und die lässt sich stetig auf einen Punkt zusammenziehen. Da sich nun jede geschlossene Kurve in der Überlagerungsgruppe durch einen irgendwie im Raum liegenden Gürtel mit doppelt gegeneinander verdrehten Enden darstellen lässt, und da sich diese Doppelverdrehung immer wie oben auflösen lässt, deshalb kann man jede geschlossene Kurve in der Überlagerungsgruppe SU(2) stetig auf einen Punkt zusammenziehen, d.h. SU(2) ist einfach zusammenhängend. Erstaunlich, dass sich eine scheinbar abstrakte topologische Eigenschaft so anschaulich demonstrieren lässt! So hat man doch gleich das Gefühl, es mit einer realen Tatsache zu tun zu haben, und das hat man ja auch!


Darstellungen der Lie-Algebra:

Um zur Überlagerungsgruppe der Drehgruppe und all ihrer Darstellungen zu gelangen, geht man oft den Weg über die Lie-Algebra und deren Darstellungen durch hermitesche Operatoren auf dem Hilbertraum. Zentralladungen brauchen wir ja nicht mehr zu befürchten, denn oben hatten wir gesehen, dass wir diese wegdefinieren können. Es muss also für die Darstellungsoperatoren der Generatoren gelten:

  [T(Ai), T(Aj)]   =   −i εijk T(Ak)

(die Striche lassen wir jetzt weg). Wir wollen diese Operatoren wie üblich als   Ji   :=   − T(Ai)   schreiben -- so werden wir auch das lästige Vorzeichen los:

  [Ji, Jj]   =   i εijk Jk

Man bezeichnet die Operatoren Ji als Drehimpulsoperatoren und spricht von der Drehimpulsalgebra. Warum, werden wir noch sehen. Analog zum Impulsoperator schreibt man auch   J   =   (J1, J2, J3)   .

Tatsächlich ist es nun so, dass die Drehimpulsalgebra   [Ji, Jj]   =   i εijk Jk   die Eigenschaften der Operatoren Ji bereits eindeutig (bis auf Phasenfaktoren) festlegt. Wie das im Einzelnen geht, findet man in jedem Text zur Quantenmechanik, beispielsweise in Darstellungstheorie der Drehgruppe von Prof. Schütte (ITKP Bonn), Kapitel 6, S.28 . Daher hier nur das Wichtigste in Kürze:

Da unitäre Darstellungen der Überlagerungsgruppe ausreichen, um alle projektiven Darstellungen der Drehgruppe zu konstruieren, sind analog zu den Impulsen auch die Drehimpuls-Operatoren Ji hermitesch. Sie haben also reelle Eigenwerte, die als Observable in Betracht kommen. Daher suchen wir die Eigenwerte und Eigenvektoren der Ji im Hilbertraum. Andere Zustände können wir dann als Superposition dieser Eigenvektoren schreiben.

Allerdings gibt es (bis auf eine Ausnahme) keine Vektoren, die zugleich Eigenvektoren zu allen drei Ji sein können, denn die Ji vertauschen nicht miteinander. Ein Beispiel: Angenommen, es gäbe einen Vektor   |j1 j2 j3ñ   , der   Ji   |j1 j2 j3ñ   =   ji   |j1 j2 j3ñ   erfüllt. Dann wäre

  [Ji, Jj]   |j1 j2 j3ñ   =   (ji jj   − jj ji)   |j1 j2 j3ñ   =   0   =   i εijk Jk   |j1 j2 j3ñ

d.h. Null ist der einzige Eigenwert, der simultaner Eigenwert der drei Jk sein könnte. Das war bei den Impulsoperatoren anders, denn diese kommutieren miteinander (wenn man von Zentralladungen absieht).

Man kann jedoch aus den drei Jk andere Operatoren zusammenbauen, die sich besser zur Ermittlung der Eigenwerte und Eigenvektoren eignen:

  J2   :=   J12 + J22 + J32
  J+   :=   J1 + i J2
  J   :=   J1 − i J2
  J3     bleibt unverändert

J2 und jedes einzelne der Ji kommutieren und haben deshalb simultane Eigenwerte und Eigenvektoren -- daher nennt man J2 auch den Casimiroperator der Drehimpulsalgebra. Da aber die Ji nicht kommutieren, müssen wir einen davon auswählen: Wir haben uns für J3 entschieden. Eine Analyse mit Hilfe der Leiteroperatoren J+ und J zeigt (siehe z.B. Darstellungstheorie der Drehgruppe von Prof. Schütte (ITKP Bonn), Kapitel 6, S.29 - 31):

Die Eigenvektoren von J2 und J3 (nennen wir sie   | jmñ   ) bilden eine Orthonormalbasis und erfüllen

  J2   |j mñ   =   j (j + 1)   |j mñ     mit   j = 0, 1/2, 1, 1/2, 2, ...  
  J3   |j mñ    =           m   |j mñ     mit   m = −j, −j+1, ... , j−1, j  

Außerdem gilt mit diesen Einschränkungen für j und m :

  J+   |j mñ   =   N   |j m+1ñ     mit     N = √( j(j+1) − m(m+1) )
  J   |j mñ   =   N'   |j m−1ñ     mit     N' = √( j(j+1) − m(m−1) )

Die Quantenzahl j (im Folgenden Drehimpuls genannt) kann also von Null aufwärts ganz- und halbzahlige Werte annehmen, und die sogenannte magnetische Quantenzahl m (auch Drehimpulskomponente entlang der 3-Achse genannt) kann dann für jedes j in ganzzahligen Schritten die Werte von −j bis j annehmen. Hier explizit die Fälle j = 0, 1/2 und 1:

  j = 0       m = 0
  j = 1/2    m = −1/2, 1/2
  j = 1       m = −1, 0, 1

Die Wirkung der Operatoren J2, J3, J+ und J auf die Basisvektoren   |j mñ   sind durch die obigen Formeln komplett festgelegt. Dabei fällt auf, dass sich j nie ändert. Man kann daher die Wirkung der Operatoren in den einzelnen Unterräumen zu den verschiedenen j getrennt voneinander betrachten und die Operatoren dort als (2j+1)-dimensionale komplexe Matrizen darstellen. Man sagt auch, die Darstellung der Operatoren zerfällt in irreduzible Darstellungen, die jeweils durch einen Wert von j gekennzeichnet sind.

Auch die beiden Operatoren J1 und J2 kann man in dieser Basis als Matrizen darstellen, indem man

  J1   =       (J+ + J) / 2  
  J2   =   −i (J+ − J) / 2  

verwendet. Diese Matrizen sind in dieser Basis nicht diagonal, da sie nicht mit J3 vertauschen. Man kann aber jederzeit zu einer neuen Basis übergehen, in der dann beispielsweise J1 diagonal ist (nicht aber J2 und J3). Es ist in diesem Sinne willkürlich, welches der Ji wir diagonal wählen.

Zur Übung schauen wir uns die Matrizen für j = 0, 1/2 und 1 an.


Der Fall   j = 0 :

Bei j = 0 ist die Sache ganz einfach: m muss auch gleich 0 sein, d.h. der Darstellungsraum ist eindimensional und die Matrizen sind einfach gleich der komplexen Zahl Null. Wir haben also eine triviale Darstellung der Lie-Algebra vor uns.


Der Fall   j = 1/2 :

Hier ist die Sache schon interessanter, denn m kann die beiden Werte 1/2 und −1/2 annehmen. Der Darstellungsraum ist also zweidimensional mit den beiden Basisvektoren   |1/2, 1/2ñ   und   |1/2, −1/2ñ   . In dieser Basis erhalten wir für die Ji-Matrizen, die wir mit   D1/2(Ji )   bezeichnen wollen:

  D1/2(Ji )   =   σi / 2       mit den drei Paulimatrizen von oben:

 


Der Fall   j = 1 :

Der Darstellungsraum ist jetzt dreidimensional, denn m kann die Werte 1, 0 und −1 annehmen und wir haben die drei Basisvektoren   |1, 1ñ  ,   |1, 0ñ   und   |1, −1ñ   . In dieser Basis erhalten wir für die Ji-Matrizen   D1(Ji )   :


D1(J1 )   =   1/√2   æ
ç
ç
ç
è
0
1
0
1
0
1
0
1
0
ö
÷
÷
÷
ø

D1(J2 )   =   −i /√2   æ
ç
ç
ç
è
0
1
0
−1
0
1
0
−1
0
ö
÷
÷
÷
ø

D1(J3 )   =     æ
ç
ç
ç
è
1
0
0
0
0
0
0
0
−1
ö
÷
÷
÷
ø

Man kann diese Darstellung zu j = 1 mit der definierenden Darstellung   i (Aj)ik   =   εijk   von oben in Beziehung setzen, indem man die Matrix A3 diagonalisiert. Die Basisvektoren ei des R3 lassen sich so in die neue Basis der   |1, mñ   umrechnen. Man findet:

  |1, 0ñ   =   e3
  |1, 1ñ   =   −1/√2   ( e1 + i e2 )
  |1, −1ñ   =   1/√2   ( e1 − i e2 )

Die Darstellung der Lie-Algebra zu j=1 lässt sich also durch einen Basiswechsel in die definierende Ausgangs-Darstellung der Lie-Algebra umrechnen, die wir aus der Drehgruppe ganz oben erhalten haben.


Darstellungen der Drehgruppe und ihrer Überlagerungsgruppe:

Da SU(2) kompakt und einfach zusammenhängend ist, lässt sich jede ihrer Darstellungen als Exponentialreihe schreiben, wobei im Exponenten eine Darstellung der Lie-Algebra steht. Die hermiteschen Darstellungen der Lie-Algebra ergeben also über die Exponentialreihe sofort alle unitären Darstellungen von SU(2).

Tatsächlich ist es so, dass man mit den unitären Darstellungen sogar alle Darstellungen der Gruppe SU(2) erfasst, denn man kann zeigen (siehe z.B. Andreas Gastel: Kompakte Lie-Gruppen, Kapitel 2.2, S.28):

Jede Darstellung einer kompakten Gruppe durch endlich-dimensionale komplexe (bzw. reelle) Matrizen lässt sich durch Basiswechsel in eine Darstellung durch unitäre (bzw. orthogonale) Matrizen umrechnen.

Das wird später bei Hinzunahme der Boosts anders werden, denn dann wird die entsprechende Gruppe (Galileigruppe oder Poincaregruppe) nicht-kompakt sein.

Die unitären Darstellungen von SU(2) bilden für festes j jeweils selbst eine Matrixgruppe mit derselben Lie-Algebra wie SU(2). Daher befinden sich unter ihnen auch alle Gruppen (mit ihren Darstellungen), zu denen SU(2) die Überlagerungsgruppe ist, denn alle Gruppen mit derselben Lie-Algebra wie SU(2) haben SU(2) als universelle Überlagerungsgruppe. Dazu gehört die Drehgruppe mit ihren Darstellungen.

Schreiben wir die Darstellungen explizit auf:

Darstellungen von SU(2):

Jede Darstellung   D j(Ji )   der Lie-Algebra der Drehgruppe ergibt über die Exponentialreihe eine Darstellung   D j(u)   der Überlagerungsgruppe SU(2) :

  D j(u)   :=   e−i wk D j(Jk )

mit u aus SU(2) und Summe über k im Exponenten. Die Matrixelemente von   D j(u)   sind

  D jmm' (u)   =   á j m | e−i w J | j m' ñ   =   á j m | Tu | j m' ñ       mit

  Tu | j m' ñ   =   ∑m   | j m ñ   á j m | Tu | j m' ñ   =   ∑m   | j m ñ   D jmm' (u)

mit   w J = wk Jk   (Summe über k) und   Tu = e−i w J   . In der Summe läuft m von −j bis j.

Dabei werden alle Darstellungen von SU(2) und somit alle Darstellungen der Drehgruppe erfasst. Die Darstellungen sind irreduzibel, d.h. sie enthalten keine invarianten Unterräume (die Matrizen zerfallen also nicht in kleinere Unter-Blöcke) -- jeder Vektor zu einem festen j lässt sich aus jedem anderen Vektor zu diesem j durch eine passende Matrix   D j(u)   erreichen. Die Dimension der Darstellungsräume ist wie bei den Matrizen der Lie-Algebra gleich 2j+1 , d.h.   D j(u)   ist eine (2j+1) mal (2j+1) -Matrix.


Der Fall   j = 0 :

Der Fall j = 0 ist wieder trivial, denn aus   D j(Jk ) = 0   folgt   D j(u)   =   1   .


Der Fall   j = 1/2 :

Für j = 1/2 spricht man auch vom Spin eines Zustandes. Die   D1/2(u)   sind speziell-unitäre 2-mal-2-Matrizen, d.h. die Darstellung von SU(2) ergibt für j = 1/2 gerade SU(2) selbst:

  D1/2(u)   =   u  

Man kann die Exponentialreihe explizit aufsummieren und erhält:

  u   =   e−i/2 σ(w)   =   cos(ω/2) 1   −   i σ(e) sin(ω/2)

mit   w = ω e   , d.h.   ω = |w|   und   e = w / |w|   sowie   σ(x)   =   xi σi mit Summe über i (siehe oben). Die Rechnung findet man z.B. in D. Schütte: Darstellungstheorie der Drehgruppe, Kapitel 10, Seite 51.

Diese Darstellung zeigt sofort, dass bei einer 360-Grad-Drehung (also ω' = ω + 2π ) sich   u   in   −u   verwandelt. Erst nach einer zweiten 360-Grad-Drehung erreicht man wieder das alte   u   . Dies hatte bereits die Formel   u σ(x) u+   =   σ(R x)   gezeigt, die wir weiter oben kennengelernt haben. Diese Formel, die den Zusammenhang zwischen SU(2) und der Drehgruppe herstellt, können wir natürlich mit den expliziten Formeln für u und R nun auch nachrechnen. Wir verzichten hier darauf -- siehe z.B. D. Schütte: Darstellungstheorie der Drehgruppe, Kapitel 10. Übrigens: Die Formeln für die Drehung um die z-Achse in Kapitel 4.6 erhält man, indem man oben e3 für e einsetzt (vielleicht bis auf ein irrelevantes Vorzeichen).


Der Fall   j = 1 :

Für j = 1 kann man durch den Basiswechsel, den wir bei der Lie-Algebra-Darstellung zu j = 1 gesehen haben, die Matrix   D1(u)   in die Drehmatrix R von ganz oben umrechnen. Die Darstellung zu j = 1 entspricht also der Drehgruppe selbst.


Der allgemeine Fall:

Man kann zeigen, dass nur die Darstellungen zu ganzzahligem j eine unitäre Darstellung der Drehgruppe bilden. Die Darstellungen zu halbzahligem j bilden dagegen eine unitäre Darstellung der Überlagerungsgruppe SU(2) und damit eine Strahldarstellung der Drehgruppe, aber keine unitäre Darstellung der Drehgruppe. Den Grund kennen wir bereits: erst zwei Drehungen um 360 Grad ergeben bei halbzahligem j wieder den Ausgangszustand, eine Drehung um 360 Grad führt dagegen zu einem Vorzeichenwechsel.

In der klassischen Physik spielen nur Drehungen und deren Darstellungen eine Rolle, nicht aber Darstellungen der Überlagerungsgruppe. Bei einer Bahnkurve oder einem elektrischen Feld darf eine 360-Grad-Drehung keinen Vorzeichenwechsel hervorrufen. Das bedeutet aber auch: Für Zustände mit halbzahligem Spin gibt es keinen klassischen Grenzfall. Der halbzahlige Spin eines Teilchens ist ein rein quantenmechanisches Phänomen, während man bei ganzzahligem j den Grenzübergang zum Drehimpuls hinbekommt (siehe unten). Daher hat auch die Veranschaulichung des Spins als innerer Drehimpuls seine Tücken -- wie soll sich ein punktförmiges strukturloses Teilchen um seine Achse drehen?

Ein interessanter Punkt, auf den ich in Steven Weinbergs Standardwerk The Quantum Theory of Fields Vol. 1 gestoßen bin, sind die Superauswahlregeln. Wenn man voraussetzt, dass SU(2) eine quantenmechanische Symmetriegruppe ist, so darf man Zustände mit halbzahligem und mit ganzzahligem Spin nicht überlagern, denn eine 360-Grad-Drehung würde das relative Vorzeichen zwischen ihnen ändern, und das wäre über Interferenzexperimente messbar. Eine 360-Grad-Drehung würde damit die Situation messbar beeinflussen und dann wäre die Drehgruppe keine Symmetriegruppe mehr. Man muss also fordern, dass es nicht möglich ist, Zustände mit halb- und mit ganzzahligem Spin im Experiment zu überlagern (man nennt dies eine Superauswahlregel). Das entspricht tatsächlich -- zumindest bis heute -- den experimentellen Tatsachen.

Falls nun aber doch solche Zustände gefunden werden, was dann? Dann darf man unitäre Darstellungen von SU(2) nicht mehr als Symmetriegruppe auf dem Hilbertraum verwenden, sondern man muss projektive Darstellungen der Drehgruppe betrachten, bei denen die Phase nur noch von den miteinander kombinierten Drehungen abhängt, nicht aber von der Halbzahligkeit des Spins. Eine 360-Grad-Drehung muss für die überlagerten Zustände zur selben Phase führen, damit diese Phase nicht messbar ist. Wir sind in Kapitel 4.6 bereits kurz darauf eingegangen.


Ausreduktion von Produktdarstellungen:

Es kommt in der Physik häufig vor, dass man ein quantenmechanisches System betrachtet, dass aus mehreren Subsystemen besteht. Ein Beispiel sind quantenmechanische Zustände aus mehreren Teilchen. Dabei spielen Produktzustände eine Rolle. Für Drehungen werden z.B. Zustände wichtig, die sich als

  | j m ñ ο | j' m' ñ

oder alternativ als   | j m , j' m' ñ   schreiben lassen. Man spricht von einem Tensorprodukt. Man kann dieses Tensorprodukt mathematisch sauber definieren (siehe z.B. Wikipedia: Tensorprodukt sowie D. Schütte: Darstellungstheorie der Drehgruppe, Kapitel 8). Die wichtigste Eigenschaften sind:

Ein Beispiel: Das Tensorprodukt zwischen Funktionen kann man so definieren:

  ( ψ ο φ ) (x,y)   :=   ψ(x) φ(y)

Dabei ist   ψ ο φ   eine Funktion, die von zwei Variablen abhängt.

Zurück zu den Zuständen   | j m ñ ο | j' m' ñ   . Die Schreibweise bedeutet, dass bei einer Drehung beide Zustände zugleich mit dem entsprechenden Drehoperator gedreht werden:

  Tu   | j m ñ ο | j' m' ñ     =     | j n ñ ο | j' n' ñ   Djnm(u)   Dj'n'm'(u)  

mit Summe über n und n' . Man kann die Zahlenpaare (j,j'), (n,n') und (m,m') wieder als Doppelindices ansehen, denn sie indizieren ja die Basiszustände im Produktraum. Oben wird gleichsam über den Doppelindex (n,n') summiert. Entsprechend kann man das Produkt   Djnm(u)   Dj'n'm'(u)   auch als Matrixelement einer Matrix   D(j,j')(n,n') (m, m')(u)   ansehen. Diese Matrix stellt die Überlagerungsgruppe SU(2) im Produktraum dar, der auch ein Vektorraum (Hilbertraum) ist.

Nun haben wir oben gezeigt, dass man jede Darstellung von SU(2) auf einem Hilbertraum durch Matrizen DJ(u) auf Unterräumen des Hilbertraums darstellen kann, wobei diese Unterräume Eigenräume zu J2 mit Eigenwert J(J+1) sind (wir schreiben J hier groß). Entsprechend muss man auch den Produktraum in solche Unterräume zerlegen können (man spricht von der Ausreduktion der Darstellung). Man muss also einen Basiswechsel

  | J M ñ   :=     | j m, j' m' ñ   á j m, j' m' | J M ñ

im Produktraum finden können, so dass die Matrix mit Matrixelementen   D(j,j')(n,n') (m, m')(u)   in dieser neuen Basis in einzelne Blöcke zerfällt, die jeweils innerhalb der Unterräume zu festem J wirken und die den Matrizen   DJ(u)   entsprechen (siehe z.B. M.Stingl: Quantentheorie, Kap. 14.3).

Die komplexen Zahlen   á j m, j' m' | J M ñ   bezeichnet man als Clebsch-Gordan-Koeffizienten. Sie sind die Komponenten der neuen Basisvektoren in der alten Produktbasis.

Physiker verwenden hier eine praktische Schreibweise, die auch den Bezug zur Lie-Algebra klar macht. Man nimmt einfach den Drehimpulsoperator aus dem Raum der   | j m ñ   (nennen wir ihn J (1) ) und den aus dem Raum der   | j' m' ñ   (nennen wir ihn J (2) ) und definiert im Produktraum den Operator

  J   :=   J (1) + J (2)     mit
  J   | j m ñ ο | j' m' ñ   :=     J (1) | j m ñ   ο   | j' m' ñ     +     | j m ñ   ο   J (2) | j' m' ñ

J (1) wirkt also nur auf den ersten Zustand, J (2) nur auf den zweiten. So ist beispielsweise

  J3   | j m ñ ο | j' m' ñ     =    
    =     J3 (1) | j m ñ   ο   | j' m' ñ     +     | j m ñ   ο   J3 (2) | j' m' ñ     =    
    =     m | j m ñ   ο   | j' m' ñ     +     | j m ñ   ο   m' | j' m' ñ     =    
    =     (m + m')   | j m ñ ο | j' m' ñ

d.h.   | j m ñ ο | j' m' ñ   ist ein Eigenzustand von   J3   zum Eigenwert   M = m + m'   .

Da die Operatoren J (1) und J (2) miteinander vertauschen, kann man leicht überprüfen, dass die Komponenten von J eine Darstellung der Lie-Algebra von SU(2) auf dem Produktraum sind. Daher muss   Tu   =   e−i w J   eine Darstellung von u auf dem Produktraum sein und es ist

  D(j,j')(n,n') (m, m')(u)   =  

  =   á j n, j' n' | e−i w J | j m, j' m' ñ   =  

  =   á j n, j' n' | e−i w (J (1) + J (2)) | j m, j' m' ñ   =  

  =   á j n | e−i w J (1) | j m ñ   á j' n' | e−i w J (2) | j' m' ñ   =  

  =   Djnm(u)   Dj'n'm'(u)

d.h. die Schreibweise reproduziert genau das gewünschte Verhalten für die Matrixelemente. Damit die Matrix in Blöcke zerfällt, muss der neue Basisvektor   | J M ñ   :=     | j m, j' m' ñ   á j m, j' m' | J M ñ   Eigenvektor zu J2 und J3 sein, denn dann haben wir wie gewünscht

  D JMM' (u)   =   á J M | e−i w J | J' M' ñ   δJ J'

Bezüglich J3 ist aber bereits   | j m, j' m' ñ   Eigenvektor mit Eigenwert   M = m + m'  , wie wir oben gesehen haben, d.h. das ist problemlos. Anders sieht das bei J2 aus -- die entsprechende Matrix muss man also diagonalisieren, um die Eigenwerte und Eigenvektoren zu berechnen. Auf diese Weise erhält man die Clebsch-Gordan-Koeffizienten des Basiswechsels.

Ein letzter Punkt dazu: Welche J können sich dabei aus j und j' ergeben? Da   M = m + m'   ist, muss als maximales J der Wert  , J = j + j'   vorkommen. Man kann zeigen, dass alle J von   j + j'   bis   |j − j'|   vorkommen. Details siehe beispielsweise M.Stingl: Quantentheorie, Kap. 14.1 .


Drehungen und Translationen als gemeinsame Symmetriegruppen:

Über die Drehgruppe und ihre projektiven Darstellungen wäre damit alles gesagt. Oft findet man in der Literatur aber konkrete Darstellungen der Drehgruppe auf ortsabhängigen Funktionen, beispielsweise Kugelflächenfunktionen. Eine weitere bekannte Formel ist die Darstellung des Drehimpulsoperators   L = x × p   , mit der man in der Quantenmechanik oft startet (um dann später festzustellen, dass dieser Operator nur für ganzzahlige Drehimpulse greift).

Um auf systematischem Weg dorthin zu gelangen, muss man Drehungen und Translationen als gemeinsame Symmetriegruppen betrachten. Im vorherigen Kapitel 4.7 haben wir gesehen, dass man bei den Translationen ganz von alleine auf Impulsamplituden f(p) und deren Fouriertransformierte ψ(x) stößt. Wenn wir nun die Drehungen hinzunehmen, werden wir untersuchen können, wie sich diese auf f(p) und ψ(x) auswirken und damit (Strahl)-Darstellungen der Drehgruppe auf diesen Funktionen erhalten. Die Vorgehensweise ist dabei vollkommen allgemein, gilt also auch in der relativistischen Quantenfeldtheorie.

Schauen wir uns an, ob Drehungen und Translationen vertauschen. Dazu betrachten wir eine Drehung R(w) aus SO(3) und eine Translation g(a) mit   g(a) x = x + a . Dann ist

  R(w) g(a) x   =   R(w) (x + a)   =   R(w) x + R(w) a   =   g(R(w) a) R(w) x

Translationen und Drehungen vertauschen also nicht miteinander. Um den Kommutator auszurechnen, schreiben wir diese Gleichung noch etwas um:

  R(w) g(a) R(w)−1   =   g(R(w) a)

Aus Kapitel 4.6 wissen wir, dass für den Kommutator von beliebigen Generatoren einer Gruppe ganz allgemein gilt:

  [Ai, Aj]   =   d/ds|s=0 ei s Aj   (i Ai)   e− i s Aj   =   d/ds|s=0 d/dt|t=0 ei s Aj   ei t Ai   e− i s Aj  

Insgesamt haben wir nun 6 verschiedene Generatoren Ai, nämlich 3 für die Translationen und 3 für die Drehungen. Um Verwirrung zu vermeiden, wollen wir für die Generatoren der Translationen hier Bi schreiben. Also ist

  [Bi, Aj]   =  
  =   d/ds|s=0   d/dt|t=0   ei s Aj   ei t Bi   e− i s Aj   =  
  =   d/ds|s=0   d/dt|t=0   R(s ej)   g(t ei)   R(s ej)−1   =  

... wir verwenden   R(w) g(a) R(w)−1   =   g(R(w) a)

  =   d/ds|s=0   d/dt|t=0   g(R(s ej) t ei)   =  
  =   d/ds|s=0   g(R(s ej) ei)   =  
  =   g(G(ej) ei)   =  
  =   g(ej × ei)   =  
  =   − εijk g(ek)   =  

... wir verwenden   g(ek)   =   d/dt|t=0 g(t ek)   =   d/dt|t=0 ei t Bk   =   i Bk

  =   − εijk i Bk

Natürlich kann man alternativ diese Gleichung auch mit Hilfe der Matrixdarstellung der Gruppen und damit der Generatoren auf direktem Weg ausrechnen. Für eine Strahldarstellung muss also gelten:

  [T(Bi), T(Aj)]   =   − εijk i T(Bk)   +   i Cij 1

wobei die Zentralladungen Cij wieder zur Phase in der projektiven Darstellung der Dreh-Translations-Gruppe führen. Man könnte nun meinen, dass man diese Zentralladungen ganz analog zu oben loswerden kann. Ganz so einfach ist es aber nicht, denn   [T(Bi), T(Aj)]   muss nicht antisymmetrisch in den Indices i und j sein, anders als   [T(Ai), T(Aj)]   . Schließlich ist Bi nicht gleich Ai .

Schauen wir uns das insgesamt etwas genauer an. Wie bisher schreiben wir dazu wieder   Ji   =   − T(Ai)   und   Pi   :=   − T(Bi)   (siehe Kapitel 4.7) und haben damit für die Strahl-Darstellung der Lie-Algebra:

  [Ji, Jj]   =   i εijk Jk
  [Pi, Pj]   =   −i εijk Ck 1
  [Pi, Jj]   =   i εijk Pk   −   i Cij 1

Dass die Zentralladungen in der ersten Gleichung wegdefiniert werden können, das hatten wir bereits weiter oben gesehen (unter der Überschrift: keine Zentralladungen).
Die zweite Gleichung kennen wir aus Kapitel 4.7.
Die dritte Gleichung haben wir gerade eben neu kennengelernt.

Wir werten nun die sogenannten Jacobi-Identitäten aus, die jeder Kommutator erfüllt. Beginnen wir mit

  [Pi, [Pj, Jk]]   +   [Jk, [Pi, Pj]]   +   [Pj, [Jk, Pi]]   =   0

Zentralladungen in den inneren Kommutatoren können wir weglassen denn sie fallen in den äußeren Kommutatoren sowieso weg. Damit fällt der zweite Term komplett weg und wir erhalten (mit Summe über doppelte Indices):

  [Pi, i εjkl Pl]   +   [Pj, −i εikl Pl]   =   0

und mit   [Pi, Pj]   =   −i εijk Ck 1   dann

  i εjkl (−i) εilm Cm   −   i εikl (−i) εjlm Cm   =   0

was wir vereinfachen können zu

  (εjkl εilm   −   εikl εjlm)   Cm   =   0

Wir können nun die Terme mit i = k aufsummieren (man sagt auch, man kontrahiert mit δik). Dabei fällt der zweite Tem weg und wir erhalten   εjil εilm   Cm   =   0   . Umsortieren ergibt   εilj εilm   Cm   =   0   . Für vorgegebene i und l wählen wir j so, dass   εilj = 1   ist und erhalten   εilm   Cm   =   0   . Das ist eine schiefsymmetrische Matrix analog zu G(w) von oben. Sie ist nur Null, wenn   Cm   =   0   ist. Bei zusätzlicher Drehsymmetrie verschwinden also die Zentralladungen in den Kommutatoren der Impulse, d.h. die Translationen werden durch eine unitäre Darstellung auf dem Hilbertraum ohne projektive Phase wiedergegeben. Genau das hatten wir im letzten Kapitel bereits verwendet (aus der Lie-Algebra der Translations-Generatoren alleine folgt das nicht, wie wir in Kapitel 4.7 gesehen haben). Erst die Hinzunahme der Drehungen bewirkt, dass die Phase in der Darstellung der Translationen generell unnötig wird. Entsprechend kann auch kein äußeres Magnetfeld mehr beschrieben werden, das ja die Drehsymmetrie zerstören würde.

Für die Cij schauen wir uns die folgende Jacobi-Identität an:

  [Pi, [Jj, Jk]]   +   [Jk, [Pi, Jj]]   +   [Jj, [Jk, Pi]]   =   0

Wieder fallen Zentralladungen in den inneren Kommutatoren weg und wir erhalten (mit Summe über doppelte Indices):

  [Pi, i εjkl Jl]   +   [Jk, i εijl Pl]   +   [Jj, −i εikl Pl]   =   0

Wenn wir hier die Terme mit k = j aufsummieren, würde der erste Term wegfallen und es bliebe   [Jj, i εijl Pl]   +   [Jj, −i εijl Pl]   =   0   übrig. Da diese Gleichung immer stimmt, hilft sie uns nicht weiter. Also versuchen wir es mit Summation über k = i (hier fällt der dritte Term weg):

  [Pi, i εjil Jl]   +   [Ji, i εijl Pl]   =   0     oder etwas anders geschrieben:

  i εjil ( [Pi, Jl]   +   [Pl, Ji] )   =   0

Der Term in der Klammer ist symmetrisch in i und l. Dagegen ist εjil antisymmetrisch in i und l. Die Summe über i und l für gegebenes j ist also immer Null, d.h. auch diese Gleichung ist trivial erfüllt.

Ich habe zwar in der Literatur bisher dazu nichts gefunden, aber es sieht so aus, als ob die bisherigen Informationen nicht ausreichen, um die Zentralladungen Cij in   [Pi, Jj]   =   i εijk Pk   −   i Cij 1   wegzudiskutieren. Betrachtet man ausschließlich Translationen und Drehungen als Symmetrien, so kann es offenbar zu projektiven Phasen kommen, wenn man eine Drehung und eine Translation nacheinander ausführt (bei zwei Drehungen oder zwei Translationen nacheinander kann man dagegen projektive Phasen wegdefinieren, wie wir gesehen haben). Ob es physikalische Anwendungen dieser Möglichkeit gibt (analog zum Magnetfeld bei Translationen wie im vorhergehenden Kapitel) ist mir leider nicht bekannt. Es müsste sich um ein System handeln, bei dem Boosts keine Symmetrie darstellen, bei dem es also ein ausgezeichnetes Inertialsystem gibt.

Nimmt man Boosts hinzu, so kann man nachrechnen, dass man die Zentralladungen in   [Pi, Jj]   loswerden kann, so dass man eine echte Darstellung der obigen Lie-Algebra erreichen kann. Die konkrete Rechnung findet man (in relativistischer Notation) in Steven Weinbergs Buch The Quantum Theory of Fields, Vol. 1, Kapitel 2.7.. In diesem Sinn ignorieren wir im Folgenden Zentralladungen in   [Pi, Jj]   und betrachten nur die Darstellung

  [Ji, Jj]   =   i εijk Jk
  [Pi, Pj]   =   0
  [Pi, Jj]   =   i εijk Pk

Für die unitäre Darstellung der Gruppenelemente folgt aus   R(w) g(a)   =   g(R(w) a) R(w)   die Gleichung

  e−i w J   e−i a P   =   e−i (R(w) a) P   e−i w J

die wir natürlich auch mit Hilfe der Lie-Algebra etwas mühsam nachrechnen können. Da R(w) eine Drehmatrix ist, gilt   (R(w) a) P   =   a (R(w)−1 P)   und somit

  e−i w J   e−i a P   =   e−i a (R(w)−1 P)   e−i w J

Abgeleitet nach den einzelnen ai ergibt das

  e−i w J   P   =   (R(w)−1 P)   e−i w J

und multipliziert mit R(w) dann

  e−i w J   (R(w) P)   =   P   e−i w J

Damit können wir nun angeben, wie sich eine Drehung auf einen Eigenvektor   |pñ   des Impulsoperators auswirkt:

  P   e−i w J   |pñ   =   e−i w J   (R(w) P)   |pñ   =   e−i w J   (R(w) p)   |pñ   =   (R(w) p)   e−i w J   |pñ

d.h. der gedrehte Zustand   e−i w J   |pñ   ist ein Eigenzustand zum Impulsoperator P zum Eigenwert   (R(w) p)   . Der Impuls des Zustandes wurde also gedreht -- genau das entspricht unserer Anschauung aus der klassischen Mechanik! Man könnte nun versucht sein, deshalb   e−i w J   |pñ   =   |R(w) pñ   zu schreiben. Doch Vorsicht: Wir wissen, dass eine 360-Grad-Drehung zu einem Vorzeichenwechsel führen kann.


Spin und Bahndrehimpuls, Spinoren:

Was also ist zu tun? Wir müssen die Möglichkeit berücksichtigen, dass es neben dem Impuls weitere Freiheitsgrade des Systems gibt, die sich bei einer Drehung verändern. Man könnte also allgemein   | p, σ ñ   mit einem Sammelindex σ schreiben, der diese zusätzlichen Freiheitsgrade berücksichtigt. Allgemein könnte σ sogar kontinuierlich sein (beispielsweise wenn σ den Relativimpuls zweier freier Teilchen darstellt -- dann wäre p der Gesamtimpuls der beiden Teilchen). Wir wollen nun an dieser Stelle davon ausgehen, dass für einen Einteilchen-Zustand ein diskretes σ ausreicht (das definiert den Begriff Einteilchen-Zustand letztlich). Achtung: Wir haben nicht von einem Elementarteilchen gesprochen! Auch ein gebundenes System wie ein Wasserstoffatom kann als ein Teilchen angesehen werden, zumindest in der relativistischen Quantentheorie. Siehe dazu auch Steven Weinberg: The Quantum Theory of Fields Vol. 1, Kapitel 2.5 .

Wenn wir von einem bestimmten Einteilchenzustand   | p, σ ñ   ausgehen, so sollten sich alle dazu gedrehten Einteilchenzustände desselben Teilchens durch Anwendung des Drehoperators   e−i w J   daraus gewinnen lassen. Zustände mit gedrehtem Impuls, die sich so nicht erreichen lassen, gehören zu einem anderen Teilchen bzw. Teilchentyp. Die Zustände zu einem Teilchen bilden also bei Drehungen einen irreduziblen Raum.

All diese Forderungen können wir einhalten, indem wir den Drehimpulsoperator   J   folgendermaßen aufspalten:

  J   =   L + S

wobei L mit S kommutiert und die Li und Si jeweils unabhängig voneinander die Drehimpulsalgebra erfüllen. Wichtig: S soll mit P kommutieren, d.h. alleine L besitzt noch nicht-triviale Kommutatoren mit P:

  [Pi, Lj]   =   i εijk Pk
  [Pi, Sj]   =   0

Wir nennen S den Spinoperator und L den Bahndrehimpuls-Operator (warum, wird noch klar werden). Insgesamt ergibt sich so wieder   [Pi, Jj]   =   i εijk Pk   . Dabei soll L für die Drehung des Impulses zuständig sein, während sich S um den zweiten Freiheitsgrad σ kümmern soll.

Vielleicht fällt die Ähnlichkeit zum Operator   J   :=   J (1) + J (2)   auf, den wir oben im Tensorproduktraum zweier Darstellungsräume definiert haben. Genauso ist es auch hier: Wir suchen eine Darstellung der Drehungen auf einem Tensorproduktraum, bei dem nur einer der beiden Räume mit den Translationen und dem Impulsoperator zusammenhängt.

Da S die Drehimpulsalgebra erfüllt, kann man wieder Eigenzustände zu S2 und S3 angeben -- nennen wir die Eigenwerte s und ms und bezeichnen s als Spin. Außerdem kommutiert S mit P , d.h. auch p kann zugleich Eigenwert sein. Wir nennen diese Zustände also

  | p s ms ñ

Der Index σ entspricht also dem Indexpaar s und ms . Schauen wir uns die Drehung dieses Zustandes an:

  e−i w J   | p s ms ñ   =   e−i w L   e−i w S   | p s ms ñ   =   e−i w L   ∑ms'     | p s ms' ñ   Dsms' ms (u)

Analog zu oben können wir wieder zeigen, dass   e−i w L   | p s ms' ñ   ein Eigenvektor von P zum Eigenwert   (R(w) p)   ist (wir brauchen dazu nur L statt J in der Rechnung zu schreiben, denn L bestreitet den Kommutator mit P ja alleine -- S spielt im Kommutator mit P schließlich keine Rolle). Wir definieren nun:

  e−i w L   | p s ms' ñ   =:   | R(w) p , s ms' ñ  

Auf diese Weise werden die Vektoren zu gleichem s und ms' , aber verschieden gedrehten Impulsen miteinander in Beziehung gesetzt. Diese Definition entspricht unserer Absicht, zwei voneinander unabhängige Freiheitsgrade (Impuls und Spin) zu beschreiben, die sich beide bei Drehungen verändern, wobei L für die Impulsdrehung und S für die Spindrehung zuständig ist. Setzen wir dies oben ein, so erhalten wir:

  e−i w J   | p s ms ñ   =     ∑ms'   | R(w) p , s ms' ñ   Dsms' ms (u)  

Für den Spinindex haben wir damit die gewünschte irreduzible Darstellung.

Ein Beispiel: Für s = 1/2 führt eine 360-Grad-Drehung (also   u = − 1   und   R(2πe) = 1   ) zu     Dsms' ms (−1)   =   − δms' ms   und somit zu

  e−i 2πe J   | p s ms ñ   =     ∑ms'   | R(2πe) p , s ms' ñ   Dsms' ms (−1)   =   − | p s ms ñ

d.h. der Spin garantiert, dass eine 360-Grad-Drehung zu einem Vorzeichenwechsel führen kann.

Wir wollen nun wie im vorherigen Kapitel wieder Impulsamplituden einführen und deren Fouriertransformation betrachten. Diesmal müssen wir allerdings nicht nur verschiedene Impulse überlagern, sondern auch verschiedene Werte von ms, um einen allgemeinen Zustand (mit festem s) zu konstruieren. Verschiedene Spinwerte s wollen wir hier nicht überlagern. Die Überlagerung von halb- und ganzzahligen s ist nach der Super-Auswahlregel sowieso verboten (siehe oben).

  |ψs ñ   =   ∑ms   ∫ d3p   fs ms(p)   | p s ms ñ

(die Summe schreiben wir hier ausnahmsweise einmal explizit hin). Wir gehen nun vollkommen analog zu Kapitel 4.7 vor, um Drehungen   Tu = e−i w J   auf den Impulsamplituden darzustellen:

  Tu   |ψs ñ   =  
  =   ∑ms   ∫ d3p   fs ms(p)   Tu   | p s ms ñ   =  
  =   ∑ms ms'   ∫ d3p   fs ms (p)     | R(w) p , s ms' ñ   Dsms' ms (u)   =  

Wir substituieren nun die Integrationsvariable   p' := R(w) p   und lassen den Strich wieder weg. Außerdem vertauschen wir die Bezeichnungen für ms' und ms:


  =   ∑ms' ms   ∫ d3p   fs ms' (R(w)−1 p)     | p s ms ñ   Dsms ms' (u)   =  
  =:   ∑ms   ∫ d3p   [Tu f ]s ms(p)   | p s ms ñ

mit

  [Tu f ]s ms(p)   :=   ∑ms'   Dsms ms' (u)   fs ms' (R(w)−1 p)  

Wir können die Schreibweise noch etwas vereinfachen, indem wir den Spaltenvektor   fs(p)   mit Komponenten   fs ms(p)   einführen und die obige Gleichung als Matrixgleichung auffassen:

  [Tu f ]s (p)   :=   Ds(u)   fs(R(w)−1 p)  

mit fest vorgegebenem Spin s. Einen Vektor, der sich bei Drehungen so verhält, bezeichnet man als Spinor. Man spricht auch von der Spinordarstellung der Drehgruppe. Anschaulich besagt die Gleichung, dass der gedrehte Spinor für den gedrehten Impuls gleich dem alten Spinor für den ungedrehten Impuls ist, zusätzlich multipliziert mit der SU(2)-Matrix   Ds(u)   , die für die Drehung des Spins zuständig ist.

Natürlich können wir durch Fouriertransformation analog zu Kapitel 4.7 von der Impulsvariable p zu einer Ortsvariable x übergehen.

  ψs(x)   :=   N   ∫ d3p   fs(p)   ei p x

Dabei sind fs und ψs jetzt Spinoren mit 2s+1 Komponenten. Analog zu Kapitel 4.7 definieren wir die gedrehte Fouriertransformierte als:

  [Tu ψ]s(x)   :=  
  =   N   ∫ d3p   [Tu f]s(p)   ei p x   =  
  =   N   ∫ d3p   Ds(u)   fs(R(w)−1 p)   ei p x   =  

Wir substituieren die Integrationsvariable   p' := R(w)−1 p   und lassen den Strich wieder weg.

  =   N   ∫ d3p   Ds(u)   fs(p)   ei (R(w) p) x   =  
  =   N   ∫ d3p   Ds(u)   fs(p)   ei p (R(w)−1 x)   =  
  =   Ds(u)   ψs(R(w)−1 x)

Der Spinor ψs transformiert sich bei Drehungen also vollkommen analog zu fs . Das entspricht der Anschauung, dass sich bei Drehungen Ort und Impuls vollkommen gleich verhalten, nämlich wie ein Vektor. Halten wir fest:

  [Tu ψ]s (x)   =   Ds(u)   ψs(R(w)−1 x)  

Häufig beginnt man in der Literatur sogar mit dieser Darstellung als definierende Darstellung von SU(2) auf Funktionen. Bei uns ist diese Darstellung ganz natürlich so nebenbei herausgekommen, wenn wir Translationen und Drehungen als gemeinsame Symmetriegruppen in der Quantentheorie betrachten (und mögliche projektive Phasen ignorieren, da sie bei der Poincaregruppe später sowieso nicht auftreten können).

In Kapitel 4.7 sind wir nun in einem nächsten Schritt hingegangen und haben eine Darstellung des Impulsoperators auf diesen Funktionen berechnet. Das können wir hier analog für den Drehimpulsoperator machen. Für den Spinoperator können wir uns das allerdings schenken, denn das Ergebnis wissen wir bereits von der Darstellung der Lie-Algebra von oben: Er wird durch 2s+1 -dimensionale Matrizen   Ts(Sk)   dargestellt, wobei wir Sk statt Jk geschrieben haben.

Kommen wir also zum Drehimpulsoperator L, der nach unserer Formel   e−i w L   | p s ms' ñ   =   | R(w) p , s ms' ñ   für die Drehung des Impulses bzw. nach Fouriertransformation für die Drehung des Ortsvektors zuständig ist. Entsprechend definieren wir

  [L ψ] (x)   :=  
  =   i   d/dw   [e−i w L ψ] (x)   | w = 0   =  
  =   i   d/dw   ψ(R(w)−1 x)   | w = 0   =  
  =   i   d/dw   ψ(e−G(w) x)   | w = 0   =  
  =   i   d/dw   ψ(x − (w × x) + ... )   | w = 0   =  
  =   i   d/dw   ψ(x × w)   | w = 0   =  
  =   i   d/dw   ψ(G(x) w)   | w = 0   =  
  =   i   ( d/dwi   ψ(G(x) w) )   =  
  =   i   ( [d/dx j ψ(x)]   d [G(x) w] j /dwi )   =  
  =   i   ( [d/dx j ψ(x)]   G(x) ji )   =  
  =   i   ( [d/dx j ψ(x)]   εjki xk )   =  
  =   −i   ( εikj xk [d/dx j ψ(x)] )   =  
  =   −i   x × d/dx ψ(x)   =  
  =     x × P ψ(x)

mit Summation über doppelte Indices, wobei die äußere Klammer beim Übergang zur Indexschreibweise den Spaltenvektor mit den Komponenten in der Klammer bedeuten soll. In der letzten Zeile haben wir die Darstellung des Impulsoperators   [P ψ] (x)   =   1/i d/x ψ(x)   aus Kapitel 4.7 verwendet (in natürlichen Einheiten, also h-quer = 1). Fassen wir zusammen:

Darstellung des Bahn-Drehimpulsoperators auf ortsabhängigen Funktionen:

  [L ψ] (x)   =   −i   x × d/dx ψ(x)   =     x × P ψ(x)

Das entspricht genau der Definition des klassischen Drehimpulses   L = x × p   . Wenn also Erwartungswerte von P im klassischen Grenzfall den klassischen Impuls ergeben, so werden Erwartungswerte von L im klassischen Grenzfall den klassischen Drehimpuls ergeben. Das ist der Grund dafür, warum wir L als Bahn-Drehimpulsoperator bezeichnet haben. Der Zusatz Bahn- dient dabei zur Unterscheidung vom Spin-Drehimpulsoperator S, zu dem es kein klassisches Gegenstück gibt.

In der Quantenmechanik-Vorlesung geht man meist umgekehrt vor und führt den Drehimpulsoperator einfach in formaler Analogie zum klassischen Drehimpuls als   L = x × P   ein. Erst bei der Analyse der Lie-Algebra seiner Komponenten stößt man dann zufällig auf die Möglichkeit, dass es auch Spin-Operatoren geben könnte. Das vorliegende Kapitel hat gezeigt, dass man die Form von L gar nicht erraten muss, sondern dass sie automatisch aus der Analyse der Strahldarstellungen der Drehgruppe (zusammen mit der Translationsgruppe) herauskommt. Die Einführung eines Ortsoperators war dabei nicht notwendig, so dass die Analyse auch in der relativistischen Quantentheorie gültig ist.


Kugelflächenfunktionen:

Wir haben damit also nun eine Darstellung des Bahn-Drehimpulsoperators L auf Funktionen. Nun bilden Funktionen (mit gewissen Zusatzbedingungen) einen Hilbertraum. Weiter oben haben wir gesehen, dass die allgemeine Darstellung eines Drehimpulsoperators L auf einem Hilbertraum durch Basisvektoren   | l ml ñ   festgelegt wird (die Bezeichnungen haben wir entsprechend angepasst, also l statt j und ml statt m geschrieben). Dabei gilt:

  L2   | l ml ñ   =   l (l + 1)   | l ml ñ     mit   l = 0, 1/2, 1, 1/2, 2, ...  
  L3   | l ml ñ   =           ml   | l ml ñ     mit   ml = −l, −l+1, ... , l−1, l  
  L+   | l ml ñ   =   N   | l ml+1 ñ     mit     N = √( l(l+1) − ml(ml+1) )
  L   | l ml ñ   =   N'   | l ml−1 ñ     mit     N' = √( l(l+1) − ml(ml−1) )

(bitte den Buchstaben l (el) von der Zahl 1 (Eins) unterscheiden -- ist leider kaum zu sehen). In der Basis der   | l ml ñ   kann man damit die Wirkung der   Lk   durch Matrizen beschreiben:

  Lk   | l ml ñ   =   ∑ml'   | l ml' ñ   á l ml' | Lk | l ml ñ   =   ∑ml'   | l ml' ñ   Dlml' ml(Lk)

Die Matrizen   Dl(Lk)   mit den Matrixelementen   Dlml' ml(Lk)   kann man mit Hilfe der obigen Formeln ausrechnen, was wir weiter oben in einigen Beispielen bereits getan haben. Über die Exponentialfunktion ergibt sich für Drehungen:

  D l(u)   =   e−i wk D l(Lk )     mit

  D lml' ml (u)   =   á l ml' | e−i w L | l ml ñ   =   á l ml' | Tu | l ml ñ
  Tu | l ml ñ   =   ∑ml'   | l ml' ñ   á l ml | Tu | l ml ñ   =   ∑ml'   | l ml' ñ   D lml' ml (u)

Wenn Funktionen nun einen Hilbertraum bilden, dann muss sich all dies eins-zu-eins auf diese Funktionen übertragen lassen. Es muss also Funktionen   ψl ml(x)   geben, so dass gilt:

Eigenfunktionen des Bahn-Drehimpulsoperators:

  [L2 ψl ml ] (x)   =   l (l + 1)   ψl ml(x)
  [L3 ψl ml ] (x)   =   ml   ψl ml(x)
  [L+ ψl ml ] (x)   =   N   ψl ml+1(x)
  [L ψl ml ] (x)   =   N'   ψl ml−1(x)

mit der Folge

  [Lk ψl ml ] (x)        =   ∑ml'   ψl ml'(x)   Dlml' ml(Lk)
  [e−i w L ψl ml ] (x)   =   ∑ml'   ψl ml' (x)   D lml' ml (u)   =   ψl ml(R(w)−1 x)

In der letzten Gleichung haben wir dabei am Schluss verwendet, dass für beliebigen Funktionen ψ die Gleichung   [e−i w L ψ](x)   =   ψ(R(w)−1 x)   gilt, wie wir weiter oben gesehen haben.

Die Funktionen   ψl ml(x)   sind Eigenfunktionen von L2 und L3 (siehe die ersten beiden Gleichungen). Die ersten 4 Gleichungen ergeben zusammen ein System von Differentialgleichungen, mit dessen Hilfe man die Funktionen   ψl ml(x)   explizit ausrechnen kann. Die entsprechende Rechung findet man in jedem Buch zur Quantenmechanik, siehe z.B. M.Stingl: Quantentheorie, Kap.3.2 . Ich möchte diese Rechnungen hier nicht wiederholen, sondern nur einige allgemeine Bemerkungen machen:

Zunächst einmal zeigt die unterste Gleichung

  [e−i w L ψl ml ] (x)   =   ψl ml(R(w)−1 x)

dass der Betrag von x keine Rolle spielt. Um das besser sichtbar zu machen, schreiben wir

  ψl ml(x)   =   ψl ml(r, Ω)  

mit   r = |x|   und   Ω = x/r   . In Kugelkoordinaten hängt Ω nur von den Winkeln θ und φ ab, weshalb man auch   ψl ml(r, θ, φ)   schreiben kann. In dieser Schreibweise mit r und Ω haben wir dann

  [e−i w L ψl ml ] (r, Ω)   =   ψl ml(r, R(w)−1 Ω)     und damit auch
  [L ψl ml] (r, Ω)   =   i d/dw   ψl ml(r, R(w)−1 Ω)   | w = 0

d.h. der Drehimpulsoperator L erfasst nur Änderungen in θ und φ, nicht aber in r. Daher kommt es, dass in Kugelkoordinaten L nur Ableitungen nach θ und φ enthält, aber keine Ableitungen nach r. Die obigen Gleichungen werden also die r-Abhängigkeit in den Funktionen   ψl ml(r, Ω)   nicht festlegen.

Wie sieht es mit der Abhängigkeit von θ und φ aus, also mit der Abhängigkeit von Ω ? Als Ausgangspunkt wählen wir dazu ein festes Ω0 , beispielsweise die z-Richtung. Die Gleichungen

  ∑ml'   ψl ml' (r, Ω0)   D lml' ml (u)   =   ψl ml(r, R(w)−1 Ω0)

erlauben es nun, ausgehend von den Funktionswerten   ψl ml' (r, Ω0)   die Funktionswerte   ψl ml(r, R(w)−1 Ω0)   für beliebige andere Richtungen   Ω   :=   R(w)−1 Ω0   zu bestimmen. Etwas umgestellt lauten die Gleichung dann

  ψl ml(r, Ω)   =   ∑ml'   ψl ml' (r, Ω0)   D lml' ml (u)

Die Ω-Abhängigkeit von   ψl ml(r, Ω)   ist damit alleine durch die Ω-Abhängigkeit von   D lml' ml (u)   festgelegt und hängt nicht von r ab. Dabei gehört u zur Drehung R, die   Ω   =   R(w)−1 Ω0   erfüllt. Für ganzzahlige l ist u durch R eindeutig festgelegt. Nur diese ganzzahligen l sind hier erlaubt -- das hatten wir weiter oben bereits durch die Forderung   e−i w L   | p s ms' ñ   =   | R(w) p , s ms' ñ   festgeschrieben.

Da   r   für die Ω-Abhängigkeit keine Rolle spielt, definiert man sogenannte Kugelflächenfunktionen   Yl ml  , die nur von Ω abhängen:

Kugelflächenfunktionen: (graphische Darstellungen siehe Wikipedia: Kugelflächenfunktionen)

  Yl ml(Ω)   =   ψl ml(1, Ω)

(ggf. noch multipliziert mit einem Normierungsfaktor). Für sie gilt dann ebenfalls

  Yl ml(Ω)   =   ∑ml'   Yl ml' (Ω0)   D lml' ml (u)

Um den Zusammenhang zwischen   Yl ml   und   ψl ml   zu ermitteln, definieren wir die Funktion

  Rl ml(r, Ω)   :=   ψl ml(r, Ω) / Yl ml(Ω)       oder umgestellt

  ψl ml(r, Ω)   =   Rl ml(r, Ω)   Yl ml(Ω)

(die Funktionsbezeichnung R nicht mit der Drehmatrix verwechseln!). Sowohl für   ψl ml(r, Ω)   als auch für   Yl ml(Ω)   ist die Ω-Abhängigkeit durch die Drehmatrizen gegeben. Das können wir nun in die obige Gleichung einsetzen:

  ∑ml'   ψl ml' (r, Ω0)   D lml' ml (u)   =   Rl ml(r, Ω)   ∑ml'   Yl ml' (Ω0)   D lml' ml (u)

Diese Matrixgleichung können wir mit der inversen Matrix Dl(u−1) multiplizieren mit dem Ergebnis:

  ψl ml' (r, Ω0)   =   Rl ml(r, Ω)   Yl ml' (Ω0)

Zugleich haben wir aus der Definition von   Rl ml(r, Ω)   die Gleichung (mit ml' statt ml und Ω0 statt Ω):

  ψl ml' (r, Ω0)   =   Rl ml' (r, Ω0)   Yl ml' (Ω0)

Vergleichen wir diese beiden Gleichungen, so folgt:

  Rl ml(r, Ω)   =   Rl ml' (r, Ω0)

Diese Gleichung gilt für beliebige Werte von Ω und Ω0, also auch für Ω = Ω0. Dann ist   Rl ml(r, Ω)   =   Rl ml' (r, Ω)   , d.h. die Funktion hängt gar nicht von ml oder ml' ab. Wir lassen daher den Index ml ab sofort weg und schreiben:

  Rl (r, Ω)   =   Rl (r, Ω0)

Da diese Gleichung für beliebige Werte von Ω und Ω0 gilt, kann die Funktion nicht von Ω oder Ω0 abhängen. Wir haben also:

  Rl ml (r, Ω)   =   Rl (r)

Halten wir das Ergebnis noch einmal fest:

Eigenfunktionen des Drehimpulses und Kugelflächenfunktionen   Yl ml   :

  ψl ml(r, Ω)   =   Rl(r)   Yl ml(Ω)

Eine zentrale Eigenschaft der Kugelflächenfunktionen ist, dass sie eine vollständige Basis für (zivilisierte) Funktionen von Ω darstellen (auf den Beweis verzichten wir hier). Jede Funktion von Ω lässt sich also als unendliche Linearkombination von Kugelflächenfunktionen schreiben (mit einem bestimmten Konvergenzbegriff). Allgemein lässt sich sogar jede gutartige Funktion ψ(x) schreiben als

Entwicklung nach Kugelflächenfunktionen:

  ψ(x)   =   ψ(r, Ω)   =   ∑l ml   Rl ml(r)   Yl ml(Ω)

mit geeigneten Radial-Funktionen   Rl ml(r)  , die natürlich von   ψ(x)   abhängen. Wichtig: Die Radial-Funktionen hängen hier auch von ml ab!
Ein Beispiel: Für die ebene Welle   ψ(x)   =   eikx   ist

  Rl ml(r)   =   4π/(kr)   jl (kr)   i l   Yl ml (Ωk)  

mit   k = |k| ,   Ωk = k / k   und den Riccati-Bessel-Funktionen   jl   (siehe z.B. M.Stingl: Quantentheorie, Kap.3.4 S.44 -- hier findet man noch viele weitere Informationen zu den Kugelflächenfunktionen). Durch geeignete Integrale über k kann man daraus auch quadratintegrable Funktionen bauen.

Auch Funktionen von p lassen sich analog nach Kugelflächenfunktionen entwickeln. Auf diese Weise können wir   |ψs ñ   so umschreiben, dass die Tensorprodukt-Struktur von Bahndrehimpuls und Spin besonders gut sichtbar wird:

  |ψs ñ   =  
  =   ∑ms   ∫ d3p   fs ms(p)   | p s ms ñ   =  
  =   ∑ms   ∑l ml   ∫ p2 dp dΩp   Rs ms l ml(p)   Yl ml(Ωp)   | p s ms ñ   =:  
  =:   ∑ms   ∑l ml   ∫ p2 dp   Rs ms l ml(p)   | p , l ml , s ms ñ

mit   p = |p| ,   Ωp = p / p ,   d3p   =   p2 dp dΩp   =   p2 dp sin(θ) dθ dφ   und

  | p , l ml , s ms ñ   :=   ∫ dΩp   Yl ml(Ωp)   | p s ms ñ

Diese Schreibweise ist dadurch motiviert, dass für eine Drehung gilt:

  Tu   | p , l ml , s ms ñ   =  
  =   ∫ dΩp   Yl ml(Ωp)   Tu   | p s ms ñ   =  
  =   ∫ dΩp   Yl ml(Ωp)   ∑ms'   | R(w) p , s ms' ñ   Dsms' ms (u)     =  
  =   ∫ dΩp   Yl ml (R(w)−1 Ωp)   ∑ms'   | p , s ms' ñ   Dsms' ms (u)     =  
  =   ∑ml' ms'   ∫ dΩp   Yl ml' (Ωp)   | p , s ms' ñ   Dlml' ml (u)   Dsms' ms (u)     =  
  =   ∑ml' ms'   | p , l ml' , s ms' ñ   Dlml' ml (u)   Dsms' ms (u)  

Zusammengefasst:

Tensorproduktdarstellung von Bahndrehimpuls und Spin:

  |ψs ñ   =   ∑ms   ∑l ml   ∫ p2 dp   Rs ms l ml(p)   | p , l ml , s ms ñ       mit

  | p , l ml , s ms ñ   :=   ∫ dΩp   Yl ml(Ωp)   | p s ms ñ       und der Dreheigenschaft

  Tu   | p , l ml , s ms ñ   =   ∑ml' ms'   | p , l ml' , s ms' ñ   Dlml' ml (u)   Dsms' ms (u)  

Soviel zur Drehgruppe und ihrer Strahldarstellung in der Quantentheorie. Wenden wir uns im nächsten Kapitel einem weiteren interessanten Thema zu: den nichtrelativistischen Boosts.


zurück zum Inhaltsverzeichnis

last modified on 29 December 2008