Kapitel 3
Die spezielle Relativitätstheorie

1  Die Poincare-Gruppe

Wir haben uns im letzten Kapitel mit der sogenannten nichtrelativistischen Mechanik befasst. Andere Bezeichnungen dafür sind Newtonsche Mechanik oder auch klassische Mechanik. Dabei sind wir anders als in klassischen Physiklehrbüchern üblich vorgegangen.

Wir haben zunächst den Impuls eines Teilchens über eine Messvorschrift definiert und dabei die Impulserhaltung bei Teilchenkollisionen gefordert. Dann haben wir uns sehr allgemein mit Raum-Zeit-Symmetrien befasst, die eine geradlinig-gleichförmige Bewegung wieder in eine solche Bewegung überführen. Diese Raum-Zeit-Symmetrien werden mathematisch durch die affinen Abbildungen der Raum-Zeit dargestellt, wie wir gesehen haben.

Anschließend haben wir diese Raum-Zeit-Symmetrien durch eine Zusatzforderung weiter eingeschränkt. Wir haben gefordert, dass Zeitintervalle durch die Transformation nicht verändert werden dürfen. Dem entspricht die anschauliche Vorstellung, dass die Zeit universell vorgegeben ist und immer und überall in gleicher Weise abläuft. Auf diese Weise sind wir zu den (verallgemeinerten) Galilei-Transformationen gekommen, die die sogenannte Galileigruppe bilden. Wir haben weiterhin gesehen, dass sich Geschwindigkeiten unter Galileitransformationen vektoriell addieren. Die Geschwindigkeit eines Spielzeugautos, das sich in einem fahrenden Zug bewegt, ist gleich der Summe aus Zuggeschwindigkeit und der Geschwindigkeit des Spielzeugautos relativ zum Zug.

Nun haben wir gefordert, dass die Impulserhaltung mit den Galileitransformationen verträglich ist. Geht man also von den Impulsen eines physikalisch möglichen Teilchenzusammenstoßes aus, und berechnet aus diesen Impulsen über eine Galilei-Transformation neue Impulse, so gehören diese neuen Impulse ebenfalls zu einem physikalisch möglichen Zusammenstoß. Dem entspricht die anschauliche Vorstellung, dass man beispielsweise einen bestimmten Teilchenzusammenstoß (mit gleichem Ablenkwinkel etc.) einmal in einem ruhenden Zug und einmal in einem fahrenden Zug ausführen kann, und dass die Impulse der Teilchen bei diesen beiden Zusammenstößen sich über eine Galileitransformation ineinander umrechnen lassen.

Damit Galilei-Transformationen und die Impulserhaltung miteinander verträglich sind, muss ein bestimmter Zusammenhang zwischen Impuls und Geschwindigkeit der Teilchen gelten. Wir konnten ausrechnen, dass dieser Zusammenhang bei einem Teilchen i durch die Formel


p   =   mi  v

gegeben ist. Dabei ist mi eine teilchenspezifische Konstante, die wir als Masse des Teilchens bezeichnet haben.

Zusätzlich haben wir gefunden, dass die Masse sich bei Zusammenstößen und Zerfällen additiv verhält. Wenn also ein Teilchen in zwei andere Teilchen zerplatzt, so ist die Summe dieser Teilchenmassen gleich der Masse des zerplatzten Teilchens.

Bei der Betrachtung der sogenannte elastischen Stöße sind wir auf eine weitere Erhaltungsgröße gestoßen: der kinetischen Energie, die durch die Formel


hi(p2)   =   A
mi
p2 + Bi

gegeben ist. Bei elastischen Stößen ist die Summe der kinetischen Teilchenenergien eine Erhaltungsgröße.

Zu guter letzt sind wir auf den Kraftbegriff eingegangen und haben Kraft und Impuls über die Beziehung


d
dt
p   =   F

miteinander verknüpft.

Ferner haben wir gesehen, dass Kräfte, die vom Abstand zweier Teilchen abhängen, eine weitere Einschränkung an die Galileitransformationen bewirken. Die Galileitransformation darf neben zeitlichen nun auch räumliche Abstände nicht mehr verändern. Das sind dann auch genau die Transformationen, die man in der physikalischen Literatur als Galileitransformationen bezeichnet.

Unsere Vorgehensweise ist vermutlich an vielen Stellen etwas pedantisch erschienen. Wir haben viele scheinbare Selbstverständlichkeiten mühsam bewiesen, und man kann durchaus die Frage stellen, ob das alles wirklich sein muss.

Die alles entscheidende Frage lautet: bestätigen die physikalischen Beobachtungen das, was wir hergeleitet haben? Verhält sich die Natur tatsächlich so, wie wir es uns überlegt haben?

Auf den ersten Blick ist das tatsächlich der Fall. Wer zweifelt schon daran, dass wenn ich zwei ein-Kilogramm-schwere Kugeln zusammenklebe, dieses Objekt dann zwei Kilogramm wiegt? Wer bezweifelt, dass die Zeit in einem fahrenden Zug dieselbe ist wie die auf dem Bahnhof? Wer bezweifelt, dass sich Geschwindigkeiten addieren und dass man zeitliche und räumliche Abstände nicht ändern darf, wenn man die Physik nicht verfälschen will?

Und dennoch: schauen wir uns die Experimente genau an!

Bei den typischen Geschwindigkeiten, die in unserer Alltagswelt auftreten, scheint es keine Probleme zu geben. Aber wenn man sich weiter umsieht, findet man auch folgende Phänomene:



Die Eichkurve für den Referenzball aus dem Kapitel über die Messvorschrift für Impulse zeigt, dass bei hohen Geschwindigkeiten der Impuls stärker als proportional zur Geschwindigkeit wächst.

Wir haben also allen Grund, anzunehmen, dass unsere bisherigen Überlegungen keineswegs eine allumfassende Gültigkeit besitzen. Sie sind vermutlich eher eine plausible Annäherung an die wirkliche physikalische Welt und haben daher nur in einem bestimmten Teilbereich der Wirklichkeit näherungsweise Gültigkeit.

Was müssen wir also tun, um zu einer besseren Beschreibung der Natur zu gelangen?

Verfolgen wir noch einmal unsere Argumentationskette:

Da ist zunächst die Idee, Teilchen durch Punkte im dreidimensionalen Raum darzustellen und ihnen eine Geschwindigkeit und einen Impuls zuzuordnen. Daran wollen wir weiterhin festhalten, da es bisher keinen Grund gibt, davon abzuweichen (später werden wir noch Gründe finden, die uns auch hier schon zu einer Änderung zwingen werden - Stichwort: Quantenmechanik).

Für den Impuls haben wir eine Messvorschrift über die Idee der Impulserhaltung festgelegt. Auch daran halten wir weiterhin fest. Für alle Teilchen, die sich auch in Ruhe aufhalten können, wollen wir weiterhin einen eindeutigen Zusammenhang zwischen Impuls und Geschwindigkeit annehmen.

Ferner wollen wir wieder annehmen, dass die Impulserhaltung verträglich ist mit Raum-Zeit-Transformationen, die geradlinig-gleichförmige Bewegungen wieder in solche Bewegungen umwandeln (also mit affinen Abbildungen von Raum und Zeit).

Soweit wollen wir also dem bisherigen Rahmen treu bleiben. Doch nun kommt die entscheidende Änderung:

Wir wollen nicht mehr fordern, dass die Raum-Zeit-Transformationen Zeitintervalle unverändert lassen müssen.

Wenn wir das nämlich weiterhin fordern würden, so hätten wir wieder die Galileitransformationen mit all ihren Konsequenzen vor uns. Und diese Konsequenzen treffen in der Natur offenbar nur eingeschränkt zu.

Wir müssen also nach einer anderen Möglichkeit suchen, die Menge der möglichen affinen Raum-Zeit-Transformationen so einzuschränken, dass sie verträglich mit den physikalischen Gesetzen werden.

Betrachten wir dazu noch einmal die Beobachtungen, die wir oben in der Auflistung gemacht haben:

Es gibt Teilchen, die sich immer mit der gleichen Geschwindigkeit bewegen, egal, ob man die Messaparatur und die Quelle bewegt oder nicht. Diese Geschwindigkeit ist eine universelle Naturkonstante: die Lichtgeschwindigkeit (abgekürzt durch den Buchstaben c). Führt man diesen Teilchen Energie zu und versucht sie, zu beschleunigen, so werden sie nicht schneller! Wir wollen diese Teilchen als masselose Teilchen bezeichnen, wobei wir diese Bezeichnung erst später rechtfertigen können.

Betrachten wir nun einen Prozess, bei dem solche masselosen Teilchen auftreten:

In großen Beschleunigern kann man heute ein bestimmtes Teilchen erzeugen: das neutrale Pion. Das neutrale Pion besitzt eine Masse und kann demnach auch in unbewegten Zustand existieren. Es zerfällt nach sehr kurzer Zeit in zwei masselose Teilchen (zwei Photonen).

Zerfällt ein unbewegtes Pion, so fliegen die beiden Photonen in entgegengesetzten Richtungen mit einander gleichem Impulsbetrag auseinander. Ihre Geschwindigkeit ist gleich der Lichtgeschwindigkeit c.

Zerfällt ein bewegtes Pion, so fliegen die beiden Photonen in bestimmte Richtungen auseinander, und zwar gerade so, dass die Impulserhaltung erfüllt ist. Dennoch ist der Betrag der Geschwindigkeit, mit der sich die Photonen bewegen, wieder gleich der Lichtgeschwindigkeit!



Ein ruhendes Pion zerfällt in zwei Photonen, die mit Lichtgeschwindigkeit auseinanderfliegen. Ihre Impulse betragen p und -p. Eine affine Transformation soll den Zerfall des ruhenden Pions in den Zerfall eines sich mit dem Impuls P bewegenden Pions umwandeln, so dass sich die beiden Photonen mit Lichtgeschwindigkeit bewegen und die Impulse   P+p   und   P-p   besitzen.

Wir suchen nun nach affinen Raum-Zeit-Transformationen, die den Zerfall des unbewegten Pions in den Zerfall des bewegten Pions überführen, so dass alle Geschwindigkeiten und Impulse korrekt ineinander umgerechnet werden.

Eine Galileitransformation schafft das nicht, denn sie könnte nicht dem Pion eine Geschwindigkeit verleihen und den Geschwindigkeitsbetrag der Photonen gleichzeitig unverändert lassen. Bei einer Galileitransformation würde zu jeder Teilchengeschwindigkeit der gleiche Geschwindigkeitsvektor u hinzuaddiert.

Die gesuchte Raum-Zeit-Transformation muss bei masselosen Teilchen also den Betrag der Lichtgeschwindigkeit unverändert lassen.

Wir wollen diese Forderung mathematisch formulieren und sehen, was für Konsequenzen sie für die möglichen Transformationen hat.

Statt den dreidimensionalen Raum wollen wir wieder einen vierdimensionalen Raum betrachten, der die drei gewöhnlichen Raumkomponenten sowie eine Zeitkomponente umfasst. Um konsistent mit den in der Physik üblichen Schreibweisen zu sein, wollen wir allerdings die Zeitkomponente noch mit der Lichtgeschwindigkeit c multiplizieren. Das hat den Vorteil, dass sowohl die räumlichen Komponenten als auch die zeitliche Komponente die physikalische Dimension einer Länge haben. Ort x und Zeitkomponente c t fassen wir wie früher zu einem vierdimensionalen Vektor x zusammen:


x   =   æ
ç
è
 t
x
ö
÷
ø

wobei wir die Zeitkomponente mit dem Koordinatenindex Null versehen wollen, damit die drei Raumkomonenten ihre gewohnten Indices 1, 2 und 3 behalten können. Analog zur in der Relativitätstheorie üblichen Schreibweise werden wir die Koordinatenindices immer oben schreiben, also   x   =   (x0, x1, x2, x3)   mit   x0   =   ct   . Solche vierdimensionalen Vektoren wollen wir auch als Vierervektoren bezeichnen.

Den vierdimensionalen Raum, in dem sich diese Vierervektoren x befinden, bezeichnen wir auch als Minkowskiraum.

Eine geradlinig gleichförmige Bewegung wird im vierdimensionalen Minkowskiraum durch eine Gerade dargestellt. Die Punkte x der Gerade können durch eine Funktion der Form


x   =   a   +   b s

dargestellt werden.



Die Punkte x einer Geraden können durch die Formel   x   =   a   +   b s   festgelegt werden. Dabei wird durch den Vektor a ein Startpunkt festgelegt und der Vektor b legt die Richtung fest. a und b sind fest vorgegeben. Die verschiedenen Punkte auf der Geraden entsprechen nun verschiedenen Werten des Parameters s.

Dabei sind   x   =   (ct, x),   a   =   (a0, a)   und   b   =   (b0, b)   vierdimensionale Vektoren (Vierervektoren) und s ist der reelle Kurvenparameter. Schreibt man die zeitliche Komponente und die räumlichen Komponenten dieser Gleichung getrennt, so erhält man


æ
ç
è
t
x
ö
÷
ø
  =   æ
ç
è
a0
a
ö
÷
ø
+ æ
ç
è
b0
b
ö
÷
ø
 s   =   æ
ç
è
a0   +   b0 s
a   +   b s
ö
÷
ø

Betrachten wir zwei Parameterwerte s1 und s2, die zwei verschiedenen Punkten   x1   =   (ct1, x1)   und   x2   =   (ct2, x2)   auf der Geraden entsprechen (die Indices haben hier nichts mit den Komponenten der Vektoren zu tun). Wir wollen annehmen, dass t2 größer als t1 ist (d.h. so wollen wir die Nummerierung wählen). Die Geschwindigkeit ist nun gegeben durch den Bruch aus dem räumlichen Abstand dividiert durch den zeitlichen Abstand zwischen diesen beiden Raum-Zeit-Punkten:


v   =   c  x2   −   x1
ct2   −   ct1
  =   c  (a + b s2)   −   (a + b s1)
(a0 + b0 s2)   −   (a0 + b0 s1)
  =   c  b
b0

Die Geschwindigkeit ist also gegeben durch den Bruch aus dem räumlichen Anteil von b (also dem dreidimensionalen Vektor b, dividiert durch den zeitlichen Anteil von b (also der Komponente b0), multipliziert mit der Lichtgeschwindigkeit c.

Wir lassen nun eine affine Raum-Zeit-Transformation f der Form


f(x)   =   L x   +   d

auf Raum und Zeit wirken. Zur Schreibweise: Früher hatten wir die affinen Transformationen in Raum und Zeit geschrieben als   g(x)   =   A x   +   c  . Den Buchstaben g wollen wir jedoch weiter unten für die sogenannte Metrik verwenden, so dass wir statt dessen den Buchstaben f für die Bezeichnung der Transformation verwenden wollen. Ebenso soll der Buchstaben c für die Lichtgeschwindigkeit reserviert werden, so dass wir statt dessen den Buchstaben d verwenden. Der Buchstabe L wiederum hat sich in der physikalischen Literatur der Relativitätstheorie etabliert, so dass wir ihn hier ebenfalls verwenden wollen.

Aus der Geraden   x   =   a + b s   wird nun die Gerade


x   =   f(a + b s)   =   L (a + b s)   +   d   =   (L a + d)   +   (L b) s

Die neue Geschwindigkeit ist also gegeben durch den Bruch aus dem räumlichen Anteil von L b, dividiert durch den zeitlichen Anteil von L b, multipliziert mit c.

Der üblichen Schreibweise folgend wollen wir die Indices der räumlichen Komponenten eines vierdimensionalen Vektors mit lateinischen Kleinbuchstaben kennzeichnen (also mit i, j, k etc.). Die Komponenten der neuen Geschwindigkeit sind also gegeben durch


vk   =   c  (L  b)k
(L  b)0

Betrachten wir nun den Fall, dass die Geschwindigkeit vor der Transformation gleich der Lichtgeschwindigkeit ist, d.h.


v2   =   c2  b2
(b0)2
  =   c2

Für den Vierervektor b muss dann die Beziehung


(b0)2   −   b2   =   0

gelten.

Es ist hilfreich, diese Beziehung noch etwas anders zu schreiben. Dazu definieren wir die Matrix g durch


g   =   æ
ç
ç
ç
ç
è
1
0
0
0
0
-1
0
0
0
0
-1
0
0
0
0
-1
ö
÷
÷
÷
÷
ø

Mit Hilfe dieser Matrix können wir eine (nicht positiv definite) Metrik im Minkowskiraum R4 definieren, die wir ebenfalls mit dem Buchstaben g bezeichnen wollen (sorry für diese zweideutige Verwendung des Buchstaben g, aber so langsam werden die Buchstaben knapp). Diese Metrik ordnet einem Paar (a,b) von Vierervektoren eine reelle Zahl zu über die Formel


g:   R4 × R4   ®   R

g(a,b)   =   aT g  b   =   a0 b0   −   a  b

Dabei ist   aT g b   das Produkt des transponierten Vierervektors aT mit der Matrix g und dem Vierervektor b. In Komponenten ausgeschrieben lautet diese Formel


g(a,b)   =   3
å
m   =   0 
3
å
n   =   0 
 am  bn  gmn

Dabei sind gmn die Komponenten der Matrix g (Achtung: die Indices schreiben wir hier unten!). Wir verwenden hier die Konvention, griechische Indexbuchstaben zu verwenden, wenn die Indices alle Werte von 0 bis 3 annehmen können. Lateinische Indexbuchstaben wollten wir dagegen für die räumlichen Indices 1, 2 und 3 reservieren.

Warum nun dieser Aufwand mit Indices, die mal oben und mal unten erscheinen? Genauer werden wir das erst verstehen, wenn wir das Transformationsverhalten von Vierervektoren untersuchen. Für den Moment wollen wir lediglich dem ganzen eine Bedeutung dadurch geben, dass wir festlegen wollen, wann ein Index bei einer Vierervektorkomponente unten geschrieben werden soll. Wir definieren nämlich die Schreibweise


am :   =   3
å
n   =   0 
 gmn  an

Man bezeichnet dies auch als das Herunterziehen eines Indexes.

Da sehr häufig über mehrfach vorkommende Indices summiert werden muss, kam Albert Einstein auf die Idee, die Summensymbole einfach wegzulassen und festzulegen, dass automatisch über mehrfach vorkommende Indices zu summieren ist. Man spricht von der Einsteinschen Summenkonvention.

In dieser Schreibweise notieren wir einfach


g(a,b)   =   am  bm

Wir sehen, wie elegant diese Schreibweise ist, aber man muss doch immer wieder aufpassen, was man da eigentlich tut, und gelegentlich eine Rückübersetzung in die ausführliche Schreibweise vornehmen.

Wir werden uns im Folgenden mal der einen, mal der anderen Schreibweise bedienen, je nachdem, welche Schreibweise jeweils am besten die Strukturen der Formeln zur Geltung bringt.

Kehren wir nach dieser Abschweifung zurück zu unserer eigentlichen Überlegung:

Die Bewegung eines Teilchens im Minkowskiraum wollten wir durch die Geradengleichung   x   =   a + b s   darstellen. Wenn sich das Teilchen mit Lichtgeschwindigkeit bewegt, muss der Vierervektor b die Beziehung   (b0)2   −   b2   =   0   erfüllen. Mit Hilfe der neuen Schreibweisen können wir dies auch so ausdrücken:


g(b,b)   =   bT g  b   =   bm  bm   =   0

Nun wenden wir eine affine Transformation auf Raum und Zeit an, so dass die neue Bewegung durch die Gerade   x   =   (L a + d)   +   (L b) s   dargestellt wird. Auch diese Bewegung soll wieder mit Lichtgeschwindigkeit erfolgen, d.h. der Vierervektor   L b   muss ebenfalls   g(L b,L b)   =   0   erfüllen.

Die Forderung an die Matrix L lautet also:


aus     g(b,b)   =   0     folgt    g(L b,L b)   =   0

Man bezeichnet Vierervektoren mit der Eigenschaft g(b,b)   =   0 auch als lichtartige Vierervektoren.

Die Matrix L muss also aus lichtartigen Vierervektoren wieder lichtartige Vierervektoren machen!

An dieser Stelle geschieht nun in vielen Physik-Lehrbüchern ein kleines Wunder: An die Stelle der obigen Forderung tritt die Forderung, dass die Matrix L die Metrik g invariant läßt, d.h. es wird


g(a,b)   =   g(L a, L b)

für beliebige Vierervektoren des Minkowskiraums gefordert.

Die neue Forderung nach der Invarianz der Metrik geht offensichtlich weiter als unsere ursprüngliche Forderung, die aus der neuen Forderung unmittelbar folgt.

Wir werden in den nächsten Kapiteln noch genauer untersuchen, inwieweit diese neue Forderung aus der alten Forderung folgt und ob es Transformationen gibt, die zwar lichtartige Vierervektoren wieder in lichtartige Vierervektoren umwandeln, die aber die Metrik g nicht invariant lassen.

Nachtrag (22. Mai 2005):
In Matt Visser: Math 465: Notes on general relativity, http://www.mcs.vuw.ac.nz/courses/MATH465/2004T2/Lecture-Notes/notes.pdf , findet sich dazu in Kapitel 2.2 eine Erklärung dazu:
In Matrixschreibweise kann man die Bedingung     g(b,b)   =   0     →    g(L b,L b)   =   0   von oben schreiben als
     bT g  b   =   0     →     bT LT g L b   =   0  
Für die gesuchte Matrix   LT g L   machen wir den allgemeinen Ansatz
  LT g L   =   Ω g   +   h
mit einem skalaren Faktor Ω (kann ggf. auch eine reelwertige Funktion sein) und einer beliebigen Matrix h. Setzen wir diesen Ansatz rechts ein und verwenden die Voraussetzung links, so folgt
  0   =   bT LT g L b   =   bT (Ω g   +   h) b   =   Ω   bT g b   +   bT h b   =   bT h b
d.h. die Matrix h muss gleich Null sein, und wir haben das Ergebnis
  LT g L   =   Ω g
oder anders geschrieben
  g(L a, L b)   =   Ω g(a,b)    
Raum und Zeit können also noch mit dem gleichen Faktor gedehnt werden. In Matt Vissers Text wird nun argumentiert, dass Ω = 1 sein muss, wenn man die Forderung stellt, dass es keine bevorzugten Inertialsysteme (Beobachter) geben soll. Klar ist: Wenn Ω eine Konstante ist (also keine Funktion), so müssen wir nur für L die Einheitsmatrix einsetzen und erhalten sofort Ω = 1 . Falls aber Ω eine Funktion der Parameter der Lorentzmatrix L ist (siehe nächstes Kapitel), so folgen nach Matt Visser daraus beobachtbare Konsequenzen, die bestimmte Bezugssysteme auszeichnen. Da wir das nicht zulassen wollen, muss Ω konstant und damit gleich 1 sein.

Soviel dazu.

Man bezeichnet affine Raum-Zeit-Transformation


f(x)   =   L x + d       mit      g(a,b)   =   g(L a, L b)

als Poincare-Transformationen, die die Poincare-Gruppe bilden. Die Poincare-Transformationen umfassen einmal Verschiebungen (Translationen) in Raum und Zeit (gegeben durch den Vierervektor d) sowie spezielle lineare Transformation der Raum- und Zeitkoordinaten (gegeben durch die Matrix L), die die Metrik g invariant lassen. Die Poincare-Transformationen, die keine Verschiebung in Raum und Zeit bewirken (d   =   0), werden auch als Lorentz-Transformationen bezeichnet, wobei die Menge der Lorentz-Transformationen die Lorentz-Gruppe bilden. Wir werden uns in einem der nächsten Abschnitte die Lorentz-Transformationen noch genauer ansehen und uns fragen, welche physikalischen Konsequenzen sich daraus ergeben.


zurück zum Inhaltsverzeichnis

last modified on 15 May 2005