Kapitel 5
Die allgemeine Relativitätstheorie

1   Gekrümmte Räume (über die Grundlagen der Differentialgeometrie)

9   Abstände und Winkel: die Metrik

Einbettung, euklidisches Skalarprodukt und induzierte Metrik:

In den bisherigen Kapiteln haben wir uns mit differenzierbaren Mannigfaltigkeiten beschäftigt, die neben Tangentialvektoren und Co-Tangentialvektoren über eine einzige zusätzliche Struktur verfügten: den affinen Zusammenhang, gegeben durch die Christoffelsymbole. Auf diese Weise konnten wir Begriffe wie die Veränderung von Vektorfeldern (kovariante Ableitung), Paralleltransport, gerade (geodätische) Linien, parallele Linien sowie Torsion und Krümmung definieren. Die Art von Geometrie, die man damit betreiben kann, bezeichnet man als affine Geometrie. Die Begriffe Abstand und Winkel kommen in der affinen Geometrie nicht vor.

Um Abstände und Winkel auf Mannigfaltigkeiten definieren zu können, brauchen wir eine andere zusätzliche Struktur: die Metrik. Wie in den vorhergehenden Kapiteln wollen wir uns bei der Definition der Metrik wieder von unserer Anschauung leiten lassen, indem wir uns Mannigfaltigkeiten eingebettet im n-dimensionalen reellen euklidischen Raum Rn vorstellen, beispielsweise als zweidimensionale (gekrümmte) Flächen im dreidimensionalen Raum.

Im Rn sind Abstände und Winkel über das euklidische Skalarprodukt definiert. Das euklidische Skalarprodukt   á X, Y ñ   zweier Vektoren X und Y aus Rn ist dabei gegeben durch

  • euklidische Skalarprodukt im Rn:

      á X, Y ñ   :=   ∑i = 1n   X i Y i

Dabei sind X i und Y i die Komponenten der Vektoren X und Y (den Index habe ich -- wie in der Relativitätstheorie üblich -- oben geschrieben). Aus der Definition geht hervor, dass das Skalarprodukt bilinear in den beiden Argumenten ist.

Die Länge |X| eines Vektors X aus Rn ist nun definiert als

  |X|   :=   √ á X, X ñ

was dem Satz des Pythagoras entspricht. Der Winkel α zwischen zwei Vektoren X und Y aus Rn ist wiederum definiert über

  á X, Y ñ   =:   |X| |Y| cos α

Wem diese Definition des Winkels merkwürdig vorkommt: Man kann auch umgekehrt das Skalarprodukt definieren als   á X, Y ñ   :=   |X| |Y| cos α  , wobei man von einer anschaulichen Winkeldefinition ausgeht, d.h. die Winkelfunktionen erfüllen die üblichen Rechenregeln (Additionstheoreme etc.). Es folgt, dass das so definierte Skalarprodukt bilinear ist, so dass man die obige Komponenten-Summenformel reproduzieren kann (den Beweis für die Gleichwertigkeit der beiden Darstellungsweisen für das Skalarprodukt findet man beispielsweise in Wikipedia: Dot product, wo auch das folgende Bild herstammt).


Skalarprodukt zweier Vektoren A und B. Der Vektor A wird senkrecht auf den Vektor B projeziert und die Länge dieser Projektion (ggf. mit Vorzeichen gemäß   cos Θ ) anschließend mit der Länge von B multipliziert, um das Skalarprodukt zu ermitteln. Bild siehe Wikipedia.


Schauen wir uns nun an, wie sich das obige Skalarprodukt auf einen Tangentialraum T(p) im Punkt p der Mannigfaltigkeit M übertragen lässt. Dazu eine kurze Wiederholung (siehe Kapitel 5.1.4 Tangentialräume und Vektorfelder):

Bei einer in Rn eingebetteten m-dimensionalen Mannigfaltigkeit M können wir jeden Punkt p durch einen n-dimensionalen Vektor X(x) im Einbettungsraum Rn darstellen. Dabei sind   x = (x1 , ...., xm) die m Koordinaten des Punktes p, d.h. es ist   x = f(p)   mit der Koordinatenfunktion (Karte) f. Man sagt auch, X(x) liefert eine Parametrisierung der Mannigfaltigkeit M (oder zumindest von Teilen davon) im Einbettungsraum Rn. Wegen   p = X(x)   und umgekehrt   x = f(p)   ist X die Umkehrfunktion zur Koordinatenfunktion f, d.h.   p = X(x) = f -1(x)  . Einen Tangentialvektor u(p) aus T(p) können wir aufgrund der Einbettung und der Parametrisierung von M nun schreiben als

  u(p)   =   ∑μ   uμ(p) dX(x)/dxμ

mit   x = f(p)  . Die Summe läuft dabei von μ = 1 bis m. Der Vektor u(p) ist demnach ein Vektor in Rn, der in p tangential zur Fläche M liegt. Die Vektoren   dX(x)/dxμ   bilden eine koordinatenabhängige Basis des Tangentialraums.

Wir können nun das Skalarprodukt des Rn auf den Tangentialraum T(p) übertragen und eine Metrik   g(u(p), v(p))   auf T(p) definieren:

  • Definition einer Metrik auf M, eingebettet in Rn:

    Für zwei Tangentialvektoren u(p) und v(p) aus T(p) definieren wir die Metrik   g(u(p), v(p))   als

      g(u(p), v(p))   :=   á u(p), v(p) ñ

    Dabei sind auf der rechten Seite aufgrund der Einbettung u(p) und v(p) als Vektoren im Rn zu lesen, so dass das euklidische Skalarprodukt zwischen ihnen definiert ist. Mit   u(p)   =   ∑μ   uμ(p) dX(x)/dxμ   und analog   v(p)   =   ∑ν   vμ(p) dX(x)/dxν   können wir aufgrund der Bilinearität des Skalarproduktes schreiben:

      g(u(p), v(p))   =   ∑μν   uμ(p) vν(p) gμν(p)         mit

      gμν(p)   :=   á dX(x)/dxμ, dX(x)/dxν ñ

Aus der Definition geht direkt hervor, dass   g(u(p), v(p))   alle Eigenschaften des euklidischen Skalarproduktes erbt, d.h. die Metrik ist symmetrisch und bilinear in u und v. Weiterhin ist sie positiv definit, d.h.   g(u(p), u(p)) > 0   wenn u(p) nicht der Nullvektor ist (andernfalls ist   g(0, 0) = 0  ).

Man kann nun mit Hilfe der Metrik wieder die Länge eines Tangentialvektors und den Winkel zwischen zwei Tangentialvektoren definieren. Dabei übertragen wir die Definition vom euklidischen Skalarprodukt unmittelbar auf die Metrik, d.h. es ist

  |u(p)|   :=   √ g(u(p), u(p))   =   √ á u(p), u(p) ñ       sowie
  g(u(p), v(p))   =   á u(p), v(p) ñ   =:   |u(p)| |v(p)| cos α

Die Länge von Tangentialvektoren können wir weiterhin dazu verwenden, um die Länge von Kurven auf der Mannigfaltigkeit zu definieren. Stellen wir uns dazu die Mannigfaltigkeit M wieder eingebettet im Rn vor. Auf M soll nun eine (differenzierbare) Kurve   γ(t)   verlaufen, d.h. für jeden reellen Kurvenparameter t ist   γ(t)   ein Punkt auf M.

Wir starten nun mit einem Punkt   γ(t)   auf M und bewegen uns ein winziges Stück auf der Kurve weiter, indem wir den Kurvenparameter um einen sehr kleinen Wert dt erhöhen. Der Nachbarpunkt lautet dann   γ(t + dt)  . Aufgrund der Einbettung können wir den Abstand zwischen diesen beiden Punkten ausrechnen:   | γ(t + dt)   − γ(t) |  . Für sehr kleine dt ist dieser Abstand anschaulich gleich der Länge des Kurvenstücks zwischen den beiden Punkten. Wir können dt nämlich so klein machen, dass die Kurve zwischen den beiden Punkten wie eine gerade Linie aussieht (genauer: das geht, da wir die Differenzierbarkeit der Kurve voraussetzen, d.h. die Kurve hat keine Knicke). Weiterhin gilt für sehr kleine dt:   | γ(t + dt)   − γ(t) |   =   |dγ(t)/dt| dt  .

Um die Gesamtlänge der Kurve zwischen zwei Punkten γ(a) und γ(b) zu definieren, müssen wir nun die Kurve dazwischen in sehr viele sehr kleine Stücke zerteilen und die Längen dieser Teilstücke aufsummieren. Im Grenzübergang unendlich vieler unendlich kleiner Teilstücke ergibt dies ein Integral für die Länge L(γ,a,b) der Kurve zwischen γ(a) und γ(b):

  L(γ,a,b)   :=   ∫ab   |dγ(t)/dt| dt

Da   dγ(t)/dt   ein Tangentialvektor im Punkt γ(t) ist, können wir diesen Ausdruck mit Hilfe der Metrik umschreiben als

  L(γ,a,b)   :=   ∫ab   √ g( dγ(t)/dt, dγ(t)/dt )   dt

Wichtig ist dabei, dass L(γ,a,b) nicht von der Parametrisierung der Kurve abhängt (also nicht davon abhängt, mit welcher Geschwindigkeit die Kurve durchlaufen wird). Die Metrik erlaubt es uns also, die Länge einer Kurve auf M zu definieren. Als Abstand zweier Punkte auf M definiert man dann die Länge derjenigen Kurve zwischen den beiden Punkten, die die kleinste Länge aufweist -- man muss also den kürzesten Weg zwischen den beiden Punkten zurücklegen. Eine solche Kurve bezeichnen wir dann als Geodäte. Wie der Zusammenhang zwischen einer Geodäte (definiert als kürzeste Kurve) und einer geodätischen Linie (definiert als geradeste Kurve, siehe Kapitel 5.1.6 Kovariante Ableitung und Paralleltransport ) aussieht, werden wir uns etwas weiter unten noch genauer ansehen.


Metrik ohne Einbettung und der Einbettungssatz von Nash:

Die oben definierte Metrik bezeichnet man auch als durch die Einbettung auf M induzierte Metrik. Wenn wir uns von dem Begriff der Einbettung lösen wollen, so müssen wir die Metrik etwas anders definieren, da uns dann das euklidische Skalarprodukt des Einbettungsraums nicht zur Verfügung steht. In diesem Fall definieren wir die Metrik daher einfach als bilineare, symmetrische, positiv definite Abbildung vom Tangentialbündel (Raum der Tangentialräume von M) in die reellen Zahlen, d.h.   g(u(p), v(p))   soll einfach dieselben Eigenschaften haben, wie sie die über eine Einbettung definierte Metrik aufweist. Insbesondere können wir schreiben:

  • Metrik auf M ohne Einbettung:

      g(u(p), v(p))   =   ∑μν   uμ(p) vν(p) gμν(p)         mit

      gμν(p)   :=   g( d/dxμ|p , d/dxν|p )

Dabei muss sich   gμν(p)   bei Koordinatenwechseln in beiden Indices genau entgegengesetzt zu   uμ(p)   und   vν(p)   transformieren, so dass   g(u(p), v(p))   koordinatenunabhängig ist. Außerdem muss   gμν(p)   =   gνμ(p)   sein, damit die Metrik symmetrisch ist.

Eine differenzierbare Mannigfaltigkeit mit einer solchen Metrik bezeichnet man als Riemannsche Mannigfaltigkeit. Man kann die Bedingung, dass die Metrik positiv definit sein soll (d.h.   g(u(p), u(p)) > 0   wenn u(p) nicht der Nullvektor ist) auch abschwächen und statt dessen fordern, dass die Metrik nicht ausgeartet ist (d.h. nur der Nullvektor steht auf allen anderen Vektoren senkrecht, hat also die Metrik Null mit allen anderen Vektoren, siehe z.B. http://theory.gsi.de/~vanhees/faq/gravitation/node24.html ). Das bedeutet, dass die Matrix der Komponenten gμν weiterhin invertierbar bleibt, was wir weiter unten noch brauchen. In diesem Fall spricht man von einer Pseudo-Riemannsche Mannigfaltigkeit, oder auch von einer Semi-Riemannsche Mannigfaltigkeit. In der allgemeinen Relativitätstheorie brauchen wir gerade eine solche Mannigfaltigkeit.

Auf einer Riemannschen Mannigfaltigkeit ermöglicht es uns die Metrik über die oben angegebenen Formeln, die Begriffe Länge, Winkel und Kurvenlänge sowie Abstand direkt zu definieren. Wird die Metrik durch eine Einbettung induziert, so haben die so definierten Begriffe automatisch ihre anschauliche Bedeutung im euklidischen Einbettungsraum.

Bei einer Semi-Riemannschen Mannigfaltigkeit lassen sich ebenfalls Längen, Winkel etc. über die obigen Formeln definieren, aber diese Begriffe haben dann nicht mehr unbedingt die entsprechende anschauliche Bedeutung. Im Rahmen der allgemeinen Relativitätstheorie gibt es beispielsweise Vektoren mit positiver, negativer oder verschwindender Länge, die man als zeitartige, raumartige oder lichtartige Vektoren bezeichnet (siehe auch Kapitel 3.1 Die Poincare-Gruppe ). Die Kurvenlänge hat dann etwas mit der sogenannten Eigenzeit zu tun, also der Zeit, die im bewegten Objekt verstreicht. Details kommen in den späteren Kapiteln.

Zurück zur Metrik ohne Einbettung: Können wir ohne Einbettung   g(u(p), v(p))   ausrechnen? Dies setzt voraus, dass wir in irgendeinem Koordinatensystem die Werte von   gμν(p)   kennen. Diese Werte müssen wir vorgeben und dadurch die Metrik festlegen, so wie wir beim affinen Zusammenhang in Kapitel 5.1.6 Kovariante Ableitung und Paralleltransport ohne Einbettung die Werte der Christoffelsymbole vorgeben mussten. Dies müssen wir so machen, dass die Metrik symmetrisch und positiv definit (oder zumindest nicht ausgeartet) bleibt. Im Prinzip liefert also jede symmetrische nicht ausgeartete bilineare Abbildung (Tensor) auf den Tangentialvektoren eine Metrik für die Mannigfaltigkeit.

Angenommen, wir haben nun eine Metrik auf M auf diese Weise vorgegeben. Kann man umgekehrt eine Einbettung von M in Rn (mit genügend großer Dimension n) finden, so dass die Einbettung gerade diese Metrik induziert (d.h. so dass   g(u(p), v(p))   :=   á u(p), v(p) ñ   ist)?

Das ist tatsächlich der Fall, wie in den Jahren 1954, 1956 und 1966 (jeweils mit leicht geänderten Voraussetzungen) von John Nash und anderen bewiesen wurde:

  • Einbettungssatz von Nash (Nash embedding theorem):

    Jede Riemannsche Mannigfaltigkeit M (d.h. jede differenzierbare Mannigfaltigkeit mit einer darauf definierten positiv-definiten Metrik) kann man isometrisch in einen euklidischen Raum Rn einbetten (wenn man n genügend groß wählt). Dabei bedeutet isometrisch, dass die Länge von Kurven bei der Einbettung unverändert bleibt. Gleichbedeutend damit ist die Aussage, dass die Metrik auf M durch das euklidische Skalarprodukt des Rn induziert wird.

    Für Semi-Riemannsche Mannigfaltigkeiten gilt der Satz so nicht.

Der Einbettungssatz von Nash ermöglicht es, dass wir uns jede Riemannsche Mannigfaltigkeit eingebettet im euklidischen Raum vorstellen können. Trotzdem ist es sehr nützlich, auch auf eine einbettungsfreie Formulierung zurückgreifen zu können, so wie wir es bisher getan haben. Damit lassen sich dann auch Semi-Riemannsche Metriken erfassen. Man braucht sich über die Einbettung keine Gedanken mehr zu machen und kann sich auf die wesentlichen Aspekte der Mannigfaltigkeit konzentrieren. Außerdem kann eine Einbettung auch in die Irre führen: Betrachten wir als Beispiel ein Blatt Papier im dreidimensionalen Raum. Dieses Papier können wir flach auf einen Tisch legen oder zu einem Zylinder zusammenrollen. Die Winkel und Abstände (d.h. die Metrik) auf dem Papier bleiben in beiden Fällen dieselben, d.h. es gibt hier verschiedene isometrische Einbettungen. Man sagt auch, die äußeren Eigenschaften von flachem und gerolltem Papier sind verschieden, aber die inneren Eigenschaften sind dieselben. In der Differentialgeometrie interessiert man sich im Normalfall für die inneren Eigenschaften! So ist beispielsweise die Krümmung (definiert in Kapitel 5.1.8 Krümmung ) des Papiers in beiden Fällen dieselbe (nämlich Null), da sich ein im Kreis auf dem Papier paralleltransportierter Vektor nicht ändert. In diesem Sinn haben wir die Krümmung als innere Eigenschaft definiert.

In Kapitel 5.1.5 Co-Tangentialräume und Differentialformen hatten wir bereits einen anderen Einbettungssatz kennengelernt:

Differenzierbar einbetten heißt dabei, dass es eine differenzierbare injektive Abbildung von M nach R2n gibt. Die Injektivität ist dabei gleichbedeutend mit dem Verbot von Selbstüberschneidungen.

Man sieht, dass der Einbettungssatz von Nash weiter geht als der Einbettungssatz von Whitney: Statt nur einer differenzierbaren injektiven Einbettung wird sogar die Existenz einer isometrischen (längenerhaltende) Einbettung bewiesen.

Wenn man jede differenzierbare Mannigfaltigkeit im euklidischen Raum überschneidungsfrei und differenzierbar einbetten kann, so kann man über diese Einbettung auch eine Metrik auf dieser Mannigfaltigkeit induzieren. Man kann also jede differenzierbare Mannigfaltigkeit mit einer Riemannschen Metrik versehen! Das macht allerdings nicht immer wirklich Sinn! In Kapitel 5.1.5 Co-Tangentialräume und Differentialformen hatten wir beispielsweise eine Mannigfaltigkeit kennengelernt, auf der sich eine Metrik nicht in natürlicher Weise definieren lässt: die projektiven Ebene. In solchen Fällen macht auch die über eine Einbettung induzierte Metrik wenig Sinn, da sie für Nichts zu gebrauchen ist.

Für die Metrik gibt es noch einige andere Schreibweisen, auf die wir hier kurz eingehen wollen. So kann man das Tensorprodukt von Co-Tangentialvektoren   dxμ|p   (zu Co-Tangentialvektoren siehe Kapitel 5.1.5 Co-Tangentialräume und Differentialformen ) verwenden, um die Metrik zu definieren:

  • Definition der Metrik über Tensorprodukt:

    Der metrische Tensor g(p) wird definiert als bilineare, positiv definite (oder zumindest nicht ausgeartete) Abbildung über die Gleichung

      g(p)   :=   ∑μν   gμν(p) dxμ|p ο dxν|p

    Dabei ist das Tensorprodukt   dxμ|p ο dxν|p   definiert durch die Gleichung

      [dxμ|p ο dxν|p] (u(p), v(p))   :=     [dxμ|p u(p)]   [dxν|p v(p)]   =   uμ(p) vν(p)

    Wir schreiben wie oben dann abgekürzt   [g(p) (u(p), v(p))]   =:   g(u(p), v(p))  . Es folgen die von oben bereits bekannten Beziehungen   g(u(p), v(p))   =   ∑μν   uμ(p) vν(p) gμν(p)   mit   gμν(p)   =   g( d/dxμ|p , d/dxν|p )  .

Übrigens kennen wir das Tensorprodukt bereits von der Cartan'schen Schreibweise der Krümmung aus Kapitel 5.1.8 Krümmung . Dort hatten wir das äußere Produkt (Dachprodukt) von Co-Tangentialvektoren definiert durch   [ dxμ Λ dxν ] (u, v)   :=   uμ vν − uν vμ  . Wir sehen nun, dass dieses Dachprodukt einfach ein antisymmetrisiertes Tensorprodukt ist:

  dxμ Λ dxν   =   dxμ ο dxν   − dxν ο dxμ  

(wobei das Minuszeichen analog zum Tensorprodukt oben über die Werte definiert ist: einfach Mal durch Minus ersetzen). Das Argument p haben wir hier weggelassen.

In der physikalischen Literatur findet man häufig die Schreibweise

  ds2   =   ∑μν   gμν dxμ dxν

Diese Schreibweise kann man auf zwei gleichwertige Arten interpretieren (siehe z.B. http://theory.gsi.de/~vanhees/faq/gravitation/node24.html ):


Metrik und affiner Zusammenhang:

Wir haben mit der Metrik in diesem Kapitel eine neue Struktur kennengelernt, die sich neben dem affinen Zusammenhang zusätzlich auf einer Mannigfaltigkeit definieren lässt, und die Begriffe wie Länge, Abstand und Winkel ermöglicht. Es stellt sich die Frage, ob man eine sinnvolle Verbindung zwischen der Metrik und dem affinen Zusammenhang herstellen kann.

Am einfachsten ist es, sich dazu wieder an unserer Anschauung zu orientieren und eine in Rn eingebettete Mannigfaltigkeit zu betrachten, z.B. eine gekrümmte Fläche im dreidimensionalen Raum. Die Einbettung induziert dann zugleich einen affinen Zusammenhang und eine Metrik auf der Mannigfaltigkeit, wobei die Torsion des Zusammenhangs Null ist (d.h. die Christoffelsymbole sind symmetrisch). Da die Einbettung also zugleich beide Strukturen induziert, könnte dies zu einer Verbindung zwischen beiden Strukturen führen.

Wie können wir diese Verbindung aufspüren? Betrachten wir dazu eine Kurve γ(t) auf der Mannigfaltigkeit und zwei Vektorfelder   u(γ(t))   und   v(γ(t))   entlang dieser Kurve, so dass wir   g(u(γ(t)), v(γ(t)))   bilden können. Um neben der Metrik auch den affinen Zusammenhang ins Spiel zu bringen, wollen wir uns die Veränderung der Metrik entlang der Kurve ansehen. Dabei wird die Veränderung der Tangentialvektoren entlang der Kurve ins Spiel kommen, und die wird ja durch die kovariante Ableitung und damit durch den affinen Zusammenhang bestimmt.

Die Veränderung der Metrik zwischen den beiden Vektorfeldern im Punkt   p = γ(0)   ist gegeben durch   d g(u(γ(t)), v(γ(t))) / dt |t = 0  . Aufgrund der Einbettung können wir die folgende Rechnung durchführen:

  d g(u(γ(t)), v(γ(t))) / dt |t = 0   =   ...

wir verwenden das euklidische Skalarprodukt im Einbettungsraum

...   =   d á u(γ(t)), v(γ(t)) ñ / dt |t = 0   =   ...

Produktregel anwenden (diese gilt aufgrund der oben angegebenen Definition des euklidischen Skalarproduktes):

...   =   á du(γ(t)) / dt |t = 0 , v(p) ñ   +   á u(p) , dv(γ(t))) / dt |t = 0 ñ   =   ...

Da u(p) (und analog v(p) ) im Tangentialraum T(p) liegen, und da das Skalarprodukt mit u(p) nur von der Projektion des jeweils anderen Vektors auf u(p) (analog für v(p) ) abhängt, können wir im Skalarprodukt den Projektionsvektor P|T(p) auf den Tangentialraum einfügen, ohne den Wert des Skalarproduktes dadurch zu verändern:

...   =   á P|T(p) du(γ(t)) / dt |t = 0 , v(p) ñ   +   á u(p) , P|T(p) dv(γ(t))) / dt |t = 0 ñ   =   ...

Die durch die Einbettung induzierte kovariante Ableitung ist nun gerade definiert als   Dw(p)u   :=   P|T(p) du(γ(t)) / dt |t = 0   (siehe Kapitel 5.1.6 Kovariante Ableitung und Paralleltransport ). Dabei ist w(p) der zur Kurve γ(t) in t=0 gehörende Tangentialvektor, d.h. aufgrund der Einbettung ist   w(p) = dγ(t)/dt|t = 0  . Wir können also weiter schreiben:

...   =   á Dw(p)u , v(p) ñ   +   á u(p) , Dw(p)v ñ   =   ...

Da die Vektoren im Skalarprodukt alle Tangentialvektoren sind, können wir das Skalarprodukt wieder durch die Metrik ersetzen und erhalten

...   =   g( Dw(p)u , v(p) )   +   g( u(p) , Dw(p)v )

Unseren Startterm können wir andererseits auch schreiben als   d g(u(γ(t)), v(γ(t))) / dt |t = 0   =   w(p) g(u,v)   , denn g(u,v) ist eine skalare Funktion auf der Mannigfaltigkeit, und w(p) liefert die Richtungsableitung in Kurvenrichtung. Insgesamt haben wir also das folgende Ergebnis:

  • Zusammenhang zwischen Metrik und kovarianter Ableitung, wenn beide durch eine Einbettung induziert werden (Verträglichkeitsbedingung):

      w(p) g(u,v)   =   g( Dw(p)u , v(p) )   +   g( u(p) , Dw(p)v )

Man kann diese Verträglichkeitsbedingung so interpretieren:

Halten wir fest: Werden Metrik und affiner Zusammenhang beide durch eine Einbettung induziert, so gilt die Verträglichkeitsbedingung   w(p) g(u,v)   =   g( Dw(p)u , v(p) )   +   g( u(p) , Dw(p)v )  , d.h. Metrik und affiner Zusammenhang sind nicht unabhängig voneinander. Außerdem ist die Torsion gleich Null (dies ist immer der Fall, wenn der affine Zusammenhang durch eine Einbettung induziert wird).

Gehen wir nun einen Schritt weiter und lassen die Einbettung weg. Dann sind wir natürlich nicht mehr gezwungen, die obige Verträglichkeitsbedingung zwischen Metrik und affinem Zusammenhang anzunehmen. Wir könnten beides als voneinander unabhängige Strukturen auf der Mannigfaltigkeit nebeneinander bestehen lassen. Eine geodätische Linie (definiert als geradeste Linie im Sinne des affinen Zusammenhangs) hätte dann nichts mit einer Geodäte (der kürzesten Linie im Sinne der Metrik) zu tun.

Dennoch ist zu erwarten, dass es in vielen Fällen nützlich sein kann, wenn man einen affinen Zusammenhang auf der Mannigfaltigkeit verwendet, der die Verträglichkeitsbedingung mit einer vorgegebenen Metrik erfüllt. Oft ist es zusätzlich nützlich, diesen Zusammenhang torsionsfrei zu wählen, so wie das bei einer Einbettung der Fall ist. Bleibt die Frage: Geht das immer, und wie eindeutig ist der affine Zusammenhang durch die Verträglichkeitsbedingung mit der Metrik und durch die Forderung nach Torsionsfreiheit festgelegt? Hier ist die Antwort:

  • Hauptsatz der Riemannschen Geometrie:
    Zu jeder Riemannschen oder Semi-Riemannschen Mannigfaltigkeit mit gegebener (positiv definiter oder zumindest nicht ausgearteter) Metrik g existiert genau ein affiner torsionsfreier Zusammenhang (gleichbedeutend mit der kovarianten Ableitung), der die obige Verträglichkeitsbedingung erfüllt. Man bezeichnet diesen Zusammenhang auch als Levi-Civita-Zusammenhang bzw. als (Semi-) Riemannschen Zusammenhang.

Den Beweis werden wir uns etwas weiter unten ansehen, wenn wir die Verträglichkeitsbedingung in Koordinaten ausschreiben. Koordinatenfreie Beweise finden sich in vielen Textbüchern der Differentialgeometrie oder auch in Differentialgeometrie 2 von Professor Grundhöfer ( http://www.lohnt-nicht.de/files/studium/Diffgeo2.ps ). Zur Verdeutlichung sei hier noch einmal gesagt, dass man neben der Verträglichkeitsbedingung die Torsionsfreiheit explizit fordern muss, um die Eindeutigkeit des Zusammenhangs zu erzielen. Es gibt auch affine Zusammenhänge, die die Verträglichkeitsbedingung erfüllen, die aber nicht torsionsfrei sind. Man spricht dann von metrischen Zusammenhängen mit Torsion.

Es gibt eine interessante Formulierung, die gleichwertig zur Verträglichkeitsbedingung   w(p) g(u,v)   =   g( Dw(p)u , v(p) )   +   g( u(p) , Dw(p)v )   von oben ist, und die die anschauliche Bedeutung dieser Bedingung noch einmal klar macht (siehe z.B. Differentialgeometrie 2 von Professor Grundhöfer ( http://www.lohnt-nicht.de/files/studium/Diffgeo2.ps ). Hier ist sie:

Besonders anschaulich ist der Fall, bei dem die Kurve γ(t) eine geodätische Linie ist (z.B. ein Großkreis auf einer Kugeloberfläche). Wählt man die Kurvenparametrisierung geeignet, so kann man für den Tangentialvektor w(p) der Kurve in jedem Punkt p auf der Kurve die Bedingung   Dw(p)w = 0   erreichen, d.h. die Tangentialvektoren der Kurve bilden ein Parallel-Vektorfeld entlang der Kurve. Paralleltransportiert man nun einen Vektor u(p) entlang der geodätischen Linie und konstruiert so ein Parallel-Vektorfeld u, so gilt nach dem oben Gesagten überall auf der Kurve, dass   g( u(γ(t)), w(γ(t)) )   konstant ist. Der Winkel zwischen dem Vektor u und der Gerade-aus-Richtung der geodätischen Linie (gegeben durch w) ändert sich also beim Paralleltransport nicht! Genau so würde man sich beispielsweise den Paralleltransport eines Vektors entlang eines Großkreises auf einer Kugeloberfläche vorstellen:



Paralleltransport eines Vektors entlang entlang dreier Großkreise (geodätischer Linien) auf der Kugeloberfläche.
Der Winkel zwischen dem Vektor und dem Großkreis ändert sich beim Paralleltransport nicht.



Verträglichkeitsbedingung in Koordinatendarstellung; Torsion:

Wir wollen nun die Verträglichkeitsbedingung von oben in Koordinaten ausschreiben, um den Zusammenhang zwischen den Christoffelsymbolen und den Komponenten der Metrik explizit zu sehen. Die Verträglichkeitsbedingung lautet (siehe oben):

  w(p) g(u,v)   =   g( Dw(p)u , v(p) )   +   g( u(p) , Dw(p)v )

Betrachten wir zunächst die linke Seite (wir lassen Argumente wie p weg, um die Schreibweise kompakt zu halten):

  w(p) g(u,v)   =   ∑μ   wμ d/dxμ ( ∑ν ρ gνρ uν v ρ )   =  
  =   ∑μν ρ   ( [dgνρ/dxμ] wμ uν v ρ   +   gνρ wμ [duν/dxμ] v ρ   +   gνρ wμ uν [dv ρ/dxμ] )

Und nun zur rechnen Seite. Um diesen Term mit dem Ausdruck hinter dem Gleichheitszeichen vergleichen zu können, nennen wir im zweiten Schritt die Indices hinter dem Gleichheitszeichen entsprechend um (so dass w den Index μ , u den Index ν und v den Index ρ erhält) und sortieren ein wenig:

  g( Dw(p)u , v(p) )   +   g( u(p) , Dw(p)v )   =  

  =   ∑μν   gμν ( ∑ρ wρ [duμ/dx ρ]   +   ∑ρσ u ρ Γμσρ wσ ) vν   +  
  +   ∑μν   gμν uμ ( ∑ρ wρ [dvν/dx ρ]   +   ∑ρσ v ρ Γνσρ wσ )   =  

  =   ∑μν ρ   ( gμν wρ [duμ/dx ρ] vν   +   gμν wρ uμ [dvν/dx ρ] )   +  
  +   ∑μν ρσ   ( gμν Γμσρ wσ u ρ vν   +   gμν Γνσρ wσ uμ v ρ )   =  

  =   ∑μν ρ   ( gνρ wμ [duν/dxμ] vρ   +   gνρ wμ uν [dvρ/dxμ] )   +  
  +   ∑μν ρσ   ( gσρ Γσμν wμ uν vρ   +   gνσ Γσμρ wμ uν vρ )

Insgesamt haben wir also

  ∑μν ρ   ( [dgνρ/dxμ] wμ uν v ρ   +   gνρ wμ [duν/dxμ] v ρ   +   gνρ wμ uν [dv ρ/dxμ] )   =  

  =   ∑μν ρ   ( gνρ wμ [duν/dxμ] vρ   +   gνρ wμ uν [dvρ/dxμ] )   +  
  +   ∑μν ρσ   ( gσρ Γσμν wμ uν vρ   +   gνσ Γσμρ wμ uν vρ )

Wie wir sehen, fallen einige Terme weg, da sie auf beiden Seiten des Gleichheitszeichens vorkommen. Es bleibt übrig:

  ∑μν ρ   [dgνρ/dxμ] wμ uν v ρ   =   ∑μν ρσ   ( gσρ Γσμν wμ uν vρ   +   gνσ Γσμρ wμ uν vρ )

Da diese Gleichung für alle Vektoren u, v und w erfüllt sein muss, erhalten wir schließlich als Ergebnis

  • Verträglichkeitsbedingung in Koordinatendarstellung:

      [dgνρ/dxμ]   =   ∑σ   ( gσρ Γσμν   +   gνσ Γσμρ )

Diese Gleichung liefert einen Zusammenhang zwischen der Metrik und den Christoffelsymbolen (und damit dem affinen Zusammenhang). Man kann diese Gleichung (unter bestimmten Voraussetzungen) mit einem Trick invertieren und so nach den Christoffelsymbolen freistellen (siehe z.B. http://en.wikipedia.org/wiki/Fundamental_theorem_of_Riemannian_geometry ). Dazu schreiben wir die Gleichung dreimal mit geschickter Indexbenennung auf: einmal wie zuvor, einmal mit Indices ρ und μ vertauscht und einmal mit anschließend noch vertauschten Indices ν und ρ :

  [dgνρ/dxμ]   =   ∑σ   ( gσρ Γσμν   +   gνσ Γσμρ )

  [dgνμ/dxρ]   =   ∑σ   ( gσμ Γσρν   +   gνσ Γσρμ )

  [dgρμ/dxν]   =   ∑σ   ( gσμ Γσνρ   +   gρσ Γσνμ )

Nun addieren wir die ersten beiden Gleichungen und subtrahieren die dritte Gleichung:

  [dgνρ/dxμ]   +   [dgνμ/dxρ]   −   [dgρμ/dxν]   =  
  =   ∑σ   ( gσρ Γσμν   +   gνσ Γσμρ   +   gσμ Γσρν   +   gνσ Γσρμ   −   gσμ Γσνρ   −   gρσ Γσνμ )

Mit Hilfe der Torsion   T ρνμ   :=     Γ ρνμ − Γ ρμν   (siehe Kapitel 5.1.7 Torsion ) und unter Verwendung der Symmetrie der Metrik können wir dies schreiben als

  [dgνρ/dxμ]   +   [dgνμ/dxρ]   −   [dgρμ/dxν]   =  
  =   ∑σ   ( gσρ Tσμν   +   gσμ Tσρν   +   gνσσρμ   +   Γσμρ) )

An dieser Stelle brauchen wir nun unsere zweite Voraussetzung: Wir betrachten nur noch torsionsfreie affine Zusammenhänge, d.h. wir fordern   Tσμν = 0  . Die Christoffelsymbole sollen also symmetrisch in den beiden unteren Indices sein, so wie das bei affinen Zusammenhängen der Fall ist, die durch eine Einbettung induziert werden. Die Gleichung vereinfacht sich damit zu

  [dgνρ/dxμ]   +   [dgνμ/dxρ]   −   [dgρμ/dxν]   =   ∑σ   2 gνσ Γσρμ

Wir hatten oben vorausgesetzt, dass die Metrik nicht ausgeartet ist, so dass wir die Matrix mit den Komponenten   gμν   invertieren können. Die Komponenten der inversen Matrix schreiben wir als   gμν  , d.h. wir verlangen

  ∑ρ   gμρ   gρν   =   δμν

(den Grund für diese Schreibweise werden wir weiter unten noch kennenlernen; er hat etwas mit der Identifikation von Tangential- und Cotangentialvektoren zu tun, d.h. mit dem sogenannten Hochziehen von Indices). Damit können wir die metrischen Matrixelemente oben auf die linke Seite bringen und so die Gleichung nach den Christoffelsymbolen freistellen:

  • Zusammenhang zwischen Christoffelsymbolen und Metrik im torsionsfreien Fall:

      Γ τρμ   = ∑ν   1/2 gτν   ( [dgνρ/dxμ]   +   [dgνμ/dxρ]   −   [dgρμ/dxν] )

Die Gleichung ist symmetrisch in μ und ρ, wie es wegen der geforderten Torsionsfreiheit sein muss. Und: Die Gleichung ermöglicht es uns, bei gegebener Metrik die Christoffelsymbole eindeutig auszurechnen! Damit liefert diese Gleichung einen Beweis für den Hauptsatz der Riemannschen Geometrie! Übrigens ist diese Gleichung nicht unbedingt der beste Weg, um bei gegebener Metrik die Christoffelsymbole auch praktisch zu berechnen. Hier gibt es noch andere, praktikablere Methoden, auf die wir an dieser Stelle aber nicht eingehen wollen.

Wie sieht es nun in dem Fall mit Torsion aus? Die entsprechenden Christoffelsymbole können wir in einen symmetrischen und einen antisymmetrischen Anteil aufteilen, wobei der symmetrische Anteil mit der Metrik verträglich sein soll. Die Idee dabei ist: Wir starten mit symmetrischen Christoffelsymbolen, die mit der Metrik verträglich sind (wir starten also mit einem Levi-Civita-Zusammenhang), und fügen einen antisymmetrischen Anteil hinzu, wobei Torsion ins Spiel kommt. Nun sehen wir nach, ob dieser antisymmetrische Anteil die Metrik-Verträglichkeit beeinträchtigt:

  Γ ρμν   =   1/2 (Γ ρμν + Γ ρνμ)   +   1/2 (Γ ρμν − Γ ρνμ)   =:   [Γsymm] ρμν   +   1/2 T ρμν

Diese Christoffelsymbole sollen mit der Metrik verträglich sein, d.h. wir können die Gleichung von oben verwenden, kurz bevor wir die Torsion gleich Null gesetzt haben (wobei wir   Γσρμ   +   Γσμρ   =   2 [Γsymm]σρμ   einsetzen) :

  [dgνρ/dxμ]   +   [dgνμ/dxρ]   −   [dgρμ/dxν]   =  
  =   ∑σ   ( gσρ Tσμν   +   gσμ Tσρν   +   2 gνσsymm]σρμ )

Der symmetrische Anteil erfüllt nach Voraussetzung diese Verträglichkeitsbedingung mit Torsion Null sowieso, d.h. es gilt:

  [dgνρ/dxμ]   +   [dgνμ/dxρ]   −   [dgρμ/dxν]   =  
  =   ∑σ   2 gνσsymm]σρμ

Ziehen wir diese Gleichung von der vorhergehenden ab, so sehen wir, dass der antisymmetrische Anteil (die Torsion) die folgende Verträglichkeitsbedingung erfüllen muss:

0   =   ∑σ   ( gσρ Tσμν   +   gσμ Tσρν )

Diese Bedingung muss erfüllt sein, damit der Zusammenhang (der jetzt Torsion besitzen darf) mit der Metrik verträglich ist! Eine Lösung dieser Bedingung ist   Tσμν = 0  , also der torsionsfreie Fall. Es mag aber durchaus weitere Lösungen geben, so dass es im Allgemeinen mehrere Metrik-verträgliche affine Zusammenhänge geben wird, wenn wir Torsion zulassen. Erst wenn wir Torsionsfreiheit fordern, legt die Verträglichkeitsbedingung den affinen Zusammenhang eindeutig fest!

Betrachten wir wieder das Beispiel, das wir aus den beiden Kapiteln 5.1.7 Torsion und 5.1.8 Krümmung bereits kennen: den reellen dreidimensionalen euklidischen Raum mit dem konstanten total antisymmetrischen affinen Zusammenhang   Γ ρνμ   =   ε ρνμ  , d.h.   T ρνμ   =   2 ε ρνμ  . Dabei ist   ε ρνμ   gleich Null für zwei gleiche Indices, antisymmetrisch bei Vertauschung zweier Indices und es ist   ε 12 3 = ε 23 1 = ε 31 2 = 1  . In Kapitel 5.1.7 Torsion hatten wir gesehen, dass die geodätischen Linien hier einfach Geraden sind, denn in die Geodätengleichung geht nur der symmetrische Anteil der Christoffelsymbole ein. Eine Parallelverschiebung entlang einer Geraden führt dabei zu einer Drehung um die Gerade, so dass sich eine schraubenförmige Bewegung ergibt.

Obwohl die geodätischen Linien Geraden im dreidimensionalen Raum sind, hatten wir am Ende von Kapitel 5.1.8 Krümmung gesehen, dass die Krümmung für dieses Beispiel nicht Null ist! Dies hängt mit der schraubenförmigen Drehbewegung beim Paralleltransport zusammen. Sie bewirkt, dass sich ein Vektor, den man auf einer kleinen Rundreise paralleltransportiert, bei der Rückkehr zum Ausgangspunkt verändert hat.

Dieses Verhalten ist etwas überaschend. Wir können nun den Grund dafür erkennen: Die anschaulich gewohnte Bedeutung haben Krümmung und affiner Zusammenhang nur, wenn sie durch eine Einbettung induziert werden können. Dies ist bei Torsion nicht der Fall. Der torsionsfreie Levi-Civita-Zusammenhang dagegen ist durch die Metrik eindeutig bestimmt und kann zusammen mit der Metrik durch eine Einbettung induziert werden -- schließlich haben wir die Verträglichkeitsbedingung oben zunächst anschaulich anhand einer Einbettung formuliert. In diesem Fall erst haben Krümmung, Paralleltransport usw. die anschauliche Bedeutung, die wir intuitiv erwarten. Der Grund dafür liegt einfach darin, dass wir alle Begriffe ja anschaulich aufgrund einer Einbettung definiert haben. Kommt Torsion ins Spiel, so geht diese anschauliche Begründung der Begriffe verloren, und wir erleben die eine oder andere Überaschung.

Übrigens: Wir sehen, dass der total antisymmetrische affine Zusammenhang sogar mit der üblichen euklidischen Metrik verträglich ist. Dazu setzen wir in   0   =   ∑σ   ( gσρ Tσμν   +   gσμ Tσρν )   einfach   gσρ = δσρ   sowie   T ρνμ   =   2 ε ρνμ   ein:

  0   =   ∑σ   ( δσρ 2 εσμν   +   δσμ 2 εσρν )   =   2 (ε ρμν   +   ε μρν )

Diese Gleichung ist erfüllt, da wegen der Antisymmetrie   ε ρμν   =   − ε μρν   gilt. Damit haben wir im dreidimensionalen Raum ein Beispiel für einen affinen Zusammenhang vor uns, der kein Levi-Civita-Zusammenhang ist (weil er nicht torsionsfrei ist), der aber dennoch mit der euklidischen Metrik verträglich ist!


Geödätische Linien (geradeste Linien) und Geodäten (kürzeste Linien):

In Kapitel 5.1.6 Kovariante Ableitung und Paralleltransport hatten wir geodätische Linien als die geradesten Kurven im Sinne des affinen Zusammenhangs definiert. Damit meinen wir, dass die kovariante Ableitung des Tangentialvektors v(γ(t)) der geodätischen Linie γ an jedem Punkt γ(t) proportional zum Tangentialvektor selbst ist. Die Anschauung dahinter ist: Bei einer Einbettung soll die Beschleunigung nur in Bewegungsrichtung oder senkrecht zur Fläche wirken, aber nicht tangential zur Fläche nach rechts oder links. Es soll also gelten:

  Dv(γ(t)) v   =   c(t) v(γ(t))

wobei man durch Umparametrisierung der Kurve c(t) = 0 erreichen kann, so dass die Tangentialvektoren der Kurve ein Parallelfeld entlang der Kurve bilden (anschaulich wirkt dann die Beschleunigung nur senkrecht zur Fläche).

Die Metrik bietet nun die Möglichkeit, eine andere Sorte von Linien zu definieren: die kürzeste Linie zwischen zwei Punkten. Diese Linien nennt man Geodäten. Wie kann man eine solche Linie nun ausrechnen?

Oben hatten wir die Länge L(γ,a,b) einer Kurve γ zwischen zwei Punkten   pa := γ(a)   und   pb := γ(b)   definiert durch

  L(γ,a,b)   :=   ∫ab   √ g( dγ(t)/dt, dγ(t)/dt )   dt

Um die Geodäte zwischen den Punkten pa und pb zu finden, müssen wir diejenige Kurve γ suchen, die   pa = γ(a)   und   pb = γ(b)   erfüllt und die das Funktional   L(γ,a,b)   minimiert. Wie so etwas mit Hilfe der Variationsrechnung geht, ist in Die Grenzen der Berechenbarkeit, Kapitel 5.4.3 Die Quantisierung der klassischen Mechanik beim Prinzip der kleinsten Wirkung ausführlich beschrieben. Als Ergebnis erhält man eine Differentialgleichung für die Kurve γ , die man auch als Euler-Lagrange-Gleichung der Geodäten bezeichnet. Wir wollen die mühsame Rechnung hier nicht durchführen (siehe z.B. Matt Visser: Math 464: Notes on differential geometry, Victoria University of Wellington, New Zealand, 2004, http://www.mcs.vuw.ac.nz/courses/MATH464/2004T1/Lecture-Notes/notes.ps ), sondern gleich das Ergebnis angeben: Die Euler-Lagrange-Gleichung ist für einen Levi-Civita-Zusammenhang identisch mit der Differentialgleichung für eine geodätische Linie. Es gilt also:

  • Für einen Levi-Civita-Zusammenhang (d.h. der affine Zusammenhang ist mit der Metrik verträglich und die Torsion ist Null) sind geodätische Linien und Geodäten identisch. Die kürzeste Verbindung zwischen zwei Punkten (also die Geodäte) ist zugleich eine geodätische Linie (also eine der geradesten Verbindungen).

Anmerkung: Im Prinzip sind mehrere geodätische Linien zwischen zwei Punkten möglich. So kann man auf einer Kugeloberfläche einen Großkreis immer auf zwei verschiedene Arten zwischen zwei Punkten durchlaufen: entweder man nimmt den direkten Weg oder man läuft den langen Weg auf der anderen Seite der Kugel herum. Die kürzeste der geodätischen Linien ist dabei dann zugleich die Geodäte (also die kürzeste aller Linien zwischen den Punkten).

Noch eine Randbemerkung zur Krümmung: Wir hatten die Krümmung in Kapitel 5.1.8 Krümmung allein mit Hilfe des affinen Zusammenhangs definiert, nämlich über die im-Kreis-Parallelverschiebung eines Tangentialvektors. Man könnte jedoch die Krümmung auch mit Hilfe der Metrik definieren. So gilt auf einer Kugeloberfläche nicht mehr, dass die Summe der Winkel eines Dreiecks (definiert durch die Metrik) gleich 180 Grad ist, oder dass der Umfang eines Kreises gleich 2 mal Pi mal dem Radius ist. Diese Abweichungen liefern anschaulich ebenfalls eine Definitionsmöglichkeit für die Krümmung. Das schöne am Levi-Civita-Zusammenhang ist nun, dass sich die Definition der Krümmung aufgrund des affinen Zusammenhangs mit der Definition aufgrund der Metrik in Übereinstimmung bringen lässt. Beide Definitionsmöglichkeiten erweisen sich dann als gleichwertig!


Identifikation von Tangentialvektoren und Co-Tangentialvektoren; Hoch- und Runterziehen von Indices:

Bei einer n-dimensionalen Mannigfaltigkeit sind sowohl der Tangentialraum T(p) als auch der Co-Tangentialraum T*(p) an einem Punkt p n-dimensionale reelle Vektorräume, so dass man natürlich bijektive Abbildungen zwischen diesen Vektorräumen definieren kann, die jedem Tangentialvektor eindeutig einen Co-Tangentialvektor zuordnen. In Kapitel 5.1.5 Co-Tangentialräume und Differentialformen hatten wir allerdings auch gesehen, dass sich zunächst keine solche Abbildung in natürlicher Weise anbietet. Dies ändert sich, sobald man über eine reellwertige bilineare nicht ausgeartete Abbildung auf den Tangentialräumen verfügt. Die Metrik ist eine solche Abbildung!

Ein Co-Tangentialvektor ω(p) aus T*(p) ordnet jedem Tangentialvektor u(p) aus T(p) eine relle Zahl   ω(p) u(p)   zu. Co-Tangentialvektoren sind ja lineare Abbildungen (Linearformen) auf dem Tangentialraum mit Werten in den reellen Zahlen.

Die Metrik wiederum ordnet zwei Tangentialvektoren v(p) und u(p) aus T(p) eine reelle Zahl zu. Die Idee ist nun die folgende:

  • Identifikation von Tangential- und Co-Tangentialvektoren über die Metrik:

    Einem Tangentialvektor v(p) ordnet man denjenigen Co-Tangentialvektor (nennen wir ihn   g*(v(p))   ) zu, der angewendet auf alle u(p) aus T(p) den Wert der Metrik von v(p) mit u(p) ergibt:

      [g*(v(p))] u(p)   :=   g(v(p), u(p))

    Diese Definition der Abbildung g* ist koordinatenunabhängig! In Koordinaten wollen wir die folgende Schreibweise verwenden:

      g*(v(p))   =:   ∑μ   vμ(p) dxμ|p  

    Dadurch ist   vμ(p)   (mit Index unten) definiert. Es gilt also:
      ∑μ   vμ(p) uμ(p)   =   ∑νμ   vν(p) gνμ(p) uμ(p)
    Da diese Gleichung für alle uμ(p) gelten soll, folgt:

      vμ(p)   =   ∑ν   vν(p) gνμ(p)

    Damit sieht man, dass die Abbildung g* eindeutig definiert ist. Man bezeichnet dies als Herunterziehen der Indices (dies ist der Grund dafür, warum wir den Stern bei g* unten geschrieben haben: g* zieht bei den Komponenten den Index herunter)!

Man kann sich den Co-Tangentialvektor   g*(v(p))   gleichsam als die linke Seite der Metrik vorstellen. In der Quantentheorie (in der an die Stelle der Metrik ein Skalarprodukt auf einem unendlich-dimensionalen Vektorraum tritt) macht man diese Idee durch Diracs Bra-Ket-Schreibweise besonders deutlich (siehe Kapitel 4.5 Das mathematische Gerüst der Quantentheorie ): Das Skalarprodukt schreibt man dort als   á u | v ñ  , man schreibt   | v ñ   für den Vektor und   á u |   für den Co-Vektor, der zum Vektor   | u ñ   gehört. Nun liefert   á u |   angewendet auf   | v ñ   einfach   á u | v ñ  , d.h. man kann den Co-Vektor   á u |   gleichsam als linken Teil des Skalarproduktes   á u | v ñ   auffassen.

Noch einige Bemerkungen zum Gradienten: Im euklidischen Einbettungsraum mit euklidischen Koordinaten xμ definiert man den Gradienten einer skalaren Funktion Φ einfach durch den Vektor mit den Komponenten   dΦ/dxμ  . Man bezeichnet diesen Vektor als   grad Φ  . Für die Richtungsableitung entlang einer Kurve γ gilt:

  dΦ(γ(t)) / dt   =   ∑μ   dΦ/dxμ   dγμ/dt   =   á grad Φ | dγ/dt ñ

Nun gilt diese Gleichung genau in dieser Form auch, wenn die Koordinaten xμ krummlinige Koordinaten sind, denn die Gleichung repräsentiert dann einfach die Kettenregel. Die Gleichung ist nun aber als Definition für den Vektor   grad Φ   aufzufassen. In diesem Fall sind die Komponenten von   grad Φ   (definiert durch die Gleichung   grad Φ   =   ∑μ   (grad Φ)μ dX/dxμ  ) aber nicht mehr unbedingt gleich   dΦ/dxμ  . Es gilt vielmehr

  ∑μ   dΦ/dxμ   dγμ/dt   =   á grad Φ | dγ/dt ñ   =   ∑νμ   (grad Φ)ν   dγμ/dt   á dX/dxν | dX/dxμ ñ

wobei X einfach der von den Koordinaten x abhängige Vektor im Rn ist. Schreiben wir wieder   á dX/dxν | dX/dxμ ñ   =:   gνμ  , so haben wir also   dΦ/dxμ   =   ∑ν   (grad Φ)ν   gνμ   oder mit Hilfe der inversen Matrix   (grad Φ)ν   =   ∑μ   gνμ   dΦ/dxμ  . Auf diese Weise kann man beispielsweise den Gradienten in Kugelkoordinaten im R3 ausrechnen -- das Ergebnis findet man in vielen mathematischen Formelsammlungen.

All dies lässt sich direkt auf eine Mannigfaltigkeit übertragen: Man definiert zunächst die Gradienten-1-Form von Φ einfach als   dΦ   =   ∑μ dΦ/dxμ dxμ   (das kennen wir schon aus Kapitel 5.1.5 Co-Tangentialräume und Differentialformen , wobei wir die Koordinatenfunktion f nicht explizit mitschreiben). Nun kann man diesem Co-Tangentialvektor durch die Umkehr-Abbildung von g* , die wir mit g* bezeichnen wollen (da sie den Index hochzieht), den Gradientenvektor   grad Φ   :=   g*(dΦ)   zuordnen. Zur Verdeutlichung: g* erfüllt die Bedingung   ω(p) u(p)   =:   g( g*(ω(p)), u(p) )  . In Komponenten ist dann   grad Φ   =   ∑ν   (grad Φ)ν d/dxν   mit   (grad Φ)ν   =   ∑μ   gνμ   dΦ/dxμ  .


Bemerkungen über Symplektische Geometrie und Hamiltonsche Mechanik:

Die Metrik haben wir oben als symmetrische bilineare nicht-ausgeartete Abbildung auf den Tangentialvektoren eingeführt. Man kann sich natürlich fragen, ob es nicht noch andere Abbildungen (Tensoren) gibt, die man auf den Tangential- und Co-Tangentialvektoren einer Mannigfaltigkeit definieren kann, und die weitere nützliche Strukturen dort bilden. Wie wäre es beispielsweise mit einer antisymmetrischen bilinearen Abbildung?

Es gibt viele Beispiele für solche nützlichen Abbildungen, und ich möchte zum Abschluss dieses Kapitels eine spezielle davon als Beispiel herausgreifen: die symplektische 2-Form ω (hat nichts mit dem oben verwendeten Co-Tangentialvektor zu tun; weitere Infos siehe z.B. http://en.wikipedia.org/wiki/Symplectic_geometry ). Diese 2-Form ist wie die Metrik einfach eine bilineare, nicht ausgeartete Abbildung von den Tangentialräumen in die reellen Zahlen. Der wichtigste Unterschied zur Metrik ist, dass ω antisymmetrisch ist, d.h.   ω(u,v)   =   − ω(v,u)  . Außerdem fordert man noch, dass ω geschlossen ist, d.h. dω = 0 (wir wollen darauf hier nicht genauer eingehen -- ein Analogon bei Vektoren wäre die Forderung, dass die Divergenz eines Vektorfeldes verschwindet).

Wie oben bei der Metrik kann man auch die symplektische 2-Form dazu verwenden, um eine Abbildung zwischen Tangential- und Co-Tangentialvektoren zu definieren. Man ersetzt dazu in den Formeln oben einfach überall g durch ω. Für eine skalare Funktion Φ kann man dann auch das Analogon zum Gradienten definieren:

  dΦ(p) u(p)   =:   ω( ω*(dΦ(p)), u(p) )

Mit Hilfe der symplektischen 2-Form kann man beispielsweise die Hamiltonsche Mechanik in eine geometrische Sprache übersetzen (Details zur Hamiltonschen Mechanik findet man in Die Grenzen der Berechenbarkeit, Kapitel 5.4.3 Die Quantisierung der klassischen Mechanik ). Dabei setzt man für Φ die Hamilton-Funktion H ein. Man schreibt dabei auch gerne

  dH u   =:   ω( vH, u )     mit     vH   :=   ω*(dH)  

(das p haben wir hier überall zur Vereinfachung weggelassen).   vH wird auch als Hamiltonsches Vektorfeld bezeichnet.

Wir wollen das Beispiel der Hamiltonschen Mechanik noch etwas weiter verfolgen. Dazu stellen wir uns ein System mit n räumlichen Freiheitsgraden vor, z.B. die Bewegung eines Teilchens im dreidimensionalen Raum (also n = 3). Die n Koordinaten, mit denen wir die Bewegung beschreiben wollen, nennen wir qi (dies können z.B. Kugelkoordinaten sein). In der Hamiltonschen Mechanik kommen zu diesen n räumlichen Koordinaten noch n kanonisch konjugierte Impulskoordinaten pi hinzu. Den (lateinischen!) Index i schreiben wir dabei unten, um anzudeuten, dass sich bei einer Koordinatentransformation der qi die Impulse umgekehrt zu den räumlichen Geschwindigkeiten transformieren.

Eine Bewegung wird in der Hamiltonschen Mechanik durch eine Kurve im Phasenraum beschrieben. Die Koordinaten im Phasenraum sind dabei die qi sowie die pi , d.h. der Phasenraum ist 2n-dimensional. Der Koordinatenvektor eines Punktes im Phasenraum lautet also

  x   =   (xμ)   =   (x1, ... , x2n)   =   (q1, ... , qn, p1, ... , pn)   =:   (q, p)

Anmerkung: Der griechische Index μ läuft bis 2n und wird wie bisher bei Koordinaten oben geschrieben. Bei den Impulsen schreiben wir den lateinischen Index i (der von 1 bis n läuft) jedoch unten. Die symplektische 2-Form ω ist nun in der Hamiltonschen Mechanik definiert durch

  ω   :=   ∑i = 1n   dqi Λ dpi

in Analogie zur Schreibweise   g   =   ∑μν   gμν dxμ ο dxν   von oben für die Metrik. Das Dachprodukt Λ hatten wir weiter oben bereits besprochen; Details siehe Kapitel 5.1.8 Krümmung .

Nun können wir das Hamiltonsche Vektorfeld   vH   =   ω*(dH)   explizit ausrechnen. Nach Definition muss nämlich gelten:

  dH u   =   ω( vH, u )

für alle Tangentialvektoren u. Rechnen wir beide Seiten aus, wobei wir H direkt als Funktion der Koordinaten ansehen: H(x) oder auch H(q,p) . Die linke Seite lautet:

  dH u   =   ∑μ   dH/dxμ   uμ   =   ∑i   ( dH/dqi   ui   +   dH/dpi   ui + n )

Für die rechte Seite haben wir

ω( vH, u )   =   ∑i   [dqi Λ dpi] ( vH, u )   =   ∑i   ( vHi ui + n   −   ui vHi + n )

Da linke und rechte Seite für alle u gleich sein müssen, haben wir also

vHi       =   [ω*(dH)]i         =     dH/dpi
vHi + n   =   [ω*(dH)]i + n   =   − dH/dqi

Dies ist das Analogon zu unserer Gradientenformel   (grad Φ)ν   =   ∑μ   gνμ   dΦ/dxμ   von oben!

Dies kann man nun dazu verwenden, um die Hamiltonschen Bewegungsgleichungen aufzuschreiben. Wir betrachten dazu eine Kurve γ(t) im Phasenraum, die die Bewegung beschreibt. Die Koordinaten dieser Kurve schreiben wir einfach als qi(t) und pi(t) . Die Hamiltonschen Bewegungsgleichungen lauten

dqi/dt   =     dH/dpi   =   vHi
dpi/dt   =   − dH/dqi   =   vHi + n

oder zusammengefasst

  dxμ/dt   =   vHμ

Das Hamiltonsche Vektorfeld liefert also gleichsam das Geschwindigkeitsfeld für die Bewegungskurven im Phasenraum.

Man kann hier noch tiefer in die geometrische Formulierung der Hamiltonschen Mechanik einsteigen und beispielsweise Poissonklammern mit Hilfe von ω definieren (schauen Sie sich doch einmal Ausdrücke wie   ω(vf , vg)   oder auch   vg f   an mit skalaren Funktionen f und g auf dem Phasenraum analog zu H). Weiter kann man Koordinaten-Transformationen im Phasenraum untersuchen, unter denen die symplektische Form ω invariant ist. Diese Transformationen nennt man kanonische Transformationen. Ziel ist es dabei, die Hamiltonschen Bewegungsgleichungen in eine möglichst einfache Form zu bringen. Wir wollen aber in diesem Kapitel nicht weiter darauf eingehen, da dies unseren Rahmen sprengen würde. Im nächsten Kapitel werden wir bei der Lie-Ableitung noch einmal kurz auf die Hamiltonsche Mechanik zurückkommen.


Literatur zu dem Thema:


zurück zum Inhaltsverzeichnis

last modified on 30 December 2008