Kapitel 5
Die allgemeine Relativitätstheorie

1   Gekrümmte Räume (über die Grundlagen der Differentialgeometrie)

6   Kovariante Ableitung und Paralleltransport

In den letzten beiden Kapiteln haben wir Tangentialvektorfelder und Co-Tangentialvektorfelder auf Mannigfaltigkeiten kennengelernt und uns damit mit Strukturen befasst, die sich auf differenzierbaren Mannigfaltigkeiten unmittelbar definieren lassen.

Wir wollen uns in diesem Kapitel nun Ableitungen von Tangentialvektorfeldern anschauen. Eine Möglichkeit, dies zu tun, besteht darin, eine weitere Struktur auf der Mannigfaltigkeit zu definieren, die als kovariante Ableitung oder auch als affiner Zusammenhang bezeichnet wird (eine andere Möglichkeit ist die sogenannte Lie-Ableitung, die ein Vektorfeld und den dadurch generierten Fluss voraussetzt -- Details kommen in einem späteren Kapitel). Die Einführung dieser affinen Struktur bewirkt, dass man von differenzierbaren Mannigfaltigkeiten zur sogenannten affinen Geometrie auf diesen Mannigfaltigkeiten übergeht. Es wird nämlich möglich werden, beispielsweise von einer möglichst geraden Kurve (einer geodätischen Linie) zu sprechen.

Wie verändert sich nun also ein Tangentialvektorfeld, wenn wir uns auf einer Mannigfaltigkeit in eine bestimmte Richtung (gegeben durch eine Kurve) bewegen?

Wir werden feststellen, dass die naive Ableitung eines Tangentialvektorfeldes in einer bestimmten Richtung in einem Punkt p im Allgemeinen keinen Tangentialvektor in p ergibt. Veranschaulichen wir uns die Situation durch zweidimensionale Flächen, eingebettet im dreidimensionalen Raum, so besitzt die naive Ableitung eines Vektorfeldes im dreidimensionalen Raum auch eine Komponente senkrecht zur Fläche. Diese senkrechte Komponente ist darauf zurückzuführen, dass sich die Fläche krümmt und sich das Tangentialvektorfeld eben nicht nur parallel zur Fläche ändert, sondern auch senkrecht dazu, wenn man sich ein kleines Stück auf der Fläche fortbewegt. Nur so kann das Tangentialvektorfeld tangential zur gekrümmten Fläche bleiben.

Möchte man auf eine Einbettung verzichten, so stört die Komponente senkrecht zur Fläche, denn sie ist zunächst gar nicht definiert. Man definiert daher die sogenannte kovariante Ableitung, bei der man einfach die senkrechte Änderungskomponente weglässt. Man projeziert also gleichsam den Ableitungsvektor auf den Tangentialraum, so dass der kovariante Ableitungsvektor selbst ein Element des Tangentialraums ist. Diese Vorgehensweise kann man dann leicht auf allgemeine differenzierbare Mannigfaltigkeiten ohne Einbettung verallgemeinern.

Einen Punkt muss man jedoch bedenken: Da wir die Änderungskomponente senkrecht zur Fläche weggelassen haben, liefert die kovariante Ableitung nicht mehr in linearer Näherung die Veränderung des Tangentialvektorfeldes mit Formeln wie   u(γ(dt)) = u(p) + Dγ'(0) u(p) dt   (mit   γ(0) = p   und der kovarianten Ableitung   Dγ'(0) u(p)   in γ'(0) -Richtung). Man muss sich daher etwas anderes überlegen, um benachbarte Tangentialvektoren über die kovariante Ableitung miteinander in Beziehung zu setzen. Das Zauberwort heißt Paralleltransport (Parallelverschiebung) -- wir werden weiter unten genauer darauf eingehen.


Kovariante Ableitung auf zweidimensionalen Flächen im dreidimensionalen Raum:

Wir wollen die obigen Ideen nun präzisieren. Dabei betrachten wir zunächst zweidimensionale gekrümmte Flächen, eingebettet im dreidimensionalen euklidischen Raum, um eine anschauliche Vorstellung der auftretenden mathematischen Ausdrücke zu ermöglichen.

Wiederholen wir kurz ein Ergebnis aus Kapitel 5.1.4 über Tangentialvektoren: Einen Punkt p unserer zweidimensionalen Fläche M können wir aufgrund der Einbettung als einen dreidimensionalen Vektor X(x) im Einbettungsraum R3 darstellen. Dabei liefert   x = (x1, x2) die beiden Koordinaten des Punktes p, d.h.   x = f(p)   mit der Koordinatenfunktion (Karte) f. Man sagt auch, X(x) liefert eine Parametrisierung der Fläche M im Einbettungsraum R3. Wegen   p = X(x)   und umgekehrt   x = f(p)   ist X die Umkehrfunktion zur Koordinatenfunktion f, d.h.   p = X(x) = f -1(x)  .

Ein Beispiel: M ist die Kugeloberfläche einer Kugel mit Radius 1, und   x1 = θ   sowie   x2 = φ   sind die Kugelkoordinatenwinkel, analog zu Längen- und Breitengrad auf der Erde. In den euklidischen Koordinaten des umgebenden dreidimensionalen Raums ist dann   X(θ, φ)   =   (sin θ cos φ , sin θ sin φ , cos θ)  . Der Winkel φ wächst also von Westen nach Osten von 0 bis 2π (also bis 360 Grad) an, der Winkel θ dagegen von Norden nach Süden von 0 bis π (also bis 180 Grad).

Einen Tangentialvektor u(p) können wir aufgrund der Einbettung nun schreiben als

  u(p)   =   ∑μ   uμ(p) dX(x)/dxμ

mit   x = f(p)  . Der Vektor u(p) ist demnach ein dreidimensionaler Vektor, der in p tangential zur Fläche M liegt. In der Summe läuft der Koordinatenindex μ von 1 bis 2.

Wir betrachten nun wie üblich eine Kurve   γ(t)   mit   γ(0) = p . Dabei muss u(p) hier nicht tangential zu dieser Kurve liegen. Wir interessieren uns nun für die Änderung von   u(γ(t))   bei   t = 0   in Kurvenrichtung. Da   u(γ(t))   für jedes t ein dreidimensionaler Vektor ist, ist auch die Ableitung nach t in   t = 0   direkt definiert (ohne Einbettung wäre diese naive Ableitung dagegen erst einmal nicht definiert, da formal im Differenzenquotienten der Ableitung die Differenz zweier Tangentialvektoren aus verschiedenen Tangentialräumen auftritt, die nur bei einer Einbettung eine Bedeutung hat). Rechnen wir die Ableitung aus (wobei wir benutzen, dass   f(γ(0)) = f(p) = x   ist):

  du(γ(t)) / dt |t = 0   =   d/dt|t = 0   ∑μ   uμ(γ(t))   dX(f(γ(t))) / dxμ   =  
  =   ∑μ   duμ(γ(t)) / dt |t = 0   dX(x)/dxμ   +   ∑μ   uμ(p)   d/dt|t = 0 dX(f(γ(t))) / dxμ   =  
  =   ∑μ   duμ(γ(t)) / dt |t = 0   dX(x)/dxμ   +   ∑μ   ∑ν   uμ(p)   d/dxν dX(x)/dxμ   df(γ(t))ν / dt |t = 0   =   ...

Der erste Term beschreibt die Veränderung aufgrund der Änderung der Vektor-Komponenten, und der zweite Term enthält die Veränderung der Tangential-Basisvektoren   dX(x)/dxμ   in ν-Koordinatenrichtung aufgrund der Veränderung der Koodinatenlinien-Richtungen im Einbettungsraum. Wegen der Einbettung ist diese Veränderung eines Basisvektors (d.h. μ fest) in xν -Koordinatenrichtung ein dreidimensionaler Vektor, den wir nach drei Basisvektoren in R3 entwickeln können. Im Punkt p sind solche Basisvektoren gegeben durch die beiden Tangentialvektoren   dX(x)/dx ρ   (mit ρ gleich 1 und 2) sowie dem dazu senkrechten Vektor N. Wir können also schreiben:

  d/dxν dX(x)/dxμ   =:   ∑ρ   Γ ρνμ dX(x)/dx ρ   +   hνμ N

Durch diese Gleichung werden die Christoffel-Symbole   Γ ρνμ   definiert (wir verwenden die Konvention, dass der Index, nach dem abgeleitet wird, vorne steht). Die obige Gleichung zeigt, dass sie die folgende anschauliche Bedeutung haben:

  • Christoffel-Symbole:
    Das Christoffel-Symbol   Γ ρνμ   ist die ρ -te Komponente (bezogen auf die koordinatenabhängige Basis dX(x)/dx ρ des Tangentialraums) des Vektors   d/dxν dX(x)/dxμ  , der die Änderung des μ-ten Basis-Tangentialvektors dX(x)/dxμ in xν-Koordinatenrichtung angibt.

Dies können wir nun verwenden, um die obige Rechnung weiterzuführen. Außerdem wollen wir noch   γ'(0) =: v(p)   schreiben, d.h.   df(γ(t))ν / dt |t = 0   =   vν(p) . Ergebnis:

...   =   ∑μ   duμ(γ(t)) / dt |t = 0   dX(x)/dxμ   +   ∑μν   uμ(p)   { ∑ρ   Γ ρνμ dX(x)/dx ρ   +   hνμ N }   vν(p)   =   ...
...   =   ∑ρ   { duρ(γ(t)) / dt |t = 0     +   ∑μν   uμ(p)   Γ ρνμ   vν(p) }   dX(x)/dx ρ   +  
            +   ∑μν   uμ(p)   hνμ N   vν(p)

Soweit also unser Ergebnis zu   du(γ(t)) / dt |t = 0   (also die Änderung von u in Kurvenrichtung). Das Ergebnis enthält drei Anteile:

Oben hatten wir betreits erwähnt, dass die Änderung der Basisvektoren senkrecht zum Tangentialraum stört, wenn man ohne eine Einbettung auskommen will. Ohne eine Einbettung ist   du(γ(t)) / dt |t = 0   gar nicht definiert. Wenn wir aber die Komponente senkrecht zum Tangentialraum weglassen, so lassen sich die übrigen Terme problemlos einbettungsfrei umschreiben. Das verwundert auch nicht, denn die Projektion von   du(γ(t)) / dt |t = 0   auf den Tangentialraum in p is ja selbst ein Element dieses Tangentialraums. Wir definieren daher die kovariante Ableitung wie folgt:

  • Definition der kovarianten Ableitung auf einer zweidimensionalen Fläche, eingebettet im dreidimensionalen euklidischen Raum:

    Die kovariante Ableitung   Dv(p) u   eines Tangentialvektorfeldes u im Punkt p in Richtung des Tangentialvektors γ'(0) = v(p) (festgelegt durch die oben definierte Kurve) ist die Projektion von   du(γ(t)) / dt |t = 0   auf den Tangentialraum in p = γ(0). Wir schreiben dies als

      Dv(p) u   :=   P|T(p) du(γ(t)) / dt |t = 0

    mit dem linearen Projektionsoperator P|T(p) auf den Tangentialraum T(p). Bezogen auf die Basisvektoren   dX(x)/dx ρ   gilt:

      Dv(p) u   =   ∑ρ   { duρ(γ(t)) / dt |t = 0     +   ∑μν   uμ(p)   Γ ρνμ   vν(p) }   dX(x)/dx ρ

    Dabei sind die Christoffelsymbole   Γ ρνμ   definiert durch

      P|T(p) d/dxν dX(x)/dxμ   =:   ∑ρ   Γ ρνμ dX(x)/dx ρ

Man kann für die Christoffelsymbole noch eine etwas griffigere Formel ableiten, indem man in   Dv(p) u   für u(p) den Basisvektor   dX(x)/dxμ   und für v(p) den Basisvektor   dX(x)/dxν   einsetzt. Die Laufindizes in der Summe erhalten zur Unterscheidung dann einen Strich. Es ist dann   uμ'(p) = δμ'μ   und   vν '(p) = δν 'ν  , so dass in den Summen über μ' und ν ' jeweils nur ein Term übrig bleibt. Die Zeitableitung   duρ(γ(t)) / dt |t = 0   fällt weg, da   uρ(p) = δρμ   konstant ist.

  DdX(x)/dxν   dX(x)/dxμ   =  
  =   ∑ρ   { duρ(γ(t)) / dt |t = 0     +   ∑μ'ν '   uμ'(p)   Γ ρν 'μ'   vν '(p) }   dX(x)/dx ρ   =  
  =   ∑ρ   Γ ρνμ   dX(x)/dx ρ

Der Vergleich mit der Formel etwas weiter oben für die Christoffelsymbole zeigt, dass für den Operator der kovarianten Ableitung   DdX(x)/dxν   gilt:

  DdX(x)/dxν   =   P|T(p) d/dxν

Dieser Ausdruck ist wegen dem Projektionsoperator P|T(p) allerdings nur bei einer Einbettung definiert.


Nachdem wir uns nun eine anschauliche Vorstellung von der kovarianten Ableitung verschafft haben, wollen wir nun versuchen, diesen Begriff auf die einbettungsfreie Formulierung zu übertragen. Die Tangentialvektoren werden dabei durch Richtungsableitungen dargestellt, was im Wesentlichen bedeutet, dass man formal in Ausdrücken wie   u(p)   =   ∑μ   uμ(p) dX(x)/dxμ   das X(x) weglässt und so zu den Richtungsableitungen   u(p)   =   ∑μ   uμ(p) d/dxμ|p   übergeht. Entsprechend könnte man die kovariante Ableitung in Analogie zu oben direkt einbettungsfrei über die folgenden Formeln definieren:

  • einbettungsfreie Definition der kovarianten Ableitung:

    Die kovariante Ableitung   Dv(p) u   eines Tangentialvektors u(p) in Richtung des Tangentialvektors v(p) (festgelegt durch die Kurve γ(t) mit p = γ(0) ) ist definiert durch

      Dv(p) u   =   ∑ρ   { v(p) uρ     +   ∑μν   uμ(p)   Γ ρνμ   vν(p) }   d/dx ρ|p

    wobei wir im ersten Term   duρ(γ(t)) / dt |t = 0   =   v(p) uρ   verwendet haben. Dabei sind die Christoffelsymbole   Γ ρνμ   definiert durch

      Dd/dxν|p   d/dxμ   =   ∑ρ   Γ ρνμ   d/dx ρ|p

Auf diese Weise wird beispielsweise in der physikalischen Literatur die kovariante Abbildung häufig definiert. Dabei muss man die Christoffelsymbole vorgeben oder aufgrund anderer Prinzipien festlegen. Unsere obigen Überlegungen haben gezeigt, dass beispielsweise bei einer Einbettung die Christoffelsymbole eindeutig festgelegt sind. Analog ist es, wenn eine Metrik auf der Mannigfaltigkeit vorliegt (siehe ein späteres Kapitel).

Noch eine wichtige Randbemerkung: Leitet man die Christoffelsymbole wie oben gezeigt aus einer Einbettung ab (man spricht davon, dass die Einbettung den affinen Zusammenhang induziert), so sind die Christoffelsymbole symmetrisch in den unteren beiden Indices. Bei der einbettungsfreien Formulierung dagegen haben wir die Freiheit, auch nicht-symmetrische Christoffelsymbole zuzulassen. Man spricht in diesem Fall von Torsion (siehe nächstes Kapitel).

Die obige Definition hat den Nachteil, dass man expliziten Bezug auf Koordinaten nimmt, um den koordinaten-unabhängigen Ausdruck   Dv(p) u   zu definieren. Dass   Dv(p) u   koordinatenunabhängig sein muss, ist für den Fall der Einbettung anschaulich klar, denn dort hatten wir den koordinaten-unabhängigen Ausdruck   Dv(p) u   :=   P|T(p) du(γ(t)) / dt |t = 0   als Ausgangspunkt der Rechnung gewählt. Bei der obigen einbettungsfreien Definition über Koordinaten müsste man aber die Koordinaten-Unabhängigkeit noch explizit nachweisen bzw. von den Christoffelsymbolen ein entsprechendes Transformationsverhalten verlangen.

In der mathematischen Literatur geht man daher gerne einen anderen Weg: Man definiert die kovariante Ableitung in v(p)-Richtung als Abbildung Dv(p) , die aus einem Tangentialvektorfeld u, das in einer Umgebung von p definiert sein muss, einen neuen Tangentialvektor   Dv(p) u   macht (bei der Definition über eine Einbettung   Dv(p) u   :=   P|T(p) du(γ(t)) / dt |t = 0   ist   Dv(p) u   ja auch ein Tangentialvektor). Von dieser Abbildung verlangt man nun eine Reihe von Eigenschaften, so wie sie auch bei der Definition über die Einbettung gegeben sind. Diese Eigenschaften müssen dann ausreichen, um den obigen koordinatenabhängigen einbettungsfreien Ausdruck für die kovariante Abbildung (also der mit den Christoffelsymbolen) reproduzieren zu können, so dass die Gleichwertigkeit zu dieser Definition gewährleistet ist. Schauen wir uns die Details an:

einbettungsfreie Definition der kovarianten Ableitung ohne Koordinaten:

  • Für zwei Tangentialvektorfelder u und v ist die kovariante Ableitung von u in v(p)-Richtung in p ein Tangentialvektor des Tangentialraums T(p). Wir schreiben diesen Tangentialvektor als   Dv(p) u  . Dabei sollen die folgenden Eigenschaften gelten:

  • Dv(p) u   ist algebraisch linear in v(p), d.h. für zwei skalare Funktionen φ und χ sowie ein weiteres Tangentialvektorfeld w gilt:

      D(φ(p) v(p)   +   χ(p) w(p)) u   =   φ(p) Dv(p) u   +   χ(p) Dw(p) u

  • Dv(p) u   ist additiv in u, d.h.

      Dv(p) (u + w)   =   Dv(p) u   +   Dv(p) w

  • Dv(p) u   genügt der Produktregel, d.h.

      Dv(p) (φ u)   =   φ(p) Dv(p) u   +   (Dv(p) φ) u(p)

    wobei   Dv(p) φ   die normale Richtungsableitung von φ in v(p) -Richtung ist, also   Dv(p) φ   :=   v(p) φ . Wegen dieser Richtungsableitung hängt   Dv(p) u   nicht nur von p, sondern von einer Umgebung von p ab (so wie das bei Ableitungen ja sein muss -- man interessiert sich ja für Veränderungen und muss daher auch etwas über die Nachbarschaft des Punktes p wissen). Daher haben wir auch in   Dv(p) u   kein (p) hinter dem u geschrieben.

Man kann sich alle diese Regeln mit Hilfe einer Einbettung und der dortigen Definition   Dv(p) u   :=   P|T(p) du(γ(t)) / dt |t = 0   plausibel machen. Ebenso kann man verifizieren, dass diese Regeln bei der weiter oben getroffenen koordinatenabhängigen einbettungsfreien Definition (mit Christoffelsymbolen) erfüllt sind. Wir wollen dies hier überspringen.

Schauen wir umgekehrt nach, ob die Regeln ausreichen, um die koordinatenabhängige einbettungsfreie Formulierung (mit Christoffelsymbolen) zurückzugewinnen. Damit stellen wir sicher, dass wir keine wichtige Regel übersehen haben:

  Dv(p) u   =   Dv(p)   ∑μ   uμ d/dxμ   =   ...

wir verwenden die Addiditivität:

...   =   ∑μ   Dv(p)   uμ d/dxμ   =   ...

wir verwenden die Produktregel:

...   =   ∑μ   { [Dv(p) uμ]   d/dxμ|p   +   uμ(p)   [Dv(p) d/dxμ] }   =   ...

Im ersten Term verwenden wir, dass nach Definition   Dv(p) uμ   =   v(p) uμ   =   duμ(γ(t)) / dt |t = 0   ist.
Im zweiten Term schreiben wir   v(p)   =   ∑ν   vν(p) d/dxν|p  . Ergebnis:

...   =   ∑μ   { (v(p) uμ) d/dxμ|p   +   uμ(p)   [D( ∑ν   vν(p) d/dxν|p ) d/dxμ] }   =   ...

wir verwenden die algebraische Linearität im zweiten Term:

...   =   ∑μ   { (v(p) uμ) d/dxμ|p   +   uμ(p)   ∑ν   [vν(p)   Dd/dxν|p d/dxμ] }   =   ...

Im zweiten Term können wir über   Dd/dxν|p d/dxμ   =   ∑ρ   Γ ρνμ   d/dx ρ|p   die Christoffelsymbole einführen (eine solche Gleichung muss gelten, denn   Dd/dxν|p d/dxμ   ist nach Definition ein Tangentialvektor, der sich nach den Basisvektoren des Tangentialraums entwickeln lassen muss):

...   =   ∑μ   { (v(p) uμ) d/dxμ|p   +   uμ(p)   ∑ν   [vν(p)   ∑ρ   Γ ρνμ   d/dx ρ|p] }   =   ...

Umsortieren und Indexumbenennung ergibt schließlich:

...   =   ∑ρ   { v(p) uρ   +   ∑μν   uμ(p)   Γ ρνμ   vν(p) }   d/dx ρ|p

Das ist genau unsere Formel von der koordinatenabhängigen Definition der kovarianten Ableitung, die wir hiermit reproduzieren konnten. Dabei haben wir genau die Regeln gebraucht, deren Gültigkeit wir oben gefordert haben. Diese Regeln reichen also aus, und wir haben keine weitere Regel benötigt.


Transformationsverhalten:

Die kovariante Ableitung   Dv(p) u   ist nach Definition ein Tangentialvektor, dessen Komponenten gegeben sind durch

  Dv(p) u   =   ∑ρ   { v(p) uρ   +   ∑μν   uμ(p)   Γ ρνμ   vν(p) }   d/dx ρ|p

mit den Christoffelsymbolen   Γ ρνμ  , die durch

  Dd/dxν|p   d/dxμ|p   =   ∑ρ   Γ ρνμ   d/dx ρ|p

definiert sind. Insgesamt müssen sich also die Komponenten, die durch die geschweifte Klammer definiert sind, wie die Komponenten eines Tangentialvektors bei Koordinatenwechseln transformieren. Sie transformieren sich also genauso wie die Komponenten uμ(p) und vμ(p) , die in der geschweiften Klammer ebenfalls vorkommen. Als Folge davon weist das Christoffelsymbol ein komplexeres Transformationsverhalten auf, das gerade so beschaffen sein muss, dass die geschweifte Klammer das gewünschte Transformationsverhalten aufweist. Dabei ist besonders wichtig, dass die Klammer die Richtungsableitung   v(p) uρ   von Tangentialvektorkomponenten enthält. Bei Koordinatentransformationen entstehen dadurch Zusatzterme, die durch das Transformationsverhalten der Christoffelsymbole kompensiert werden müssen. Physiker kennen das von Eichtheorien, bei denen das Eichpotential   Aμ(x)   die Zusatzterme von   δμ ψ(x)   bei Eichtransformationen neutralisieren muss, so dass   Dμ(A) ψ(x)   sich bei Eichtransformationen genauso transformiert wie   ψ(x)   (Details siehe Die Grenzen der Berechenbarkeit, Kapitel 5.4.6 Eichtheorien). Analog hier: Die Komponenten von   Dv(p) u   sollen sich bei Koordinatentransformationen genauso transformieren wie die Komponenten von u(p), d.h.   Dv(p) u   soll ein Tangentialvektor sein wie u(p). Halten wir fest:

Um es konkret zu machen: Am einfachsten lässt sich das Transformationsverhalten beschreiben, wenn man die folgenden Objekte mit Hilfe der Basisvektoren des Co-Tangentialraums definiert:

  Θ ρμ   :=   ∑ν Γ ρνμ dxν

Θ ist also eine Matrix, deren Elemente Co-Tangentialvektoren sind. Die ν-Koordinate wird durch die Bildung von Θ gleichsam versteckt, denn Θ enthält keine μ-Koordinatenabhängigkeit mehr. Insbesondere ist

  Θ ρμ(p) v(p)   =   ∑ν Γ ρνμ dxν|p v(p)   =   ∑ν Γ ρνμ vν(p)

Damit lässt sich die kovariante Ableitung kurz schreiben als

  Dv(p) u   =   ∑ρ   { v(p) uρ   +   ∑μ uμ(p)   (Θ ρμ(p) v(p)) }   d/dx ρ|p

Als Spaltenvektor gesehen ist   Dv(p) u   also gegeben durch   v(p) u   +   Θ(v) u(p)  , wobei der Spaltenvektor   v(p) u   die Komponenten   v(p) uρ   hat und   Θ(v)   als Matrix mit Komponenten   Θ ρμ(p) v(p)   zu lesen ist. Die Matrix   Θ(v)   wird dabei mit dem Spaltenvektor u(p) multipliziert.

Geht man nun von Koordinaten x zu Koordinaten x' über mit der Jacobi-Matrix   Jλμ := dxλ/dx'μ  , so gilt die Matrixgleichung

  Θ'   =   J − 1 Θ J   +   J − 1 dJ

Dabei ist Θ' die Matrix bezüglich der neuen Koordinaten x', und dJ ist die Matrix mit Elementen analog zur Definition von dΦ im Kapitel über Co-Tangentialvektoren. Details ersparen wir uns hier.

Einige weitere Anmerkungen:


Parallelverschiebung (Paralleltransport):

Wenn wir eine Einbettung voraussetzen, lässt sich die Richtungsableitung eines Vektorfeldes u in γ'(0)-Richtung in t = 0 durch den üblichen Grenzwert des Differenzenquotienten ausdrücken:

  du(γ(t)) / dt |t = 0   =   lim t → 0   [u(γ(t)) − u(p)] / t

Man kann aufgrund des Einbettungsraumes direkt die Differenz der zwei Vektoren bilden.

Ohne Einbettung geht das nicht, denn u(γ(t)) und u(p) gehören zu zwei verschiedenen Tangentialräumen. Deshalb ist die obige Richtungsableitung ohne Einbettung gar nicht definiert, und wir haben sie durch die kovariante Ableitung ersetzt, die die obige Richtungsableitung auf den Tangentialraum in p projeziert. Die kovariante Ableitung benötigt keine Einbettung. Man kann sich nun die Frage stellen, ob sich für die kovariante Ableitung ein Ausdruck analog zu oben finden lässt, bei dem eine Art Unterschied zwischen Tangentialvektoren eine Rolle spielt.

Das Problem ist, dass die Differenz oben die Tangentialvektoren an zwei unterschiedlichen Punkten γ(t) und γ(0) = p miteinander vergleicht. Wir dürfen ohne Einbettung jedoch nur Tangentialvektoren des gleichen Tangentialraums voneinander abziehen. Der Tangentialvektor u(γ(t)) muss dazu irgendwie von γ(t) nach γ(0) = p verschoben (transportiert) werden, und zwar so, dass anschließend der Ausdruck gerade die kovariante Ableitung ergibt. Nennen wir den Transportoperator, der aus u(γ(t)) einen Tangentialvektor in p macht,   T(γ)− t   , d.h.   T(γ)− t u(γ(t))   ist ein Tangentialvektor in p. Wir können   T(γ)− t   so lesen, dass dieser Operator einen sogenannten Paralleltransport entlang der Kurve γ bewirkt, und zwar so, dass der Kurvenparameter um   − t   geändert wird. Allgemein soll der Paralleltransportoperator   T(γ)t   aus einem Tangentialvektor im Tangentialraum T(γ(s)) einen Tangentialvektor im Tangentialraum T(γ(s + t)) machen. Also ist   T(γ)t   eine Abbildung vom Tangentialraum T(γ(s)) in den Tangentialraum T(γ(s + t)) für jeden Wert s des Kurvenparameters. Dabei soll   T(γ)0 = 1   sein, denn der Transport um Nichts soll auch Nichts ändern.

Wir wollen den Transportoperator nun so konstruieren, dass folgendes gilt:

  Dv(p) u   =   lim t → 0   { [ T(γ)− t u(γ(t)) ]   −   u(p) } / t

wobei v(p) der zur Kurve γ(t) gehörende Tangentialvektor in t = 0 ist.

Insgesamt wollen wir einen möglichst einfachen Transportoperator konstruieren. Da der Transportoperator eine Abbildung zwischen zwei Vektorräumen ist, wollen wir versuchen, mit einem linearen Transportoperator auszukommen. Außerdem soll

  T(γ)t' T(γ)t   =   T(γ)t + t'  

gelten, was der Vorstellung entspricht, dass der Transportoperator einen Tangentialvektor entlang einer Kurve verschiebt, wobei man den Transport um t + t' in zwei Teiltransporte zerlegen kann (wie üblich, muss man diese Operator-Beziehung von rechts nach links lesen: erst wird immer der Operator rechts ausgeführt). Setzt man hier   t' = − t  , so folgt

  T(γ)− t T(γ)t   =   1  

d.h. ein Transport hin und wieder zurück ändert nichts. Wichtig ist bei all diesen Regeln, dass immer dieselbe Kurve γ für den Transport verwendet wird. Das Transportergebnis kann ja vom Transportweg abhängen (und tut es auch im Allgemeinen)!

Für die folgende Rechnung ist es günstig, den Tangentialvektor u(γ(t)) nach den Basisvektoren   [T(γ)t d/dxμ|p]   entwickeln. Dies sind die von p = γ(0) nach γ(t) paralleltransportierten Basisvektoren   d/dxμ|p . Wir schreiben also

  u(γ(t))   =:   ∑μ   wμ(γ(t))   [T(γ)t d/dxμ|p]

mit entsprechenden Entwicklungskoeffizienten wμ(γ(t)) . Vorsicht: die Basisvektoren   [T(γ)t d/dxμ|p]   müssen nicht identisch sein mit den Basisvektoren   d/dxμ|γ(t)   -- deswegen haben wir die Koeffizienten hier auch   wμ(γ(t))   anstatt   uμ(γ(t))   genannt.

Wir wollen nun die kovariante Ableitung im Punkt γ(t) (also nicht in p = γ(0) ) ausrechnen:

  Dv(γ(t)) u   =   lim ε → 0   { [ T(γ)− ε u(γ(t + ε)) ]   −   u(γ(t)) } / ε

Dabei ist v(γ(t)) der zu γ(t) gehörende Tangentialvektor im Punkt t. Wenn wir die obige Darstellung von u(γ(t)) einsetzen, so erhalten wir aufgrund der geforderten Eigenschaften des Transportoperators:

  Dv(γ(t)) u   =  
  =   lim ε → 0   { [ T(γ)− ε u(γ(t + ε)) ]   −   u(γ(t)) } / ε   =  
  =   lim ε → 0   { [ T(γ)− ε   ∑μ   wμ(γ(t + ε))   [T(γ)t + ε d/dxμ|p] ]   −   u(γ(t)) } / ε   =  
  =   lim ε → 0   { ∑μ   wμ(γ(t + ε))   [ T(γ)− ε   T(γ)t + ε   d/dxμ|p ]   −   u(γ(t)) } / ε   =  
  =   lim ε → 0   { ∑μ   wμ(γ(t + ε))   [ T(γ)t d/dxμ|p ]   −   u(γ(t)) } / ε   =  
  =   lim ε → 0   { ∑μ   wμ(γ(t + ε))   [ T(γ)t d/dxμ|p ]   −   ∑μ   wμ(γ(t))   [ T(γ)t d/dxμ|p ] } / ε   =  
  =   lim ε → 0   { ∑μ   [ wμ(γ(t + ε))   −   wμ(γ(t)) ] } / ε }   [ T(γ)t d/dxμ|p ]   =  
  =   ∑μ   dwμ(γ(t')) / dt' |t' = t   [ T(γ)t d/dxμ|p ]   =  
  =   ∑μ   (v(γ(t)) wμ)   [ T(γ)t d/dxμ|p ]

Andererseits ist die kovariante Ableitung additiv und es gilt die Produktregel, d.h. wir können   Dv(γ(t)) u   auch mit Hilfe dieser Regeln berechnen und dann die Ergebnisse vergleichen. Dazu brauchen wir die Basisentwicklung des Tangential-Vektorfeld u:

  u(γ(t))   =   ∑μ   wμ(γ(t))   [T(γ)t d/dxμ|p]   =:   [∑μ   wμ   [T(γ) d/dxμ|p]] (γ(t))

mit   [T(γ) d/dxμ|p] (γ(t))   :=   T(γ)t d/dxμ|p   . Der Operator T(γ) erzeugt dabei allgemein aus einem Vektor im Punkt p durch Paralleltransport ein Vektorfeld entlang der Kurve γ. Aufgrund der Eigenschaften der kovarianten Ableitung gilt nun:

  Dv(γ(t)) u   =  
  =   Dv(γ(t))   ∑μ   wμ   [T(γ) d/dxμ|p]   =  
  =   ∑μ   (v(γ(t)) wμ)   [T(γ)t d/dxμ|p]   +   ∑μ   wμ(γ(t))   Dv(γ(t)) [T(γ) d/dxμ|p]

Vergleichen wir dies mit dem Ergebnis für   Dv(γ(t)) u   etwas weiter oben, so sehen wir: Es muss

  Dv(γ(t)) [T(γ) d/dxμ|p]   =   0

gelten. Die kovariante Ableitung des Vektorfeldes, das durch Parallelverschiebung eines Basis-Tangentialvektors   d/dxμ|p   entlang einer Kurve γ entsteht, muss Null sein. Dies gilt für jeden Punkt γ(t) der Kurve.

Wir können nun mit Hilfe von T(γ) aus einem festen Vektor u(p) allgemein ein Vektorfeld entlang der Kurve γ definieren durch

  T(γ)t u(p)   =:   [T(γ) u(p)] (γ(t))

Das Vektorfeld   T(γ) u(p)   wollen wir als Parallel-Vektorfeld längs der Kurve γ bezeichnen. Jeder Vektor dieses Vektorfeldes geht dabei durch eine Parallelverschiebung aus dem festen Vektor u(p) hervor, d.h. T(γ) erzeugt aus einem festen Vektor u(p) durch Parallelverschiebung das entlang γ parallele Vektorfeld   [T(γ) u(p)]  . Dabei ist speziell   [T(γ) u(p)](p)   =   u(p)  .

An dieser Stelle noch eine kurze Nebenbemerkung: Man kann in Analogie zum Push-Forward-Fluss der Lie-Ableitung (siehe ein späteres Kapitel) auch noch das parallelverschobene Vektorfeld   T(γ)t u   auf der Kurve γ definieren. Dieses Vektorfeld geht aus dem Vektorfeld u dadurch hervor, dass jeder Vektor u(γ(t')) um ein festes t parallelverschoben wird:

  T(γ)t u(γ(t'))   =:   [T(γ)t u] (γ(t' + t))

Entsprechend könnten wir in der Formel für die kovariante Ableitung   T(γ)− t u(γ(t))   =   [T(γ)− t u] (p)   mit p = γ(0) einsetzen. Die Formel für die kovariante Ableitung sieht dann vollkommen analog zur Formel der Lie-Ableitung aus, die wir in einem späteren Kapitel noch kennenlernen werden.

Wie sieht es mit der kovarianten Ableitung   Dv(γ(t)) [T(γ) u(p)]   des Parallelfeldes aus? Um unser Ergebnis bezüglich der Basisvektoren verwenden zu können, zerlegen wir   T(γ) u(p)   nach dieser Basis:

  [T(γ) u(p)] (γ(t))   =  
  =   T(γ)t   u(p)   =  
  =   T(γ)t   ∑μ   uμ(p)   d/dxμ|p   =  
  =   ∑μ   uμ(p)   [T(γ)t d/dxμ|p]   =  
  =   ∑μ   uμ(p)   [T(γ) d/dxμ|p] (γ(t))

also   T(γ) u(p)   =   ∑μ   uμ(p)   [T(γ) d/dxμ|p]  . Dabei sind uμ(p) feste Zahlenwerte, die nicht von γ(t) abhängen. Für die kovariante Ableitung haben wir dann:

  Dv(γ(t)) [T(γ) u(p)]   =   Dv(γ(t))   ∑μ   uμ(p)   [T(γ) d/dxμ|p]   =   ∑μ   uμ(p)   Dv(γ(t)) [T(γ)t d/dxμ|p]   =   0

Unser Ergebnis lautet also:

  • Der lineare Parallel-Transportoperator mit den oben geforderten Eigenschaften muss die Gleichung

      Dv(γ(t)) [T(γ) u(p)]   =   0

    in jedem Punkt t der Kurve erfüllen. Ander ausgedrückt:
    Die kovariante Ableitung in Kurvenrichtung eines längs der Kurve γ parallelen Vektorfeldes muss in jedem Punkt der Kurve gleich Null sein.

    Anschaulich bedeutet dies (bei einer Einbettung):
    Verschiebt man einen Tangentialvektor parallel entlang einer Kurve auf der Fläche, so ändert er sich nur senkrecht zur Fläche (dies ist notwendig, um der Krümmung der Fläche zu folgen, so dass der Vektor tangential bleibt), nicht aber tangential zur Fläche. Der Vektor bleibt also so konstant wie möglich.




Paralleltransport eines Vektors entlang einer geschlossenen Kurve auf einer Kugel.
Der Vektor bleibt immer tangential zur Kugeloberfläche.
Man sieht, dass sich nach einem Umlauf der Vektor um 90 Grad gedreht hat.
Dies werden wir im nächsten Kapitel nutzen, um den Begriff der Krümmung zu definieren.


Der Zusammenhang zwischen Paralleltransport und kovarianter Ableitung durch die Gleichung

  Dv(p) u   =   lim t → 0   { [ T(γ)− t u(γ(t)) ]   −   u(p) } / t

wird uns in ganz analoger Form bei der Lie-Ableitung in einem späteren Kapitel wiederbegegnen. Man benötigt dabei eine Abbildung zwischen verschiedenen Tangentialräumen entlang einer Kurve. Bei der kovarianten Ableitung ist dies der Paralleltransport; bei der Lie-Ableitung dagegen verwenden wir eine sogenannte Fluss-Abbildung. Diese Abbildung definiert gleichsam das Referenz-Vektorfeld, mit dem man das gegebene Vektorfeld vergleicht und so eine Ableitung des Vektorfeldes definieren kann. Bei der kovarianten Ableitung ist das Referenz-Vektorfeld durch das längs einer Kurve γ parallele Vektorfeld gegeben. Entsprechend ist die kovariante Ableitung dieses Referenz-Vektorfeldes in Kurvenrichtung Null, denn man misst ja durch die kovariante Ableitung gerade die Änderung gegenüber dem Referenz-Vektorfeld.

Noch eine Bemerkung zur Vorgehensweise: Im vorliegenden Kapitel sind wir von einer Definition der kovarianten Ableitung ausgegangen und haben daraus den Paralleltransport und damit das Referenzvektorfeld herleiten können. In der Literatur (z.B. in Matt Visser: Math 464: Notes on differential geometry, Victoria University of Wellington, New Zealand, 2004, http://www.mcs.vuw.ac.nz/courses/MATH464/2004T1/Lecture-Notes/notes.ps ) wird teilweise auch anders herum vorgegangen und zunächst der Paralleltransport konstruiert, bevor man daraus die zugehörige kovariante Ableitung herleitet. Diese Vorgehensweise bietet sich später bei der Lie-Ableitung an, bei der wir von der Fluss-Abbildung ausgehen werden und daraus die Lie-Ableitung herleiten werden.

Wir können nun die Bedingung   Dv(γ(t)) [T(γ) u(p)]   =   0   dazu verwenden, die Wirkung des Parallel-Transportoperators durch eine Differenzialgleichung zu beschreiben. Dazu müssen wir die Bedingung einfach nur in Koordinaten ausschreiben. Um die Schreibweise zu vereinfachen, verlangen wir von unserem Vektorfeld u, dass es ein Parallelfeld längs γ ist, d.h. es soll gelten:   u(γ(t))   =   T(γ)t u(p)   oder kurz   u   =   T(γ) u(p)  . Das Vektorfeld entlang der Kurve soll also durch Parallelverschiebung entstehen. Legen wir los:

  Dv(γ(t)) [T(γ) u(p)]   =   Dv(γ(t)) u   =  
  =   ∑ρ   { duρ(γ(t')) / dt' |t' = t     +   ∑μν   uμ(γ(t))   Γ ρνμ(γ(t))   vν(γ(t)) }   d/dx ρ|γ(t)   =  
  =   0

Das bedeutet:

  • Differenzialgleichung für ein Parallelfeld längs einer Kurve:

    Das Tangentialvektorfeld   u(γ(t)) = ∑μ uμ(γ(t)) d/dxμ|γ(t)   ist ein Parallelfeld längs einer vorgegebenen Kurve γ, wenn seine Koeffizienten   uμ(γ(t))   in jedem Punkt der Kurve die Differenzialgleichung

      duρ(γ(t')) / dt' |t' = t     +   ∑μν   uμ(γ(t))   Γ ρνμ(γ(t))   vν(γ(t))   =   0

    erfüllen. Dabei sind vν(γ(t)) die vorgegebenen Koeffizienten des zu γ(t) gehörenden Tangentialvektors. Man kann diese Differenzialgleichung auch als Matrixgleichung in der Kurzform

      v(γ(t)) u   +   Θ(v) u(γ(t))   =   0

    schreiben, wobei   u(γ(t))   und   v(γ(t)) u   als Spaltenvektoren zu lesen sind und   Θ(v)   eine Matrix ist -- die genaue Definition hatten wir weiter oben bereits gegeben.

Das Lösen dieser Differenzialgleichung entspricht dem Ausrechnen der Wirkung des Parallel-Transportoperators. Sind beispielsweise als Anfangswert die Werte   uμ(γ(0))   vorgegeben (d.h. u(p) ist vorgegeben), so liefert die Lösung der Differenzialgleichung die Werte   uμ(γ(t))   und damit den nach t parallelverschobenen Tangentialvektor. Da es sich um eine lineare Differenzialgleichung erster Ordnung für   uμ(γ(t))   handelt, ist die Lösung bei vorgegebenem Anfangswert eindeutig bestimmt. Man kann daher die Differenzialgleichung als eindeutige Definition des Parallel-Transportoperators auffassen. Diese Definition ist konsistent zu den oben geforderten Eigenschaften des Parallel-Transportoperators, denn die Lösung   uμ(γ(t))   der Differenzialgleichung hängt linear von den Anfangsbedingungen   uμ(γ(0))   ab, und auch die anderen Eigenschaften kann man nachweisen. Damit ist es uns tatsächlich gelungen, den gewünschten Parallel-Transportoperator eindeutig zu konstruieren. Ist ein affiner Zusammenhang (eine kovariante Ableitung) gegeben, so ist der Paralleltransport eindeutig festgelegt und umgekehrt, wie unsere obigen Überlegungen zeigen.

Das Einzige, was uns noch fehlt, ist eine explizite Formel für den Parallel-Transportoperator. In der Mathematik verzichtet man zumeist auf eine solche Formel, da die Differenzialgleichung oben bereits alle Informationen enthält. In der Physik dagegen kennt man aus ähnlichen Fragestellungen bereits explizite Formeln für solche Lösungs-Operatoren von linearen Differenzialgleichungen. Ein bekanntes Beispiel ist die Lösung der zeitabhängigen Schrödingergleichung in der Quantenmechanik. Man braucht nur noch den Formalismus auf unser obiges Problem zu übertragen.

Die Details der Konstruktion wollen wir hier überspringen. Man findet die Ideen in jedem Buch über Quantenmechanik (Stichworte: zeitabhängige Schrödingergleichung, Zeitordnung, Störungstheorie) oder aber in dem unten angegebenen Skript von Matt Visser in Anhang D. Das Ergebnis ist das sogenannte weggeordnete Integral (path ordered integral). Im Rahmen der Eichtheorie wird daraus der Eich-Transportoperator, der bei einem geschlossenen Weg (d.h. Anfangspunkt gleich Endpunkt) zum sogenannten Wilson loop wird. Wir werden hier nicht näher darauf eingehen.


Geodätische Linien:

Man kann die Idee des Paralleltransports dazu nutzen, um eine möglichst gerade Kurve zu konstruieren. Eine solche Kurve wollen wir geodätische Linie nennen. Dabei soll möglichst gerade bedeuten, dass die Tangentialvektoren entlang der Kurve bis auf einen Faktor durch Parallelverschiebung auseinander hervorgehen. Anschaulich bedeutet das bei einer Einbettung, dass sich der Tangentialvektor der Kurve nur senkrecht zur Tangentialfläche sowie parallel zu sich selbst ändern darf. Veranschaulichen wir uns den Tangentialvektor als Geschwindigkeit, so darf die Beschleunigung also nur senkrecht zur Fläche wirken (wird benötigt, damit die Geschwindigkeit im Lauf der Bewegung tangential zur Fläche bleibt) sowie in Bewegungsrichtung beschleunigend oder abbremsend wirken.

Wichtig ist, dass innerhalb der Tangentialfläche keine Beschleunigung zur Seite stattfindet. Übertragen auf ein Schiff im Ozean bedeutet das: Das Schiff fährt immer geradeaus, weder nach rechts, noch nach links. Dabei darf es auch mal schneller oder langsamer werden. Aufgrund der Erdkrümmung gibt es während der Fahrt eine kleine Beschleunigung senkrecht zur Wasseroberfläche, denn das Schiff verlässt die Wasseroberfläche nicht.

Man kann durch Umparametrisierung der Kurve erreichen, dass die parallele Beschleunigung gleich Null wird, d.h. die Bewegung erfolgt dann mit konstanter Geschwindigkeit. Dies wäre dann eine spezielle Parametrisierung der geodätischen Linie. Für unser Schiff bedeutet das, dass es mit gleichmäßiger Geschwindigkeit über die Wellen gleitet.

Man kann sich eine geodätische Linie auf einer gekrümmten Fläche auch noch anders veranschaulichen. Dazu stellen wir uns vor, dass wir ein dünnes langes Band, z.B. aus einem dünnen Blech, flach auf einer gekrümmten Fläche anbringen. Das Band liegt dann entlang einer geodätischen Linie auf der Fläche, da es so beschaffen sein soll, dass es sich nur senkrecht zur Fläche biegen lässt.

Präzisieren wir diese Überlegung: Wir verlangen, dass die kovariante Ableitung des Tangentialvektors v(γ(t)) der Kurve γ an jedem Punkt γ(t) der Kurve proportional zum Tangentialvektor selbst ist. Es soll also gelten:

  Dv(γ(t)) v   =   c(t) v(γ(t))

wobei man durch Umparametrisierung der Kurve c(t) = 0 erreichen kann, so dass die Tangentialvektoren der Kurve ein Parallelfeld entlang der Kurve bilden. Natürlich kann man auch diese Gleichung bezüglich einer Koordinatenfunktion f in Komponenten ausschreiben:

  • Differenzialgleichung einer geodätischen Linie in Koordinatendarstellung:

      dvρ(γ(t')) / dt' |t' = t     +   ∑μν   vμ(γ(t))   Γ ρνμ(γ(t))   vν(γ(t))   =   c(t)   vρ(γ(t))

    oder in Matrix-Kurzform

      v(γ(t)) v   +   Θ(v) v(γ(t))   =   c(t)   v(γ(t))

mit   d(f ο γ)μ(t') / dt' |t' = t     =   vμ(γ(t))  . Es gilt nun, diese Differenzialgleichung für vρ(γ(t)) bei vorgegebenen Anfangswerten und gegebenen Christoffelsymbolen zu lösen und dann durch Integration die Kurvenkoordinaten   (f ο γ)μ(t)   zu bestimmen, wobei man meist   c(t) = 0   setzt und damit die Parametrisierung der Kurve gleich festlegt. Übrigens: wegen der Symmetrie in μ und ν spielt Torsion in dieser Gleichung keine Rolle.


kovariante Ableitung für Co-Tangentialvektoren und weitere Tensoren:

Wir hatten oben bereits erwähnt, dass man die kovariante Ableitung für Co-Tangentialvektoren ω(p) über die Produktregel

  Dv(p) (ω u)   =:   ω(p) (Dv(p) u)   +   (Dv(p) ω) u(p)  

definieren kann. Da   φ := (ω u)   eine skalare Funktion ist, ist dabei   Dv(p) (ω u)   = v(p) (ω u)  . Der Paralleltransport ermöglicht es uns, diese Vorgehensweise besser zu verstehen. Wir können nämlich nicht nur Tangentialvektoren, sondern auch Co-Tangentialvektoren paralleltransportieren, indem wir fordern, dass bei diesem Paralleltransport der Wert der skalaren Funktion   ω u   sich nicht ändern soll. Anschaulich sagen wir ja, dass der Paralleltransport einen Tangentialvektor v(p) so wenig wie möglich ändert (was bei einer Einbettung unmittelbar eine anschauliche Bedeutung hat). Analog wollen wir auch, dass der Paralleltransport einen Co-Tangentialvektor ω(p) so wenig wie möglich ändert. Dazu passt dann, dass sich   ω(p) u(p)   beim gleichzeitigen Paralleltransport von ω(p) und u(p) überhaupt nicht ändert. Wir definieren also den Paralleltransport der skalaren Funktion   φ(p)   :=   (ω u)(p)   :=   ω(p) u(p)   durch

  [T(γ) φ(p)](γ(t))   :=   T(γ)t φ(p)   :=   φ(p)       und somit dann
  [T(γ) (ω u)(p)](γ(t))   :=   T(γ)t (ω u)(p)   :=   (ω u)(p)   =   ω(p) u(p)

d.h. die Funktion   [T(γ) (ω u)(p)]   ist entlang der Kurve γ konstant. Diese Definition des Paralleltransports einer skalaren Funktion ist zwingend, wenn wir für die kovariante Ableitung einer skalaren Funktion φ die Formel

  Dv(p) φ   =   lim t → 0   { [ T(γ)− t φ(γ(t)) ]   −   φ(p) } / t

analog zur Formel für Tangentialvektoren erreichen wollen. Aus der Konstanz von φ beim Paralleltransport folgt nämlich   T(γ)− t φ(γ(t))   =   φ(γ(t))  , so dass
  Dv(p) φ   =   lim t → 0   { φ(γ(t))   −   φ(p) } / t   =   dφ(γ(t)) / dt |t = 0   =   v(p) φ  
ist. Genau so war ja die kovariante Ableitung einer skalaren Funktion definiert.

Mit Hilfe dieser Funktion können wir nun den Paralleltransport des Co-Tangentialvektors ω(p) definieren durch

ω(p) u(p)   =   T(γ)t (ω u )(p)   =:   [T(γ)t ω(p)]   [T(γ)t u(p)]

d.h. der gleichzeitige Paralleltransport von ω(p) und u(p) entlang der Kurve ändert den Wert der Kombination dieser beiden Vektoren nicht.

Die kovariante Ableitung eines Co-Tangentialvektors ω definieren wir nun analog zu skalaren Funktionen und Tangentialvektoren durch

  Dv(p) ω   =  
  =   lim t → 0   { [ T(γ)− t ω(γ(t)) ]   −   ω(p) } / t   =  
  =   d [ T(γ)− t ω(γ(t)) ] / dt |t = 0

Nun ist   [ T(γ)− t ω(γ(t)) ]   ein Co-Tangentialvektor im Punkt p, den wir schreiben können als
  [ T(γ)− t ω(γ(t)) ]   =   ∑μ   [ T(γ)− t ω(γ(t)) ]μ(p)   dxμ|p
d.h. die t-Abhängigkeit steckt alleine in den Koeffizienten. Analog ist es beim Tangentialvektor
  [ T(γ)− t u(γ(t)) ]   =   ∑μ   [ T(γ)− t u(γ(t)) ]μ(p)   d/dxμ|p
Daraus folgt, dass wir in der folgenden Rechnung die Produktregel anwenden dürfen:

  v(p) (ω u)   =   Dv(p) (ω u)   =  
  =   d(ω u)(γ(t)) / dt |t = 0   =   ...

wir verwenden die Konstanz von   (ω u)   beim Paralleltransport:

  =   d [ T(γ)− t (ω u)(γ(t))] / dt |t = 0   =   ...

wir setzen die Definition des Paralleltransports für einen Co-Tangentialvektor ein:

  =   d { [T(γ)− t ω(γ(t))]   [T(γ)− t u(γ(t))] } / dt |t = 0   =   ...

umschreiben in Komponenten ergibt:

  =   d { ∑μ   [T(γ)− t ω(γ(t))]μ   [T(γ)− t u(γ(t))]μ } / dt |t = 0   =   ...

Produktregel anwenden:

  =   ∑μ   d [T(γ)− t ω(γ(t))]μ / dt |t = 0   uμ(p)   +   ∑μ   ωμ(p)   d [T(γ)− t u(γ(t))]μ / dt |t = 0   =   ...

die Definition der kovarianten Ableitung für Tangential- und Co-Tangentialvektoren über den Paralleltransport ergibt:

  =   ∑μ   [Dv(p) ω]μ   uμ(p)   +   ∑μ   ωμ(p)   [Dv(p) u]μ   =  

  =   [Dv(p) ω]   u(p)   +   ω(p)   [Dv(p) u]

Damit haben wir die Produktregel von oben reproduziert. Fassen wir zusammen:

  • Erweiterung von Paralleltransport und kovarianter Ableitung auf Co-Tangentialvektoren und skalare Funktionen:

    Gegeben ist entweder die Definition von kovarianter Ableitung oder Paralleltransport von Tangentialvektoren (in diesem Kapitel haben wir die kovariante Ableitung als Grundlage definiert). Das jeweils andere Objekt (kovarianter Ableitung oder Paralleltransport) ist definiert über

      Dv(p) u   =   lim t → 0   { [ T(γ)− t u(γ(t)) ]   −   u(p) } / t   =   d [ T(γ)− t u(γ(t)) ] / dt |t = 0

    Genau denselben Zusammenhang zwischen Paralleltransport und kovarianter Ableitung möchten wir auch für skalare Funktionen φ und für Co-Tangentialvektoren ω erreichen:

      Dv(p) φ   =   lim t → 0   { [ T(γ)− t φ(γ(t)) ]   −   φ(p) } / t   =   d [ T(γ)− t φ(γ(t)) ] / dt |t = 0
      Dv(p) ω   =   lim t → 0   { [ T(γ)− t ω(γ(t)) ]   −   ω(p) } / t   =   d [ T(γ)− t ω(γ(t)) ] / dt |t = 0

    Da wir bei skalaren Funktionen   Dv(p) φ   :=   v(p) φ   definiert hatten, folgt   T(γ)− t φ(γ(t))   =   φ(γ(t))  , d.h. der Paralleltransport ändert den Funktionswert nicht. Auf der Definition des Paralleltransports skalarer Funktionen und Tangentialvektoren können wir nun aufbauen und den Paralleltransport von Co-Tangentialvektoren definieren, denn   φ(p)   :=   (ω u )(p)   :=   ω(p) u(p)   ist eine skalare Funktion:

    ω(p) u(p)   =   T(γ)t (ω u )(p)   =:   [T(γ)t ω(p)]   [T(γ)t u(p)]       oder umgekehrt

    ω(γ(t)) u(γ(t))   =   T(γ)− t (ω u )(γ(t))   =:   [T(γ)− t ω(γ(t))]   [T(γ)− t u(γ(t))]

    Bildet man nun die Ableitung nach t in t = 0, schreibt in Komponenten um und wendet die Produktregel an, so folgt (siehe Rechnung oben):

      v(p) (ω u)   =   Dv(p) (ω u)   =   [Dv(p) ω]   u(p)   +   ω(p)   [Dv(p) u]

Die Formeln

  ω(p) u(p)   =   T(γ)t (ω u )(p)   =:   [T(γ)t ω(p)]   [T(γ)t u(p)]       sowie

  v(p) (ω u)   =   Dv(p) (ω u)   =   [Dv(p) ω]   u(p)   +   ω(p)   [Dv(p) u]

sind im Grunde gleichwertig. Man kann entweder über die erste Formel den Paralleltransport von ω definieren (dann legt die zweite Formel die dazu passende kovariante Ableitung fest), oder man definiert über die zweite Formel die kovariante Ableitung (dann legt die erste Formel den dazu passenden Paralleltransport fest). In der Literatur findet man beide Vorgehensweisen.

Die obige Vorgehensweise ist nicht auf Co-Tangentialvektoren beschränkt. Man kann mit ihr schrittweise die kovariante Ableitung beliebigen Tensoren definieren. Betrachten wir als Beispiel die bilineare Abbildung   g(p)(u(p), w(p))  , die zwei Tangentialvektoren aus T(p) eine reelle Zahl zuordnet (die Metrik ist ein Beispiel für eine solche Abbildung). In Komponenten ausgeschrieben haben wir

  g(p)(u(p), w(p))   =   ∑μν   gμν(p)   uμ(p)   wν(p)

d.h. die p-Abhängigkeit von   g(p)(...)   ist (neben der p-Abhängigkeit der Argumente u(p) und w(p) ) durch die p-Abhängigkeit der Komponenten   gμν(p)   gegeben. Wir können nun als skalare Funktion   g(p)(u(p), w(p))   verwenden (analog zu   ω(p) u(p)   von oben) und analog zu oben vorgehen:

  • Erweiterung von Paralleltransport und kovarianter Ableitung auf bilineare Abbildungen g(p)(u(p), v(p)) von T(p) nach R (Beispiel: Metrik):

      g(p)(u(p), w(p))   =:   (T(γ)t g(p)) ( [T(γ)t u(p)], [T(γ)t w(p)] )   =  
      =   ∑μν   [T(γ)t g(p)]μν   [T(γ)t u(p)]μ   [T(γ)t w(p)]ν

    Die zugehörige kovariante Ableitung ist für g(p) dann definiert durch

      [Dv(p) g]μν   :=  
      :=   lim t → 0   { [T(γ)− t g(γ(t))]μν   −   gμν(p) } / t   =  
      :=   d [T(γ)− t g(γ(t))]μν / dt |t = 0

    Wie oben können wir damit für die kovariante Ableitung die folgende Produktregel herleiten:

      v(p) g(u,w)   =   Dv(p) g(u,w)   =  
      =   [Dv(p) g](u(p), w(p))   +   g(p)( Dv(p) u , w(p))   +   g(p)(u(p) , Dv(p) w)

Interessant ist der Fall   [Dv(γ(t)) g]   =   0  , also   [Dv(γ(t)) g]μν   =   0   für jeden Punkt γ(t) der Kurve. Es gilt dann   T(γ)− t g(γ(t))   =   g(p)   bzw. umgekehrt   T(γ)t g(p)   =   g(γ(t))   und somit

  v(p) g(u,w)   =   g(p)( Dv(p) u , w(p))   +   g(p)(u(p) , Dv(p) w)       sowie
  g(p)(u(p), w(p))   =   g(γ(t))( [T(γ)t u(p)], [T(γ)t w(p)] )

Die erste Gleichung werden in Kapitel 5.1.9 Abstände und Winkel: die Metrik noch kennenlernen: es handelt sich um die Verträglichkeitsbedingung von Metrik und affinem Zusammenhang. Wie wir sehen, können wir diese Bedingung auch durch   [Dv(γ(t)) g]   =   0   abkürzen. Die zweite Gleichung wiederum besagt, dass sich dann die Metrik zwischen zwei gleichzeitig paralleltransportierten Tangentialvektoren nicht ändert.


Soviel zum Thema Kovariante Ableitung und Paralleltransport. Richtig interessant werden diese Begriffe, wenn wir uns mit den Themen Krümmung und Metrik befassen und Zusammenhänge zwischen diesen Begriffen untersuchen. Das wollen wir in den nächsten Kapiteln tun.


Literatur zu dem Thema:


zurück zum Inhaltsverzeichnis

last modified on 30 December 2008