Kapitel 4
Die Quantentheorie

5  Das mathematische Gerüst der Quantentheorie

Anmerkung: Dieses Kapitel ist angelehnt an das Skript Quantenmechanik von H.Rollnik, III. Kapitel, Vorlesung gehalten im WS 1975/76 an der Universität Bonn, sowie an Kapitel 5 aus Feynman: Vorlesungen über Physik, Band III: Quantenmechanik.

Wer die Quantentheorie an der Universität lernt, der wird nach den Begriffen Wellenfunktion und Schrödingergleichung schon bald etwas über Hilberträume, Eigenzustände und Operatoren hören. Nach meiner Erfahrung bekommt man diesen mathematischen Apparat zumeist als Gesamtpaket einfach serviert, ohne dass klar wird, warum man ausgerechnet diese Mathematik hier verwenden kann.

Wir sind in den vorherigen Kapiteln etwas anders vorgegangen und haben Begriffe wie Schrödingergleichung und Wellenfunktion bewusst zurückgestellt. Der Grund dafür liegt darin, dass Wellenfunktionen und die Schrödingergleichung nur in einem bestimmten Bereich der Quantentheorie anwendbar sind: in der nichtrelativistischen Quantenmechanik und dabei speziell in der Atomphysik. Die von uns verwendeten Wahrscheinlichkeitsamplituden und die bisher besprochenen Regeln für ihre Anwendung sind dagegen in der gesamten Quantentheorie anwendbar und gelten auch in der relativistischen Quantenfeldtheorie.

Bisher haben wir jedoch erst einige Grundeigenschaften von Wahrscheinlichkeitsamplituden kennengelernt und es ist nun an der Zeit, konkreter zu werden und den gesamten mathematischen Apparat der Quantentheorie schrittweise aufzubauen. Dabei wollen wir darauf achten, dass die so entwickelte mathematische Struktur für die gesamte Quantentheorie gilt (und nicht nur für die nichtrelativistische Quantenmechanik).

Beginnen wir mit dem Begriff des quantenmechanischen Zustandes eines Systems.

Dieser Begriff hängt eng mit dem Begriff vollständiges Ereignis zusammen, den wir bereits in Kapitel 4.2 verwendet haben. Wir hatten dazu gesagt, dass ein solches Ereignis alle Informationen umfassen muss, die in der Natur vorliegen. Genauer müssten wir sagen, dass ein solches Ereignis durch einen vollständigen Satz miteinander verträglicher Messwerte festgelegt wird. Nur einem solchen Ereignis darf man eine Wahrscheinlichkeitsamplitude zuordnen.

Was aber bedeuten die Begriffe vollständig und verträglich in diesem Zusammenhang?

Vollständig heißt, dass wir nicht mehr Informationen über das System gewinnen können, oder aber dass solche zusätzlichen Informationen (z.B. der innere Aufbau eines Elementarteilchens) für das betrachtete Experiment nicht relevant sind, da die damit zusammenhängenden physikalischen Freiheitsgrade nicht berührt werden (beispielsweise ist die innere Struktur des Atomkerns bei chemischen Experimenten nicht relevant, da die chemischen Energien viel zu niedrig sind, um den Atomkern zu beeinflussen).

Dabei ist es keineswegs einfach, zu wissen, ob die gemessenen Informationen in diesem Sinn vollständig sind. Die Untersuchung dieser Frage ist vielmehr im Allgemeinen Gegenstand der physikalischen Forschung.

Kommen wir zu dem Begriff verträglich. Die Messungen müssen miteinander verträglich sein, d.h. die Messung der einen Messgröße verändert nicht den Wert einer damit verträglichen anderen Messgröße. So ist es immer möglich, Ort und Spin eines Elektrons zu messen. Es ist ebenfalls immer möglich, Impuls und Spin eines Elektrons zu messen, d.h. man kann den Impuls messen, ohne eine zuvor gemessene Spininformation zu verlieren.

Gibt es auch Messungen, die nicht miteinander verträglich sind? Ja, die gibt es! Beispielsweise zerstört die Messung des Ortes an einem Teilchen die Information über seinen Impuls. Und genauso zerstört die Messung der Spinkomponente eines Elektrons in z-Richtung die Information über die Spinkomponente in x- oder y-Richtung.

Als Folge davon gibt es verschiedene Möglichkeiten für einen vollständigen Satz miteinander verträglicher Messwerte. Für ein Elektron könnte man beispielsweise Ort und Spin in z-Richtung oder Ort und Spin in x-Richtung oder Impuls und Spin in z-Richtung wählen.

Nun sind wir gerüstet, den quantenmechanischen Zustandes eines Systems zu definieren:

Wir sagen, dass sich ein physikalisches System in einem bestimmten quantenmechanischen Zustand befindet, wenn ein vollständiger Satz von (miteinander verträglichen) Messwerten über das System bekannt ist.

Der Zustand wird also durch Angabe dieser Messwerte eindeutig gekennzeichnet. Nur solange diese Information noch gültig ist, d.h. nur solange sich die Messwerte reproduzieren lassen, können wir sagen, dass sich das System noch in diesem Zustand befindet.

Wie aber kommen wir zu einem vollständigen Satz von Messwerten? Entweder, wir wissen aus irgendwelchen Gründen bereits genug über das System (z.B. aufgrund seiner Entstehung), oder aber wir müssen die Werte explizit an dem physikalischen System messen und dadurch einen solchen Zustand erst herstellen. Man sagt auch, dass man einen quantenmechanischen Zustand durch Messung präpariert. Erst nach dieser Messung befindet sich das System also in dem entsprechenden Zustand.

Ein Beispiel: In unserem Doppelspaltexperiment haben wir angenommen, dass die Teilchenquelle einen Strahl Elektronen mit einem bestimmten Impuls aussendet. Weiterhin wollen wir annehmen, dass nur Elektronen mit Spin in z-Richtung erzeugt werden. Solche Elektronen könnten wir z.B. mit einem inhomogenen Magnetfeld herausfiltern. Da Impuls und Spinkomponente zusammen einen vollständigen Satz von Messwerten bilden (das müssen Sie mir an dieser Stelle einfach mal ohne weitere Begründung glauben), können wir sagen, dass sich diese Elektronen vor dem Doppelspalt in einem quantenmechanischen Zustand befinden, der durch einen bestimmten Impuls und eine bestimmte Spinkomponente gekennzeichnet ist.

Wir wollen an dieser Stelle eine Schreibweise für einen solchen Zustand einführen: wir schreiben alle Messwerte einfach in Klammern hintereinander. Den Elektronzustand mit Impuls p und Spinkomponente mz in z-Richtung schreiben wir also als


(p mz)

Einen allgemeinen Zustand irgendeines physikalischen Systems werden wir analog als (y) oder (f) etc. schreiben. Dabei stehen die griechischen Buchstaben einfach für eine vollständige Liste entsprechender Messwerte, so wie sie für das betrachtete System messbar sind.

Es ist hier noch völlig unklar, was für ein mathematisches Objekt wir mit einem Zustand identifizieren können, da wir noch keine weiteren Regeln aufgestellt haben, wie mit solchen Zuständen umzugehen ist.

Um zu solchen Regeln zu kommen, müssen wir überlegen, welche Verbindung zwischen einem solchen Zustand und den Wahrscheinlichkeitsamplituden für ein experimentelles Ereignis besteht. Ein solches Ereignis wäre bei unserem Doppelspaltexperiment das Auftreffen eines Elektrons auf dem Leuchtschirm hinter dem Doppelspalt.

Für die Entwicklung der folgenden Ideen ist es allerdings besser, ein einfacheres Beispiel zu verwenden. Wir betrachten dazu einen Strahl elektrisch neutraler Fermionen (also Spin-1/2-Teilchen, z.B. Neutronen), der in x-Richtung mit festem Impuls p fliegt. Dieser Strahl kann auf seinem Weg ein oder mehrere inhomogene Magnetfelder durchfliegen. Die Magnetfelder sind dabei in y- oder z-Richtung orientiert. Da das Neutron Spin 1/2 besitzt, teilt sich der Strahl beim Durchfliegen eines in z-Richtung orientierten Magnetfeldes in zwei Teilstrahlen auf. Der eine Teilstrahl wird leicht nach oben (also in z-Richtung), der andere leicht nach unten (also gegen die z-Richtung) abgelenkt. Jedem der beiden Teilstrahlen entspricht ein bestimmter Wert der Spinkomponente in z-Richtung, die wir als mz bezeichnet haben. Im einen Teilstrahl ist mz = 1/2, im anderen Teilstrahl ist mz = -1/2. Warum der Wert gerade 1/2 ist, können wir hier noch nicht verstehen. Wichtig ist im Moment nur, dass es zwei Messwerte gibt, und dass der Messwert durch die Zugehörigkeit zum einen oder anderen Teilstrahl festgelegt ist. Durch das Auffinden eines Teilchens in einem der beiden Teilstrahlen wird der Wert von mz also gemessen.

Wir wollen weiterhin annehmen, dass die Ablenkung im Magnetfeld so gering ist, dass wir auch danach noch von Strahlen sprechen können, die im Wesentlichen in x-Richtung fliegen (ansonsten könnten wir sie eben nach der Trennung noch ein klein wenig umlenken, bis sie wieder in x-Richtung fliegen - wir wollen den Apparat aber nicht zu kompliziert machen).



Ein elektrisch neutraler Teilchenstrahl mit Spin 1/2 teilt sich beim Durchgang durch ein inhomogenes Magnetfeld in zwei Teilstrahlen auf.

Betrachten wir nun ein in y-Richtung orientiertes inhomogenes Magnetfeld. Auch hier teilt sich der Strahl beim Durchgang in zwei Teilstrahlen auf. Der eine Teilstrahl wird leicht nach links (also in y-Richtung), der andere leicht nach rechts (also gegen die y-Richtung) abgelenkt. Jedem der beiden Teilstrahlen entspricht ein bestimmter Wert der Spinkomponente my in y-Richtung. Im einen Teilstrahl ist my = 1/2, im anderen Teilstrahl ist my = -1/2.

Betrachten wir nun folgende Situation:

Der Strahl fliegt in x-Richtung durch ein Magnetfeld, das in z-Richtung steht, und wir blockieren den Weg eines der beiden Teilstrahlen hinter dem Magneten, so dass nur ein Teilstrahl übrig bleibt. Damit wissen wir, welchen Wert die Spinkomponente mz hat. Der Impuls hat sich beim Durchgang durch das Magnetfeld nicht geändert (die kleine Ablenkung wollten wir dabei ja vernachlässigen). Impuls und Spinkomponente bilden für Fermionen einen vollständigen Satz von Messwerten, solange die Energien so klein sind, dass eine Substruktur der Teilchen keine Rolle spielt (das sei hier der Fall). Wir können daher sagen, dass sich die Teilchen in diesem durchgelassenen Teilstrahl im quantenmechanischen Zustand (p mz) befinden. Diesen Zustand haben wir mit Hilfe des Magnetfeldes demnach präpariert.

Wir wollen nun diesen Teilstrahldurch einen weiteren Magneten schicken, dessen Magnetfeld in y-Richtung orientiert ist. Auch hier teilt sich der Strahl wiederum in zwei Teilstrahlen auf, die durch my = +1/2 bzw. my = -1/2 gekennzeichnet sind. Der Impuls wird dabei (zumindest in guter Näherung) nicht verändert.

Sobald wir wissen, in welchem der beiden Teilstrahlen sich ein Teilchen befindet, kennen wir den Wert seiner Spinkomponente my, d.h. in diesem Moment haben wir sie gemessen. Das zur Messung gehörende Ereignis lautet also: Finde das Teilchen in einem der beiden Teilstrahlen. Es handelt sich dabei um ein vollständiges Ereigniss, denn

Dies ist im Grunde unsere erste wirklich präzise Formulierung des Begriffs vollständiges Ereignis.



Verhalten eines Teilchenstrahls mit Spin 1/2 beim Durchgang durch zwei inhomogene, senkrecht zueinander orientierte Magnetfelder.

Da es sich um vollständige Ereignisse handelt, können wir jedem dieser Ereignisse eine Wahrscheinlichkeitsamplitude zuordnen, deren Betragsquadrat die Wahrscheinlichkeit dafür angibt, dass das Ereignis eintritt. Diese Amplitude hängt zum einen natürlich von den gefundenen Messwerten ab, also von p und my. Sie hängt aber auch von dem Zustand ab, an dem die Messung durchgeführt wurde, also von p und mz . Ein Strahl mit mz = 1/2 muss sich beim Durchgang durch das in y-Richtung orientierte Magnetfeld ja nicht genauso verhalten wie ein Strahl mit mz = -1/2 (die Abhängigkeit vom Impuls p haben wir hier nur der Vollständigkeit mitgenommen).

Wir schreiben daher die Amplitude als


A(p  my ,  p  mz)

Dabei wollen wir die Messwerte, die den vorliegenden Zustand vor der Messung charakterisieren, rechts schreiben, und die Messwerte, die bei der Messung gefunden werden, links schreiben. Diese Reihenfolge wird sich später noch als nützlich erweisen.

Im allgemeinen Fall schreiben wir analog


A(fy)

für die Wahrscheinlichkeitsamplitude, dass an einem System im Zustand (y) in dem betrachteten Experiment die Messwerte f gemessen werden, so dass sich das System unmittelbar nach der Messung im Zustand (f) befindet.

Übrigends: Natürlich muss |A(yy)|2 = 1 sein, denn wir wissen über das System ja, dass es sich vor der Messung im Zustand (y) befindet, und das bedeutet, dass wir bei einer erneuten Messung derselben physikalischen Größen wieder die Messwerte y finden werden.

Noch eine Randbemerkung: Die Spinkomponenten mz und my (und allgemeiner die Messwertlisten y und f) beinhalten implizit auch immer die Angabe einer Messvorschrift, denn man muss ja auch sagen, für welches Experiment man die Wahrscheinlichkeitsamplituse angibt. Die Amplitude A(p  my ,  p  mz) gilt also für ein Experiment, bei dem ein Teilchenstrahl mit Impuls p durch ein inhomogenes Magnetfeld in z-Richtung herausgefiltert wird, und an diesem Teilstrahl anschließend eine Messung mit einem inhomogenen Magnetfeld in y-Richtung durchgeführt wird. Dies meint man, wenn man sagt, man findet einen gewissen Satz von Messwerten. Dazu muss eine experimentelle Anordnung gehören, die genau diese Messung (z.B. y-Komponente des Spins) ermöglicht. Mit einem Magnetfeld, dass die y-Spinkomponente misst, kann man nicht gleichzeitig die z-Komponente messen, denn dafür müsste das Magnetfeld anders orientiert sein.

Für die folgende Diskussion wollen wir nun eine Sprachregelung vereinbaren: Wir bezeichnen ab sofort einen Magneten mit in y-Richtung orientiertem inhomogenen Magnetfeld als y-Magneten. Analog definieren wir einen z-Magneten.

Im oben betrachtete Fall hatten wir also mit einem z-Magneten einen Teilstrahl mit eindeutigem mz herausgepickt und diesen durch einen y-Magneten geschickt. Picken wir nun hinter dem y-Magneten einen Teilstrahl heraus, so hat dieser nun einen eindeutigen Wert für my. Zu dieser Messung gehört die Wahrscheinlichkeitsamplitude A(p  my ,  p  mz).

Nun könnten wir wieder einen z-Magneten dahinterstellen und an dem herausgefilterten Strahl mit festem my-Wert wieder die Wahrscheinlichkeit für mz messen. Zu dieser Messung gehört nun die Wahrscheinlichkeitsamplitude A(p  mz ,  p  my). Dabei zeigt sich: Es ist völlig egal, aus welchem ursprünglichen mz-Strahl die Teilchen stammen. Wichtig ist allein, aus welchem my-Strahl die Teilchen sind. Das Herausfiltern eines my-Strahls hat die ursprüngliche Information über mz komplett ausgelöscht, oder besser: es hat sie ersetzt. Die Teilchen in den my-Strahlen scheinen jede Erinnerung an ihren früheren mz-Wert verloren zu haben

Nun verändern wir diese Versuchsanordnung etwas: Hinter dem ersten z-Magneten blockieren wir weiterhin einen der beiden Teilstrahlen, so dass wir einen eindeutigen Wert für mz haben. Dann lassen wir diesen Strahl wie bisher durch einen y-Magneten laufen. Der Strahl teilt sich also wieder in zwei Teilstrahlen mit my = 1/2 und my = -1/2 auf. Diesmal jedoch blockieren wir keinen dieser Teilstrahlen, sondern wir führen sie hinter dem Magneten wieder zu einem einzigen Strahl zusammen (z.B. mit Hilfe eines geeigneten Magnetfeldes). Den zusammengeführten Strahl wiederum schicken wir wieder durch einen z-Magneten, der den Wert von mz bestimmt.

Wie lautet nun unser experimentelles Ergebnis? Die Antwort ist: der letzte z-Magnet misst genau den mz-Wert, den wir hinter dem ersten z-Magneten herausgefiltert haben. Der Durchgang durch den y-Magneten, die Aufteilung und anschließende Wiedervereinigung der Teilstrahlen haben den Wert von mz nicht verändert!

Aber wie kann das sein? Hatten wir nicht eben gesagt, dass die Messung von mz an einem der beiden my-Teilstrahlen nicht von dem ursprünglich herausgefiltertem mz-Wert abhängt? Hatten wir nicht gesagt, dass die Messung des my-Wertes die Kenntnis über den vorher gemessenen mz-Wert auslöscht bzw. ersetzt? Ja, genauso ist es!

Wo also ist der Unterschied?

Der Unterschied ist, dass wir beim Aufteilen und Zusammenführen der beiden Teilstrahlen im my-Magneten den Wert von my gar nicht messen! Wir wissen nur, dass die Teilchen einen der beiden Wege genommen haben, aber nicht, welchen. Die Situation ist vollkommen analog zum Doppelspaltversuch: die beiden Ablenkungsmöglichkeiten im y-Magneten entsprechen den beiden Möglichkeiten, durch einen der beiden Spalte im Doppelspaltversuch hindurchzukommen.

Die beiden beiden Ablenkungsmöglichkeiten im y-Magneten sind ununterscheidbar, solange wir nicht nachsehen, welchen Weg die Teilchen genommen haben. Entsprechend interferieren die zugehörigen Wahrscheinlichkeitsamplituden, d.h. sie müssen addiert werden. Anders wäre es, wenn wir einfach zwei beliebige Strahlen aus zwei verschiedenen Strahlquellen mit jeweils entgegengesetztem Wert von my zu einem Strahl vereinigen würden. Der entstandene Strahl wird keinen definierten Wert von mz haben, und zur Berechnung der Wahrscheinlichkeit für einen mz-Wert müssten wir die Wahrscheinlichkeiten der beiden Strahlen für diesen Wert addieren, nicht aber die Amplituden.

Versuchen wir, die Wahrscheinlichkeitsamplitude A(p  mz ,  p  mz¢) so zu schreiben, dass die Interferenz der beiden Möglichkeiten sichtbar wird. Dabei ist A(p  mz¢,  p  mz) die Amplitude dafür, dass wir am Anfang einen Strahl mit definierten mz herausfiltern, und nach dem Aufteilen und Wiedervereinigen im y-Magneten den Wert mz¢ messen. Wie oben bereits gesagt, ist diese Amplitude gleich Null, wenn mz ¹ mz¢ ist. Um die Notation zu vereinfachen, wollen wir den Impuls p im Folgenden weglassen, da er für die Betrachtung keine Rolle spielt.

Die Amplitude dafür, dass ein Fermion mit definiertem mz in einem der beiden Teilstrahl mit festem my aufgefunden wird, ist A(my,mz). Die Amplitude dafür, dass bei einem solchen Fermion anschließend der Wert mz¢ gemessen wird, ist A(mz¢,my). Die Amplitude dafür, dass das Fermion also die Möglichkeit wählt, bei der diese beiden Schritte hintereinandergeschaltet sind, ist das Produkt dieser beiden Amplituden, also A(mz¢,my) A(my,mz). Das ist also die Amplitude dafür, dass das Teilchen den my-Teilstrahl im y-Magneten wählt.

Die Gesamtamplitude ist nun die Summe all dieser Amplituden, also


A(mz¢,mz) =
å
my 
 A(mz¢,my) A(my,mz)

Die Summe enthält hier nur zwei Summanden, nämlich den für my = 1/2 und den für my = -1/2. Der Wert von my kennzeichnet dabei die verschiedenen ununterscheidbaren Möglichkeiten, auf die das Ereignis eintreten kann.

Die obige Formel ist eine der wichtigsten Formeln der Quantentheorie. Sie gilt in ganz allgemeiner Form. So kann man beispielsweise den wiedervereinigten Strahl durch ein inhomogenes Magnetfeld schicken, dass um den Winkel a gegen die z-Achse geneigt ist, und die Spinkomponente ma entlang dieser Achse messen (wobei der Strahl weiterhin senkrecht auf das Magnetfeld treffen soll). Dann ist


A(ma,mz) =
å
my 
 A(ma,my) A(my,mz)

Und man kann statt dem y-Magneten, der den Strahl zwischendurch aufteilt, einen beliebig um einen Winkel b gedrehten Magneten verwenden. Dann ist


A(ma,mz) =
å
mb 
 A(ma,mb) A(mb,mz)

Und die Formel ist auch richtig, wenn man Teilchen mit anderem Spin betrachtet, beispielsweise mit Spin 1. Dann treten drei Teilstrahlen auf mit my = 1, 0, -1.

Ganz allgemein stellt sich diese Erkenntnis so dar:

Wir gehen aus von einem quantenmechanischen Zustand (y), d.h. wir haben Kenntnis über einen vollständigen Satz von Messwerten, den wir durch y abkürzen. Nun führen wir eine Messung eines (i.a. anderen) vollständigen Satzes von Messgrößen durch und fragen nach der Wahrscheinlichkeitsamplitude A(f,y) dafür, dass wir dabei den vollständigen Messwertsatz f messen. Wenn wir die physikalische Situation analysieren, werden wir dabei zumeist feststellen, dass das Ereignis auf verschiedene Arten eintreten kann. Es handelt sich dabei um eine gedankliche Aufteilung in verschiedene Alternativen, die ausgehend vom Zustand (y) zum Messwertsatz f führen können. Alle diese Alternativen sind in dem betrachteten Experiment ununterscheidbar, aber man könnte das Experiment so verändern, dass man nachweisen könnte, welche Möglichkeit gewählt wurde. Bei diesem Nachweis würde allerdings die Interferenz der Amplituden, die zu den einzelnen Alternativen gehören, verloren gehen, d.h. man darf die Amplituden in diesem veränderten Experiment nicht mehr addieren.

Jede der Alternativen muss nun ebenfalls durch einen vollständigen Satz von Messwerten gekennzeichnet sein, den wir mit n bezeichnen wollen. Alle diese Möglichkeiten interferieren nun zum Gesamtergebnis, d.h. es ist


A(f,y) =
å
n 
 A(f,n) A(n,y)

Die Summe geht dabei über alle möglichen Messwertsätze n.

Wichtig ist dabei, dass wir vollkommene Freiheit dabei haben, die physikalischen Messgrößen n festzulegen, durch die die Aufteilung in verschiedene Alternativen erfolgt. Wichig ist nur, dass es ein vollständiger Satz von Messgrößen ist, und dass echte Alternativen vorliegen (d.h. A(n,n¢) = 0 für n ungleich n¢, und |A(n,n)|2 = 1 sowieso), also dass man bei einer Messung, mit der man die Alternativen unterscheiden kann, nur entweder die Messwertkombination n oder die Messwertkombination n¢ erhalten kann.

Betrachten wir ein weiteres Beispiel: das Elektron in einem Wasserstoffatom im Grundzustand. Wir wollen annehmen, dass der Spin des Elektrons im betrachteten Experiment keine Rolle spielt. In diesem Fall besitzen wir einen vollständigen Satz von Messwerten für das Elektron: seine Energie E (Grundzustand im Wasserstoffatom). Wir bezeichnen diesen Zustand daher als (E).

Wir können nun fragen: wie groß ist die Amplitude A(x,E) dafür, das Elektron am Ort x zu finden? Andererseits können wir auch fragen: wie groß ist die Amplitude A(p,E) dafür, das Elektron mit Impuls p zu finden? (Anmerkung: Genau genommen müsste man nach dem Abstand zwischen Elektron und Proton bzw. nach dem dazu konjugierten Relativimpuls fragen).

Nun lassen sich Ort und Impuls nicht gleichzeitig bestimmen (wir kommen in einem späteren Kapitel noch einmal darauf zurück). Wenn wir also nach der Amplitude A(x,E) fragen, so gibt es für den Impuls des Elektrons im Wasserstoffatom sehr viele hier ununterscheidbare Möglichkeiten, die dazu beitragen können, das Elektron am Ort x zu finden. Es ist also


A(x,E) =
å
p 
 A(x,p) A(p,E)

Dabei ist A(x,p) die Amplitude dafür, dass ein Elektron mit Impuls p am Ort x aufgefunden wird. Übrigens sind wir hier etwas ungenau in der Schreibweise: da der Impuls einen kontinuierlichen Wertebereich annehmen kann, müssten wir eigentlich mit Integralen arbeiten. Diese Feinheit wollen wir aber erst später beachten.

Umgekehrt ist aber auch


A(p,E) =
å
x 
 A(p,x) A(x,E)

denn die einzelnen hier ununterscheidbaren Alternativen für den Ort interferieren, wenn wir nach dem Impuls fragen (auch hier müssen wir genau genommen mit Integralen arbeiten). Wir sehen, wie trickreich die ganze Angelegenheit sein kann!


Wir haben nun eine ganze Menge über Amplituden gelernt. Andererseits haben wir den Begriff quantenmechanischer Zustand eingeführt und gesehen, dass eine Amplitude von zwei solchen Zuständen abhängt: dem präparierten vor der Messung und dem, der durch die Messung wiederum präpariert wird, denn die Messung verändert ja das Wissen über das physikalische System. Wir wollen daher versuchen, unser Wissen über Amplituden in einen Formalismus für Zustände zu übersetzen. Machen wir uns also auf die Suche nach einem mathematischen Modell für Zustände.

Was muss ein solches Modell leisten?

Nehmen wir an, wir könnten einen Zustand (y) mit einem mathematischen Objekt in Beziehung bringen, das wir nach Dirac als |y ñ bezeichnen wollen (sprich: Ket-Psi). Was für mathematische Eigenschaften |y ñ haben muss, und wie es genau mit dem Zustand (y) zusammenhängt, das wollen wir nun im Einzelnen untersuchen.

Unsere zentrale Formel für die Interferenz von Amplituden lautet A(f,y) = ån A(f,n) A(n,y) . Man kann diese Formel auch folgendermaßen interpretieren: Der Zustand y lässt sich zusammensetzen aus Zuständen n, wobei die Zustände n auf eine bestimmte Art aufaddiert werden müssen. Dies entspricht anschaulich der Überlagerung mehrerer Teilstrahlen zu einem neuen Strahl. Wir wollen diese Interpretation mathematisch durch Ausdrücke der Form


|y ñ =
å
n 
 an |n ñ

ausdrücken. Dabei sollen an komplexe Zahlen sein, analog zu den Amplituden. Ob Ausdrücke dieser Art für unsere Zwecke brauchbar sind, ist momentan noch unklar. Wir werden es einfach schrittweise ausprobieren müssen.

Was bedeutet nun diese Addition und Multiplikation? Nun, bis zu einer physikalischen Interpretation fehlt uns noch ein Schritt. Aus formaler Sicht genügt es aber, zunächst einige Rechenregeln für diese Art der Addition und Multiplikation festzulegen.

Man braucht das Rad hier glücklicherweise nicht neu zu erfinden, denn die Mathematik hält bereits einen Baukasten bereit, der es erlaubt, mit solchen Ausdrücken umzugehen: Wir fordern, dass die Addition von |n ñ-Objekten und deren Multiplikation mit komplexen Zahlen den sogenannten Vektorraumaxiomen über dem Körper der komplexen Zahlen genügt. Mit anderen Worten: die gesuchten mathematischen Objekte |n ñ sind Vektoren. Ob dieser Ansatz geeignet ist, müssen wir nun im Detail untersuchen.

Ich möchte hier nicht alles wiederholen, was es zu Vektorräumen zu sagen gibt. Hierzu gibt es bereits viele Lehrbücher. An dieser Stelle sollen nur kurz die wesentlichen Axiome angegeben werden, aus denen sich alle Rechenregeln für Vektoren herleiten:

Zur Erinnerung: diese Regeln sind Axiome, d.h. wir leiten sie nicht her, sondern wir fordern, dass sie für unsere mathematischen |y ñ-Objekte gelten. Erst dadurch erhält z.B. das + -Symbol in unseren formalen Ausdrücken den Charakter einer Addition. Die |y ñ-Vektoren sind auch nicht mit dreidimensionalen Vektoren gleichzusetzen, die z.B. zur Beschreibung der Geschwindigkeit eines Teilchens verwendet werden. Der Begriff des Vektors ist allgemeiner, und es gibt viele mathematische Objekte, die Vektoren sind. Vektor sein heißt nur, dass die Vektorraumaxiome gelten - nicht mehr und nicht weniger.

Um zu überprüfen, ob sich dieser mathematische Formalismus zur Beschreibung von quantenmechanischen Zuständen eignet, müssen wir noch den Bezug zu den Wahrscheinlichkeitsamplituden herstellen.

Je zwei Zustände definieren eine solche Amplitude. Entsprechend bräuchte man eine mathematische Abbildung, die zwei Vektoren |y ñ und |f ñ eine komplexe Zahl zuordnet. Außerdem muss die Abbildung verträglich sein mit der Möglichkeit, eine Amplitude in eine Summe anderer Amplituden aufzuteilen.

Eine bekannte mathematische Abbildung, die genau das leistet, ist das sogenannte (positiv definite) Skalarprodukt. Wir wollen das Skalarprodukt von zwei Vektoren |y ñ und |f ñ in der Form áy|f ñ schreiben. Diese Schreibweise klebt intuitiv einen sogenannten Bra-Vektor áy| mit einem Ket-Vektor |f ñ zusammen. Mathematisch exakt wäre der Bra-Vektor áy| dabei als sogenannte Linearform zu interpretieren, also als eine Abbildung, die angewendet auf einen Vektor eine komplexe Zahl liefert, wobei bestimmte Zusatzregeln gelten (siehe unten). Für Details sei auf die mathematischen Standardlehrbücher zur linearen Algebra verwiesen. Übrigens wird nun auch die Namensgebung (Bra- und Ket-Vektoren) klar: beide zusammen bilden eine braket, also eine Klammer (eben ein Skalarprodukt). Mathematiker sollten sich aber durch diese Physiker-Spielereien nicht verwirren lassen: es handelt sich um übliche Vektoren und das übliche mathematische Skalarprodukt.

Das Skalarprodukt erfüllt nun wiederum eine Reihe von Axiomen (nur dann darf diese Abbildung auch so heißen):

Als Ansatz zwischen Amplitude und Skalarprodukt wählen wir


A(f,y) = áf|y ñ

d.h. die Amplitude entspricht dem Skalarprodukt der Vektoren, die zu den physikalischen Zuständen gehören.

Damit ist unser mathematisches Modell komplett. Zustände werden durch Vektoren repräsentiert, und Amplituden durch Skalarprodukte zwischen diesen Vektoren.

Bleibt nun, zu überprüfen, ob dieses mathematische Modell alle Eigenschaften von Amplituden korrekt reproduziert. Weiter müssen wir überprüfen, wie der Zusammenhang zwischen quantenmechanischen Zuständen und Vektoren genauer aussieht: ist dieser Zusammenhang eindeutig? Und schließlich müssen wir die Frage nach der physikalischen Interpretation der mathematischen Ausdrücke stellen: ist jede Summe von Vektoren physikalisch interpretierbar, oder brauchen wir Zusatzregeln, die über die reinen Vektorraumaxiome hinausgehen?


Kommen wir zuerst zur zweiten Frage:
Wie sieht der Zusammenhang zwischen quantenmechanischen Zuständen und Vektoren genauer aus, und ist dieser Zusammenhang eindeutig?

Betrachten wir dazu zwei Zustände (y) und (f). Wann sind diese Zustände gleich?

Nach unserer obigen Definition des Zustandes können wir sagen: wenn die vollständigen Messwertsätze gleich sind und sich auf die gleichen physikalischen Größen (z.B. Spin in z-Richtung) beziehen.

Es gibt aber noch eine zweite gleichwertige Möglichkeit, die Gleichheit von Zuständen zu definieren. Starten wir mit einem Zustand (y) und fragen nach der Wahrscheinlichkeit, bei diesem Zustand für irgendwelche vollständigen Messgrößen den Messwertsatz zu messen, der dem Zustand (f) entspricht. Beispiel: wir starten mit einem Zustand (p,mz) (d.h. Fermion mit Impuls p und Spinkomponente mz in z-Richtung) und messen die Spinkomponente ma entlang einer Achse, die um den Winkel a gegenüber der z-Achse geneigt ist. Den Impuls brauchen wir nicht weiter zu betrachten, denn er bleibt im Wesentlichen hier unberührt (die kleine Ablenkung im Magnetfeld wollen wir ja vernachlässigen).

Wie groß ist nun die Wahrscheinlichkeit, einen bestimmten Wert ma (z.B. ma = 1/2 ) zu messen?

Diese Wahrscheinlichkeit ist gleich dem Betragsquadrat der zugehörigen Amplitude, also gleich |A(ma,mz)|2 (den Impuls haben wir bei dieser Schreibweise wie oben auch einfach weggelassen). Nun gibt es aber zwei mögliche Messwerte für ma, nämlich ma = 1/2 und ma = -1/2, und beide Messwerte treten auch auf. Daher ist die Wahrscheinlichkeit für jeden der beiden Messwerte kleiner als 1. Nur für den Fall a = 0 wissen wir, welcher Messwert herauskommen wird, denn dann messen wir ja die Spinkomponente entlang der z-Achse, und deren Wert kennen wir ja bereits vor der Messung: es muss der vorgegebene Wert von mz dabei herauskommen! Anders ausgedrückt: |A(mz,mz)|2 = 1.

Dies gilt auch ganz allgemein:

Das Betragsquadrat der Amplitude A(f,y) von zwei Zuständen (y) und (f) ist bei verschiedenen Zuständen kleiner als eins, da mehrere Messwerte möglich sind und das Betragsquadrat die Wahrscheinlichkeit für die jeweilige Möglichkeit darstellt. Nur wenn die beiden Zustände gleich sind, ist das Betragsquadrat der Amplitude gleich eins, d.h. es ist sicher, dass die entsprechende Messwertkombination auch gemessen wird. Es gilt also:

In unserem mathematischen Modell wollen wir die Amplitude durch das Skalarprodukt der beiden Vektoren |f ñ und |y ñ ausdrücken, also A(f,y) = áf|y ñ. Sind die beiden Zustände (y) und (f) gleich, so muss | áf|y ñ|2 = 1 gelten. Was bedeutet das für die Vektoren |f ñ und |y ñ ? Gibt es einen Zusammenhang?

Um diese Frage zu beantworten, geben wir einen Vektor |y ñ vor und fragen, wie der Vektor |f ñ aussehen kann. Dazu zerlegen wir diesen Vektor in einen Anteil parallel zu |y ñ und einen Anteil senkrecht zu |y ñ. Wir machen also den Ansatz


|f ñ = a |y ñ + |r ñ

wobei ár|y ñ = 0 gelten soll (das meint man, wenn man von senkrechten Vektoren spricht). Eine solche Zerlegung ist bei Vektoren immer möglich. Wir setzen nun diesen Ansatz in | áf|y ñ|2 = 1 ein. und wenden die obigen Regeln für das Skalarprodukt an:


| áf|y ñ|2 = |a* áy|y ñ + ár|y ñ|2 = 1

Der zweite Term ist gleich Null, denn |r ñ sollte ja senkrecht zu |y ñ sein. Im ersten Term ist | áy|y ñ|2 = 1, denn das Betragsquadrat der Amplitude für gleiche Zustände ist eins. Damit reduziert sich die Gleichung auf |a*|2 = 1 oder gleichbedeutend |a|2 = 1, d.h. a ist eine komplexe Zahl vom Betrag eins. Eine solche Zahl kann man auch schreiben als a = eb mit einer reellen Zahl b (man bezeichnet b auch als Phase von a).

Nun muss andererseits auch | áf|f ñ|2 = 1 gelten, denn wir haben es hier wieder mit zwei identischen Zuständen zu tun. Setzen wir den Ansatz wieder ein, so folgt nach einer kurzen Rechnung die Bedingung


|1 + ár|r ñ|2 = 1

und damit ár|r ñ = 0. Unsere Axiome für das Skalarprodukt sagen, dass diese Bedingung nur vom neutralen Element |0 ñ (dem Nullvektor) erfüllt wird (denn das Skalarprodukt sollte positiv definit sein), d.h. wir können diesen Vektor in unserem Ansatz weglassen.

Unser Ergebnis lautet also:

Das ist eine erste kleine Überraschung, die man schnell übersehen kann! In unserem mathematischen Modell gibt es zu einem quantenmechanischen Zustand keinen eindeutigen Vektor, sondern alle Vektoren, die sich nur durch einen komplexen Zahlenfaktor vom Betrag eins unterscheiden, gehören zum gleichen Zustand. Mathematisch exakt müsste man daher sagen, dass ein Zustand durch eine sogenannte Äquivalenzklasse von Vektoren repräsentiert wird. Man spricht auch von einem sogenannten Strahl. Für konkrete quantenmechanische Berechnungen müssen wir natürlich einen dieser Vektoren auswählen, aber es darf für das Ergebnis (also für die Wahrscheinlichkeiten) keine Rolle spielen, welchen dieser Vektoren wir verwenden. Der Faktor eb darf im Ergebnis nicht vorkommen.

Wir sehen hier etwas, das in der Physik oft vorkommt: ein mathematisches Modell besitzt gewisse freie Parameter, die für das Ergebnis nicht relevant sind, die aber die Struktur des Modells mit bestimmen. Ein anderes Beispiel dafür sind die sogenannten Eichfreiheitsgrade in elektromagnetischen Potentialen (man kann beispielsweise zu einem elektrischen Potential eine Konstante hinzuaddieren, ohne dass sich das daraus berechnete elektrische Feld dadurch ändert).


Kümmern wir uns nun um die folgende Frage:
Werden alle uns bekannten Eigenschaften der Amplituden durch unser mathematisches Modell (Vektorraum mit Skalarprodukt) korrekt dargestellt?

Die zentrale Formel für die Interferenz von Amplituden lautet A(f,y) = ån A(f,n) A(n,y) . In unserem mathematischen Modell muss daher gelten:


áf|y ñ =
å
n 
  áf|n ñ  án|y ñ

Tatsächlich gilt diese Formel allgemein für Vektorräume mit Skalarprodukt, wenn die Vektoren |n ñ eine Orthonormalbasis des Vektorraumes bilden, denn dann kann man jeden Vektor |y ñ als Linearkombination der Basisvektoren schreiben: |y ñ = ån an |n ñ. Bilden wir das Skalarprodukt mit irgendeinem Basisvektor |m ñ und verwenden, dass ám|n ñ = dm,n ist (d.h. das Skalarprodukt zwischen identischen Basisvektoren ist Eins und zwischen verschiedenen Basisvektoren ist es Null; genau das ist ja eine Orthonormalbasis), so folgt an = án|y ñ und somit


|y ñ =
å
n 
 |n ñ  án|y ñ

Im Grunde ist es diese Möglichkeit, Vektoren zu anderen Vektoren zu kombinieren, die den Vektorraum mit Skalarprodukt zu einem geeigneten mathematischen Modell der Quantentheorie werden lässt, denn damit reproduziert man automatisch die zentrale Formel für die Interferenz von Amplituden.

Übrigens kann man die obige Formel auch noch etwas anders auffassen: Man kann die Basisentwicklung eines Vektors |y ñ nach Basisvektoren |n ñ als Anwendung eines Operators auf den Vektor |y ñ schreiben. Dieser Operator ist gleich dem Identitätsoperator (geschrienen als 1), denn der Vektor wird ja nicht verändert. Es ist also


1 =
å
n 
 |n ñ  án|

wobei án| als lineare Abbildung zu sehen ist, die angewendet auf den Vektor |y ñ das Skalarprodukt án|y ñ ergibt. Diese Schreibweise kann sehr nützlich sein, denn sie erlaubt es, in den Formeln an beliebiger Stelle eine geeignete Orthonormalbasis gleichsam einzuschieben.

Bleibt die Frage: Woher wissen wir, dass die Vektoren |n ñ eine Orthonormalbasis des Vektorraumes bilden? Dass die Bedingung ám|n ñ = dm,n erfüllt werden kann, ist unmittelbar klar: die verschiedenen Möglichkeiten sind echte Alternativen, d.h. wenn eine Messwertkombination (n) gemessen wird, kann keine andere Messwertkombination (m) gemessen werden (das Fermion befindet sich beim Nachschauen entweder im oberen oder im unteren Teilstrahl). Aber ist die Basis auch vollständig? Nun, das ist eine Forderung, die wir an den Vektorraum stellen müssen! Der für das betrachtete physikalische Problem geeignete Vektorraum muss die Menge aller Vektoren sein, die sich nach dieser Basis entwickeln lassen. Man sagt auch, er muss die lineare Hülle der Basis sein. Dabei müssen wir beachten, dass auch abzählbar unendlich viele Basisvektoren erlaubt sind, d.h. die Dimension des Vektorraums muss nicht endlich sein. In diesem Fall werden Konvergenzfragen zunehmend wichtig.


Wie steht es nun mit der Tatsache, dass mehrere Vektoren zum gleichen physikalischen Zustand gehören? Ein Faktor eb darf die Wahrscheinlichkeiten nicht ändern. Wie verträgt sich das mit der zentralen Formel für die Interferenz von Amplituden?

Probieren wir es aus und multiplizieren in dieser Formel den Vektor |y ñ mit diesem Faktor:


áf|eb y ñ =
å
n 
  áf|n ñ  án|eb y ñ

Zunächst einmal ist auch diese Formel mathematisch richtig, denn sie lässt sich aus der Formel ohne den Faktor herleiten. Sie muss aber andererseits genau dieselbe physikalische Situation beschreiben wie die ursprüngliche Formel ohne den Faktor, denn dieser darf keine Rolle spielen.

Betrachten wir zunächst die Amplitude auf der linken Seite. Die zugehörige Wahrscheinlichkeit ist gleich dem Betragsquadrat der Amplitude. Wegen


| áf|eb y ñ|2 = |eb  áf|y ñ|2 = | áf|y ñ|2

spielt der Faktor für die Berechnung der Wahrscheinlichkeit keine Rolle. Analog auf der rechten Seite: Würden wir beobachten, welche der Möglichkeiten (n) zutrifft (und dabei die Interferenz der Möglichkeiten zerstören), so spielt auch in dieser Wahrscheinlichkeit | án|eb y ñ|2 der Faktor keine Rolle.

Wichtig ist dabei, dass alle Amplituden, die den gleichen Zustand rechts enthalten, mit demselben Faktor multipliziert werden, denn dann ändert sich an der Interferenz dieser Amplituden nichts. Man sagt auch, dass Amplituden in diesem Sinne nur bis auf einen globalen Phasenfaktor eindeutig festgelegt sind. Relevant sind allein die Phasendifferenzen zwischen den interferierenden Amplituden. Genau diese Mehrdeutigkeit der Amplituden überträgt sich auf die Zustandsvektoren, die ebenfalls nur bis auf einen Phasenfaktor der Form eb festgelegt sind.


Vielleicht hat sich der eine oder andere Leser über die Eigenschaft a áy|f ñ = áy|a f ñ = áa* y|f ñ des Skalarproduktes gewundert (man sagt, das Skalarprodukt ist (sesqui-) linear bezüglich der Multiplikation mit den komplexen Zahlen). Aus der rechten Hälfte kann man also komplexe Zahlenfaktoren unverändert herausziehen. Beim Herausziehen aus der linken Hälfte muss man dagegen den Zahlenfaktor komplex konjugieren (Mathematiker definieren das übrigens oft genau anders herum).

Diese Eigenschaft ist notwendig, damit das Skalarprodukt positiv definit ist, d.h. áy|y ñ > 0 wenn |y ñ nicht das neutrale Element (also der Nullvektor |0 ñ) ist. Nehmen wir an, wir könnten aus der linken Hälfte des Skalarproduktes Zahlenfaktoren unverändert herausziehen. Dann würde das Skalarprodukt des Vektors |w ñ : = eb |y ñ mit sich selbst folgendes ergeben:


áw|w ñ = áeb y|eb y ñ = e2i b  áy|y ñ

Für b = p/2 ist aber e2i b = i2 = -1 und damit wäre áw|w ñ < 0 für áy|y ñ > 0. Das Skalarprodukt wäre nicht mehr positiv definit.

Bleibt die Frage: muss das Skalarprodukt denn unbedingt positiv definit sein? Hätten wir auf die Forderung áy|y ñ > 0 (wenn |y ñ nicht der Nullvektor |0 ñ ist) verzichten können? Diese Frage ist gar nicht so leicht zu beantworten. Rein mathematisch wäre es durchaus denkbar, ohne diese Bedingung zu arbeiten. Man hätte dann kein Skalarprodukt, sondern eine sogenannte indefinite Metrik vor sich. Eine solche Metrik ist uns im Minkowskiraum (der Raumzeit) der speziellen Relativitätstheorie bereits begegnet. Dort gab es Vierervektoren v, die die Bedingung g(v,v) = 0 erfüllen. Wir haben diese Vektoren als lichtartig bezeichnet. Es zeigt sich aber, dass quantenphysikalische Theorien, die auf die Positivitätsbedingung verzichten, mit ernsthaften Schwierigkeiten zu kämpfen haben. Im Zusammenhang mit der Quanten-Beschreibung von Licht (Photonen) werden wir noch einmal auf diesen Punkt stoßen. Ein Beispiel für die Probleme, mit denen man zu kämpfen hat: Wir hatten oben den Ansatz |f ñ = a |y ñ + |r ñ für alle Vektoren |f ñ gemacht, die zum gleichen quantenmechanischen Zustand wie |y ñ gehören. Um den Vektor |r ñ loszuwerden, haben wir die Positivitätsbedingung des Skalarproduktes benötigt, d.h. ohne diese Bedingung würde ein Zustand durch eine viel größere Klasse von Vektoren repräsentiert. Eine Theorie mit einer solchen Struktur ist auf jeden Fall wesentlich komplexer als eine Theorie mit positiv definitem Skalarprodukt. Man muss im Detail untersuchen, ob die sich daraus ergebende mathematische Struktur auf die physikalischen Beobachtungen anwendbar ist. Fazit: ohne Zwang sollte man auf die Positivitätsbedingung schon aus praktischen Erwägungen nicht verzichten.


Die Tatsache, dass komplexe Zahlen aus der linken Seite des Skalarproduktes nur komplex konjugiert herausgezogen werden können, ist konsistent mit der Bedingung, dass das Skalarprodukt hermitesch ist: áy|f ñ = ( áf|y ñ)* . Das bedeutet, dass diese Beziehung auch für Wahrscheinlichkeitsamplituden gelten muss. Bisher sind wir aber auf diese Eigenschaft der Amplituden noch nicht gestoßen. Daher soll nun gezeigt werden, dass Amplituden sich tatsächlich so verhalten müssen. Dazu starten wir mit unserer allgemeinen Formel für die Interferenz von Amplituden A(f,y) = ån A(f,n) A(n,y) und setzen darin die beiden Zustände gleich: f = y . Es folgt A(y,y) = ån A(y,n) A(n,y). Weiterhin wissen wir, dass |A(y,y)|2 = 1 ist, d.h. die Amplitude muss von der Form A(y,y) = ei b sein. Zusammengefasst gilt also



å
n 
 A(y,n) A(n,y) = ei b

Nun ist andererseits |A(n,y)|2 die Wahrscheinlichkeit dafür, die Messwertkombination n beim vorliegenden Zustand (y) zu messen (wobei die Interferenz verloren geht). Da irgendeine dieser Kombinationen mit Sicherheit gemessen wird (es gibt ja keine weitere Alternative), muss die Summe all dieser Wahrscheinlichkeiten gleich Eins sein:



å
n 
 |A(n,y)|2 = 1

Diese Formel sowie die Formel davor sollen für beliebige Zustände (y) und (n) richtig sein, d.h. es ist ån A(y,n) A(n,y) = ei b ån  |A(n,y)|2 . Man kann zeigen, dass für die einzelnen Summanden dann die Beziehung A(y,n) A(n,y) = A(n,y)* A(n,y) ei b gelten muss (dabei haben wir |A(n,y)|2 = A(n,y)* A(n,y) verwendet). Die Amplitude A(n,y) kann man wegkürzen und erhält


A(y,n) = A(n,y)* ei b

Wenn man die Zustände in der Amplitude vertauscht, so wird die Amplitude also komplex konjugiert. Zusätzlich kann mit einem willkürlicher Phasenfaktor multipliziert werden, der aber für alle interferierenden Amplituden gleich sein muss. Dies entspricht einfach nur der Tatsache, dass die Amplituden nur bis auf einen solchen Phasenfaktor festgelegt sind. Die obige Formel wird durch die hermitesche Eigenschaft áy|n ñ = án|y ñ* des Skalarproduktes korrekt wiedergegeben. Auch hier können wir ja jederzeit einen Phasenfaktor dadurch anbringen, dass wir einen Vektor |f ñ = ei b |y ñ verwenden, der zum selben Zustand gehört: áy|n ñ = án|f ñ* ei b .

Die Gleichung A(y,n) = A(n,y)* ei b bedeutet, dass die Wahrscheinlichkeit symmetrisch in den Zuständen ist:


|A(y,n)|2 = |A(n,y)|2

Das ist bemerkenswert! Die Wahrscheinlichkeit, bei einem Zustand (y) die Messwertkombination n zu messen, ist genauso groß wie die Wahrscheinlichkeit, bei einem Zustand (n) die Messwertkombination y zu messen! Dies ist keineswegs selbstverständlich, sondern ist eine Folge davon, dass Amplituden zu verschiedenen Möglichkeiten miteinander interferieren, wenn die Möglichkeiten in diesem Experiment ununterscheidbar sind.


Wir sehen also, dass unser mathematisches Modell bisher alle Eigenschaften besitzt, die wir für die Beschreibung der Quantentheorie benötigen. Insbesondere konnten wir den Begriff des Zustandes in diesem Modell präzisieren und jedem Zustand eine Menge (Strahl) von Vektoren zuordnen. Mathematisch würde man sagen, dass die Abbildung der Zustände auf die Strahlen injektiv ist, d.h. zu jedem gegebenen Zustand gibt es einen eindeutigen Strahl von Vektoren.

Wie sieht es nun umgekehrt aus: Gibt es zu jedem Strahl von Vektoren auch einen quantenmechanischen Zustand?

Zunächst einmal gibt es eine ganz einfache Einschränkung: es muss áy|y ñ = 1 gelten, d.h. der Vektor |y ñ hat die Norm Eins. Dies ist jedoch keine besonders beeindruckende Einschränkung, denn aus jedem beliebigen Vektor |y¢ ñ lasst sich durch |y ñ = |y¢ ñ/Ö{ áy¢|y¢ ñ} ein Vektor mit Norm Eins konstruieren. Anmerkung: Man kann auch auf die Normierungsbedingung verzichten und erst bei der Bildung der Wahrscheinlichkeiten geeignet normieren. Der Formalismus sieht dann etwas anders aus, aber die wesentliche Struktur ist identisch.

Eine andere Einschränkung aber ist viel wichtiger. Dazu stellen wir die Frage: Kann man beliebige Vektoren zu neuen Vektoren linearkombinieren, und entspricht dieser neue Vektor (normiert auf Eins) dann immer einem physikalischen Zustand? Mit anderen Worten: ist die Abbildung der (auf Eins normierten) Vektoren auf die Zustände surjektiv?

Betrachten wir dazu folgendes Beispiel: Gegeben sei ein Zustand (e), der ein Elektron mit einem bestimmten Impuls und einer bestimmten Spinkomponente beschreibt. Weiter sei ein Zustand (p) gegeben, der analog ein Proton beschreibt. Ist es möglich, diese beiden Zustände zu einem neuen quantenmechanischen Zustand (nennen wir ihn (N) ) zu überlagern?


|N ñ = a |e ñ + b |p ñ

Die Antwort lautet ganz klar: Nein!

Um zu verstehen, warum solche Überlagerungen keinen Sinn machen, schauen wir uns nochmal die allgemeine Formel für die Interferenz von Amplituden an. Sie lautete: áf|y ñ = ån  áf|n ñ  án|y ñ . Hier interferieren die Amplituden zu verschiedenen ununterscheidbaren Alternativen (n) miteinander. Anders ausgedrückt: Die dazu gleichwertige Addition |y ñ = ån |n ñ  án|y ñ entspricht der Interferenz der verschiedenen ununterscheidbaren Möglichkeiten, die durch die Vektoren |n ñ repräsentiert werden. Die Amplituden án|y ñ sind dabei die verschiedenen komplexen Gewichtsfaktoren (inclusive Phase), mit denen die Zustände |n ñ aufsummiert werden müssen, um den Zustand |y ñ zu ergeben.

Was würde dann der Ausdruck |N ñ = a |e ñ + b |p ñ physikalisch bedeuten? Man hätte ein Experiment vor sich, in dem zunächst ein quantenmechanischer Zustand (N) für ein physikalisches Objekt (z.B. ein Teilchen) präpariert wird, der durch gewisse Messwerte N gekennzeichnet ist (präziser: man muss natürlich viele solcher Objekte in den Zustand (N) bringen, um statistische Aussagen gewinnen zu können). Die Messwerte N enthalten nicht die Information das Objekt ist ein Proton oder das Objekt ist ein Elektron, denn diese beiden Alternativen müssen ja ununterscheidbar sein, solange der Zustand (N) für das Objekt besteht. Nun stellt man die Frage: Ist das Objekt ein Elektron oder ein Proton? Mit einer Wahrscheinlichkeit |a|2 findet man, dass das Objekt ein Elektron ist, und mit der Wahrscheinlichkeit |b|2 ist es ein Proton. Elektron und Proton haben unterschiedliche elektrische Ladungen, d.h. das physikalische Objekt, das durch den Zustand (N) beschrieben wird, hat keinen definierten Wert für die Ladung! Es ist auch keineswegs elektrisch neutral, denn dann würden die beiden Fragen Ist es ein Proton? und Ist es ein Elektron? beide eine negative Antwort erhalten. Es zeigt sich nun, dass man Zustände, die keine definierte Ladung haben, experimentell nicht präparieren kann. Die elektrische Ladung eines Objektes ist eine Größe, die immer bekannt ist. Der Grund dafür ist, dass die elektrische Ladung mit einem elektrischen Feld verbunden ist, das weit in den Raum hinausreicht und das deshalb zwangsläufig irgendwelche Spuren in der Natur zurücklässt. Die beiden Alternativen Elektron und Proton sind also immer unterscheidbar (auch wenn ich mich vielleicht für den Unterschied nicht interessiere).

Nun können Elektron und Proton gemeinsam bekanntlich ein Wasserstoffatom bilden. Kann man den Zustand (H) des Wasserstoffatoms womöglich schreiben als |H ñ = a |e ñ + b |p ñ ? Auch dies geht nicht, denn ein Wasserstoffatom ist niemals gleich einem Elekron oder einem Proton. Es enthält beides, aber es ist nicht die Interferenz der Alternativen Elektron und Proton. Statt dessen kann man beispielsweise die folgende Frage stellen: An welchen Orten xe und xp befinden sich Elektron und Proton im Wasserstoffatom, und wie ist deren jeweilige Spinkomponente me,z und mp,z bezüglich der z-Achse? Die entsprechende Wahrscheinlichkeitsamplitude áxe me,z, xp mp,z|H ñ ist eine sinnvolle physikalische Größe.

Die Tatsache, dass man nicht beliebig Zustände zu anderen Zuständen kombinieren kann, trägt den Namen Superauswahlregeln. Es existieren also Zusatzregeln, die nicht alle Linearkombinationen von Vektoren zulassen. Mit anderen Worten: Zu jedem Zustand gibt es einen Strahl von Vektoren, aber nicht zu jedem Strahl von Vektoren kann man auch einen physikalischen Zustand präparieren.

Es ist manchmal gar nicht so leicht, zu sehen, ob eine bestimmte Kombination zulässig ist oder nicht. Ist beispielsweise der Zustand |N ñ = a |Neutron ñ + b |Antineutron ñ sinnvoll? Sowohl Neutron als auch Antineutron sind ja elektrisch neutral. Man kann diese Frage nur beantworten, wenn man die physikalischen Randbedingungen kennt, unter denen man Zustände mit Neutronen oder Antineutronen experimentell erzeugen kann. In diesem Fall ist die Antwort: Man weiss immer ob man ein Neutron oder ein Antineutron vor sich hat (Stichwort: Baryonenzahl), d.h. eine solche Superposition macht keinen Sinn.

Es gibt aber auch Beispiele, in denen solche Superpositionen Sinn machen. Eines der berühmtesten Beispiele findet man bei Neutrinos. Etwas vereinfacht (Tau-Neutrinos werden ignoriert) passiert folgendes:

In der Sonne entstehen bei der Kernfusion sogenannte Elektron-Neutrinos, aber keine Myon-Neutrinos. Sonnennneutrinos werden also direkt nach ihrer Entstehung durch einen Vektor |Elektron-Neutrino ñ beschrieben. Die Eigenschaft, ob ein Elektron- oder ein Myon-Neutrino vorliegt, kann man messen, indem man das Neutrino mit Materie wechselwirken lässt. Ein Elektron-Neutrino kann sich dabei nur in ein Elektron verwandeln, aber niemals in ein Myon, und umgekehrt. Nun kann man andererseits die Masse eines Neutrinos messen (in der Praxis tun sich hier allerdings einige Probleme auf). Neuere Experimente lassen vermuten, dass es (bei Weglassen der Tau-Neutrinos) zwei verschiedene mögliche Messwerte m1 und m2 für die Masse der Neutrinos gibt, die beide größer als Null sind, und dass die Neutrinomasse dabei keine für jeden Neutrinozustand generell bekannte Größe ist, sondern dass es bei einem Elektron-Neutrino eine sehr große Wahrscheinlichkeit gibt, die Masse m1 zu messen, aber auch eine gewisse (sehr kleine) Wahrscheinlichkeit, die Masse m2 zu messen. Man kann also schreiben:


|Elektron-Neutrino ñ = a1 |m1 ñ + a2 |m2 ñ

|Myon-Neutrino ñ = b1 |m1 ñ + b2 |m2 ñ

Dabei ist der Betrag von a1 sehr viel größer als der von a2 und der Betrag von b2 sehr viel größer als der von b1. Daher bezeichnet man m1 auch oft als die Masse des Elektron-Neutrinos und m2 als die Masse des Myon-Neutrinos, obwohl das streng genommen nicht ganz korrekt ist, wenn a2 und b1 ungleich Null sind. Ob sie ungleich Null sind, ist gegenwärtig (2002) noch Gegenstand intensiver Forschung.

Wie verhalten sich nun diese Neutrino-Zustände im Lauf der Zeit? Erinnern wir uns, was wir in einem früheren Kapitel über die Zeitentwicklung von freien Teilchen-Zuständen mit definierter Masse gelernt haben: Ein Zustandsvektor, der zur Zeit Null gleich |m1 ñ ist, ist zu einem späteren Zeitpunkt t gleich exp -(i/(h/2p)) (Ei t - p x) |m1 ñ mit E12 = (m1 c2)2+(pc)2 (und analog für m2). Das führt dazu, dass zum Zeitpunkt t aus einem reinen Elektron-Neutrinozustand ein Zustand wird, der auch einen Anteil Myon-Neutrinozustand enthält. Es findet eine Art Schwebung statt, bei der periodisch die Wahrscheinlichkeit, ein Myon-Neutrino zu finden, von Null auf einen Maximalwert ansteigt und anschließend wieder auf Null abfällt. Man spricht von Neutrino-Oszillationen. In die Oszillationslänge geht dabei (in guter Näherung) der Term |m12-m22| ein. Es würde den Rahmen sprengen, hier auf Details einzugehen. Der Leser hat aber bereits hier alle Werkzeuge zur Verfügung, um die Rechnung selbst durchzuführen. Details findet man auch im Internet, z.B. unter http://pdg.lbl.gov/2001/neutrinos_s801.pdf .


Kommen wir zu einem weiteren Punkt: Wie beschreibt man die Veränderung eines quantenmechanischen Zustandes, z.B. beim Durchgang durch irgendwelche Magnetfelder mit oder ohne Blockierung von Teilstrahlen? Dabei nehmen wir an, dass bei dieser Veränderung kein Informationsverlust eintritt, höchstens eine Informationsveränderung. Das System soll also weiterhin durch einen quantenmechanischen Zustand beschrieben werden, wenn auch evtl. durch einen anderen als vor der Veränderung. Beispielsweise kann der Zustand am Anfang durch die Spinkomponente mz = 1/2 gekennzeichnet sein, nach der Veränderung dagegen durch my = 1/2.

Nennen wir den Zustand vor der Veränderung |y ñ und nach der Veränderung |f ñ. Dann suchen wir eine Abbildung (nennen wir sie A), die aus |y ñ den Vektor |f ñ macht:


|f ñ = A |y ñ

Der Operator A repräsentiert dann den Apparat bzw. den Mechanismus, der die Veränderung des Zustandes herbeiführt. Welche Eigenschaften muss A haben?

Wie immer, wenn es um die Eigenschaften neuer mathematischer Objekte geht, empfiehlt es sich, zu den Grundregeln für Amplituden zurückzukehren. Wir fragen also nach der Amplitude dafür, dass nach der Veränderung die Messwertkombination x gemessen wird. Diese Amplitude ist gleich


áx|f ñ = á x | A  | y  ñ

wobei der rechte Ausdruck das Skalarprodukt von |x ñ mit dem Vektor A |y ñ meint. Nun kann das Ereignis, das zu dieser Amplitude gehört, folgendermaßen zerlegt werden: Es gibt verschiedene ununterscheidbare Möglichkeiten, wie die Veränderung eintreten kann. Mit der Amplitude án|y ñ haben wir den Zustand |n ñ vor der Veränderung vorliegen. Nun gibt es eine Amplitude Am,n, dass aus einem Zustand |n ñ vor der Veränderung ein Zustand |m ñ nach der Veränderung entsteht. Und schließlich gibt es eine Amplitude áx|m ñ, dass bei einem Zustand |m ñ die Messwertkombination x festgestellt wird.

Wir haben es hier mit der Interferenz von ununterscheidbaren Möglichkeiten zu tun, die jeweils durch zwei Messwertkombinationen n und m gekennzeichnet sind. Jede dieser Möglichkeiten wird dabei in drei Teilschritte zerlegt: Zustand |n ñ wird gewählt, durch die Veränderung entsteht ein Zustand |m ñ, und schließlich wird die Messwertkombination x gemessen. Gemäß unseren Regeln müssen wir die Amplituden der Teilschritte zu jeder Möglichkeit multiplizieren und dann über alle Möglichkeiten summieren:


á x | A  | y  ñ =
å
m,n 
  áx|m ñ Am,n  án|y ñ

Zur Veranschaulichung ein Beispiel: Wir beginnen mit einem Teilchenstrahl mit definiertem mz-Wert, teilen den Strahl mit einem y-Magneten in zwei Strahlen mit verschiedenem my-Wert auf und führen diese Strahlen wieder zusammen, ohne zu überprüfen, in welchem Teilstrahl sich die Teilchen befinden. Das Aufteilen und wieder Zusammenführen bewirkt keine Veränderung am Zustand, verdeutlicht aber die beiden Möglichkeiten, die wir hier unterscheiden können. Nun schicken wir den Strahl durch den Apparat, der die Veränderung bewirkt, und teilen hinter dem Apparat den Strahl erneut in zwei my-Strahlen auf, die wir wieder zusammenführen. Zu guter Letzt messen wir ma entlang einer entsprechend gedrehten Achse. Eine der Möglichkeiten, die wir berücksichtigen müssen, wäre dann: Ein Teilchen mit mz = 1/2 wählt den Teilstrahl mit my = 1/2, geht durch den Apparat, geht hinter dem Apparat durch den Teilstrahl mit my = -1/2, und am Schluss wird der Wert ma = 1/2 gemessen.

Da die Formel oben für beliebige Vektoren |x ñ gilt, können wir auch schreiben


A |y ñ =
å
m,n 
 |m ñ Am,n  án|y ñ

Mit Hilfe dieser Beziehung kann man leicht zeigen, dass A ein linearer Operator ist, d.h. es gilt allgemein A (a  |y ñ + b  |r ñ) = a A |y ñ + b A |r ñ.

Und schließlich können wir weiter oben |x ñ = |i ñ und |y ñ = |j ñ wählen, wobei ái|m ñ = dim und án|j ñ = dnj sein soll. Es folgt


Am,n = á m | A  | n  ñ

Die Tatsache, dass alle Veränderungen von Zuständen durch die Wirkung linearer Operatoren auf den Zustandsvektoren beschrieben werden können, stellt eine große Vereinfachung dar. Um die Wirkung des Operators zu kennen, muss man nicht sämtliche Amplituden á f | A  | y  ñ zwischen beliebigen Vektoren analysieren, sondern es genügen die Amplituden á m | A  | n  ñ zwischen Orthonormalbasisvektoren.


Versuchen wir, herauszufinden, welche Sorte von Operatoren wir mit den möglichen Messwerten bei einer Messung in Verbindung bringen können. Dabei wollen wir weiterhin die Vereinfachung machen, dass nur diskrete (abzählbare) Messwerte möglich sind. Für kontinuierliche Messwerte wie den Impuls kann man sich dann vorstellen, dass man zunächst nur eine diskrete Menge von Werten betrachtet und dann diese Werte so dicht legt, dass die gewünschte Genauigkeit erreicht wird. Eine mathematische Präzisierung für kontinuierliche Messwerte werden wir später kennen lernen.

Betrachten wir ein physikalisches System, das durch den quantenmechanischen Zustandsvektor |y ñ beschrieben wird (d.h. ein vollständiger Satz y von Messgrößen ist bekannt). Mit Hilfe einer geeigneten Apparatur führen wir nun die Messung einer physikalischen Größe (beispielsweise die Spinkomponente entlang der z-Achse) durch. Wenn wir sehr viele solcher Messungen an vielen identischen Systemen durchführen, so werden wir feststellen, dass bestimmte Messwerte (nennen wir sie an) mit gewissen Wahrscheinlichkeiten (nennen wir sie Pn) auftreten. Die entsprechenden Wahrscheinlichkeitsamplituden lauten án|y ñ, d.h. Pn = | án|y ñ|2. Nach der Messung befindet sich das System idealerweise im Zustand |n ñ (wir haben hier die Schreibweise etwas vereinfacht; man könnte auch präziser |an ñ schreiben). Das bedeutet: Ein vollständiger Satz n von Messwerten muss bekannt sein, in dem der Messwert an vorkommt. Die Messung darf also die neben an benötigten Messwerte, die noch aus dem Messwertsatz y stammen, gar nicht oder in klar definierter Weise ändern (Beispiel: der Impuls bei der Messung der Spinkomponente).

Wir wollen nun einen Operator suchen, der den zu erwartenden Mittelwert (Erwartungswert) der Messwerte für den gegebenen Zustand (y) ausdrückt, wobei die Messwerte mit ihrer auftretenden Wahrscheinlichkeit gewichtet werden. Nennen wir diesen Erwartungswert áa ñy , d.h.
áa ñy =
å
n 
 Pn  an
Wir können nun Pn = | án|y ñ|2 = áy|n ñ  án|y ñ verwenden und erhalten
áa ñy =
å
n 
  áy|n ñ  an   án|y ñ
Damit haben wir den gesuchten Operator gefunden: er lautet
A =
å
n 
 |n ñ  an   án|
Was ist damit gemeint? Es bedeutet, dass die Wirkung von A auf jeden beliebigen Zustandsvektor |y ñ gegeben ist durch A |y ñ = ån  |n ñ  an   án|y ñ . Mit Hilfe von A können wir den Mittelwert schreiben als
áa ñy = á y | A  | y  ñ

Der Operator A hat nun einige interessante Eigenschaften:

1) A ist linear.

2) A ist hermitesch, d.h. es ist áf|y ñ = áf|A y ñ für beliebige Zustandsvektoren (die Schreibweise haben wir hier etwas abgeändert, um klarer zu machen, dass der Operator mal auf den rechten und mal auf der linken Vektor im Skalarprodukt wirkt; áf|A y ñ ist dasselbe wie á f | A  | y  ñ ).

3) Die Vektoren |n ñ sind Eigenvektoren von A zum Eigenwert an, d.h. A |n ñ = an |n ñ

Man kann also die Messwerte in der Quantentheorie als Eigenvektoren hermitescher Operatoren sehen, und die dabei entstehenden Zustände als Eigenvektoren dieser Operatoren.

Es gilt sogar umgekehrt (etwas vereinfacht), dass hermitesche Operatoren generell reelle Eigenwerte haben, und dass die zugehörigen (auf 1 normierten) Eigenvektoren eine Orthonormalbasis bilden (für den Beweis sei auf die Standardlehrbücher der linearen Algebra verwiesen), d.h. jeder hermitesche Operator (mit diskreten Eigenwerten) lässt sich schreiben als A = ån  |n ñ  an   án|. Im Fall von unendlich vielen Eigenwerten muss man allerdings dabei noch einige Konvergenzbedingungen stellen, und im Fall von kontinuierlichen Eigenwerten geht die Summe in ein Integral über (wir kommen noch darauf zurück). Details findet man in Büchern zur Funktionalanalysis. Wie so oft in der Physik ignorieren wir zunächst solche mathematischen Feinheiten und kümmern uns erst darum, wenn sie wichtig werden.


Zum Abschluss dieses recht umfangreichen und sicher nicht ganz einfachen Kapitels wollen wir noch einmal zum Begriff des Zustandes zurückkommen und uns fragen, was passiert, wenn wir ein quantenmechanisches System nicht durch einen Zustand beschreiben können.

Es wird oft übersehen, dass ein quantenmechanischer Zustand im Grund der Idealfall in der Quantentheorie ist. Er bedeutet, dass wir eine vollständige, nicht erweiterbare Information über das physikalische System besitzen.

Für ein einzelnes Elektron bedeutet das beispielsweise, dass wir seinen Impuls p und seine Spinkomponente mz bezüglich der z-Achse kennen. Sein Zustand wird dann durch den Vektor |p,mz ñ beschrieben (den Impuls wollen wir diesmal nicht weglassen).

Wenn wir nun die Spinkomonente entlang einer Achse messen, die um den Winkel a gegenüber der z-Achse geneigt ist, so ist die Wahrscheinlichkeit für das Auftreten eines bestimmten Wertes von ma gegeben durch das Betragsquadrat der Amplitude áp,ma|p,mz ñ, und der Erwartungswert für die Spinkomponente ma ist gegeben durch
áma ñp,mz =
å
ma 
  áp,mz|p,ma ñ  ma   áp,ma|p,mz ñ = á p,mz | A  | p,mz  ñ
mit
A =
å
ma 
 |p,ma ñ  ma   áp,ma|
Die Summe geht dabei über die beiden Werte ma = +1/2, -1/2 . Der Impuls soll bei der Messung nicht verändert werden.

Wie aber haben wir vorzugehen, wenn lediglich der Impuls, nicht aber der Wert der Spinkomponente mz bekannt ist? Das ist beispielsweise der Fall, wenn wir eine Elektronenquelle vor uns haben, die einen unpolarisierten oder nur teilweise polarisierten Elektronenstrahl (mit konstantem Impuls) ausstößt. Wenn wir die Spinkomponente mz messen, so werden wir mit einer gewissen Wahrscheinlichkeit P+1/2 den Wert mz = +1/2 und mit einer gewissen Wahrscheinlichkeit P-1/2 den Wert mz = -1/2 finden. Nun könnte der Elektronenstrahl möglicherweise durch irgendeinen Zustand |p,mb ñ beschrieben werden, so dass Pmz = | áp,mz|p,mb ñ|2 ist. Ob das so ist, wissen wir beispielsweise, wenn wir mb messen. Kommt hier immer derselbe Wert heraus, liegt ein reiner Zustand vor.

Im Allgemeinen aber wird die Elektronenquelle keinen solchen Zustand aussenden, sondern ein statistisches Gemisch von mz-Werten. In diesem Fall verhält sich der Strahl oft so, als hätten wir zwei unabhängig voneinander entstandene Strahlen mit mz = +1/2 bzw. mz = -1/2 gemischt. Dabei treten im Experiment nun zwei unterscheidbare Alternativen auf: Das Teilchen stammt aus dem einen oder dem anderen Strahl. Wir können nun nach der Wahrscheinlichkeit fragen, bei diesem gemischten Strahl den Messwert ma, also einen bestimmten Spinwert entlang einer geneigten Achse, zu messen. Diese Wahrscheinlichkeit ist die Summe der Wahrscheinlichkeiten der einzelnen Möglichkeiten, also


Pma =
å
mz 
 Pmz | áp,ma|p,mz ñ|2

Zur Erinnerung: hier werden nicht Amplituden, sondern Wahrscheinlichkeiten addiert! Es gibt keine Interferenz der Möglichkeiten. Die Wahrscheinlichkeit für jede der unterscheidbaren Alternativen ist dabei gleich der Wahrscheinlichkeit Pmz, dass der Zustand (mz) im Strahl vorliegt, multipliziert mit der Wahrscheinlichkeit | áp,ma|p,mz ñ|2, dass bei diesem Zustand der Messwert ma gemessen wird.

Analog zur Vorgehensweise beim hermiteschen Operator A oben können wir diesen Ausdruck auch schreiben als


Pma = á p,ma | r  | p,ma  ñ

mit einem Operator


r =
å
mz 
 |p,mz ñ Pmz  áp,mz|

Dieser Operator wird auch als Dichteoperator oder als statistischer Operator bezeichnet. Er beschreibt ein allgemeines quantenmechanisches Objekt inclusive derjenigen, die nicht durch einen reinen Zustand beschrieben werden können.

Auch für einen Strahl, der sich in einem reinen Zustand |p,mb ñ befindet, ist diese Schreibweise anwendbar, denn dann ist Pmb = 1 für diesen Wert von mb (und Null für alle anderen), d.h. r = |p,mb ñ  áp,mb| .

Die allgemeine Form des Dichteoperators lautet


r =
å
l 
 |l ñ Pl  ál|

mit geeigneten Zuständen |l ñ, bezüglich derer man die Wahrscheinlichkeiten Pl kennt. Die Zustände (l) müssen dabei nicht unbedingt orthogonal zueinander sein (man könnte ja beispielsweise zwei Teilchenstrahlen überlagern, die jeweils durch einen Zustand (ma) bzw. (mb) charakterisiert werden, wobei sich die Winkel a und b nicht exakt um 90 Grad unterscheiden).

Wir hatten oben gesehen, dass wir bei einem reinen Zustand (y) den Erwartungswert einer Messgröße a mit möglichen Messwerten an schreiben können als áa ñy = á y | A  | y  ñ, wobei der hermitesche Operator A = ån  |n ñ  an   án| die Messgröße a charakterisiert. Wie lässt sich dieses Ergebnis auf ein System verallgemeinern, das nicht durch einen reinen Zustand charakterisiert werden kann, sondern durch ein statistisches Gemisch von Zuständen beschrieben werden muss, also durch einen Dichteoperator r ?

Zunächst einmal ist der Erwartungswert gegeben durch áa ñy = ån  Pn  an . Dabei ist Pn die Wahrscheinlichkeit dafür, den Messwert an zu messen. Nach unserem obigen Ergebnis ist bei einem statistischen Gemisch von Zuständen diese Wahrscheinlichkeit gegeben durch
Pn = á n | r  | n  ñ
d.h. es ist áa ñy = ån   á n | r  | n  ñ  an. In diesem Ausdruck können wir nun eine beliebige vollständige Orthonormalbasis 1 = åj  |j ñ áj| vor dem Operator r einschieben und erhalten áa ñy = ån åj  an  án|j ñ  á j | r  | n  ñ . Die Faktoren können wir nun folgendermaßen vertauschen: áa ñy = ån åj   á j | r  | n  ñ an  án|j ñ In diesem Ausdruck kann man nun A = ån  |n ñ  an   án| verwenden mit dem Ergebnis áa ñy = åj   á j | r A  | j  ñ . Man bezeichnet den Ausdruck rechts auch als die Spur des Operators r A, abgekürzt Sp. Dabei ist egal, mit welcher Orthonormalbasis |j ñ die Spur berechnet wird, denn die Spur ist unabhängig von der Wahl dieser Basis. Unser Ergebnis lautet also:


áa ñy =
å
j 
  á j | r A  | j  ñ = Sp (r A)

Betrachten wir noch einmal den Unterschied zwischen reinen Zuständen und einem statistischen Gemisch aus Zuständen aus einem etwas anderen Blickwinkel. Bei einem reinen Zustand (y) war der Dichteoperator gegeben durch r = |y ñ áy|. Wir können nun vor und hinter diesem Operator eine vollständige Orthonormalbasis |n ñ bzw. |m ñ einschieben:
r = |y ñ áy| =
å
m,n 
 |m ñ ám|y ñ áy|n ñ án| =
å
m,n 
 |m ñrmn án|
mit rmn = ám|y ñ áy|n ñ . Man bezeichnet rmn auch als Dichtematrix. Wir können uns nun vorstellen, dass aufgrund irgendeines physikalischen Vorgangs viele Nicht-Diagonalelemente der Dichtematrix sehr klein werden, so dass die Dichtematrix beispielsweise in einzelne Diagonalblöcke zerfällt. Im Extremfall bleiben nur noch Diagonalelemente zurück, d.h. rnm = Pn dmn. Dann ist r = ån |n ñPn án|, d.h. übrig bleibt ein statistisches Gemisch von einzelnen Zuständen. Das Verschwinden von Nicht-Diagonalelementen der Dichtematrix ist also gleichbedeutend mit dem Übergang von reinen Zuständen zu statistischen Zustandsgemischen. Man spricht auch von Dekohärenz. Diese Dekohärenz ist nach derzeitigem Kenntnisstand ein zentraler Mechanismus bei allen physikalischen Messprozessen. Sie tritt auf, wenn ein quantenmechanischer Zustand in Wechselwirkung mit einem makroskopischen Messaparat tritt. Was dabei genau passiert, ist gegenwärtig Gegenstand intensiver Forschung.


Fassen wir den Inhalt dieses Kapitels noch einmal zusammen:

Wir haben ein mathematisches Modell gefunden, das die Regeln zum Rechnen mit Wahrscheinlichkeitsamplituden wiederspiegelt und das hilft, die entsprechenden Rechnungen klar und übersichtlich zu strukturierent. Dabei haben wir nichts Neues hinzuerfunden, sondern nur bereits bekanntes Wissen in anderer Form dargestellt. Ganz zentral war dabei, dass Amplituden als Interferenz ununterscheidbarer Alternativen geschrieben werden können.

Als geeignetes mathematisches Modell hat sich der sogenannte Hilbertraum erwiesen, also ein vollständiger komplexer Vektorraum mit einem hermiteschen, positiv definitem Skalarprodukt und einer abzählbaren Basis. Quantenmechanische Zustände entsprechen dabei Strahlen in diesem Hilbertraum (also Mengen von Vektoren, die sich nur durch einen komplexen Phasenfaktor unterscheiden), und Amplituden entsprechen dem Skalarprodukt zwischen den Vektoren.

Dabei haben wir mögliche Probleme, die mit unendlichen Summen oder kontinuierlichen Messwerten zusammenhängen, zunächst einfach ignoriert. Weitere Probleme werden in der relativistischen Quantentheorie auf uns zukommen (Stichwort Renormierung). Wir haben also in diesem Kapitel den groben Rahmen kennengelernt, wie er jeder Quantentheorie zugrunde liegt. Nun gilt es, die Details auszuarbeiten: Wie sehen die Vektorräume im Detail aus? Wie verändern sich Zustände mit der Zeit? Wie wirken sich Symmetrietransformationen (z.B. Drehungen) aus? Welche Messwerte sind möglich? Wie sehen vollständige Messwertsätze aus, und welche Messungen sind miteinander verträglich?

Diesen und weiteren Fragen wollen wir uns in den nun folgenden Kapiteln zuwenden.


zurück zum Inhaltsverzeichnis