Franklin Pezzuti Dyer

Home     Einträge     Lebenslauf     Kontakt     Leute     RSS

Intransitive Zufallsvariablen

(Psst! Don't want to read this in German? Here's a translation.)

Stell dir vor, ein Schwindler schlagt vor, ein einfache Würfelspiel zu spielen, in dem es drei Würfel gibt, jeder spieler würfelt einen von denen und der, der die höchste Zahl erhält, wird der Sieger. Aber um dich daran zu beruhigen, daß es keinen gezinkten Würfel gibt, der höhere Zahlen als die anderen in den meisten Fällen hervorbringt, der Schwindler schenkt dir die Gelegenheit, den Würfel auszuwählen, der dir am meisten gefällt, vor er den Seinen wählt.

Vielleicht ahnst du irgendeine Art von Betrügerei, aber wenn du das Recht der ersten Wahl hast, denkst du, das Spiel gerecht sein könnte, oder sogar zu deinem Vorteil? Und wenn die drei Würfel sind die Folgenden?

Fig 1

Als drei Zufallsvariablen könnte man diese drei Würfel formulieren:

Diese drei Zufallsvariablen entsprechen einer seltsamen Eigenschaft - fallweise kann man bestätigen, daß

Das ist, es gibt keinen besten Würfel aber egal ist das Spiel kein gerechtes Spiel. Für jeden Würfel entspricht ihm anderen Würfel, die eine höhere Zahl in den meisten Fällen hervorbringt. Egal, welchen Würfel wählst du, wird der Schwindler einen erwählen um das Spiel mit Wahrscheinlichkeit $5/9$ zu gewinnen.

Aufklärung des Paradoxes

Dieses Phänomen heißt Intransitivität der Zufallsvariablen und es ist manchmal für seine unintuitive Natur bekannt. In diesem Abteil möchte ich einen generelleren Sachverhalt betreten, der (meiner Ansicht nach) auf den Grund, dieses Phänomen uns so verwirrend erscheinen kann, ein bisschen Licht wirft.

Stell mal vor, wir überlegen drei Sätze $\psi,\phi,\chi$ die wahr oder falsch für jede Ergebnis der Zufallsvariable $W$ sind. Das ist, wenn $\Omega$ das Ergebnismenge der Zufallsvariable $W$ ist, denn sind $\psi,\phi,\chi$ Prädikaten aus der Menge $\Omega$. Wenn zwei Prädikaten $\psi,\phi$ inkompatibel sind, oder anders gesagt $\neg(\psi\land\phi)$ in jedem Fall Wahr wird, dann folgt es, daß Stell aber mal vor, daß $\psi, \phi, \chi$ unvereinbar sind, also, daß Zum Beispiel wenn $W$ aus einem Tripel von Zufallvariablen $(X,Y,Z)$ besteht sind die drei Aussagen unvereinbar, aber jetzt sprechen wir über Prädikaten im allgemeinen. Intuitiv könnte es den Anschein haben, wir könnten genauso die Ungleichung ableiten und zur Folge ableiten, daß es nicht sein könnte, jeder der drei Wahrscheinlichkeiten $\mathbb P(\psi),\mathbb P(\phi),\mathbb P(\chi)$ größer als $1/3$ sei, also und daß wenn $\Omega$ optimal verteilt wäre, um diese Mindestwahrscheinlichkeit zu maximieren, dann würde es so erscheinen:

Fig 3

Diese Auswertung ist aber falsch, weil die drei Prädikaten unvereinbar aber nicht paarweise unvereinbar sind. Die Aussage $\psi\land\phi$ könnte wohl wahr sein und genauso können $\phi\land\chi$ oder $\chi\land\psi$ wahr sein, obwohl $\psi\land\phi\land\chi$ immer falsch ist. Für jeder Ergebnis $\omega\in\Omega$ können am meisten zwei von den drei unvereinbaren Prädikaten wahr sein und deshalb kann die Überlagerung der drei Teilmengen die Ergebnismenge $\Omega$ am meisten zweifach bedecken. Aufgrund dieser Betrachtung können wir die wahre Obergrenze herleiten: und deshalb und die begrenzende Verteilung wäre etwa so:

Fig 4

In der Wirklichkeit gibt es deswegen kein Paradox. Meines Erachtens stammt die unintuitive Natur dieses Phänomens von einer schlechten Intuition wenn es um Aussagen derart "wahrscheinlich wird $\psi$ wahr" geht. Im Allgemeinen erfordert es viele geistigen Anstrengung, die folgende Aussagen miteinander abstimmen zu laßen:

Mit zwei Prädikaten gibt es kein "Paradox" dieser Art, weil es kann nicht sein, daß von $\psi$ und $\phi$ beide wahrscheinlich seien aber $\psi\land\phi$ unmöglich sei, wenn man die Aussage "wahrscheinlich wird $\psi$ wahr" als $\mathbb P(\psi) > 1/2$ auffaßt.

Maximale Intransitivität

Wir haben schon entdeckt, daß mit drei Zufallsvariablen $X,Y,Z$ es keinen größeren Transitivitätsverstoß als das Folgende geben kann: Umgekehrt kann man einfach bestätigen, daß dieser Transitivitätsverstoß möglich ist, z.B. wenn $X,Y,Z$ die gemeinsame Wahrscheinlichkeitsverteilung befolgen: Doch wir haben auf eine wichtige Bestimmung der Zufallsvariablen verzichtet, damit sie als eine realistische Generalisierung des originalen Würfelspiel gelten, nämlich daß sie unabhängig sind. Offensichtlich sind die drei Zufallsbariablen in der obenen Wahrscheinlichkeitsverteilung abhängig. Es könnte sein, daß man drei unabhängige Zufallsvariablen erfinden kann, daß diese 2/3-Grenze auch erreichen, doch keine solche Beispiele haben wir bis jetzt gesehen.

Stellen Sie vor, eine einfachere Frage, in der man setzt voraus, daß $Y$ eine Konstante sei, also, daß es eine reele Zahle $c$ gäbe, derart $\mathbb P(Y = c) = 1$. Wir setzen auch voraus, daß die Wahrscheinlichkeit, irgendeine zwei der drei Variablen zeigen sich gleich, sei null. In diesem Fall sucht man den Größtwert der Mindestwahrscheinlichkeit wenn $X,Z$ unabhängig sind. Es gilt aber dann, daß weil $X < c$ und $c < Z$ zusammen auf $X < Z$ schließen laßen, und die zwei Möglichkeiten unabhängig sind (aufgrund dieser Voraussetzung können wir seine Wahrscheinlichkeiten multiplizieren). Deshalb ist den ersuchten Größtwert höchstens Man kann aber überprüfen, daß diese Minimalwert am höchsten steigt wenn $p=q=1-pq$ also wenn Deshalb wissen wir, wenn $Y$ konstante ist, daß wir einen Maximaltransitivitätsverstoß von $\phi^{-1}\approx 0.618$ erreichen könnten, doch ob es wirklich erreichbar ist wissen wir noch nicht. Sogar kann man von dieser Spezialfallgrenze eine generelle Grenze ableiten: in dieser Schrift von S. Trybula wird es bewiesen, daß der Maximaltransitivitätsverstoß $\phi^{-1}$ ist, auch wenn $Y$ nicht konstant sein kann. Das ist:

Es ist ein schönes Rätsel rausfinden, ob es zwar drei unabhängige Zufallsvariablen gibt oder nicht, die diese Obergrenze erreichen. Tatsache ist, daß ein solches Tripel existiert und zwar existiert ein Tripel in dem $Y$ konstant ist: Gleich könnte man diese Zufallsvariablen durch ihre Wahrscheinlichkeitsdichtefunktionen beschreiben: und etwa so visualisieren:

Fig 2

Wenn es um vier oder mehr Zufallsvariablen gibt bin ich mir nicht sicher, wieviel der Maximaltransitivitätsverstoß wäre. Mit mehrere Zufallsvariablen kann man die Obergrenze $\phi^{-1}$ überschreiten aber es läßt sich ziemlich einfach beweisen, daß es eine universale Obergrenze von $3/4$ gibt, das ist, wenn $X_1,X_2,\cdots, X_n$ unabhängige Zufallsvariablen sind, dann muss es sein, daß Kannst du diese Obergrenze beweisen? Wenn du ein Hinweis möchtest, würde ich dir andeuten, es könnte günstig sein, Mediane der $n$ Zufallsvariablen überzulegen.

Parametrisierung einer Familie von intransiitiven Zufallsvariablen

Nehmen wir mal an, daß wir drei Zufallsvariablen $X,Y,Z$ haben, und daß wir eine ganze Familie von Zufallsvariablen so bestimmen: wenn $p+q+r=1$. Das ist, $W(p,q,r)$ heißt ein Zufallsvariabel, der sein Wert von $X$ nimmt mit Wahrscheinlichkeit $p$, von $Y$ mit Wahrscheinlichkeit $q$ und von $Z$ mit Wahrscheinlichkeit $r$. Anders gesagt, wenn $f_X,f_Y,f_Z$ die Wahrscheinlichkeitsdichtefunktionen von $X,Y,Z$ bzw. sind, dann wird die Wahrscheinlichkeitsdichtefunktion von $W(p,q,r)$ Wir könnten diese Familie von Zufallsvariablen als dreidimensionale Vektoren von $\mathbb R^3$ parametrisieren: Wenn man die Parameter $p,q,r$ beziehungsweise alle mögliche Werten der Interval $[0,1]$ bekommen laßen, derart $p+q+r=1$, dann manifestiert sich der Raum aller möglichen Zufallsvariablen dieser Familie als ein Dreieck in $\mathbb R^3$:

Fig 5

Um ganz exakt zu sein, wir beschreiben eine Einbettung der konvexe Hülle der drei Funktionen $f_X,f_Y,f_Z$ im Vektorraum alle Distributionen auf $\mathbb R$ in dem dreidimensionalen Vektorraum $\mathbb R^3$ mittels eine konvexkombinationstreue Abbildung. Bitte beachte, daß die Zufallsvariablen $W(1,0,0), W(0,1,0), W(0,0,1)$ sind gleich verteilt wie $X,Y,Z$ beziehungsweise und den Ecken des Dreiecks entsprechen.

Wenn wir noch mal annehmen, daß die drei Zufallsvariablen $X,Y,Z$ mit Wahrscheinlichkeit $1$ verschiedene Werte hervorbringen, und wenn wir die drei Wahrscheinlichkeiten wissen, dann können wir die Wahrscheinlichkeit jeder Vergleichung von zwei Zufallsvariablen unserer Familie $W(p,q,r)$ berechnen, also, die Wahrscheinlichkeit kalkulieren. Die Parametrisierung dieser Zufallsvariablen als Vektoren wird uns sehr nützlich, um diese Wahrscheinlichkeit einfach zu formulieren: wenn $\mathbf{w}_0, \mathbf{w}_1$ die Vektoren, die $W(p_0,q_0,r_0)$ und $W(p_1,q_1,r_1)$ bzw. entsprechen, und $A$ die Matrix ist, dann kann man fallweise beweisen, daß

Endlich bedenken wir den Fall, in dem $X,Y,Z$ drei unabhängige Zufallsvariablen die die Transitivität maximal missachten sind. Dann wird Merke: wir können $A$ anders beschreiben als in der $C$ die Permutationsmatrix bezeichnet. Und diese Matrix, als lineare Abbildung des Vektorraum $\mathbb R^3$, permutiert die drei Koordinaten der Vektoren, oder es führt eine Drehung von $2\pi/3$ um den Vektor $\langle 1,1,1\rangle$ durch:

Fig 6

Was sehr interessant ist, ist daß $C$ ein Spezialfall der generellen Rotationsmatrix $R_\theta$ um den Vektor $\langle 1,1,1\rangle$ im Gegenuhrzeigersinn ist, sodass $C=R_{2\pi/3}$. Alle Rotationsmatrizen um die gleichen Achse laßen sich vertauschen weil $R_{\theta_0} R_{\theta_1} = R_{\theta_0 + \theta_1}$, deshalb für jede $\theta$. Zur Folge, jede $R_\theta$ sich mit $A$ vertauschen läßt, weil Deshalb wird die Möglichkeit des Ergebnis $W_0 < W_1$, wenn wir die Vektoren der Parameter $\mathbf w_0, \mathbf w_1$ sich $\theta$ Radianten in der Ebene $x+y+z=1$ drehen laßen, also, sich mit $R_\theta \mathbf w_0, R_\theta \mathbf w_1$ ersetzen laßen, weil Tatsächlich kann man die Wahrscheinlichkeit $\mathbb P(W_0 < W_1)$ kalkulieren auch wenn man nur die Größe der Komponenten und den Wert des Winkels zwischen den Komponenten der Vektoren $\mathbf w_0, \mathbf w_1$ in der Ebene $x+y+z=1$. Wenn seine Projektionen auf diese Ebene Größe $r_0, r_1$ haben und einen Winkel $\Delta\theta$ im Gegenuhrzeigersinn miteinander bilden, etwa so:

Fig 7

dann wird $\mathbb P(W_0 < W_1)$:

Also, wenn man eine längere Kette von Zufallsvariablen $X_1, \cdots, X_n$ aufbauen will, die intransitiv sind, derart, daß könnte man einfach $n$ Vektoren in diesem Dreiecke finden, die die gleiche Länge haben und kongruenten Winkeln bzw. formen. Zum Beispiel, wenn man die $5$ Zufallsvariablen betrachtet, die den Vektoren oder

Fig 8

entsprechen, denn bekommt man einen (kleinen aber nicht nightigen) Transitivitätsverstoß von $\approx 0.532$, das ist, die Minimalwahrscheinlichkeit von $\mathbb P(W_0 < W_1), \cdots, \mathbb P(W_4 < W_0)$ wird $\approx 0.532$. Vermittels diese geometrische Visualisierung kann man größere und komplexere Familien von intransitiven Zufallsvariablen aufbauen, obwohl sie in den meisten Fällen nicht optimal sind.


zurück zur Startseite
The posts on this website are licensed under CC-by-NC 4.0.