Was ist der Erwartungswert und warum soll ich ihn maximieren?

Es liegt im Interesse eines jeden Akteurs, die eigenen Ziele so gut als möglich zu erreichen. Wenn ich dies bei meinen Handlungen umsetze, dann handle ich rational. Was heißt es aber konkret, so zu handeln, dass man ein Ziel bestmöglich erreicht?

Risiko

Wenn wir mit einer absoluten Gewissheit konfrontiert sind, dann ist der Fall klar. Ich möchte diejenige Handlungsoption wählen, die von mir am höchsten bewertet wird. Wenn es mein Ziel wäre, möglichst viel Geld zu verdienen und ich entweder eine Zehner- oder eine Hunderternote auswählen kann, dann wähle ich natürlich die Hunderternote.

Nun sind aber weder die Welt, und insbesondere auch nicht unsere Sinnesorgane, so beschaffen, dass wir die Konsequenzen unserer Handlungen jeweils mit Gewissheit voraussagen können. Wenn ich mir beispielsweise überlege, einen Lottoschein zu kaufen, dann ist die Wahrscheinlichkeit hoch, dass ich das bezahlte Geld verlieren werde. Mit einer kleinen Wahrscheinlichkeit jedoch gewinne ich auch mehr, als ich einsetze.

Entscheidungsfindung unter Unsicherheit

In anderen Fällen haben wir (anders als im Lotto) nicht einmal exakte Vorgaben dazu, wie sich unser Risiko respektive unsere Gewinnchancen genau ausrechnen lassen. Aber trotzdem müssen wir nach bestem Wissen und Gewissen Wahrscheinlichkeiten setzen, weil wir uns schlussendlich irgendwie entscheiden müssen. Die Wahrscheinlichkeiten, die wir für das Eintreffen eines Ereignisses – beispielsweise ob unser Startup erfolgreich sein wird oder nicht – setzen, sind subjektive Wahrscheinlichkeiten, Werte zwischen 0 und 1. Sie bilden keine Gesetze der Welt ab, sondern sie machen unsere besten Schätzungen aus, basierend auf all den (unvollständigen) Informationen, die wir zur Verfügung haben. (Jemand anderes, mit anderen Informationen und Grundannahmen, würde vielleicht eine andere Wahrscheinlichkeit auf den Erfolg unseres Startups setzen – und wann immer jemand andere Wahrscheinlichkeiten setzt, könnte es sich lohnen, Wetten einzugehen.) Ob wir eine Startup-Idee verfolgen oder nicht hängt u.a. davon ab, wie wir die Erfolgswahrscheinlichkeit einschätzen (und wie viel es zu gewinnen gibt). Es ist nicht erlaubt, bzw. es ist unsinnig, zu sagen, man “wisse nicht”, wie es um die Wahrscheinlichkeiten steht: Denn wenn man sich z.B. dagegen entscheidet, eine Startup-Idee zu verfolgen, oder wenn man sich dagegen entscheidet, auf den Erfolg einer Startup-Idee zu wetten (indem man beispielsweise Geld investiert), dann setzt man damit die Erfolgswahrscheinlichkeit implizit als “kleiner als lohnenswert”. Durch die eigene Handlung setzt man also (implizit) schon eine Wahrscheinlichkeit, weil man das Startup unterstützen wollen würde, wenn man die Wahrscheinlichkeit eines Erfolgs hoch genug einschätzen würde (z.B. höher als 10%, dass das Startup bald Millionen abwirft). Jede Handlung ist eine Wette, und das Beste, was wir in einer Welt voller Unsicherheiten machen können, ist – nach bestem Wissen und Gewissen – Wahrscheinlichkeitsschätzungen zu machen und dazu den Erwartungswert unserer Handlungen zu maximieren.

Was ist der Erwartungswert?

Der Erwartungswert einer Handlungsoption setzt sich aus der Summe aller möglichen Outcomes („Ausgänge“) zusammen, wobei jedes Outcome der Eintreffwahrscheinlichkeit nach gewichtet wird. Die Summe aller Eintreffwahrscheinlichkeiten muss 1 ergeben. Als Formel sieht das wie folgt aus:

Ein Beispiel:

Mir wird angeboten, dass ich entweder

a) 10 Franken bar auf die Hand bekomme, oder dass ich

b) ein Spiel spielen kann, bei dem ich 66 Franken bekomme, falls ein fairer, 6-seitiger Würfel beim ersten Wurf eine sechs zeigt, und jeweils 1 Franken verliere, wenn er keine sechs zeigt.

Der Erwartungswert der Handlungsoption a) beträgt 10.00 CHF, da nur ein Outcome gegeben ist, das mit Sicherheit eintreten wird.

Der Erwartungswert der Handlungsoption b) besteht aus zwei Komponenten, die wir addieren müssen. Man berechnet ihn wie folgt:

Die Wahrscheinlichkeit, dass keine sechs kommt, multipliziert mit dem dazugehörigen Outcome:

(5/6)*(-1) CHF = -0.83 CHF

Die Wahrscheinlichkeit, dass eine sechs kommt, multipliziert mit dem dazugehörigen Outcome: (1/6)*66 CHF = 11 CHF

Die Summe von beidem:

–(0.83 CHF) + 11 CHF = 10.17 CHF

Es folgt, dass ich im Erwartungswert 0.17 Franken mehr gewinne, falls ich mich für das Würfelspiel entscheide.

Heißt das, dass jemand irrational handelt, wenn er/sie sich für die 10 Franken auf sicher entscheidet? Nicht unbedingt! Die Frage ist, worauf es einer Person genau ankommt, d.h. was ihr Ziel ist.

Der Unterschied zwischen “Wert” und “Utility”

Es kann gut sein, dass wir in den fünf von sechs Fällen, in denen wir im obigen Beispiel beim Würfelspiel verlieren und einen Franken bezahlen müssen, überproportional enttäuscht darüber sein werden im Vergleich dazu, wie glücklich wir über den Gewinn der 66 Franken wären. Wenn ein Spieler das eigene Wohlbefinden auch einbeziehen möchte, dann könnte es also gut sein, dass die gefühlte Enttäuschung in fünf von sechs Fällen die zusätzliche Freude im sechsten Fall und die zusätzlichen 0.17 Franken im Erwartungswert nicht aufzuwiegen vermag.

Zudem könnte es auch sein, dass wir uns in einer Situation befinden, in der wir aus bestimmten Gründen dringend 10 Franken benötigen, z.B. wenn wir ohne Kreditkarte in der Stadt sind und vor Ladenschluss unbedingt noch ein bestimmtes Geburtstagsgeschenk für jemanden kaufen müssen, für das uns genau zehn Franken fehlen. In einem solchen Fall wäre es vermutlich sehr schlecht für uns, auf die kleine Chance zu spekulieren, viel Geld zu gewinnen (und damit den Erwartungswert an gewonnenem Geld zu maximieren), weil wir dann in Kauf nehmen müssten, dass wir in fünf von sechs Fällen eine uns wichtige Person enttäuschen werden.

Für kaum jemanden geht es im Leben primär um das Maximieren von Geld. Und weiterhin ist es auch nicht der Fall, dass doppelt so viel Geld für Leute jeweils doppelt so gut ist, da Geld (und Güter allgemein) in der Regel einen abnehmenden Grenznutzen haben.

Um all dies zusammenzufassen, was uns wichtig ist, gibt es das Konzept des Nutzens (engl. „utility“), das sich vom (monetären) Wert von Geld oder Gütern unterscheidet. Jedem möglichen Ausgang wird ein Nutzen zugeschrieben, abhängig davon, wie sehr wir dieses Outcome möchten, d.h. wie sehr es der Gesamtmenge unserer Ziele entspricht. Wenn eine Option für uns doppelt so viel Nutzen hat, dann bedeutet dies, dass wir sie, wenn wir vollständig informiert sind und keinen kognitiven Verzerrungen unterliegen, doppelt so gut finden würden.

Prinzipiell kann alles mögliche unter den Begriff Nutzen fallen – es kommt einfach darauf an, was unsere Ziele im Leben sind. Oft wird angenommen, dass “Nutzen” (oder auch “Rationalität”) immer mit Egoismus zu tun hat oder damit, Geld anzuhäufen. Dabei handelt es sich jedoch um ein Missverständnis. Auch altruistische Ziele können im Begriff Nutzen berücksichtigt sein.

Weil damit also alles berücksichtigt wird, was einem wichtig ist, macht es stets Sinn, im Erwartungswert den persönlichen Nutzen zu maximieren.

Warum den Erwartungswert maximieren?

Warum genau sollen wir den Erwartungswert maximieren und nicht irgend ein anderes Verhältnis zwischen Eintreffwahrscheinlichkeiten und Outcomes?

Nehmen wir ein Beispiel, bei dem es darum geht, anderen zu helfen. Und nehmen wir an, dass wir vollständig altruistisch sind und unser Nutzen mit jedem Menschen, dem wir helfen, linear zunimmt (d.h. es wäre für uns n Mal besser, einer Anzahl n an Menschen zu helfen, als einem einzigen Menschen zu helfen).

Auf einer Insel ist eine Epidemie ausgebrochen. Alle 20’000 Einwohner/innen schweben in Todesgefahr, da jede Infektion dieses Erregers innerhalb von drei Tagen zum qualvollen Erstickungstod führt. ExpertInnen schätzen die Dynamik so ein, dass bei fehlender Intervention die gesamte Inselbevölkerung innerhalb weniger Wochen sterben wird. Die Einwohner/innen dieser Insel verfügen nur über ein spärliches Gesundheitswesen, weshalb sie auf externe Hilfe angewiesen sind. Wir befinden uns auf der größeren Nachbarsinsel und koordinieren ein Rettungspaket. Dabei stehen wir vor der Wahl, welche der zwei auf dem Markt verfügbaren Medikamente wir einsetzen: SafeRelieve und/oder CheapRelieve. Beide Präparate wirken sowohl kurativ wie auch präventiv. SafeRelieve kostet 2.04 CHF pro behandelte Person und zieht zu 100% eine vollständige Genesung nach sich. CheapRelieve ist ein günstigeres aber auch weniger sicheres Produkt. Nämlich heilt es nur in 50% der Fälle vollständig; bei den restlichen Fällen wirkt es überhaupt nicht. Dies bei einem Preis von 1.00 CHF pro behandelter Person. Die Politik gewährt dem Rettungspaket ein Budget von 10’000 CHF. Das Paket ist so geplant, dass jede/r Einwohner/in mit gleich hoher Wahrscheinlichkeit das Medikament erhält. Wie gehen wir vor?

Angenommen, wir setzen alles auf SafeRelieve, so ersparen wir 10’000/2.04, also etwa 4’900 Einwohnern/innen die Todesqual. Setzen wir jedoch auf das zweite Medikament, so dürfen wir im Erwartungswert mit 10’000/1*0.5, also ungefähr 5’000 Unversehrten, rechnen. CheapRelieve mag weniger sicher erscheinen, aber wir erwarten damit das geringere Übel.

Theoretisch wäre es aber möglich (die Chance beträgt 2.3%1)Dieser Text baut auf Brian Tomasiks Why maximize expected value? auf. (Dort finden sich auch weitere Informationen zu den Rechenbeispielen.)
), dass wir großes Pech haben und CheapRelieve in sehr vielen Fällen nichts bewirkt, so dass dadurch insgesamt weniger Leuten geholfen würde.

Aufteilen

Wenn wir das Geld halb-halb aufteilen, und sowohl SafeRelieve als auch CheapRelieve kaufen, dann helfen wir im Erwartungswert 4’950 Leuten. Durch die vielen sicheren SafeRelieve Medikamente verringern wir die Varianz, d.h. wir verkleinern die Chance, dass durch Pech extrem wenig Leute gerettet werden. Der Preis, den wir dafür bezahlen, ist jedoch, dass wir die Chance verringern, dass extrem viele Leute gerettet werden, wodurch der Erwartungswert an geretteten Leuten insgesamt abnimmt. Wenn 100% CheapRelieve besser ist als 100% SafeRelieve, dann scheint es kein Argument zu geben, warum man einen Teil (wie viel genau?) des Geldes in SafeRelieve investieren sollte. Je mehr Medikamente man kaufen kann, desto klarer wird es, dass CheapRelieve stets die bessere Wahl ist.

Stellen wir uns nun folgende Situation vor: Wiederum koordinieren wir das Rettungspaket, aber dieses Mal finden wir heraus, dass wir eine zusätzliche Spende von 51 Franken bekommen haben, mit der wir mehr Medikamente kaufen können. Mit SafeRelieve retten wir garantiert 51/2.04 = 25 zusätzliche Leute. Mit CheapRelieve ist der Erwartungswert bei 25.5 Leuten. Dieses Mal besteht eine 44%ige(!) Wahrscheinlichkeit, dass CheapRelieve weniger Leuten hilft als SafeRelieve. Sollen wir dieses Mal, anders als bei der großen Spende, lieber auf Sicherheit setzen?

Sicherlich nicht! Die zusätzlichen 51 CHF sind nicht isoliert zu betrachten, sondern sie sind Teil des gesamten Budgets. Wenn wir mit einem Budget von 10’051 CHF angefangen hätten, gäbe es keinen Sinn, die Strategie zu wechseln. Wie wir oben gesehen haben, ist es nicht sinnvoll, das Geld über beide Medikamente aufzuteilen (siehe auch diesen Blogpost).

Law of Large Numbers

Der Erwartungswert misst im Wesentlichen das durchschnittliche Outcome, das eintrifft, wenn wir die Handlung enorm viele Male durchspielen würden. CheapRelieve schneidet im Erwartungswert immer besser ab. Zusätzlich gilt, dass je größer die Gesamtmenge an Leuten, denen CheapRelieve gegeben wird, desto wahrscheinlicher ist es, dass es auch in einem spezifischen Fall besser abschneidet.

Ein Argument dafür, immer den Erwartungswert zu maximieren, ist das „Law of Large Numbers“. Längerfristig, wenn wir eine Entscheidung immer wieder durchspielen würden, wird unser Gesamtgewinn praktisch garantiert dann am höchsten sein, wenn wir bei jeder einzelnen Entscheidung den Erwartungswert maximieren.

Dieses Argument mag überzeugend sein, aber man könnte immer noch einwenden, dass wir Entscheidungen in der Regel ja nur einmal fällen. Warum sollte man in einer einmaligen Entscheidung den Erwartungswert maximieren?

Willkür

Dazu kann man sich Folgendes überlegen: Wenn nicht den Erwartungswert maximieren, was sonst? Sobald man anfängt, Outcomes mit erhöhtem Risiko weniger als dem Erwartungswert nach zu gewichten, stellt sich sofort die Frage, wie viel weniger man sie gewichten möchte. Hier scheint es so, als ob prinzipiell jegliche Form der Gewichtung möglich wäre, ohne dass eine dieser unendlichen Möglichkeiten irgendwie heraussticht. Der Erwartungswert hingegen ist eindeutig und lässt sich sinnvoll ableiten (siehe nächster Punkt).

Axiomatischer Ansatz

Als weiteres Argument für die Maximierung des Erwartungsnutzens gibt es einen axiomatischen Ansatz, das sogenannte Von Neumann-Morgenstern Utility Theorem. Wenn eine Person ihre Präferenzen über eine Menge an Wetten angibt, und wenn diese Präferenzen vier intuitiv einleuchtenden Axiomen folgen, dann handelt diese Person so, als ob sie den Erwartungswert ihrer Zielfunktion (engl. utility function) maximieren möchte. Oder mit anderen Worten bedeutet dies, dass die Ablehnung der Maximierung des Erwartungsnutzens einer Verletzung von mindestens einem intuitiv einleuchtenden Axiom gleichkommt.

Die altruistische Perspektive

Für altruistische Nutzensdefinitionen gibt es interessanterweise noch ein zusätzliches Argument dafür, auch in isolierten Entscheidungssituationen stets den Erwartungswert zu maximieren. Wir können uns nämlich in die Perspektive derer versetzen, denen wir helfen möchten. Welche Entscheidung würde ich bevorzugen, wenn ich ein zufällig ausgewähltes hilfsbedürftiges Wesen wäre, welchem prinzipiell geholfen werden könnte? Ich würde diejenige Handlungsoption wählen, bei der meine Chance am größten ist, gerettet zu werden. Beim Insel-Beispiel oben würde ich also immer auf CheapRelieve setzen, selbst dann, wenn nur Medikamente für 51 Franken gekauft werden können.

Einstellung zum Risiko

Wer stets den Erwartungswert maximieren möchte, handelt risikoneutral. Wer Outcomes vorzieht, bei denen eine große Sicherheit besteht (selbst wenn der Erwartungswert einer anderen Handlungsoption höher wäre), der handelt risikoavers. Weil Menschen Verluste tendenziell stärker wahrnehmen als Gewinne, handeln sie irrationalerweise oft risikoavers.

Leute, die dafür argumentieren, dass Risikoaversion manchmal rational sein kann, haben oft den Unterschied zwischen “Wert” und “Nutzen” nicht berücksichtigt: Wenn jemand mir anbietet, mein gesamtes Vermögen auf den Ausgang eines Münzwurfs zu setzen, und mir im Gewinnfall noch einen Franken extra auf die Verdoppelung draufgelegt wird, dann würde ich bei diesem Spiel im Erwartungswert 0.5 Franken Gewinn machen. Allerdings wäre es für mich wahrscheinlich viel schlechter, all mein Hab und Gut zu verlieren, als es positiv wäre, meine Besitztümer zu verdoppeln. Dass man bei Geld manchmal (nicht immer!) „risikoavers“ handelt, macht also Sinn, weil es immer noch sein kann, dass man bezüglich des Nutzens davon, also von dem, worauf es einem letztendlich ankommt, den Erwartungswert maximiert.

Zusammenfassung

Selbst in Situationen, in denen das Abschätzen von Wahrscheinlichkeitswerten (immer zwischen 0 und 1) schwierig ist und es sich anfühlt, als ob wir Wahrscheinlichkeiten “aus der dünnen Luft heraussaugen” müssten, müssen wir zumindest implizit Werte festlegen, wenn wir uns basierend auf unseren Zielen für oder gegen eine bestimmte Handlung entscheiden. Wir müssen also immer geneigt sein, in Wahrscheinlichkeiten zu denken. (Natürlich lohnt es sich nur selten, z.B. bei großen, schwierigen Entscheidungen, viel Zeit in explizite Schätzungen zu investieren.) Das Prinzip der Maximierung des Erwartungswerts (bzw. des Erwartungsnutzens) gibt an, wie wir als rationale Akteure mit Ungewissheit in unseren Handlungsoptionen umgehen sollten.

Quellen

Martin Peterson (2009). An Introduction to Decision Theory. Cambridge University Press.

Zum nächsten Artikel

Dieser Artikel wurde ursprünglich auf der Website der Stiftung für Effektiven Altruismus veröffentlicht.


Zentrale Konzepte

Weiterführende Texte


Informieren & aktiv werden

Philosophie

Was sind gute Argumente dafür, anderen zu helfen –
und dabei zu versuchen, das Meiste zu bewirken?

Mehr

Werde aktiv

Es gibt viele Möglichkeiten, aktiv zu werden und etwas zu bewirken. Finde den Weg, der am besten zu dir passt.

Mehr

Newsletter

Wir schicken dir ein monatliches EA-Update, mit dem du immer auf dem Laufenden bleibst.

Veranstaltungen

Medien

Zeit Logo
Süddeutsche Logo
FAZ Logo
Spiegel Logo
SRF Logo
ZDF Logo