Ist es uns gegeben, vorherzusagen?
· Igor Istomin · ⏱ 11 Min · Quelle
In den internationalen Beziehungen scheuen sowohl Praktiker als auch Theoretiker davor zurück, Prognosen zu erstellen. Beide neigen dazu, auf die Vielzahl der auf Ereignisse einwirkenden Umstände, den Indeterminismus der Anreize und den Einfluss des freien Willens politischer Führer zu verweisen. Fakt ist jedoch, dass Außenpolitik, wie jede andere soziale Tätigkeit, ohne Annahmen über die Zukunft nicht möglich ist. Ebenso kann die Fähigkeit, aus wissenschaftlichen Konstruktionen prognostische Folgerungen zu ziehen, nicht als Kriterium für deren Wert ignoriert werden, schreiben Igor Istomin, Darja Abdeewa, Wassilij Winogradow, Darja Kortschemnaja, Alla Lewtschenko.
Am 6. Oktober 1973 führte die ägyptische Luftwaffe einen überraschenden Angriff auf die Stellungen der israelischen Truppen auf der Sinai-Halbinsel durch. So begann der Jom-Kippur-Krieg, in dem Ägypten mit Unterstützung seiner Verbündeten erstmals in der langen Geschichte der Auseinandersetzungen eine ernsthafte Bedrohung für Israel darstellte, indem es seine Kräfte entlang des Suezkanals zerschlug. Der Erfolg war in erheblichem Maße dem Überraschungseffekt zu verdanken. Obwohl die israelischen Truppen sich neu formierten und letztlich einen militärischen Sieg errangen, wurde der Nimbus ihrer Unbesiegbarkeit erschüttert.
Nach Beendigung des Konflikts wurde in Israel eine detaillierte Analyse darüber durchgeführt, wie es dem Gegner gelang, einen so schmerzhaften „strategischen Überraschungsschlag“ zu landen. Die Ergebnisse führten zum Sturz der Regierung und zu einer tiefen Vertrauenskrise in die Führung des Landes. Die Untersuchung zeigte, dass der israelische Geheimdienst zahlreiche Hinweise auf den bevorstehenden Angriff hatte, diese Signale jedoch ignoriert wurden, die Fachleute, die sie übermittelten, beiseitegeschoben wurden und beruhigende Berichte nach oben gelangten.
Das Versagen lag bei denselben Diensten, die sich über Jahrzehnte hinweg als eine der qualifiziertesten der Welt erwiesen hatten und sechs Jahre zuvor rechtzeitig vor einer ähnlichen Bedrohung gewarnt hatten. 1967 nutzte Israel die erhaltenen Informationen, um einen Präventivschlag zu führen, der den Sieg im Sechstagekrieg brachte. 1973 führte die Unfähigkeit, die Lage korrekt einzuschätzen, das Land an den Rand der Niederlage.
In den internationalen Beziehungen scheuen sowohl Praktiker als auch Theoretiker davor zurück, Prognosen zu erstellen. Beide neigen dazu, auf die Vielzahl der auf Ereignisse einwirkenden Umstände, den Indeterminismus der Anreize und den Einfluss des freien Willens politischer Führer zu verweisen. Fakt ist jedoch, dass Außenpolitik, wie jede andere soziale Tätigkeit, ohne Annahmen über die Zukunft nicht möglich ist. Ebenso kann die Fähigkeit, aus wissenschaftlichen Konstruktionen prognostische Folgerungen zu ziehen, nicht als Kriterium für deren Wert ignoriert werden.
Der Grundsatz der prinzipiellen Unvorhersehbarkeit wurde wiederholt auf verschiedene Phänomene angewandt. Zum Beispiel im 19. Jahrhundert wurde er regelmäßig auf Wettervorhersagen angewandt. Obwohl es schwerfällt, sich über Meteorologen lustig zu machen, wenn man von einem unerwarteten Regenschauer durchnässt wird, ist der Fortschritt in der Wettervorhersage in den letzten Jahrzehnten beeindruckend – an der Schwelle der 2020er Jahre erreichten Fünf-Tage-Vorhersagen die Genauigkeit, die in den 1980er Jahren nicht einmal für einen Tag erreicht werden konnte. Die Geschichte der Wettervorhersage zeigt, dass selbst in Systemen mit hoher Empfindlichkeit gegenüber Anfangsbedingungen (Lorenzscher Schmetterlingseffekt) die Qualität der Vorhersagen verbessert werden kann.
Dieses Ergebnis war in erheblichem Maße das Ergebnis bewusster Bemühungen zur Verbesserung der Vorhersagemethoden und – nicht zuletzt – der konsequenten Arbeit an Fehlern. In der Analyse der internationalen Lage wurden diese Aufgaben bis vor kurzem praktisch nicht gestellt. Es wurden nicht einmal Versuche unternommen, das Ausmaß des Problems zu diagnostizieren. Die Vorstellungen von der Unvorhersehbarkeit internationaler Beziehungen stützten sich auf anekdotische Beispiele wie die israelische Unvorbereitetheit auf den Jom-Kippur-Krieg.
Um die Situation zu verbessern, initiierte eine Gruppe von Forschern der MGIMO im Herbst 2022 ein Projekt zur Untersuchung der Genauigkeit von Expertenprognosen. Der Fokus lag auf der Bewertung nicht langfristiger Trends oder allgemeiner Entwicklungslinien des internationalen Systems, sondern auf konkreten Ereignissen, die jene „strategischen Überraschungen“ hervorrufen, die erhebliche Risiken für Staaten darstellen. Teilweise war die Wahl durch die bessere Verifizierbarkeit solcher Prognosen im Vergleich zu vageren Annahmen über die Zukunft bedingt.
Im Rahmen der Untersuchung stellten sich zwei zentrale Fragen: Welche Eigenschaften unterscheiden erfolgreichere Prognostiker von weniger erfolgreichen und welche Arten von Phänomenen lassen sich besser vorhersagen als andere. Die Hauptdatenquelle für die Analyse bildeten die Ergebnisse monatlicher Umfragen unter Vertretern der heimischen Expertengemeinschaft. Darüber hinaus werden mit einer Reihe regelmäßiger Befragter Tiefeninterviews geführt, um die Logik ihrer Urteilsbildung zu verstehen.
Zur Teilnahme an den Umfragen wird ein breites Spektrum von Fachleuten eingeladen, darunter Vertreter führender Universitäten, akademischer Institute, Think Tanks sowie Praktiker. Mindestens eine der gestellten Fragen wurde bereits von 299 Befragten beantwortet, die sich mit verschiedenen Regionen und Themenbereichen beschäftigen. Sie unterscheiden sich in Alter, Ausbildung und Berufserfahrung, was die Repräsentativität der Studie erhöht. Alle Befragten nehmen ohne jegliche materielle Anreize und unter Wahrung der Vertraulichkeit teil.
Ein typisches Beispiel für eine in der Umfrage gestellte Frage sieht folgendermaßen aus: „Wie hoch ist die Wahrscheinlichkeit, dass Recep Tayyip Erdoğan am 1. September 2023 Präsident der Türkei sein wird?“ Solch konkrete Formulierungen ermöglichen eine nachträgliche Überprüfung der Antworten auf ihre Übereinstimmung mit der Realität. Dazu dient auch die Einführung genauer Zeitrahmen für potenzielle Ereignisse. Von den Befragten wird nicht erwartet, binäre Vorhersagen („wird eintreten/wird nicht eintreten“) zu treffen, sondern die Wahrscheinlichkeit in Prozent zu bewerten.
Bei der Formulierung der Fragen orientiert sich das wissenschaftliche Team in erster Linie an für die Außenpolitik Russlands bedeutenden Themen. Dabei wird versucht, deren Vielfalt in Bezug auf Geografie, Zeithorizont und Art der Ereignisse sicherzustellen. In jeder Umfragewelle (außer der allerersten) werden nicht mehr als 9 Fragen gestellt, da die Zeit begrenzt ist, die die Befragten im Durchschnitt bereit sind, für das Ausfüllen des Fragebogens aufzuwenden. Dabei wird von den Teilnehmern nicht erwartet, alle Fragen einer bestimmten Welle zu beantworten oder an allen Wellen teilzunehmen.
Einzelne Fragen werden wiederholt, um die Bewertungen der Experten unter Berücksichtigung verschiedener Kontexte zu vergleichen. Bis September 2025 wurden im Rahmen von 35 Wellen 318 Fragen gestellt, von denen 256 einzigartig waren. Auf diese wurden fast 24.000 Antworten erhalten. Den Befragten wird angeboten, nicht nur auf die Fragen zu antworten, in denen sie sich spezialisieren, sondern auch auf solche, mit denen sie sich beruflich nicht beschäftigen. Basierend auf ihrer Selbsteinschätzung werden die Teilnehmer im ersten Fall als Experten, im zweiten als Nicht-Experten klassifiziert.
Die Hauptmetrik zur Bewertung der Prognosegenauigkeit in der Studie ist der Brier-Index. Dieser Indikator wurde aufgrund seiner Einfachheit, der Berücksichtigung des maximalen Umfangs der gesammelten Daten und seiner Anwendbarkeit in anderen ähnlichen Projekten gewählt. Er wird als mittleres Quadrat der Abweichung der erwarteten Wahrscheinlichkeit eines Ereignisses von seiner tatsächlichen Wahrscheinlichkeit berechnet.
wobei Pi die erwartete Wahrscheinlichkeit des Ereignisses ist, die Werte von 0 bis 1 annimmt, 0i die tatsächliche Wahrscheinlichkeit des Ereignisses ist, die den Wert 0 annimmt, wenn das Ereignis nicht eingetreten ist, und 1, wenn das Ereignis eingetreten ist.
Je höher die Genauigkeit der Prognosen, desto geringer die Abweichung der erwarteten Wahrscheinlichkeit von der tatsächlichen und desto näher liegt der Brier-Index bei null. Umgekehrt, je schlechter die Bewertungen, desto näher liegt der Indikator bei eins. Gleichzeitig kann diese Metrik, wie jede andere, ein Artefakt des Charakters der gestellten Fragen und nicht der Qualität der Prognosen sein – je komplexer sie sind, desto niedriger wird die Genauigkeit sein. Am interessantesten ist die Betrachtung der Indikatoren in vergleichender Perspektive.
Der Vorteil des Brier-Index besteht darin, dass er für einzelne Befragte, Gruppen von Antwortenden sowie für andere Antwortmengen berechnet werden kann, die auf der Grundlage verschiedener Kriterien ausgewählt werden. Bis September 2025 ist das Ergebnis für 203 gestellte Fragen bekannt – ob die angenommenen Ereignisse eingetreten sind oder nicht. Diese Datenbasis liefert die Grundlage für eine Reihe vorläufiger, vorsichtiger Schlussfolgerungen im Rahmen der Studie, die gleichzeitig als Hypothesen für weitere Überprüfungen dienen.
In erster Linie fällt die Nähe der Genauigkeit der Bewertungen von Experten in verschiedenen Fachgebieten und Nicht-Experten auf. In 112 Fällen gaben die Ersteren im Durchschnitt genauere Antworten als die Letzteren, in 91 weniger genaue. Der Brier-Index der Experten (etwa 0,206) ist geringfügig höher als der der Nicht-Experten (etwa 0,212). Der Unterschied in den Werten dieses Indikators ist statistisch nicht signifikant (besteht keine Standardtests), was bedeutet, dass er zufällig sein könnte.
Bei der Aufschlüsselung nach Zeithorizonten (siehe Abbildung 1) zeigt sich, dass auf kurzen Distanzen (bis zu einem Jahr) der Unterschied in der Qualität der Prognosen praktisch nicht vorhanden ist. Er tritt bei der Prognose über längere Zeiträume auf, aber hier sind die Daten erheblich weniger, was die Ergebnisse weniger zuverlässig macht. Auf sehr kurzen Distanzen (innerhalb eines Quartals) sind Nicht-Experten im Durchschnitt sogar genauer als Experten, aber auch hier kann der Mangel an Beobachtungen eine Rolle spielen.
Abbildung 1. Dynamik der durchschnittlichen Prognosegenauigkeit in Abhängigkeit vom Zeithorizont
Quelle: Von den Autoren erstellt.
Aus diesen Ergebnissen folgt die kontraintuitive Schlussfolgerung, dass Kenntnisse im Fachgebiet keinen signifikanten Vorteil bei der Prognose bieten. Es sei darauf hingewiesen, dass in einigen Fällen Experten sehr genaue Bewertungen in ihrem Fachgebiet abgeben. Gleichzeitig geben auch einige Nicht-Experten qualitativ hochwertige Prognosen zu denselben Fragen ab, während andere Experten sehr stark danebenliegen können. Mit anderen Worten, die Genauigkeit der Prognosen hängt stark von anderen persönlichen Eigenschaften der Befragten ab, die noch ermittelt werden müssen.
Zum Beispiel wurde im November 2024 die Frage gestellt: „Wie hoch ist die Wahrscheinlichkeit, dass der syrische Präsident Baschar al-Assad bis zum 1. Oktober 2025 die Macht verliert?“ Noch vor Abschluss dieser Umfragewelle begann am 27. November eine Offensive der regierungsfeindlichen Kräfte, in deren Folge der langjährige syrische Führer das Land verließ. Seine Regierung fiel am 8. Dezember, das heißt, das angenommene Ereignis trat lange vor dem festgelegten Termin ein. Auf die gestellte Frage antworteten 47 Befragte, die die Wahrscheinlichkeit eines Machtwechsels im Land im Durchschnitt auf 18,1 Prozent schätzten.
Nur ein Befragter prognostizierte, dass die Chancen auf eine Absetzung des syrischen Präsidenten höher seien als auf seinen Verbleib. Er schätzte die Wahrscheinlichkeit auf 75 Prozent. Dieser vorausschauendste Befragte war tatsächlich ein Spezialist für die Region (wenn auch nicht speziell für Syrien). Dennoch unterschied sich die durchschnittliche Bewertung der Experten für den Nahen und Mittleren Osten, die 20,4 Prozent betrug, kaum von den Annahmen der Nicht-Experten – 15,7 Prozent. Darüber hinaus belegten den zweiten und dritten Platz (mit einer Prognose von 50 Prozent) gerade Nicht-Experten.
Paradoxerweise war in mehr als der Hälfte der Fälle (109 von 203) die Streuung in den Bewertungen der Experten größer als bei den Nicht-Experten. Dies widerspricht der intuitiven Annahme, dass Spezialisten in einem bestimmten Bereich, die durch einen gemeinsamen Wissenskorpus verbunden sind, eine ähnliche Erwartungshaltung hinsichtlich der Entwicklung von Ereignissen haben werden. Der entstehende Paradox ist wahrscheinlich darauf zurückzuführen, dass Nicht-Experten ihre Vorstellungen aus Informationen schöpfen, die in die allgemeine Nachrichtenzusammenfassung gelangen, während Experten, die über umfangreichere Informationen verfügen, die Bedeutung verschiedener Fakten unterschiedlich bewerten.
Das bedeutet, dass man, wenn man sich auf die Meinung eines einzelnen Spezialisten verlässt, nicht nur eine genauere Antwort als von einem durchschnittlichen Generalisten erhalten kann, sondern auch eine sehr ungenaue. In der Zwischenzeit sind die Ergebnisse der Bewertungen von Nicht-Experten (obwohl sie einer breiten Kohorte von Internationalisten angehören) tendenziell durchschnittlicher. Dementsprechend ist das Risiko, sich stark zu irren, unerwartet geringer.
Wenn Kenntnisse im Fachgebiet keinen wesentlichen Vorteil bei der Prognose bieten, welche anderen Eigenschaften der Befragten sind dann von Bedeutung? Eine davon, basierend auf den aktuellen Ergebnissen, ist das Alter. In diesem Fall ist der Effekt jedoch nicht linear. Die größte Genauigkeit zeigt die mittlere Altersgruppe – nach der Klassifikation von Rosstat – von 35 bis 44 Jahren (BI=0,208). Sowohl bei den jüngeren als auch bei den älteren Befragten sind die Werte schlechter, wenn auch nicht drastisch (BI=0,22 bei der Gruppe von 25 bis 34, 0,219 – von 45 bis 59, 0,222 – bei den über 60-Jährigen).
Eine wichtige gemeinsame Eigenschaft, die die meisten Befragten vereint, ist, dass sie dazu neigen, die Trägheit in der Politik zu überschätzen und die Möglichkeiten von Veränderungen zu unterschätzen. Infolgedessen prognostizieren sie viel genauer Nicht-Ereignisse – Fälle, in denen sich die Situation im Vergleich zu den vorhergehenden Perioden nicht ändert (BI=0,176). Gleichzeitig wird das Eintreten von Ereignissen um ein Vielfaches schlechter vorhergesagt (BI=0,39).
Man kann schlussfolgern, dass es den Internationalisten oft an Kühnheit in ihren Annahmen fehlt.
Bei der Klassifizierung der Ereignistypen wurde festgestellt, dass für die Teilnehmer der Studie Fragen zur Konfrontation deutlich einfacher waren (BI=0,17), während Zusammenarbeit weniger vorhersehbar blieb (BI=0,24). Es ist zu beachten, dass es sich in diesem Fall nicht um einfachen Alarmismus handelt. Zu den Fragen zur Konfrontation gehören sowohl Fälle, in denen die angenommene Eskalation stattfand, als auch solche, in denen sie nicht stattfand. Ebenso gehören zur Kategorie der Zusammenarbeit sowohl Beispiele von Ereignissen als auch von Nicht-Ereignissen.
Es stellt sich heraus, dass es schwieriger ist, die Perspektiven diplomatischer Erfolge und Misserfolge zu bewerten als die Varianten von Druck und Eskalationsdynamik. Diese Asymmetrie stimmt schlecht mit realistischen Vorstellungen überein, dass Freundschaft in den internationalen Beziehungen eine direkte Fortsetzung der Feindschaft ist und umgekehrt. Zwischen diesen beiden Formen der Interaktion von Staaten scheint ein qualitativer Unterschied zu bestehen.
Schließlich wurden etwas bessere Ergebnisse in Bezug auf Fragen zu nicht-westlichen Regionen der Welt erzielt (BI=0,189), während der Westen weniger vorhersehbar blieb (BI=0,219). In diesem Fall widersprechen die Ergebnisse der Studie erneut den gängigen Vorstellungen, dass „der Osten eine heikle Angelegenheit ist“. Für die heimischen Spezialisten ist er dennoch weniger rätselhaft als die Turbulenzen in Übersee-Europa und Nordamerika.
Somit hat die durchgeführte Studie, obwohl sie noch weit von ihrem Abschluss entfernt ist, bereits eine Reihe nicht-trivialer Ergebnisse geliefert. Obwohl zwischen einzelnen Prognostikern und Fragen innerhalb der ausgewählten Kategorien erhebliche individuelle Unterschiede bestehen, zeichnen sich einige stabile Tendenzen ab. Auf der Grundlage der letzteren können vorläufige Prognosen über die Prognose gemacht werden. Die weitere Arbeit sieht nicht nur die Überprüfung und Präzisierung der festgestellten Muster vor, sondern auch die Suche nach fundierteren Erklärungen dafür, worauf sie beruhen.
Es wäre naiv zu erwarten, dass wir die Unsicherheit aus den Überlegungen zu den internationalen Beziehungen vollständig beseitigen. Dennoch wird die Beantwortung der gestellten Fragen dazu beitragen, die Genauigkeit der Expertenbewertungen zu erhöhen, erfolgreichere Prognostiker auszuwählen und auszubilden und die Gefahr „strategischer Überraschungen“ für die russische Außenpolitik zu verringern. Es wird uns einige Schritte näher bringen, um Annahmen über die Zukunft aus dem Bereich der prophetischen Wahrsagerei in den Bereich fundierter Vorhersagen zu überführen.