Scheinkorrelation
Eine statistische Korrelation scheint eine Kausalbeziehung aufzuzeigen, die aber nicht durch weitere Beweise belegt wird.
Beispiel:
Die Zahl von Störchennestern in einer Region korreliert hoch mit der Geburtenrate [bei Menschen] in dieser Region.
Folglich gibt es einen Kausalzusammenhang zwischen Störchen und Geburten.
Störche fühlen sich naheliegenderweise dort am wohlsten, wo sie genügend Nahrung finden und das ist eher auf dem Land der Fall als in der Stadt. Ebenso ist die Geburtenrate bei Menschen auf dem Land höher als in der Stadt, was wiederum an Faktoren wie (vermutete) Lebensqualität, günstigerem Wohnraum und anderen liegen könnte – sicher aber nicht an der höheren Storchendichte.
Beschreibung
Grundsätzlich beschreibt eine Korrelation immer einen statistischen Zusammenhang; Kausalität hingegen beschreibt – wie der Name schon sagt: einen Kausalzusammenhang.
Auch wenn eine (möglichst hohe) Korrelation ein Hinweis auf eine wie auch immer geartete Kausalbeziehung sein kann, reicht diese keinesfalls aus, um auf eine Kausalität zu schließen.
Korrelation und Kausalität
Während „Korrelation“ ein gemeinsames Auftreten von Ereignissen bezeichnet, beschreibt „Kausalität“ eine Ursache-Wirkung-Beziehung zwischen den Ereignissen.
Die Frage, was eigentlich Kausalität ausmacht ist dabei erstaunlich komplex, weswegen selbst eine kurze Einführung in das Thema in einen eigenen Artikel ausgelagert wurde: Kausalität.
Kurz gesagt handelt es sich um einen Begriff, der nur schwer klar zu definieren ist – was dazu führt, dass auch die verschiedenen wissenschaftlichen Disziplinen ihn zum Teil sehr unterschiedlich behandeln. Wenn es überhaupt einen kleinsten gemeinsammen Nenner zwischen all den verschiedenen Ansätzen gibt, dann die folgende Erkenntnis:
Korrelation impliziert keine Kausalität!
D.h. dass sich alleine aus einer Korrelation keine Kausalität ableiten lässt. Ebenso unstrittig ist aber auch, dass eine hohe Korrelation notwendige Voraussetzung für Kausalität ist.
Correlation-Hacking
Stehen genügend unterschiedliche Datensätze bereit, ist es gewöhnlich nicht schwer, eine Kombination aus zweien zu finden, die „zufällig“ eine hohe Korrelation zueinander haben.
Im besten Fall sind solche Scheinkorrelationen dann leicht zu durchschauen und durchaus unterhaltsam, wenn etwa die „Zahl der Museen in Bayern“ mit der „Zahl der Beschäftigten im deutschen Bäckerhandwerk“ korreliert wird (Korrelationskoeffizient: 0,9883 für die Jahre 2007 bis 2012), im schlimmsten Fall ist das weniger offensichtlich und führt womöglich sogar in die Irre.
Eine solche Suche nach Korrelationen in Datensätzen ist vergleichbar mit der als „𝑝-Hacking“ bekannten Fehlanalyse von Daten. In beiden Fällen werden mehrere Analysen so behandelt, als handle es sich um eine einzige – mit entsprechend falschen Ergebnissen.
Abgrenzung
Von der hier erklärten Scheinkorrelation ist zu unterscheiden:
Der Korrelationsirrtum ist ein Denkfehler, der darin besteht, dass korrelierte, also gemeinsam bzw. aufeinander folgend auftretende, Ereignisse bzw. Phänomene als kausal verbunden angenommen werden, sowie
Die Kausalillusion, ein unbewusster psychologischer Effekt (kognitive Verzerrung), welche gemeinsam oder in zeitlicher Abfolge vorkommende Phänomene als kausal verbunden erscheinen lässt.
Beide sind eng miteinander verbunden und möglicherweise sogar dasselbe Phänomen, das nur von verschiedenen Gesichtspunkten betrachtet wird.
Beispiele
Sammlung von Scheinkorrelationen
Es gibt verschiedene Sammlungen von offensichtlichen Scheinkorrelationen, die sehr kurzweilig durchzulesen sind. Dabei hat sich die folgende als besonders langlebig erwiesen:
- Tyler Vigen: Spurious Correlations (Englisch)
Badeunfälle und Eisverkäufer
Als ein klassisches Textbuchbeispiel sei hier noch die (notorisch hohe!) Korrelation zwischen Eisverkäufern und Badeunfällen am Strand erwähnt.
Aus nahe liegenden Gründen tauchen sowohl Eisverkäufer als auch Badeurlauber häufig zur gleichen Zeit am Strand auf, nämlich vor allem an heißen Sommertagen. Letztere suchen auch gerne Erfrischung im Wasser, was dann leicht zu Badeunfällen führen kann. Je mehr Badegäste, desto mehr Badeunfälle – aber auch umso mehr Eisverkäufer, die sich ein gutes Geschäft erhoffen.
Es ist offensichtlich unsinnig, den Eisverkäufern die „Schuld“ für die Badeunfälle zu geben. Zwischen diesen und den Unfällen besteht kein direkter Kausalzusammenhang.
In solchen Fällen sind die Scheinkorrelationen recht leicht zu durchschauen, da die meisten von uns schon Erfahrungen mit Eisverkäufern und mit Badestränden haben und der tatsächliche zugrunde liegende Mechanismus (heißes Wetter → mehr Badegäste → mehr Badeunfälle) leicht zu verstehen ist.
Das wird schwieriger, wenn man sich Korrelationen anschaut, die abstraktere und womöglich sogar emotional aufgeladene Themen betreffen:
Gewalttätige Videospiele und Amokläufe
Vor allem nach spektakulären Gewalttaten wird immer wieder die Behauptung aufgestellt, es gäbe einen Zusammenhang zwischen der Beliebtheit gewalttätiger Videospiele und Amokläufen. Untersuchungen zeigen jedoch, dass andere Faktoren, wie etwa die Verfügbarkeit professioneller Hilfe in psychischen Ausnahmesituationen oder die Verfügbarkeit von Waffen, sehr viel bessere Indikatoren für die Wahrscheinlichkeit von Amokläufen sind.
Immigration und Kriminalität
Aus den zahlreichen Daten, die zu Immigration, Ausländeranteilen in der Bevölkerung und Kriminalitätsraten gesammelt werden, lassen sich auch immer wieder Datensätze korrellieren. Ob diese aber tatsächlich eine Kausalbeziehung anzeigen, ist zumindest fraglich – andere Faktoren, wie sozio-ökonomischer Status oder Bildungsstand sind deutlich stärḱere Kandidaten um Kriminalitätsraten zu erklären.
Impfungen und Autismus
Die Diagnose von Autismus findet meist im Kindesalter statt, ziemlich genau in der Zeit, in der auch die wichtigsten Impfungen an Kinder verabreicht werden. Eine solche zeitliche Korrelation kann dazu führen, dass der Autismus als kausale Folge der Impfung wahrgenommen wird. Im Kombination mit dem natürlichen Beschützerinstinkt der Eltern, sowie viel Desinformation auf sozialen Medien rund um dieses Thema, hat das dazu geführt, dass seit Jahren die Impfquoten bei Kindern zurück gehen, und in der Folge, dass längst „besiegt“ geglaubte Krankheiten, vor denen diese Impfungen eigentlich schützen würden, wieder auf dem Vormarsch sind.
Fazit
Alles, was man aus diesem Artikel lernen sollte, lässt sich eigentlich recht gut in einer einzigen prägnaten Aussage zusammenfassen:
Korrelation impliziert keine Kausalität!
Leider ist es nicht immer einfach, diese Erkenntnis auch in die Tat umzusetzen. Vor allem solche Scheinkorrelationen, die allzu gut in das eigene Weltbild zu passen scheinen, oder die bestehende Meinungen und Haltungen zu unterstützen scheinen, werden allzu leicht unkritisch akzeptiert (Bestätigungsneigung). Umso mehr sollte man gerade bei solchen Themen lieber etwas kritischer hinschauen.
Siehe auch
Weitere Informationen
- Scheinkorrelation auf Wikipedia.
- Spurious Correlations von Tyler Vigen (Englisch)
