Inhaltsverzeichnis

Scheinkorrelation

Eine statistische Korrelation scheint eine Kausalbeziehung aufzuzeigen, die aber nicht durch weitere Beweise belegt wird.

Beispiel:

Die Zahl von Störchennestern in einer Region korreliert hoch mit der Geburtenrate [bei Menschen] in dieser Region.
Folglich gibt es einen Kausalzusammenhang zwischen Störchen und Geburten.

Störche fühlen sich naheliegenderweise dort am wohlsten, wo sie genügend Nahrung finden und das ist eher auf dem Land der Fall als in der Stadt. Ebenso ist die Geburtenrate bei Menschen auf dem Land höher als in der Stadt, was wiederum an Faktoren wie (vermutete) Lebensqualität, günstigerem Wohnraum und anderen liegen könnte – sicher aber nicht an der höheren Storchendichte.

Beschreibung

Grundsätzlich beschreibt eine Korrelation immer einen statistischen Zusammenhang; Kausalität hingegen beschreibt – wie der Name schon sagt: einen Kausalzusammenhang.

Auch wenn eine (möglichst hohe) Korrelation ein Hinweis auf eine wie auch immer geartete Kausalbeziehung sein kann, reicht diese keinesfalls aus, um auf eine Kausalität zu schließen.

Korrelation und Kausalität

Während „Korrelation“ ein gemeinsames Auftreten von Ereignissen bezeichnet, beschreibt „Kausalität“ eine Ursache-Wirkung-Beziehung zwischen den Ereignissen.

Die Frage, was eigentlich Kausalität ausmacht ist dabei erstaunlich komplex, weswegen selbst eine kurze Einführung in das Thema in einen eigenen Artikel ausgelagert wurde: Kausalität.

Kurz gesagt handelt es sich um einen Begriff, der nur schwer klar zu definieren ist – was dazu führt, dass auch die verschiedenen wissenschaftlichen Disziplinen ihn zum Teil sehr unterschiedlich behandeln. Wenn es überhaupt einen kleinsten gemeinsammen Nenner zwischen all den verschiedenen Ansätzen gibt, dann die folgende Erkenntnis:

Korrelation impliziert keine Kausalität!

D.h. dass sich alleine aus einer Korrelation keine Kausalität ableiten lässt. Ebenso unstrittig ist aber auch, dass eine hohe Korrelation notwendige Voraussetzung für Kausalität ist.

Correlation-Hacking

Stehen genügend unter­schied­liche Daten­sätze bereit, ist es ge­wöhn­lich nicht schwer, eine Kom­bi­na­tion aus zweien zu finden, die „zu­fällig“ eine hohe Kor­rela­tion zu­ein­ander haben.

Im besten Fall sind solche Schein­kor­rela­tionen dann leicht zu durch­schauen und durch­aus unterh­altsam, wenn etwa die „Zahl der Museen in Bayern“ mit der „Zahl der Be­schäft­igten im deut­schen Bäcker­hand­werk“ kor­rel­iert wird (Korrelations­koeffizient: 0,9883 für die Jahre 2007 bis 2012), im schlimmsten Fall ist das weniger offensichtlich und führt womöglich sogar in die Irre.

Eine solche Suche nach Kor­rela­tionen in Daten­sätzen ist ver­gleich­bar mit der als „𝑝-Hack­ing“ be­kan­nten Fehl­ana­lyse von Daten. In beiden Fäl­len werden mehrere Ana­lysen so be­hand­elt, als handle es sich um eine einzige – mit entsprechend falschen Ergebnissen.

Abgrenzung

Von der hier erklärten Scheinkorrelation ist zu unterscheiden:

Der Korrelationsirrtum ist ein Denkfehler, der darin besteht, dass korrelierte, also gemeinsam bzw. aufeinander folgend auftretende, Ereignisse bzw. Phänomene als kausal verbunden angenommen werden, sowie

Die Kausalillusion, ein unbewusster psychologischer Effekt (kognitive Verzerrung), welche gemeinsam oder in zeitlicher Abfolge vorkommende Phänomene als kausal verbunden erscheinen lässt.

Beide sind eng miteinander verbunden und möglicherweise sogar dasselbe Phänomen, das nur von verschiedenen Gesichtspunkten betrachtet wird.

Beispiele

Sammlung von Scheinkorrelationen

Es gibt verschiedene Sammlungen von offensichtlichen Scheinkorrelationen, die sehr kurzweilig durchzulesen sind. Dabei hat sich die folgende als besonders langlebig erwiesen:

Badeunfälle und Eisverkäufer

Als ein klassisches Textbuchbeispiel sei hier noch die (notorisch hohe!) Korrelation zwischen Eisverkäufern und Badeunfällen am Strand erwähnt.

Aus nahe liegenden Gründen tauchen sowohl Eisverkäufer als auch Badeurlauber häufig zur gleichen Zeit am Strand auf, nämlich vor allem an heißen Sommertagen. Letztere suchen auch gerne Erfrischung im Wasser, was dann leicht zu Badeunfällen führen kann. Je mehr Badegäste, desto mehr Badeunfälle – aber auch umso mehr Eisverkäufer, die sich ein gutes Geschäft erhoffen.

Es ist offensichtlich unsinnig, den Eisverkäufern die „Schuld“ für die Badeunfälle zu geben. Zwischen diesen und den Unfällen besteht kein direkter Kausalzusammenhang.

In solchen Fällen sind die Scheinkorrelationen recht leicht zu durchschauen, da die meisten von uns schon Erfahrungen mit Eisverkäufern und mit Badestränden haben und der tatsächliche zugrunde liegende Mechanismus (heißes Wetter → mehr Badegäste → mehr Badeunfälle) leicht zu verstehen ist.

Das wird schwieriger, wenn man sich Korrelationen anschaut, die abstraktere und womöglich sogar emotional aufgeladene Themen betreffen:

Gewalttätige Videospiele und Amokläufe

Vor allem nach spektakulären Gewalttaten wird immer wieder die Behauptung aufgestellt, es gäbe einen Zusammenhang zwischen der Beliebtheit gewalttätiger Videospiele und Amokläufen. Untersuchungen zeigen jedoch, dass andere Faktoren, wie etwa die Verfügbarkeit professioneller Hilfe in psychischen Ausnahmesituationen oder die Verfügbarkeit von Waffen, sehr viel bessere Indikatoren für die Wahrscheinlichkeit von Amokläufen sind.

Immigration und Kriminalität

Aus den zahlreichen Daten, die zu Immigration, Ausländeranteilen in der Bevölkerung und Kriminalitätsraten gesammelt werden, lassen sich auch immer wieder Datensätze korrellieren. Ob diese aber tatsächlich eine Kausalbeziehung anzeigen, ist zumindest fraglich – andere Faktoren, wie sozio-ökonomischer Status oder Bildungsstand sind deutlich stärḱere Kandidaten um Kriminalitätsraten zu erklären.

Impfungen und Autismus

Die Diagnose von Autismus findet meist im Kindesalter statt, ziemlich genau in der Zeit, in der auch die wichtigsten Impfungen an Kinder verabreicht werden. Eine solche zeitliche Korrelation kann dazu führen, dass der Autismus als kausale Folge der Impfung wahrgenommen wird. Im Kombination mit dem natürlichen Beschützerinstinkt der Eltern, sowie viel Desinformation auf sozialen Medien rund um dieses Thema, hat das dazu geführt, dass seit Jahren die Impfquoten bei Kindern zurück gehen, und in der Folge, dass längst „besiegt“ geglaubte Krankheiten, vor denen diese Impfungen eigentlich schützen würden, wieder auf dem Vormarsch sind.

Fazit

Alles, was man aus diesem Artikel lernen sollte, lässt sich eigentlich recht gut in einer einzigen prägnaten Aussage zusammenfassen:

Korrelation impliziert keine Kausalität!

Leider ist es nicht immer einfach, diese Erkenntnis auch in die Tat umzusetzen. Vor allem solche Scheinkorrelationen, die allzu gut in das eigene Weltbild zu passen scheinen, oder die bestehende Meinungen und Haltungen zu unterstützen scheinen, werden allzu leicht unkritisch akzeptiert (Bestätigungsneigung). Umso mehr sollte man gerade bei solchen Themen lieber etwas kritischer hinschauen.

Siehe auch

Weitere Informationen

Über diese Site

QR Code Denkfehler Online ist ein Projekt, die häufigsten Irrtümer und Trugschlüsse zu erklären und zu kategorisieren. Dieser Artikel ist aus dem Bereich „Statistik“, welcher zu diesem Zeitpunkt noch im Aufbau ist. Der Artikel, oder der Aufbau dieses Seitenbereiches kann sich daher noch ändern und die Artikel können noch Fehler enthalten.
Für mehr Informationen, siehe die Hauptkategorie Statistik.