Nächste Überarbeitung | Vorhergehende ÜberarbeitungNächste ÜberarbeitungBeide Seiten der Revision |
mathematik:statistik:interpretationsfehler:scheinkorrelation [18.03.22, 22:06:54] – Externe Bearbeitung 127.0.0.1 | mathematik:statistik:interpretationsfehler:scheinkorrelation [18.10.22, 15:55:23] – ↷ Links angepasst, weil Seiten im Wiki verschoben wurden sascha |
---|
====== Scheinkorrelation ====== | ====== Scheinkorrelation ====== |
| |
Eine statistischen Korrelation scheint eine Kausalbeziehung aufzuzeigen, die aber nicht durch weitere Beweise belegt wird. | Eine statistischen Korrelation scheint eine Kausalbeziehung aufzuzeigen, die aber nicht durch weitere Beweise belegt wird. |
| |
<div info-box> | <html><p class="info-box"></html>**Hinweis:** Der Begriff „Scheinkorrelation“ ist etwas irreführend, da nicht die //Korrelation// „scheinbar“ ist, sondern die //Kausalbeziehung//.<html></p></html> |
**Hinweis:** Der Begriff „Scheinkorrelation“ ist etwas irreführend, da es nicht die Korrelation ist, die „scheinbar“ ist, sondern die Kausalbeziehung.</div> | |
| |
Beispiel: | Beispiel: |
| |
> Die Zahl von Störchennestern in einer Region korreliert hoch mit der Geburtenrate [bei Menschen] in dieser Region. | > Die Zahl von Störchennestern in einer Region korreliert hoch mit der Geburtenrate [bei Menschen] in dieser Region. |
> <html><span class="invalid">Folglich gibt es einen Kausalzusammenhang zwischen Störchen und Geburten.</span></html> | > <html><s class="invalid">Folglich gibt es einen Kausalzusammenhang zwischen Störchen und Geburten.</s></html> |
| |
Störche fühlen sich naheliegenderweise dort am wohlsten, wo sie genügend Nahrung finden und das ist eher auf dem Land der Fall als in der Stadt. Ebenso ist die Geburtenrate bei Menschen auf dem Land höher als in der Stadt, was wiederum an Faktoren wie (vermutete) Lebensqualität, günstigerer Wohnraum und anderen liegen könnte – sicher aber nicht an der höheren Storchendichte. | Störche fühlen sich naheliegenderweise dort am wohlsten, wo sie genügend Nahrung finden und das ist eher auf dem Land der Fall als in der Stadt. Ebenso ist die Geburtenrate bei Menschen auf dem Land höher als in der Stadt, was wiederum an Faktoren wie (vermutete) Lebensqualität, günstigerem Wohnraum und anderen liegen könnte – sicher aber nicht an der höheren Storchendichte. |
| |
Aus der Korrelation zwischen Störchen und Geburten eine Kausalbeziehung herzuleiten ist daher unsinnig. | |
===== Beschreibung ===== | ===== Beschreibung ===== |
| |
==== Hinweis zur Kausalität ==== | ==== Hinweis zur Kausalität ==== |
| |
//Kausalität// ist ein komplexes metaphysisches und epistemologisches Problem, das seit der Antike kontrovers diskutiert wird. Die Frage, wann und wie Kausalität belegbar ist, steht weit außerhalb dessen, was der Autor in diesem Rahmen leisten kann und will. Für Interessierte sei hier nur auf den [[wpde>Kausalität|gleichnamigen Wikipedia-Artikel]] verwiesen, der viele Hinweise für das weitere Studium bietet. | //Kausalität// ist ein komplexes metaphysisches und epistemologisches Problem, welches schon seit der Antike kontrovers diskutiert wird. Die Frage, wann und wie Kausalität belegbar ist, steht weit außerhalb dessen, was der Autor in diesem Rahmen leisten kann und will. Für Interessierte sei hier nur auf den [[wpde>Kausalität|gleichnamigen Wikipedia-Artikel]] verwiesen, der viele Hinweise für das weitere Studium bietet. |
| |
Wenn es überhaupt eine Aussage gibt, die weitest gehend unstrittig ist, dann die folgende: | Wenn es überhaupt eine Aussage gibt, die weitest gehend unstrittig ist, dann die folgende: |
| |
<WRAP center round important auto> | <html><p class="info-box important-small center" style="text-align:center"></html>**Korrelation impliziert //keine// Kausalität!**<html></p></html> |
**Korrelation impliziert //keine// Kausalität!** | |
</WRAP> | |
| |
D.h. dass sich aus Korrelation //alleine// keine Kausalität ableiten lässt. Ebenso unstrittig ist aber auch, dass eine hohe Korrelation //notwendige Voraussetzung// für Kausalität ist. | D.h. dass sich //alleine// aus einer Korrelation keine Kausalität ableiten lässt. Ebenso unstrittig ist aber auch, dass eine hohe Korrelation //notwendige Voraussetzung// für Kausalität ist. |
| |
| ==== Correlation-Hacking ==== |
| |
| Stehen genügend unterschiedliche Datensätze bereit, ist es gewöhnlich nicht schwer, eine Kombination aus zweien zu finden, die „zufällig“ eine hohe Korrelation zueinander haben. |
| |
| Im besten Fall sind solche Scheinkorrelationen dann leicht zu durchschauen und durchaus unterhaltsam, wenn etwa die „Zahl der Museen in Bayern“ mit der „Zahl der Beschäftigten im deutschen Bäckerhandwerk“ korreliert wird ([[begriffe:korrelationskoeffizient|Korrelationskoeffizient]]: 0,9883 für die Jahre 2007 bis 2012), im schlimmsten Fall ist das weniger offensichtlich und führt womöglich sogar in die Irre. |
| |
| Eine solche Suche nach Korrelationen in Datensätzen ist vergleichbar mit der als „[[mathematik:statistik:analysefehler:p-hacking|𝑝-Hacking]]“ bekannten Fehlanalyse von Daten. In beiden Fällen werden mehrere Analysen so behandelt, als handle es sich um eine einzige – mit entsprechend falschen Ergebnissen. |
| |
| Es gibt mehrere Sammlungen von solchen Korrelationen der eher unterhaltsameren Art. Als Auswahl seien die folgenden beiden empfohlen: |
| |
| * [[https://scheinkorrelation.jimdo.com|Scheinkorrelationen]] |
| * [[http://www.tylervigen.com/spurious-correlations|Spurious Correlations]] (Englisch) |
| |
===== Abgrenzung ===== | ===== Abgrenzung ===== |
Von der hier erklärten //Scheinkorrelation// ist zu unterscheiden: | Von der hier erklärten //Scheinkorrelation// ist zu unterscheiden: |
| |
Der **[[denkfehler:kausalitaetsirrtuemer:korrelationsirrtum|Korrelationsirrtum]]** ist ein [[denkfehler:hauptseite|Denkfehler]], der darin besteht, dass //korrelierte//, also gemeinsam bzw. aufeinander folgend auftretende, Ereignisse bzw. Phänomene als //kausal// verbunden angenommen werden, sowie | Der **[[kausalitaet:korrelationsirrtum|Korrelationsirrtum]]** ist ein [[denkfehler:hauptseite|Denkfehler]], der darin besteht, dass //korrelierte//, also gemeinsam bzw. aufeinander folgend auftretende, Ereignisse bzw. Phänomene als //kausal// verbunden angenommen werden, sowie |
| |
Die **[[psychologie:kognitive_verzerrungen:kausalillusion|Kausalillusion]],** ein unbewusster psychologischer Effekt ([[psychologie:kognitive_verzerrungen:kausalillusion|kognitive Verzerrung]]), welche gemeinsam oder in zeitlicher Abfolge vorkommende Phänomene als kausal verbunden erscheinen lässt. | Die **[[psychologie:kognitive_verzerrungen:kausalillusion|Kausalillusion]],** ein unbewusster psychologischer Effekt ([[psychologie:kognitive_verzerrungen:kausalillusion|kognitive Verzerrung]]), welche gemeinsam oder in zeitlicher Abfolge vorkommende Phänomene als kausal verbunden erscheinen lässt. |
===== Siehe auch ===== | ===== Siehe auch ===== |
| |
* [[denkfehler:kausalitaetsirrtuemer:korrelationsirrtum|Korrelationsirrtum]] | * [[kausalitaet:korrelationsirrtum|Korrelationsirrtum]] |
* [[psychologie:kognitive_verzerrungen:kausalillusion|Kausalillusion]] | * [[psychologie:kognitive_verzerrungen:kausalillusion|Kausalillusion]] |
===== Weitere Informationen ===== | ===== Weitere Informationen ===== |