Beide Seiten der vorigen RevisionVorhergehende ÜberarbeitungNächste Überarbeitung | Vorhergehende ÜberarbeitungNächste ÜberarbeitungBeide Seiten der Revision |
mathematik:statistik:interpretationsfehler:scheinkorrelation [27.07.22, 15:56:25] – [Hinweis zur Kausalität] sascha | mathematik:statistik:interpretationsfehler:scheinkorrelation [18.10.22, 15:55:23] – ↷ Links angepasst, weil Seiten im Wiki verschoben wurden sascha |
---|
====== Scheinkorrelation ====== | ====== Scheinkorrelation ====== |
| |
Eine statistischen Korrelation scheint eine Kausalbeziehung aufzuzeigen, die aber nicht durch weitere Beweise belegt wird. | Eine statistischen Korrelation scheint eine Kausalbeziehung aufzuzeigen, die aber nicht durch weitere Beweise belegt wird. |
| |
<div info-box> | <html><p class="info-box"></html>**Hinweis:** Der Begriff „Scheinkorrelation“ ist etwas irreführend, da nicht die //Korrelation// „scheinbar“ ist, sondern die //Kausalbeziehung//.<html></p></html> |
**Hinweis:** Der Begriff „Scheinkorrelation“ ist etwas irreführend, da es nicht die Korrelation ist, die „scheinbar“ ist, sondern die Kausalbeziehung.</div> | |
| |
Beispiel: | Beispiel: |
| |
> Die Zahl von Störchennestern in einer Region korreliert hoch mit der Geburtenrate [bei Menschen] in dieser Region. | > Die Zahl von Störchennestern in einer Region korreliert hoch mit der Geburtenrate [bei Menschen] in dieser Region. |
> <html><span class="invalid">Folglich gibt es einen Kausalzusammenhang zwischen Störchen und Geburten.</span></html> | > <html><s class="invalid">Folglich gibt es einen Kausalzusammenhang zwischen Störchen und Geburten.</s></html> |
| |
Störche fühlen sich naheliegenderweise dort am wohlsten, wo sie genügend Nahrung finden und das ist eher auf dem Land der Fall als in der Stadt. Ebenso ist die Geburtenrate bei Menschen auf dem Land höher als in der Stadt, was wiederum an Faktoren wie (vermutete) Lebensqualität, günstigerer Wohnraum und anderen liegen könnte – sicher aber nicht an der höheren Storchendichte. | Störche fühlen sich naheliegenderweise dort am wohlsten, wo sie genügend Nahrung finden und das ist eher auf dem Land der Fall als in der Stadt. Ebenso ist die Geburtenrate bei Menschen auf dem Land höher als in der Stadt, was wiederum an Faktoren wie (vermutete) Lebensqualität, günstigerem Wohnraum und anderen liegen könnte – sicher aber nicht an der höheren Storchendichte. |
| |
Aus der Korrelation zwischen Störchen und Geburten eine Kausalbeziehung herzuleiten ist daher unsinnig. | |
===== Beschreibung ===== | ===== Beschreibung ===== |
| |
| |
D.h. dass sich //alleine// aus einer Korrelation keine Kausalität ableiten lässt. Ebenso unstrittig ist aber auch, dass eine hohe Korrelation //notwendige Voraussetzung// für Kausalität ist. | D.h. dass sich //alleine// aus einer Korrelation keine Kausalität ableiten lässt. Ebenso unstrittig ist aber auch, dass eine hohe Korrelation //notwendige Voraussetzung// für Kausalität ist. |
| |
| ==== Correlation-Hacking ==== |
| |
| Stehen genügend unterschiedliche Datensätze bereit, ist es gewöhnlich nicht schwer, eine Kombination aus zweien zu finden, die „zufällig“ eine hohe Korrelation zueinander haben. |
| |
| Im besten Fall sind solche Scheinkorrelationen dann leicht zu durchschauen und durchaus unterhaltsam, wenn etwa die „Zahl der Museen in Bayern“ mit der „Zahl der Beschäftigten im deutschen Bäckerhandwerk“ korreliert wird ([[begriffe:korrelationskoeffizient|Korrelationskoeffizient]]: 0,9883 für die Jahre 2007 bis 2012), im schlimmsten Fall ist das weniger offensichtlich und führt womöglich sogar in die Irre. |
| |
| Eine solche Suche nach Korrelationen in Datensätzen ist vergleichbar mit der als „[[mathematik:statistik:analysefehler:p-hacking|𝑝-Hacking]]“ bekannten Fehlanalyse von Daten. In beiden Fällen werden mehrere Analysen so behandelt, als handle es sich um eine einzige – mit entsprechend falschen Ergebnissen. |
| |
| Es gibt mehrere Sammlungen von solchen Korrelationen der eher unterhaltsameren Art. Als Auswahl seien die folgenden beiden empfohlen: |
| |
| * [[https://scheinkorrelation.jimdo.com|Scheinkorrelationen]] |
| * [[http://www.tylervigen.com/spurious-correlations|Spurious Correlations]] (Englisch) |
| |
===== Abgrenzung ===== | ===== Abgrenzung ===== |
Von der hier erklärten //Scheinkorrelation// ist zu unterscheiden: | Von der hier erklärten //Scheinkorrelation// ist zu unterscheiden: |
| |
Der **[[denkfehler:kausalitaetsirrtuemer:korrelationsirrtum|Korrelationsirrtum]]** ist ein [[denkfehler:hauptseite|Denkfehler]], der darin besteht, dass //korrelierte//, also gemeinsam bzw. aufeinander folgend auftretende, Ereignisse bzw. Phänomene als //kausal// verbunden angenommen werden, sowie | Der **[[kausalitaet:korrelationsirrtum|Korrelationsirrtum]]** ist ein [[denkfehler:hauptseite|Denkfehler]], der darin besteht, dass //korrelierte//, also gemeinsam bzw. aufeinander folgend auftretende, Ereignisse bzw. Phänomene als //kausal// verbunden angenommen werden, sowie |
| |
Die **[[psychologie:kognitive_verzerrungen:kausalillusion|Kausalillusion]],** ein unbewusster psychologischer Effekt ([[psychologie:kognitive_verzerrungen:kausalillusion|kognitive Verzerrung]]), welche gemeinsam oder in zeitlicher Abfolge vorkommende Phänomene als kausal verbunden erscheinen lässt. | Die **[[psychologie:kognitive_verzerrungen:kausalillusion|Kausalillusion]],** ein unbewusster psychologischer Effekt ([[psychologie:kognitive_verzerrungen:kausalillusion|kognitive Verzerrung]]), welche gemeinsam oder in zeitlicher Abfolge vorkommende Phänomene als kausal verbunden erscheinen lässt. |
===== Siehe auch ===== | ===== Siehe auch ===== |
| |
* [[denkfehler:kausalitaetsirrtuemer:korrelationsirrtum|Korrelationsirrtum]] | * [[kausalitaet:korrelationsirrtum|Korrelationsirrtum]] |
* [[psychologie:kognitive_verzerrungen:kausalillusion|Kausalillusion]] | * [[psychologie:kognitive_verzerrungen:kausalillusion|Kausalillusion]] |
===== Weitere Informationen ===== | ===== Weitere Informationen ===== |