Benutzer-Werkzeuge

Früher bekannt als Ad Hominem Info. Willkommen auf der neuen Site …

Ökologischer Fehlschluss

Beschreibt einen Fehlschluss, bei dem ein statistisches Merkmal einer Population unzu­lässig auf ein anderes Aggre­gations­niveau (z.B. auf die jeweiligen Individuen) übertragen wird.

Die Kriminalitätsrate in der Stadt X ist extrem hoch.
Person A kommt aus der Stadt X.
Daher ist A kriminell.

Ein solcher Schluss ist natürlich unsinnig, da selbst in einer Stadt mit extrem hoher Kriminalitätsrate immer noch nur ein kleiner Teil der Bevölkerung tatsächlich kriminell ist – die Wahrscheinlichkeit, dass eine beliebige Person tatsächlich in der Gruppe der Kriminellen ist, ist daher sehr gering.

Während den meisten wohl die Absurdität eines solchen Schlusses sofort ein­leuchtet, wenn er sich wie hier auf eine Stadt bezieht, sind vergleichbare Schlüsse, die sich auf Ethni­zität, Reli­gion oder Ab­stamm­ung beziehen, jedoch recht verbreitet. Man denke nur an verbreitete Vorurteile über z.B. Roma, Muslime, Albaner oder auch Sizilianer.

Andere Namen

  • Gruppen­fehlschluss
  • Ecological (infer­ence) fallacy
  • Popu­lation fallacy

Hinweis: Der Begriff „öko­log­isch“ hat in diesem Zu­sammen­hang nur in­direkt mit Umwelt­schutz zu tun, sondern ist vom alt­griech­ischen „oí­kos“ [οἶ­κος] ab­ge­leitet, was mit „Haus­halt“ oder hier spe­zi­fischer mit „zu­sammen­leb­ender Ge­mein­schaft“ über­setzt werden kann. Hier­von leiten sich auch andere Wörter mit „öko-“ ab, ein­schließ­lich „Öko­nomie“ oder eben auch unsere moderne Be­deut­ung von „Öko­logie“.

Beschreibung

Aussagen, die über eine Gruppe gemacht werden, können sich auf jedes ein­zelne Gruppen­mit­glied be­ziehen oder nur auf die Gruppe als ganzes.

Beispiele für Ersteres sind All­aus­sagen in der klas­sischen Logik wie zum Bei­spiel:

„Alle Kühe sind Paar­hufer“.

Für solche Aus­sagen gilt, dass ihr Subjekt (hier: „Kühe“) ver­teilt ist, also dass sie sich auf eben­so auf jede Unter­gruppe der damit be­schrieb­enen Menge be­ziehen (z.B.: „Alle Hol­stein-Rinder sind Paar­hufer“, aber auch: „Nachbars Kuh Elsa ist ein Paarhufer“).

Dies gilt nicht für Ex­is­tenz­sätze (z.B.: „Einige Kühe sind schwarz-weiß gefleckt“). Hier ist das Sub­jekt nicht ver­teilt, d.h. wir können keine Aus­sagen ab­leiten, die sich auf alle Kühe be­ziehen und können daher auch nicht von solchen Aus­sagen auf Indi­vi­duen der Sub­jekt­menge schließen.

Dies betrifft auch praktisch alle Aus­sagen der Stat­istik. Wenn man nicht ge­rade eine Prä­valenz von 100 % vor­findet, sind auch diese Aus­sagen nicht ver­teilt und es kann daher nicht ohne weiteres von der Gruppen­aus­sage auf die Indi­viduen der Gruppe ge­schlos­sen werden kann.

Man nehme etwa die folgende Aussage:

Bei der Land­tags­wahl im Saar­land 2022 haben 43,5 % der Wähler für die SPD gestimmt.

Zwar erlaubt es die Statistik, hier­aus andere Infor­ma­tionen ab­zu­leiten, als es eine ent­sprech­ende kate­gor­ische Aus­sage der klas­sischen Logik er­lauben würde (in diesem Fall: „es exis­tieren Wähler, welche für die SPD gestimmt haben“), aber es ist immer noch keine Aus­sage über Indi­vi­duen mög­lich, außer mit welcher Wahr­schein­lich­keit ein zu­fällig aus­ge­wähltes Indi­vi­duum aus der Menge der Wähler für diese Partei ge­stimmt hat.

Mit anderen Worten: die sta­tis­tische Aus­sage be­zieht sich auf das „Öko­system“ der Wähler. Eine solche Aus­sage auf den ein­zelnen Wähler zu über­tragen, ist nicht zu­lässig. Da­her wäre ein Schluss wie der fol­gende auch ziem­lich offen­sicht­lich un­sinnig:

A kommt aus dem Saarland.
A hat folglich SPD gewählt.

Einordnung

Dieser Fehlschluss steht hier unter „Interpretationsfehler“ im Bereich Statistik, da dessen wesent­­liches Merk­­mal darin besteht, eine (korrekte) sta­tis­tische Aus­sage falsch zu inter­pret­ieren und daraus un­gült­ige Schlüsse zu ziehen.

Man kann dies auch als eine Form von unzulässiger Ver­all­gemein­er­ung ver­stehen, da hier aufgrund von un­zu­reich­en­den Infor­ma­tionen auf eine ver­all­ge­mein­ernde Aus­sage ge­schlossen wird.

In der Logik beschreibt der Trugschluss der Division einen sehr ähnlichen Sachverhalt, jedoch spe­zi­fisch auf eine Nichtbeachtung des Phänomens der Emergenz bezogen. Allerdings könnte man ar­gu­men­tieren, dass die Maße der deskriptiven Statistik grundsätzlich als emergente Eigenschaften von Gruppen verstanden werden können

Beispiele

Gruppenzugehörigkeit und Wahlverhalten

Eine naive Form der Übertragung von statistischen Daten, die man erstaunlich häufig in den Medien oder auf Diskussionsforen findet, könnte wie folgt aussehen:

In einem Wahlkreis sind 40 % der Wahlberechtigten Kirchenmitglieder.
(und wer in der Kirche aktiv ist, wählt höchstwahrscheinlich eine konservative Partei)
In diesem Wahlkreis haben rund 40 % der Wähler konservativ gewählt.
Also haben alle Kirchenmitglieder konservativ gewählt.

Auch wenn die Prämissen wahrscheinlich korrekt sind, ist ein solcher Schluss unzulässig: Es gibt keinen Hinweis darauf, dass die 40 % Kirchenmitglieder und die 40 % konservativen Wähler identische Personengruppen bezeichnen.

Ähnliches gilt für andere gesellschaftliche Gruppen: nicht jedes Gewerkschaftsmitglied wählt SPD und nicht jeder, der sich für Umwelt- und Naturschutz einsetzt, die Grünen.

Gewichtung von Daten aufgrund von Merkmalsverteilungen

Aus dem vorherigen Beispiel ergibt sich auch ein Problem bei der Gewichtung von er­hob­enen Daten, wie es z.B. bei Wahlumfragen üblich ist.

Das Problem: Werden Umfragewerte anhand einer nicht- oder nur gering re­prä­sen­ta­tiven Aus­wahl er­hoben (ins­be­son­dere bei willkürlichen Stichproben), lassen sich diese kaum noch sinnvoll auf die Ge­samt­be­völk­er­ung um­rechnen. Aber selbst bei sorgfältig durchgeführten Umfragen – wie z.B. von renommierten Wahlforschungsinstituten – kommt es zu Verzerrungen ( Auswahleffekte), die kompensiert werden müssen, um ein sinnvolles Ergebnis zu erhalten.

Ein häufig zu sehender Ansatz, mit diesem Problem umzugehen, besteht darin, solche Daten dann aufgrund eines anderen Merkmals (z.B. der Altersgruppe) zu gewichten, um so Prob­leme bei der repräsentativen Auswahl der Um­frage­teil­nehmer aus­zu­gleichen. Sind also z.B. ältere Wähler in der Umfrage unterrepräsentiert, werden die Ergebnisse von älteren Umfrageteilnehmern höher gewichtet, um dies auszugleichen.

Dahinter steht eine implizierte Vermutung, dass die Ergebnisverteilung in der Gruppe der älteren Umfrageteilnehmer der in der gleich alten Gesamtbevölkerung entspricht. Dies ist aber eine Form von ökologischem Fehlschluss, denn gibt keinen Grund, zu vermuten, dass bei der Umfrage nicht auch die Ergebnisse innerhalb der Merk­mals­gruppe ebenso verzerrt wurden.

Dagegen steht die Erfahrung, insbesondere aus der Wahlforschung, dass man auf solche Weise zumindest die Abweichung von den tatsächlich gemessenen Werten (d.h. bei der Wahl erzielten Ergebnissen) verringern kann. Diese Verringerung fällt dann umso deutlicher aus, je kleinteiliger diese Untergruppen angelegt werden. Aus diesem Grund werden meist dutzende von sekundären Maßzahlen erhoben, etwa Alter, Wohn­ort, Bildung, Einkommen, Religion, u.s.w., aus denen dann hunderte von Untergruppen gebildet werden, die einzeln nach ihrer Prävalenz in der Bevölkerung gewichtet werden.

Hinweis: Ernsthafte Wahl­forsch­ungs­insti­tute haben über Jahr­zehnte detaillierte Infor­ma­tionen über das Wahl­ver­halten verschiedener Bevölkerungsgruppen gesammelt. Auf deren Basis – und in Verbindung mit sehr viel besseren Erhebungsmethodiken – lassen sich in der Tat relativ genaue Projektionen von den erhobenen Daten auf das zu erwartende Wahlverhalten schließen.

Hinweis 2: Insbesondere im Kontext von (stark für Stich­proben­ver­zerr­ungen an­fäll­igen) Online-Umfragen werden gelegentlich nicht sonderlich hilfreiche Tipps gegeben, wie dieses Problem umgangen werden kann. Diese reichen vom „iterativen“ herum­probieren mit ver­schied­enen Ge­wicht­ungen ( 𝑝-Hacking), bis zur Einführung von Konstanten, um die Verzerrungen bei der Umfrage zu kompensieren. Emp­feh­lens­wert ist keines davon.

IQ-Unterschiede von Bevölkerungsgruppen

Eine ganze Reihe von Miss­ver­ständ­nissen be­trifft die Unter­schiede zwischen normal­ver­teilten Merk­malen. Als Bei­spiel soll dies hier anhand des so­ge­nannten „In­telli­genz­quo­tienten“ (IQ) auf­ge­führt werden:

Es werden immer wieder Ver­gleiche von IQs zwischen ver­schied­enen Be­völk­er­ungs­grup­pen (z.B. auf­ge­schlüs­selt nach Be­rufs­grup­pen, Her­kunfts­länd­ern, Par­tei­prä­fer­enzen, Me­di­en­kon­sum, u.s.w) ver­öf­fent­licht. Solche Ver­gleiche haben oft zu­mind­est ge­wisse As­pekte von Emo­tions­apel­len oder von Selbst­über­heb­ungen, wes­wegen sie auch gerne auf sozi­alen Medien weiter ver­breitet werden. Wer möchte schon nicht gerne glauben, dass eine Gruppe, der man sich selbst zu­ge­hörig fühlt, in­tel­li­genter sei als andere …

Dabei sind solche Ver­gleiche bei weitem nicht immer so harm­los wie etwa bei Berufs- oder Studien­fach­ver­gleichen. So werden Unter­such­ungen, nach denen die durch­schnitt­lich er­mit­telten IQs von afro-ameri­kan­ischen Be­völk­er­ungs­grup­pen in den USA nied­riger sind, als die der euro­päisch- oder asia­tisch-stämm­igen Be­völk­er­ung immer wieder als ver­meint­lich „wissen­schaft­liche“ Be­gründ­ung für rass­ist­ische Dis­kri­mi­nier­ung her­an­ge­zogen. Spätere Studien, welche diese Er­geb­nisse wider­legen, werden dabei gerne ignoriert.

Es würde zu weit führen, alle Probleme solcher Ver­gleiche hier auf­zu­zählen. Spezi­fisch für das Thema dieses Artik­els wäre ein Schluss von unter­schied­lichen Durch­schnitts­werten auf unter­schied­liche In­telli­genzen der Gruppen­mit­glieder je­doch ein sehr gutes Beispiel für einen öko­log­ischen Fehl­schluss. Kurz gesagt: auch in der „in­telli­gen­tes­ten“ Gruppe gibt es immer mehr oder weniger in­telli­gente Indi­viduen.

Da wir wissen, dass der IQ normal­ver­teilt ist, könnte man die Über­schneid­ung der Merk­mals­ver­teil­ungen in den beiden Gruppen im Prinzip sogar ge­nau be­rechnen. Der Auf­wand dafür lohnt sich aller­dings eher nicht, da die Werte auch noch ziem­lich un­ge­nau sind und eine Unter­scheid­ung meist ohne­hin nur mög­lich ist, wenn man diese mit einer irre­führ­enden Ge­nau­ig­keit nennt. In den meisten Fäl­len ist der Über­lapp­ungs­be­reich zwi­schen den beiden Popu­la­tionen jedoch sehr groß (siehe Abbildung oben), so­dass man mit den Werten kaum sinn­volle Be­rech­nungen an­stel­len kann.

Unter keinen Umständen kann man aus dem Durch­schnitts­wert aber Schlüsse auf den IQ von Indi­vi­duen ziehen. Noch weniger üb­rigens auf deren In­telli­genz, was nicht un­be­dingt das­selbe ist.

Siehe auch

Lernmaterialien

Weitere Informationen

Über diese Site

Denkfehler Online ist ein Projekt, die häufigsten Irr­tümer und Trug­schlüsse zu erklären und zu kate­gori­sieren. Dieser Artikel ist aus dem Bereich „Statistik“, welcher zu diesem Zeitpunkt noch im Aufbau ist. Der Artikel, oder der Aufbau dieses Seitenbereiches kann sich daher noch ändern und die Artikel können noch Fehler enthalten.
Für mehr In­for­ma­tionen, siehe die Haupt­kategorie  Statistik.

Diese Web­site be­nutzt Cookies. Durch die Nutz­ung der Web­site er­klären Sie sich mit der Speich­er­ung von Cookies auf Ihrem Com­puter ein­ver­standen. Außer­dem be­stät­igen Sie, dass Sie unsere Daten­schutz­richt­linie ge­lesen und ver­standen haben. Wenn Sie damit nicht ein­ver­standen sind, ver­lassen Sie bitte die Web­site.

Weitere Information