Quantile
Bezeichnet eine Reihe von Maßzahlen, durch welche eine Folge von Daten in einem bestimmten Verhältnis geteilt werden.
Das bekannteste und am häufigsten benutzte Quantil ist der Median, der die Daten in zwei gleich große Gruppen teilt.
Der Begriff „Quantil“ hat hierbei zwei Bedeutungen: zum einen ist es der Sammelbegriff für die hier aufgezählten Maße, zum anderen ist es auch die Bezeichnung für ein – allerdings eher selten benutztes - Maß, das auch auf dieser Seite weiter unten beschrieben wird.
Gebräuchliche Maße
Perzentile
Die Perzentile teilen die Daten in 100 Teile, auf die man sich dann nach ihrer Nummerierung beziehen kann – so entspricht etwa das 42. Perzentil dem Wert, der größer oder gleich 42 % der Daten ist und kleiner oder gleich 58 %.
Perzentile werden gewöhnlich mit einem P gefolgt von der tief gestellten Prozentzahl bezeichnet (allerdings ohne Prozentzeichen), also z.B. P12 oder P34.
Dezile
Die Dezile (von Lat. decem = zehn) teilen die Daten in 10 Teile auf, dabei entspricht das erste Dezil dem 10. Perzentil und das neunte dem 90.
Quartile
Die Quartile teilen die Daten in 4 gleich große Gruppen. Dabei entspricht das erste Quartil dem 25. Perzentil und das dritte Quartil dem 75. Perzentil. Das zweite Quartil wird selten gebraucht, da dies genau dem Median entspricht (s.u.).
Median
Der Median ist der Wert, der die Daten in zwei gleich große Teilmengen teilt. Er entspricht dem 50. Perzentil und dem zweiten Quartil.
Er hat eine besondere Bedeutung als Mittelwert, weswegen ihm dort ein eigener Artikel gewidmet ist (siehe Median).
Quintile
Seltener in Gebrauch sind Quintile, welche die Daten in fünf gleiche Teile untergliedern (je 20 % der Daten)
Terzile
Noch seltener findet man Terzile, welche drei Gruppen mit jeweils einem Drittel der Daten bilden.
Quantile
Gelegentlich benutzt man auch direkt die Bezeichnung Quantil zusammen mit einer Kommazahl, welche den Teiler bezeichnet (z.B. das „0,34-Quantil“). In dieser Schreibweise bezeichnen z.B. das 12. Perzentil (P12) und das 0,12-Quantil (Q0,12) beide die gleiche Unterteilung.
Berechnung
Je kleinteiliger die Quantile sind und je weniger Datenpunkte zur Verfügung stehen, desto schwieriger wird es, einen sinnvollen Wert zu bestimmen. Schon beim Median hat man bei einer geraden Anzahl von Werten das Problem, dass sich der korrekte Median irgendwo zwischen den beiden mittleren befindet (üblicherweise nimmt man das arithmetische Mittel aus den beiden Werten, auch wenn dies streng mathematisch eigentlich nicht möglich wäre).
Bei Perzentilen (mit 100 Unterteilungen) kann es leicht passieren, dass nicht genügend Datenpunkte vorliegen, um zwischen zwei aufeinander folgenden Werten zu unterscheiden (z.B. wenn sowohl das 42. als auch das 43. Perzentil zwischen den selben zwei Datenpunkten zu finden wären).
Aber auch schon bei Terzilen kann dies problematisch sein. Hat man z.B. genau 5 Datenpunkte, ist es praktisch unmöglich, diese gleichmäßig auf die drei Bereiche aufzuteilen. Das gleiche gilt auch für andere Quantile – prinzipiell umso stärker, je kleinteiliger die Aufteilung ist.
Siehe auch
Weitere Informationen
- Empirisches Quantil auf Wikipedia