Zufälligkeit
beschreibt ein mathematisches Konzept, nach dem Zahlen nicht-deterministisch erzeugt werden und damit noch vorhersehbar und nicht wiederholbar erscheinen.
Echte Zufallsdaten zu erzeugen ist erstaunlich komplex, da viele der allgemein gebrauchten Methoden zur Erzeugung solcher Zahlen entweder auf deterministischen Funktionsweisen beruhen, oder sich nicht entsprechend der gewünschten Verteilungsform verteilen (s.u.).
Auf keinen Fall sollte „zufällig“ mit „beliebig“ verwechselt werden. Diese Verwechslung ist u.a. Grundlage des Fehlers der „willkürlichen Stichprobe“.
Dieser Artikel ist noch in Bearbeitung und daher unvollständig.
Zufallsverteilungen
Je nachdem, wie die Zahlen erzeugt wurden können Zufallszahlen in verschiedenen Verteilungsformen vorkommen. Diese Verteilungsformen werden typischerweise erst mit sehr großen Mengen an Daten sich annähern (siehe: Gesetz der großen Zahlen).
In der einfachsten Form verteilen sich zufällige Daten linear über den zugänglichen Datenraum. Dies ist zum Beispiel bei Würfeln (1-6) oder beim Roulette (0-36) der Fall.
Bei vielen statistischen Daten findet man eine zufällige Abweichung um einen zentralen Mittelwert, welche typischerweise als Normalverteilung mit der hierfür typischen Glockenkurvenform annimmt. Beispiele hierfür sind die Verteilung von IQ-Werten in der Bevölkerung, Geburtsgewichte, die Größe von gefangenen Fischen, u.s.w.
Je nach Daten sind auch zahlreiche andere Verteilungen möglich, die hier nicht alle aufgeführt werden können. Da es gerade für das Verständnis von statistischen Fehlern aber wichtig ist, sei noch spezifisch auf eine negativ logarithmische Verteilung hingewiesen, die u.a. für das Benfordsche Gesetz wichtig ist.
Pseudo-Zufälligkeit
In vielen Fällen wird man eher mit pseudo-zufälligen Daten zu tun haben, was heißt, dass diese zwar aufgrund deterministischer Ereignisse (mit-)bestimmt wurden, diese aber für die spezifische Anwendung keinen Belang haben.
So werden „Zufallszahlen“, die von modernen Computersystemen generiert werden gewöhnlich aufgrund eines Startwertes („seed “) berechnet und sind daher vollständig deterministisch (vom gleichen Ausgangswert lässt sich erneut dieselbe Zahlenfolge generieren). Für die meisten Anwendungszwecke reicht das aber vollkommen aus, während für andere (z.B. Kryptographie) zusätzliche Zufallsquellen eingebunden werden müssen.
Ein weiteres Beispiel sind die am Nachthimmel sichtbaren Sterne, welche aufgrund der physikalischen Gesetze im Weltraum verteilt sind und deren Sichtbarkeit von physikalischen Größen und Gesetzen abhängt. Die Art und Weise, wie diese am Firmament verteilt sind, ist dagegen so weit von diesen Vorgängen entfernt, dass man diese als zufällig ansehen kann.
Ähnliches gilt auch für physikalische Objekte zur Bestimmung von Zufallszahlen (z.B. Würfel, Münzen oder auch eine Roulette): auch diese folgen physikalischen Gesetzen und bei vollständigem Wissen über sämtliche Parameter könnte man auch die Ergebnisse vorhersagen. Da dieses Wissen aber für den Spieler nicht erreichbar ist, sind diese praktisch gleichwertig zu „echten“ Zufallsergebnissen.