Contact
CoCalc Logo Icon
StoreFeaturesDocsShareSupport News AboutSign UpSign In
| Download

All published worksheets from http://sagenb.org

Views: 168703
Image: ubuntu2004

Illustration zur Übung 3 des Moduls 2.03  (Grundlagen Statistik)

Prof. Christian Göbel, Hochschule der Bundesagentur für Arbeit

Illustration: Gesetz der großen Zahlen

Angenommen wir hätten ein diskrete Zufallsvariable X mit der folgenden Wahrscheinlickeitsfunktion:

f(x) = P(x) = 0.3 für x=0

                  = 0.4 für x=1

                  = 0.3 für x=2

Der Erwartungswert von X beträgt 1.

Stellt man diese Wahrscheinlickheitsfunktion graphisch dar, so erhält man:

Nun ziehen wir eine Stichprobe der Größe 30 aus dieser Verteilung und berechnen Mittelwert und Standardfehler für die Stichprobe.
Die Stichprobe lässt sich natürlich auch graphisch Darstellen. Im oberen Bild werden die Ausprägungen dargestellt, da die Stichprobe 30 Ausprägungen enthält gibt es insgesamt 30 Punkte.

Im nächsten Schritte beobachten wir wie sich der Mittelwert mit steigender Stichprobengröße entwickelt. Für jede Stichprobengröße wurde der Mittelwert nur für die bisher gezogenen Ausprägungen berechnet.

Beispiel:
Der Mittelwert für die Stichprobengröße 2 berechnet sich aus den ersten 2 Ausprägungen der Stichprobe.
Der Mittelwert für die Stichprobengröße 3 berechnet sich aus den ersten 3 Ausprägungen der Stichprobe.
....
Der Mittelwert für die Stichprobengröße 30 berechnet sich aus der gesamten Stichprobe (30 Ausprägungen der Stichprobe).

Häufig kann man beobachten, dass sich der Mittelwert bereits bei einer Stichprobengröße von 30 dem Erwartungswert annähert.

Stichprobe: [0, 0, 1, 2, 0, 2, 0, 2, 2, 1, 1, 0, 1, 0, 1, 1, 0, 2, 1, 0, 2, 2, 0, 1, 2, 0, 2, 0, 0, 1]
Mittelwert: 0.900000000000000
Standardfehler: 0.844862771962569
Aktualisierte Mittelwerte: [0.000000000000000, 0.000000000000000, 0.333333333333333, 0.750000000000000, 0.600000000000000, 0.833333333333333, 0.714285714285714, 0.875000000000000, 1.00000000000000, 1.00000000000000, 1.00000000000000, 0.916666666666667, 0.923076923076923, 0.857142857142857, 0.866666666666667, 0.875000000000000, 0.823529411764706, 0.888888888888889, 0.894736842105263, 0.850000000000000, 0.904761904761905, 0.954545454545455, 0.913043478260870, 0.916666666666667, 0.960000000000000, 0.923076923076923, 0.962962962962963, 0.928571428571429, 0.896551724137931, 0.900000000000000]

Was passiert eigentlich für sehr große Stichproben? Das Gesetz der großen Zahlen sagt uns ja, dass für unendlich große Stichproben der Mittelwert dem Erwartungwert enspricht.

Hier eine Illustration:

Das Gesetz der großen Zahlen (im weiteren Sinn) beruht darauf, dass in sehr großen (unendlich) großen Stichproben die Wahrscheinlichkeitsverteilung der Grundgesamtheit repliziert wird.

Intuitiv macht das auch Sinn, den die Wahrscheinlichkeitsverteilung gibt ja gerade an, wie häufig bestimmte Werte vorkommen.

Zur Illustration verwenden wir eine Normalverteilung mit Erwartungwert 0 und einer Standardabweichung von 2. NV(0,2).

Wir Ziehen aus der Verteilung und lasen uns für die Stichprobe das Histogram ausgeben.

Illustration: Mittelwerte sind zufällig

Wenn Wir den Mittelwert eine (Zufalls-)-Stichprobe berechnen, dann hängt der Mittelwert von den zufällig gezogenen Ausprägungen ab.

Der Mittelwert ist deshlab selbst zufällig und bei jeder neuen Ziehung hat der Mittelwert einen anderen Betrag.

Illustration: Wir ziehen eine Stichprobe aus einer Standardnormalverteilung (Erwartungwert 0, Standardabweichung 1)  NV(0,1) und

berechnen den Mittelwert.

Frage: Was können wir beobachten wenn wir die Stichprobengröße erhöhen?

Verteilung von Mittelwerten:

In sehr großen Stichproben sind Mittelwerte annähernd Normalverteilt (Dies folgt aus dem zentraler Grenzwertsatz).

Wir können das Gesetz der Großen Zahlen nutzen um die Form der Verteilung der Mittelwerte "sichtbar" zu machen.

Vorgehensweise (beispielhaft):
Schritt 1: Wir ziehen eine Zufallsstichprobe z.B. der Größe 30 und berechnen deren Mittelwert.
Schritt 2: Wir wiederholen Schritt 1 sehr häufig und generieren so sehr viele Mittelwerte (alle Mittelwert für die gleiche Stichprobengröße und aus der gleichen Grundgesamtheit).
Schritt 3: Ein Histogramm kann für die Veranschaulichung der Verteilung der Mittelwerte genutzt werden.

Dieses "Experiment" können wir für unterschiedliche Stichprobengrößen und Verteilungen der Grundgesamtheit durchführen.

Folgende Beobachtungen lassen sich dabei machen:

1. Wenn die Stichprobe groß genug ist, dann ist der Mittelwert immer annähernd normalverteilt; dies gilt unabhängig von der Verteilung der Grundgesamtheit (aus der wir die Stichproben ziehen).

2. Die Varianz der Verteilung der Mittelwerte nimmt mit der Stichprobengröße ab.

3. Ist die Grundgesamtheit bereits selbst (zumindest annähernd) normalverteilt, dann benötigen wir nur relativ kleine Stichproben, damit der Mittelwert normalverteilt ist.

4. Ist die Verteilung der Grundgesamtheit selbst "sehr weit" von einer normalverteilung entfernt, dann benötigt man tatsächlich sehr große Stichproben, damit der Mittelwert der Stichproben sich einer Normalverteilung annähert.