Zurück...

-Test, Chi2-Test, Chiquadrat-Test

Der -Test ist ein Anpassungstest. Mit ihm lässt sich prüfen, ob die beobachtete Verteilung einer vorgegebenen Verteilung entspricht.
Dieser Test ist anwendbar für kategoriale oder auch für kontinuierliche Merkmale die klassifiziert wurden.

Kategoriale Merkmale

Zur Darlegung des -Tests für kategoriale Merkmale gehen wir von diesem kleinen Würfelexperiment aus (Bild 1):

Bild 1

Erwartet wird die Gleichverteilung der gewürfelten Zahlen für die 290 Würfe und dieser Erwartungswert hE über die 6 Kategorien beträgt für dieses Beispiel

hE = 290 / 6 = 48,33.

Mit dem -Test kann nun geprüft werden, ob die im Bild 1 dargestellte reale Verteilung über die Kategorien hK dem Erwartungswert hE, also der Gleichverteilung, entspricht.
Wir bezeichnen

hK = hE als Nullhypothese H0 und

hK # hE als Alternativhypothese H1.

Wird jedes Auftreten der Ausprägung von X auf Annahme oder Ablehnung (1 oder nicht 1 gewürfelt) hin betrachtet, kann von einer Binomialverteilung ausgegangen werden:

hi ~ B(n, hE)

D. h., dass für jede Kategorie (i = 1...6) so die Nullhypothese H0 geprüft werden kann. Wie oben erwähnt, kann der Anpassungstest mit dem -Test direkt für alle Kategorien Xn durchgeführt werden. Dazu wird die quadrierte Differenz von hi und hE gebildet und normiert:

F 1

Die Summe dieser normierten Abweichung stellt dann die -Prüfgröße dar:

F 2

Für kategoriale Merkmale gilt die Ablehnung der Nullhypothese H0 (keine Gleichverteilung), wenn

F 3

ist.
Die Berechung des -Wertes für obiges Beispiel (Bild 1) zeigt Bild 2 (OpenOffice-Tabelle):

Bild 2, OpenOffice-Tabellenblatt

Das 0,95-Quantil der -Verteilung mit 5 Freiheitsgeraden (k = 6-1) ist

 0,95 (5) = 11,07  (siehe Tabelle).

Da

1,559 < 11,07

trifft die Nullhypothese zu, d. h., die Verteilung der “Augenzahl” des Würfels entspricht der Erwartung. Der Würfel “taugt” zum Spielen!

Kontinuierliche Merkmale

Der -Test kann auch zur Anpassungsprüfung für kontinuierliche (normalverteilte) Merkmale eingesetzt werden (siehe auch Schiefe und Wölbung).
Dazu ist es notwendig, die Merkmalsausprägung in Klassen zu gruppieren. D. h., es werden eine bestimmte Anzahl Intervalle (Klassen) in dem Spannweitenbereich der Merkmalsausprägung gebildet und die einzelnen Ausprägungen dann dem jeweiligen Intervall zugeordnet. Nach der Zuordnung wird dann, wie im Bild 2 und 3 dargestellt, die Häufigkeit der Zuordnung pro Klasse gezählt. (Hinweis: Zum Test einer geringen Anzal Merkmale siehe Kolmogorov-Smirnov-Test.)

Zur Linkseite "Statistiklabor"

Bild 3

In diesem Beispiel soll der Anpassungstest, wie schon erwähnt, bezüglich obiger Daten auf die Standardnormalverteilung geprüft werden.
Dazu werden die jeweiligen Klassenobergrenzen, oder als bessere Näherung die Klassenmitte (Spalte A), um den Flächenanteil der Standardnormalverteilung berechnen zu können, in z-Werte transformiert (Bild 4, Spalte C):

F 4

Als nächster Schritt wird der Flächenanteil der Standardnormalverteilung, entweder aus Tabellen oder - wie in diesem Beispiel - über die dementsprechende (OpenOffice-)Funktion, ermittelt (Bild 4, Spalte D). Über die Flächendifferenz (Bild 4, Spalte E) wird nach hE = Flächendifferenz * Anzahl Beobachtungen die erwartete Häufigkeit hE ermittelt (Bild 4, Spalte F). Die normierte Differenz nach F1 wird in Spalte G, Bild 4, berechnet:

Bild 4, OpenOffice-Tabellenblatt

Die Berechnung des Chiquadratprüfwertes als Summe über die Zellen G2-G6 sehen Sie in der Zelle G8 mit dem Betrag 15.43.
Zur Ermittlung des Vergleichswertes der -Verteilung wird der Freiheitsgrad benötigt. Hier muss nun im Unterschied zu F3 die Anzahl der geschätzten Parameter berücksichtigt werden. Um die z-Transformation (F4) durchführen zu können, musste der Mittelwert und die Standardabweichung geschätzt werden. Das bedeutet nun, dass der Freiheitsgrad durch k-1-2 (2 für Mittelwert und Standardabweichung) bestimmt wird:

          k: 5 Klassen
          Freiheitsgrad = 5 -1 - 2 = 2

Mit

 0,95 (2) = 5,99  (siehe Tabelle).

ist eine Abweichung von der Normalverteilung zu erwarten:

15,43 > 5,99

Zur Abrundung der grafische Vergleich zwischen beobachteter und erwarteter Häufigkeit (Bild 5):

F 5

Seitenanfang

Hat der Inhalt Ihnen weitergeholfen und Sie möchten diese Seiten unterstützen?