Basis-Statistik-Wilcoxon





		Zurück...

		Wilcoxon-Test, Vorzeichen-Rang-Test

Tests für den Vergleich zweier verbundener Stichproben - dem Vergleich gepaarter Beobachtungen - ist der t-Test bei normalverteilten Differenzen und der Vorzeichen-Rang-Test von Wilcoxon. Der Wilcoxon-Test ist ein nichtparametrischer Test, d. h., es wird keine Annahme über die zugrundeliegende Verteilung als Voraussetzung gemacht. Die Verteilung des zugrundeliegenden Merkmals steht nicht im Vordergrund, sondern die symmetrische Verteilung der Paardifferenzen der Merkmale um den Median.
Es wird für diesen Test dennoch vorausgesetzt, dass die dem Merkmal(en) zugrundeliegende Verteilung symmetrisch ist. Damit lässt sich der Wilcoxon-Test auch auf normalverteilte Beobachtungen anwenden.

Der Wilcoxon-Test prüft, ob die Differenzen paarweise angeordneter Beobachtungen symmetrisch mit dem Median gleich Null verteilt sind. Die Nullhypothese H₀ lautet also

H₀: _Differenz= 0.

Die Alternativhypothese H₁, das der Median der Differenzen ungleich Null ist, ist demnach

H₁: _Differenz # 0.

Trifft die Alternativhypothese H₁ zu, ist die Grundgesamtheit nicht symmetrisch in Bezug auf den Median oder den Stichproben liegen unterschiedliche Verteilungen zugrunde. Darauf basierend, lassen sich die Hypothesen auch wie folgt formulieren:

Die Nullhypothese

H₀: die Verteilungsfunktionen der gepaarten Beobachtungen X und Y sind indentisch

und die Alternativhypothese

H₁: die Verteilungsfunktionen unterscheiden sich in ihrer Lage oder Form.

Testdurchführung

Der Test wird in mehreren Schritten durchgeführt:

Von den gepaarten Beobachtungen X_i und Y_i wird die Differenz D_i ...

... und anschließend der Absolutbetrag gebildet:
Die absoluten Beträge werden aufsteigend geordnet. Der kleinste Betrag erhält die Rangzahl R_i=1 = 1 und der größte Betrag die größte Rangzahl R_i=n = n (n: Stichprobenumfang).
Zu jeder Rangzahl R_i wird festgehalten, ob die zugehörige Differenz ein positives oder negatives Vorzeichen aufweist.
Anschließend wird die Summe der positiven und negativen Rangzahlen R_i gebildet:

An dieser Stelle hilft folgende Überlegung bezüglich der Testkonstruktion (siehe obige Hypothesenbildung) weiter: Trifft die Nullhypothese H₀ zu, sollten die positiven und negativen Rangsummen R_Sum etwa gleich groß sein. Denn dann kann auch von einer Symmetrie der Verteilung um den Median ausgegangen werden.
Als Prüfgröße (Testgröße) wird die kleinere der beiden Rangsummen R_Sum benutzt:

Die Prüfgröße PG kann über

geprüft werden.

Die Nullhypothese H₀ wird dann verworfen, wenn die Prüfgröße PG kleiner oder gleich dem Vergleichswert der R_Tabelle ist:

Bei der Testdurchführung treten gelegentlich sogenannte Bindungen oder auch Ties genannt auf. Eine Art Bindung ist, wenn die Differenz X_i - Y_i = 0 ist. Die andere Art der Bindung liegt vor, wenn gleich große Differenzen vorliegen.
Ist die Differenz D = 0, wird die entsprechend Beobachtung nicht berücksichtigt und der Stichprobenumfang n verringert. Kommt also diese Bindung (Differenz = 0) einmal vor, entspricht der Stichprobenumfang n dann n = n - 1. Bedenkenswert ist hier allerdings, dass dann Beobachtungen, die für die Nullhypothese H₀ sprechen, nicht berücksichtigt werden!

Liegen gleich große Differenzen vor, werden Duchschnittsränge gebildet:

D_i:	1,5	2,5	3,5	3,5	3,5	4,5
R, Bindung ignoriert:	1	2	3	4	5	6
R mit Durchschnittsr.:	1	2	4	4	4	6

Für die gelb markierten Ränge wird der Durchschnittsrang gebildet: (3+4+5)/3=4. Die Rangbildung wird dann ab dem 6. Rang fortgesetzt. Rang 3 und 5 sind in den Durchschnittsrang eingeflossen und können natürlich nicht mehr verwendet werden.

Zur Behandlung von Bindungen werden verschiedene Methoden vorgeschlagen. Möchten Sie sich in das Thema vertiefen, empfehle ich Bortz, Lienert und Boehnke.

Beispiel

Wir gehen von folgendem Beispiel aus:

Im obigen Beispiel sind 3 gleiche absolute Differenzen enthalten. Die gelben Zellen zeigen den Durchschnittsrang . Die Verteilung zwischen den positiven und negativen Rangzahlen ist nicht identisch, aber ob hier ein statistisch signifikanter Unterschied vorliegt, also H₀ abgelehnt werden muss, soll wie folgt geprüft werden:

Die Prüfgröße PG entspricht der kleinsten Rangzahl: PG = 24
Der Stichprobenumfang n für die gepaarten Beobachtungen ist n = 10
Der Vergleichswert aus der Tabelle ist R_{(10; 0,05)} = 8

Nun haben wir alle Daten vorliegen und prüfen die Nullhypothese H₀, also ob die gepaarten Beobachtungen X und Y eine identische Verteilungsfunktion besitzen:

H₀: PG > R_{(10; 0,05)} = 24 > 8

Mit einem Signifikanzniveau von 5% trifft die Nullhypothese H₀ zu!

Dieser Test kann natürlich auch mit dem Statistikprogramm R durchgeführt werden!

Die X- und Y-Variablen wurden in die R-Umgebung als Objekt Daten geladen.

Über die Funktion wilcox.test() mit dem Argument paired = TRUE wird in diesem Beispiel der Wilcoxon-Test durchgeführt:

Die Ausgabe der Funktion ist deutlich: V = 24 ist die Summe der positiven Rangzahlen und die Größe des p-Wertes (p-value = 0.7592) macht deutlich, dass die Nullhypothese H₀ nicht abgelehnt werden kann! Die Warnmeldung ist verständlich, es liegen ja tatsächlich Bindungen vor! Dadurch kann der p-Wert auch nur geschätzt werden!

Standardmäßig wird der Vertrauensbereich P mit P = 0.95 vorgegeben (conf.level = 0.95), was einem Signifikanzniveau von 0,05 entspricht.

Möchten Sie den Wilcoxon-Test mit einer exakten Berechnung des p-Wertes durchführen, können Sie z. B. die Funktion wilcox_test()aus dem Paket coin nutzen!


	Hat der Inhalt Ihnen weitergeholfen und Sie möchten diese Seiten unterstützen?

Impressum

Datenschutz