Zur├╝ck...

Hypothese und Signifikanz

Da das Thema Hypothese und deren Test und der Signifikanz der anschlie├čenden Aussage recht interessant ist, wird es auf dieser Seite in einer ├ťbersichtsform oder hier als Video dargestellt.

Der Weg zur Hypothese:

Hypothese1
Abb. 1

Was ist eine Hypothese? Eine Hypothese ist eine mit Hilfe von Vorkenntnissen formulierte testbare Aussage (Abb. 1). Sie sollte kurz und aussagekr├Ąftig formuliert werden! Oder noch k├╝rzer:

Eine Hypothese ist eine testbare Aussage!

Eine Hypothese besteht immer aus zwei Hypothesen! Die Nullhypothese H0 und die Alternativhypothese H1 (oder HA). Die Nullhypothese H0 ist die testbare Aussage und die Alternativhypothese H1 ist das Gegenteil der Nullhypothese. Die Nullhypothese H0 nimmt i. d. R. keine Beziehung zwischen Variablen (Merkmalsauspr├Ągungen, ...) bzw. keinen Unterschied zwischen Gruppen an, weil dies klar definierte Aussagen sind und somit testbar. Einfach formuliert: Die Nullhypothese H0 besagt, dass “nichts passiert”! Das Testergebnis f├╝hrt zu statistisch abgesichertem Wissen (Abb. 1).

Es werden gerichtete und ungerichtete Hypothesen unterschieden:

    • Ungerichtet:

      Ein Hamburger von xyz beinhaltet im Durchschnitt 36 g Fleisch.

      D. h., der Hamburger kann mehr oder weniger Fleisch als 36 g beinhalten.
       
    • Gerichtet:

      Ein Hamburger von xyz beinhaltet im Durchschnitt weniger als 36 g Fleisch.

      D. h., der Hambuger kann weniger oder gleich 36 g Fleisch beinhalten. Die Hypothese beinhaltet eine oberer Grenze, n├Ąmlich 36 g.

Hypothesentest und Signifikanz:

Zum Hypothesentest geh├Ârt die statistische Signifikanz (lat.: Deutlichkeit). Mit ihrer Hilfe werden Hypothesen abgelehnt oder angenommen. Zum Verst├Ąndnis wird Abb. 1 dazu erg├Ąnzt (Abb. 2):

Hypothese2
Abb. 2

Aus der Frage

Wie hoch ist das Fleischgewicht eines Hamburger?

 und der geleisteten Vorarbeit, l├Ąsst sich folgende Hypothese ableiten:

        H0: Das Hamburgerfleischgewicht betr├Ągt im Mittel = 36 g.

        H1: Das Hamburgerfleischgewicht betr├Ągt im Mittel # 36 g.

Oder k├╝rzer formuliert:

              H0m├╝-Sign = 36 g

              H1Mittelwert_Zeichen # 36 g

H0 bezieht sich mit dem Mittelwert m├╝-Sign = 36 g auf die Grundgesamtheit und H1 mit dem Mittelwert  Mittelwert_Zeichen # 36 g auf die Stichprobe.

    Wenn das Stichprobenergebnis Mittelwert_Zeichen stark von dem angenommenen Nullhypothesen-Wert abweicht und einen bestimmten kritischen Wert ├╝berschreitet, wird angenommen, dass die Aussage ├╝ber die Grundgesamtheit (H0) nicht stimmt.

Diese Hervorhebung ist wichtig, da wir mit unserer Fragestellung auf das Verhalten der Grundgesamtheit eingehen. Die Basis dazu ist eine mehr oder weniger gro├če repr├Ąsentative zuf├Ąllig erzeugt Stichprobe. Von dieser Stichprobe schlie├čen wir auf die Grundgesamtheit.
Kl├Ąren wir nun die Bedeutung von einem bestimmten kritischen Wert ├╝berschreiten. Dazu nehmen wir an, dass das Hamburgerfleischgewicht der Hamburger normalverteilt ist. Der Erwartungswert E unseres Stichprobenmittelwertes Mittelwert_Zeichen entspricht dem Mittelwert m├╝-Sign der Grundgesamtheit:

E(Mittelwert_Zeichen) = m├╝-Sign

Mit dieser Annahme kann folgende Stichprobenverteilung konstruiert werden (Abb. 1):

Hypothese_Abb1
Abb. 1

Abb.1 l├Ąsst aufgrund der Normalverteilungsannahme erwarten, dass Werte (das Hamburgerfleischgewicht als Messergebnis) nahe dem Erwartungswert E eine hohe Auftrittswahrscheinlichkeit und Werte weit weg von E eine kleine Auftrittswahrscheinlichkeit haben.

Die Darlegung des Themas ist noch ein wenig theoretisch, sp├Ąter folgt im Text ein praktisches Beispiel. Aber nun geht es erst einmal theoretisch weiter.

Wenn ein Messwert (Messwerte, Mittelwert) stark vom Erwartungswert E abweicht und dabei einen kritischen Wert ├╝berschreitet, nehmen wir an, dass unsere Nullhypothese H0 nicht korrekt ist und lehnen sie zugunsten der Alternativhypothese H1 ab. Der kritische Wert mit der dazugeh├Ârigen Fl├Ąche alpha-Zeichen wird in Abb. 2 beispielhaft dargestellt:

Hypothese_Abb2
Abb. 2

Der Hypothese folgend, zeigt Abb.2 zwei Ablehnungsbereiche. Das Hamburgerfleischgewicht kann schlie├člich nach unten und nach oben von dem erwarteten Mittelwert E(Mittelwert_Zeichen) = 36 g abweichen. In diesem Fall, wird von einer ungerichteten Hypothese und einem zweiseitigen Test gesprochen.

Die Fl├Ąche alpha-Zeichen in der Stichprobenverteilung  Abb. 2 ist der Ablehnungsbereich und entspricht der Wahrscheinlichkeit einen Wert zu finden, der gr├Â├čer ist als der kritische Wert. Mit der Fl├Ąche alpha-Zeichen haben wir das Signifikanzniveau alpha-Zeichen festgelegt.
Das Signifikanzniveaus alpha-Zeichen wird durch 2 dividiert, weil - wie erw├Ąhnt - ein ungerichteter Hypothesentest in diesem Beispiel durchgef├╝hrt wird.
H├Ąufig wird zum Testen von Hypothesen Signifikanzniveaus von alpha-Zeichen = 10% (oder auf 1 bezogen von alpha-Zeichen = 0,1),  alpha-Zeichen = 5% (0,05) oder alpha-Zeichen = 1% (0,01) verwendet. Auf Abb. 2 bezogen bedeutet das, dass mit kleiner werdenden Signifikanzniveaus der Ablehnungsbereich (die rot schraffierte Fl├Ąche) nach links und rechts verschoben wird.
Hier gilt, je sicherer die Aussage (das Testergebnis) sein soll, desto kleiner ist alpha-Zeichen zu w├Ąhlen. Nat├╝rlich kann alpha-Zeichen aber nicht beliebig klein gew├Ąhlt werden, da das Ablehnen von H0 immer wahrscheinlicher wird. Siehe dazu Abb. 2 und diese Aussage wird grafisch sehr sch├Ân unterst├╝tzt.

Um es deutlich hervorzuheben was in Abb. 2 grafisch beschrieben ist, wird die Nullhypothese H0 zugunsten der Alternativhypothese H1 abgelehnt, wenn der Mittelwert Mittelwert_Zeichen unserer Hamburgerfleischgewichts-Erhebung in dem rot schraffierten Ablehnungsbereich (Signifikanzniveaus alpha-Zeichen/2) in Abb. 2 liegt. Gehen wir davon aus, dass ein Signifikanzniveaus alpha-Zeichen= 0,1 gew├Ąhlt wurde und der Mittelwert der Gewichtserhebung bei Mittelwert_Zeichen= 29 g Fleischgewicht liegt. Damit liegt er in dem unteren Ablehnungsbereich mit  alpha-Zeichen/2 = 0,1 / 2 = 0,05 und H0 wird zugunsten

Hypothese3


verworfen (Abb. 3). Das Testergebnis ist statistisch signifikant. Andersrum, wenn das Messergebnis Mittelwert Mittelwert_Zeichen im Annahmebereich 1-alpha-Zeichen liegt, kann die Nullhypothese H0 nicht abgelehnt werden.
Hypothese_Abb3
Abb. 3

Hierbei handelt es sich nur um Wahrscheinlichkeiten und es k├Ânnen Fehler bei der Annahme oder Ablehnung der Nullhypothese auftreten. Dieser Fehler entspricht dem gew├Ąhlten Signifikanzniveau alpha-Zeichen und es wird von einem Fehler 1. Art bzw. 2. Art gesprochen (Tabelle 1):

      • Fehler 1. Art: Die unberechtigte Ablehnung von H0
      • Fehler 2. Art: Das unberechtigte Beibehalten von H0

Testentscheidung

“Wirklichkeit”

H0 wahr

H0 falsch

H0 abgelehnt

Fehler 1. Art
( alpha-Zeichen-Fehler)

richtig

H0 beibehalten

richtig

Fehler 2. Art
( Beta-Symbol-Fehler)

Tabelle 1

Haben wir aufgrund des Testergebnisses H0 abgelehnt obwohl H0 wahr ist, liegt ein Fehler 1. Art vor. H0 wurde f├Ąlschlicherweise verworfen. Wird H0 nicht abgelehnt und sie ist wahr, wurde die richtige Entscheidung getroffen.
Haben wir H0 beibehalten und sie ist nicht wahr, liegt ein Fehler 2. Art, oder auch Beta-Symbol-Fehler vor. Die Fehler 1. und 2. Art (alpha-Zeichen- und Beta-Symbol-Fehler) sind voneinander abh├Ąngig. Wird der alpha-Zeichen-Fehler verkleinert, wird der Beta-Symbol-Fehler vergr├Â├čert und umgekehrt. In der Praxis wird sich in der Regel mit dem Festlegen des alpha-Zeichen-Fehler (der Irrtumswahrscheinlichkeit) begn├╝gt.

Sie sollten nun eine wichtige Erkenntnis erlangt haben: Das Testergebnis ist nur ein Hinweis auf das Verhalten der Grundgesamtheit, aber kein echter Beweis!

Anwendung des Hypothesentests

Wir haben die Hypothese

            H0m├╝-Sign = 36 g als Nullhypothese und

            H1Mittelwert_Zeichen # 36 g als Alternativhypothese

formuliert. Das Signifikanzniveau zu dem wir die Nullhypothese H0 ablehnen, legen wir auf 5 % fest:

            alpha-Zeichen = 5% bzw. alpha-Zeichen = 0,05

Um H0 zu testen, m├╝ssen Daten erhoben werden. D. h., wir m├╝ssen das Gewicht der Hamburgerfleischscheiben, auch Patty genannt, durch Wiegen ermitteln. Dazu wird die Stichprobengr├Â├če n auf n = 10 Patty’s festgelegt. Nun wird aus praktischen Gr├╝nden eine wichtige Annahme gemacht:

  • Es wird angenommen, dass die Patty’s eine unabh├Ąngige, repr├Ąsentative Stichprobe darstellen und die Patty-Gewichte einer Normalverteilung folgen.

Beispiel Annahme der Nullhypothese H0:

In Tabelle 2 sind die ermittelten Patty-Gewichte aufgef├╝hrt (Datei Patty_36.csv):

Nr.

Patty-Gewicht in g

1

35,0

2

37,2

3

36,4

4

36,1

5

37,0

6

36,6

7

35,8

8

34,4

9

36,2

10

36,2

Tab. 2

Die Pr├╝fung unserer Hypothese f├╝hren wir mit dem parametrischen (weil wir eine Annahme bez├╝glich der Verteilung gemacht haben) Hypothesentest t.test() aus der Statistikumgebung R durch. Da die Stichprobe mit n = 10 deutlich kleiner als n = 30 ist, kommt hier die t-Verteilung zum Zuge, weil

      • die Standardabweichung der Grundgesamtheit unbekannt ist und zur Sch├Ątzung der Testgr├Â├če die Standardabweichung der Stichprobe verwendet wird

        und
         
      • erst ab einem Stichprobenumfang n >= 30 die t-Verteilung in die Normalverteilung, als Voraussetzung zur Anwendung des Gau├č-Tests, ├╝bergeht.

Der t-Testwert wird wie folgt gesch├Ątzt (Abbildung 4):

Hypothese_Abb4
Abb. 4

Ist der t-Testwert < als der t-Wert der t-Verteilung zum festgelegten Signifikanzniveaus und dem Freiheitsgrad f = n - 1, dann kann die Nullhypothese H0 beibehalten werden (Abbildung 5, siehe auch Sollwert-t-Test):

Hypothese_Abb5
Abb. 5

F├╝hren wir den t-Test endlich mit R durch. Die Patty-Gewichte aus Tabelle 2 sind im Datenobjekt Patty_36g gespeichert und das Hamburgerfleischgewicht der Nullhypothese H0 wird als Argument mu = 36 der Funktion t.test ├╝bergeben:

          > t.test(Patty_36g, mu = 36)

                  One Sample t-test

          data:  Patty_36g
          t = 0.33313, df = 9, p-value = 0.7467
          alternative hypothesis: true mean is not equal to 36
          95 percent confidence interval:
           35.47885 36.70115
          sample estimates:
          mean of x
              36.09

Wie wird die Ausgabe (blau) der R-Funktion t.test interpretiert? Die Nullhypothese H0 kann nicht abgelehnt werden, weil

      • der gesch├Ątzte t-Wert t = 0.33313 hinreichend klein ist (siehe t-Verteilung) und
      • der p-Wert (p-value) mit 0.7467 deutlich ├╝ber dem Signifikanzniveau alpha-Zeichen = 0,05 liegt:
          • 0,7467 / 2 = 0,37335 (weil ungerichtet (zweiseitig))
          • 0,373 > 0,05/2 (weil ungerichtet (zweiseitig))

        Mit diesen t- und p-Werten liegt der Mittelwert der Messreihe Patty_36g sehr gut im 1-alpha-Zeichen der Abbildung 2.

Zus├Ątzlich wird der Vertrauensbereich (confidence interval) und der gesch├Ątzte Mittelwert der Stichprobe mit mean of x 36.09 ausgegeben.

Beispiel R├╝ckweisung der Nullhypothese H0:

Um das Thema abzurunden, folgt nun ein Beispiel, bei dem die Nullhypothese H0 abgelehnt werden muss. In Tabelle 3 sind Patty-Gewichte einer weiteren Stichprobenerhebung aufgef├╝hrt (Datei Patty_29.csv):

Nr.

Patty-Gewicht in g

1

29,3

2

29,9

3

28,9

4

28,0

5

28,8

6

29,7

7

30,9

8

29,5

9

29,7

10

29,7

Tab. 3

Die Patty-Gewichte aus Tabelle 3 sind im Datenobjekt Patty_29g gespeichert und das Hamburgerfleischgewicht der Nullhypothese H0 wird als Argument mu = 36 der Funktion t.test ├╝bergeben:

          > t.test(Patty_29g, mu = 36)

                  One Sample t-test

          data:  Patty_29g
          t = -26.921, df = 9, p-value = 6.518e-10
          alternative hypothesis: true mean is not equal to 36
          95 percent confidence interval:
           28.88877 29.99123
          sample estimates:
          mean of x
              29.44

Aufgrund des t-Wertes t = -26.921 und des p-Wertes mit p-value = 6.518e-10 muss die Nullhypothese H0 zugunsten der Alternativhypothese H1 abgelehnt werden. Zur Veranschaulichung dient hierzu Abb. 3.

Ich freue mich, wenn durch diesen Beitrag das Thema Hypothese und Signifikanz ein wenig klarer geworden ist und Sie dadurch sicherer in der Anwendung und Interpretation sind!

Seitenanfang

Hat der Inhalt Ihnen weitergeholfen und Sie m├Âchten diese Seiten unterst├╝tzen?