ZurĂŒck...

Lexikon


Sprung zum Bereich:

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z      Literaturstellen    Links

A

ABC-Analyse siehe hier!

Absolutbetrag siehe hier!

Abszisse: Bezeichnung fĂŒr die “horizontale” Koordinate des kartesischen Koordinatensystems (x-Achse).

Abweichung (deviation, error):

Ist die Abweichung zwischen einem Merkmalswert und einem Bezugswert des Merkmals.

Ähnlichkeit und Distanz

AnnahmeprĂŒfung:

QualitĂ€tsprĂŒfung zur Feststellung, ob ein Produkt wie bereitgestellt oder geliefert annehmbar ist.

ANOVA: analysis of variance / Varianzanalyse, mehr dazu hier....!

Analysenprobe siehe Messprobe

Analytische SensitivitÀt (Empfindlichkeit) (analytical sensitivity):

Sie beschreibt die FĂ€higkeit einer PrĂŒfmethode zwischen z. B. konzentrationsabhĂ€ngigen Signalen zu differenzieren (Steigung einer Kalibrierfunktion).

Analytische SpezifitÀt (analytical specifity):

Ist die FĂ€higkeit einer PrĂŒfmethode, nur die gesuchte Substanz zu erfassen, wobei andere Bestandteile der Matrix das PrĂŒfergebnis nicht beeinflussen.

Anti-Image-Kovarianz-Matrix:

Dient zur EignungsprĂŒfung einer Korrelationsmatrix in der Faktorenanalyse, mehr dazu hier!

arbitrary origin: willkĂŒrlicher Nullpunkt

Assoziativgesetz: (siehe auch Kommutativgesetz)

      (a+b)+c = a+(b+c)           (a*b)*c = a*(b*c)

Audit (QualitÀstaudit):

Ein QualitĂ€tsaudit, kurz Audit (lat. audire = (an)hören), ist eine systematische und objektive Untersuchung auf ErfĂŒllung von QualitĂ€tsanforderungen (siehe ISO 9000:2000 ff.).

Das Ziel eines Audits ist

  • die QualitĂ€tsfĂ€higkeit des Auditiertens zu bestĂ€tigen (Zertifikat)
  • und / oder frĂŒhzeitig Schwachstellen aufzuzeigen, um Maßnahmen zur Verbesserung zu ergreifen.

Es wird in 3 Auditarten unterschieden:

  1. Prozessaudit: ÜberprĂŒfung der ZweckmĂ€ĂŸigkeit und der Einhaltung von Prozessen
  2. Systemaudit: ÜberprĂŒfung des QM-Systems oder von Teilen des QM-Systems
  3. Produktaudit: ÜberprĂŒfung der Übereinstimmung von Produkten mit den festgelegten QualitĂ€tsanforderungen

Und es wird auch danach unterschieden, wer das Audit durchfĂŒhrt:

  • Internes Audit: Managementwerkzeug der Unternehmensleitung zur internen Beurteilung und Aufrechterhaltung der QualitĂ€tsfĂ€higkeit.
  • Externes Audit: Beurteilung der QualitĂ€tsfĂ€higkeit eines Unternehmens durch eine unternehmensfremde Stelle.

Ausreissertest, siehe Extremwert

Axiom:

Ein Axiom ist ein Satz einer Theorie, der nicht bewiesen werden muss, sondern beweislos vorausgesetzt wird.

B

ZurĂŒck...

Bartlett-SphĂ€rentest findet Verwendung in der EignungsprĂŒfung der Korrelationsmatrix in der Faktorenanalyse.

Bartlett-Test auf Gleichheit mehrerer Varianzen bei gleichem oder unterschiedlichen StichprobenumfÀngen.

Befragung siehe PrimÀr- und SekundÀrstatistik

Beobachtung siehe PrimÀr- und SekundÀrstatistik

Beschreibende Statistik oder gleich deskriptive Statistik...

Bestimmungsgrenze: siehe Nachweisgrenze

Bias:

Als Bias oder auch Verzerrung, wird der systematische Einfluss auf erhobene Daten genannt. Das bedeutet, dass die durchgefĂŒhrten SchĂ€tzungen ein konstantes zu hohes oder zu niedriges Resultat zeigen. Ursachen dieser Verzerrung können sein:

      • Die entnommene Stichprobe aus der Grundgesamtheit ist nicht reprĂ€sentativ (Stichprobenumfang zu klein, eine bestimmter Bereich / bestimmte Gruppe wurde bevorzugt, ...)
         
      • Wenn in einer Befragung durch nicht optimal formulierte Fragen Antwortoptionen möglich sind, können dadurch Verzerrungen in den Antworten auftreten.
         
      • Wird die Datenerhebung mithilfe eines Messinstrumentes durchgefĂŒhrt, kann dieses dejustiert sein und dadurch systematische verschobene Ergebnisse liefern.
         
      • Sind z. B. in einem medizinischem Experiment den Testpersonen oder den Beobachtern (Betreuern) bekannt, wer den Wirkstoff oder ein Placebo bekommen hat, kann dies als Verzerrung in das Ergebnis einfließen.
         
      • Werden in der Datenanalyse Daten/Beobachtungen ausgewĂ€hlt, hat diese Vorgehensweise sicher einen Einfluss auf die Aussage / das Ergebnis. Unter AuswĂ€hlen wird hier nicht das Aussortieren von ungĂŒltigen oder unsinnige Antworten einer Befragung gemeint! Ist eine Datenbereinigung notwendig, wird sie entsprechend dokumentiert! Siehe auch Extremwert.

Big Data, in Verbindung mit Data Mining siehe hier!

Bindungen

Hinweise zu Bindungen in Datenerhebungen finden Sie hier!

Binomialverteilung

Blindwert (siehe auch Richtigkeit)

Box-Plot als grafische Zusammenfassung der Quantile

C

ZurĂŒck...

Charge: Begriffe zur Probenahme

Chemometrie:

Chemometrie ist der Teil der chemischen Disziplinen, der mathematische und statistische Methoden zur Auswahl optimaler Messverfahren, zur Plannung von Experimenten und zur Gewinnung maximaler Informationen bei der Analyse der erhaltenen Daten verwendet.

Chiquadrat-Test, -Test:

Der -Test ist ein Anpassungstest. Mit ihm lĂ€sst sich prĂŒfen, ob die beobachtete Verteilung der vorgegebenen Verteilung entspricht. Mehr dazu hier...!

Clusteranalyse siehe Multivariate Analysenmethoden

Conjoint Measurement siehe Multivariate Analysenmethoden

cp- und cpk-Index:

Die ProzessfÀhigkeit wird neben weiteren, durch die Indices cp, process capability, und durch cpk, critical process capability, beschrieben. Mehr dazu und die Berechnung finden Sie hier....!

D

ZurĂŒck...

Data Mining:

Eine Übersicht ĂŒber das Thema Data Mining finden Sie hier und das erwĂ€hnte Data-Mining- Projekt-Modell CRISP-DM 1.0 können Sie ĂŒber diesen Link auf Ihren Computer laden!

Datenerhebung:

Sind die Daten zur statistischen Betrachtung schon vorhanden, wird von einer Erhebung gesprochen. Es werden folgende Erhebnungsarten unterschieden:

  • PrimĂ€rstatistische Erhebung: Die Daten werden speziell zur Beantwortung einer aktuellen Fragestellung erhoben, z. B. politische Umfragen.
  • SekundĂ€rstatistische Erhebung: Bereits vorhandene Originaldaten aus z. B. Datenbanken weren zur Auswertung herangezogen.
  • TertiĂ€rstatistische Erhebung: Diese Daten stehen nur noch in transformierter Form, z. B. als Mittelwerte, zur VerfĂŒgung.

Diagnosemethoden (Psychologie):

  • Querschnittsdiagnose:
    Querschnittsdiagnosen betrachtet den aktuellen Zustand des Objekts, z. B. Unterschiede in den MerkmalsausprÀgungen zwischen Personen oder Gruppen.
  • LĂ€ngsschnittdiagnose:
    LĂ€ngsschnittdiagnosen betrachtet VerĂ€nderungen ĂŒber einen grĂ¶ĂŸeren Zeitraum des Objekts (VerĂ€nderungen von bestimmten Merkmalen von z. B. Personen mit zunehmenden Alter).
     

Diskriminanzanalyse siehe Multivariate Analysenmethoden oder hier...!

Deskriptive Statistik:

Beschreibende Statistik durch graphische Aufbereitung und Komprimierung (z. B. Mittelwert und Streuung) von Daten (siehe auch explorative und induktive Statistik).
Ein EinfĂŒhrungsvideo zur deskriptiven Statistik mit MS Excel finden Sie hier!

Dispersionsmaße:

Maße, die die VariabilitĂ€t der Verteilung kennzeichnen, wie z. B. Standardabweichung oder Spannweite.

Distanz und Ähnlichkeit

E

ZurĂŒck...

e (Euler’sche Zahl):

Der Grenzwert der Funktion ...

... ist die e-Zahl, oder auch nach Leonhard Euler Euler’sche Zahl genannt. Die e-Zahl ist hĂ€ufig die Basis fĂŒr Wachstumsprozesse in der Natur und wird deswegen als natĂŒrliche Basis bezeichnet. Als Beispiel sei hier das Bakterienwachstum genannt:

Effekte (effects):

Einfach ausgedrĂŒckt, sind Effekte fĂŒr die wir uns interessieren fixed effects (oder auch feste Faktoren) und Faktoren die in unseren Beobachtungen enthalten sind, fĂŒr die wir uns weniger interessieren, random effects (oder auch Zufallsfaktoren). Die gebildete Hypothese entscheidet letztendlich, was fĂŒr den PrĂŒfer ein fixed oder random effect ist.

Eichen (verification):

Das Eichen eines MessgerĂ€tes umfasst die von der zustĂ€ndigen Eichbehörde nach den Eich- vorschriften vorzunehmenden PrĂŒfungen und die Stempelung. (DIN 1319 Teil1)

EingangsprĂŒfung (receiving inspection):

AnnahmeprĂŒfung an einem zugelieferten Produkt durch den Abnehmer.

Emperie (empirical):

Die Empirie (griechisch embirĂ­a - die Erfahrung) stellt im wissenschaftlichen Sinne eine auf methodischem Weg (Induktion, Analogie, Beobachtung und Versuche) gewonnene Erfahrung dar. Hier wird z. B. unter empirische Verteilung eine Verteilung verstanden, die beobachtete oder durch Versuche gewonnenen Daten basiert.

EndprĂŒfung (final inspection):

Letzte der QualitĂ€tsprĂŒfungen vor Übergabe der Einheit (Lot, Charge) an den Abnehmer.

Entscheidungsbaum oder Regressionsbaum siehe hier!

Ergebnisabweichung (error of result):

Unterschied zwischen einem Merkmalswert und dem Bezugswert, wobei dieser je nach Festlegung oder Vereinbarung der wahre, der richtige oder der Erwartungswert sein kann.     (Siehe Genauigkeit und Wahrer Wert)

Ergebnisraum: (Stichprobenraum, Wertebereich eines Merkmals)

Ein Ergebnisraum stellt die Anzahl möglicher Zufallsergebnisse dar (siehe auch Merkmal und Zufallsvariable).
FĂŒr einen WĂŒrfel betrĂ€gt im Allgemeinen der Ergebnisraum E = {1, 2, ..., 6}und fĂŒr den Wurf einer MĂŒnze betrĂ€gt E = {Wappen, Zahl}.
Teilmengen aus z. B. dem “WĂŒrfel”-Ergebnisraum heißen Ereignisse, z. B.

Ereignisse ET = {1, 2, 3}

und einelementige Teilmengen werden als Elementarereignis, wie z. B.

Elementarereignis EE = {1}

bezeichnet.

Ergebnisunsicherheit (Messunsicherheit):

GeschĂ€tzter Betrag zur Kennzeichnung eines Wertebereichs, innerhalb dessen der Bezugswert liegt (siehe Vertrauensbereich fĂŒr den Mittelwert und Wahrscheinlichkeit).

Erhebungsarten siehe PrimÀr- und SekundÀrstatistik

Ermittlungsergebnis (result of determination):

Durch die Anwendung eines Ermittlungsverfahrens (PrĂŒfmethode) festgestellter Merkmalswert (Merkmalsergebnis).

ErstprĂŒfung:

Erste in einer Folge von vorgesehenen oder zugelassenen QualitĂ€tsprĂŒfungen.

Erwartungswert (expectation):

Stellt praktisch den Mittelwert der Merkmalergebnisse, die durch “unablĂ€ssiges” Wiederholen gewonnen wurden, dar.

Explorative Statistik:

Suche nach Strukturen und Besonderheiten in den Daten (siehe auch deskriptive und induktive Statistik).

Extremwert:

Bei einem Extremwert handelt es sich um auffÀllig hohe oder kleine Beobachtungen (Messwert...) einer Stichprobe. Hier stellt sich die Frage, ob derartige Beobachtungen als Ausreisser aus der Stichprobe gestrichen werden können. Diese Frage kann mit einem Ausreissertest beantwortet werden.

Experiment siehe PrimÀr- und SekundÀrstatistik

F

ZurĂŒck...

Faktorenanalyse siehe Multivariate Analysenmethoden

Faktorielles Desgin ist ein Begriff aus der Varianzanalyse (ANOVA).

Fehler (nonconformance):

NichterfĂŒllung vorgegebener Forderungen durch ein Merkmalswert. Die Verwendbarkeit ist durch einen Fehler nicht notwendigerweise beeintrĂ€chtigt.

Fehlerklassifizerung (classification of...): Einstufung möglicher Fehler einer Einheit in Fehlerklassen nach einer Bewertung, die an die Fehlerfolgen ausgerichtet ist.

Kritischer Fehler (critical ...): Fehler, von dem anzunehmen oder bekannt ist, dass er gefĂ€hrliche oder unsichere Situationen schafft; oder die ErfĂŒllung der Funktion........ verhindert.

Hauptfehler (major...): Nicht kritischer Fehler, der voraussichtlich zu einem Ausfall fĂŒhrt oder die Brauchbarkeit fĂŒr den vorgesehenen Verwendungszweck wesentlich herabsetzt.

Nebenfehler (minor...): Fehler, der voraussichtlich die Brauchbarkeit fĂŒr den vorgesehenen Verwendungszweck nicht wesentlich herabsetzt, oder den Gebrauch/Betrieb der Einheit nur geringfĂŒgig beinflusst.

Fehlerfortpflanzung:

Rechnen mit fehlerbehafteten Zahlen, siehe hier...!

Fehler 1. und 2. Art siehe hier!

FertigungsprĂŒfung:

ZwischenprĂŒfung an einem in der Fertigung befindlichen materiellem Produkt.

FischgrÀten-Diagramm siehe hier!

Fishers exakter Test siehe hier!

FMEA:

FMEA steht fĂŒr Fehlermöglichkeits- und Einflussanalyse. Mehr zum Thema finden Sie hier!

Formmaße:

Maße, die die Abweichung einer Verteilung von der Normalverteilung charakterisieren, wie z. B. Schiefe- und Wölbungsmaße (Momentkoeffizienten).

Fragebogenkonstruktion , Hinweise zur -:

Die folgenden Hinweise sollen Sie bei der Konstruktion eines Fragebogens zur Datenerhebung unterstĂŒtzen:

  • Seien Sie sich darĂŒber im Klaren, dass die Befragten immer in der Lage sind, Testergebnisse (ĂŒber die Merkmale einer Erhebung / Befragung) willentlich zu beeinflussen. Das gilt vor allem, wenn sozial erwĂŒnschtes Verhalten fĂŒr den Befragten erkennbar wird.
  • Fragen, bei den erwartet wird, dass immer Zustimmung oder Ablehnung erfolgt sollten erst gar nicht gestellt werden.
  • Begriffe mit mehreren Bedeutungen vermeiden.
  • Verwenden Sie nur von bekannte Begriffe in Fragestellungen. Wenn Sie Zweifel haben, erklĂ€ren Sie den Begriff!
  • Fragen nur einem sachlichen Inhalt zugrunde legen (Vermeidung der Kombination wie z. B. ...sehr gerne und sehr schnell…)
  • Keine doppelten Verneinungen
  • Keine Verallgemeinerungen
  • Die Frage nicht zu lang (SchachtelsĂ€tze) aber auch nicht zu kurz (dass das VerstĂ€ndnis verloren geht) formulieren
  • Bezieht sich eine Frage auf einen Zeitraum, diesen deutlich definieren (nicht in den letzten Monaten, sondern in den letzten 3 Monaten…)
     
  • Wenn möglich, prĂŒfen Sie den Fragebogen durch eine Vorbefragung auf VerstĂ€ndlichkeit (weiter Stichworte sind ValiditĂ€t und ReliabilitĂ€t).
     
  • Vermeiden Fragen vom Ja/Nein-Antwort-Typ
    Dieser Fragetyp ist bei einer exakten und gut verstĂ€ndlichen Fragestellung leicht zu beantworten. Allerdings erhĂ€lt man zu wenig differenzierte Informationen. Eine Triebkraft fĂŒr diesen Hinweis ist die Schwierigkeiten bei der statistischen Analyse.

Diese Hinweise sind sicher nicht umfassend, sie sollen Anregungen sein!

Freiheitsgrad (degrees of freedom, df):

Der Freiheitsgrad (df oder f) entspricht dem Stichprobenumfang n minus der Anzahl Parameter p die aus diesem Stichprobenumfang geschÀtzt wurden:

df = f = n - p

Der Begriff Freiheitsgrad wird an folgendem Beispiel dargelegt. Dazu gehen wir davon aus, das uns 5 Zahlen vorliegen, deren Summe 25 betrĂ€gt und der Mittelwert 5 entspricht.
Basierend auf dieser Annahme können wir nun in der folgenden Tabelle 5 Zahlen, die positiv oder negativ sein können, aber - wie erwĂ€hnt - als Summe nur 25 ergeben dĂŒrfen, eintragen. Starten wir einfach, völlig willkĂŒrlich, mit der Zahl 6 in der ersten Zeile:

1. Zahl

2. Zahl

3. Zahl

4. Zahl

5. Zahl

6

 

 

 

 

Auch ist es egal, welche Zahl als 2. Zahl eingetragen wird. Tragen wir einfach die 4 ein:

1. Zahl

2. Zahl

3. Zahl

4. Zahl

5. Zahl

6

4

 

 

 

Die 3. Zahl kann von uns auch willkĂŒrlich gewĂ€hlt werden, hier die 7:

1. Zahl

2. Zahl

3. Zahl

4. Zahl

5. Zahl

6

4

7

 

 

Und ebenso die 4. Zahl, beispielsweise tragen wir hier eine 3 ein:

1. Zahl

2. Zahl

3. Zahl

4. Zahl

5. Zahl

6

4

7

3

 

Und nun kommen wir zur letzten Zahl! Hier haben wir keine Wahlfreiheit mehr! Um die Summe 25 und folglich einen Mittelwert 5 zu erhalten, mĂŒssen wir als letzte Zahl 5 eintragen:

1. Zahl

2. Zahl

3. Zahl

4. Zahl

5. Zahl

6

4

7

3

5

FĂŒr die Zahlen 1 bis 4 haben wir völlige Wahlfreiheit aber durch die Vorgabe des Mittelwerts 5 in diesem Beispiel, haben wir keine Wahlfreiheit fĂŒr die 5. Ziffer mehr. In diesem Beispiel haben wir also nur 4 Freiheitsgerade!

G

ZurĂŒck...

Genauigkeit (accuracy):

Die Genauigkeit ist die Bezeichnung fĂŒr das Ausmaß der AnnĂ€herung von Merkmals- ergebnissen an den Bezugswert, wobei dieser je nach Festlegung oder Vereinbarung der richtige oder ein festgelegter Wert sein kann.

Die Genauigkeit ist der Oberbegriff fĂŒr PrĂ€zision und Richtigkeit.

Gesamtabweichung (total deviation, total error):

Ist die Differenz von Sollwert und Istwert und setzt sich zusammen aus systematischer und zufÀlliger Abweichung.

Gini-Koeffizient als Abweichungsmaß in der Lorenzkurve

GLM (Generalisierte Lineare Modelle):

GLM ist eine Analyse-Methode aus dem Bereich der Regressionsanalyse. Besonders ist hierbei, dass die abhĂ€ngige Variable Y (ZielgrĂ¶ĂŸe) einen diskreten Charakter, wie z. B. ja = 1 oder nein = 0, hat (siehe auch Skalen). Ein Anwendungsbespiel dieser Methode finden Sie hier!

Grenz-

Grenzbetrag (upper limit amount): Betrag fĂŒr Mindestwert und Höchswert, die bis auf das Vorzeichen ĂŒbereinstimmen.

Grenzabweichung (limiting deviation): Untere Grenzabweichung oder obere Grenzabweichung.

Untere Grenzabweichung (lower limiting deviation): Mindestwert minus Bezugswert, wobei der Bezugswert der Nennwert oder Sollwert ist.

Obere Grenzabweichung (upper limiting deviation): Höchstwert minus Bezugswert.

Griechisches Alphabet

Grundgesamtheit (Population):

Die Grundgesamtheit ist die Gesamtheit aller MerkmalstrĂ€ger, oder anders ausgdrĂŒckt, ist die Menge aller statistischen Einheiten (Objekte, Elemente), ĂŒber die eine Aussage getroffen werden soll.
Eine Grundgesamtheit kann endlich, unendlich oder hypothetisch sein. Die Grundgesamtheit muss z. B. nach folgenden Kriterien definiert werden:

      • Sachlich, was soll untersucht werden?
      • RĂ€umlich, wo soll die Untersuchung durchgefĂŒhrt werden?
      • Zeitraum, wann soll die Untersuchung stattfinden?

Wird eine Teilmenge der Grundgesamtheit betrachtet, also darauf beschrÀnkt, wird von einer Teilgesamtheit (Teilpopulation) gesprochen.

Nehmen wir als Beispiel eine Befragung zum nĂ€chsten Bundeskanzler als Wahlergebnis der Wahl vom 27. September 2009. Die Befragung wird im gesamten Bundesgebiet (rĂ€umlich) in der 4. Wochen vor dem Wahltermin fĂŒr den Zeitraum von einem Tag an 1008 zufĂ€llig ausgewĂ€hlten BundesbĂŒrger (sachlich, Stichprobe = Teilerhebung) durchgefĂŒhrt. Das Ergebnis der Umfrage soll eine Aussage (Wahrscheinlichkeitsaussage) sein, wer nĂ€chster Bundeskanzler oder natĂŒrlich Bundeskanzlerin wird.
Über das Ergebnis dieser Teilerhebung wird auf das Wahlverhalten der Grundgesamtheit (die Gesamtbevölkerung der Bundesrepublik) geschlossen. Deswegen muss die Stichprobe reprĂ€sentativ sein. Nicht reprĂ€sentativ wĂ€re sicher eine Teilerhebung in nur einem Bundesland. Siehe dazu auch Bias!

H

ZurĂŒck...

H-Test von Kruskal und Wallis siehe hier!

HÀufigkeit, kumuliert (SummenhÀufigkeit) siehe hier!

Histogramm:

Über ein Histogramm lassen sich HĂ€ufigkeitsverteilungen grafisch darstellen. Wie ein Histogramm konstruiert wird, sehen Sie hier!

Hypergeometrische Verteilung

Hypothese, Null- und Alternativ-:

Eine ausfĂŒhrlichere Beschreibung des Themas finden Sie hier!

Durch ein statistisches Testverfahren soll z. B. geprĂŒft werden, ob die LĂ€nge der produzierten Schrauben einer laufenden Produktion dem Sollwert = 50 mm entsprechen oder ob beispielsweise zwei Stichprobenmittelwerte innerhalb einer zufĂ€lligen Schwankung gleich sind (der gleichen Grundgesamtheit entstammen).

Dazu werden Hypothesen formuliert: Die Nullhypothese H0 bedeutet, dass nichts geschieht (einfach ausgedrĂŒckt) und die Alternativhypothese H1, dass ein bestimmtes oder extremes Ereignis eingetreten ist. Wichtig ist, dass die Nullhypothese H0 nicht durch Tests bewiesen wird, sondern dass aufgrund der Beobachtungen und Test gezeigt wird, dass die Nullhypothese H0 hinreichend unwahrscheinlich ist! Dann wird zugunsten der Alternativhypothese H1 die Nullhypothese H0 verworfen.

Was bedeutet das fĂŒr obige Beispiele? Zeigt der statistische Test, dass der Sollwert von 50 mm SchraubenlĂ€nge innerhalb der normalen statistischen Varianz erreicht wird, ist die Wahrscheinlichkeit hoch, dass die Nullhypothese H0 zutrifft. Zeigt der Test aufgrund der Beobachtungen (deutliche Abweichung der SchraubenlĂ€nge von 50 mm) hingegen, dass die Nullhypothese H0 hinreichend unwahrscheinlich ist, muss sie zu Gunsten der Alternativhypothese H1 zurĂŒckgewiesen werden.
FĂŒr das 2. Beispiel bedeutet die Nullhypothese H0, dass die beiden Mittelwerte innerhalb der normalen statistischen Varianz gleich sind (nichts geschieht). Zeigt ein statistischer Test fĂŒr den Vergleich der Mittelwerte hingegen einen signifikanten Unterschied zwischen den Mittelwerten, ist die Nullhypothese H0 zu Gunsten der Alternativhypothese H1 zurĂŒckzuweisen.

FĂŒr Hypothesentests werden zur Entscheidung die entsprechenden tabellierten Verteilungen herangezogen oder durch Statistikprogramme wie z. B. R, p-Werte zur WahrscheinlichkeitsabschĂ€tzung berechnet.

Ein Fehler 1. Art tritt nun dann auf, wenn H0 verworfen wird, obwohl H0 wahr ist. Und der Fehler 2. Art tritt dann ein, wenn H0 beibehalten wird, obwohl H1 wahr ist.

I

ZurĂŒck...

Induktive Statistik:

Versuch durch Einbindung der Stochastik ĂŒber die erhobenen/ermittelten Daten hinaus allgemeine Schlußfolgerungen fĂŒr umfassendere Grundgesamtheiten zu ziehen (schließende Statistik, siehe auch deskriptive und explorative Statistik).
Induktiv: Bezeichnet die Vorgehensweise in der Logik des Schließens “vom Besonderen auf das Allgemeine”.

Interquartilbereich (interquartilrange, IQR):

Der Interquartilbereich kann als Kennzahl fĂŒr die Verteilung dienen, d. h., die GrĂ¶ĂŸe des Bereichs gibt Auskunft, wie weit die Verteilung auseinander gezogen ist.
Die Berechnung des Interquartilbereichs dQ erfolgt nach

dQ = Q3 - Q1

Der Interquartilbereich ist, da links von Q1 und rechts von Q3 die Werte nicht berĂŒcksichtigt werden, gegen Extremwerte (Ausreißer) stabil. Als Ausreißer-Kandidaten können Werte vermutet werden, die folgende Grenzen ĂŒberschreiten:

Unterer Grenzwert = Q1 - 1,5 dQ

Oberer Grenzwert = Q3 + 1,5 dQ

(EN) ISO 9001:2000 ff , QM-System

(EN) ISO 19011, Leitfaden fĂŒr das Auditieren von QualitĂ€ts- und /oder Umweltmanagementsystemen

Istwert:

Momentanes Merkmalsergebnis, welches sich durch systematische und /oder zufÀllige Abweichungen vom wahren/richtigen Wert unterscheidet.

Intervalle:

Ein Intervall stellt eine zusammenhÀngende Teilmenge einer geordneten Menge dar. Das bedeutet, wenn 2 Objekte in der Teilmenge enthalten sind, sind auch die dazwischen liegenden Objekte in dieser Teilmenge enthalten.
Ein Intervall ist durch seine Intervallgrenzen eindeutig bestimmt. Ein Intervall heißt abgeschlossen, wenn es beide Grenzen enthĂ€lt und offen, wenn es beide Grenzen nicht enthĂ€lt. Als halboffen wird ein Intervall bezeichnet, wenn es eine Intervallgrenze beinhaltet:

  • Abgeschlossenes Intervall (geschlossen, kompakt):

    [1, 10] -> Das Intervall enthÀlt auch die Zahl 1 und 10.
     
  • Offenes Intervall (beschrĂ€nktes):

    (1, 10) -> Das Intervall enthĂ€lt nicht die Zahlen 1 und 10, aber natĂŒrlich die Zahlen zwischen 1 und 10. FĂŒr die folgenden halboffenen Intervalle gilt dies analog.
     
  • Halboffenes (linksoffenes) Intervall:

    (1, 10] -> Das Intervall enthÀlt nicht die Zahl 1 aber die Zahl 10.
     
  • Halboffenes (rechtsoffenes) Intervall:
     
  • [1, 10) -> Das Intervall enthĂ€lt die Zahl 1 aber nicht die Zahl 10.

Um Verwechselungen mit dem Dezimalkomma zu vermeiden, werden oft folgende Schreibweisen genutzt:

      [1, 10] = [1; 10] = [1 | 10]

Ishikawa-Diagramm siehe hier!

J

ZurĂŒck...

Justieren (adjustment):

Justieren bedeutet, ein MessgerĂ€t so einzustellen oder abzugleichen, dass die Messabweichungen möglichst klein werden oder dass die BetrĂ€ge der Messabweichungen die Fehlergrenze nicht ĂŒberschreiten. (DIN 1319 Teil 1)

K

ZurĂŒck...

Kalibrieren (calibration):

Das Kalibrieren eines Systems ist die Ermittlung und Festlegung eines funktionalen Zusammenhangs zwischen einer zĂ€hl- bzw. messbaren GrĂ¶ĂŸe und einer bestimmenden Konzentration (Objekteigenschaft) aus Daten, die im allgemeinen mit zufĂ€lligen Abweichungen behaftet sind. (DIN 1319 Teil 1)

Kardinalzahlen sind Mengen, die als ReprĂ€sentanten von Mengen einer bestimmten GrĂ¶ĂŸe dienen (Anzahl, siehe auch Skalen).

Kartesische Produktmenge, siehe hier!

Klassierung (Kategorisierung) von MerkmalsausprÀgungen siehe hier!

KommunalitÀtsproblem als Aspekt der Faktorenanalyse siehe hier!

Kommutativgesetz: (siehe auch Assoziativgesetz)

        a+b = b+ a         a*b = b* a

KMO-Kriterium, Kaiser-Meyer-Olkin-Kriterium

EignungsprĂŒfverfahren in der Faktorenanalyse, siehe hier!

Kolmogorov-Smirnov-Test (Kolgoroff-Smirnoff-Test) als Anpassungstest zur PrĂŒfung auf Normalverteilung siehe hier!

Konfidenzbereich /-intervall (confidence interval): siehe Vertrauensbereich

Kontingenz- oder Kreuztabelle und Kontigenzanalyse, oder Übersicht der Multivariaten Analysenmethoden

Kontingenzkoeffizienten K*, Kontigenzanalyse, StÀrke des Zusammenhangs...

Korrelation (correlation):

Allgemeine Bezeichung fĂŒr den stochastischen Zusammenhang zwischen zwei oder mehreren ZufallsgrĂ¶ĂŸen.

Im engeren Sinn wird mit “Korrelation” der lineare stochastischen Zusammenhang bezeichnet.

Sind die Beobachtungen vom metrischen Skalentyp, wird der Korrelationskoeffizient nach Pearson geschÀtzt und sind sie mindestens vom ordinalen Skalentyp, nach Spearman (Rangkorrelationskoeffizient).

Über den t-Test fĂŒr den Korrelationskoeffizienten, können Sie die GĂŒte des vermuteten statistischen Zusammenhanges zwischen den Merkmalen prĂŒfen. Weiters dazu hier!

Korrelationsmatrix, Inverse -, siehe hier!

Korrespondenzanalyse siehe Multivariate Analysenmethoden

Kreisprozess:

Um auf Fragestellungen Antworten (Resultate) zu finden, hilft der statistische Kreisprozess weiter. Auf Basis der Fragestellung werden die geplanten Daten erhoben, Annahmen ĂŒber das Modell gemacht, die Daten analysiert und interpretiert. Zeigen Fragestellung und Resultate keinen “inneren” Zusammenhang (Modell / Interpretation) mĂŒssen Anpassungen vorgenommen werden, bis dass Modell die RealitĂ€t befriedigend abbildet.

Kruskal und Wallis-Test (oder H-Test) siehe hier!

L

ZurĂŒck...

Laplace-Wahrscheinlichkeit siehe hier!

Lebensdaueruntersuchung:

Zum Thema Lebensdaueruntersuchung (ZuverlÀssigkeits-) siehe Weibullverteilung!

Likert-Skala (nach Renisis Likert), siehe hier!

Logistische Regression, siehe hier!

Logische VerknĂŒpfung, siehe hier!

Logit:

Begiff aus der logistischen Regression, siehe hier!

Lokalisationsmaße:

Maße fĂŒr die mittlere Lage einer Verteilung, wie z. B. der Mittelwert.

Lorenzkurve als garphische Darstellung der relativen Merkmalkonzentration.

Los: Begriffe zur Probenahme

M

ZurĂŒck...

Matrix, mathematisch -

Matrix: (chemisch -)

Die Matrix ist die Gesamtheit der Bestandteile eines Materials und ihrer chemischen und physikalischen Eigenschaften und deren gegenseitigen Beeinflussungen.

Median

Mengenlehre:

Grundbegriffe der Mengenlehre siehe hier!

Merkmal (characteristic):

Eigenschaft zum Erkennen oder zum Unterscheiden von Einheiten (Charge, Los, Untersuchung einer Grundgesamtheit).
Quantitativ:

  • Kontinuierliches oder stetiges Merkmal. D. b., es können alle Merkmalswerte, z. B. in einem Intervall, angenommen werden.
  • Diskretes Merkmal; diesem Merkmalstyp werden abzĂ€hlbare MerkmalsausprĂ€gungen zugewiesen.
  • Quasi-stetige Merkmale; diskrete AusprĂ€gung, die aber aufgrund ihrer feinen Abstufung wie stetige Merkmale behandelt werden können.

Qualitativ: Attributives oder beschreibendes Merkmal

Gruppierte oder klassierte Merkmale sind zusammengefasste MerkmalsausprÀgungen. Werden stetige Merkmale gruppiert, können sie als diskret angesehen werden.

Merkmalswert: (characteristic value, auch PrĂŒfergebnis, siehe auch QualitĂ€t, Wertdefinitionen und Skalen)

Der Erscheinungsform des Merkmals zugeordneter Wert.

Wertebereich eines Merkmals :

Menge aller Merkmalswerte, die das betrachtete Merkmal annehmen kann.

Messprobe: (auch Analysenprobe)

Eine Messprobe ist diejenige Probe, deren Gehalt an einem zu bestimmenden Stoff unmittelbar gemessen werden kann. Sie wird aus der Laboratoriumsprobe durch ZusÀtze von Reagenzien, oder allgem. durch Bearbeitung, erhalten.

Meta-Analyse:

Randomisierte Studien sind die bestmöglichen Voraussetzungen zur Beurteilung eines Therapieerfolges. Systematische Zusammenfassungen dieser randomisierten Studien sind ein wesentlicher Schritt im Erkenntnisgewinn und derartige Zusammenfassungen werden als Übersichtsarbeit oder Review bezeichnet. Übersichtsarbeiten sind dadurch gekennzeichnet, dass in systematischer Weise nach Studien zu einer bestimmten Fragestellung gesucht wird. Diese Studien sollen unabhĂ€ngig von ihrem Ergebnis in die Bewertung (der Übersichtsarbeit) einfließen. (Diese Forderung ist schwierig einzuhalten, da Studien, die einen negativen Therapieerfolg als Ergebnis zeigen, wenig Chancen auf Veröffentlichung haben!)
Es wir von einer Meta-Analyse gesprochen, wenn die Ergebnisse der einzelnen Studien zu einem gemeinsamen Effekt mit statistischen Methoden zusammengefasst werden.

Methode, 8D-:

Die 8D-Methode beschreibt einen teamorientierten Problemlösungsprozess und legt eine Schrittfolge fest, die durchlaufen werden soll, wenn ein Problem mit unbekannter Ursache offensichtlich wird. Mehr hier....!

Mittelwert (mean), arithmetischen ...

Mittel, geometrisch:

Das geometrische Mittel wird berechnet, wenn die Merkmalswerte x relative Änderungen (Wachstum, Produktionssteigerungen, usw.) oder Zeiten, wie Wartezeiten, sind.
Die VerhĂ€ltniszahl (relative Änderung) soll als VerĂ€nderung im jeweils gleichen zeitlichen Abstand gegeben sein.
Die Berechnung erfolgt nach: 

Mittel, gewogen:

Der gewogene arithmetische Mittelwert wird im Bereich der Datenzusammenfassung dargestellt.

Mittel, harmonisch:

Das harmonische Mittel wird als Mittel fĂŒr z. B. verschiedene Geschwindigkeiten auf unterschiedlichen Teilstrecken angegeben.
Die Berechnung erfolgt nach:

Über das harmonische Mittel lĂ€sst sich dann die mittlere Geschwindigkeit eines Fahrzeugs ausdrĂŒcken, das von A nach B fĂ€hrt und fĂŒr verschiedene Streckenabschnitte bestimmte Zeiten benötigt. Folgendes Beispiel zeigt die Berechnung des harmonischen Mittelwertes:

Strecke

LĂ€nge km

km/h

1

25

80

2

20

70

3

30

90

4

40

100

AB

115

 

Die Durchschnittsgeschwindigkeit fĂŒr die Strecke von Punkt A nach Punkt B betrĂ€gt 86,4 km/h.

Mittelwert, Schwerpunkteigenschaft:

FĂŒr den arithmetischen Mittelwert gilt:

D. h., die Summe der Abweichung zwischen xi und ist Null. Diese Eigenschaft der Einzelwerte (Beobachtungen) wird als Schwerpunkteigenschaft interpretiert. Siehe auch hierzu Standardabweichung. Die Idee, die zur Standardabweichung fĂŒhrt, ist nun, die Summe der Abweichungen der Merkmalswerte vom Mittelwert als Streuungsmaß zu verwenden. Aufgrund der Schwerpunkteigenschaft (es mĂŒssen negative wie positive Differenzen vorliegen), wird die Differenz quadriert und somit erhalten alle Abweichungen ein positives Vorzeichen und können summiert werden. Je grĂ¶ĂŸer diese Summe ist, desto grĂ¶ĂŸer ist die Varianz.
Durch die Quadrierung der Abweichung von reagiert die Standardabweichung (Varianz) allerdings empfindlich auf Extremwerte.

Mittelwert-t-Test:

Mit diesem Test wird die Frage beantwortet, ob 2 Mittelwerte aus Datenreihen vom Umfang n1 und n2 unterschiedlich sind. D. h., entstammen beide Mittelwerte einer Grundgesamtheit oder nicht? Mehr dazu hier...!

Modus:

Der Modus xmod ist ein Lagemaß und zeigt die AusprĂ€gung (Merkmalswert, Klasse) mit der grĂ¶ĂŸten HĂ€ufigkeit. Er ist eindeutig, wenn die HĂ€ufigkeitsverteilung ein eindeutiges Maximum besitzt. In einem Histogramm (Stab- oder SĂ€ulendiagramm) ist er die höchste SĂ€ule, die Klasse mit der höchsten HĂ€ufigkeit. Besitzt die AusprĂ€gung mindestens ordinales Skalenniveau, kann die HĂ€ufigkeitsverteilung auch mehrere voneinander getrennte Maxima besitzen.

Moment siehe Potenzmomente

Multidimensionale Skalierung siehe hier oder Multivariate Analysenmethoden

Multiple lineare Regression siehe hier...!

Multivariate Daten:

n-dimensionale Daten, d. h. Daten, die aus Beobachtungen von n Merkmale bestehen (siehe auch univariate Daten).

Eine Übersicht ĂŒber Multivariate Analysemethoden wird hier gegeben.

N

ZurĂŒck...

Nachweisgrenze: (auch Bestimmungsgrenze)

Die Nachweisgrenze stellt den unteren Bereich des Arbeitsbereiches einer PrĂŒfmethode dar (siehe auch Blindwert).
Im einfachsten Fall wird von der Regel ausgegangen, dass der Merkmalswert folgende Eigenschaft hat:

xi >= 3 sx

Wenn das PrĂŒfergebnis (Merkmalswert, xi) wie im obigen Beispiel, 3 mal grĂ¶ĂŸer ist als die Standardabweichung sx, gilt das Ergebnis als gesichert nachgewiesen.
Liegt eine Kalibrierfunktion vor, wird anstatt sx die Standardwabweichung des Achsenabschnitts sa eingesetzt.

Der Messwert y gilt dann als sicher bestimmt, wenn

y >= a + 3sa

ist.
Bemerkung:
Dies sind sicher einfache Berechnungen und in der Literatur werden entsprechend komplexere dargelegt. Hier liegt der Vorteil in der Einfachheit und der mit 3s verknĂŒpften hohen statistische Sicherheit.

Neuronale Netze siehe Multivariate Analysenmethoden

Normalverteilung:

Eine wichtige Verteilung in der Statistik ist die Normalverteilung. Und oft geht es um die Frage, ob die beobachteten Werte (z. B. Messwerte) einer Normalverteilung folgen oder nicht. Die Normalverteilung ist eine Dichtekurve, die symmetrisch, unimodal und glockenförmig ist. Diese Art von Dichtkurven, werden durch folgende Dichtfunktion beschrieben:

Form und Lage der Dichtekurve wird durch den Mittelwert und der Standardabweichung festgelegt . Der Mittelwert liegt im Zentrum der Verteilung (= Maximum der Verteilung) und die Dichtekurve ist um so schlanker, je kleiner die Standardabweichung ist.

Folgende Grafik zeigt die Normalverteilung in AbhÀngigkeit von der Standardabweichung s:
Sprung zu www.r-statistik.de

Da in obiger Dichtefunktion Mittelwert und Standardabweichung beliebige Werte annehmen können, existieren beliebig viele unterschiedliche Normalverteilungen. Obige Abbildung ist eine Beispiel fĂŒr konstantem Mittelwert und 3 verschiedene Standardabweichungen.
Um Verteilungen besser vergleichen zu können, wird die Normalverteilung standardisiert um zur Standardnormalverteilung zu gelangen:

StandardnormalverteilungSprung zu www.r-statistik.de

Über diese Standardisierung lassen sich dann die wichtigen Quantile berechnen.

Siehe auch Verteilungen!

Normalverteilung siehe Student-Verteilung

Normalverteilung, Abweichung von

Abweichungen von der Normalverteilung lassen sich, neben der unter obigen Link beschriebenen Methoden, sehr schnell visuell abschĂ€tzen. Das kann mittels Histogramm oder ĂŒber einen Quantil-Quantil-Plot (QQ-Plot) geschehen:

Abbildung QQ-PlotSprung zu www.r-statistik.de

Liegen wie im obigen Beispiel-Plot die Beobachtungen (z. B. Messwerte) auf oder ziemlich nahe an der Hilfslinie, kann von einer sehr guten NĂ€herung an die Normalverteilung ausgegangen werden.

Normen:

EN ISO 9000:2000 ff (Systemnorm)

Normierung, siehe Z-Normierung

O

ZurĂŒck...

Odds Ratio siehe hier!

Ordinalzahl ist eine Menge, die den Ordnungstyp einer wohlgeordneten Menge reprÀsentiert (Ordnungszahl, siehe auch Skalen).

Ordinate: Bezeichnung fĂŒr die “vertikale” Koordinate des kartesischen Koordinatensystems (y-Achse).

Ordnungszeichen (Zahlen-), siehe hier!

P

ZurĂŒck...

Panelerhebung:

Eine Panelerhebung ist eine Mehrfacherhebung, die sich auf eine reprĂ€sentative Teilauswahl (Panel) bezieht. Die Datenerhebung wird immer zum selben Untersuchungsgegenstand gemacht. Das heißt, es wird eine Mehrfacherhebung zu den selben Merkmalen zu verschiedenen Zeitpunkten mit der gleichen Teilauswahl (d. h. die selben Teilnehmer) durchgefĂŒhrt.

Der Zweck der Panelerhebung ist, durch die periodische Erhebungen zeitliche VerĂ€nderungen sichtbar zu machen. Diese Methode stellt eine Zeitreihenuntersuchung auf Individualebene dar. Dadurch werden LĂ€ngsschnittdaten erhalten, die als Grundlage fĂŒr Prognosen zur Marktbeurteilung herangezogen werden können (Handel- / Verbraucherpanels).
Bei Panelerhebungen kommt den Teilnehmern eine besondere Bedeutung zu. Die Bedeutung fĂ€ngt mit der Gewinnung der Teilnehmer, deren Ersatz bei Teilnehmerausfall und Ende noch nicht mit der Aufrechterhaltung der Teilnahmemotivation. Über einen langen Erhebungszeitraum kann es zu systematischen Verzerrungen kommen, welche dann besonders deutlich werden, wenn ausgefallene Teilnehmer durch neue ersetzt werden. Hier wird auch von PanelmortalitĂ€t gesprochen. Auch kann es passieren, dass die Teilnehmer ihre Einstellung zum Untersuchungsobjekt Ă€ndern (Paneleffekte!)

Pareto-Anaylse:

Die Pareto-Analyse, dargestellt als Pareto-Diagramm, trennt das wenige Wichtige von dem vernachlĂ€ssigbar Vielem. Synonym wird die Pareto-Analyse auch als ABC-Analyse bezeichnet, weil EinflussgrĂ¶ĂŸen in Gruppen klassiert und in diesen kumuliert werden. Die wichtigsten Gruppen (A, B, C) reprĂ€sentieren oft einen betrĂ€chtlichen Anteil des Einflusses. Die folgende Abbildung zeigt ein beispielhaftes Pareto-Diagramm als Ergebnis einer Pareto-Analyse.

Gruppe

Einfluss

A

50

B

20

C

10

D

3

E

3

F

2

G

2

Beispieldaten

Um ĂŒber eine Pareto-Analyse ein Pareto-Diagramm zu erhalten, mĂŒssen Sie

  • dass zu untersuchende Problem (Merkmal) festlegen,
  • die nötigen Daten erfassen,
  • die nötigen Kategorien festlegen, die Daten kategorisieren und kumulieren,
  • die Kategorien nach HĂ€ufigkeit in absteigender Reihenfolge, wie in Abb. gezeigt, graphisch darstellen.

Benötigen Sie eine Kategorie „Sonstiges“ als Sammelkategorie, steht sie in der Grafik unabhĂ€ngig von ihrer GrĂ¶ĂŸe, ganz rechts im Diagramm. Verlieren Sie aber nicht die GrĂ¶ĂŸe dieser Kategorie aus den Augen! Ab einem gewissen Anteil sollten Sie ĂŒber eine weitere AufschlĂŒsselung nach denken.
Das Pareto-Prinzip steht fĂŒr die 80/20-Regel. Diese besagt, das etwa 80 % der Beeinflussung (der Probleme) durch nur 20 % der beteiligten Faktoren hervorgerufen wird.

Poisson-Verteilung

Population: siehe Grundgesamtheit

Potenzmomente:

Potenzmomente beschreiben die Abweichung von der Normalverteilung.

PrÀzision (precision):

Ist die Bezeichnung fĂŒr das Ausmaß der gegenseitigen AnnĂ€herung voneinander unabhĂ€ngiger Merkmalsergebnisse bei mehrfacher Anwendung einer festgelegten PrĂŒfmethode.

Die PrÀzision beschreibt den zufÀlligen Fehler (zufÀllige Abweichung, Varianz).

Es wird unterschieden zwischen WiederholprÀzision und der VergleichsprÀzision.

PrimÀr- und SekundÀrstatistik:

Wurden die Daten fĂŒr eine Untersuchung auf Basis von Erhebungen gesammelt, wird von PrimĂ€rstatistiken (Field Research) gesprochen. Dabei werden folgende Beobachtungsarten unterschieden:

        • Beobachtung
          Das zu untersuchende Objekt wird nicht oder nur unwesentlich durch diese Art der Datensammlung beeinflusst. Es verbleibt sozusagen in seiner Umgebung. Eine unwesentliche Einflussnahme stellt das Nehmen einer Stichprobe dar.
           
        • Experiment
          Bei einem Experiment nimmt das zu untersuchende Objekt teil. Z. B. in der Medizin, wenn die Wirksamkeit eines neuen Medikamentes erprobt wird. Bei der Planung eines Experimentes können diverse Faktoren, in der Medizin z. B. das Alter des Probanden, berĂŒcksichtigt werden. Dadurch besteht ein gewisses Maß an Kontrolle.
           
        • Befragung
          Bei dieser Beobachtungsart, wird das Objekt, in diesem Falle Sie und ich, mit sorgfĂ€ltig formulierten Fragen befragt. Die Fragen mĂŒssen so formuliert werden, dass keine oder geringe Verzerrung (Bias) auftreten kann. Die Fragenformulierung gestaltet sich dementsprechend aufwĂ€ndig.

Von SekundĂ€rstatistiken wird gesprochen, wenn diese Daten nicht zum Zwecke einer statistischen Untersuchung erhoben wurden, sondern z. B. in der behördlichen Verwaltung oder durch eine wirtschaftliche TĂ€tigkeit angefallen sind. Vertraute Beispiele dĂŒrften die Kfz-Zulassungszahlen bezogen auf die Automarken oder im Rahmen einer wirtschaftlichen TĂ€tigkeit, die Rohölpreisentwicklung. Die Daten zur Untersuchung sind also schon vorhanden.

Primzahl:

Eine Primzahl p ist eine natĂŒrliche Zahl (p > 1), die nur durch sich selbst und durch Eins ohne Rest teilbar ist. Z. B.

p = 2,3,5,7,11,13,17,19,...

Probenahme, Begriffe zur :

Grafische Darstellung der Begriffe zur Probenahme

Los (lot): Menge eines Produkts, das unter Bedingungen entstanden ist, die als einheitlich angesehen werden können. Bei dem Produkt kann es sich beispielsweise um Rohmaterial, um Halbzeug, oder um ein Endprodukt handeln. Unter welchen UmstĂ€nden die Bedingungen als einheitlich angesehen werden können, lĂ€sst sich nicht allgemein angeben. Es kann ein Wechsel des eingesetzten Materials, des Werkzeugs oder eine Unterbrechung des Herstellvorgangs zu anderen Bedingungen fĂŒhren. FĂŒr den Begriff Los wird in bestimmten Branchen auch synonym “ Charge” oder “Partie” verwendet.

Losumfang (lot size): Anzahl der Einheiten im Los (z. B. 10000 Schrauben oder 5000kg einer chemischen Substanz).

PrĂŒflos (inspection lot): Los, das als zu beutreilende Gesamtheit einer QualitĂ€tsprĂŒfung unterzogen wird.

Probe, Stichprobe (sample): Eine oder mehrere Einheiten, die aus der Grundgesamtheit (z. B. einer Charge oder Lieferung) oder aus Teilgesamtheiten entnommen werden.

Stichprobenumfang (sample size): Anzahl der Einheiten in der Stichprobe.

Einzelprobe (increment): Durch einmalige Entnahme aus einem Massengut entnommene Probe.

Sammelprobe (bulk sample, gross sample): Probe, die durch Zusammenfassung von Einzelproben oder Teilproben ensteht.

Teilprobe (divided sample): Probe, die durch ein Probeteilungsverfahren aus Einzel- oder Sammelproben gewonnen wird.

Laboratoriumsprobe (laboratory sample): Probe, die als Ausgangsmaterial fĂŒr die Untersuchung im Laboratorium dient (siehe Messprobe).

Probennahme, Stichprobennahme (sampling): Entnahme einer Probe nach festgelegten Verfahren.

Produktmenge, kartesische -

ProximitÀt:

ProximitĂ€t ist ein Begriff aus der Distanzanalyse (z. B. Multidimensionale Skalierung, Clusteranalyse) und beschreibt Ähnlichkeits- bzw. UnĂ€hnlichkeitskoeffizienten.

ProzessfÀhigkeit:

Was ist ein fÀhiger Prozess und wie wird dieser beschrieben? Siehe hier...!

PrĂŒfmethode, -verfahren, -anweisung (inspection instruction):

Beschreibt die DurchfĂŒhrung zur Ermittlung der Merkmalswerte fĂŒr PrĂŒfmerkmale. Liegt eine PrĂŒfspezifikation vor, ist sie die Grundlage fĂŒr die PrĂŒfmethode.

PrĂŒfspezifikation (inspection specification):

Festlegung der PrĂŒfmerkmale fĂŒr die QualitĂ€tsprĂŒfung und gegebenenfalls der vorgegebenen Merkmalswerte sowie erforderlichenfalls der PrĂŒfverfahren (-methode).

p-value (p-Wert):

Hypothesenentscheidung auf Basis des p-values in der Anwendung von Statistikprogrammen wie z. B. R siehe hier...!

Q

ZurĂŒck...

QQ-Plot siehe hier!

QualitÀt (quality):

Ist die Gesamheit der Merkmale und Merkmalswerte, bzw. deren AusprĂ€gung, eines Objektes (z. B. Produkt, Dienstleistung) bezĂŒglich seiner Eignung, festgelegte und vorausgesetzte Erfordernisse zu erfĂŒllen (nach DIN 58936 Teil 1)

QualitÀtsmerkmal (quality characteristic):

Ist ein Merkmal, das die QualitÀt eines Objektes beschreibt. Es ist damit ein Element der Gesamtheit aller die QualitÀt eines Objektes charakterisierender Kennzeichen und Eigenschaften (nach DIN 58936 Teil 1).

QualitĂ€tsprĂŒf-Zertifikat:

Bescheinigung ĂŒber das Ergebnis einer QualitĂ€tsprĂŒfung, das gegenĂŒber dem Abnehmer oder Auftraggeber als Nachweis ĂŒber die QualitĂ€t eines Produkts dient. Ein Zertifikat enthĂ€lt Angaben ĂŒber:

  • Aussteller des QualitĂ€tsprĂŒf-Zertifikats/Datum
  • Hersteller/Auftragnehmer (Lieferer)
  • Abnehmer/Auftraggeber/Besteller/Betreiber
  • Auftrags-/Bestell-Nummer
  • Liefergegenstand, StĂŒckzahl usw.
  • QualitĂ€tsforderungen
  • PrĂŒfspezifikationen
  • Art des QualitĂ€tsprĂŒf-Zertifikats, z. B. “Herstellerzertifikat M nach DIN 55 350 Teil 18”
  • gegebenenfalls spezielle QualitĂ€tsmerkmale
  • PrĂŒfergebnisse

QualitÀtssicherung (quality assurance):

Ist die Gesamtheit der TĂ€tigkeiten des QualitĂ€tsmanagements, der QualitĂ€tsplanung, der QualitĂ€tslenkung und der QualitĂ€tsprĂŒfung. QualitĂ€tssicherung ist als integrierter Prozess in der Wertschöpfungskette zu verstehen.

QualitĂ€tsmanagement ist der Aspekt des Gesamtmanagements, der die QualitĂ€tspolitik festlegt und zur AusfĂŒhrung bringt (siehe QM-System).

QualitĂ€tsplanung bedeutet auswĂ€hlen, klassifizieren und gewichten der QualitĂ€tsmerkmale und konkretisieren der QualitĂ€tsanforderung unter BerĂŒcksichtigung von Anspruch und Realisierungsmöglichkeiten.

QualitĂ€tslenkung bedeutet, Überwachung der QualitĂ€tsmerkmale im Hinblick auf die gegebenen Forderungen sowie gegebenenfalls Korrekturmaßnahmen.

QualitĂ€tsprĂŒfung bedeutet festzustellen, inwieweit das Objekt die QualitĂ€tsforderung erfĂŒllt.

(Nach DIN 55350 Teil 11 und DIN 58936 Teil 1)

QualitÀtssicherungssystem (quality control system):

Ein QualitĂ€tssicherungssystem beschreibt die festgelegte Organisation zur DurchfĂŒhrung der QualitĂ€tssicherung.

Quantile, Quartile:

Ein Quantil oder Quartil ist ein Lokalisationsmaß einer stetigen Verteilung, bei dem die Wahrscheinlichkeit p fĂŒr einen Wert <= p oder => 1-p ist.
Der Median ist das 50%-Quantil, d. h., hier sind 50% der Werte <= dem Median und 50% der Werte => dem Median.
Im Zusammenhang mit dem Median werden, wenn die Anzahl n der Werte >= 20 ist, oft die Quantile Q1, Q2 = Median und Q3 angegeben:

Quantil

Berechnung

Beispiel mit n = 20

Q1
oder auch x0,25

p = 0,25 (25%) mit n+1 gerundet

21 * 0,25 = 5,25
Q1 liegt an der Stelle des 5. Wertes.

Q2 (Median)

 

 

Q3
oder auch x0,75

p = 0,75 (75%) mit n+1 gerundet

21 * 0,75 = 15,75
Q3 liegt an der Stelle des 16. Wertes

Ist die Verteilung annÀhernd symmetrisch zum Median, sind Q1 und Q3 gleich weit vom Median entfernt. Siehe auch QQ-Plot!

R

ZurĂŒck...

Rangkorrelationskoeffizient , siehe hier!

Ratingverfahren (Likert-Skala (nach Renisis Likert)):

Verfahen zur Erhebung von Ähnlichkeitsurteilen, siehe MDS (Multidimensionale Skalierung).

Rechnen mit fehlerbehafteten Zahlen, Fehlerfortpflanzung:

Um den Fehlerbereich fĂŒr fehlerbehaftete Zahlen bei Anwendung der vier Grundrechenarten auftritt abzuschĂ€tzen, werden zwei parallele Rechnungen durchgefĂŒhrt. Eine mit der unteren Fehlerschranke und eine mit der oberen Fehlerschranke. An folgenden Beispieldaten, wird die Auswirkung der Fehlerfortplanung gezeigt:

          50 +- 3     (Wertebereich von 47 bis 53)
          40 +- 2     (Wertebereich von 38 bis 42)

Addition:

    Die Summe beider Zahlen liegt zwischen

          • 47 + 38 = 85
            und
          • 53 + 42 = 95.

    Der relative Fehler der Summe betrÀgt

      (95 - 85) / (95 + 85) = 10 / 180 = 0,0556 = 5,56 %.

Subtraktion:

    Die Differenz wird ĂŒberkreuz ermittelt:

          • 47 - 42 = 5
          • 53 - 38 = 15

    Der relative Fehler der Differenz betrÀgt

      (15 - 5) / (15 + 5) = 10 / 20 = 0,5 = 50 %.

Multiplikation:

    Das Produkt liegt in den Grenzen von

          • 47 * 38 = 1786
            und
          • 53 * 42 = 2226.

    Der relative Fehler des Produktes liegt bei

      (1786 - 50 * 40) / 50 * 40 = (1786 - 2000) /2000 = -0,107 = - 11,7 %
      und
      (2226 - 50 * 40) / 50 * 40 = (2226 - 2000) / 2000 = 0,113 = 11,3 %.

Division:

    Die Quotienten betragen (ĂŒberkreuz)

            • 47 / 42 = 1,1191
              und
            • 53 / 38 = 1,3947.

    Der relatve Fehler betrÀgt dann

      (1,1191 - 50 / 40) / (50 / 40) = (1,1191 - 1,25) / 1,25 = -0,105 = -10,5 %
      und
      (1,3947 - 50 / 40) / (50 / 40) = (1,3947 - 1,25) / 1,25 = 0,116 = 11,6 %.

Aus diesen Beispielen ist leicht ersichtlich, dass das Rechnen mit fehlerbehafteten Zahlen bezĂŒglich der Subtraktion besonders kritisch zu betrachten ist.

Referenzmaterial (reference material):

Ein Referenzmaterial ist eine Substanz, deren Eigenschaft / Eigenschaften so genau festgelegt oder bekannt sind, dass sie zur Kalibrierung von MessgerĂ€ten und Kontrolle der PrĂŒfmethode verwendet werden kann.

Regelkarte:

QualitÀtsregelkarten sind Werkzeuge zur statistischen Prozesskontrolle, mehr dazu hier...!

Regression, logistische siehe Multivariate Analysenmethoden

Regressionsanalyse siehe Korrelations- und Regressionsanalyse oder Multivariate Analysenmethoden

Regressionsbaum siehe hier!

Relationen:

Durch Relationen (relationale Operatoren) werden Beziehungen zwischen Zahlen dargestellt:

Relatives Risiko siehe hier!

ReliabilitÀt:

ReliabilitĂ€t bedeutet, dass die Beobachtungen (Daten) zuverlĂ€ssig ermittelt werden. ZuverlĂ€ssig bedeutet, die Daten mit einer möglichst hohen GĂŒte und Genauigkeit zu bestimmen.  D. h, es mĂŒssen Bedingungen vorliegen oder geschaffen werden, die Beobachtungsdaten mit einem möglichst kleinen Fehler bestimmt werden können.

ValiditÀt und ReliabilitÀt stehen in einer engen Beziehung. Wird eines von beiden vernachlÀssigt, können die gesamten Beobachtungen wertlos sein.

Residuen:

Als Residuen e wird die Abweichnung zwischen der ZielgrĂ¶ĂŸe y (Vorgabe einer Kalibrierung) und dem berechneten Wert der ZeilgrĂ¶ĂŸe yo = a + bx, bezeichnet:

ei = yi - yoi

Mit ihrer Hilfe können Aussagen ĂŒber die Korrektheit des linearen Modells gemacht werden (siehe Korrelation). Ist das Modell korrekt, mĂŒssen sich die Werte von ei im gesamten Bereich von yoi ohne erkennbare Struktur um 0 sammeln.

Richtiger Wert (conventional true value):

Wert fĂŒr Vergleichszwecke, dessen Abweichung vom wahren Wert fĂŒr den Vergleichszweck als vernachlĂ€ssigbar betrachtet wird.

Richtigkeit (trueness, accuracy of the mean):

Die Richtigkeit ist eine Bezeichnung fĂŒr das Ausmaß der AnnĂ€herung des Mittelwertes der Merkmalergebnisse an den Bezugswert, wobei dieser je nach Festlegung oder Vereinbarung der richtige oder ein festgelegter Wert sein kann.

Die Richtigkeit beschreibt den systematischen Fehler (systematische Abweichung).

RPZ, RisikoprioritÀtszahl:

Maßzahl einer FMEA, Fehlermöglichkeits- und Einflussanlayse (Failure Mode and Effects Analysis), mehr dazu hier!

S

ZurĂŒck...

SchÀtzen:

  • PunktschĂ€tzung:
    Eine PunktschĂ€tzung ist das SchĂ€tzen eines Wertes fĂŒr einen unbekannten Parameter auf Basis der vorliegenden Verteilung ĂŒber eine Stichprobe. Der SchĂ€tzwert ist ist das Ergebnis (die Realisierung) dieser PunktschĂ€tzung des unbekannten Parameters. Es ist unbekannt, wie gut der SchĂ€tzwert dem wahren Parameter nahe kommt. Siehe hierzu auch das Gesetz der Großen Zahlen. Zur AbschĂ€tzung der Abweichung vom wahren Wert, wird die PunktschĂ€tzung durch die IntervallschĂ€tzung ergĂ€nzt.
    Einfache Beispiele der PunktschÀtzung ist die Berechnung des Mittelwertes (SchÀtzfunktion) und der Standardabweichung.
     
  • IntervallschĂ€tzung:
    In dem durch die IntervallschĂ€tzung geschĂ€tztem Intervall, soll der Parameter der PunktschĂ€tzung (der SchĂ€tzwert) mit einer bestimmten Vertrauenswahrscheinlichkeit enthalten sein. Dieses Intervall heißt Konfidenzintervall oder Vertrauensbereich. Ein Beispiel ist die SchĂ€tzung des Vertrauensbereich um den Mittelwert.
     

GewĂŒnschte Eigenschaften einer SchĂ€tzfunktion:

      • Erwartungstreue -> möglichst geringer systematischer Fehler
      • Effizienz -> möglichst geringe Varianz, auch bei kleinem Stichprobenumfang
      • Konsistent -> mit wachsendem Stichprobenumfang dem wahren unbekannten Parameter entgegen streben (konvergieren)
      • Suffizienz, Robust -> alle Informationen der Stichprobe nutzen und robust gegenĂŒber Abweichungen (vom angenommenen Modell)

Schiefe:

Siehe Abweichung von der Normalverteilung.

Schlussregeln (mathematische -):

Eine Schlussregel ist eine Aussagelogik wie “Wenn a eine hinreichende Bedingung fĂŒr b ist und a wahr ist, dann ist auch b wahr!”

Schwerpunkteigenschaft des Mittelwerts

Shapiro-Wilk-Test:

Mit dem Shapiro-Wilk-Test wird die Hypothese geprĂŒft, ob die Beobachtungen X normalverteilt sind. Dazu wird die Verteilung des Quotienten aus zwei SchĂ€tzungen der Varianz s2 betrachtet: das Quadrat einer kleinsten FehlerquadratschĂ€tzung fĂŒr die Steigung der Regressionsgraden im QQ-Plot und die Stichprobenvarianz. Liegt Normalverteilung vor, sollten beide SchĂ€tzung nahe zusammenliegen und der Quotient W sollte 1 oder nahe bei 1 liegen.

ai ist eine vom Stichprobenumfang abhĂ€ngige Konstante und kann entsprechenden Tabellen entnommen werden. Hier wird allerdings der Test unter Nutzung von R durchgefĂŒhrt. Im folgenden Beispiel werden 100 normalverteilte Werte um den Mittwelwert 100, mit einer Standardaabweichung s = 0,5, erzeugt. Anschließend wird der Test ĂŒber die Funktion shapiro.test() durchgefĂŒhrt:

    x <- rnorm(100 , 100, 0.5)
    > shapiro.test(x)

        Shapiro-Wilk normality test

    data: x
    W = 0.9904, p-value = 0.6942

Der Quotient W liegt nahe bei 1 und der p-Wert (p-value) als Wahrscheinlichkeitaussage zum Zutreffen der Hypothese ist genĂŒgend groß. Weicht W deutlich von 1 ab und geht der p-Wert deutlich in Richtung 0 (z. B. < 0,05) ist von einer Abweichung von der Normalverteilung auszugehen.

Signifikanzniveau: siehe Wahrscheinlichkeit

Six Sigma, ein methodisches Vorgehen zur Prozessverbesserung, siehe hier...!

Skalen:

Spannweite (range) R:

Ist die Differenz aus dem grĂ¶ĂŸten und dem kleinsten Merkmalswert: R = xmax - xmin

Spearman, Rangkorrelationskoeffizient nach ...

Splines, Regressionanalyse ĂŒber die flexible Modellierung mit ...

Standardabweichung: siehe Statistik-Basis

Statistik, Die drei Bereiche der -:

Einen kleinen Überblick ĂŒber die drei Statistikbereiche soll folgende Grafik geben:

Sprung zur deskriptiven StatiskSprung zur induktiven StatiskSprung zur deskriptiven StatiskSprung zur explorativen StatiskSprung zur induktiven StatiskSprung zur explorativen Statisk

Statistische ProzessĂŒberwachung (statistical process control, SPC):

Sie ist der Teil der QualitÀtskontrolle / -lenkung, bei der statistische Verfahren zur Planung und Aus-/Bewertung eingesetzt werden (nach DIN 58936 Teil1, siehe auch ProzessfÀhigkeit und Regelkarten!).
NatĂŒrlich ist die statistische Prozesskontrolle, wie hĂ€ufig angenommen, nicht nur ein QualitĂ€tsmanagementwerkzeug fĂŒr den Produktionsbereich, sondern kann und sollte auf alle GeschĂ€ftsprozesse angewendet werden. Folgende PrĂ€sentation kann zur Motivation dienen: Statistical Quality Control SPC (OpenOffice - animiert) / Statistical Quality Control SPC (PDF)

Sterbetafel:

Zur Sterbetafel im Rahmen der Weibullverteilung geht es hier....!

Stichprobe: siehe Probennahme

Stichprobenraum: siehe Ergebnisraum

Strukturgleichungsmodelle siehe Multivariate Analysenmethoden

Stochastik: Teilgebiet der Mathematik, das sich mit zufÀlligen Ereignissen befasst (Wahrscheinlichkeitsrechnung).

Student-Verteilung, t-Verteilung (Tabelle der t-Verteilung)

SummenhÀufigkeit, kumulierte HÀufigkeit:

Über ein Histogramm können Sie einen visuellen Eindruck ĂŒber die Verteilung Ihrer Beobachtungen gewinnen (siehe auch Skalen). Möchten Sie hingegen wissen, wie viele Beobachtungen unterhalb oder einschließlich einer bestimmten Grenze (Klasse) liegen, hilft die kumulierte HĂ€ufigkeit weiter. Zur Bildung der kumulierten HĂ€ufigkeiten werden die Beobachtungen beginnend mit der kleinsten AusprĂ€gung in aufsteigender Reihenfolge aufaddiert (kumuliert).

Die folgende Tabelle zeigt ein Beispiel:

 

Beobachtungen ni

n =

1

2

3

4

5

6

7

8

9

10

Beobachtungen

2

5

6

11

12

5

8

4

2

1

Kumul. Beob.

2

7

13

24

36

41

49

53

55

56

Die kumulierte Summe fĂŒr n = 4 setzte sich zusammen aus der Summe = n1+n2+n3+n4 = 2+5+6+11 = 24. D. h., bis einschließlich n4 liegen 24 Beobachtungen vor!

Formaler lĂ€sst sich das als SummenhĂ€ufigkeits-Funktion ausdrĂŒcken:

Grafisch lÀsst sich obige Tabelle wie rechts gezeigt darstellen.

Die Grafik wurde mit dem Statistikprogramm R erstellt. Wenn Sie es nachstellen möchten, hier ein paar Zeilen R-Code:

> HĂ€ufigkeit <- c(2,5,6,11,12,5,8,4,2,1)
> HĂ€ufigkeit_kumuliert <- cumsum(HĂ€ufigkeit)
> HĂ€ufigkeit_kumuliert
 [1] 2 7 13 24 36 41 49 53 55 56
> plot(cumsum(HĂ€ufigkeit), type = "s", tck = 1, lwd = 3, main = "Kumulierte HĂ€ufigkeit", xlab = "Beobachtung n", ylab = "Kumulierte HĂ€ufigkeit")

www.r-statistik.de

Systematische Abweichung (systematic deviation, systematic error):

Siehe Richtigkeit.

Systematische Abweichungen weisen bei definierter Vorgehensweise (z. B. gleiche PrĂŒf- methode) gleiches Ausmaß und Vorzeichen auf. Bei quantitativen Merkmalswerten ist die systematische Abweichung, unter BerĂŒcksichtigung der vorangemachten Ausage, gleich der Differenz aus Erwartungswert und richtigem bzw. wahrem Wert.

 

T

ZurĂŒck...

Test:

  • Parametrischer Test:
    Bei dieser Gruppe von Tests ist das Vorliegen und Bekanntsein einer bestimmten Verteilung Voraussetzung. Als Beispiele seien hier der t-Test, der Shapiro-Wilk-Test oder auch die AusfĂŒhrungen unter SchĂ€tzen genannt. Die AusprĂ€gung der Beobachtung muss kardinalskaliert sein.
     
  • Nichtparametrischer Test:
    Bei diesen Tests wird keine Annahme ĂŒber die genaue Form der Verteilung gemacht. Deswegen werden diese Tests auch verteilungsunabhĂ€ngige oder verteilungsfreie Tests genannt. Diese Tests sind an weniger Voraussetzungen - z. B. der Normalverteilung - gebunden. Damit sind die Aussagen nur unter bestimmten Voraussetzungen gĂŒltig und mĂŒssen fĂŒr jeden Test entsprechend belegt werden. Die AusprĂ€gung der Beobachtung ist von einem niedrigen Skalenniveau als kardinalskaliert.

Theorem (= Lehrsatz):

Ein Theorem ist ein allgemeiner Lehrsatz, ein Bestandteil einer wissenschaftlichen Theorie oder Lehrmeinung: “Der erklĂ€rende Satz einer Aussage / eines Systems”

Theorem = Lehrsatz = Satz

Ein Satz muss mit den Axiomen der Theorie mit den Schlussregeln der Theorie bewiesen werden.

Term:

Ein Term ist ein sinnvoller Ausdruck, der Zahlen, Variablen, Symbole (auch mathematische VerknĂŒpfungen) enthalten kann:

f(x) = a + bx

                  a:  konstanter Term
                  bx: linearer Term

Umgangssprachlich: Ein Term ist das, was Bedeutung trÀgt!

Test, Das Prinzip des -

Welchem Prinzip ein statistischer Test folgen sollte, finden Sie hier!

Toleranz (tolerance): Höchstwert minus Mindestwert und auch obere Grenzabweichung minus untere Grenzabweichung.

Toleranzbereich (tolerance zone): Bereich zugelassener Werte zwischen Mindestwert und Höchstwert.

Trendtest siehe hier!

t-Test fĂŒr

... Differenzen siehe hier!

... Sollwerte siehe hier!

... den Korrelationskoeffizient:

Über den t-Test zur PrĂŒfung der Korrelationskoeffizienten kann geprĂŒft werden, ob ein statistisch signifikanter Zusammenhang zwischen den AusprĂ€gungen (Realisierungen) xi und yi der Merkmale X und Y besteht. Weiteres finden Sie hier!

Tupel, n-Tupel siehe hier!

t-Verteilung siehe Student-Verteilung

U

ZurĂŒck...

UnabhÀngige identische Wiederholung:

NĂ€heres finden Sie hier!

Univariate Daten:

Eindimensionale Daten, d. h. Daten, die aus Beobachtungen eines einzelnen Merkmals bestehen (siehe auch multivariate Daten).

Ursache-Wirkungs-Diagramm: (FischgrÀten- oder Ishikawa-Diagramm, K.Ishikawa 1915-1989)

Durch ein Ursache-Wirkungs-Diagramm kann die Suche nach Fehlerursachen in einem Prozessablauf erleichtert werden. Es ist möglich, auf Basis dieses Diagramms auch komplexe ZusammenhÀnge zu visualisieren und dadurch zu analysieren. Dabei wird wie im folgenden Bild gezeigt, von den Ursachen, z. B. den 5 M`s, auf das Ereignis (Problem) geschlossen:

V

ZurĂŒck...

ValiditÀt:

ValiditĂ€t bedeutet einfach ausgedrĂŒckt, die Daten zu messen (beobachten), die Gegenstand der Untersuchung sind. Wenn der Beobachter an der KörpergrĂ¶ĂŸe des Menschen interessiert ist, soll sie von den FĂŒĂŸen bis einschließlich des Kopfes gemessen und nicht der Bauchumfang bestimmt werden.
Ist das direkte Bobachten (Messen) der gewĂŒnschten Eigenschaft nicht möglich, kommt möglicherweise eine HilfsgrĂ¶ĂŸe (Proxy-Variable) in Betracht. Das Bruttoinlandsprodukt ist ein Beispiel fĂŒr eine Proxy-Variable, denn an welcher einzelnen Eigenschaft soll der Wohlstand eines Volkes festgemacht werden?

ValiditÀt und ReliabilitÀt stehen in einer engen Beziehung. Wird eines von beiden vernachlÀssigt, können die gesamten Beobachtungen wertlos sein.

Varianz: siehe Statistik-Basis

Varianzanalyse siehe Multivariate Analysenmethoden

Variationskoeffizient siehe hier!

Vergleichsbedingungen:

Bei der Gewinnung von unabhĂ€ngigen Merkmalswerte gelten folgende Bedingungen: festgelegte PrĂŒfmethode, identisches Objekt (Material), verschiedene PrĂŒfer (Beobachter), eventuell verschiedener PrĂŒfausstattung (GerĂ€te) und verschiedene Orte (Labors).

VergleichsprÀzision (reproducibility):

Die VergleichsprĂ€zision ist die Bezeichnung fĂŒr das Ausmaß der gegenseitigen AnnĂ€herung der Merkmalswerte unter Vergleichsbedingungen.

VerknĂŒpfungen, logische -, siehe hier!

Verteilungen, Gipfeligkeiten von:

Folgende Grafik zeigt mögliche HÀufigkeitsverteilungen und deren Bezeichnungen:

Verteilung, Zur Chi2-Verteilung- (Chi2-)

Verteilung, Binomial-

Verteilung, geometrische

Verteilung, hypergeometrische

Verteilung, Normal-, Student- (t-)

Verteilung, Poisson-

Verteilung, Weibull-

Vertrauensbereich, Konfidenzbereich (confidence interval):

Unter Vertrauensbereich wird ein aus Stichprobenwerten berechnetes, d. h. in der Lage und Breite zufĂ€lliges Intervall, das den wahren aber unbekannten Parameter mit einer vorgegebenen Wahrscheinlichkeit, der Vertrauenswahrscheinlichkeit, ĂŒberdeckt (einschließt), verstanden. Die Grenzen des Intervalls werden Vertrauensgrenzen (confidence limits) genannt.

Siehe Berechnung Vertrauensbereich fĂŒr den Mittelwert

Verzerrung siehe Bias

Vorzeichenregel siehe hier!

W

ZurĂŒck...

Wahrer Wert (true value):

TatsÀchlicher Merkmalswert; ist in der Regel aber nur ein ideeller Wert, weil er sich praktisch nicht ermitteln lÀsst. Es können i. d. R. zu dessen Ermittlung nicht alle Faktoren, die zur Ergebnisabweichung beitragen, vermieden werden (nach DIN 55350 Teil12).

Wahrscheinlichkeit:

Die Wahrscheinlichkeitsverteilung einer Zufallsvariablen gibt an, mit welcher Wahrscheinlichkeit die Werte der Zufallsvariablen angenommen werden. Diese Wahrscheinlichkeitsverteilung wird durch die Verteilungsfunktion eindeutig definiert:

F(x) = P(X <= x)

F(x) gibt die Wahrscheinlichkeit an, dass die Zufallsvariable X einen Wert kleiner oder gleich x annimmt. Nimmt die Zufallsvariable x diskrete Werte an, wird von einer Wahrscheinlichkeitsfunktion (probability function, frequency function) gesprochen. Die Verteilungsfunktion wird durch Aufsummieren der Wahrscheinlichkeiten

ermittelt. FĂŒr stetige Zufallsvariablen wird die Verteilungsfunktion durch Integration ĂŒber die Wahrscheinlichkeitsdichte berechnet:

Wahrscheinlichkeit: Mit welcher Wahrscheinlichkeit tritt ein Ereignis aus der Anzahl möglichen Ereignisse ein?
Der Wahrscheinlichkeitsbegriff kann in eine objektive und subjektive Wahrscheinlichkeit separiert werden:

    • Objektiv: Die Wahrscheinlichkeit mit einem WĂŒrfel eine 6 zu werfen, betrĂ€gt 1:6.
    • Subjektiv: Wahrscheinlich werde ich heute Abend ins Kino gehen!

Im ersten Beispiel ist der objektive Charakter deutlich erkennbar und im zweiten Beispiel, der subjektive durch die “Alltagsaussage /-annahme” ebenfalls.

Wahrscheinlichkeit: Vertrauens- und Irrtumwahrscheinlichkeit

Wahrscheinlichkeiten:

  • A-priori-Wahrscheinlichkeit:
    Wird eine Wahrscheinlichkeit P auf logischem Wege ermittelt, wird von einer A-priori-Wahrscheinlichkeit gesprochen (theoretische Wahrscheinlichkeit). Nehmen wir als Beispiel den Wurf einer MĂŒnze. Wir gehen von der Voraussetzung aus, dass beide Seiten (Kopf/Wappen und Zahl) gleichwertig sind, d. h., keine Seite wird durch die PrĂ€gung bevorzugt! Wird die MĂŒnze geworfen, kann das Ereignis, das Ergebnis des Wurfes, mit gleicher Wahrscheinlichkeit P Wappen oder Zahl annehmen. Die Wahrscheinlichkeit dass z. B. das Ereignis = Zahl ist, betrĂ€gt
  • P(Zahl) = Ereignis / mögliche Ereignisse = 1/2 = 0,5 (50%)

    Wir nehmen eine A-priori-Wahrscheinlichkeit P von P = 0,5 an!

  • A-posteriori-Wahrscheinlichkeit:
    Bleiben wir bei dem Beispiel. Zeigt die MĂŒnze starke Abnutzungserscheinungen, darf die oben beschriebene theoretische Wahrscheinlichkeit, die A-priori-Wahrscheinlichkeit, nicht mehr erwartet werden. D. h., wir gehen nicht mehr davon aus, dass mit einem beliebigen MĂŒnzwurf die Wahrscheinlichkeit P fĂŒr Ereignis = Zahl nicht mehr P(Zahl) = 0,5 (50%) betrĂ€gt!
    Um die Wahrscheinlichkeit P fĂŒr den Wurf Zahl zu bestimmen, hilft nur noch das Experiment weiter:
    Es wird n-mal (Vielleicht 100-mal?) die MĂŒnze geworfen und das Auftreten von Wappen und Zahl gezĂ€hlt. Tritt idealerweise 50-mal das Ereignis Zahl ein, ist die empirische Wahrscheinlichkeit, oder auch A-posteriori-Wahrscheinlichkeit
  • P(Zahl) = Anzahl Ereignis Zahl / Anzahl der MĂŒnzwĂŒrfe = 50 / 100 = 0,5

    Hier sind wir von dem idealen Fall der Gleichverteilung zwischen Wappen und Zahl ausgegangen. In der “realen” Welt, strebt die relative HĂ€ufigkeit des Wurfs Zahl gegen die wahre Verteilung zwischen Wappen und Zahl mit steigender Anzahl n der MĂŒnzwĂŒrfe.

    Darauf basierend, lĂ€sst sich allgemein folgender Grenzwert fĂŒr die A-posteriori-Wahrscheinlichkeit definieren:

Wahrheitswerttafel:

FĂŒr die (logischen) Aussagen A und B werden die VerknĂŒpfungen gemĂ€ĂŸ folgender Wahrheitswerttafel mit w = wahr und f = falsch erklĂ€rt:

A

B

A oder B
Logisches Oder 

A und B
Logisches Und 

A => B
(Aus A folgt B)

A <=> B
(A und B sind Àquivalent)

w

w

w

w

w

w

w

f

w

f

f

f

f

w

w

f

w

f

f

f

f

f

w

w

Die VerknĂŒpfung A => B wird als logische Implikation (Folgerung) bezeichnet; es sind folgende Sprechweisen ĂŒblich:

      • aus A folgt B
      • A impliziert B
      • wenn A gilt, dann gilt auch B
      • A ist eine hinreichende Bedingung fĂŒr B
      • B ist eine notwendige Bedingung fĂŒr A

Die VerknĂŒpfung A <=> B ist eine abgekĂŒrzte Schreibweise fĂŒr A => B und B => A. Sprechweisen fĂŒr Ă€quivalente Aussagen sind:

        • B gilt genau dann, wenn A gilt
        • B gilt nur dann, wenn A gilt
        • B ist eine hinreichende und notwendige Bedingung fĂŒr A

Weibull-Verteilung:

Lebensdauerverteilungen lassen sich die Weibullverteilung darstellen, mehr dazu hier...!

Wertdefinitionen:

Istwert (actual value): Ermittlungsergebnis eines quantitativen Merkmals.

Sollwert (desired value): Wert eines quantitativen Merkmals, von dem die Istwerte dieses Merkmals so wenig wie möglich abweichen sollen (siehe Toleranzbereich).

Richtwert (standard value): Wert eines quantitativen Merkmals, dessen Einhaltung durch die Istwerte empfohlen wird, ohne dass Grenzwerte vorgegeben sind.

Grenzwert (limiting value): Mindestwert oder Höchstwert.

Mindestwert (lower limiting value): Kleinster zugelassener Wert eines quantitativen Merkmals.

Höchstwert (upper limiting value): GrĂ¶ĂŸter zugelassener Wert eines quantitativen Merkmals.

WiederholprÀzision (repeatability, wirhin-run precision):

Die WiederholprĂ€zision ist die Bezeichnung fĂŒr das Ausmaß der gegenseitigen AnnĂ€herung der PrĂŒfergebnisse unter Wiederholbedingungen.

Wiederholbedingungen:

Bei der Gewinnung von unabhĂ€ngigen PrĂŒfergebnissen gelten folgende Bedingungen: festgelegte PrĂŒfmethode, identisches Objekt (Material), der gleiche PrĂŒfer (Beobachter), die gleiche PrĂŒfausstattung (GerĂ€te) und der gleiche Ort (Labor).

Wiederkehrende PrĂŒfung:

QualitĂ€tsprĂŒfung nach fĂŒr die Wiederkehr vorgegebenen Regeln in einer Folge von vorgesehenen QualitĂ€tsprĂŒfungen an derselben Einheit (Lot, Charge).

WiederholungsprĂŒfung:

QualitĂ€tsprĂŒfung nach unerwĂŒnschtem Ergebnis der vorausgegangenen in einer Folge von zugelassenen QualitĂ€tsprĂŒfungen an derselben Einheit (Lot, Charge).

Wilcoxon-Test:

Tests fĂŒr den Vergleich zweier verbundener Stichproben, Vorzeichen-Rang-Test nach Wilcoxon.

Wölbung:

Siehe Abweichung von der Normalverteilung.

X

Y

Z

ZurĂŒck...

ZurĂŒck...

ZurĂŒck...

Z-Normierung:

Oft besteht die Notwendigkeit Merkmalswerte (MerkmalsausprĂ€gungen) zur besseren Beurteilung oder fĂŒr statistische Verfahren derart zu normieren, dass der Mittelwert den Wert 0 und die Standardabweichung den Wert 1 annimmt. Diese Standardisierung oder Z-Normierung wird ĂŒber folgende Formel durchgefĂŒhrt:

Zahlen, Das Gesetz der Großen - :

Das Gesetz der Großen Zahlen wird am Beispiel des arithmetischen Mittels dargestellt:

 = 1/n (X1 + ... + Xn)

 ist der durchschnittliche Wert von X, des Merkmals, bei n (= Anzahl) Versuchen. Nach der “VersuchsdurchfĂŒhrung” liegt die Realisierung, also der Wert (die MerkmalsausprĂ€gung), vor:

X Wirkstoffgehalt

xWert, AusprÀgung

X1

x1 = 96,4 %

X2

x2 = 96,7 %

X3

x3 = 96,5 %

X4

x4 = 96,3 %

X5

x5 = 96,8 %

X6

x6 = 96,6 %

Xn

xn = ...........

Dabei wird folgende Annahme gemacht:
X1, ... Xn sind unabhĂ€ngig und bezĂŒglich ihrer Verteilung identische Zufallsvariablen von X.
n ist der Zufallsstichprobenumfang, kurz die Anzahl der Realisierungen.
Trifft diese Annahme zu, wird von einer unabhÀngige und identische Wiederholung gesprochen.

Strebt nun n -> , oder wird zumindest sehr groß, strebt der Erwartungswert des Mittelwerts

E(n) =  und die Varianz  gegen 0.

Einfach ausgedrĂŒckt, bedeutet dies, dass mit einer hohen Anzahl von Werten, die SchĂ€tzung des Mittelwerts der MerkmalausprĂ€gung und und die dazugehörige Standardabweichung immer besser wird. Je mehr Ereignisse, desto nĂ€her an den Erwartungswert!

In diesem Beispiel sagt das Gesetz der großen Zahlen aus, dass mit dem Streben von n -> die Wahrscheinlichkeit P fĂŒr -> gegen 1 strebt (konvergiert):

c: Parameter > 0

Zeitreihenanalyse siehe hier!

Zeitreihe, StationaritÀt

In der Zeitreihenanalyse wird davon ausgegangen, dass die Beobachtungen Xt eines zufÀlligen Prozesses zu verschiedenen Zeitpunkten tn voneinander abhÀngen. Diese Beobachtungen folgen einer bestimmten Verteilung, die im Allgemeinem unbekannt ist. Die Beobachtung Xt stellt eine AusprÀgung des Merkmals X zum Zeitpunkt t dar und somit kann nicht auf die Momente Erwartungswert und Varianz geschlossen werden.
Damit dennoch statistische Verfahren bei der Betrachtung von Zeitreihen angewendet werden können, werden Eigenschaften definiert, die durch Zeitreihen erfĂŒllt werden mĂŒssen. Diese Eigenschaften beziehen sich auf die Momente Erwartungswert, Varianz und Autokovarianz (bzw. Korrelation). Es muss immer bedacht werden, dass der Erwartungswert, die Varianz / Kovarianz der Zeitreihe fĂŒr Xt zu jedem Zeitpunkt t verschieden sein kann.

Ein statistischer Prozess Prozess (dem die Zeitreihe zugrunde liegt) wird als schwach stationÀr bezeichnet, wenn der Mittelwert und die Varianz zeitunabhÀngig sind und die Kovarianz lediglich vom zeitlichen Abstand (Lag) zwischen den Punkten t und t+1 abhÀngt, aber nicht vom Zeitpunkt t an dem die Beobachtung X gemacht wird.

Von einem streng stationÀren Prozess wird gesprochen, wenn zu jedem Zeitpunkt t die gleiche Verteilung vorliegt.

Verlieren Sie bezĂŒglich der StationaritĂ€t nicht die Eingangsbemerkung aus den Augen!

Zeitreihe, weißes Rauschen (White noise)

In der Zeitreihenanalyse wird das weiße Rauschen als der einfachste statistische Zeitreihen-Prozess betrachtet. Das weiße Rauschen besteht aus zeitlich zufĂ€lligen, unkorrelierten Beobachtungen mit dem Erwartungswert Null und einer konstanten Varianz. Dieser Prozess ist schwach stationĂ€r. Die Autokorrelationsfunktion ist immer Null, ausgenommen fĂŒr Lag = 0.

FĂŒr den Prozess „weißes Rauschen“ kann keine Aussage ĂŒber den zukĂŒnftigen Verlauf des Prozesses aus der Vergangenheit gemacht werden, da die Autokorrelationsfunktion keine Struktur aufweist.

ZwischenprĂŒfung:

QualitĂ€tsprĂŒfung wĂ€hrend der Realisierung einer Einheit (Lot, Charge).

ZufÀllige Abweichung (random deviation, random error):

ZufĂ€llige Abweichungen weisen bei definierter Vorgehensweise (z. B. gleiche PrĂŒfmethode) ein zufĂ€lliges Ausmaß und Vorzeichen auf. Bei quantitativen Merkmalswerten ist die zufĂ€llige Abweichung, unter BerĂŒcksichtigung der vorangemachten Ausage, gleich der Differenz aus Merkmalswert und richtigem bzw. wahrem Wert.

Zufallsstichproben:

Zufallsstichproben sind Teile einer Grundgesamtheit, die durch einen Auswahlprozess mit Zufallsprinzip aus dieser entnommen und stellvertretend, reprĂ€sentativ fĂŒr die Grundgesamtheit sind (siehe Grundgesamtheit und Beispiel).

Zufallsvariable:

Die Zufallsvariable ist ein Grundbegriff der Statistik mit folgender Bedeutung: Der Wert einer Zufallsvariablen, z. B. ein Merkmalswert, wird bei der DurchfĂŒhrung eines Versuches ermittelt (siehe auch Zufallsvorgang).

Je nach Art des Versuchs (Experiment, Beobachtung) sind die möglichen Werte der Zufallsvariablen ein einzelner Wert einer GrĂ¶ĂŸe (beim Messen), einer Zahl (beim ZĂ€hlen), eine AusprĂ€gung (bei der Bestimmung eines qualitativen Merkmals) usw. oder auch Paare, Tripel, Quadrupel, n-Tupel solcher Werte.

Eine Zufallsvariable, die nur abzĂ€hlbar viele Werte annehmen kann, heißt “diskrete Zufallsvariable”. Eine Zufallsvariable, die kontinuierliche Werte annehmen kann, heißt “kontinuierliche Zufallsvariable”.

Zufallsvorgang:

Bevor dieser Vorgang durchgefĂŒhrt wird, ist es ungewiss, welches Ergebnis tatsĂ€chlich eintreten wird (siehe Zufallsvariable -> DurchfĂŒhrung eines Versuchs). Dieses Ergebnis wird mit einer bestimmten Wahrscheinlichkeit eintreffen.

ZuverlÀssigkeitsuntersuchungen:

Zum Thema ZuverlÀssigkeitsuntersuchung (Lebensdauer-) siehe Weibullverteilung!


Literaturstellen:        (ZurĂŒck...)

Backhaus, Erichson, Plinke, Weiber, Multivariate Analysenmethoden, Springer Verlag
Borg, Groenen, Mair, Multidimensionale Skalierung, Rainer Hampp Verlag
Bortz, Linert, Boehnke, Verteilungsfreie Methoden in der Statistik, Springer Verlag
BĂŒhner, Markus, EinfĂŒhrung in Test- und Fragebogenkonstruktion, PEARSON Studium
Burkschat, Cramer, Kamps, Beschreibende Statistik, Grundlegende Methoden, Springer-Verlag
E. Cramer, K. Cramer, Kamps, Zuckschwerdt, Beschreibende Statistik, Interaktive Grafiken, Springer-Verlag
DIN 55 350, Begriffe der QualitÀtssicherung und Statistik
Eckey, Kosfeld, Rengers, Multivariate Statistik, Gabler
GĂŒnter Faes, SPC - Statistische Prozesskontrolle, BoD
GĂŒnter Faes, EinfĂŒhrung in R, BoD
Ludwig Fahrmeir, KĂŒnstler, Pigeot, Tutz, Statistik , Springer-Verlag
Ludwig Fahrmeir, Thomas Kneib, Stefan Lang, Regression, Springer Verlag
W. Funk, V. Dammann, G. Donnevert, QualitÀtssicherung in der Analytischen Chemie, VCH
 G. W. Gottschalk, Auswertung quantitativer Analysenergebnisse,Analytiker Taschenbuch Band 1, Springer-Verlag
Handl, Andreas, Multivariate Analysemethoden, Springer
Kreis, Neuhaus, EinfĂŒhrung in die Zeitreihenanalyse, Springer
Kronthaler, Franz, Statistik angewandt, Springer Spektrum
Ligges, Uwe, Programmieren mit R, Springer-Verlag
Montgomery, Douglas C. , Statistical Quality Control, Wiley
Markus Oestreich, Oliver Romberg, Keine Panik vor Statistik, Vieweg + Teubner
Helmut Pruscha, Statistische Methodenbuch, Springer
Rinne, Mittag, ProzeßfĂ€higkeitsmessung fĂŒr die industrielle Praxis, Hanser
Riedwyl, AmbĂŒhl, Statistische Auswertungen mit Regressionsprogrammen, Oldenbourg
Deborah Rumsey, Übungsbuch Statistik fĂŒr Dummies, Wiley
Sachs, Angewandte Statistik, Springer-Verlag
Sachs, Hedderich, Angewandte Statistik, Springer-Verlag
Schlittgen, Rainer, Das Statistiklabor, Springer-Verlag
Schumacher, Schulgen, Methodik klinischer Studien, Springer Verkag
Storm, Regina, Wahrscheinlichkeitsrechnung, mathematische Statistik und statistische QualitÀtskontrolle, HANSER
Timischl, Wolfgang, QualitÀtssicherung, Hanser
Toutenburg, Heumann, Induktive Statistik, Springer
Guido Walz (Hg.), Lexikon der Statistik, Spektrum Akademischer Verlag
Zöfel, Statistik verstehen, Addison-Wesley
 

Wenn Sie möchten, können Sie Ihre Literatur direkt ĂŒber diesen Link bei Amazon beschaffen!

Ihre Bestellung trÀgt zum Erhalt und zur Weiterentwicklung dieser Seiten bei! Danke!

Seitenanfang

Hat der Inhalt Ihnen weitergeholfen und Sie möchten diese Seiten unterstĂŒtzen?