Zurück...

Diskriminanzanalyse mit dem R-Paket LinDA

Laden Sie das Paket LinDA (Lineare Diskriminanzanalyse) und die Beispieldaten in die R-Umgebung:

      > data(Beispiel)

Das Datenobjekt Beispiel beinhaltet das 3-Gruppen-Beispiel. Über die Funktion linda.lda() wird die Diskriminanzfunktion geschätzt und in Funktion abgelegt. Die Attribute erweitert = TRUE und gruppenP = TRUE geben die Standardabweichungen, Mittelwerte und wahrscheinliche Gruppenzugehörigkeit aus:

    > Funktion <- linda.lda(Beispiel, erweitert = TRUE, gruppenP = TRUE)

Ausgabe:


        Lienare Diskriminanzfunktion
       
      Verteilung der Merkmale zwischen den Gruppen (1 = 100%):
          A     B     C
      0.3333333 0.3333333 0.3333333

      Gruppenmittelwerte:
       Sicherheit  Umwelt Innovativ Prestige
      A  8.400000 6.533333 7.933333 8.666667
      B  8.466667 8.200000 5.333333 5.600000
      C  4.533333 7.866667 3.533333 2.866667

      Gruppenstandardabweichungen:
       Sicherheit  Umwelt Innovativ Prestige
      A 1.0555973 1.0600988 1.3345233 0.9759001
      B 0.9154754 1.0141851 0.7237469 0.6324555
      C 0.9154754 0.9154754 0.6399405 0.6399405

      Konstante Glieder b0 (LD1...LDn):
      [1] -7.765268 -6.098156


      Koeffizienten der Diskriminanzfunktion (LD1...n):
               LD1    LD2
      Sicherheit 0.4018996 0.8831480
      Umwelt   -0.3377654 0.3969992
      Innovativ  0.4076665 -0.2366116
      Prestige  0.9034934 -0.3269652


      Wahrscheinliche Gruppenzugehörigkeit (1 = 100%) und deren Klassierung:
             A      B      C Gruppe
      1 1.000000e+00 7.346040e-10 4.794868e-24   A
      2 9.999974e-01 2.620214e-06 2.061498e-16   A
      3 1.000000e+00 1.789203e-08 2.551615e-21   A
      4 9.999997e-01 3.336379e-07 5.023774e-21   A
      5 1.000000e+00 3.023734e-08 1.118747e-27   A
      6 9.993389e-01 6.611424e-04 3.515529e-12   A
      7 1.000000e+00 2.184183e-08 4.817927e-24   A
      8 9.999997e-01 2.787064e-07 9.409756e-20   A
      9 9.999974e-01 2.572034e-06 4.656750e-16   A
      10 9.996901e-01 3.099447e-04 7.788740e-15   A
      11 9.999998e-01 2.377653e-07 1.002834e-18   A
      12 2.203104e-13 1.000000e+00 8.770083e-10   B
      13 9.999995e-01 5.158841e-07 2.271002e-23   A
      14 9.983323e-01 1.667687e-03 4.521033e-18   A
      15 9.999566e-01 4.335960e-05 4.748893e-16   A
      16 2.814706e-07 9.999286e-01 7.108160e-05   B
      17 2.018240e-08 9.997729e-01 2.270301e-04   B
      18 2.677648e-05 9.999731e-01 7.493698e-08   B
      19 1.183567e-04 9.988419e-01 1.039753e-03   B
      20 3.209768e-04 9.996780e-01 1.067358e-06   B
      21 2.814706e-07 9.999286e-01 7.108160e-05   B
      22 2.286455e-07 9.999926e-01 7.177334e-06   B
      23 6.101408e-05 9.999380e-01 9.591310e-07   B
      24 1.459639e-07 9.999998e-01 4.422044e-08   B
      25 2.456515e-04 9.997543e-01 1.664885e-08   B
      26 3.646441e-05 9.999614e-01 2.176238e-06   B
      27 3.646441e-05 9.999614e-01 2.176238e-06   B
      28 5.997465e-04 9.994003e-01 7.457860e-10   B
      29 2.509357e-05 9.999749e-01 7.047307e-10   B
      30 4.278902e-07 9.953805e-01 4.619039e-03   B
      31 4.654544e-18 3.297362e-07 9.999997e-01   C
      32 2.098572e-18 2.540093e-06 9.999975e-01   C
      33 2.280632e-16 2.826467e-05 9.999717e-01   C
      34 8.242643e-14 1.387045e-02 9.861295e-01   C
      35 1.838896e-19 1.610334e-07 9.999998e-01   C
      36 1.498186e-16 1.660190e-05 9.999834e-01   C
      37 4.727051e-22 3.673428e-10 1.000000e+00   C
      38 9.297544e-22 1.522779e-08 1.000000e+00   C
      39 3.613065e-19 3.436823e-07 9.999997e-01   C
      40 4.626008e-15 4.931717e-05 9.999507e-01   C
      41 6.307707e-16 9.294946e-04 9.990705e-01   C
      42 4.599257e-17 1.012873e-07 9.999999e-01   C
      43 7.380633e-18 8.066053e-06 9.999919e-01   C
      44 4.096082e-15 6.282197e-05 9.999372e-01   C
      45 7.099391e-26 1.188476e-09 1.000000e+00   C

Abbildung 1: Ausgabe der Diskriminanzfunktion und weiterer Daten

Zur Schätzung der Gruppenzuordnung neuer Daten (Diskriminanz_Predict_Test) laden Sie diese in das Objekt Test:

      > Test <- read.csv2("Diskriminanz_Predict_Test.csv")

Schauen Sie sich die Test-Daten an und führen Sie die Schätzung der Gruppierung mit der Funktion linda.predict() durch (Abbildung 2):

      > Schätzung <- linda.predict(Funktion, Test)

Ausgabe:


        Schätzung der Klassifizierung auf Basis LinDA.lda-Anpassung:

      Schätzung der Gruppenzugehörigkeit als Gruppe und
      Wahrscheinlichkeit 1 = 100%):
       
        Gruppe      A      B      C
      1    A 1.000000e+00 1.846640e-09 2.117694e-23
      2    A 9.999983e-01 1.663140e-06 5.917994e-17
      3    B 1.945914e-05 9.999805e-01 5.742560e-08
      4    A 9.999996e-01 3.813227e-07 5.813671e-23
      5    A 9.995192e-01 4.808307e-04 1.094949e-18
      6    A 9.999756e-01 2.441766e-05 1.454909e-16
      7    B 2.228376e-07 9.999542e-01 4.557468e-05
      8    B 2.160266e-08 9.998218e-01 1.781563e-04
      9    B 1.285059e-07 9.999998e-01 3.759545e-08
      10   B 2.006637e-04 9.997993e-01 1.468560e-08
      11   B 2.474595e-05 9.999738e-01 1.413729e-06
      12   B 2.474595e-05 9.999738e-01 1.413729e-06
      13   B 1.821794e-04 9.998178e-01 1.740374e-09
      14   B 1.427000e-05 9.999857e-01 1.166174e-09
      15   B 3.244018e-07 9.955305e-01 4.469135e-03
      16   C 1.599058e-18 2.295355e-07 9.999998e-01
      17   C 6.504182e-19 1.370766e-06 9.999986e-01
      18   C 1.077109e-16 2.260817e-05 9.999774e-01
      19   C 7.333275e-18 7.688062e-08 9.999999e-01
      20   C 2.671210e-18 5.782792e-06 9.999942e-01
      21   C 2.328343e-15 4.418862e-05 9.999558e-01
      22   C 9.558693e-25 1.863697e-09 1.000000e+00

Abbildung 2: Ausgabe der geschätzten Gruppenzugehörigkeit

Das Ergebnis der Schätzung (Abb. 2) wird neben der Ausgabe auch im Objekt Schätzung gespeichert. Schätzung enthält zusätzlich die Diskriminanzwerte y (LD1/LD2) der Test-Daten (Abb. 3):

> Schätzung
       A      B      C Gruppe    LD1    LD2
1 1.000000e+00 1.846640e-09 2.117694e-23   A 5.7196022 -1.8135226
2 9.999983e-01 1.663140e-06 5.917994e-17   A 4.0764438 -1.9727062
3 1.945914e-05 9.999805e-01 5.742560e-08   B 0.6089981 1.8813195
4 9.999996e-01 3.813227e-07 5.813671e-23   A 5.6199081 0.2797385
5 9.995192e-01 4.808307e-04 1.094949e-18   A 4.5367108 1.3103485
6 9.999756e-01 2.441766e-05 1.454909e-16   A 3.9825166 -0.9992046
7 2.228376e-07 9.999542e-01 4.557468e-05   B -0.6264938 1.4855243
8 2.160266e-08 9.998218e-01 1.781563e-04   B -1.0341603 1.7221359
9 1.285059e-07 9.999998e-01 3.759545e-08   B 0.1074044 3.0914327
10 2.006637e-04 9.997993e-01 1.468560e-08   B 1.0166646 1.6447079
11 2.474595e-05 9.999738e-01 1.413729e-06   B 0.2769995 1.1585591
12 2.474595e-05 9.999738e-01 1.413729e-06   B 0.2769995 1.1585591
13 1.821794e-04 9.998178e-01 1.740374e-09   B 1.2446271 2.1117410
14 1.427000e-05 9.999857e-01 1.166174e-09   B 1.0108977 2.7644674
15 3.244018e-07 9.955305e-01 4.469135e-03   B -1.0982945 0.4419888
16 1.599058e-18 2.295355e-07 9.999998e-01   C -4.5885477 -1.4773005
17 6.504182e-19 1.370766e-06 9.999986e-01   C -4.6824749 -0.5037990
18 1.077109e-16 2.260817e-05 9.999774e-01   C -4.1167470 -0.4337650
19 7.333275e-18 7.688062e-08 9.999999e-01   C -4.4247194 -2.2904146
20 2.671210e-18 5.782792e-06 9.999942e-01   C -4.5244135 -0.1971534
21 2.328343e-15 4.418862e-05 9.999558e-01   C -3.7789816 -0.8307642
22 9.558693e-25 1.863697e-09 1.000000e+00   C -6.1675719 -0.3563370

Abbildung 3: Inhalt des Datenobjekt Schätzung

Um sich einen grafischen Überblick der Gruppenzugehörigkeit und -verteilung zu verschaffen, dient die Funktion linda.plot(). Da es sich hier um ein 3-Gruppen-Beispiel handelt, kann natürlich nur LD1 gegen LD2 angezeigt werden. Über linda.plot() können nur bis zu 4-Gruppen-Beispiele dargestellt werden (siehe Hilfe). Der Funktionsaufruf ...

> linda.plot(Schätzung)

... zeigt folgende Grafik (Abb. 4):

Abbildung 4: Grafische Ausgabe der geschätzten Gruppenzugehörigkeit

Sprung zum Seitenanfang

Hat der Inhalt Ihnen weitergeholfen und Sie möchten diese Seiten unterstützen?