RGP
Die Funktion RGP berechnet mithilfe der Methode der kleinsten Quadrate Kennziffern zur linearen Regression (in Form eines Arrays), wobei davon ausgegangen wird, dass sich die vorhandenen Daten durch eine lineare Gleichung beschreiben lassen.
RGP(Bekannte_y-Werte; Bekannte_x-Werte; y-Achsenabschnitt_ungleich_Null; Weitere_Statistiken)
Bekannte_y-Werte: Eine Sammlung mit den bekannten y-Werten. Bekannte_y-Werte müssen entweder Zahlenwerte oder Datums-/Uhrzeitwerte enthalten. Wird nur eine (1) Sammlung bekannter x-Werte angegeben, kann die Sammlung Bekannte_y-Werte beliebig groß sein. Werden mehrere Sammlungen bekannter x-Werte verwendet, darf es sich beim Argument Bekannte_y-Werte entweder nur um eine einzelne Spalte mit Werten oder nur um eine einzelne Zeile mit Werten handeln.
Bekannte_x-Werte: Dies ist eine optionale Sammlung mit den bekannten x-Werten. Bekannte_x-Werte müssen entweder Zahlenwerte oder Datums-/Uhrzeitwerte enthalten. Wird dieses Argument nicht angegeben, wird angenommen, dass es sich um eine Gruppe mit der gleichen Größe wie Bekannte_y-Werte handelt, die mit 1 beginnt (z. B.: 1;2;3), wenn es drei Bekannte_y-Werte gibt. Liegt nur eine (1) Bekannte_x-Werte-Gruppe vor, muss diese Gruppe, sofern verwendet, gleich groß sein wie die Bekannte_y-Werte-Sammlung. Liegen mehrere Gruppen bekannter x-Werte vor, wird jede Zeile/Spalte Bekannte_x-Werte als eigenständige Gruppe behandelt, die gleich groß sein muss wie die Zeile/Spalte Bekannte_y-Werte.
y-Achsenabschnitt_ungleich_Null: Dieser optionale Modalwert bestimmt, wie der Schnittpunkt mit der y-Achse (Konstante b) berechnet wird.
Normal (1, WAHR oder keine Angabe): Der Schnittpunkt mit der y-Achse (Konstante b) wird normal berechnet.
Wert 0 erzwingen (0, FALSCH): 0 wird als Wert für den Schnittpunkt mit y-Achse (Konstante b) erzwungen.
Weitere_Statistiken: Dieser optionale Modalwert bestimmt, ob weitere statistische Informationen geliefert werden.
Keine zusätzlichen Statistiken (0, FALSCH oder keine Angabe): Das gelieferte Array enthält keinen weiteren regressionsstatischen Informationen.
Zusätzliche Statistiken (1, WAHR): Das gelieferte Array enthält weitere regressionsstatische Informationen.
Hinweise
Die Ergebniswerte werden von der Funktion in Form eines Array (Matrix) geliefert. Die in diesem Array enthaltenen Werte können u. a. mit der Funktion INDEX gelesen werden. Die Funktion RGP kann in die Funktion INDEX integriert werden: =INDEX(RGP(Bekannte_y-Werte; Bekannte_x-Werte; Schnittpunkt y-Achse; Weitere_Statistiken); y; x), wobei y und x der Spalten- und der Zeilenindex des gewünschten Werts sind.
Werden keine zusätzlichen Statistiken geliefert (Weitere_Statistiken = FALSCH), umfasst das Array genau eine (1) Zeile. Die Anzahl der Spalten entspricht dabei der Anzahl der Bekannte_x-Werte-Gruppen plus 1. Die Zeile enthält die Steigung der Geraden (1 Wert pro Zeile/Spalte mit x-Werten) in umgekehrter Reihenfolge (der erste Wert bezieht sich auf die letzte Zeile/Spalte mit x-Werten), gefolgt vom Wert für die Konstante b, dem Achsenschnittpunkt.
Werden zusätzliche Statistiken geliefert (Weitere_Statistiken = WAHR), umfasst das Array fünf Zeilen. Weitere Informationen über dieses Array findest du direkt im Anschluss an die Beispiele.
Beispiele |
---|
Die folgende Tabelle enthält bekannte_y-Werte (Zellen A2:A6) und bekannte_x-Werte (Zellen B2:B6): |
A | B | |
---|---|---|
1 | Y | X |
2 | 0 | -1 |
3 | 8 | 10 |
4 | 9 | 12 |
5 | 4 | 5 |
6 | 1 | 3 |
=INDEX(RGP(A2:A6; B2:B6; 1; 0); 1) liefert den Näherungswert 0,752707581227437, wenn für y-Achsenabschnitt_ungleich_Null der Wert normal (1) angenommen wird. Dies ist die Steigung für die optimale Ausgleichsgerade, da der erste Wert aus dem Array mit der Funktion INDEX übergeben wird und nur eine Gruppe des Arguments Bekannte_x-Werte angegeben wurde. =INDEX(RGP(A2:A6; B2:B6; 1; 0); 2) liefert den Näherungswert 0,0342960288808646. Hierbei handelt es sich um die Konstante b, den Achsenschnittpunkt der Ausgleichsgeraden. Der Schnittpunkt wurde ermittelt, da angegeben wurde, dass der zweite Wert aus dem Array durch die Funktion INDEX übergeben werden soll. Es handelt sich um den zweiten Wert, da nur eine Gruppe des Arguments Bekannte_x-Werte angegeben wurde. |
Inhalt des Arrays bei zusätzlichen statistischen Informationen
Das von der Funktion RGP ermittelte Array kann zusätzliche regressionsstatische Informationen enthalten. Für die folgende Diskussion soll die Annahme gelten, dass zusätzlich zu den bekannten y-Werten fünf Gruppen mit bekannten x-Werten vorliegen. Weiterhin soll gelten, dass die bekannten_x-Werte in fünf Tabellenspalten oder fünf Tabellenzeilen enthalten sind. Auf dieser Basis würde das von der Funktion RGP ermittelte Array die folgenden Werte enthalten.
1 | 2 | 3 | 4 | 5 | 6 | |
---|---|---|---|---|---|---|
1 | S5 | S4 | S3 | S2 | S1 | b |
2 | SF5 | SF4 | SF3 | SF2 | SF1 | SFb |
3 | C | SFy | ||||
4 | F | FG | ||||
5 | R1 | R2 |
Zeile 1, Spalte 1 enthält S5 (die Steigung für die fünfte Gruppe des Arguments Bekannte_x-Werte). Dies setzt sich bis Spalte 5 fort, die S1 (die Steigung für die erste Gruppe des Arguments Bekannte_x-Werte) enthält. Beachte, dass die Steigungen für jede Gruppe des Arguments Bekannte_x-Werte in umgekehrter Reihenfolge ermittelt werden.
Die letzte Zelle in Zeile 1 enthält die Konstante b, den Schnittpunkt auf der y-Achse für die bekannten x-Werte. In unserem Beispiel wäre das Zeile 1, Spalte 6.
Zeile 2, Spalte 1 enthält SF5 (den Standardfehler für den Koeffizienten bezogen auf die fünfte Gruppe des Arguments Bekannte_x-Werte). Dies setzt sich bis Spalte 5 fort, die SF1 (den Standardfehlerkoeffizienten für die erste Gruppe des Arguments Bekannte_x-Werte) enthält. Diese Werte werden in umgekehrter Reihenfolge ermittelt. Das bedeutet, dass im Falle von fünf Gruppen bekannter x-Werte der Wert für die fünfte Gruppe als erster Wert des Arrays ermittelt wird. Dies erfolgt in gleicher Weise wie bei der Ermittlung der Steigungswerte.
Die letzte Zelle in Zeile 2 enthält SFb, den Standardfehler bezogen auf den Wert für den Schnittpunkt mit der y-Achse (b). In unserem Beispiel wäre das Zeile 2, Spalte 6.
Zeile 3, Spalte 1 enthält C, das Bestimmtheitsmaß (auch Determinationskoeffizient). Diese Kennziffer beruht auf dem Vergleich der erwarteten mit den tatsächlichen y-Werten. Der Wert 1 besagt, dass kein Unterschied zwischen dem erwarteten y-Wert und dem tatsächlichen y-Wert besteht. Dies wird als vollkommene Korrelation bezeichnet. Der Wert 0 besagt, dass keine Korrelation zwischen den Werten besteht und die gegebene Regressionsgleichung nicht dazu geeignet ist, einen y-Wert vorherzusagen.
Zeile 3, Spalte 2 enthält SFy, den Standardfehler bezogen auf den erwarteten y-Wert.
Zeile 4, Spalte 1 enthält F, die F-Statistik (berechneter F-Wert). Die F-Statistik gibt Aufschluss darüber, ob die zwischen den abhängigen und den unabhängigen Variablen beobachtete Beziehung zufällig ist oder nicht.
Zeile 4, Spalte 2 enthält FG, den Freiheitsgrad. Mithilfe dieser Kennziffer kann das Konfidenzniveau beurteilt werden.
Zeile 5, Spalte 1 enthält R1, die Quadratsumme der Regression.
Zeile 5, Spalte 2 enthält R2, die Quadratsumme der Residuen.
Beim Array mit den zusätzlichen Statistiken ist Folgendes zu beachten:
Es ist unerheblich, ob die bekannten x-Werte und die bekannten y-Werte in Spalten oder in Zeilen enthalten sind. In beiden Fällen bilden (wie in der Tabelle oben zu sehen ist) Zeilen das Ordnungsprinzip für das Array.
Im Beispiel oben wird von fünf Gruppen bekannter x-Werte ausgegangen. Liegen weniger oder mehr als fünf Gruppen vor, ändert sich die Anzahl der Spalten im gelieferten Array entsprechend (die Anzahl der Spalten entspricht stets der Anzahl der Gruppen bekannter x-Werte plus 1). Die Anzahl der Zeilen bleibt hingegen konstant.
Hat das Argument „Weitere_Statistiken“ der Funktion RGP den Wert FALSCH (sodass keine zusätzlichen Statistiken geliefert werden), umfasst das gelieferte Array nur die erste Zeile des Beispiels oben.