LINREGR
Funktionen LINREGR returnerer en matrice over statistikken for en ret linje, der passer bedst til de givne data vha. de mindste kvadraters metode.
LINREGR(kendte-y-værdier; kendte-x-værdier; ikkenul-y-skæring; mere-statistik)
kendte-y-værdier: En samling, som indeholder de kendte y-værdier. kendte-y-værdier skal enten indeholde talværdier eller dato-/tidsværdier. Hvis der kun er en samling af kendte x-værdier, kan kendte-y-værdier have en vilkårlig størrelse. Hvis der er flere samlinger af kendte x-værdier, kan kendte-y-værdier enten være en kolonne med værdierne eller en række med værdierne, men ikke begge.
kendte-x-værdier: En valgfri samling indeholdende de kendte x-værdier. kendte-x-værdier skal enten indeholde talværdier eller dato-/tidsværdier. Hvis den udelades, antages den at være et sæt med samme størrelse som kendte-y-værdier, der starter med 1, f.eks. 1, 2, 3 hvis der er tre kendte-y-værdier. Hvis der kun er et sæt af kendte x-værdier, skal kendte-x-værdier, hvis de anføres, have samme størrelse om kendte-y-værdier. Hvis der er flere sæt af kendte x-værdier, opfattes hver række/kolonne af kendte-x-værdier som et sæt, og størrelsen på hver række/kolonne skal være den samme som størrelsen på rækken/kolonnen i kendte-y-værdier.
ikkenul-y-skæring: En valgfri modalværdi, der angiver, hvordan y-skæringspunktet (konstant b) skal beregnes.
normal (1, SAND eller udeladt): Værdien af y-skæringspunktet (konstant b) skal beregnes på normal vis.
fremtving 0-værdi (0, FALSK): Værdien af y-skæringspunktet (konstant b) skal tvinges til at være 0.
mere-statistik: En valgfri modalværdi, der angiver, om der skal returneres yderligere statistiske oplysninger.
ingen yderligere statistik (0, FALSK eller udeladt): Returner ikke yderligere regressionsstatistik i den returnerede matrice.
yderligere statistik (1, SAND): Returnerer yderligere regressionsstatistik i den returnerede matrice.
Noter
De værdier, der returneres af funktionen, er indeholdt i en matrice. Man kan f.eks. bruge funktionen INDEKS til at læse værdierne i matricen. Du kan indlejre funktionen LINREGR i funktionen INDEKS: =INDEKS(LINREGR(kendte-y-værdier; kendte-x-værdier; y-skæringspunkt; mere statistik); y; x), hvor y og x er kolonne- og rækkeindekset for den ønskede værdi.
Hvis der ikke returneres yderligere statistik (mere-statistik er FALSK), er den returnerede matrice en række dyb. Antallet af kolonner er lig med antallet af sæt i kendte-x-værdier plus 1. Det indeholder linjestigningerne (en værdi for hver række/kolonne med x-værdier) i modsat rækkefølge (den første værdi hører til den sidste række/kolonne af x-værdier) og derefter værdien for b, skæringspunktet.
Hvis der returneres yderligere statistik (mere-statistik er SAND), indeholder matricen fem rækker. Der findes flere oplysninger om denne matrice umiddelbart efter eksemplerne.
Eksempler |
---|
I følgende tabel med kendte-y-værdier (cellerne A2:A6) og kendte-x-værdier (cellerne B2:B6): |
A | B | |
---|---|---|
1 | Y | X |
2 | 0 | -1 |
3 | 8 | 10 |
4 | 9 | 12 |
5 | 4 | 5 |
6 | 1 | 3 |
=INDEKS(LINREGR(A2:A6; B2:B6; 1; 0); 1) returnerer ca. 0,752707581227437 med en given normalværdi (1) for ikkenul-y-skæring. Det er den bedste stigning for en ret linje, fordi vi har anført, at den første værdi skulle returneres af INDEKS, og fordi vi kun anførte et sæt kendte-x-værdier. =INDEKS(LINREGR(A2:A6; B2:B6; 1; 0); 2) returnerer ca. 0,0342960288808646, hvilket er b, skæringspunktet for den bedste linje. Skæringspunktet returneres, fordi vi valgte, at den anden værdi skulle returneres af INDEKS, som er den anden værdi, fordi vi kun anførte et sæt kendte-x-værdier. |
Indholdet af matricen over yderligere statistik
LINREGR kan indeholde yderligere statistiske oplysninger i den matrice, der returneres af funktionen. Som udgangspunkt for den følgende diskussion skal du antage, at der er fem sæt kendte x-værdier ud over de kendte y-værdier. Antag desuden, at de kendte x-værdier er i fem tabelrækker eller fem tabelkolonner. På basis heraf vil den matrice, der returneres af LINREGR, indeholde følgende værdier.
1 | 2 | 3 | 4 | 5 | 6 | |
---|---|---|---|---|---|---|
1 | S5 | S4 | S3 | S2 | S1 | B |
2 | SE5 | SE4 | SE3 | SE2 | SE1 | SEb |
3 | C | SEy | ||||
4 | F | DF | ||||
5 | R1 | R2 |
Række 1, kolonne 1 indeholder S5 (stigningen for det femte sæt kendte-x-værdier), der fortsætter t.o.m. kolonne 5, som indeholder S1 (stigningen for det første sæt kendte-x-værdier). Bemærk, at stigningen for hvert sæt kendte-x-værdier returneres i omvendt rækkefølge.
Den sidste celle i række 1 indeholder b, y-skæringspunktet for de kendte x-værdier. I vores eksempel er det række 1, kolonne 6.
Række 2, kolonne 1 indeholder SE5 (standardfejlen for den koefficient, der hører til det femte sæt kendte x-værdier), fortsætter t.o.m. kolonne 5, som indeholder SE1 (standardfejlen for den koefficient, der hører til det første sæt kendte-x-værdier). Disse værdier returneres i omvendt rækkefølge, dvs. hvis der er fem kendte x-værdisæt, returneres værdien for det femte sæt først i matricen. Det er den samme måde, som stigningsværdierne returneres på.
Den sidste celle i række 2 indeholder SEb, standardfejlen der hører til værdien af y-skæringspunkt (b). I vores eksempel er det række 2, kolonne 6.
Række 3, kolonne 1 indeholder C, determinationskoefficienten. Denne statistiske beregning sammenligner forventede og faktiske y-værdier. Hvis den er 1, er der ingen forskel mellem den forventede y-værdi og den faktiske y-værdi. Det kaldes perfekt korrelation. Hvis determinationskoefficienten er 0, er der ingen korrelation, og den givne regressionsligning kan ikke hjælpe med at forudsige en y-værdi.
Række 3, kolonne 2 indeholder SEy, standardfejlen der hører til prognosen for y-værdien.
Række 4, kolonne 1 indeholder F, den F-observerede værdi. Den F-observerede værdi kan bruges til at afgøre, om det observerede forhold mellem de afhængige og uafhængige variabler sker tilfældigt.
Række 4, kolonne 2 indeholder DF, frihedsgraderne. Brug frihedsgraderne til at bestemme et konfidensniveau.
Række 5, kolonne 1 indeholder R1, regressionssummen af kvadrater.
Række 5, kolonne 2 indeholder R2, restsummen af kvadrater.
Her er nogle ting, du skal være opmærksom på i forbindelse med matricen over yderligere statistik:
Det er ligegyldigt, om de kendte x-værdier og kendte y-værdier er i rækker eller kolonner. I begge tilfælde ordnes den returnerede matrice efter rækker som illustreret i tabellen.
Eksemplet antager fem sæt kendte x-værdier. Hvis der var mere eller mindre end fem, ville antallet af kolonner i den returnerede matrice ændres tilsvarende (det svarer altid til antallet af sæt af kendte x-værdier plus 1), men antallet af rækker ville forblive konstant.
Hvis der ikke anføres yderligere statistik i argumenterne til LINREGR, svarer den returnerede matrice kun til den første række.