LINREGR
LINREGR-funktio palauttaa matriisin sellaisen suoran janan ominaisuuksista, joka parhaiten sopii annettuun dataan pienimmän neliösumman menetelmää käyttäen.
LINREGR(tunnetut y-arvot; tunnetut x-arvot; nollaton-y-leikkauspiste; lisää tilastoja)
tunnetut y-arvot: Tunnetut y-arvot sisältävä joukko. tunnettujen y-arvojen täytyy sisältää joko lukuarvoja tai päivämäärä-/aika-arvoja. Jos tunnettuja x-arvoja on vain yksi joukko, tunnetut y-arvot voi olla minkä kokoinen tahansa. Jos tunnettuja x-aroja on enemmän kuin yksi joukko, tunnetut y-arvot voi olla joko yksi arvot sisältävä sarake tai yksi arvot sisältävä rivi, mutta ei molempia.
tunnetut x-arvot: Tunnetut x-arvot sisältävä valinnainen joukko. tunnettujen x-arvojen täytyy sisältää joko lukuarvoja tai päivämäärä-/aika-arvoja. Jos tämä jätetään pois, sen oletetaan olevan samankokoinen joukko kuin tunnetut-y-arvot alkaen luvusta 1 (esimerkiksi 1, 2, 3, jos tunnettuja-y-arvoja on kolme). Jos tunnettuja x-arvoja on vain yksi joukko, tunnetut x-arvot ‑joukon, jos se määritetään, tulisi olla saman kokoinen kuin tunnetut y-arvot. Jos tunnettuja x-arvoja on enemmän kuin yksi joukko, jokaisen tunnettujen x-arvojen rivin/sarakkeen katsotaan olevan yksi joukko ja jokaisen rivin/sarakkeen koon on oltava sama kuin tunnettujen y-arvojen rivin/sarakkeen koon.
nollaton-y-leikkauspiste: Valinnainen modaalinen arvo, joka määrittää kuinka y-leikkauspiste (vakio b) lasketaan.
normaali (1, TOSI tai ohitettu): Y-leikkauspisteen arvo (vakio b) pitäisi laskea normaalisti.
pakotettu 0-arvo (0, EPÄTOSI): Y-leikkauspisteen arvo (vakio b) pitäisi pakottaa nollaksi.
lisää tilastoja: Valinnainen modaalinen arvo, joka määrittää palautetaanko lisätilastotiedot.
ei lisätilastoja (0, EPÄTOSI tai ohitettu): Älä palauta regression lisätilastoja palautetussa matriisissa.
lisätilastoja (1, TOSI): Palauttaa regression lisätilastot palautetussa matriisissa.
Huomautuksia
Funktion palauttamat arvot ovat matriisin sisällä. Yksi tapa lukea matriisin arvot on käyttää INDEKSI-funktiota. Voit ympäröidä LINREGR-funktion INDEKSI-funktiolla: =INDEKSI(LINREGR(tunnetut y-arvot; tunnetut x-arvot; y-leikkauspiste; lisää tilastoja); y; x), jossa y ja x ovat halutun arvon sarake- ja rivi-indeksi.
Jos lisätilastoja ei palauteta (lisää tilastoja on EPÄTOSI), palautettu matriisi on yhden rivin syvyinen. Sarakkeiden määrä on yhtä suuri kuin tunnetut x-arvot ‑joukkojen määrä plus 1. Se sisältää kulmakertoimet (yksi arvo x-arvojen riviä/saraketta kohden) käänteisessä järjestyksessä (ensimmäinen arvo viittaa x-arvojen viimeiseen riviin/sarakkeeseen) sekä leikkauspiste b:n arvon.
Jos lisätilastoja palautetaan (lisää tilastoja on TOSI), matriisi sisältää viisi riviä. Lisätietoja tästä matriisista löytyy näiden esimerkkien jälkeen.
Esimerkkejä |
---|
Seuraava taulukko sisältää tunnetut y-arvot (solut A2:A6) ja tunnetut x-arvot (solut B2:B6): |
A | B | |
---|---|---|
1 | Y | X |
2 | 0 | -1 |
3 | 8 | 10 |
4 | 9 | 12 |
5 | 4 | 5 |
6 | 1 | 3 |
=INDEKSI(LINREGR(A2:A6; B2:B6; 1; 0); 1) palauttaa likimäärin 0,752707581227437, jos nollaton-y-leikkauspiste-arvo on normaali (1). Tämä on parhaiten sopiva janan kulmakerroin, koska määritimme, että haluamme ensimmäisen arvon INDEKSI-funktion palauttamasta matriisista ja määritimme vain yhden joukon tunnettuja x-arvoja. =INDEKSI(LINREGR(A2:A6; B2:B6; 1; 0); 2) palauttaa likimäärin 0,0342960288808646, joka on b, parhaiten sopivan janan leikkauspiste. Leikkauspiste palautettiin, koska määritimme, että haluamme toisen arvon INDEKSI-funktion palauttamasta matriisista, joka on toinen arvo, koska määritimme vain yhden joukon tunnettuja x-arvoja. |
Lisätilastomatriisin sisältö
LINREGR voi sisällyttää lisää tilastotietoja palauttamaansa matriisiin. Seuraavassa oletetaan, että tunnettuja x-arvoja on viisi joukkoa tunnettujen y-arvojen lisäksi. Oletetaan myös, että tunnetut x-arvot ovat viidellä taulukon rivillä tai viidessä taulukon sarakkeessa. Tämän perusteella LINREGR-funktion palauttama matriisi sisältää seuraavat arvot.
1 | 2 | 3 | 4 | 5 | 6 | |
---|---|---|---|---|---|---|
1 | S5 | S4 | S3 | S2 | S1 | b |
2 | SE5 | SE4 | SE3 | SE2 | SE1 | SEb |
3 | C | SEy | ||||
4 | F | DF | ||||
5 | R1 | R2 |
Rivi 1, sarake 1 sisältää S5:n (tunnettujen x-arvojen viidennen joukon kulmakerroin) jatkuen sarakkeeseen 5, joka sisältää S1:n (tunnettujen x-arvojen ensimmäisen joukon kulmakerroin). Huomaa, että jokaiseen tunnettujen x-arvojen joukkoon liittyvä kulmakerroin palautetaan käänteisessä järjestyksessä.
Rivin 1 viimeinen solu sisältää b:n, tunnettujen x-arvojen y-leikkauspisteen. Tässä esimerkissä tämä on rivi 1 sarake 6.
Rivi 2, sarake 1 sisältää SE5:n (tunnettujen x-arvojen viidennen joukon kertoimen standardivirheen) jatkuen sarakkeeseen 5, joka sisältää SE1:n (tunnettujen x-arvojen ensimmäisen joukon kertoimen standardivirheen). Nämä arvot palautetaan käänteisessä järjestyksessä eli, jos tunnettuja x-arvojen joukkoja on viisi, viidennen joukon arvo on palautetussa matriisissa ensimmäisenä. Tämä on sama tapa, jolla kulmakertoimet palautetaan.
Rivin 2 viimeinen solu sisältää SEb:n, y-leikkauspisteen (b) standardivirheen. Tässä esimerkissä tämä on rivi 2 sarake 6.
Rivi 3 sarake 1 sisältää C:n, determinaatiokertoimen. Tämä tilasto vertaa arvioituja ja todellisia y-arvoja. Jos se on 1, arvioidun y-arvon ja todellisen y-arvon välillä ei ole eroa. Tämä tunnetaan nimellä täydellinen korrelaatio. Jos determinaatiokerroin on 0, korrelaatiota ei ole ja annettu regressioyhtälö ei auta y-arvon ennustamisessa.
Rivi 3, sarake 2 sisältää SEy:n, y-arvon arvioon liittyvän standardivirheen.
Rivi 4 sarake 1 sisältää F:n, F:n havaitun arvon. F:n havaittua arvoa voidaan käyttää sen määrittämiseen, onko riippuvan ja riippumattoman muuttujan välillä havaittu suhde sattumanvarainen.
Rivi 4 sarake 2 sisältää DF:n, vapausasteen. Vapausasteet-tilastoa voidaan käyttää luotettavuustason määrittämiseen.
Rivi 5, sarake 1 sisältää R1:n, neliöiden regressiosumman.
Rivi 5, sarake 2 sisältää R2:n, jäännösneliösumman.
Tässä on joitakin asioita, jotka kannattaa pitää mielessä lisätilastojen matriisista:
Sillä ei ole väliä, ovatko tunnetut x-arvot ja tunnetut y-arvot riveissä vai sarakkeissa. Molemmissa tapauksissa palautettu matriisi on järjestetty rivien mukaan kuten kuvassa.
Tämä esimerkki olettaa viisi joukkoa tunnettuja x-arvoja. Jos niitä olisi enemmän tai vähemmän kuin viisi, palautetussa matriisissa olevien sarakkeiden määrä muuttuisi sen mukaan (se on aina sama kuin tunnettujen x-arvojen joukkojen määrä plus 1), mutta rivien määrä pysyisi vakiona.
Jos lisätilastoja ei määritetä LINREGR-funktion argumenteissa, palautettu matriisi on yhtä suuri kuin ensimmäinen rivi.