LINEST
Функція LINEST повертає масив статистичних даних для прямої, яка краще підходить заданим даним, за допомогою методу найменших квадратів.
LINEST(відомі-значення-y; відомі-значення-x; ненульовий-y-перетин; додаткова-статистика)
відомі-значення-y: збірник, що містить відомі значення у. Відомі-значення-y мають містити або числові значення або значення дати/часу. Якщо є тільки один збірник відомих значень x, тоді аргумент відомі-значення-y може мати будь-який розмір. Якщо є кілька збірників відомих значень x, тоді аргумент відомі-значення-y може бути одним стовпцем, який містить значення, або одним рядком, який містить значення, але не обома.
відомі-значення-x: додатковий збірник, що містить відомі значення x. Відомі-значення-x мають містити або числові значення або значення дати/часу. Якщо аргумент пропущено, тоді він вважатиметься набором того самого розміру, що і відомі-значення-y, який починається з 1, наприклад, 1, 2, 3, якщо є три значення відомі-значення-y. Якщо є тільки один набір відомих значень x, тоді аргумент відомі-значення-x, якщо вказаний, повинен мати той самий розмір, що і відомі-значення-y. Якщо є більше одного набору відомих значень x, тоді кожен рядок/стовпець аргумента відомі-значення-x вважається одним набором, а розмір кожного рядка/стовпця повинен збігатися з розміром рядка/стовпця аргумента відомі-значення-y.
ненульовий-y-перетин: додаткове модальне значення, яке визначає, як слід обчислювати y-перетин (константа b).
нормальний (1;TRUE або пропущено)значення y-перетину (константа b) має обчислюватися нормально.
примусове 0 значення (0, FALSE): значення y-перетину (константа b) потрібно доводити до 0.
додаткова-статистика: додаткове модальне значення, яке визначає, чи потрібно повертати додаткову статистичну інформацію.
немає додаткової статистики (0, FALSE або пропущено): Не видавати додаткові регресивні статистичні дані в масиві.
додаткова статистика (1, TRUE): Повертає додаткові регресивні статистичні дані в масиві.
Примітки
Значення, видані функцією, вміщуються в масив. Щоб прочитати значення в масиві, можна використати функцію INDEX. Ви можете загорнути функцію LINEST у функцію INDEX: =INDEX(LINEST(відомі-значення-y; відомі-значення-x; ненульовий-y-перетин; додаткова-статистика); y; x), де y і x є покажчиками стовпця і рядка потрібного значення.
Якщо додаткові статистичні дані не видаються (додаткова-статистика має значення FALSE), виданий масив має один рядок. Кількість стовпців дорівнює кількості наборів відомі-значення-x плюс 1. Тут містяться градієнти ліній (одне значення для кожного рядка/стовпця значень x) у зворотному порядку (перше значення відноситься до останнього рядка/стовпця значень x), а потім йде значення для b, перетину.
Якщо додаткові статистичні дані видаються (додаткова-статистика має значення TRUE), виданий масив має п’ять рядків. Додаткові відомості щодо цього масиву див. одразу після прикладів.
Приклади |
---|
Маємо наведену таблицю значень відомі-значення-y (клітинки A2:A6) і відомі-значення-x (клітинки В2:В6): |
A | B | |
---|---|---|
1 | Y | X |
2 | 0 | -1 |
3 | 8 | 10 |
4 | 9 | 12 |
5 | 4 | 5 |
6 | 1 | 3 |
=INDEX(LINEST(A2:A6; C2:C6; 1; 0); 1) повертає приблизно 0,752707581227437, за умови значення «стандартний» (1) для ненульовий-y-перетин. Це є градієнтом найкращої емпіричної кривої, оскільки ми вказали, що функція INDEX має видати друге значення з масиву, і ми вказали тільки один набір значень відомі-значення-x. =INDEX(LINEST(A2:A6; C2:C6; 1; 0); 2) повертає приблизно 0,0342960288808646, що є b, перетином для найкращої емпіричної кривої. Перетин було отримано, оскільки ми вказали, що функція INDEX має видати друге значення з масиву, яке було б другим значенням, оскільки ми вказали лише один набір значень відомі-значення-x. |
Вміст масиву додаткових статистичних даних
Функція LINEST може включати додаткові статистичні дані в масив, який повертає функція. Для цілей цього розгляду припустимо, що існує п’ять наборів відомих значень x, крім відомих значень y. Припустимо, що значення відомі-значення-x наведено в п’яти рядках або стовпцях таблиці. Виходячи з цього, масив, який повертає LINEST, може містити наведені нижче значення.
1 | 2 | 3 | 4 | 5 | 6 | |
---|---|---|---|---|---|---|
1 | S5 | S4 | S3 | S2 | S1 | b |
2 | SE5 | SE4 | SE3 | SE2 | SE1 | SEb |
3 | C | SEy | ||||
4 | F | DF | ||||
5 | R1 | R2 |
Рядок 1, стовпчик 1 містить S5 (градієнт п’ятого набору значень аргумента відомі-значення-x), продовжуючи до стовпчика 5, який міститиме S1 (градієнт першого набору значень аргументу відомі-значення-x). Зауважте, що градієнти, пов’язані із кожним набором значень відомі-значення-x видаються в зворотному порядку.
Остання клітинка в рядку 1 містить b, y-перетин для відомих значень x. У нашому прикладі це буде рядок 1 стовпець 6.
Рядок 2, стовпчик 1 містить SE5 (стандартна помилка коефіцієнта, пов’язаного з п’ятим набором значень аргумента відомі-значення-x), продовжуючи до стовпця 5, який міститиме SE1 (стандартна помилка коефіцієнта для першого набору значень аргумента відомі-значення-x). Ці значення видаються у зворотному порядку, тобто, якщо є п’ять наборів відомих значень x, значення для п’ятого набору повертається першим у масиві. Значення градієнта видаються так само.
Остання клітинка в рядку 2 містить SEb, стандартну помилку, пов’язану зі значенням y-перетину (b). У нашому прикладі це буде рядок 2 стовпець 6.
Рядок 3, стовпець 1 містить C, коефіцієнт змішаної кореляції. Цей статистичний метод порівнює розрахункові та фактичні значення y. Якщо це 1, різниці між розрахунковим значенням y і фактичним значенням y немає. Це відношення називається абсолютною кореляцією. Якщо коефіцієнт змішаної кореляції 0, кореляції не існує, і задане рівняння регресії не допоможе спрогнозувати значення y.
Рядок 3, стовпчик 2 містить SEy, стандартну помилку, пов’язану з розрахунковим значенням y.
Рядок 4, стовпець 1 містить F, експериментальне значення F. Експериментальне значення F може застосовувати, коли потрібно визначити, чи випадково відбувається спостережене відношення між залежною і незалежною змінними.
Рядок 4, стовпець 2 містить DF, ступені свободи. Застосовуйте статистичний метод ступенів свободи, щоб визначити рівень достовірності.
Рядок 5, стовпчик 1 містить R1, регресійну суму квадратів.
Рядок 5, стовпчик 2 містить R2, залишкову суму квадратів.
Ось кілька речей про масиви додаткових статистичних даних, про які варто пам’ятати.
Неважливо, де знаходяться відомі значення x і відомі значення y, у рядках чи стовпцях. У будь-якому випадку масив впорядковується за рядками, як це показано в таблиці.
У прикладі було припущено п’ять наборів відомих значень x. Якби було більше або менше п’яти наборів, кількість стовпців в отриманому масиві змінювалася б відповідно (вона завжди дорівнює кількості відомих значень x плюс 1), але кількість рядків залишилася б незмінною.
Якщо додаткові статистичні дані не вказано в аргументах для функції LINEST, отриманий масив дорівнює тільки одному рядку.