LINEST
LINEST 函数可使用最小平均法返回给定数据的最佳拟合直线的统计数据数组。
LINEST(已知 y 值, 已知 x 值, y 截距不为 0, 更多统计)
已知 y 值: 包含已知 y 值的集合。 已知 y 值必须包含数字值或日期/时间值。如果只有一组已知的 x 值,则已知 y 值可以是任意大小。如果有多组已知的 x 值,则已知 y 值可以是含有值的一列或一行,但不能同时是两者。
已知 x 值: 一个可选集合,含有已知的 x 值。 已知 x 值必须包含数字值或日期/时间值。如果省略,则将假定它是大小与已知 y 值(从 1 开始)相同的集合,例如,1, 2, 3(如果有三个已知 y 值)。如果只有一组已知的 x 值,则已知 x 值(如已指定)的大小应与已知 y 值相同。如果存在多组已知的 x 值,则已知 x 值的每行/列都应视为一个集合,且每行/列的大小必须与已知 y 值的行/列大小相同。
y 截距不为 0: 可选模态值,用于指定应如何计算 y 轴截距(常数 b)。
正常 (1、TRUE 或省略): 应按正常方式计算的 y 轴截距(常数 b)值。
强制为 0 值 (0、FALSE): 应强制设为 0 的 y 轴截距(常数 b)值。
更多统计: 可选模态值,用于指定是否应返回附加统计数据信息。
无附加的统计值 (0、FALSE 或省略): 不在返回的数组中返回附加的回归统计数据。
附加的统计值 (1、TRUE): 在返回的数组中返回附加的回归统计数据。
注释
函数返回的值包含在数组中。读取数组中值的方法之一是使用 INDEX 函数。可在 INDEX 函数中绕排 LINEST 函数:=INDEX(LINEST(已知 y 值, 已知 x 值, y 截距, 更多统计), y, x) 中的 y 和 x 是所需值的列索引和行索引。
如果未返回附加统计数据(更多统计为 FALSE),返回的数组则只有一行。列数等于已知 x 值的集合个数加 1。它含有以倒序排列(第一个值与 x 值的最后一行/列关联)的直线斜率(x 值的每行/列有一个值)和截距 b 的值。
如果返回附加统计数据(更多统计为 TRUE),则数组含有五行。请参阅此数组的附加信息(紧跟在这些示例的后面)。
示例 |
---|
假设包含已知 y 值(单元格 A2:A6)和已知 x 值(单元格 B2:B6)的表格如下: |
A | B | |
---|---|---|
1 | Y | X |
2 | 0 | -1 |
3 | 8 | 10 |
4 | 9 | 12 |
5 | 4 | 5 |
6 | 1 | 3 |
=INDEX(LINEST(A2:A6, B2:B6, 1, 0), 1) 返回近似值 0.752707581227437,假定 y 截距不为 0 为正态值 1。这是最佳拟合线斜率,因为我们已经指定我们想要 INDEX 返回的数组的第一个值,并且我们只指定了一组已知 x 值。 =INDEX(LINEST(A2:A6, B2:B6, 1, 0), 2) 返回近似值 0.0342960288808646,即为 b,最佳拟合线的截距。返回该截距,因为我们已经指定我们想要 INDEX 返回的数组的第二个值,这可能是第二个值,因为我们只指定了一组已知 x 值。 |
附加统计数据数组的内容
LINEST 可包括此函数返回的数组中的附加统计信息。为了进行下面的讨论,假设除了已知的 y 值,还有五组已知的 x 值。进一步假设已知 x 值位于五个表格行或五个表格列中。根据这些假设,LINEST 返回的数组可能包含以下值。
1 | 2 | 3 | 4 | 5 | 6 | |
---|---|---|---|---|---|---|
1 | S5 | S4 | S3 | S2 | S1 | b |
2 | SE5 | SE4 | SE3 | SE2 | SE1 | SEb |
3 | C | SEy | ||||
4 | F | DF | ||||
5 | R1 | R2 |
第 1 行第 1 列包含 S5(第五组已知 x 值的斜率),继续直到第五列,第五列将包含 S1(第 1 组已知 x 值的斜率)。请注意与每组已知 x 值相关的斜率会以倒序返回。
第 1 行的最后一个单元格包含 b,即已知 x 值的截距 y。在我们的例子中,这会是第 1 行第 6 列。
第 2 行第 1 列包含 SE5(与第五组已知 x 值关联的系数的标准错误),继续直到第 5 列,第 5 列将包含 SE1(第一组已知 x 值的标准错误系数)。返回的这些值按倒序排列,也就是说,如果有五组已知的 x 值,则第五组值在数组中首先返回。这与返回斜率值的方法相同。
第 2 行的最后一个单元格包含 SEb,与 y 截距值 (b) 关联的标准错误。在我们的例子中,这会是第 2 行第 6 列。
第 3 行第 1 列包含 C,即确定系数。此统计方法可比较 y 估计值和 y 实际值。如果该值是 1,则 y 估计值和 y 实际值之间没有差异。这称为完全相关。如果确定系数是 0,则没有相关性,而且给定的回归方程对预测 y 值没有帮助。
第 3 行第 2 列包含 SEy,即与 y 估计值关联的标准错误。
第 4 行第 1 列包含 F,即 F 观测值。F 观测值用于确定因变量和自变量之间的观测关系是否为随机出现。
第 4 行第 2 列包含 DF,即自由度。使用自由度统计方法可帮助确定置信度。
第 5 行第 1 列包含 R1,回归平方和。
第 5 行第 2 列包含 R2,残差平方和。
对于附加统计数据数组,请记住以下事项:
已知的 x 值和已知的 y 值是否在同一行或同一列无关紧要。在任意一种情况下,返回的数组都按表格中说明的行顺序排列。
此示例假设存在五组已知的 x 值。如果大于或小于五组,返回的数组中的列数也将相应改变(始终等于已知 x 值的组数加 1),但行数始终为常数。
如果未在 LINEST 的参数中指定附加统计数据,则返回的数组只能等于第一行。