PROJ.LIN
A função PROJ.LIN tem como resultado uma tabela das estatísticas de uma linha reta que melhor se ajusta aos dados indicados utilizando o método dos quadrados mínimos.
PROJ.LIN(valores-y-conhecidos; valores-x-conhecidos; interceção-y-difzero; mais-estatísticas)
valores-y-conhecidos: Uma coleção que contém os valores y conhecidos. valores-y-conhecidos tem de conter valores numéricos ou valores de data/hora. Se existir apenas uma coleção de valores x conhecidos, valores-y-conhecidos pode ter qualquer tamanho. Se existir mais do que uma coleção de valores x conhecidos, valores-y-conhecidos pode ser ou uma coluna com os valores ou uma linha com os valores, não ambas.
valores-x-conhecidos: Uma coleção opcional que contém os valores de x conhecidos. valores-x-conhecidos tem de conter valores numéricos ou valores de data/hora. Se for omitido, assume-se que é um conjunto do mesmo tamanho que valores-y-conhecidos a começar por 1, por exemplo, 1, 2, 3 se houver três valores-y-conhecidos. Se apenas existir um conjunto de valores x conhecidos, os valores-x-conhecidos, se especificados, devem ter o mesmo tamanho que os valores-y-conhecidos. Se existir mais do que um conjunto de valores x conhecidos, cada linha/coluna de valores-x-conhecidos é considerada como sendo um conjunto e o tamanho de cada linha/coluna tem de ser igual ao tamanho da linha/coluna dos valores-y-conhecidos.
interceção-y-difzero: Um valor modal opcional que especifica como o valor de interceção y (constante b) deve ser calculado.
normal(1, VERDADEIRO ou omitido): O valor de interceção y (constante b) deve ser calculado normalmente.
forçar valor 0 (0, FALSO): O valor de interceção y (constante b) deve ser forçado a ser 0.
mais-estatísticas: Um valor modal opcional que especifica se deve ou não ser devolvida informação estatística adicional.
sem estatísticas adicionais (0, FALSO ou omitido): Não devolver estatísticas de regressão adicionais na tabela devolvida.
estatísticas adicionais (1, VERDADEIRO): Devolver estatísticas de regressão adicionais na tabela devolvida.
Notas
Os valores que resultam da função encontram-se numa tabela. Um método de leitura dos valores numa tabela é utilizar a função ÍNDICE. Pode integrar a função PROJ.LIN na função ÍNDICE: =ÍNDICE(PROJ.LIN(valores-y-conhecidos; valores-x-conhecidos; interceção-y; mais-estatísticas), y, x) em que y e x são o índice de coluna e linha do valor desejado.
Se não forem devolvidas estatísticas adicionais (mais-estatísticas é FALSO), a tabela devolvida apresenta uma linha. O número de colunas é igual ao número de conjuntos de valores-x-conhecidos mais 1. Contém os declives de linha (um valor para cada linha/coluna de valores x) em ordem inversa (o primeiro valor diz respeito à última linha/coluna de valores x) e depois o valor de b, a interceção.
Se forem devolvidas estatísticas adicionais (mais-estatísticas é VERDADEIRO), a tabela apresenta cinco linhas. Consulte mais informações sobre esta tabela logo a seguir aos exemplos.
Exemplos |
---|
Tendo em conta a tabela seguinte de valores-y-conhecidos (células A2:A6) e valores-x-conhecidos (células B2:B6): |
A | B | |
---|---|---|
1 | Y | X |
2 | 0 | -1 |
3 | 8 | 10 |
4 | 9 | 12 |
5 | 4 | 5 |
6 | 1 | 3 |
=ÍNDICE(PROJ.LIN(A2:A6; B2:B6; 1; 0); 1) tem como resultado aproximadamente 0,752707581227437, tendo em conta um valor (1) normal para interceção-y-difzero. Trata-se da reta de melhor ajuste, porque especificámos que pretendíamos o primeiro valor da tabela devolvido por ÍNDICE e especificámos apenas um conjunto de valores-x-conhecidos. =ÍNDICE(PROJ.LIN(A2:A6; B2:B6; 1;0); 2) tem como resultado aproximadamente 0,0342960288808646, que corresponde a b, a interceção da reta de melhor ajuste. A interceção é devolvida, porque especificámos que pretendíamos o segundo valor da tabela devolvido por ÍNDICE, que seria o segundo valor, porque especificámos apenas um conjunto de valores-x-conhecidos. |
Conteúdo da tabela de estatísticas adicionais
PROJ.LIN pode incluir informação estatística adicional na tabela devolvida pela função. Para fins da seguinte exposição, imagine que existem cinco conjuntos de valores x conhecidos, para além dos valores y conhecidos. Imagine ainda que os valores-x-conhecidos estão em cinco linhas de tabela ou em cinco colunas de tabela. Com base nestes pressupostos, a tabela devolvida por PROJ.LIN conteria os valores que se seguem.
1 | 2 | 3 | 4 | 5 | 6 | |
---|---|---|---|---|---|---|
1 | S5 | S4 | S3 | S2 | S1 | b |
2 | SE5 | SE4 | SE3 | SE2 | SE1 | SEb |
3 | C | SEy | ||||
4 | F | GL | ||||
5 | R1 | R2 |
A linha 1, coluna 1 contém S5 (o declive do quinto conjunto de valores-x-conhecidos) continuando até à coluna 5, que conteria S1 (o declive do primeiro conjunto de valores-x-conhecidos). Note-se que o declive relativo a cada um dos conjuntos de valores-x-conhecidos é devolvido por ordem inversa.
A última célula da linha 1 contém b, a interceção de y para os valores x conhecidos. Neste exemplo, seria a linha 1, coluna 6.
A linha 2, coluna 1 contém SE5 (o erro padrão do coeficiente associado ao quinto conjunto de valores-x-conhecidos) continuando até à coluna 5, que conteria SE1 (o coeficiente de erro padrão do primeiro conjunto de valores-x-conhecidos). Estes valores são devolvidos por ordem inversa, ou seja, se existirem cinco conjuntos de valores x conhecidos, o valor para o quinto conjunto aparece em primeiro lugar na tabela. É igual à forma como os valores de declive são devolvidos.
A última célula na linha 2 contém SE b, o erro padrão associado ao valor interceção-y (b). Neste exemplo, seria a linha 2, coluna 6.
A linha 3, coluna 1 contém C, o coeficiente de determinação. Esta estatística compara valores y estimados e reais. Se for 1, não existe diferença entre o valor y estimado e o valor y real. A isso chama-se correlação perfeita. Se o coeficiente de determinação for 0, não existe correlação e a equação de regressão indicada não ajuda a prever um valor y.
A linha 3, coluna 2 contém SEy, o erro padrão associado ao valor y estimado.
A linha 4, coluna 1 contém F, o valor de F observado. O valor de F observado pode ser utilizado para determinar melhor se a relação observada entre as variáveis dependentes e independentes ocorre por acaso.
A linha 4, coluna 2 contém GL, os graus de liberdade. Utilize a estatística dos graus de liberdade para melhor determinar o nível de confiança.
A linha 5, coluna 1 contém R1, a soma de regressão dos quadrados.
A linha 5, coluna 2 contém R2, a soma residual dos quadrados.
Seguem-se algumas indicações a ter em conta acerca da tabela de estatísticas adicionais.
Não é importante se os valores x conhecidos e os valores y conhecidos são linhas ou colunas. Em qualquer dos casos, a tabela devolvida é ordenada por linhas conforme ilustrado na tabela.
O exemplo presume a existência de cinco conjuntos de valores x conhecidos. Se existissem mais ou menos do que cinco, o número de colunas na tabela devolvida alterar-se-ia em conformidade (é sempre igual ao número de conjuntos de valores x conhecidos mais 1), mas o número de linhas manter-se-ia constante.
Se não forem especificadas estatísticas adicionais nos argumentos da função PROJ.LIN, a tabela devolvida é apenas igual à primeira linha.