Principal » negociação algorítmica » Noções básicas de regressão para análise de negócios

Noções básicas de regressão para análise de negócios

negociação algorítmica : Noções básicas de regressão para análise de negócios

Se você já se perguntou como dois ou mais dados se relacionam (por exemplo, como o PIB é impactado por mudanças no desemprego e na inflação), ou se você já teve seu chefe, peça para criar uma previsão ou analisar previsões com base nas relações entre variáveis, aprender a análise de regressão valeria a pena.

Neste artigo, você aprenderá o básico da regressão linear simples, às vezes chamada de 'mínimos quadrados comuns' ou regressão OLS - uma ferramenta comumente usada em previsões e análises financeiras. Começaremos aprendendo os princípios fundamentais da regressão, primeiro aprendendo sobre covariância e correlação e depois avançando para a construção e interpretação de uma saída de regressão. Softwares comerciais populares, como o Microsoft Excel, podem fazer todos os cálculos e saídas de regressão para você, mas ainda é importante aprender a mecânica subjacente.

Variáveis

No coração de um modelo de regressão está a relação entre duas variáveis ​​diferentes, chamadas variáveis ​​dependentes e independentes. Por exemplo, suponha que você queira prever vendas para sua empresa e tenha concluído que as vendas de sua empresa aumentam e diminuem dependendo das mudanças no PIB.

As vendas que você está prevendo seriam a variável dependente porque o valor "depende" do valor do PIB e o PIB seria a variável independente. Você precisaria determinar a força do relacionamento entre essas duas variáveis ​​para prever vendas. Se o PIB aumentar / diminuir 1%, quanto suas vendas aumentarão ou diminuirão?

Covariância

Cov (x, y) = ∑ (xn − xu) (yn − yu) N \ begin {alinhado} & Cov (x, y) = \ sum \ frac {(x_n - x_u) (y_n - y_u)} {N } \\ \ end {alinhado} Cov (x, y) = ∑N (xn-xu) (yn-yu)

A fórmula para calcular o relacionamento entre duas variáveis ​​é chamada covariância. Este cálculo mostra a direção do relacionamento. Se uma variável aumenta e a outra variável também tende a aumentar, a covariância seria positiva. Se uma variável sobe e a outra tende a cair, a covariância seria negativa.

O número real que você obtém ao calcular isso pode ser difícil de interpretar porque não é padronizado. Uma covariância de cinco, por exemplo, pode ser interpretada como um relacionamento positivo, mas a força do relacionamento só pode ser considerada mais forte do que se o número fosse quatro ou mais fraco do que se o número fosse seis.

Coeficiente de correlação

Correlação = ρxy = Covxysxsy \ begin {alinhado} & Correlação = \ rho_ {xy} = \ frac {Cov_ {xy}} {s_x s_y} \\ \ end {alinhado} Correlação = ρxy = sx sy Covxy O que outras pessoas estão dizendo

Precisamos padronizar a covariância para nos permitir melhor interpretá-la e usá-la na previsão, e o resultado é o cálculo da correlação. O cálculo da correlação simplesmente pega a covariância e a divide pelo produto do desvio padrão das duas variáveis. Isso vinculará a correlação entre um valor de -1 e +1.

Uma correlação de +1 pode ser interpretada para sugerir que ambas as variáveis ​​se movem perfeitamente positivamente uma com a outra e um -1 implica que elas estão perfeitamente negativamente correlacionadas. No exemplo anterior, se a correlação for +1 e o PIB aumentar 1%, as vendas aumentarão 1%. Se a correlação for -1, um aumento de 1% no PIB resultaria em uma redução de 1% nas vendas - exatamente o oposto.

Equação de Regressão

Agora que sabemos como é calculada a relação relativa entre as duas variáveis, podemos desenvolver uma equação de regressão para prever ou prever a variável que desejamos. Abaixo está a fórmula para uma regressão linear simples. O "y" é o valor que estamos tentando prever, o "b" é a inclinação da linha de regressão, o "x" é o valor do nosso valor independente e o "a" representa a interceptação em y. A equação de regressão descreve simplesmente a relação entre a variável dependente (y) e a variável independente (x).

y = bx + a \ begin {alinhado} & y = bx + a \\ \ end {alinhado} y = bx + a

A interceptação, ou "a", é o valor de y (variável dependente) se o valor de x (variável independente) for zero e, portanto, às vezes é simplesmente chamado de 'constante'. Portanto, se não houvesse mudança no PIB, sua empresa ainda efetuaria algumas vendas - esse valor, quando a variação do PIB é zero, é a interceptação. Dê uma olhada no gráfico abaixo para ver uma representação gráfica de uma equação de regressão. Neste gráfico, existem apenas cinco pontos de dados representados pelos cinco pontos no gráfico. A regressão linear tenta estimar uma linha que melhor se ajusta aos dados (uma linha de melhor ajuste) e a equação dessa linha resulta na equação de regressão.

Figura 1: Linha de melhor ajuste

Fonte: Investopedia

Regressões no Excel

Agora que você entendeu alguns dos antecedentes de uma análise de regressão, vamos fazer um exemplo simples usando as ferramentas de regressão do Excel. Vamos continuar com o exemplo anterior de tentar prever as vendas do próximo ano com base nas mudanças no PIB. A tabela a seguir lista alguns pontos de dados artificiais, mas esses números podem ser facilmente acessíveis na vida real.

AnoVendasPIB
20141001, 00%
20152501, 90%
20162752, 40%
20172002, 60%
20183002, 90%

Apenas observando a tabela, você pode ver que haverá uma correlação positiva entre vendas e PIB. Ambos tendem a subir juntos. Usando o Excel, tudo o que você precisa fazer é clicar no menu suspenso Ferramentas, selecionar Análise de Dados e, em seguida, escolher Regressão . A caixa pop-up é fácil de preencher a partir daí; seu intervalo de entrada Y é sua coluna "Vendas" e seu intervalo de entrada X é a alteração na coluna do PIB; escolha o intervalo de saída para o local em que deseja que os dados sejam exibidos na planilha e pressione OK. Você deve ver algo semelhante ao que é fornecido na tabela abaixo:

Coeficientes de Estatística de Regressão

R múltiplo0.8292243Interceptar34.58409

Praça R


0, 687613PIB88.15552
Ajustado
Praça R


0, 583484

-


-


Erro padrão51.021807-

-


Observações5

-


-


Interpretação

Os principais produtos com os quais você precisa se preocupar para a regressão linear simples são o quadrado R, o intercepto (constante) e o coeficiente beta (b) do PIB. O número do quadrado R neste exemplo é 68, 7% - isso mostra quão bem o nosso modelo prevê ou prevê vendas futuras, sugerindo que as variáveis ​​explicativas do modelo previram 68, 7% da variação na variável dependente. Em seguida, temos um intercepto de 34, 58, que nos diz que se a mudança no PIB fosse nula, nossas vendas seriam de cerca de 35 unidades. E, finalmente, o PIB beta ou coeficiente de correlação de 88, 15 nos diz que se o PIB aumentar em 1%, as vendas provavelmente aumentarão em cerca de 88 unidades.

A linha inferior

Então, como você usaria esse modelo simples em seus negócios ">

Obviamente, isso é apenas uma regressão simples e existem modelos que você pode construir que usam várias variáveis ​​independentes chamadas de regressões lineares múltiplas. Porém, várias regressões lineares são mais complicadas e têm vários problemas que precisariam de outro artigo para discutir.

Compare contas de investimento Nome do provedor Descrição Divulgação do anunciante × As ofertas que aparecem nesta tabela são de parcerias das quais a Investopedia recebe remuneração.
Recomendado
Deixe O Seu Comentário