Introdução à Regressão Linear e Correlação
Descubra como a regressão linear e a correlação podem ajudar você a entender e prever relacionamentos entre variáveis.
Conceitos Básicos de Estatística
Variáveis
Quantidades que podem variar e são medidas ou observadas em um estudo estatístico.
Dados
Coleção de valores de variáveis coletados em um estudo estatístico.
Relação Entre Variáveis
Como as variáveis mudam em relação umas às outras, expressas como correlação ou regressão.
O que é Regressão Linear?
Uma técnica estatística que investiga a relação linear entre uma variável dependente (resposta) e uma ou mais variáveis independentes (preditoras).
Tipos de Regressão Linear

1

Regressão linear simples: usa apenas uma variável independente para prever a variável dependente.

2

Regressão linear múltipla: usa duas ou mais variáveis independentes para prever a variável dependente.
Regressão Linear Simples
Utiliza uma única variável independente para prever a variável dependente. A relação linear entre as variáveis é representada por uma reta.
Regressão Linear Múltipla
Utiliza duas ou mais variáveis independentes para prever a variável dependente. A relação é representada por um plano ou hiperplano.
O Método dos Mínimos Quadrados
Um método para encontrar a reta de regressão que minimiza a soma dos quadrados dos erros, ou seja, a distância vertical entre os pontos de dados e a reta.
Pressupostos da Regressão Linear
Linearidade
A relação entre as variáveis ​​independentes e a variável dependente é linear.
Normalidade
Os erros de regressão são normalmente distribuídos.
Homoscedasticidade
A variância dos erros de regressão é constante para todos os valores da variável independente.
Independência
Os erros de regressão são independentes um do outro.
Interpretação dos Coeficientes de Regressão
Os coeficientes de regressão representam a inclinação e a interceptação da reta de regressão. A inclinação indica a mudança na variável dependente para cada unidade de mudança na variável independente. A interceptação é o valor da variável dependente quando a variável independente é zero.
Coeficiente de Determinação (R²)
Representa a proporção da variância da variável dependente explicada pela variável independente. Um R² alto indica que o modelo de regressão explica grande parte da variância da variável dependente.
Erro Padrão da Estimativa
Uma medida da variabilidade dos erros de regressão. Um erro padrão baixo indica que o modelo de regressão está bem ajustado aos dados.
Análise de Variância (ANOVA) na Regressão
Uma técnica para testar a significância geral do modelo de regressão. O F-statistic é usado para determinar se a variável independente explica uma quantidade significativa da variância na variável dependente.
Teste de Hipóteses na Regressão Linear
Usado para testar a significância dos coeficientes de regressão. O p-value é usado para determinar se há evidências suficientes para rejeitar a hipótese nula de que o coeficiente de regressão é zero.
Intervalos de Confiança na Regressão
Um intervalo que estima o valor verdadeiro do coeficiente de regressão com uma determinada probabilidade. Os intervalos de confiança são usados para indicar a incerteza na estimativa do coeficiente.
Previsão e Intervalos de Predição
A regressão linear pode ser usada para prever o valor da variável dependente para um valor específico da variável independente. Os intervalos de predição são usados para indicar a incerteza na previsão do valor da variável dependente.
Diagnóstico de Resíduos
Analisar os resíduos, a diferença entre os valores observados e os valores previstos, para identificar se os pressupostos da regressão linear estão sendo violados.
Multicolinearidade
Quando as variáveis independentes estão altamente correlacionadas, dificultando a estimativa independente dos efeitos de cada variável.
Heterocedasticidade
Quando a variância dos erros de regressão não é constante para todos os valores da variável independente.
Autocorrelação
Quando os erros de regressão estão correlacionados com os erros de outros pontos de dados, geralmente em dados de séries temporais.
Transformações de Variáveis
Transformar as variáveis ​​independentes ou dependentes para linearizar a relação entre as variáveis ​​e melhorar o ajuste do modelo de regressão.
Seleção de Variáveis
Identificar o subconjunto mais adequado de variáveis ​​independentes a serem incluídas no modelo de regressão para melhorar o desempenho e a interpretação do modelo.
Regressão Polinomial
Um tipo de regressão linear que usa polinômios para modelar a relação entre variáveis ​​quando a relação não é linear.
Regressão Logística
Um tipo de regressão usado para prever a probabilidade de um evento discreto, como sucesso ou falha, com base em uma ou mais variáveis ​​independentes.
Introdução à Correlação
Uma medida da força e direção da relação linear entre duas variáveis. Um coeficiente de correlação positivo indica uma relação direta, enquanto um negativo indica uma relação inversa.
Coeficiente de Correlação de Pearson
Uma medida da correlação linear entre duas variáveis ​​contínuas. O coeficiente de correlação de Pearson varia de -1 a 1, onde -1 indica uma correlação negativa perfeita, 1 indica uma correlação positiva perfeita e 0 indica nenhuma correlação.
Coeficiente de Correlação de Spearman
Uma medida da correlação de posto entre duas variáveis. O coeficiente de correlação de Spearman é usado quando as variáveis ​​não são normalmente distribuídas ou quando a relação entre as variáveis ​​é não linear.
Interpretação e Significância da Correlação
Um coeficiente de correlação alto indica uma forte relação linear entre as variáveis, enquanto um coeficiente baixo indica uma relação fraca ou nenhuma relação.
Correlação Parcial
Uma medida da relação entre duas variáveis, controlando o efeito de uma ou mais variáveis ​​terceiras. A correlação parcial é usada para determinar a correlação entre duas variáveis ​​quando o efeito de outras variáveis ​​é removido.
Aplicações Práticas de Regressão e Correlação
A regressão linear e a correlação são usadas em uma variedade de campos para prever resultados, analisar dados e tomar decisões informadas.
Ferramentas e Software para Análise de Regressão e Correlação
Existem vários softwares estatísticos disponíveis para realizar análise de regressão e correlação. Esses softwares fornecem ferramentas para realizar a regressão, interpretar resultados e gerar gráficos e tabelas.