Coeficiente de determinação
Coeficiente de determinação , nas estatísticas, R dois(ou r dois), uma medida que avalia a capacidade de um modelo de prever ou explicar um resultado na configuração de regressão linear. Mais especificamente, R doisindica a proporção da variância na variável dependente ( Y ) que é previsto ou explicado por regressão linear e a variável preditora ( X , também conhecida como variável independente).
Em geral, um alto R doisvalor indica que o modelo é um bom ajuste para os dados, embora as interpretações de ajuste dependam do contexto de análise. A R doisde 0,35, por exemplo, indica que 35% da variação no resultado foi explicada apenas pela previsão do resultado usando as covariáveis incluídas no modelo. Essa porcentagem pode ser uma porção muito alta de variação para prever em um campo como as ciências sociais; em outras áreas, como as ciências físicas, seria de esperar R doisestar muito mais perto de 100 por cento. O mínimo teórico R doisé 0. No entanto, uma vez que a regressão linear é baseada no melhor ajuste possível, R doisserá sempre maior que zero, mesmo quando as variáveis de previsão e de resultado não têm relação entre si.
R doisaumenta quando uma nova variável preditora é incluída no modelo, mesmo se o novo preditor não estiver associado ao resultado. Para dar conta desse efeito, o R dois(normalmente denotado com uma barra sobre o R dentro R dois) incorpora as mesmas informações usuais R doismas também penaliza pelo número de variáveis preditoras incluídas no modelo. Como resultado, R doisaumenta à medida que novos preditores são adicionados a um modelo de regressão linear múltipla, mas o R doisaumenta apenas se o aumento em R doisé maior do que se esperaria apenas do acaso. Em tal modelo, o ajustado R doisé a estimativa mais realista da proporção da variação prevista pelas covariáveis incluídas no modelo.
Quando apenas um preditor é incluído no modelo, o coeficiente de determinação é matematicamente relacionado ao coeficiente de correlação de Pearson, r . O quadrado do coeficiente de correlação resulta no valor do coeficiente de determinação. O coeficiente de determinação também pode ser encontrado com a seguinte fórmula: R dois= M S S / T S S = ( T S S - R S S ) / T S S , Onde M S S é a soma dos quadrados do modelo (também conhecido como É S S , ou soma de quadrados explicada), que é a soma dos quadrados da previsão da regressão linear menos a média para essa variável; T S S é a soma total dos quadrados associados à variável de resultado, que é a soma dos quadrados das medições menos sua média; e R S S é a soma residual dos quadrados, que é a soma dos quadrados das medições menos a previsão da regressão linear.
O coeficiente de determinação mostra apenas associação. Tal como acontece com a regressão linear, é impossível usar R doispara determinar se uma variável causa a outra. Além disso, o coeficiente de determinação mostra apenas a magnitude da associação, não se essa associação é estatisticamente significativa.
Compartilhar: