决定系数是什么意思 _一文解答

什么是R平方,它有什么作用?

R平方是用于评估我们的回归模型的拟合优度的统计度量。 在R平方中,我们有一个基线模型,它是最差的模型。该基线模型没有使用任何独立变量来预测因变量Y的值。相反,它使用因变量Y的观测响应的平均值,并始终将该平均值预测为Y的值。 我们适合的任何回归模型都与该基线模型进行比较,以了解它是否合适。 换句话说,R-squared简单地解释了与基线模型相比,您的模型有多好
决定系数是什么意思 _一文解答
上图中的红线是基线模型,它总是预测因变量Y的观测响应的均值作为Y的值,而不考虑自变量的值。 绿线是我们的拟合模型,它利用自变量来预测因变量Y的值。

R平方的数学表示

R平方由下式给出
决定系数是什么意思 _一文解答
其中SSE是我们的回归模型的误差平方的总和
决定系数是什么意思 _一文解答
而SST是我们的基础模型的误差平方的总和。
决定系数是什么意思 _一文解答

R平方值可以取的范围是多少?

我们最糟糕的回归模型可能是基线模型本身。 因此,在这种情况下,SSE将等于SST。 所以R平方将等于 R平方= 1-1 = 0
决定系数是什么意思 _一文解答

这就是R平方= 0的模型的样子

我们最好的模型将是完美适合所有数据点的模型,所以在这种情况下SSE将为0。 所以,R平方= 1-0 = 1表示一个完美的模型。
决定系数是什么意思 _一文解答

与模型R平方接近1

所以R平方可以取0到1之间的值,其中接近于0的值表示不合适,而接近1的值表示完美契合。 如何解释R平方? 如果R平方= 0.93,则意味着因变量Y的93%变化由我们模型中存在的自变量解释。

使用R平方的缺陷

R-squared可以被人为地提高。也就是说,我们可以通过简单地向模型添加越来越多的自变量来增加R平方的值。 换句话说,在添加更多独立变量时,R平方不会减少。 有时候,这些变量中的一些可能非常微不足道,对我们的模型来说可能是无用的。 为什么会发生?
决定系数是什么意思 _一文解答
当SSE / SST最小时,R平方最大。 为了SSE / SST最低,SSE应该是最小的。 现在,随着我们向模型添加更多解释变量,SSE将会减少。这是因为我们在回归模型中添加了更多的解释变量,所以我们的回归模型会更好地拟合数据点,因此平方误差的总和会减少。因此即使变量对我们的模型不重要,R平方也会增加。 为了避免由R平方引起的这个问题,我们使用调整的R平方

调整R平方

调整后的R平方简单地惩罚了添加更多无用变量的模型。 调整的R平方由下式 给出
决定系数是什么意思 _一文解答
n =没有数据点 p =模型中不使用的独立变量

调整的R平方是如何工作的?

随着我们模型中增加自变量的 数量 ,n-p-1减少,所以如果我们除以
决定系数是什么意思 _一文解答
通过越来越小的数字,结果值将越来越大,并且当从1减去该值时,调整的R平方 将减小。 所以通过增加更多无用的变量,调整的R平方的值减小。 例 考虑以下数据
决定系数是什么意思 _一文解答
考虑使用x1和x2作为独立变量的模型1来预测变量y的值
决定系数是什么意思 _一文解答
这个模型的R平方= 0.909。调整的R平方为此计算为
决定系数是什么意思 _一文解答
现在,如果我们选择将另一个变量x3添加到我们以前的模型中
决定系数是什么意思 _一文解答
这个模型的R平方= 0.912,比我们以前的模型略高。调整的R平方为此计算为
决定系数是什么意思 _一文解答
注意在这个例子中,当我们将变量x3添加到我们的模型中时,R平方的值的增加(与之前的模型相比)非常小(0.003),除此之外分母的值已经从10降到9。因此调整R平方的结果值下降,表明x3对我们的模型不重要。 这很好解释了当我们向模型中添加越来越多的无用变量时,R值的平方值不会显着增加,调整的R值的平方值就会下降。

R平方与调整的R平方有什么不同?

R平方告诉你模型如何适合数据点,而调整的R平方告诉你模型的特定特征有多重要。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 787013311@qq.com 举报,一经查实,本站将立刻删除。
(0)
上一篇 2022-09-20 10:20:25
下一篇 2022-09-20 10:25:26

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注