美文网首页R语言与统计分析
多重共线性问题相关

多重共线性问题相关

作者: fun游乐场 | 来源:发表于2017-06-08 22:46 被阅读106次

多元回归分析中的共线性问题

原创 2015-11-13 ccccfys spss统计分析

多重共线性:回归模型中,两个或者两个以上的自变量彼此相关时,称回归模型中存在多重共线性。

为什么多重共线性会导致一系列问题呢?试想一下,假如两个变量完全共线性,设两个变量为A,B.那么A=xB,x是常数。如果把这两个变量带入回归方程,由于一个变量完全可以用另外一个变量乘以一个常数来表示,带入两个变量,就需要给他们分配系数,怎么分配呢,显然有很多种可能,而计算机并不知道哪一种是最好的,但是在输出结果时,它会给你一种,管它是不是你想要的呢,它只关心跑完了自己的程序。现实中的共线性问题一般不会是完全共线性,但有时候共线性问题会很严重,具体有相关指标,请看下面其他内容。

多重共线性导致的问题:

1)线性关系显著(F检验显著,或者回归关系显著),大部分回归系数却不显著;

2)回归系数的符号与理论或者预期不符合。

多重共线性的识别:

1)各自变量之间显著相关(使用散点图矩阵和相关系数矩阵)

2)线性关系检验显著(F检验显著),各自变量系数却大多数不显著

3)回归系数正负号与预期相反

4)容忍度(tolerance)小于0.1或者方差扩大因子(VIF)大于10,认为存在严重共线性

多重共线性问题的处理

1)删除相关性很强的两个自变量中的一个,或者删除多个相关性很强的自变量中的几个变量;

2)提取主成分,将多个相关性很强的变量包含的信息浓缩到一个变量中;

什么时候可以不关心多重共线性问题呢?

1)模型不是用来解释现实事物之间的关系,因此不用进行系数的检验,不用考虑多重共线性问题;

2)利用回归方程在自变量样本值范围内预测因变量(注意自变量的取值只能在自变量最小值和最大值范围内)由于是进行预测,只关心结果,不考虑过程。

相关文章

  • 出现多重共线性问题,如何处理?

    在进行线性回归分析时,容易出现自变量(解释变量)之间彼此相关,这种情况被称作多重共线性问题。 适度的多重共线性不成...

  • 多重共线性问题相关

    多元回归分析中的共线性问题 原创 2015-11-13 ccccfys spss统计分析 多重共线性:回归模型中,...

  • 多重共线性案例

    SPSSAU处理多重共线性问题 一、说明 当回归模型中两个或者两个以上的自变量高度相关(比如相关系数大于0.7)时...

  • 皮尔森相关系数

    多个属性间的相关性很高(相关系数>0.7),即多重共线性(multicollinearity),往往会导致预测结果...

  • 多重共线性, 2022-06-21

    (2022.06.21 Tues)回归分析中,两个或以上自变量之间存在的相关性,称为多重共线性multicolli...

  • 在Python中实现多重共线性的可视化

    在Python中实现多重共线性的可视化 网络图的胜利。 简介什么是多重共线性? 多重共线性是指两个或更多的特征之间...

  • 【问题积累】

    1.多重共线性 @2020-2-15 问题来源:pandas.get_dummies函数中的drop_firs...

  • 多重共线性、异方差和自相关性

    1.多重共线性 多重共线性是解释变量存在线性关系或者近似的线性关系,多重共线性影响的模型一般为底层是线性的模型,例...

  • 多重共线性(multicollinearity)问题

    建立多元线性回归的前提之一是:不存在多重共线性(Multicollinearity)。检验变量之间是否存在共线性问...

  • 关于多重共线性的一点感想

    多重共线性是指多变量线性回归中,变量之间由于存在高度相关关系而使回归估计不准确。比如虚拟变量陷阱(英语:Dummy...

网友评论

    本文标题:多重共线性问题相关

    本文链接:https://www.haomeiwen.com/subject/ecxxqxtx.html