1、共线性问题共有以下五种解决办法:1. 手动移除出共线性的自变量先做下相关分析,如果发现某两个自变量X(解释变量)的相关系数值大于0.7,则移除掉一个自变量(解释变量),然后再做回归分析。但此种办法有一个小问题,即有的时候根本就不希望把某个自变量从模型中剔除,如果有此类情况,可考虑使用逐步回归让软件自动剔除,同时更优的办法可能是使用岭回归进行分析。
2、 逐步回归法让软件自动进行自变量的选择剔除,逐步回归会将共线性的自变量自动剔除出去。此种解决办法有个问题是,可能算法会剔除掉本不想剔除的自变量,如果有此类情况产生,此时最好是使用岭回归进行分析。
3、 增加样本容量增加样本容量是解释共线性问题的一种办法,但在实际操作中可能并不太适合,原因是样本量的收集需要成本时间等。
4、 岭回归上述第1和第2种解决办法在实际研究中使用较多,但问题在于,如果实际研究中并不想剔除掉某些自变量,某些自变量很重要,不能剔除。此时可能只有岭回归最为适合了。岭回归是当前解决共线性问题最有效的解释办法,但是岭回归的分析相对较为复杂,后面会提供具体例子,当然也可以参考SPSSAU官网岭回归说明。
5、 利用因子分析合并变量共线性问题的解释办法是,理论上可以考虑使用因子分析(或者主成分分析),利吹涡皋陕用数学变换,将数据降维提取成几个成分,即把信息进行浓缩,最后以浓缩后的信息作为自变量(解释变量)进入 模型进行分析。此种解释办法在理论上可行,而且有效。但实际研究中会出现一个问题,即本身研究的X1,X2,X3等,进行了因子分析(或主成分)后,变成成分1,成分2类似这样的了,意义完全与实际研究情况不符合,这导致整个研究的思路也会变换,因而此种办法适用于探索性研究时使用,而不适合实际验证性研究。