用微表格能做回归分析?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了用微表格能做回归分析?相关的知识,希望对你有一定的参考价值。

参考技术A 1、 先看回归统计表,Multiple R即相关系数R的值,和我们之前做相关分析得到的值一样,大于0.8表示强正相关。

2、 回归统计表中的R Square是R平方值,R平方即R的平方,又可以叫判定系数、拟合优度,取值范围是[0,1],R平方值越大,表示模型拟合的越好。一般大于70%就算拟合的不错,60%以下的就需要修正模型了。这个案例里R平方0.9054,相当不错。

3、 Adjusted R是调整后的R方,这个值是用来修正因自变量个数增加而导致模型拟合效果过高的情况,多用于衡量多重线性回归。

4、 第二张表,方差分析表,df是自由度,SS是平方和,MS是均方,F是F统计量,Significance F是回归方程总体的显著性检验,其中我们主要关注F检验的结果,即Significance F值,F检验主要是检验因变量与自变量之间的线性关系是否显著,用线性模型来描述他们之间的关系是否恰当,越小越显著。这个案例里F值很小,说明因变量与自变量之间显著。

5、 残差是实际值与预测值之间的差,残差图用于回归诊断,回归模型在理想条件下的残差图是服从正态分布的。

6、 第三张表我们重点关注P-value,也就是P值,用来检验回归方程系数的显著性,又叫T检验,T检验看P值,是在显著性水平α(常用取值0.01或0.05)下F的临界值,一般以此来衡量检验结果是否具有显著性,如果P值>0.05,则结果不具有显著的统计学意义,如果0.01<P值<0.05,则结果具有显著的统计学意义,如果P<=0.01,则结果具有极其显著的统计学意义。T检验是看某一个自变量对于因变量的线性显著性,如果该自变量不显著,则可以从模型中剔除。

7、 从第三张表的第一列我们可以得到这个回归模型的方程:y=4361.486+1.198017x,此后对于每一个输入的自变量x,都可以根据这个回归方程来预测出因变量Y。
参考技术B 用微表格能做回归分析?excel是日常生活中常用的数据处理工具,excel可以用来对数据做回归分析。那么应该怎么用excel做回归分析呢?下面以office 365中的excel为例,一起来看看吧。
工具原料office 365 excel
方法/步骤分步阅读
1
/13
首先打开电脑上的excel,在方框处输入要做回归分析的数据,此处以两组数据,身高x和体重y为例,输入数据如下图所示。
2
/13
接着点击箭头处的“文件”按钮,可以看到最下方的“选项”。
3
/13
点击箭头处的“选项”按钮,进入excel选项界面,可以看到“加载项”。
4
/13
下面点击箭头处“加载项”按钮,选择“分析工具库”,点击下方箭头处“转到”按钮。
5
/13
进入加载项界面后,勾选“分析工具库”前面的方框,点击箭头处“确定”按钮。
6
/13
接着点击方框处的“数据”,箭头处即可看到“数据分析”工具。
7
/13
点击“数据分析”按钮,在分析工具中找到“回归”,接着点击箭头处“确定”。
8
/13
进入回归分析界面,首先选择“Y值输入区域”,点击箭头处即可开始选择。
9
/13
用方框选中体重y下面的单元格,点击上方箭头处图标即可。
10
/13
接着选择“X值输入区域”,点击箭头处即可开始选择X值。
11
/13
用方框选中身高x下面的单元格,点击上方箭头处图标即可。
12
/13
下面勾选“置信度”前面的方框,此处置信度为95%。点击箭头处“确定”即可开始回归分析。
13
/13
回归分析完成后,在界面上即可看到回归分析结果,如下图所示。
注意事项
office 365 excel
内容仅供参考并受版权保护
参考技术C 回归分析是一种应用广泛的统计分析方法,在金融,医学等领域都已经成功应用,而且是比较简单也比较常用的算法了,是经得起考验的,结果解读也很友好。

这次我们就先以最常见的Excel表格来做回归分析,Excel表格的功能远比我们想的强大(一般的回归分析,只要是数据量不是很大,Excel完全可以搞得定,而且上手十分容易,不需要一行代码,就可以轻松搞定)
一般是利用最小二乘法来计算出回归模型的参数值。但是得到的回归方程到底有没有统计学意义,还需要对回归方程进行各种检验,主要是回归方程显著性检验,回归系数显著性检验,残差分析等。

数据集:波士顿房价数据

波士顿房价数据已被用于许多涉及回归问题的机器学习论文中,所有我们拿这个成熟的数据集来预测房价练练手!数据如下:

CRIM 城镇人均犯罪率

ZN 占地面积超过2.5万平方英尺的住宅用地比例

INDUS 城镇非零售业务地区的比例

CHAS 查尔斯河虚拟变量 (= 1 如果土地在河边;否则是0)

NOX 一氧化氮浓度(每1000万份)

RM 平均每居民房数

AGE 在1940年之前建成的所有者占用单位的比例

DIS 与五个波士顿就业中心的加权距离

RAD 辐射状公路的可达性指数

TAX 每10,000美元的全额物业税率

PTRATIO 城镇师生比例

B 1000(Bk - 0.63)^2 其中 Bk 是城镇的黑人比例

LSTAT 人口中地位较低人群的百分数

MEDV 以1000美元计算的自有住房的中位数

做回归分析前,先看下特征的相关性,如下:

注:Excel内置的相关系数是pearson相关系数

好像和价格的相关性都差不多,那我们做一个回归拟合看看,Excel界面如下:

得到结果如下:

残差图

特征残差拟合图

注:回归方程的显著性检验是F检验也就是方差分析,回归方程系数检验是T检验

结果说明:

1,回归统计:R Square表示拟合度,就是方程对数据的拟合程度,当然是越大越好,此时为0.74

2,方差分析:F=108.057,这个F是啥?是F统计量,回归方程的显著性检验是用的F检验,sig F=6.9468E-135 <0.05,所有这个方程是显著的,有意义的!

3,回归系数coefficient显著性,看T——Start值,看特征对于的P值,如图:特征INDUS,AGE对应的T统计量均小于1,P值大于0.05,说明这两个系数与y(price)的线性关系不显著,不应该保留在回归方程中,也可以再结合特征残差拟合图来看一下特征的有效性

看来得把这两个线性关系不显著的特征去掉之后再重新做回归!

这一次的回归方程和回归系数都有显著性,但是这个R Square=0.740545,好像和不剔除变量没什么差别,甚至还小一点,这就有点尴尬了。

整体的方程拟合度才0.74,效果不是很好。

我们用python来做一下看看
首先来筛选特征,有两种方法SelectKBest和f_regression

注:f_regression 是单因素线性回归F检验,SelectKBest方法可以调用检验方法,如:卡方检验chi2,还有针对分类的方差分析的f_classif,当然也可以调用f_regression方法,还可以选择前k个分数较高的特征,去掉其他的特征。所以这个方法更强大,推荐使用这个。

结果如下:

这两种方法得到的结果一样,对应的特征的P值都小于0.05,没法去掉一些特征

再注:目前python提供的有方差分析,卡方检验的方法,但是一直没有发现T检验的方法。可能是因为T检验其实也算是一种F检验的缘故吧,至于是不是因为这,我也不知道,这只是我猜的!但是用Excel做的时候即使去掉两个不显著的特征,好像对回归结果没有什么大的影响,所有在python中干脆都显著了,

数据分成训练集和测试集,通过在训练集和测试集上的得分对比来判断是否过拟合还是欠拟合,可以直接得到回归系数和截距,如下如:

从结果看,回归方程的拟合度在0.73左右,和用Excel做的差不多,没有提高,反而略微降低了。

绘制交叉验证预测图

从结果看,拟合的并不是很好。

后记:

结合Excel和python做的回归方程拟合度都是在0.74左右,效果只能是一般,看来得换一种方法来做。

简单问题用Excel表格去做回归(该案例是一元线性回归)

比如有这样一组数据(原始数据)

这是数据字典(必须要有!)

已知月均信用卡支出为因变量

如果我们想查看这个人的收入和月均信用卡支出是否有显著的相关性,以及它们之间的数量关系。
可以把这两列数据复制到一个新的工作表中

我们想看收入和支出的数量关系
首先:文件→选项→加载项;查看数据分析库是否在活用应用程序加载项中,若在不在,那么肯定在非活动应用程序加载项中,就要把它转到活动应用程序加载项里面

这样的话,在数据里面就有数据分析这项功能了

具体步骤如下
①对缺失值进行处理,可以用均值进行填补。
average函数得出均值

然后筛选第一列:开始→排序和筛选→筛选
取消全选,选中空白,点击确定

这样就会把所有缺失值筛选出来

再用刚刚算出来的平均数去填补缺失值

没有了缺失值,就可以正常去操作数据了
②数据→数据分析→回归→确定

会弹出这个框,我们先把Y值区域和X区域选中进去


第一行有标签行的话,就要勾选标志这个选项,这样计算机在计算的时候就会忽略标签行

点击确定,会得到下列数据

最后两行数据就是回归结果

Intercept这一行不管,我们重点是看第二行Income

以上是关于用微表格能做回归分析?的主要内容,如果未能解决你的问题,请参考以下文章

回归分析

如何将回归分析的系数导出到电子表格或 csv 文件?

采用SPSS17.0进行二元logistic回归分析方法筛查某种疾病易患因素,所得结果“不在方程中变量”OR值的计算

spss回归分析结果图,帮忙看一下,麻烦详细地解释解释

多元线性回归 协整检验怎么做?

多元线性回归方程公式