![技术分享](https://o6v7e1w4j.qnssl.com/uploads/article/20160927/055f88c8574403f6851f854ed5bf06d5.JPG)
![技术分享](https://mmbiz.qpic.cn/mmbiz_jpg/f8nejt3QMP5MYdRq20sEwujdzf9wcVicLntOFmx2y3QUFjp53jnP6uiaNiaN7sxvEAXqhVfFCTNaSgOmehbycpwMQ/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)
前文:统计挖掘的一些事一些情(一)
![技术分享](https://mmbiz.qpic.cn/mmbiz/f8nejt3QMP7u9ibczvVqGYeHibSib6DgDYHzzHBTiaiacn4ricah6AqljLoscKBuCJQxgtbUy8tazxPECcj6eJRzwYdg/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)
实际上,无论是日常的统计学习还是挖掘学习中,回归分析都可以算是大家最早接触,也是整个体系当中相当重要的一个内容了,所以咱们这期就从回归分析说起吧。
![技术分享](https://mmbiz.qpic.cn/mmbiz/f8nejt3QMP7u9ibczvVqGYeHibSib6DgDYHroGPjibYVibFsiaVzsSyI04WQE2Mic3WcuRV1zZZOx1u19oibIB00Zh8vMA/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)
一般来说,借助回归分析,我们希望可以量化描述预测变量与响应变量的关系,同时帮助我们进行预测。其他的例子还有:广告的投入与市场销售的关系,受教育程度与收入的关系等。而在整个回归体系当中,最基础的莫过于普通最小二乘回归(Ordinary Least Square,简称OLS)
![技术分享](https://mmbiz.qpic.cn/mmbiz/f8nejt3QMP7u9ibczvVqGYeHibSib6DgDYH3VlPv0YHk31jYW2UA1kzI2aGVNbibDszedFClaQseukFCV4r6aN1MgQ/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)
![技术分享](https://mmbiz.qpic.cn/mmbiz/f8nejt3QMP7u9ibczvVqGYeHibSib6DgDYH8G8ds7ibskQSoXZB0bavB21MPRN9yQx5N5xzL9YRRTEH36zLmQfscicQ/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)
![技术分享](https://mmbiz.qpic.cn/mmbiz/f8nejt3QMP7u9ibczvVqGYeHibSib6DgDYHzEJFKicSY8ETd8kaka5PxB0Mdt3nKknF2zjg77U4eIkXWaBicicyaHEEw/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)
实际上,对于回归分析来说,我们需要有两件事情需要确认:(1)参数估计;(2)假设检验。
1:参数估计
![技术分享](https://mmbiz.qpic.cn/mmbiz_jpg/f8nejt3QMP5MYdRq20sEwujdzf9wcVicL7FVeHAy8WsScbhvPwT7C2VjD08yM9yoYwPr6l4MJReqpxNKJxtt1uA/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)
![技术分享](https://mmbiz.qpic.cn/mmbiz_jpg/f8nejt3QMP5MYdRq20sEwujdzf9wcVicLV1PLVnZNuZVmqegeVwOByWiawIyd2PVPuhubnbDGk9uActXZDnhyYibA/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)
实际上,上述的回归分析损失函数是一个凸函数;在机器学习中,我们一般会构造关于所求变量的凸函数,这更容易帮助我们取得最优解。
![技术分享](https://mmbiz.qpic.cn/mmbiz/f8nejt3QMP7u9ibczvVqGYeHibSib6DgDYHNlr5fmt94Vhp1LdrLDNodLvryUKAC6wLrFFn1C9xwicSliaZOXy6hbmg/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)
从上面的式子中,我们可以得知,在其他因素固定的情况下,身高每增加1cm,体重就平均增加2.085kg
![技术分享](https://mmbiz.qpic.cn/mmbiz/f8nejt3QMP7u9ibczvVqGYeHibSib6DgDYH3icTABnuBK14TPf7GjdaFQQCNCxeFQ7EF9FH9rO9WSpfIGQcza4qfFA/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)
2:假设检验
![技术分享](https://mmbiz.qpic.cn/mmbiz/f8nejt3QMP7u9ibczvVqGYeHibSib6DgDYHf9Q0IgUqtAMWjZKEajeYiasHrnqIh1CfbA9AoauLGSIgyqA50Vyq0TQ/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)
(1)t检验
![技术分享](https://mmbiz.qpic.cn/mmbiz/f8nejt3QMP7u9ibczvVqGYeHibSib6DgDYH4OicanfcU1uEj6xjCSH1TdwecDklbBjlBbxSZjXvAuQrlwXBBYDYcag/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)
![技术分享](https://mmbiz.qpic.cn/mmbiz_jpg/f8nejt3QMP5MYdRq20sEwujdzf9wcVicLeAxPmMH0RkWic5xmY4wCYZtsFSG3kXlKuVFPgrpLQRicYG07nKrvTDHA/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)
![技术分享](https://mmbiz.qpic.cn/mmbiz_jpg/f8nejt3QMP5MYdRq20sEwujdzf9wcVicLYOUibibepNxGcYIz5QzIw7v2NTCgXdfThTcsu5g85Sc6OUFB5vRmw0mg/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)
![技术分享](https://mmbiz.qpic.cn/mmbiz/f8nejt3QMP7u9ibczvVqGYeHibSib6DgDYHOHZ1VWtkKF9WJe1wsPFibBY1MFicicicoNhMoFJ58M6QicvtqJ1nlgQK4bg/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)
(2)相关系数r
![技术分享](https://mmbiz.qpic.cn/mmbiz/f8nejt3QMP7u9ibczvVqGYeHibSib6DgDYHYIpg1W4ggJJR5wrKULujzVnrhtm5v7KDgiaTa5dl6icicYDrm1cW6xNmg/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)
![技术分享](https://mmbiz.qpic.cn/mmbiz/f8nejt3QMP7u9ibczvVqGYeHibSib6DgDYHI8icmFiaKyfia0RQ5D8K4tLevYnByhS5FbxPAehtnXd1OCHjvFvE5LNfQ/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)
![技术分享](https://mmbiz.qpic.cn/mmbiz/f8nejt3QMP7u9ibczvVqGYeHibSib6DgDYHwiclSgWoWhjkF6veIibUSS39QwAA7hAF4bgEolJFfibBXmCy3UI42DKrA/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)
实际上,以我们考试为例。参数估计,有点像我们回答问题的过程;而假设检验,则是像检验我们刚刚回答是否达到标准的过程;
![技术分享](https://mmbiz.qpic.cn/mmbiz/f8nejt3QMP7u9ibczvVqGYeHibSib6DgDYHibKuTusEMgSM3R7UpSMEoIiaIeQdgP0wP4hNpPY2sHjjlH12OwghovnA/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)
![技术分享](https://mmbiz.qpic.cn/mmbiz/f8nejt3QMP7u9ibczvVqGYeHibSib6DgDYHwLg4Ec79HYpydZsGJa54WkPib35pvZQAJBkGK0eTVJPqlT3SYxwabAA/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)
![技术分享](https://mmbiz.qpic.cn/mmbiz/f8nejt3QMP7u9ibczvVqGYeHibSib6DgDYHUicOZCiaiaKtDESWaz1EK0tNlNibwTKvovhx8LY2AuWYH9M3R0xYVsa5yA/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)
接下来,我们简单谈谈利用SPSS Modeler的实现过程
直接回复公众号“回归分析”,将给你提供本次回归分析所使用的数据和建模文件的网盘链接
![技术分享](https://mmbiz.qpic.cn/mmbiz/f8nejt3QMP7u9ibczvVqGYeHibSib6DgDYHmXia2TbibPIXFfOngsMiaMHArbsJuspg5k76DWYkmkNtDuQ2YON0NZCKA/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)
![技术分享](https://mmbiz.qpic.cn/mmbiz/f8nejt3QMP7u9ibczvVqGYeHibSib6DgDYH5OMIl1B3r1Qnuiah5nEzG1cku4yVEdVIpzUaHribYjQrRowWiayFCO8jw/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)
![技术分享](https://mmbiz.qpic.cn/mmbiz/f8nejt3QMP7u9ibczvVqGYeHibSib6DgDYHJib2xR3tvTOsNS7icmG97gD55eMp6jGS2gBPJjzNsdmNxGktGUjAzgGA/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)
![技术分享](https://mmbiz.qpic.cn/mmbiz/f8nejt3QMP7u9ibczvVqGYeHibSib6DgDYHibJh89f0Z5HA9mOEj09Dz4Fia8xbfgibHPl9Mibmiccmtyov7kfuDQRYGGg/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)
![技术分享](https://mmbiz.qpic.cn/mmbiz/f8nejt3QMP7u9ibczvVqGYeHibSib6DgDYH8zGKxicu69dSsQ2PlCud8michSDLDiaNGF4dGbic0flwtrvB3XiboKyIhkA/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)
![技术分享](https://mmbiz.qpic.cn/mmbiz_png/f8nejt3QMP5MYdRq20sEwujdzf9wcVicLt6ia4L0AO2fFViag2ZQEedw4Xt6lEPPvpJw3r3G70fYDSghXwDg1mRiaw/640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=1)
从上述分析结果中,我们可以看到系数检验表(Coefficients),无论是常数项还是身高的系数项对应的P值都是小于0.05,认为系数显著,可以写出回归方程:体重=2.085 ? 身高 ? 290.4。另外我们通过ModelSummary可以看到,该回归方程的相关系数r=0.997,说明体重与身高有非常强的线性相关。至于中间的ANOVA表格,则是F检验的结果,我们留待下节介绍。
![技术分享](https://mmbiz.qpic.cn/mmbiz/f8nejt3QMP7u9ibczvVqGYeHibSib6DgDYHrqqFwib0wMXv1ibCAbCibPiae5eDC1PxmSRh14POCribFkv04ylfTWkvULA/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1)