推理分析和预测分析有啥区别?

Posted

技术标签:

【中文标题】推理分析和预测分析有啥区别?【英文标题】:What is the difference between inferential analysis and predictive analysis?推理分析和预测分析有什么区别? 【发布时间】:2016-03-31 21:22:33 【问题描述】:

目标

为了通过具有哪些特征或属性来澄清,我可以说分析是推理性的或预测性的。

背景

参加涉及推理和预测分析的数据科学课程。解释(我所理解的)是

推理

从群体中的小样本中得出一个假设,并在更大/整个群体中看到它是正确的。

在我看来,这是一种概括。我认为诱导性吸烟导致肺癌或二氧化碳导致全球变暖是推论分析。

预测

通过测量对象的变量来归纳出可能发生的事情的陈述。

我认为,确定人们对哪些特征、行为、言论的反应有利,并使总统候选人足够受欢迎以成为总统是一种预测分析(这也在课程中涉及)。

问题

我对这两者有点混淆,因为在我看来有一个灰色区域或重叠。

Bayesian Inference 是“推理”,但我认为它用于预测,例如垃圾邮件过滤器或欺诈性金融交易识别。例如,银行可以使用先前对变量(如 IP 地址、发起国、受益人账户类型等)的观察,并预测交易是否具有欺诈性。

我认为theory of relativity 是一种推理分析,它从观察和思想实验中得出一个理论/假设,但它也预测光的方向会弯曲。

请帮助我了解什么是必须具备的属性,以便将分析归类为推理性或预测性。

【问题讨论】:

【参考方案1】:

"What is the question?" by Jeffery T. Leek, Roger D. Peng 很好地描述了典型数据科学工作流程中的各种分析类型。具体解决您的问题:

推理数据分析量化观察到的模式是否 可能会超出手头的数据集。这是最常见的 正式科学文献中的统计分析。一个例子 是一项关于空气污染是否与预期寿命相关的研究 美国的州级 (9)。在非随机 实验,通常只能确定存在 两个测量之间的关系,但不是基础 机制或原因。

超越推理数据分析,量化 人口规模的关系,预测数据分析使用 测量的子集(特征)来预测另一个测量 (结果)对一个人或一个单位。网站之类的 FiveThirtyEight.com 使用民意调查数据来预测人们将如何投票 在一次选举中。预测性数据分析仅表明您可以 从另一个测量中预测一个测量值;他们不一定解释 为什么这种预测选择有效。

【讨论】:

【参考方案2】:

两者之间存在一些灰色地带,但我们仍然可以做出区分。

推论统计是指您试图了解导致特定结果的原因。在此类分析中,特别关注自变量,您希望确保拥有可解释的模型。例如,您在一项研究中检查吸烟是否会导致肺癌的例子是推论性的。在这里,您试图仔细研究导致肺癌的因素,而吸烟恰好是其中之一。

在预测分析中,您更感兴趣的是使用某个数据集来帮助您预测结果变量值的未来变化。在这里,您可以使您的模型尽可能复杂,以至于只要它完成工作,它就无法解释。一个更简单的例子是一家房地产投资公司,它有兴趣确定哪些变量组合可以预测某个房产的最优惠价格,以便它可以获取它们以获取利润。潜在的预测因素可能是社区收入、犯罪、教育状况、到海滩的距离和种族构成。这里的主要目的是获得这些变量的最佳组合,从而更好地预测未来的房价。

这就是它变得模糊的地方。假设您对中年男性进行了一项研究,以确定患心脏病的风险。为此,您需要测量体重、身高、种族、收入、婚姻状况、胆固醇、教育程度,以及一种称为“mx34”(只是虚构)的潜在血清化学物质。假设您发现这种化学物质确实是心脏病的一个很好的危险因素。您现在已经实现了推理目标。但是,您对自己的新发现感到满意,并开始怀疑是否可以使用这些变量来预测谁可能患心脏病。您希望这样做是为了推荐预防措施来预防未来的心脏病。

【讨论】:

感谢您的回答。我认为推理分析从一小部分人群中得出结果或发现(对患者进行抽样以发现热病的危险因素)。然后看看是否适用于更大的人群,以判断其中哪些人可能患有心脏病,在我看来,这与预测分析相同。那么推理分析包含预测分析(预测是推理的一部分/子集)? 或者……只要我试图根据观察来判断可能发生的事情,它就被称为预测性的,而推理分析本质上是预测性的,因为它在更大的范围内尝试假设(对会发生什么的预期)人口? 我会同意你的第一条评论。推断总是关于我们试图从精心挑选的样本中理解/推断的总体。另一方面,我不确定我是否会称之为假设检验预测。【参考方案3】:

我正在阅读的同一篇学术论文对我提出了这个问题,也给出了答案(来自加州大学伯克利分校的统计学家 Leo Breiman):

• 预测。能够预测响应将是什么 到未来的输入变量;

• [推断]。23 [推断] 自然如何关联响应 变量到输入变量。

来源:http://courses.csail.mit.edu/18.337/2015/docs/50YearsDataScience.pdf

【讨论】:

以上是关于推理分析和预测分析有啥区别?的主要内容,如果未能解决你的问题,请参考以下文章

关于飞桨UIE等模型预测推理时间很久的问题分析以及解决,蒸馏剪枝部署问题解决

关于飞桨UIE等模型预测推理时间很久的问题分析以及解决,蒸馏剪枝部署问题解决

R语言使用cmprsk包的crr函数进行生存资料的多因素竞争风险分析使用predict.crr函数进行多因素竞争风险模型的预测推理分析

商业智能和预测性分析之间的相似之处

请问用简单的BP神经网络对33个输入因素进行分析,然后预测,请问精度会会好吗?能有啥方法改进吗?

基于Python的二手房数据分析与预测系统的设计与实现 对社会有啥帮助