分类数据和连续数据在逻辑回归中如何设值
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了分类数据和连续数据在逻辑回归中如何设值相关的知识,希望对你有一定的参考价值。
在逻辑回归中设值方法如下所述:分类数据由用户或专家在模式级显式地说明属性的偏序:通常,分类属性或维的概念分层涉及一组属性。连续数据在一定区间内可以任意取值、数值是连续不断的、相邻两个数值可作无限分割。 参考技术A 逻辑回归通常用于解决分类问题,比如:客户是否该买某个商品,借款人是否会违约等。实际上,“分类”是逻辑回归的目的和结果,中间过程依旧是“回归”,因为通过逻辑回归模型,我们得到的是0-1之间的连续数字,即概率,类似借款人违约的可能性。然后给这个可能性加上一个阈值,就变成了分类。 参考技术B 逻辑回归通常用于解决分类问题,比如:客户是否该买某个商品,借款人是否会违约等。实际上,“分类”是逻辑回归的目的和结果,中间过程依旧是“回归”,因为通过逻辑回归模型,我们得到的是0-1之间的连续数字,即概率,类似借款人违约的可能性。然后给这个可能性加上一个阈值,就变成了分类。 参考技术C . 逻辑回归是分类问题,用于实现二分类问题
2. 实现方式:利用线性模型计算,在逻辑函数作用下产生分类
3. 多分类实现:
如何在Likert量表上测量的自变量应该在二元逻辑回归中作为连续变量或序数变量来处理?
在我的研究中,因变量是二进制编码为0和1,独立变量是类别变量和变量的组合,以5分量表的比例尺度进行测量。根据我想要执行二元逻辑回归的数据,但有点混淆我应该如何处理那些在Likert量表上测量的自变量。这些应该被视为连续变量还是有序变量?根据我的知识,逻辑回归仅处理分类和连续的独立变量。如果按照衡量标准衡量的变量是顺序相当连续的统计工具我应该应用吗?
答案
这是一个非常有争议的问题。我建议你阅读以下链接。无论如何,这取决于您的研究设计和您对结果的等待:
http://www.theanalysisfactor.com/can-likert-scale-data-ever-be-continuous/ https://www.researchgate.net/publication/266212127_Five-Point_Likert_Items_t_Test_Versus_Mann-Whitney-Wilcoxon https://stats.stackexchange.com/questions/86923/effect-of-two-demographic-ivs-on-survey-answers-likert-scale
根据我的观点,不可能将它们视为连续的价值观。也许你应该问这个社区:
https://stats.stackexchange.com
以上是关于分类数据和连续数据在逻辑回归中如何设值的主要内容,如果未能解决你的问题,请参考以下文章