R语言与虚拟变量模型
Posted GoatGui
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言与虚拟变量模型相关的知识,希望对你有一定的参考价值。
学习笔记
参考书籍:《计量经济学》-李子奈;《统计学:从数据到结论》-吴喜之;
虚拟变量模型
许多变量是可以定量度量的,如需求量、价格等,但也有一些因素无法定量度量,如职业、性别。为了能够在模型中反映这些因素的影响,并提高模型的精度,需要将它们’量化’,这种’量化’通常是通过引入虚拟变量来完成的。根据这些因素的属性类型,构造取’0’或’1’的人工变量。通常称为虚拟变量,记为D。
例如:反映性别的虚拟变量可取为:
一般地,在虚拟变量的设置中,基础类型和肯定类型取值为1; 比较类型和否定类型取值为0。同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型。
- 加法模型
若我们以员工薪金作为因变量,工龄作为一般解释变量,性别作为虚拟变量构造虚拟变量模型,则在模型中可以将虚拟变量以相加的形式引入模型,则该加法模型为:
以上是关于R语言与虚拟变量模型的主要内容,如果未能解决你的问题,请参考以下文章
R语言使用R基础安装中的glm函数构建乳腺癌二分类预测逻辑回归模型分类预测器(分类变量)被自动替换为一组虚拟编码变量summary函数查看检查模型使用table函数计算混淆矩阵评估分类模型性能
R语言构建xgboost模型:特征因子化独热编码( one-hot encoding)卡方检验判断预测变量与目标变量的相关性