R语言与虚拟变量模型

Posted GoatGui

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言与虚拟变量模型相关的知识,希望对你有一定的参考价值。

学习笔记
参考书籍:《计量经济学》-李子奈;《统计学:从数据到结论》-吴喜之;


虚拟变量模型

许多变量是可以定量度量的,如需求量、价格等,但也有一些因素无法定量度量,如职业、性别。为了能够在模型中反映这些因素的影响,并提高模型的精度,需要将它们’量化’,这种’量化’通常是通过引入虚拟变量来完成的。根据这些因素的属性类型,构造取’0’或’1’的人工变量。通常称为虚拟变量,记为D。

例如:反映性别的虚拟变量可取为:
R语言与虚拟变量模型_取值
一般地,在虚拟变量的设置中,基础类型和肯定类型取值为1; 比较类型和否定类型取值为0。同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型



  • 加法模型

若我们以员工薪金R语言与虚拟变量模型_R语言_02作为因变量,工龄R语言与虚拟变量模型_取值_03作为一般解释变量,性别R语言与虚拟变量模型_R语言_04作为虚拟变量构造虚拟变量模型,则在模型中可以将虚拟变量R语言与虚拟变量模型_R语言_04以相加的形式引入模型,则该加法模型为:
以上是关于R语言与虚拟变量模型的主要内容,如果未能解决你的问题,请参考以下文章

R语言一般线性模型(涉及因变量是虚拟变量(哑变量))

R语言一般线性模型(涉及因变量是虚拟变量(哑变量))

R语言使用R基础安装中的glm函数构建乳腺癌二分类预测逻辑回归模型分类预测器(分类变量)被自动替换为一组虚拟编码变量summary函数查看检查模型使用table函数计算混淆矩阵评估分类模型性能

R语言基本回归分析

基础方法 | 数据管理:Stata与R语言的应用

R语言构建xgboost模型:特征因子化独热编码( one-hot encoding)卡方检验判断预测变量与目标变量的相关性