虚拟变量的数值化
-
1 视频
-
2 课件
-
3 随堂测验
上一节
下一节
虚拟变量的数值化-赋值问题
一、什么是虚拟变量(Dummy Variable)
名义型变量在回归分析中的重要性---定性解释变量,例如:
解释工资收入:学历、职位、职称……
解释消费差异:性别、是否城镇居民……
虚拟变量---将名义性变量通过一定的赋值规则进行数量化,再引入到回归模型中。
二、虚拟变量的赋值规则
赋值原则:
1.赋值原则:均设为0、1
2.基准类的选择
例:
![]()
3.多分类变量的赋值: 
![]()
为什么一个多分变量不能够用一个虚拟变量刻画? 

为什么一个多分变量(M个分类)须用M-1个虚拟变量刻画?
由于存在虚拟变量陷阱,因此赋值时:
包含截距项模型:M个分类引入M-1个虚拟变量;
不含截距项模型:M个分类引入M个虚拟变量。

