专栏名称: 爬虫俱乐部
Stata技术控,编程技术咨询,数据讨论与分享,编程和实证培训。
目录
相关文章推荐
科幻世界SFW  ·  新刊速递丨《科幻世界画刊·惊奇科学》2025 ... ·  2 天前  
科幻世界SFW  ·  💪科幻世界为所有高考学子加油! ·  3 天前  
中核集团  ·  中国专利奖!中核集团斩获双金! ·  2 天前  
51好读  ›  专栏  ›  爬虫俱乐部

变量和标签的故事

爬虫俱乐部  · 公众号  ·  · 2018-06-28 12:35

正文

请到「今天看啥」查看全文


在数据处理中,我们经常会遇到将字符型的分类变量转化为数值型变量的问题,并且将原来的值定义为对应的标签值。

在往期推文 《数据类型转换之字符型-数值型》 《论egen的花样用法(三)》 ,我们分别介绍的 encode 命令和 egen 命令与 group 搭配使用时均可以实现这样的功能哦~

以数据集 hbp2 举例如下,该数据中变量 sex 为字符型的分类变量。

webuse hbp2,clear
encode sex,generate(gender)
br sex gender in 1/5

结果如下:

当我们不输出变量的标签值时,可以执行如下命令语句:

br sex gender in 1/5, nolabel

可以发现,新生成变量 gender 是对应的数值。

同样,我们用 egen 命令与 group 搭配,看一看能否达到同样的效果呢?

webuse hbp2,clear
egen gender = group(sex), label
br sex gender in 1/5

br sex gender in 1/5, nolabel

我们同样达到了想要的效果。

另外,我们还会遇到将一个变量的观测值定义为另一变量的标签值的问题,那该如何解决呢?这里可以用到一个外部命令 labmask (执行命令 findit labutil 下载 labutil 命令即可),我们以国泰安上一个关于公司审计意见的数据集为例进行介绍,样本数据如下所示:

我们想让变量证券简称变为证券代码的标签,就可以执行如下命令语句:

labmask 证券代码, values(证券简称)

得到结果:







请到「今天看啥」查看全文