专栏名称: Python爱好者社区
人生苦短,我用Python。分享Python相关的技术文章、工具资源、精选课程、视频教程、热点资讯、学习资料等。每天自动更新和推送。
目录
相关文章推荐
百职帮  ·  高考结束别躺平!这个暑假学Python,开学 ... ·  14 小时前  
百职帮  ·  高考结束别躺平!这个暑假学Python,开学 ... ·  14 小时前  
Python开发者  ·  苹果炮轰推理模型全是假思考!4个游戏戳破神话 ... ·  17 小时前  
Python爱好者社区  ·  月薪3万35岁脑干出血程序员:ICU躺了28 ... ·  2 天前  
Python爱好者社区  ·  软考,yyds ·  2 天前  
Python爱好者社区  ·  Science披露:近3年,垃圾论文激增,9 ... ·  3 天前  
51好读  ›  专栏  ›  Python爱好者社区

从零开始学Python数据分析【7】-- pandas(数据框部分02)

Python爱好者社区  · 公众号  · Python  · 2017-10-24 13:12

正文

请到「今天看啥」查看全文


把条件括起来。


两个变量的观测筛选并筛选部分变量




在Python中通过索引的方式获取数据的部分子集,虽然有loc和iloc可以实现取子集,但我更 推荐loc函数 的应用,因为个人觉得iloc应用的场景比较少,它是基于行或列的位置进行数据筛选的。例如



R语言中 ,获取数据集的子集就更容易了,这里 强烈推荐使用subset函数 。按照上面Python的例子用R语言实现一遍:


一个变量的观测筛选



两个变量的观测筛选



两个变量的观测筛选并筛选部分变量



二、变量的删除


有时,在一张表里你可能需要删除与建模或分析无关紧要的变量,如用户id、姓名、邮编号码等。在Python中,你可以借助于 drop函数 非常轻松的删除指定的变量。



需要注意的是,该函数默认的axis=0,表示删除行观测,如果需要删除列,就要 将asix设置为1 。记住,此时虽然删除了两个变量,但iris数据集本身是没有变化的,如果你需要改变iris数据集, 需要设置inplace为True


在R语言中,我们仍然使用 subset函数进行变量的筛选 ,通过select参数,将需要删除的变量前面 加上负号(-) 即可,如下:



三、变量重命名








请到「今天看啥」查看全文