专栏名称: 大数据文摘
普及数据思维,传播数据文化
目录
相关文章推荐
大数据文摘  ·  反转!AI ... ·  2 天前  
InfoTech  ·  为什么大家都不去KTV和SPA了? ·  2 天前  
CDA数据分析师  ·  《CDA二级教材》电子版上线CDA网校,助你 ... ·  2 天前  
大数据文摘  ·  我们让 GPT 玩狼人杀,它特别喜欢杀 0 ... ·  3 天前  
大数据文摘  ·  字节发布 Seedance 1.0 ... ·  3 天前  
51好读  ›  专栏  ›  大数据文摘

快问快答 | 助教带你学习数据科学(附答疑视频领取)

大数据文摘  · 公众号  · 大数据  · 2017-11-08 14:12

正文

请到「今天看啥」查看全文




找到下方应用,双击打开,然后输入python,就是python命令行环境了,自带2.7版本的python。



可以百度一下这个链接: http://yanghao.org/blog/archives/59


https://zhuanlan.zhihu.com/p/25198543 这个anacoda的教程讲解的比较详细,平时最常用的基本上都讲到了,大家可以参考一下。


Q:例题都是.py的保存方式,可我的数据保存之后都是.ipny呀,两个是因为编辑器不同的原因吗?


A:jupyter notebook默认将文件报讯城.ipny格式,你也可以保存成.py格式,具体方式如下图。python自带的IDE,Pycharm等一般的IDE都支持.py格式的文件。


Q:现在好像XGBOOST用的频率挺高的,泛化性能应该挺不错的吧?


A:号称大杀器 用过就知道了,不过精度太高,是有可能过拟合的,所以交叉验证看看。


Q:助教,咨询你一个问题,我这两天同时看《利用python进行数据分析》、《机器学习实战》、sql还有咱们的预习资料,看的脑袋都快炸了。能不能给点建议,目前要怎么学习?


A:先练习python,然后可以预习一下pandas,还想看别的话,可以看看scikit-learn。先掌握技能,然后在练技能的基础上再补理论知识,至于你刚才说的那两本书,可以以后作为辅助学习。


不要着急,把基础打好,python,pandas都差不多了就看看scikit-learn,都是以后常用的工具。


Q:st,data,ss2 = summary_table(res,alpha=0.5)#从模型获得拟合数据,自行车模型的,st,data,ss2是summary_tabel的返回值吗? “=”左边的三个数是什么,不是具体含义。


A:从变量的命名看来,返回的值是标准差,数据,还有拟合变剩余随机成度的差值。st就是返回的整个表,也就是说是返回值,对应前三个。data是ss2对应的数,比如第三列是预测结果。


Q:异常值检测有哪些常用的方法?


A:UpperLimit=Q3+1.5IQR=75%分位数+(75%分位数-25%分位数)*1.5, LowerLimit=Q1-1.5IQR=25%分位数-(75%分位数-25%分位数)*1.5。


Q:jupyter能不能撤销命令?就是执行完一段代码,对原来的内容进行了修改,想撤销这个代码的执行,恢复到原来的内容。







请到「今天看啥」查看全文