正文
1991年,经Guido van Rossum(吉多·范罗苏姆)推出后,Python就成为了通用语言中的大热门,在数据科学社区中得到了广泛应用。目前使用的主流版本是3.6和2.7。
1、极受欢迎的主流通用编程语言,模型种类多、适用范围广,有众多社区支持。
2、许多在线服务都提供Python API。
3、上手简单。低门槛使其成为菜鸟程序猿的理想“初恋”。
4、Pandas、scikit-learn和Tensorflow等包使Python在高级机器学习应用中也有很强的存在感。
1、型别安全:作为一个动态类型语言,Python时时刻刻求关注。类型错误(比如向心心念念期待着Integer的方法传递了一个String)差不多是家常便饭了。
2、对于特定的统计、数据分析问题,R包“海纳百川”式的涵盖范围使其在面对Python时有那么一丢丢优势;但是谈到通用语言,Python总能给你更快、更安全的选择。
Python是数据科学语言的上佳之选,对象绝不仅限于初学者。很多数据科学流程都围绕着ETL(抽取-转换-加载)展开,这与Python的通用性简直是天作之合。诸如谷歌Tensorflow等库更使得Python在机器学习领域大出风头。
结构化查询语言(SQL)是关系数据库的定义者、管理者和查询者。虽然自1974年面世后历经多次实现,但核心原则从未改变。
1、在关系数据库的查询、升级和操作上效率极高。
2、声明语法的使用让SQL通常都具有极强的可读性,比如“SELECT name FROM users WHERE age > 18”的意义就十分明确清晰。
3、SQL应用范围广泛,因此熟悉该语言还是很有用的。程序猿们利用诸如SQLAlchemy等模块可以直接把SQL整合到其他语言中。
1、SQL的分析能力十分有限-除了求和、计数和求平均数,你也没啥能选的。
2、具有命令式语言背景的程序猿可能需要一段时间来掌握SQL的声明语法。
3、SQL具有众多实现,比如PostgreSQL、SQLite和MariaDB等。这些实现的差异之大使得互操作性成为了一个颇为棘手的问题。
与其作为高级分析工具,SQL在数据处理上表现得更加得心应手。然而,数据科学工作的大头都依赖于ETL,SQL的长盛不衰和简明高效恰恰证明这是一门值得现代数据科学家了解掌握的有用语言。
Java是在Java虚拟机上运行的一门非常受欢迎的通用语言。这个抽象计算系统能够实现跨平台的无缝移植。目前有甲骨文公司支持该语言。