专栏名称: 人称T客
T客汇始创于自媒体“人称T客”,包涵了研究中心(移动信息化研究中心),媒体中心(人称T客各自媒体平台和T客汇官网),以及数据服务中心(SaaS云调研分析平台)等三部分构成,旨在打造中国第一个研究型媒体平台。
目录
相关文章推荐
新浪科技  ·  【#曝AirTag2即将发布#】苹果 ... ·  20 小时前  
36氪  ·  永辉大动作,前山姆高管接手了 ·  昨天  
新浪科技  ·  【#苹果液态玻璃被指神似WindowsVis ... ·  2 天前  
51好读  ›  专栏  ›  人称T客

第四次产业革命:始于人工智能 | 周末长文

人称T客  · 公众号  · 科技媒体  · 2017-02-11 00:26

正文

请到「今天看啥」查看全文


机器学习的方法有超过 15 种,每一种都使用不同算法结构,依据得到的数据实现预测最优化。「深度学习」是其中一种方法,在新的领域取得了突破性成果,我们将在下文中对此方法进行探索。此外一些没有受到很多关注的技术也很有价值,它们适用于更广泛的使用情形。除了深度学习外,「随机森林」也是一种最有效率的机器学习算法,可以创造很多决策树,使预测最优化;

「贝叶斯网络」使用概率性方法分析变量及各变量之间的关系;在支持向量机中输入的是类别化的案例,它可以创造模型,把新的输入分配到各个类别中。

每一种方法都有优势和不足,所以要结合起来使用(一种组合方法)。哪种算法会被选择出来解决某一特定问题,取决于可用数据集等因素的性质。实践中,开发者倾向于通过实验观察哪些算法是有效果的。

机器学习的使用案例根据我们的需求和想象而不同。拥有正确的数据后,我们可以建立算法实现各种目的:根据某人之前的购买记录推荐购买产品;预测汽车装配线上的机器何时会发生故障;预测电子邮件地址是否错误;估计信用卡交易欺诈行为的可能性;还有很多其他目的。

深度学习:将特征详述工作交给算法

即使使用随机森林、贝叶斯网络、支持向量机等普通机器学习方法,也很难编写出能很好地完成特定任务的程序,从理解语音到识别图像中的对象。因为我们无法以实际、可靠的途径来详述特征。

例如,如果想要编写计算机程序来识别汽车的形象,我们无法在算法中详述汽车的特征,来确保在所有情况下都能准确识别。汽车的形状、大小和颜色多种多样,位置、方向和形态也有所不同。背景、灯光和很多其他因素都会影响对象的外表。一组规则中需要包含的变量太多了,即使我们能够全部包含进去,这种解决方案也不具备延展性。我们需要为每种需要识别的对象都编写一组程序。

深度学习(DL)已经彻底改变了人工智能世界。有超过 15 种实现机器学习的方法,深度学习就是其中一种,所有深度学习都属于机器学习,但是机器学习并不只是深度学习。

通过深度学习,程序员可以不必完成特征详述(根据数据定义需要分析的特征)或最优化(如何权衡数据以实现准确预测)的任务,而是全部交给算法来完成。

那么如何实现这些呢?深度学习的突破点在于模拟大脑,而不是模拟世界。我们的大脑会学习做有难度的事情,比如理解话语和识别物体,而且并不是通过详尽的规则而是通过时间和反馈来学习。小的时候我们体验这个世界(比如看见一张汽车的图片),做出预测(汽车!)然后收到反馈(没错!)。我们没有通过一组详尽的规则,而是通过训练进行学习。

深度学习使用的就是这种方法。将人造的、以软件为基础的计算器连接在一起,类似于大脑中的神经元。它们组成了一个「神经网络」,接收输入并进行分析、作出判断,如果判断正确,就做出通知,如果输出是错误的,算法就会对神经元之间的联系做出调整,改变未来的预测。最初网络会出现很多次错误,但随着我们输入数以百万计的例子,神经元之间的联系就会得到调整,最终几乎在所有情形下,神经网络都会做出正确的判断,这也就是熟能生巧。

通过这个过程,我们现在可以:

  • 识别图片中的元素;

  • 实时语言翻译;

  • 语音控制设备(通过 Apple Siri、Google Now、Amazon Alexa 以及 Microsoft Cortana);

  • 预测基因变化会对 DNA 转录产生怎样的影响;

  • 分析客户反馈中的情感;

  • 通过医学影像探测肿瘤。

深度学习并不能用于解决所有问题,其通常会需要利用大型数据集进行训练,需要广泛的处理能力来训练和运行神经网络。「可解释性」也是一个问题,要知道神经网络如何实现预测是非常困难的。但是深度学习使程序员从复杂的特征详述工作中解放出来,为一系列重要问题提供成功的预测机制。深度学习最终会成为 AI 开发者的强大工具。

二. 深度学习是如何工作的?

既然深度学习如此重要,了解其工作的基本要素也是非常有价值的。深度学习需要使用一个人工「神经网络」,即一组相互连接的「神经元」(基于软件的计算器)。

一个人工神经元至少会接收一个输入,其会以此为基础进行数学计算,得到输出结果。输出结果会依赖于每个输入的权重和神经元中的「输入-输出函数」的结构(图 5)。输入-输出函数会发生变化,神经元可能是:

一个线性单元(输出与总加权输入成一定比例);







请到「今天看啥」查看全文