专栏名称: 腾云
Technology is the new sexy.
目录
相关文章推荐
腾讯研究院  ·  腾讯研究院AI速递 20250612 ·  昨天  
36氪  ·  「工业迪士尼」,成了京沪排队王 ·  昨天  
新浪科技  ·  【#苹果史上落差最大WWDC# ... ·  2 天前  
51好读  ›  专栏  ›  腾云

2018,关于人工智能你最应该关注的并不是阿法狗 |《腾云》年度特别策划

腾云  · 公众号  · 科技媒体  · 2019-02-13 08:00

正文

请到「今天看啥」查看全文




2

数据安全、落地瓶颈

和迁移学习, 更值得关注


伴随媒体对人工智能的广泛报道,公众在2018年对人工智能的了解程度在逐渐加深,认知也不断丰富。但是,公众关注得更多的是一些具有话题性的事件,比如2016年AlphaGo接连战胜两位人类顶尖棋手这样的轰动性事件,因此一些对行业发展具有重要影响但还未具有显著效应的事件反而往往会被忽视。因此,这里我列出 值得更多关注的三个方面,作为对我们回顾2018年人工智能发展的补充: 一是数据安全与保护对人工智能的影响,二是人工智能落地遇到瓶颈,三是迁移学习成为学界关注的重点。

大数据是人工智能的基础,但近年来,国内外多次曝出用户数据泄露的事件,不仅导致用户的谴责甚至起诉,同时也使公众对数据安全性的担忧愈发加深。因此, 全球范围内呼吁加强数据安全和隐私保护的呼声很高。 欧盟在2018年5月25日开始实施旨在保护用户个人隐私和数据安全的《通用数据保护条例》 (General Data Protection Regulation,GDPR) 。该条例要求经营者用清晰、明确的语言来表述自己的用户协议,并且允许用户执行数据“被遗忘”的权利,即用户可以要求经营者删除其个人数据并且停止利用其数据进行建模,而违背该条例的企业将会面临巨额罚款。我国在2017年开始实施的《中华人民共和国网络安全法》和《中华人民共和国民法总则》也指出,网络运营者不得泄露、篡改、毁坏其收集的个人信息,并且与第三方进行数据交易时需确保拟定的合同明确约定拟交易数据的范围和数据保护义务。美国等国家和地区也正在酝酿出台类似的法律规定。


大数据作为人工智能的基础,数据安全和隐私保护至关重要


大数据的优势就是解决数据孤岛问题,将数据整合到一起,但传统的人工智能收集、处理、使用数据的模式在以上这些法规面前可能成为违法行为。大数据面临的这个法律困境,如果不能得到学术界和产业界的足够重视,将很有可能引发人工智能的下一个寒冬。 而要解决这个问题,一个可能的方案就是“联邦学习”(federated machine learning)。 它通过加密机制下的参数交换方式保护用户数据隐私,数据和模型本身不会进行传输,也不能反猜对方数据,因此在数据层面不存在泄露的可能,也不违反更严格的数据保护法案。因此我们可以说,联邦学习的产生为人工智能打破数据屏障和进一步发展提供了新的思路。它在保护本地数据的前提下让多个数据拥有方联合建立共有模型,从而实现了以保护隐私和数据安全为前提的互利共赢。

我们说 人工智能落地遇到瓶颈,突出表现在人工智能在实验室的理想环境下表现优秀,但是在实际的生产生活中却无法取得预期的效果。 在我看来,这里主要有两个方面的原因。第一,仍然是缺乏数据的问题。数据在大部分产业界都是以孤岛的形式存在,以小数据的形式存在,没有形成完整的大数据。为大数据设计的算法模型,在这样的场景中,就会无能为力。第二,人工智能并不是一个产品,不像Microsoft Office那样可以直接拿来使用。人工智能的模型需要数据来进行训练,需要通过好的反馈来使模型壮大,并整合不同的数据拥有方来进行互补。这样一来,人工智能的落地就像是一个解决方案。但是,人工智能作为解决方案面对不同问题时,扩展又很难进行,导致效率低下。因此,巧妙地做好一个垂直领域行业的“生态”,使得参与的各方能够互利共赢,比如一个开放的、针对人工智能和大数据的操作系统,对于人工智能的真正落地至关重要。


在深度学习之外,迁移学习应该成为人工智能研究和应用的另一重要方向








请到「今天看啥」查看全文