专栏名称: 腾讯科技
只供应最有营养的科技大餐!
目录
相关文章推荐
51好读  ›  专栏  ›  腾讯科技

与谷歌翻译小别胜新婚之后,看清中国人工智能到底和谷歌比什么

腾讯科技  · 公众号  · 科技媒体  · 2017-04-02 19:25

正文

请到「今天看啥」查看全文



人类文明萌芽于符号(语言),赫拉利老师在《人类简史》中就强调,我们的智人祖先正是因为有了完备的语言,才能组织起来,击败身体强装的尼安德特人。


现代文明无不基于符号的流通、利用。 法国哲学家、符号学家鲍德里亚善于“翻译”当代生活。比如《消费社会》一书就把消费行为当作一种语言行为——你消费任何商品都是在表达某种意思。以往经济学家强调商品的使用价值和交换价值,鲍德里亚看到的是:


商品的物质“使用价值”不再重要,符号价值才重要。商品就是一种语言符号,消费成了一种言说。爱漂亮衣服,爱打折标签,你是凡客。吃西少肉夹馍、骑摩拜单车,你是创业狗。


今天的人类生活更是进入了“过度”符号化的时代。


信息技术的发展可以描述为数据符号“侵袭”自然生活。正如最近讯飞轮值总裁胡郁在演讲中谈到“自然宇宙”与“数字宇宙”的关系。想想,“宅男”、“二次元”的另一面就是“真实”生活退后,人们都生活在经过互联网编码后的世界里。


在这种时代,依赖符号运作的机器反而如鱼得水。因为它们的一切运行以符号(代码、函数、数据、标签)为基础。追溯计算机的发明,无非是人类把自己的意图翻译成机器可以理解的语言,促成机器的行动。如今做feed流的公司,利用机器算法给每条资讯打上成百的属性标签,通过用户点击行为反测用户的消费偏好,这难道不是鲍德里亚消费社会理论的机器化实现?


一切信息都是“语言”,一切语言传递都是编码——解码。 所以,“翻译”成了人工智能的关键。


观察当下AI大企业,技术线路都有清晰的两块,一块是图像识别、语音识别方向,一块是自然语言处理方向。 从阿里的小黄图牛皮藓鉴别、讯飞的语音识别,甚至到百度的无人车,更多利用前者。从百度的搜索、翻译、度秘到阿里的机器客服、搜狗的输入法,更多基于后者。看AI人才也可分这两类。吴恩达与酷炫的图像识别(识猫)、无人车相关,王海峰、王小川则与低调的自然语言处理相关。


二者是并列的关系吗? 新任百度AI技术平台体系(AIG)负责人王海峰说过一段话:


相对于看、听和行动的能力,语言是人类区别于其他生物最重要的特征之一。视觉、听觉和行为不仅是人特有的,动物也会有,甚至比人强,但是语言是人特有的。AlphaGo对于普通人来讲是非常震撼的一件事情,我们也认为它是一个挺大的成绩。但是我们也不能忽略,它的规则是明确的,空间是封闭的,为围棋训练出来的程序下象棋就不好用。基本来讲是一个可解的问题,但是语言的很多问题是更难解的。


几天前有文章《百度大清洗》谈百度结构大调整,用了“王海峰的崛起”这样的小标题。我以为应该从自然语言处理技术重要性来理解。


机器翻译的进化


翻译,是“自然语言处理”的最重要分支,也是比较难的一支。人工智能在早期就是符号智能,人把各种规则变成符号算式输入机器,结果深挖下去发现规则比恒河沙粒还多,累死了自己。


最早的机器翻译方法就是基于词和语法规则。 注意,人类并不了解大脑是如何工作的,但是依然工作的很好。反过来,人类自己语言熟练,不代表人能理解自己语言神经是怎么运作的。这就导致依赖人工规则的翻译软件笑话百出。即便现在,谷歌、百度也无法避免下面这样的翻译错误:


(谷歌)








请到「今天看啥」查看全文