正文
今年 5 月份,谷歌发布会推出了谷歌家庭(Google Home),我想这这是万物互联时代,业界英雄所见略同。但是我想更进一步告诉大家,其实面对未来真正的万物互联时代,中国企业不再仅仅像前几次浪潮都是跟风,而是要引领和推动整个产业的到来。
在交互过程中最重要的是远场识别、噪音环境下的语音识别,以及在多个人同时讲话时,语音识别能不能达到使用。
国际上有一个非常著名的语音识别竞赛 Chime,就是在噪音口音和多人情况下进行比赛。这个比赛今年是在谷歌举行的,我很高兴的告诉大家,几乎全球顶尖机构全部参加了,科大讯飞在所有 3 项指标中都是全球第一名。而且,我们可以看到这个数据指标网站,6 麦克风,这最难的这个麦克风场合下,我们的准确率已经可以做到 97% 以上。也就是我们亲爱的老罗同志在锤子发布会上说 97% 的准确率,这不是中文,而是英文的在谷歌做的国际比赛结果:在噪音环境下我们的错误率只有 2.24%。
这些的识别,都会真正的推动我们整个产业的革命和创新。今天我们也有长安汽车的董事长到场,其实到目前为止,根据宝马、奔驰这些国际大厂测试,在汽车时速 100 公里以上、空调打开的噪音环境下,只有科大讯飞的技术能够做到使用。
●
●
●
机器翻译:比赛中打破日本、美国垄断
在机器翻译领域,2014 年基于深度神经网络的这些算法上的创新和突破,科大讯飞的机器翻译取得了突破性的历史进展。在 2014 年国际口语翻译大赛( IWSLT)中, 我们获得了全球第一,这是具有历史意义的。因为以前国际翻译大赛,汉英翻译项目都是日本研究机构全球第一,英汉翻译项目都是美国机构全球第一,2014 年 11 月的这次比赛,终结了这个历史:科大讯飞英汉和汉英都是全球第一名。
在这基础上,2015 年 2 月,美国国家标准技术研究院组织的机器翻译大赛中我们继续是全球第一。今年,我们又面对国家一带一路的重大战略,正式推出面向一带一路的多语种翻译。所以今天我一开场讲话时,大家就可以看到两边屏幕上不光有中文,对应的还有英语,而且不光是有英语,我们同步的有维语出来,还有藏语,同样的还有日语和韩语的同步翻译,这一切,我觉得都是真正的在践行科大讯飞创业之初的理念:
我们要实现人类乃至人机信息沟通无障碍。
在未来,我们要把世界所有主要语种全部放进去。
我想跟大家说,今天我们展示的成果,绝不仅仅是我们今天发布会上的这些。就在 4 天前,上海高级法院招待了来自 11 个国家的大法官和高层管理者。我们的翻译转写平台在专业领域训练之后,就用于这次会议,在上海高院如此高端的接待中做实时翻译,得到了所有参会的国际友人的高度评价。所以我想这已经不是一个概念,而是切切实实的用我们技术在一个又一个的行业和专业领域给我们带来更便捷的生活,带来更美好的沟通。
●
●
●
“认知智能”是未来人工智能的必由之路
那么在去年发布会上,我们还告诉大家,人工智能有 3 个层次:
计算智能(机器人能计算和存储)、感知智能(机器的视觉、听觉可以超过人工)和认知智能(未来的核心)
。而以语音和语言为入口的认知计算,是人工智能的必由之路。在过去一年之中,科大讯飞在人工智能最核心的可以说是皇冠上的明珠的认知计算领域,又取得了令全球瞩目成果,我们在今年参加国际非常知名的 Winogard 的认知智能的测试,这比赛是要用来替代图灵测试的,因为今天移动互联网传输到后台的对话数据越来越多,所以图灵测试已经越来越容易过关,这就是看机器真正的认知结果。
我在这里给大家看的一个例子,这是一个比赛的原题,当然是英文的。
“父亲举不起儿子,是因为他太重。”
这里要求机器判断到底是谁重?机器要知道这是因为儿子重。
“父亲举不起儿子,是因为他太虚弱。”
这里机器要判断出是因为父亲虚弱。
这些的基本推理对人类看起来是自然而然的,但是当机器具备了这样基本的认知判断能力,就可以真正的在一个又一个的领域来学习我们人类最顶尖专家的知识。
就在不久前,在 11 月 15 号,又一次传来喜讯,由美国国家标准技术研究院组织的国际非常知名 KBP 认知大赛中,在对于实体的发现,以及关联信息的关系的比赛项目中,包括了卡内基梅隆,包括 IBM 这些我们非常尊敬的企业和研究机构都参加了,科大讯飞是全世界第一名。
大家可以看到这是其中的一道题目。
“美国大选期间,特朗普炮轰杰克·布什,说伊拉克战争就是你哥哥的错。”
机器需要自动判断出所有的地名、国家和人名,还要知道“你哥哥”其实指的就是前美国总统乔治·布什。这个 KBP 比赛是英语,汉语和西班牙语 3 个语种同时上,科大讯飞是全世界第一名。所以这些在国际顶尖舞台上的认知成果,
真正证明了我们中国人在人工智能领域已经不仅仅是一个科普、科幻或者带有所谓先知角度的感性判断,而是在踏踏实实做理论创新。
在这些创新的基础上,我们在跟教育部考试中心合作,在事关国家教育未来的考试阅卷中(保证主观题的评分要达到公平公正性),机器已经在今年上海的四六级考试,在江苏、湖南等地的高考和研究生考试中对学生的语文和英语作文判分。机器学习了 500 份专家判分的卷子,就可以对其它几十万份卷子进行判分,其综合效能已经超过人工水平。
大家知道 Alpha Go 是学习了 3000 万份围棋的对弈,然后跟人类来下棋。而围棋还是有着相对清晰的规律可循,而考试阅卷是一个更加开放的领域,我们只要学习 500 份而不是几千万份,就能对剩下的几十万份卷子判分,超过人工水平,其实原理都是后台的学习训练。
那么这个技术的突破和进展,还可以应用在医疗行业,学习顶尖的医疗专家的知识和就诊案例,它就可以超过一线的全科医生,给我们的医疗带来巨大的福音。它用在法院系统,学习大量的法庭和司法数据,就可以给一线法官的判案,形成非常好的参考。甚至可以说,我们的机器,在 2 年内就可以通过国家的医学资格考试。
以上这些,就是在一个又一个领域,人工智能技术给我们带来的无比令人欣喜的突破。所以我们可以说,就是因为今天技术的进展,因为有着无线互联网,不断传输而来的数据,有着云计算无比强大不断迭代的运算平台,
所以今天的人工智能在学习了顶尖专家的知识之后,将来就能达到一流专家的水平,从而超过 90% 的专业人士。
这就是我们面临的,这个时代的趋势。当然,在源头创新上,科大讯飞将继续在基于数理统计、神经网络基础上,做出算法的突破和创新。我们同样还跟一批顶尖医疗机构以及心理学、认知学的专业机构科学合作研究,希望在脑神经的传导机制上找到突破。但今天我想说的是,即便没有传统的数理统计、神经建模方式上的重大突破,即便没有脑神经科学的突破,就用科大讯飞已经达到的深度神经网络和我们的创新成果,结合移动互联网大数据,这一些已经配套成型的产业框架,我们已经可以改变一个又一个的行业,这时代已经到来了。
●
●
●
“人工智能+”时代的三种落地形式
所以我想说的是,不仅仅是科大讯飞的判断,我们可以看看一些行业的各方面的趋势分析,去年 10 月份麦肯锡给出的报告认为,将来 45% 的当前的知识活动是可以被自动化的。
科学杂志,在今年年初给出的判断是,到了 2045 年,全球将有 50% 的工作岗位由人工智能的机器来替代,而在中国这个数据是 77%。大家可以想一想,也就是说鼎鼎有名的科学家会认为,未来的 30 年之内,在中国每 4 个工作会有 3 个由人工智能来替代。但是我想说的是,这是今年年初的预测,如果根据我们最新的进展,我认为这时间还会大幅度提前。所以今天,人工智能已经不仅仅是一个企业,一个行业的事情,而是关乎我们今天在座的每一位。