正文
腾讯公司副总裁梁柱表示:“贾佳亚教授是人工智能领域的研究专家,我们很高兴能邀请到贾佳亚教授加盟腾讯优图实验室。优图实验室的图像识别、人脸识别技术一直处于国际领先的地位,在人工智能各类世界级的比赛中屡创佳绩。近年来,腾讯依托以社交为核心的丰富应用场景、海量的大数据和强大的云计算能力,在人工智能领域获得了飞速发展。在未来,我们还将持续提升AI的技术能力和应用场景,结合云平台来激发AI的潜力,以科技提升人们的生活品质。”
贾佳亚教授表示:“我很荣幸能够加入腾讯优图实验室。经过近几年发展,优图实验室在人工智能多个领域积累了领先的技术实力和解决方案。特别是在人脸识别领域,优图实验室已多次在MegaFace 、LFW等国际人工智能的权威比赛中刷新世界纪录。视觉识别是人工智能的核心和重要入口,而人工智能的研究必须建立在海量数据基础之上,通过大数据训练来优化算法模型。加入优图实验室之后,我期待能够依托于腾讯社交网络大平台产生的海量数据进行研究。我相信新的机会将随之而来,也希望能不断拓展新的应用场景,让人工智能在现实中对大众产生意义。”
2017年5月13日,在腾讯正式宣布贾佳亚教授的加入前夕,贾教授接受了新智元的独家专访。讲述了他为什么会选择腾讯,又是如何看待从学术到工业界的角色转换问题。他还在专访中聊到了自己的学术生涯、所培养的学生、以前去年带领团队在ImageNet夺冠等问题。在技术上,贾教授向新智元介绍了他著名的“图像去模糊化”技术,并且谈到了他对计算机视觉行业发展趋势的看法。
贾佳亚对新智元表示,与腾讯优图的结合,几乎是一拍即合,自己会全职加入腾讯。而之所以会选择进入工业界,是因为“ 到了一定年龄阶段,会希望追求些不一样的东西。” 在腾讯,他希望让技术能够促进社会进步,产生更大的影响。
谈到角色转换的问题,贾佳亚总结了计算机视觉的三大特点:第一,它基本上是应用驱动的,每一种技术几乎都必须先有应用场景 ;第二,计算机视觉是 AI 里验证结果最直接的 ; 第三,计算机视觉既是一种表达方式,又能有很多其他功能。正是因为这些特点,计算机视觉研究成果在工业界(加上工程化)几乎就能应用 。
他认为:“很多时候我们的研究思维方式非常靠近应用,所以我的角色转变其实不大。当然做好一个产品会有很大一部分用户和市场因素,但是因为在腾讯有大量开发人员,市场和产品经理去把控用户体验,所以对我而言,最大的挑战更多的是进入公司后,去理解公司文化,建立一支适合这个企业的研发队伍”。
此外,他也对新智元表示,许多大师级的学术人才,在进入企业界前,一定要思考 “匹配”的问题,看自己的能力是否与公司的需要匹配,自己的研究周期与企业发展是否匹配。“否则,是不容易走到一起的。”
许多人都不知道,贾佳亚与中国AI领域的“黄埔军校”微软研究院也颇有渊源。博士4年,他有3年的时间都是在位于北京的微软研究院度过的。在那儿,他遇到了对他的人生产生重大影响的导师——沈向洋,不仅在知识和技术上得到了最高水平的训练和锤炼,同时,也学到了做研究的专业态度。他当时与孙剑等计算机视觉领域的顶级学者同时在微软共事,做了许多非常前沿的计算机视觉研究。可以说,在微软的三年,奠定了贾佳亚后来成为计算机领域宗师级教授的坚实基础。他在采访中详细地回忆了自己的这一段经历。
在香港中文大学,贾佳亚培养了“不仅在学术界成为顶梁柱,在产业界也开辟了一片天地”的优秀计算机视觉人才,可谓桃李满天下,这也是“大师”二字的由来。
贾教授在采访中向新智元介绍了去年在 ImageNet 竞赛场景分类项目中夺冠的技术——“基于上下文语义信息的金字塔场景解析框架PSPNet”,以及传统图像处理皇冠上的明珠:图像去模糊技术。
以下是新智元对话贾佳亚教授的文字实录:
【新智元】
您为什么会选择加入腾讯优图?
【贾佳亚】
选择加入腾讯优图,也是因为我做计算机视觉的研究开发已超过15年了,在图像视频领域留下了许多成果,所以其实工业界一直与我有很紧密联系。比如现在学校里很多的视觉研究项目都是业界主动提供给我们,希望我们找到方法,我们也创造了很多在工业界实用的技术。我在香港中文大学的研究组就是以创造新的方法为主要目标的。这是我要加入企业的一个原因。另外,这两年很多公司寻求AI的前沿技术,在这个需求之上,我们也想把多年培养出来的创造性技术,解决新问题的能力发挥到工业中,转化为生产力。优图与我的研究方向非常吻合,所以,我与腾讯优图几乎是一拍即合。因为他们基于多年的积累,在图像、视频上产生了非常大的优势。而且基于腾讯的平台,优图已经走出自己的商业路线,有很多不错的产品和技术转化。腾讯拥有庞大的平台和客户群体,并且提供了几乎所有可以想象的应用场景。记得有人说过,把腾讯拿掉之后,中国就剩不了多少IT了,所以腾讯是非常强大的。
因此,我决定全职加入腾讯优图。我的base主要在深圳和香港,也经常会去上海和北京。我十分欢迎在深圳和香港等地的科研人员能够加入我们。
【新智元】
您刚提到腾讯的应用场景优势,数据优势是否是一个吸引你的地方?
【贾佳亚】
当然。比如优图实验室的图像识别,人脸识别等技术一直处于国际领先的地位,并且已经实现了鉴黄、寻亲、金融等多个领域的产品落地。团队依托以社交为核心的丰富应用场景,海量的大数据和强大的云计算能力,能够在技术的研发上有更多的发展空间。
【新智元】
加入腾讯以后,在整个团队配合上有什么计划?
【贾佳亚】
腾讯优图和我是有非常好的优势互补效应的。优图很强的技术主要包括人脸识别、 图像分类、鉴黄、OCR等。音频上也有音乐分类、哼唱检索等。优图在这些方向上能做到产品在各个移动和云平台落地。而我之前和最近的研究侧重于自然图像视频的各种智能产生,理解,和增强新技术,比如图像去模糊、图像增强、语义分割,物体检测识别等。我希望能把第一线研究创新的基因在腾讯平台上强化和扩大。我的目标是在团队里提供给尖端视觉科学家和一流研究人员所需的研发环境。我希望这些技术能够产生论文,专利,能够让更多人知道我们创造的技术。我今后会侧重将新技术与工程人员、商业人员的配合,将自研 AI 技术系统化,放到产品里面,让用户看到这些产品,增强用户体验,丰富生活。
【新智元】
您之前有一些技术比较出名,比如图像去模糊,会不会在腾讯的产品中采用?
【贾佳亚】
不会直接采用,因为涉及专利问题。我的目标是建立一个新的团队,研发新的技术,对应公司内外的需求。比如,我们最近研发了人的整体分割,在CVPR等也有发表的论文,能够自动把一个人的分割出来。这些新技术会被整合到各种平台上去。我们甚至会提供SDK,开放代码。我希望系统化地去建立视觉系统,就像一个拼图,每一个形状都不一样,希望把这些组件拼起来,拼成一个大的图像。我希望在公司内部建立系统化工程,把新技术开放出来。比如我几次在国际各大会议上给大家介绍的一种信号滤波技术(rolling guidance filter),就是一张图像很快处理一下就能直接去除把上面的一些小的纹理或其他不想要的小结构。这个技术不需要深度学习,一行代码就给出非常酷的结果,而且非常快。实际上我们有许多很有趣的新技术和想法,我会花精力在公司内部把这些新技术都整合起来。
另外,今年我们做了一个很有趣的事情:人脸美化的回复( debeautification): 我们希望能够通过AI技术,去退回到人脸美化之前的样子。为什么要做这件事?原因就是我们看到很多新闻说网上照片都很美丽,但是见面后发现落差非常大,甚至引发社会事件。我们就想把美化后的图恢复成它原本的样子。这个以后我再详细介绍。总结一下,我们的研究有的时候比较天马行空,但是能产生意想不到的结果。我希望能把这些新技术通过公司的平台调配需求,产生更大的应用。
【新智元】
加入腾讯后的梦想是什么?
【贾佳亚】
到了一定年龄阶段,会希望追求些不一样的东西。我也期待有新的挑战。其实在学校里的研究,比较难在非常短期内帮助社会的发展,或者让普通人很快用上这些技术。我的梦想就是让技术快速促进社会进步,产生更大的作用。创业通常前期只能专注一两个方向或者内容,不可能将我们几十个新的技术全部落地。所以我想与产业结合,加入腾讯来广泛开拓不同领域。
【新智元】
我们都知道腾讯是一家十分看重产品和用户体验的公司,那么从学术研究到企业研发,你怎么克服角色转化,面临的最大挑战是什么?
【贾佳亚】
这是一个非常好的问题。我觉得很多人,包括媒体、工业界、学术界,都会认为从学术研究走到企业是一个很大的转变,这是一个非常有意思的论点。其实,我不是这么认为的。我做的方向叫计算机视觉,虽然在AI时代大家都叫AI,但我们一直就是研究计算机视觉。与其他人工智能方向相比,计算机视觉在AI发展过程中有很多的特点,我想总结一下,以此说明为什么很多时候从学术界到工业界的角色转换并不是一个难题。