正文
CSDN:还有哪些场景同样满足以上三个条件,也适合机器学习?今日头条内部还会做哪方面的尝试呢?
李磊:
同样满足上述条件的应用我觉得Youtube和Amazon商品推荐也都是。Youtube做UGC视频的个性化推荐,Amazon是个性化商品推荐,都做得不错。
目前头条的其他几款产品包括火山、抖音、问答等等也都是基于机器学习进行个性化分发。
同时,
头条也在利用人工智能进行对低质、低俗内容的审核。
CSDN:你目前花精力最多的地方在哪里?正在解决什么难题呢?难在何处?
李磊:
我目前精力花的比较多的难题是如何用人工智能更好地进行内容识别。包括识别文章是不是虚假内容、有没有广告信息、文章的质量包括文章内的配图是不是合适等等。
通过人工智能进行内容识别的难点其实就是自然语言理解的一些难点。它很大的一个困难是语言中充满了歧义,也就是语义的复杂性,包含因果关系和逻辑推理的上下文等。
另外图文是否相符这个问题上,目前包括学术界也都还没有明确方法和研究模型,我们也在做一些探索。
CSDN:你近期正在关注哪些AI理论和实践方面的新进展?为什么吸引你?
李磊:
最近在看一些非监督学习的方法,比如说UC Berkeley CycleGAN对抗生成神经网络的一系列工作。它主要是利用非平行的样本。传统监督学习需要X(数据)、Y(标签)一一对应来做训练,非监督学习的方法只需要一组X、Y,不需要一一对应,仍然可以训练出其中的模式。
我在头条平时做数据需要比较多的标注,数量包括标注质量都是比较大的难题,如果能用非平行样本来进行训练,会对实际模型有比较大的帮助。
另外,机器翻译方面最新的基于注意力机制(attention mechanism)的网络框架我也有关注。关注最新进展或者说去读一些最新的论文,不一定是说这些算法或者模型做的非常好,而是它们可能会带来一些新方法和新的思考角度,这些东西也许会帮助我们在实际应用中有提高。
CSDN:你在上海交大读本科,卡耐基梅隆拿到博士学位,中间在加州大学伯克利分校工作过(做博士后研究员),请谈谈这三所学校在AI领域,都有何优势与劣势?请再列举两所你欣赏的,在AI领域有建树的高校。
李磊:
上海交大是国内计算机专业顶尖的几所高校之一。
交大开设的ACM班是对计算机学科的教学作改革,在本科的教学上就为学生打下了良好的理论、算法和工程基础。
像分析与变分、数理逻辑、计算理论、算法导论都是后面学习AI的基础。同时,它开设的一些大作业课程比如操作系统、编译原理、数据库、计算机网络等等帮助学生把工程需要的各种能力也都培养起来了。
卡耐基梅隆大学
应该是最早设立计算机学系的学校。1956年CMU建立了计算中心,1965年7月建立了美国乃至世界的第一个计算机科学系,后来成为计算机学院。
它在AI领域下的门类非常全,可以认为是广度上最强的研究机构。
计算机学院下面有好多系都在做AI方面非常前沿的研究,包括机器学习系、机器人所、语言技术所、人机交互所等九大科研系所。AI领域从理论到应用的各类问题在CMU都有世界顶级的专家在进行研究。