正文
追踪和研究最前沿的计算机视觉理论与算法,依托人工智能和大数据的支持,赋予计算机接近乃至超越人类视觉系统的能力,提升计算机完成各类视觉任务的水平,探索计算机在最新领域中的应用。
主要研究分支:图像视频的分析、理解与编辑,人脸的检测与识别,物体的检测、跟踪与分类,3D视觉,基于视觉的增强学习等
二、语音识别
基于声学模型和语言模型, 创建一个智能的"机器听觉系统" 和"机器会话系统", 让机器能"听懂"人类语言, 并理解语言中包含的信息从而达到真正的人机"对话"。
主要研究分支:语言前端处理、声学模型/语言模型的建立、语言解码和语音合成等。
三、自然语言处理
赋予计算机系统以自然语言文本方式与外界交互的能力(即让计算机能够"读懂"自然语言文本,并能够用自然语言文本的方式"表达"自己的"思想"),追踪和研究最前沿的自然语言文本理解和生成技术,孵化下一代自然语言处理技术与商业应用场景。
主要研究分支:语义分析、知识推理、智能问答、机器翻译等。
四、机器学习
研究前沿机器学习理论及算法,研发部署大规模机器学习/深度学习系统。在大数据和互联网背景下,探索机器学习算法在社交网络、广告推荐,行业大数据,智能游戏,以及基于感知和决策的AI等方向的应用 。
主要研究分支:机器学习理论,优化算法,大规模分布式计算,异构平台,以及创新监督,半监督,和增强机器学习算法的研究。