正文
随着应用场景变得越来越复杂,人工智能技术仍面临着众多挑战。首先,由于环境噪声、物理随机过程、数据缺失等因素的存在,大数据中存在普遍的不确定性,这就要求人工智能技术具有不确定性建模和推理的能力。其次,在关键应用领域,由于隐私保护、欺骗、伪装等技术的运用,信息有缺有盈、有真有假是普遍存在的现象,这就要求人工智能系统能够去伪存真,在不完全信息的条件下做出正确的决策。最后,真实应用场景往往是开放的和动态变化的,场景中的概念随着时间可能增加也可能减少,这就要求人工智能系统能够自适应环境变化。为此,目前急需发展能有效处理“不确定性、不完全信息、开放环境”的人工智能理论和方法。
︾
针对这一现状,
清华大学的研究团队在国家973计划项目“非结构化环境下的智能感知基础理论与关键技术”子课题“非结构化环境的表征、结构识别与异构推理”的支持下,对贝叶斯方法、大数据机器学习、深度学习等人工智能技术进行了深入研究,提出了多个创新理论和高效算法,并将研究成果应用于图像、视频、文本等数据的分析任务,取得了显著的性能提升。
要理解研究团队的研究,首先要理解贝叶斯定理。经典的贝叶斯定理由18世纪的英国教士托马斯.贝叶斯提出,迄今已有250多年的历史,给整个科学界和统计学界都带来了深远的影响。概括地说,贝叶斯方法是一种计算概率的方法,其前提是假设的先验概率、在给定假设下观察到不同数据的概率以及观察到的数据本身。以收到的邮件为例,假设我们收到垃圾邮件的概率为60%(先验概率),当我们收到一封包含“职称”的邮件时,这封邮件是垃圾邮件的概率(后验概率)有多高呢?这时便可以引入贝叶斯理论。简言之,贝叶斯方法的最终目的是寻找到能够处理不确定性的方法。
正则化贝叶斯为贝叶斯推理提供了第三维自由度,即后验约束