专栏名称: AI科技评论
「AI科技评论」是国内顶尖人工智能媒体和产业服务平台,专注全球 AI 业界、学术和开发三大方向的深度报道。
目录
相关文章推荐
爱可可-爱生活  ·  【[88星]official-lean-ai ... ·  昨天  
云技术  ·  20万元,DeepSeek系统硬件及AI服务 ... ·  昨天  
云技术  ·  20万元,DeepSeek系统硬件及AI服务 ... ·  昨天  
黄建同学  ·  Firecrawl推出官方Firecrawl ... ·  昨天  
爱可可-爱生活  ·  【[78星]trpc-a2a-go:为AI ... ·  昨天  
中新经纬  ·  机器人之后,荣耀不止于智能手机制造 ·  2 天前  
中新经纬  ·  机器人之后,荣耀不止于智能手机制造 ·  2 天前  
51好读  ›  专栏  ›  AI科技评论

新任AAAI 2021 大会主席,杨强教授认为的「机器学习前沿问题」有哪些?

AI科技评论  · 公众号  · AI  · 2020-01-18 00:26

正文

请到「今天看啥」查看全文


1、机器学习如何规模化?
虽然人工智能现在发展的非常火热,但是人工智能面临巨大的挑战,首先是人才的挑战,培养一个人工智能的人才,包括在学校里的培养,在实践当中培养,前后加起来需要耗费近十年的时间。
那么人工智能技术本身是不是可以用来设计人工智能?在人工智能的具体应用环节,有的环节是否能够让人工智能来进行?换句话说,AI的算法是不是可以自动化的进行设计?要解决这个问题需要全面考虑AI算法,尤其是机器学习算法整个流程的每个环节,哪个环节适宜用自动化,哪个环节不能用自动化。
机器学习的整个流程包括问题的定义、收集数据、建立特征工程、模型的训练和测试、应用,最后再将应用的结果反馈到第一步。所以这个循环的过程非常繁杂,有很多的环节需要人工智能的专家,这也是为什么一个人工智能落地的项目非常昂贵的原因。所以哪个步骤可以用自动化来解决?例如从定义问题出发,定义问题不仅仅是从过去知识学习的问题,还能够有意识的提出新颖的想法,甚至有些想法没有过去的经验可参考。
因此我们断定在定义问题的环节很难引入自动化,但是后面的环节,例如数据的收集、数据聚合,然后形成特征工程,包括模型的训练其实都是可以自动化。
在数学模型的概念上,机器学习目的在于使训练数据和模型之间的差别变得越来越小,整个过程是一个优化的过程,也是一个概率的过程。我们在寻找模型的时候,实际上是在配置的参数空间里面寻找。但是参数的数量,尤其是在深度学习里面的参数数量非常多,维度可以达到上亿。这些参数一般是机器学习专家来调节,那么如果使用机器,效果是不是更好?
第二个环节,是性能的评估,即评估模型和训练数据差别,这个环节也可以部分的由机器来解决,虽然这个差别本身的定义还是由人来解决,即由数学家来定义一个模型和训练数据之间到底有多大的差别。
所以,最近的一些分析,人工智能的基础是不是应该是数学,就体现在:数学家对距离的定义,即各种各样的在不同的空间,转化空间之间的距离的定义。
那么如何高效的求解,在这个空间里面找到最佳的配置是一个优化的问题,所以总结起来为:数据的预处理、特征处理和模型训练。这几个方面都可以形成一些搜索空间,可以在这样的空间里面形成优化函数,例如上图左边是三个空间,那么在这三个空间就包括在右边的那个性能的空间里面。

自动化的特征工程已经有非常好的平台,例如第四范式公司推出了AutoCross平台,他会把不同维度的特征自动的组合筛选,最后推出最优化的组合。同时现在比较困难的是在自动化机器学习里如何找到一个最优的网络结构,这也是拓扑空间的搜索问题。
上图的右上角展现的是一个深度学习的拓扑结构,也即从一个神经元到另外一个神经元之间的连接,这种连接千变万化,而且影响是巨大。那么如何找到一个最佳的拓扑结构?这是比较难的问题,这个问题现在也在尝试自动化的方式解决,具体来说是引用了强化学习的概念,如上图左侧所示。






请到「今天看啥」查看全文