专栏名称: 腾讯研究院
【腾讯研究院 ★ Tencent Research Institute】 网聚智慧,连接世界!网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。
目录
相关文章推荐
新浪科技  ·  【@雷军 ... ·  15 小时前  
Web3天空之城  ·  Cursor核心成员圆桌:用强化学习训练编码 ... ·  14 小时前  
Web3天空之城  ·  Cursor核心成员圆桌:用强化学习训练编码 ... ·  14 小时前  
51好读  ›  专栏  ›  腾讯研究院

科学家都开始用起了AI,事实果真如此吗?

腾讯研究院  · 公众号  · 科技媒体  · 2025-03-10 16:30

正文

请到「今天看啥」查看全文


这项研究通过GPT-4o等大语言模型进行语义解析,团队构建了一个包含12.9万科学问题与4.2万AI方法的新数据集,之后经过语义聚类,最终形成390个科学问题簇和355个AI方法簇。这一过程突破了传统分类体系的桎梏,实现了数据驱动的动态映射。

有了数据,还需要能将数据梳理清楚的筛子——不止是发现当下数据的统计规律,还需要根据数据中涌现的趋势来预测未来。AI+科学这个公式的两端,一边是日新月异的AI工具,另一方则是各个细分领域的科学问题。考虑到AI是一项通用的技术,预期其适合各个领域,只是有些领域接触AI更早,因此出成果更快。

由此,这项研究使用复杂网络的方法,将AI方法和科学问题作为节点,构建二分图,图2a中每个节点的大小对应其无权度,表示应用于科学问题的 AI 方法数量,或应用了 AI 方法的科学问题数量。而边的分布不均表明AI与science的连接不平衡,对应AI4Science的应用存在错位。图b-c展示了AI 方法节点的度遵循对数正态分布,而科学问题节点的度分布更为肥尾,表明存在“枢纽”连接 AI 和科学。

图2:AI-Science 二分图及节点分布


二、哪些学科和AI的结合有哪些错位?

有了上述的AI4Science数据集 (图1) ,就可以将科学问题按照该领域内的论文数量,以及该领域内应用AI的论文数量进行对比,如果这个比例偏低,那么就可以说明这个领域使用AI的进度相对落后。

图3,4 科学问题及AI方法中,每个聚簇使用AI的研究多少,图中x 轴表示每个聚簇的总出版物数量,而 y 轴反映每个聚簇中的跨学科 AI4Science 出版物数量。

结果显示,AI应用高度集中于少数领域,如蛋白质设计、材料科学、基因组分析。与之相对的是,存在大量科学问题尚未被充分探索,如不对称合成、磁性材料挑战、森林与气候变化等关键领域的AI渗透率不足10%,这些科学问题可能会更多地从采用 AI 方法中受益。

类似的逻辑也可以用来分析那些AI方法,例如注意力机制、梯度基方法/梯度下降、嵌入技术、策略优化、正则化技术、对抗训练、对比学习和变分推断等还没有被广泛应用。这些技术未来可能在更广泛的科学应用中得到探索。

之后在上述的二分图中 (图2)







请到「今天看啥」查看全文