专栏名称: 腾讯科技
只供应最有营养的科技大餐!
目录
相关文章推荐
新浪科技  ·  【#扎克伯格150亿美元收购AI初创公司#】 ... ·  21 小时前  
新浪科技  ·  【#苹果确认部分Mac ... ·  昨天  
36氪  ·  大学里的水课,为什么都长一个样 ·  2 天前  
新浪科技  ·  #追觅科技悬赏100万征集线索#【#追觅科技 ... ·  2 天前  
51好读  ›  专栏  ›  腾讯科技

OpenAI o1比博士还“聪明”,全球11位AI大咖怎么看?

腾讯科技  · 公众号  · 科技媒体  · 2024-09-13 16:21

主要观点总结

OpenAI推出了名为OpenAI o1的新人工智能模型,具备“推理”能力,尤其擅长处理数学、代码、物理、化学等问题。该模型分为o1-preview和o1-mini两个版本,仅支持文本形式。全球多位AI领域的关注者对其进行了评价,意见大致分为两派。一派以OpenAI的高管和研究员为代表,认为新模型开启了AI技术的新范式,使大模型走向更复杂的推理时代;另一派则持较为保守的观点,认为新模型的能力尚未得到充分测试,距离AGI还很遥远。OpenAI o1模型的推出标志着AI技术的重要进展,但在处理非标准化问题上仍需提高。

关键观点总结

关键观点1: OpenAI推出名为OpenAI o1的新人工智能模型,具有推理能力,擅长处理多领域问题。

新模型推出了o1-preview和o1-mini两个版本,仅支持文本形式。全球AI领域的关注者对其评价不一,存在分歧。

关键观点2: OpenAI o1模型的评价存在两种主要观点。

一派以OpenAI的高管和研究员为代表,认为新模型开启了AI技术的新范式;另一派则认为新模型的能力尚未得到充分测试,距离实现AGI还有很长的路要走。

关键观点3: OpenAI o1模型在处理非标准化问题上仍有待提高。

该模型擅长处理标准化程度高的理科问题,但在解决没有标准答案的非标准化问题上仍需进一步提高。


正文

请到「今天看啥」查看全文


虽然OpenAI o1在AIME和GPQA的测试中显得很强大,但不一定能直接转化为用户可以感受到的效果。即使对科学工作者来说,找出GPT-4不如OpenAI o1的提示并不容易,但一旦找到,你会觉得非常惊奇。我们都需要找到更具挑战性的提示。

人工智能用人类语言模拟思维链在很多方面表现出色。这个模型能像人类一样处理问题,比如将复杂的步骤拆解成简单的步骤、识别并纠正错误,以及尝试不同的方法。

这个领域已经被完全重新定义了。

OpenAI研究员马克斯·施瓦泽(Max Schwarzer) 我一直认为,你不需要一个GPT-6级的基础模型来实现人类水平的推理能力,强化学习才是通往AGI的关键。今天,我们有了证明——OpenAI o1。

作为OpenAI创始成员之一,前特斯拉AI高级总监安德烈·卡帕西(Andrej Karpathy)的评论画风格外不同,他吐槽了模型的“懒惰”问题: OpenAI o1-mini一直拒绝为我解决黎曼假设(Riemann Hypothesis),模型的“懒惰”仍然是一个主要问题。

英伟达高级研究科学家Jim Fan和 卡内基梅隆大学计算机科学博士生詹姆斯·坎贝尔(James Campbell) 虽然不是OpenAI工作人员, 也给了好评。

英伟达高级研究科学家Jim Fan: 这可能是自2022年原始Chinchilla缩放定律以来,大语言模型研究中最重要的进展。关键在于两个曲线的协同作用,而不是单一曲线。人们通过延伸训练缩放定律来预测大语言模型能力将陷入停滞,却未曾预见到推理缩放才是真正打破收益递减的关键。

我在2月份曾提到,任何自我提升的大语言模型算法都没能在三轮 之后取得显著进展。没有人能在大语言模型领域重现AlphaGo的成功,在这个领域,更多的计算能力将可达到超越人类的水平。不过,现在我们翻开了新的一页。

博士生坎贝尔 VS 奥特曼: 卡内基梅隆大学计算机科学博士生詹姆斯·坎贝尔(James Campbell)发帖,展示了OpenAI o1预览版在美国数学邀请赛(AIME)上的表现,显示其解答了83%的问题。相较之下,GPT - 4o仅解答出13%的问题。坎贝尔写道:“一切都结束了!” 对此,OpenAI首席执行官山姆·奥特曼(Sam Altman)回复称:“我们还会回来的!”



“中差评”阵营:买家需谨慎,

它并没有那么聪明


HuggingFace首席执行官兼联合创始人克莱门特·德兰吉(Clement Delangue): 再一次,人工智能系统并不是在“思考”,而是在“处理”和“运行预测”——就像谷歌或电脑一样。这种技术往往给人一种错误的印象,让你觉得这些系统像人类一样智能,但这只是廉价的宣传和营销策略,让你觉得它们比实际情况更聪明。







请到「今天看啥」查看全文