专栏名称: 腾讯科技
只供应最有营养的科技大餐!
目录
相关文章推荐
新浪科技  ·  #王自如下周或恢复更新# ... ·  22 小时前  
新浪科技  ·  #蔚来一季度交付同比增长超40%# ... ·  21 小时前  
新浪科技  ·  【#现货黄金上触3340#】现货黄金向上触及 ... ·  2 天前  
51好读  ›  专栏  ›  腾讯科技

2025,硅谷冷落AGI,为“超级智能”爆灯

腾讯科技  · 公众号  · 科技媒体  · 2025-01-15 08:28

正文

请到「今天看啥」查看全文



智能体是杀手级应用的必要条件

如果将大模型比作会做题的学生,智能体就是毕业生 ,必须学以致用。

行业对智能体的共识,贯穿2024年始终,2025年将达到高潮。几乎所有的科技巨头、初创企业与垂直行业,都参与其中,就像当年开发APP一样。去年年初,吴恩达团队基于GPT-3.5的智能体的性能,甚至超过了GPT-4。

智能体就是用来完成原本应该由人完成的任务,它最本质特征就是会使用工具,首先从使用数字化的工具开始,进入工作流,如PC,还有任务流,如手机。编程是智能体进展最快的领域;Claude的computer use,以及完全体的Siri,可以初步实现像人类那样操作PC或手机。设计与使用工具的能力,是对智能体的基准评价。首先是数字空间,然后结合物理场景。

在互联网时代与移动互联网时代,杀手级应用依托于网络效应; 在大模型时代,AI应用的爆发与杀手级应用的诞生,很大程度上将依托于智能体使用工具的熟练程度,还有设计新工具的能力。

智能体依赖于推理模型的进步。它可以通过增加检索和思维链中的反思减少大模型的“幻觉”,并且增加对“涌现”的可解释性,但根本上更强的基础模型是具备类似人类的慢思考与快思考结合的直觉判断能力。它依赖于更强大的检索增强生成,也需要更高效地从模仿学习到解耦到泛化再到涌现。

与去年将智能体嵌入工作流,拆解、分配任务并处理问题相比,基于下一代大模型的智能体,要在开放式场景中发挥更多主动性。这就要求它能够利用的工具足够顺手,调用工具的方式足够合理。

尽管智能体将首先在数字化的工作流中得到快速渗透,但推理与多模态相结合,才能让AI与世界产生更有意义的交互。它是智能体对ChatGPT的人类与AI交互的自然延伸。纳德拉将ChatGPT的成功,归因于它是有状态(stateful) 的工具。

有状态,意味着工具能够像人一样,记住上下文,并进行动态调整,从而提供更智能和人性化的交互 ;而传统搜索尽管有搜索历史,但没有更深入的状态管理,是无状态的。

在这个意义上,智能体的“状态”将变得更为丰富,也更为重要,同时面临更大的工程挑战,尤其是多智能体协同时。李飞飞在最近一篇智能体综述论文中表示,多模态、跨现实,将是通往通用人工智能的智能体的新范式。


重塑算力与应用市场格局

2025年,整个市场仍将处于算力饥渴的状态。

微软决定在2025财年投入800亿美元的资本开支,xAI已经以疯狂的速度建立起十万张GPU卡的算力集群,把这场竞赛的巨头级门槛,提升到千亿美元资本支出和十万卡算力集群级别。

大模型进入推理时代,反而强化了算力逻辑。

首先,AI作为通用技术,将随着推理模型与智能体技术的成熟,进入越来越多的行业。而且, 如果AI推理解决有经济价值的问题,能提升效率并且创造出新的需求,那么,就会伴随着单位算力成本下降,越便宜用得越多,推高算力的总需求量。

其次,推理模型的思维链,以及智能体感知环境与调度工具的中间过程,也将消耗大量终端用户看不到的算力。任务越复杂、越广泛,消耗的token呈数量级增加。

最后,即使最近涌现出一批更轻量和更集约的模型,要保持同等的性能,往往在基础模型、合成数据等多个环节,额外增加算力支出。

算力经济将会继续繁荣下去。越有价值的推理,消耗越大量的token,价格越贵。

红杉资本判断,行业将从按席位收费,转向按成果收费。但是,一旦推理模型进入市场竞争阶段,谁能提供更高性价比的服务,谁将占据上风。







请到「今天看啥」查看全文