专栏名称: 知危
提供敏锐、独到的商业信息与参考,重点关注TMT、出海、新消费、新能源。
目录
相关文章推荐
新东方家庭教育  ·  喜欢把家里打扫得很干净的人,大多活成了这样( ... ·  9 小时前  
PChouse家居画报  ·  “去客厅化”多赚20㎡功能区,看完想重装! ·  昨天  
上海科技馆  ·  99%的人不知道:开了空调后,这里再摆个风扇 ... ·  23 小时前  
长春晚报  ·  官宣:全额退款!立即停用 ·  昨天  
51好读  ›  专栏  ›  知危

OpenAI新智能体API:小白狂喜,老手无感

知危  · 公众号  ·  · 2025-03-12 22:17

正文

请到「今天看啥」查看全文



至于 Assistant API,之后 OpenAI 将在 Response API 完成了对 Assistant API 的功能继承之后 ( 比如本次很遗憾还没加上的 Code Interpreter,以及Assistant、Thread 等 ) ,就会在 2026 年中期将 Assistant API 完全弃用,开发者们可以做好准备开始迁移了。

网络搜索工具基于 GPT-4o 和 GPT-4o-mini,在基准测试 SimpleQA上,GPT-4o search preview 和 GPT-4o mini search preview 获得了 90% 和 88% 的分数,远超 OpenAI 其它没有调用搜索的基础模型。


费用方面,GPT-4o search preview 和 GPT-4o mini search preview 的定价分别是 30 美元每千次查询和 25 美元每千次查询。


文件搜索工具和 Assistant API 中的类似,相比于 Assistant API,增加了元数据过滤、直接搜索端点 ( 可直接搜索向量存储 ) 等新功能。

费用方面,每千次查询是 2.50 美元,文件存储则是 0.10 美元/GB/天,首 GB 免费。


Computer Use 工具和之前发布的 Operator 一样使用了 Computer-Using Agent ( CUA ) 模型。基准测试方面,该模型在 OSWorld 的全 Computer Use 任务上达到 38.1% 成功率,在 WebArena 上达到 58.1% 成功率,在 WebVo yager 的基于 Web 的交互任务上达到 87% 成功率,创下了新的 SOTA 记录。


OpenAI 表示,此次通过 API 使用 Computer Use,相当于将 Operator 的功能扩展到本地操作系统,会引入新的风险,尽管进行了额外的安全评估和红队测试,结合其在 OSWorld 上仍然远不够好的表现,官方建议使用时进行人工监督。






请到「今天看啥」查看全文