专栏名称: 计算机司令部
安信计算机:严谨研究 真诚服务。
目录
相关文章推荐
老刘说NLP  ·  纯Prompt提示LLM的多阶段知识图谱三元 ... ·  2 天前  
腾讯技术工程  ·  让小程序从“能用”到“好用”——还差一个Bu ... ·  4 天前  
程序猿  ·  “把 if 往上提,for 往下放!” ·  2 天前  
稀土掘金技术社区  ·  【万字总结】2025 前端+大前端+全栈 ... ·  3 天前  
程序员的那些事  ·  突发!TP-Link ... ·  4 天前  
51好读  ›  专栏  ›  计算机司令部

【民生AI体验官】OpenAI o3/o4 mini:开启图像推理新时代

计算机司令部  · 公众号  ·  · 2025-04-19 23:32

正文

请到「今天看啥」查看全文




2、编码能力方面


x@flavioAd第一时间给o3和o4-mini上了小球测试:



在编程基准测试中,包括 SWE-Lancer: IC SWE Diamod Freelancer 编程任务和 SWE-Bench Verified 软件工程任务,SWE‑Lancer: IC SWE Diamond上真实的自由职业软件工程任务,模型以“高奖励”模式接单,看看最后能拿到的收益是多少钱,o3和o4-mini都直接上了high模式。


3、多模态处理能力方面

OpenAI首次展示了其模型如何将图像直接整合进推理思维链中。




o3 模型已突破传统视觉识别局限,构建起从 “看” 到 “想” 的跨越式能力。通过创新的多模态融合技术,它将视觉感知与语义推理深度交织,在国际权威多模态测评中刷新了性能标杆。无论是记录会议要点的白板照片、承载专业知识的教材插图,还是即兴勾勒的创意草图,用户仅需上传图片,模型便能穿透模糊、倒置或像素受损的画面表象,精准捕捉视觉信息背后的深层逻辑。


更值得关注的是,依托强大的工具调用系统,o3模型在分析过程中可实时执行图像旋转、局部缩放、格式转换等操作,将图像处理转化为动态推理的有机组成部分,真正实现 “用图像思考” 的智能进化。图为OpenAI官方案例,o3已经可以完成复杂的图像推理。









请到「今天看啥」查看全文