专栏名称: 智东西
智东西-聚焦智能变革,服务产业升级!作为智能行业新锐媒体,智东西专注五大领域:VR/AR;AI/机器人/无人机;智能汽车/智能出行;智能家居/物联网;智能穿戴/智能医疗,通过内容、活动、报告以及社群等方式助力“智能+”时代的创业和产业升级。
目录
相关文章推荐
新浪科技  ·  #奥迪回应性声明#【#奥迪回应取消全面电动化 ... ·  16 小时前  
yikai 的摸鱼笔记  ·  专访Granola ... ·  2 天前  
yikai 的摸鱼笔记  ·  专访Granola ... ·  2 天前  
新浪科技  ·  【#京东CEO称外卖订单量远超预期#:#京东 ... ·  2 天前  
51好读  ›  专栏  ›  智东西

豆包1.6来了!深度推理测评超DeepSeek-R1,视频模型超Veo3

智东西  · 公众号  · 科技媒体  · 2025-06-11 21:00

主要观点总结

在FORCE原动力大会上,火山引擎发布了新一系列AI产品,包括豆包大模型1.6系列、豆包·视频生成模型Seedance 1.0 pro、豆包·语音播客模型等。这些新产品在推理能力、多模态理解能力、图形界面操作能力等方面有了显著提升,特别是在视频生成和语音交互方面的能力获得了突破。同时,火山引擎还推出了AI云原生全栈服务,包括一系列工具产品和解决方案,旨在帮助企业快速搭建AI应用原型,构建高生产力的Agent。这些新产品和新服务展示了字节跳动以“模型能力+工具链+基础设施”为核心的产业智能化路径。

关键观点总结

关键观点1: 火山引擎推出新产品和服务

包括豆包大模型1.6系列、豆包·视频生成模型Seedance 1.0 pro、豆包·语音播客模型等,提升推理能力、多模态理解能力、图形界面操作能力等。

关键观点2: 豆包大模型1.6系列的特点和优势

支持多模态理解和图形界面操作,具有边想边搜、DeepResearch深度研究能力,能在企业端广泛应用于多种场景。

关键观点3: Seedance 1.0 pro的视频生成能力

具备无缝多镜头叙事、多动作及随心运镜、稳定运动与真实美感等特点,在文生视频、图生视频两项任务上超越其他多模态模型。

关键观点4: 火山引擎的AI云原生全栈服务

包括TRAE、MCP服务、PromptPilot、AI知识管理产品等工具和解决方案,旨在帮助企业快速搭建AI应用原型,构建高生产力的Agent。

关键观点5: 字节跳动的AI战略

以“模型能力+工具链+基础设施”为核心,从模型研发到应用落地形成闭环,推动行业效率提升与创新模式变革。


正文

请到「今天看啥」查看全文



据悉,豆包大模型1.6系列包含三个模型,分别为doubao-seed-1.6、1.6-thinking以及1.6-flash,并且这三个模型都 支持256K上下文 doubao-seed-1.6 All-in-One的综合模型 ,深度思考、多模态理解、图形界面操作等多项能力。用户可以选择开启或关闭深度思考、自适应思考三种方式,其中自适应思考模式可根据提示词难度自动决定是否开启思考,提升效果的同时大幅减少tokens消耗。
doubao-seed-1.6-thinking 是豆包大模型1.6系列在深度思考方面的强化版本,在 代码、数学、逻辑推理 等基础能力上有进一步提升。 doubao-seed-1.6-flash 是豆包大模型1.6系列的极速版本,支持深度思考和多模态理解。比较有特点的是, flash的延迟极低,TOPT仅需10毫秒 ,火山引擎称其 视觉理解能力比肩友商旗舰模型
智东西从现场了解到,豆包大模型1.6-thinking在推理能力、多模态理解能力、GUI操作能力上较1.5 pro有一定提升,其在GPQA Diamond(推理能力)和Multichallenge(指令执行)榜单上 超越DeepSeek-R1-0528 ,与OpenAI-03-high的差距也在逐步缩小。
1.6系列模型支持多模态理解和图形界面操作,能够理解和处理真实世界问题,该能力支持了 豆包APP最新的实时视频通话功能 ,在企业端可广泛应用于电商商品审核、自动驾驶标注、安全巡检等场景。
豆包1.6的图形界面(GUI)操作能力可以帮助用户完成一系列“智能体”类的跨平台操作能力。演示案例显示,豆包1.6可自动操作浏览器完成酒店预定,识别购物小票并整理成Excel表格等任务。
豆包大模型1.6在推理速度、准确度与稳定性上也有明显提升。豆包大模型1.6具有 边想边搜、DeepResearch深度研究能力 ,能独立思考、规划、使用搜索等各种研究工具,可以 在5-30分钟内生成一份调研报告
据悉,目前豆包大模型已涵盖多模态、视频、图像、语音、音乐等模型品类。在行业应用上,豆包大模型已与全球TOP10手机厂商中的9家、8成主流汽车品牌、70%的系统重要性银行及超5成985高校等达成合作。
为方便企业使用,火山引擎还推出大模型应用实验室,并开源了手机助手、实时视频理解、DeepSearch等应用,帮助企业快速搭建AI应用原型,编排专属智能体。用户可在火山引擎官网大模型应用实验室、GitHub方舟开源站点下载使用。

02 .
Seedance 1.0多视频生成能力登顶
播客大模型可一句话生成脚本






请到「今天看啥」查看全文