主要观点总结
在FORCE原动力大会上,火山引擎发布了新一系列AI产品,包括豆包大模型1.6系列、豆包·视频生成模型Seedance 1.0 pro、豆包·语音播客模型等。这些新产品在推理能力、多模态理解能力、图形界面操作能力等方面有了显著提升,特别是在视频生成和语音交互方面的能力获得了突破。同时,火山引擎还推出了AI云原生全栈服务,包括一系列工具产品和解决方案,旨在帮助企业快速搭建AI应用原型,构建高生产力的Agent。这些新产品和新服务展示了字节跳动以“模型能力+工具链+基础设施”为核心的产业智能化路径。
关键观点总结
关键观点1: 火山引擎推出新产品和服务
包括豆包大模型1.6系列、豆包·视频生成模型Seedance 1.0 pro、豆包·语音播客模型等,提升推理能力、多模态理解能力、图形界面操作能力等。
关键观点2: 豆包大模型1.6系列的特点和优势
支持多模态理解和图形界面操作,具有边想边搜、DeepResearch深度研究能力,能在企业端广泛应用于多种场景。
关键观点3: Seedance 1.0 pro的视频生成能力
具备无缝多镜头叙事、多动作及随心运镜、稳定运动与真实美感等特点,在文生视频、图生视频两项任务上超越其他多模态模型。
关键观点4: 火山引擎的AI云原生全栈服务
包括TRAE、MCP服务、PromptPilot、AI知识管理产品等工具和解决方案,旨在帮助企业快速搭建AI应用原型,构建高生产力的Agent。
关键观点5: 字节跳动的AI战略
以“模型能力+工具链+基础设施”为核心,从模型研发到应用落地形成闭环,推动行业效率提升与创新模式变革。
正文
据悉,豆包大模型1.6系列包含三个模型,分别为doubao-seed-1.6、1.6-thinking以及1.6-flash,并且这三个模型都
支持256K上下文
。
doubao-seed-1.6
是
All-in-One的综合模型
,深度思考、多模态理解、图形界面操作等多项能力。用户可以选择开启或关闭深度思考、自适应思考三种方式,其中自适应思考模式可根据提示词难度自动决定是否开启思考,提升效果的同时大幅减少tokens消耗。
doubao-seed-1.6-thinking
是豆包大模型1.6系列在深度思考方面的强化版本,在
代码、数学、逻辑推理
等基础能力上有进一步提升。
doubao-seed-1.6-flash
是豆包大模型1.6系列的极速版本,支持深度思考和多模态理解。比较有特点的是,
flash的延迟极低,TOPT仅需10毫秒
,火山引擎称其
视觉理解能力比肩友商旗舰模型
。
智东西从现场了解到,豆包大模型1.6-thinking在推理能力、多模态理解能力、GUI操作能力上较1.5 pro有一定提升,其在GPQA Diamond(推理能力)和Multichallenge(指令执行)榜单上
超越DeepSeek-R1-0528
,与OpenAI-03-high的差距也在逐步缩小。
1.6系列模型支持多模态理解和图形界面操作,能够理解和处理真实世界问题,该能力支持了
豆包APP最新的实时视频通话功能
,在企业端可广泛应用于电商商品审核、自动驾驶标注、安全巡检等场景。
豆包1.6的图形界面(GUI)操作能力可以帮助用户完成一系列“智能体”类的跨平台操作能力。演示案例显示,豆包1.6可自动操作浏览器完成酒店预定,识别购物小票并整理成Excel表格等任务。
豆包大模型1.6在推理速度、准确度与稳定性上也有明显提升。豆包大模型1.6具有
边想边搜、DeepResearch深度研究能力
,能独立思考、规划、使用搜索等各种研究工具,可以
在5-30分钟内生成一份调研报告
。
据悉,目前豆包大模型已涵盖多模态、视频、图像、语音、音乐等模型品类。在行业应用上,豆包大模型已与全球TOP10手机厂商中的9家、8成主流汽车品牌、70%的系统重要性银行及超5成985高校等达成合作。
为方便企业使用,火山引擎还推出大模型应用实验室,并开源了手机助手、实时视频理解、DeepSearch等应用,帮助企业快速搭建AI应用原型,编排专属智能体。用户可在火山引擎官网大模型应用实验室、GitHub方舟开源站点下载使用。