主要观点总结
本文报道了字节跳动在AI领域的最新进展。火山引擎举办了Force原动力大会,发布了豆包大模型1.6系列和豆包视频生成模型seedance 1.0 pro等新产品。CEO梁汝波表示AI发展还处于早期阶段,字节致力于成为优秀的创新科技公司。火山引擎总裁谭待介绍了豆包大模型的优势和应用场景,包括多模态能力、图形界面操作和多场景应用等。同时,豆包大模型成本降至三分之一,推动了AI Agent规模化应用的提速。
关键观点总结
关键观点1: 火山引擎举办Force原动力大会,发布新产品。
大会上,字节跳动发布了豆包大模型1.6系列和豆包视频生成模型seedance 1.0 pro等新产品。
关键观点2: 豆包大模型的优势和场景应用。
豆包大模型具备多模态能力、图形界面操作和多场景应用等优势,能够理解和处理真实世界问题。
关键观点3: AI发展的早期阶段和字节的目标。
CEO梁汝波表示AI发展还处于早期阶段,字节致力于成为优秀的创新科技公司。
关键观点4: 豆包大模型成本降低推动AI Agent规模化应用提速。
通过技术和商业创新,豆包大模型成本降至三分之一,使得AI Agent的应用得以更快速地规模化落地。
正文
据介绍,豆包1.6系列当前由三个模型组成,其中,doubao-seed-1.6是全功能综合模型,支持256K长上下文、自适应思考(自动判断是否开启深度推理);doubao-seed-1.6-thinking强化深度推理,编码、数学、逻辑能力显著提升,支持复杂Agent构建;doubao-seed-1.6-flash是极速版本,适用于实时交互场景(如智能客服、语音助手)。
据介绍,豆包1.6系列模型支持多模态理解和图形界面操作,能够理解和处理真实世界问题。相比豆包1.5的多模态能力,图形界面操作能力让其进一步具备“行动力”,如自动操作浏览器完成酒店预定,识别购物小票并整理成Excel表格等任务。
多项权威测评成绩显示,在复杂推理、竞赛级数学、多轮对话和指令遵循等测试集上,豆包1.6-thinking的表现已跻身全球前列。
除了多模态能力以外,大模型另一个振奋人心的领域是视频生成。会上,火山引擎发布最新的豆包视频生成模型seedance 1.0 pro,支持无缝多镜头叙事、丝滑运镜,应用于电商广告、影视分镜、游戏剧情生成。
“根据第三方权威榜单,豆包视频生成模型在文生视频、图生视频两个维度都超越了业界诸多主流模型。”谭待称。