正文
博通乐观展望ASIC需求,中移动普遍光缆招标结果出炉
英伟达财报平稳落地,运营商4月收入增速提升》
对外发布时间:2025年6月8日
报告发布机构:中信建投证券股份有限公司
本报告分析师:
阎贵成 SAC 编号:S1440518040002
SFC 编号:BNS315
刘永旭 SAC 编号:S1440520070014
SFC 编号:BVF090
汪洁 SAC 编号:S1440523050003
《
多模态产品密集更新,关注WWDC及字节火山大会进展
稳定币影响几何》
近期多模态动态更新密集。5月21日,谷歌于2025 I/O大会上正式推出 Veo 3 视频生成模型,实现AI视频音画同步;5月23日,豆包正式上线视频通话功能,支持实时视频交流及屏幕分享;6月6日,快手宣布可灵AI ARR在2025年3月突破1亿美金,且4月和5月的月度付费金额均突破1亿人民币。考虑到6月10日苹果WWDC 2025及6月11日字节Force 2025原动力大会·春即将召开,多模态模型和端侧AI产品有望加速落地。
本周周观点
多模态模型持续发展,国内模型表现亮眼。
国内外多模态模型呈现交替发展的格局。其中,在文生图模型领域,中美模型能力大致相当,OpenAI 2025年5月更新的GPT-4o和字节2025年4月推出的Seedream 3.0在Artificial Analysis的ELO评分中分别获得1165和1161分;此外,部分老模型如Recraft V3仍然具备一定的竞争力。在文生视频模型领域,谷歌Veo 3 Preview版本强于快手Kling 2.0,近期Veo 3正式发布则进一步加速多模态商业化进程;而除谷歌和快手相对领先外,OpenAI Sora(1053分)、MiniMax T2V-01(1039分)、Pika 2.0(1037分)、阿里Wan 2.1(1027分)整体排名靠前。在图生视频模型领域,谷歌Veo 3 Preview同样相比快手Kling 2.0保持一定的领先优势;部分模型如Sora在不同输入模式之间表现差异显著,即在文生视频表现较好,而在图生视频任务方面表现较弱,受此影响模型如Runway Gen 4和Pika 2.2单独发布了图生视频模型。
谷歌I/O大会发布Veo 3模型,实现AI视频音画同步。
5月21日,谷歌于2025 I/O大会上正式推出 Veo 3 视频生成模型和 Imagen 4 图像生成模型。其中,Veo 3不仅能生成高质量视频,还能理解视频中的原始像素,自动生成与画面同步的对话、多种音效,即通过单个提示词生成附带音频的完整视频。据用户实测,Voe 3能够生成口型一致、鼓点同步的脱口秀、音乐会等场景视频,达到以假乱真的水平。目前,Veo 3定位服务于专业创作者、开发者的高阶会员能力,仅面向美国Ultra订阅用户开放,定价249.99 美元/月,展现了多模态模型的商业化应用价值。
豆包上线视频通话功能,支持实时视频交流及屏幕分享。
5月23日,豆包正式上线视频通话功能,用户可以在豆包App对话框中选择“打电话”功能体验视频通话。豆包的本次升级基于最新的视觉推理模型,支持联网搜索,可以在各种场景为用户提供支持。此外,在豆包接听电话的过程中,用户还可以打开“共享屏幕”选项,与豆包一起浏览视频和网页。此时豆包不仅可以实时描述和评论画面内容,还会主动抛出基于视频主题及其相关内容的聊天话题,大幅提升交互体验。
可灵ARR突破1亿美金,多模态创作场景商业化落地加速。
6月6日,快手宣布可灵AI年化收入运行率(ARR)在2025年3月(正式上线的第10个月)已突破1亿美金,且月度付费金额在2025年4月和5月连续突破1亿人民币,营收增速和营收水平均位居全球视频生成大模型产品和独立AI产品前列。具体而言,可灵AI自2024年6月发布以来已累计完成了超过20次的迭代,致力于提升模型基础质量并给用户提供创作所想的可控能力。一方面,快手可灵AI为P端用户(专业的自媒体、视频创作者和广告营销从业者等)提供会员订阅服务,助力提升创作效率和质量;另一方面,快手可灵AI还为超过1万家的海内外企业客户和开发者提供API服务,涵盖专业创作平台、广告营销、影视动画、游戏制作和智能终端等多个行业;通过P端和B端的结合,可灵AI实现商业化落地加速。
苹果及字节大会将近,关注多模态基模升级和端侧产品进展。
6月10日,苹果WWDC 2025即将召开,此前彭博社的马克·古尔曼发文称公司内部已经在测试远比目前发布的Apple智能更强大的大模型,或能更好支撑模型在设备端运行;6月11日-6月12日,字节Force 2025原动力大会·春将于北京举行,豆包大模型家族讲全线升级,有望更好支撑AI应用落地。随着多模态基础模型能力的不断提升,叠加WWDC、字节火山大会、小米AI眼镜、DS-R2等预期,端侧AI产品有望加速落地。
总结:近期多模态动态更新密集。5月21日,谷歌于2025 I/O大会上正式推出 Veo 3 视频生成模型,实现AI视频音画同步;5月23日,豆包正式上线视频通话功能,支持实时视频交流及屏幕分享;6月6日,快手宣布可灵AI ARR在2025年3月突破1亿美金,且4月和5月的月度付费金额均突破1亿人民币。考虑到6月10日苹果WWDC 2025及6月11日字节Force 2025原动力大会·春即将召开,多模态模型和端侧AI产品有望加速落地。
投资建议:多模态模型持续更新。1)利好有数据、有客户、有场景的软件企业,AI产品有望带动公司ARPU提升和项目单价上升;2)模型私有化需求增加,利好一体机、超融合和B端服务外包企业。
风险提示
(1)宏观经济下行风险:计算机行业下游涉及千行百业,宏观经济下行压力下,行业IT支出不及预期将直接影响计算机行业需求;(2)应收账款坏账风险:计算机多数公司业务以项目制签单为主,需要通过验收后能够收到回款,下游客户付款周期拉长可能导致应收账款坏账增加,并可能进一步导致资产减值损失;(3)行业竞争加剧:计算机行业需求较为确定,但供给端竞争加剧或将导致行业格局发生变化;(4)国际环境变化影响:国际贸易摩擦加剧,美国不断对中国科技施压,对于海外收入占比较高公司可能形成影响。