中信建投：TMT科技本周核心推荐

中信建投证券研究 · 公众号 · 证券 · 2025-06-10 07:25

正文

请到「今天看啥」查看全文

博通乐观展望ASIC需求，中移动普遍光缆招标结果出炉英伟达财报平稳落地，运营商4月收入增速提升》

对外发布时间：2025年6月8日

报告发布机构：中信建投证券股份有限公司

本报告分析师：

阎贵成 SAC 编号：S1440518040002

SFC 编号：BNS315

刘永旭 SAC 编号：S1440520070014

SFC 编号：BVF090

汪洁 SAC 编号：S1440523050003

《多模态产品密集更新，关注WWDC及字节火山大会进展稳定币影响几何》

中信建投证券研究

近期多模态动态更新密集。5月21日，谷歌于2025 I/O大会上正式推出 Veo 3 视频生成模型，实现AI视频音画同步；5月23日，豆包正式上线视频通话功能，支持实时视频交流及屏幕分享；6月6日，快手宣布可灵AI ARR在2025年3月突破1亿美金，且4月和5月的月度付费金额均突破1亿人民币。考虑到6月10日苹果WWDC 2025及6月11日字节Force 2025原动力大会·春即将召开，多模态模型和端侧AI产品有望加速落地。

本周周观点

多模态模型持续发展，国内模型表现亮眼。国内外多模态模型呈现交替发展的格局。其中，在文生图模型领域，中美模型能力大致相当，OpenAI 2025年5月更新的GPT-4o和字节2025年4月推出的Seedream 3.0在Artificial Analysis的ELO评分中分别获得1165和1161分；此外，部分老模型如Recraft V3仍然具备一定的竞争力。在文生视频模型领域，谷歌Veo 3 Preview版本强于快手Kling 2.0，近期Veo 3正式发布则进一步加速多模态商业化进程；而除谷歌和快手相对领先外，OpenAI Sora（1053分）、MiniMax T2V-01（1039分）、Pika 2.0（1037分）、阿里Wan 2.1（1027分）整体排名靠前。在图生视频模型领域，谷歌Veo 3 Preview同样相比快手Kling 2.0保持一定的领先优势；部分模型如Sora在不同输入模式之间表现差异显著，即在文生视频表现较好，而在图生视频任务方面表现较弱，受此影响模型如Runway Gen 4和Pika 2.2单独发布了图生视频模型。

谷歌I/O大会发布Veo 3模型，实现AI视频音画同步。 5月21日，谷歌于2025 I/O大会上正式推出 Veo 3 视频生成模型和 Imagen 4 图像生成模型。其中，Veo 3不仅能生成高质量视频，还能理解视频中的原始像素，自动生成与画面同步的对话、多种音效，即通过单个提示词生成附带音频的完整视频。据用户实测，Voe 3能够生成口型一致、鼓点同步的脱口秀、音乐会等场景视频，达到以假乱真的水平。目前，Veo 3定位服务于专业创作者、开发者的高阶会员能力，仅面向美国Ultra订阅用户开放，定价249.99 美元/月，展现了多模态模型的商业化应用价值。

豆包上线视频通话功能，支持实时视频交流及屏幕分享。 5月23日，豆包正式上线视频通话功能，用户可以在豆包App对话框中选择“打电话”功能体验视频通话。豆包的本次升级基于最新的视觉推理模型，支持联网搜索，可以在各种场景为用户提供支持。此外，在豆包接听电话的过程中，用户还可以打开“共享屏幕”选项，与豆包一起浏览视频和网页。此时豆包不仅可以实时描述和评论画面内容，还会主动抛出基于视频主题及其相关内容的聊天话题，大幅提升交互体验。

可灵ARR突破1亿美金，多模态创作场景商业化落地加速。 6月6日，快手宣布可灵AI年化收入运行率（ARR）在2025年3月（正式上线的第10个月）已突破1亿美金，且月度付费金额在2025年4月和5月连续突破1亿人民币，营收增速和营收水平均位居全球视频生成大模型产品和独立AI产品前列。具体而言，可灵AI自2024年6月发布以来已累计完成了超过20次的迭代，致力于提升模型基础质量并给用户提供创作所想的可控能力。一方面，快手可灵AI为P端用户（专业的自媒体、视频创作者和广告营销从业者等）提供会员订阅服务，助力提升创作效率和质量；另一方面，快手可灵AI还为超过1万家的海内外企业客户和开发者提供API服务，涵盖专业创作平台、广告营销、影视动画、游戏制作和智能终端等多个行业；通过P端和B端的结合，可灵AI实现商业化落地加速。

苹果及字节大会将近，关注多模态基模升级和端侧产品进展。 6月10日，苹果WWDC 2025即将召开，此前彭博社的马克·古尔曼发文称公司内部已经在测试远比目前发布的Apple智能更强大的大模型，或能更好支撑模型在设备端运行；6月11日-6月12日，字节Force 2025原动力大会·春将于北京举行，豆包大模型家族讲全线升级，有望更好支撑AI应用落地。随着多模态基础模型能力的不断提升，叠加WWDC、字节火山大会、小米AI眼镜、DS-R2等预期，端侧AI产品有望加速落地。

总结：近期多模态动态更新密集。5月21日，谷歌于2025 I/O大会上正式推出 Veo 3 视频生成模型，实现AI视频音画同步；5月23日，豆包正式上线视频通话功能，支持实时视频交流及屏幕分享；6月6日，快手宣布可灵AI ARR在2025年3月突破1亿美金，且4月和5月的月度付费金额均突破1亿人民币。考虑到6月10日苹果WWDC 2025及6月11日字节Force 2025原动力大会·春即将召开，多模态模型和端侧AI产品有望加速落地。

投资建议：多模态模型持续更新。1）利好有数据、有客户、有场景的软件企业，AI产品有望带动公司ARPU提升和项目单价上升；2）模型私有化需求增加，利好一体机、超融合和B端服务外包企业。

风险提示

（1）宏观经济下行风险：计算机行业下游涉及千行百业，宏观经济下行压力下，行业IT支出不及预期将直接影响计算机行业需求；（2）应收账款坏账风险：计算机多数公司业务以项目制签单为主，需要通过验收后能够收到回款，下游客户付款周期拉长可能导致应收账款坏账增加，并可能进一步导致资产减值损失；（3）行业竞争加剧：计算机行业需求较为确定，但供给端竞争加剧或将导致行业格局发生变化；（4）国际环境变化影响：国际贸易摩擦加剧，美国不断对中国科技施压，对于海外收入占比较高公司可能形成影响。