专栏名称: AI产品阿颖
关注分布式相关的开源项目和基础架构,致力于分析并报道这些新技术是如何以及将会怎样影响企业的软件构建方式。
目录
相关文章推荐
新机器视觉  ·  已确认裁员了,很严重,大家做好准备吧! ·  11 小时前  
科技美学官方  ·  6499华为Pura80Pro开箱体验丨一镜 ... ·  20 小时前  
爱可可-爱生活  ·  【[13星]Newton-Isaac-Sim ... ·  昨天  
AI前线  ·  苹果憋一年终超同参数 Qwen ... ·  2 天前  
51好读  ›  专栏  ›  AI产品阿颖

历史性时刻!Google Veo 3杀疯了,AI视频终于不再是“哑巴”

AI产品阿颖  · 公众号  · AI 科技自媒体  · 2025-05-21 07:36

主要观点总结

谷歌在I/O大会上发布了多个新产品和功能,其中DeepMind带来的Veo 3视频生成模型引人注目。该模型能自动生成画面、配音、音效、环境音,甚至根据提示词自动配出对白。此外,谷歌还推出了新的图像生成模型Imagen 4和应用Flow,用于创作电影级片段和场景。这些新工具主要对美国的Google AI Pro和Ultra订阅用户开放。

关键观点总结

关键观点1: 谷歌在I/O大会上发布了一系列新产品和功能。

包括AI搜索模式、Flow应用、Gemini 2.5 Pro的增强推理模式、智能眼镜等。

关键观点2: DeepMind带来的Veo 3视频生成模型是最引人注目的发布内容。

该模型能自动生成画面,还能一键生成配音、音效、环境音,根据提示词自动配出对白。已经应用在Gemini聊天机器人上,只对订阅了每月249.99美元AI Ultra的用户开放。其特色是“音画同步”。

关键观点3: Imagen 4图像生成模型也同步推出。

在表现精细细节方面有惊人的清晰度,并能生成写实和抽象图像。渲染字体方面有显著提升,能以多种宽高比生成分辨率高达2K的图像。

关键观点4: 谷歌推出了新应用Flow来整合Veo、Imagen和Gemini,用于创作电影级片段和场景。

用户可以用自然语言描述他们想要的最终效果,Flow会自动生成。目前这一新工具仅对美国的Google AI Pro和Ultra订阅用户开放。

关键观点5: AI生成视频的发展对创作者带来了独特的机会。

创造的门槛被打破,人人都可以做自己的导演。但同时也存在行业难题,如AI生成视频容易被滥用或恶意篡改。DeepMind采用自研的SynthID技术在每帧嵌入不可见水印,提升防伪和追溯能力。


正文

请到「今天看啥」查看全文


这波新体验,已经在 Gemini 聊天机器人应用上线,但只对订阅了每月 249.99 美元 AI Ultra 的用户开放。

Veo 3 的杀手锏在于——“音画同步”。AI 生成音效其实早就不新鲜了,但让 AI 能理解每一帧画面的内容,实时生成并同步不同场景的声音,这事之前还真没谁能做好。比如一场打雷的夜戏,Veo 3 能自动识别闪电和雨点,生成精准的雷声和环境音,甚至根据镜头变化调整音效强度。







请到「今天看啥」查看全文