主要观点总结
谷歌在I/O大会上发布了多个新产品和功能,其中DeepMind带来的Veo 3视频生成模型引人注目。该模型能自动生成画面、配音、音效、环境音,甚至根据提示词自动配出对白。此外,谷歌还推出了新的图像生成模型Imagen 4和应用Flow,用于创作电影级片段和场景。这些新工具主要对美国的Google AI Pro和Ultra订阅用户开放。
关键观点总结
关键观点1: 谷歌在I/O大会上发布了一系列新产品和功能。
包括AI搜索模式、Flow应用、Gemini 2.5 Pro的增强推理模式、智能眼镜等。
关键观点2: DeepMind带来的Veo 3视频生成模型是最引人注目的发布内容。
该模型能自动生成画面,还能一键生成配音、音效、环境音,根据提示词自动配出对白。已经应用在Gemini聊天机器人上,只对订阅了每月249.99美元AI Ultra的用户开放。其特色是“音画同步”。
关键观点3: Imagen 4图像生成模型也同步推出。
在表现精细细节方面有惊人的清晰度,并能生成写实和抽象图像。渲染字体方面有显著提升,能以多种宽高比生成分辨率高达2K的图像。
关键观点4: 谷歌推出了新应用Flow来整合Veo、Imagen和Gemini,用于创作电影级片段和场景。
用户可以用自然语言描述他们想要的最终效果,Flow会自动生成。目前这一新工具仅对美国的Google AI Pro和Ultra订阅用户开放。
关键观点5: AI生成视频的发展对创作者带来了独特的机会。
创造的门槛被打破,人人都可以做自己的导演。但同时也存在行业难题,如AI生成视频容易被滥用或恶意篡改。DeepMind采用自研的SynthID技术在每帧嵌入不可见水印,提升防伪和追溯能力。
正文
这波新体验,已经在 Gemini 聊天机器人应用上线,但只对订阅了每月 249.99 美元 AI Ultra 的用户开放。
Veo 3 的杀手锏在于——“音画同步”。AI 生成音效其实早就不新鲜了,但让 AI 能理解每一帧画面的内容,实时生成并同步不同场景的声音,这事之前还真没谁能做好。比如一场打雷的夜戏,Veo 3 能自动识别闪电和雨点,生成精准的雷声和环境音,甚至根据镜头变化调整音效强度。