专栏名称: 人工智能学家
致力成为权威的人工智能科技媒体和前沿科技研究机构
目录
相关文章推荐
人工智能学家  ·  谷歌CEO最新深访完整版:人工智能、未来十年 ... ·  11 小时前  
爱可可-爱生活  ·  #听见微博# #微博声浪计划# ... ·  11 小时前  
黄建同学  ·  可能搞到机器人怀疑机身//@karminsk ... ·  昨天  
爱可可-爱生活  ·  【[10星]Awesome-Search-R ... ·  昨天  
爱可可-爱生活  ·  【[13星]OpenThinkIMG:让AI ... ·  2 天前  
51好读  ›  专栏  ›  人工智能学家

谷歌I/O大会王者归来:Gemini“世界模型” 初现,搜索“换脑”,一句话制作原声电影

人工智能学家  · 公众号  · AI  · 2025-05-21 17:34

正文

请到「今天看啥」查看全文


:谷歌首次将扩散技术应用于文本生成,推出了实验性模型Gemini Diffusion,速度比肩此前顶级模型快5倍

Jules :对标OpenAI的Codex,异步编码代理,可在后台处理错误修复和功能原型开发,需要注册等待才能使用

多模态能力大爆发

Google Meet :新增实时翻译功能

Veo 3 :视频生成能力大幅提升,生成具有4K逼真效果的视频,并支持原生音频、对话和噪声合成

Imagen 4 :对标并超越OpenAI gpt-4o的图像生成能力,但是速度快了3倍,2K图像模型,在排版和文本图像生成方面更快、更准确

Flow :全新的电影制作工具,与好莱坞导演共创“Flow”结合了Veo 3和Gemini的能力,可根据文本提示构建完整的电影场景

Flow让创作者能更直观地“导演”AI:上传自己的角色和场景素材,或用Imagen即时生成;通过精确的镜头指令,描述想要的画面,Flow会自动生成剪辑片段并保持角色和场景的一致性。你可以无限迭代、调整镜头、延长或修剪片段,就像在传统剪辑软件中一样。Flow的目标是让电影制作进入一个全新的“流动”状态,让创意自然生长,将电影创作从“按部就班”变成“灵感迸发”

谷歌搜索彻底重塑:全新的“AI模式”(AI Mode)







请到「今天看啥」查看全文