主要观点总结
Midjourney推出了视频模型,这是该公司向构建能够实时模拟完整3D世界的AI系统迈出的关键一步。新功能“图像转视频”能让用户将静态图像转换为生动的短动画片段,提供两种操作模式。视频长度可达20秒,可通过多次延长并调整提示词来丰富动画效果。然而,该功能也有局限性,如缺乏音频功能、输出时长限制等。市场竞争激烈,Midjourney正面对来自其他AI视频生成公司的挑战,同时自身也面临法律挑战。创始人的最终目标是整合视频模型、3D元素和实时处理到一个统一平台,以实现实时世界模拟。
关键观点总结
关键观点1: Midjourney推出视频模型,实现图像转视频功能
用户可以通过Midjourney网页界面中的“动画”按钮,轻松将任何静态图像转换为生动的短动画片段。提供两种操作模式,满足不同创作需求。
关键观点2: 视频功能具有局限性
新功能缺乏音频功能,输出时长限制在20秒内。目前不支持编辑时间轴、场景转换或片段间的连续性。
关键观点3: 市场竞争激烈
AI视频生成成为生成式AI领域竞争最激烈的细分市场之一,众多科技巨头和初创公司都在快速推进。
关键观点4: Midjourney面临法律挑战
Disney和Universal对Midjourney提起诉讼,指控其未经授权创建受版权保护的角色图像。
关键观点5: 创始人的最终目标是实现3D世界模拟
Midjourney创始人致力于构建能够进行实时世界模拟的系统,视频模型是通往这一目标的过渡步骤。
正文
"高运动"模式
则会让镜头和主体都更加动态活跃,不过 Midjourney 也坦诚地提醒用户,这种模式有时可能产生不够精确的效果。
每个视频的初始长度约为 4 秒
,但创作的可能性并不止于此!用户最多可以将视频延长 4 次,而且在每次延长时还可以调整原始图像的提示词,让动画效果更加符合自己的创意 vision。
更令人兴奋的是,这个功能不仅限于 Midjourney 内部创建的图像。用户完全可以为外部图像制作动画,只需将图像拖入提示栏并设为"起始帧",然后在文本提示中描述期望的运动效果即可。
缺乏音频功能
该模型最明显的局限是缺乏音频功能,
内置编辑器功能不如 Runway 、 Sora 、 Luma 等 AI 视频竞品。
与 Google 的 Veo 3 和 Luma Labs 的 Dream Machine 等竞争对手不同, Midjourney 的系统不会生成配套音轨或环境音效。
目前,任何配乐都需要在后期制作中使用独立工具手动添加。