Midjourney 重磅发布视频功能！

AI范儿 · 公众号 · AI媒体 · 2025-06-19 10:03

主要观点总结

Midjourney推出了视频模型，这是该公司向构建能够实时模拟完整3D世界的AI系统迈出的关键一步。新功能“图像转视频”能让用户将静态图像转换为生动的短动画片段，提供两种操作模式。视频长度可达20秒，可通过多次延长并调整提示词来丰富动画效果。然而，该功能也有局限性，如缺乏音频功能、输出时长限制等。市场竞争激烈，Midjourney正面对来自其他AI视频生成公司的挑战，同时自身也面临法律挑战。创始人的最终目标是整合视频模型、3D元素和实时处理到一个统一平台，以实现实时世界模拟。

关键观点总结

关键观点1: Midjourney推出视频模型，实现图像转视频功能

用户可以通过Midjourney网页界面中的“动画”按钮，轻松将任何静态图像转换为生动的短动画片段。提供两种操作模式，满足不同创作需求。

关键观点2: 视频功能具有局限性

新功能缺乏音频功能，输出时长限制在20秒内。目前不支持编辑时间轴、场景转换或片段间的连续性。

关键观点3: 市场竞争激烈

AI视频生成成为生成式AI领域竞争最激烈的细分市场之一，众多科技巨头和初创公司都在快速推进。

关键观点4: Midjourney面临法律挑战

Disney和Universal对Midjourney提起诉讼，指控其未经授权创建受版权保护的角色图像。

关键观点5: 创始人的最终目标是实现3D世界模拟

Midjourney创始人致力于构建能够进行实时世界模拟的系统，视频模型是通往这一目标的过渡步骤。

正文

请到「今天看啥」查看全文

"高运动"模式则会让镜头和主体都更加动态活跃，不过 Midjourney 也坦诚地提醒用户，这种模式有时可能产生不够精确的效果。

每个视频的初始长度约为 4 秒，但创作的可能性并不止于此！用户最多可以将视频延长 4 次，而且在每次延长时还可以调整原始图像的提示词，让动画效果更加符合自己的创意 vision。

更令人兴奋的是，这个功能不仅限于 Midjourney 内部创建的图像。用户完全可以为外部图像制作动画，只需将图像拖入提示栏并设为"起始帧"，然后在文本提示中描述期望的运动效果即可。

缺乏音频功能

该模型最明显的局限是缺乏音频功能, 内置编辑器功能不如 Runway 、 Sora 、 Luma 等 AI 视频竞品。

与 Google 的 Veo 3 和 Luma Labs 的 Dream Machine 等竞争对手不同， Midjourney 的系统不会生成配套音轨或环境音效。

目前，任何配乐都需要在后期制作中使用独立工具手动添加。