专栏名称: 知危
提供敏锐、独到的商业信息与参考,重点关注TMT、出海、新消费、新能源。
目录
相关文章推荐
宝玉xp  ·  回复@LiXia99ye:主流模型都可以的, ... ·  2 天前  
爱可可-爱生活  ·  晚安~ #晚安# -20250608223927 ·  2 天前  
新机器视觉  ·  工业现场相机坐标系和机械手坐标系的标定 ·  2 天前  
人工智能产业链union  ·  【AI加油站】第十三部:《Transform ... ·  2 天前  
51好读  ›  专栏  ›  知危

可灵发布2.1:柔性交互和流体动态拉满,重要的是还便宜

知危  · 公众号  ·  · 2025-05-30 20:56

主要观点总结

可灵在主打运动质量的2.0大师版基础上推出更高级别的2.1系列模型,包括可灵2.1和可灵2.1大师版。新模型在动态真实性、动作幅度、物理效果及理解提示词的能力方面有所增强,面向影视制作、商业广告等专业场景。价格与可灵2.0大师版相同,但效果更好。文章通过多个测试案例展示可灵2.1大师版在图形生成视频方面的出色表现,如跑步、舞蹈、冲浪等场景。该模型在维持高性价比的同时,提高了生成视频的质量和速度。

关键观点总结

关键观点1: 可灵2.1系列模型的升级特点

可灵2.1系列模型包括可灵2.1和可灵2.1大师版,在动态真实性、动作幅度、物理效果和理解提示词能力方面有所增强。面向影视制作、商业广告等专业场景。

关键观点2: 价格与效果对比

可灵2.1系列模型的价格与可灵2.0大师版相同,但生成视频的效果更好。通过多个测试案例展示可灵2.1大师版在图形生成视频方面的出色表现,如跑步、舞蹈、冲浪等场景。

关键观点3: 视频生成速度

可灵2.1系列模型提高了视频生成的速度,行业内其他模型需要2~3分钟,而可灵2.1生成5秒高品质视频(1080p)只需不到1分钟。

关键观点4: 应用领域




正文

请到「今天看啥」查看全文



提示词:

多名舞者在舞台上进行同步舞蹈。舞者有节奏的动作,中间的主舞者旋转跳跃,其余舞者形成队形流动。镜头绕舞台缓慢旋转。舞台灯光随动作变化节奏切换,整体呈现流动舞台感。音乐剧舞台风格,镜头稳定流畅,强调集体节奏与个人动作张力,光影配合表演节拍变化。


输出视 频:


不管是每个舞者的动作自然度、同步性以及整体队形流动形成的舞台效果都很棒, 裙摆的飞舞看起来也非常符合物理直觉,队形流动后没有形成错误的空间遮挡 ,有些小遗憾的是后方的舞者走到前方后出现了一些不一致,比如走到前方后第三位舞者的服装应该是有裙摆的,有些舞者旋转后过早从背面转换为正面。


在这个多人舞台中,每个人都是单独执行动作的,如果要在交互复杂性上更进一步,当然双人舞最合适不过,这也是非常典型的人与人交互的场景,来看看这个拉丁舞的案例。


首帧图:


提示词:

专业舞蹈演员表演拉丁舞。男女舞伴身体贴近,女舞者被男伴带领做旋转和倾斜动作,动作充满张力和激情。相机围绕舞者做弧形运动,时而拉近捕捉精彩动作,时而拉远展现整体舞姿。女舞者裙摆在旋转中飞扬,舞台灯光随节拍变化,观众掌声此起彼伏。舞台表演风格,戏剧化光影,色彩浓郁,强调舞者间的化学反应和情感张力。


输出视频:


实际上,可灵 2.0 大师版在这类场景已经展现出了不错的潜力, 但可灵 2.1 大师版在保持相同的动作质量的同时,动作速度甚至更快 ,两位舞者通过动作和神态把情绪很好地传达了出来,虽然女舞者在旋转时手跟不上身体的几个瞬间比较明显,但瑕不掩瑜,丝毫不能掩盖成品带来的惊艳感。


人体除了肌肉、肢体、服装,还有一个元素能够通过柔性交互提高画面表现力,那就是头发,所以我们再测试一下可灵 2.1 大师版在大风吹拂场景下的头发表现力。


首帧图:


提示词:

一位长发少女骑着一只巨大的缅因猫在空中飞行,镜头跟随她们穿越高空云层,展现少女飘动的发丝与猫毛在风中流动的细节。写实风格,真实模拟毛发在风中动态变化的物理特性,光影细腻、色彩自然,整体画面具有电影质感,镜头语言强调速度与毛发动势的张力,整体构图强调空间层次与纵深感。


输出视频:







请到「今天看啥」查看全文