专栏名称: 机器之心
专业的人工智能媒体和产业服务平台
目录
相关文章推荐
51好读  ›  专栏  ›  机器之心

Index-AniSora:B站开源动画生成模型,斩获多项SOTA入选IJCAI25

机器之心  · 公众号  · AI  · 2025-05-19 12:03

正文

请到「今天看啥」查看全文



生成的视频


  • 提示词:左边男人紧紧抿着嘴唇,脸上刻满了愤怒和决心。他的表情传达出无尽的挫折与坚定信念。与此同时,另一个男人的嘴巴张得大大的,仿佛即将开口大声说话或大喊大叫


引导帧首帧


生成的视频


  • 提示词:画面中展现了石块发生爆炸的场景,发出刺眼的光芒,碎石四处飞散


引导帧首帧


生成的视频


简单介绍一下我们如何实现这些魔法效果的。通过高效的数据处理链路,构建了超过千万条高质量的文本 - 视频对,包含了大量不同风格、类型、内容的 高质量动画数据 ,为模型训练提供了坚实的数据基础。


其次,针对动画生成的独特需求,我们开发了统一的扩散生成框架,并引入时空掩码机制, 灵活支持图生视频、插帧补全和局部控制等任务,实现对角色口型、动作乃至局部区域的精细控制, 显著增强内容生成的可控性和创作自由度。


最后,我们设计了首个面向动画视频的专用评估基准,涵盖多个二次元子类型,填补了现有自然视频评估体系的空白。我们还基于 VLM 模型进行了定向优化,使其更好地理解动漫语境与 ACG 审美,从而构建出更贴合创作者真实需求的自动化视频评估系统。








请到「今天看啥」查看全文