专栏名称: 腾讯科技
只供应最有营养的科技大餐!
目录
相关文章推荐
51好读  ›  专栏  ›  腾讯科技

GPT生成「吉卜力风格」图像不侵权,宫崎骏维权都难成?|AGI之路

腾讯科技  · 公众号  · 科技媒体  · 2025-05-06 16:30

正文

请到「今天看啥」查看全文


在实践中,就像美国著名大法官汉德所说的那样,“思想”与“表达”之间的界限往往是比较模糊的,很难划出一条清晰的界线。比如,假设某个游戏涉及到“三国杀”(虚拟假设)的规则,单一的基础规则或设定可能不受保护,但当这些规则、人物特征、技能效果等元素组合在一起,形成一个整体的游戏呈现时,这个具体的“表达”就能受到著作权法的保护。


腾讯科技 AI生成图像常带有可辨识的"工具风格",比如一眼能看出是Midjourney还是GPT-4o生成的。这种AI的风格是如何在技术层面形成的?与人类创作风格相比,有哪些本质区别?

赵旺: 从2014年深度学习开始之后,AI生成风格的范式都是一样的,就是从大数据中挖掘计算数学的模式,一方面是数据,另一方面是模型拟合函数的的能力。那时如果生成特定的风格,就需要收集特定数据、训练特定模型。现在GPT-4o这样的大一统模型出现,能够整合不同风格,而不需要对某一种任务或风格做特定设计。

至于跟人类艺术家的具体风格有什么区别,这是很有意思的问题。

第一点,AI创造的范式是自底向上的,而人类艺术是自顶向下的。AI是从像素开始,逐渐学习局部、直到全局的语义信息;而人类是从最高层的意境逐步解构具体的表达的。对人类来说,细节是有重要程度区分的,而对AI来说,每个像素的重要性都相同。

第二点,AI创造的内容没有上下文,或者说它的不确定性相较人类而言太少了。这里不确定性指的是它作为社会和时代的行为主体,缺乏情感和自己的思考。

第三点,人类现在学习创作是高效的,但也是受限的;而AI的学习创作虽然是低效的,却是可扩展的。人类学生不可能大量完全复制老师的作品,但AI可以稳定生成某种风格。


泰祥洲: 艺术作品本质上是和时间紧密相关的,每个时代都有自己普遍通行的艺术范式。例如文艺复兴和启蒙运动时期,光变成了时间的尺度,产生了写实主义绘画,这背后是科学和文明。1900年以来,光的认识被二次解构,分割成光子,这时有了点彩画派、印象派。

所以不论梵高还是莫奈,都是在一个大的科学逻辑下产生的个体分化。艺术家是在自身思想性的基础上,踩上这种脉搏的。技法本身不太重要,经过长期的训练都会形成自身娴熟的风格,这背后的思想更重要。

吉卜力风格究竟是什么呢?其实宫崎骏做动画时,一开始真的是拍电影,后来他把电影平面化了,更像像素的方法,把人做的东西换算成计算机语言,因此机器很容易学习,随着互联网发展就变成了时代潮流。吉卜力就是在这种平面化、碎片化的基础上形成的风格。

所以,关键在于理解和掌握这个“底层逻辑”。如果我们能真正把握住它,我相信未来的AI工程师,也能在此基础上创作出更伟大的作品。

腾讯科技: 刚刚提到宫崎骏的画风与机器学习有契合之处,那么AI是不是更容易习得某些艺术风格呢?

赵旺: 宫崎骏的这种吉卜力风格,相当于对真实世界的图像做了简化,它的颜色和线条简单连续、细节也较少,从最基础的角度来说,这种风格肯定是更容易被AI习得的。

我们真实世界图像的细节太多、维度太大,生图就较为困难,比如说Midjourney v5之前,大家可能就会觉得生成的真人图片手部细节很少、头发眼睛很差。

对最新的GPT-4o或者Midjourney v8来说,无论是什么流派或风格,都不难。难的是超前一步创造新的东西。AI可能可以靠自己的一些涌现能力“创造”,但最终还是跳脱不了原来的数据分布。

腾讯科技: 如果不是AI,而是一个人模仿特定艺术风格(如吉卜力风格)进行商业创作,这是否构成侵权?

刘云: 可能构成侵权。判断的关键在于,其创作的具体作品是否与权利人(如吉卜力工作室)受版权保护的具体作品构成了实质性相似。如果仅仅是风格相似,但内容、构图、具体形象等是独创的或未达到实质性相似,则不构成侵权。

李昀锴: 我补充一个核心概念:著作权法是不禁止模仿的,甚至在某种程度上是鼓励模仿的; 著作权法禁止的是直接复制他人的作品,也就是没有经过自己创作和理解就照搬别人的具体表达。 所以,无论是人还是 AI,在学习和模仿风格的过程中,本身是有法律空间的。

图片来源:Studio Ghibli

AI开发者头顶的“达摩克利斯之剑”







请到「今天看啥」查看全文