主要观点总结
本文探讨了基于大语言模型的生成式人工智能(GenAI)的社会影响,分析了促进其技术发展的社会因素,并讨论了它在扩大国际和国内社会不平等方面的潜在影响。文章指出,GenAI的发展正处于早期阶段,其社会影响可能彻底改变商品和服务的生产方式,重塑人类社会的组织方式和日常生活的本质。尽管对GenAI及其能力的认知仍然有限,但结合历史和技术变革的经验,我们可以进行初步的推测性讨论。文章还探讨了有利于GenAI技术发展的关键因素,如规模因素、语料库特异性和语言特异性,以及这些因素如何塑造全球竞争格局,特别是中美两国之间在GenAI技术开发上的竞争。此外,文章还研究了在采用GenAI的国家内部,GenAI日益增加的应用如何改变职业结构以及扩大收入不平等。最后,文章预测了未来可能的变化,并强调了适当的政府监管对于确保伦理标准、缓解风险以及营造一个包容性环境的重要性。
关键观点总结
关键观点1: GenAI的社会影响
GenAI可能彻底改变商品和服务的生产方式,重塑人类社会的组织方式和日常生活的本质。
关键观点2: 促进GenAI发展的关键因素
包括规模因素、语料库特异性和语言特异性,这些因素塑造全球竞争格局,特别是中美两国在GenAI技术开发上的竞争。
关键观点3: GenAI在国内的应用影响
GenAI的应用改变职业结构并扩大收入不平等。
关键观点4: 未来的变化预测
预测了未来可能的变化,强调了适当的政府监管对于确保伦理标准、缓解风险以及营造一个包容性环境的重要性。
正文
综上所述,本节阐明了规模因素在GenAI技术发展中的关键作用。经济上的效率低下、实际挑战以及数据不足是小型社会在开发该技术时面临的主要障碍。有意思的一点是,规模因素的作用在农业技术中曾至关重要,但在工业时代的重要性有所减弱,而在当前以GenAI技术为标志的人工智能革命中,规模因素重获重要地位。
(
二
)
语料库特异性和语言特异性
GenAI系统之所以能够生成有用的类人文本响应,是因为它们的训练依赖语料库(即大批文本的集合)作为输入。因此,任何GenAI的表现都必然受到其所使用的特定语料库的影响。换言之,这项技术的表现取决于所用语料库的质量。这种对特定语料库的依赖限制了GenAI的能力。例如,在叙述历史事件时,GenAI的准确性上受限于训练数据的覆盖范围和准确性。如果某些历史事件由于被忽视、证据有争议或因政治审查而未被记录,这些内容就无法在模型的响应中得到准确的反映。此外,不同语料库可能会导致不同的输出。在考虑到语料库的文化和政治背景时,这一特性尤其重要。在多元文化或国际语境中,不同语料库可能反映不同的叙事和偏见,从而得到不同的响应。
已有研究揭示了基于英文的GenAI技术中的性别与种族偏见(Kantharuban et al.,2024),例如,ChatGPT的回答会因用户姓名所暗示的种族和性别而有所不同。即使用户未明确透露自己的种族,GenAI也可能生成带有种族刻板印象的推荐内容(Kantharuban et al.,2024)。此外,不同语言之间的差异也可能较大。例如,用英语和中文提出一个相同的问题,可能会产生不同的回答,这反映了每种语言所特有的叙事和背景。正如Kan-tharuban et al.(2024)所指出的,大语言模型生成的回应反映了用户的需求以及用户的身份。
为理解语言在GenAI中的作用,我们在2023年12月测试了OpenAI的ChatGPT4.0:用英语、中文、日语和缅甸语四种语言向ChatGPT4.0提出一系列相同的问题。除改变语言外,我们还改变了用户的民族身份,例如将用户设定为中国人或日本人。部分问题涉及政治和文化,其中一个问题是关于一位著名的政治领袖,另一个问题则是关于“龙”。我们在实验中有以下发现。
其一,对于各国普遍认可的概念和事实,例如科学术语和科学发现,不同语言之间的回答没有差异。
其二,对于各文化之间有所不同的概念,如餐桌礼仪,语言的影响小于用户身份的影响。
其三,对于在特定语言中具有独特含义的概念,如“龙”,输入的语言会产生影响,无论用户的自我认同如何设定。
其四,对于根据政治体制或国家而具有不同含义的术语或概念,语言的影响显著。在涉及政治敏感的术语或概念上,用户使用中文输入时得到的回答与使用英文时有显著不同。这是一个令人惊讶的发现,因为我们使用的都是ChatGPT4。
其五,用英语提问和用例如缅甸语这样的小语种提问,得到的答案差异很小(尽管部分回答并不连贯或难以理解)。我们推测ChatGPT的小语种回答是基于英文语料库生成的。
后三点体现了GenAI的语料库特异性,即语言特异性。这是因为GenAI的训练需要的数据集——语料库,只能存在于特定的语言中。虽然理论上GenAI技术可以将用户输入翻译成不同语言,但它在原始训练数据的语言(如英语)中表现最佳,因为许多表达方式是某种语言所特有的,无法轻易转译。换言之,翻译技术具有内在的性能限制。因此,即使算法完全相同,GenAI模型的响应也会因输入的语料语言不同而有所差异。由于GenAI技术的语料库是特定语言的文本数据,语言在最终产品中具有影响力,部分是通过前述的“规模因素”。规模越大,语言对技术性能的影响力越显著。我们注意到,语言并不一定局限于单一国家,例如英语在许多国家和曾为英国殖民地的地区使用。
相反,一个国家内可能使用多种语言,如加拿大的英语和法语,印度的多种官方语言。因此,GenAI技术生产的一个重要因素是使用某种语言的人口规模。不同语言的人口规模有很大差异。在图1中,我们列出了世界上最常用的语言,英语居于首位(有13亿使用者),其次是中文(有11亿使用者)。尽管印度是目前世界上人口最多的国家,但印地语的使用规模仅排第三。
图1 各语言使用人口规模 数据来源:《民族语》(Ethnologue)2022年,第25版。
像世界上其他社会和自然现象一样,语言使用的分布高度偏斜,遵循幂律分布。少数语言,如英语和中文,为大量人群使用,而大多数语言的使用人群很少。在图2中,我们展示的图像表明语言使用人口规模符合幂律,其帕累托系数为:
图2 各语言使用人口规模的幂律分布 数据来源:《民族语》(Ethnologue)2022年,第25版。
另一个复杂之处在于,使用某种语言的人口规模不能完美预测该语言的文本数据量。例如,虽然印地语是第三大语言,但印地语使用者中仍不识字的占很大比例,因此无法产生文本数据(Statista,2024)。此外,因为印度的许多精英使用英语接受教育以及交流,印地语的文本信息无法与其使用者规模排名相符。例如,在报纸和杂志出版方面,印地语排名第四;在书籍出版方面,印地语未进入前12名(Lobachev,2008)。因此,语料库和语言特异性会为拥有庞大且受过良好教育人口的语言共同体带来优势。
正如前文所述
,GenAI技术的发展优势或劣势难以简单地以国家为单位来衡量。毕竟,规模因素和语料库的特异性是对语言和社会文化共同体造成优势和劣势,而这些共同体的分布并不一定与国家边界完全重合。然而,在分析GenAI技术的竞争格局时,以国家为分析单位仍然具有重要意义。
GenAI技术的投资和发展主要源于人们认为其在提升经济生产力方面的潜力。随着GenAI技术的不断进步,可以预期该技术的分布格局将发生显著变化。目前,GenAI的企业对企业商业模式主要采取订阅制的企业软件形式,即采用GenAI技术的企业需要向GenAI供应商如OpenAI支付月费或年费。随着技术改善以及企业围绕技术调整战略,企业可能会减少雇佣并且逐步实现工作任务的自动化。从本质上讲,这可以被理解为一种外包形式,企业使用更为廉价的第三方替代服务来完成部分任务,从而提升自身利润,同时也增加了服务提供商的利润。当工作被外包至他国时,原本可以留在国内的资金可能会流失。这在GenAI的情境下尤为重要,因为开发这些工具的主导企业集中在少数几个国家,因此很可能会捕获该技术产生的相当大一部分收益。
除了经济方面的问题外,文化和社会因素也可能进一步加剧国家间的不平等。也就是说,对大规模语料库的需求系统性地让小语种人群处于不利地位,因为他们可能受制于开发GenAI技术的国家在文化和政治上的主导。GenAI工具生成的内容基于其训练数据,因此会反映这些文本和图像背后的态度和观念。例如,OpenAI的GPT-3的训练数据有大约60%来自CommonCrawl(Brown et al.,2020),这个互联网档案库包含了规模以拍字节计的爬取自网络的数据。据估计,CommonCrawl的数据中有46%的文档主要是英语,这些内容可能充斥着英语创作者的价值观。
第二次世界大战后,全球政治的主要主题是民族独立和自决(Jackson,2000),从殖民统治中获得解放。如今由于AI革命,GenAI的到来显示出了逆转这一长期趋势的风险,因为它使小国重新依赖于处支配地位的国家。换言之,AI革命的到来可能会加剧国家间的不平等,使拥有先进AI技术的大国占据优势,使缺乏独立AI技术的小国面临不利局面。尤其是中美在地缘政治上的紧张和冲突,可能会引发全球技术竞争,使其他国家在技术上依赖它们。
GenAI技术也在全球范围内对当前的法律体系提出了挑战。长期以来,人们普遍接受每个国家在其领土范围内拥有发布法律的主权。然而,正如我们之前所讨论的,GenAI技术必然会超越国界。只有在数据隐私、政治审查和跨境数据流动等法律领域的国家差异得到解决后,才能实现GenAI的跨国共享。