主要观点总结
文章讨论了基于大语言模型的生成式人工智能(GenAI)的社会影响,分析了推动其发展的社会因素,并探讨了其在国际和国内社会不平等方面的潜在影响。文章指出,GenAI的发展将改变商品和服务的生产方式,重塑社会组织的方式和日常生活的本质,并可能加剧国际和国内的社会不平等。特别指出,美国和中国可能在GenAI技术主导权上展开激烈竞争,因为这关乎全球重大利益。同时,文章也探讨了GenAI技术如何受到语料库特异性和语言特异性的影响,并强调这些因素如何塑造全球竞争格局。文章还指出,在采用GenAI的国家内部,其日益增加的应用将如何改变职业结构并扩大收入不平等。最后,文章讨论了GenAI在更宏大的经济生产历史背景中的位置,并预测未来可能发生的变化。
关键观点总结
关键观点1: GenAI的社会影响
GenAI可能彻底改变商品和服务的生产方式,重塑人类社会的组织方式和日常生活的本质,并可能加剧国际和国内的社会不平等。
关键观点2: 推动GenAI发展的社会因素
文章分析了规模因素、语料库特异性和语言特异性对GenAI发展的影响,强调这些因素如何塑造全球竞争格局,并指出美国和中国可能在GenAI技术主导权上展开竞争。
关键观点3: GenAI在国际社会不平等方面的影响
GenAI的发展可能导致小国重新依赖于处于支配地位的国家,加剧国家间的不平等,使拥有先进AI技术的大国占据优势。
关键观点4: GenAI在国内社会不平等方面的影响
在采用GenAI的国家内部,其日益增加的应用可能改变职业结构,并扩大收入不平等,导致职业阶梯消失和劳动力市场极化。
关键观点5: GenAI在更宏大的经济生产历史背景中的位置
文章讨论了GenAI在更宏大的经济生产历史背景中的位置,并预测未来可能发生的变化,强调适当的政府监管对于确保伦理标准、缓解风险以及营造一个包容性的环境至关重要。
正文
10000
年
)
、工业革命
(
约
18
世纪
)
和信息技术革命
(
约
20
世纪后期
)
。我们即将迎来第四次技术革命
——
人工智能革命。农业依赖土地和气候
,
工业依赖资本
,
信息技术依赖人力资本
,
而人工智能则依赖大量数据用于训练和微调
(
同时在某种程度上仍然依赖人力资本
)
。一个人口众多且相对富足的社会
,
有能力获取充足的人力资源和数据。
综上所述
,
本节阐明了规模因素在
GenAI
技术发展中的关键作用。经济上的效率低下、实际挑战以及数据不足是小型社会在开发该技术时面临的主要障碍。有意思的一点是
,
规模因素的作用在农业技术中曾至关重要
,
但在工业时代的重要性有所减弱
,
而在当前以
GenAI
技术为标志的人工智能革命中
,
规模因素重获重要地位。
(
二
)
语料库特异性和语言特异性
GenAI
系统之所以能够生成有用的类人文本响应
,
是因为它们的训练依赖语料库
(
即大批文本的集合
)
作为输入。因此
,
任何
GenAI
的表现都必然受到其所使用的特定语料库的影响。换言之
,
这项技术的表现取决于所用语料库的质量。这种对特定语料库的依赖限制了
GenAI
的能力。例如
,
在叙述历史事件时
,GenAI
的准确性上受限于训练数据的覆盖范围和准确性。如果某些历史事件由于被忽视、证据有争议或因政治审查而未被记录
,
这些内容就无法在模型的响应中得到准确的反映。此外
,
不同语料库可能会导致不同的输出。在考虑到语料库的文化和政治背景时
,
这一特性尤其重要。在多元文化或国际语境中
,
不同语料库可能反映不同的叙事和偏见
,
从而得到不同的响应。
已有研究揭示了基于英文的
GenAI
技术中的性别与种族偏见
(Kantharuban et al.,2024)
,
例如
,ChatGPT
的回答会因用户姓名所暗示的种族和性别而有所不同。即使用户未明确透露自己的种族
,GenAI
也可能生成带有种族刻板印象的推荐内容
(Kantharuban et al.,2024)
。此外
,
不同语言之间的差异也可能较大。例如
,
用英语和中文提出一个相同的问题
,
可能会产生不同的回答
,
这反映了每种语言所特有的叙事和背景。正如
Kan-tharuban et al.
(2024)
所指出的
,
大语言模型生成的回应反映了用户的需求以及用户的身份。
为理解语言在
GenAI
中的作用
,
我们在
2023
年
12
月测试了
OpenAI
的
ChatGPT4.0:
用英语、中文、日语和缅甸语四种语言向
ChatGPT4.0
提出一系列相同的问题。除改变语言外
,
我们还改变了用户的民族身份
,
例如将用户设定为中国人或日本人。部分问题涉及政治和文化
,
其中一个问题是关于一位著名的政治领袖
,
另一个问题则是关于
“
龙
”
。我们在实验中有以下发现。
其一
,
对于各国普遍认可的概念和事实
,
例如科学术语和科学发现
,
不同语言之间的回答没有差异。
其二
,
对于各文化之间有所不同的概念
,
如餐桌礼仪
,
语言的影响小于用户身份的影响。
其三
,
对于在特定语言中具有独特含义的概念
,
如
“
龙
”,
输入的语言会产生影响
,
无论用户的自我认同如何设定。
其四
,
对于根据政治体制或国家而具有不同含义的术语或概念
,
语言的影响显著。在涉及政治敏感的术语或概念上
,
用户使用中文输入时得到的回答与使用英文时有显著不同。这是一个令人惊讶的发现
,
因为我们使用的都是
ChatGPT4
。
其五
,
用英语提问和用例如缅甸语这样的小语种提问
,
得到的答案差异很小
(
尽管部分回答并不连贯或难以理解
)
。我们推测
ChatGPT
的小语种回答是基于英文语料库生成的。
后三点体现了
GenAI
的语料库特异性
,
即语言特异性。这是因为
GenAI
的训练需要的数据集
——
语料库
,
只能存在于特定的语言中。虽然理论上
GenAI
技术可以将用户输入翻译成不同语言
,
但它在原始训练数据的语言
(
如英语
)
中表现最佳
,
因为许多表达方式是某种语言所特有的
,
无法轻易转译。换言之
,
翻译技术具有内在的性能限制。因此
,
即使算法完全相同
,GenAI
模型的响应也会因输入的语料语言不同而有所差异。
由于
GenAI
技术的语料库是特定语言的文本数据
,
语言在最终产品中具有影响力
,
部分是通过前述的
“
规模因素
”
。规模越大
,
语言对技术性能的影响力越显著。我们注意到
,
语言并不一定局限于单一国家
,
例如英语在许多国家和曾为英国殖民地的地区使用。
相反
,
一个国家内可能使用多种语言
,
如加拿大的英语和法语
,
印度的多种官方语言。因此
,GenAI
技术生产的一个重要因素是使用某种语言的人口规模。不同语言的人口规模有很大差异。在图
1
中
,
我们列出了世界上最常用的语言
,
英语居于首位
(
有
13
亿使用者
)
,
其次是中文
(
有
11
亿使用者
)
。尽管印度是目前世界上人口最多的国家
,
但印地语的使用规模仅排第三。
图
1
各语言使用人口规模 数据来源:《民族语》(
Ethnologue
)
2022
年,第
25
版。
像世界上其他社会和自然现象一样
,
语言使用的分布高度偏斜
,
遵循幂律分布。少数语言
,
如英语和中文
,
为大量人群使用
,
而大多数语言的使用人群很少。在图
2
中
,
我们展示的图像表明语言使用人口规模符合幂律
,
其帕累托系数为:
图
2
各语言使用人口规模的幂律分布
数据来源:《民族语》(
Ethnologue
)
2022
年,第
25
版。
另一个复杂之处在于,使用某种语言的人口规模不能完美预测该语言的文本数据量。例如,虽然印地语是第三大语言,但印地语使用者中仍不识字的占很大比例,因此无法产生文本数据
(
Statista
,
2024
)
。此外,因为印度的许多精英使用英语接受教育以及交流,印地语的文本信息无法与其使用者规模排名相符。例如,在报纸和杂志出版方面,印地语排名第四;在书籍出版方面,印地语未进入前
12
名
(
Lobachev
,
2008
)
。因此,语料库和语言特异性会为拥有庞大且受过良好教育人口的语言共同体带来优势。
正如前文所述
,GenAI
技术的发展优势或劣势难以简单地以国家为单位来衡量。毕竟
,
规模因素和语料库的特异性是对语言和社会文化共同体造成优势和劣势
,
而这些共同体的分布并不一定与国家边界完全重合。然而
,
在分析
GenAI
技术的竞争格局时
,
以国家为分析单位仍然具有重要意义。
GenAI
技术的投资和发展主要源于人们认为其在提升经济生产力方面的潜力。随着
GenAI
技术的不断进步
,
可以预期该技术的分布格局将发生显著变化。目前
,GenAI
的企业对企业商业模式主要采取订阅制的企业软件形式
,
即采用
GenAI
技术的企业需要向
GenAI
供应商如
OpenAI
支付月费或年费。随着技术改善以及企业围绕技术调整战略
,
企业可能会减少雇佣并且逐步实现工作任务的自动化。从本质上讲
,
这可以被理解为一种外包形式