正文
但不可否认的是,Llama的成功让扎克伯格摆脱了外界对其超现实雄心的质疑,也帮助其公司度过了2022年底和2023年初的“效率年”困境。更重要的是,Llama的崛起为扎克伯格提供了一个解决长期痛点的机会:即Meta的服务和产品常受苹果和谷歌规则的限制,这两个竞争对手的应用商店是Meta在移动设备时代的主要分发渠道。扎克伯格曾在博客文章中写道:“我们必须确保自己始终能获得最好的技术,并避免被竞争对手的封闭生态系统所束缚。”
如今借助Llama,Meta和扎克伯格有机会树立新的行业标准。他在财报电话会议上表示:“Llama 3.1将是行业的转折点,开源AI将像Linux一样成为行业标准。”他提到了打破微软Windows等专有操作系统主导地位的开源项目,暗示Llama有望引领这一变革。
或许正是这种潜在的可能性帮助扎克伯格重新恢复了信心。在他与人共同创立Facebook已逾20年后,40岁的他仿佛正经历着一场所谓的
“扎克复兴”——个人形象与职业生涯均焕发出新的光彩。
他已从往日的短发转变为浓密的卷发,单调的卫衣也被金链子和宽大的黑色T恤所取代,曾经棱角分明的面容如今常挂着轻松的微笑。甚至,在11月份,他还抽空与T-Pain合作翻拍了热门歌曲《Get Low》,以此作为送给妻子普莉希拉·陈Priscilla Chan)的周年纪念惊喜。
扎克伯格与好友T-Pain合作,为纪念与妻子的“约会纪念日”表演《Get Low》
Meta在AI领域的探索可追溯到2013年,那时扎克伯格慧眼识珠,邀请了长期在纽约大学任教的AI专家杨立昆来掌舵Facebook新成立的FAIR实验室。杨立昆回忆道,当他初谈此职位时,首要关切的便是Facebook是否会将其研究成果开源。他向扎克伯格坦言:“好点子不应被垄断,我们应尽可能广泛地合作。”而扎克伯格给出的答复令他倍感振奋:“哦,你大可放心。我们的平台软件及一切均已开源。”
然而,在生成式AI风起云涌之前,Meta对AI的应用大多局限于幕后,或是深耕于研究领域,或是作为推荐算法和内容审核的底层支撑。至于面向消费者的AI产品,如聊天机器人等,扎克伯格那时并无宏伟蓝图,尤其是当他的心思全然倾注于元宇宙之上时。
随着OpenAI推出ChatGPT,生成式AI领域迎来了爆发式增长,而Meta的转向在当时看来尤为不明智。Meta的支出飙升,消费者却反响平平,其股价更是一路跌至7年来的最低点,引发了诸如“扎克伯格是否陷入大麻烦”等种种质疑。在此背景下,Meta也不得不裁撤了数千名员工。
Meta首次尝试推出的AI项目并未取得显著进展。2022年11月,FAIR发布了名为Galactica的聊天机器人,它基于大语言模型构建,并接受了科学文本的训练。与以往的FAIR模型一样,Galactica也是以开源形式发布的,旨在让研究人员深入了解其运作机制。
然而,当时公众尚未充分认识到大语言模型可能产生的幻觉现象,即它们有时会给出令人信服但错误的答案。Galactica的一些输出内容令科学家震惊,因为它提供了不科学的信息,如引用不存在的研究论文,讨论如何在浴缸中制造“凝固汽油弹”、“吃碎玻璃有哪些好处”等不当言论。这些不当输出引发了广泛的批评,有人称Galactica“不道德”,甚至是“Meta迄今为止制造的最危险的东西”。
在遭受了多天的激烈批评后,Meta的研究人员决定关闭Galactica。而就在12天后,OpenAI发布了ChatGPT,它迅速在全球范围内走红,尽管ChatGPT本身也存在幻觉问题。
在Galactica遭遇强烈反对后,FAIR的研究人员在整个冬季都在对新一代生成式AI模型进行微调,这款模型被命名为LLaMA(Large Language Models Meta AI的缩写)。在Galactica事件后,Meta变得非常谨慎,没有将代码和模型权重完全开放给所有人,而是要求研究人员申请访问权限,并且不提供商业许可。当被问及原因时,杨立昆表示:“因为上次我们向所有人提供大语言模型时,人们对我们嗤之以鼻,告诉我们这将破坏社会结构。”
尽管有这些限制措施,完整的LLaMA模型还是在几周内被泄露到了网上,并在4chan和各种AI社区中传播。Meta对在网上发布该模型的网站提出了下架请求,试图控制其传播范围。然而,一些批评人士警告Meta将面临严重的后果,并严厉批评了它的做法:“准备好迎接大量垃圾邮件和网络钓鱼攻击吧!”
恐慌情绪甚至蔓延至了国会山。2023年6月,两名美国参议员致信扎克伯格,对Llama的发布提出了批评,并发出警告,指出其可能被用于欺诈、传播恶意软件、骚扰以及侵犯隐私等不当行为。信中称,Meta传播先进AI技术的方式“引发了严重的滥用问题”。
然而,与此同时,杨立昆却表示,他和Meta的其他高层领导对于Llama模型的巨大需求感到惊讶。潜在用户所期望的灵活性和控制权,将使得一个极为强大的大语言模型得以开放访问。
例如,律师事务所可以借此训练出专门用于法律领域的模型,并拥有相应的知识产权;医疗保健公司则能够审计和管理模型背后的数据,确保符合各项规定;研究人员也可以对模型的内部工作原理进行试验和检查。杨立昆回忆道:“我们收到了许多请求,他们都表示,‘你们必须将这些资源开源。它极具价值,足以催生出一个全新的行业,就像一个新的互联网一样。’”
这些反馈直接引起了扎克伯格、首席技术官安德鲁·博兹·博斯沃思(Andrew “Boz” Bosworth)以及杨立昆的重视,促使他们每周都要召开一次电话会议,共同探讨应对策略。他们是否应该将下一个版本开源?开源的利是否大于弊?经过深思熟虑,扎克伯格最终下定决心,并获得了多位高管的支持,于2023年7月正式公布了开源模型。