走出元宇宙阴影、拥抱开源AI模型，Meta实现“扎克伯格式复兴”

腾讯科技 · 公众号 · 科技媒体 · 2024-11-24 12:16

正文

请到「今天看啥」查看全文

但不可否认的是，Llama的成功让扎克伯格摆脱了外界对其超现实雄心的质疑，也帮助其公司度过了2022年底和2023年初的“效率年”困境。更重要的是，Llama的崛起为扎克伯格提供了一个解决长期痛点的机会：即Meta的服务和产品常受苹果和谷歌规则的限制，这两个竞争对手的应用商店是Meta在移动设备时代的主要分发渠道。扎克伯格曾在博客文章中写道：“我们必须确保自己始终能获得最好的技术，并避免被竞争对手的封闭生态系统所束缚。”

如今借助Llama，Meta和扎克伯格有机会树立新的行业标准。他在财报电话会议上表示：“Llama 3.1将是行业的转折点，开源AI将像Linux一样成为行业标准。”他提到了打破微软Windows等专有操作系统主导地位的开源项目，暗示Llama有望引领这一变革。

或许正是这种潜在的可能性帮助扎克伯格重新恢复了信心。在他与人共同创立Facebook已逾20年后，40岁的他仿佛正经历着一场所谓的 “扎克复兴”——个人形象与职业生涯均焕发出新的光彩。 他已从往日的短发转变为浓密的卷发，单调的卫衣也被金链子和宽大的黑色T恤所取代，曾经棱角分明的面容如今常挂着轻松的微笑。甚至，在11月份，他还抽空与T-Pain合作翻拍了热门歌曲《Get Low》，以此作为送给妻子普莉希拉·陈Priscilla Chan）的周年纪念惊喜。

扎克伯格与好友T-Pain合作，为纪念与妻子的“约会纪念日”表演《Get Low》

在AI领域深耕十年，

催生出类似互联网的新行业

Meta在AI领域的探索可追溯到2013年，那时扎克伯格慧眼识珠，邀请了长期在纽约大学任教的AI专家杨立昆来掌舵Facebook新成立的FAIR实验室。杨立昆回忆道，当他初谈此职位时，首要关切的便是Facebook是否会将其研究成果开源。他向扎克伯格坦言：“好点子不应被垄断，我们应尽可能广泛地合作。”而扎克伯格给出的答复令他倍感振奋：“哦，你大可放心。我们的平台软件及一切均已开源。”

然而，在生成式AI风起云涌之前，Meta对AI的应用大多局限于幕后，或是深耕于研究领域，或是作为推荐算法和内容审核的底层支撑。至于面向消费者的AI产品，如聊天机器人等，扎克伯格那时并无宏伟蓝图，尤其是当他的心思全然倾注于元宇宙之上时。

随着OpenAI推出ChatGPT，生成式AI领域迎来了爆发式增长，而Meta的转向在当时看来尤为不明智。Meta的支出飙升，消费者却反响平平，其股价更是一路跌至7年来的最低点，引发了诸如“扎克伯格是否陷入大麻烦”等种种质疑。在此背景下，Meta也不得不裁撤了数千名员工。

Meta首次尝试推出的AI项目并未取得显著进展。2022年11月，FAIR发布了名为Galactica的聊天机器人，它基于大语言模型构建，并接受了科学文本的训练。与以往的FAIR模型一样，Galactica也是以开源形式发布的，旨在让研究人员深入了解其运作机制。

然而，当时公众尚未充分认识到大语言模型可能产生的幻觉现象，即它们有时会给出令人信服但错误的答案。Galactica的一些输出内容令科学家震惊，因为它提供了不科学的信息，如引用不存在的研究论文，讨论如何在浴缸中制造“凝固汽油弹”、“吃碎玻璃有哪些好处”等不当言论。这些不当输出引发了广泛的批评，有人称Galactica“不道德”，甚至是“Meta迄今为止制造的最危险的东西”。

在遭受了多天的激烈批评后，Meta的研究人员决定关闭Galactica。而就在12天后，OpenAI发布了ChatGPT，它迅速在全球范围内走红，尽管ChatGPT本身也存在幻觉问题。

在Galactica遭遇强烈反对后，FAIR的研究人员在整个冬季都在对新一代生成式AI模型进行微调，这款模型被命名为LLaMA（Large Language Models Meta AI的缩写）。在Galactica事件后，Meta变得非常谨慎，没有将代码和模型权重完全开放给所有人，而是要求研究人员申请访问权限，并且不提供商业许可。当被问及原因时，杨立昆表示：“因为上次我们向所有人提供大语言模型时，人们对我们嗤之以鼻，告诉我们这将破坏社会结构。”

尽管有这些限制措施，完整的LLaMA模型还是在几周内被泄露到了网上，并在4chan和各种AI社区中传播。Meta对在网上发布该模型的网站提出了下架请求，试图控制其传播范围。然而，一些批评人士警告Meta将面临严重的后果，并严厉批评了它的做法：“准备好迎接大量垃圾邮件和网络钓鱼攻击吧！”

恐慌情绪甚至蔓延至了国会山。2023年6月，两名美国参议员致信扎克伯格，对Llama的发布提出了批评，并发出警告，指出其可能被用于欺诈、传播恶意软件、骚扰以及侵犯隐私等不当行为。信中称，Meta传播先进AI技术的方式“引发了严重的滥用问题”。

然而，与此同时，杨立昆却表示，他和Meta的其他高层领导对于Llama模型的巨大需求感到惊讶。潜在用户所期望的灵活性和控制权，将使得一个极为强大的大语言模型得以开放访问。

例如，律师事务所可以借此训练出专门用于法律领域的模型，并拥有相应的知识产权；医疗保健公司则能够审计和管理模型背后的数据，确保符合各项规定；研究人员也可以对模型的内部工作原理进行试验和检查。杨立昆回忆道：“我们收到了许多请求，他们都表示，‘你们必须将这些资源开源。它极具价值，足以催生出一个全新的行业，就像一个新的互联网一样。’”

这些反馈直接引起了扎克伯格、首席技术官安德鲁·博兹·博斯沃思（Andrew “Boz” Bosworth）以及杨立昆的重视，促使他们每周都要召开一次电话会议，共同探讨应对策略。他们是否应该将下一个版本开源？开源的利是否大于弊？经过深思熟虑，扎克伯格最终下定决心，并获得了多位高管的支持，于2023年7月正式公布了开源模型。