专栏名称: 腾讯科技
只供应最有营养的科技大餐!
目录
相关文章推荐
51好读  ›  专栏  ›  腾讯科技

零一万物发布旗舰预训练模型,李开复回应AI六小虎困境传言:融资、芯片都不是问题

腾讯科技  · 公众号  · 科技媒体  · 2024-10-16 15:09

主要观点总结

本文介绍了零一万物发布新预训练模型Yi-Lightning及相关产品矩阵的情况,包括模型性能提升、推理速度、国际权威盲测榜单排名等关键点。同时,文章还涉及大模型公司面临的挑战、成本问题以及ToB和ToC产品的界限等话题。

关键观点总结

关键观点1: 零一万物发布新的预训练模型Yi-Lightning,性能进一步提升,推理速度有明显提升。

Yi-Lightning采用了混合专家模型架构,包括混合注意力机制和动态Top-P路由等技术。此外,模型训练过程中采用了多阶段训练模式,注重数据多样性和丰富性。

关键观点2: Yi-Lightning在国际权威盲测榜单LMSYS中取得第六名的成绩,暂时位列GPT-4之前。

这个成绩证明了Yi-Lightning模型性能的提升得到了认可。

关键观点3: 零一万物同时发布了面向ToB市场的首款产品——AI 2.0数字人,为零售和电商场景提供解决方案。

AI 2.0数字人构建了一套包括角色、声音和电商话术的完整模型体系。

关键观点4: 关于大模型公司的成本问题,李开复强调了模型和推理成本的重要性,并提到零一万物通过模基共建、模应一体战略降低成本。

零一万物通过AI Infra能力助力模型训练和推理,以更低的训练成本和推理成本实现高性能的模型。

关键观点5: 关于ToB和ToC产品的界限,李开复讨论了两者之间的不同和相似之处,以及零一万物在这两个领域的战略。

零一万物主要在国内推出面向企业的产品,而在海外市场推出面向消费者的产品。

关键观点6: 零一万物的新模型价格较低,但并未出现较大的成本压力。

零一万物通过优化模型和降低成本的方式,使得高性能的模型价格更加亲民。

关键观点7: 零一万物还有其他的ToB解决方案将在近期正式对外发布。

除了已经发布的AI 2.0数字人和API之外,零一万物还有AI Infra解决方案、私有化定制模型等其他ToB业务,这些业务会在近期正式对外公布。


正文

请到「今天看啥」查看全文


只有模型能力和成本问题能够被逐步解决,基于AI的商业生态才能真正健康地发展。
在发布会上,李开复也与包括腾讯科技在内的媒体进行了深度沟通,并正面回复了关于大模型领域的成本 、竞争等重要问题,以下为内容实录:

Q: 此前有消息称AI方面的六小虎,某几家放弃了预训练,开复博士已辟谣了,但站在行业的角度请评估逐步放弃预训练模型将是行业整个趋势吗?

李开复: 我觉得做好预训练模型是一个技术活,而且是要非常多有才华的人在一起工作,慢工出细活,需要有懂芯片的人,懂推理的人,懂基础架构的人,懂模型的人,有很好的算法同学,一起做出来。

如果一个公司能有幸拥有这么多优秀的人才,能够跨领域的合作, 那我相信中国是绝对可以做出世界排名前十的预训练的通用模型 ,但不是每家公司都可以做这件事情,做这件事情的成本也比较高,以后有可能会越来越少的大模型公司训练做预训练。不 过据我所知,这六家公司融资额度都是够的,我们做预训练的production run,训练一次三四百万美金,这个钱也是头部公司都付得起, 我觉得中国的六家大模型公司只要有够好的人才,想做预训练的决心,融资额跟芯片都不会是问题的。

Q: OpenAI的o1发布后,很多人认为,从技术上会带来新的范式。这对初创公司来说会有哪些影响?
李开复: 我刚从美国回来,跟OpenAI的人员也有沟通, 他们跟我分享的是公司内部还有一些好东西,但是他们不急拿出来 ,因为他们领先行业足够多,到了一定的业务节点才释放出来,这是他们能做而别人不能做。OpenAI o1  虽然隐藏了所有中间的思考状态,但是很多人还是在网上开始猜它怎么做,我们认为有一些揣测还是比较靠谱,我觉得五个月以后应该也有不少类似o1 模型的能力出现在各个模型公司,包括零一万物。
o1的思考模式是把之前只在预训练中 scaling (规模定律)的趋势扩展到了推理的时候,这件事情对行业是最大的认知改变。过去大家觉得谁预训练做好就够了,慢慢大家发现后训练SFT和强化训练都是非常重要。
所以零一万物的团队刚开始做的主要是专注预训练,之后又有很多很厉害的人加入,帮我们把Posttrain(后训练)也做出来,现在看来推理也很重要,一年半以前大家觉得大模型最厉害的地方就是预训练,一年以后发现后训练也是同样重要,这感谢OpenAI点醒我们这一点,现在我相信很多中美公司都在往o1 方向狂奔。
Q: 李开复博士之前曾表示不会从事亏损的To B业务。然而,在最近的发布会上,他首次公布了相关的产品矩阵,这似乎表明公司正在尝试更深入地探索To B市场。这是否意味着零一万物已经找到了解决AI 1.0时代SaaS行业普遍面临的低利润和亏损问题的方法?
李开复: 我们特别重视给每一个用户提供价值,所以我们不会去说有模型,你要拿来做什么,我卖给你,你先给钱,这样对用户是不会满足的。另外一种常见的做法,就是到企业里,企业说我要做客服,模型卖给我,怎么做客服我不会做,你帮我做,这就成为和AI1.0时代一样的可以称为 系统集成型的AI,也就是说卖模型给你,先帮你把客服应用做好 ,这样的情况下很难有利润,之前我说如果做一单赔一单的to B,零一万物宁可不做,这句话我们并没有改变。
我们刚刚发布的AI 2.0数字人解决方案不会做一单赔一单,因为它是专注到用户重大的痛点需求和盈利点,也就是说一个店长或KOL平时做一次直播浪费最重要的资源,就是他的时间,而且这个时间就算做一小时的直播能赚到一千块钱,也就是一千块钱,但如果用数字人直播就不是一小时了,可能可以做一千个小时,哪怕每一个小时只能赚一半的钱,一千个小时还是可以赚五百倍的钱,这样的账就很好算了。如果真的能把数字人做到端到端,只要输入公司内部的东西,这次减价的,选一个形象、声音按一个钮就开始百录甚至千录的直播,等于你是卖给这个企业一个印钞机,印钞机要收租赁费就是可行的了。除了直播以外,我们的AI 2.0数字人解决方案已经跑通了更多业务场景,比如AI伴侣、IP形象、办公会议等等。
我们继续执行模应一体战略,将Yi-Lightning模型能力与数字人解决方案结合,不断迭代产品,后续会解锁更多业务场景。
回到国内的SaaS的问题,国内现在很难说到SaaS,整个收费模式和商业模式在美国走通了,但国内还是一直有很大的问题。但也有一些行业可以走通SaaS,SaaS按使用收费,也可以订阅,按照每个月收费,也可以用分成,这些模式都可以综合称为比较好的商业模式,因为它不是一次性卖掉,像一个项目制的公司帮你做一个客服卖给你,你付钱就走了,以后没有钱可以收了,而是可以持续收费。刚才讲的模式,无论分成、订阅的SaaS模式才是可持续的商业模式,今天我们并没有看到一个普遍被接受的SaaS模式的存在。所以在国内,我们大模型to B相对于AI 1.0时代有不同的打法,首要任务就是要寻找少数能够按使用情况收费的方法,而不是项目定制的方法,能得到比较高利润率的订单再去做。
整体来看,零一万物 ToB 整体解决方案会采取“一横一纵”的打法。和Yi-Large相比,Yi-lightning的模型性能又有大幅提升,作为国际 SOTA 的基座模型,他们本身就具备着出色的泛化性,再加上零一万物自身拥有很强大的SFT(监督学习)能力。这些技术能力使得我们的团队能够先将单个行业做深做透,进而以自身技术能力和行业积累为基础,凝练出标准化的ToB解决方案,为各行各业的企业客户降本提效,将世界第一梯队的大模型用到实处,真正为企业带来业务增长和新竞争力。






请到「今天看啥」查看全文