阿里原首席贾扬清朋友圈怒怼某国内大佬,我们是小公司也不想得罪大佬们,名字我就不说了,不过各位大佬,开源社区不容易,如果你们就是开源的模型结构,求高抬贵手就叫原来的名字吧,免得我们还做一堆工作就为了适配你们改名字。
但是有网友发现,李开复的零一万物公司的 Y-34B模型基本上采用了LLaMA的架构,只是重命名了两个张量。因为很多人认为贾扬清怼的就是这个。
对此,零一万物表示:GPT是一个业内公认的成熟架构,Llama在GPT上做了总结。零一万物研发大模型的结构设计基于GPT成熟结构,借鉴了行业顶尖水平的公开成果,由于大模型技术发展还在非常初期,与行业主流保持一致的结构,更有利于整体的适配与未来的迭代。同时零一万物团队对模型和训练的理解做了大量工作,也在持续探索模型结构层面本质上的突破。