主要观点总结
本文主要描述了阿里巴巴在人工智能领域的发展历程,包括其AI之路的种子、技术和人才储备、以及各个团队的贡献和整个公司对AI的投入和野心。通过介绍阿里云智能集团的收入、目标和对AI基础设施的投入,突显了阿里巴巴在AI领域的实力和影响力。文章还提到了夸克业务的转变和面临的挑战,以及阿里国际站的商家对AI技术的信任和应用。最后,文章强调了阿里巴巴的长期发展策略和生态系统建设,以及其在AI浪潮中的稳健地位。
关键观点总结
关键观点1: 阿里巴巴的AI之路的种子可以追溯到2007年,当时马云给团队提出了关于算力和数据的问题,这是阿里巴巴走向科技公司的起点。
初始阶段与AI相关的团队如阿里云、iDST和达摩院的成立,为阿里巴巴的AI发展奠定了基础。
关键观点2: 阿里巴巴的达摩院在AI技术领域不断突破,M6模型的出现和后续的发展,以及通义大模型的发布,都是其AI之路上的重要里程碑。
达摩院的团队面临诸多挑战,但通过不断的努力和创新,成功追上了国际前沿的AI技术。
关键观点3: 阿里云智能集团已成为阿里巴巴在AI领域的重要利润来源之一。
随着AI技术的不断发展和应用,阿里云的业务持续增长,成为全球领先的云服务提供商之一。
关键观点4: 夸克业务的转变和所面临的挑战反映了阿里巴巴在AI时代的业务升级。
夸克从搜索业务起家,一直保持谨慎和克制的行事风格,但在AI时代,为了保持竞争力,也必须进行变革和创新。
关键观点5: 阿里巴巴的商家对AI技术表现出极高的信任和应用。
商家们亲身体验到AI技术带来的获客成本降低和效率提升,因此对其持乐观态度。
关键观点6: 阿里巴巴的长期发展策略和生态系统建设使其在AI浪潮中保持稳健地位。
通过持续投入研发、加强团队建设、与合作伙伴紧密合作,阿里巴巴已经构建了一个强大的生态系统,以支持其在AI领域的长期发展。
正文
有意思的是,在
M6
的背后,你能见到很多熟悉的名字。
比如清华大学教授唐杰,后来他创立了智谱
,而唐杰的学生之一杨植麟又是
Kimi
的创始人。
但即便集合了当时国内最顶尖的人才,整支团队也并不知道自己到底能不能成,最重要的是到底
怎么用
。
2014
年的时候,在大家还在聊
O2O
时,马云在硅谷成立了
iDST
( 数据科学与技术研究院 )
。并且花重金挖人,从漆远到金榕、司罗,再到任小枫。
最开始,
iDST
野心勃勃地承接了建立超大规模
GPU
机器学习集群、机器学习平台等任务。
但即便有期望在前,在残酷的竞争环境和体制之中,理想主义的存在也是奢侈和艰难的。
仅一年时间,因为研究商业化等原因,人员被打散放入各种实战业务部门里:漆远去了蚂蚁金服,而金榕调入淘宝天猫,语音团队并入阿里云。
直到
2017
年,阿里巴巴启动了
NASA
计划,要面向未来
20
年组建强大的独立研发部门。再次将
iDST
和
AI Lab
等核心实验室合并为一个实体组织,起名达摩院。
阿里到底在这上面投入有多少,有一张图或许可以说明一二。达摩院成立前夜,一张马云宴请科学家的照片广为流传。
在一堆高密度人才架构中,过于前沿的技术,谁也不知道到底行不行,但是就是在这里,奠定了阿里
AI
的人才和技术基础。
就在他们放弃把
M6
大张旗鼓
公之于众的
27
天之后,
ChatGPT
上线引爆了全世界,人们迅速忘记了
M6
。
实际看到
ChatGPT
之后,达摩院也不得不承认自己确实和对方有着不小的差距。事实上,当时全世界都和
OpenAI
有差距。
M6
采用的是
BERT
架构,将解码器和编码器集成在同一框架中,而
OpenAI
走是单向模型的路线,只做解码器的部分。
简单来说,就是
ChatGPT
只能从左往右或从右往左地读一行字,而
BERT
是同时从两边处理一句话,也可以在未标注过的数据上学习。
从理解速度上来说,
M6
所采用的方向要高效得多。但固执的
ChatGPT
靠着猛堆参数量,做到大力出奇迹,突破了单向模型理解能力差的瓶颈。
非主流的方向性选择,孤注一掷或许一鸣惊人,多数一败涂地。
面临路线更改的局面,达摩院只给了自己
4
个多月的时间,去追上
OpenAI
。
高压和焦虑,反而让团队内部上下拧成一股绳。
不仅如此,彼时达摩院
2000
多人里
,有一半都是从事
AI
相关研究。外界戏称达摩院为少林派护法,其人才储备是兵家抢人必争之地。
最终,赶在
2023
年
4
月中旬,阿里用通义千问这个名字将大模型上线邀测,也是当时国内第二个上线的大模型。
2022
年的云栖大会上,达摩院虽然没有公布
M6
,却成立了一个社区
——
魔搭社区
,这是国内首个
AI
模型开源社区。
这成为了通义大模型道路上最重要的一步。当时达摩院把手头上三四百个模型全部都对外开源了。此后
Qwen
的每一代模型,不管投入了多少资源,都会第一时间在魔搭上主动开源开放。
这并不是常见的事。事实上,在
DeepSeek
出现以前,开闭源一直都是业内争论不休的话题。即使开源更可能降低研发和应用的门槛,便于开发者快速定制
AI
解决方案,更接近于实现
“ AI
普惠
”
,但因为商业化困难,闭源流派一度占了上风。
但,慷慨的选择,给通义带来可观的
“
收益
”
。
“
通义千问刚上线时,与头部闭源模型还有相当一段的距离,在开源之后快速地就追上了,
”