特稿｜阿里AI之路：耐心者的胜利

差评X.PIN · 公众号 · 热门自媒体 · 2025-06-05 00:00

主要观点总结

本文主要描述了阿里巴巴在人工智能领域的发展历程，包括其AI之路的种子、技术和人才储备、以及各个团队的贡献和整个公司对AI的投入和野心。通过介绍阿里云智能集团的收入、目标和对AI基础设施的投入，突显了阿里巴巴在AI领域的实力和影响力。文章还提到了夸克业务的转变和面临的挑战，以及阿里国际站的商家对AI技术的信任和应用。最后，文章强调了阿里巴巴的长期发展策略和生态系统建设，以及其在AI浪潮中的稳健地位。

关键观点总结

关键观点1: 阿里巴巴的AI之路的种子可以追溯到2007年，当时马云给团队提出了关于算力和数据的问题，这是阿里巴巴走向科技公司的起点。

初始阶段与AI相关的团队如阿里云、iDST和达摩院的成立，为阿里巴巴的AI发展奠定了基础。

关键观点2: 阿里巴巴的达摩院在AI技术领域不断突破，M6模型的出现和后续的发展，以及通义大模型的发布，都是其AI之路上的重要里程碑。

达摩院的团队面临诸多挑战，但通过不断的努力和创新，成功追上了国际前沿的AI技术。

关键观点3: 阿里云智能集团已成为阿里巴巴在AI领域的重要利润来源之一。

随着AI技术的不断发展和应用，阿里云的业务持续增长，成为全球领先的云服务提供商之一。

关键观点4: 夸克业务的转变和所面临的挑战反映了阿里巴巴在AI时代的业务升级。

夸克从搜索业务起家，一直保持谨慎和克制的行事风格，但在AI时代，为了保持竞争力，也必须进行变革和创新。

关键观点5: 阿里巴巴的商家对AI技术表现出极高的信任和应用。

商家们亲身体验到AI技术带来的获客成本降低和效率提升，因此对其持乐观态度。

关键观点6: 阿里巴巴的长期发展策略和生态系统建设使其在AI浪潮中保持稳健地位。

通过持续投入研发、加强团队建设、与合作伙伴紧密合作，阿里巴巴已经构建了一个强大的生态系统，以支持其在AI领域的长期发展。

正文

请到「今天看啥」查看全文

有意思的是，在 M6 的背后，你能见到很多熟悉的名字。比如清华大学教授唐杰，后来他创立了智谱，而唐杰的学生之一杨植麟又是 Kimi 的创始人。

但即便集合了当时国内最顶尖的人才，整支团队也并不知道自己到底能不能成，最重要的是到底怎么用。

这种奢侈的理想主义，给团队带来了巨大的压力。

2014 年的时候，在大家还在聊 O2O 时，马云在硅谷成立了 iDST （数据科学与技术研究院）。并且花重金挖人，从漆远到金榕、司罗，再到任小枫。

最开始， iDST 野心勃勃地承接了建立超大规模 GPU 机器学习集群、机器学习平台等任务。

但即便有期望在前，在残酷的竞争环境和体制之中，理想主义的存在也是奢侈和艰难的。

仅一年时间，因为研究商业化等原因，人员被打散放入各种实战业务部门里：漆远去了蚂蚁金服，而金榕调入淘宝天猫，语音团队并入阿里云。

直到 2017 年，阿里巴巴启动了 NASA 计划，要面向未来 20 年组建强大的独立研发部门。再次将 iDST 和 AI Lab 等核心实验室合并为一个实体组织，起名达摩院。

阿里到底在这上面投入有多少，有一张图或许可以说明一二。达摩院成立前夜，一张马云宴请科学家的照片广为流传。

在一堆高密度人才架构中，过于前沿的技术，谁也不知道到底行不行，但是就是在这里，奠定了阿里 AI 的人才和技术基础。

就在他们放弃把 M6 大张旗鼓 公之于众的 27 天之后， ChatGPT 上线引爆了全世界，人们迅速忘记了 M6 。

实际看到 ChatGPT 之后，达摩院也不得不承认自己确实和对方有着不小的差距。事实上，当时全世界都和 OpenAI 有差距。

从某些方面来说，这样的差距不可避免。

M6 采用的是 BERT 架构，将解码器和编码器集成在同一框架中，而 OpenAI 走是单向模型的路线，只做解码器的部分。简单来说，就是 ChatGPT 只能从左往右或从右往左地读一行字，而 BERT 是同时从两边处理一句话，也可以在未标注过的数据上学习。

从理解速度上来说， M6 所采用的方向要高效得多。但固执的 ChatGPT 靠着猛堆参数量，做到大力出奇迹，突破了单向模型理解能力差的瓶颈。非主流的方向性选择，孤注一掷或许一鸣惊人，多数一败涂地。

面临路线更改的局面，达摩院只给了自己 4 个多月的时间，去追上 OpenAI 。

高压和焦虑，反而让团队内部上下拧成一股绳。不仅如此，彼时达摩院 2000 多人里，有一半都是从事 AI 相关研究。外界戏称达摩院为少林派护法，其人才储备是兵家抢人必争之地。

最终，赶在 2023 年 4 月中旬，阿里用通义千问这个名字将大模型上线邀测，也是当时国内第二个上线的大模型。

2022 年的云栖大会上，达摩院虽然没有公布 M6 ，却成立了一个社区 —— 魔搭社区 ，这是国内首个 AI 模型开源社区。

这成为了通义大模型道路上最重要的一步。当时达摩院把手头上三四百个模型全部都对外开源了。此后 Qwen 的每一代模型，不管投入了多少资源，都会第一时间在魔搭上主动开源开放。

这并不是常见的事。事实上，在 DeepSeek 出现以前，开闭源一直都是业内争论不休的话题。即使开源更可能降低研发和应用的门槛，便于开发者快速定制 AI 解决方案，更接近于实现 “ AI 普惠 ” ，但因为商业化困难，闭源流派一度占了上风。

但，慷慨的选择，给通义带来可观的 “ 收益 ” 。 “ 通义千问刚上线时，与头部闭源模型还有相当一段的距离，在开源之后快速地就追上了， ”