专栏名称: 差评X.PIN
这些东西,大佬们肯定不想让你知道...
目录
相关文章推荐
来去之间  ·  转发微博-20250612200649 ·  15 小时前  
张佳玮写字的地方  ·  步行者2比1雷霆:每一个惊喜,25年的等待 ·  22 小时前  
张佳玮写字的地方  ·  “小时候,真的没玩够” ·  昨天  
罗辑思维  ·  有些时候,你应该拒绝“拉个群” ·  2 天前  
51好读  ›  专栏  ›  差评X.PIN

特稿|阿里AI之路:耐心者的胜利

差评X.PIN  · 公众号  · 热门自媒体  · 2025-06-05 00:00

主要观点总结

本文主要描述了阿里巴巴在人工智能领域的发展历程,包括其AI之路的种子、技术和人才储备、以及各个团队的贡献和整个公司对AI的投入和野心。通过介绍阿里云智能集团的收入、目标和对AI基础设施的投入,突显了阿里巴巴在AI领域的实力和影响力。文章还提到了夸克业务的转变和面临的挑战,以及阿里国际站的商家对AI技术的信任和应用。最后,文章强调了阿里巴巴的长期发展策略和生态系统建设,以及其在AI浪潮中的稳健地位。

关键观点总结

关键观点1: 阿里巴巴的AI之路的种子可以追溯到2007年,当时马云给团队提出了关于算力和数据的问题,这是阿里巴巴走向科技公司的起点。

初始阶段与AI相关的团队如阿里云、iDST和达摩院的成立,为阿里巴巴的AI发展奠定了基础。

关键观点2: 阿里巴巴的达摩院在AI技术领域不断突破,M6模型的出现和后续的发展,以及通义大模型的发布,都是其AI之路上的重要里程碑。

达摩院的团队面临诸多挑战,但通过不断的努力和创新,成功追上了国际前沿的AI技术。

关键观点3: 阿里云智能集团已成为阿里巴巴在AI领域的重要利润来源之一。

随着AI技术的不断发展和应用,阿里云的业务持续增长,成为全球领先的云服务提供商之一。

关键观点4: 夸克业务的转变和所面临的挑战反映了阿里巴巴在AI时代的业务升级。

夸克从搜索业务起家,一直保持谨慎和克制的行事风格,但在AI时代,为了保持竞争力,也必须进行变革和创新。

关键观点5: 阿里巴巴的商家对AI技术表现出极高的信任和应用。

商家们亲身体验到AI技术带来的获客成本降低和效率提升,因此对其持乐观态度。

关键观点6: 阿里巴巴的长期发展策略和生态系统建设使其在AI浪潮中保持稳健地位。

通过持续投入研发、加强团队建设、与合作伙伴紧密合作,阿里巴巴已经构建了一个强大的生态系统,以支持其在AI领域的长期发展。


正文

请到「今天看啥」查看全文



有意思的是,在 M6 的背后,你能见到很多熟悉的名字。 比如清华大学教授唐杰,后来他创立了智谱 ,而唐杰的学生之一杨植麟又是 Kimi 的创始人。


但即便集合了当时国内最顶尖的人才,整支团队也并不知道自己到底能不能成,最重要的是到底 怎么用


这种奢侈的理想主义,给团队带来了巨大的压力。


2014 年的时候,在大家还在聊 O2O 时,马云在硅谷成立了 iDST ( 数据科学与技术研究院 ) 。并且花重金挖人,从漆远到金榕、司罗,再到任小枫。


最开始, iDST 野心勃勃地承接了建立超大规模 GPU 机器学习集群、机器学习平台等任务。


但即便有期望在前,在残酷的竞争环境和体制之中,理想主义的存在也是奢侈和艰难的。


仅一年时间,因为研究商业化等原因,人员被打散放入各种实战业务部门里:漆远去了蚂蚁金服,而金榕调入淘宝天猫,语音团队并入阿里云。

直到 2017 年,阿里巴巴启动了 NASA 计划,要面向未来 20 年组建强大的独立研发部门。再次将 iDST AI Lab 等核心实验室合并为一个实体组织,起名达摩院。


阿里到底在这上面投入有多少,有一张图或许可以说明一二。达摩院成立前夜,一张马云宴请科学家的照片广为流传。

在一堆高密度人才架构中,过于前沿的技术,谁也不知道到底行不行,但是就是在这里,奠定了阿里 AI 的人才和技术基础。



就在他们放弃把 M6 大张旗鼓 公之于众的 27 天之后, ChatGPT 上线引爆了全世界,人们迅速忘记了 M6


实际看到 ChatGPT 之后,达摩院也不得不承认自己确实和对方有着不小的差距。事实上,当时全世界都和 OpenAI 有差距。


从某些方面来说,这样的差距不可避免。


M6 采用的是 BERT 架构,将解码器和编码器集成在同一框架中,而 OpenAI 走是单向模型的路线,只做解码器的部分。 简单来说,就是 ChatGPT 只能从左往右或从右往左地读一行字,而 BERT 是同时从两边处理一句话,也可以在未标注过的数据上学习。


从理解速度上来说, M6 所采用的方向要高效得多。但固执的 ChatGPT 靠着猛堆参数量,做到大力出奇迹,突破了单向模型理解能力差的瓶颈。 非主流的方向性选择,孤注一掷或许一鸣惊人,多数一败涂地。


面临路线更改的局面,达摩院只给了自己 4 个多月的时间,去追上 OpenAI


高压和焦虑,反而让团队内部上下拧成一股绳。 不仅如此,彼时达摩院 2000 多人里 ,有一半都是从事 AI 相关研究。外界戏称达摩院为少林派护法,其人才储备是兵家抢人必争之地。


最终,赶在 2023 4 月中旬,阿里用通义千问这个名字将大模型上线邀测,也是当时国内第二个上线的大模型。

2022 年的云栖大会上,达摩院虽然没有公布 M6 ,却成立了一个社区 —— 魔搭社区 ,这是国内首个 AI 模型开源社区。


这成为了通义大模型道路上最重要的一步。当时达摩院把手头上三四百个模型全部都对外开源了。此后 Qwen 的每一代模型,不管投入了多少资源,都会第一时间在魔搭上主动开源开放。


这并不是常见的事。事实上,在 DeepSeek 出现以前,开闭源一直都是业内争论不休的话题。即使开源更可能降低研发和应用的门槛,便于开发者快速定制 AI 解决方案,更接近于实现 “ AI 普惠 ,但因为商业化困难,闭源流派一度占了上风。


但,慷慨的选择,给通义带来可观的 收益 通义千问刚上线时,与头部闭源模型还有相当一段的距离,在开源之后快速地就追上了,






请到「今天看啥」查看全文