专栏名称: Python开发者
人生苦短,我用 Python。伯乐在线旗下账号「Python开发者」分享 Python 相关的技术文章、工具资源、精选课程、热点资讯等。
目录
相关文章推荐
51好读  ›  专栏  ›  Python开发者

印度国家级大模型上线两天仅 300 余次下载,投资人直呼“尴尬”:韩国大学生模型都有20万!

Python开发者  · 公众号  · Python  · 2025-05-27 08:23

主要观点总结

Sarvam AI发布的名为Sarvam-M的模型是基于Mistral Small构建的混合语言模型,支持包括印度本地语言在内的多种语言。该模型被视为印度本土AI研究的突破,但上线后的反响平平,仅获得少量下载。引发了对印度本土AI技术发展的争论和质疑。Sarvam AI的目标是在印度大规模普及生成式AI,其创始人致力于推进印度本土语言AI的应用,并试图开发属于印度自己的AI技术栈。然而,这次发布的Sarvam-M模型基于法国AI初创公司的Mistral Small构建,引发了关于印度本土AI发展的讨论和批评。

关键观点总结

关键观点1: Sarvam AI发布混合语言模型Sarvam-M

Sarvam AI发布了基于Mistral Small构建的混合语言模型Sarvam-M,支持多种印度本地语言。

关键观点2: Sarvam-M模型反响平平

Sarvam-M模型上线后反响平平,下载量不高,引发了业界人士和投资者的质疑和批评。

关键观点3: Sarvam AI的目标和愿景

Sarvam AI的目标是在印度大规模普及生成式AI,其创始人致力于推进印度本土语言AI的应用,并试图开发属于印度自己的AI技术栈。

关键观点4: Sarvam AI的争议和讨论

关于Sarvam AI及其发布的模型的争议和讨论集中在模型性能、实用性、市场前景、融资与投入等方面,引发了印度AI社区的广泛关注和热议。


正文

请到「今天看啥」查看全文


说好的“印度自己的

AI 技术栈”呢?

Sarvam AI 成立于 2023 年 7 月,由 Vivek Raghavan 和 Pratyush Kumar 联合创办,目标是在印度大规模普及生成式 AI。两位创始人此前都参与了专注于印度语言开源 AI 的研究项目 AI4Bharat。Raghavan 曾长期在 UIDAI(主管 Aadhaar 的机构)任职,Kumar 毕业于 ETH 苏黎世并拥有 IIT 孟买背景,是 AI4Bharat 的联合创始人,专注于推进印度本土语言 AI 应用。

Kumar 的愿景非常明确:印度需要属于自己的基础 AI 模型——不仅仅是对西方模型的“适配”,而是真正从零构建、使用印度本地数据训练,并在本土环境中安全部署。他接受媒体采访时表示,“到了 2040 年,印度必须拥有可以独立训练和部署基础模型的公司。”

“DeepSeek 证明,训练强大的模型不需要几十亿美元。这改变了 AI 竞争的基本规则。”Kumar 说道。对于 Sarvam 而言,这是一次重大战略机遇。

Kumar 认为,AI 主权不只是构建基础模型,更是要拥有从数据生成到模型部署的完整技术链。与许多仅对现有模型进行微调的初创公司不同,Sarvam 决心打造自己的模型。它最初与 Meta 合作,对 Llama 模型进行印度语言方向的优化,但很快意识到自身的真正使命是:打造属于印度自己的 AI 技术栈。

但这次发布的 Sarvam-M 却是基于法国 AI 初创公司的 Mistral Small 构建。据悉,目前 Sarvam 正筹备开发一个 700 亿参数的模型,预估成本为 4000–5000 万美元。

根据 Sarvam 的技术报告, Sarvam-M 在性能上已超越 Llama-4 Scout ,并且在与更大规模模型(如 Llama-3.3 70B 和 Gemma 3 27B)对比时也表现稳健。“原始的 Mistral Small 模型在印度语言方面存在明显提升空间。”不过,模型在英文知识评估(如 MMLU)上出现了 1% 的小幅下降。

该公司对这一进展感到自豪。该公司联合创始人 Vivek Raghavan 表示,“Sarvam-M 是我们为印度打造自主 AI 的重要基石。”







请到「今天看啥」查看全文