印度国家级大模型上线两天仅 300 余次下载，投资人直呼“尴尬”：韩国大学生模型都有20万！

Python开发者 · 公众号 · Python · 2025-05-27 08:23

主要观点总结

Sarvam AI发布的名为Sarvam-M的模型是基于Mistral Small构建的混合语言模型，支持包括印度本地语言在内的多种语言。该模型被视为印度本土AI研究的突破，但上线后的反响平平，仅获得少量下载。引发了对印度本土AI技术发展的争论和质疑。Sarvam AI的目标是在印度大规模普及生成式AI，其创始人致力于推进印度本土语言AI的应用，并试图开发属于印度自己的AI技术栈。然而，这次发布的Sarvam-M模型基于法国AI初创公司的Mistral Small构建，引发了关于印度本土AI发展的讨论和批评。

关键观点总结

关键观点1: Sarvam AI发布混合语言模型Sarvam-M

Sarvam AI发布了基于Mistral Small构建的混合语言模型Sarvam-M，支持多种印度本地语言。

关键观点2: Sarvam-M模型反响平平

Sarvam-M模型上线后反响平平，下载量不高，引发了业界人士和投资者的质疑和批评。

关键观点3: Sarvam AI的目标和愿景

Sarvam AI的目标是在印度大规模普及生成式AI，其创始人致力于推进印度本土语言AI的应用，并试图开发属于印度自己的AI技术栈。

关键观点4: Sarvam AI的争议和讨论

关于Sarvam AI及其发布的模型的争议和讨论集中在模型性能、实用性、市场前景、融资与投入等方面，引发了印度AI社区的广泛关注和热议。

正文

请到「今天看啥」查看全文

说好的“印度自己的

AI 技术栈”呢？

Sarvam AI 成立于 2023 年 7 月，由 Vivek Raghavan 和 Pratyush Kumar 联合创办，目标是在印度大规模普及生成式 AI。两位创始人此前都参与了专注于印度语言开源 AI 的研究项目 AI4Bharat。Raghavan 曾长期在 UIDAI（主管 Aadhaar 的机构）任职，Kumar 毕业于 ETH 苏黎世并拥有 IIT 孟买背景，是 AI4Bharat 的联合创始人，专注于推进印度本土语言 AI 应用。

Kumar 的愿景非常明确：印度需要属于自己的基础 AI 模型——不仅仅是对西方模型的“适配”，而是真正从零构建、使用印度本地数据训练，并在本土环境中安全部署。他接受媒体采访时表示，“到了 2040 年，印度必须拥有可以独立训练和部署基础模型的公司。”

“DeepSeek 证明，训练强大的模型不需要几十亿美元。这改变了 AI 竞争的基本规则。”Kumar 说道。对于 Sarvam 而言，这是一次重大战略机遇。

Kumar 认为，AI 主权不只是构建基础模型，更是要拥有从数据生成到模型部署的完整技术链。与许多仅对现有模型进行微调的初创公司不同，Sarvam 决心打造自己的模型。它最初与 Meta 合作，对 Llama 模型进行印度语言方向的优化，但很快意识到自身的真正使命是：打造属于印度自己的 AI 技术栈。

但这次发布的 Sarvam-M 却是基于法国 AI 初创公司的 Mistral Small 构建。据悉，目前 Sarvam 正筹备开发一个 700 亿参数的模型，预估成本为 4000–5000 万美元。

根据 Sarvam 的技术报告， Sarvam-M 在性能上已超越 Llama-4 Scout ，并且在与更大规模模型（如 Llama-3.3 70B 和 Gemma 3 27B）对比时也表现稳健。“原始的 Mistral Small 模型在印度语言方面存在明显提升空间。”不过，模型在英文知识评估（如 MMLU）上出现了 1% 的小幅下降。

该公司对这一进展感到自豪。该公司联合创始人 Vivek Raghavan 表示，“Sarvam-M 是我们为印度打造自主 AI 的重要基石。”