专栏名称: OSC开源社区
OSChina 开源中国 官方微信账号
目录
相关文章推荐
程序员技术  ·  某程序员:感觉身边35岁后月薪稳定在40k以 ... ·  14 小时前  
伯乐在线  ·  HR ... ·  21 小时前  
伯乐在线  ·  HR ... ·  21 小时前  
稀土掘金技术社区  ·  为了让 iframe 支持 ... ·  2 天前  
51好读  ›  专栏  ›  OSC开源社区

2024年中国开源模型:崛起与变革

OSC开源社区  · 公众号  · 程序员  · 2025-02-07 15:11

正文

请到「今天看啥」查看全文


从 “追随者” 到 “引领者”
2024 年,中国学术界和产业界大力推进自主研发,在技术创新和模型能力上实现了显著飞跃,并在全球范围内取得了显著成就。Hugging Face Open LLM 排行榜数据显示,从智谱的 GLM 系列、阿里巴巴的 Qwen 系列到深度求索的 DeepSeek 系列,这些自主研发的模型在国内外各项评测中表现卓越。
每个月来自中国主要研究机构和公司的开源模型 / 数据集数量。

图片源自 Hugging Face 中文社区模型社群:
https://huggingface.co/spaces/zh-ai-community/zh-model-release-heatmap
其中,Qwen 系列凭借灵活的多尺寸选项,强大的多语言支持以及友好的模型授权功能,赢得了社区开发者的高度评价。DeepSeek 通过引入多头潜在注意力(Multi-head Latent Attention, MLA)技术,在性能和成本上实现了革命性突破,开创高性价比的 AI 新纪元。
智谱的 CogVideoX 系列文生视频模型,成为全球首批开源的文生视频模型之一,不仅在技术方面让中国视频生成模型列入领先梯队,强化了中国模型在全球范围的竞争力,也为国际开源生态的发展产生了积极的影响,为全球开发者提供了更多创新和应用的可能。
中国开源模型从最初的质疑中崛起,逐步赢得了广泛认可。这不仅彰显了中国开源模型从追随者到行业引领者的跨越式成长,也为全球人工智能发展注入了新的活力与动力。中国开源模型的成功并非偶然。在政府对人工智能产业的持续支持以及国内人工智能行业对模型研发的巨额投入下,从基础算法到行业应用、从算力基础设施到数据资源整合,中国人工智能生态体系正在迅速完善。这一趋势表明,未来中国有可能在全球人工智能领域占据更为核心的地位。
开源生态的繁荣与协作
随着开源模型影响力的提高,中国开源社区的活跃度也明显提升。无论是企业、研究机构还是个体开发者都更加积极地参与到开源工作中。
以阿里巴巴的通义千问 Qwen 为例,据不完全统计,截止 2024 年 9 月,全球已有近 8 万基于 Qwen 的衍生模型,超越了 Meta 的 Llama。该系列模型已被集成到 Hugging Face Transformers、Hugging Chat 和阿里自家的百炼平台中,极大促进了全球开发者的交流和协作,形成了国际化开源生态。
北京智源研究院和上海人工智能实验室等研究机构,通过与企业和高校合作及开源平台的建设,建立了更完善的协作机制,从而在开源模型 (如 InternLM) 和数据集 (如 Infinity-MM) 领域贡献了大量有影响力的基础工作和资源。
2024 年,中国开源社区涌现出众多高质量的自发研究成果。其中,MAP 团队推出的全开源模型 Map Neo 引人瞩目。该模型在训练数据、脚本以及模型对齐工作上实现了全面公开,成为国内少有的真正意义上完全开源的项目。
而 InstantX 团队的 InstantID 则作为中国模型在国际开源社区的 2024 年首秀,一经发布便获得了广泛关注,为中国模型在全球开源生态中赢得了更多认可。






请到「今天看啥」查看全文