正文
检索增强技术在代码及多模态场景中的发挥着重要作用,而向量模型是检索增强体系中的重要组成部分。针对这一需求,近日,智源研究院联合多所高校研发了三款向量模型,包括代码向量模型 BGE-Code-v1,多模态向量模型 BGE-VL-v1.5 以及视觉化文档向量模型 BGE-VL-Screenshot。这些模型取得了代码及多模态检索的最佳效果,并以较大优势登顶 CoIR、Code-RAG、MMEB、MVRB 等领域内主要测试基准。
BGE 自 2023 年 8 月发布以来,已成为中国首个登顶 Hugging Face 榜首的国产 AI 模型以及 2023 年所有发布模型的全球下载量冠军。
目前,BGE-Code-v1、BGE-VL-v1.5、BGE-VL-Screenshot 三款模型已向社区全面开放,为相关技术研究与产业应用提供助力。
BGE-Code-v1:
-
模型地址:https://huggingface.co/BAAI/bge-code-v1
-
项目主页:https://github.com/FlagOpen/FlagEmbedding/tree/master/research/BGE_Coder
-
论文链接:
https://arxiv.org/abs/2505.12697
BGE-VL-v1.5:
-
模型地址:https://huggingface.co/BAAI/BGE-VL-v1.5-zs
-
项目主页:https://github.com/FlagOpen/FlagEmbedding/tree/master/research/BGE_VL
-
论文链接:https://arxiv.org/abs/2412.14475
BGE-VL-Screenshot:
-
模型地址:https://huggingface.co/BAAI/BGE-VL-Screenshot
-
项目主页:https://github.com/FlagOpen/FlagEmbedding/tree/master/research/BGE_VL_Screenshot
-
论文链接:https://arxiv.org/abs/2502.11431