专栏名称: 品玩
有品好玩的科技,一切与你有关
目录
相关文章推荐
谜想屯  ·  为了你,圣杯 ·  2 天前  
谜想屯  ·  为了你,圣杯 ·  2 天前  
51好读  ›  专栏  ›  品玩

大厂模型商用开源,阿里云起了个头

品玩  · 公众号  · 科技媒体  · 2023-08-04 09:48

正文

请到「今天看啥」查看全文


Qwen-7B是支持中、英等多种语言的基座模型,Qwen-7B-Chat是基于基座模型的中英文对话模型,在许多测基准,比如MMLU、C-Eval 中,Qwen-7B在70亿参数规模领域上都取得了良好的表现,阿里云表示其部分能力甚至可以赶超一些120亿参数大模型。

用户目前已经可以从魔搭社区直接下载模型,也可通过阿里云灵积平台访问和调用这些模型,而通过开源代码,用户可以很方便地在消费级显卡上部署和运行模型。阿里云基于大模型的服务,包括训练、推理、部署和精调都可以应用在上述两个模型上。

这不是国内第一个免费、可商用的大模型。就在半个月前,智谱 AI 宣布 ChatGLM-6B 和 ChatGLM2-6B 允许免费商业使用,百川智能的Baichuan 13B模型在发布的同时就开源允许免费商用。

但通义千问是成为了第一个科技大厂的开源大模型,它的开源将被视为国内“百模大战”进入新阶段的一个标志——现在无论中美,也无论巨头还是中小初创公司,有关大模型开源的看法正在趋近于一致。







请到「今天看啥」查看全文