专栏名称: 人工智能与大数据技术
分享大数据、云计算、人工智能等高科技先进技术
目录
相关文章推荐
CDA数据分析师  ·  【反焦虑法则】当我不再较劲这 5 ... ·  3 天前  
软件定义世界(SDX)  ·  【PPT】互联网女皇340页AI报告猛料刷屏 ·  4 天前  
数局  ·  后浪研究所:2025年轻人地铁出行报告 ·  3 天前  
数局  ·  后浪研究所:2025年轻人毛绒玩具报告 ·  4 天前  
51好读  ›  专栏  ›  人工智能与大数据技术

国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身Top10

人工智能与大数据技术  · 公众号  · 大数据  · 2024-10-24 11:49

正文

请到「今天看啥」查看全文


Yi-Lightning跃居并列第二,和o1-mini相差无几。

数学 能力,Yi-Lightning和Gemini-1.5-Pro-002并列第3,仅次于o1-preview、o1-mini。

代码 能力Yi-Lightning排名并列第4。

另外在 Hard Prompts Longer Quer y 分榜,Yi-Lightning也都排在第4位。


最后同样值得关注的是,竞技场新功能 风格控制过滤 ,确保分数反映模型真正解决问题的能力,而不是用漂亮的格式、增加回答长度。

在对长度和风格等特征做了降权处理后,所有模型分数均有下降,Yi-Lightning排名变化不大,整体还与GPT-4o、Grok-2同一梯队。

发布会上,零一万物创始人兼CEO李开复博士展示了Yi-Lightning在不同场景上的能力。







请到「今天看啥」查看全文