专栏名称: 腾讯研究院
【腾讯研究院 ★ Tencent Research Institute】 网聚智慧,连接世界!网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。
目录
相关文章推荐
36氪  ·  蒸发159亿,蔚来的账户快见底了 ·  13 小时前  
新浪科技  ·  #蔚来一季度交付同比增长超40%# ... ·  2 天前  
51好读  ›  专栏  ›  腾讯研究院

腾讯研究院AI速递 20250220

腾讯研究院  · 公众号  · 科技媒体  · 2025-02-20 00:02

正文

请到「今天看啥」查看全文


三、  全球首测!OpenAI开源SWELancer,大模型冲击100万年薪

1. OpenAI推出SWE-Lancer基准测试,从Upwork平台精选1400多个真实软件工程任务,总价值达100万美元,采用端到端测试评估AI编程能力;

2. 测试包含个人贡献者任务和软件经理任务两大类,前者评估代码实现能力,后者考验技术判断和决策能力;

3. Claude 3.5 Sonnet在所有测试模型中表现最佳,在完整数据集上"赚取"超40万美元,但通过率仍有较大提升空间。

https://mp.weixin.qq.com/s/9TV33uWZ7BuqAOmMOBMf3A

四、  OpenAI前CTO新公司:北大校友翁荔加盟,2/3来自OpenAI

1. OpenAI前CTO Mira Murati等多位ChatGPT核心成员组建新公司Thinking Machines Lab,团队成员来自OpenAI、Meta、Character.ai等顶级AI公司;

2. 新公司将专注三大核心基础:SOTA模型智能、高质量基础设施和先进的多模态能力,承诺通过论文和代码开放研究成果;

3. 核心团队阵容豪华,包括PPO算法创始人John Schulman任首席科学家、翁荔等30多位AI领域顶尖专家。

https://mp.weixin.qq.com/s/cZ2DHqXmmb8312FhedIlZA







请到「今天看啥」查看全文