专栏名称: 机器之心
专业的人工智能媒体和产业服务平台
目录
相关文章推荐
爱可可-爱生活  ·  AI时代,为什么还要学物理化学语文?(解读见 ... ·  16 小时前  
宝玉xp  ·  Claude Code ... ·  22 小时前  
爱可可-爱生活  ·  晚安~ #晚安# -20250611231622 ·  昨天  
宝玉xp  ·  一年之间 AI 做高考数学从 47 分到 ... ·  昨天  
爱可可-爱生活  ·  【[13星]Newton-Isaac-Sim ... ·  昨天  
51好读  ›  专栏  ›  机器之心

重磅 | 微软发布数据集MS MARCO,打造阅读理解领域的「ImageNet」

机器之心  · 公众号  · AI  · 2016-12-17 11:07

正文

请到「今天看啥」查看全文



今天早些时候,微软在其官方博客上宣布发布了一个包含 10 万个问题和答案的数据集,研究者可以使用这个数据集来创造能够像人类一样阅读和回答问题的系统。此外,微软计划效仿 ImageNet,与其他人合作、最终创办正式的竞赛等。


这个数据集名叫 MS MARCO,表示 Microsoft MAchine Reading COmprehension(微软机器阅读理解)。其背后的团队声称这是目前这一类别中最有用的数据集,因为这个数据集是基于匿名的真实数据构建的。通过将该数据集免费开放给更多的研究者,该团队希望能够促进机器阅读领域的研究突破,就像之前研究者已经在图像识别和语音识别领域所取得颠覆性突破一样。


MS MARCO 数据集地址:http://www.msmarco.org



他们也希望这次开放能够促进「人工通用智能(AGI/artificial general intelligence)」的长期目标的实现,即创造出能够像人类思考的机器。



Rangan Majumder,微软 Bing 搜索引擎部门合作伙伴组的程序经理


微软 Bing 搜索引擎部门合作伙伴组的程序经理(partner group program manager)Rangan Majumder 是这个项目的领导者,他说:「为了实现人工通用智能的目标,我们首先需要机器能够像人类一样阅读和理解文档。这个数据集是向这个方向迈出的一步。」


Majumder 说,目前回答复杂问题的系统仍然还处在婴儿阶段。Bing 这样的搜索引擎和小娜那样的虚拟助手还只能回答一些基本的问题,比如「光明节那天开始?」或「2000 乘以 43 等于多少?」








请到「今天看啥」查看全文