专栏名称: 生物探索
探索生物科技价值的新媒体
目录
相关文章推荐
51好读  ›  专栏  ›  生物探索

Nature:超强版AlphaGo来了!可自学成才,将助力科研

生物探索  · 公众号  · 生物  · 2017-10-23 09:46

正文

请到「今天看啥」查看全文


AlphaGo Zero:从零自学成才


DeepMind开发的前几款“围棋程序”,都是在与有专家参与的超10万次围棋对弈中训练而来的,且时间长达数月。现在,这一款最新的AlphaGo Zero则从零开始、自我学习。 经过40天训练、3000万次PK(包括自我对弈),AlphaGo Zero可以打败之前的AlphaGo版本。


AlphaGo Zero的原理是 “强化学习”(reinforcement learning) ,能够在更少的训练时间、更强的计算能力下远超“前辈”。DeepMind参与AlphaGo开发的科学家David Silver认为:“对人工智能使用纯强化学习一直很困难。”他认为,该项目是第一个“真正稳定、强大的强化学习版本”。


2 一个“大脑”:40天远超人类







请到「今天看啥」查看全文