Nature：超强版AlphaGo来了！可自学成才，将助力科研

生物探索 · 公众号 · 生物 · 2017-10-23 09:46

正文

请到「今天看啥」查看全文

AlphaGo Zero：从零自学成才

DeepMind开发的前几款“围棋程序”，都是在与有专家参与的超10万次围棋对弈中训练而来的，且时间长达数月。现在，这一款最新的AlphaGo Zero则从零开始、自我学习。 经过40天训练、3000万次PK（包括自我对弈），AlphaGo Zero可以打败之前的AlphaGo版本。

AlphaGo Zero的原理是 “强化学习”（reinforcement learning） ，能够在更少的训练时间、更强的计算能力下远超“前辈”。DeepMind参与AlphaGo开发的科学家David Silver认为：“对人工智能使用纯强化学习一直很困难。”他认为，该项目是第一个“真正稳定、强大的强化学习版本”。

2 一个“大脑”：40天远超人类

请到「今天看啥」查看全文

推荐文章

催眠大师JY · 冰杖被削的不能看？6.24它才是最强神器

8 年前

韩国me2day · 24小时新闻：JENNIE-电影版-Red Velvet-Ten-具惠善-WINNER--Jackson

8 年前

总裁俱乐部 · 做一个简单的人（很好的文章）

8 年前

雷科技 · OPPO R11 最强对手来袭！三星首款双摄手机 C10 真机曝光

7 年前

河南新闻广播 · 下半年，你的五险一金将迎来5大喜讯！

7 年前