专栏名称: InfoQ
有内容的技术社区媒体。
目录
相关文章推荐
新浪科技  ·  【#曝AirTag2即将发布#】苹果 ... ·  19 小时前  
新浪科技  ·  【#周鸿祎称员工领导智能体将成常态#】6月1 ... ·  22 小时前  
36氪  ·  估值暴涨30倍,蔡崇信夫妇赚翻了 ·  2 天前  
51好读  ›  专栏  ›  InfoQ

课程推荐丨深度强化学习第一课——小白入门攻略篇

InfoQ  · 公众号  · 科技媒体  · 2017-09-08 08:00

正文

请到「今天看啥」查看全文


那么,什么是深度强化学习呢?

一般来说,机器学习分为监督学习(Supervised learning),非监督学习(Unsupervised learning)以及强化学习(Reinforcement learning)三类。与监督学习,非监督学习不同,强化学习是一种多阶段的接收环境反馈的机器学习方法。强化学习的学习目标是从环境状态到行为映射关系,从而使得系统的一系列行为从环境中获得的累计奖赏最大(损失最小)







请到「今天看啥」查看全文