专栏名称: InfoQ
有内容的技术社区媒体。
目录
相关文章推荐
新浪科技  ·  #OpenAI开源模型推迟#【#奥特曼回应开 ... ·  2 天前  
新浪科技  ·  【#iOS26可让音频始终在耳机内播放#】苹 ... ·  2 天前  
51好读  ›  专栏  ›  InfoQ

课程推荐丨深度强化学习第一课——小白入门攻略篇

InfoQ  · 公众号  · 科技媒体  · 2017-09-08 08:00

正文

请到「今天看啥」查看全文


那么,什么是深度强化学习呢?

一般来说,机器学习分为监督学习(Supervised learning),非监督学习(Unsupervised learning)以及强化学习(Reinforcement learning)三类。与监督学习,非监督学习不同,强化学习是一种多阶段的接收环境反馈的机器学习方法。强化学习的学习目标是从环境状态到行为映射关系,从而使得系统的一系列行为从环境中获得的累计奖赏最大(损失最小)







请到「今天看啥」查看全文