专栏名称: 待字闺中
深度分析大数据、深度学习、人工智能等技术,切中实际应用场景,为大家授业解惑。间或,也会介绍国内外相关领域有趣的面试题。
目录
相关文章推荐
OSC开源社区  ·  OpenAI用Rust重写AI编程工具Cod ... ·  4 天前  
京东科技技术说  ·  JDK从8升级到21的问题集 ·  昨天  
稀土掘金技术社区  ·  我在 pre 直接修改 bug,被领导批评了 ·  昨天  
51好读  ›  专栏  ›  待字闺中

机器学习系列(一):在赌场怎么玩老虎机收益最大?

待字闺中  · 公众号  · 程序员  · 2016-12-06 18:02

正文

请到「今天看啥」查看全文



前面说到了估计值,那么如何估算一台老虎机在某个时刻t的拉杆吐出的硬币的可能价值?显而易见的办法是计算之前每个老虎机总共吐出的硬币的价值,除以这个老虎机被拉杆了多少次。这个和我们的常识很一致,蛮合理的。如下所示。




得到了每台老虎机在某个时刻t的拉杆吐出的硬币的估算值,事情就好办了。在时刻t,我们就选择估算值最大的老虎机,然后拉杆就行了。如下所示。




现在,根据前面的估算公式,换一种表示方法,就是把前几次的收益(硬币的价值)相加,然后除以拉杆次数。









请到「今天看啥」查看全文