专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
目录
相关文章推荐
小小挖掘机  ·  KDD 2024 | ... ·  10 月前  
InfoTech  ·  DeepSeek 彻底爆了 ·  4 天前  
51好读  ›  专栏  ›  数据派THU

独家 | Michael I.Jordan:大数据时代下的安全实时决策堆栈与增强学习(视频+精华笔记...

数据派THU  · 公众号  · 大数据  · 2017-09-25 19:00

正文

请到「今天看啥」查看全文



从前,风险是在统计学、经济学中研究,而时间概念则在计算机科学、电气科学中考虑,将这两个传统的问题放在一起来考虑具有非凡的意义。权衡风险与时间并不简单,并且至今尚未被解决。我们拥有许多数据,有些是最新且相关的,有些却不是,这一点给决策造成了困难。什么叫做相关?将数据保存为可以预测的形式,不仅仅是时间上的预测,而且包含了数据相关性的预测,这是一个很复杂的概念。过去的十年,公司收集的数据往往是普适的,他们提供的服务对于所有人都是相同的。而今天,我们收集的数据来自每一个不同的人,对于每个个体,我们希望提供个性化的服务。这种决策是非常困难的,因为我们要用计算机建立成千上万的模型,需要将数据整合再分开,并且对每一个人都需要提供好的预测,这个问题需要学术界来解决。总而言之,我们考虑的事情包括对实时数据毫秒级的实时决策,以及系统安全性问题。


在实时决策中我们要解决如下三个问题:


首先,处理海量的数据并及时给予反馈难度很高,数据量越大,实时性就越难达到 。我们需要大数据量来提高决策的准确性,但与此同时决策速度却会变慢。那我们该怎样解决这个问题呢?我们需要构造流水线,来快速地搭建模型、模型服务并更新模型。我们想到运用增强学习算法,这一算法在自动驾驶中已用到。尽管增强学习的思路与技术都具备,但目前它尚未带来我们预期的突破。Alpha Go运用的就是增强学习算法,有人认为它是一个重大突破,但我不这么认为。因为它并没有解决目前的实际问题,它只是一个游戏,你可以去模拟这个游戏平台,你很清楚地知道这盘游戏的布局。而现实生活并非如此,我们永远不知道那个角落有什么,永远不知道后面会发生什么。你无法模拟现实生活,根据这一状态来预测下一状态的事情。因此,我们确实希望构建增强学习系统,来看我们每一步是否有意义,但目前我们尚无手段来证明这件事。


接下来一个非常重要的问题是,承认“我不知道”的能力。 目前的机器学习系统在这一点上表现得并不好,它总是说它知道。就像你们去医院寻求治疗,医生很确定地告诉你你的心脏有问题需要手术一样,你知道这其中肯定是有不确定性的,但他并不给你第二个答案,这是非常危险的。


最后,可解释性。 人们希望得到的答案往往不是简单的是或否,而希望得到进一步的解释,但目前的系统尚未做到这一点。因此我们的目标就是解决这些问题并将开源平台提供给大家,当然我们不认为这件事是可以由我们独自完成的,它是每一个人都面临的挑战。


现在,我来介绍一下在过去的半年里我们所做的工作。


首先是SRDS,它随着时间不断演化 。它基于AMPLab栈,并关注新的事情。我们有一个轻量级的微型核,用于调度、目标存储与优化,它是开源的。我们现在致力于研究一种在大数据流下不需要等待上一个节点处理完再做接下来事情的架构,相关资料可以在网上找到。


Clipper是模型服务的一项工程。 模型服务是一项很重要的任务,我们常常需要花费好几天来训练一个与时机、环境、人都契合得很好的模型。以往我们很容易能得到单一的模型,将它复制多份即可,但现在我们要搭建的不再是单一模型,而是个性化的模型。每个人要得到不同的模型,那么你该如何组织、服务,该如何整合人群信息来得到针对每个人的好模型,这是一个很难的挑战。







请到「今天看啥」查看全文