正文
身份认证。FusionInsight使用LDAP作为帐户管理系统,并通过Kerberos对帐户信息进行安全认证;统一了Manager系统用户和组件用户的管理及认证,提供单点登录。
权限控制。基于用户和角色的认证统一体系,遵从帐户/角色RBAC(基于角色的访问控制)模型,实现通过角色进行权限管理,对用户进行批量授权管理,降低集群的管理难度;通过角色创建访问组件资源的权限,可以细粒度管理资源(例如文件、目录、表、数据库、列族等访问权限);将角色授予用户/用户组,简化用户/用户组的权限配置。
审计日志。FusionInsight审计日志中记录了用户操作信息,可以快速定位系统是否遭受恶意的操作和攻击,并避免审计日志中记录用户敏感信息:确保每一项用户的破坏性业务操作被记录审计,保证用户业务操作可回溯;为系统提供审计日志的查询、导出功能,可为用户提供安全事件的事后追溯、定位问题原因及划分事故责任的重要手段。
数据安全
从集群容灾、备份、数据完整性、数据保密性等方面保证用户数据的安全。
文件系统加密:Hive、HBase可以对表、字段加密,集群内部用户信息禁止明文存储;
加密灵活:加密算法插件化,可进行扩充,亦可自行开发。非敏感数据可不加密,不影响性能;
业务透明:上层业务只需指定敏感数据(Hive和HBase表级、列级加密),加解密过程业务完全不感知。
数据容灾
FusionInsight集群容灾为集群内部保存的用户数据提供实时的异地数据容灾功能;它对外提供了基础的运维工具,包含主备集群关系维护,数据重建,数据校验,数据同步进展查看等功能。
四、京东大数据安全实践
数据资源已经成为一种基础战略资源,数据的共享和流通会产生巨大价值。然而,数据资源在流通过程中却面临着诸多瓶颈和制约,尤其是当数据一种特殊的数字内容产品时,其权益保护难度远大于传统的大数据,一旦发生侵权问题,举证和追责过程都十分困难。
为了解决这些问题,京东万象数据服务平台(如图B-6所示)利用区块链技术对流通的数据进行确权溯源,数据买家在数据服务平台上购买的每一笔交易信息都会在区块链中存储起来,数据买家通过获得交易凭证可以看到该笔交易的数字证书以及该笔交易信息在区块链中的存储地址,待买家需要进行数据确权时,登录用户中心进入查询平台,输入交易凭证中的相关信息,查询到存储在区块链中的该笔交易信息,从而完成交易数据的溯源确权。
在安全保障方面,为了防止数据流通过程中的个人身份冒用问题,京东万象数据服务平台通过使用公安部提供的个人身份认证服务对用户身份进行识别和保护。京东万象数据服务平台结合公安部eID技术,该技术密码技术为基础、以智能安全芯片为载体、由“公安部公民网络身份识别系统”签发给公民的网络身份标识,能够在不泄露身份信息的前提下在线远程识别用户身份。
京东万象数据服务平台通过区块链溯源和eID技术,有效解决了合法用户基于互联网开展大数据安全交易的数字产品版权保护问题,保障了数据拥有者在数据交易中的合法权益。
五、奇虎360大数据安全实践
奇虎360在面对日益严峻的安全挑战时,不断更新技术思路,实现了及时响应最新的网络安全威胁。为应对千变万化的网络安全威胁,奇虎360通过部署的数万台大数据服务器,对当前网络安全事件进行实时监测与分析,采用大数据技术对网络安全威胁进行跟踪和防范。
为了保障安全,大数据平台依照“安全三同步”原则进行建设,即同步规划、同步组织实施、同步运作投产。
奇虎360的大数据平台安全保障体系框架如图B-7所示。大数据平台安全保障体系框架包括“安全职责划分”,“安全区域划分”,“安全级别划分”,“安全监测模块”,“安全防御模块”,“业务安全与安全运维模块”,“安全响应中心模块”等部分。
安全职责划分
安全职责划分是整体方案的基础,所有技术手段都应贴近安全职责划分,为其服务。梳理大数据平台各方安全责任边界,对整个活动中的安全事件进行详细的责任划分。
安全区域划分
大数据平台环境相对复杂,涉及多类业务,多类系统,现有网络结构已经考虑了分级问题,在此基础上,需进一步细化安全域的划分以及不同安全域、不同安全级别的访问控制设计。
安全级别划分
按照安全区域划分结果,为每个区域制定响应的安全等级,区域安全等级与用户安全等级、数据安全等级相互对应。通过安全级别的划分确保可信合规使用资源。
安全监测模块
其中主要包括大数据平台安全防御审查系统并提供基于人工或自动化的多层次的安全监测服务。
安全防御模块
按照统一规划、统一标准的设计思路,在充分考虑当前网络应用和实际环境的基础上,对整体的网络划分为若干个安全域和安全区,建设大数据平台面向各个区域的基础安全防御系统和大数据平台自身的防御系统。
业务安全与安全运维模块
实现安全运维操作的分级管理,针对大数据业务安全和安全运维工作的用户赋予符合其安全职责划分的权限,实现业务安全和安全运维。
安全响应中心模块
采用本地响应+安全响应的新型工作模式。本地响应实现当前问题的及时规范化处理,安全响应结合云端的情报威胁联动、本地终端协调联动、以及专家等提供及时的技术保障服务。
六、腾讯大数据安全实践
腾讯一直把大数据应用作为公司的重要发展战略,并依托十多年的互联网产品开发和运营经验,形成了一套完整、可靠、扩展性强的大数据业务应用框架,为用户提供大数据处理服务。
腾讯大数据业务应用框架为用户提供三大基础能力:
数据:提供海量的数据接入能力与处理能力;
连接:提供开放接口,做互联网+的连接器;
安全:重视网络安全,将其作为连接一切的防护体系。
腾讯特别注重在提供大数据处理服务过程中的数据安全和隐私保护问题,采取安全技术和管理措施确保大数据业务的健康发展。大数据和云计算密不可分,腾讯云通过端、主机、网络、业务的安全服务,为客户提供安全的大数据业务。腾讯大数据安全涉及的安全关注重点如图B-8所示。
平台安全
关注系统自身的安全性,防止来自系统层面的攻击,同时为更高级安全防御措施提供系统级别的支持,包括:系统防御,即防御来自系统层面的攻击,如漏洞攻击、嗅探攻击、流量攻击(如DDoS)等;权限管理,即提供文件、设备等底层资源的权限管理能力,防止越权访问;操作审计:即提供文件、设备等底层资源的访问、操作历史日志,为更高级的审计提供数据和功能支持。