专栏名称: 云技术实践
关注云计算,云技术,云运维,云存储,存储,分布式,OpenStack,SDN,Ceph,虚拟化,运维,分享在云计算/虚拟化/运维项目实施中的资讯、经验、技术,坚持干货。
目录
相关文章推荐
InfoQ Pro  ·  充电计划 | 反卷“大”模型 ·  14 小时前  
InfoQ Pro  ·  Redis 之父:哪怕被喷我也得说,AI ... ·  14 小时前  
字节跳动技术团队  ·  基于LLM的AI应急:多模态信息智能化分析整 ... ·  昨天  
字节跳动技术团队  ·  远程访问代理+内网穿透:火山引擎边缘网关助力 ... ·  2 天前  
字节跳动技术团队  ·  稀土掘金 x Trae ... ·  2 天前  
51好读  ›  专栏  ›  云技术实践

关于“AIOps”智能运维,这篇最透彻!

云技术实践  · 公众号  · 架构  · 2018-12-13 19:55

正文

请到「今天看啥」查看全文



2. AIOps的层次划分和能力

根据Gartner的定义,AIOps产品或平台应包含下图所示的层级:

  • 数据层

  • 大数据层

  • 计算层:

  • 分析层:

  • 算法层

  • 机器学习层

  • 可视化层


AIOps应拥有以下能力:


数据提取

AIOps 从各种来源收集各种类型的数据。这可能包括关于错误、日志、性能警报和工单数据。从最不同的数据源摄取数据的能力至关重要。


自动发现

IT环境,尤其是到了云环境,一直是一个动态的过程,企业需要自动发现的能力。 AIOps 能自动收集标识所有基础设施设备、正在运行的应用程序和的业务数据。


相关性关联

AIOps平台应该将数据以关联起来,确定基础设施、应用程序、业务之间的关系。


可视化展现

AIOps 端到端关联过程完成后,需要可视化数据,可视化非常重要,可视化之后IT运维能快速查明问题并采取纠正措施。


自动化

自动化是AIOps的一个关键组成部分,因为它向用户交付了最终的ROI。通过自动化IT运维任务,可以减少运维成本,加速创新,降低MTTR,提高满意度。


预测

找到问题的根源是关键,但确定重复出现的事件及预测未来可能发生的事件更为关键。AIOps使用机器学习来确定时间序列中事件的模式,从而预期行为和阈值检测异常,并预测中断和性能问题。


3. 云使IT环境更复杂,使用AIOps只是时间问题

随着云的普及,IT环境表现出三个特征:

  • 规模更大,产生的数据更多。

  • 动态,云的弹性决定了IT环境是不断变化的。

  • 更复杂,从主机层面有物理机,虚拟机,云主机,容器等,从形态上有私有云、公有云、混合云等。

越来越多的数据,复杂环境频繁的警报,大量重复工作,要求提升自动化水平,AIOps是解决这些问题的利器,使用AIOps只是时间问题。



2







请到「今天看啥」查看全文