专栏名称: 51CTO
51CTO官方公众号——聚焦最新最前沿最有料的IT技术资讯、IT行业精华内容、产品交流心得。本订阅号为大家提供各种技术干货,还会不定期的举办有奖活动,敬请关注。
目录
相关文章推荐
51好读  ›  专栏  ›  51CTO

从人肉运维到智能运维,京东金融服务监控的进阶之路

51CTO  · 公众号  · 科技媒体  · 2017-09-28 11:43

正文

请到「今天看啥」查看全文


简化研发使用,实现业务、中间件、监控完全独立。

  • 约定大于配置。 自动发现:部署规范,配置规范默认返回码、描述。

  • 动态路由。 日志传输节点远程控制,无限扩容。


  • 02

    自主监控三剑客

    做自主监控有三个最基本要素,分别是调用量、性能、成功率。 后期的一些监控扩展,都是基于这三个指标。


    如下图,是监控的细节:

    如图中所示,红颜色的线条被称之基线,通过波动可知当前这个服务的响应时间、调用量、成功率等情况。基线计算很复杂,基于以前历史数据,利用异常检测算法,推算当前的量应该是多少。


    如下图,是监控分层的细节展示:

    如图中所示,每一条线都可以下钻,钻进去就可看到某个应用里有哪些类正在被监控,进一步下钻可以看到方法、IP 级别。


    当出现某一台服务器故障,影响整个响应时间时,从 IP 级别的图中就可以快速定位,看到是哪个 IP 出现了问题。


    03

    服务依赖关系梳理

    分享服务梳理方法之前,先来了解如下两个概念:

    • 依赖强度。 指服务之间的依赖关系强弱。比如购物必须要交易,交易必须经过支付后才发货,交易对支付就是强依赖,支付系统出故障,交易也不能幸免。

    • 依赖频度。 指对某一个服务的调用次数,调用频繁,就是高频依赖。


    基于这两个概念,可以进一步对方法、应用和业务线之间的依赖关系进行分析,如下是某场景依赖关系的全拓扑图:

    从图中,可以很清晰的看到整个调用的拓扑,所有应用相互之间的依赖强度,通过连线之间的数字来描述应用之间的依赖频度。


    如下,是依赖关系的主流程图:

    把弱依赖及依赖频度较小的应用去掉以后,可以看到主流程,主流就是核心系统,如果出现故障,影响会非常大。



    04







    请到「今天看啥」查看全文