正文
简化研发使用,实现业务、中间件、监控完全独立。
约定大于配置。
自动发现:部署规范,配置规范默认返回码、描述。
动态路由。
日志传输节点远程控制,无限扩容。
做自主监控有三个最基本要素,分别是调用量、性能、成功率。
后期的一些监控扩展,都是基于这三个指标。
如下图,是监控的细节:
如图中所示,红颜色的线条被称之基线,通过波动可知当前这个服务的响应时间、调用量、成功率等情况。基线计算很复杂,基于以前历史数据,利用异常检测算法,推算当前的量应该是多少。
如下图,是监控分层的细节展示:
如图中所示,每一条线都可以下钻,钻进去就可看到某个应用里有哪些类正在被监控,进一步下钻可以看到方法、IP 级别。
当出现某一台服务器故障,影响整个响应时间时,从 IP 级别的图中就可以快速定位,看到是哪个 IP 出现了问题。
分享服务梳理方法之前,先来了解如下两个概念:
基于这两个概念,可以进一步对方法、应用和业务线之间的依赖关系进行分析,如下是某场景依赖关系的全拓扑图:
从图中,可以很清晰的看到整个调用的拓扑,所有应用相互之间的依赖强度,通过连线之间的数字来描述应用之间的依赖频度。
如下,是依赖关系的主流程图:
把弱依赖及依赖频度较小的应用去掉以后,可以看到主流程,主流就是核心系统,如果出现故障,影响会非常大。