专栏名称: 运维帮
互联网技术分享平台,分享的力量。帮主一直坚信技术可以改变世界,从毕业到现在干了15年运维,有许多话要和你说。
目录
相关文章推荐
51好读  ›  专栏  ›  运维帮

日志VS网络数据,谁能做好全链路监控?

运维帮  · 公众号  · 运维  · 2021-01-28 18:00

正文

请到「今天看啥」查看全文


在网络传输过程中,由于Delayed ACK与Nagle算法相互作用会导致最大500毫秒的延迟。日志往往无法排查此类问题,而通过网络数据可以进行数据包回溯分析。因此,网络数据比日志具备更高的实时性。

二、监控路径对比

作为两种数据源,日志与网络数据所监控的定义与范围有着天然的差别。分布式追踪领域有三个重要的概念:Metrics、Trace、Log,全链路监控就是利用三者间的关系分步骤实现。

  • Metrics即指标,反映组件实时状况与健康度;

  • Trace即链路,反映在单次请求的范围内如何处理信息;

  • Log即日志,反映离散的事件或过程;



(Metrics、Tracing、Logging三者间的关系示意图)

一般进行全链路监控有两种做法:

  • 第一种做法:首先通过指标即(Metrics),查看组件的健康程度、受影响的交易类型,再通过指标关联查看整个交易路径的健康度即(Trace),最后定位具体的问题节点即(Log),找出根因。

  • 第二种做法:当交易出现问题,先查看出错的具体路径即(Trace),再查看相对应的指标(Metrics),如服务器或应用性能指标等,最后查看详细日志数据(Log)。







请到「今天看啥」查看全文