Speaker
Ms
Li 王丽
(高能所)
Description
CSNS公共服务构建在不同的软件模块集上,这些软件模块由不同的团队开发,使用不同的编程语言实现,并且部署在不同的服务器上。当公共服务系统出现问题时,最初的查找方式只能依靠人工,从出现问题的地方逐一排查,直到找到问题源头。这种方式,在问题定位及分析上相当耗时。2010年Google发布了Gapper一款针对大规模分布式系统监控的工具。紧接着各种监控工具应运而生,如Zipkin,Cat,Pinpoint,Skywalking。然而Zipkin和cat对代码有一定的侵入性;Pinpoint是基于字节码注入技术,可以做到完全的无代码侵入,但开发语言只支持Java和PHP,数据存储方面又仅支持Hbase。本文基于Skywalking,开发满足CSNS公共服务系统的全链路监控工具。设计链路数据流的数据结构Span,根据业务的差异,封装业务客户端的探针。服务端接收这些探针发送的链路信息并存储到Elasticsearch。最终再组装成每一条完整的链路数据进行展示。使用该工具减少了查找故障带来的人力、物力,时间和精力的消耗,提高各类服务的工作效率。
Primary author
Ms
Li 王丽
(高能所)