admin管理员组

文章数量:1558045

版权声明:本文为神州灵云作者的原创文章,未经神州灵云允许不得转载。

本文作者:Bruce

引子

最近,笔者所在公司 - 神州灵云的专家拜访一知名政企客户时,专家详细介绍了公司酷毙的一体化性能管理解决方案(从网络和应用端同时采集监控),客户挑衅地说:“我们这边有个真实的应用性能问题,如果你们能解决,才是真正的酷!”

以往都是Presentation+Demo就可以,这次要来真格的,专家虽然有些意外,但自信满满的说:“来吧 ,还就怕你没问题 ”。

故障描述

原来客户有个Coding应用,使用者从互联网访问,不断吐槽、投诉不断(再不解决就不用了)很多交易的响应时间超过了500 毫秒,SLA承诺是300 毫秒以内,这差距也太大了吧。因为网络设备和节点繁多,排障初期并不能确定故障点,客户花费了大量时间在防火墙和Nginx 策略优化上,但是依然不见成效。

了解到这个情况,专家心里有谱了:“没事,先上我们的故障定位系统NPM”,部署架构是这样的:

图中数字1 - 代表外联区,2 - 代表 核心交换区 3 - 代表应用服务区

定位问题

  1. 外联区:在12 月4 日

本文标签: 罪魁祸首故障性能快速用户