网络故障分析

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了网络故障分析相关的知识,希望对你有一定的参考价值。

网络故障分析

一、网络应用访问缓慢

故障详细描述:
(1)同一VLAN的内网主机之间访问速度非常缓慢,如互相PING,网上邻居拷贝文件等操作。
(2)不同VLAN间的主机,访问速度非常缓慢。
(3)内网主机可以打开网页,但速度非常缓慢。
(4)内网主机PING外网域名或DNS服务器时,返回时间较大。
(5)网络中的各种应用出现时断时续的现象。
(6)内网主机打开网络中某业务 系统时,响应非常缓慢,甚至出 现假死状态。

故障原因分类:
(1)网络丢包
1)网络设备丢包
2)网络拥塞
3)MTU配置不当
4)网络***
5)负载均衡设备配置不当
(2)网络延迟大
1)设备的延迟
2)传输距离延迟
3)贷款延迟
(3)应用响应慢
1)TCP连接慢
2)应用交易处理慢
(4)相关应用服务器响应慢
1)DNS服务器响应慢
2)数据库服务器响应慢
3)其他相关服务慢

故障详细成因及解决方案:

针对网络设备丢包:
利用克莱网络回溯分析系统采用多端部署的方式,在网络中关键设备的两端进行数据包对比,确定该设备是否丢包,从而准确定位丢包设备。
推荐解决方案:
1)更新存在问题的设备配置。
2)更换存在问题的网络设备。
针对网络拥塞:
利用科来网络回溯分析系统监控关键链路(一般是出口链路)的流量占用情况,查看网络利用率是否过高,每秒数据包是否过多,数据包大小分布是否合理、TCP会话是否正常等各项。
推荐解决方案:
1)如果网络拥塞的原因是P2P、病毒、***等异常流量引起的,需对这些流量进行控制。
2)如果网络拥塞的原因是网络带宽过小,应考虑增加网络带宽。
针对MTU配置不当:
利用科来网络回溯分析系统采集关键链路数据,查看传输MTU值,再查看网络中关键设备的MTU设备。
推荐解决方案:
设定合适的MTU值。
针对网络***:
通过科来网络回溯分析系统监控关键链路,实时发现网络中的异常网络***,根据科来智能诊断,快速判断网络中是否存在异常网络***。
推荐解决方案:
根据智能诊断判断的地址进行排查,封堵。
针对负载均衡设备配置不当:
利用科来网络回溯分析系统通过多端部署方式,监控流量通过负载均衡后被分配情况,确定是否是用于负载均衡设备把数据包分配到错误的链路引起丢包。
推荐解决方案:
合理配置负载均衡策略

针对网络延迟大:
利用科来网络回溯分析系统采用多段部署的方式,在网络中关键设备的两端进行数据包对比传输的TCP数据包延时,分析并定位造成延迟的设备。
推荐解决方案:
1)更新引发延迟设备的配置。
2)更换引发延迟的网络设备。
针对传输距离延迟:
分析TCP连接中三次握手数据包的时间间隔,查看客户端网络延迟、服务端网络延迟,定位延迟位置。
推荐解决方案:
采用多连接或其他传输层协议,避免网络延迟给TCP传输带来的影响。
针对带宽延迟:
通过分析TCP传输的性能,确定是否存在带宽延迟看。通过计算传输的数据量和链路带宽容量,来确定带宽对传输延迟的影响。
推荐解决方案:
增加网络带宽

针对TCP连接慢:
利用科来网络回溯分析系统捕获应用通讯数据,通过定义应用直接查看三次握手延迟,及客户端、服务器延迟,快速判断TCP连接较慢是发生在客户端还是服务器。
推荐解决方案:
提升网络传输过程中的传输性能。
针对应用交易处理慢:
利用科来网络回溯分析系统捕获应用通讯数据,通过定义应用直接查看客户端请求时间和服务器响应时间,判断服务器是否存在应用交易处理响应慢的现象。

针对DNS服务器响应慢:
利用科来网络回溯分析系统捕获DNS通讯数据,分析DNS请求和响应数据包,查看是否存在DNS服务器响应慢的现象。
推荐解决方案:
优化DNS服务器的软硬件设置。
针对数据库服务器响应慢:
利用科来网络回溯分析系统捕获数据库通讯数据,分析后台数据库的交易处理请求和响应数据包,查看是否存在数据库交易处理慢的现象。
推荐接具体方案:
优化数据库服务器的软硬件配置,优化数据库操作脚本。
其他相关响应慢:
利用科来网络回溯分析系统捕获应用通讯数据,分析其他相关服务的交易处理请求和响应数据包,查看是否存在交易处理慢的现象。
推荐解决方案:
优化相关服务的软硬件配置。

二、网络、应用无法访问

故障详细描述:
(1)内网主机不能与互联网的任何应用进行通信,如网页、邮件、QQ、FTP等都不能使用。
(2)内网主机PING不通DNS服务器,网站域名。
(3)内网主机可以上QQ,但打不开网页。
(4)内网主机不能访问网络某个特定的应用服务。

故障原因分类:
(1)网络不可达
1)物理链路中断
2)网络设备宕机
3)严重丢包
4)拒绝服务***
5)路由不可达
6)策略中断
(2)应用不可达
1)应用宕机
2)应用拒绝服务
3)策略中断
(3)应用无响应
应用故障
(4)相关应用无响应
1)DNS服务器无响应
2)数据库服务器无法连接
3)其他相关服务无法连接

故障详细成因及解决方案:

针对物理链路中断:
通过PING定位断点,查看网络设备和物理链路状态,确定是否存在链路中断。
推荐解决方案:
恢复链路的连通性。
针对网络设备宕机:
通过PING定位断点,查看网络设备和物理链路状态,确定是否存在网络设备宕机。
推荐解决方案:
恢复设备正常运行。
针对严重丢包:
利用科来网络回溯分析系统监控关键链路,查看链路中TCP数据流是否存在大量重传,如果有,则表明网络中存在大量的丢包情况。通过PING目标主机确定是否存在大量丢包。同时通过分段捕获分析数据包定位丢包设备。
推荐解决方案:
1)如果丢包的原因是P2P、病毒、***等异常流量引起的,需对这些流量进行控制。
2)如果丢包的原因是某个设备丢包,可考虑对其进行重新配置或更换。
针对拒绝服务***:
利用科来网络回溯分析系统监控关键链路,通过智能报警系统快速判断网络内是否存在拒绝服务***,并迅速定位***源。
推荐解决方案:
定位***源,并对其阻断。
针对路由不可达:
利用科来网络回溯分析系统监控关键链路,分析捕获到的包中是否存在目的不可达的CMP数据包。通过tracert命令分析不可达的目标地址路由。
推荐解决方案:
更新路由器的路由配置。
针对策略中断:
利用科来网络回溯分析系统采用多段部署的方式,在网络中安全设备的两端进行数据包对比,定位中端点,查看是否是由于防火墙等安全设备的访问控制策略阻断了应用通讯。
推荐解决方案:
修正防火墙等设备上的访问控制策略。

针对应用宕机:
利用科来网络回溯分析系统捕获应用通讯数据,自定义应用并对应用进行监控,出现ing用宕机时通过应用警报及时预警。
推荐解决方案:
检查服务器端的应用服务状态。
针对应用拒绝服务:
根据科来智能警报查看并定位,产生***的地址。
推荐解决方案:
受到DOS/DDOS等***,查找并阻断***源。

针对应用故障:
利用科来网络回溯分析系统捕获应用通讯数据,可自定义,应用并对应用进行长期监控,可以查看应用请求与响应状态,如果出现服务器未响应请求,则服务端可能出现问题。
推荐解决方案:
检查应用的工作状态,查找应用的BUG,或重启应用,重启服务器。

针对DNS服务器无响应:
利用克莱网络回溯分析系统捕获DNS通讯数据,分析相关的DNS请求和响应数据包,查看是否存在DNS服务未无法正常解析应用地址情况,导致无法连接应用服务器。
推荐解决方案:
检查DNS服务器软硬件情况,恢复DNS服务。
针对数据库服务器无法连接:
利用科来网络回溯分析系统捕获数据库通讯数据,分析相关的数据库请求和响应数据包,查看是否存在数据库服务器没有响应,导致无法提供正常交易处理。
推荐解决方案:
检查数据库服务的配置,确保数据库服务正常。
针对其他相关服务无法连接:
利用科来网络回溯分析系统捕获应用通讯数据,分析其他相关服务器的交易处理情况。
推荐解决方案:
优化相关服务的软硬件及策略的设置,确保服务的正常提供。

以上是关于网络故障分析的主要内容,如果未能解决你的问题,请参考以下文章

故障诊断分析基于matlab BP神经网络三相逆变器故障诊断研究含Matlab源码 1736期

基于网络拓扑及告警的故障根因定位系统实现及算法研究赛题需求分析

NSX 虚拟网络故障分析经验分享

结构化的网络故障检测与排除方法

云网络运维必备神器:全链路故障诊断与分析

故障诊断分析基于matlab概率神经网络柴油机故障诊断含Matlab源码 1754期