浅析几种典型网络故障排查方法

时间:2022-05-05 12:34:22

浅析几种典型网络故障排查方法

【摘要】网络已经成为当今时代必不可少的生活“必须品”,作为一种新型的产业网络中出现各种各样的故障也是困扰使用者的一大心病。本文就从常见的网络问题入手,简单的分析一下几种常见的网络问题的解决方法。

【关键词】网络故障 交换机故障 门户网站访问失败 排查方法

【中图分类号】TD672 【文献标识码】A 【文章编号】1672-5158(2013)04-0097-01

一、无法上网的故障和排查方法

电脑使用中某一时刻无法上网,这可能是以下几种:1、在局域网络中,其中一台电脑无法上网;2、局域网通信时断时续;3、开机后,网卡指示灯和数据传输指示灯不亮;4、用户安装新网卡,新网卡无法使用。在第一种情况,局域网中,其中的一台电脑无法上网。网卡和数据指示灯一直亮着。检测过程中首先要关闭电脑防火墙,用“ping”命令与本机IP地址通信正常,“ping”本网段内的其他计算机IP不能够连通,“ping”网关的lP地址不能够连通,其他计算机之间可以ping通。查看“本地连接”属性中的数据发送情况只有发送而没有接收,于是我们怀疑RJ-45接头有问题。解决的方法是重新制作RJ-45接头并且连接,发现数据指示灯闪烁,再用“ping”命令重新测试其他计算机IP地址,返回信息正常。重新上网后正常。2、局域网出现时断时续的情况。我们分析首先检查集线器,发现集线器工作正常,但有一个端口中的双绞线的指示灯为橙色状态很不正常。拔下此端口网线后,局域网中各计算机的通信恢复正常。按照网线上编号找到网线所连接的电脑,用替换法将一台通信正常的计算机的网线连接到本计算机上,发现通信正常,说明本机的操作系统的网卡没有故障,首先排除了由于病毒和网卡原因造成的故障。再来检查网线,若网线出现问题,在一些以外的操作时导致双绞线的保护外皮受损,造成双绞线内部线芯绝缘层损坏而短路。解决的方法是更换新网线,重新连接电脑,网络故障排除。此外,在集线器连接的共享式以太网中,网络内任何一节点产生的问题,都有可能造成整个网络异常甚至瘫痪。这是由于集线器连接的局域网为共享式局域网,采用同CSMA/CD技术进行网络信息传输,所以当信息网络发生短路后,信号不能正常传输并而且错误信号,以至网段内充满错误信号,导致正常信号不能顺利传输,致使网络连接时断时续。3、开机后,网卡的指示灯和数据传输指示灯不亮。此故障主要是由于网卡和主板插槽接触不良造成的,如果主板插槽没有给网卡供电,网卡的电源指示灯就不会亮。解决方法是更换网卡插槽;用替换法以排除因网卡硬件故障而造成网络不正常。网卡是网络中的第一道关口,若网卡出现接触不良或硬件故障,则网络将无法连通。4、装上新网卡之后,网卡无法使用。导致此类原因的问题比较复杂,第一是网卡驱动程序错误。第二是网卡的物理损坏。第三是网卡配置冲突。网卡如果程序错误则应该在“设备管理器”中将原有不正确网络适配器卸载,选择正确的驱动程序进行安装。如果无法确定是网卡是否物理损坏,则使用网卡测试软件或通过替换法确认。在网卡正常工作时,要占用中断号和I/0地址范围等一些系统资源。如果这些配置与其他设备冲突,网卡就无法正常工作。当冲突时,检查“设备管理器”中的“网络适配器”,在相应网卡前图标有一个黄色标记“!”,将带有此标记的网络适配器删除,并且通过“添加/删除硬件”在系统中重新添加网卡。若多次添加网卡故障仍然存在,此时,应考虑网卡驱动程序是不是正确的。另外如果还是不能用,可用“ping”命令ping网卡自身的IP地址,如果返回的信息正常,应考虑网线是不是有问题、交换机工作是否正常等。

二、交换机故障和排查方法

在用户使用网络过程中,有用户反映城域网6808交换机出现部分网吧用户不能上网故障。部分专线用户不能上网,用disam连接设备的拨号用户上网正常。经现场测试,发现BH-6GTX2GBIC48FE的前24个百兆口能够正常通信,后24个百兆口上专线用户(在BIG6800上三层)的业务全不通,2层拨号用户(在BIG6800上为二层透传)正常。解决的方法为1、查阅FDB、ARP表项,看是否因为这些表项没有建立而导致的ASIC芯片内硬件表项没有设置转发表。2、查看CPU流控收报队列,以排除是否是在cpu流控中丢的。比如网络中某个端口大量存在ARP攻击时,CPU会将大量ARP丢弃,是不是由于此中丢弃导致了“合法”的ARP也被丢弃了,导致转发异常呢?需要查查看。3、查看CPU、内存等的信息,尤其是show int e X/X不能转发三层数据的端口统计,看是否在端口被丢弃。4、在BIG6800故障点的部分,连接Pc进行逐级PING测试。大包和小包都要兼顾。运用上面四步,查看网络交换机在工作中的故障。交换机就像是网络的道路。道路宽一些,网络的速度就会快一些。所以,当交换机出现问题时,应及时修复。避免,网络堵车。

三、门户网站访问失败故障和排查方法

生活中,我们在某一时段访问某些网站时会出现访问失败的现象,这让我们着急,同时也让运营商们苦恼。在我们电脑网络正常的情况下,那么问题应该会出在运营商。下面针对这种问题,我们依例分析。某运营商为3G用户提供访问的web portal系统,在每天业务高峰晚上十点半到十一点半都会接到大量客户投诉,网站访问不了!在故障时间段,服务器和各网络设备的进程、资源开销与平时比较并无异常;事后查各设备的日志,也找不到故障的原因。管理员一直尝试通过监控服务器和网络设备本身的状态、进程和日志的手段来解决,但是效果不是很好。于是,我们从另方面入手,借助网络协议分析工具,能够从网络的角度分析到应用信息,实现web portal系统端到端的性能监控,分析webportal系统在故障时间段与平时相比有何异常,最终找到有问题设备的节点。首先基本流量分析。在流量与平时相比并无异常的情况下,可以排除网络异常的情况。然后运用TCP进行分析,通过TCP统计信息我们发现:在故障时间段,假如总共有135个用户访问了该web服务器,建立的TCP连接数为5235个,而可疑的是有2213次是通过TCP复位发送(RST)来结束连接,而不是通过正常的4次握手来结束连接的。我们再次利用三次握手分析网络延迟的原因。通过成功连接的分析和失败时延连接的对比。我们可以通过时延的判定,可以确认出口路由器就是导致本次故障的根源。Web portal管理员将分析结果提交给出口路由器得厂家支持人员,厂家支持人员很快发现这是路由器的bug,最后通过升级路由器解决问题。通过网络协议分析工具,用“旁观”的方式,从网络角度对业务应用进行端到端的分析,能更快速和有效的定位到问题。

结束语:

网络的日益强大,为我们带来了方便,也为我们带来了新的挑战。掌握一些新的网络故障排除方法,可以有效的节约我们的时间,提高我们的工作效率。

参考文献:

[1]毛洪涛.基于事件的网络管理系统的研究与设计[D]

北京林业大学2007

[2]刘康平,朱海萍,李增智.告警关联与故障诊断专家系统研究与实现[J].计算机工程2002-6

[3]党光浅析几种典型网络故障排查方法[J].实验室科学2009-1

上一篇:浅析矿山地质环境调查与恢复治理措施 下一篇:信步阅读课堂 探寻有效策略