網(wǎng)絡(luò)丟包故障處理方案
一、網(wǎng)絡(luò)丟包的定位與處理
出現(xiàn)網(wǎng)絡(luò)丟包現(xiàn)象時(shí),第一步需要確定丟包的網(wǎng)絡(luò)位置,其次是確定丟包的故障原因,然后依據(jù)定位的故障原因再進(jìn)行解決。定位流程大致如圖8-1。
圖8-1 網(wǎng)絡(luò)丟包的定位與處理
本文采用某園區(qū)的丟包故障現(xiàn)象為例,給出部署了交換機(jī)的網(wǎng)絡(luò)發(fā)生丟包的定位與處理方法。
例如,某園區(qū)部署的網(wǎng)絡(luò)如圖8-2上連接用戶A、用戶B和用戶C上連接入交換機(jī)Switch_3和Switch_2,用戶D和用戶E上連接入交換機(jī)Switch_4,之后共同接入到核心交換機(jī)Switch_1,并通過防火墻連接到Internet。
圖8-2 某園區(qū)部署網(wǎng)絡(luò)組網(wǎng)圖
用戶A反饋上網(wǎng)很慢,有時(shí)甚至打不開網(wǎng)頁,而其他用戶沒有異常反饋。此時(shí)在用戶A的PC上直接Ping公網(wǎng)地址有丟包。
二、確認(rèn)發(fā)生網(wǎng)絡(luò)丟包
網(wǎng)絡(luò)丟包的故障現(xiàn)象通常表現(xiàn)為:
用戶上網(wǎng)時(shí):
- 網(wǎng)絡(luò)速度不穩(wěn)定,打開網(wǎng)頁的速度特別的慢,有時(shí)候還會出現(xiàn)網(wǎng)頁部分內(nèi)容或是整個(gè)頁面無法顯示的問題;
- 觀看視頻業(yè)務(wù)時(shí)有馬賽克或花屏等卡頓現(xiàn)象;
- QQ等即時(shí)通訊工具等頻繁掉線或提示登錄超時(shí);
- 下載文件速度慢;
交換機(jī)工作時(shí):
- 在交換機(jī)上執(zhí)行Ping操作,對網(wǎng)絡(luò)進(jìn)行連通性測試,提示超時(shí);
- 端口無法正常轉(zhuǎn)發(fā)數(shù)據(jù);
- 管理用戶登錄交換機(jī),提示超時(shí);
- 業(yè)務(wù)經(jīng)常中斷;
這些故障現(xiàn)象幾乎都跟網(wǎng)絡(luò)丟包有關(guān)。如果現(xiàn)網(wǎng)當(dāng)中出現(xiàn)以上故障現(xiàn)象中的一種或多種,基本可以確認(rèn)發(fā)生了網(wǎng)絡(luò)丟包。
三、排查產(chǎn)生丟包現(xiàn)象的PC
排查產(chǎn)生丟包現(xiàn)象的PC本身問題。
如PC的網(wǎng)卡是否正常、PC連接設(shè)備的線纜是否正常都有可能造成設(shè)備丟包。解決方法:斷開網(wǎng)絡(luò)后給PC查殺病毒、檢查網(wǎng)線重裝操作系統(tǒng)、檢查網(wǎng)卡等。
確認(rèn)PC正常后,如果故障仍然存在,繼續(xù)執(zhí)行下一步。
四、檢查接口物理狀態(tài)是否為Down
一般來說,接口的物理狀態(tài)Down,或接口雙工模式或速率協(xié)商模式與對端不一致,會造成接口的狀態(tài)異常。在設(shè)備上執(zhí)行:
display interface interface-type interface-number命令查看接口運(yùn)行狀態(tài)是否正常。
這里以檢查Switch_3的GE1/0/2為例。
<HUAWEI> display interface gigabitethernet 1/0/2
GigabitEthernet1/0/2 current state : DOWN //接口當(dāng)前物理狀態(tài)
Line protocol current state : DOWN
Description:
Switch Port, Link-type : access(negotiated),
PVID : 1, TPID : 8100(Hex), The Maximum Frame Length is 9216
IP Sending Frames' Format is PKTFMT_ETHNT_2, Hardware address is 000b-0974-a475
Last physical up time : 2016-08-10 21:09:51 Last physical down time : 2013-08-10 21:10:51
Current system time: 2016-08-10 21:15:06
Port Mode: COMMON FIBER //接口工作模式。COMMON COPPER表示此接口為電接口;COMMON FIBER表示此接口為光接口
Speed : 1000, Loopback: NONE //接口速率、環(huán)回狀態(tài),鏈路兩端需要保持一致
Duplex: FULL, Negotiation: ENABLE //接口雙工模式及自協(xié)商狀態(tài),鏈路兩端需要保持一致
---- More ----
- 輸出信息顯示“current state : UP”,表明接口的運(yùn)行狀態(tài)正常。請?zhí)^本節(jié),參考下一節(jié)進(jìn)行定位與處理。
- 輸出信息顯示“current state : Administratively down”,表示接口被人為Shutdown。
請?jiān)谙到y(tǒng)視圖下執(zhí)行interface interface-type interface-number進(jìn)入故障接口視圖,然后執(zhí)行display this命令查看接口是否執(zhí)行了shutdown操作,如果是請?jiān)诮涌谙聢?zhí)行undo shutdown命令。
- 輸出信息顯示“current state : DOWN”,則需要查看接口的協(xié)商狀態(tài)、速率、雙工模式以及網(wǎng)線適應(yīng)方式是否鏈路兩端保持一致。分別在鏈路兩端的設(shè)備執(zhí)行display interface命令查看以上信息,如表8-1所示。
表8-1 檢查鏈路兩端的設(shè)備接口雙工、速率、協(xié)商模式
輸出信息顯示“current state : ERROR DOWN (down-cause)”,表示接口由于錯(cuò)誤事件而被Shutdown,需要根據(jù)down-cause具體字段信息排查故障。
五、檢查接口入方向是否存在CRC校驗(yàn)錯(cuò)誤
檢查報(bào)文經(jīng)過的物理端口是否存在CRC校驗(yàn)錯(cuò)誤,且錯(cuò)誤計(jì)數(shù)是否在不斷增長。如果輸出信息顯示字段“CRC”有計(jì)數(shù),且重復(fù)執(zhí)行命令發(fā)現(xiàn)計(jì)數(shù)在不斷增長,說明端口接收到了CRC錯(cuò)誤報(bào)文,即存在CRC校驗(yàn)錯(cuò)誤,說明是由于物理鏈路或者設(shè)備問題導(dǎo)致的錯(cuò)包 。
六、檢查接口出方向是否存在Discard計(jì)數(shù)
檢查端口是否存在Discard丟包計(jì)數(shù)。
在任意視圖執(zhí)行命令display interface interface-type interface-number,或在接口視圖執(zhí)行命令display this interface,查看設(shè)備連接用戶側(cè)端口出方向報(bào)文計(jì)數(shù),存在Discard丟包計(jì)數(shù)則說明端口曾經(jīng)存在擁塞。在業(yè)務(wù)受到影響時(shí),觀察該Discard是否增加。如果不增加,則業(yè)務(wù)影響與Discard丟包無關(guān)。
七、檢查是否存在環(huán)路
這是最容易造成丟包現(xiàn)象的因素,并且具有比較強(qiáng)的隱蔽性,例如在較大型的網(wǎng)絡(luò)環(huán)境中,管理員很容易把交換機(jī)之間的端口連接錯(cuò)誤,從而引起網(wǎng)絡(luò)環(huán)路,導(dǎo)致丟包。觀察是否出現(xiàn)如下環(huán)路相關(guān)的現(xiàn)象。網(wǎng)絡(luò)出現(xiàn)環(huán)路后,除了產(chǎn)生丟包現(xiàn)象,一般還有如下現(xiàn)象產(chǎn)生:
- 執(zhí)行display interface brief | include up命令,查看所有Up接口下的流量,存在環(huán)路的接口上InUti和OutUti兩個(gè)計(jì)數(shù)會逐步增加,甚至接近100%,遠(yuǎn)遠(yuǎn)超過業(yè)務(wù)流量。
- 使用display interface命令查看該接口統(tǒng)計(jì)信息時(shí),發(fā)現(xiàn)接口收到大量廣播報(bào)文。
- 設(shè)備上發(fā)生環(huán)路的VLAN的接口指示燈頻繁閃爍。
- 設(shè)備CPU占用率超過80%