網路風暴

由於網卡損壞等問題導致的癱瘓

由於網路拓撲的設計和連接問題,或其他原因導致廣播在網段內大量複製,傳播數據幀,導致網路性能下降,甚至網路癱瘓。這就是網路風暴。

簡介


一個數據幀或包被傳輸到本地網段(由廣播域定義)上的每個節點就是廣播;由於網路拓撲的設計和連接問題,或其他原因導致廣播在網段內大量複製,傳播數據幀,導致網路性能下降,甚至網路癱瘓。這就是廣播風暴

原因


網路設備原因
我們經常會有這樣一個誤解:交換機是點對點轉發,不會產生廣播風暴。其實,在我們購買網路設備時,購買的交換機通常是智能型的集線器(Hub),卻被奸商當做交換機來賣。這樣,在網路稍微繁忙的時候,肯定會產生廣播風暴了。
網卡損壞
如果網路機器的網卡損壞,也同樣會產生廣播風暴。損壞的網卡不停向交換機發送大量的數據包,就會產生大量無用的數據包,最終導致廣播風暴。由於網卡物理損壞引起的廣播風暴比較難排除,並且損壞的網卡一般還能上網,我們一般借用Sniffer區域網管理軟體,查看網路數據流量,來判斷故障點的位置。
網路環路
曾經在一次網路故障排除中,發現一個很可笑的錯誤:一條雙絞線的兩端插在同一個交換機的不同埠上,導致了網路性能驟然下降,打開網頁都非常困難。這種故障,就是典型的網路環路。網路環路的產生,一般是由一條物理網路線路的兩端同時接在了一台網路設備中所致。不過,現今的交換機(不是HUB)一般都帶有環路檢測功能。
一些比較流行的網路病毒,如Funlove、震蕩波、RPC等病毒,一旦有機器中毒后,它們便會立即通過網路進行傳播。網路病毒的傳播,就會佔據大量的網路帶寬,引起網路堵塞,進而引起廣播風暴。
黑客軟體的使用
一些上網者經常利用網路執法官、網路剪刀手等黑客軟體,對網吧的內部網路進行攻擊,這些軟體的使用,也可能產生廣播風暴。

預防


(以CISCO catalyst switch為例)
1、首先使用網管分析你網路的baseline,這樣可以明確你的網路當中正常情況下的廣播包比例是多少。
2、絕大多數交換機都支持廣播風暴抑制特性,配置了這個特性以後,你可以控制每個埠的廣播包維持在特定的比例之下,這樣可以保留帶寬給必須的應用。
配置:(以CISCO catalyst switch為例)
Int XX
storm-control broadcast level 20.00
switch#sh storm
Interface Filter State Level Current
Fa1/0/1 Forwarding 20.00% 0.00%
3、針對預設STP配置無法排除的網路環路問題,利用STP的BPDUguard特性來預防廣播風暴。此種環路情況示意圖如下:
switch——hub(portA——portB)
Switch啟用了STP,而hub則被人有意無意的用一根網線聯起來,導致引起了環路。SWITCH的埠不會收到其他交換機或本交換機其他埠的 BPDU,不會觸發該埠的STP決策過程,也就不可能blocking該埠,這樣就會引起廣播風暴。我們可以利用CISCO STP的BPDUguard特性來預防這一點。
int xxx
spanning-tree bpduguard enable
值得注意的是bpduguard可以在全局下配置,也可以在每埠的基礎上配置。如果在全局下配置,則只對配置了portfast的埠起作用,如果在埠下配置,則不用配置portfast。

排障


(以CISCO catalyst switch為例)
如果網路中已經產生了網路風暴(現象通常為網路丟包、響應遲緩、時斷時通等),則可以利用如下的方法來排障
1、首先確認是否是網路風暴或其他異常流量引起的網路異常,在核心交換機
如果交換機的CPU利用率較高,且大部分的資源都被“IP Input”進程佔用,則基本可以確定網路中有大流量的數據
2、查找異常流量是從交換機的那一個埠來的:
switch #sh int | i protocol|rate|broadcasts
FastEthernet1/0/1 is up, line protocol is up (connected)
Queueing strategy: fifo
5 minute input rate 0 bits/sec, 0 packets/sec
5 minute output rate 2000 bits/sec, 3 packets/sec
Received 241676 broadcasts (0 multicast)
如果找到一個埠的input rate非常高,且接收到的廣播包也非常多,則基本可以找到來源,如果該埠下聯的也是可管理的交換機,則再次執行此過程,直到找到一個連接PC或者HUB的埠
3、shutdown該埠
int xx
shutdown
4、查找產生異常流量的根源
如果是HUB環路,則拆掉環;如果是病毒,則做殺毒處理;如果是網卡異常,則更換網卡。此部分不詳述。
5、確認交換機的CEF功能是否啟用,如果沒有,則需要啟用,可以加速流量的轉發
配置CEF: switch〉sh ip cef
全局模式下輸入
ip cef