今天有朋友給我來信息咨詢,他們公司用的光纖收發器經常會出現死機是什么問題,是光纖收發器壞了嗎?還是怎么了。本文將就死機的情況詳細分析原因;希望能幫助你們判斷故障原因。
用光纖收發器可以將Ethernet的傳輸距離延伸到100公里以上,但是在長距離的傳輸過程中由于誤碼的原因,可能導致以太網交換機設備的“死機”。
在對某型號光纖收發器的系統設計中,針對這一問題,根據我們對故障原因的分析及理解,提出一套解決方案可以最大限度地減少交換機“死機”現象。
一、故障原因分析:
數據傳輸過程及差錯控制點。
A點的有效數據發出后,在路途中的兩個光纖收發器中不作差錯校驗,只有數據幀到達B點的交換核心時才做差錯校驗,將錯誤幀丟棄,而正確幀進入
BUFFER,等待轉發。但是,所有的差錯校驗過程都是一個程序控制過程,當某些特定的錯誤幀進入時,無論是幀長度檢測還是CRC檢驗都不能查出錯誤,這種幀也被認為是正確幀進入BUFFER,但這類幀永遠無法轉發出去,進而在BUFFER中造成堆積,當BUFFER的占用量大到一定程度時,導致交換機無法繼續運行。
二、某型號的解決方案:
判斷BUFFER中的數據堆積是由于交通捅塞造成的、錯誤幀造成的,還是其它原因造成的,因此對于一個復雜系統無法用簡單的手段處理。但是,對于光纖收發器因為它只有兩個端口,如果可以實現交換機的上述檢測功能,又出現了BUFFER堆積的問題時,我們可以簡單了判斷為光纖收發器的狀態不正常,因而可以將它Reset。
針對這一理解,解決方案就是在某型號系列光纖收發器中內置以太網交換核心及一個大BUFFER,使其具有差錯校驗功能(當然,這樣設計還具有其它的功能,在此不多述),同時在系統的設計中加入自動Reset功能,當系統判定自身進入嚴重故障狀態時,自動進行Reset,從而最大限度地避免上位系統的故障可能。
某型號完成數據鏈路層的全部功能,對數據做幀級的差錯校驗及處理,同時某型號具有2KMAC地址表,只有當一個數據幀具有確實存在的MAC地址,可以正確轉發時,才將該幀發出,否則只能堆積在自身的BUFFER中,如果收發器也出現BUFFER大量堆積時,它認為自身狀態嚴重故障,實施Reset動作,清除所有BUFFER中的數據,這樣導致的結果是部分傳輸的數據丟失,但可以避免網絡設備“死機"。
在使用某型號的系統環境中,只有當段的雙絞線出現大量誤碼時,才可能導致交換機B的“死機”現象,而由光路上來的誤碼已由某型號處理,有效地提高交換機的端口及整機交換效率,降低“死機”的風險。