今天有朋友給我來信息咨詢,他們公司用的光纖收發(fā)器經(jīng)常會出現(xiàn)死機是什么問題,是光纖收發(fā)器壞了嗎?還是怎么了。本文將就死機的情況詳細(xì)分析原因;希望能幫助你們判斷故障原因。
用光纖收發(fā)器可以將Ethernet的傳輸距離延伸到100公里以上,但是在長距離的傳輸過程中由于誤碼的原因,可能導(dǎo)致以太網(wǎng)交換機設(shè)備的“死機”。
在對某型號光纖收發(fā)器的系統(tǒng)設(shè)計中,針對這一問題,根據(jù)我們對故障原因的分析及理解,提出一套解決方案可以最大限度地減少交換機“死機”現(xiàn)象。
一、故障原因分析:
數(shù)據(jù)傳輸過程及差錯控制點。
A點的有效數(shù)據(jù)發(fā)出后,在路途中的兩個光纖收發(fā)器中不作差錯校驗,只有數(shù)據(jù)幀到達(dá)B點的交換核心時才做差錯校驗,將錯誤幀丟棄,而正確幀進(jìn)入
BUFFER,等待轉(zhuǎn)發(fā)。但是,所有的差錯校驗過程都是一個程序控制過程,當(dāng)某些特定的錯誤幀進(jìn)入時,無論是幀長度檢測還是CRC檢驗都不能查出錯誤,這種幀也被認(rèn)為是正確幀進(jìn)入BUFFER,但這類幀永遠(yuǎn)無法轉(zhuǎn)發(fā)出去,進(jìn)而在BUFFER中造成堆積,當(dāng)BUFFER的占用量大到一定程度時,導(dǎo)致交換機無法繼續(xù)運行。
二、某型號的解決方案:
判斷BUFFER中的數(shù)據(jù)堆積是由于交通捅塞造成的、錯誤幀造成的,還是其它原因造成的,因此對于一個復(fù)雜系統(tǒng)無法用簡單的手段處理。但是,對于光纖收發(fā)器因為它只有兩個端口,如果可以實現(xiàn)交換機的上述檢測功能,又出現(xiàn)了BUFFER堆積的問題時,我們可以簡單了判斷為光纖收發(fā)器的狀態(tài)不正常,因而可以將它Reset。
針對這一理解,解決方案就是在某型號系列光纖收發(fā)器中內(nèi)置以太網(wǎng)交換核心及一個大BUFFER,使其具有差錯校驗功能(當(dāng)然,這樣設(shè)計還具有其它的功能,在此不多述),同時在系統(tǒng)的設(shè)計中加入自動Reset功能,當(dāng)系統(tǒng)判定自身進(jìn)入嚴(yán)重故障狀態(tài)時,自動進(jìn)行Reset,從而最大限度地避免上位系統(tǒng)的故障可能。
某型號完成數(shù)據(jù)鏈路層的全部功能,對數(shù)據(jù)做幀級的差錯校驗及處理,同時某型號具有2KMAC地址表,只有當(dāng)一個數(shù)據(jù)幀具有確實存在的MAC地址,可以正確轉(zhuǎn)發(fā)時,才將該幀發(fā)出,否則只能堆積在自身的BUFFER中,如果收發(fā)器也出現(xiàn)BUFFER大量堆積時,它認(rèn)為自身狀態(tài)嚴(yán)重故障,實施Reset動作,清除所有BUFFER中的數(shù)據(jù),這樣導(dǎo)致的結(jié)果是部分傳輸?shù)臄?shù)據(jù)丟失,但可以避免網(wǎng)絡(luò)設(shè)備“死機"。
在使用某型號的系統(tǒng)環(huán)境中,只有當(dāng)段的雙絞線出現(xiàn)大量誤碼時,才可能導(dǎo)致交換機B的“死機”現(xiàn)象,而由光路上來的誤碼已由某型號處理,有效地提高交換機的端口及整機交換效率,降低“死機”的風(fēng)險。