4月份的時候處理過一個緊急case,某生產(chǎn)線采用了西門子的s7-400以及profibus總線控制系統(tǒng)。該生產(chǎn)線試運行將近3個月,某天突然出現(xiàn)通訊中斷的問題,導致生產(chǎn)線停車。現(xiàn)場調(diào)試人員做了各種檢查,包括更換dp插頭、在線槽內(nèi)加隔板等等,但總是工作一段時間后就再次出現(xiàn)丟站的情況。
在現(xiàn)場,我們了解到,該系統(tǒng)的dp通信共兩路,其中網(wǎng)絡1連接的都是閥島,該路網(wǎng)絡并沒有出現(xiàn)故障;網(wǎng)絡2連接的是et200m(io)以及稱重儀表,該路網(wǎng)絡出現(xiàn)故障(圖1)。
圖1 網(wǎng)絡組態(tài)
從現(xiàn)場故障記錄可以看到,dp網(wǎng)絡頻繁中斷,現(xiàn)場工程師已經(jīng)對網(wǎng)線進行了檢測、隔離等處理,有些網(wǎng)段則重新布線。另外,在出問題的網(wǎng)絡2中,又增加了一個rs485中繼器,但問題依然沒有解決,因此現(xiàn)場調(diào)試工程師懷疑是emc干擾導致通信出現(xiàn)問題。
為了確定問題的原因,到了現(xiàn)場,按照事先的計劃安排,我們開始對網(wǎng)絡拓撲進行檢查。
首先檢查網(wǎng)絡拓撲和布線?,F(xiàn)場網(wǎng)絡共兩條,每條網(wǎng)絡上都只有20多個站點,并沒有超出連接站點數(shù)的限制。波特率的設(shè)置為500kpbs,通信電纜的長度在400米以內(nèi),滿足profibus網(wǎng)線通信距離的要求。但在通訊出現(xiàn)中斷后,現(xiàn)場在網(wǎng)絡2的中間位置增加了一個rs485中繼器。接下來,我們對現(xiàn)場的實際布線及接線情況進行了檢測。
由于現(xiàn)場已經(jīng)對網(wǎng)絡進行過排查,因此重點懷疑的有三段網(wǎng)線,該三段網(wǎng)線均在線槽內(nèi)與動力電纜混在一起平行走線, 并且發(fā)現(xiàn)了其中有一根網(wǎng)線存住破損的情況,而該破損的網(wǎng)線很有可能是導致通信出現(xiàn)問題的原因,因此我們再次重點檢查了該網(wǎng)線。
我們再次對破損的電纜進行檢查,一開始僅僅看到外皮和屏蔽層都被割破了(圖2)。
圖2 網(wǎng)線外皮有破損
但隨著我們繼續(xù)將外皮撥開,發(fā)現(xiàn)實際上紅色的數(shù)據(jù)電纜的外皮已經(jīng)被割破(圖3),隨時可能與屏蔽層接觸到,而一旦接觸,將導致通信線與屏蔽層發(fā)生短路故障,dp通信就會出現(xiàn)問題。
圖3 數(shù)據(jù)線已經(jīng)破損,將導致短路故障
根據(jù)現(xiàn)場工程師的分析,應該是由于之前所敷設(shè)的dp電纜由于長度問題,與金屬管口接觸較為緊密,而原的金屬管口也沒有保護墊圈,隨著設(shè)備的震動,管口將dp電纜割破,導致通信出現(xiàn)問題。
于是現(xiàn)場將該電纜重新敷設(shè),長度加長,保證dp電纜與管口不會接觸,并且在管口加了膠皮墊圈,保證金屬管口不再將電纜割斷。而經(jīng)過處理后,通信已經(jīng)恢復正常,并且運行了一段時間都沒有出現(xiàn)問題,因此應該說該問題是導致通信中斷的主要原因(圖4)。
圖4 dp網(wǎng)線重新放線,金屬管道口做了處理
現(xiàn)場在做了電纜處理后,正常工作了大概兩天,但之后又出現(xiàn)過問題,因此網(wǎng)絡中應該還存在其他隱患,于是我們對其余網(wǎng)段都進行了檢查。
首先,由于電柜內(nèi)加裝了一個中繼器,但在中繼器的接線上,我們發(fā)現(xiàn)從主站方向來的dp線接到了rs485中繼器的下端口,而一般情況下,rs485中繼器都要求將dp主站方向來的電纜連接在上端口,因此我們將中繼器的接線進行了整改,將主站方向來的dp線接到了中繼器的上端口(圖5)。
圖5 中繼器的接線方向做了調(diào)整
除了檢查布線,我們又檢查了dp通信的波形。因為通過波形,是可以發(fā)現(xiàn)網(wǎng)線上的干擾信號的。
我們分別在dp主站、中繼器以及終端的站點上分別對波形進行了檢測。從波形上看,物理層上并沒有發(fā)現(xiàn)emc干擾信號。
由于停機時間到,我們大概在晚上19點30分結(jié)束了檢查,現(xiàn)場開始恢復生產(chǎn)。但大概在10點鐘左右,我們接到電話,現(xiàn)場再次出現(xiàn)停機故障。
于是我們再次回到現(xiàn)場。當我們到達現(xiàn)場后,現(xiàn)場維護人員已經(jīng)將故障恢復,但系統(tǒng)運行了幾分鐘后,通信再次中斷。通過在線診斷信息,可以看到,有從站丟失,而這些丟失的從站都位于中繼器之前。
圖6 丟失的從站都是rs485中繼器之前的
由于現(xiàn)場需要立刻恢復生產(chǎn),而根據(jù)之前的對現(xiàn)場布線的檢查,大家決定將從最后一個稱重儀表到中繼器之間的一段dp電纜用臨時電纜替換,因為該電纜本身經(jīng)過了一段線槽,而之前大家曾經(jīng)認為該段電纜在線槽內(nèi)與動力電纜一起布線,容易受到干擾。
更換了該電纜后,通信恢復,系統(tǒng)也恢復正?!,F(xiàn)場隨及恢復生產(chǎn)。因此,大家初步懷疑是該段電纜也存在類似第一段電纜一樣的破損或者是受到線槽內(nèi)動力電纜的干擾所至。
此時,為了確保通信的正常,我們也對dp信號再次進行了檢測。但為了不影響生產(chǎn),僅僅對更換電纜后的中繼器上的信號進行了檢測(圖7)。
圖7 更換新的電纜后,中繼器上檢測到的波形
從波形圖上看,似乎也沒有發(fā)現(xiàn)有什么問題。于是,當天的檢查工作全部結(jié)束,現(xiàn)場開始生產(chǎn),我們只能第二天再進行檢測。
第二天,當我們再次檢查波形的時候,突然發(fā)現(xiàn)昨天的正常的波形變得不規(guī)則了(圖8)。
圖8 cpu集成dp口的波形
將波形放大(圖9),可以看出,本次檢測得到的波形和正常的波形(如圖7)不一樣,上面有明顯的反射,而這也和頭天晚上檢測到的波形(圖8)不同。
這個波形讓我覺得很奇怪,出現(xiàn)這樣的波形表示物理線路上有斷點,有可能是斷線或者有虛接的插頭;也有可能是某dp接口模板有問題,但昨天檢查為什么是正常的呢?
圖9 波形上有反射
根據(jù)波形參數(shù),我們判斷該反射點應該在距離主站最近的一個遠端從站,于是我們又檢測了該從站處的波形,發(fā)現(xiàn)該處的波形更差(圖10)。
圖10 距離主站最近的從站處的波形
在該從站檢測到的信號波形上,可以看到,該從站自身發(fā)出的波形沒有問題,但主站波形出現(xiàn)了較為嚴重的畸變。
而當我將該從站的終端電阻設(shè)置為“on”時,信號即恢復正常,這就意味著,導致主站信號在傳輸過程中出現(xiàn)問題的,應該不是該從站。
于是我對每個從站都進行了波形的檢測,最終查到,導致波形發(fā)生畸變的正是之前在線路上增加的rs485中繼器!
于是我們將該中繼器取消,再次測量波形,發(fā)現(xiàn)波形恢復正常(圖11)。
圖11 將中繼器去掉后,檢測到的主站波形
通過這個現(xiàn)場出現(xiàn)的問題,我們看到,現(xiàn)場檢查需要對每個細節(jié)都仔細的檢查,不能按照思維定式進行現(xiàn)場問題的處理,否則將有可能漏掉很重要的線索,導致問題解決的不徹底。希望這個現(xiàn)場故事能夠?qū)Υ蠹矣兴鶐椭?br>