基于LCS算法的管道內檢測數據對齊及應用
來源:《管道保護》2023年第2期 作者:段明偉 劉志軍 王沂沛 畢禎哲 欒奕 高雨晴 張磊 藺文楠 時間:2023-4-25 閱讀:
段明偉 劉志軍 王沂沛 畢禎哲 欒奕 高雨晴 張磊 藺文楠
國家管網集團北方管道沈陽檢測技術分公司
摘要:為高效準確對比分析兩次管道內檢測數據,基于最長公共子串(LCS)算法,研究明確了數據對齊流程。將該數據對齊方法應用于實際案例,結果發現:管道閥門、三通、法蘭對齊比例達到100%,環焊縫對齊比例達99%以上,金屬損失類缺陷對齊比例達80%以上。對于存在改線換管的管道,該方法能實現準確識別并跳過改線區域,以避免數據誤對齊。通過引入缺陷“簇”概念,提高了數據對齊中一對多、多對一、多對多的準確性。
關鍵詞:管道內檢測;數據對齊;LCS算法;缺陷“簇”
國家市場監管總局要求長輸管道定期檢驗中優先使用內檢測技術。隨著超高清漏磁內檢測器的推廣應用,每百公里長輸管道產生的內檢測數據達到十萬條以上,海量內檢測數據深度對比分析變得越來越復雜,不同檢測運營商采用各種內檢測器對同一條管道開展多次內檢測更加劇這種情況。建立可靠的模型算法進行內檢測數據對齊分析,及時預測和發現管道腐蝕風險,對管道安全運行具有重要意義。
1 數據對比技術現狀和提升途徑
1.1 技術現狀
國外油氣管道內檢測數據對比技術發展較早,主要內檢測運營商均開展了油氣管道內檢測數據對比研究。一些學者通過應用回歸樹算法和內檢測比對分析軟件,研究了腐蝕缺陷的生長模型[1];有人以內檢測數據自動對齊來代替人工對齊的方法,用于標識未能對齊的異常點和分析腐蝕增長情況[2]。
國內學者通過研究球閥、彎頭、焊縫與基線對齊方法以及缺陷對齊算法,將對齊結果與基線偏差精確到0.01 m[3];通過計算兩次內檢測數據分布的KL散度,利用Pearson相似系數獲得兩次內檢測數據對齊結果的評價系數曲線,證明了對齊算法模型的可行性[4]。
1.2 提升途徑
(1)通過標準化內檢測特征數據庫,識別具備更多細節的管道組件,包括較短節、閥門、法蘭等附近比較復雜的環焊縫,將管道劃分成更多細小管段,從根本上提升對齊比例。
(2)LCS(Longest Common Subsequences,最長公共子串)算法是將兩個給定字符串分別刪去零個或多個字符,但不改變剩余字符的順序后得到的長度最長的相同字符序列;谠撍惴,實現管段拆分方案的最優化,提升數據對齊的性能和準確性。
(3)通過試錯法識別改線換管的管段,跳過該管段以避免數據誤對齊。
(4)引入缺陷“簇”的概念,對于缺陷對齊中的一對多、多對一、多對多等復雜情況,提高其準確性和可靠性。
2 數據對齊算法
通過對不同內檢測數據進行標準化清洗處理,建立統一標準化的內檢測特征數據庫。特征數據庫中的特征點包括閥門、三通、環焊縫、彎頭、法蘭、金屬損失等。將特征點分為三類,一類特征點包括閥門、三通;二類特征點為管節劃分組件,包括環焊縫、彎頭、法蘭;三類特征點包括除一類、二類外的其他特征點。
2.1 一類特征對齊
根據標準化內檢測特征數據庫,分別識別兩組內檢測數據中的一類特征點,根據里程分布將兩組數據中相同的一類特征點對齊,將對齊的一類特征點設置為錨點,基于錨點將管道劃分多個管段,并定義為一級管段。
2.2 二類特征對齊
根據標準化內檢測特征數據庫,識別一級管段中的二類特征點,采用管節拆分算法,對兩組內檢測數據中上述二類特征點進行對齊,管段拆分算法步驟如下:
(1)基于LCS算法,查找兩組內檢測數據中對齊的兩個一級管段的序列中最長公共子序列,將兩組內檢測數據按照檢測時間分別定義為基準數據和對齊數據,最長公共子序列存在于基準數據中的序列(x0,x1,x2....xi)和對齊數據中的序列(y0,y1,y2....yj)中,最長公共子序列的長度C[i,j]為:
(2)對找到的最長公共子序列中所包括的二類特征點逐個對齊,使用里程偏差閾值函數計算對齊數據二類特征點的里程估值范圍 t:
t = k(M1±△m) (2)
式中:k為基準數據和對齊數據中二類特征點所在一級管段的長度比;M1為基準數據二類特征點距上游已對齊一級特征點或二類特征點的距離;Δm為基準數據二類特征點的里程偏差范圍。
(3)如果對齊數據二類特征點距上游已匹配特征點的距離M2∈t,則認為該二類特征點對齊成功,將該對齊二類特征點作為最新的節點數據,導入里程偏差閾值函數進行更新訓練;若未對齊,則在里程估值范圍內,找出兩組內檢測數據中最接近k×M1的相同類型的二類特征點,將該點作為最新的節點數據,導入里程偏差閾值計算函數,進行更新訓練。通過以上方法將對齊的二類特征點設置為錨點,將各個一級管段劃分為多個細小二級管段。
2.3 三類特征對齊
(1)對當前二級管段內的缺陷進行“簇”劃分(集群劃分),有兩種劃分方法。一種是相鄰缺陷邊界間距小于3倍壁厚,另一種是相鄰缺陷邊界軸向間距小于兩缺陷中最小長度且周向間距小于兩缺陷中最小寬度。
(2)以劃分的二級管段為單位,對二級管段內剩余的特征點及缺陷依次進行對齊處理,特征點對齊重復二類特征對齊中的方法,并設置角度閾值,缺陷對齊采用“簇”劃分方法進行對齊。
3 應用示例
某長輸管道全長193 km,2013年和2021年分別進行兩次漏磁內檢測,期間實施2次改線換管。采用提升后的對齊算法和對齊分析軟件對兩次內檢測結果進行數據對齊。
3.1 管道特征對齊結果
管道特征對齊結果如表 1所示。從表 1中可以看出,本文提出的對齊算法對不同內檢測商檢測的數據對齊比例很高,閥門、三通、法蘭都達到100%,比例最低的環焊縫達到99.35%。環焊縫未對齊的原因是管道改線增加閥門、三通數量,不同內檢測商對閥門、法蘭、彎頭區域環焊縫標記方式不同所致。
表 1 兩次內檢測管道特征對齊結果
3.2 缺陷對齊結果
兩次內檢測缺陷對齊結果如表 2所示。從表 2中可以看出,缺陷對齊比例較特征對齊比例有所降低,金屬損失類缺陷對齊比例為84.21%。兩次內檢測缺陷報告的數量、內外部類型相差較大,尤其是環焊縫異常數量變化明顯。主要原因包括:內檢測器識別模型能力不同、內檢測器精度不同、管道改線換管影響。此外,為處理管道小范圍內金屬損失集群的復雜情況,引入缺陷“簇”的概念,在對齊的26610個金屬損失缺陷中,發現對齊的金屬損失缺陷“簇”1819組。
表 2 兩次內檢測缺陷對齊結果
3.3 應用效果
基于LCS算法,對于管道特征對齊,兩次內檢測數據對齊可實現閥門、三通、法蘭對齊比例100%,管道環焊縫對齊比例99%以上。對于管道缺陷,因內檢測器識別能力、檢測精度差異,受管道運營條件變化導致的缺陷增長以及管道改線換管等因素的影響,管道缺陷對齊比例較特征對齊比例有所下降,但金屬損失類缺陷的對齊比例仍可達到80%以上。
4 結論
(1)本文研究建立的內檢測數據對齊算法應用于實際管道,高效、準確地實現了管道特征和缺陷的對齊,可為有效預測管道腐蝕增長變化以及管道檢驗評價提供數據支撐。
(2)數據對齊過程中,引入缺陷“簇”概念,提高了數據對齊中一對多、多對一、多對多的準確性,增加了識別和分析管道面積形缺陷成因的效率。但面臨大面積復雜的缺陷“簇”時,數據對齊效果有所下降,可采用人工干預的方法提高數據對齊算法的準確性。
(3)不同檢測運營商內檢測器的識別能力、精度、置信度等參數會直接影響內檢測數據的質量,也會對多次內檢測數據對齊結果產生影響,影響程度的關系有待進一步研究。
參考文獻:
[1]GU B, KANIA R, SHARMA S, GAO M. Approach to assessment of corrosion growth in pipelines[C]. Calgary: 2002 4th International Pipeline Conference, 2002:1837-1847.
[2]DAN M R, DANN C. Automated matching of pipeline corrosion feature from in-line inspection date[J]. Reliability Engineering & System Safety, 2017, 162:40-50.
[3]楊賀,劉新凌,李強,等. 油氣管道多輪內檢測數據對齊算法研究及應用[J]. 管道技術與設備,2020(1):21-24,28.
[4]孫鵬,謝裕喜,張勇,等. 管道內檢測數據對齊方法與應用[J].油氣儲運,2021,40(2):151-156.
作者簡介:段明偉,1987年生,工程師,碩士研究生畢業于河北大學應用化學專業,現從事檢驗檢測與評價工作。聯系方式:13998832692,duanmw@pipechina.com.cn。
上篇:
下篇: