禁要:由于受到胃部蠕動、氣泡、食物、光照以及圖像采集過程中攝像頭移動等因素影響,電子胃鏡圖像存在亮度變化較大等問題,常用的計算機輔助分析方法雄以取得理想的效果。針對該問題,在分析電子胃鏡圖像特點的基礎上,提出一種電子胃鏡圖像病灶良恐性識別方法。在不同顏色通道中使用結合局部二元模式算法,提取其紋理特征向量,分別輸入支持向量機進行訓練和識別,對不同顏色空間的識別結果采用投票原則確定最終結果。實驗結果表明,該方法的識別率達到92.2%。
1概述
胃癌是世界范圍內最常見的惡性腫瘤之一,據2000年資料統(tǒng)計,全球每年新發(fā)胃癌87萬例,占所有新發(fā)癌癥病例的9%,僅次于肺癌、乳腺癌和腸癌,居第4位。每年約有64萬人因胃癌死亡,居癌癥死因的第2位。就胃癌而言,早期胃癌術后的5年生存率可達95%~99%,而進展期病例的5年生存率卻不超過50%1-],因此及時發(fā)現(xiàn)早期胃癌對于提高胃癌的治療效果具有十分重要的意義。胃鏡檢測是發(fā)現(xiàn)早期胃癌的最直接方法,采用計算機輔助診斷方法,通過對胃鏡圖像的數學分析,為臨床診斷提供依據是目前早期胃癌診斷研究的一個方向1。圖1是上海交通大學附屬瑞金醫(yī)院消化內科在臨床診斷過程中所采集的部分病人電子胃鏡圖像。
其中,圖1(a)為早期腫瘤圖像,圖1(b~圖1(d)分別為常見的胃潰瘍、糜爛和疣狀胃炎對應圖像。從圖像中可以看到由于采集過程光照等因素影響,電子胃鏡圖像的亮度變化較大,同時,胃部氣泡和殘留食物的干擾嚴重影響到早期胃癌圖像的識別,要實現(xiàn)電子胃鏡病灶的良惡性識別,必須有一個可以避免胃部無用物質干擾同時能在不同亮度情況下均能取得良好效果的特征提取方法。
2電子胃鏡病灶良惡性識別
本文所采用的識別方法如圖2所示。
在分析電子胃鏡圖像特點的基礎上,本文提出基于局部二元模式(Local Binary Pattern,LBP)算法的電子胃鏡圖像良惡性病灶識別方法,提取電子胃鏡圖像在不同顏色通道的分量,并將其轉化為灰度圖像,采用LBP算法提取其統(tǒng)計特征作為紋理特征向量,分別采用SVM進行訓練和識別,對各通道識別的結果采取投票原則確定最終的識別結果。
2.1色彩空間融合
相比灰度圖像來說,彩色圖像能為臨床醫(yī)生的判斷提供更多的信息,電子胃鏡即為彩色圖像。然而LBP算法是基于灰度級別的算法,如果將彩色圖像轉化為單一灰度圖像處理,這必然會丟失很多重要信息。因此,本文采用色彩空間融合的方法,在R,GB色彩通道分別采用LBP算法提取胃鏡圖像紋理特征輸入SVM進行訓練與識別,對各通道的識別結果采用投票選擇的方法來確定彩色胃鏡圖像的識別結果。
2.2紋理分析方法
由于受胃部蠕動、氣泡、食物、光照以及胃鏡采集圖像過程中攝像頭移動等因素的影響和胃鏡圖像本身亮度變化較大等問題,常用的計算機輔助分析方法難以取得理想的效果15]。
圖像的紋理反映了圖像灰度模式的空間分布,包含圖像的表面信息及其圖像灰度和統(tǒng)計信息等,兼顧圖像的宏觀與微觀結構,胃鏡圖像的分析可以采用紋理特征分析來實現(xiàn),紋理分析主要有共生矩陣(6]、Markov 隨機場模型(1、Gabor小波變換1]等方法。共生矩陣方法考慮了像素間的相互關系。
不同距離產生不同的共生矩陣,對于給定距離,利用共生矩陣產生一系列紋理特征,需要大量的統(tǒng)計數據,在不同的灰度尺度和亮度情況下所取得的效果相差很大。Markov隨機場模型首先確定Markov隨機場模型的階數和模型的形式,然后確定它的參數,但參數的估計困難,運算量較大。Gabor小波變換引入了多尺度多分辨率的概念,在不同尺度上進行紋理分析,可以獲得不同紋理特征,增加了信息量。小波函數有較大的選擇范圍,但運算量也較大。
文獻[9]提出了基于LBP的一種紋理描述算子,具有能處理不同灰度尺度圖像、不受圖像旋轉等干擾優(yōu)點,近幾年被廣泛地應用于醫(yī)學圖像處理領域。
2.3局部二元模式
通過圖3和式(1)、式(2),可知LBP算法的運算機理。
其中,g。為中心像素值;g。為圓周上相應的取值。
圖3是N=8,R=1的情況。參數組(N,R)表示在以g為圓心、R為半徑的圓上取N個點的像素值用來計算LBP值,
8。對應的坐標為(ga+Rcos(2m/N),g。+Rsin(2m/N),ge和g。分別表示g.的橫坐標和縱坐標,在坐標不是整數的情況下,通過周圍領域的像素值進行雙線性插值求得該坐標的像素值。
圖4是不同參數組(N,R)對應的情況。
通過該算法,很容易得到一些紋理信息,圖5中從左至右分別代表暗點或平滑區(qū)域、邊緣和亮點,其LBPw)值分別為:00000000,11000011,11111111。
通過圖3可以直觀地看到,圖像旋轉后,其每個子塊的LBP值都會相應發(fā)生改變,從而影響其LBP描述,這為圖像的特征提取和分類造成很大麻煩。文獻[10]在文獻[9]工作的基礎上提出一種改進的方法,該方法通過求取各旋轉角度上的LBP最小值來獲取LBP算子的旋轉不變性,如式(3)所示:
其中,ROR(LBPNA),)表示將二進制數組LBPx.A)向右圓周平移i位。形象地說,式(3)表示將圖像子塊順時針旋轉,取其LBPvx)的最小值作為最終的LBP值。
由于LBP以某個像素為中心的圖像子塊作為計算對象來考慮,從式(1)可知LBP在運算時,只考慮圖像子塊中圓周像素g。與中心像素g。的差,并通過取值窗口(圖像子塊)在圖像上的平移來遍歷整幅圖像,取得圖像的LBP運算結果。因此對于不同亮度的圖像,尤其是亮度較弱的圖像處理,能取得良好的效果。而通過參數組(WN,R)的選取使得LBP適用于多灰度級、多尺度圖像的分析。
從式(3)可以看出,LBPAA)算子在保留LBP算子不受圖像亮度和分辨率變化影響的基礎上,通過圖像子塊的旋轉獲取最小二進制描述,從而具有不受圖像旋轉的優(yōu)點。胃鏡圖像的紋理特征提取最終要為學習機器提供最好的訓練和識別樣本,特征提取算法的選擇影響到學習及其最終識別精度。本文選取改進的LBP算法作為特征提取方法來避免圖像采集角度和光照強度帶來的影響。
2.4統(tǒng)計特征提取
灰度共生矩陣是最常用的統(tǒng)計紋理分析方法,但是該方法運算量大,在面對亮度變化較大的樣本識別時,準確率不高。灰度直方圖是描述圖像灰度值分布情況的一種方法,其橫坐標是灰度值,縱坐標是該灰度值出現(xiàn)的概率。設圖像灰值量化為L個灰度值,令i=0,1…,L-1,第i個灰度值的像素總數為N(i),而整幅圖像的像素總數為M,那么,灰級i出現(xiàn)的概率為
根據圖像的灰度直方圖,可得到一系列圖像統(tǒng)計特征:
(1)圖像的R階距
為了以最小運算代價來取得最高識別準確率,在本文方案中,電子胃鏡圖像在各顏色通道的分量經過LBP算法后,選取圖像均值、方差和嫡作為統(tǒng)計特征向量輸入支持向量機進行訓練和識別。
2.5支持向量機
支持向量機(Support Vector Machine,SVM)是由文獻[11]
提出的一種基于統(tǒng)計學習理論的機器學習方法。它通過結構風險最小化原則以及核函數方法,自動尋找那些對樣本有較好區(qū)分能力的支持向量,由此構造出的超平面可以最大化類間間隔,并且具有較好的推廣性和較高的分類準確率。因此,本文選用SVM作為分類工具來進行胃鏡圖像中的良惡性病變組織識別。
2.6投票原則
彩色圖像在RGB顏色通道中的值并不呈線性關系[2],在不同顏色通道中,分類器的識別性能有一定差別,因此,有必要采取方案對3個顏色通道的識別和訓練進行比較以確定最終彩色圖像的識別結果。投票原則是多通道、多分辨率和多分類器集成識別過程中較多使用的方法,其基本思想是通過投票的方式決定分類器輸出結果不一致時的模式類別。投票規(guī)則源于一種假設:群體的判斷優(yōu)于個體的判斷]。本文將R,GB3個顏色通道分別進行LBP運算、特征提取和訓練/識別,對3個顏色通道的識別結果采用“一人一票”的方法,以少數服從多數的原則確定彩色圖像的識別結果。
3實驗與分析
本文選用上海交通大學醫(yī)學院附屬瑞金醫(yī)院消化內科臨床胃鏡檢查所采集的電子胃鏡圖像。其中,訓練圖像含良性病變30例,早期胃癌35例,圖像分辨率為640×480,測試集合由隨機選取的50位病人電子胃鏡圖像組成,共200幅,分辨率為640×480,選用32×32的窗口截取子圖像樣本量作為樣本進行訓練和識別,共19500個訓練樣本,60000個測試樣本。所用計算機CPU為Pentium(R),主頻3.0GHz,內存1GB。
通過醫(yī)生瀏覽圖像,手動勾畫出惡性腫瘤區(qū)域,對于每個樣本,確定LBP算子的(W,R)參數組值為(8,1),分別對子圖像的R,GB顏色分量進行LBP運算后,將其均值、方差和嫡作為紋理特征向量,采用醫(yī)生的判斷作為先驗知識為紋理特征向量確定標記值,作為SVM的訓練樣本進行訓練。
在圖像識別過程中,采取同樣的方法,提取紋理特征輸入SVM進行識別,將LBP方法與其他特征提取方法進行對比實驗,結果如表1所示。結果表明,本方法在胃鏡圖像良惡性識別問題上,具有較強的分辨能力,同時在運行速度上也有較強的優(yōu)勢。同時也注意到,在對少量未能準確識別的樣本進行分析之后得知,在圖像識別過程中均存在氣泡、胃中食物等無用信息干擾較為嚴重的問題,因此,為提高識別準確率,可利用邊緣檢測和頻譜分析相結合的方法,將無用信息和有用信息區(qū)分開來1],再用本文方法單獨處理有用信息。
4結束語
本文將LBP算法應用到胃鏡圖像的識別領域,提出采用提取圖像RGB分量的LBP統(tǒng)計特征作為胃鏡圖像的紋理特征,并采用SVM進行識別,取得了良好的效果,實驗結果顯示,該算法在良惡性腫瘤胃鏡圖像的識別中是合理可行的。