前言:本站為你精心整理了模糊理論圖像分割算法范文,希望能為你的創(chuàng)作提供參考價(jià)值,我們的客服老師可以幫助你提供個(gè)性化的參考范文,歡迎咨詢(xún)。
論文關(guān)鍵詞:圖像分割邊緣檢測(cè)模糊理論遺傳算法Matlab
論文摘要:分割的目的是將圖像劃分為不同區(qū)域。圖像分割算法一般是基于亮度值的兩個(gè)基本特性之一:不連續(xù)性和相似性。第一類(lèi)性質(zhì)的已用途徑是基于亮度的不連續(xù)變化分割圖像,比如圖像的邊緣。第二類(lèi)的主要應(yīng)用途徑是依據(jù)事先制訂的準(zhǔn)則將圖像分割為相似的區(qū)域。門(mén)限處理、區(qū)域生長(zhǎng)、區(qū)域分離和聚合都是這類(lèi)方法的實(shí)例。遺傳算法具有簡(jiǎn)單、魯棒性好和本質(zhì)并行的突出優(yōu)點(diǎn)。其在應(yīng)用領(lǐng)域取得的巨大成功,引起了廣大學(xué)者的關(guān)注。在圖像分割領(lǐng)域,遺傳算法常用來(lái)幫助確定分割閾值。
本文介紹討論了幾種目前廣泛應(yīng)用的圖像邊緣檢測(cè)、圖像閾值分割的各種算法,并給出了對(duì)比分析;對(duì)遺傳算法的基本概念和研究進(jìn)展進(jìn)行了綜述;給出了標(biāo)準(zhǔn)遺傳算法的原理、過(guò)程、實(shí)驗(yàn)結(jié)果及分析.實(shí)驗(yàn)結(jié)果表明,本文提出的遺傳分割算法優(yōu)于傳統(tǒng)分割算法。
第一章緒論1.1圖像分割綜述
圖像分割就是指把圖像分成各具特性的區(qū)域并提取出感興趣目標(biāo)的技術(shù)和過(guò)程。這里所說(shuō)的特性可以是灰度、顏色、紋理等,而目標(biāo)可以對(duì)應(yīng)單個(gè)區(qū)域,也可以對(duì)應(yīng)多個(gè)區(qū)域。圖像分割是數(shù)字圖像處理中的一項(xiàng)關(guān)鍵技術(shù),它使得其后的圖像分析,識(shí)別等高級(jí)處理階段所要處理的數(shù)據(jù)量大大減少,同時(shí)又保留有關(guān)圖像結(jié)構(gòu)特征的信息。而且,在數(shù)字圖像處理工程中,一方面,圖像分割是目標(biāo)表達(dá)的基礎(chǔ),對(duì)特征測(cè)量有重要的影響;另一方面,圖像分割是自動(dòng)目標(biāo)識(shí)別的關(guān)鍵步驟,圖像分割及其基于分割的目標(biāo)表達(dá)、特征提取和參數(shù)測(cè)量等將原始圖像轉(zhuǎn)化為更抽象更緊湊的形式,分割中出現(xiàn)的誤差會(huì)傳播至高層次處理階段,因此分割的精確程度是至關(guān)重要的。只有通過(guò)細(xì)致精細(xì)的圖像分割,才能使得更高層的圖像分析和理解成為可能。因此,圖像分割是由圖像處理進(jìn)到圖像分析的關(guān)鍵步驟,在圖像工程中占據(jù)重要的位置。
1.2圖像分割的研究意義與發(fā)展現(xiàn)狀
作為計(jì)算機(jī)視覺(jué)和圖像處理中的難點(diǎn)和熱點(diǎn)之一,圖像分割的研究受到了研究工作者的高度重視,對(duì)圖像分割進(jìn)行了深入、廣泛的研究。作為一種重要的圖像技術(shù),圖像分割在不同領(lǐng)域中有時(shí)也用其它名稱(chēng):如目標(biāo)輪廓(objectdelineation)技術(shù),閾值化(thresholding)技術(shù),圖像區(qū)分或求差(imagediscrimination)技術(shù),目標(biāo)檢測(cè)(targetdetection)技術(shù),目標(biāo)識(shí)別(targetrecognition)技術(shù),目標(biāo)跟蹤(targettracking)技術(shù)等,但這些技術(shù)本身或其核心實(shí)際上也就是圖像分割技術(shù)。圖像分割作為圖像處理、分析的一項(xiàng)基本內(nèi)容,其應(yīng)用非常廣泛,幾乎出現(xiàn)在有關(guān)圖像處理的所有領(lǐng)域,并涉及各種類(lèi)型的圖像。在工業(yè)自動(dòng)化、在線產(chǎn)品檢驗(yàn)、生產(chǎn)程控、文件圖像處理、遙感圖像、保安監(jiān)視、以及軍事、體育、農(nóng)業(yè)等行業(yè)和工程中,圖像分割都有著廣泛的應(yīng)用。例如:在遙感圖像中,合成孔徑雷達(dá)圖像中目標(biāo)的分割、遙感云圖中不同云系和背景分布的分割等;在醫(yī)學(xué)應(yīng)用中,腦部MR圖像分割成灰質(zhì)(GM)、白質(zhì)(WM)、腦脊髓(CSF)等腦組織和其它腦組織區(qū)域(NB)等;在交通圖像分析中,把車(chē)輛目標(biāo)從背景中分割出來(lái)等;在面向?qū)ο蟮膱D像壓縮和基于內(nèi)容的圖像檢索中將圖像分割成不同的對(duì)象區(qū)域等。在各種圖像應(yīng)用中,只要需對(duì)圖像目標(biāo)進(jìn)行提取,測(cè)量等都離不開(kāi)圖像分割。
自20世紀(jì)70年代至今,已提出上千種各種類(lèi)型的分割算法。如:門(mén)限法、匹配法、區(qū)域生長(zhǎng)法、分裂-合并法、水線法、馬爾可夫隨機(jī)場(chǎng)模型法、多尺度法、小波分析法、數(shù)學(xué)形態(tài)學(xué)等。隨著新理論、新技術(shù)的發(fā)展,一些新的圖像分割方法也隨之出現(xiàn),但這些分割算法都是針對(duì)某一類(lèi)型圖像、某一具體的應(yīng)用問(wèn)題而提出的,并沒(méi)有一種適合所有圖像的通用分割算法。通用方法和策略仍面臨著巨大的困難。另外,還沒(méi)有制定出選擇適用分割算法的標(biāo)準(zhǔn),這給圖像分割技術(shù)的應(yīng)用帶來(lái)許多實(shí)際問(wèn)題。
1.3本論文所作的工作
據(jù)此,在本論文中只對(duì)常用的、并在實(shí)踐中行之有效的邊緣檢測(cè)方法和閾值分割方法進(jìn)行深入的了解,并對(duì)閾值分割方法中的灰度直方圖雙峰法和基于遺傳算法的最大類(lèi)間方差法進(jìn)行詳細(xì)的討論,同時(shí)用Matlab對(duì)上述兩種方法進(jìn)行驗(yàn)證并給出結(jié)果。
1.4本論文的論述內(nèi)容
本文對(duì)圖像分割的整個(gè)過(guò)程中的一些常用的,經(jīng)實(shí)踐檢驗(yàn)行之有效的算法進(jìn)行了討論和改進(jìn)。全文共七章。第一章為緒論,主要介紹了現(xiàn)階段圖像分割技術(shù)的發(fā)展現(xiàn)狀和研究意義。其他六章分別在以下幾個(gè)方面介紹了本文所做的工作:
1.對(duì)本文所采用的試驗(yàn)測(cè)試工具M(jìn)atlab進(jìn)行簡(jiǎn)介。
2.簡(jiǎn)介數(shù)字圖像的基礎(chǔ)問(wèn)題。概述了數(shù)字圖像的基本概念和特點(diǎn),簡(jiǎn)介了各種圖像格式的特點(diǎn)和應(yīng)用,為全文的討論作一鋪墊。
3.詳細(xì)討論了圖像分割中的基于閾值的圖像分割方法,給出了直方雙峰法的算法和驗(yàn)證結(jié)果,并簡(jiǎn)要介紹了普通最大類(lèi)間方差法的算法過(guò)程。
4.對(duì)遺傳算法理論進(jìn)行簡(jiǎn)介。詳細(xì)討論了遺傳算法的定義和標(biāo)準(zhǔn)遺傳算法的流程和要素。為應(yīng)用此方法對(duì)最大閾值進(jìn)行迭代尋優(yōu)打下基礎(chǔ)。
6.應(yīng)用遺傳算法改進(jìn)了最大類(lèi)間方差法。給出了整個(gè)遺傳操作的使用函數(shù)與具體進(jìn)程,并對(duì)實(shí)例圖片進(jìn)行處理,得到處理結(jié)果并得到迭代最優(yōu)閾值M。
本文研究了圖像分割的相關(guān)理論和常用技術(shù),并對(duì)遺傳算法進(jìn)行了介紹,對(duì)遺傳算法應(yīng)用于圖像分割進(jìn)行了驗(yàn)證.
第二章Matlab簡(jiǎn)介2.1MATLAB的概況和產(chǎn)生背景2.1.1MATLAB的概況
MATLAB是矩陣實(shí)驗(yàn)室(MatrixLaboratory)之意。除具備卓越的數(shù)值計(jì)算能力外,它還提供了專(zhuān)業(yè)水平的符號(hào)計(jì)算,文字處理,可視化建模仿真和實(shí)時(shí)控制等功能。MATLAB的基本數(shù)據(jù)單位是矩陣,它的指令表達(dá)式與數(shù)學(xué),工程中常用的形式十分相似,故用MATLAB來(lái)解算問(wèn)題要比用C,FORTRAN等語(yǔ)言完相同的事情簡(jiǎn)捷得多.
當(dāng)前流行的MATLAB包括擁有數(shù)百個(gè)內(nèi)部函數(shù)的主包和三十幾種工具包(Toolbox).工具包又可以分為功能性工具包和學(xué)科工具包.功能工具包用來(lái)擴(kuò)充MATLAB的符號(hào)計(jì)算,可視化建模仿真,文字處理及實(shí)時(shí)控制等功能.學(xué)科工具包是專(zhuān)業(yè)性比較強(qiáng)的工具包,控制工具包,信號(hào)處理工具包,通信工具包等都屬于此類(lèi).開(kāi)放性使MATLAB廣受用戶(hù)歡迎.除內(nèi)部函數(shù)外,所有MATLAB主包文件和各種工具包都是可讀可修改的文件,用戶(hù)通過(guò)對(duì)源程序的修改或加入自己編寫(xiě)程序構(gòu)造新的專(zhuān)用工具包.
2.1.2MATLAB產(chǎn)生的歷史背景
在70年代中期,CleveMoler博士和其同事在美國(guó)國(guó)家科學(xué)基金的資助下開(kāi)發(fā)了調(diào)用EISPACK和LINPACK的FORTRAN子程序庫(kù).EISPACK是特征值求解的FOETRAN程序庫(kù),LINPACK是解線性方程的程序庫(kù).在當(dāng)時(shí),這兩個(gè)程序庫(kù)代表矩陣運(yùn)算的最高水平.到70年代后期,身為美國(guó)NewMexico大學(xué)計(jì)算機(jī)系系主任的CleveMoler,在給學(xué)生講授線性代數(shù)課程時(shí),想教學(xué)生使用EISPACK和LINPACK程序庫(kù),但他發(fā)現(xiàn)學(xué)生用FORTRAN編寫(xiě)接口程序很費(fèi)時(shí)間,于是他開(kāi)始自己動(dòng)手,利用業(yè)余時(shí)間為學(xué)生編寫(xiě)EISPACK和LINPACK的接口程序.CleveMoler給這個(gè)接口程序取名為MATLAB,該名為矩陣(matrix)和實(shí)驗(yàn)室(labotatory)兩個(gè)英文單詞的前三個(gè)字母的組合.在以后的數(shù)年里,MATLAB在多所大學(xué)里作為教學(xué)輔助軟件使用,并作為面向大眾的免費(fèi)軟件廣為流傳。1983年春天,CleveMoler到Standford大學(xué)講學(xué),MATLAB深深地吸引了工程師JohnLittle.JohnLittle敏銳地覺(jué)察到MATLAB在工程領(lǐng)域的廣闊前景.同年,他和CleveMoler,SteveBangert一起,用C語(yǔ)言開(kāi)發(fā)了第二代專(zhuān)業(yè)版.這一代的MATLAB語(yǔ)言同時(shí)具備了數(shù)值計(jì)算和數(shù)據(jù)圖示化的功能.1984年,CleveMoler和JohnLittle成立了MathWorks公司,正式把MATLAB推向市場(chǎng),并繼續(xù)進(jìn)行MATLAB的研究和開(kāi)發(fā).
在當(dāng)今30多個(gè)數(shù)學(xué)類(lèi)科技應(yīng)用軟件中,就軟件數(shù)學(xué)處理的原始內(nèi)核而言,可分為兩大類(lèi).一類(lèi)是數(shù)值計(jì)算型軟件,如MATLAB,Xmath,Gauss等,這類(lèi)軟件長(zhǎng)于數(shù)值計(jì)算,對(duì)處理大批數(shù)據(jù)效率高;另一類(lèi)是數(shù)學(xué)分析型軟件,Mathematica,Maple等,這類(lèi)軟件以符號(hào)計(jì)算見(jiàn)長(zhǎng),能給出解析解和任意精確解,其缺點(diǎn)是處理大量數(shù)據(jù)時(shí)效率較低.MathWorks公司順應(yīng)多功能需求之潮流,在其卓越數(shù)值計(jì)算和圖示能力的基礎(chǔ)上,又率先在專(zhuān)業(yè)水平上開(kāi)拓了其符號(hào)計(jì)算,文字處理,可視化建模和實(shí)時(shí)控制能力,開(kāi)發(fā)了適合多學(xué)科,多部門(mén)要求的新一代科技應(yīng)用軟件MATLAB.經(jīng)過(guò)多年的國(guó)際競(jìng)爭(zhēng),MATLAB以經(jīng)占據(jù)了數(shù)值軟件市場(chǎng)的主導(dǎo)地位.
在MATLAB進(jìn)入市場(chǎng)前,國(guó)際上的許多軟件包都是直接以FORTRANC語(yǔ)言等編程語(yǔ)言開(kāi)發(fā)的。這種軟件的缺點(diǎn)是使用面窄,接口簡(jiǎn)陋,程序結(jié)構(gòu)不開(kāi)放以及沒(méi)有標(biāo)準(zhǔn)的基庫(kù),很難適應(yīng)各學(xué)科的最新發(fā)展,因而很難推廣。MATLAB的出現(xiàn),為各國(guó)科學(xué)家開(kāi)發(fā)學(xué)科軟件提供了新的基礎(chǔ)。在MATLAB問(wèn)世不久的80年代中期,原先控制領(lǐng)域里的一些軟件包紛紛被淘汰或在MATLAB上重建。
時(shí)至今日,經(jīng)過(guò)MathWorks公司的不斷完善,MATLAB已經(jīng)發(fā)展成為適合多學(xué)科,多種工作平臺(tái)的功能強(qiáng)大大大型軟件。在國(guó)外,MATLAB已經(jīng)經(jīng)受了多年考驗(yàn)。在歐美等高校,MATLAB已經(jīng)成為線性代數(shù),自動(dòng)控制理論,數(shù)理統(tǒng)計(jì),數(shù)字信號(hào)處理,時(shí)間序列分析,動(dòng)態(tài)系統(tǒng)仿真等高級(jí)課程的基本教學(xué)工具;成為攻讀學(xué)位的大學(xué)生,碩士生,博士生必須掌握的基本技能。在設(shè)計(jì)研究單位和工業(yè)部門(mén),MATLAB被廣泛用于科學(xué)研究和解決各種具體問(wèn)題。在國(guó)內(nèi),特別是工程界,MATLAB一定會(huì)盛行起來(lái)??梢哉f(shuō),無(wú)論你從事工程方面的哪個(gè)學(xué)科,都能在MATLAB里找到合適的功能。
2.2MATLAB的語(yǔ)言特點(diǎn)
一種語(yǔ)言之所以能如此迅速地普及,顯示出如此旺盛的生命力,是由于它有著不同于其他語(yǔ)言的特點(diǎn),正如同F(xiàn)ORTRAN和C等高級(jí)語(yǔ)言使人們擺脫了需要直接對(duì)計(jì)算機(jī)硬件資源進(jìn)行操作一樣,被稱(chēng)作為第四代計(jì)算機(jī)語(yǔ)言的MATLAB,利用其豐富的函數(shù)資源,使編程人員從繁瑣的程序代碼中解放出來(lái)。MATLAB最突出的特點(diǎn)就是簡(jiǎn)潔。MATLAB用更直觀的,符合人們思維習(xí)慣的代碼,代替了C和FORTRAN語(yǔ)言的冗長(zhǎng)代碼。MATLAB給用戶(hù)帶來(lái)的是最直觀,最簡(jiǎn)潔的程序開(kāi)發(fā)環(huán)境。以下簡(jiǎn)單介紹一下MATLAB的主要特點(diǎn)。
1.語(yǔ)言簡(jiǎn)潔緊湊,使用方便靈活,庫(kù)函數(shù)極其豐富。MATLAB程序書(shū)寫(xiě)形式自由,利用起豐富的庫(kù)函數(shù)避開(kāi)繁雜的子程序編程任務(wù),壓縮了一切不必要的編程工作。由于庫(kù)函數(shù)都由本領(lǐng)域的專(zhuān)家編寫(xiě),用戶(hù)不必?fù)?dān)心函數(shù)的可靠性??梢哉f(shuō),用MATLAB進(jìn)行科技開(kāi)發(fā)是站在專(zhuān)家的肩膀上。更為難能可貴的是,MATLAB甚至具有一定的智能水平,所以用戶(hù)根本不用懷疑MATLAB的準(zhǔn)確性。
2.運(yùn)算符豐富。由于MATLAB是用C語(yǔ)言編寫(xiě)的,MATLAB提供了和C語(yǔ)言幾乎一樣多的運(yùn)算符,靈活使用MATLAB的運(yùn)算符將使程序變得極為簡(jiǎn)短。
3.MATLAB既具有結(jié)構(gòu)化的控制語(yǔ)句(如for循環(huán),while循環(huán),break語(yǔ)句和if語(yǔ)句),又有面向?qū)ο缶幊痰奶匦浴?/p>
4.程序限制不嚴(yán)格,程序設(shè)計(jì)自由度大。例如,在MATLAB里,用戶(hù)無(wú)需對(duì)矩陣預(yù)定義就可使用。
5.程序的可移植性很好,基本上不做修改就可以在各種型號(hào)的計(jì)算機(jī)和操作系統(tǒng)上運(yùn)行。
6.MATLAB的圖形功能強(qiáng)大。在FORTRAN和C語(yǔ)言里,繪圖都很不容易,但在MATLAB里,數(shù)據(jù)的可視化非常簡(jiǎn)單。MATLAB還具有較強(qiáng)的編輯圖形界面的能力。
7.MATLAB的缺點(diǎn)是,它和其他高級(jí)程序相比,程序的執(zhí)行速度較慢。由于MATLAB的程序不用編譯等預(yù)處理,也不生成可執(zhí)行文件,程序?yàn)榻忉寛?zhí)行,所以速度較慢。
8.功能強(qiáng)大的工具箱是MATLAB的另一特色。MATLAB包含兩個(gè)部分:核心部分和各種可選的工具箱。核心部分中有數(shù)百個(gè)核心內(nèi)部函數(shù)。其工具箱又分為兩類(lèi):功能性工具箱和學(xué)科性工具箱。功能性工具箱主要用來(lái)擴(kuò)充其符號(hào)計(jì)算功能,圖示建模仿真功能,文字處理功能以及與硬件實(shí)時(shí)交互功能。功能性工具箱用于多種學(xué)科。而學(xué)科性工具箱是專(zhuān)業(yè)性比較強(qiáng)的,如control,toolbox,signlproceessingtoolbox,commumnicationtoolbox等。這些工具箱都是由該領(lǐng)域內(nèi)學(xué)術(shù)水平很高的專(zhuān)家編寫(xiě)的,所以用戶(hù)無(wú)需編寫(xiě)自己學(xué)科范圍內(nèi)的基礎(chǔ)程序,而直接進(jìn)行高,精,尖的研究。
9.源程序的開(kāi)放性。開(kāi)放性也許是MATLAB最受人們歡迎的特點(diǎn)。除內(nèi)部函數(shù)以外,所有MATLAB的核心文件和工具箱文件都是可讀可改的源文件,用戶(hù)可通過(guò)對(duì)源文件的修改以及加入自己的文件構(gòu)成新的工具箱。
2.3MATLAB遺傳算法工具箱簡(jiǎn)介
鑒于Matlab強(qiáng)大的擴(kuò)展功能和影響力,各個(gè)領(lǐng)域的專(zhuān)家相繼突出了許多基于Matlab的專(zhuān)用工具箱。本文所采用的遺傳算法工具箱,就是由英國(guó)謝菲爾德(Sheffield)大學(xué)設(shè)計(jì)推出的。相對(duì)于其他版本的遺傳算法工具箱,如:美國(guó)北卡萊羅納州立大學(xué)推出的遺傳算法優(yōu)化工具箱GAOT(GeneticAlgorithmOptimizationToolbox),以及MathWorks公司最新的一個(gè)專(zhuān)門(mén)設(shè)計(jì)的Matlab遺傳算法和直接搜索工具箱(GeneticAlgorithmandDirectSearchToolbox),本工具箱的出現(xiàn)最早,影響較大且功能較為完備。文中所采用的所有遺傳操作函數(shù)大部分出自本工具箱。
第三章數(shù)字圖像基礎(chǔ)簡(jiǎn)介
圖像處理的首要一步,就是要了解圖像的基本性質(zhì)與特點(diǎn)。只有充分了解和掌握了所要處理得圖像的特點(diǎn)和性質(zhì),才能在接下來(lái)的處理中根據(jù)圖像的特點(diǎn)獲取所需的信息,并對(duì)其進(jìn)行相應(yīng)的處理。
本章將介紹數(shù)字圖像的基礎(chǔ)知識(shí),以及圖像在計(jì)算機(jī)處理中的信息表達(dá)形式,并對(duì)幾種常用的圖像文件格式Bmp,Jpeg以及Png等做簡(jiǎn)要的介紹。
3.1圖像的基本概念及其特點(diǎn)
要對(duì)圖像進(jìn)行處理,必須清楚圖像的概念。一般來(lái)說(shuō),二維或三維景物呈現(xiàn)在人眼中的樣子就是圖像。圖像具有以下三個(gè)方面的特點(diǎn):
①圖像帶有大量的信息,一幅圖像頂?shù)蒙锨а匀f(wàn)語(yǔ);
②圖像種類(lèi)繁多,包括照片、繪圖視頻圖像等;
③人類(lèi)從外界獲得的大部分信息來(lái)自視覺(jué)系統(tǒng)。
人們看到的任何自然界的圖像都是連續(xù)的模擬圖像。其形狀和形態(tài)表現(xiàn)由圖像各位置的顏色來(lái)決定??梢杂胒(x,y)表示一幅模擬圖像,其中x,y表示空間坐標(biāo)點(diǎn)的位置,f表示圖像在點(diǎn)(x,y)的某種性質(zhì)的數(shù)值,如亮度、顏色等,f、x、y可以是任意的實(shí)數(shù)。而把連續(xù)空間的圖像在坐標(biāo)空間(X,Y)和性質(zhì)空間F都離散化,以便于計(jì)算機(jī)進(jìn)行加工處理的離散化的圖像則稱(chēng)為數(shù)字圖像。數(shù)字圖像用I(r,c)來(lái)表示,其中:r=row為行,c=col為列,表示空間離散點(diǎn)的坐標(biāo),I表示離散化的圖像f。I,r,c都是整數(shù)。實(shí)際中仍習(xí)慣用f(x,y)表示數(shù)字圖像。圖像存儲(chǔ)畫(huà)面的形式為柵格結(jié)構(gòu):即將圖像劃分為均勻分布的柵格(像素),顯式的記錄每一像素的亮度和顏色;而將像素的坐標(biāo)值規(guī)則地隱含起來(lái),其位置排列規(guī)則,通常為矩形排列。
3.2圖像的格式
組成數(shù)字圖像的基本單位稱(chēng)為像素(Pixel),把像素按不同的方式進(jìn)行組織和存儲(chǔ),就得到不同的圖像格式;把圖像數(shù)據(jù)存為文件就得到圖像文件。圖像文件按其格式的不同一般具有不同的擴(kuò)展名。常用的圖像文件格式有位圖文件、JPEG文件、GIF文件、PNG文件等。每一種格式都有它的特點(diǎn)和用途,在選擇輸出的圖像文件格式時(shí),應(yīng)考慮圖像的應(yīng)用目的以及圖像文件格式對(duì)圖像數(shù)據(jù)類(lèi)型的要求。下面我們介紹幾種常用的圖像文件格式及其特點(diǎn)。
3.2.1BMP圖像格式
這是一種DOS和Windows兼容計(jì)算機(jī)系統(tǒng)的標(biāo)準(zhǔn)圖像格式。BMP格式支持索引色、灰度等色彩模式。圖像存儲(chǔ)為BMP格式時(shí),每一個(gè)像素所占的位數(shù)可以是1位、4位、8位或32位,相對(duì)應(yīng)的顏色數(shù)也從黑白一直到真彩色。對(duì)于使用Windows格式的4位和8位圖像,可以指定采用RLE壓縮。BMP圖像文件含文件頭、調(diào)色板數(shù)據(jù)和圖像數(shù)據(jù)三個(gè)層次。其中文件頭由定義文件標(biāo)識(shí)、大小即圖像數(shù)據(jù)偏移量的BITMAPF工LEHEADER以及指定BMP圖像自身的若干參數(shù)的BITMAPINFOHEADER兩部分組成。這種格式在PC機(jī)上應(yīng)用非常普遍。
3.2.2JPEG圖像格式
JPEG是由聯(lián)合照片專(zhuān)家組(JiontPhotographicExpertsGroup)開(kāi)發(fā)的一種圖像文件格式。它采用有損壓縮方式去除冗余的圖像和彩色數(shù)據(jù),在獲取極高的壓縮率的同時(shí)也能展現(xiàn)十分豐富生動(dòng)的圖像。也就是說(shuō),可以用較少的磁盤(pán)空間得到較好的圖像質(zhì)。另外,JPEG還是一種比較靈活的格式,當(dāng)將圖像保存為JPEG格式時(shí),允許用戶(hù)用不同的壓縮比例對(duì)文件進(jìn)行壓縮,就是可以指定圖像的品質(zhì)和壓縮級(jí)別。
3.2.3TIFF圖像格式
TIFF文件主要由三部份組成,包括文件頭、標(biāo)識(shí)信息區(qū)和圖像數(shù)據(jù)區(qū)。T工FF文件的圖像數(shù)據(jù)區(qū)以行掃描的方式存取圖像,存儲(chǔ)圖像前先將圖像分割成若干部分,壓縮后再存儲(chǔ)。存儲(chǔ)時(shí),單色圖像一個(gè)字節(jié)存儲(chǔ)8個(gè)點(diǎn),16色圖像一個(gè)字節(jié)2個(gè)點(diǎn),而256色圖像就是一個(gè)字節(jié)存儲(chǔ)一個(gè)點(diǎn)。TIFF圖像格式是一種應(yīng)用非常廣泛的位圖圖像格式,幾乎被所有繪畫(huà)、圖像編輯和頁(yè)面排版應(yīng)用程序所支持。TIFF格式常常用于在應(yīng)用程序之間和計(jì)算機(jī)平臺(tái)之間交換文件。
3.2.4GIF圖像格式
CIF是GraphicsInterchangeFormat(圖形交換格式)的縮寫(xiě),是由ComputerServe公司推出的一種圖像格式。該種圖像格式的特點(diǎn)是壓縮比高,可以極大地節(jié)省存儲(chǔ)空間。最初的GIF只是簡(jiǎn)單的用來(lái)存儲(chǔ)單幅靜止圖像,后來(lái)可以同時(shí)存儲(chǔ)若干幅靜止圖像從而形成連續(xù)的動(dòng)畫(huà);同時(shí),GIF格式支持透明背景,可以較好地與網(wǎng)頁(yè)背景融合在一起。因此,GIF常常用于保存作為網(wǎng)頁(yè)數(shù)據(jù)進(jìn)行傳輸?shù)膱D像文件,成為網(wǎng)絡(luò)和BBS上使用頻率較高的一種圖像文件格式。但是GIF最多只能處理256種色彩,不能用于存儲(chǔ)真彩色的圖像文件。
3.2.5PNG圖像格式
這種格式稱(chēng)為可移植網(wǎng)絡(luò)圖像文件格式(PortableNetworkGraphics),由ThomasBoutell,TomLan。等人提出并設(shè)計(jì)。其特點(diǎn)是:①支持48位真彩色圖像、16位灰度圖像和顏色索引數(shù)據(jù)圖像;②主要面向網(wǎng)絡(luò)圖像傳輸和圖像編輯,其提供的二維交叉存儲(chǔ)機(jī)制使用戶(hù)在圖像網(wǎng)絡(luò)傳輸過(guò)程中能更快的觀察到接近真實(shí)的近似圖像;③對(duì)用戶(hù)完全透明且無(wú)專(zhuān)利限制,用戶(hù)可以從Internet上隨時(shí)下載與PNG文件格式配套的圖像數(shù)據(jù)壓縮算法源程序代碼:④具有比GIF高5-20%的壓縮效率;⑤具有可擴(kuò)展性。
作為目前最不失真的圖像格式,PNG格式圖像吸取了GIF和JPEG二者的優(yōu)點(diǎn)。它可以把文件壓縮到極限以利于網(wǎng)絡(luò)傳輸,但由于采用無(wú)損壓縮方式來(lái)減少文件大小,PNG格式能保留所有與圖像品質(zhì)有關(guān)的信息。同時(shí),PNG支持圖像背景透明,顯示速度快。
本文的所有圖像的處理都是對(duì)由JPG格式圖像通過(guò)圖像格式轉(zhuǎn)化得來(lái)的Bmp格式的索引色圖像進(jìn)行的,其具體轉(zhuǎn)換程序參見(jiàn)附錄[一]。
第四章圖像分割4.1圖像分割算法的定義與分類(lèi)
在圖像的研究和應(yīng)用中,人們往往只對(duì)一幅圖像中的某些部分感興趣,這些感興趣的部分一般對(duì)應(yīng)圖像中特定的、具有特殊性質(zhì)的區(qū)域(可以對(duì)應(yīng)單個(gè)區(qū)域,也可以對(duì)應(yīng)多個(gè)區(qū)域),稱(chēng)之為目標(biāo)或前景;而其它部分稱(chēng)為圖像的背景。為了辨識(shí)和分析目標(biāo),需要把目標(biāo)從一幅圖像中孤立出來(lái),這就是圖像分割要研究的問(wèn)題。所謂圖像分割,從廣義上來(lái)講,是根據(jù)圖像的某些特征或特征集合(包括灰度、顏色、紋理等)的相似性準(zhǔn)則對(duì)圖像象素進(jìn)行分組聚類(lèi),把圖像平面劃分成若干個(gè)具有某些一致性的不重疊區(qū)域。這使得同一區(qū)域中的象素特征是類(lèi)似的,即具有一致性;而不同區(qū)域間象素的特征存在突變,即具有非一致性。從集合的角度出發(fā),圖像分割定義如下:
設(shè)整個(gè)圖像空間為一集合R。根據(jù)選定的一致性準(zhǔn)則P,R被劃分為互不重疊的非空子集(或子區(qū)域):{R1,R2,L,Rn},這些子集必須滿足下述條件:
(1)R=
(2)對(duì)于所有的i和j,當(dāng)i≠j,=空集
(3)P(Ri)=True,對(duì)所有的i
(4)所有i≠j;Ri,Rj相鄰,P(RiURj)=False
(5)對(duì)i=1,2,L,n,Ri是連通區(qū)域
其中:P(Ri)為作用于Ri中所有象素的形似性邏輯謂詞,i,j=1,2,L,…n。上述條件
(1)指出分割后的全部子區(qū)域的總和應(yīng)包含圖像中的所有元素,或者說(shuō)分割應(yīng)將圖像中每個(gè)象素都分進(jìn)一個(gè)子區(qū)域中。
(2)指出各個(gè)子區(qū)域相互不重疊。
(3)指出分割后得到的屬于同一區(qū)域中的元素應(yīng)該具有某種相同特性。
(4)指出對(duì)于分割后得到的屬于相鄰兩個(gè)區(qū)域中的元素具有某種不同的特性。(5)要求同一個(gè)子區(qū)域內(nèi)的元素應(yīng)當(dāng)是連通的。
其中分割準(zhǔn)則P適用于所有象素,由它來(lái)確定各區(qū)域元素的相同特性。上述數(shù)學(xué)條件說(shuō)明了圖像分割算法的一些特點(diǎn),凡不符合以上特點(diǎn)的圖像處理算法則不能稱(chēng)為圖像分割算法。
目前,在己提出的多種類(lèi)型的分割算法中,大致可以分為基于邊緣檢測(cè)的方法和基于區(qū)域的方法。而在實(shí)際應(yīng)用中,這些方法主要又可劃分為三種類(lèi)型:邊緣檢測(cè)型、閾值型和區(qū)域跟蹤型。本文的討論正是基于閾值型圖像分割方法展開(kāi)的。
4.2基于閾值的分割4.2.1方法定義與特點(diǎn)
基于閾值的分割方法是一種應(yīng)用十分廣泛的圖像分割技術(shù)。所謂閾值分割方法的實(shí)質(zhì)是利用圖像的灰度直方圖信息得到用于分割的閾值。它是用一個(gè)或幾個(gè)閾值將圖像的灰度級(jí)分為幾個(gè)部分,認(rèn)為屬于同一個(gè)部分的象素是同一個(gè)物體。它不僅可以極大的壓縮數(shù)據(jù)量,而且也大大簡(jiǎn)化了圖像信息的分析和處理步驟。因此,在很多情況下,是進(jìn)行圖像分析、特征提取與模式識(shí)別之前必要的圖像預(yù)處理過(guò)程。它特別適用于目標(biāo)和背景占據(jù)不同灰度級(jí)范圍的圖像。閾值分割方法的最大特點(diǎn)是計(jì)算簡(jiǎn)單,運(yùn)算效率高,在重視運(yùn)算效率的應(yīng)用場(chǎng)合,它得到了廣泛的應(yīng)用。
4.2.2閾值的分割的描述
設(shè)(x,y)是二維數(shù)字圖像的平面坐標(biāo),圖像灰度級(jí)的取值范圍是G={0,1,2,…L-1}(習(xí)慣上0代表最暗的像素點(diǎn),L-1代表最亮的像素點(diǎn)),位于坐標(biāo)點(diǎn)(x,y)上的像素點(diǎn)的灰度級(jí)表示為f(x,y)。設(shè)t∈G為分割閾值,B={b0,b1}代表一個(gè)二值灰度級(jí),并且b0,b1∈B。于是圖像函數(shù)f1(x,y)在閾值t上的分割結(jié)果可以表示為:
閾值分割法實(shí)際就是按某個(gè)準(zhǔn)則函數(shù)求最優(yōu)閾值t的過(guò)程。域值一般可寫(xiě)成如下的形式:
T=T[x,y,f(x,Y),p(x,y)]
其中f(x,y)是在像素點(diǎn)(x,y)處的灰度值,p(x,y)是該點(diǎn)鄰域的某種局部性質(zhì)。4.3.3閾值分割方法的分類(lèi)
通過(guò)上文的討論,結(jié)合所給公式,可以將閾值分割方法分為以下3類(lèi):
1)全局閾值:T=T[p(x,y)〕,即僅根據(jù)f(x,y)來(lái)選取閾值,閾值僅與各個(gè)圖像像素的本身性質(zhì)有關(guān)。
2)局部閾值:T=T[f(x,y),p(x,y)],閾值與圖像像素的本身性質(zhì)和局部區(qū)域性質(zhì)相關(guān)。
3)動(dòng)態(tài)閾值:T=T[x,y,f(x,y),p(x,y)],閾值與像素坐標(biāo),圖像像素的本身性質(zhì)和局部區(qū)域性質(zhì)相關(guān)。
全局閾值對(duì)整幅圖像僅設(shè)置一個(gè)分割閾值,通常在圖像不太復(fù)雜、灰度分布較集中的情況下采用;局部閾值則將圖像劃分為若干個(gè)子圖像,并對(duì)每個(gè)子圖像設(shè)定局部閾值;動(dòng)態(tài)閾值是根據(jù)空間信息和灰度信息確定。局部閾值分割法雖然能改善分割效果,但存在幾個(gè)缺點(diǎn):
1)每幅子圖像的尺寸不能太小,否則統(tǒng)計(jì)出的結(jié)果無(wú)意義。
2)每幅圖像的分割是任意的,如果有一幅子圖像正好落在目標(biāo)區(qū)域或背景區(qū)域,而根據(jù)統(tǒng)計(jì)結(jié)果對(duì)其進(jìn)行分割,也許會(huì)產(chǎn)生更差的結(jié)果。
3)局部閾值法對(duì)每一幅子圖像都要進(jìn)行統(tǒng)計(jì),速度慢,難以適應(yīng)實(shí)時(shí)性的要求。
全局閾值分割方法在圖像處理中應(yīng)用比較多,它在整幅圖像內(nèi)采用固定的閾值分割圖像??紤]到全局閾值分割方法應(yīng)用的廣泛性,本文所著重討論的就是全局閾值分割方法中的直方圖雙峰法和基于遺傳算法的最大類(lèi)間方差法。在本節(jié)中,將重點(diǎn)討論灰度直方圖雙峰法,最大類(lèi)間方差法以及基于遺傳算法的最大類(lèi)間方差法留待下章做繼續(xù)深入地討論。