前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇計(jì)算機(jī)視覺基礎(chǔ)及應(yīng)用范文,相信會(huì)為您的寫作帶來幫助,發(fā)現(xiàn)更多的寫作思路和靈感。
(1)課程內(nèi)容方面:工程應(yīng)用價(jià)值較小的內(nèi)容居多;具備工程應(yīng)用價(jià)值的方法,如基于結(jié)構(gòu)光的3D信息獲取,在課程內(nèi)容中卻極少出現(xiàn)。
(2)課程定位方面:現(xiàn)有課程體系中未能體現(xiàn)最新研究成果,而掌握世界最新工程應(yīng)用成果是卓越工程師的基本要求之一。
(3)教學(xué)形式方面:傳統(tǒng)計(jì)算機(jī)視覺課程側(cè)重基本原理,盡管范例教學(xué)被引入到課堂教學(xué)中,在一定程度上幫助學(xué)生理解,但卓越工程師培養(yǎng)目標(biāo)是培養(yǎng)學(xué)生解決實(shí)際工程問題的能力。針對(duì)卓越工程師培養(yǎng)目標(biāo),以及目前計(jì)算機(jī)視覺課程中存在的問題,本文提出工程應(yīng)用導(dǎo)向型的課程內(nèi)容、面向最新成果的課程定位、理論實(shí)例化與工程實(shí)踐化的教學(xué)形式,以培養(yǎng)具有扎實(shí)理論基礎(chǔ)及工程實(shí)踐能力的卓越工程師。
1工程應(yīng)用導(dǎo)向型的課程內(nèi)容傳統(tǒng)計(jì)算機(jī)視覺課程圍繞Marr理論框架展開教學(xué),其中部分原理僅在理想狀態(tài)或若干假設(shè)下成立,不能直接運(yùn)用到工程實(shí)踐中。近年來已具備工程應(yīng)用基礎(chǔ)的原理及方法,在傳統(tǒng)課程內(nèi)容中較少出現(xiàn),如已在工業(yè)測(cè)量、視頻監(jiān)控、游戲娛樂等領(lǐng)域中應(yīng)用的主動(dòng)式三維數(shù)據(jù)獲取方法等。我們對(duì)工程應(yīng)用價(jià)值高的課程內(nèi)容,增加課時(shí),充分講解其原理及算法,并進(jìn)行工程實(shí)例分析;對(duì)工程應(yīng)用價(jià)值較低內(nèi)容,壓縮課時(shí),以介紹方法原理為主。例如,在教授3D信息獲取部分時(shí),課時(shí)主要投入到工程應(yīng)用價(jià)值較大的內(nèi)容,如立體視覺、運(yùn)動(dòng)恢復(fù)結(jié)構(gòu)、基于結(jié)構(gòu)光的3D信息獲取等;而對(duì)于基于陰影的景物恢復(fù)等缺乏應(yīng)用基礎(chǔ)的內(nèi)容主要介紹其基本原理,并引導(dǎo)學(xué)生進(jìn)行其工程應(yīng)用的可行性分析,培養(yǎng)學(xué)生縝密的思維習(xí)慣,訓(xùn)練學(xué)生辯證的分析能力。
2面向最新成果的課程定位計(jì)算機(jī)視覺近十年來發(fā)展迅速,新方法和新理論層出不窮,在現(xiàn)有課程體系中未能得以體現(xiàn)。跟進(jìn)世界最新成果是卓越工程師的基本要求之一,因此計(jì)算機(jī)視覺課程定位應(yīng)當(dāng)面向國際最新成果。為實(shí)現(xiàn)這一目標(biāo),我們主要從以下兩方面入手。
(1)選用涵蓋最新成果的教材。我們?cè)诮虒W(xué)中加入國際最新科研成果及應(yīng)用范例,在教材選取上采用2010年RichardSzeliski教授所著《Computervision:algorithmsandapplications》作為參考教材。該書是RichardSzeliski教授在多年MIT執(zhí)教經(jīng)驗(yàn)及微軟多年計(jì)算機(jī)視覺領(lǐng)域工作經(jīng)驗(yàn)基礎(chǔ)上所著,涵蓋計(jì)算機(jī)視覺領(lǐng)域的主要科研成果及應(yīng)用范例,參考文獻(xiàn)最新引用至2010年。這是目前最新的計(jì)算機(jī)視覺著作之一,條理清晰,深入淺出,特點(diǎn)在于對(duì)計(jì)算機(jī)視覺的基本原理介紹非常詳盡,算法應(yīng)用緊跟國際前沿。
(2)強(qiáng)化學(xué)生調(diào)研及自學(xué)能力?!笆谥贼~”,不如“授之以漁”。在教授學(xué)生的同時(shí),更重要的是培養(yǎng)學(xué)生調(diào)研、跟蹤、學(xué)習(xí)并分析國際最新科研及工程應(yīng)用成果的能力。為強(qiáng)化學(xué)生的知識(shí)結(jié)構(gòu),培養(yǎng)學(xué)生跟蹤國際前沿的能力,我們?cè)诮虒W(xué)中加入10%的課外學(xué)時(shí),指導(dǎo)每位學(xué)生完成最近三年本領(lǐng)域的國際最新文獻(xiàn)調(diào)研及工程應(yīng)用新技術(shù)調(diào)研,并撰寫相關(guān)調(diào)研論文。同時(shí),設(shè)置2學(xué)時(shí)課內(nèi)學(xué)時(shí),讓每位學(xué)生介紹調(diào)研成果,并進(jìn)行課堂討論。在調(diào)研基礎(chǔ)上,選擇相關(guān)算法進(jìn)行了實(shí)驗(yàn)證明,進(jìn)一步強(qiáng)化學(xué)習(xí)成果。實(shí)踐證明,由于學(xué)生能夠根據(jù)自己的興趣,選擇本領(lǐng)域感興趣的課題進(jìn)行深入調(diào)研,極大地調(diào)動(dòng)了學(xué)生的積極性,強(qiáng)化了學(xué)生調(diào)研、跟蹤、學(xué)習(xí)并分析國際最新科研及工程應(yīng)用成果的能力。
3工程實(shí)踐化的教學(xué)形式我們?cè)诮虒W(xué)中提出工程實(shí)踐化的教學(xué)形式,即以人類視覺功能為背景,由相應(yīng)工程實(shí)例引出相關(guān)理論,并最終將理論運(yùn)用到工程實(shí)例中的算法和方法傳授給學(xué)生。
關(guān)鍵詞:計(jì)算機(jī);視覺技術(shù);交通工程
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-7712 (2014) 04-0000-01
一、引言
隨著科技的發(fā)展,計(jì)算機(jī)替代人的視覺與思維已經(jīng)成為現(xiàn)實(shí),這也是計(jì)算機(jī)視覺的突出顯現(xiàn)。那么在物體圖像中識(shí)別物體并作進(jìn)一步處理,是客觀世界的主觀反應(yīng)。在數(shù)字化圖像中,我們可以探尋出較為固定的數(shù)字聯(lián)系,在物體特征搜集并處理時(shí)做到二次實(shí)現(xiàn)。這既是對(duì)物體特征的外在顯現(xiàn)與描繪,更是對(duì)其定量信息的標(biāo)定。從交通工程領(lǐng)域的角度來看,該種技術(shù)一般應(yīng)用在交管及安全方面。監(jiān)控交通流、識(shí)別車況及高速收費(fèi)都是屬于交通管理的范疇;而對(duì)交通重大事件的勘察及甄別則是交通安全所屬。在這個(gè)基礎(chǔ)上,筆者對(duì)計(jì)算機(jī)視覺系統(tǒng)的組成及原理進(jìn)行了分析,并形成視覺處理相關(guān)技術(shù)研究。
二、設(shè)計(jì)計(jì)算機(jī)視覺系統(tǒng)構(gòu)成
計(jì)算機(jī)視覺處理技術(shù)的應(yīng)用是建立在視覺系統(tǒng)的建立基礎(chǔ)上的。其內(nèi)部主要的構(gòu)成是計(jì)算機(jī)光源、光電轉(zhuǎn)換相關(guān)器件及圖像采集卡等元件。
(一)照明條件的設(shè)計(jì)。在測(cè)量物體的表征時(shí),環(huán)境的創(chuàng)設(shè)是圖像分析處理的前提,其主要通過光線反射將影像投射到光電傳感器上。故而要想獲得清晰圖像離不開照明條件的選擇。在設(shè)計(jì)照明條件時(shí),我們通常會(huì)視具體而不同處理,不過總的目標(biāo)是一定的,那就是要利于處理圖像及對(duì)其進(jìn)行提取分析。在照明條件的設(shè)定中,主動(dòng)視覺系統(tǒng)結(jié)構(gòu)光是較為典型的范例。
(二)數(shù)據(jù)采集的處理。如今電耦合器件(CCD)中,攝像機(jī)及光電傳感器較為常見。它們輸出形成的影像均為模擬化的電子信號(hào)。在此基礎(chǔ)上,A模式與D模式的相互對(duì)接更能夠讓信號(hào)進(jìn)入計(jì)算機(jī)并達(dá)到數(shù)字處理標(biāo)準(zhǔn),最后再量化入計(jì)算機(jī)系統(tǒng)處理范圍。客觀物體色彩的不同,也就造就了色彩帶給人信息的差異。一般地黑白圖像是單色攝像機(jī)輸入的結(jié)果;彩色圖像則需要彩色相機(jī)來實(shí)現(xiàn)。其過程為:彩色模擬信號(hào)解碼為RGB單獨(dú)信號(hào),并單獨(dú)A/D轉(zhuǎn)換,輸出后借助色彩查找表來顯示相應(yīng)色彩。每幅圖像一旦經(jīng)過數(shù)字處理就會(huì)形成點(diǎn)陣,并將n個(gè)信息濃縮于每點(diǎn)中。彩色獲得的圖像在16比特,而黑白所獲黑白灰圖像則僅有8比特。故而從信息采集量上來看,彩色的圖像采集分析更為繁復(fù)些。不過黑白跟灰度圖像也基本適應(yīng)于基礎(chǔ)信息的特征分析。相機(jī)數(shù)量及研究技法的角度,則有三個(gè)分類:“單目視覺”、“雙目”及“三目”立體視覺。
三、研究與應(yīng)用計(jì)算機(jī)視覺處理技術(shù)
從對(duì)圖像進(jìn)行編輯的過程可以看出,計(jì)算機(jī)視覺處理技術(shù)在物體成像及計(jì)算后會(huì)在灰度陣列中參雜無效信息群,使得信息存在遺失風(fēng)險(xiǎn)。成像的噪聲在一定程度上也對(duì)獲取有效信息造成了干擾。故而,處理圖像必須要有前提地預(yù)設(shè)分析,還原圖像本相,從而消去噪音。邊緣增強(qiáng)在特定的圖像變化程度中,其起到的是對(duì)特征方法的削減?;诙祷?,分割圖像才能夠進(jìn)一步開展。對(duì)于物體的檢測(cè)多借助某個(gè)范圍來達(dá)到目的。識(shí)別和測(cè)算物體一般總是靠對(duì)特征的甄別來完成的。
四、分析處理三維物體技術(shù)
物體外輪擴(kuò)線及表面對(duì)應(yīng)位置的限定下,物體性質(zhì)的外在表現(xiàn)則是其形狀。三維物體從內(nèi)含性質(zhì)上來看也有體現(xiàn),如通過其內(nèi)含性質(zhì)所變現(xiàn)出來的表層構(gòu)造及邊界劃定等等。故而在確定圖像特征方面,物體的三維形態(tài)是最常用的處理技術(shù)。檢測(cè)三維物體形狀及分析距離從計(jì)算機(jī)視覺技術(shù)角度來看,渠道很多,其原理主要是借助光源特性在圖像輸入時(shí)的顯現(xiàn)來實(shí)現(xiàn)的。其類別有主動(dòng)與被動(dòng)兩類。借助自然光照來對(duì)圖像獲取并挖掘深入信息的技術(shù)叫做被動(dòng)測(cè)距;主動(dòng)測(cè)距的光源條件則是利用人為設(shè)置的,其信息也是圖像在經(jīng)過測(cè)算分析時(shí)得到的。被動(dòng)測(cè)距的主要用途體現(xiàn)在軍工業(yè)保密及限制環(huán)境中,而普通建筑行業(yè)則主要利用主動(dòng)測(cè)距。特別是較小尺寸物體的測(cè)算,以及擁有抗干擾及其他非接觸測(cè)距環(huán)境。
(一)主動(dòng)測(cè)距技術(shù)。主動(dòng)測(cè)距,主要是指光源條件是在人為創(chuàng)設(shè)環(huán)境中滿足的,且從景物外像得到相關(guān)點(diǎn)化信息,可以適當(dāng)顯示圖像大概并進(jìn)行初步分析處理,以對(duì)計(jì)算適應(yīng)功率及信息測(cè)算程度形成水平提高。從技術(shù)種類上說,主動(dòng)測(cè)距技術(shù)可分為雷達(dá)取像、幾何光學(xué)聚焦、圖像干擾及衍射等。除了結(jié)構(gòu)光法外的測(cè)量方法均為基于物理成像,并搜集所成圖像,并得到特殊物理特征圖像。從不同的研究環(huán)境到條件所涉,以結(jié)構(gòu)光法測(cè)量作為主要技術(shù)的工程需求較為普遍,其原理為:首先在光源的設(shè)計(jì)上由人為來進(jìn)行環(huán)境考慮測(cè)算,再從其中獲取較為全面的離散點(diǎn)化信息。在離散處理后,此類圖像已經(jīng)形成了較多的物體真是特征表象。在此基礎(chǔ)上,信息需要不斷簡化與甄別、壓縮。如果分析整個(gè)物體特征信息鏈,則后期主要體現(xiàn)在對(duì)于數(shù)據(jù)的簡化分析。如今人們已經(jīng)把研究的目光轉(zhuǎn)向了結(jié)構(gòu)光測(cè)量方法的應(yīng)用,體現(xiàn)在物體形狀檢測(cè)等方面。
(二)被動(dòng)測(cè)距技術(shù)。被動(dòng)測(cè)距,對(duì)光照條件的選擇具有局限性,其主要通過對(duì)于自然光的覆蓋得以實(shí)現(xiàn)。它在圖像原始信息處理及分析匹配方面技術(shù)指向較為突出。也通過此三維物體之形狀及周圍環(huán)境深度均被顯露。在圖像原始信息基礎(chǔ)上的應(yīng)用計(jì)算,其與結(jié)構(gòu)光等相比繁雜程度較高。分析物體三維特性,著重從立體視覺內(nèi)涵入手,適應(yīng)物體自身特點(diǎn)而存在。不過相對(duì)來說獲得圖像特征才是其適應(yīng)匹配的條件保障。點(diǎn)、線、區(qū)域及結(jié)構(gòu)紋理等是物象特征的主體形式。其中物特較為基礎(chǔ)與原始的特征是前兩個(gè)特征,同時(shí)它們也是其他相關(guān)表征的前提。計(jì)算機(jī)系統(tǒng)技術(shù)測(cè)量基本原理為對(duì)攝像機(jī)進(jìn)行構(gòu)建分析,并對(duì)其圖像表征進(jìn)行特征匹配,以得到圖像不同區(qū)間的視覺差異。
五、結(jié)束語
通過對(duì)計(jì)算機(jī)視覺技術(shù)的研究,悉知其主要的應(yīng)用領(lǐng)域及技術(shù)組成。在系統(tǒng)使用的基礎(chǔ)上深入設(shè)計(jì),對(duì)系統(tǒng)主要構(gòu)成環(huán)節(jié)進(jìn)行分析。從而將三維復(fù)雜形態(tài)原理、算法及測(cè)量理論上升到實(shí)際應(yīng)用。隨著社會(huì)對(duì)于計(jì)算機(jī)的倚賴程度增加,相信該技術(shù)在建筑或者其他領(lǐng)域會(huì)有更加深入的研究及應(yīng)用。
參考文獻(xiàn):
[1]段里仁.智能交通系境在我國道路空通管理中的應(yīng)用[J].北方工業(yè)時(shí)報(bào),2012(06).
[2]王豐元.計(jì)算機(jī)視覺在建筑區(qū)間的應(yīng)用實(shí)例分析[J].河北電力學(xué)報(bào),2011(04).
關(guān)鍵詞:計(jì)算機(jī)視覺;案例推理;圖像處理;圖像描述
中圖分類號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2007)04-11102-03
1 引言
基于案例推理(case-base reasoning)是人工智能中正不斷發(fā)展的一項(xiàng)重要推理技術(shù)。基于案例推理與類比推理方法相似,案例推理將舊經(jīng)驗(yàn)或教訓(xùn)轉(zhuǎn)換為知識(shí),出現(xiàn)新問題時(shí),首先查找以前是否有相似的案例,并用相似案例解決新問題。如果沒遇到相似案例的,經(jīng)過推理后解決新問題的方法,又會(huì)成為新的案例或新經(jīng)驗(yàn),下一次再遇到相同問題時(shí),就可以復(fù)用這些案例或經(jīng)驗(yàn)。
這與人遇到問題時(shí),首先會(huì)用經(jīng)驗(yàn)思考解決問題的方式相似,這也是解決問題較好的方法?;诎咐评響?yīng)用于工業(yè)產(chǎn)品檢測(cè)或故障診斷時(shí)具有以下特點(diǎn):
CBR智能化程度較高。利用案例中隱含的難以規(guī)則化的知識(shí),以輔助規(guī)則推理的不足,提高故障診斷系統(tǒng)的智能化程度。
CBR較好解決“知識(shí)獲取”的瓶頸。CBR知識(shí)表示以案例為基礎(chǔ),案例的獲取比規(guī)則獲取要容易,大大簡化知識(shí)獲取的過。
CBR求解效率較高。是對(duì)過去的求解結(jié)果進(jìn)行復(fù)用,而不是再次從頭開始推導(dǎo),可以提高對(duì)新問題的求解效率。
CBR求解的質(zhì)量較高。CBR以過去求解成功或失敗的經(jīng)歷,可以指導(dǎo)當(dāng)前求解時(shí)該怎樣走向成功或避開失敗。
CBR持續(xù)不斷的學(xué)習(xí)能力,使得它可以適應(yīng)于將來問題的解決。
所以基于案例推理方法正不斷應(yīng)用在產(chǎn)品質(zhì)量檢測(cè)和設(shè)備故障診斷方面,并取得較好的經(jīng)濟(jì)效益。為了產(chǎn)品檢測(cè)和設(shè)備故障診斷中,更為智能化,更容易實(shí)現(xiàn)現(xiàn)場(chǎng)檢測(cè)和診斷,計(jì)算機(jī)視覺技術(shù)起到很大的作用。
計(jì)算機(jī)視覺是研究用計(jì)算機(jī)來模擬人和生物的視覺系統(tǒng)功能的技術(shù)學(xué)科,使計(jì)算機(jī)具有感知周圍視覺世界的能力。通過計(jì)算機(jī)視覺,進(jìn)行圖像的獲取預(yù)處理、圖像分割與特征抽取、識(shí)別與分類、三維信息理解、景物描述、圖像解釋,讓計(jì)算機(jī)具有對(duì)周圍世界的空間物體進(jìn)行傳感、抽象、判斷的能力,從而達(dá)到識(shí)別、理解的目的。
計(jì)算機(jī)視覺隨著科學(xué)技術(shù)發(fā)展,特別計(jì)算機(jī)技術(shù)、通信技術(shù)、圖像采集技術(shù)、傳感器技術(shù)等,以及神經(jīng)網(wǎng)絡(luò)理論、模糊數(shù)學(xué)理論、小波的分析理論等計(jì)算機(jī)視覺理論的不斷發(fā)展和日趨成熟,使計(jì)算機(jī)視覺從上世紀(jì)60年代開始興起發(fā)展到現(xiàn)在,取得快速發(fā)展,已經(jīng)從簡單圖像質(zhì)量處理發(fā)展到圍繞著紋理分析、圖像編碼、圖像分割和濾波等研究。圖像的分析與處理,也由靜止轉(zhuǎn)向運(yùn)動(dòng),由二維轉(zhuǎn)向三維,并主要著眼于對(duì)圖像的識(shí)別和理解上,也使計(jì)算機(jī)視覺的應(yīng)用領(lǐng)域更為廣泛,為案例推理中運(yùn)用計(jì)算機(jī)視覺打下基礎(chǔ)。
2 案例推理系統(tǒng)的主要關(guān)鍵技術(shù)
(1)案例的表示與組織
案例的表示與組織即是如何抽取案例的特征變量,并以一定的結(jié)構(gòu)在計(jì)算機(jī)中組織存儲(chǔ)。如何將信息抽取出特征變量,選擇什么語言描述案例和選擇什么內(nèi)容存放在案例中,案例按什么組織結(jié)構(gòu)存放在存儲(chǔ)器中,這關(guān)系到基于案例推理方法的效率,而且對(duì)于案例數(shù)量越來越多,結(jié)構(gòu)十分復(fù)雜的案例庫,尤其重要。
(2)案例的索引與檢索
案例的索引與檢索即是為了查找最佳相似案例,如何建立案例索引和相似度算法,利用檢索信息從案例庫中檢索并選擇潛在可用相似案例。后面的工作能否發(fā)揮出應(yīng)有的作用,很大程度上依賴于這一階段得到的案例質(zhì)量的高低,因此這一步非常關(guān)鍵。
(3)案例的復(fù)用和調(diào)整
案例的復(fù)用即是如何根據(jù)舊案例得出新解,涉及到找出案例與新問題之間的不同之處,案例中的哪些部分可以用于新問題,哪些部分不適合應(yīng)用于新問題的解決。而復(fù)用還分案例的結(jié)果復(fù)用,案例的求解方法復(fù)用。
(4)案例的學(xué)習(xí)
案例的學(xué)習(xí)即是將新解添加到案例庫中,擴(kuò)充案例庫的案例種類與數(shù)量,這過程也是知識(shí)獲取。此過程涉及選取哪些信息保留,以及如何把新案例有機(jī)集成到案例庫中,包括如何存儲(chǔ),如何建立索引等等。
針對(duì)案例推理的關(guān)鍵技術(shù),根據(jù)檢測(cè)和故障診斷系統(tǒng)的特點(diǎn),計(jì)算機(jī)視覺主要解決如何將產(chǎn)品圖像輸入系統(tǒng),如何將產(chǎn)品圖像特征進(jìn)行抽取和描述,如何區(qū)別產(chǎn)品不同之處。以便案例推理系統(tǒng)進(jìn)行案例建模,確立案例的表示形成和案例相似度的計(jì)算。本文主要從計(jì)算機(jī)視覺如何運(yùn)用在案例推理系統(tǒng)進(jìn)行探討。
3 產(chǎn)品輸入系統(tǒng)
產(chǎn)品輸入系統(tǒng)在不同產(chǎn)品類型和生產(chǎn)環(huán)境可能有不同之處,主要應(yīng)有傳感器單元和圖像采集單元。如圖1。
圖1 產(chǎn)品輸入系統(tǒng)結(jié)構(gòu)
傳感器單元主要判斷是否有產(chǎn)品存在,是否需要進(jìn)行圖像采集,是否繼續(xù)下一個(gè)產(chǎn)品圖像的采集。這簡單傳感器可使用光電開關(guān),配合光源,當(dāng)產(chǎn)品經(jīng)過時(shí),產(chǎn)品遮擋住光源,使光電開關(guān)產(chǎn)生一個(gè)0值,而沒有產(chǎn)品經(jīng)過時(shí),光電開關(guān)產(chǎn)生相反的1值,系統(tǒng)通過判斷光電開關(guān)的值,從而判斷是否有產(chǎn)品。
圖像采集單元簡單地說是將產(chǎn)品拍攝并形成數(shù)字化圖像,主要包括光源、反射鏡、CCD相機(jī)和圖像采集卡等組成。光源和反射鏡作用主要使圖像中的物體和背景之間有較大灰度。CCD相機(jī)主要是拍攝設(shè)備。圖像采集卡主要是將圖像數(shù)字化。通過傳感器判斷有產(chǎn)品后,光源發(fā)出的光均勻地照在被測(cè)件上,CCD相機(jī)拍攝,拍攝圖像經(jīng)過圖像采集卡數(shù)字化后輸入存儲(chǔ)設(shè)備。存儲(chǔ)設(shè)備即為計(jì)算機(jī)硬盤。存放原始圖像、數(shù)據(jù)、處理結(jié)果等。
這是案例推理系統(tǒng)的原始數(shù)據(jù),是圖像處理、圖像特征抽取描述的基礎(chǔ)。
4 圖像處理
在案例推理系統(tǒng)中,需要對(duì)案例的組織和案例建模,案例的組織即案例的表示,相對(duì)計(jì)算機(jī)而言,即圖像特征的抽取,即某圖像具有與其它圖像不同之處,用于區(qū)別其它圖像,具有唯一性。同時(shí),又能完整地表示該圖像。所以案例的表示要體現(xiàn)案例的完整性、唯一性、操作容易性。
圖像中有顏色區(qū)別、又有物體大小之分以及圖像由不同的物體組成。如何表示圖像,或說圖像內(nèi)部包含表示的本質(zhì),即圖像的描述。根據(jù)圖像特點(diǎn),確立圖像案例的表示,以圖像的像素、圖像的數(shù)字化外觀、圖像物體的數(shù)字組成等屬性。這需要對(duì)產(chǎn)品輸入的原始圖像進(jìn)行處理。
在計(jì)算機(jī)視覺技術(shù)中,對(duì)原始圖像主要進(jìn)行圖像增強(qiáng)、平滑、邊緣銳化、分割、特征抽取、圖像識(shí)別與理解等內(nèi)容。經(jīng)過這些處理后,輸出圖像的質(zhì)量得到相當(dāng)程度的改善,既改善了圖像的視覺效果,又便于計(jì)算機(jī)對(duì)圖像進(jìn)行分析、處理和識(shí)別。具體工作流程如圖2所示:
圖2 計(jì)算機(jī)視覺的任務(wù)與工作流程
圖像預(yù)處理是將產(chǎn)品的數(shù)字圖像輸入計(jì)算機(jī)后,首先要進(jìn)行圖像的預(yù)處理,主要完成對(duì)圖像噪聲的消除以及零件的邊緣提取。預(yù)處理的步驟為:圖像二值化處理;圖像的平滑處理;圖像的邊緣提取。
圖像二值化處理主將灰度圖形二值化的關(guān)鍵是閾值的選取,由于物體與背景有明顯的灰度差,可以選取根據(jù)灰度直方圖中兩峰之間的谷值作為閾值來分割目標(biāo)和背景。
圖像的平滑處理技術(shù)即圖像的去噪聲處理,主要是為了去除實(shí)際成像過程中因成像設(shè)備和環(huán)境所造成的圖像失真,提取有用信息。
圖像邊緣提取是為了將圖像中有意義的對(duì)象與其背景分開,并使之具有某種指定的數(shù)學(xué)或符號(hào)表達(dá)形式,使計(jì)算機(jī)能夠理解對(duì)象的具體含義,檢測(cè)出邊緣的圖像就可以進(jìn)行特征提取和形狀分析了。可采用多種算法,如采用Sobel算子提取邊緣。
圖像預(yù)處理是為下一步的特征描述打基礎(chǔ),預(yù)處理的好壞直接影響案例推理的結(jié)果和檢測(cè)診斷的效率。
特征提取是對(duì)圖像進(jìn)行描述,是案例建模關(guān)鍵,案例建模是根據(jù)案例組織要求抽取圖像特征,是建立案例索引和檢索的關(guān)鍵。如果圖像沒有特征,就談不上進(jìn)行檢索。圖像特征可通過圖像邊界、圖像分割、圖像的紋理等方法,確定圖像特征,包括是什么產(chǎn)品、產(chǎn)品形狀大小、產(chǎn)品顏色,產(chǎn)品有什么缺陷、產(chǎn)品缺陷在什么位置等特征,根據(jù)這些圖像特征進(jìn)行描述,形成計(jì)算機(jī)中屬性值,并從數(shù)據(jù)庫查找相應(yīng)信息資料,從而確定產(chǎn)品之間的關(guān)系,相似度,也就是案例推理的方向。
5 系統(tǒng)的檢索
根據(jù)案例推理原理和相應(yīng)算法,建立案例推理系統(tǒng)模型,如圖3所示。
圖3 案例推理系統(tǒng)
對(duì)話系統(tǒng):完成人機(jī)交互、問題描述、結(jié)果顯示和系統(tǒng)總控制。
案例庫系統(tǒng):由案例庫及案例庫管理系統(tǒng)組成。
數(shù)據(jù)析取系統(tǒng):對(duì)各種已有的源數(shù)據(jù)庫的數(shù)據(jù)通過轉(zhuǎn)換而形成所需的數(shù)據(jù)。
多庫協(xié)同器:根據(jù)問題求解的需要,按照一定的數(shù)據(jù)抽取策略,完成問題求解過程中對(duì)模型庫系統(tǒng)、方法庫系統(tǒng)、知識(shí)庫系統(tǒng)和數(shù)據(jù)庫系統(tǒng)等資源的調(diào)度與協(xié)調(diào)。
知識(shí)庫系統(tǒng):由產(chǎn)生式規(guī)則組成,這些知識(shí)包括專家經(jīng)驗(yàn)和以規(guī)則形式表示的有關(guān)知識(shí),也可以是數(shù)據(jù)挖掘結(jié)論,支持案例檢索、案例分析、案例調(diào)整等。 模型庫系統(tǒng):由模型庫、算法庫、模型庫管理系統(tǒng)組成。完成模型識(shí)別和調(diào)用,并把結(jié)果綜合,送入對(duì)話系統(tǒng)顯示,作為補(bǔ)充信息供案例檢索、調(diào)整使用。
數(shù)據(jù)庫系統(tǒng):存放待決策支持的所有問題,并完成其維護(hù)與查詢等功能。
由于系統(tǒng)主要應(yīng)用產(chǎn)品的現(xiàn)場(chǎng)實(shí)時(shí)檢測(cè)監(jiān)控或故障診斷,所以系統(tǒng)的檢索時(shí),也必須輸入檢索值,即輸入現(xiàn)場(chǎng)產(chǎn)品的圖像,在通過產(chǎn)品預(yù)處理、圖像的二值化、分割和邊界處理后,進(jìn)行圖像特征描述,根據(jù)圖像描述進(jìn)行分類識(shí)別。根據(jù)案例推理的算法檢索案例庫中,是否有相似的案例。即確定相似度。相似度確定主要由案例推理的算法確定,如貼近分析法。確定相似度最大作為結(jié)果,并將案例的解輸出,給相關(guān)控制系統(tǒng)進(jìn)行決策。如產(chǎn)品質(zhì)量檢測(cè),確定產(chǎn)品質(zhì)量是否合格,是否有不合格產(chǎn)品,不合格產(chǎn)品是什么原因造成,故障源是什么,如何解決和排除故障,等等。
6 結(jié)論
案例推理方法有效地解決計(jì)算機(jī)視覺技術(shù)中圖像檢索問題。對(duì)提高圖像檢索的效率和準(zhǔn)確度提供了平臺(tái)。
計(jì)算機(jī)視覺技術(shù)也為案例推理系統(tǒng)實(shí)現(xiàn)產(chǎn)品現(xiàn)場(chǎng)實(shí)時(shí)檢測(cè)、監(jiān)控、診斷提供技術(shù)支持。計(jì)算機(jī)視覺技術(shù)現(xiàn)場(chǎng)的數(shù)據(jù)采集、處理為案例推理打好基礎(chǔ)。
兩者的結(jié)合設(shè)計(jì)的系統(tǒng)適用范圍很廣,只要產(chǎn)品需要進(jìn)行質(zhì)量檢測(cè)、監(jiān)控,或設(shè)備需要進(jìn)行故障診斷和維護(hù),都可以適用。
系統(tǒng)提供的實(shí)時(shí)檢測(cè)、監(jiān)控和診斷功能,提高企業(yè)的生產(chǎn)效益,降低了生產(chǎn)成本。
參考文獻(xiàn):
[1](美)??希⊿onka,M).圖像處理分析與機(jī)器視覺[M].人民郵電出版社.
[2]王宏等譯.計(jì)算機(jī)視覺[M].電子工業(yè)出版社.
[3]蔡建榮.自然場(chǎng)景下成熟水果的計(jì)算機(jī)視覺識(shí)別[J].農(nóng)業(yè)機(jī)械,36(2):61-64.
[4]王宇輝.基于計(jì)算機(jī)視覺的錐體零件尺寸在線檢測(cè)算法[J].重型機(jī)械,2005,2:4-6
[5]駱志堅(jiān).基于計(jì)算機(jī)視覺檢測(cè)技術(shù)自動(dòng)計(jì)數(shù)系統(tǒng)的研究與應(yīng)用[J].儀表技術(shù)與傳感器,2005,3:41-43.
[6]左小德.貼近度分析法在案例庫推理中的應(yīng)用[J],南大學(xué)學(xué)報(bào)(自然科學(xué)版),1997,18(1):21-26.
[7]姜麗紅.案例推理在智能化預(yù)測(cè)支持系統(tǒng)中的應(yīng)用研究[J].決策與決策支持系統(tǒng),1996,6(4):63-69.
關(guān)鍵詞:數(shù)字?jǐn)z影測(cè)量 計(jì)算機(jī)視覺 多目立體視覺 影像匹配
引言
攝影測(cè)量學(xué)是一門古老的學(xué)科,若從1839年攝影術(shù)的發(fā)明算起,攝影測(cè)量學(xué)已有170多年的歷史,而被普遍認(rèn)為攝影測(cè)量學(xué)真正起點(diǎn)的是1851―1859年“交會(huì)攝影測(cè)量”的提出。在這漫長的發(fā)展過程中,攝影測(cè)量學(xué)經(jīng)歷了模擬法、解析法和數(shù)字化三個(gè)階段。模擬攝影測(cè)量和解析攝影測(cè)量分別是以立體攝影測(cè)量的發(fā)明和計(jì)算機(jī)的發(fā)明為標(biāo)志,因此很大程度上,計(jì)算機(jī)的發(fā)展決定了攝影測(cè)量學(xué)的發(fā)展。在解析攝影測(cè)量中,計(jì)算機(jī)用于大規(guī)模的空中三角測(cè)量、區(qū)域網(wǎng)平差、數(shù)字測(cè)圖,還用于計(jì)算共線方程,在解析測(cè)圖儀中起著控制相片盤的實(shí)時(shí)運(yùn)動(dòng),交會(huì)空間點(diǎn)位的作用。而出現(xiàn)在數(shù)字?jǐn)z影測(cè)量階段的數(shù)字?jǐn)z影測(cè)量工作站(digital photogrammetry workstation,DPW)就是一臺(tái)計(jì)算機(jī)+各種功能的攝影測(cè)量軟件。如果說從模擬攝影測(cè)量到解析攝影測(cè)量的發(fā)展是一次技術(shù)的進(jìn)步,那么從解析攝影測(cè)量到數(shù)字?jǐn)z影測(cè)量的發(fā)展則是一場(chǎng)技術(shù)的革命。數(shù)字?jǐn)z影測(cè)量與模擬、解析攝影測(cè)量的最大區(qū)別在于:它處理的是數(shù)字影像而不再是模擬相片,更為重要的是它開始并將不斷深入地利用計(jì)算機(jī)替代作業(yè)員的眼睛。[1-2]毫無疑問,攝影測(cè)量進(jìn)入數(shù)字?jǐn)z影測(cè)量時(shí)代已經(jīng)與計(jì)算機(jī)視覺緊密聯(lián)系在一起了[2]。
計(jì)算機(jī)視覺是一個(gè)相對(duì)年輕而又發(fā)展迅速的領(lǐng)域。其目標(biāo)是使計(jì)算機(jī)具有通過二維圖像認(rèn)知三維環(huán)境信息的能力,這種能力將不僅使機(jī)器能感知三維環(huán)境中物體的幾何信息,包括它的形狀、位置、姿態(tài)、運(yùn)動(dòng)等,而且能對(duì)它們進(jìn)行描述、存儲(chǔ)、識(shí)別與理解[3]。數(shù)字?jǐn)z影測(cè)量具有類似的目標(biāo),也面臨著相同的基本問題。數(shù)字?jǐn)z影測(cè)量學(xué)涉及多個(gè)學(xué)科,如圖像處理、模式識(shí)別以及計(jì)算機(jī)圖形學(xué)等。由于它與計(jì)算機(jī)視覺的聯(lián)系十分緊密,有些專家將其看做是計(jì)算機(jī)視覺的分支。
數(shù)字?jǐn)z影測(cè)量的發(fā)展已經(jīng)借鑒了許多計(jì)算機(jī)視覺的研究成果[4]。數(shù)字?jǐn)z影測(cè)量發(fā)展導(dǎo)致了實(shí)時(shí)攝影測(cè)量的出現(xiàn),所謂實(shí)時(shí)攝影測(cè)量是指利用多臺(tái)CCD數(shù)字?jǐn)z影機(jī)對(duì)目標(biāo)進(jìn)行影像獲取,并直接輸入計(jì)算機(jī)系統(tǒng)中,在實(shí)時(shí)軟件的幫助下,立刻獲得和提取需要的信息,并用來控制對(duì)目標(biāo)的操作[1]。在立體觀測(cè)的過程中,其主要利用計(jì)算機(jī)視覺方法實(shí)現(xiàn)計(jì)算機(jī)代替人眼。隨著數(shù)碼相機(jī)技術(shù)的發(fā)展和應(yīng)用,數(shù)字近景攝影測(cè)量已經(jīng)成為必然趨勢(shì)。近景攝影測(cè)量是利用近距離攝影取得的影像信息,研究物體大小形狀和時(shí)空位置的一門新技術(shù),它是一種基于數(shù)字信息和數(shù)字影像技術(shù)的數(shù)據(jù)獲取手段。量測(cè)型的計(jì)算機(jī)視覺與數(shù)字近景攝影測(cè)量的學(xué)科交叉將會(huì)在計(jì)算機(jī)視覺中形成一個(gè)新的分支――攝影測(cè)量的計(jì)算機(jī)視覺,但是它不應(yīng)僅僅局限于地學(xué)信息[2]。
1. 計(jì)算機(jī)視覺與數(shù)字?jǐn)z影測(cè)量的差異
1.1 目的不同導(dǎo)致二者的坐標(biāo)系和基本公式不同
攝影測(cè)量的基本任務(wù)是嚴(yán)格建立相片獲取瞬間所存在的像點(diǎn)與對(duì)應(yīng)物點(diǎn)之間的幾何關(guān)系,最終實(shí)現(xiàn)利用攝影片上的影像信息測(cè)制各種比例尺地形圖,建立地形數(shù)據(jù)庫,為各種地理信息系統(tǒng)建立或更新提供基礎(chǔ)數(shù)據(jù)。因此,它是在測(cè)繪領(lǐng)域內(nèi)發(fā)展起來的一門學(xué)科。
而計(jì)算機(jī)視覺領(lǐng)域的突出特點(diǎn)是其多樣性與不完善性。計(jì)算機(jī)視覺的主要任務(wù)是通過對(duì)采集的圖片或視頻進(jìn)行處理以獲得相應(yīng)場(chǎng)景的三維信息,因此直到計(jì)算機(jī)的性能提高到足以處理大規(guī)模數(shù)據(jù)時(shí)它才得到正式的關(guān)注和發(fā)展,而這些發(fā)展往往起源于其他不同領(lǐng)域的需要。比如在一些不適合于人工作業(yè)的危險(xiǎn)工作環(huán)境或人工視覺難以滿足要求的場(chǎng)合,常用計(jì)算機(jī)來替代人工視覺。
由于攝影測(cè)量是測(cè)繪地形圖的重要手段之一,為了測(cè)繪某一地區(qū)而攝影的所有影像,必須建立統(tǒng)一的坐標(biāo)系。而計(jì)算機(jī)視覺是研究怎樣用計(jì)算機(jī)模擬人的眼睛,因此它是以眼睛(攝影機(jī)中心)與光軸構(gòu)成的坐標(biāo)系為準(zhǔn)。因此,攝影測(cè)量與計(jì)算機(jī)視覺目的不同,導(dǎo)致它們對(duì)物體與影像之間關(guān)系的描述也不同。
1.2 二者處理流程不同
2. 可用于數(shù)字?jǐn)z影測(cè)量領(lǐng)域的計(jì)算機(jī)視覺理論――立體視覺
2.1 立體視覺
立體視覺是計(jì)算機(jī)視覺中的一個(gè)重要分支,一直是計(jì)算機(jī)視覺研究的重點(diǎn)和熱點(diǎn)之一,在20多年的發(fā)展過程中,逐漸形成了自己的方法和理論。立體視覺的基本原理是從兩個(gè)(或多個(gè))視點(diǎn)觀察同一景物,以獲取在不同視角下的感知圖像,通過三角測(cè)量原理計(jì)算像像素間的位置偏差(即視差)來獲取景物的三維信息,這一過程與人類視覺的立體感知過程是類似的。一個(gè)完整的立體視覺系統(tǒng)通??煞譃閳D像獲取、攝像機(jī)定標(biāo)、特征提取、影像匹配、深度確定及內(nèi)插等6個(gè)大部分[5]。其中影像匹配是立體視覺中最重要也是最困難的問題,也是計(jì)算機(jī)視覺和數(shù)字?jǐn)z影測(cè)量的核心問題。
2.2 影像匹配
立體視覺的最終目的是為了恢復(fù)景物可視表面的完整信息。當(dāng)空間三維場(chǎng)景被投影為二維圖像時(shí),同一景物在不同視點(diǎn)下的圖像會(huì)有很大不同,而且場(chǎng)景中的諸多因素,如光照條件,景物幾何形狀和物理特性、噪聲干擾和畸變以及攝像機(jī)特性等,都被綜合成單一的圖像中的灰度值。因此,要準(zhǔn)確地對(duì)包含了如此之多不利因素的圖像進(jìn)行無歧義的匹配,顯然是十分困難的。
在攝影測(cè)量中最基本的過程之一就是在兩幅或者更多幅的重疊影像中識(shí)別并定位同名點(diǎn),以產(chǎn)生立體影像。在模擬攝影測(cè)量和解析攝影測(cè)量中,同名點(diǎn)的識(shí)別是通過人工操作方式完成的;而在數(shù)字?jǐn)z影測(cè)量中則利用計(jì)算機(jī)代替人工解決同名點(diǎn)識(shí)別的問題,即采用影像匹配的方法。
2.3 多目立體視覺
根據(jù)單張相片只能確定地面某個(gè)點(diǎn)的方向,不能確定地面點(diǎn)的三維空間位置,而有了立體像對(duì)則可構(gòu)成與地面相似的立體模型,解求地面點(diǎn)的空間位置。雙目立體視覺由不同位置的兩臺(tái)或者一臺(tái)攝像機(jī)(CCD)經(jīng)過移動(dòng)或旋轉(zhuǎn)拍攝同一幅場(chǎng)景,就像人有了兩只眼睛,才能看三維立體景觀一樣,然后通過計(jì)算空間點(diǎn)在兩幅圖像中的視差,獲得該點(diǎn)的三維坐標(biāo)值。現(xiàn)在的數(shù)字?jǐn)z影測(cè)量中的立體像對(duì)技術(shù)通常是在一條基線上進(jìn)行的,但是由于采用計(jì)算機(jī)匹配替代人眼測(cè)定影像同名像對(duì)時(shí)存在大量的誤匹配,使自動(dòng)匹配的結(jié)果很不可靠。其存在的問題主要是,對(duì)存在特殊結(jié)構(gòu)的景物,如平坦、缺乏紋理細(xì)節(jié)、周期性的重復(fù)特征等易產(chǎn)生假匹配;在攝像機(jī)基線距離增大時(shí),遮擋嚴(yán)重,能重建的空間點(diǎn)減少。為了解決這些問題,降低雙目匹配的難度,自1986年以來出現(xiàn)了三目立體視覺系統(tǒng),即采用3個(gè)攝像機(jī)同時(shí)攝取空間景物,通過利用第三目圖像提供的信息來消除匹配的歧義性[5]。采用“多目立體視覺技術(shù)”可以利用攝影測(cè)量的空中三角測(cè)量原理,對(duì)多度重疊點(diǎn)進(jìn)行“多方向的前方交會(huì)”,既能較有效地解決隨機(jī)的誤匹配問題,同時(shí)又能增加交會(huì)角,提高高程測(cè)量的精度[2]。這項(xiàng)技術(shù)的應(yīng)用,將很大程度地解決自動(dòng)匹配結(jié)果的不可靠性,提高數(shù)字?jǐn)z影測(cè)量系統(tǒng)的準(zhǔn)確性。
關(guān)鍵詞:目標(biāo)跟蹤;CAMSHIFT算法;OpenCV;顏色直方圖
中圖分類號(hào):TP391文獻(xiàn)標(biāo)識(shí)碼:B文章編號(hào):1004373X(2008)2012803
Moving Object Tracking Method and Implement Based on OpenCV
LI Zhenwei1,2,CHEN Chong1,2,ZHAO You1
(1.Changchun Observatory,National Astronomical Observatories,Chinese Academy of Sciences,Changchun,130117,China;
2.Graduate School,Chinese Academy of Sciences,Beijing,100049,China)
Abstract:CAMSHIFT is an object tracking algorithm based onthe color histogram.In the process of object tracking,CAMSHIFT operates on a color back-projection image produced from object histogram model in current frame and finds the location and size of the current frame by adaptively adjusting the size and the location of the searching windows according to the tracking results of the previous frame in the video.On the basis of introducing OpenCV(an Intel open source computer vision library),through CAMSHIFT algorithm,the paper realizes moving object tracking and resolves some problems including distractor and occlusion by other objects.Experimental results show good performances,superiority and feasibility of the algorithm.
Keywords:object tracking;CAMSHIFT algorithm;OpenCV;color histogram
目標(biāo)跟蹤是計(jì)算機(jī)視覺的一個(gè)重要分支,日益廣泛應(yīng)用于科學(xué)技術(shù)、國防安全、航空、醫(yī)藥衛(wèi)生以及國民經(jīng)濟(jì)等領(lǐng)域。實(shí)現(xiàn)目標(biāo)跟蹤的關(guān)鍵在于完整地分割目標(biāo)、合理提取特征和準(zhǔn)確地識(shí)別目標(biāo),同時(shí),要考慮算法實(shí)現(xiàn)的時(shí)間,以保證實(shí)時(shí)性。當(dāng)視頻圖像中被跟蹤目標(biāo)發(fā)生姿態(tài)變化,存在旋轉(zhuǎn)或部分遮擋時(shí),簡單的灰度模板或者Hausdorff距離匹配一般很難達(dá)到實(shí)時(shí)跟蹤目標(biāo)的要求,出現(xiàn)誤匹配或者跟蹤丟失的情況,而且跟蹤效率較低。
Gary R.Bradski提出的CAMSHIFT[1](Continuously Adaptive Mean Shift)算法是以顏色直方圖為目標(biāo)模式的目標(biāo)跟蹤算法,可以有效地解決目標(biāo)變形和部分遮擋的問題,而且運(yùn)算效率很高。該文首先詳細(xì)介紹CAMSHIFT算法,并結(jié)合Intel公司開發(fā)的開源OpenCV計(jì)算機(jī)視覺庫,實(shí)現(xiàn)了運(yùn)動(dòng)目標(biāo)跟蹤,并驗(yàn)證了CAMSHIFT算法的有效性以及展現(xiàn)OpenCV計(jì)算機(jī)視覺庫的靈活性和優(yōu)越性。
1 CAMSHIFT算法
由于RGB顏色空間對(duì)光照亮度變化比較敏感[2],為了減少光照亮度變化對(duì)跟蹤效果的影響,CAMSHIFT算法將圖像由RGB顏色空間轉(zhuǎn)化到HSV(Hue,Saturation,Value)顏色空間再進(jìn)行后續(xù)處理。
圖1是CAMSHIFT算法流程。首先選擇大小為S的初始搜索窗口,然后對(duì)該窗口中每一個(gè)像素點(diǎn)的H通道上采樣,得到運(yùn)動(dòng)目標(biāo)的色調(diào)(Hue)直方圖,再將該直方圖保存下來作為搜索目標(biāo)的顏色直方圖模型。在目標(biāo)跟蹤過程中,對(duì)攝像頭當(dāng)前幀圖像的每一個(gè)像素,通過查詢目標(biāo)的顏色直方圖模型,可以得到該像素為目標(biāo)像素的概率。經(jīng)上述預(yù)處理,視頻中每一幀圖像都轉(zhuǎn)化為目標(biāo)顏色概率分布圖,也稱為目標(biāo)顏色投影圖。在一般情況下,將投影圖轉(zhuǎn)化為8位的灰度投影圖,概率為1的像素值設(shè)為255,概率為0的像素值為0,其他像素也轉(zhuǎn)換為相應(yīng)的灰度值。
圖1中虛線部分是CAMSHIFT算法的核心。設(shè)點(diǎn)(x,y)為搜索窗口中的像素位置,I(x,y)是投影圖中(x,y)處的像素值。為此,定義搜索窗口的零階矩M00和一階矩M01,M10分別如下:
M00=∑x∑yI(x,y)
M01=∑x∑yyI(x,y)
M10=∑x∑yxI(x,y)
圖1 CAMSHIFT算法跟蹤流程
該搜索窗口的質(zhì)心位置為:
(xc,yc)=(M10/M00,M01/M00)
計(jì)算跟蹤目標(biāo)的方向和尺寸:
二階矩:
M20=∑x∑yx2I(x,y)
M02=∑x∑yy2I(x,y)
M11=∑x∑yxyI(x,y)
令:
a =M20 /M00 -x2c,b=2(M11/M00-xcyc),
c =M02 /M00 -y2c
目標(biāo)長軸的方向角為:
θ=12tan-1(ba-c)
圖像中目標(biāo)的長軸和短軸的長度計(jì)算公式:
l=(a+c)+b2+(a-c)22,
w=(a+c)-b2+(a-c)22
然后,根據(jù)零階矩M00調(diào)整搜索窗口的大小,并將搜索窗口的中心移動(dòng)到質(zhì)心,如果移動(dòng)距離大于預(yù)先設(shè)定的固定閾值,則重新計(jì)算調(diào)整后的窗口質(zhì)心,進(jìn)行新一輪的窗口位置和尺寸調(diào)整,直到窗口中心與質(zhì)心間的距離小于預(yù)設(shè)的固定閾值,或者循環(huán)運(yùn)算的次數(shù)達(dá)到某一最大值,認(rèn)為收斂條件滿足,進(jìn)入下一幀圖像進(jìn)行心的目標(biāo)搜索。在下一幀圖像中,利用上一幀圖像中最終得到的窗口質(zhì)心位置和S=2M00256來設(shè)置新的搜索窗口位置和尺寸。CAMSHIFT跟蹤算法在視頻單幀內(nèi)與幀間都根據(jù)上一步得到的M00自適應(yīng)地調(diào)整搜索窗口的大小,因而可以適應(yīng)跟蹤目標(biāo)動(dòng)態(tài)變形的情況。
2 計(jì)算機(jī)視覺類庫OpenCV簡介
開放源代碼的計(jì)算機(jī)視覺類庫OpenCV( Intel@ Open Source Computer Vision Library)由英特爾公司位于俄羅斯的研究實(shí)驗(yàn)室所開發(fā),它是一套可免費(fèi)獲得的、由一些C函數(shù)和C++類所組成的庫,用來實(shí)現(xiàn)一些常用的圖像處理及計(jì)算機(jī)視覺算法。
OpenCV主要用于對(duì)圖像進(jìn)行一些高級(jí)處理,比如說特征檢測(cè)與跟蹤、運(yùn)動(dòng)分析、目標(biāo)分割與識(shí)別以及3D重建等。
與其他計(jì)算機(jī)視覺工具相比,OpenCV的優(yōu)越性如表1所示:
表1 圖像處理、計(jì)算機(jī)視覺工具比較(IPL,openCV,IPP,visDSK與 Matlab)
開發(fā)工具開發(fā)單位應(yīng)用領(lǐng)域免費(fèi)情況源碼公開與否備注
IPLIntel圖像處理Free不公開已被并入到IPP
OpenCVIntel圖像處理、計(jì)算機(jī)視覺Free公開基于Intel芯片代碼優(yōu)化
IPPIntel集成開發(fā)環(huán)境庫(圖像處理、信號(hào)處理等)Not free不公開基于Intel芯片代碼優(yōu)化
VisDSKMircrosoft圖像處理Free公開無優(yōu)化
MatlabMathWorks多學(xué)科、多種工作平臺(tái)Not free不公開速度慢,不宜編譯成可執(zhí)行文件
OpenCV是Intel公司開發(fā)的圖像處理和計(jì)算機(jī)視覺函數(shù)庫,它有以下特點(diǎn):
(1) 開放C及C++源碼;
(2)基于Intel處理器指令集開發(fā)的優(yōu)化代碼;
(3)統(tǒng)一的結(jié)構(gòu)和功能定義;
(4)強(qiáng)大的圖像和矩陣運(yùn)算能力;
(5)方便靈活的用戶接口;
(6) 同時(shí)支持MS-Windows,Linux平臺(tái);
(7) 在速度上OpenCV還有Intel 公司的mmx和ssl優(yōu)化。
2.1 OpenCV的數(shù)據(jù)結(jié)構(gòu)
OpenCV設(shè)計(jì)一些基本數(shù)據(jù)類型,基本的數(shù)據(jù)類型包括:圖像類的IplImage,矩陣類的CvMat,可變集合類的CvSeq,CvSet,CvGraph以及用于多維柱狀圖的混合類CvHistogram。輔助數(shù)據(jù)類型包括:用于表示二維點(diǎn)坐標(biāo)的CvPoint,用于表示圖像寬和高的CvSize等。
2.2 OpenCV的函數(shù)體系
OpenCV中每個(gè)函數(shù)的命名都以“cv”開始,然后是該函數(shù)的行為及目標(biāo)。例如用來創(chuàng)建圖像的函數(shù)“cvCreateImage”,載入圖像的函數(shù)“cvLoadImage”。OpenCV是為圖像處理及計(jì)算機(jī)視覺在實(shí)際工程中的應(yīng)用而設(shè)計(jì)的一個(gè)類庫,其中所有的函數(shù)都由于其在實(shí)際應(yīng)用中所實(shí)現(xiàn)的不同的功能而分屬不同的類型,主要的函數(shù)類型有:
(1) 基本的圖像處理與分析函數(shù)。
這個(gè)類型的函數(shù)主要用于實(shí)現(xiàn)一些基本的圖像處理與分析功能,例如圖像平滑函數(shù)cvSmooth,Sobel算子cvSobe,l Canny邊緣分割函數(shù)cvCanny等。
(2) 結(jié)構(gòu)分析函數(shù)。
包括有輪廓處理函數(shù),幾何學(xué)函數(shù)以及平面細(xì)分函數(shù)。
(3) 運(yùn)動(dòng)分析與目標(biāo)跟蹤函數(shù)。
包括有用于運(yùn)動(dòng)分析與目標(biāo)跟蹤的函數(shù),例如背景重建函數(shù)cvAcc,用光流法或動(dòng)態(tài)輪廓模型來實(shí)現(xiàn)目標(biāo)跟蹤的函數(shù)cvCalcOpticalFlowBM和cvSnakeImage以及卡爾曼濾波函數(shù)CvKalman等。
(4) 攝像機(jī)標(biāo)定和3D重建函數(shù)。
包括有用于攝像機(jī)標(biāo)定,姿態(tài)估計(jì)以及從兩個(gè)攝像機(jī)進(jìn)行3D相似重構(gòu)的函數(shù)。
(5) GUI與視頻處理函數(shù)。
包括有高級(jí)圖形用戶接口highGUI用以實(shí)現(xiàn)對(duì)圖像的載入、顯示及保存等基本操作以及用以實(shí)現(xiàn)視頻輸入輸出及處理的函數(shù)。
3 CAMSHIFT算法實(shí)現(xiàn)
在OpenCV庫中,CvCamShiftTracker類就是用來實(shí)現(xiàn)CAMSHIFT算法的,使得進(jìn)行二次開發(fā)變得很簡單。該函數(shù)為:
int cvCamShift( const CvArr* prob_image,CvRect window,CvTermCriteria criteria,CvConnectedComp* comp,CvBox2D* box=NULL );
prob_image:目標(biāo)直方圖的反向投影
window:初始搜索窗口
criteria:確定窗口搜索停止的準(zhǔn)則
comp:生成的結(jié)構(gòu),包含收斂的搜索窗口坐標(biāo) (comprect 字段) 與窗口內(nèi)部所有像素點(diǎn)的和 (comparea 字段).
box:目標(biāo)的帶邊界盒子。如果非 NULL,則包含目標(biāo)的尺寸和方向。
利用該函數(shù),在VC6.0開發(fā)環(huán)境下,就容易實(shí)現(xiàn)CAMSHIFT算法跟蹤運(yùn)動(dòng)物體,圖2是程序界面:
圖2 CAMSHIFT跟蹤界面
4 實(shí)驗(yàn)結(jié)果與分析
在本實(shí)驗(yàn)中,用一個(gè)攝像頭來跟蹤一運(yùn)動(dòng)物體,下面圖3~圖6一系列圖像是采用CAMSHIFT算法跟蹤運(yùn)動(dòng)物體部分圖像。
圖3 攝像頭拍到的場(chǎng)景
圖4 手動(dòng)選中的目標(biāo)物體
圖5 物體快速移動(dòng)時(shí)跟蹤目標(biāo)
圖6 物體發(fā)生旋轉(zhuǎn)、變形時(shí)跟蹤目標(biāo)物體
由此可見,基于顏色直方圖的CAMSHIFT算法可以有效地解決目標(biāo)變形和旋轉(zhuǎn)問題,而且運(yùn)算效率很高,可以實(shí)時(shí)跟蹤運(yùn)動(dòng)目標(biāo)。
5 結(jié) 語
本文在詳細(xì)分析CAMSHIFT算法原理的基礎(chǔ)上,采用Intel公司開發(fā)的OpenCV視覺庫,在VC6.0開發(fā)環(huán)境下,實(shí)現(xiàn)了運(yùn)動(dòng)目標(biāo)實(shí)時(shí)跟蹤,解決了目標(biāo)旋轉(zhuǎn)、變形、部分遮擋問題。同時(shí),可以看到,在開源庫OpenCV的基礎(chǔ)上,根據(jù)自己所開發(fā)應(yīng)用程序所要實(shí)現(xiàn)的功能選擇所需的庫函數(shù),能夠大大減少在計(jì)算機(jī)視覺領(lǐng)域中的開發(fā)時(shí)間和精力,縮短程序開發(fā)的周期。
參考文獻(xiàn)
[1]Bradski G puter Video Face Tracking for Use in a Perceptual User Interface[J].Intel Technology Journal,1998,2:214-219.
[2]Boye M.The Effects of Caputre Conditions on the CAMSHIFT Face Tracker[R].Alberta,Canada:Department of Computer Science,University of Calgary,2001.
[3]Comaniciu D,Ramesh V,Meer R.Real-time Tracking of Non-rigid Objects Using Meanshift[A].Proceeding of the IEEE Conference on Computer Vision and Pattern Recognition[C].Dublin,Ireland,2000,2:142-149.
[4]張宏志,張金換,黃世霖,等.基于Camshift的目標(biāo)跟蹤算法[J].Computer Engineering and Design,2006,27(11):2 012-2 014.
[5]劉雪,常發(fā)亮,王華杰.基于改進(jìn)Camshift算法的視頻對(duì)象跟蹤方法[J].微計(jì)算機(jī)信息,2007(21):297-298,305.
[6]孫鑫,余安平.VC++深入詳解[M].北京:電子工業(yè)出版社,2006.
[7]劉瑞禎,于仕琪.OpenCV教程基礎(chǔ)篇[M].北京:北京航空航天大學(xué)出版社,2007.
[8]Intel Open Source Computer Vision Library Reference Manual[EB/OL]./research/mrl/research/opencv/.
[9]/hunnish.
[10]/group/OpenCV.
作者簡介 李振偉 男,1983年出生,河南安陽人,碩士研究生。研究方向?yàn)橐曨l運(yùn)動(dòng)目標(biāo)跟蹤。
陳 碩士研究生。
計(jì)算機(jī)技術(shù) 計(jì)算機(jī)維護(hù) 計(jì)算機(jī)安全 計(jì)算機(jī)畢業(yè)論 計(jì)算機(jī)理論 計(jì)算機(jī)軟件 計(jì)算機(jī)英語 計(jì)算機(jī)畢業(yè) 計(jì)算機(jī)網(wǎng)絡(luò) 計(jì)算機(jī)病毒 紀(jì)律教育問題 新時(shí)代教育價(jià)值觀