圖像識(shí)別是以圖像的主要特征為基礎(chǔ)。每個(gè)圖像都有它的特征,對(duì)圖像識(shí)別時(shí)眼動(dòng)的研究表明,視線(xiàn)總是集中在圖像的主要特征上,也就是集中在圖像輪廓曲度最大或輪廓方向突然改變的地方,這些地方的信息量最大;而且眼睛的掃描路線(xiàn)也總是依次從一個(gè)特征轉(zhuǎn)到另一個(gè)特征上。
本教程操作環(huán)境:windows7系統(tǒng)、Dell G3電腦。
圖像識(shí)別技術(shù)是人工智能的一個(gè)重要領(lǐng)域。它是指對(duì)圖像進(jìn)行對(duì)象識(shí)別,以識(shí)別各種不同模式的目標(biāo)和對(duì)像的技術(shù)。
圖像識(shí)別的發(fā)展經(jīng)歷了三個(gè)階段:文字識(shí)別、數(shù)字圖像處理與識(shí)別、物體識(shí)別。圖像識(shí)別,顧名思義,就是對(duì)圖像做出各種處理、分析,最終識(shí)別我們所要研究的目標(biāo)。今天所指的圖像識(shí)別并不僅僅是用人類(lèi)的肉眼,而是借助計(jì)算機(jī)技術(shù)進(jìn)行識(shí)別。
圖像識(shí)別技術(shù)原理
計(jì)算機(jī)的圖像識(shí)別技術(shù)和人類(lèi)的圖像識(shí)別在原理上并沒(méi)有本質(zhì)的區(qū)別,人類(lèi)的圖像識(shí)別都是依靠圖像所具有的本身特征分類(lèi),然后通過(guò)各個(gè)類(lèi)別所具有的特征將圖像識(shí)別出來(lái)的,當(dāng)看到一張圖片時(shí),我們的大腦會(huì)迅速感應(yīng)到是否見(jiàn)過(guò)此圖片或與其相似的圖片。
在這個(gè)過(guò)程中,我們的大腦會(huì)根據(jù)存儲(chǔ)記憶中已經(jīng)分好的類(lèi)別進(jìn)行識(shí)別,查看是否有與該圖像具有相同或類(lèi)似特征的存儲(chǔ)記憶,從而識(shí)別出是否見(jiàn)過(guò)該圖像。
圖像識(shí)別技術(shù)可能是以圖像的主要特征為基礎(chǔ)的。每個(gè)圖像都有它的特征,如字母A有個(gè)尖,P有個(gè)圈、而Y的中心有個(gè)銳角等。對(duì)圖像識(shí)別時(shí)眼動(dòng)的研究表明,視線(xiàn)總是集中在圖像的主要特征上,也就是集中在圖像輪廓曲度最大或輪廓方向突然改變的地方,這些地方的信息量最大。而且眼睛的掃描路線(xiàn)也總是依次從一個(gè)特征轉(zhuǎn)到另一個(gè)特征上。由此可見(jiàn),在圖像識(shí)別過(guò)程中,知覺(jué)機(jī)制必須排除輸入的多余信息,抽出關(guān)鍵的信息。同時(shí),在大腦里必定有一個(gè)負(fù)責(zé)整合信息的機(jī)制,它能把分階段獲得的信息整理成一個(gè)完整的知覺(jué)映象。
模式識(shí)別是人工智能和信息科學(xué)的重要組成部分。模式識(shí)別是指對(duì)表示事物或現(xiàn)象的不同形式的信息做分析和處理從而得到一個(gè)對(duì)事物或現(xiàn)象做出描述、辨認(rèn)和分類(lèi)等的過(guò)程。
圖像識(shí)別技術(shù)是以圖像的主要特征為基礎(chǔ)的。每個(gè)圖像都有它的特征,對(duì)圖像識(shí)別時(shí)眼動(dòng)的研究表明,視線(xiàn)總是集中在圖像的主要特征上,也就是集中在圖像輪廓曲度最大或輪廓方向突然改變的地方,這些地方的信息量最大。而且眼睛的掃描路線(xiàn)也總是依次從一個(gè)特征轉(zhuǎn)到另一個(gè)特征上。由此可見(jiàn),在圖像識(shí)別過(guò)程中,知覺(jué)機(jī)制必須排除輸入的多余信息,抽出關(guān)鍵的信息。同時(shí),在大腦里必定有一個(gè)負(fù)責(zé)整合信息的機(jī)制,它能把分階段獲得的信息整理成一個(gè)完整的知覺(jué)映象。
圖像識(shí)別技術(shù)的過(guò)程
既然計(jì)算機(jī)的圖像識(shí)別技術(shù)與人類(lèi)的圖像識(shí)別原理相同,那它們的過(guò)程也是大同小異的。圖像識(shí)別技術(shù)的過(guò)程分以下幾步:信息的獲取、預(yù)處理、特征抽取和選擇、分類(lèi)器設(shè)計(jì)和分類(lèi)決策。
信息的獲取是指通過(guò)傳感器,將光或聲音等信息轉(zhuǎn)化為電信息。也就是獲取研究對(duì)象的基本信息并通過(guò)某種方法將其轉(zhuǎn)變?yōu)闄C(jī)器能夠認(rèn)識(shí)的信息。
預(yù)處理主要是指圖像處理中的去噪、平滑、變換等的操作,從而加強(qiáng)圖像的重要特征。
特征抽取和選擇是指在模式識(shí)別中,需要進(jìn)行特征的抽取和選擇。簡(jiǎn)單的理解就是我們所研究的圖像是各式各樣的,如果要利用某種方法將它們區(qū)分開(kāi),就要通過(guò)這些圖像所具有的本身特征來(lái)識(shí)別,而獲取這些特征的過(guò)程就是特征抽取。
在特征抽取中所得到的特征也許對(duì)此次識(shí)別并不都是有用的,這個(gè)時(shí)候就要提取有用的特征,這就是特征的選擇。特征抽取和選擇在圖像識(shí)別過(guò)程中是非常關(guān)鍵的技術(shù)之一,所以對(duì)這一步的理解是圖像識(shí)別的重點(diǎn)。
圖像識(shí)別技術(shù)應(yīng)用都有哪些?
圖像識(shí)別分為生物識(shí)別、物體與場(chǎng)景識(shí)別和視頻識(shí)別。其中生物識(shí)別包括指紋、掌形、眼睛(視網(wǎng)膜和虹膜)、臉型等;物體與場(chǎng)景識(shí)別包括:簽名、語(yǔ)音、行走的步態(tài)、擊打鍵盤(pán)的力度等。
圖像識(shí)別是一個(gè)綜合性的問(wèn)題,涵蓋圖像匹配、圖像分類(lèi)、圖像檢索、人臉檢測(cè)、行人檢測(cè)等技術(shù),并在互聯(lián)網(wǎng)搜索引擎、自動(dòng)駕駛、醫(yī)學(xué)分析、遙感分析等領(lǐng)域具有廣泛的應(yīng)用價(jià)值。