圖像識別是以圖像的主要特征為基礎。每個圖像都有它的特征,對圖像識別時眼動的研究表明,視線總是集中在圖像的主要特征上,也就是集中在圖像輪廓曲度最大或輪廓方向突然改變的地方,這些地方的信息量最大;而且眼睛的掃描路線也總是依次從一個特征轉到另一個特征上。
本教程操作環(huán)境:windows7系統(tǒng)、Dell G3電腦。
圖像識別技術是人工智能的一個重要領域。它是指對圖像進行對象識別,以識別各種不同模式的目標和對像的技術。
圖像識別的發(fā)展經歷了三個階段:文字識別、數字圖像處理與識別、物體識別。圖像識別,顧名思義,就是對圖像做出各種處理、分析,最終識別我們所要研究的目標。今天所指的圖像識別并不僅僅是用人類的肉眼,而是借助計算機技術進行識別。
圖像識別技術原理
計算機的圖像識別技術和人類的圖像識別在原理上并沒有本質的區(qū)別,人類的圖像識別都是依靠圖像所具有的本身特征分類,然后通過各個類別所具有的特征將圖像識別出來的,當看到一張圖片時,我們的大腦會迅速感應到是否見過此圖片或與其相似的圖片。
在這個過程中,我們的大腦會根據存儲記憶中已經分好的類別進行識別,查看是否有與該圖像具有相同或類似特征的存儲記憶,從而識別出是否見過該圖像。
圖像識別技術可能是以圖像的主要特征為基礎的。每個圖像都有它的特征,如字母A有個尖,P有個圈、而Y的中心有個銳角等。對圖像識別時眼動的研究表明,視線總是集中在圖像的主要特征上,也就是集中在圖像輪廓曲度最大或輪廓方向突然改變的地方,這些地方的信息量最大。而且眼睛的掃描路線也總是依次從一個特征轉到另一個特征上。由此可見,在圖像識別過程中,知覺機制必須排除輸入的多余信息,抽出關鍵的信息。同時,在大腦里必定有一個負責整合信息的機制,它能把分階段獲得的信息整理成一個完整的知覺映象。
模式識別是人工智能和信息科學的重要組成部分。模式識別是指對表示事物或現象的不同形式的信息做分析和處理從而得到一個對事物或現象做出描述、辨認和分類等的過程。
圖像識別技術是以圖像的主要特征為基礎的。每個圖像都有它的特征,對圖像識別時眼動的研究表明,視線總是集中在圖像的主要特征上,也就是集中在圖像輪廓曲度最大或輪廓方向突然改變的地方,這些地方的信息量最大。而且眼睛的掃描路線也總是依次從一個特征轉到另一個特征上。由此可見,在圖像識別過程中,知覺機制必須排除輸入的多余信息,抽出關鍵的信息。同時,在大腦里必定有一個負責整合信息的機制,它能把分階段獲得的信息整理成一個完整的知覺映象。
圖像識別技術的過程
既然計算機的圖像識別技術與人類的圖像識別原理相同,那它們的過程也是大同小異的。圖像識別技術的過程分以下幾步:信息的獲取、預處理、特征抽取和選擇、分類器設計和分類決策。
信息的獲取是指通過傳感器,將光或聲音等信息轉化為電信息。也就是獲取研究對象的基本信息并通過某種方法將其轉變?yōu)闄C器能夠認識的信息。
預處理主要是指圖像處理中的去噪、平滑、變換等的操作,從而加強圖像的重要特征。
特征抽取和選擇是指在模式識別中,需要進行特征的抽取和選擇。簡單的理解就是我們所研究的圖像是各式各樣的,如果要利用某種方法將它們區(qū)分開,就要通過這些圖像所具有的本身特征來識別,而獲取這些特征的過程就是特征抽取。
在特征抽取中所得到的特征也許對此次識別并不都是有用的,這個時候就要提取有用的特征,這就是特征的選擇。特征抽取和選擇在圖像識別過程中是非常關鍵的技術之一,所以對這一步的理解是圖像識別的重點。
圖像識別技術應用都有哪些?
圖像識別分為生物識別、物體與場景識別和視頻識別。其中生物識別包括指紋、掌形、眼睛(視網膜和虹膜)、臉型等;物體與場景識別包括:簽名、語音、行走的步態(tài)、擊打鍵盤的力度等。
圖像識別是一個綜合性的問題,涵蓋圖像匹配、圖像分類、圖像檢索、人臉檢測、行人檢測等技術,并在互聯網搜索引擎、自動駕駛、醫(yī)學分析、遙感分析等領域具有廣泛的應用價值。