有關(guān)圖像識(shí)別的基礎(chǔ)介紹
圖像識(shí)別可能是以圖像的主要特征為基礎(chǔ)的。每個(gè)圖像都有它的特征,如字母A有個(gè)尖,P有個(gè)圈、而Y的核心有個(gè)銳角等。對(duì)圖像識(shí)別時(shí)眼動(dòng)的研究表明,視線總是集中在圖像的主要特征上,也就是集中在圖像輪廓曲度大或輪廓方向突然改變的地方,這些地方的信息量大。而且眼睛的掃描路線也總是依次從一個(gè)特征轉(zhuǎn)到另一個(gè)特征上。由此可見,在圖像識(shí)別過(guò)程中,知覺(jué)機(jī)制排除輸入的多余信息,抽出關(guān)鍵的信息。同時(shí),在大腦里必定有一個(gè)負(fù)責(zé)整合信息的機(jī)制,它能把分階段獲得的信息整理成一個(gè)完整的知覺(jué)映象。
在人類圖像識(shí)別系統(tǒng)中,對(duì)復(fù)雜圖像的識(shí)別往往要通過(guò)不同層次的信息加工才能實(shí)現(xiàn)。對(duì)于熟悉的圖形,由于掌握了它的主要特征,就會(huì)把它當(dāng)作一個(gè)單元來(lái)識(shí)別,而不再注意它的細(xì)節(jié)了。這種由孤立的單元材料組成的整體單位叫做組塊,每一個(gè)組塊是同時(shí)被感知的。在文字材料的識(shí)別中,人們不僅可以把一個(gè)漢字的筆劃或偏旁等單元組成一個(gè)組塊,而且能把經(jīng)常在一起出現(xiàn)的字或詞組成組塊單位來(lái)加以識(shí)別。
在計(jì)算機(jī)視覺(jué)識(shí)別系統(tǒng)中,圖像內(nèi)容通常用圖像特征進(jìn)行描述。事實(shí)上,基于計(jì)算機(jī)視覺(jué)的圖像檢索也可以分為類似文本搜索引擎的三個(gè)步驟:提取特征、建索引build以及查詢。