人臉識(shí)別是指利用分析比較人臉視覺(jué)特征信息進(jìn)行身份鑒別的計(jì)算機(jī)技術(shù),其可以定義為:輸入查詢場(chǎng)景中的靜止圖像或者視頻,使用人臉數(shù)據(jù)庫(kù)識(shí)別或驗(yàn)證場(chǎng)景中的一個(gè)人或者多個(gè)人,通常也被稱為面部識(shí)別、人像識(shí)別。人臉識(shí)別具有非強(qiáng)制性、非接觸性、并發(fā)性等特點(diǎn),因此研究者在上世紀(jì)六、七十年代就開(kāi)始了人臉識(shí)別技術(shù)的研究。
進(jìn)入九十年代后,隨著高性能計(jì)算機(jī)的發(fā)展,人臉識(shí)別技術(shù)獲得了重大突破。美國(guó)國(guó)家標(biāo)準(zhǔn)技術(shù)局(NIST)舉辦的FRVT2000(FaceRecognitionVendorTest2006)通過(guò)大規(guī)模的人臉數(shù)據(jù)庫(kù)測(cè)試表明,人臉識(shí)別技術(shù)的識(shí)別精度要比FRVT2002至少提高了一個(gè)數(shù)量級(jí)。部分識(shí)別算法的精度超過(guò)了人類的平均水平。對(duì)于高分辨率、高質(zhì)量的正面人臉的識(shí)別率達(dá)到100%。
人臉識(shí)別技術(shù)的難點(diǎn)
雖然人臉識(shí)別技術(shù)經(jīng)歷了較長(zhǎng)的研究階段,但至今還是被認(rèn)為是生物特征識(shí)別技術(shù)中較為困難的研究課題之一,其原因在于:
1.背景環(huán)境的復(fù)雜多樣
在進(jìn)行人臉識(shí)別前需要先對(duì)監(jiān)控場(chǎng)景中的人臉進(jìn)行定位,即人臉檢測(cè)。人臉檢測(cè)的正確與否直接影響人臉識(shí)別性能。當(dāng)監(jiān)控場(chǎng)景的背景較為復(fù)雜時(shí),人臉檢測(cè)率也會(huì)隨之降低,因此能夠適應(yīng)復(fù)雜背景環(huán)境的人臉檢測(cè)算法是人臉識(shí)別技術(shù)的難點(diǎn)之一。
2.光照條件的復(fù)雜多變
在智能視頻監(jiān)控系統(tǒng)的實(shí)際應(yīng)用中,會(huì)由于監(jiān)控環(huán)境光線的變化造成檢測(cè)到的人臉圖像存在不同的陰暗變化,如圖1所示。FRVT2006測(cè)試表明,不同光照條件下人臉識(shí)別雖然在性能上比FRVT2002有顯著提高,但是還沒(méi)在根本上克服光照對(duì)識(shí)別率的影響。
在實(shí)際應(yīng)用過(guò)程中,人臉的表情隨時(shí)都可能發(fā)生變化。下圖給出了部分表情變化的人臉圖像。從下圖可以看出,當(dāng)人的表情發(fā)生變化時(shí),可能會(huì)引起人臉輪廓以及紋理的變化,同時(shí)由于面部肌肉的牽引,面部的特征點(diǎn)的位置也會(huì)隨之改變。不同的表情引起面部的變化都不同,此外,不同的人的相同表情影響也不相同,因此很難用統(tǒng)一的標(biāo)準(zhǔn)來(lái)劃分各種表情對(duì)不同人的影響。
4.采集人臉的角度多樣性
人臉的角度多樣性主要是指由于拍攝角度的不同導(dǎo)致檢測(cè)到的人臉圖像的旋轉(zhuǎn),包括平面旋轉(zhuǎn)和深度旋轉(zhuǎn)。圖3列出了部分不同角度拍攝的人臉圖像。從下圖可以看出,與表情變化對(duì)人臉圖像的影響相同,拍攝角度的變化同樣會(huì)導(dǎo)致人臉輪廓的變化,除此之外,由于角度的變化,可能會(huì)導(dǎo)致人臉的部分特征無(wú)法被正確提取,進(jìn)一步導(dǎo)致人臉的錯(cuò)誤識(shí)別。
5.遮擋問(wèn)題
即使是非人為故意遮擋,在實(shí)際應(yīng)用時(shí)檢測(cè)到的人臉圖像也經(jīng)常會(huì)出現(xiàn)如帽子、眼鏡等遮擋物,除了這些,胡子以及劉海的變化也直接影響人臉的特征提取。當(dāng)人臉圖像發(fā)生遮擋時(shí),人臉的很多信息會(huì)丟失,導(dǎo)致人臉識(shí)別算法出錯(cuò)或失效。
人臉識(shí)別系統(tǒng)的步驟
人臉識(shí)別系統(tǒng)主要包括四個(gè)組成部分:人臉圖像檢測(cè)、人臉識(shí)別預(yù)處理、人臉特征提取以及特征匹配與識(shí)別。
1.人臉圖像檢測(cè)
人臉圖像檢測(cè)是人臉識(shí)別過(guò)程的關(guān)鍵環(huán)節(jié)之一。人臉檢測(cè)是指對(duì)于任意一幅給定的圖像,采用一定的策略對(duì)其進(jìn)行搜索以確定其中是否含有人臉,如果有,則返回檢測(cè)到的人臉圖像的位置、大小以及姿態(tài)。人臉檢測(cè)主要利用人臉圖像的直方圖特征、顏色特征、模板特征、結(jié)構(gòu)特征以及haar特征等。
人臉檢測(cè)的難點(diǎn)主要在于:(1)光照的復(fù)雜多變,圖像序列中存在的人臉圖像可能由于光源的照射角度或監(jiān)控環(huán)境中同時(shí)存在的多個(gè)光源而導(dǎo)致陰影或?qū)Ρ榷鹊淖兓黾恿藱z測(cè)難度;(2)拍攝角度以及圖像清晰度,如果成像距離較遠(yuǎn),或者圖像序列分辨率較低,可能會(huì)導(dǎo)致人臉圖像清晰度差而無(wú)法被正確檢測(cè);(3)人臉圖像中可能存在的遮擋物,場(chǎng)景中的人臉圖像可能由于眼鏡、帽子等遮擋物而影響檢測(cè)結(jié)果,除此之外,劉海、胡子的變化等也可能對(duì)人臉圖像造成影響;(4)人臉復(fù)雜的細(xì)節(jié)變化,人臉的成像可能會(huì)由于表情的變化而略有不同,此外,人臉圖像的角度旋轉(zhuǎn)也影響人臉檢測(cè)的正確檢測(cè)率。
2.人臉圖像預(yù)處理
預(yù)處理是指在進(jìn)行人臉識(shí)別前,為了提高識(shí)別率,通過(guò)圖像處理技術(shù)對(duì)檢測(cè)得到的人臉圖像進(jìn)行的一系列圖像質(zhì)量提高。這些處理主要包括灰度校正、噪聲過(guò)濾、光線補(bǔ)償、直方圖均衡化、歸一化等。
3.人臉特征提取
人臉特征提取是對(duì)人臉進(jìn)行特征建模的過(guò)程,提取方法主要分為兩大類:基于知識(shí)的表征方法和基于代數(shù)特征或統(tǒng)計(jì)學(xué)習(xí)的表征方法。目前人臉識(shí)別技術(shù)中使用的人臉特征主要包括視覺(jué)特征、人臉圖像變換系數(shù)特征,人臉圖像代數(shù)特征等。其中基于知識(shí)的表征方法主要是根據(jù)人臉五官的形狀描述以及它們之間的距離特性來(lái)獲得有助于人臉?lè)诸惖奶卣鲾?shù)據(jù),其特征分量通常是使用特征點(diǎn)間的歐幾里得距離、曲率或角度等。基于幾何特征的表征方法是指利用人臉五官之間的結(jié)構(gòu)關(guān)系的幾何描述進(jìn)行人臉表征的方法。
匹配與識(shí)別是指利用上一步提取到的人臉特征,與樣本庫(kù)中存儲(chǔ)的特征模板進(jìn)行搜索匹配,在這個(gè)過(guò)程中,需要預(yù)先定義一個(gè)閾值,當(dāng)相似度超過(guò)該閾值,則輸出匹配結(jié)果。
人臉識(shí)別技術(shù)的研究現(xiàn)狀
人臉識(shí)別方法大致可以分為兩類:基于2D人臉圖像的人臉識(shí)別和基于3D人臉圖像的人臉識(shí)別。其中,基于2D人臉圖像的人臉識(shí)別算法概括起來(lái)人臉識(shí)別方法主要分為以下幾個(gè)大類:1.基于模板匹配的方法,其中模板可以使用固定模板和可變模板;2.基于知識(shí)的方法;3.基于統(tǒng)計(jì)學(xué)習(xí)的方法。
近些年,利用3D人臉信息提高識(shí)別性能得到越來(lái)越多的關(guān)注。三維人臉識(shí)別是指將采集獲得的待識(shí)別對(duì)象的臉部三維形狀數(shù)據(jù)作為識(shí)別依據(jù),與庫(kù)中已知身份的臉部三維形狀數(shù)據(jù)進(jìn)行匹配,然后得出待識(shí)別對(duì)象身份的過(guò)程。