實驗室研究人臉技術(shù)多年,不僅在技術(shù)方面有很好的積累,而且在公司內(nèi)外的業(yè)務中有眾多應用。在與產(chǎn)品、商務、工程開發(fā)同事交流過程中發(fā)現(xiàn):不管是“從圖中找到人臉的位置”,或是“識別出這個人臉對應的身份”,亦或是其他,大家都會把這些不同的人臉技術(shù)統(tǒng)稱為“
人臉識別技術(shù)”。
因此,整理了一些常見人臉技術(shù)的基本概念,主要用于幫助非基礎(chǔ)研究同事對人臉相關(guān)技術(shù)有一個更深入的了解,方便后續(xù)的交流與合作。
人臉技術(shù)基本概念介紹
1. 人臉檢測
“人臉檢測(Face Detection)”是檢測出圖像中人臉所在位置的一項技術(shù)。
人臉檢測算法的輸入是一張圖片,輸出是人臉框坐標序列(0個人臉框或1個人臉框或多個人臉框)。一般情況下,輸出的人臉坐標框為一個正朝上的正方形,但也有一些人臉檢測技術(shù)輸出的是正朝上的矩形,或者是帶旋轉(zhuǎn)方向的矩形。
常見的人臉檢測算法基本是一個“掃描”加“判別”的過程,即算法在圖像范圍內(nèi)掃描,再逐個判定候選區(qū)域是否是人臉的過程。因此人臉檢測算法的計算速度會跟圖像尺寸、圖像內(nèi)容相關(guān)。開發(fā)過程中,我們可以通過設置“輸入圖像尺寸”、或“最小臉尺寸限制”、或“人臉數(shù)量上限”的方式來加速算法。
人臉檢測結(jié)果舉例(綠色框為人臉檢測結(jié)果)
2. 人臉配準
“人臉配準(Face Alignment)”是定位出人臉上五官關(guān)鍵點坐標的一項技術(shù)。
人臉配準算法的輸入是“一張人臉圖片”加“人臉坐標框”,輸出五官關(guān)鍵點的坐標序列。五官關(guān)鍵點的數(shù)量是預先設定好的一個固定數(shù)值,可以根據(jù)不同的語義來定義(常見的有5點、68點、90點等等)。
當前效果的較好的一些人臉配準技術(shù),基本通過深度學習框架實現(xiàn),這些方法都是基于人臉檢測的坐標框,按某種事先設定規(guī)則將人臉區(qū)域扣取出來,縮放的固定尺寸,然后進行關(guān)鍵點位置的計算。因此,若不計入圖像縮放過程的耗時,人臉配準算法是可以計算量固定的過程。另外,相對于人臉檢測,或者是后面將提到的人臉提特征過程,人臉配準算法的計算耗時都要少很多。
人臉配準結(jié)果舉例(右圖中的綠色點位人臉配準結(jié)果)
3. 人臉屬性識別
“人臉屬性識別(Face Attribute)”是識別出人臉的性別、年齡、姿態(tài)、表情等屬性值的一項技術(shù)。
一般的人臉屬性識別算法的輸入是“一張人臉圖”和“人臉五官關(guān)鍵點坐標”,輸出是人臉相應的屬性值。人臉屬性識別算法一般會根據(jù)人臉五官關(guān)鍵點坐標將人臉對齊(旋轉(zhuǎn)、縮放、扣取等操作后,將人臉調(diào)整到預定的大小和形態(tài)),然后進行屬性分析。
常規(guī)的人臉屬性識別算法識別每一個人臉屬性時都是一個獨立的過程,即人臉屬性識別只是對一類算法的統(tǒng)稱,性別識別、年齡估計、姿態(tài)估計、表情識別都是相互獨立的算法。但最新的一些基于深度學習的人臉屬性識別也具有一個算法同時輸入性別、年齡、姿態(tài)等屬性值的能力。
人臉屬性識別過程(最右側(cè)文字為屬性識別結(jié)果)
4. 人臉提特征
“人臉提特征(Face Feature Extraction)”是將一張人臉圖像轉(zhuǎn)化為一串固定長度的數(shù)值的過程。這個數(shù)值串被稱為“人臉特征(Face Feature)”,具有表征這個人臉特點的能力。
人臉提特征過程的輸入也是 “一張人臉圖”和“人臉五官關(guān)鍵點坐標”,輸出是人臉相應的一個數(shù)值串(特征)。人臉提特征算法都會根據(jù)人臉五官關(guān)鍵點坐標將人臉對齊預定模式,然后計算特征。
近幾年來,深度學習方法基本統(tǒng)治了人臉提特征算法,這些算法都是固定時長的算法。早前的人臉提特征模型都較大,速度慢,僅使用于后臺服務。但最新的一些研究,可以在基本保證算法效果的前提下,將模型大小和運算速度優(yōu)化到移動端可用的狀態(tài)。
人臉提特征過程(最右側(cè)數(shù)值串為“人臉特征”)
5. 人臉比對(人臉驗證、
人臉識別、人臉檢索、人臉聚類)
“人臉比對(Face Compare)”是衡量兩個人臉之間相似度的算法
人臉比對算法的輸入是兩個人臉特征(注:人臉特征由前面的人臉提特征算法獲得),輸出是兩個特征之間的相似度。人臉驗證、人臉識別、人臉檢索都是在人臉比對的基礎(chǔ)上加一些策略來實現(xiàn)。相對人臉提特征過程,單次的人臉比對耗時極短,幾乎可以忽略。
基于人臉比對可衍生出人臉驗證(Face Verification)、人臉識別(Face Recognition)、人臉檢索(Face Retrieval)、人臉聚類(Face Cluster)等算法。
人臉對比過程(右側(cè)的相似度為人臉比對輸出的結(jié)果)
6. 人臉驗證
“人臉驗證(Face Verification)”是判定兩個人臉圖是否為同一人的算法。
它的輸入是兩個人臉特征,通過人臉比對獲得兩個人臉特征的相似度,通過與預設的閾值比較來驗證這兩個人臉特征是否屬于同一人(即相似度大于閾值,為同一人;小于閾值為不同)。
人臉驗證過程說明(最右側(cè)“是同一人”為人臉驗證的輸出)
7. 人臉識別
“人臉識別(Face Recognition)”是識別出輸入人臉圖對應身份的算法。
它的輸入一個人臉特征,通過和注冊在庫中N個身份對應的特征進行逐個比對,找出“一個”與輸入特征相似度最高的特征。將這個最高相似度值和預設的閾值相比較,如果大于閾值,則返回該特征對應的身份,否則返回“不在庫中”。
人臉識別過程(右側(cè)身份“jason”為人臉識別結(jié)果)
8. 人臉檢索
“人臉檢索”是查找和輸入人臉相似的人臉序列的算法。
人臉檢索通過將輸入的人臉和一個集合中的說有人臉進行比對,根據(jù)比對后的相似度對集合中的人臉進行排序。根據(jù)相似度從高到低排序的人臉序列即使人臉檢索的結(jié)果。
人臉檢索過程(右側(cè)綠框內(nèi)排序序列為檢索結(jié)果)
9. 人臉聚類
“人臉聚類(Face Cluster)”是將一個集合內(nèi)的人臉根據(jù)身份進行分組的算法。
人臉聚類也通過將集合內(nèi)所有的人臉兩兩之間做人臉比對,再根據(jù)這些相似度值進行分析,將屬于同一個身份的人劃分到一個組里。
在沒有進行人工身份標注前,只知道分到一個組的人臉是屬于同一個身份,但不知道確切身份。另外假設集合中有N個人臉,那么人臉聚類的算法復雜度為O(N2)
人臉聚類過程(右側(cè)綠框內(nèi)按身份的分組結(jié)果為聚類結(jié)果)
10. 人臉活體
“人臉活體(FaceLiveness)”是判斷人臉圖像是來自真人還是來自攻擊假體(照片、視頻等)的方法。
和前面所提到的人臉技術(shù)相比,人臉活體不是一個單純算法,而是一個問題的解法。這個解法將用戶交互和算法緊密結(jié)合,不同的交互方式對應于完全不同的算法。鑒于方法的種類過于繁多,這里只介紹“人臉活體”的概念,不再展開。