人臉識別產(chǎn)業(yè)鏈上游為基礎層,包括人工智能芯片、算法技術和數(shù)據(jù)集;中游由視頻人臉識別、圖片人臉識別和數(shù)據(jù)庫對比檢驗等技術層構成,大體包括人臉檢測、活體檢測、人臉識別、視頻對象提取與分析等技術;下游則是具體的場景應用,即應用方案、消費類終端或服務等。下游以攝像頭為主的硬件采集端和應用端采集人臉數(shù)據(jù),為數(shù)據(jù)集豐富數(shù)據(jù),對于基礎層算法的更新迭代形成正反饋。
日前,國外巨頭公司大多呈現(xiàn)全產(chǎn)業(yè)布局的特征,即上中下游均有布局。國內(nèi)人臉識別創(chuàng)業(yè)公司基本缺席上游的芯片和算法開發(fā)環(huán)節(jié),除了少量在中游有技術突破外,大多數(shù)集中于下游場景應用層,這很大程度上得益于國內(nèi)龐大的應用場景支持。
在具體的場景應用商業(yè)化落地環(huán)節(jié),以BAT為代表的國內(nèi)互聯(lián)網(wǎng)巨頭,由于無法將計算機視覺的某一個子模塊拿出來單獨盈利。因此在應用落地上并沒有明顯的優(yōu)勢,而是創(chuàng)業(yè)公司突破能力更強。但互聯(lián)網(wǎng)巨頭擁有最大的數(shù)據(jù)源,人臉識別的后續(xù)發(fā)展動力十足。
人臉識別產(chǎn)業(yè)鏈上游分析
人臉識別產(chǎn)業(yè)鏈上游,即基礎層,影響發(fā)展的三大要素是數(shù)據(jù)量、計算力和算法模型。2000年后,數(shù)據(jù)量的上漲、計算力的提升和深度學習算法的出現(xiàn)促進了計算機視覺行業(yè)的發(fā)展。作為計算機視覺中重要的人臉識別,以攝像頭為主的采集終端的大規(guī)模普及帶來了數(shù)據(jù)量的增長,深度學習算法的出現(xiàn)可以實現(xiàn)精準的識別功能。
此外,云計算技術、服務器和人工智能芯片等相關硬件性能的提升,對于處理數(shù)據(jù)的計算力有很強的助力作用,從而人臉識別應用方案走入人們的生活成為現(xiàn)實。
而在算法領域,算法領域,美國互聯(lián)網(wǎng)巨頭谷歌、FACEBOOK、微軟都推出了深度學習算法開源平臺,在深度學習算法方面有著明顯的技術優(yōu)勢。
2016年以來,以谷歌、微軟為首的巨頭為了搶占市場,將自己研發(fā)的算法技術進行開源,導致很多企業(yè)免去人工智能基礎技術研發(fā)投入,只需要采用開源算法或經(jīng)過訓練的人工智能芯片,再結合行業(yè)數(shù)據(jù)進行訓練,就可開展行業(yè)應用落地。與之對比,百度PaddlePaddle是國內(nèi)巨頭中唯一開放的深度學習算法開源平臺。
人臉識別產(chǎn)業(yè)鏈中游分析
中游人臉識別技術的進步,是推動下游場景應用拓展的關鍵所在。目前,人臉識別市場的解決方案主要包括2D識別、3D識別技術。
市場上主流的識別方案是采用攝像頭的2D方案,但由于人的臉部并非平坦,因此2D識別在將3D人臉信息平面化投影的過程中存在特征信息損失。3D識別使用三維人臉立體建模方法,可最大程度保留有效信息,因此3D人臉識別技術的算法比2D算法更合理并擁有更高精度。
人臉識別產(chǎn)業(yè)鏈下游分析
人臉識別對場境要求非常強,產(chǎn)品能否達到實際使用要求,核心并不只在于算法本身,還在于對場景的深耕。算法水平對于識別率的有力證明,也僅僅是停留在訓練集與測試集之間,存在于實驗室的“理論數(shù)值”。
而現(xiàn)實生活中人臉的獲取過程有大量不可控因素,光的方向、強度,是否有胡須、發(fā)型的變化,是否有表情都會影響識別效果。多種因素疊加后,真實環(huán)境下測得的準確率可能只有75%左右,甚至更低。
因此,需要針對場景的不同特點收集大量場景數(shù)據(jù),不斷調(diào)試參數(shù)、組合算法、方法,甚至使用外圍硬件輔助以提升效果,不斷迭代以實現(xiàn)產(chǎn)品化。除此之外,還要在工程上滿足計算量、延遲、可維護性等需求。
來源:安防行業(yè)網(wǎng)