如今人臉識(shí)別技術(shù)越來越多得應(yīng)用到我們生活之中,安防、交通、金融等領(lǐng)域都可以見到它的身影,同時(shí)人臉識(shí)別領(lǐng)域的公司也深受資本的青睞,涌現(xiàn)出了一大批的“獨(dú)角獸”。那么這其中到底哪家的技術(shù)強(qiáng)呢?
在知乎問題“關(guān)于人臉識(shí)別哪家強(qiáng)?”下,作者@MaxSam提供了一個(gè)高票回答,以一個(gè)從事人員的角度詳細(xì)解釋了這個(gè)行業(yè)。
以下為知乎@MaxSam 的回答:
本人從事人臉識(shí)別相關(guān)工作(2017年底剛剛離開該行業(yè)),這一波人工智能的投資風(fēng)起來,很多人臉識(shí)別公司恨不得馬上往自己臉上貼幾噸金,有個(gè)朋友說了一句很有意思的話:
外行一般覺得很科幻,內(nèi)行一般覺得很絕望,業(yè)界領(lǐng)袖和領(lǐng)袖各種打雞血。
大部分AI公司都在燒錢階段,未來變現(xiàn)有很大的不確定性??纯窗俣茸詣?dòng)駕駛的系統(tǒng)和google圖像識(shí)別系統(tǒng)的開放可以預(yù)知未來免費(fèi)是大趨勢(shì),那可是曾經(jīng)投入數(shù)百億美元。但是資本投進(jìn)來,必須拉著媒體一起吆喝,不然本都回不了(進(jìn)入AI行業(yè)才知道很多資本方原來什么也不懂亂投)。
人臉識(shí)別作為一項(xiàng)模塊技術(shù)很少有獨(dú)立應(yīng)用(獨(dú)立的業(yè)務(wù)層設(shè)計(jì)),大部分只是為已有的業(yè)務(wù)軟件體系上做增強(qiáng),比如客戶人臉校驗(yàn)(在過去密碼基礎(chǔ)上增加一層),人臉檢索(比人工高效,攝像頭結(jié)果過濾),相似人臉推薦(比如婚介社交,整容設(shè)計(jì)),不過這個(gè)過程中已經(jīng)死掉大量公司,因?yàn)槔麧櫶?非強(qiáng)需求。
目前相關(guān)產(chǎn)業(yè)公司在已知的主要商業(yè)模式中都在實(shí)踐,但賣貨,賣授權(quán),賣服務(wù),后臺(tái)流量變現(xiàn)這四大商業(yè)模式中,都沒有看到一個(gè)公司有。作為行業(yè)中人,所謂的絕望無非如下:
1. 算法再好,也只是調(diào)味料,最終出路還是做到最終產(chǎn)品中,通過業(yè)務(wù)層疊加開發(fā),形成產(chǎn)品和方案,更多時(shí)候是一個(gè)方案服務(wù)商,更像過去傳統(tǒng)軟件商,規(guī)模難有爆發(fā)。
2. 使用門檻、成本很低,目前市場上終端算法部署比較低端的產(chǎn)品授權(quán)就500元/套(1:1的遠(yuǎn)程接口調(diào)用所使用的前端授權(quán)),市場競爭的結(jié)果就是低價(jià)傾銷。
人臉識(shí)別目前就是為了各種噱頭立項(xiàng)、經(jīng)費(fèi)申請(qǐng)瓜分用的,有個(gè)公司靠這個(gè)拿國家各種科技補(bǔ)貼。真正賺錢都是那些中間商公司,人臉識(shí)別一家都沒有。至于未來有沒有新商業(yè)模式出現(xiàn),暫且無法推斷。
題主問題比較寬泛(到底是盈利強(qiáng),還是算法強(qiáng),還是應(yīng)用強(qiáng)?),人臉識(shí)別技術(shù)的衡量維度太多,但從技術(shù)比較,比如圖像比對(duì)級(jí)的1:1,1:N,N:N;衡量的標(biāo)準(zhǔn)和維度都不同。比如算法精確度上,國內(nèi)國外的人臉識(shí)別技術(shù)大多數(shù)在開源OPENCV等開源庫上進(jìn)行新規(guī)則添加(深度學(xué)習(xí)進(jìn)行疊層運(yùn)算),公司之間的識(shí)別正確率差異僅僅在小數(shù)點(diǎn)上,99.6%-99.7%提升意義不大,如果說在LFW上稱王稱霸就是世界一流,就要被內(nèi)行笑話了。
衡量人臉識(shí)別的算法能力幾個(gè)指標(biāo):拒識(shí)率、誤識(shí)率、通過率,準(zhǔn)確率。
先看看人臉識(shí)別的基本流程:
人臉識(shí)別最難的部分是有充分適應(yīng)各大光線環(huán)境的人臉預(yù)處理算法,需要在各種復(fù)雜的光線環(huán)境中提取到人臉信息,特別是移動(dòng)互聯(lián)網(wǎng)時(shí)代,攝像頭拍照的地方可以在斑駁的樹影下,也可以在昏暗的街燈下,以及深夜出租車內(nèi),這對(duì)算法的魯棒性考驗(yàn)極大。同時(shí)還要考慮照片和視頻欺詐,二次成像的光線污染等問題。
下面說一下目前人臉識(shí)別的常見問題(不要再問人臉識(shí)別準(zhǔn)確度了,這個(gè)是外行話)。
1:1人臉識(shí)別算法主要用于身份驗(yàn)證
1:1人臉識(shí)別技術(shù)主要是利用圖像處理技術(shù)從圖像中提取人像特征點(diǎn),利用生物統(tǒng)計(jì)學(xué)的原理進(jìn)行分析建立數(shù)學(xué)模型,即人臉特征點(diǎn)模型。再從人臉特征點(diǎn)模型與被測者的人的面像進(jìn)行特征分析(可以假定為無數(shù)的幾何特征點(diǎn)求解),根據(jù)分析的結(jié)果來給出一個(gè)相似值,通過這個(gè)值即可確定是否為同一人。簡單的說就是A/B兩張照片比對(duì),產(chǎn)生的計(jì)算數(shù)值是否達(dá)到要求。
這個(gè)值我們稱之為閾值,可以從1到100(100就是極端嚴(yán)苛)很多人臉識(shí)別公司說他們的產(chǎn)品很容易通過,那只說了一半,如果閾值調(diào)整到5以下,幾乎大部分人都可以是相似的,而調(diào)整到95以上,同一個(gè)人在不同的背景環(huán)境拍出的照片都無法匹配。所以當(dāng)一公司跟你吹牛算法準(zhǔn)確度,先問下使用的是用什么閾值,同一人臉比對(duì)通過率,非同一人比對(duì)通過率。
1:1主要用于快速的人臉識(shí)別比對(duì),作為身份確認(rèn)的一種新方式,比如考生身份確認(rèn)、公司考勤確認(rèn)、各種證件照和本人確認(rèn),由于這些照片源不一定有權(quán)威統(tǒng)一的接口調(diào)用,所以一直沒有用起來。目前市面上做的比對(duì)來源主要有三種方式:
1. 用戶自傳照片,比如支付寶的人臉比對(duì),用戶自傳的照片最大的問題是照片質(zhì)量的合格率太低,拍照的光線、角度等因素會(huì)導(dǎo)致采集源的質(zhì)量下降,不利于后期的大批量人臉特征碼管理。
2. 使用身份證讀卡器,讀取身份證上的照片,遺憾的是這張照片的質(zhì)量極差,2K的大小,很多照片上的人臉質(zhì)量實(shí)際非常差,不過也是目前用最多的方式。
3. 使用公安部旗下NCIIC的人臉比對(duì)接口(注意,不是網(wǎng)紋照片接口,這個(gè)接口已經(jīng)不對(duì)外),使用的是直接的人臉比對(duì)接口。目前具備有這個(gè)庫調(diào)用權(quán)限的,目前所知的只有幾家,在人臉識(shí)別公司中,好像只看到一家在提供,這里先不提了。BAT應(yīng)該都還沒有接入,如有大家有新發(fā)現(xiàn)的可以補(bǔ)充。
實(shí)際上,解決比對(duì)源的問題的關(guān)鍵是需要有權(quán)威的照片數(shù)據(jù)來進(jìn)行比對(duì),許多公司剛剛開始的時(shí)候采取NCIIC(公安部的一個(gè)事業(yè)單位)身份證返照接口的照片,進(jìn)行消網(wǎng)紋處理進(jìn)行比對(duì),但人臉的很多特征點(diǎn)被損毀成功率大概只有6成(根據(jù)六月份發(fā)布的網(wǎng)絡(luò)安全法,目前網(wǎng)紋返照接口市面上除了銀行系統(tǒng)可以使用外,其他所用的身份證返照接口都是非法的,一用就被查)。
無證件的情況下,如何確認(rèn)本人是XX?
曾經(jīng)有一些問題是關(guān)于如何確認(rèn)本人的笑話,派出所要求一個(gè)小伙證明就是本人,證明你媽是你媽。。這種奇葩問題,但是許多陌生場合也有這種尷尬,你如果沒有帶證件,警察無法看到你的照片,如何確認(rèn)你就是XX就是之前經(jīng)常出現(xiàn)的執(zhí)法矛盾;如果一個(gè)人把身份證弄丟了,外面風(fēng)雪交加,如何給這類人辦理酒店入住手續(xù)?這些就是身份確認(rèn)的問題。公安部推身份證網(wǎng)上副本 身份認(rèn)證可“刷臉”完成就是用來解決這個(gè)問題,我們出門不用完全依賴身份證可以確定身份,可以方便很多。
但是1:1人臉?biāo)惴ǖ木薮箅[患是我們隨處可見的人臉,實(shí)際就是一個(gè)公開的鑰匙,馬云提出刷臉消費(fèi)吃飯,如果沒有手機(jī)驗(yàn)證碼(本身也是一重手機(jī)實(shí)名驗(yàn)證),分分鐘鐘被吃垮。但是既然可以用手機(jī),為什么還用刷臉,不是多此一舉嗎?
另外還有一些高級(jí)會(huì)所,希望實(shí)現(xiàn)VIP的貴賓警報(bào)服務(wù),這個(gè)在下面的1:N和N:人臉識(shí)別算法系統(tǒng)中可以看到。但是1:1比對(duì)的身份應(yīng)用哪家強(qiáng)了?
比如遠(yuǎn)程的互聯(lián)網(wǎng)客戶,如何確認(rèn)身份?
在互聯(lián)網(wǎng)買機(jī)票、車票,醫(yī)院掛號(hào),政府惠民工程項(xiàng)目,以及各種證券開戶、電信開戶、互聯(lián)網(wǎng)金融開戶都會(huì)用到。過去的身份認(rèn)證方式是非常不妥的(比如支付寶的持有注冊(cè)流程,還有一些不知名的社交APP等需要上傳身份證照片),這些資料是極其容易被盜取和轉(zhuǎn)賣的,下圖是來自百度的圖片搜索結(jié)果截圖,還有最近的一些女大學(xué)生的裸條資料泄露知乎專欄,導(dǎo)致犯罪分子有很多利用的漏洞,黑客軍團(tuán)號(hào)稱資料2000萬,分分鐘鐘薅干一家金融平臺(tái)沒有問題:
許多金融公司喜歡把人臉識(shí)別SDK模塊嵌入到APP當(dāng)中,但這個(gè)太容易繞過,所以會(huì)再加上活體檢測(市場上常見的活體檢測為隨機(jī)動(dòng)作配合),但是即便加了活體檢測,也一樣可以繞過。比如下面這兩種方式:
1. 3D人臉仿真面具
2. 人臉模型實(shí)時(shí)重建
所謂道高一尺魔高一丈,這個(gè)還是增加其他的多維校驗(yàn)才能確認(rèn)身份,否則真有人要進(jìn)行遠(yuǎn)程攻擊,也不是很難的事情。那么活體檢測哪家強(qiáng)了?
1:N人臉識(shí)別算法主要用于人臉檢索
跟1:1的A/B兩張照片比對(duì)最大的區(qū)別是A/B A/C A/D......多個(gè)1:1計(jì)算,這個(gè)最大的問題是一旦BCD總和數(shù)量越大計(jì)算速度越慢,而總和超過20萬,就回出現(xiàn)多個(gè)相似結(jié)果(20萬人這個(gè)大數(shù)會(huì)導(dǎo)致有不少人長相相似),需要人工輔助定位。過去我們?cè)陔娪袄锩婵吹绞裁础疤炀W(wǎng)”識(shí)別系統(tǒng)只是一種理想狀態(tài),實(shí)際應(yīng)用中都是排列出多個(gè)結(jié)果,排第一的未必是需要的人。
1:N人臉識(shí)別算法主要用于排查犯罪嫌疑人、失蹤人口的全庫搜尋、一人多證的重復(fù)排查,以此相似度列出相應(yīng)的結(jié)果,可以大大提高排查效率。類似的也可以用到走失兒童的項(xiàng)目中去,相比美帝的亞當(dāng)警報(bào)、安珀警戒,國內(nèi)有沒有類似的兒童走失警報(bào)及尋找機(jī)制?
這一類系統(tǒng)的部署需要兩個(gè)條件:
1. BCD基本庫(比如1000萬人)
2. 強(qiáng)大的算法硬件
1:N同時(shí)作業(yè)就是N:N了,同時(shí)相應(yīng)多張照片檢索需求,檢索耗費(fèi)的時(shí)間跟硬件算法關(guān)系極大,就這一領(lǐng)域的應(yīng)用,又哪家公司強(qiáng)了?
N:N人臉識(shí)別算法主要用于實(shí)時(shí)多1:N檢索計(jì)算:
N:N 該算法實(shí)際上是基于1:N的算法,輸入多個(gè)求解結(jié)果。比如視頻流的幀處理所用,對(duì)服務(wù)器的計(jì)算環(huán)境要求嚴(yán)苛,目前的算法系統(tǒng)所支撐的輸出率非常有限。
主要的限制如下:
海量的人臉照片解析需要大量運(yùn)算(目前很少看到在采集端直接解析的,都是照片剪裁)海量的人臉照片傳輸需要大量的帶寬(常見的720布控?cái)z像頭抓取最小的人臉照片為20K)海量的人臉照片在后臺(tái)檢索需要耗費(fèi)大量的運(yùn)算(國內(nèi)主流主機(jī)為例,最多到24路攝像頭)
由此可見,真正實(shí)現(xiàn)“天網(wǎng)”人臉檢索,一來要解決數(shù)億攝像頭的圖片處理,二來需要解決聯(lián)合庫的超算檢索,這可不是一般公司吃得消。有些小區(qū)和高級(jí)場所,對(duì)VIP客戶的識(shí)別和接待比較喜歡這種視頻校驗(yàn)方式,但是實(shí)際部署使用者會(huì)受到攝像頭位置、角度,以及多人同時(shí)入場產(chǎn)生的問題,而且人臉庫會(huì)非常有限,不然計(jì)算時(shí)間長,體驗(yàn)極差,一些所謂的迎賓機(jī)通常也就幾個(gè)人的照片(就是純粹給領(lǐng)導(dǎo)看的),實(shí)用價(jià)值大大的打折扣,有戴墨鏡或者帽子遮蔽都認(rèn)不出,畢竟關(guān)鍵特征取樣有限。這又有誰強(qiáng)了?
拍照和直播APP的人臉圖像疊加
國內(nèi)比較多的娛樂APP通過對(duì)人像圖層跟蹤處理,也是一個(gè)不錯(cuò)的技術(shù)切入點(diǎn),但是產(chǎn)品安裝包會(huì)比較大,現(xiàn)在做的也只是跟蹤技術(shù),屬于底層識(shí)別,如果復(fù)雜一些的需要通過云服務(wù)實(shí)現(xiàn),但是服務(wù)器算法解析速度和帶寬比較難以跟上,也不算是一種靠譜的商業(yè)模式。
人臉識(shí)別的技術(shù)發(fā)展方向:
結(jié)合三維信息:二維和三維信息融合使特征更加魯棒;
多特征融合:單一特征難以應(yīng)對(duì)復(fù)雜的光照和姿態(tài)變化;
大規(guī)模人臉比對(duì):面向海量數(shù)據(jù)的人臉比對(duì)與搜索;
深度學(xué)習(xí):在大數(shù)據(jù)條件下充分發(fā)揮深度神經(jīng)網(wǎng)絡(luò)強(qiáng)大的學(xué)習(xí)能力。
在視頻級(jí)N:N的校驗(yàn)中,如果要提高通過率,很多時(shí)候是采取降低準(zhǔn)確率的方式,降低算法隊(duì)列數(shù)量;同樣在一些比賽中為了降低誤識(shí)率,大大提高了準(zhǔn)確率,所以算法在校驗(yàn)的過程中必須遵循至少一個(gè)固定標(biāo)準(zhǔn),追求的是速度效率還是最高準(zhǔn)確率。
人臉識(shí)別應(yīng)用的發(fā)展方向
人臉識(shí)別這玩意兒就是一個(gè)調(diào)味料,在千萬的業(yè)務(wù)解決方案中,就是一個(gè)小模塊,其他的都是業(yè)務(wù)層的開發(fā)問題,使用上,技術(shù)也未必要高精尖,如果一定要真正稱得上人工智能組成部分的,個(gè)人認(rèn)為未來最大的使用端是機(jī)器人視覺交互。
人臉識(shí)別算法的應(yīng)用分類派系:
人臉識(shí)別對(duì)應(yīng)解決方案方向:
個(gè)人認(rèn)為未來人臉識(shí)別會(huì)讓大部分的數(shù)據(jù)更加真實(shí),而可以通過社會(huì)工程學(xué)模板做很多分析和改良,比如近期一些科學(xué)家利用人臉識(shí)別來分析一些人的健康、清晰,甚至是犯罪傾向,或許在未來還可以結(jié)合大數(shù)據(jù),對(duì)我們過去傳統(tǒng)的面相分析技術(shù)做一個(gè)全新的提升,到時(shí)候算命先生都要失業(yè)了。更多機(jī)器人交互、無人機(jī)產(chǎn)生的攝像目標(biāo)鎖定分析等科幻畫面并不是多遙遠(yuǎn)的事情。
關(guān)于算法核心研發(fā)情況的爭論:
基本上國內(nèi)每家公司都會(huì)說自己的算法牛,實(shí)際上有幾家有人臉核心算法呢?國內(nèi)在完全從事算法研究的總工程師人數(shù)到目前(2016年)總計(jì)不到100人,不過也沒有現(xiàn)在問題也不大,中科院計(jì)算所山世光教授已經(jīng)開源了(https://zhuanlan.zhihu.com/p/22451474),沒有基礎(chǔ)的公司不用太辛苦從零開始在OPENCV基礎(chǔ)上做算法升級(jí),相信很快google微軟還會(huì)有新的算法發(fā)布?,F(xiàn)在算法基本都是98%以上,這點(diǎn)差距已經(jīng)不重要,算法核不核心也沒有太大問題。大家不用太過于焦慮,產(chǎn)品到應(yīng)用階段,單單靠算法可不夠,還要考慮實(shí)際的使用。
目前做人臉識(shí)別的公司很多,集成應(yīng)用的有數(shù)百家,國內(nèi)的看百度,看融資,看各種報(bào)道就差不多了,只是認(rèn)真沉下心來做事情的公司太少。國內(nèi)的騰訊和阿里都在做(阿里支付寶用的是自己的團(tuán)隊(duì)研發(fā)算法,只是特別低調(diào),把名聲都留給自己投資的公司,阿里可不止投了一家),國內(nèi)的公司吹牛逼的、炒概念的太多,就不聊了。
美國Identix公司
美國Bioscrypt公司
德國Cognitec Systems公司
西班牙Herta Security公司
日本NEC公司
日本Softwise公司
以上都是老牌人臉識(shí)別公司,美國Identix公司做的是多模認(rèn)證(指紋、虹膜),而Bioscrypt公司早期起于指紋識(shí)別考勤,在政府市場的份額都不小,德國的Cognitec公司主要做政府項(xiàng)目的人臉識(shí)別系統(tǒng),而NEC公司主要做機(jī)器人視覺識(shí)別系統(tǒng),西班牙Herta公司是一家學(xué)術(shù)很濃厚的公司。此外的還有一些以色列公司技術(shù)。這些公司幾乎做的都是政府的安全項(xiàng)目,但公司普遍規(guī)模都很小,盈利和投資也很少見報(bào)道。Facebook公司進(jìn)入這個(gè)領(lǐng)域,主要是進(jìn)行人群的分類和應(yīng)用的優(yōu)化(針對(duì)性的市場推廣),項(xiàng)目都是作為公司原本業(yè)務(wù)的一種補(bǔ)充。
所以這個(gè)問題到了最后,我只能說:如果非要問人臉識(shí)別哪家強(qiáng),不如問哪家公司吹牛逼強(qiáng)。
原文標(biāo)題:人臉識(shí)別技術(shù)哪家強(qiáng)?不如問哪家公司吹牛強(qiáng)!
文章出處:【微信號(hào):icsmart,微信公眾號(hào):芯智訊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。