李子青,人臉識(shí)別和智能視頻監(jiān)控專家,主持了多個(gè)國(guó)家科學(xué)研究項(xiàng)目和重大應(yīng)用工程項(xiàng)目,在相關(guān)領(lǐng)域獲準(zhǔn)和申請(qǐng)專利10余項(xiàng)。2004年,李子青作為“百人計(jì)劃”入選者來到中科院自動(dòng)化所,十一年后,創(chuàng)辦AI公司中科奧森,親自主持了多個(gè)重大項(xiàng)目的落地。
中科院生物識(shí)別與安全技術(shù)研究中心主任李子青
動(dòng)態(tài)人臉監(jiān)控存在的問題
過去雖然安防行業(yè)更聚焦在智能視頻分析的應(yīng)用上,但是AI跟安防的結(jié)合是持續(xù)不斷的,早在十多年以前就已經(jīng)引入了AI,視頻結(jié)構(gòu)化、人臉結(jié)構(gòu)化、車輛結(jié)構(gòu)化等,都是安防行業(yè)在視頻大數(shù)據(jù)領(lǐng)域最關(guān)注的問題。但現(xiàn)在與過去不同的是,深度學(xué)習(xí)帶來的AI第三次浪潮將AI的概念進(jìn)一步強(qiáng)化,更深刻地影響著安防行業(yè)。在智能安防產(chǎn)品中,隨著靜態(tài)人臉識(shí)別已經(jīng)到了尾聲階段,動(dòng)態(tài)人臉監(jiān)控當(dāng)前正如火如荼地進(jìn)行中,但在實(shí)際應(yīng)用中卻遇到一些問題:
(1)誤報(bào)率太高。以業(yè)務(wù)規(guī)模來解釋,在某個(gè)轄區(qū)中有1000路視頻抓拍人像,并且只有一個(gè)黑名單庫(kù),假設(shè)每個(gè)攝像頭每10秒或者5秒抓拍一張人臉,該轄區(qū)每秒鐘抓拍100張左右的圖象,該轄區(qū)每天要產(chǎn)生864萬(wàn)張抓拍人臉,跟20萬(wàn)人的在圖庫(kù)比對(duì)次數(shù)是1.728萬(wàn)億次。
對(duì)動(dòng)態(tài)人臉識(shí)別的性能要求,用戶希望通過率比較高,例如90%的通過率,在動(dòng)態(tài)人臉監(jiān)控上面算是較高的水平,意味著它每天的誤報(bào)個(gè)數(shù)要少于200個(gè)?,F(xiàn)在的問題是誤報(bào)率太高,如果每次都是“狼來了”,那么就算公安用戶對(duì)新技術(shù)的有強(qiáng)烈的需求,也會(huì)選擇禁用甚至放棄。
(2)沒有足夠的標(biāo)注數(shù)據(jù)去解決問題。去年12月份李開復(fù)談AI和大數(shù)據(jù),他的觀點(diǎn)是:具有一定規(guī)模和質(zhì)量的數(shù)據(jù)集成為人工智能行業(yè)發(fā)展的一大制約。搜狗的CTO楊洪濤說,還沒有足夠的數(shù)據(jù)去解決問題。后者的總結(jié)是不太準(zhǔn)確的,應(yīng)該是沒有足夠的標(biāo)注數(shù)據(jù)去解決問題,因?yàn)楫?dāng)前生產(chǎn)環(huán)節(jié)的數(shù)據(jù)是海量的,就像剛才描述的公安生產(chǎn)環(huán)節(jié)的數(shù)據(jù)并不少。
李開復(fù)說,人工標(biāo)注這些東西是不解決問題的,必須在真實(shí)運(yùn)用場(chǎng)景里得到閉環(huán)回饋的標(biāo)注,才能真正地解決AI與大數(shù)據(jù)的問題?,F(xiàn)在行業(yè)做深度引擎開發(fā)的都遇到了這樣的問題。
這就引出了當(dāng)前技術(shù)和應(yīng)用的痛點(diǎn)所在,深度學(xué)習(xí)是需要大數(shù)據(jù)訓(xùn)練的,但是人工標(biāo)注費(fèi)時(shí)費(fèi)力,在這方面標(biāo)注的資源非常有限。行業(yè)里聽說,商湯每個(gè)月都要花費(fèi)幾百萬(wàn)來做標(biāo)注,因此深度學(xué)習(xí)還有一定的發(fā)展空間,但是不管是提升算法、改進(jìn)網(wǎng)絡(luò)架構(gòu),還是通過增大數(shù)據(jù)標(biāo)注的方式,提升的空間都不會(huì)太大,因?yàn)樗呀?jīng)接近天花板。所以行業(yè)必須在這方面突破——必須像李開復(fù)說的那樣,要形成應(yīng)用場(chǎng)景的數(shù)據(jù)閉環(huán),能夠利用生產(chǎn)環(huán)節(jié)的大數(shù)據(jù)進(jìn)行自主標(biāo)注、自主學(xué)習(xí)。
未來AI+安防的趨勢(shì)
從應(yīng)用來講,動(dòng)態(tài)識(shí)別的誤報(bào)率太高,大數(shù)據(jù)的資源應(yīng)用沒有充分的利用起來,研發(fā)單位不管是公司還是其他,只能選擇在公安現(xiàn)場(chǎng)去訓(xùn)練,或者通過一些手段把數(shù)據(jù)拷下來,自己標(biāo)注、加工,來提升核心引擎。
從數(shù)據(jù)源頭來講,在傳感器方面,仍然是受到了暗光、強(qiáng)光和逆光的影響,雖然行業(yè)現(xiàn)在有寬動(dòng)態(tài)、星光型的攝像機(jī),但是這仍然是一個(gè)問題。未來的發(fā)展趨勢(shì)就是3D傳感器,從Kinect到iphone X到Lidar,這是另外一個(gè)趨勢(shì),對(duì)二維的識(shí)別進(jìn)行補(bǔ)充。
最后李子青結(jié)合中科奧森的新技術(shù),談了AI+安防未來的技術(shù)趨勢(shì):
第一,大數(shù)據(jù)閉環(huán)自主學(xué)習(xí),行業(yè)通過前端獲取數(shù)據(jù),數(shù)據(jù)抓取之后經(jīng)過結(jié)構(gòu)化或者直接送到后臺(tái)大數(shù)據(jù)存儲(chǔ),通過核心引擎實(shí)現(xiàn)數(shù)據(jù)的訓(xùn)練,最后實(shí)現(xiàn)后臺(tái)大數(shù)據(jù)與核心引擎的再學(xué)習(xí)打通,實(shí)現(xiàn)閉環(huán)。
第二,從大數(shù)據(jù)到一人一檔。通過路人庫(kù)和名單庫(kù)這兩個(gè)集合的合輯梳理成一人一檔,實(shí)現(xiàn)跨時(shí)空的目標(biāo)軌跡挖掘等應(yīng)用,是核心算法和大數(shù)據(jù)產(chǎn)生的結(jié)果。
第三,新一代智能攝像機(jī),不僅能實(shí)現(xiàn)臉、人體、車輛的視頻結(jié)構(gòu)化集成到前端去,而且能實(shí)現(xiàn)全光照拍攝功能。
李子青最后總結(jié),安防跟深度學(xué)習(xí)是深度融合的,新銳企業(yè)依靠純算法肯定是沒有出路的,像商湯、曠視這些企業(yè)都在做落地應(yīng)用。安防企業(yè)如??荡笕A等,它們具備市場(chǎng)優(yōu)勢(shì),落地應(yīng)用非常好,AI企業(yè)的核心技術(shù)要比傳統(tǒng)企業(yè)更加前沿,兩者各有各的優(yōu)勢(shì),現(xiàn)階段而言,兩者之間的互動(dòng)能讓產(chǎn)業(yè)與中國(guó)的安防技術(shù)提升到更高的臺(tái)階。
原文標(biāo)題:中科院李子青:AI+安防的技術(shù)和應(yīng)用痛點(diǎn)
文章出處:【微信號(hào):asmag001,微信公眾號(hào):安全自動(dòng)化】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。