隨著人工智能(AI)技術(shù)的廣泛應(yīng)用,確保AI技術(shù)沒有偏見變得越來越重要。IBM計(jì)劃發(fā)布一個大型的、無偏見的人臉圖像數(shù)據(jù)集,以推動無偏見的人臉識別研究。
與以往相比,人類社會對人工智能系統(tǒng)中的偏見問題更加關(guān)注,尤其是用于識別和分析人臉圖像的系統(tǒng)。在IBM,科研人員采取以下措施來確保以負(fù)責(zé)任的方式來創(chuàng)建并訓(xùn)練面部識別技術(shù):
(1)導(dǎo)致面部分析領(lǐng)域出現(xiàn)偏見的最大問題之一是缺乏訓(xùn)練系統(tǒng)的各種數(shù)據(jù)。因此,科研人員打算在2018年秋天公開以下數(shù)據(jù)集,以作為技術(shù)行業(yè)和研究界的工具:
IBM研究院(IBM Research)的科學(xué)家正在構(gòu)建的一個超過100萬張圖像的注釋數(shù)據(jù)集,可以用于提高對面部分析偏見的理解。圖像將使用屬性進(jìn)行注釋,利用Flickr圖像中的地理標(biāo)記來平衡來自多個國家/地區(qū)的數(shù)據(jù)和主動學(xué)習(xí)工具,以減少樣本選擇偏差。目前,可用的最大面部屬性數(shù)據(jù)集包含20萬個圖像,因此這個具有一百萬個圖像的新數(shù)據(jù)集將是一個巨大的進(jìn)步。
一個最多包含3.6萬張圖像的注釋數(shù)據(jù)集—其中膚色、性別和年齡呈均勻分布,由IBM Research注釋,能夠?yàn)槿藗冊u估其技術(shù)提供更加多樣化的數(shù)據(jù)集。這將為算法設(shè)計(jì)人員識別和解決面部分析系統(tǒng)中的偏見提供特別幫助。解決偏見問題的第一步是確認(rèn)存在偏見--這就是該數(shù)據(jù)集的目標(biāo)所在。
(2)2018年早些時候,IBM極大地增強(qiáng)了用于面部分析的Watson視覺識別服務(wù)的準(zhǔn)確性,這使得面部分析的錯誤率降低了近十倍。IBM正在舉辦一個技術(shù)研討會(由IBM Research與馬里蘭大學(xué)合作),以確定并減少將于2018年9月14日與ECCV 2018聯(lián)合使用的面部分析系統(tǒng)中的偏見。使用IBM面部圖像數(shù)據(jù)集的競賽結(jié)果將公布在該研討會上。此外,IBM的研究人員將繼續(xù)與廣大的利益相關(guān)者、用戶和專家合作,以了解可能影響AI決策的其他偏見和漏洞,從而不斷改善系統(tǒng)。
人工智能擁有改善人們生活和工作方式的重要力量,但前提是對人工智能系統(tǒng)的開發(fā)和培訓(xùn)是負(fù)責(zé)任的,且該類系統(tǒng)能夠產(chǎn)生讓我們信任的結(jié)果。確保系統(tǒng)接受平衡的數(shù)據(jù)培訓(xùn)和消除偏見對建立這種信任至關(guān)重要。
隨著對AI應(yīng)用的不斷增加,防止偏見進(jìn)入AI系統(tǒng)正在成為最受關(guān)注的問題。IBM相信任何技術(shù)--無論多么準(zhǔn)確--都不能夠或不應(yīng)該取代人類的判斷力、直覺和專業(yè)知識。像人工智能這樣的先進(jìn)創(chuàng)新技術(shù)的威力在于它們能夠增強(qiáng)而非取代人類的決策能力。因此,任何使用AI的組織(包括視覺識別或視頻分析功能)都必須對使用AI的團(tuán)隊(duì)進(jìn)行培訓(xùn),以了解偏見(包括隱性和無意識的偏見),對其進(jìn)行監(jiān)控,并知道如何消除偏見。
原文標(biāo)題:為推動無偏見的AI研究,IBM將發(fā)布大型人臉識別數(shù)據(jù)集
文章出處:【微信號:AI_News,微信公眾號:人工智能快報(bào)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。