人工智能領(lǐng)域的深度學(xué)習(xí)與安全領(lǐng)域的跨界結(jié)合為2015的黑帽大會(huì)((BlackHat)帶來了嶄新的議題,后者每年一度在美國(guó)的拉斯維加斯舉行,被視作是信息安全領(lǐng)域的年度盛事。而帶來這個(gè)議題的正是360公司人工智能專家王占一,2015年度黑帽大會(huì)的官網(wǎng)顯示王占一此次將發(fā)表題為《數(shù)據(jù)挖掘技術(shù)應(yīng)用于安全領(lǐng)域》的演講,介紹如何基于大數(shù)據(jù)分析,將人工智能技術(shù)拓展到安全領(lǐng)域。
來自360公司內(nèi)部的消息稱,王占一屬于天眼產(chǎn)品團(tuán)隊(duì),這個(gè)團(tuán)隊(duì)剛剛發(fā)布了中國(guó)首個(gè)APT報(bào)告,這份報(bào)告同樣利用了大數(shù)據(jù)分析技術(shù)發(fā)現(xiàn)未知威脅,代表了中國(guó)目前企業(yè)安全領(lǐng)域的最高研發(fā)水平。
黑帽大會(huì)涌現(xiàn)多個(gè)歷史時(shí)刻
黑帽大會(huì)自1997年成立以來,歷經(jīng)17年的發(fā)展,已成為引領(lǐng)安全思想和技術(shù)走向的風(fēng)向標(biāo)。參會(huì)人員包括企業(yè)和政府的研究人員,以及一些民間團(tuán)隊(duì)。黑帽大會(huì)被認(rèn)為是世界上最好的能夠了解未來安全趨勢(shì)和方向的信息峰會(huì),它的權(quán)威性更是獨(dú)一無(wú)二的。
多年來,黑帽大會(huì)吸引諸多“白帽”黑客分享前沿技術(shù),他們致力于尋找、測(cè)試和修補(bǔ)計(jì)算機(jī)的漏洞,讓互聯(lián)網(wǎng)和電腦設(shè)備更安全。在黑帽大會(huì)上曾經(jīng)出現(xiàn)過諸多登峰造極的人物,也留下了不少時(shí)刻足以載入史冊(cè)。
巴納拜-杰克是其中一位代表性人物。2010年7月28日,在當(dāng)年的“黑帽”大會(huì)上,巴納拜-杰克將2臺(tái)ATM搬到會(huì)場(chǎng),執(zhí)行破解程序令提款機(jī)狂吐鈔票,技驚四座,一舉成為全球最牛的“明星黑客”。
時(shí)隔兩年,黑客巴納拜-杰克卻離奇死亡。去世前杰克曾向外界宣布:他要在7月31日開幕的“黑帽”會(huì)議上,展示在9米之外入侵植入式心臟起搏器等無(wú)線醫(yī)療裝置,然后向其發(fā)出一系列830V高壓電擊,從而令“遙控殺人”成為現(xiàn)實(shí)。而他的突然離世,也讓這項(xiàng)技術(shù)充滿了神秘感。
深度學(xué)習(xí)崛起 帶來新的產(chǎn)業(yè)思路
安全行業(yè)經(jīng)過多年的發(fā)展,似乎在2015年也走到了顛覆與重塑的岔路口。在剛剛過去的2014年,全球的信息安全行業(yè)都面對(duì)了巨大的挑戰(zhàn)。美國(guó)電信運(yùn)營(yíng)商Verizon年度調(diào)查報(bào)告顯示,2014年一年之內(nèi)接近全球八萬(wàn)家公司被黑,其中2122家公司基于行業(yè)法律被迫公開承認(rèn)關(guān)鍵數(shù)據(jù)被盜,全球500強(qiáng)里面大面積淪陷,涉及全球超過60個(gè)國(guó)家,這在歷史上都是罕見的。
傳統(tǒng)的信息安全技術(shù)正在前所未有的挑戰(zhàn),迫切需要新的技術(shù)思路和研究方法的注入。而深度學(xué)習(xí)、大數(shù)據(jù)分析等技術(shù)與安全的結(jié)合帶來了全新的產(chǎn)業(yè)發(fā)展思路。
當(dāng)前人工智能之所以能夠引起大家的興奮和廣泛關(guān)注,在很大程度上是源于深度學(xué)習(xí)的研究進(jìn)展。這項(xiàng)機(jī)器學(xué)習(xí)技術(shù)為視覺、語(yǔ)音識(shí)別和自然語(yǔ)言處理帶來了巨大的的進(jìn)步,也相應(yīng)的帶來了具體應(yīng)用的產(chǎn)品。在過去幾年內(nèi),包括谷歌、Facebook、亞馬遜等科技巨頭一直在爭(zhēng)奪深度學(xué)習(xí)方面擁有技術(shù)的創(chuàng)業(yè)公司和研究人員,并將研究成果應(yīng)用于產(chǎn)品。
深度學(xué)習(xí)的概念源于一個(gè)古老的計(jì)算理念:神經(jīng)網(wǎng)絡(luò),是由多倫多大學(xué)教授杰夫·辛頓在2006年提出。它是機(jī)器學(xué)習(xí)研究中的一個(gè)新的領(lǐng)域,作用是模擬人腦的神經(jīng)網(wǎng)絡(luò),學(xué)習(xí)辨別聲音、圖像和其他數(shù)據(jù),從而幫助計(jì)算機(jī)突破一些人類無(wú)法依靠直覺來解決的瑣碎問題,從識(shí)別人臉到理解語(yǔ)言等。
相較于在一大堆數(shù)據(jù)中自我生成任務(wù)的機(jī)器學(xué)習(xí)來說,深度學(xué)習(xí)是一個(gè)巨大的進(jìn)步。之前的機(jī)器學(xué)習(xí)可以稱之為淺層的學(xué)習(xí)系統(tǒng),主要通過算法使機(jī)器從原始數(shù)據(jù)中學(xué)習(xí)規(guī)律,對(duì)新的樣本做智能識(shí)別或未來做預(yù)測(cè)。而深度學(xué)習(xí)的出現(xiàn)使這種情況發(fā)生了改觀,能夠主動(dòng)識(shí)別特征和類別,這就是人類非常擅長(zhǎng)但一直很難用代碼去實(shí)現(xiàn)的任務(wù)。
基于深度學(xué)習(xí)深入的能力,人們?cè)趫D像和語(yǔ)音識(shí)別上正在做出顯著的進(jìn)步。2012 年 6 月,人們給谷歌的深度學(xué)習(xí)系統(tǒng)輸入了 1,000 萬(wàn)張來自YouTube 視頻的圖片,不僅有人,還有貓貓狗狗等其他生物。谷歌也用該技術(shù)來減少語(yǔ)音識(shí)別的錯(cuò)誤率,應(yīng)用于最新的安卓手機(jī)軟件上。2012 年 10月,微軟首席研究官里克·拉希德在中國(guó)的一次演講中,就用這種語(yǔ)音識(shí)別軟件,以僅7%的錯(cuò)誤率把他的英文演講內(nèi)容轉(zhuǎn)成文本,之后再翻譯成中文,還能模擬他的語(yǔ)音用字正腔圓的普通話表達(dá)出來。