這是一個(gè)悲傷的故事,你可能經(jīng)歷過。
你又熱又渴,看到桌子上有一瓶看起來像水的東西,來不及思考,揭開瓶蓋喝了一大口。哦!漏!是油!
時(shí)間回到10秒前,我們重來一次。
這一次,額外的劇情是,你有一個(gè)看不慣的死敵和你一起住(這種情況在合租大軍中很容易出現(xiàn)),他放了一瓶類似水的不明液體在桌上。
你又進(jìn)來了,有累又熱又渴,這一次你又端起來這瓶液體。這一次,你仔細(xì)分析了這種物質(zhì)、形狀和體積,你利用曾經(jīng)的斗爭經(jīng)驗(yàn)再次判斷,然后信心滿滿地做出了正確選擇,完美地躲避了這場惡作劇——一瓶100%純尿。

福音來了
如果我把這瓶看似是水的東西放置在傳統(tǒng)的計(jì)算機(jī)視覺模塊下分析,可以輕易識(shí)別出來它的成分。如果我手欠,非得手抓瓶子再來試一次,由于手指光榮出鏡,傳統(tǒng)的計(jì)算機(jī)視覺模塊突然無法識(shí)別了。但是,如果我機(jī)智地把系統(tǒng)升級(jí),加入人工智能模塊,即所謂的深度學(xué)習(xí)技術(shù),那么即使手指出鏡,這瓶液體也可以被識(shí)別出來。這就是在微小變化下,深度學(xué)習(xí)的好處——即使只能讀取部分?jǐn)?shù)據(jù),大部分圖像被遮蓋,也能正確識(shí)別。
深度學(xué)習(xí),就像人們所熟知的神經(jīng)網(wǎng)絡(luò),受到大腦激勵(lì),不斷增強(qiáng)學(xué)習(xí)識(shí)別物體的能力。以視覺識(shí)別為例,我們的大腦可以通過感官輸入獲得原始數(shù)據(jù),同時(shí)進(jìn)一步自主學(xué)習(xí)更高級(jí)別的特點(diǎn)。同樣,在深度學(xué)習(xí)中,原始數(shù)據(jù)從深度神經(jīng)網(wǎng)絡(luò)中讀取,憑此學(xué)習(xí)如何識(shí)別物體。機(jī)器學(xué)習(xí),從另一個(gè)角度而言,需要通過機(jī)器學(xué)習(xí)模塊,手動(dòng)選擇特征進(jìn)行處理。結(jié)果,這種處理過程耗時(shí)長,準(zhǔn)確性受到人工錯(cuò)誤的制約。深度學(xué)習(xí)則更復(fù)雜、精密、自主學(xué)習(xí)能力強(qiáng),能保證高準(zhǔn)確率及超快的處理速度。
網(wǎng)絡(luò)安全與圖像識(shí)別相似,99%以上的新威脅和惡意軟件實(shí)際上來源于此前已經(jīng)存在的威脅和惡意軟件的輕微“突變”。據(jù)說,即便是那1%的完全嶄新的新威脅和惡意軟件,也只是已存危機(jī)的大量“突變”而已。但是,盡管如此,即使是那些最前沿的,結(jié)合使用動(dòng)態(tài)分析及傳統(tǒng)機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)安全技術(shù),也在檢測大量新的惡意軟件上遭遇重重困難,結(jié)果就是各類企業(yè)和組織極易遭受數(shù)據(jù)泄露、數(shù)據(jù)盜竊、惡意軟件的扣押勒索和數(shù)據(jù)損壞。
福音來了,我們可以通過深度學(xué)習(xí)應(yīng)用來解決這些問題,捍衛(wèi)網(wǎng)絡(luò)安全。
兩類老辦法"然并卵"
我們先簡單回顧下檢測惡意軟件方案的歷史。
基于簽名的解決方案是最古老的惡意軟件檢測形式,它們也被稱為傳統(tǒng)的解決方案。為了檢測惡意軟件,防病毒引擎將一個(gè)身份不明的代碼塊的內(nèi)容與它的數(shù)據(jù)庫中已知的惡意軟件簽名相比較。如果與已知惡意軟件簽名不匹配,那么就要靠手動(dòng)調(diào)整的啟發(fā)式算法來生成一個(gè)新的手工簽名,然后更新發(fā)布。
這個(gè)過程十分耗時(shí),有時(shí)簽名是在初步檢測的數(shù)月后才發(fā)布。因此,這種檢測方法無法與時(shí)俱進(jìn),跟不上每天產(chǎn)生百萬個(gè)新的惡意軟件變種的節(jié)奏,這也導(dǎo)致了企業(yè)和組織容易受到新的及已經(jīng)被檢測到卻沒有發(fā)布簽名的威脅襲擊。
用基于代碼行為特點(diǎn)的啟發(fā)式技術(shù)來識(shí)別惡意軟件,產(chǎn)生了基于行為的解決方案。該惡意軟件檢測技術(shù)分析了惡意軟件運(yùn)行時(shí)的行為,而非針對惡意軟件代碼本身的硬編碼。這種惡意軟件檢測方法的主要限制是,它僅能在惡意行動(dòng)已經(jīng)開始時(shí)發(fā)現(xiàn)惡意軟件。結(jié)果,預(yù)防被推遲,有時(shí)甚至就是處理得太遲。

沙箱解決方案則是基于行為檢測方法的發(fā)展。這些解決方案在一個(gè)虛擬的環(huán)境中執(zhí)行惡意軟件,以確定該文件是否惡意,而非檢測運(yùn)行時(shí)的行為指紋。雖然這種技術(shù)已被證明在檢測精度上相當(dāng)有效,但是由于過程耗時(shí)長,因此實(shí)時(shí)保護(hù)成本高。此外,新類型的惡意代碼可以通過拖延執(zhí)行逃避沙箱檢測,從而構(gòu)成新的挑戰(zhàn)。
深度學(xué)習(xí)檢測效果顯著
使用人工智能偵測惡意軟件的方法應(yīng)運(yùn)而生。
結(jié)合人工智能,打造更復(fù)雜的檢測能力是網(wǎng)絡(luò)安全解決方案演變之路上的最新一步?;跈C(jī)器學(xué)習(xí)的惡意軟件檢測方法應(yīng)用更詳細(xì)的算法,根據(jù)手動(dòng)工程的特點(diǎn)來判斷一個(gè)文件的行為是惡意還是合法。然而,這個(gè)過程費(fèi)時(shí)長,需要大量人力在文件分級(jí)過程中來確定技術(shù)參數(shù)、變量或特點(diǎn),在文件分類過程中的重點(diǎn)。此外,惡意軟件檢測率仍然離100%識(shí)別很遠(yuǎn)。