這兩張圖展示了我們基于中國移動釣魚欺詐和仿冒的站點之間的關聯,下面是我們看到黑客利用的新的手段,去隱藏他們對于僵尸網絡的控制。另外一個圖展示了我們對全球DDoS攻擊的態(tài)勢監(jiān)測,我們利用互聯網整體數據的收集,能看到像上面這張圖,利用這種攻擊方式,在一個三維可視化的過程中,把攻擊的類型、攻擊的時長和激烈程度,被攻擊的目標、攻擊來源信息都能夠充分體現出來。同時在下面也可以看到,在全球活動中一些比較大的僵尸網絡之間的關聯關系,通過數據的方式都呈現在我們面前。
更廣泛的應用不光是網絡安全方面,我們把它擴展到業(yè)務的安全,或者和大眾相關的安全應用,其實我們最近也發(fā)揮了這樣一個系統,我們對全國偽基站的狀態(tài)進行監(jiān)控,這是態(tài)勢和追蹤的情況,這張圖是北京的地圖,這是一天當中一個時點偽基站在北京城里面的活動狀態(tài),可以看到一個非常有意思的現象,可能從八達嶺高速、包括北苑路,就像我們上班一樣,從這幾條路進城,開始進入到發(fā)達地區(qū),發(fā)送一些欺詐短信、垃圾短信等等,我們還通過這樣的系統和數據分析,可以把其中的一些欺詐信息網站定位下來,甚至繪出它一天移動的過程。通過這些分析成果,我們也相當于把這些成果報給網絡監(jiān)管機構,包括網安部門,他們也針對性地對這些犯罪活動進行了打擊。
從上述的表述可以看到,其實我們在做數據驅動安全的過程中我們在做一些事情,通過我們找到的線索去做一個拼圖,把這個線索拼成一個事件的全貌,最終我們看到整體和背后是一個什么樣的情況。這在原來是無法想象的。
有一個比喻,我們原來做網絡安全防護的時候只盯住一個點,在現在的環(huán)境下,往往是達不到很好的效果的,比如說我們希望研究一片葉子上的威脅預警,我們必須研究整體的森林,這樣就引出我們對于數據能力的關鍵。最為關鍵的能力是我們要擁有數據,從360來講,在網絡安全方面,我們可能擁有現在中國最大的數據量,包括我們90億的樣本庫,包括防護的經驗,包括我們對DNS解析的數據,以及對漏洞數據的收集。正是這些海量數據匯集在一起,才能有效地從數據挖掘中得出安全的結論和關聯分析。
除了擁有數據之外,還要具備非常強的處理能力,我們用四萬臺服務器進行安全數據的處理,在這個過程中我們用于安全上的數據量已經超過了一個TB。除了數據計算以外,我們還有很多方面進行數據的挖掘,數據的大并不是關鍵點,而在于我們能不能從海量數據中通過數據挖掘和分析的方法,得到我們想要的這些內容。這個過程中,其實我們在這些包括機器學習、和挖掘方面積累了很多的經驗,才能看到這些案例和結果。
另外一個就是協同的問題,我們有了這些數據,我們有了這樣一個能力,我們對于傳統的已經失效的方法怎么樣發(fā)揮效果,所以協同是一個非常關鍵的步驟。其中一個點,見微見廣,在云端和本地的大數據平臺結合起來,把我們在云端的大數據平臺和本地輕量級平臺結合,做一個攻擊的發(fā)現,其實我們在本地平臺上也已經在實際的服務器上做到了幾千億的樣本處理和分析,同時能夠聯動我們響應的過程。
另外一個方面,改變傳統。剛才把我們說到的云端數據的平臺和大數據平臺終端結合起來,包括傳統的一些防護點,比如像我們的終端網關,不僅僅進行防御,而且讓它變成傳感器,數據采集器,把我們在各地的數據匯總起來,形成整體的數據采集、大數據的分析,以及之后的響應,形成這樣一個閉環(huán),我們真正能夠做到和終端產品、傳統的網關產品之間的連,讓它們再把自身的能力發(fā)揮出來。
另外,追本溯源,網絡攻擊和黑客攻擊我們都能從大數據平臺上從一點線索出發(fā),把關聯線索都關聯出來,我們手里有樣本,我們能找到遠端控制端的服務器IP,能夠找到用于掛馬和控制的域名,以及域名背后的注冊關聯信息,就是在這樣一個可視化的關聯分析系統中,我們不再能夠看到一片葉子,而是能看到在森林里到底發(fā)生了什么。
更多的我們把這些數據和情報應用推到更廣,做威脅態(tài)勢感知系統,對于不管是行業(yè)性的還是監(jiān)管機構能夠對本地區(qū)的安全態(tài)勢有一個更完整的調整,從而能夠變到更多安全事件的應對,起到預警和報警作用。
另外一個點,我們360在去年的時候發(fā)布了國內第一個威脅情報中心,也是希望用我們360的力量能夠把我們所掌握的部分數據向我們的業(yè)內、向我們的企業(yè)、向我們的政府去開放,做一些數據的共享和連接的努力,從而能夠讓業(yè)內的水平推到更高的位置上。所以大家可以看到這樣一個網址,可以看到在安全方面更有效的數據內容提供,來推進整個業(yè)內的發(fā)展。