從長遠來看,我不覺得同為人類的棋手能夠在與機器的搏殺中重占上風——無論棋類游戲的空間與規(guī)則是多么復雜,對機器而言,只要證明了某種算法行之有效,那么,在與日俱增的大數據資源、與時俱進的計算資源的加持下,其相對于人類而言的優(yōu)勢只會越來越大。
大數據:豈止于大
一個有趣的問題是,有關人工神經網絡與深度學習的理論探討和實踐嘗試已有幾十年歷史,然而為什么直到今天,深度學習才顯現出非凡的威力?
美國聯合服務協(xié)會(USAA)數據科學部部長羅伯特·韋爾伯恩(Robert Welborn)認為,2015年是機器學習商業(yè)化進程快速發(fā)展的一年。存儲市場的大范圍降價及存儲設備制造成本的降低是機器學習領域騰飛的關鍵。
而當大數據和云遇見深度學習,這一計算機科學家朝思暮想了數十載的科技終于不再是無本之木。隨著深度學習技術的潛能被充分釋放,弈棋程序的勝利以及我們在圖像識別、語音識別等領域的連番突破也就是順理成章的事。
大數據到底有多大?根據IDC在2014年發(fā)布的一份報告,僅在2013年,人類生成、復制與消費的數據量便達到4.4ZB,即44億TB——可以想想,這些數據需要多少個硬盤來盛裝——而到2020年,這一數值將達到40ZB,年增長率40%。
很明顯,云計算、移動互聯網與社交網絡是大數據的三大推進器。做一組數字對比就知道:
1997年,全中國膠卷消費量約為1.2億個,而當時的人口數是12.36億。以每卷膠卷能拍24-36張照片計,總共約40億張照片,相當于每年每10個中國人消費1卷膠卷,拍攝3張照片。
2015年,僅小米手機用戶每天新拍攝的照片就達到1億張,而微信用戶每天上傳的新照片則超過10億張,也就是小米手機用戶每一個半月、微信每四天新增的照片數量就超過1997年全中國人拍攝的照片。
由對比揭示出,過去不到20年的時間里,個人計算設備生成的數據量呈現出驚人的增長態(tài)勢。而要想處理好這些激增的數據,就需要強大的云存儲與計算平臺。以處理小米手機每日新增照片為例,1億張照片的云相冊縮略圖處理就需要2400核、2.6GHz的CPU與200TB的存儲空間。
況且要讓手機這種設備支持某些看起來很酷很智能的功能,比如人臉檢測、根據面孔特征實現身份識別和分類編目等,若沒有一流云平臺在背后支持,也是不可想象的。
小米手機相冊就加入了一些對用戶而言相當便利和人性化的功能,例如:
用戶可以從合影中找到每一張人臉并看到年齡標簽。
點擊“面孔”分欄,所有包含人物的照片便被歸入“姓名”影集中。
選擇其中一張合影,應用還能標示出畫面里每個人的姓名……
上述功能對于“患有”臉盲癥和健忘癥的朋友來說非常有用,而且也讓手機看起來很“聰明”。但其實,相關的運算過程并不是在手機硬件平臺上進行,而是依托于遠端的“小米云相冊”——至于小米云相冊,其實是由金山云做支撐。
深度學習:讓機器勝過人
正是因為數據量以幾何級數激增,從事機器學習、神經網絡等研究工作的科學家們以前認為不可能完成的訓練任務,今天才能相對容易地完成。
我自己是做研究出身的,以前專攻的方向正是視頻與圖像內容分析及檢索、計算機視覺和信息系統(tǒng)。關于人臉識別,早在20年前,我和團隊就獲得了一項專利——記得1996年,我在硅谷的HP實驗室時開始研究,1997年提出專利申請,2000年獲得批準(如圖2、圖3)。這是一個分布式的架構,數據從客戶端生成,傳輸至后端的系統(tǒng),經過一系列處理后,再將結果推送到前端。事實上,現在學界與產業(yè)所做的人臉識別、云-端圖像處理研究與20年前相比,在原理方面是相近的,只是在數據資源與算法上有了極大的改進。