很多人認(rèn)為,經(jīng)過多年的積累,人工智能技術(shù)已處于爆炸式增長的前夕——也許他們的判斷沒錯,但作為信息科技領(lǐng)域的從業(yè)者,我和同行們更關(guān)心的是,人工智能何以突然間從“冷宮”穿越到“朝堂”上,成為了萬眾矚目的焦點?誰在為人工智能賦能?
請想象以下場景——
某種人工智能助手成為了像數(shù)字支付、地圖那樣的基礎(chǔ)服務(wù)。
它跨越平臺。無論是PC和手機,又或是智能家電與無人汽車,它都隱身于幕后,隨時準(zhǔn)備著響應(yīng)主人的“召喚”。
它跨越應(yīng)用。用戶無論是拍照片、玩游戲,又或是到語言不通的異國旅行、開始一輪新的健身訓(xùn)練,都少不了它的陪伴。
它還是跨越場景的,感官健全的。能聽又能說、能看又能寫,也就是說,它會極大地增強主人的能力,幫助人類更好地應(yīng)對工作與生活場景中的各種挑戰(zhàn)。
人工智能技術(shù):爆炸倒計時?
盡管目前行業(yè)里還沒有一款人工智能產(chǎn)品能達到這樣的水平——既能對接企業(yè)的產(chǎn)品數(shù)據(jù)庫,又能基于長期的用戶數(shù)據(jù)積累,達成對主人客觀情況的某種程度的了解——但我們距離類似的目標(biāo)已越來越近。
預(yù)計幾年之內(nèi),通過嵌入各類硬件、軟件與服務(wù)中,人工智能可以收集到更多實時生成的用戶數(shù)據(jù),類似于體重、體脂、體溫、心率、血氧飽和度等生理健康指標(biāo)和健身項目、時長等運動指標(biāo)等自身數(shù)據(jù),以及用戶飲食禁忌、消費習(xí)慣、品牌偏好等外部數(shù)據(jù),再加上時刻灌入更新的實時企業(yè)商品及服務(wù)信息,就可以為用戶提供最貼身、最吻合其需要的生活提示與消費推薦。當(dāng)然,所有的用戶數(shù)據(jù)都會加密存儲于云端,不會有泄密的問題。
很多人認(rèn)為,經(jīng)過多年的積累,人工智能技術(shù)已處于爆炸式增長的前夕——也許他們的判斷沒錯,但作為信息科技領(lǐng)域的從業(yè)者,我和同行們更關(guān)心的是,人工智能何以突然間從“冷宮”穿越到“朝堂”上,成為了萬眾矚目的焦點?誰在為人工智能賦能?
三大動力
盡管人們很早以前就開始對有自主思維與行動能力的機器展開暢想,并在60年前(達特茅斯會議)便確立了“人工智能”(Artificial Intelligence)的概念,但經(jīng)歷了幾十年漫長歲月的探索、挫折、重振,直到最近這幾年,學(xué)術(shù)界、產(chǎn)業(yè)界似乎才看到將人工智能由構(gòu)想轉(zhuǎn)換為現(xiàn)實的曙光。
深度學(xué)習(xí)算法、高質(zhì)量大數(shù)據(jù)與高性能計算資源,這是令人工智能技術(shù)研發(fā)驟然加速的三大動力,推動著人工智能從實驗室走向人們工作與生活,也推動著相關(guān)技術(shù)孵化和裂變出越來越多的精彩應(yīng)用。
首先,深度學(xué)習(xí)算法其實就是推理算法與機器學(xué)習(xí)算法的結(jié)合。典型的深度學(xué)習(xí)模型往往需要架設(shè)出層次很深的神經(jīng)網(wǎng)絡(luò),通過強化模型的復(fù)雜度來提升機器的學(xué)習(xí)能力,而模型復(fù)雜度又需要增加模型寬度(即隱性神經(jīng)元數(shù)目)與增加模型深度(即隱層數(shù)目)。
其次,研究者還必須不斷提高數(shù)據(jù)規(guī)模與質(zhì)量,來增強機器的學(xué)習(xí)效果。以過去幾個月來名聲大噪的AlphaGo為例,這個圍棋程序借助對人類六至九段棋手的16000次對局分析獲得了3000萬個布點數(shù)據(jù),并將這些數(shù)據(jù)用來訓(xùn)練其“策略網(wǎng)絡(luò)”(Policy Network)。
其三,高性能計算資源亦不可或缺。Elo評分法(Elo Rating)是由美籍匈牙利裔物理學(xué)博士阿帕德·埃羅(Arpad Elo)創(chuàng)建的對決類比賽選手水平評分方法。根據(jù)Elo評分,AlphaGo采用不同硬件配置、運行于異步模式(Asyncdivonous)與分布模式(Distributed)時對應(yīng)的得分如圖1:
圖1:AlphaGo的Elo評分,引自谷歌Deep
很顯然,分布模式下,從1202個CPU、176個GPU到1920個CPU、280個GPU,計算性能的線性增長只帶來了28點的評分增長,這表明,計算資源呈線性增長,評分卻不可能同樣呈線性增長。越往后,每一點評分的增長都需要海量計算資源的支持。