科技訊9月29日消息,據(jù)國(guó)外媒體報(bào)道,一百多年來(lái),人工智能一直是計(jì)算機(jī)界的終極難題,對(duì)這種極其復(fù)雜的技術(shù),我們目前了解的只是冰山一角。目前,科技界的所有領(lǐng)軍企業(yè)都向人工智能系統(tǒng)的研發(fā)投入了重金,但目前看來(lái),我們距離真正的人工智能依舊十分遙遠(yuǎn)。
對(duì)此,國(guó)外媒體對(duì)谷歌的搜索業(yè)務(wù)高級(jí)副總裁約翰-賈南德雷亞(John Giannandrea)展開(kāi)了采訪。他曾擔(dān)任谷歌的機(jī)器智能業(yè)務(wù)高管。
以下為訪問(wèn)主要內(nèi)容。
目前并非人工智能時(shí)代,而是機(jī)器學(xué)習(xí)時(shí)代
約翰先闡明了一個(gè)問(wèn)題,即機(jī)器智能擁有三個(gè)不同的層次:機(jī)器學(xué)習(xí)、機(jī)器智能與人工智能。機(jī)器學(xué)習(xí)是我們目前所處的研發(fā)階段。在機(jī)器學(xué)習(xí)系統(tǒng)中,我們可編寫(xiě)某種算法并輸入一些信息,用來(lái)訓(xùn)練機(jī)器以某種方式運(yùn)行。
機(jī)器學(xué)習(xí)的較高層次是,機(jī)器能夠吸收所學(xué)的內(nèi)容,并適應(yīng)新概念。而真正的人工智能能夠自學(xué)新概念并實(shí)現(xiàn)自我進(jìn)步,就像人類那樣。我們目前已攻克的問(wèn)題僅僅是編寫(xiě)人工學(xué)習(xí)算法。而且,約翰表示,要讓系統(tǒng)吸納所學(xué)內(nèi)容并靠依賴自身的力量來(lái)適應(yīng)新環(huán)境,為時(shí)尚早。
神經(jīng)網(wǎng)絡(luò)以及數(shù)字訓(xùn)練場(chǎng)
要讓機(jī)器達(dá)到最簡(jiǎn)單的智能水平,核心在于“訓(xùn)練”。每臺(tái)機(jī)器首先得接受“訓(xùn)練”,才能以某種方式處理信息。例如,向機(jī)器展示一張狗的照片,要它把照片正確標(biāo)記為“狗”,谷歌需要向神經(jīng)網(wǎng)絡(luò)提供成千上萬(wàn)張狗的照片。本質(zhì)上而言,神經(jīng)網(wǎng)絡(luò)是模擬人腦的多層數(shù)字感知器。
其中每一層都擁有某些“端口”,它們就像人腦中的神經(jīng)元一樣,可根據(jù)攜帶的刺激信號(hào)與對(duì)應(yīng)端口相連接。因此,研究人員會(huì)向神經(jīng)網(wǎng)絡(luò)輸入成千上萬(wàn)張僅含有狗的圖像,并查看所有圖片對(duì)應(yīng)的輸出信息是否是“狗”。一旦出現(xiàn)錯(cuò)誤,錯(cuò)誤的信息就會(huì)被反饋到神經(jīng)網(wǎng)絡(luò)中,這樣神經(jīng)網(wǎng)絡(luò)就能從錯(cuò)誤中“學(xué)習(xí)”,并調(diào)整識(shí)別模式。谷歌已取得一些顯著的進(jìn)展,這可在照片管理應(yīng)用Google Photos中得到體現(xiàn)——該應(yīng)用可基于內(nèi)容對(duì)照片展開(kāi)分類。
用戶可以在Google Photos中輸入“貓”,結(jié)果就會(huì)搜出圖庫(kù)中所有帶貓的照片。這就屬于機(jī)器學(xué)習(xí)的范疇,但仍然相當(dāng)有限。約翰指出,雖然這種算法能夠搜出所有帶貓的照片,但無(wú)法根據(jù)貓的品種來(lái)細(xì)分照片。
機(jī)器學(xué)習(xí)的真正極限
當(dāng)前階段的機(jī)器學(xué)習(xí)擁有著相當(dāng)有限的功能。它能夠區(qū)分貓和狗,但還沒(méi)辦法識(shí)別出貓的不同品種。機(jī)器學(xué)習(xí)只能在很有限的變量范圍內(nèi)運(yùn)行,哪怕只有一個(gè)變量發(fā)生變化,它就無(wú)法正常運(yùn)行。例如,如果把一只貓裝扮成狗,那么Photos應(yīng)用該把它認(rèn)作貓還是狗?
谷歌一直利用機(jī)器學(xué)習(xí)技術(shù)來(lái)開(kāi)發(fā)能夠區(qū)分說(shuō)話者的聲音和環(huán)境噪聲的語(yǔ)音識(shí)別軟件。這種軟件還能夠識(shí)別不同語(yǔ)言,但無(wú)法識(shí)別語(yǔ)調(diào)以及說(shuō)話時(shí)的情感模式(例如,諷刺)。它只能在十分有限的參數(shù)集合中運(yùn)行,要擴(kuò)大可運(yùn)行的參數(shù)范圍,研究者就需要投入大量的時(shí)間,并安排成千上萬(wàn)次訓(xùn)練,才能讓機(jī)器學(xué)習(xí)系統(tǒng)正常運(yùn)行。
谷歌如何應(yīng)用機(jī)器學(xué)習(xí)技術(shù)
約翰表示,谷歌的機(jī)器學(xué)習(xí)API目前仍處在研發(fā)初期,但進(jìn)展速度相當(dāng)快。谷歌正使用機(jī)器學(xué)習(xí)來(lái)增強(qiáng)自動(dòng)搜索功能、YouTube的推薦視頻功能、郵件客戶端Inbox以及即時(shí)通訊工具Allo等等。Inbox的功能之一是基于內(nèi)容撰寫(xiě)并發(fā)送自動(dòng)回復(fù)郵件。約翰表示,Inbox用戶發(fā)出郵件中的10%就使用了自動(dòng)回復(fù)郵件這一功能。
Allo則更為智能。Allo中的算法學(xué)習(xí)了用戶特有的交談方式后,就會(huì)基于所學(xué)內(nèi)容、建議回復(fù)內(nèi)容。
語(yǔ)音助手Google Assistant對(duì)機(jī)器學(xué)習(xí)技術(shù)的應(yīng)用可以說(shuō)最為深入。它能夠識(shí)別語(yǔ)言,甚至區(qū)分用戶的聲音與周邊的噪音。Google Now則基于用戶的使用模式為用戶生成相關(guān)信息。
隱私問(wèn)題
谷歌正在收集大量的用戶數(shù)據(jù),這不是什么秘密。這些數(shù)據(jù)對(duì)谷歌的用途之一是訓(xùn)練機(jī)器學(xué)習(xí)API。當(dāng)被問(wèn)及這些數(shù)據(jù)的安全性有多大,約翰回答,所有數(shù)據(jù)被用于訓(xùn)練機(jī)器學(xué)習(xí),并匯總成一個(gè)龐大的數(shù)據(jù)庫(kù),但谷歌對(duì)數(shù)據(jù)進(jìn)行了匿名處理,因此所有數(shù)據(jù)都無(wú)法追溯至來(lái)源。