國外媒體近日撰文揭秘重塑谷歌帝國的人造大腦。文章指出,3年前創(chuàng)建的谷歌大腦項(xiàng)目表現(xiàn)越來越搶眼,其人工智能系統(tǒng)給谷歌旗下的各個(gè)重要產(chǎn)品都帶來了助力,從Android語音識別軟件到無人駕駛汽車,再到廣告和谷歌地圖。
以下是文章主要內(nèi)容:
它是最單調(diào)乏味的互聯(lián)網(wǎng)工作之一。一谷歌團(tuán)隊(duì)需要日復(fù)一日盯著電腦屏幕,檢查街景照片的小細(xì)節(jié),反復(fù)不斷地問自己同一個(gè)問題:“我看到的是不是地址呢?”然后點(diǎn)擊“是”,點(diǎn)擊“是”,點(diǎn)擊“否”。
這是打造該公司的谷歌地圖服務(wù)過程的重要組成部分。知道建筑的準(zhǔn)確地址,對于制圖師來說確實(shí)很有幫助。但那并不能讓那些苦逼的谷歌工作人員的生活好過一些,他們必須得一個(gè)個(gè)地去判斷谷歌街景車拍攝的一串?dāng)?shù)字是電話號碼、涂鴉標(biāo)簽還是正確的地址。
而在幾個(gè)月前,他們終于脫離苦海了,部分谷歌工程師將公司的機(jī)器訓(xùn)練得能夠處理該類吃力不討好的任務(wù)了。從以往來看,計(jì)算機(jī)并不擅長處理這類先進(jìn)的圖像識別工作,而谷歌則終于憑借其名為“谷歌大腦”(Google Brain)的新人工智能系統(tǒng)攻克了該問題。利用谷歌大腦,谷歌如今能夠在不到一個(gè)小時(shí)內(nèi)轉(zhuǎn)錄街景車拍到的所有地址信息。
自3年前誕生于谷歌的秘密實(shí)驗(yàn)室Google X以來,谷歌大腦在公司內(nèi)部變得越來越搶眼,讓軟件工程師們能夠?qū)⑶把氐臋C(jī)器學(xué)習(xí)算法應(yīng)用于越來越多的問題解決上。在許多方面,它很可能會給谷歌帶來競爭優(yōu)勢,幫助它在未來十年擴(kuò)張至各個(gè)新領(lǐng)域,一如過去十年它的搜索算法和數(shù)據(jù)中心技術(shù)幫助它建立起極為成功的廣告業(yè)務(wù)那樣。
“機(jī)器學(xué)習(xí)公司”
“谷歌不完全是家搜索公司,它是家機(jī)器學(xué)習(xí)公司。”曾在谷歌大腦實(shí)習(xí)的視覺搜索創(chuàng)業(yè)公司Clarifai CEO馬修·塞勒(Matthew Zeiler)如是說。他稱,谷歌最重要的項(xiàng)目全都受益于該類研究,從無人駕駛汽車,到廣告,再到谷歌地圖。“該公司的一切都由機(jī)器學(xué)習(xí)驅(qū)動(dòng)。”
除了谷歌地圖外,谷歌大腦還給Android的語音識別軟件和Google+的圖像搜索帶來了助力。但據(jù)谷歌大腦項(xiàng)目領(lǐng)導(dǎo)者之一杰夫·迪恩(Jeff Dean)稱,那還只是個(gè)開始。他相信,谷歌大腦將有助提升公司的搜索算法和谷歌翻譯。“谷歌內(nèi)部現(xiàn)在大概有三四十個(gè)團(tuán)隊(duì)使用我們的基礎(chǔ)設(shè)施,”迪恩說道,“有的團(tuán)隊(duì)?wèi)?yīng)用于生產(chǎn),有的在進(jìn)行探索,將谷歌大腦與已有系統(tǒng)進(jìn)行對比,它們在運(yùn)用谷歌大腦解決各類問題上普遍都取得很不錯(cuò)的效果。”
該項(xiàng)目是名為“深度學(xué)習(xí)”的新型人工智能大趨勢的一部分。Facebook在探究類似的工作,微軟、IBM等公司亦然。不過,谷歌似乎暫時(shí)處于領(lǐng)先,對該技術(shù)的研究更深入。
人工智能即服務(wù)
谷歌大腦誕生于2011年。一年后,谷歌將Android的語音識別錯(cuò)誤率大幅降低25%。不久后該公司開始不斷招兵買馬,網(wǎng)羅它能找到的每一位深度學(xué)習(xí)專家。去年,谷歌招攬了杰夫·辛頓(Geoff Hinton)——全球最頂級的深度學(xué)習(xí)專家之一。今年1月,該公司又斥資4億美元拿下一家神秘的深度學(xué)習(xí)公司DeepMind。
利用深度學(xué)習(xí)技術(shù),計(jì)算機(jī)科學(xué)家可建立起在某種程度上模擬人腦學(xué)習(xí)模式的軟件模型。然后,他們訓(xùn)練這些模型處理海量的新數(shù)據(jù),并相應(yīng)調(diào)整模型,最終將它們應(yīng)用于各類新任務(wù)。例如,為谷歌圖像搜索而建的圖像識別模型可能也對谷歌地圖團(tuán)隊(duì)有幫助。文本分析模型可能有助于改進(jìn)谷歌的搜索引擎,或許在Google+上也能夠派上用場。
谷歌開發(fā)了一些人工智能模型,并將它們發(fā)布到內(nèi)部網(wǎng)絡(luò)上。迪恩及其團(tuán)隊(duì)也專門開發(fā)了后端軟件,讓谷歌的服務(wù)器進(jìn)行數(shù)據(jù)挖掘,然后將結(jié)果顯示在軟件控制面板上,向開發(fā)者展示人工智能代碼的表現(xiàn)和作用。“它看起來就像是核反應(yīng)堆控制臺。”迪恩說。
對于部分項(xiàng)目,如Android語音識別軟件,迪恩的團(tuán)隊(duì)需要費(fèi)一番功夫才能讓那些學(xué)習(xí)模型發(fā)揮作用。不過,在使用谷歌大腦軟件的團(tuán)隊(duì)中,約有一半只需要下載源代碼,修改配置文件,以及將谷歌大腦指向它們自己的數(shù)據(jù)。
考慮到深度學(xué)習(xí)算法可解決問題之廣泛,迪恩及其團(tuán)隊(duì)開發(fā)的代碼可以做的還很多。他們還發(fā)現(xiàn),那些模型往往處理的數(shù)據(jù)越多,就會變得越精準(zhǔn)。那可能是谷歌的下一個(gè)重大目標(biāo):建立基于數(shù)十億而非數(shù)百萬的數(shù)據(jù)點(diǎn)的人工智能模型。正如迪恩所說的,“我們正試圖推進(jìn)下一個(gè)水平的可擴(kuò)展性去訓(xùn)練極其巨大且十分精準(zhǔn)的模型。”
http://www.wired.com/2014/07/google_brain/
譯者:樂邦