克里斯汀·羅伯森,職責(zé)是在機(jī)器學(xué)習(xí)方面培訓(xùn)谷歌內(nèi)外的人員。
這也需要相當(dāng)程度的耐心。羅伯森說(shuō):“機(jī)器學(xué)習(xí)模型不是靜態(tài)代碼,你需要不斷為其提供數(shù)據(jù)。我們一直在不停地更新模型,而且還要不斷學(xué)習(xí),增加更多數(shù)據(jù),調(diào)整預(yù)測(cè)方式等。它就像是一個(gè)有生命的東西,這是一種截然不同的開(kāi)發(fā)模式。”迦南德里說(shuō):“實(shí)際上這是一個(gè)使用不同算法進(jìn)行實(shí)驗(yàn)的學(xué)科,或關(guān)于哪個(gè)訓(xùn)練數(shù)據(jù)集在你的使用案例上工作效果最好的學(xué)科。”
盡管迦南德里已是搜索業(yè)務(wù)主管,但他仍然認(rèn)為在內(nèi)部傳播機(jī)器學(xué)習(xí)技術(shù)的福音是他工作的一部分。他說(shuō):“計(jì)算機(jī)科學(xué)那部分不會(huì)有太大變化,但對(duì)數(shù)學(xué)和統(tǒng)計(jì)學(xué)的關(guān)注會(huì)更多,而對(duì)編寫(xiě)五十萬(wàn)行代碼的關(guān)注則會(huì)減少。”就谷歌而言,這一障礙可以通過(guò)智能再培訓(xùn)克服。迪恩說(shuō):“在訓(xùn)練的一天結(jié)束時(shí),這些模型中所使用的數(shù)學(xué)變得不再?gòu)?fù)雜。對(duì)于谷歌雇傭的大部分工程師而言,這都是可以實(shí)現(xiàn)的。”
為了進(jìn)一步幫助日益增長(zhǎng)的機(jī)器學(xué)習(xí)專(zhuān)家團(tuán)隊(duì),谷歌開(kāi)發(fā)了一系列強(qiáng)大的工具,在訓(xùn)練算法時(shí)選擇正確的模型,以加快培訓(xùn)和提煉過(guò)程。其中最強(qiáng)大的是TensorFlow,它可以加速神經(jīng)網(wǎng)絡(luò)的構(gòu)建過(guò)程。TensorFlow源自谷歌大腦項(xiàng)目,由迪恩和他的同事拉加特·芒格(Rajat
Monga)共同發(fā)明。它能把構(gòu)建系統(tǒng)過(guò)程中涉及的晦澀難懂的細(xì)節(jié)變成標(biāo)準(zhǔn)化的內(nèi)容,特別是在谷歌2015年11月開(kāi)始將其開(kāi)放給公眾后,這種做法的效果更快得以顯現(xiàn)。
前景廣闊 應(yīng)用無(wú)限
盡管谷歌煞費(fèi)苦心地將傳播人工智能技術(shù)的行為描述為利他主義行為,但它也承認(rèn):如果新一代程序員都能熟悉該公司內(nèi)部的機(jī)器學(xué)習(xí)工具,那對(duì)谷歌未來(lái)的招聘活動(dòng)帶來(lái)莫大好處。盡管如此,TensorFlow的功能以及谷歌的開(kāi)源模式很快受到了程序員的歡迎。迦南德里表示,當(dāng)谷歌首次提供TensorFlow課程時(shí),共有7.5萬(wàn)人報(bào)名參加。
但谷歌仍為自己的程序員保留了很多好東西。在公司內(nèi)部,員工擁有無(wú)可比擬的機(jī)器學(xué)習(xí)工具——Tensor Processing
Unit(張量處理單元)。他們雖然使用這項(xiàng)創(chuàng)新已經(jīng)很多年,但直到最近才對(duì)外宣布。張量處理單元是一種針對(duì)機(jī)器學(xué)習(xí)程序優(yōu)化的芯片,就像GPU是專(zhuān)門(mén)針對(duì)圖形處理優(yōu)化的芯片一樣。該公司的龐大數(shù)據(jù)中心里使用了數(shù)以千計(jì)的張量處理單元。通過(guò)賦予神經(jīng)網(wǎng)絡(luò)以超級(jí)計(jì)算能力,張量處理單元為谷歌帶來(lái)了巨大優(yōu)勢(shì)。迪恩說(shuō):“如果沒(méi)有它,我們無(wú)法推出RankBrain。”
但由于谷歌最需要的還是設(shè)計(jì)和完善這些系統(tǒng)的人才,就像正在緊鑼密鼓地完善其軟件訓(xùn)練工具一樣,谷歌也在不斷嘗試各種方式來(lái)為工程師提供機(jī)器學(xué)習(xí)方面的培訓(xùn)。這些培訓(xùn)的規(guī)模大小不等,包括為期兩天的速成班,使用幻燈片和實(shí)際操作練習(xí)。谷歌希望這只是初步嘗試,工程師隨后還會(huì)尋找更多資源來(lái)深入學(xué)習(xí)。迪恩說(shuō):“已經(jīng)有數(shù)千人報(bào)名,準(zhǔn)備參加下一次課程。”
谷歌還采取其他措施,為外部人才提供機(jī)器學(xué)習(xí)培訓(xùn)。今年初春,谷歌啟動(dòng)了Brain
Residency項(xiàng)目,利用谷歌大腦項(xiàng)目為有潛力的外部人才提供了為期一年的集訓(xùn)。羅伯森說(shuō):“我們稱(chēng)之為深度學(xué)習(xí)職業(yè)生涯的開(kāi)端。”這次集訓(xùn)共有27名來(lái)自不同學(xué)科的機(jī)器學(xué)習(xí)學(xué)員,其中可能有些人會(huì)留在谷歌。但羅伯森表示,谷歌的目的是讓他們自行發(fā)展,利用自己掌握的先進(jìn)知識(shí)在世界各地傳播谷歌的機(jī)器學(xué)習(xí)技術(shù)。
從某種意義上說(shuō),機(jī)器學(xué)習(xí)正在逐步走上中心舞臺(tái),谷歌希望以人工智能公司的身份繼續(xù)占據(jù)主導(dǎo)地位,而霍爾蓋特等人在忍者項(xiàng)目中學(xué)到的知識(shí)正是這一計(jì)劃的核心。霍爾蓋特的課程最初是為期4周的新兵訓(xùn)練營(yíng),由谷歌最先進(jìn)的人工智能項(xiàng)目產(chǎn)品負(fù)責(zé)人提供指導(dǎo),仔細(xì)教給他們?nèi)绾螌C(jī)器學(xué)習(xí)融入項(xiàng)目中。
羅伯森說(shuō):“我們把忍者帶進(jìn)會(huì)議室,考拉多站在白板前解釋何為L(zhǎng)STM(長(zhǎng)短期記憶,一種可以打造強(qiáng)大神經(jīng)網(wǎng)絡(luò)的技術(shù))。他做著夸張的手勢(shì),講述這種系統(tǒng)的工作原理,利用了哪些數(shù)學(xué)原理,如何應(yīng)用于產(chǎn)品中。在最初的4個(gè)星期里,我們幾乎用到了所有技術(shù)和所有工具,為的是給他們帶來(lái)真正的沉浸式體驗(yàn)。”