李開復(fù)在清華大學(xué)演講的時(shí)候?qū)θ斯ぶ悄茏龀隽艘环浅V锌系脑u(píng)論。其中還詳細(xì)的解釋了一般企業(yè)如何應(yīng)用人工智能為企業(yè)建立競爭優(yōu)勢(shì)和技術(shù)壁壘,句句都是干貨,簡單來說,人工智能行業(yè)的發(fā)展現(xiàn)在仍有很大限制——沒有平臺(tái)化。但也正因?yàn)橛兄@樣一個(gè)限制,這時(shí)候建立起來的壁壘也會(huì)是最高的。由于人工智能的優(yōu)勢(shì)眾多,因此我們認(rèn)為,企業(yè)都應(yīng)該考慮開始用人工智能輔助自己,也招募一些相關(guān)方面的人才。
不過我們不能光打打嘴炮,如何克服困難和挑戰(zhàn),讓人工智能幫到你的工作、你的事業(yè)呢?讓我們將李開復(fù)的演講內(nèi)容,再結(jié)合一個(gè)實(shí)例,來給大家解釋一下。
現(xiàn)在,假設(shè)你是一個(gè)程序員
雖然哥也是一媒體人,但黑起自己的行業(yè)來是絲毫不會(huì)手軟的,假設(shè)你現(xiàn)在是一家媒體的IT部門人員,這家媒體每天做的最多,最重要的工作就是從別的網(wǎng)站復(fù)制文章過來,然后加一些自己的記號(hào)上傳到自己的網(wǎng)站上去,而你雖然是一介碼農(nóng),但是卻心懷天下,想要拯救公司里那些苦逼的編輯。于是你決定自己編寫一個(gè)程序,幫助編輯們一鍵完成,甚至自動(dòng)完成這些復(fù)制文章的事,你應(yīng)該怎么做?
當(dāng)然,用人工智能來復(fù)制粘貼看起來是有點(diǎn)大材小用了,但這活看起來很機(jī)械,倒也需要一定的應(yīng)變,比如網(wǎng)站的頁面里除了正文外還有很多亂七八糟的廣告鏈接,只要網(wǎng)站的設(shè)計(jì)者不會(huì)太蠢,設(shè)計(jì)出來的結(jié)果應(yīng)該是人一眼就能看出來哪個(gè)部分是正文哪些是無關(guān)信息。但一個(gè)算法要如何識(shí)別正文和廣告/無關(guān)鏈接的區(qū)別呢?而且算法如何在網(wǎng)站的內(nèi)容中尋找到哪些是值得Copy的內(nèi)容呢?(是謂“熱點(diǎn)”)
最關(guān)鍵的是,細(xì)細(xì)一想,這些要注意的事項(xiàng)還真挺多。你平時(shí)學(xué)的If else似乎不夠用了,你該用什么語言來完成你的驚世算法呢?
說到這里,我們就面臨了李開復(fù)提到的目前的深度學(xué)習(xí)面臨的第一個(gè)挑戰(zhàn):沒有平臺(tái)
深度學(xué)習(xí)的挑戰(zhàn)之一:平臺(tái)
人工智能目前還沒有一個(gè)統(tǒng)一的平臺(tái)。在深度學(xué)習(xí)方面,現(xiàn)在的人懂就是懂,不懂就是不懂。這就是為什么Google最近花了重金不斷在挖業(yè)界頂尖的人才,給年輕人開出的年薪甚至超過200萬美元。這些人也就是二十來歲,博士剛畢業(yè)不久,怎么會(huì)這么值錢呢?
為什么這么貴呢?李開復(fù)老師有提到,這些人被投入到各個(gè)領(lǐng)域的AI研究中去后,可能很快就能創(chuàng)造出千萬美元甚至上億美元的價(jià)值了。但他可能沒有表達(dá)出來的一個(gè)意思是,現(xiàn)在的AI開發(fā)真的很難,很難,之所以這么難,就是因?yàn)闆]有平臺(tái)。
平臺(tái)是一個(gè)比較玄乎的概念,因?yàn)楝F(xiàn)在人工智能的發(fā)展還處于一種摸著石頭過河的狀態(tài),因此沒有人能預(yù)測(cè)所謂的“平臺(tái)”的準(zhǔn)確形態(tài)是什么樣,這話題鋪開來講可能能單獨(dú)講一篇文章,但簡單來說,大概會(huì)是一種“統(tǒng)一標(biāo)準(zhǔn)”的狀態(tài)。比如說現(xiàn)在一提神經(jīng)網(wǎng)絡(luò)算法人們就會(huì)想起很多種概念,CNN、RNN、DNN等等,而具體到應(yīng)用實(shí)現(xiàn)的方法也千奇百怪。所有基于AI的編程,都是要從0開始編起,一點(diǎn)一點(diǎn)構(gòu)筑起算法。但如果有一天有一個(gè)類似于iOS、安卓的東西,探索出了一種最優(yōu)秀的算法(當(dāng)然這只是打個(gè)比方,不一定有最優(yōu)秀的算法。),并且將其集成進(jìn)了某種程序中,后人如果想進(jìn)行神經(jīng)網(wǎng)絡(luò)有關(guān)的開發(fā),只需要調(diào)用它提供的API就能完成了。那樣就能極大的簡化深度學(xué)習(xí)開發(fā)的難度。
深度學(xué)習(xí)挑戰(zhàn)之二:數(shù)據(jù)的收集和運(yùn)算
當(dāng)然作為一個(gè)心懷天下的碼農(nóng),這點(diǎn)小事肯定是難不倒你的,你應(yīng)該很快就找到了合適的語言系統(tǒng),比如Tensorflow,比如Scikit,開開心心的編起了程序。不過接下來你要面對(duì)的問題可能就沒有那么好解決了:它們都從兩個(gè)方向分別決定著你的算法訓(xùn)練的效果:訓(xùn)練數(shù)據(jù)的量和訓(xùn)練的速度。李開復(fù)老師將這個(gè)問題拆成了兩個(gè)問題,但我們認(rèn)為,其實(shí)他們都是關(guān)于算法訓(xùn)練的問題,因此其實(shí)可以歸于同一個(gè)問題。
深度學(xué)習(xí)的網(wǎng)絡(luò)太大,需要海量的數(shù)據(jù)。