1月22日消息,昨日,未來論壇創(chuàng)立大會在北京成功舉行。百度首席科學(xué)家吳恩達在論壇上發(fā)表了題為“人工智能與深度學(xué)習(xí)”的主題演講,并在會后接受了新浪科技的采訪。
吳恩達提到,“我們最近決定看看,以神經(jīng)網(wǎng)絡(luò)取代傳統(tǒng)語音識別軟件。世界走向移動設(shè)備,想象一下我們圍繞語音界面重新設(shè)計移動產(chǎn)品——語音將會推動手機的革命。我想要重新設(shè)計大家的手機”,這也將改變很多家用電器、可穿戴設(shè)備等等,“這些設(shè)備有太多界面了,如果用語音識別和設(shè)備進行溝通,會更加方便。”
技術(shù)發(fā)展帶來深度發(fā)展新機會
吳恩達以建造火箭為例,闡述了深度學(xué)習(xí)越來越火爆的原因。“火箭有兩個部分,第一部分是火箭發(fā)射機,是很大的發(fā)動機。第二個是燃料,如果發(fā)動機小,燃料很多是不可能的,如果發(fā)動機很小,燃料很少也不行,燃料燒著燒著就沒了,所以火箭必須要有一個大發(fā)動機和很多的燃料。深度學(xué)習(xí)和這個差不多,我們現(xiàn)在神經(jīng)網(wǎng)絡(luò)就是我們發(fā)動機,它推動著AI的發(fā)展,燃料就是我們所用的數(shù)據(jù),我們現(xiàn)在有這么多的數(shù)據(jù),社會數(shù)據(jù)化給我們提供了大量的數(shù)據(jù),這樣輸入到我們發(fā)動機中給我們作為燃料。”
如今,隨著移動互聯(lián)網(wǎng)的興起,大家的交流方式慢慢地從文本轉(zhuǎn)向圖像和視頻,基于此,越來越多的人開始搜索圖像和語言,而通過深度學(xué)習(xí),可以幫助人們更好地了解文本和圖像、語音之間的互動關(guān)系。
在吳恩達看來,隨著軟件和技術(shù)的發(fā)展,帶來了新的機會,使得軟件可以通過深度學(xué)習(xí)來分析數(shù)據(jù),從而使得我們擁有更多的數(shù)據(jù),使得計算機視覺可以做到之前所無法做到的事情。
目前百度基于深度學(xué)習(xí)技術(shù)的產(chǎn)品已有很多,深度學(xué)習(xí)技術(shù)幫助我們更好地理解語言、圖片和語音,使計算機更好地理解我們的溝通。并希望能通過各種方式去更好地利用這一技術(shù)。
其中一個最主要的例子是對對象的識別。你可以讓計算機去“看”一張圖片,并從中識別出對象。在許多知名的評分中,百度獲得了最好的成績。此前一些別的團隊獲得了最好成績,而我們在此基礎(chǔ)上繼續(xù)改進。這是通過深度學(xué)習(xí)技術(shù)來實現(xiàn)的。這需要通過建設(shè)龐大的神經(jīng)網(wǎng)絡(luò),輸入大量數(shù)據(jù),而百度的GPU技術(shù)使其成為了可能。
機器人不會掌控世界
AI快速的發(fā)展促成了一些炒作,大家忍不住會想,未來的某一天,計算機或許會成為機器人,掌控整個世界?
吳恩達很嚴肅地表示,他們是會和我們一起創(chuàng)造一個很好的世界,并不會成為邪惡的機器人。因為,大家完全可以利用技術(shù)進行預(yù)測,技術(shù)不斷的改變,神經(jīng)網(wǎng)絡(luò)是非常好的識別工具,還有預(yù)測的工具,當你輸入數(shù)據(jù)的時候它們可以進行預(yù)測。
如果我們能夠遠離炒作,AI發(fā)展是比較健康的,AI創(chuàng)造的挑戰(zhàn)并不是機器會掌控世界,他很可能會幫助我們替代勞工,我們領(lǐng)導(dǎo)者必須要認真考慮技術(shù),要讓人工智能技術(shù)幫助我們替代那些繁雜的勞動。
百度語音識別正取得很好進展
百度的語音識別技術(shù)正取得很好的進展,計算機已經(jīng)保存了大量語音數(shù)據(jù),通過訓(xùn)練神經(jīng)網(wǎng)絡(luò),從而打造了非常準確的語音識別系統(tǒng)。當前語音識別技術(shù)的一大問題在于無法在嘈雜的環(huán)境中使用,例如當你在一個很吵的車中開車時,這樣的技術(shù)無法很好地提供服務(wù)。百度目前擁有嘈雜環(huán)境中最優(yōu)秀的語音識別技術(shù)。
至于如何克服語音識別技術(shù)研發(fā)中的困難,則需要做兩方面的工作。一方面在于規(guī)模,百度需要研究如何建設(shè)規(guī)模很大的網(wǎng)絡(luò)。因此百度擁有著很強大的GPU團隊,并開發(fā)了強大的GPU軟件。另一方面,百度需要找到足夠多的數(shù)據(jù)來作為這一大型神經(jīng)網(wǎng)絡(luò)的輸入內(nèi)容。
在百度工作令人興奮
吳恩達已經(jīng)在百度工作將近一年的時間,也不可避免地接觸到公司以及團隊的成員。這也是一個不可回避的問題。
當然,吳恩達在提到這個問題的時候非常愉快,因為在他看來,在百度工作令人興奮而愉快。公司非常敏捷,動作很快,所以可以創(chuàng)造出一些東西,而且與研發(fā)團隊的共事也讓人感到興奮。
他還以語音識別來舉例說明。百度有3個實驗室,這3個實驗室之間經(jīng)常共同討論,相互提供專業(yè)指導(dǎo)。許多人會相互拜訪、相互溝通。以往當語音技術(shù)宣布突破時,美國的團隊出現(xiàn)進展,北京的團隊就會借鑒來自英語環(huán)境的經(jīng)驗,并轉(zhuǎn)而在中文環(huán)境中嘗試。百度是一家統(tǒng)一的公司,大家努力作為同一個團隊、同一家公司來行動。