9月1日消息,2016百度世界大會在中國大飯店舉行。百度公司董事長兼首席執(zhí)行官李彥宏在主題演講中展示了百度人工智能應(yīng)用的最新進(jìn)展,已經(jīng)可以用在實(shí)際生活中。
他著重介紹了百度在語音和圖像方面的進(jìn)展。
其中最讓人興奮的應(yīng)用是語音翻譯。李彥宏展示了一段中國出租車司機(jī)和外國乘客的對話。兩人都不會外語,出租車司機(jī)說中文,通過百度可以翻譯成外語,讓外國乘客聽懂。外國乘客說英文,百度也可以準(zhǔn)確翻譯成中文。
這背后是百度的語音識別和語音合成功能在支持。他展示了語音識別和語音合成的技術(shù),百度的語音識別可以比較準(zhǔn)確地識別出一段營銷電話中銷售員和客戶的對話,同時(shí)百度用語音合成技術(shù)合成了張國榮向現(xiàn)場觀眾問候的話。
在現(xiàn)場,李彥宏還展示了百度自動駕駛汽車識別路況的過程。
還有一些正在探索中的應(yīng)用。李彥宏也展示了與歐萊雅合作的嘗試,比如拍一個(gè)歐萊雅洗發(fā)水,百度可以識別出洗發(fā)水,并且可以展示洗發(fā)水的主要原料。
他展示的還有自然語言處理。在去年的百度世界大會上,李彥宏曾展示通過度秘訂到咖啡,今年他展示了度秘獨(dú)立解說奧運(yùn)籃球比賽決賽,度秘的語速比半月前它與著名籃球評論員楊毅合作解說奧運(yùn)籃球比賽有所加快,較為流暢。(溫泉)
以下是李彥宏演講全文
李彥宏:各位來賓大家早上好!歡迎來到2016百度世界。
大家知道,百度世界是我們每年舉辦一次的百度技術(shù)創(chuàng)新大會。今年的主題我們聚焦在人工智能,大家在之前收到的請柬上已經(jīng)看到這個(gè)主題了。剛才開場視頻是以人工智能為主題的,今天我的主題演講也將圍繞著人工智能來展開。
今年6月份,我在百度聯(lián)盟峰會上講了一個(gè)概念,叫做互聯(lián)網(wǎng)的下一幕。下一幕是什么意思呢?就是說,互聯(lián)網(wǎng)的發(fā)展在此之前已經(jīng)經(jīng)過了兩個(gè)非常重要的階段,第一個(gè)階段大概持續(xù)了十幾年的時(shí)間,就是我們講的PC互聯(lián)網(wǎng)階段。第二個(gè)階段是在最近四五年,我們把它叫做移動互聯(lián)網(wǎng)的階段。對于中國市場來說,隨著上網(wǎng)人數(shù)越來越多,上網(wǎng)人口的滲透率越來越高,現(xiàn)在已經(jīng)達(dá)到了七億多,就是說已經(jīng)超過了50%的滲透率,同時(shí),每一個(gè)上網(wǎng)的人現(xiàn)在也基本都用上了智能手機(jī)。這意味著什么呢?這意味著,未來互聯(lián)網(wǎng)的增長不能再靠人口紅利來驅(qū)動了,也就是說,移動互聯(lián)網(wǎng)的時(shí)代其實(shí)正在離開我們。這可能是很多人覺得難以接受的。我們國家現(xiàn)在進(jìn)入了所謂的新常態(tài),經(jīng)濟(jì)的增長需要靠“互聯(lián)網(wǎng)+”行動計(jì)劃來推動,所謂“互聯(lián)網(wǎng)+”就是希望用互聯(lián)網(wǎng)的思維方式、互聯(lián)網(wǎng)的效率來推動各個(gè)行業(yè)、產(chǎn)業(yè)的繼續(xù)發(fā)展。但是,我們互聯(lián)網(wǎng)的從業(yè)者其實(shí)又深深地感受到了這其中的危機(jī),這個(gè)危機(jī)就是因?yàn)檫^去的粗放增長階段已經(jīng)結(jié)束了。
移動互聯(lián)網(wǎng)之后的下一幕是什么?其實(shí)現(xiàn)在已經(jīng)很清楚了,就是我們所說的人工智能。人工智能對于百度來說是核心當(dāng)中的核心,我們也很幸運(yùn),在過去的五六年當(dāng)中,百度花了很大很大的精力投入到人工智能的研發(fā)當(dāng)中。人工智能對于百度來說意味著什么呢?我可以用簡單的四個(gè)字來描述,就是百度大腦。百度大腦的概念我們其實(shí)在大約三年前就對外講過。那個(gè)時(shí)候我們講,百度大腦已經(jīng)具備了大概兩三歲孩子的智力水平了。自此以后,不斷的有人來問我,尤其是今年人工智能突然火起來了之后,很多人來問我說,你們這個(gè)百度大腦現(xiàn)在相當(dāng)于多少歲人的智力水平了。
要回答這個(gè)問題其實(shí)還蠻難的,我也不知道它現(xiàn)在是多少歲了,因?yàn)楫吘谷四X和電腦它還是有很大的區(qū)別,百度大腦雖然是一個(gè)人工智能的大腦,但是它和人正常的發(fā)育的過程還是很不一樣的。
百度大腦到底由什么構(gòu)成的呢?它基本上是由三個(gè)大的部分組成的。第一個(gè)組成部分,就是人工智能的算法。我們有超大規(guī)模的神經(jīng)網(wǎng)絡(luò),這是模擬人的神經(jīng)元組成的網(wǎng)絡(luò),但其實(shí)我們也不知道真正人腦工作的原理是什么,只是想象當(dāng)中應(yīng)該是這個(gè)樣子。我們還使用了萬億級的參數(shù),人腦的神經(jīng)源大概是千億級的,我們也有千億的樣本和千億的特征進(jìn)行訓(xùn)練。整個(gè)這些東西組成了百度大腦當(dāng)中算法的部分。