百度大腦智能連接
百度大腦讓連接更智能。首先人來(lái)到百度這個(gè)平臺(tái),表達(dá)他的搜索需求,這個(gè)搜索需求有可能是關(guān)鍵詞,有可能是一段話,有可能是拍個(gè)照片,就要靠百度大腦來(lái)識(shí)別用戶(hù)的意圖,在精確識(shí)別用戶(hù)搜索意圖后,我們用深度學(xué)習(xí)來(lái)對(duì)網(wǎng)頁(yè)語(yǔ)義相關(guān)性排序,從而匹配用戶(hù)需求,這就完成了人與信息的連接。另一方面是連接人與廣告和服務(wù),我們通過(guò)大規(guī)模的深度學(xué)習(xí),去估計(jì)和優(yōu)化點(diǎn)擊率和轉(zhuǎn)化率,進(jìn)而把人連接到所需要的廣告和服務(wù)。我們的深度學(xué)習(xí)已經(jīng)用在百度核心業(yè)務(wù)的方方面面,真正實(shí)現(xiàn)智能連接人和信息,智能連接人和服務(wù)。
深入百度大腦,百度大腦里用到一種叫深度語(yǔ)義神經(jīng)網(wǎng)絡(luò)的模型,它是百度大腦用于自然語(yǔ)言,去匹配query和網(wǎng)頁(yè)的語(yǔ)義相關(guān)性,這是業(yè)界第一次把深度學(xué)習(xí)用于提升搜索精度的成功案例,也是迄今為止深度學(xué)習(xí)用于語(yǔ)言文本信息最成功的應(yīng)用。另外,我們的鳳巢廣告系統(tǒng),它背后基于機(jī)器學(xué)習(xí)的點(diǎn)擊率預(yù)估模型,從第一代淺層的機(jī)器學(xué)習(xí)模型,已經(jīng)過(guò)度到到用更復(fù)雜的模型、更深的模型的時(shí)代。
同樣我們不斷的講到大數(shù)據(jù),大數(shù)據(jù)實(shí)際上給深度學(xué)習(xí)給人工智能帶來(lái)很大的機(jī)會(huì)。但如何處理大數(shù)據(jù)、如何獲得大知識(shí)、給我們帶來(lái)了新的技術(shù)挑戰(zhàn)。怎么樣去處理?我們是世界上最早大規(guī)模的利用GPU做深度學(xué)習(xí)的高科技公司,我們通過(guò)各種各樣的數(shù)據(jù)并行,模型并行去處理這些海量數(shù)據(jù)。我們還可以支持,生成,配置針對(duì)不同的應(yīng)用、不同的場(chǎng)景和不一樣的網(wǎng)絡(luò)結(jié)構(gòu)。在今天Robin也提到了,在中文語(yǔ)音移動(dòng)搜索的方面,在基于內(nèi)容的圖像搜索方面,我們現(xiàn)在做到了世界領(lǐng)先,這個(gè)是跟我們?cè)诖髷?shù)據(jù)訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)所取得的進(jìn)展分不開(kāi)的。
基于深度學(xué)習(xí)的OCR技術(shù),還可以像人一樣讀懂文字。比如一個(gè)實(shí)際的例子,我一個(gè)外國(guó)朋友在上??吹侥硞€(gè)菜單,他想知道這個(gè)菜單中是否滿(mǎn)足他想要的菜品需求,他拍照用百度翻譯,識(shí)別菜單上道菜是牛肉拉面,通過(guò)識(shí)別后翻譯成英文,并有語(yǔ)音的合成,所以這一款小小的APP,體現(xiàn)了百度在方方面面的人工智能領(lǐng)域都有非常深的積累。
我們剛剛上線的拍照答題,在一款產(chǎn)品叫作業(yè)幫里。我估計(jì)在小朋友們的暑假中可得到廣泛應(yīng)用,如果假期玩得很開(kāi)心,但臨近開(kāi)學(xué)還沒(méi)有做作業(yè)怎么辦。就像這頁(yè)P(yáng)PT顯示的例子,他們可以用這款產(chǎn)品拍下題目,我們的作業(yè)幫馬上就識(shí)別題目,并能找到答案。小朋友們?cè)摱嚅_(kāi)心埃當(dāng)然,也許這個(gè)對(duì)于家長(zhǎng)就不那么喜歡了。
不僅是中文OCR,在英文OCR識(shí)別方面,我們也都做到世界領(lǐng)先。這里展現(xiàn)的這些例子,人不一定都認(rèn)清的英文,但是我們的機(jī)器能夠識(shí)別。
百度擁有世界領(lǐng)先的基于內(nèi)容的圖像搜索技術(shù),比如跟我們的競(jìng)爭(zhēng)對(duì)手比,無(wú)論是識(shí)別結(jié)果還是搜索相關(guān)性都大幅度領(lǐng)先。希望機(jī)器能夠像人一樣去理解圖片,這個(gè)是很有挑戰(zhàn)性的。在兩個(gè)禮拜前百度推出了百度移動(dòng)搜索APP5.5版本,這個(gè)是歷史的進(jìn)步。這是世界上第一款基于深度學(xué)習(xí)的拍照實(shí)物搜索??催@些例子:拍書(shū)可以知道這個(gè)書(shū)的價(jià)格,知道它在哪里能夠買(mǎi)到;小朋友拿著爸爸媽媽的手機(jī),看著好玩的玩具直接下單,這是多么開(kāi)心的一件事情;再比如說(shuō)你要是看見(jiàn)朋友的衣服或者包包非常好看,拍了直接可以下單。
我們?cè)谶@里看看百度大腦的全景圖。我們以前是獲取互聯(lián)網(wǎng)信息,然后做搜索做廣告,所有一切都是在虛擬世界完成。但是現(xiàn)在所有的服務(wù)離現(xiàn)實(shí)世界越來(lái)越近,離人越來(lái)越近,所以我們通過(guò)自然交互,通過(guò)穿戴式,了解人的需求,另外物理世界的信息,比如商店,場(chǎng)景,街道,天氣等等,都跟我們推送的服務(wù)的相關(guān)性息息相關(guān),我們現(xiàn)在需要通過(guò)智能感知技術(shù)獲取人和場(chǎng)景的信息,才能推薦更加相關(guān)的服務(wù)。還有,我們看服務(wù)的執(zhí)行階段,以前互聯(lián)網(wǎng)上完成一個(gè)預(yù)測(cè),做出一個(gè)決策,之后是由人去執(zhí)行,從而完成整個(gè)互聯(lián)網(wǎng)服務(wù)環(huán)節(jié)。未來(lái)的互聯(lián)網(wǎng)服務(wù),需要機(jī)器,或者說(shuō)機(jī)器人,自動(dòng)的完成這服務(wù)的最后一公里。比如說(shuō)某一個(gè)人想吃披薩,在網(wǎng)上下單后,一般是要由人來(lái)完成制作披薩,然后遞送到家的。但是,這個(gè)體驗(yàn)不一定最好,因?yàn)槿绻麢C(jī)器知道個(gè)性化的口味需求,能千人千面的私人定制這個(gè)披薩,而且,自動(dòng)駕駛能更高效便捷的將披薩送到家里。所以說(shuō),互聯(lián)網(wǎng)的人工智能一定會(huì)從數(shù)字世界的智能延伸到物理世界的智能,機(jī)器人是大勢(shì)所趨。