受灣區(qū)同學(xué)技術(shù)沙龍(www.tech-meetup.com)邀請(qǐng),這周六百度研究院副院長(zhǎng)余凱在Santa Clara的Intel總部禮堂做了一場(chǎng)很干貨的分享。我覺(jué)得“干貨”的原因不僅僅是余凱對(duì)諸如“百度為什么要做各種智能硬件?”和“百度的自動(dòng)駕駛和Google有何不同?”等問(wèn)題進(jìn)行了回答,而是因?yàn)橥ㄟ^(guò)這次分享,我們可以看到百度在包括基于大數(shù)據(jù)的深度學(xué)習(xí)等一些前沿研究領(lǐng)域的成果,以及在“萬(wàn)物互聯(lián)”的大數(shù)據(jù)時(shí)代,百度在機(jī)器人、無(wú)人駕駛等方面的一些思考,也讓我們這些互聯(lián)網(wǎng)從業(yè)者對(duì)于未來(lái)大數(shù)據(jù)和人工智能的演化有一個(gè)更好的了解。
雖然觀眾幾乎坐滿了會(huì)場(chǎng),但我估計(jì)最多也就有兩百來(lái)號(hào)人分享到了這些東西。所以我對(duì)余凱的演講進(jìn)行了一些整理,供雷鋒網(wǎng)的讀者了解和學(xué)習(xí)。

以下內(nèi)容根據(jù)演講整理:
感謝郭曉峰、朱平還有好多朋友在周末來(lái)組織這么一個(gè)活動(dòng)。對(duì)我來(lái)講回到這個(gè)地方和大家交流有一種回家的感覺(jué),因?yàn)槲沂侨昵暗臅r(shí)候從灣區(qū)回國(guó)加入百度,開(kāi)始負(fù)責(zé)百度的人工智能和深度學(xué)習(xí)方面的研究。很親切?;仡欉@個(gè)歷史也是滿有趣的,當(dāng)時(shí)我在NEC Lab,有好多深度學(xué)習(xí)方面的工作,今天像Facebook等有很多人在從事深度學(xué)習(xí),好多都是從NEC Lab加入的。從灣區(qū)回到中國(guó)也確實(shí)把灣區(qū)的一些資源給介紹回去了,像以前我一個(gè)很好的朋友Andrew Ng,我也把他忽悠到了百度。
這反映什么呢?以前這些比較前沿的技術(shù)研發(fā)事情很多是在硅谷在美國(guó)去發(fā)生,在今天在北京或者深圳其實(shí)很多同樣事情也在發(fā)生,所以我覺(jué)得是一個(gè)創(chuàng)新的時(shí)代。
今天我的題目叫《從大數(shù)據(jù)到人工智能》。在過(guò)去的幾年時(shí)間里,百度比較有特色的一點(diǎn)就是作為一個(gè)私營(yíng)企業(yè)在技術(shù)研發(fā)這個(gè)領(lǐng)域做了很多工作,對(duì)我們來(lái)講是一個(gè)很鼓舞的事情。
我想即使在Google的朋友也會(huì)同意這個(gè)觀點(diǎn):搜索引擎本身也是一個(gè)人工智能的系統(tǒng),一方面通過(guò)免費(fèi)的服務(wù)提供很多數(shù)據(jù),另一方面把這些數(shù)據(jù)區(qū)變現(xiàn),這中間就要用到很多技術(shù),這當(dāng)中最重要的就是基于大數(shù)據(jù)的人工智能,比如說(shuō)數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、自然語(yǔ)言理解在移動(dòng)時(shí)代或者IOT時(shí)代,語(yǔ)音識(shí)別語(yǔ)音理解圖像識(shí)別等很多人工智能技術(shù)在中間可以扮演非常重要的角色。
什么是人工智能
那什么是人工智能呢?有很多不同的看法,有強(qiáng)人工智能,有弱人工智能,我們也看到很多電影和小說(shuō)等,但到今天沒(méi)有一個(gè)公認(rèn)的統(tǒng)一的定義,但我們講一個(gè)人工智能有幾個(gè)方面:
第一個(gè)是感知。就是采集數(shù)據(jù);
第二個(gè)是理解。對(duì)環(huán)境、對(duì)對(duì)話的對(duì)象有一些理解;
第三個(gè)是決策。這些數(shù)據(jù)你要做大量的分析,知道環(huán)境是什么樣的,基于這上面你會(huì)做大量的決策,本身來(lái)講感知、理解、決策這三步也是一個(gè)循環(huán)的過(guò)程。
我們今天看到各種各樣所謂的智能產(chǎn)品,那這些產(chǎn)品是否真的具有智能呢?其實(shí)一個(gè)很本質(zhì)的差別,也是互聯(lián)網(wǎng)服務(wù)和其他產(chǎn)品不一樣的地方,就是這個(gè)服務(wù)和產(chǎn)品是否能夠隨著經(jīng)驗(yàn)不斷演化,隨著用戶使用越來(lái)越多對(duì)用戶越來(lái)越了解,這種隨著經(jīng)驗(yàn)演化也就是學(xué)習(xí)的能力實(shí)際上是評(píng)估一件產(chǎn)品是否真正具有智能的因素。整個(gè)移動(dòng)互聯(lián)網(wǎng),通過(guò)手機(jī)也好,通過(guò)App也好,他對(duì)用戶是在不斷的去了解,去知道用戶的需求和喜好。
我們知道在機(jī)器學(xué)習(xí)研究的課程里,有一個(gè)詞叫經(jīng)驗(yàn)數(shù)據(jù),經(jīng)驗(yàn)就是數(shù)據(jù),數(shù)據(jù)就是經(jīng)驗(yàn)。我們今天講這是一個(gè)大數(shù)據(jù)的時(shí)代,大數(shù)據(jù)時(shí)代的意義在什么地方呢?就是能讓一個(gè)系統(tǒng)有機(jī)會(huì)變得越來(lái)越智能。因?yàn)橹悄鼙旧硪粋€(gè)特點(diǎn)就是學(xué)習(xí)的能力。
萬(wàn)物互聯(lián)與大數(shù)據(jù)
大數(shù)據(jù)的時(shí)代從PC互聯(lián)網(wǎng)到移動(dòng)互聯(lián)網(wǎng)有一個(gè)飛躍的變化,像這個(gè)圖是05年教皇選舉的場(chǎng)景,8年以后你可以看到,同樣的地方,同樣一波人,移動(dòng)互聯(lián)網(wǎng)對(duì)人們的改變是巨大的。每一個(gè)人隨著這個(gè)設(shè)備,無(wú)論是在打電話,拍照,帶在身上,你以為你沒(méi)有在用它,但手機(jī)上面的傳感器會(huì)把很多數(shù)據(jù)傳到云端。數(shù)據(jù)的產(chǎn)生是無(wú)時(shí)不刻的。

未來(lái)我們會(huì)進(jìn)入一個(gè)物聯(lián)網(wǎng)的時(shí)代或者機(jī)器人的時(shí)代,那萬(wàn)物互聯(lián)的時(shí)代是一個(gè)什么樣的場(chǎng)景呢?我們可以想象到2020年,前段時(shí)間孫正義在烏鎮(zhèn)互聯(lián)網(wǎng)大會(huì)上說(shuō),到2020年一個(gè)人可能會(huì)連接到上千個(gè)設(shè)備。今天在中國(guó)我們每個(gè)人可能都帶著兩三個(gè)手機(jī),因?yàn)橐粋€(gè)人在生活中會(huì)扮演很多角色(觀眾笑)。加上穿戴式設(shè)備和其他連接,在中國(guó)平均一個(gè)人帶三四個(gè)設(shè)備是很正常的。面向未來(lái)的話可能一個(gè)紐扣都會(huì)是一個(gè)設(shè)備,所以說(shuō)每個(gè)人連接一千個(gè)設(shè)備并不是那么聳人聽(tīng)聞。