4月24日,百度公司宣布正式發(fā)布大數(shù)據(jù)引擎,將開放云、數(shù)據(jù)工廠、百度大腦三大組件在內(nèi)的核心大數(shù)據(jù)對外開放,與百度合作的機(jī)構(gòu)和傳統(tǒng)企業(yè)將能夠在線使用百度的大數(shù)據(jù)架構(gòu),處理自身積累的大數(shù)據(jù),或融合百度大數(shù)據(jù),來改造和優(yōu)化傳統(tǒng)行業(yè)的企業(yè)管理、產(chǎn)品服務(wù)、商業(yè)模式等環(huán)節(jié)。百度將在政府、醫(yī)療、金融、教育等傳統(tǒng)領(lǐng)域率先開展對外合作。
開放大數(shù)據(jù)引擎
在當(dāng)天百度第四屆技術(shù)開放日上,百度首席執(zhí)行官李彥宏重提互聯(lián)網(wǎng)正在加速淘汰傳統(tǒng)產(chǎn)業(yè)的觀點(diǎn),并補(bǔ)充道:“互聯(lián)網(wǎng)幾乎首先是顛覆了媒體,后來顛覆了零售,再往后是旅游,再往后是金融,金融可能現(xiàn)在才剛剛開始。”
“大約4年前,在百度的活動上同樣來了很多傳統(tǒng)產(chǎn)業(yè)的老板、企業(yè)家,我跟他們講,我們這些企業(yè)家們今后要有互聯(lián)網(wǎng)思維,可能你做的事情不是互聯(lián)網(wǎng),但你要逐漸按照互聯(lián)網(wǎng)的思維方式去想問題?,F(xiàn)在4年過去了,這種觀念已經(jīng)逐步被越來越多的企業(yè)家,甚至企業(yè)以外的各行各業(yè)、各個領(lǐng)域的人所認(rèn)可了。原因是什么?是互聯(lián)網(wǎng)正在顛覆各種各樣的傳統(tǒng)產(chǎn)業(yè)。其實(shí)這個趨勢在過去幾年一直在發(fā)生。”李彥宏說。
事實(shí)上,李彥宏要談?wù)摰氖谴髷?shù)據(jù),“一方面互聯(lián)網(wǎng)在改變中國,這個是過去時(shí),甚至是現(xiàn)在進(jìn)行時(shí),可是我們怎么能夠?yàn)槲磥頃r(shí)做準(zhǔn)備呢?我覺得這就需要我們對技術(shù),對大數(shù)據(jù),或者以大數(shù)據(jù)為基礎(chǔ)的互聯(lián)網(wǎng)相關(guān)技術(shù),有一個及早的了解、及早的認(rèn)知、及早的擁抱。”
李彥宏特別提到了百度內(nèi)部有一個叫做“百度大腦”的項(xiàng)目。據(jù)介紹,這個項(xiàng)目用計(jì)算機(jī)加上人工智能,以及深度學(xué)習(xí)的技術(shù)模擬人腦的思維,現(xiàn)在已經(jīng)達(dá)到了大約相當(dāng)于兩到三歲孩子的智力水平。“這可能是世界上最復(fù)雜的模擬人大腦思維的系統(tǒng)。”
這個讓李彥宏引以為傲的“百度大腦”,與開放云、數(shù)據(jù)工廠,共同構(gòu)成了百度昨日發(fā)布的大數(shù)據(jù)引擎的三大組件。這個大數(shù)據(jù)引擎向外界提供大數(shù)據(jù)存儲、分析及挖掘的技術(shù)能力,并通過深度學(xué)習(xí)技術(shù)和數(shù)據(jù)建模技術(shù),使數(shù)據(jù)具有“智能”。這也是全球首個開放的大數(shù)據(jù)引擎。
談及百度大腦,百度深度學(xué)習(xí)研究院常務(wù)副院長余凱更為自信。他介紹說,在整個自然界和生物的智能系統(tǒng),智能的水平和大腦的神經(jīng)元的規(guī)模是有相當(dāng)?shù)年P(guān)聯(lián)的。比如,自然界最大的神經(jīng)網(wǎng)絡(luò)系統(tǒng)是人腦,它擁有一千個神經(jīng)元。而百度大腦的深度學(xué)習(xí)技術(shù),現(xiàn)在已經(jīng)有能力構(gòu)建規(guī)模達(dá)到兩百億個參數(shù)的深度神經(jīng)網(wǎng)絡(luò),這個是我們所知的在業(yè)界最大規(guī)模的深度神經(jīng)網(wǎng)絡(luò)系統(tǒng)。因而,百度在大數(shù)據(jù)處理方面,就能擁有其他公司所不具備的智能和能力。
率先用于傳統(tǒng)領(lǐng)域
據(jù)了解,百度大數(shù)據(jù)引擎會逐步開放,目前采取邀請制和免費(fèi)模式,將在政府、醫(yī)療、金融、零售、教育等傳統(tǒng)領(lǐng)域率先開展對外合作。
發(fā)布會現(xiàn)場,百度大數(shù)據(jù)相關(guān)負(fù)責(zé)人和業(yè)界專家陸續(xù)登臺,力圖向在場的傳統(tǒng)行業(yè)代表和外界傳達(dá)這樣一種信息:百度擁有強(qiáng)大的大數(shù)據(jù)存儲、挖掘、處理能力,百度也將開放自己的大數(shù)據(jù)核心能力,與傳統(tǒng)行業(yè)一同挖掘數(shù)據(jù)價(jià)值,加快傳統(tǒng)行業(yè)的轉(zhuǎn)型升級。
正如百度高級副總裁王勁所言,怎么讓傳統(tǒng)行業(yè)進(jìn)入大數(shù)據(jù)時(shí)代,充分挖掘、利用大數(shù)據(jù)的價(jià)值,是擺在我們面前的新課題。百度主打的搜索引擎天然就是一個大數(shù)據(jù)應(yīng)用,百度希望通過多年在技術(shù)上的積累,能夠把大數(shù)據(jù)的技術(shù),打造成一個大數(shù)據(jù)的引擎,提供給傳統(tǒng)的產(chǎn)業(yè)。
在大數(shù)據(jù)的利用方面,王勁舉了個例子,全球每年有幾百萬人患心臟病,如果我們的大數(shù)據(jù)中心有很好的計(jì)算能力,能從這些患病人群里找到共性,也許我們能提前一兩天給他一個預(yù)警,讓他來到醫(yī)院做預(yù)防措施。從健康的角度而言,提前預(yù)防將極大地提高人們對抗疾病的能力。從保險(xiǎn)公司的角度而言,也能極大地降低配需率。
有意思的是,在王勁看來,百度自身收入水平的提升也與公司在相關(guān)技術(shù)方面的提升息息相關(guān)。百度的搜索引擎用計(jì)算機(jī)學(xué)習(xí)的辦法來預(yù)測人們的行為方法。大規(guī)模學(xué)習(xí)的能力有兩個指標(biāo)評估,第一是機(jī)器的規(guī)模,第二是它能處理的特征向量的大小。
據(jù)王勁介紹,4年前,百度機(jī)器的規(guī)模大概是幾百臺服務(wù)器,特征向量處理水平大概為十萬左右。那時(shí)百度的收入規(guī)模大概在70億元左右。兩年前,百度的機(jī)器規(guī)模達(dá)到近十萬臺了,與此同時(shí)百度的特征向量也達(dá)到了歷史的巔峰,當(dāng)年百度的收入達(dá)到150億元。