百度正在傳統(tǒng)的搜索技術(shù)之外,利用“大數(shù)據(jù)+云計算”打造另一個驅(qū)動公司發(fā)展的新引擎——百度高級副總裁王勁接受21世紀(jì)經(jīng)濟(jì)報道記者采訪時如是說。
百度大腦是“云計算+大數(shù)據(jù)”的載體:其由硬件和軟件兩部分組成,硬件部分是由云計算中心和服務(wù)器組成,軟件部分是由大數(shù)據(jù)和人工智能算法組成。無論百度推薦引擎、BaiduEye,還是百度面對商家的直達(dá)號,均依賴百度大腦作為技術(shù)基礎(chǔ),是一切前端應(yīng)用的backoffice。
王勁認(rèn)為,百度的核心競爭力在于人工智能和大數(shù)據(jù)的結(jié)合??赡艿膱鼍笆牵河檬謾C(jī)拍一朵花的照片,上傳給百度,百度大腦把它轉(zhuǎn)化成“0101”的數(shù)字流,然后輸入到深度神經(jīng)網(wǎng)絡(luò)里,經(jīng)過層層的分析、復(fù)雜的學(xué)習(xí)算法和大數(shù)據(jù)比對,最后還原并識別出它是一朵花,并告訴用戶這朵花的名字,隨后在百度百科里找到花的屬性。
如何獲得大數(shù)據(jù)?在百度看來,與第三方伙伴合作是較快獲取大規(guī)模數(shù)據(jù)的方式之一。此前百度曾和中科院花卉研究所對接,獲得花卉種類等近二十萬條的數(shù)據(jù)。在電商領(lǐng)域,國內(nèi)京東、當(dāng)當(dāng)、蘑菇街等電商平臺伙伴向百度提供消費(fèi)數(shù)據(jù),同時獲得百度入口的流量。當(dāng)然,目前百度尚沒有阿里巴巴(滾動資訊)系統(tǒng)的數(shù)據(jù)。
《大數(shù)據(jù)時代》作者舍恩伯格的判斷是,目前正處在大數(shù)據(jù)時代的早期。對于百度來說,其通過搜索引擎積累了大量的數(shù)據(jù)“金礦”,人工智能則給予百度“挖礦”的能力。
百度做大數(shù)據(jù),更是通過搜索引擎在為人工智能鋪路。但并非所有的數(shù)據(jù)金礦都在百度手中,微信、微博(23.81, -0.53, -2.18%)等社交數(shù)據(jù)是一個例子,阿里巴巴手中的電商數(shù)據(jù)是另一個例子。
“百度在革自己的命”
《21世紀(jì)》:百度大腦研究現(xiàn)在進(jìn)展如何?目前人工智能的研究方面在國際上處于什么位置?
王勁:人工智能一直到2010年都沒有什么突破,當(dāng)它的準(zhǔn)確率不高的時候,它就無法應(yīng)用。一直到這兩年有了深度學(xué)習(xí)的新算法,這個新算法才被用到人工智能上,突破了以前很多瓶頸。在這個方面,百度是做得最早的,百度在全球都是在這方面進(jìn)行投入的最早公司之一,我們跟國際最領(lǐng)先的公司在同一個起跑線上。
《21世紀(jì)》:人工智能從70年代、80年代末初就開始做了,為什么一直就沒做起來?
王勁:在那個時候確實面臨技術(shù)的瓶頸。人工智能在我讀書的時候是規(guī)則制定階段,人工智能要制定很多規(guī)則。深度學(xué)習(xí)以及機(jī)器學(xué)習(xí)的好處是,只要把模型建起來以后,就可讓計算機(jī)自主學(xué)習(xí)、拼命去迭代。
百度現(xiàn)在擁有10億規(guī)模的連接,人最多只能用幾百個參數(shù),我們沒辦法做人工的判斷。百度就把大數(shù)據(jù),把規(guī)則制定好,數(shù)學(xué)模型和算法做好,得出結(jié)果,人不需要知道為什么是這個結(jié)果。人工智能好就好在不需要程序員是每行每業(yè)的專家。這是為什么人工智能在這兩年有一個飛速的發(fā)展。
另一個原因則是語音識別技術(shù)的飛速發(fā)展,過去兩年,語音識別率從70%提高到了95%。今天兩個自然人在講話,其識別準(zhǔn)確率差不多是98%。去年百度才剛剛到90%,現(xiàn)在就可以達(dá)到95%以上,接近自然人對話。
《21世紀(jì)》:推薦引擎的功能,現(xiàn)在的搜索引擎是不是也能做到?
王勁:搜索引擎也可以看成是一種推薦引擎,過去的搜索引擎給用戶提供很多的結(jié)果。那時候搜索引擎都認(rèn)為,搜得的結(jié)果越多越好。推薦引擎跟它做的正相反,最好只給用戶一個最相關(guān)的結(jié)果。推薦引擎需要在人工智能再上一個臺階以后才可以做到。只有對用戶有了更多了解,如時間、地點、人物的更多數(shù)據(jù),才可以真正實現(xiàn)個性化推薦,成為真正的推薦引擎。
你可以看到這是新一代的技術(shù),也可以看到百度是在革自己的命。
越開放會越強(qiáng)
《21世紀(jì)》:百度如何和線下的商場合作?也就是說,百度的大數(shù)據(jù)怎樣考慮應(yīng)用場景?
王勁:拿銀泰和百度的合作來說,戴上Baidu Eye到銀泰的人,年齡、性別、在哪一些貨架停留的時間最長,商品有多少人買了,有多少人不買,這些銀泰需要的數(shù)據(jù),百度就可以幫它拿到并做出分析。
百度投資了一家室內(nèi)定位的公司。通過室內(nèi)定位,知道消費(fèi)者在這個商場里面的走動軌跡,上述數(shù)據(jù)也都能夠用百度大腦算出來。銀泰可以通過數(shù)據(jù)進(jìn)行商業(yè)決策,比如說,該怎么安排消費(fèi)者在商場的路線,怎么導(dǎo)航能夠讓這個商場最優(yōu)化,再把到商場里面的購買行為全部打通,未來購物體驗會非常不一樣。