侯宇濤:英偉達(dá)作為大數(shù)據(jù)產(chǎn)業(yè)鏈里面的技術(shù)以及相關(guān)支撐產(chǎn)品的供應(yīng)商,致力于能夠降低大數(shù)據(jù)計(jì)算及處理的計(jì)算時(shí)間。我們目前面臨的最大壓力是來自于客戶的期望,而且GPU可以加速變形計(jì)算的處理,目前加速的速度相對(duì)以前已經(jīng)很高。香港大學(xué)的兩位老師以前在做人臉識(shí)別的計(jì)算,一個(gè)簡(jiǎn)單追蹤的過程需要20天,用了GPU以后,由20天變成了6小時(shí),有很大的提升。他說,你能不能再快一點(diǎn)?80倍的提升仍遠(yuǎn)遠(yuǎn)達(dá)不到大型數(shù)據(jù)采樣的需求。英偉達(dá)力圖優(yōu)化內(nèi)存采用3D的構(gòu)架,并使單卡的內(nèi)存可以突破24G或者更高,這樣可以使更大規(guī)模的數(shù)據(jù)同時(shí)得到處理。
王井東:我在微軟的主要工作集中在大規(guī)模的相似度搜索,有一些技術(shù)應(yīng)用在微軟必應(yīng)搜索這樣的產(chǎn)品里面?,F(xiàn)在已經(jīng)有大數(shù)據(jù)環(huán)境,其實(shí)直接能夠用來幫助去做研究的數(shù)據(jù)還很少。剛才余凱老師提到,大數(shù)據(jù)已經(jīng)很大,但是學(xué)術(shù)領(lǐng)域里面最大的數(shù)據(jù)比如ImageNet,也有1000類,fine-grained classes也只有22000多,在實(shí)際應(yīng)用里面還是遠(yuǎn)遠(yuǎn)不夠的。我們希望將來對(duì)大的數(shù)據(jù)都會(huì)有標(biāo)注。我總結(jié)起來就是數(shù)據(jù)問題,怎么樣能夠做到更好,更reliable(有用的)的幫助研究開發(fā)。
■人臉識(shí)別尚不成熟但大有可為
王濤(主持人):剛才說人臉識(shí)別是一個(gè)很重要的發(fā)展方向。前面在特定的數(shù)據(jù)之上,達(dá)到百分之九十幾,但在實(shí)際的視頻監(jiān)控上差距比較。從商務(wù)的角度上來講,這個(gè)差距在哪個(gè)地方?未來有什么樣的發(fā)展方向?
趙世范:在很多應(yīng)用情境下,多人臉識(shí)別的準(zhǔn)確率是很高的,比如說安檢通道,或者是固定的出入口。但是從別的行業(yè)應(yīng)用來看,人臉識(shí)別還有較大局限。第二個(gè),在室外的話,拍攝的角度一般都是由上往下的,如果要真正做到人臉識(shí)別,架設(shè)高度只能接近兩米左右,而現(xiàn)在大多數(shù)攝像機(jī)的架設(shè)高度是3米以上的。另外,人在走路的時(shí)候會(huì)有擺動(dòng),拍攝下來人臉的照片不會(huì)是正向的。目前來看,室外環(huán)境下,識(shí)別準(zhǔn)確率能達(dá)到50%已經(jīng)很不錯(cuò)。
余凱:我對(duì)人臉識(shí)別的話,持一個(gè)比較謹(jǐn)慎的觀點(diǎn),考慮這件事情的話,至少要分三個(gè)維度:
第一個(gè)維度是場(chǎng)景;另外一個(gè)維度是應(yīng)用的任務(wù)。通常大家會(huì)混淆兩件事情,一個(gè)是人臉識(shí)別,一個(gè)是叫人臉驗(yàn)證。人臉識(shí)別對(duì)應(yīng)的情景是,不知道這個(gè)人是誰,也沒有人告訴你這個(gè)人是誰。人臉驗(yàn)證問題要簡(jiǎn)單的多,近期內(nèi)有可能成為成熟的實(shí)用技術(shù)。而人臉識(shí)別技術(shù)在絕大部分場(chǎng)景都不實(shí)用。另外還有一個(gè)維度,我覺得是商業(yè)模式的問題,一項(xiàng)技術(shù)是整個(gè)產(chǎn)品里面的feature(特色、功能),還是說它本身就是一個(gè)產(chǎn)品?
王濤(主持人):解釋的非常清楚。刷臉技術(shù),很多情況是把驗(yàn)證與識(shí)別混淆在一起,非常感謝余院長(zhǎng)給我們的解釋。
趙世范:我再補(bǔ)充一點(diǎn)。不管有怎樣的驗(yàn)證方式,它最終都有一個(gè)數(shù)據(jù)是存在計(jì)算機(jī)里面的,這個(gè)東西總有辦法能夠偷走,總有辦法能夠去欺騙通機(jī)器。人臉,可以做3D打印的面具;指紋,可以做指膜。而生物識(shí)別它是不可撤銷的,比如我們沒有辦法換自己的DNA,但數(shù)據(jù)本身是可以偷走的。生物特征是輔助識(shí)別,但是作為唯一的主識(shí)別的話,風(fēng)險(xiǎn)是很大的。比如指紋失效的話,還可以按密碼。
■開放大數(shù)據(jù),構(gòu)建生態(tài)圈
王濤(主持人):大數(shù)據(jù)時(shí)代首先的核心是數(shù)據(jù),大數(shù)據(jù)在未來是否會(huì)變成一個(gè)商品?甚至它的價(jià)值可以與石油來媲美?未來數(shù)據(jù)將開放、分享,而是建立大數(shù)據(jù)聯(lián)盟,怎么能夠高效的在數(shù)據(jù)分享平臺(tái)上進(jìn)行工作,想請(qǐng)各位嘉賓談一談你們的看法。
趙世范:實(shí)際上,??挡]有數(shù)據(jù),??禐闃I(yè)主提供大量監(jiān)控的設(shè)備,但是這些數(shù)據(jù)都是屬于業(yè)主的。第二個(gè),用戶已經(jīng)有大量的數(shù)據(jù),會(huì)提供一些技術(shù)手段幫助用戶進(jìn)行數(shù)據(jù)的分析,但到底是提供數(shù)據(jù)還是提供服務(wù)是有商量余地的。數(shù)據(jù)共享最大的障礙是隱私的問題。如果別人拿數(shù)據(jù)用來犯罪,威脅到了當(dāng)事人的人身安全,這件事情怎么辦?大量的數(shù)據(jù)是堅(jiān)決不允許拿走的。如果有少量的樣本數(shù)據(jù),拿過去之前,也要經(jīng)過脫敏的處理過程,像今天這種大數(shù)據(jù)分析的時(shí)候,脫敏的作用都不大,脫敏之后照樣可以窺探到用戶的隱私。
王濤(主持人):給出了非常有價(jià)值的觀點(diǎn)。谷女士來自于騰訊的微信,從騰訊來說,對(duì)于大數(shù)據(jù)的方向,你們對(duì)于這個(gè)方向有什么樣的看法?
谷沉沉:騰訊這幾年一直的觀點(diǎn)就是開放,我們希望把數(shù)據(jù)開放出來,但一定是保證安全的前提之下,保護(hù)用戶隱私的前提之下。我們可以把一些東西開放出來,給廣大的創(chuàng)業(yè)團(tuán)隊(duì),或者說其他的一些企業(yè),構(gòu)建一個(gè)互聯(lián)網(wǎng)、全方位的生態(tài)圈的,這有利于整個(gè)生態(tài)圈的發(fā)展。騰訊不會(huì)去拿大數(shù)據(jù)賣錢,騰訊公司肯定不會(huì)差這個(gè)錢。主要在于怎么去利用大數(shù)據(jù)幫助我們?nèi)ジ纳飘a(chǎn)品體驗(yàn),如果有一些想法,我們是非常開放的,歡迎大家一起來利用數(shù)據(jù)去改善業(yè)務(wù)。