□王濤(王濤(主持人),愛奇藝首席科學(xué)家):視頻大數(shù)據(jù)助力影視、動漫、游戲行業(yè),云服務(wù)終將實現(xiàn)
□王井東(微軟亞洲研究院主管研究員):數(shù)據(jù)庫的建設(shè)、標(biāo)注與數(shù)據(jù)聯(lián)盟的建立十分必要
□侯宇濤(英偉達(dá)CUDA應(yīng)用市場總監(jiān)):GPU和高性能硬件加速深度學(xué)習(xí)發(fā)展
□趙世范(海康威視大數(shù)據(jù)開發(fā)總監(jiān)):人臉識別尚不成熟,人臉驗證已具備實用條件
□谷沉沉(騰訊微信事業(yè)群高級工程師):大數(shù)據(jù)改善用戶體驗,騰訊不靠賣數(shù)據(jù)賺錢
□王田(華為研究院媒體研究室首席科學(xué)家):5G網(wǎng)絡(luò)將在2020年左右進(jìn)一步聯(lián)連通世界
□譚曉生(奇虎360科技副總裁):大數(shù)據(jù)開啟網(wǎng)絡(luò)安全與隱私新格局

(上圖從左至右)
■大數(shù)據(jù)已經(jīng)很“大”,但遠(yuǎn)遠(yuǎn)無法滿足現(xiàn)實需求
王濤(主持人):最近幾年來,由于互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)的高速發(fā)展,手機(jī)、攝像機(jī)、各種傳感器數(shù)據(jù)采集的設(shè)備,并且能傳輸?shù)皆贫说臄?shù)據(jù)中心?大數(shù)據(jù)的增長非???,在未來的10年要增長八位數(shù)字,比現(xiàn)有的數(shù)據(jù)還要多8倍。諸位從自己所在行業(yè)的角度出發(fā),你們感覺到最大的需求和問題是什么?大家是如何看待大數(shù)據(jù)時代的機(jī)會與挑戰(zhàn)的?
譚曉生:我在360主要負(fù)責(zé)大數(shù)據(jù)計算和信息安全。2010年,360做了一個基于大數(shù)據(jù)惡意文件的鑒別引擎——QVM,今年第一季度QVM在全球一次評測中與卡巴斯基全球并列第一,滿分。我們的做法就是基于80億的大數(shù)據(jù)樣本,顛覆了過去特征碼利用掃描的方法。除此之外,在兩年多之前,我們開始做基于網(wǎng)絡(luò)的全流量的監(jiān)聽的供給檢測,采用了有監(jiān)控的學(xué)習(xí)方法,現(xiàn)在進(jìn)入到了無監(jiān)督的學(xué)習(xí)階段,最基本的成果就是幫助國家抓住了進(jìn)行API攻擊的犯罪分子。我們用大數(shù)據(jù)的方法在這方面取得了非常豐碩的果實。我們知道大數(shù)據(jù)技術(shù)的效果很好,存儲也已經(jīng)非常強(qiáng)了,但是怎么樣去做更大規(guī)模的數(shù)據(jù)計算呢?這是我現(xiàn)在覺得非常值得關(guān)注的一個點(diǎn)。
王田:在大數(shù)據(jù)方面,華為主要提供通訊設(shè)備和網(wǎng)絡(luò)服務(wù)。網(wǎng)絡(luò)在將來一定會比現(xiàn)在好,會有更高的要求,但具體是什么?比如說對連接數(shù)有什么要求?網(wǎng)絡(luò)響應(yīng)有什么要求?帶寬需要有什么樣的要求?我們的通信實驗室會根據(jù)不同指標(biāo)和情景做大數(shù)據(jù)研究。我們考慮更多的是網(wǎng)絡(luò)的關(guān)系,未來大數(shù)據(jù)里面網(wǎng)絡(luò)到底應(yīng)該起到什么樣的作用?2020年網(wǎng)絡(luò)可能是5G,5G業(yè)務(wù)對網(wǎng)絡(luò)有一個更高的要求,不僅是帶寬還有延遲,還有一些年際數(shù)。
谷沉沉:我在主要工作是做微信上面的視頻分發(fā),騰訊一直在做一些海量用戶的行為的大數(shù)據(jù)搜集和分析,研究對現(xiàn)在的產(chǎn)品做哪些改進(jìn)?同時還要對現(xiàn)在的產(chǎn)品質(zhì)量在海量用戶中做一個評價?騰訊的用戶量非常龐大,微信現(xiàn)在有5億用戶,視頻通話產(chǎn)品的日發(fā)起量也是千萬起,這樣一個海量用戶的產(chǎn)品,如何讓更多的用戶對我們的服務(wù)感到滿意?就現(xiàn)在來看,無論我們怎么努力,每天我們?nèi)タ从脩舴答?,總是有用戶在罵我們的產(chǎn)品,說視頻通話不清晰、不流暢,現(xiàn)在也在做這一些的嘗試,搜集大量豐富的數(shù)據(jù),針對一些用戶細(xì)分場景,比如中國網(wǎng)民是4G網(wǎng)絡(luò)還是2G、是20兆帶寬還是2兆帶寬?這樣網(wǎng)絡(luò)的差異和手機(jī)性能差異都影響著產(chǎn)品的體驗度。
趙世范:??低曉诮衲瓿闪⒘搜芯吭海饕袃刹糠郑褐悄芤曨l和大數(shù)據(jù)。大數(shù)據(jù)組的主要工作,是將智能視頻識別以后的對象進(jìn)行分析,比較成熟的是車牌識別記錄下的車輛過車信息。目前的主要工作是協(xié)助公安系統(tǒng)做一些案件的偵破,之后也會做一些城市交通疏導(dǎo)方面的工作。海康威視意識到,視頻監(jiān)控的車牌識別還是一個比較成熟的應(yīng)用,有一些過車記錄數(shù)據(jù)產(chǎn)生;而另外一方面,針對場景的視頻識別,還有一些基于人的視頻識別,技術(shù)難度較大,是我們現(xiàn)在需要解決的問題,比如:第一個,從一個場景里面把人提取出來,同時能夠提取場景里面的一些物品;另外一個,實現(xiàn)多個場景人的關(guān)聯(lián)。
王濤(主持人):你們這個是什么級別的量體?需要知道視頻這一時刻有人、有物品?還是說需要知道這個物體、人在什么位置?是哪個人?是哪個物體?
趙世范:監(jiān)控視頻領(lǐng)域已經(jīng)從標(biāo)清到高清,但實際上高清目前也就是200萬到300萬像素,而真正能夠讓給機(jī)器達(dá)到人眼相似的識別度,像素要到1200萬左右,清晰度還需極大提升。目前視頻里對移動對象的識別是非常成熟的,可以知道這個視頻里面有什么對象?這個東西是人還是車?或者里面有多少人?但這個人和另外一個鏡頭里面的人是不是同一個人?目前在判斷上是非常困難的。計算機(jī)對人臉的識別技術(shù)有一定的發(fā)展,特別是在深度學(xué)習(xí)應(yīng)用以后,在互聯(lián)網(wǎng)應(yīng)用中有一些突破,但跟安防領(lǐng)域比還是有很大差異。第一個,它的色彩度不太好;第二個,它有很多的形變;第三個,受清晰度和光照等因素影響,會變模糊。判斷是不是同一個對象現(xiàn)在非常困難。