AVS視頻標(biāo)準(zhǔn)的框架也是大的思路上,都是大同小異的,全世界幾大不同的技術(shù)集團(tuán)采用的思路都是比較相近的,為什么中國(guó)要做這件事?除了提高效率問(wèn)題以外,還有另外一些原因,專(zhuān)利、知識(shí)產(chǎn)權(quán)等原因,為了讓中國(guó)自己的企業(yè),或者說(shuō)中國(guó)的企業(yè)向海外發(fā)展的時(shí)間,不受欺負(fù),所以中國(guó)要有一套這樣的東西,這套東西還是從純粹的技術(shù)、效果等等角度考慮問(wèn)題。
在中國(guó)做了一段時(shí)間以后,在中國(guó)做不一定都是中國(guó)人,當(dāng)然AVS都是國(guó)外企業(yè),國(guó)際上比較知名的大的合作視頻編碼有關(guān)的企業(yè)都有派代表加入到AVS工作團(tuán)組,最近做出了一個(gè)東西變成了IEEE的標(biāo)準(zhǔn)的,叫做IEEE 1857的標(biāo)準(zhǔn),面向互聯(lián)網(wǎng)視頻編解碼的群體,這個(gè)群體在2012年2月份正式成立起來(lái),經(jīng)過(guò)一個(gè)很完整的流程,第一個(gè)視頻編碼標(biāo)準(zhǔn)昨天已經(jīng)剛剛印刷,今年3月份批準(zhǔn),經(jīng)過(guò)三個(gè)月的準(zhǔn)備時(shí)間昨天剛剛印刷完成。IEEE 1857整個(gè)處理流程,從去年2月份成立以后,4月份第一次會(huì)議大概到今年3月15日開(kāi)了7次會(huì)議,最后把文本全部完成。
這個(gè)文本里,整個(gè)的編輯經(jīng)歷了非常漫長(zhǎng)的過(guò)程,因此做一個(gè)標(biāo)準(zhǔn)技術(shù)很行以外,處理流程也要按部就班要往返很多次,現(xiàn)在這個(gè)IEEE 1857的標(biāo)準(zhǔn)里面有各種各樣面向不同應(yīng)用的部分,我們叫profile或者叫g(shù)roup,它和別的標(biāo)準(zhǔn)不一樣的,或者是有特色的地方,就是IEEE 1857對(duì)監(jiān)控視頻有特別的支持。
什么樣特別的支持?是第一次把背景建模技術(shù)加到整個(gè)處理流程,加到環(huán)路里面,這是非常不容易的一件事,這張圖可以看出,當(dāng)你沒(méi)有進(jìn)行背景建模你的處理效率沒(méi)那么高,隨著你的建模越來(lái)越好,你的編碼效率會(huì)越高。所以下面這條藍(lán)色線,它實(shí)際整個(gè)效率,就是你的碼率越高效率越高,比如說(shuō)現(xiàn)在給你2兆的帶寬,同樣的質(zhì)量的東西你會(huì)占的帶寬為什么低,所以效率越來(lái)越高,這是一個(gè)非常好的想法。這件事,背景建模怎么做出來(lái)的?這是非常直觀的一張圖,當(dāng)給你一個(gè)視頻,你要看這個(gè)食品區(qū)編還是非常復(fù)雜的,通過(guò)一個(gè)映射變化另外一個(gè)空間上,你會(huì)發(fā)現(xiàn)橫的幾乎都是一樣的,只是有人、有車(chē)動(dòng)的地方稍微有點(diǎn)點(diǎn)變化,我們根據(jù)這個(gè)變化建出來(lái)一個(gè)背景模,用它來(lái)提高編碼效率,如果從技術(shù)的角度來(lái)看,我們有一些對(duì)象,我可以把這個(gè)對(duì)象建模,把原來(lái)沒(méi)有和有的做插分,最后就找到一個(gè)非常干凈的背景,上面全都是一些非背景的東西,根據(jù)這些東西我就知道哪些新進(jìn)來(lái)的,哪些是新的,通過(guò)就使編碼的效率變成非常高,這也包括各種各樣不同的天氣條件、時(shí)間、霧天、雨天都可以進(jìn)行相應(yīng)的建模,模型通過(guò)參數(shù)的變化覆蓋住,就是有很容易把對(duì)象檢測(cè)出來(lái)了,檢測(cè)出來(lái)我們后面的分析就會(huì)非常有幫助。而且模型可以不停的進(jìn)行更新。這個(gè)標(biāo)準(zhǔn)昨天已經(jīng)出版了。當(dāng)然這個(gè)版本,一個(gè)版本完了,后面還有各個(gè)部門(mén)在按部就班的做,這個(gè)標(biāo)準(zhǔn)比現(xiàn)有的同類(lèi)標(biāo)準(zhǔn)編碼效率提高一倍。這是關(guān)于存不下。
找不快,到現(xiàn)在為止分析和編碼是分開(kāi)做的,分開(kāi)來(lái)做因?yàn)槭峭耆謧€(gè)不同的體系,如果你從技術(shù)上來(lái)講無(wú)可厚非,但是分開(kāi)來(lái)做有一個(gè)最大的問(wèn)題,在編碼的時(shí)候不能分析,在分析的時(shí)候就不能編碼,一般是先編碼從采集端送回到局端以后進(jìn)行分析,分析再把它解開(kāi)進(jìn)行分析,這樣就把自己的寶貴時(shí)間丟掉了。這還是最重要的問(wèn)題,你為了追求編碼效率可能會(huì)損失到你的識(shí)別率,我們舉一個(gè)例子:當(dāng)然IEEE 1857可以很好的解決這個(gè)問(wèn)題,比如說(shuō)紅框是感興趣的,檢測(cè)出來(lái)立刻在描述文本里面這個(gè)描述出來(lái),在后面就可以啟動(dòng),包括對(duì)象的檢測(cè)、對(duì)象的跟蹤、行為的分析、行為的跟蹤,一個(gè)完整的環(huán)就可以流出來(lái),而且可以包括GPS的信息都含進(jìn)去。對(duì)象檢測(cè)出來(lái),人臉怎么辦,實(shí)際上現(xiàn)在有技術(shù)可以把這個(gè)找得到。
具體的做法,左邊有一個(gè)錄像,有人在那兒走來(lái)走去,這一段視頻里面到底哪一張人臉最好,我不知道現(xiàn)在是不知道,現(xiàn)在是計(jì)算機(jī)來(lái)干這件事,我們可以一個(gè)模型,模型里面有6個(gè)主要的參數(shù),通過(guò)這6個(gè)參數(shù)就包括,我看它的分辨率、亮度、姿態(tài)、清晰度、噪聲水平、灰度級(jí),把這6個(gè)參數(shù)綜合起來(lái)就可以找到一個(gè)最清晰的人臉圖象。當(dāng)然同樣的想法可以檢測(cè)車(chē)、檢測(cè)人等等。
為了做這件事,今年要組織一個(gè)全國(guó)的研究生智慧城市比賽,現(xiàn)在正在組織,由教育部學(xué)位研究中心、智慧城市產(chǎn)業(yè)聯(lián)盟、中國(guó)科協(xié)等等,秘書(shū)處現(xiàn)在設(shè)在北航,現(xiàn)在已經(jīng)有一些具體方案。