這些案例告訴我們大數(shù)據(jù)時代已經(jīng)來了,當然在大數(shù)據(jù)里面我們需要知道什么東西的量最大,這個曲線大家能夠看到,我們2012年圖像和視頻數(shù)據(jù)已經(jīng)占到80%多,今年圖像和視頻數(shù)據(jù)在整個大數(shù)據(jù)的比例已經(jīng)要接近90%,這樣一個比例,在真正的大數(shù)據(jù)里面你的核心挑戰(zhàn)到底是什么,當然數(shù)據(jù)大了以后怎么處理、怎么挖掘里面的一些有價值的規(guī)律,是我們首先要做的。最大的數(shù)據(jù)要怎么處理,實際上是最大的一個挑戰(zhàn)。
所以說我們多媒體大數(shù)據(jù),特別和圖像、視頻有關(guān)傳輸、存儲、處理、應用是四個問題。為什么有效存儲這個問題很難,實際上現(xiàn)在街上按的攝像頭所拍下來的東西不會永遠保存,有的會存三個月,有的會存一個月,有的還會存一個星期就會覆蓋掉,這個數(shù)據(jù)就永遠丟失的,為什么會這樣呢?因為存不起,這個費用太高。怎么有效保存對于大數(shù)據(jù)是一個很大的難題。怎么樣處理,大家都以為這個問題很簡單,有各種各樣的智能處理系統(tǒng)、圖像分析系統(tǒng),實際上那些都是再研究或者是做演示,像城市大規(guī)模系統(tǒng)還是比較少。
第二,關(guān)于智慧城市中的多媒體大數(shù)據(jù)的挑戰(zhàn)。到底是什么挑戰(zhàn)呢?因為智慧城市本身,這個概念是一個非常好的概念,所謂智慧城市也是一種生態(tài)系統(tǒng),這個生態(tài)系統(tǒng)里面為了達到,比如說這個城市的平安、健康、適宜居住、交通方便等等,所以你需要去構(gòu)建一個完整的信息系統(tǒng),這個信息系統(tǒng)實際上是包括視頻傳感、物聯(lián)網(wǎng)系統(tǒng)和網(wǎng)絡、和整個決策系統(tǒng)構(gòu)造成一個完整的系統(tǒng),這個系統(tǒng)才叫智慧城市。在這個系統(tǒng)里面有很多子系統(tǒng),包括有可視化的治安防控系統(tǒng)、應急聯(lián)動子系統(tǒng)、數(shù)字化城市管理系統(tǒng)等等,比如像治安防空系統(tǒng)可以通過各個卡口、電子警察、一些監(jiān)控、技術(shù)防范等等子系統(tǒng)實現(xiàn)治安防控。對于應急聯(lián)動,對于自然災害、公共事務等發(fā)現(xiàn)以后能夠啟動應急聯(lián)動的功能。城市管理就包括現(xiàn)在我們經(jīng)常說的汽車定位、地理信息、身份驗證、物品識別、數(shù)字通信等等,把這些系統(tǒng)連接在一起是一個完整的信息系統(tǒng)。這個系統(tǒng)的監(jiān)控很關(guān)鍵,當然不是視頻、攝像頭,里面包括各種各樣的傳感器,視頻是比較主要的一些傳感器,這些傳感器分布在城市的各個角落,在各個角落的獲取的各個信息是通過一個網(wǎng)絡把這些信息能夠進行傳輸,當然這些傳輸,網(wǎng)絡是分各種各樣的一組一組的,這里面和居住有關(guān)、和辦公有關(guān)、和交通有關(guān)的等等。這些一些群體的數(shù)據(jù)通過這個網(wǎng)絡就會構(gòu)造成一個所謂的感知網(wǎng),如果你以攝像頭為主就是視覺感知網(wǎng),這個視覺感知網(wǎng)會被送智能分析中心,最后對整個智慧城市進行決策。這個決策里面有兩個非常大的難題:
1、存不下,剛才已經(jīng)說過,數(shù)據(jù)最多存三個月,有的可能一個月、一個星期就被覆蓋掉,數(shù)據(jù)永遠被清除掉,這是很可惜的事。
2、找不快,如果發(fā)生一件事希望系統(tǒng)快速找出來反而找不快。
首先我們看存一下這個問題,因為現(xiàn)在數(shù)據(jù)源源不斷的產(chǎn)生,源源不斷的往系統(tǒng)里面灌,系統(tǒng)的存儲除非你很有錢,不停的增加存儲設(shè)備,但是現(xiàn)在沒有說哪個人不斷的增加存儲設(shè)備,一個預算完了存儲一段時間就算了,或者把里面的信息摘取出來放在另外的地方。這里面大家很容易想得到,如果有一個非常好的高效的存儲技術(shù),或者把原來的圖像和視頻編碼壓縮可以節(jié)省存儲空間,原來能存三個月,如果能把它的壓縮效率提高一倍就可以存六個月,或者把原來的系統(tǒng)開銷減掉一半。這件事在技術(shù)領(lǐng)域已經(jīng)做了三十多年,大概從90年代初有人提出來,剛開始不是為了視頻監(jiān)控做的,而是為廣播電視、數(shù)字電視做的,比如第一代的編碼標準,早些時候大家用的VCD、DVC的標準,做了一段時間大家覺得壓縮不夠又開始做第二代,覺得還不夠就開始做第三代,現(xiàn)在系統(tǒng)大量使用的是H.264,我們叫做第二代的標準技術(shù),現(xiàn)在正在做第三代的一些東西。
第三代、第二代、第一代的編碼效果有多高呢,第一代的編碼標準能夠把原來的視頻數(shù)據(jù)壓縮到1/75,第二代比第一代效率增加了一倍,能夠把原來的視頻壓縮到1/150,現(xiàn)在正在做的第三代大概能把數(shù)據(jù)壓縮到1/300,大概是這樣,取下來的視頻壓縮完之后存儲在那里,如果有辦法找到一個編碼壓縮技術(shù)就可以提高它的編碼效率。為什么有150:1、300:1,甚至未來修600:1的壓縮能力呢,因為我們拍視頻的時候里面有很多的冗余,只要你有很好的算法把這個冗余去除掉,所以擰毛巾就是做視頻壓縮要做的,為什么可以這樣呢?因為冗余里面有各種各樣的,比如說同樣的東西每一楨被拍了很多遍,如果每一楨都重新表達出來肯定很浪費,能不能把后來拷的都一樣拷過來就可以了。還有一種叫編碼冗余,實際從理論可以分析出來,現(xiàn)在的算法離真正的理論上限還差很遠,只是找不到更好的算法逼近那個理論上限,所以現(xiàn)在有成千上萬的工程師和科學家找高效編碼的算法,希望一點點進行改進。所以我們還有很多的空間?;敬蟮目蚣芫褪沁@個這張圖給的框架?;\統(tǒng)說,采用包括正交變換、運動預測、商編發(fā)等等使編碼效率一點點的提高。