雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))按:本文作者楊朋朋,就讀于北京交通大學(xué),信號與信息處理專業(yè)博士生二年級,導(dǎo)師倪蓉蓉教授。研究興趣包括多媒體取證、隱寫分析,深度學(xué)習(xí)。所在團隊為教育部創(chuàng)新團隊和科技部重點領(lǐng)域創(chuàng)新團隊,負(fù)責(zé)人為趙耀教授。
圖像取證
在當(dāng)今飛速發(fā)展的信息時代,數(shù)字圖像已經(jīng)滲透到社會生活的每一個角落,數(shù)字圖像的廣泛使用也促進了數(shù)字圖像編輯軟件的開發(fā)與應(yīng)用,例如:Adobe Photoshop、CorelDRAW、美圖秀秀等等。利用這些編輯工具,用戶可以隨意對圖像進行修改,從而達(dá)到更好的視覺效果。然而,在方便了用戶的同時,也給一些不法分子以可乘之機。在未經(jīng)授權(quán)的情況下,不法分子對圖像內(nèi)容進行非法操作,如違規(guī)編輯、合成虛假圖像等,從而造成篡改圖像在人們社會生活中泛濫成災(zāi)。圖像取證技術(shù)就是在這樣的背景下提出,旨在通過盲分析手段認(rèn)證圖像數(shù)據(jù)的原始性和真實性、鑒別和分析圖像所經(jīng)歷的操作處理及估計圖像的操作歷史。
數(shù)字圖像的完整周期包含三個部分:圖像獲取、圖像編碼、圖像編輯,如圖1所示。
圖1. 數(shù)字圖像的完整周期
在圖像獲取過程中,真實場景中的光線通過相機鏡頭投射到相機傳感器(如CCD或者CMOS傳感器),產(chǎn)生數(shù)字圖像信號。在投射到相機傳感器之前,通常光首先經(jīng)過CFA濾波處理,即每個像素點只會包含一種主要的顏色分量(紅、綠、藍(lán))。在相機傳感器之后會進行CFA差值(也稱去馬賽克處理),從而獲取每個像素點的紅綠藍(lán)三通道分量。然后獲取的數(shù)字圖像信號會經(jīng)歷相機內(nèi)部的軟件處理,比如白平衡、對比度增強、圖像銳化、伽馬矯正等等。
在圖像編碼部分,經(jīng)過處理后的數(shù)字圖像信號為了節(jié)省相機內(nèi)存通常會經(jīng)過有失真壓縮處理,最常見的壓縮方式為JPEG壓縮。部分壓縮后的數(shù)字圖像為了獲得更好的視覺效果會進行后處理操作,任何的圖像編輯都可以應(yīng)用在后處理操作,經(jīng)常使用的編輯為:幾何變換(旋轉(zhuǎn)、縮放等)、模糊、銳化、對比度調(diào)整、圖像拼接、復(fù)制-粘貼。經(jīng)過編輯后的數(shù)字圖像重新保存為JPEG格式形成最終的數(shù)字圖像。
數(shù)字圖像取證的出發(fā)點是通過提取數(shù)字圖像周期中留下的固有痕跡進行分析和理解數(shù)字圖像的操作歷史。以上介紹的數(shù)字圖像完整周期的三個部分,每一部分都會留下不同的操作痕跡(指紋特性),即獲取指紋、編碼指紋、編輯指紋。在圖像獲取指紋研究中,根據(jù)鏡頭特性、傳感器特性、CFA模式等引入數(shù)字圖像中的不同指紋特性對數(shù)字圖像進行分析。在圖像編碼指紋研究中,JPEG壓縮以及多重JPEG壓縮檢測是主要關(guān)注的問題。在圖像編輯指紋特性研究中,基于信號處理和基于物理/幾何的技術(shù)被提出。利用信號處理技術(shù)進行復(fù)制粘貼檢測、重采樣檢測、對比度增強檢測、線裁剪檢測等,利用光線/陰影進行拼接檢測以及利用幾何關(guān)系的一致性檢測拼接處理都是取證研究中的熱點問題。
圖像取證深度學(xué)習(xí)之風(fēng)
不同于傳統(tǒng)的圖像取證算法,深度學(xué)習(xí)算法將特征提取和特征分類整合到一個網(wǎng)絡(luò)結(jié)構(gòu)中,實現(xiàn)了一種end-to-end的自動特征學(xué)習(xí)分類的有效算法。從當(dāng)前的研究工作來看,深度學(xué)習(xí)應(yīng)用于圖像取證領(lǐng)域大致可分為三個層次。
第一個層次是簡單的遷移,即直接將CV領(lǐng)域常用的CNN網(wǎng)絡(luò)結(jié)構(gòu)引入到圖像取證領(lǐng)域。取證領(lǐng)域比較常用的網(wǎng)絡(luò)結(jié)構(gòu)為AlexNet,選擇此網(wǎng)絡(luò)結(jié)構(gòu)的原因,是因為AlexNet網(wǎng)絡(luò)結(jié)構(gòu)相較于其他網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜度相對較低并且性能較好,對于解決數(shù)據(jù)集少的取證問題有更好的嘗試性條件。典型案例為Luca Baroffio, Luca Bond等發(fā)表的文章“Camera Identification With Deep Convolutional Networks”, 文章提出用深度學(xué)習(xí)解決取證中的相機源辨別問題。
第二個層次是嘗試對網(wǎng)絡(luò)輸入的修改,進行此種嘗試的初衷是由取證問題和CV問題的本質(zhì)區(qū)別所驅(qū)使。取證問題雖可歸類于識別、分類、定位問題,但是對于分類問題的類間差別取證分類問題遠(yuǎn)小于CV分類問題。舉個例子:ImageNet中的22000種類別之間的形態(tài)差異是較大的,比如貓和狗兩個類別之間的差異人眼可辨別;然而對于取證問題,類別之間的形態(tài)差異是極其微小的,類間差別以微弱信號的形式存在;比如對于常見的雙重JPEG壓縮取證,需要解決的問題是區(qū)分一幅圖像是經(jīng)歷過一次JPEG壓縮之后的圖像,還是經(jīng)歷過兩次JPEG壓縮之后的圖像。在兩次壓縮使用的壓縮因子(壓縮因子小于等于90)一致的前提條件下,內(nèi)容相同的兩幅圖像的DCT域統(tǒng)計類間差別小于0.4%(數(shù)據(jù)來源于Detecting Double JPEG Compression With the Same Quantization Matrix)。