贊助本站
谷歌的人工智能研究人員最近展示了一種新的訓(xùn)練方式,可以讓計(jì)算機(jī)理解為什么有些圖像比其他圖像更美觀。
傳統(tǒng)上,機(jī)器會(huì)使用基本的分類(lèi)——比如判斷一個(gè)圖像是否有“貓”。新的研究表明,現(xiàn)在人工智能可以對(duì)圖像質(zhì)量進(jìn)行評(píng)分,不管類(lèi)別是什么。這個(gè)過(guò)程被稱(chēng)為神經(jīng)圖像評(píng)估(NIMA),它利用深度學(xué)習(xí)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)(CNN)來(lái)預(yù)測(cè)圖像的評(píng)級(jí)。
根據(jù)研究人員發(fā)表的一份白皮書(shū):“我們的方法與其他方法不同,因?yàn)槲覀兺ㄟ^(guò)卷積神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)人類(lèi)的意見(jiàn)分?jǐn)?shù)分布。我們的結(jié)果網(wǎng)絡(luò)不僅可以被用來(lái)可靠地給圖像打分,而且與人類(lèi)的感知高度相關(guān),并且還可以幫助在攝影通道中對(duì)照片編輯/增強(qiáng)算法進(jìn)行調(diào)整和優(yōu)化。”
NIMA模型避開(kāi)了傳統(tǒng)的方法,采用了10分制的評(píng)分標(biāo)準(zhǔn)。機(jī)器會(huì)檢查圖像的特定像素和整體美學(xué)。然后它會(huì)決定某一個(gè)評(píng)級(jí)有多大可能被一個(gè)人選擇。基本上,人工智能會(huì)試圖猜測(cè)一個(gè)人喜歡這張照片的程度。這并不能使機(jī)器獲得感知或思考的能力,但它可能會(huì)讓計(jì)算機(jī)成為更好的藝術(shù)家或策展人。這個(gè)過(guò)程可能會(huì)被應(yīng)用于尋找一批最好的圖片。
如果你是那種每次拍20或30張圖片的人,為了確保你擁有最好的照片,這可以為你節(jié)省很多空間。假設(shè),只要點(diǎn)擊一下按鈕,AI就可以查看存儲(chǔ)中的所有圖片,并確定哪些圖片是類(lèi)似的,然后保留最好的,刪除剩余的。根據(jù)谷歌研究博客最近的一篇文章,NIMA也可以用來(lái)優(yōu)化圖像設(shè)置,從而產(chǎn)生完美的結(jié)果:
“我們觀察到,由NIMA評(píng)分的對(duì)比調(diào)整可以改善基準(zhǔn)的審美評(píng)分。因此,我們的模型能夠引導(dǎo)一個(gè)深度的CNN過(guò)濾器,找到其參數(shù)近乎理想的設(shè)置,比如亮度、高光和陰影。”
創(chuàng)建一個(gè)幾乎和人類(lèi)一樣理解圖像質(zhì)量的神經(jīng)網(wǎng)絡(luò)似乎并不具有革命性,但對(duì)于擁有像人類(lèi)一樣視力的計(jì)算機(jī)應(yīng)用程序卻有很多。
為了讓人工智能在現(xiàn)實(shí)世界中執(zhí)行任務(wù),比如在沒(méi)有人類(lèi)幫助的情況下安全地駕駛汽車(chē),它必須能夠“看到”并理解它的環(huán)境。NIMA,以及像它這樣的項(xiàng)目,正在為未來(lái)的全功能機(jī)器打下基矗