11月28日消息,不久之前,人們認(rèn)為圖像識別將會是另一個引領(lǐng)未來之浪潮,如今這樣的想法已經(jīng)不常見了。但是現(xiàn)在,由于拍攝及存儲的照片之規(guī)模愈發(fā)龐大,而且又需要即快且易地找到它們,攝影技術(shù)便把圖像識別技術(shù)推到了發(fā)展之前沿,舞臺的中心。而且隨著技術(shù)不斷進(jìn)步,圖像識別技術(shù)也加入了其他技術(shù)來鞏固搜索運(yùn)算和搜索結(jié)果。
近日,雅虎旗下的Flickr以及實(shí)驗(yàn)室小組利用一個多元合一策略,把計(jì)算機(jī)視覺、地理信息以及人際互動結(jié)合在一起,擺脫了對元數(shù)據(jù)的依賴,從而已經(jīng)發(fā)展出了一套可行的搜索算法。開發(fā)這一技術(shù)的初衷是,幫助優(yōu)化Flickr照片軟件以及為照片軟件的用戶服務(wù),同時(shí)也著眼于雅虎軟件和電子商務(wù)服務(wù)的當(dāng)前及未來之商業(yè)需求。
雅虎天氣軟件為試驗(yàn)這一技術(shù)提供了一個好機(jī)會。該軟件搜集元數(shù)據(jù)、地理位置以及人們對Flickr照片的互動,以為該軟件選擇那些最有趣味的圖片。雅虎實(shí)驗(yàn)室的高級科研主管David表示,“天氣軟件是一個很好的例子,因?yàn)樗婕暗胶芏嗾掌?,而且我們可以在不同的地理位置檢索這些圖片,不僅檢索地理坐標(biāo),而且檢索時(shí)間和天氣狀況,然后再把這些圖片還原到軟件中,從而發(fā)現(xiàn)你喜歡什么樣的城市風(fēng)貌。”雅虎沒有完全依賴于諸如標(biāo)簽、照片名稱等來自于用戶的內(nèi)容,而且借助于計(jì)算機(jī)視覺和深度學(xué)習(xí)技術(shù)來識別圖片上的物體。計(jì)算機(jī)視覺和社會視覺的結(jié)合增強(qiáng)了搜索結(jié)果的質(zhì)量。
社會計(jì)算方法產(chǎn)生出了大約600萬張?zhí)鞖鈭D片。經(jīng)過對不準(zhǔn)確的地理位置和時(shí)間、低分辨率以及錯誤內(nèi)容的修正,大約有150萬張照片保留在了天氣軟件上。“這一方法加強(qiáng)了人工智能,而且加入人的因素,”雅虎實(shí)驗(yàn)室的高級研究科學(xué)家Jia Li說。“基于深度學(xué)習(xí),照片歸類算法分析一張照片到底是暴風(fēng)圖、多云圖還是雪景圖,是白天還是黑夜。”
這并非Flickr第一次公開分析其圖像識別技術(shù)進(jìn)展的細(xì)枝末節(jié)。另一個最近的博客帖子也描述了該小組正在嘗試改善圖片搜索以及圖片尋找技術(shù)。雅虎和Flickr把社會計(jì)算(social computing)、地理方位以及電腦視覺融合起來,推動圖像識別技術(shù)的發(fā)展。雅虎也加入其它公司共同研發(fā)圖像識別技術(shù),分享自己搜集的一億多張照片來提供足夠多的數(shù)據(jù)供研究人員使用。
最終,圖片識別技術(shù)成熟之時(shí),會有助于提高改善人們的私生活。Garrigues說,“圖像識別還沒有怎么影響到尋常百姓的生活。我手機(jī)上有一萬張照片,而且我需要花很多時(shí)間來滑動屏幕,但還是找不到想要的照片。我們認(rèn)為,在把這一技術(shù)帶給人們以及讓它幫助人們改善生活上,還缺少一環(huán)。”(編譯:曹建峰)