這個(gè)工具包支持人工智能各個(gè)方面的應(yīng)用,包括口語(yǔ),視頻和其他媒體。但是,最震撼和最強(qiáng)大的功能莫過(guò)于牛津項(xiàng)目現(xiàn)在支持開發(fā)者通過(guò)牛津人臉應(yīng)用平臺(tái)接口項(xiàng)目( Project Oxford Face API)檢測(cè)圖片中的人物表情。
譬如,用牛津項(xiàng)目處理一張包含5個(gè)人的照片,識(shí)別照片中的臉以及每個(gè)人的表情——快樂,憤怒或惡心。
這項(xiàng)功能在新的高度,像人類一樣「理解」圖片質(zhì)量。觀看他人照片時(shí),人們關(guān)注的最重要特征就是個(gè)人或群體的情感狀況。
Pinterest Visual Search
Pinterest日前發(fā)布了全新的圖片搜索功能,它能幫助用戶發(fā)現(xiàn)更多的信息甚至幫助購(gòu)買他們?cè)诠潭ㄕ掌锟吹降漠a(chǎn)品。
首先,在 Pinterest的圖片中選中任一物體(來(lái)回拖動(dòng)一個(gè)盒狀標(biāo)識(shí))。然后,搜索工具會(huì)找到具有相似圖案和顏色的相似物,系統(tǒng)會(huì)將最匹配的結(jié)果鏈接到購(gòu)買按鈕上,點(diǎn)擊這里就能購(gòu)買該產(chǎn)品。
這個(gè)功能是以伯克利視覺和學(xué)習(xí)中心(Berkeley Vision and Learning Center)的深度學(xué)習(xí)人工智能為基礎(chǔ)的。
這種照片人工智能應(yīng)用可以說(shuō)是萬(wàn)維網(wǎng)照片的雛形,在這個(gè)萬(wàn)維網(wǎng)中,每張圖片中的每個(gè)物體都與等同物或者相似物、相關(guān)物彼此關(guān)聯(lián)。
CloudSight
一家名為CamFind的圖片識(shí)別和視覺搜索公司,今年推出了一個(gè)「云視覺」(CloudSight)的公共應(yīng)用平臺(tái)接口。
這個(gè)API支持開發(fā)者使用CamFind的人工智能分析圖片內(nèi)容。這樣的掃描大多數(shù)情況下具有高度特定性,比如,能識(shí)別汽車的制造和模型,或者狗的品種以及食品的具體類型。一旦分析出圖片中的物品,開發(fā)者就可以使用這些信息來(lái)獲取網(wǎng)絡(luò)上的文字信息。
Deepomatic
Deepomatic開發(fā)了一種服務(wù)型軟件智能搜索引擎,它能識(shí)別圖片中各種各樣的數(shù)據(jù)。Deepomatic熱衷時(shí)尚。它不僅匹配顏色,圖案和其他數(shù)據(jù),還能識(shí)別圖片中的物品,并將它與一個(gè)全面的時(shí)尚產(chǎn)品數(shù)據(jù)庫(kù)進(jìn)行匹配。
Deepomatic網(wǎng)站聲稱,其技術(shù)模擬了人類大腦接收視覺信息的方式并用這種方式來(lái)理解各種概念。
遠(yuǎn)大前景
每當(dāng)想到這樣一個(gè)令人驚喜的新世界:能夠理解照片內(nèi)容的人工智能將無(wú)處不在,具有強(qiáng)大擴(kuò)展?jié)摿η彝偈挚傻脮r(shí),這些無(wú)限可能性就會(huì)令人嘆為觀止。
而且,這僅僅是一個(gè)開始。在絕大多數(shù)情況下,這項(xiàng)技術(shù)幾乎都能通過(guò)API,開源程序或服務(wù)化處理得以應(yīng)用實(shí)現(xiàn),因此,我們已經(jīng)站在了未來(lái)世界的入口:圖像AI將和網(wǎng)絡(luò)搜索一樣普及,成為這個(gè)世界的一個(gè)基本特征。為了真正模擬人工智能,計(jì)算機(jī)必須有視覺,現(xiàn)在它們有了。
機(jī)器之心編譯出品,參與成員:Sane、微胖
登陸|注冊(cè)歡迎登陸本站,認(rèn)識(shí)更多朋友,獲得更多精彩內(nèi)容推薦!