
一支來(lái)自麻省理工學(xué)院計(jì)算機(jī)科學(xué)和人工智能實(shí)驗(yàn)室(CSAIL)的團(tuán)隊(duì),在早先研究人工智能和算法的基礎(chǔ)上,創(chuàng)造了食譜數(shù)據(jù)庫(kù)。他們認(rèn)為,這樣的照片解析方式能幫助人們了解食譜配方,從而更好地為健康飲食習(xí)慣提供寶貴建議配方,更好地理解人們的飲食習(xí)慣。
針對(duì)一幅菜肴的靜態(tài)影像,CSAIL團(tuán)隊(duì)開(kāi)發(fā)的精深學(xué)習(xí)算法能夠準(zhǔn)確推算出食材原料和配方。
在卡塔爾計(jì)算研究學(xué)院(QCRI)最新發(fā)表的一篇文章中,CSAIL團(tuán)隊(duì)設(shè)計(jì)了PicRecipe系統(tǒng)可以通過(guò)讀取食物的照片,預(yù)測(cè)其食材組成,并給出相似的食譜配方。
一位來(lái)自麻省理工學(xué)院的博士后Yusuf Aytar提到,“在計(jì)算機(jī)視覺(jué)領(lǐng)域,食物是最容易被忽略的,因?yàn)槲覀儾](méi)有規(guī)模足夠大的數(shù)據(jù)集來(lái)做這樣的預(yù)測(cè)。但那些看起來(lái)似乎沒(méi)什么用的美食照片,實(shí)際上可以在飲食習(xí)慣和膳食偏好等方面為我們提供有價(jià)值的洞見(jiàn)。”
Yusuf Aytar與同校的教授Antonio Torralba合著了一篇關(guān)于該系統(tǒng)的論文, 他表示“7月底時(shí),這篇論文已在檀香山舉辦的計(jì)算機(jī)視覺(jué)和模式識(shí)別會(huì)議上發(fā)表。”
CSAIL研究生Nick Hynes和西班牙加泰羅尼亞紐約科技大學(xué)的Amaia Salvador并列第一作者。聯(lián)合發(fā)表者還包括CSAIL博士后Javier Marin,科學(xué)家Ferda Ofli以及QCRI的研發(fā)總監(jiān)Ingmar Weber。
AI識(shí)別食物照片,是如何實(shí)現(xiàn)的呢?
網(wǎng)站上可以找到大量針對(duì)食品數(shù)據(jù)分級(jí)歸類的研究,但是它們中的大多數(shù)使用的數(shù)據(jù)集太小,經(jīng)常導(dǎo)致食物分類的偏差很大。
2014年瑞士研究人員創(chuàng)建了“Food-101”數(shù)據(jù)集,并用它來(lái)開(kāi)發(fā)了一種識(shí)別食物圖像的算法,精準(zhǔn)度可以達(dá)到50%。經(jīng)過(guò)進(jìn)一步迭代循環(huán)也只能將這一準(zhǔn)確度提高至80%,這也意味著數(shù)據(jù)集的規(guī)??赡苁莻€(gè)限制因素。
但即使數(shù)據(jù)集夠大,通常也存在人口普及率方面的局限,如香港城市大學(xué)的數(shù)據(jù)庫(kù)有多達(dá)11萬(wàn)張食物圖片,65000個(gè)菜譜,每一份都有原配料清單和說(shuō)明,但僅僅包含了中國(guó)菜。
CSAIL團(tuán)隊(duì)的項(xiàng)目旨在基于現(xiàn)有的工作基礎(chǔ)上構(gòu)建數(shù)據(jù)集,但要極大地拓展范圍。研究者對(duì)All Recipes和http://Food.com等網(wǎng)站進(jìn)行了仔細(xì)梳理后,開(kāi)發(fā)出“Recipe 1M”,這是一個(gè)包含了上百萬(wàn)種食譜及其原料信息的數(shù)據(jù)庫(kù),涵蓋菜品的種類也非常廣泛。然后他們用數(shù)據(jù)訓(xùn)練神經(jīng)中樞網(wǎng)絡(luò)去查找圖像,并在食物圖像和相應(yīng)的原料,食譜間建立聯(lián)系。
比如給你一張食物圖片,Pic2Recipe能夠識(shí)別出面粉、雞蛋、黃油等材料,之后它會(huì)根據(jù)數(shù)據(jù)庫(kù)中類似的圖片,給出幾種配方建議。研究團(tuán)隊(duì)制作了在線操作演示,人們可以上傳自己的食物照片來(lái)做測(cè)試。
想象一下,人們可以利用這個(gè)功能來(lái)追蹤每日的營(yíng)養(yǎng)需求,也可以在餐廳就餐時(shí)給喜歡的菜肴拍個(gè)照,然后回家之后就可以根據(jù)智能推薦的結(jié)果自己進(jìn)行評(píng)測(cè)。
來(lái)自維也納MODUL大學(xué)新媒體技術(shù)學(xué)院的副教授Christoph Trattner表示,CSAIL團(tuán)隊(duì)的方法已經(jīng)接近人類的判斷水平,這是非常偉大的。
對(duì)甜點(diǎn)的識(shí)別相對(duì)更好
該系統(tǒng)對(duì)曲奇或松餅等甜點(diǎn)的識(shí)別方面做的尤其好,因?yàn)檫@是數(shù)據(jù)庫(kù)中的主要素材類別。然而,如果是壽司卷或Smoothie等很多模糊不清的食品,識(shí)別起來(lái)就較為困難。
當(dāng)同一道菜有很多相似的配方時(shí),也通常會(huì)被難倒。比如鹵汁面條的制作方法有十多種,該團(tuán)隊(duì)需要確保系統(tǒng)在對(duì)比那些相似配方的不同之處時(shí)可以更快將其區(qū)分開(kāi),解決此問(wèn)題的一種方法是,在對(duì)比食譜配方前,先要看看他們的原料與分析照片中的是否大體類似或相同。
未來(lái),該團(tuán)隊(duì)希望能夠改進(jìn)系統(tǒng),使它可以分析出更詳細(xì)的信息,比如食物的準(zhǔn)備方法,是燉的還是切丁的,或者區(qū)分更多不同種類的食物,如蘑菇或洋蔥。
研究人員非常有興趣將該系統(tǒng)開(kāi)發(fā)成“餐桌助手”,可以根據(jù)膳食偏好和冰箱里的食材清單給出烹飪建議。
Hynes稱:“該系統(tǒng)可以在人們沒(méi)有足夠清楚的營(yíng)養(yǎng)信息時(shí),幫助他們分析攝入的是什么。例如,如果你知道菜肴里有哪些食材,但不知道其使用量,就可以可以拍個(gè)照片,輸入相應(yīng)的食材,并運(yùn)行該模型,尋找到一種已知量的相似配方,然后利用這些信息推算出自己的膳食營(yíng)養(yǎng)攝入。”
(以上文章被中國(guó)計(jì)算網(wǎng)《超算AI數(shù)據(jù)庫(kù)》收錄于2018年12月21日,轉(zhuǎn)自知乎,歡迎CAE與計(jì)算機(jī)行業(yè)人士投稿于中國(guó)計(jì)算網(wǎng))
搜索微信公眾號(hào): cncompute_Mall 直接關(guān)注,更多驚艷的資訊等你來(lái)關(guān)注~您也可以來(lái)投稿~
搜索微信公眾號(hào): cncompute_Mall 直接關(guān)注,更多驚艷的資訊等你來(lái)關(guān)注~您也可以來(lái)投稿~