媒體注:本文作者 Silver Keskkula 是Teleportinc 創(chuàng)始人之一 ,也是Skype 核心團(tuán)隊(duì)的首席研究員。作者從五個(gè)方面講述了,如何通過AI 技術(shù)讓你足不出戶就能找到一處適合自己居住的地方。文章由圖普科技翻譯。
我曾經(jīng)在《AI將如何重組人口》一文中打趣過我的讀者們。就像在線約會(huì)網(wǎng)站決定誰跟誰將制造一個(gè)嬰兒,我們將也讓AI技術(shù)決定誰將搬去哪兒。所以,我們?nèi)绾沃廊缃衲男┏鞘胁拍鼙环Q為好城市?
我們讀新聞,聽到朋友的好消息,看到照片和視頻,從那里得到最好的工作機(jī)會(huì),而非常平常的是,我們經(jīng)常只是走馬觀花地去看城市。
我不會(huì)去深入剖析AI是如何參與決定哪些新聞,朋友的帖子,視頻或城市的照片將被我們看到,但我將要闡述我們?nèi)绾问褂迷赥eleport中的AI技術(shù)去幫助你更客觀地看待城市。 自從我被《每個(gè)孩子都開始編程》一文深深吸引后,接下來,我將通過簡(jiǎn)單的代碼示例來演示這個(gè)文中的過程,以說明使用所有工具玩轉(zhuǎn)AI已經(jīng)是一件很容易的事情。
以下想法主要受到來自MIT的StreetScore項(xiàng)目的啟發(fā)。
通過AI的眼睛探訪城市
讓我們從Teleport Developers API中抓取愛沙尼亞Tartu區(qū)域,并生成10,000個(gè)隨機(jī)地理坐標(biāo)。你可能會(huì)問,為什么是一萬個(gè)?因?yàn)榭茖W(xué)!
這樣在地理上的均勻分布當(dāng)然會(huì)使我們對(duì)城市的看法有一定意見,因?yàn)榇蠖鄶?shù)時(shí)候我們?cè)跇淞掷锘蛘呶蓓斏隙紟缀蹩床坏饺魏螙|西。但幸運(yùn)的是,在Google Maps API的幫助下,我們可以任意移動(dòng)坐標(biāo),并得到更像這樣的東西:
正如你所看到的,我們計(jì)劃訪問的位置(紅點(diǎn))或多或少在熱鬧的道路和街道上,而不是一些長(zhǎng)滿了樹的地方。
現(xiàn)在我們已經(jīng)擁有我們的位置,現(xiàn)在是時(shí)候進(jìn)入觀看位了,并熟悉Google街景視圖圖像API?;旧衔矣梦业淖鴺?biāo)調(diào)用他們的API,并在本地保存生成的圖像。
經(jīng)過一些反向地理編碼和一些常規(guī)遵循后,Google的API讓我得到了每個(gè)坐標(biāo)返回的照片(而均勻分布則會(huì)顯示的“對(duì)不起,我們沒有圖像”)。
然后通過我的代碼,我就可以窺視成千上萬的Tartu的圖像,而不需要離開房間(或我的電腦?)。
圖像HAL層上有什么?
為了簡(jiǎn)化事情,我通過公共可用的機(jī)器視覺API運(yùn)行我們的圖像集。 我們有很多這種類似的選擇,比如Microsoft Computer Vision API / Google Cloud Vision API / IBM Vision Recognition API / Cloud / Sight API / Clarifai等等
但為了這個(gè)例子,我去了微軟的牛津項(xiàng)目。微軟研究組織使我印象深刻,老實(shí)說,他們的API免費(fèi)使用條款是最吸引我的。他們甚至慷慨到提供Python 的快速開始代碼。
實(shí)質(zhì)上,您只需將圖片上傳到其API,并返回一行描述場(chǎng)景的文本。這里有一個(gè)來自Tartu的圖像示例,以及來自MS Vision API的輸出文本。
智能壓縮
通過他們的API,我將來自Tartu的8.5GB原始圖像像素?cái)?shù)據(jù)壓縮成255KB的文本數(shù)據(jù)。 如果研究過壓縮和智能的關(guān)系,那么這個(gè)減小了35,294倍的尺寸或許能說明一些問題。
無論如何,現(xiàn)在我們終于有了描述場(chǎng)景的自然語言,我們可以開始研究統(tǒng)計(jì)數(shù)據(jù),看看我們能否找到一些說服某人搬家的理由。