Google 在 2015 I/O 大會上推出的 Google Photos 不僅僅是一個相冊,它可以將相冊中同一個人物的照片整合在一起,比如回顧一個嬰兒從小到大的成長軌跡。通過人工智能的長期學(xué)習(xí),它甚至可以自動判斷對你重要的時刻、重要的人、和重要的事物。
在其中起到關(guān)鍵作用的是 Google 的圖片識別 AI 。它通過學(xué)習(xí)大量的圖片、調(diào)整算法來提高識別的精確度。
但是工程師們要如何知道 AI 對圖片識別的準(zhǔn)確性呢?
通過一個被稱為 Inceptionism 的項(xiàng)目,Google 工程師潛入了 AI 的 “夢境”。他們先輸入一張圖片,讓它識別圖片中關(guān)鍵的部分;再讓 AI 輸出一張圖片,表達(dá)它對圖片的理解。

Google 的圖片識別 AI 具有 30 層神經(jīng)網(wǎng)絡(luò),每一層對應(yīng)著不同的抽象程度,比如最低層次能識別光線、色彩,下一層次能識別圖片的邊緣等等。這樣一層層的“訓(xùn)練”需要大量的數(shù)據(jù)。每一層都能提取出更高層次的細(xì)節(jié),而最后一層會決定 AI 對圖片的理解。
比如你想知道輸入怎樣的圖片會讓 AI 認(rèn)為是“香蕉”,可以從一張滿是噪點(diǎn)的圖片開始,然后慢慢調(diào)整,直到它輸出你想讓它識別的事物。

在測試中,當(dāng)試圖詢問啞鈴是什么時,Google AI 輸出了帶手臂的啞鈴,在輸入學(xué)習(xí)的圖片庫中,啞鈴都是和手臂一起出現(xiàn)的。那么提高認(rèn)識精確度的辦法就是,在訓(xùn)練學(xué)習(xí)中多輸入一些啞鈴單獨(dú)出現(xiàn)的圖片。

在不同的層次輸入圖片會得出不同的結(jié)果,比如在一些測試中,就出現(xiàn)了這些多眼多足的“神獸”。

Google 還專門為這些圖片建了一個相冊。有的如同超現(xiàn)實(shí)主義的藝術(shù)作品,有的則十分驚悚。這些圖片至少能夠表明,AI 眼中的世界顯然與人類還有很大的差距。
而用戶對此的反應(yīng)也不一而足。有人看了以后評論道:
“這是我見過最恐怖的東西。如果 AI 眼中的世界是我們永遠(yuǎn)都不可能看到的,那么我們要怎么回應(yīng)它們的行為?”
而另一位用戶則認(rèn)為:
“我很懷疑這是我們可以稱為‘智能’的東西。它很奇特、吸引人、很酷,但是計(jì)算機(jī)并不是在繪畫或者做夢,它只是在遵循設(shè)定的程序而已。”