近來(lái)跑出去參加了兩次會(huì)議:虎嗅的FM以及新浪科技的C+峰會(huì),很有意思的是兩次會(huì)上都有關(guān)于人工智能的話題,前者是余凱等的一個(gè)論壇后者則是微軟研究院洪小文做了關(guān)于小冰的演講。C+峰會(huì)的走廊上還有一個(gè)接入了圖靈系統(tǒng)的NAO機(jī)器人,可惜的是我去捅它的時(shí)候,它正充電,完全不搭理我。但各種文章、書(shū)籍、對(duì)話和演講聽(tīng)下來(lái),看下來(lái)我發(fā)現(xiàn)還很少有人對(duì)人工智能整體做過(guò)歸納,這篇文章正是這樣一種嘗試。嘗試把各種五花八門(mén)的產(chǎn)品和技術(shù)梳理出一點(diǎn)脈絡(luò)。
重新啟動(dòng)的自動(dòng)化
在1946年,美國(guó)福特公司的機(jī)械工程師D.S。哈德就提出了“自動(dòng)化”一詞,此后各種提高自動(dòng)化程度的技術(shù)層出不窮,但就和傳統(tǒng)軟件一樣,過(guò)去的自動(dòng)化更多的是處理能清楚定義邊界的工作的自動(dòng)化,對(duì)于邊界不清晰,環(huán)境特別復(fù)雜的情形則有點(diǎn)力不從心。拿掃地機(jī)器人來(lái)做例子最容易說(shuō)清這兩類(lèi)情形:如果就限定是很大的、固定是長(zhǎng)方形的、沒(méi)什么障礙物的屋子的清掃,那就很容易設(shè)計(jì)一種掃地機(jī)器人來(lái)完成確定的清掃方案,但這在居家的掃地機(jī)器人身上就行不通,因?yàn)椴煌说奈葑涌偸菚?huì)有差別,這意味著這種居家掃地機(jī)器人必須處理預(yù)先沒(méi)被定義的各種情形。這是條紅線,沒(méi)有人工智能的發(fā)展,自動(dòng)化的程度就會(huì)限定在這條紅線下面。這反過(guò)來(lái)也就意味著,如果人工智能可以賦給機(jī)器更多的智力,那原本那些自動(dòng)化方案沒(méi)法搞定的領(lǐng)域,現(xiàn)在也可以開(kāi)始自動(dòng)化了。這種領(lǐng)域很多,散布在種種不同的行業(yè)中,如果按照潛在的影響力來(lái)做大致的排行的話,那么是:
一、自動(dòng)駕駛
自動(dòng)駕駛所能帶來(lái)的變化肯定會(huì)大于電動(dòng)這種單純的能源變換所帶來(lái)的變化,因?yàn)橐坏┳詣?dòng)駕駛真的實(shí)現(xiàn),車(chē)在人們心目中的意義很可能會(huì)發(fā)生巨大變化并使車(chē)上的共享經(jīng)濟(jì)真的得以實(shí)現(xiàn)。想象下在龐大且復(fù)雜的調(diào)度算法的支持下,每個(gè)人的出行需要都可以按需滿(mǎn)足,那人們?yōu)槭裁葱枰惠v自己的車(chē)。
自動(dòng)駕駛的發(fā)展有兩種路線:一種是Google式的,特點(diǎn)是一下子實(shí)現(xiàn)終極目標(biāo),中間沒(méi)有過(guò)渡;一種則是以各大車(chē)廠為代表的漸進(jìn)式自動(dòng)駕駛實(shí)現(xiàn)路線。
要想判斷那種更容易先成功那么需要考慮到由現(xiàn)有狀態(tài)到自動(dòng)駕駛的更迭不只是車(chē)的更迭,而是整個(gè)系統(tǒng)的更迭。所謂整個(gè)系統(tǒng)的更迭至少有兩方面的含義:
一個(gè)是自動(dòng)駕駛所需要的支撐系統(tǒng)必須是完整實(shí)現(xiàn)的。一般來(lái)講加油/充電、事故維修、保養(yǎng)是汽車(chē)運(yùn)轉(zhuǎn)必須的幾項(xiàng)支撐。但這點(diǎn)對(duì)自動(dòng)駕駛路線影響并不大,兩條路線應(yīng)該都是可以嵌入到現(xiàn)有系統(tǒng)里來(lái)。
另一點(diǎn)則是車(chē)所需要面對(duì)的環(huán)境是一體的,逐個(gè)場(chǎng)景來(lái)實(shí)現(xiàn)自動(dòng)駕駛理論上似乎是個(gè)誤區(qū),因?yàn)楝F(xiàn)實(shí)里很難清晰劃定場(chǎng)景的邊界。我們可以講突然躥出人這種場(chǎng)景在高速路上就絕對(duì)不會(huì)出現(xiàn),不需要處理,在一般街道上就需要處理嗎?而要想徹底解決自動(dòng)駕駛里的問(wèn)題,其根本并不在車(chē)本身,而在于數(shù)據(jù)(道路的數(shù)據(jù)、雷達(dá)等感知到的數(shù)據(jù)等)以及數(shù)據(jù)的處理。所以從這個(gè)角度看,車(chē)本身是已經(jīng)被征服的技術(shù)點(diǎn),Google這樣的公司去搞車(chē)雖然難,但有舊例可循,但與此相比車(chē)廠去處理數(shù)據(jù)則更難。
這兩種路徑看著是后一種更穩(wěn)妥,但實(shí)際上很可能是Google那種路線最終會(huì)勝出。因?yàn)閺膱?chǎng)景的角度看要么你完全搞定了自動(dòng)駕駛,要么沒(méi)搞定,似乎沒(méi)有給中間狀態(tài)留太多的空間。
現(xiàn)在的估計(jì)是自動(dòng)駕駛會(huì)在5~10年內(nèi)變成一種大眾化的技術(shù),其中5年估的就是那種漸進(jìn)式的路線,如果按照上述邏輯進(jìn)行修正,那么這事離我們大概還有10年遠(yuǎn)。
二、服務(wù)機(jī)器人
服務(wù)機(jī)器人里面最典型的就是掃地機(jī)器人,其它如酒店服務(wù)機(jī)器人、安保機(jī)器人等也都可以劃入這個(gè)類(lèi)別。也許還會(huì)涌現(xiàn)出其它產(chǎn)品,但這些產(chǎn)品本質(zhì)差不多,所要依賴(lài)的基礎(chǔ)技術(shù)會(huì)有共通的地方,主要是需要強(qiáng)化的點(diǎn)會(huì)不太一樣。這種機(jī)器人通常需要知道自己的位置,并對(duì)環(huán)境(公路、家里、酒店、園區(qū)等)進(jìn)行感知,再接下來(lái)根據(jù)感知到的東西采取行動(dòng)。如果需要交互那么還需自然語(yǔ)言處理(NLP)做支持。這里面實(shí)時(shí)知道自己的位置、對(duì)現(xiàn)實(shí)進(jìn)行感知并行動(dòng)是重度依賴(lài)于人工智能的點(diǎn),沒(méi)人工智能上的突破這幾項(xiàng)不太可能做好。終極狀態(tài)就是四處能跑的和真人一樣的機(jī)器人,但現(xiàn)在限于技術(shù)水平,只可能在特定環(huán)境下進(jìn)行優(yōu)化。沒(méi)地圖走路這點(diǎn)其實(shí)比較難,經(jīng)常提到的SLAM(即時(shí)定位與地圖構(gòu)建)指的就是這個(gè),據(jù)說(shuō)地球上能這個(gè)上搞出像樣結(jié)果的人一共也沒(méi)幾個(gè)。
服務(wù)機(jī)器人因?yàn)槭窍薅▓?chǎng)景,所以雖然有難度但離我們其實(shí)不遠(yuǎn),現(xiàn)實(shí)里已經(jīng)部分的走到我們生活里來(lái)了,比如iRobot的掃地機(jī)器人。
上述的自動(dòng)駕駛汽車(chē)和服務(wù)機(jī)器人本質(zhì)上都可以看成是對(duì)自動(dòng)化的延續(xù),但加入了感知、機(jī)器學(xué)習(xí)等來(lái)面對(duì)復(fù)雜不可以預(yù)先預(yù)知的環(huán)境(想象下現(xiàn)在在火星上跑的那車(chē))。這里面比較濫竽充數(shù)的是工廠里的機(jī)械手,這類(lèi)產(chǎn)品大多時(shí)候也還只是原本定義的自動(dòng)化,只不過(guò)從形態(tài)上很容易被歸到機(jī)器人這一類(lèi)別下面。實(shí)際上它們并沒(méi)有太多機(jī)器人的內(nèi)涵。Baxter等公司也在嘗試做出能學(xué)習(xí)的用于生產(chǎn)制造的機(jī)器人,但這個(gè)也還處在在路上的狀態(tài)。
數(shù)據(jù)分析和挖掘
同屬于于人工智能但又與上面所說(shuō)的自動(dòng)化升級(jí)差異非常大的領(lǐng)域是數(shù)據(jù)的分析和挖掘。
我們這個(gè)世界的數(shù)據(jù)化程度必然因?yàn)榛ヂ?lián)網(wǎng)、智能硬件的發(fā)展而逐步加深,這就會(huì)導(dǎo)致海量的數(shù)據(jù)產(chǎn)生,而傳統(tǒng)的方法是不足以應(yīng)付這么大的數(shù)據(jù)量的,因此就有大數(shù)據(jù)相關(guān)的各個(gè)領(lǐng)域出來(lái),但之前常提到的各種大數(shù)據(jù)技術(shù)比如Hadoop、Spark更像是大數(shù)據(jù)的處理的基礎(chǔ)設(shè)施,在基礎(chǔ)設(shè)施完備之后就需要有一定方法來(lái)從這些數(shù)據(jù)中挖掘出價(jià)值。人是不可能玩成這工作的,必須某種機(jī)器智能來(lái)做才行,因?yàn)榇髷?shù)據(jù)的價(jià)值密度一定會(huì)非常稀疏,人是不可能直接利用這些數(shù)據(jù)的。其實(shí)這也道出了現(xiàn)在所謂人工智能的一種主流驅(qū)動(dòng)方式--數(shù)據(jù)驅(qū)動(dòng)。這個(gè)方向上在可見(jiàn)范圍兩個(gè)典型的應(yīng)用是IBM的沃森和Palantir:
一、沃森
沃森的標(biāo)志性事件是在美國(guó)的一檔知名問(wèn)答節(jié)目里擊敗人類(lèi)選手,獲得冠軍和100萬(wàn)獎(jiǎng)金。這實(shí)在是科技界最厲害的公關(guān)事件,通過(guò)一次比賽把自己記進(jìn)了人工智能的發(fā)展史,只要還有人在提人工智能那就繞不開(kāi)沃森。
如果拋開(kāi)商業(yè)這一面不論我們可以發(fā)現(xiàn)沃森與上面所說(shuō)的自動(dòng)化升級(jí)有著非常大的差異。沃森背后倒沒(méi)聯(lián)網(wǎng),但需要有15T的數(shù)據(jù)做支撐,它不太需要感知環(huán)境,但需要對(duì)語(yǔ)音語(yǔ)義有較好的理解,否則沒(méi)法搶答并回答問(wèn)題。
二、行業(yè)應(yīng)用
行業(yè)應(yīng)用就更現(xiàn)實(shí)一點(diǎn),體現(xiàn)的是人+人工智能的優(yōu)勢(shì)。金融公司總是要從海量數(shù)據(jù)中分析出那種行為更像是金融欺詐,廣告公司要分析轉(zhuǎn)化率,電商公司則要根據(jù)用戶(hù)行為分析如何提升銷(xiāo)售額等。這類(lèi)工作的基本模式正如上面所說(shuō)一般是有一大堆數(shù)據(jù)需要處理,數(shù)據(jù)分析師需要從這堆數(shù)據(jù)里提煉些東西出來(lái)。這時(shí)候把數(shù)據(jù)完全交給算法是很困難的,因?yàn)楝F(xiàn)在的人工智能算法不太可能理解很復(fù)雜的目的性,于是就需要人與人工智能的結(jié)合,人設(shè)定方向,利用某種機(jī)器智能的算法來(lái)獲得結(jié)果,和目標(biāo)進(jìn)行匹配。有可能沒(méi)法一次到位,于是這一過(guò)程可能需要迭代多次,才能達(dá)到最終目的。
上面這類(lèi)人工智能系統(tǒng)的兩個(gè)核心部分是海量數(shù)據(jù)的分析能力以及一個(gè)與人交互的接口。與人交互的接口因?yàn)椴煌瑘?chǎng)景會(huì)有變化,沃森那類(lèi)系統(tǒng)需要的接口比較高級(jí),因?yàn)樾枰鎸?duì)完全沒(méi)有人工智能知識(shí)的人員,行業(yè)應(yīng)用的接口則需要比較低級(jí),甚至需要暴漏底層算法來(lái)給數(shù)據(jù)分析師做選擇。這種系統(tǒng)更可能在專(zhuān)業(yè)領(lǐng)域展開(kāi),比如律師對(duì)過(guò)往案例的查詢(xún)、醫(yī)生對(duì)X光片的分析,一旦這種系統(tǒng)在在一般用戶(hù)級(jí)別的展開(kāi),那體現(xiàn)形式就是Siri、小娜。
解決情感問(wèn)題
上述兩者的大綜合再加上擬人情感的部分才可能是斯皮爾伯格電影里演繹的那種人工智能,這種人工智能從自動(dòng)化方向繼承的是感知、學(xué)習(xí)和反應(yīng),從大數(shù)據(jù)繼承的是海量數(shù)據(jù)處理,額外再加上良好的人機(jī)交互、對(duì)人類(lèi)情感上的理解,最終就會(huì)形成一種伙伴型的機(jī)器人,這會(huì)是非常綜合的一種產(chǎn)品。有意思的是正因?yàn)檫@種綜合你不太好定位它到底適合干什么,不適合干什么。從功能上看這會(huì)是人類(lèi)完整的復(fù)制品,你能干的它都能干,包括寫(xiě)作、照看他人、幫你收拾屋子等等。
現(xiàn)實(shí)里人們一邊隱約感受到這方向的價(jià)值,一邊又不確切的知道具體可以用這東西來(lái)干什么,所以很多人都是在摸索前行,但技術(shù)的不成熟和剛需的不明朗確實(shí)注定了這個(gè)方向上的產(chǎn)品命運(yùn)必然坎坷,比如JIBO、Pepper、Rokid。
Pepper一發(fā)布我就感覺(jué)路數(shù)不對(duì),專(zhuān)門(mén)發(fā)了條微博調(diào)侃:
近來(lái)又看到有人報(bào)道老孫頭帶頭推的Pepper,這東西暫時(shí)肯定沒(méi)戲應(yīng)該是明顯的,為啥會(huì)做這個(gè)呢,不理解。
時(shí)隔半年之后,我專(zhuān)門(mén)到Y(jié)outube上看了下產(chǎn)品的現(xiàn)場(chǎng)感受以及評(píng)論,結(jié)果發(fā)現(xiàn)反饋里惡評(píng)如潮,現(xiàn)場(chǎng)的人們更多的是在感嘆:難しい。這詞咋一看是困難,但在那個(gè)語(yǔ)境里翻譯成“差點(diǎn)意思”更合適。視頻下方的評(píng)論中有一條最有意思:這產(chǎn)品充分的說(shuō)明了孫正義和喬布斯的差距啊。
小結(jié)
這篇文章寫(xiě)了人工智能的各種落地方向,沒(méi)覆蓋的是虛擬現(xiàn)實(shí)。虛擬現(xiàn)實(shí)的演化方向與上述所說(shuō)的完全不同,會(huì)更傾向于建立一個(gè)像黑客帝國(guó)電影里描述的那種虛擬空間,但要想非常真實(shí)的創(chuàng)建那樣一個(gè)世界,只是蒙住眼睛顯然是不夠的,在虛擬世界的完善過(guò)程中一樣會(huì)用到人工智能的技術(shù),大致如此。