上周五,微軟為它的人工智能機(jī)器人“小冰”舉行了一場(chǎng)成人禮。
從2014年5月29日發(fā)布以來(lái),“小冰”已經(jīng)更新到了第四代,年紀(jì)也從16歲長(zhǎng)到了18歲。過(guò)去兩年多時(shí)間里,小冰在微信、微博、美圖等平臺(tái)上積累了上千萬(wàn)的用戶,對(duì)話量超過(guò)了200億條。
在相互的對(duì)話過(guò)程中,她也表現(xiàn)得越來(lái)越像一個(gè)正常人。比如她可以識(shí)別你發(fā)給她的圖片,能在文字和語(yǔ)音之間進(jìn)行切換,能夠采用某種“策略”把你帶出消極情緒,甚至,可以跟你打電話。
“小冰”已經(jīng)成為了微軟在人工智能領(lǐng)域的一個(gè)戰(zhàn)略級(jí)產(chǎn)品,而作為這個(gè)項(xiàng)目的領(lǐng)導(dǎo)者之一,微軟全球執(zhí)行副總裁陸奇也從美國(guó)飛到了北京。在發(fā)布會(huì)結(jié)束之后,他跟我們聊起了小冰、微軟的人工智能戰(zhàn)略,還有如何在過(guò)去幾年進(jìn)行產(chǎn)品和業(yè)務(wù)轉(zhuǎn)型升級(jí)。
陸奇認(rèn)為,人工智能最終將表現(xiàn)在“對(duì)話”這個(gè)核心的訴求點(diǎn)上。當(dāng)人工智能可以向電影《她》中那樣與人類自然對(duì)話,與人類產(chǎn)生情感聯(lián)系,那么將給整個(gè)社會(huì)帶來(lái)巨在的變化。而微軟小冰已經(jīng)在這條路上走了兩年多。
陸奇在進(jìn)入微軟之前,很長(zhǎng)一段時(shí)間就職于雅虎。當(dāng)被問(wèn)到微軟這個(gè)巨人應(yīng)該如何轉(zhuǎn)身,而避免雅虎的悲劇時(shí),他覺(jué)得兩個(gè)公司面臨的情況并不太相同。雅虎的門戶已經(jīng)被搜索引擎和社交網(wǎng)絡(luò)取代,而微軟在借助云計(jì)算技術(shù)之后,把原有的產(chǎn)品重新推向了一個(gè)更為廣闊的市常
以下是采訪實(shí)錄。
關(guān)于微軟小冰
問(wèn):小冰一個(gè)很大的特色是它的情感計(jì)算框架。但是人類的情感是很復(fù)雜的,包括積極的情感、消極的情感。從目前現(xiàn)看,小冰基本上表現(xiàn)的都是積極的情感,與人平等的對(duì)話可能會(huì)涉及消極的表達(dá),小冰在這方面會(huì)有學(xué)習(xí)嗎?
陸奇:按照我們?nèi)斯ぶ悄?、大?shù)據(jù)和機(jī)器學(xué)習(xí)技術(shù),人的情感只要有數(shù)字化的介入,行為的規(guī)范基本上是可以學(xué)出來(lái)的。微軟想要建立人工智能是代表正能量的,是為人類服務(wù),幫助人類的。所以在這種情況下,我們想要建立的對(duì)話,采用的策略,基本上引導(dǎo)人類從他的消極或者負(fù)面環(huán)境(中走出來(lái))。
問(wèn):小冰已經(jīng)可以做到和人類打電話了。但人和機(jī)器之間文字的交流,實(shí)時(shí)的講話,實(shí)時(shí)的了解人的語(yǔ)境,進(jìn)行語(yǔ)音的反饋,這方面是挺難的吧?
陸奇:從某種意義上來(lái)講,我們?yōu)槿斯ぶ悄芩a(chǎn)生的對(duì)話能力,提出了一個(gè)新的標(biāo)準(zhǔn),如何在實(shí)時(shí)性方向,非常智能的,就像人與人之間交流,確實(shí)技術(shù)上有很大的問(wèn)題。
我們首先要聽(tīng)得懂,語(yǔ)音識(shí)別要非常清楚,速度得非常非???;第二,交互的能力非常廣,但是如何把這些技術(shù),有難度的核心技術(shù)提高到一定的層次,把它集合起來(lái),使整個(gè)的用戶體驗(yàn),真的像人與人之間智能交互,這是非常重要的。
剛才有一位女士上去試了一下,小冰可能今天沒(méi)法測(cè)試說(shuō)今天給我打電話的是個(gè)男的還是女的,有很多事情要解決。
問(wèn):為什么要賦予小冰這樣一種實(shí)時(shí)對(duì)話的能力?
陸奇:人類跟任何種類不一樣的地方,我們發(fā)明了語(yǔ)言,人與人之間近距離的交換,后來(lái)有了電話以后,可以遠(yuǎn)距離的交換,就是實(shí)時(shí)的交換,不光把人類進(jìn)化,而且產(chǎn)生人類知識(shí),人生整個(gè)演進(jìn)過(guò)程中起了非常大的作用,人工智能會(huì)成為新的人與人之間交流的基準(zhǔn)橋梁。
其實(shí)是蠻振奮人心的,雖然我們沒(méi)有完全把技術(shù)問(wèn)題解決,但是我們至少定義了這是一個(gè)新的里程碑,將來(lái)不管是機(jī)器人也好,它是一個(gè)自然的交流形式,完全可以連續(xù)實(shí)時(shí)的、可以不斷的,毫無(wú)保留的講。
問(wèn):我們離這個(gè)理想的自然交流狀態(tài)有多遠(yuǎn)?
陸奇:根據(jù)我們現(xiàn)在的深度學(xué)習(xí)技術(shù),只是一個(gè)時(shí)間問(wèn)題。把數(shù)據(jù)輸進(jìn)去,不斷地去訓(xùn)練,在2009年之前,錯(cuò)誤率接近30%,這么幾年已經(jīng)從30%降到8%,可以預(yù)測(cè)再過(guò)一兩年,就差不多1.5%左右,這也是我們技術(shù)上可以解決的。