牛津計(jì)劃還包括哪些新的人工智能技術(shù)?
洪小文:牛津計(jì)劃是我們的一個(gè)系列或品牌,我們在今年推出一部分,到明年年初還會有更新的技術(shù)。這些技術(shù)主要包括:
語音識別。語音的應(yīng)用范圍很廣,包括物聯(lián)網(wǎng)等。目前不僅微軟的平臺,像中國也有很多公司做自己的語音技術(shù)平臺等等。
語言理解智能服務(wù)(LUIS)。這里面主要是自然語言處理技術(shù),比如我們的微軟學(xué)術(shù)搜索就實(shí)現(xiàn)了從關(guān)鍵詞搜索到自然語言搜索的技術(shù)飛躍,還沒有輸入完搜索內(nèi)容機(jī)器就可以猜測出你想要搜索的內(nèi)容。同時(shí),該服務(wù)還可以對知識按照不同領(lǐng)域和范圍進(jìn)行分類。例如,有開發(fā)人員想要做一個(gè)自然語言搜索的應(yīng)用,那么他可以通過利用牛津所提供的自然語言API來實(shí)施。
圖像(計(jì)算機(jī)視覺和人臉識別)。該技術(shù)可以幫助用戶在上千個(gè)物種當(dāng)中搜索到既定目標(biāo),比如說在必應(yīng)上面進(jìn)行圖片搜索,可以找到十億以上或百億以上數(shù)量級的資源。
此外,還有可視化技術(shù)(visualization)。也就是做大數(shù)據(jù)分析,我們通過表格把數(shù)據(jù)可視化,這些都是智能云里面非常重要的項(xiàng)目。微軟最近的產(chǎn)品不僅僅代表了研究院的技術(shù),也預(yù)示著更加深入和廣闊的發(fā)展前景。我們現(xiàn)在推出的產(chǎn)品只是一部分,未來可以做的東西還非常多。
過去一年人工智能的進(jìn)展有沒有讓您感覺到很興奮的?
洪小文:業(yè)界、學(xué)術(shù)界的許多人在談人工智能、機(jī)器學(xué)習(xí)或大數(shù)據(jù),我認(rèn)為在很大程度上這三樣是一件事。因?yàn)槿斯ぶ悄苡泻芏嗖煌念I(lǐng)域,但是今天的人工智能百分之八九十是收集數(shù)據(jù)之后去進(jìn)行機(jī)器學(xué)習(xí)。
可以說我們?nèi)祟愇拿鞯倪M(jìn)展都是大數(shù)據(jù)。先從科學(xué)的角度來看待這個(gè)問題。當(dāng)代的科學(xué)之父伽利略通過觀察發(fā)現(xiàn)運(yùn)動(dòng)跟物質(zhì)的大小無關(guān),發(fā)現(xiàn)地球不是宇宙的中心,可能是太陽。這樣的結(jié)論在當(dāng)時(shí)受到了很多人的挑戰(zhàn)。
這就叫大數(shù)據(jù),有了移動(dòng)互聯(lián)網(wǎng)之后,大數(shù)據(jù)飛速發(fā)展。有了互聯(lián)網(wǎng),內(nèi)容就變成數(shù)字化,利用移動(dòng)互聯(lián)網(wǎng),可以很快地讓用戶幫我們做實(shí)驗(yàn)。比如新一代互聯(lián)網(wǎng)創(chuàng)新就是把一個(gè)想法先讓用戶體驗(yàn)來看用戶的反饋,根據(jù)反饋確定修改的方向,再來改進(jìn)??茖W(xué)家、互聯(lián)網(wǎng)公司、任何人都可以通過這種方法達(dá)到最優(yōu)的狀態(tài)。人工智能、機(jī)器學(xué)習(xí)都是這種運(yùn)作的方式。我們做實(shí)驗(yàn)或做產(chǎn)品,會有一個(gè)假設(shè),我們會收集資料、數(shù)據(jù)來驗(yàn)證假設(shè)。收集資料之后發(fā)現(xiàn)假設(shè)需要修改,或發(fā)現(xiàn)需要再做一個(gè)實(shí)驗(yàn),或要修改實(shí)驗(yàn)部分的內(nèi)容再循環(huán)一次。這是一種閉環(huán)反饋或者試錯(cuò)?,F(xiàn)在很多電視劇,也是每天寫劇本,根據(jù)觀眾的反應(yīng)再進(jìn)行修改。許多過程都是這樣的循環(huán),通過每一個(gè)循環(huán)可以慢慢進(jìn)步。農(nóng)業(yè)、工業(yè)也是這樣。
這就造就了數(shù)據(jù)為王的時(shí)代,反饋回路越快到達(dá),就相當(dāng)于可以在相同時(shí)間里做更多的實(shí)驗(yàn),也就可以取得勝利。以前很多人要一年、十年或一個(gè)世紀(jì)才能得到反饋,現(xiàn)在可以得到反饋很快地去改善,可以預(yù)見未來會更快。現(xiàn)在有一個(gè)新的稱呼是數(shù)據(jù)科學(xué)家(Data Scientist),每天通過看大量數(shù)據(jù),看用戶反愧脈動(dòng)等等,包括市場調(diào)查等,利用數(shù)據(jù)去解決問題。
在這個(gè)過程中,如何能夠不遺漏數(shù)據(jù),讓數(shù)據(jù)為我所用,微軟投入了許多心血。不僅是對人工智能、機(jī)器學(xué)習(xí)、大數(shù)據(jù),包括里面?zhèn)鹘y(tǒng)的數(shù)據(jù)庫、系統(tǒng)、網(wǎng)絡(luò)上都使用了大數(shù)據(jù)技術(shù)。其中,速度很重要。大數(shù)據(jù)的搜集是一方面,數(shù)據(jù)處理的速度如果沒有,那數(shù)據(jù)就沒有意義。
更深入一點(diǎn)是跟技術(shù)有關(guān)的。比如一個(gè)人博學(xué)多聞,意思是這個(gè)人知道很多數(shù)據(jù)、很聰明。但是另外一方面,有時(shí)他因?yàn)樾畔⒉粔蚨y以決定,這并不代表這個(gè)人很笨。更何況許多事情牽涉到商業(yè)機(jī)密、國家機(jī)密或個(gè)人隱私,正常人是沒有辦法知道的?;氐饺斯ぶ值膯栴},我的人工助手知道我喜歡坐哪班飛機(jī)、坐哪個(gè)位置,如果突然換一個(gè)人工助手可能就不知道我的偏好了,因?yàn)樗€沒收集到我的數(shù)據(jù)。因此我認(rèn)為憑借數(shù)據(jù)量的大小來判斷一個(gè)機(jī)器是否智能是值得商榷的。
講到人工智能,一般人工智能是做算法,但是信息多了之后的確是會比較聰明。我認(rèn)為未來一個(gè)大的方向,是如何通過機(jī)器和人的結(jié)合使得人類變成「超人」。因?yàn)槿松朴谒伎迹侨藭?,?jì)算有時(shí)也可能算錯(cuò),可能看不清所有的東西,但是機(jī)器可以,機(jī)器看東西可以通過掃描,但是要用人的算法去提取知識。假設(shè),我是做證券交易的,我希望看到今天所有公司與股票有關(guān)的數(shù)據(jù)。機(jī)器可以掃描比人眼看到更多的數(shù)據(jù),但是掃描之后還是識別不出漲跌,就需要用到人類的算法。人類如果能夠和機(jī)器結(jié)合,就可以做出最好的證券交易或推薦。這就是未來的兵家必爭之地。