微軟二十一世紀(jì)的計(jì)算大會(huì)期間,機(jī)器之心對(duì)微軟全球資深副總裁、微軟亞太研發(fā)集團(tuán)主席兼微軟亞洲研究院院長(zhǎng)洪小文進(jìn)行了專訪,洪小文博士對(duì)微軟的人工智能產(chǎn)品和服務(wù)進(jìn)行了詳細(xì)介紹,也對(duì)人工智能的定義、發(fā)展以及目前的難點(diǎn)做了深度分析。
小冰和Cortana在微軟的定位是怎樣?
洪小文:我自己就是做語音研究的,對(duì)基礎(chǔ)研究和相關(guān)服務(wù)做了二三十年。但是最近這五年技術(shù)成熟到一定程度,我們真的可以讓語音和人工智能實(shí)現(xiàn)個(gè)性化服務(wù),成為我們工作、生活當(dāng)中的人工助手。小娜是這樣發(fā)展起來的,后來過了幾年開始做小冰。
小娜和小冰的區(qū)別在于,小娜跟人的真正助手一樣,知道你的很多需求并提供服務(wù),包括訂會(huì)議室和機(jī)票、提供天氣信息和新聞等。所以,可以把小娜視為能夠幫你提高生產(chǎn)力的助手。但另外一方面,即使是機(jī)器人,人有時(shí)也希望它有人性的一面,例如你和它聊天,像和朋友一起聊天一樣。聊天是一種社交,大部分都是沒有目的性的,這就是小冰的作用。小娜適合于做有目的的事情,小冰則是可以漫無目的聊天的伙伴。
小冰和小娜還有很多交叉點(diǎn),因?yàn)榇蟛糠謺r(shí)候的正式談話和非正式聊天是可以交叉在一起的。比如說,和小娜聊天主要是為了實(shí)現(xiàn)一些目標(biāo),偶爾加一些非正式聊天。和小冰談話是從聊天開始,最后可以談一些正式的事情。在京東平臺(tái)上就出現(xiàn)了商戶從純粹聊天轉(zhuǎn)向咨詢數(shù)碼相機(jī)之類信息的案例?;趯?duì)小冰等機(jī)器人朋友的信賴,用戶更容易在了解了產(chǎn)品的特性之后進(jìn)行購(gòu)買。
站在科學(xué)的角度,我個(gè)人認(rèn)為小冰能夠發(fā)展到今天是很讓人興奮的?,F(xiàn)在每期會(huì)話(交互)次數(shù)達(dá)到了二十三。如果就圖靈設(shè)定的測(cè)試標(biāo)準(zhǔn)來看,小冰已經(jīng)達(dá)到甚至超過了規(guī)定的標(biāo)準(zhǔn),但是這并非意味著小冰能夠完全替代人類的聊天功能。
除了大家很熟悉的小冰和小娜,微軟還有哪些和人工智能相關(guān)的產(chǎn)品?
洪小文:因?yàn)橛?jì)算機(jī)和移動(dòng)互聯(lián)網(wǎng)的普及,特別是人工智能的發(fā)展,用戶所想用的東西會(huì)變成一種隱形的、無所不在的東西。隱形的另外一層意思是無縫,今天你用的可能是手機(jī),也可能是云服務(wù),同時(shí)有物聯(lián)網(wǎng)和攝像頭等。對(duì)于用戶而言,他們并不需要知道人工智能是發(fā)生在云端還是手機(jī)端。事實(shí)上,現(xiàn)在的人工智能或自然人機(jī)界面只需要用語音和面部表情就能完成,這就是一種隱形的創(chuàng)新。
我知道很多讀者對(duì)技術(shù)感興趣,而大多數(shù)讀者需要的是最直接和可用的技術(shù)。這里面包括了大家看到的小冰和小娜,而在背后包含的有計(jì)算機(jī)圖像識(shí)別、語音識(shí)別、自然語言處理、社交網(wǎng)絡(luò)情感計(jì)算等等技術(shù)。
微軟的產(chǎn)品很多元化,像今年推出的Windows10,在短短兩個(gè)月時(shí)間已經(jīng)積累超過1.1億臺(tái)設(shè)備升級(jí)到了Windows10。Windows基本要求是操作系統(tǒng)更安全、更穩(wěn)定、更快。如果大家使用Windows10就可以發(fā)現(xiàn),以前的系統(tǒng)每一個(gè)進(jìn)化版本都需要更多的內(nèi)存,但是如今Windows10比Windows8所需要的機(jī)器內(nèi)存容量更少。
Windows10中的小冰和小娜代表了新的技術(shù),Windows10已經(jīng)發(fā)展為聽你說出指令并且做出反應(yīng)。譬如我們可以通過說「小冰」發(fā)出讓機(jī)器人運(yùn)轉(zhuǎn)的指令。同時(shí),我們還在做「Speaker ID」,就是計(jì)算機(jī)需要對(duì)用戶的說話聲音和內(nèi)容進(jìn)行辨認(rèn),而這樣的功能都是不為用戶熟知的(是隱性的)。
還有跟生物信息有關(guān)的技術(shù),比如人臉識(shí)別、指紋識(shí)別、瞳孔識(shí)別和虹膜識(shí)別等,我們可以在很暗的光線下使用紅外線技術(shù)進(jìn)行人臉識(shí)別,我們把這些都加入到Windows和其他應(yīng)用服務(wù)當(dāng)中。在10月披露的微軟財(cái)報(bào)當(dāng)中,智能云(intelligent cloud)是一大亮點(diǎn),包括像今年推出的牛津計(jì)劃(Project Oxford)和前段時(shí)間出現(xiàn)的How Old.net等。我們一開始推出How Old只是進(jìn)行技術(shù)展示,但是現(xiàn)在變得很流行,應(yīng)用范圍更廣,比如我們可以實(shí)現(xiàn)對(duì)上百人規(guī)模的公司進(jìn)行人臉識(shí)別。我們也把一款名為Windows Hello的生物信息技術(shù)搬到了智能云。在將來,大家可以看到更多智能云的應(yīng)用,而傳統(tǒng)Windows應(yīng)用軟件開發(fā)商也會(huì)利用我們的技術(shù)來改進(jìn)他們的系統(tǒng)。