編者按:在今年微軟Build大會(huì)上,兩歲的小娜(Cortana)成為亮點(diǎn)。微軟CEO薩提亞·納德拉圍繞著人工智能方面發(fā)布了一些交互式的方法,想要通過(guò)小娜打造一個(gè)聊天式的人工智能交互界面,并成為微軟的一個(gè)長(zhǎng)期目標(biāo)。近日,微軟小娜全球負(fù)責(zé)人Mike Calcagno來(lái)華,并接受科技的采訪,詳細(xì)闡述了小娜的發(fā)展規(guī)劃。
文/小羿
智能語(yǔ)音助手雖然是一個(gè)不太新鮮的話題了,但卻在最近得到了國(guó)外互聯(lián)網(wǎng)巨頭得到了相當(dāng)程度的重視。讓我么先來(lái)回顧下巨頭們的布局歷史。2011年10月,蘋(píng)果語(yǔ)音助手Siri隨iPhone4s一起推出。2012年6月,谷歌也發(fā)布了語(yǔ)音助手Google Now,整合了旗下搜索功能。2014年4月,微軟也推出了自行研發(fā)的語(yǔ)音助理小娜(Cortana)。2016年3月,微軟推出面向Twitter等社交平臺(tái)的聊天機(jī)器人Tay,但因?yàn)槿枇R用戶遭到下架。而在2016年4月份,F(xiàn)acebook也宣布推出聊天機(jī)器人Messenger Platform,希望建立一個(gè)對(duì)話式的系統(tǒng),實(shí)現(xiàn)訂餐、下單、獲取資訊等各種各樣的服務(wù)。
可以看出,語(yǔ)音助手正在向著聊天機(jī)器人演化。未來(lái)這些語(yǔ)音服務(wù)系統(tǒng)將不僅僅是識(shí)別、搜索和提醒的功能,更多的將是基于聊天的服務(wù)系統(tǒng)。這也是微軟和Facebook力推聊天機(jī)器人的最重要原因。試想一下,如果人們都開(kāi)始用聊天機(jī)器人而非應(yīng)用,蘋(píng)果App Store和谷歌Google Play將會(huì)失去它在移動(dòng)生態(tài)系統(tǒng)中的中心位置。也就說(shuō)聊天機(jī)器人將可能會(huì)顛覆iOS和Android兩大手機(jī)操作系統(tǒng)的中心邏輯,對(duì)于在移動(dòng)生態(tài)系統(tǒng)中沒(méi)有話語(yǔ)權(quán)兩家巨頭微軟和Facebook必然是大力發(fā)展聊天機(jī)器人產(chǎn)品。
但是,與Facebook CEO扎克伯格將聊天機(jī)器人定位于企業(yè)互動(dòng)和購(gòu)物的新方式不同,微軟不僅讓小娜面向Android用戶開(kāi)放,而且提供跨越多款設(shè)備的通知提醒功能,例如支持用戶在計(jì)算機(jī)上發(fā)送短信。小娜甚至還能根據(jù)一天中的不同時(shí)間提供建議,比如向你提供訂餐信息,或是幫你安排一輛出租車(chē),這或許會(huì)帶來(lái)未來(lái)計(jì)算機(jī)交互領(lǐng)域的重大變革。
在微軟Build大會(huì)上,小娜在微軟中的戰(zhàn)略地位得到無(wú)限提升。那么,微軟小娜將如何發(fā)展?在開(kāi)放給第三方開(kāi)發(fā)者之后,小娜是否能用聊天對(duì)話式的服務(wù)顛覆目前的移動(dòng)生態(tài)系統(tǒng)呢?
以下為采訪實(shí)錄(經(jīng)科技整理):
聊天對(duì)話是最自然的交互方式
記者:在Build上,微軟也提出自然交互式對(duì)話,那么微軟內(nèi)部是如何規(guī)劃的,什么時(shí)候開(kāi)始做這件事情?
Mike Calcagno (以下簡(jiǎn)稱(chēng)Mike,微軟小娜全球項(xiàng)目負(fù)責(zé)人):實(shí)際上,微軟在交互式對(duì)話上,已經(jīng)投入了很多年的研究了,超過(guò)幾十年。最近的深度學(xué)習(xí),因?yàn)樯疃葘W(xué)習(xí)能力和計(jì)算機(jī)的計(jì)算能力讓這個(gè)研發(fā)更加的提速,這個(gè)產(chǎn)品里面,我們可以很得到,微軟的產(chǎn)品像Cortana,通過(guò)這種一定程度的自然交互,完成一些任務(wù)。另外,微軟自己的產(chǎn)品,像小冰,他完全是基于對(duì)話式的系統(tǒng),我們這兩個(gè)產(chǎn)品在不斷的研發(fā)往前發(fā)展的過(guò)程中,我們也是不斷的學(xué)習(xí)。對(duì)話式交互的技術(shù),是非常有挑戰(zhàn)性的,最近的Facebook,也提出了一個(gè)機(jī)器人的平臺(tái),為他的信息,這里面你也可以看到有好多各種各樣的問(wèn)題,不是說(shuō)你很多東西能夠一蹴而就,是需要很多年的研發(fā)的積累,我們希望微軟在這些年以來(lái),長(zhǎng)期的在技術(shù)的積累,從我們的研發(fā),到產(chǎn)品開(kāi)發(fā),能夠讓我們微軟在這個(gè)領(lǐng)域處于一個(gè)領(lǐng)先的地位。
記者:Mike提到了Facebook的計(jì)劃,微軟和Facebook看到的關(guān)于聊天作為UI的事情愿景是一樣的,有什么區(qū)別?
Mike:是很難猜測(cè),我們并不知道Facebook的愿景到底是什么,F(xiàn)acebook本身一直在強(qiáng)調(diào),希望能夠把在地球上的所有人,都連接在一起,在網(wǎng)絡(luò)上。對(duì)話式交互,能夠讓人很容易的去跟設(shè)備和應(yīng)用場(chǎng)景去服務(wù),作為一個(gè)交流,達(dá)到一個(gè)目的。
記者:我看到彭博上面有一篇文章介紹到Cortana的對(duì)話作為UI的方式,是從微信上獲得了一些靈感,可以講一下方面的事情嗎?