
思必馳首席科學(xué)家、聯(lián)合創(chuàng)始人俞凱
鈦媒體注:在7月15日鈦媒體和《商業(yè)價值》聯(lián)合主辦的 2016移動互聯(lián)網(wǎng)創(chuàng)新大會(MIIC) 上,思必馳首席科學(xué)家、聯(lián)合創(chuàng)始人俞凱以“人機交互中的認(rèn)知智能”為題進(jìn)行了演講。俞凱認(rèn)為,從PC互聯(lián)、手機無線網(wǎng)到現(xiàn)在物聯(lián)網(wǎng)時代,這三個階段中有兩個最大不同: 首先是信息數(shù)量的指數(shù)級增長;另外就是人機交互模式的變革。
到了物聯(lián)網(wǎng)時代,人機交互模式的主要特點就是通過語音進(jìn)行復(fù)雜的信息處理,這當(dāng)中最為依賴的技術(shù)就是 NLP(自然語言處理)與對話系統(tǒng),而對話系統(tǒng)又可分為三種技術(shù)類型:
1、問答式對話:提出問題后機器能夠告訴我答案,是告訴答案,不是告訴我各種可選擇的搜索結(jié)果,答案意味著要去篩選。
2、閑聊式對話:一個很典型的場景的就是iPhone用戶調(diào)戲Siri,這類往往沒有商業(yè)模式但是體現(xiàn)了某種機器智能。
3、任務(wù)型對話:第三類是任務(wù)性對話,真的幫助你完成任務(wù)。比如說訂一杯咖啡,是買星巴克還是其他家,通過任務(wù)型對話幫你完成任務(wù),這是對話技術(shù)最關(guān)鍵的部分。
思必馳這家公司最重要的特點是把對話交互技術(shù)作為核心組織各種各樣的語音智能,深耕垂直場景的語音交互技術(shù)。目前主要專注在智能車載、智能家居、智能機器人的解決方案。
但俞凱表示,思必馳這樣一類公司涉及到單純的語音界面,解決不到交互認(rèn)知的問題,要同時解決記憶、推理、建議以及相應(yīng)的一些決策的問題,一定要從人工智能和認(rèn)知計算的角度上解決問題。
俞凱強調(diào),語音交互與識別是兩種完全不同的概念,他表示:
“從交互平臺上講,不單單有感知,還要有認(rèn)知,這個就是所謂自然語言認(rèn)知交互的未來。把理解和決策表述這樣認(rèn)知技術(shù),與前端強大的識別技術(shù)結(jié)合在一起,進(jìn)行更多的搜索和數(shù)據(jù)處理,才能實現(xiàn)知識意義上更加自由的交互。”
以下是俞凱在2016移動互聯(lián)網(wǎng)創(chuàng)新大會(MIIC)上的演講全文,經(jīng)鈦媒編輯:
我既是一個從業(yè)者也是一個研究者,今天想和大家分享一點不同的東西。提到語音,絕大部分人的第一個反應(yīng)是語音識別,希望講完以后大家知道語音交互和識別是兩種不同的概念。
縱觀智能交互發(fā)展史,其實互聯(lián)網(wǎng)經(jīng)歷了三個階段:第一個是PC互聯(lián)網(wǎng),第二個是手機無線網(wǎng),第三個是硬件物聯(lián)網(wǎng),這三個階段有兩大不同的特點:
1、數(shù)量。手機數(shù)量是在十億這個級別,物聯(lián)網(wǎng)是百億級別,數(shù)量的增長對信息傳輸要求越來越高。
2、交互。屏幕越來越小,甚至到了智能硬件上屏幕都消失了,這使得人和機器交互的模式產(chǎn)生了天翻地覆的變化。
我這里大概列一下從80年代到目前人和機器進(jìn)行信息交互,我們整個一個發(fā)展歷程。
a.80年代的時候Windows32,不知道在座有多少人使用過,當(dāng)時的交互的界面用故意指示做組織存儲;
b.90年代出現(xiàn)了互聯(lián)網(wǎng)之后,我們主要的交互模式是通過網(wǎng)站的瀏覽來實現(xiàn)復(fù)雜信息的獲取;
c.2000年,谷歌和百度這一類搜索引擎的出現(xiàn),使得獲取信息的交互方式變成搜索的模式,這個時候我們模態(tài)都是鼠標(biāo)和鍵盤;
d.21世紀(jì)第一個十年,我們交互模式變了,變成可以用手機和智能硬件
這時候目標(biāo)不再是簡單的搜索,我估計現(xiàn)在幾乎沒有人直接在手機上用瀏覽器搜索,你們的目標(biāo)我搞一件事,這個手機直接辦成了,這個目標(biāo)是進(jìn)行信息本身的處理,既包括了信息的獲得,又包括了后端信息的處理。在這個過程當(dāng)中,很關(guān)鍵的一個模態(tài)就是所謂的交互。
物聯(lián)網(wǎng)時代的人機交互特點:交互
剛才說到在發(fā)展過程里面,人和機器交互的模式,如果想進(jìn)行復(fù)雜信息傳輸時候,到最后沒有屏幕,幾乎只能夠用語音,用語音是不是識別就夠了,曾經(jīng)有人暢想識別就夠了,這一撥人就是蘋果,讓我們看一下蘋果是怎么暢想的。
你們隊看到,機器是被動地執(zhí)行人類命令的助理,這個過程當(dāng)中很重要的一件事情是機器對人的任何命令都能準(zhǔn)確識別,然后可以和人進(jìn)行對話和相應(yīng)的交互,完成人的指令。
實際上在Iphone真正發(fā)展起來以后,它的觀點有所變化,2015年出了一件大事,這個時候我們就要回顧一下Iphone它的交互是什么樣子。