提問:今天最開始在宣傳片里面,大家說現(xiàn)在這個技術(shù)是基于Android或者是Linux的,是我看錯了嗎?
景鯤:你可以這樣想,原來那些系統(tǒng)都是上一代的,是一個底層的系統(tǒng),并不是那么關(guān)心交互的。DuerOS其實(shí)是以用戶交互為驅(qū)動的一個操作系統(tǒng)。移動時代跟原來的PC有很多不一樣,AI技術(shù)跟原來的不一樣,AI的設(shè)備也很多樣。這種多樣的情況下,DuerOS要做的就是通過語音交互,把用戶統(tǒng)一在一起。雖然設(shè)備很不一樣,但是都用一個交互統(tǒng)一在一起。這是DuerOS要綁定的關(guān)系。其他的OS我把它看成是我們原來的系統(tǒng)適配層,適配到原來傳統(tǒng)的OS。但是DuerOS是一個語音交互的平臺,更上層一些。
提問:剛剛說到開發(fā)者,類似于DuerOS上面有100個Skills這種概念,這些Skills是開發(fā)者貢獻(xiàn)來的還是你們自己?
景鯤:我們有自己100個原生的?,F(xiàn)在有很多開發(fā)者,作為我們前期的嘗鮮者,他們在我們的平臺上搭建了100多個第三方的Skills。
提問:原生的是100個,還有100個開發(fā)者的?
景鯤:對,第三方的。
提問:我來自界面。跟廠商合作的時候,您了解到他們會比較看重哪些指標(biāo)?因?yàn)槲野l(fā)現(xiàn)有些廠商后來更換了百度的系統(tǒng),不知道有沒有什么具體的一些策略?要做一個設(shè)備的Android系統(tǒng),現(xiàn)在已經(jīng)到哪一步了,您覺得還差什么?
景鯤:設(shè)備廠商現(xiàn)在最關(guān)注聽懂和滿足,如果用原來的核心三要素:聽清、聽懂和滿足,現(xiàn)在設(shè)備廠商最關(guān)心聽懂和滿足。很多智能音箱可能覺得有點(diǎn)傻,交互不是那么自然,問它東西它不懂。所以現(xiàn)在這一塊是我們的合作伙伴最關(guān)心的。其實(shí)這一塊是老百姓最關(guān)心的。老百姓不關(guān)心你這三個模塊,老百姓最關(guān)心我隨便問你一句話,你真正能懂我,給我一個東西。所以聽懂和滿足,是所有合作廠商現(xiàn)在最關(guān)心的。
提問:都是技術(shù)層面是嗎?
景鯤:滿足有點(diǎn)像資源豐富度的層面,聽懂是技術(shù)層面,就是有大家Query能聽懂。我們最近做的渡鴉設(shè)備,它在聽懂層面上是遠(yuǎn)遠(yuǎn)超過其他競品的,所以我們把它定位為標(biāo)桿設(shè)備,或者是智能硬件設(shè)備。我覺得發(fā)展到現(xiàn)在,我們需要探索如何做一個最好的產(chǎn)品體驗(yàn)。現(xiàn)在大家都有點(diǎn)Follow美國Echo的路線,就是他們怎么做我們怎么做。我覺得我們要做世界級的DuerOS。人機(jī)交互在美國也是很初期的,尤其在中國的場景里面,中國的家庭環(huán)境比較小,美國是大房子,中國是小房子,我們都是一居室、兩居室、三居室的房間,什么樣的交互是好的交互,多快的交互是好的交互?這些需要很多的探索。今天下午發(fā)布的百度人工智能交互設(shè)計(jì)院會在12月份發(fā)布行業(yè)里面第一個很有價(jià)值的報(bào)告,就是智能音箱的交互多快是快,多快是好。像這些東西,大家如果不關(guān)注用戶體驗(yàn),都不會看到這種細(xì)節(jié),就會覺得現(xiàn)在Echo這個就是好,之前從媒體上我們都沒看到你們寫過智能音箱多快是好。
提問:1.5秒?
景鯤:我們現(xiàn)在基本上是1.25秒到1.4秒。現(xiàn)在講的極致的最好的是650毫秒。如果再快,在現(xiàn)在來講,用戶會覺得雖然你很智能,但有點(diǎn)搶話。就像這樣一個小問題,原來我們做搜索引擎的時候覺得越快越好,但是在這種新的人機(jī)交互上來講,你會發(fā)現(xiàn)有很多原來的認(rèn)知都會有變化。所以我覺得在細(xì)節(jié)上,已經(jīng)做了很多了。比如現(xiàn)在的智能音箱,你叫它一聲,現(xiàn)在有的不出聲,亮一個燈,有的音箱是你叫它一聲、它“叮”響一聲,有的音箱你叫它一聲,它回復(fù)“唉”,用人聲回復(fù)。我們發(fā)現(xiàn),你在不同的時間點(diǎn)按,用不同的交互都是好的。1.4秒以后用人聲會好一點(diǎn),人會覺得慢一點(diǎn),人反饋會好一點(diǎn)。1.4秒以內(nèi)用人聲回復(fù),就會增強(qiáng)那種搶話的感覺,這個時候用“叮”一聲更合適。這個聲音跟人聲是不一樣的,可能不用人聲回答。再往前,Alexa就是指示燈,沒有聲音,不同的時間用不同的交互。我們在這個方面花了很多的時間,探索怎么能夠讓產(chǎn)品體驗(yàn)最好。回答你剛才的問題,還是把用戶體驗(yàn)做對。把每個設(shè)備在每個場景里面的用戶體驗(yàn)做對,現(xiàn)在是最重要的。
主持人:謝謝各位媒體朋友,如果有什么問題的話可以隨時再聯(lián)系,感謝大家!