5月13日消息,《連線》網(wǎng)站撰文稱(chēng),數(shù)字助手的聲音聽(tīng)上去很像是人類(lèi),就是好事情嗎?那的確可能會(huì)使得人們更想要使用它,但也可能會(huì)帶來(lái)意想不到的影響:助手的功能變?nèi)?,變得沒(méi)那么有用。這提出了一個(gè)重要的問(wèn)題:人們究竟想要從虛擬助手那里得到什么呢?
以下是文章主要內(nèi)容:
向Alexa詢(xún)問(wèn)天氣狀況,它會(huì)用愉快的音調(diào)告訴你天氣晴朗。讓它給你講個(gè)笑話,它就會(huì)用它標(biāo)志性的斷奏給你講個(gè)雙關(guān)笑話。叫它唱首歌,它就會(huì)唱出自動(dòng)調(diào)諧的民謠。亞馬遜的虛擬助手擁有著各種各樣像人類(lèi)的機(jī)靈功能——但它的聲音出賣(mài)了它:Alexa還只是個(gè)機(jī)器人。
為了幫助Alexa擺脫機(jī)器人口音,亞馬遜最近升級(jí)了它的語(yǔ)音合成標(biāo)記語(yǔ)言標(biāo)簽,讓開(kāi)發(fā)者能夠用來(lái)給Alexa的技能或者應(yīng)用編造出更加自然的語(yǔ)音模式。那些新標(biāo)簽可讓Alexa做各種口頭活動(dòng),如低聲說(shuō)話,停頓,爆出咒罵的話,調(diào)整語(yǔ)音的速度、音量、語(yǔ)氣強(qiáng)調(diào)和音高。這意味著Alexa和其它的數(shù)字助手可能不久之后就會(huì)聽(tīng)上去不那么像是機(jī)器人,而更像是人類(lèi)。但在這兩個(gè)極端之間取得良好的平衡對(duì)于語(yǔ)音交互設(shè)計(jì)師而言仍是一大挑戰(zhàn),且提出了人們真正想要從語(yǔ)音助手那里得到什么的重要問(wèn)題。
讓表達(dá)更加細(xì)致入微
先進(jìn)的語(yǔ)言標(biāo)簽之于計(jì)算機(jī)生成的語(yǔ)音的作用,就像是標(biāo)點(diǎn)符號(hào)和表情符號(hào)之于文本通訊的作用:增加信息的帶寬。簡(jiǎn)單的標(biāo)記語(yǔ)言可讓語(yǔ)音助手區(qū)分1996和1,996,或者區(qū)分相同發(fā)音的單詞不同的用法。先進(jìn)的標(biāo)簽可讓它們傳達(dá)比以往多得多的信息。你知道你是如何看待“聽(tīng)起來(lái)不錯(cuò)”短信和帶表情符號(hào)的“聽(tīng)起來(lái)不錯(cuò)”短信之間的差異的嗎?發(fā)出抑揚(yáng)之聲的能力也將讓數(shù)字助手能夠做出細(xì)致入微的表達(dá)。
更加細(xì)致的助手可能會(huì)更有幫助。俄亥俄州立大學(xué)語(yǔ)音心理學(xué)家勞拉·瓦格納(Laura Wagner)表示,“聲音的音樂(lè)要素有助于你形成一種期待。”語(yǔ)音的抑揚(yáng)可帶來(lái)更加高效的描述,減少歧義性。它還有望給Alexa帶來(lái)相對(duì)于來(lái)自蘋(píng)果和谷歌的數(shù)字助手的情感優(yōu)勢(shì)。“如果它聽(tīng)上去像人的話,我們會(huì)很喜歡它。”瓦格納說(shuō)道。有證據(jù)顯示,人們對(duì)于能夠“隨即地進(jìn)行互動(dòng)”(即能夠跟另一個(gè)人進(jìn)行響應(yīng)式的來(lái)回交談)的物體有更強(qiáng)的連接。“Alexa聽(tīng)上去越像人,我就越想要信任她,越想要使用她。”瓦格納說(shuō)。
當(dāng)然,那也解釋了為什么亞馬遜想要讓Alexa聽(tīng)上去盡可能地像是人類(lèi)。
功能或弱化
不過(guò),亞馬遜也面臨著讓Alexa聽(tīng)上去太像人的風(fēng)險(xiǎn)。2月,該公司發(fā)布了“speechcon”——數(shù)十個(gè)Alexa能夠更加準(zhǔn)確地發(fā)音的感嘆詞,如argh(哎?。?、cheerio(好呀)和d’oh。亞馬遜想要給它的虛擬助手加上一層個(gè)性,但像那樣的怪異模式會(huì)讓Alexa變得沒(méi)那么有用。
卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)家阿蘭·布萊克(Alan Black)表示,“如果Alexa開(kāi)始說(shuō)出諸如‘hmm’和‘well’的話時(shí),你會(huì)不自覺(jué)地跟著她那么說(shuō)話。”布萊克在1990年代幫助開(kāi)辟了語(yǔ)音合成標(biāo)記標(biāo)簽的應(yīng)用。人往往會(huì)不自覺(jué)地模仿對(duì)話者的會(huì)話風(fēng)格;讓數(shù)字助手的說(shuō)話方式變得太隨便的話,人們也會(huì)跟著那么說(shuō)話。“這樣的代價(jià)就是,數(shù)字助手可能會(huì)聽(tīng)不出用戶(hù)在說(shuō)些什么。”布萊克說(shuō)。
以功能弱化為代價(jià)來(lái)改進(jìn)語(yǔ)音助手的個(gè)性,是越來(lái)越多的用戶(hù)界面設(shè)計(jì)師們將要解決的一個(gè)折中問(wèn)題。舊金山設(shè)計(jì)咨詢(xún)公司Fjord的聊天機(jī)器人設(shè)計(jì)師約翰·瓊斯(John Jones)說(shuō)道,“我們是想要說(shuō)話的個(gè)性,還是想要給予我們信息的實(shí)用功能?我想很多情況下我們都會(huì)更想要可給給予我們信息的實(shí)用功能。”僅僅因?yàn)锳lexa能夠說(shuō)出俗語(yǔ)和流行文化用語(yǔ)來(lái),并不意味著它應(yīng)該那么做。有時(shí)候你只希望它能夠帶來(lái)效用。數(shù)字助手應(yīng)當(dāng)用簡(jiǎn)短的回復(fù)來(lái)回應(yīng)直接的指令,又或許直接沉默不語(yǔ)——而不是發(fā)出“booyah”(一種喜悅的叫法)的聲音。(亞馬遜添加的另一個(gè)speechcon。)