因?yàn)閬嗰R遜缺乏人才,它利用自己雄厚的財(cái)力來(lái)收購(gòu)有技術(shù)專長(zhǎng)的公司。林普說(shuō):“在開發(fā)Alexa的早期,我們收購(gòu)了很多公司。”2011年9月,亞馬遜收購(gòu)了Yap公司,這是一家語(yǔ)音文本公司,在將口語(yǔ)轉(zhuǎn)化為書面語(yǔ)言方面很出色。2012年1月,亞馬遜收購(gòu)了英國(guó)劍橋的Evi公司,該公司的軟件可以像Siri那樣響應(yīng)語(yǔ)音請(qǐng)求。2013年1月,亞馬遜收購(gòu)了一家專門從事文本轉(zhuǎn)為語(yǔ)音業(yè)務(wù)的波蘭公司Ivona,該公司提供的技術(shù)讓Echo擁有對(duì)話能力。
但是亞馬遜的保密文化阻礙了它吸引學(xué)術(shù)界頂尖人才的努力。它的其中一個(gè)潛在招募對(duì)象是亞歷克斯。斯莫拉,他是這個(gè)領(lǐng)域的超級(jí)大碗,曾在雅虎和谷歌工作過(guò)。亞馬遜網(wǎng)絡(luò)服務(wù)公司的深度學(xué)習(xí)和人工智能的總經(jīng)理馬特。伍德說(shuō):“他確實(shí)是深度學(xué)習(xí)領(lǐng)域的教父之一。”(谷歌學(xué)術(shù)上斯莫拉的學(xué)術(shù)文章的引用超過(guò)9萬(wàn)次。)亞馬遜的高管們甚至不會(huì)向他或其他候選人透露他們將來(lái)的工作計(jì)劃。斯莫拉拒絕了這個(gè)工作邀請(qǐng),選擇在卡內(nèi)基梅隆大學(xué)負(fù)責(zé)建立一個(gè)實(shí)驗(yàn)室。
Alexa的總監(jiān)Ruhi Sarikaya和Alexa引擎的副總裁艾爾·林賽,他們不僅創(chuàng)建了智能音箱產(chǎn)品線Echo,還致力于為其他公司的產(chǎn)品提供語(yǔ)音服務(wù)。
林賽說(shuō):“在我們發(fā)布產(chǎn)品之前,一直都有不看好的聲音。他們會(huì)說(shuō),‘我為什么要去亞馬遜工作,我對(duì)售賣產(chǎn)品的工作不感興趣!’”
但亞馬遜在一個(gè)方面確實(shí)有吸引力。因?yàn)閬嗰R遜一直都喜歡先預(yù)想好最終產(chǎn)品的樣子再進(jìn)行開發(fā)研究的工作習(xí)慣,很多時(shí)候這些初步設(shè)計(jì)稿里面有很多目前技術(shù)尚未解決的問題。這些困難的問題對(duì)于一些有野心的科學(xué)家來(lái)說(shuō)具有的致命吸引力。特別是想要在語(yǔ)音方面,要有一種對(duì)話式的人工智能技術(shù),比如具備喚醒詞(“嗨,Alexa!”),能夠識(shí)別并理解命令,提供合理的答案等等,這些技術(shù)在當(dāng)時(shí)都還不存在。
即使亞馬遜沒有公布太多這個(gè)項(xiàng)目的開發(fā)細(xì)節(jié),也引起了羅希特。普拉薩德的興趣,他是一位受人尊敬的語(yǔ)音識(shí)別科學(xué)家,在波士頓一家名為Raytheon BBN的科技公司就職。(亞馬遜讓他在自己的家鄉(xiāng)建立了一個(gè)團(tuán)隊(duì),這對(duì)于吸引他來(lái)亞馬遜就職有所幫助。)他認(rèn)為亞馬遜缺乏專業(yè)知識(shí)是它的一個(gè)特征,而不是缺陷。他說(shuō):"這里是一塊尚待開拓的土地。谷歌和微軟多年來(lái)一直致力于語(yǔ)音技術(shù)的研究。 在亞馬遜,我們可以白手起家,解決難題。“2013年,他入職亞馬遜后便直接加入了Alexa的項(xiàng)目。他表示:”這款設(shè)備目前只在硬件階段可行,想要搭載語(yǔ)音技術(shù)還為時(shí)尚早。“
Echo智能音響中最棘手的部分是一種被稱為遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別的技術(shù),它涉及到識(shí)別并理解與麥克風(fēng)保持一定距離的語(yǔ)音指令,即使這些指令會(huì)受到環(huán)境噪音或其他聲音的影響。這要求亞馬遜在技術(shù)上有新的突破,并且從整體上而言,也提升了亞馬遜在機(jī)器學(xué)習(xí)方面的競(jìng)爭(zhēng)力。一個(gè)很有挑戰(zhàn)性的因素是,這款設(shè)備不能浪費(fèi)太多時(shí)間去思考你說(shuō)的話。它必須把音頻發(fā)送到云端,并迅速給出一個(gè)答案,讓人感覺像是正在進(jìn)行一段對(duì)話,而不是反應(yīng)慢到讓人尷尬得覺得自己在跟一個(gè)好像快睡著的人聊天。構(gòu)建一個(gè)能夠在嘈雜的環(huán)境中理解指令,并給出響應(yīng)的機(jī)器學(xué)習(xí)系統(tǒng)需要大量的數(shù)據(jù)。亞馬遜能從哪里得到這些數(shù)據(jù)也是一個(gè)問題。
現(xiàn)在,各種各樣的亞馬遜設(shè)備和第三方產(chǎn)品都使用了Alexa語(yǔ)音服務(wù)。通過(guò)Alexa收集的數(shù)據(jù)有助于改進(jìn)系統(tǒng)并且從廣義上來(lái)說(shuō)也增加了亞馬遜在人工智能方面的工作量。
亞馬遜設(shè)備及服務(wù)高級(jí)副總裁林普說(shuō),遠(yuǎn)場(chǎng)技術(shù)以前就存在了。但“它應(yīng)用于美國(guó)三叉戟潛艇的鼻錐部分,造價(jià)十億美元。”亞馬遜試圖將其內(nèi)置在一個(gè)可以放在廚房柜臺(tái)上的設(shè)備上,而且它必須足夠便宜,讓消費(fèi)者能夠買得起這樣一款新奇的小產(chǎn)品。普拉薩德說(shuō):“我的團(tuán)隊(duì)中有90%的人認(rèn)為這完全不可能。我們?cè)诠就饷嬗幸粋€(gè)技術(shù)咨詢委員會(huì),我們沒有告訴他們我們?cè)谧鍪裁?,但他們說(shuō),‘不管你做什么,都不要想著研究遠(yuǎn)場(chǎng)識(shí)別!’”