在即將正式發(fā)布的iOS 10中,Siri的聲音是最后一個(gè)被機(jī)器學(xué)習(xí)改造的部分。同樣,深度神經(jīng)網(wǎng)絡(luò)替代了原先授權(quán)的技術(shù)。Siri的聲音來(lái)自一家語(yǔ)音中心收集的錄音數(shù)據(jù)庫(kù),每句話都是語(yǔ)音段拼貼的結(jié)果。機(jī)器學(xué)習(xí)讓語(yǔ)音變得平滑,聽起來(lái)更像一個(gè)真人。
這看起來(lái)只是很小的細(xì)節(jié),但更自然的聲音能為Siri帶來(lái)很大的改變。Gruber認(rèn)為,“如果聲音質(zhì)量更高,人們會(huì)感到更加可信。更好的語(yǔ)音能吸引用戶,讓他們更常使用。”
使用Siri的意愿,以及機(jī)器學(xué)習(xí)在技術(shù)上的提升,都在蘋果向開發(fā)者開放Siri的過(guò)程中十分重要。許多人注意到,蘋果在Siri上的合伙量只有兩位數(shù),遠(yuǎn)遠(yuǎn)落后于亞馬遜的Alexa,后者稱外部開發(fā)者幫助開發(fā)了1000多項(xiàng)技能。蘋果認(rèn)為這種比較沒有意義,因?yàn)閬嗰R遜用戶要使用特定的指令方式,才可用到那些技能。蘋果表示,Siri在與Uber和SquareCash等服務(wù)的整合上會(huì)更自然。
與此同時(shí),蘋果對(duì)Siri的改善也得到了回報(bào),用戶發(fā)現(xiàn)了一些新功能,也感到常用的查詢變得更準(zhǔn)確,而相應(yīng)的,查詢數(shù)量也不斷增長(zhǎng)。
五
或許,蘋果使用機(jī)器學(xué)習(xí)技術(shù)中遇到的最大問(wèn)題,是如何堅(jiān)持保護(hù)用戶隱私的原則。蘋果會(huì)加密用戶信息,包括公司律師在內(nèi)的任何人都無(wú)法讀齲FBI也不能,即便獲得了批準(zhǔn)(按:關(guān)于蘋果與FBI的對(duì)戰(zhàn),可閱讀雷鋒網(wǎng)(搜索“雷鋒網(wǎng)”公眾號(hào)關(guān)注)的解讀)。它還表示,不會(huì)收集用戶信息用于廣告目的。
從用戶的角度上看,這種行為值得尊敬,但這對(duì)吸引頂尖AI人才并無(wú)幫助。一位蘋果前員工表示,“機(jī)器學(xué)習(xí)專家想要的就是數(shù)據(jù)。但出于保護(hù)隱私的立場(chǎng),蘋果總會(huì)有所干預(yù)。這種做法是否正確暫不討論,但外界會(huì)認(rèn)為蘋果不是鐵桿AI粉。”
蘋果高管并不認(rèn)同這種觀點(diǎn)。他們認(rèn)為無(wú)需將用戶信息放在云端,或存儲(chǔ)訓(xùn)練神經(jīng)網(wǎng)絡(luò)所用的數(shù)據(jù),也能得到提升機(jī)器學(xué)習(xí)表現(xiàn)的數(shù)據(jù)。Federighi認(rèn)為,“外界一直存在錯(cuò)誤的觀點(diǎn),做出了錯(cuò)誤的妥協(xié),我們想讓他們走上正軌。”
這里有兩個(gè)問(wèn)題。第一個(gè)涉及到在機(jī)器學(xué)習(xí)系統(tǒng)中處理個(gè)人信息,當(dāng)個(gè)人詳細(xì)信息是由神經(jīng)網(wǎng)絡(luò)收集到的時(shí),這些信息會(huì)怎么樣?第二個(gè)涉及到收集訓(xùn)練神經(jīng)網(wǎng)絡(luò)識(shí)別行為所需的數(shù)據(jù),不收集個(gè)人信息,又將如何做到訓(xùn)練呢?
蘋果對(duì)兩者都有答案。Cue表示,“有人認(rèn)為,我們用AI做不了這些事,因?yàn)闆]有數(shù)據(jù)。但我們找到了獲取所需的數(shù)據(jù),同時(shí)保護(hù)隱私的方式。這是我們的底線。”
對(duì)于第一個(gè)問(wèn)題,蘋果的解決方式是利用其獨(dú)特的對(duì)軟硬件的控制。簡(jiǎn)單來(lái)說(shuō),多數(shù)個(gè)人信息仍保留在Apple Brain中。Federighi表示,“我們會(huì)將部分最敏感的信息保留在設(shè)備上,這時(shí)機(jī)器學(xué)習(xí)完全在本地運(yùn)行。”他給出的例子是應(yīng)用推薦,即在主屏上右滑時(shí)會(huì)出現(xiàn)的圖標(biāo)。在理解狀態(tài)下,這些應(yīng)用就是你意圖想用的。這種預(yù)測(cè)基于許多因素,基本都與用戶的行為有關(guān)。這一功能確實(shí)有用,F(xiàn)ederighi表示,預(yù)測(cè)用戶想用圖標(biāo)的概率有90%。
蘋果存在設(shè)備上的其它信息可能包括了最個(gè)人的信息:用戶使用iPhone鍵盤輸入的文字。使用經(jīng)過(guò)神經(jīng)網(wǎng)絡(luò)訓(xùn)練的系統(tǒng),蘋果能識(shí)別出關(guān)鍵事件和項(xiàng)目,如航班信息,聯(lián)系人及約會(huì)。不過(guò)這些信息都存在手機(jī)上。即使是備份在蘋果云上的信息,也會(huì)經(jīng)過(guò)處理后不能僅由備份信息進(jìn)行還原。“我們不想把信息存在蘋果服務(wù)器上,公司沒必要知道你的愛好或你在哪。”
蘋果也在盡量減少整體上保存的信息。一個(gè)例子是,在交談中有人可能提到一個(gè)詞,這或許需要搜索。其它公司很可能在云端分析整段對(duì)話,從而識(shí)別出那些詞語(yǔ),但蘋果設(shè)備無(wú)需這些數(shù)據(jù)遠(yuǎn)離用戶就能識(shí)別出來(lái)。這是因?yàn)橄到y(tǒng)會(huì)不斷與手機(jī)中的知識(shí)庫(kù)進(jìn)行搜索匹配。
Federight表示,“知識(shí)庫(kù)很精練,但也相當(dāng)完善,儲(chǔ)存了成千上萬(wàn)的地點(diǎn)和實(shí)體。”蘋果所有的應(yīng)用都能用知識(shí)庫(kù),包括Spotlight搜索應(yīng)用,地圖和瀏覽器。它也能幫助自動(dòng)糾錯(cuò),一直在后臺(tái)運(yùn)行。
機(jī)器學(xué)習(xí)圈的一個(gè)疑問(wèn)是,蘋果的隱私限制是否會(huì)阻礙神經(jīng)網(wǎng)絡(luò)算法,這也是上文中提到的第二個(gè)問(wèn)題。經(jīng)過(guò)大量數(shù)據(jù)訓(xùn)練,神經(jīng)網(wǎng)絡(luò)才能準(zhǔn)確。如果蘋果不采集用戶行為數(shù)據(jù),又從哪里得到數(shù)據(jù)呢?與其它公司一樣,蘋果用公開數(shù)據(jù)集訓(xùn)練神經(jīng)網(wǎng)絡(luò),但總有需要更新更準(zhǔn)確的數(shù)據(jù)的時(shí)候,而這又只能從用戶中來(lái)。蘋果的做法是在不知道用戶是誰(shuí)的情況下收集信息。它會(huì)對(duì)數(shù)據(jù)匿名處理,隨機(jī)打上識(shí)別信息。