7月10日消息,據(jù)國(guó)外媒體報(bào)道,谷歌表示,在人工智能技術(shù)的幫助下,Gmail垃圾郵件識(shí)別率如今提升到了99.9%。
大約10年前,垃圾郵件幾乎要?dú)Я穗娮余]箱。一場(chǎng)拯救人們的郵箱的比賽隨即打響,兩大科技巨頭也力爭(zhēng)奪得垃圾郵件頭號(hào)殺手的頭銜。
2012年2月,微軟聲稱,它能夠過(guò)濾掉Hotmail 97%的垃圾郵件。谷歌后來(lái)作出回應(yīng),稱它的Gmail能夠過(guò)濾掉大約99%的垃圾郵件,而且誤判率(將沒(méi)問(wèn)題的郵件誤判為垃圾郵件的比例)也只有1%。
兩家公司的成果表明,啟發(fā)式檢測(cè)技術(shù)——按照預(yù)設(shè)規(guī)則識(shí)別垃圾郵件——能奏效。
不過(guò),它們還不夠出色。1%的垃圾郵件還是會(huì)讓人很煩惱,而1%的誤判率也可能帶來(lái)不小的麻煩,尤其是錯(cuò)過(guò)重要的信息的話。因此,這些公司繼續(xù)不斷改良各自的垃圾郵件過(guò)濾技術(shù)。現(xiàn)在,憑借一系列新的人工智能工具,谷歌在這方面又上了一層樓。
谷歌時(shí)隔3年再一次公布了Gmail的垃圾郵件數(shù)據(jù),稱它的垃圾郵件比例已經(jīng)削減至0.1%,誤判率也下降至只有0.05%。該公司將此主要?dú)w功于類大腦的“神經(jīng)網(wǎng)絡(luò)”的引入。引入到垃圾郵件過(guò)濾器后,該類技術(shù)能夠通過(guò)分析大量計(jì)算機(jī)上的信息來(lái)學(xué)習(xí)識(shí)別垃圾郵件和釣魚(yú)信息。
“機(jī)器學(xué)習(xí)的一大好處在于,它能夠自行適應(yīng)不同的環(huán)境。”Gmail高級(jí)產(chǎn)品經(jīng)理約翰·瑞伊-格蘭特(John Rae-Grant)指出。谷歌稱,Gmail目前的全球用戶量達(dá)到9億。換言之,Gmail的垃圾郵件過(guò)濾器并不只是通過(guò)實(shí)施預(yù)設(shè)的規(guī)則來(lái)清楚垃圾,它們?cè)谶\(yùn)行期間還能夠自行制定新規(guī)則。
針對(duì)你不想看到的
與Facebook和Twitter一樣,谷歌也是神經(jīng)網(wǎng)絡(luò)領(lǐng)域的領(lǐng)先者。近年來(lái),該公司利用該類技術(shù)來(lái)識(shí)別你向Android手機(jī)發(fā)出的語(yǔ)音指令,辨別你發(fā)布到Google Photos服務(wù)的照片,等等。據(jù)谷歌工程師杰夫·迪恩(Jeff Dean)稱,公司將這些技術(shù)應(yīng)用于其互聯(lián)網(wǎng)帝國(guó)上的各種服務(wù)。
神經(jīng)網(wǎng)絡(luò)技術(shù)也能有效用于識(shí)別垃圾郵件其實(shí)并不令人意外。百度在使用該類技術(shù)來(lái)推送你可能會(huì)有興趣的廣告,F(xiàn)acebook利用它來(lái)在動(dòng)態(tài)消息(News Feed)中判斷你可能想看的內(nèi)容。在某種程度上,垃圾郵件識(shí)別技術(shù)只是這些系統(tǒng)的相反面,它針對(duì)的是你不想看到的信息。
其它公司也在探索將神經(jīng)網(wǎng)絡(luò)用作過(guò)濾工具。除了識(shí)別垃圾信息之外,Twitter還計(jì)劃利用該技術(shù)在其社交網(wǎng)絡(luò)上識(shí)別淫穢內(nèi)容。
粗略地說(shuō),這些神經(jīng)網(wǎng)絡(luò)是機(jī)器的巨大合集,模擬大腦中的神經(jīng)細(xì)胞網(wǎng)絡(luò)。在谷歌,迪恩和由其他人工智能工程師組成的核心小組負(fù)責(zé)運(yùn)作這些網(wǎng)絡(luò),提供軟件庫(kù),從而讓包括Gmail團(tuán)隊(duì)在內(nèi)的其它谷歌團(tuán)隊(duì)能夠用得上。據(jù)谷歌軟件工程師維賈伊·埃蘭蒂(Vijay Eranti)稱,Gmail團(tuán)隊(duì)幾個(gè)月前才開(kāi)始采用該項(xiàng)技術(shù)。
說(shuō)到神經(jīng)網(wǎng)絡(luò),瑞伊-格蘭特指出,“從研發(fā)到初始應(yīng)用再到廣泛的應(yīng)用,事情的發(fā)展非常迅速,尤其是這個(gè)領(lǐng)域。”
個(gè)性化調(diào)整
微軟現(xiàn)在的垃圾郵件過(guò)濾率達(dá)到多少呢?該公司還沒(méi)有公布Hotmail(現(xiàn)改稱為Outlook.com)這方面的最新數(shù)據(jù)。不過(guò)它也在部分產(chǎn)品中采用神經(jīng)網(wǎng)絡(luò)技術(shù)。正是由于該技術(shù),Skype電話的即時(shí)翻譯功能才得以實(shí)現(xiàn)。
然而,正確來(lái)說(shuō),應(yīng)用神經(jīng)網(wǎng)絡(luò)只是像谷歌這樣的公司打擊垃圾郵件和確保用戶收到正當(dāng)內(nèi)容的舉措的一部分。瑞伊-格蘭特還表示,Gmail利用數(shù)項(xiàng)工具來(lái)調(diào)整垃圾郵件過(guò)濾器,從而使得它們符合用戶特定的偏好。
“這方面有灰色地帶,一個(gè)人的垃圾對(duì)另一個(gè)人來(lái)說(shuō)可能是寶貝。”他說(shuō)道。
“我們會(huì)追蹤并試圖粗略估計(jì)你想要看到什么內(nèi)容,不想看到什么內(nèi)容,具體是根據(jù)你之前關(guān)注過(guò)什么信息,標(biāo)記了哪些內(nèi)容為垃圾信息。所以,除了應(yīng)用接收所有人的反饋的大機(jī)器學(xué)習(xí)模型,我們還會(huì)針對(duì)個(gè)人進(jìn)行適當(dāng)?shù)恼{(diào)整。”