北京時間1月14日消息,據(jù)國外媒體報道,美國《福布斯》雜志網(wǎng)絡(luò)版日前刊登文章稱,2013年將是智能系統(tǒng)年。文章同時對2013年智能系統(tǒng)領(lǐng)域的發(fā)展進(jìn)行了展望。
以下是這篇文章的內(nèi)容摘要:
2012年對許多人來說利用語音控制手機(jī)、汽車、電腦甚至是電視機(jī)都是非常平常的事了。之所以如此,是因?yàn)檎Z音識別和自然語言理解(NLU)領(lǐng)域取得了重大進(jìn)步。不久前還被認(rèn)為是科幻小說里才會出現(xiàn)的產(chǎn)品功能,現(xiàn)在已經(jīng)變成主流手機(jī)和消費(fèi)設(shè)備的基本功能。語音用戶界面和“虛擬個人助手”已經(jīng)成為福特、三星、蘋果和谷歌(微博)等企業(yè)開展廣告營銷活動時重點(diǎn)宣傳的一個關(guān)鍵特色,這一特色將會引起前所未有的關(guān)注和市場需求。
人們對這些全新的語音驅(qū)動用戶界面抱有很大的熱情。許多報道指出,用戶對他們的新“助手”充滿感情。不過,許多人也認(rèn)識到,這些系統(tǒng)仍在不斷改進(jìn)中,需要不斷的創(chuàng)新。預(yù)計,現(xiàn)有的虛擬個人助手將演變成無處不在的智能系統(tǒng),通過語音、文本、視覺、觸覺和手勢與人進(jìn)行互動,并將基于周圍的環(huán)境信息,如位置等,讓所有互動具有更大的相關(guān)性。
以下是對2013年智能系統(tǒng)發(fā)展的8點(diǎn)展望:
1、語音識別精度更高
語音識別是智能系統(tǒng)技術(shù)的基礎(chǔ),語音識別的準(zhǔn)確性一直在穩(wěn)步提高,之所以這么說,是因?yàn)楝F(xiàn)在已經(jīng)把更加豐富的訓(xùn)練數(shù)據(jù)、更加強(qiáng)大的計算能力以及全新更加復(fù)雜的建模方法(如目前非常流行的基于人腦如何完成模式識別的技術(shù)“深度信念網(wǎng)”( Deep Belief Networks))結(jié)合在一起,提高了語音識別的精度。
2、設(shè)備將具備更強(qiáng)的識別能力
不管是在城市街道上,還是在汽車?yán)锘蚩蛷d里,語音識別的功能性和精確性正越來越高。一流的信號處理能夠區(qū)分不同的聲音,語音生物統(tǒng)計學(xué)有助于判定誰在說話。并排的多個麥克風(fēng)能夠動態(tài)引導(dǎo)“聽光束”,并可在攝像頭的輔助下跟蹤用戶的位置。因此,在與用戶聯(lián)系更加緊密的移動設(shè)備上應(yīng)用這項(xiàng)功能,將會提高移動設(shè)備的識別能力。
3、設(shè)備將具備更強(qiáng)的感知能力
未來完成一項(xiàng)任務(wù)可減少許多必需的步驟,如必須選擇設(shè)備、打開設(shè)備、找到目標(biāo)應(yīng)用、啟動應(yīng)用,然后與應(yīng)用互動。不久,用戶將可以簡單地用自然語言告訴處于睡眠狀態(tài)的設(shè)備干什么——不用觸碰它。具備這種低功耗模式狀態(tài)下聽功能的設(shè)備將可以鑒別用戶,并通過逐步喚醒其處理器的其他功能來確認(rèn)要求的操作,最終按照要求完成相應(yīng)的操作。
4、互動性的普遍性和連續(xù)性
隨著語音識別技術(shù)和自然語言理解技術(shù)的發(fā)展,用戶希望能夠在不同設(shè)備(智能手機(jī)、平板電腦、電視或汽車)的顯示屏上進(jìn)行互動,并擁有一致的體驗(yàn)。用戶可以在一臺設(shè)備上開始任務(wù),在另一臺設(shè)備上完成任務(wù)。這種互動將通過基于客戶識別器和云識別器,以及自然語言理解引擎的框架聯(lián)系在一起。用戶的互動歷史將被聚合在云端,用來改進(jìn)識別模型,以便在其他所有相關(guān)設(shè)備中應(yīng)用。
5、自然語言處理和人工智能將更加智能化
自然語言理解(猜測用戶輸入并據(jù)此操作的意圖)的能力也在不斷提高。今天的一流技術(shù)把功能強(qiáng)大的語言框架(被稱作符號處理)、知識顯示法(知識本體)和利用大數(shù)據(jù)用觀察到的例子和模型來填充框架的機(jī)器學(xué)習(xí)結(jié)合在一起。這種互補(bǔ)性至關(guān)重要:過去的符號方法被證明是不可靠的,純數(shù)據(jù)驅(qū)動型自然語言理解一般僅是膚淺的理解。
智能系統(tǒng)現(xiàn)在已從對任務(wù)目標(biāo)的預(yù)定程序描述遷移至以用戶的背景、參數(shù)選擇和互動歷史為條件的動態(tài)操作,系統(tǒng)據(jù)此有效地自我編程。這將允許我們從簡單的任務(wù)向更加復(fù)雜的任務(wù)過渡,可能必須訪問協(xié)調(diào)工作流中的各種應(yīng)用和信息源。
比如,為了響應(yīng)“核查下比爾(Bill)和艾利森(Allison)明天晚上是否來吃飯”的請求,手機(jī)個人助手將確定最喜愛的飯店,并基于通信歷史來決定你所說的是哪個比爾和艾利森,同時聯(lián)系對方的虛擬助手核對他們的安排,并草擬一份有關(guān)預(yù)定和人員組成等信息的電子郵件發(fā)給對方。
這種推理屬于人工智能范疇,不過,早期系統(tǒng)可靠性差,新一代系統(tǒng)將依靠一種被稱為“非單調(diào)推理”的更加靈活和穩(wěn)健的方法,在模糊狀態(tài)下表現(xiàn)更好,并生成近似的解決方案,盡管可能無法給出準(zhǔn)確的解決方案。
6、語義搜索將直接訪問信息
理解用戶意圖可以穿過多個屏幕的應(yīng)用圖標(biāo)、文件夾和子文件夾,或一系列中間網(wǎng)頁。在搜索方面,頻繁提問的自然語言理解應(yīng)用可以跳過搜索引擎檢索的所有象征性鏈接列表,直接導(dǎo)向希望的目的地。這種快速和直接訪問信息的功能非常強(qiáng)大,潛在地威脅到普通的搜索業(yè)務(wù)。一些搜索服務(wù)提供商也開始測試用直接應(yīng)答提問來替代網(wǎng)頁鏈接,不過,他們現(xiàn)在還不允許用戶直接獲取想要的第三方內(nèi)容。
7、用戶關(guān)注虛擬助手
用戶服務(wù)業(yè)務(wù)很難按照有效和可理解的方式組織成菜單結(jié)構(gòu)——不管是在互動語音應(yīng)答(IVR)系統(tǒng),還是在移動應(yīng)用中。專業(yè)化虛擬助手的自然語言理解將完全繞開互動語音應(yīng)答系統(tǒng)直接訪問信息,此外還將支持靈活的對話,允許用戶前瞻性地提供未受提示的信息,任意在不同聯(lián)系中心功能間切換。
8、自然語言理解將改進(jìn)醫(yī)療保健
醫(yī)師利用語音識別系統(tǒng)來描述包含大量關(guān)鍵信息的接診患者病情,但這很難實(shí)現(xiàn)共享。利用自然語言理解應(yīng)用,與醫(yī)學(xué)有關(guān)的事實(shí)將被篩選并被輸入電子健康記錄數(shù)據(jù)庫。自動化事實(shí)篩選的精度現(xiàn)在已經(jīng)接近人工操作,使得系統(tǒng)可以幫助醫(yī)師“說清”患者的病情。改進(jìn)的患者信息記錄能被進(jìn)一步處理,以分配帳單代碼,節(jié)約成本,提高信息和護(hù)理的質(zhì)量。
綜合利用這些進(jìn)步表明新一代計算——第三代計算革命的開始,意義相當(dāng)于引入圖形和觸摸用戶界面。自然語言理解和人工智能在設(shè)備功耗管理、快速網(wǎng)絡(luò)以及基于云的內(nèi)容、服務(wù)和應(yīng)用領(lǐng)域取得了長足的進(jìn)步,并發(fā)揮了巨大作用。
2013年將是智能系統(tǒng)年,期待著那些夢幻般的智能應(yīng)用能夠盡快變成現(xiàn)實(shí)。