C語音識別 早已成熟應(yīng)用卻被抱怨最多
很多人應(yīng)該都有過被手機(jī)語音識別氣得半死的經(jīng)歷,在機(jī)器翻譯中,語音翻譯可能是比文本翻譯更加被普通人急需的功能,但就目前的應(yīng)用現(xiàn)狀看,“槽點(diǎn)”最多的也是它。但其實(shí),語音識別沒有我們以為的那么幼弱,在一些習(xí)以為常的地方,它們已經(jīng)發(fā)揮了很重要的作用,比如中高考的英語“人機(jī)對話”。
廣東省從1999年開始率先增加英語聽力考試,并于2004年增加了口語計(jì)算機(jī)考試,也就是通常所說的“人機(jī)對話”——考生坐在電腦前,戴上特制的耳麥,計(jì)算機(jī)開始播放聽力試題,考生根據(jù)提問一一作答。計(jì)算機(jī)記錄下考生的答案后,綜合打分。
“如此大規(guī)模的聽說考試,如果用人與人面對面的考試方式,不可能像筆試一樣數(shù)十萬人同時(shí)考試,根本無法完成考試任務(wù),所以廣東采用了‘人機(jī)對話’,并在2014年開發(fā)了計(jì)算機(jī)評卷系統(tǒng),非常高效。”廣東省教育考試院副院長黃友文告訴記者,十幾年的“人機(jī)對話”搞下來,高校反饋,廣東學(xué)生的英語應(yīng)用能力明顯提高。
為什么關(guān)系到千萬學(xué)子前途的國家考試敢于用這么“不成熟”的技術(shù)?專家解釋,計(jì)算機(jī)語音識別在特定領(lǐng)域內(nèi)的確可以比人更出色,即便是主觀題的答案,得分點(diǎn)也都在一些關(guān)鍵詞上,很容易被機(jī)器抓齲這時(shí),既不會有日常語言中的千變?nèi)f化,也不會有背景噪音和含混不清,機(jī)器識別反而更準(zhǔn)確和高效。
D機(jī)器學(xué)習(xí) 大數(shù)據(jù)點(diǎn)燃人工智能加速引擎
如何讓語音識別技術(shù)走下“規(guī)范用語”的窄軌,進(jìn)入日常應(yīng)用呢?除了前面說到的“神經(jīng)網(wǎng)絡(luò)”算法外,大數(shù)據(jù)時(shí)代的到來,將給語音識別乃至語音翻譯插上翅膀。
“打個(gè)比方,人們常常在對話中會出現(xiàn)一時(shí)沒聽清楚的情況——你剛才說什么,請?jiān)僬f一遍?”程國艮給記者看了一段視頻,這是一段極其簡短的語言片段,說的是某種方言,在沒有任何提示的情況下,反復(fù)聽多次也不明白他在說什么。“這是因?yàn)槿四X對語言的判斷需要足夠的信息元素,上下文語境等等背景可以用來幫助我們快速理解語言的意思,當(dāng)抽離了很多信息元素時(shí),就很費(fèi)解了,”程國艮說,“但實(shí)驗(yàn)證明,在這種情況下,依托大數(shù)據(jù)的機(jī)器語言識別能力就超過了人腦,它能‘分析’出信息不夠的語句背后的完整意思。”
專家們一致認(rèn)為,翻譯是人工智能中集大成者,隨著大數(shù)據(jù)資源庫的不斷膨脹,機(jī)器能夠?qū)W習(xí)的資源越來越多。“比如電腦手機(jī)的輸入法,人們每敲擊一次鍵盤,都是在給語言數(shù)據(jù)庫以及其他各類大數(shù)據(jù)庫添磚加瓦,機(jī)器就是這樣學(xué)會了世界各地人們的各種語言習(xí)慣包括個(gè)性化表達(dá)。”于洋說。而要表達(dá)一個(gè)意思,熟練的翻譯者可以掌握幾種常用句式,但實(shí)際生活中,可能有超過100種句式,包括非常個(gè)人化的表達(dá)方式,這些就是翻譯者無法掌握而計(jì)算機(jī)卻可以全部學(xué)會的。
也就是說,不用擔(dān)心未來的機(jī)器人說話干巴巴,它們能夠說的花樣可能你想破腦袋都想不出來。
登陸|注冊歡迎登陸本站,認(rèn)識更多朋友,獲得更多精彩內(nèi)容推薦!