你想過和異國人說話不需要再有翻譯,只需隨身攜帶一個輕巧的數(shù)碼機(jī)器嗎?目前來看這仍是奢望。不過,或許某一天,我們終于可以不再學(xué)習(xí)頭疼的外語就能實(shí)現(xiàn)和外國人的無縫交流。
機(jī)器翻譯是一個充滿挑戰(zhàn)的研究領(lǐng)域,正因?yàn)殡y度很大,它被列為21世紀(jì)世界十大科技難題之首。一路走來,機(jī)譯經(jīng)歷了艱難而曲折的發(fā)展歷程,既有成功和興奮,也有挫折和困惑。
然而,需求永遠(yuǎn)走在應(yīng)用的前方。由于近年來全球化進(jìn)程的加速以及國際交流的日趨頻繁,人們對于翻譯的需求空前增長。而互聯(lián)網(wǎng)的普遍應(yīng)用則使在線翻譯成了當(dāng)今機(jī)譯的重頭戲。
在這一領(lǐng)域,競爭正變得空前激烈。如今功能較強(qiáng)、方便易用的在線翻譯工具有谷歌翻譯、必應(yīng)翻譯、臉譜翻譯、寶貝魚翻譯、巴比倫翻譯等,其中后起之秀的谷歌翻譯最具特色,同時最具代表性。
谷歌翻譯目前可提供63種主要語言之間的實(shí)時翻譯;它可以提供所支持的任意兩種語言之間的互譯,包括字詞、句子、文本和網(wǎng)頁翻譯。另外它還可以幫助用戶閱讀搜索結(jié)果、網(wǎng)頁、電子郵件、YouTube視頻字幕以及其它信息,用戶甚至還能在Gmail內(nèi)進(jìn)行實(shí)時的多語言對話。
谷歌翻譯主要是采用統(tǒng)計翻譯模型,往計算器內(nèi)輸入大量的文字文本,包括源語言的文本,以及對應(yīng)目標(biāo)語言人工翻譯的文本,通過海量統(tǒng)計數(shù)據(jù)來提高翻譯精確度。
之所以采用統(tǒng)計翻譯模型,一個重要原因是,谷歌翻譯采用了云計算架構(gòu)。該架構(gòu)擁有谷歌研發(fā)的分布式計算系統(tǒng)(MapReduce)和分布式存儲系統(tǒng)(BigTable);而這兩個系統(tǒng)很有創(chuàng)造性,而且有極大的擴(kuò)展性,使得谷歌在系統(tǒng)吞吐量上有很大的競爭力。
機(jī)譯更激動人心的應(yīng)用,在于日常對話中的實(shí)時翻譯。這一領(lǐng)域同樣是谷歌領(lǐng)先;它擁有較強(qiáng)的語音識別技術(shù),可以通過聲音實(shí)現(xiàn)自動檢索,再將語音識別和機(jī)譯結(jié)合在一起。
2011年11月,谷歌最新推出了一款手機(jī)翻譯軟件;該軟件支持包括漢語普通話在內(nèi)的14個語種。對著谷歌Android智能手機(jī)講話的用戶,幾乎能實(shí)時聽到他們的源語言被翻譯成目標(biāo)語言;而通話對方的語言也會被翻譯成該用戶的母語。
谷歌董事長埃里克施密特稱,這種手機(jī)翻譯服務(wù)將會得到極大改善,甚至可能進(jìn)行“同聲傳譯”;其前景是令人樂觀的。
谷歌的首席科學(xué)家阿施斯維努戈帕爾稱,谷歌的最終目的是研發(fā)出能夠翻譯全球至少10億人所說的300種語言的手機(jī)軟件。
除了傳統(tǒng)的翻譯思路,一種被稱為解碼外語的新方法也小荷露出尖尖角。
這項(xiàng)由南加州大學(xué)的科學(xué)家們提出的全新機(jī)譯方法把英語視為一種初始語言,而需要翻譯的外語類似一種加密后的高級文字,通過譯碼破譯,把外語「破解」,變成英語。
不過,現(xiàn)實(shí)是骨感的。目前,這種翻譯方法只能翻譯一些短句或電影字幕,尚未運(yùn)用到長句或片段翻譯中,但它卻給機(jī)譯研究打開了一條新的思路,且可以運(yùn)用到任何一種語言中。科學(xué)家們稱,因?yàn)椴恍枰魏渭扔械奈谋緸榛A(chǔ),這種翻譯方法今后甚至可以對“海豚音”或“外星人語言”進(jìn)行破譯。