本文整理自4月8日科大訊飛劉慶峰在深圳會(huì)展中心舉辦的《人工智能產(chǎn)業(yè)發(fā)展論壇》上的演講,文字由科大訊飛的語音軟件訊飛聽見現(xiàn)場(chǎng)實(shí)時(shí)對(duì)演講錄音的轉(zhuǎn)化,雷鋒網(wǎng)(搜索“雷鋒網(wǎng)”公眾號(hào)關(guān)注)在此基礎(chǔ)上做了細(xì)節(jié)上的優(yōu)化。
尊敬的各位領(lǐng)導(dǎo),各位企業(yè)家和專家,非常高興今天能夠借這個(gè)機(jī)會(huì)跟大家分享科大訊飛對(duì)人工智能產(chǎn)業(yè)發(fā)展當(dāng)前的狀況以及下一步趨勢(shì)的理解。
應(yīng)該說今天是人工智能,正式提出來的60周年。在1956年達(dá)特矛斯會(huì)議提出之后人工智能已經(jīng)經(jīng)歷了三次的浪潮,那么第一次浪潮的高峰是在1970年,當(dāng)時(shí)由于機(jī)器能夠證明數(shù)學(xué)原理中的大部分的原理,自動(dòng)證明,那么大家認(rèn)為第一代的人工智能機(jī)器甚至可以在5到10年內(nèi)達(dá)到人類的智慧水平。當(dāng)然事實(shí)證明,其實(shí)由于當(dāng)時(shí)算法的局限性,包括第一代神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)架構(gòu)上的一些問題,導(dǎo)致了到1980年大家發(fā)現(xiàn)出現(xiàn)第一次的冬天。那么隨后,隨著遞歸網(wǎng)絡(luò)算法的出現(xiàn),人工智能第二次浪潮到來,甚至提出了雄心勃勃的第五代計(jì)算機(jī)的概念,那么還是由于算法本身以及計(jì)算收斂性的問題,到了2000年第二次人工智能的冬天到來。這一次的人工智能的產(chǎn)業(yè)發(fā)展,其實(shí)一個(gè)非常重要的標(biāo)志點(diǎn)是在2006年前后深度學(xué)習(xí)算法的出來。到了2011年開始,深度學(xué)習(xí)算法由多個(gè)創(chuàng)新的公司和研究院把這些算法在各個(gè)應(yīng)用領(lǐng)域進(jìn)行算法的突破和應(yīng)用延伸,終于開始在語音合成、語音識(shí)別、圖像識(shí)別等越來越多的領(lǐng)域取得了突破。那么今天呢,正處于人工智能大規(guī)模爆發(fā)的前夜。
為什么這么講呢?人工智能一方面大家在進(jìn)行多角度交叉學(xué)科的研究,包括對(duì)老科學(xué)的研究,希望真的能夠分析清楚人類大腦神經(jīng)元傳遞及思維活動(dòng)的基本原理,未來用機(jī)器來進(jìn)行模擬,這個(gè)路徑還有不確定性,未來到底多長(zhǎng)時(shí)間能有重大突破,那我們的科學(xué)家和產(chǎn)業(yè)界正在探索。但是,即便以當(dāng)前的深度學(xué)習(xí)的算法,結(jié)合現(xiàn)代的云計(jì)算大數(shù)據(jù),源源不斷地能夠把一線的數(shù)據(jù)匯聚到后臺(tái)進(jìn)行學(xué)習(xí)和訓(xùn)練,那再有著我們對(duì)深度學(xué)習(xí)核心算法全面的掌握和不斷地深化,已經(jīng)可以用深度學(xué)習(xí)來深刻地改變我們每天的生活。
我們可以看到,不久前谷歌的AlphaGo,下圍棋超過了這個(gè)人人類的韓國(guó)世界冠軍李世石九段,事實(shí)上在比賽之前的3月6號(hào)科大訊飛就明確預(yù)測(cè)了,機(jī)器一定會(huì)贏。因?yàn)榻裉斓纳疃葘W(xué)習(xí),在這樣有規(guī)律可循的圍棋預(yù)算而且在給定時(shí)間要出結(jié)果上一定會(huì)比人強(qiáng),甚至在3月9號(hào)進(jìn)行比賽的現(xiàn)場(chǎng)前半段所有人都認(rèn)為機(jī)器,肯定要輸,只有科大訊飛說一定會(huì)贏,因?yàn)橛袡C(jī)器運(yùn)算可以看到40步之外。
圍棋只是一個(gè)品類,其實(shí),差不多同樣難度的在語音合成領(lǐng)域,科大訊飛已經(jīng)把它做到了不僅中文發(fā)音也好在英語中也是全世界第一。在語音識(shí)別中,在2015年(科大訊飛)也是通過這些算法的突破首次在寶馬的汽車中測(cè)試,不僅達(dá)到了實(shí)用水平,我們還超過全世界第二名十幾個(gè)百分點(diǎn),那是唯一能夠在車載環(huán)境下使用的。
機(jī)器翻譯,由于深度網(wǎng)絡(luò)的不斷突破,2014年底和2015年的國(guó)際比賽中已經(jīng)改寫了國(guó)際口語翻譯比賽的結(jié)果,以前漢英翻譯都是日本的研究機(jī)構(gòu)全球第一,英漢翻譯是美國(guó)人全球第一,可是到2014年和15年也就是最近的兩次國(guó)際比賽,科大訊飛都是全球第一,而且把口語翻譯做到了像我們大學(xué)六級(jí)的水平。
就出國(guó),現(xiàn)在吃飯購(gòu)物旅游問路等等基本上機(jī)器翻譯都能幫你解決。這些就是深度學(xué)習(xí)的算法,在各個(gè)領(lǐng)域的突破創(chuàng)新開始取得全面應(yīng)用成果。所以我們才說未來5到10年,人工智能一定會(huì)深刻地進(jìn)入到社會(huì)生活的每一個(gè)領(lǐng)域,即便是老神經(jīng)老科學(xué)的研究還沒有突破,現(xiàn)有的算法已經(jīng)可以改變世界。
我們可以看看第三方的各種預(yù)測(cè),比如說Gartner就預(yù)測(cè)到2018年會(huì)有300萬員工要向機(jī)器人老板匯報(bào)工作。那么同樣,麥肯錫做的調(diào)研做人工智能不僅僅是替代我們所認(rèn)為的簡(jiǎn)單重復(fù)的低端勞動(dòng),各種高端的勞動(dòng)照樣可以被替代。我們可以看到右邊這張表格,橫坐標(biāo)是表示每小時(shí)的薪酬,縱坐標(biāo)是表示有多少工作可以被替代,那么,橫坐標(biāo)越往右表示工作越復(fù)雜,可能薪酬越高,但是我們可以看到文檔管理員80%的工作可以被替代,花園匠由于它還有很多機(jī)械操控,現(xiàn)場(chǎng)環(huán)境也復(fù)雜,只有20%不到是可以被替代,CEO20%以上的工作是可以被替代的,那么理論上45%的當(dāng)前復(fù)雜的技術(shù)性工作是可以被自動(dòng)化的。所以我們才可以看到,科學(xué)雜志在2016年預(yù)測(cè),說截止到2045年也就是我們很多場(chǎng)合下說的奇點(diǎn)來臨的時(shí)候,人工智能將會(huì)顛覆全球就業(yè)率50%,甚至在中國(guó)會(huì)超過77%的勞動(dòng)人口因?yàn)闄C(jī)器人技術(shù)的發(fā)展而丟掉工作。當(dāng)然,因?yàn)闄C(jī)器人丟掉的77%,它會(huì)創(chuàng)造出更多更新的工作,就跟我們?nèi)祟悮v史一樣,只是這一輪人工智能不像前幾次工業(yè)革命來的相對(duì)比較和緩,它可能在5到10年迅速突破,所以我們才在今天上午的深圳宣言中提出來要制定法律體系和相關(guān)的倫理道德師德,使得被替代掉77%的工作之后,我們社會(huì)還能夠保持和諧。