“人工智能能力在不斷增強(qiáng),尤其在語音與計(jì)算機(jī)視覺方面。我認(rèn)為,五年之內(nèi)計(jì)算機(jī)視覺一定會(huì)超過人類;而十年之內(nèi),計(jì)算機(jī)視覺識(shí)別也一定會(huì)比人類更強(qiáng)。”沈向洋認(rèn)為。
正如上文提到的,微軟語音識(shí)別技術(shù)出錯(cuò)率低已至6.3%,已經(jīng)與人類專業(yè)高手持平。
“最讓我激動(dòng)的還有就是所謂人機(jī)交互界面的徹底顛覆。”沈向洋表示,“無論人工智能到底怎么定義,這么多年以來,計(jì)算機(jī)科學(xué)的發(fā)展自始至終都在做一件事情——人機(jī)交互。包括手機(jī)、筆記本的發(fā)展都是如此。我們一直在研究如何與計(jì)算機(jī)同存共進(jìn)。”
沈向洋認(rèn)為“用戶圖形界面”的概念正在被顛覆,語音用處越來越多,未來視頻類技術(shù)也會(huì)隨著跟上。而這也是微軟一直在提的概念:對(duì)話式人工智能。比如其小娜、小冰。
相比谷歌的AlphaGo在圍棋方面大戰(zhàn)人類,沈向洋更看重人工智能在商業(yè)領(lǐng)域的突破。
“我對(duì)AlphaGo除了敬仰還是敬仰,真的非常了不起,的的確確打破了很多人對(duì)人工智能的想象。”沈向洋坦言,“但是AlphaGo雖然很了不起,我們卻看不到它能真正應(yīng)用到商業(yè)領(lǐng)域的地方。我個(gè)人認(rèn)為,近三到五年,人工智能的突破還是在商業(yè)領(lǐng)域的應(yīng)用。”
具體來說是人工智能在傳統(tǒng)商業(yè)領(lǐng)域,比如銷售市嘗客戶支持、人力資源等領(lǐng)域的應(yīng)用。
沈向洋以市場銷售為例。過去銷售一件商品可能需要打很多拜訪電話,有一個(gè)非常長的潛在客戶名單。在面對(duì)這么多客戶名字、公司的時(shí)候,需要判斷在有限的時(shí)間里應(yīng)該先聯(lián)系誰,后聯(lián)系誰。但是有了越來越多的數(shù)據(jù)可以參考和分析之后,可以利用人工智能技術(shù)讓效率提升五倍、十倍。
“腦科學(xué)+AI”將是最有意義的方向
“AlphaGo已經(jīng)證明了在圍棋這個(gè)場景,機(jī)器比人厲害。但是未來,人工智能不需要證明它的計(jì)算能力和算法高于人,而是在無法理解的領(lǐng)域有所突破,也不光光是情感。”沈向洋表示。
相比計(jì)算能力,沈向洋一直在強(qiáng)調(diào)人工智能的“情感”能力。他認(rèn)為,雖然情感到底是什么至今都沒有定論,但情感肯定不是計(jì)算,也不是計(jì)算出來的。之所以認(rèn)為人類是智能的,就是因?yàn)槿祟愑写竽X。但對(duì)于大腦的神經(jīng)科學(xué)的研究進(jìn)展還非常緩慢,因此,沈向洋認(rèn)為接下來“腦科學(xué)+AI”一定會(huì)成為科研角度最激動(dòng)人心的方向。
“如果我的學(xué)生說他想念博士的話,我會(huì)鼓勵(lì)他們往這個(gè)方向去思考,這一定是接下來三十年最有意義的方向。”沈向洋提到。
其實(shí),微軟的人工智能助理小冰已經(jīng)帶有“情感”的成分。這一“情感”成分來自大量的社交網(wǎng)站數(shù)據(jù)。小冰從誕生到現(xiàn)在已經(jīng)有31個(gè)月,擁有4000萬用戶,在不斷與其對(duì)話過程中,小冰也在不斷深入學(xué)習(xí),沈向洋認(rèn)為小冰其實(shí)是數(shù)據(jù)驅(qū)動(dòng)的方式在學(xué)習(xí)人類的情感。
但是,當(dāng)人工智能發(fā)展到擁有語言能力,語音能力,視覺能力以及理解能力的時(shí)候,人類是否會(huì)開始畏懼人工智能的發(fā)展呢?
沈向洋直言:“我覺得畏懼也沒有用。在任何一個(gè)技術(shù)浪潮到來的時(shí)候,我們都會(huì)非常謹(jǐn)慎。比如核能的例子,我們需要監(jiān)管核能,因?yàn)橐徊恍⌒木涂赡艹龃笫?。人工智能其?shí)也產(chǎn)生過很多問題,包括倫理和偏見的問題。”
因此,微軟在公司內(nèi)部成立了一個(gè)人工智能倫理委員會(huì),不斷學(xué)習(xí)和探討這方面的問題。
微軟人工智能普及化
在人工智能方面,微軟一直強(qiáng)調(diào)“人工智能普及化”。這一概念是薩提亞在2016年Ignite大會(huì)上提出來的,并且描述了人工智能普及化的藍(lán)圖。
微軟這一概念更多的是針對(duì)開發(fā)者。微軟上線了基于微軟智能云的微軟認(rèn)知服務(wù),在這個(gè)服務(wù)上微軟開放了25個(gè)API,對(duì)于開發(fā)者來說可以介入語音、視覺、自然語言或者搜索等各種功能。據(jù)沈向洋透露,上線后很短時(shí)間內(nèi),微軟已經(jīng)累計(jì)了接近一百萬個(gè)開發(fā)者。