
5月12日西雅圖報道
去年, 微軟 內(nèi)部進(jìn)行了又一次重大架構(gòu)調(diào)整,宣布成立新的人工智能部門,而領(lǐng)導(dǎo)這一5000人規(guī)模部門的掌舵人,是微軟全球執(zhí)行副總裁沈向洋。
人工智能的重要性正在被微軟提到前所未有的高度,在10日舉辦的微軟Build開發(fā)者大會首日,沈向洋代表微軟人工智能部門,向外界發(fā)布了一系列人工智能相關(guān)的開發(fā)工具,并闡述了微軟對人工智能的理解及愿景。
會后,沈向洋接受了包括騰訊科技在內(nèi)的多家媒體采訪。他談到,微軟人工智能方面的研究,正在朝著“理解人類“的方向努力,強(qiáng)調(diào)AI應(yīng)該不僅有”智商“,還應(yīng)該有 “情商”。他認(rèn)為,人工智能具有顛覆一切商業(yè)應(yīng)用的能力,對于微軟來說,一方面是如何用AI技術(shù)重新定義現(xiàn)有的龐大產(chǎn)品線,讓所有產(chǎn)品和應(yīng)用“智能化”,另一方面是探尋由AI所驅(qū)動的新的產(chǎn)品形態(tài)和商業(yè)機(jī)會。另外,他還首次公開談到了微軟對于高端人才流動的態(tài)度,表示樂于成為培養(yǎng)和推動AI人才成長和發(fā)展的“黃埔軍校”,助推整個行業(yè)朝著未來人工智能浪潮的方向前進(jìn)。
AI 既要有“智商” 也要有“情商”
沈向洋認(rèn)為,近年來三大趨勢推動了人工智能領(lǐng)域的大爆發(fā),一是高性能的計算能力,二是強(qiáng)大的算法,三是海量的數(shù)據(jù)。
如今,人工智能技術(shù)已經(jīng)可以以極高的準(zhǔn)確度識別圖片、語音,甚至在象棋、圍棋方面勝過最頂尖的人類選手,但在沈向洋看來,人工智能僅僅有IQ (智商)還不夠,還需要有EQ(情商)。
所謂的“情商”,即如何讓機(jī)器真正理解和懂得人類。沈向洋表示,即便是在當(dāng)下人工智能技術(shù)已經(jīng)顯示出非常強(qiáng)大的功能,但其對整個世界的理解仍然不到一個4、5歲小孩的能力。
“雖然有那么強(qiáng)大的具體能力,但是,智能最主要的還是我們對世界的理解,對世界的建模,所謂的常識,”沈向洋說,“這些AI在今天還遠(yuǎn)遠(yuǎn)不夠,這里面包括感情的問題。”
近年來,包括微軟在內(nèi),主要的科技公司都在探究下一個人機(jī)交互方式 是什么,而語音交互成為這些公司不約而同認(rèn)定的方式。在此基礎(chǔ)上, 亞馬遜 研發(fā)了Echo, 谷歌 (微博)研發(fā)了Google Assistant, 蘋果 研發(fā)了Siri,微軟研發(fā)了Cortana,這些智能語音助手背后都是通過強(qiáng)大的智能語音識別技術(shù)來實現(xiàn)。
沈向洋表示,回顧過去,計算機(jī)剛出來的時候是指令界面,后來變成了圖形交互界面。
“指令界面大概只有幾十個、幾百個程序員用,”沈向洋說,“對大多數(shù)的普羅大眾來講,圖形界面的出現(xiàn)改變了大家對計算機(jī)的認(rèn)識。”
隨著人工智能的發(fā)展,沈向洋認(rèn)為,人機(jī)交互的方式一定會發(fā)生新的變化,并且隨著這樣的變化過程,人和機(jī)器之間的關(guān)系也在發(fā)生著微妙變化。
“以前就算你有圖形交互界面,人還是要學(xué)機(jī)器語言,”沈向洋說,“有了這個AI,特別是Conversation AI,如果發(fā)展的好,以后就變成了計算機(jī)會學(xué)人的語言,AI就會講人的話,AI就會對人類理解。”
在沈向洋看來,目前主流的智能語音助手類工具,從功能實現(xiàn)上依然停留在人發(fā)出語音指令,讓機(jī)器具體完成一些事情上,而機(jī)器本身并不理解人說一些話的真正含義。
他表示,微軟除了在“幫助人完成任務(wù)”這一角度進(jìn)行相關(guān)的人工智能技術(shù)研發(fā)以外,還非常關(guān)注情感方面的研發(fā)。
“我們是兩條路同時在走,”沈向洋舉了微軟智能聊天機(jī)器人小娜和小冰的例子,“小娜是幫助你,小冰更加是從情感的角度,陪你聊天,試圖理解你,跟你不斷對話。”
沈向洋認(rèn)為,人工智能對于認(rèn)知方面的進(jìn)展還遠(yuǎn)處于初級階段。“用今天現(xiàn)有的方法,包括深度學(xué)習(xí)的方法,解出來的效果還不是足夠好,”
人工智能將顛覆一切商業(yè)應(yīng)用
在今年的微軟Build開發(fā)者大會上,微軟發(fā)布了一系列面向開發(fā)者的人工智能相關(guān)工具,目前,微軟認(rèn)知服務(wù)提供了業(yè)界最多的智能API接口,數(shù)量達(dá)到了29個,利用這些API,開發(fā)者能夠?qū)⒁曈X、語音、語言、知識和搜索等智能應(yīng)用加入到任何應(yīng)用場景中,直接利用現(xiàn)成的功能或者通過定制加工,來打造自己的智能應(yīng)用和機(jī)器人體驗。