關健
[王小川說,AI不是表面上那些酷炫的東西,真正的方向是讓機器做決策,具備人的推理能力,但現(xiàn)在看,還沒有誰能做到]
“科學上每走出一步,你發(fā)現(xiàn)前面還有十步不了解,見得越多發(fā)現(xiàn)不懂的更多。”搜狗CEO王小川在烏鎮(zhèn)向《第一財經日報》記者回憶他早年研究基因學的感受,每過幾年的重大發(fā)現(xiàn)都推翻了之前的結論。他覺得人工智能也是如此,在談到無人車等現(xiàn)有AI產品時,他會用“不太靠譜”來評價。
這似乎有點潑冷水的意思。剛剛感慨“人工智能在烏鎮(zhèn)大會上火得一塌糊涂”的小米董事長雷軍說,中國互聯(lián)網正在從模式創(chuàng)新進入技術創(chuàng)新階段。普遍看來,技術創(chuàng)新過去一直是硅谷的代名詞。但目前在國內,BAT均在人工智能領域進行布局,連業(yè)務相關度并不算高的媒體創(chuàng)始人丁磊也在潛心試水。
在清華讀書時就學習人工智能的王小川說,AI不是表面上那些酷炫的東西,真正的方向是讓機器做決策,具備人的推理能力,但現(xiàn)在看,還沒有誰能做到。“算法結構上的創(chuàng)新發(fā)明都是國外的,國內只不過看誰先把這些國外論文翻譯過來,最快用到應用中去。”在他眼中,國內外在人工智能上的差距還是很大的。
冷眼看AI
今年3月份,谷歌AlphaGo戰(zhàn)勝人類棋手時,王小川給公司放了一天假,慶祝人工智能的歷史性突破。放假那天是周一,這件事很快成為互聯(lián)網圈的談資,這一天還被戲稱為“狗勝節(jié)”。背后是這個38歲的“四川神童”對人工智能的執(zhí)著。
3個月過后,王小川來到英國倫敦拜訪DeepMind公司(谷歌母公司Alphabet所擁有的英國AI公司)的工程師,問當時機器輸?shù)舻谒木制鍟r究竟發(fā)生了什么?“不是程序有BUG,就是深度學習本身有瓶頸。”但對方用了3個月去復盤,仍沒有給出解決的答案。這給王小川留下一個深刻的印象,深度學習還是存在瓶頸的,未來AlphaGo會繼續(xù)出錯。
他拿無人車向記者舉例,以今天的技術,無人駕駛確實可以在它熟知的、較封閉的環(huán)境下應用,但在面對真正開放的環(huán)境時,無人駕駛的技術仍不夠安全。“這個場景只要它沒見過,可能就會犯嚴重的錯誤,就像AlphaGo下棋一樣會突然發(fā)瘋。”
互聯(lián)網大會上,百度的十幾輛藍色無人車在烏鎮(zhèn)路面上“秀肌肉”,這是國內無人車第一次在城市道路上測試行駛,出于監(jiān)管與安全方面的考慮,這條3公里長的道路是事先劃批的,但并不限制社會車輛通行。谷歌的無人車已經在路面上跑了五年,但遇到像極端天氣、前車突然變道等復雜路況時,仍難以精準地自動調整。規(guī)?;逃眠€很漫長。
就連自家發(fā)布的AI產品,王小川也透露出謹慎的態(tài)度。當時,他在烏鎮(zhèn)主持了一場匯聚海內外人工智能專家的移動互聯(lián)網論壇,他演講時,大屏幕上實時顯示出演講內容的中英文對照文字,本來戴著同聲傳譯耳機的斯坦福大學客座教授杰瑞·卡普蘭等老外摘下耳機,看屏幕上的文字理解。但不知是否出于緊張,王小川竟然忘了在臺上發(fā)布這款機器同傳產品,而這是全球首次基于神經網絡的實時機器翻譯技術在大型活動上做展示。
臺下,他一邊自責自己“邏輯好,記性差”,一邊針對這項技術對本報記者分析說,這就像火箭上天,不是每一次發(fā)射都能成功。因為實時處理對后臺算法模型的要求非常高。這個過程首先要求機器準確識別語音,一旦語音識別成文字這一步出錯了,后面的翻譯就更是差之千里。在他看來,在技術上第一步的語音識別比翻譯更難。
除了搜狗,阿里云、百度、科大訊飛等公司也在公開場合展示過實時語音識別,并均對外聲稱對中文語音識別的準確率達到了97%左右,但實際也出現(xiàn)過“演砸了”的時候。如果場景并不像會場那樣有序,或者演講者有較重的口音,現(xiàn)在還沒有一家公司敢將語音識別技術公開拿出來測試。
不只是輸入法的爭奪
目前,搜狗、百度、訊飛是第三方手機輸入法活躍用戶數(shù)的前三名,三家在語音識別上的多年布局,正在將手機輸入法帶進一個比拼人工智能水平的新階段。事實上,早在蘋果發(fā)布iPhone4S手機時,就隨機發(fā)布了人工智能Siri,但從這兩年實際使用反饋來看,Siri尚沒有達到用戶對這個智能機器人的期待。而微軟、谷歌、亞馬遜三家公司在該領域被看好。