一、一場(chǎng)以大數(shù)據(jù)為核心的智能盛宴
時(shí)下仿佛大家都在談人工智能,就像當(dāng)年人人都在談大數(shù)據(jù)一樣。在不同場(chǎng)合上,阿里巴巴的馬云、百度的李彥宏及騰訊的馬化騰分別談過自己對(duì)人工智能的看法和觀點(diǎn)。這種對(duì)話有點(diǎn)兒像金庸小說中的華山論劍。到底是氣宗( 大數(shù)據(jù))還是劍宗(人工智能)更有戰(zhàn)略意義?我認(rèn)為,兩者是相輔相成的。經(jīng)歷了互聯(lián)網(wǎng)20 年的發(fā)展,我們已經(jīng)積累了足夠多的數(shù)據(jù)去驅(qū)動(dòng)一場(chǎng)“智能盛宴”,以大數(shù)據(jù)為核心的人工智能漸露端倪。
有一天晚上準(zhǔn)備睡覺時(shí),聽到隔壁傳來女兒跟蘋果智能語音助手Siri 對(duì)話的聲音。我太太問我,這樣正常嗎?我告訴她不用擔(dān)心,這是目前的趨勢(shì)。根據(jù)不久前美國“用戶普及率調(diào)查”的結(jié)果,語音助手的使用已經(jīng)達(dá)到引爆點(diǎn),并在走向大規(guī)模普及的階段。
前段時(shí)間,我在美國舊金山就拜訪了Semantic Machines 的創(chuàng)始人兼CEO 丹· 羅斯(Dan Roth),這家公司的成員很多都是Siri 和Echo 的幕后功臣。如今,羅斯領(lǐng)導(dǎo)著一個(gè)匯集了自然語言處理、語義理解、會(huì)話計(jì)算等領(lǐng)域?qū)<业捻敿?jí)團(tuán)隊(duì),目標(biāo)是攻破人機(jī)對(duì)話領(lǐng)域這個(gè)老大難的題目。
羅斯把他們正在研發(fā)的革命性技術(shù)稱為對(duì)話式人工智能(Conversational AI)。與Siri 相比,這種技術(shù)能夠更真實(shí)地了解用戶本人的意圖,哪怕用戶從一個(gè)話題跳到另一個(gè)話題,又或者說的話不完整、不連貫,而這些正是人類對(duì)話的自然特點(diǎn)。這些特點(diǎn)正是目前這類技術(shù)的難點(diǎn)所在,相信了解破解自然語言難度的人都清楚,這項(xiàng)研究一旦成功,必然會(huì)改變世界。
2010 年,“數(shù)據(jù)科學(xué)家”這個(gè)稱謂的發(fā)明者帕蒂爾(D.J.Patil)和杰夫· 哈默巴赫(Jeff Hammerbacher)認(rèn)為,一切應(yīng)該以產(chǎn)品為中心,從數(shù)據(jù)獲取、數(shù)據(jù)清洗、搭建和管理數(shù)據(jù)設(shè)施、原型開發(fā)、產(chǎn)品設(shè)計(jì)等方面,去實(shí)踐數(shù)據(jù)的價(jià)值。我在阿里就經(jīng)歷了從“數(shù)據(jù)產(chǎn)品”到“數(shù)據(jù)作為產(chǎn)品”的階段,后者其實(shí)才是大數(shù)據(jù)的真正產(chǎn)物,也是人工智能的源泉。
二、誰掌握“完美信息”,誰就將擁有整個(gè)世界
剛開始進(jìn)入數(shù)據(jù)行業(yè)時(shí),我一直秉承著這樣一個(gè)理念:在“假設(shè)數(shù)據(jù)都是可獲取的”基礎(chǔ)上,思考問題。隨著整個(gè)社會(huì)數(shù)據(jù)化程度的進(jìn)一步加深,以及人與物之間的高度互聯(lián),以前很多信息的盲點(diǎn)被快速解開。由不同領(lǐng)域積累下的數(shù)據(jù)形成的“完美信息”漸露端倪,這其實(shí)是一個(gè)數(shù)據(jù)從量變到質(zhì)變的過程。這一“完美信息”具有無限潛能,足以讓人工智能所向披靡,催生各種智能場(chǎng)景,并讓其如潮涌至。智能時(shí)代,秉承“假設(shè)數(shù)據(jù)都是可獲取的”這一思維方式,才可讓你比別人更勝一籌,從而做到心中有數(shù)。
我在阿里時(shí)就曾參與設(shè)計(jì)了一款智能營銷工具 “Look-Alike”。通過機(jī)器學(xué)習(xí),我們可以利用過去積累的客戶消費(fèi)特征(每個(gè)客戶有高達(dá)上萬個(gè)標(biāo)簽),作出精準(zhǔn)推送廣告的決策。有別于過去的廣告規(guī)劃,我們不會(huì)問廣告主如何描述其目標(biāo)客戶群,而是讓廣告主給出500 個(gè)喜歡某品牌的用戶名單,我們就可以幫他找出5 000 個(gè),甚至5 萬個(gè)類似的客戶。這種方法可以在幾個(gè)小時(shí)之內(nèi)快速“掃描”出最有效的營銷方案。通過這項(xiàng)技術(shù),我們基本可以實(shí)現(xiàn)讓廣告主喜出望外的精準(zhǔn)廣告投放效果。但問題是,這種產(chǎn)品真的能為廣告業(yè)及阿里帶來新的價(jià)值嗎?這還只是大數(shù)據(jù)革命的開端,大家可以拭目以待!
現(xiàn)實(shí)中,我們從數(shù)據(jù)收集、整合、判斷,以至行動(dòng)、再到反饋的過程并不完美,而形成數(shù)據(jù)閉環(huán)系統(tǒng)的阻力往往是人為因素居多。谷歌無人駕駛汽車項(xiàng)目的偉大之處正是給了我們重要的啟發(fā),讓我們意識(shí)到自動(dòng)化及智能化所需要的數(shù)據(jù)閉環(huán)系統(tǒng)是如何做到了既封閉又開放,其中的里應(yīng)外合正是未來的發(fā)展趨勢(shì)。我在阿里就經(jīng)歷了4 個(gè)不同階段:數(shù)據(jù)驅(qū)動(dòng)決策、數(shù)據(jù)驅(qū)動(dòng)流程、數(shù)據(jù)驅(qū)動(dòng)產(chǎn)品、數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)。在此過程中,你會(huì)發(fā)現(xiàn),數(shù)據(jù)驅(qū)動(dòng)的目標(biāo)越模糊、數(shù)據(jù)越零散、人的互動(dòng)環(huán)節(jié)越多,智能項(xiàng)目開展起來就越吃力。
三、從數(shù)據(jù)戰(zhàn)略到數(shù)據(jù)治理,別讓數(shù)據(jù)成為累贅
如前所述,數(shù)據(jù)資源的積累是發(fā)展數(shù)字經(jīng)濟(jì)的前提。企業(yè)在向往智能時(shí)代所帶來的機(jī)遇的同時(shí),更要為企業(yè)的未來目標(biāo)制定數(shù)據(jù)戰(zhàn)略。企業(yè)不僅要關(guān)注自己現(xiàn)在有什么數(shù)據(jù),更要了解未來會(huì)欠缺什么。然后,再去探討欠缺的部分有多少可以靠自己補(bǔ)充,有多少需要求助他人、與他人合作以實(shí)現(xiàn)補(bǔ)充。有人把數(shù)據(jù)比喻為電能,這個(gè)比喻很生動(dòng),但與電能不一樣的是,數(shù)據(jù)是可以被重復(fù)使用的。