人類從未對自己的認知能力滿意過。也正因為此,過目不忘,一目十行,上知天文下知地理,一直被看做是人類進階版本的一個典范。
計算機早就做到了這一點。
最近,在阿里巴巴的數(shù)據(jù)開放日中,我會面了數(shù)位數(shù)據(jù)科學家。當他們描述大數(shù)據(jù)未來能力的時候,我就會想到人類的局限。認知科學的未來,必然是計算機與人類的完美結合。但是,這個結合,應該是什么樣的?
數(shù)據(jù)越來越多,而人類的解讀能力是固定的,人會累,會無法完全理性。但是計算機不會。計算機可以幫助人類找到自己的盲點。IBM Watson實驗室的首席工程師Bowen Zhou告訴我,在Watson的醫(yī)療項目中,人類要閱讀十年的論文,計算機只需要30分鐘就可以讀完。曾任職Axciom的徐玲告訴我,在非常早期的時候,美國兩個很大的圖書館,以及梵蒂岡圖書館的數(shù)據(jù)化已經(jīng)完成了。
這兩件事都指向一個結論:當我們找到的科技能力,正好能彌補人類的缺點,這之間隱藏著巨大的價值。實現(xiàn)的關鍵在于數(shù)據(jù)化。數(shù)據(jù)化讓計算機和人類得以溝通和結合。
記憶力一直不是人類最關鍵的東西,甚至說,是最薄弱的一環(huán)。邏輯,才是人類的認知關鍵,邏輯的產(chǎn)生源于經(jīng)驗的積累和推演。如果計算機能夠幫助人類獲取更多的經(jīng)驗,將有助于更強大邏輯的產(chǎn)生。
我曾經(jīng)非常喜歡Evernote這個應用軟件。它可以記錄我所有片段的思考,同時收藏資料和文章。如果有一天,這個軟件可以通過“機器學習”我的記錄文檔,向我推薦值得閱讀的資料,幫助我瞬間搜索信息,提煉觀點,是否將會改變?nèi)祟惖恼J知習慣?
未來有可能實現(xiàn)么?至少眼下,我們已經(jīng)看到了一些進展,數(shù)據(jù)正在幫助我們看到盲點。我總結了數(shù)據(jù)開放日中各路英雄的核心觀點,希望能夠對你有所啟發(fā)。
NO 1 認知科學可能是未來很關鍵的能力
未來數(shù)據(jù)的價值不在于多少,而在于你是否有提煉的能力。Watson正在推進的健康項目中,計算機能夠做到通過大數(shù)據(jù)來判斷未來治療的癌癥方向,并且就此判斷更為精準的治療方法。
以往我們是怎么做的呢?我們成千上萬的醫(yī)療專家,通過閱讀和研究大量的文獻、實驗和試錯,推演出可能的方向。這需要消耗十年,甚至更長的時間。而計算機只需要三十分鐘就可以閱讀完所有的相關文獻,迅速判斷有用信息。這是用認知科學來節(jié)省人類在醫(yī)療方面的時間和精力。
NO 2 紅酒與壽司:整合“實時數(shù)據(jù)”與“歷史數(shù)據(jù)”
將“實時數(shù)據(jù)”與“歷史數(shù)據(jù)”整合已經(jīng)成為了業(yè)界共識。徐玲這樣比喻說,“歷史數(shù)據(jù)”如同紅酒,越陳越好。“實時數(shù)據(jù)”如同壽司,越新鮮越好,兩者搭配,乃是絕妙。
而今我們對數(shù)據(jù)的處理上,也需要面對“實時數(shù)據(jù)”和“歷史數(shù)據(jù)”結合的問題。舉個例子,如果你在淘寶搜索茶葉,推薦系統(tǒng)應該從歷史數(shù)據(jù)中推薦各式茶葉,還是應該結合當前你的購物車數(shù)據(jù),推薦更適合你的偏好品牌?
數(shù)據(jù)的結合并不容易,不僅要求不同數(shù)據(jù)的格式和標準統(tǒng)一化,更要求對于歷史數(shù)據(jù)與新數(shù)據(jù)結合后所產(chǎn)生對當下的理解和認知。
“就像是開飛機,我們通過歷史數(shù)據(jù)來判斷航道,但當時的風和氣候都很重要對駕駛有影響。實時數(shù)據(jù)越對你敏感,就價值越高。最終你通過設定預期軌跡和實時調整,獲得了最安全高效省錢的結果。實時和歷史數(shù)據(jù)的結合意味著更好的計劃和更快的反應。”
NO3 大數(shù)據(jù)也需要人的互補
Aaron Ling是Ancestry公司的總工程師,他在論壇上畫了一個巨大的家族譜系圖。這就是他正在做的項目,用大數(shù)據(jù)來清晰美國的家族圖譜。人們通過網(wǎng)站查閱相關的家族譜系,然后通過UGC的方式給出修改或者添加數(shù)據(jù)。這個模式將可能會對未來的醫(yī)療以及社會研究產(chǎn)生巨大的影響。
這個項目證明了大數(shù)據(jù)推演出的結果有時候也需要人的互補。因為經(jīng)過人的信息互動,才有可能產(chǎn)生超出于人類的東西。人的互動可以讓大數(shù)據(jù)變得更靈活,更實在。
在實際操作中,我們可能會遇到這樣的情況:盡管你擁有很多數(shù)據(jù),但是你還是無法獲得某個人的完整網(wǎng)絡行為信息。所以我們需要用一些算法把這個“數(shù)據(jù)漏洞”填住。來自Samsung的演講嘉賓Junlin Hu這樣形容這種困惑:“如果我們把人看做一個個的列,你會發(fā)現(xiàn)每個人其實沒買多少東西,大部分商品和人之間的連接是空白的。”