張首晟,斯坦福大學(xué)物理系教授,“歐洲物理獎”獲得者,美國藝術(shù)與科學(xué)院2011年新增院士。張首晟于2006年提出拓撲絕緣體理論的材料實現(xiàn)方案,將其基于芯片業(yè)未來提出的新構(gòu)想——通過控制電子的自旋運動來降低能耗——在理論上完成了預(yù)言。2007年,這一理論預(yù)言在他與德國維爾茨堡大學(xué)實驗小組通過實驗證實。2012年8月張首晟教授榮獲國際理論物理學(xué)領(lǐng)域最高獎“狄拉克獎”。2013得獲國際基礎(chǔ)物理學(xué)前沿獎。
通常的電子在硅片里面的運動完全是雜亂無章的。“量子自旋霍爾效應(yīng)”找到了電子自轉(zhuǎn)方向與電流方向之間的規(guī)律,利用這個規(guī)律可以使電子以新的姿勢非常有序地運動,“就像高速公路,分車道里行駛的車輛一樣”,張首晟教授說。“這樣能量耗散會降到很低。”這一物理發(fā)現(xiàn)有可能給未來的信息革命帶來重大影響,電腦甚至量子計算都將隨之發(fā)生巨大改變。張首晟教授也提出:“可能在十年后目前的半導(dǎo)體技術(shù)潛力用完之時,會出現(xiàn)基于量子自旋霍爾效應(yīng)的新一代電腦。”
正如在《復(fù)蘇》(renewal)一書中,特拉維斯·吉布斯提出的,“遺傳,就是要我們記住那些已經(jīng)奏效的東西。”張首晟也認為,“人之所以能夠具備智能,是通過幾百萬年的進化。今天大腦那么聰明,其實也是經(jīng)過大數(shù)據(jù)的訓(xùn)練。計算機沒有發(fā)展那么長的時間,只能用整個空間的分布來縮短它進化的時間?,F(xiàn)在通過大數(shù)據(jù)和機器學(xué)習(xí),我們可以加速的實現(xiàn)這個進化。”
張教授認為,人類的大腦,因為它的儲存量到底不是那么大,所以它對信息、數(shù)據(jù)有個篩選的過程,大腦是做的特別好。“其實我們?nèi)送浭虑?,是很重要的功能。今天對于大?shù)據(jù),如何對涌進來大量數(shù)據(jù)進行預(yù)處理也是關(guān)鍵。”張教授說。“事實上因特網(wǎng)現(xiàn)在要做的事情,很重要的也是對于知識的排序和管理。”他舉例說,谷歌之所以成功,最早期開發(fā)的pagerank功能很重要,它就是一個排序的功能。“今天對大數(shù)據(jù),對知識,怎么對它進行有效地管理,也是最重要的事情??赡芫S基百科通過人工在做的一些,可能還需要更深層,比如說知識圖譜,谷歌的pagerank只是一維的評價。”張教授說。
為什么要管理和整合這些數(shù)據(jù),張教授說:“2012年,我在斯坦福專門開的一門課上,我曾講了一個挺有趣的故事。我說2012年,正是預(yù)言的‘世界末日’,聯(lián)想到了諾亞方舟的故事。諾亞方舟當(dāng)時是洪水,現(xiàn)在大數(shù)據(jù)帶來很多好處,同時也像一場大的洪水。你一定要在那么多的數(shù)據(jù)里面,通過它總結(jié)出最高的智能(知識),還要能夠有個智能的排序。所以,現(xiàn)在碰到最有趣的問題就是怎么自動的來整合、管理這些數(shù)據(jù)。”
張首晟認為,機器學(xué)習(xí)(deep learnnig)具有很大得空間。他提出,最近一些主要的發(fā)明,都是在這個算法上的一些發(fā)明。正如人的學(xué)習(xí)具有不同的抽象的層次,機器也是一樣的。比如機器下棋為什么難?按理說如果有一個計算機,我就可以將所有步驟的可能性全算出來,但是這些計算其實是指數(shù)增長的。隨著棋盤的大小,復(fù)雜性也是指數(shù)的增長。即便今天,我們計算機的能力這樣增長,遇到指數(shù)增長的問題,我們還是要找到一些非常巧妙,比較近似的,但是基本上對這個問題解決的比較好的方法。
就像“谷歌翻譯”就的確是一個非常重大的發(fā)明,張教授說:“本來學(xué)自然語言,都是要有很多專家對語言的理解。現(xiàn)在一個數(shù)學(xué)模型做完了之后,谷歌通過掃描,把幾乎所有的圖書數(shù)據(jù)存儲過來,機器通過程序慢慢自己分析這個語法。計算機看了之后,有了這個感覺之后有這個語法,有這個語法的概念在后面。”(這也是大數(shù)據(jù)全量數(shù)據(jù)和相關(guān)性的體現(xiàn)。)
“本來機器翻譯就是有兩派不同的思潮,有一派的思潮就是說我要把語法、知識怎么灌輸?shù)綑C器里面去;現(xiàn)在就是谷歌說忘掉語法,通過寫一個好的學(xué)習(xí)程序,讓機器看那么多的東西,讓它自動總結(jié)出這個語法的概念。”張教授認為:這個時代之所以那么激動人心,就是我們兩件事情在同時做。一個在理解人的腦子,還有一個是想通過大數(shù)據(jù),拓展人類的智能。機器和人互相反饋,也許能催生新的科學(xué)大發(fā)現(xiàn)。
最簡單的,他距離說就像自己做研究的時候,最想要的就是計算機能夠根據(jù)自己以前看的論文,根據(jù)看文章的習(xí)慣,自己寫的論文,以及做的筆記,可以到全網(wǎng)絡(luò)上去找,計算機知道他理解問題的風(fēng)格,知道他對什么東西感興趣,如果能夠經(jīng)常給他一些好的文章或論著,反饋給他,他我就可能做出更多的成果。事實上通過這樣的例子,張首晟覺得人的智能和機器的智能是可以互動的。
甚至人和機器的智能還能互相提升,張首晟同樣以谷歌的例子,闡釋和人和機器怎樣能夠在智能提升上達到一個雙贏。他說谷歌圖書擁有很多的書。但是在掃描這么多書的時候,就會有一些錯誤,機器怎么也辨識不出來,這是一個問題;另外還有一個看似截然不同的問題,就是很多人會通過計算機去攻擊一些網(wǎng)站。因而說我們?nèi)ム]箱,或者銀行賬號登錄的時候,就可能會讓你填幾個驗證碼,這些驗證碼最好要是計算機認不出來的東西,只有人才能認出來??仿〈髮W(xué)就想出一個辦法,把這兩個東西放在一起:就是在谷歌圖書掃描的時候,發(fā)現(xiàn)有一些認不準(zhǔn)的,它就放到諸如銀行頁面登錄驗證的地方讓人來認,本來這個問題一個是矛,一個是盾,現(xiàn)在兩個東西放在一起就解決了這個問題。同時給出兩個,一個是計算機本來已經(jīng)知道的,故意模糊化一下,;還有一個谷歌在掃描書的時候也認不準(zhǔn)的,最終對比大家提交的答案,大部分人相同的可能就是正確的。這個其實是一個很好的例子。兩個難題通過這種大數(shù)據(jù)方式得到了一種相對簡單的,比較好的解決方案。