
在科學(xué)技術(shù)剛剛萌芽的時候,科學(xué)家Blaise Pascal和Von Leibniz就想到了有朝一日能夠?qū)崿F(xiàn)人工智能。即讓機器擁有像人一樣的智能。
機器學(xué)習(xí)是AI中一條重要的發(fā)展線,在工業(yè)界和學(xué)術(shù)界都異?;鸨F髽I(yè)、大學(xué)都在投入大量的資源來做機器學(xué)習(xí)方面的研究。最近,機器學(xué)習(xí)在很多任務(wù)上都有了重大的進步,達到或者超越了人類的水平(例如,交通標志的識別[1],ML達到了98.98%,已超越了人類)。
圖1中展示了ML的一個粗略的時間線,標記了很多里程碑。熟悉該圖,閱讀下文會覺得順暢很多。
機器學(xué)習(xí)簡史
機器學(xué)習(xí)和計算機視覺相關(guān)的數(shù)學(xué)
什么是機器學(xué)習(xí)技術(shù)?
機器學(xué)習(xí)和文本分析
推動機器學(xué)習(xí)流行化的第一個舵手是Hebb,1949年他提出了神經(jīng)心理學(xué)學(xué)習(xí)范式——Hebbian學(xué)習(xí)理論。經(jīng)過簡單的擴展,該理論就開始研究遞歸神經(jīng)網(wǎng)絡(luò)的節(jié)點之間的相關(guān)度,它記錄下網(wǎng)絡(luò)上的共性然后像記憶一樣工作,正式的表達是這樣:
假設(shè)反射活動的持久性或重復(fù)性可以誘導(dǎo)細胞發(fā)生變化,以適應(yīng)這種活動…當(dāng)神經(jīng)元細胞A距離神經(jīng)元細胞B足夠近時,它就可以持續(xù)重復(fù)的激活B,那么這兩個細胞之一或者全部就會發(fā)生一些代謝過程或生長變化來提高效率[1]。
1952年,IBM的Arthur Samuel寫出了西洋棋程序,該程序可以通過棋盤狀態(tài)學(xué)習(xí)一個隱式的模型來為下一步給出較好的走法。Samuel和程序?qū)?zhàn)多局后,覺得這個程序經(jīng)過一定時間的學(xué)習(xí)后可以達到很高的水平。
用這個程序,Samual駁倒了機器不能像人類那樣可以學(xué)習(xí)顯式代碼之上的模式。他定義并解釋了一個新詞——機器學(xué)習(xí)。
機器學(xué)習(xí)是給計算機一種不用顯式編程就能獲得能力的領(lǐng)域。
1957年,Rosenblatt的感知器算法是第二個有著神經(jīng)系統(tǒng)科學(xué)背景的機器學(xué)習(xí)模型,它與今天的ML模型已經(jīng)很像了。在當(dāng)時,感知器的出現(xiàn)引起了不小的轟動,因為它比Hebbian的想法更容易實現(xiàn)。Rosenblatt用下面的話向大家闡釋感知器算法:
感知器算法的作用是,在不用深入理解只對一些特定生物有機體有效的未知條件的前提下,說明了通用智能系統(tǒng)一些基礎(chǔ)特點[2]。
3年之后,Widrow [4] 因發(fā)明Delta學(xué)習(xí)規(guī)則而載入ML史冊,該規(guī)則馬上就很好的應(yīng)用到了感知器的訓(xùn)練中,對,沒錯,就是現(xiàn)在常見的最小二乘問題。感知器和Delta學(xué)習(xí)規(guī)則的聯(lián)姻著實構(gòu)造了一個極好的線性分類器。但是,根據(jù)后浪拍死前浪的歷史規(guī)律,感知器的熱度在1969被Minskey[3]一盆冷水潑滅了。他提出了著名的XOR問題,論證了感知器在類似XOR問題的線性不可分數(shù)據(jù)的無力。對神經(jīng)網(wǎng)絡(luò)(NN)社區(qū)來說,形成了幾乎當(dāng)時看來幾乎不可逾越的鴻溝,史稱“明斯基之印”。然而無論如何,在10年的19世紀80年代,NN學(xué)者們還是打破了這個緊箍咒。

圖 2 XOR問題-線性不可分數(shù)據(jù)示例
被封印后,ML的發(fā)展幾乎停滯,盡管BP的思想在70年代就被Linnainmaa [5] 以“自動微分的翻轉(zhuǎn)模式”被提出來,但直到1981年才被Werbos [6]應(yīng)用到多層感知器(MLP)中,直到現(xiàn)在仍是神經(jīng)網(wǎng)絡(luò)架構(gòu)的關(guān)鍵組成部分。多層感知器和BP算法的出現(xiàn),促成了第二次神經(jīng)網(wǎng)絡(luò)大發(fā)展,1985-1986年NN研究者們成功的實現(xiàn)了實用的BP算法來訓(xùn)練MLP。(Rumelhart, Hinton, Williams [7]- Hetch, Nielsen[8])

圖 3 來自Hetch和Nielsen
花開并蒂,各表一枝。另一個同樣很著名的ML算法在1986年被J. R. Quinlan[9]提出,即決策樹算法,具體來說是ID3算法。這是機器學(xué)習(xí)的另一條主流中一個燈塔式的成就。ID3以其簡單的規(guī)則和明確的推理,解決了很多現(xiàn)實世界的問題,實際上,它就是以一個實用軟件的姿態(tài)出現(xiàn)的,相對于黑箱子般的NN算法。
ID3之后,很多其他的算法或改進如雨后春筍般的出現(xiàn),例如ID4,回歸樹,CART等等)。直到現(xiàn)在,決策樹仍然是ML界中的熱點。
