《Modern Information Retrieval, Ricardo Baeza-Yates et al》. 1999
老書(shū),牛人。貌似第一本完整講述IR的書(shū)。可惜IR這些年進(jìn)展迅猛,這本書(shū)略有些過(guò)時(shí)了。翻翻做參考還是不錯(cuò)的。另外,Ricardo同學(xué)現(xiàn)在是Yahoo Research for Europe and Latin Ameria的頭頭。
《Pattern Classification (2ed)》, Richard O. Duda, Peter E. Hart, David G. Stork
大約也是01年左右的大塊頭,有影印版,彩色。沒(méi)讀完,但如果想深入學(xué)習(xí)ML和IR,前三章(介紹,貝葉斯學(xué)習(xí),線(xiàn)性分類(lèi)器)必修。
還有些經(jīng)典與我只有一面之緣,沒(méi)有資格評(píng)價(jià)。另外還有兩本小冊(cè)子,論文集性質(zhì)的,倒是講到了了不少前沿和細(xì)節(jié),諸如索引如何壓縮之類(lèi)。可惜忘了名字,又被我壓在箱底,下次搬家前怕是難見(jiàn)天日了。
(呵呵,想起來(lái)一本:《Mining the Web - Discovering Knowledge from Hypertext Data》 )
說(shuō)一本名氣很大的書(shū):《Data Mining: Practical Machine Learning Tools and Techniques》。Weka 的作者寫(xiě)的??上?nèi)容一般。理論部分太單薄,而實(shí)踐部分也很脫離實(shí)際。DM的入門(mén)書(shū)已經(jīng)不少,這一本應(yīng)該可以不看了。如果要學(xué)習(xí)了解 Weka ,看文檔就好。第二版已經(jīng)出了,沒(méi)讀過(guò),不清楚。
信息檢索方面,Du Lei 同學(xué)再次推薦:
信息檢索方面的書(shū)現(xiàn)在建議看Stanford的那本《Introduction to Information Retrieval》,這書(shū)剛剛正式出版,內(nèi)容當(dāng)然up to date。另外信息檢索第一大牛Croft老爺也正在寫(xiě)教科書(shū),應(yīng)該很快就要面世了。據(jù)說(shuō)是非常pratical的一本書(shū)。
對(duì)信息檢索有興趣的同學(xué),強(qiáng)烈推薦翟成祥博士在北大的暑期學(xué)校課程,這里有全slides和閱讀材料:http://net.pku.edu.cn/~course/cs410/schedule.html
maximzhao 同學(xué)推薦了一本機(jī)器學(xué)習(xí):
加一本書(shū):Bishop, 《Pattern Recognition and Machine Learning》. 沒(méi)有影印的,但是網(wǎng)上能下到。經(jīng)典中的經(jīng)典。Pattern Classification 和這本書(shū)是兩本必讀之書(shū)。《Pattern Recognition and Machine Learning》是很新(07年),深入淺出,手不釋卷。
最后,關(guān)于人工智能方面(特別地,決策與判斷),再推薦兩本有意思的書(shū),
一本是《Simple Heuristics that Makes Us Smart》
另一本是《Bounded Rationality: The Adaptive Toolbox》
不同于計(jì)算機(jī)學(xué)界所采用的統(tǒng)計(jì)機(jī)器學(xué)習(xí)方法,這兩本書(shū)更多地著眼于人類(lèi)實(shí)際上所采用的認(rèn)知方式,以下是我在討論組上寫(xiě)的簡(jiǎn)介:
這兩本都是德國(guó)ABC研究小組(一個(gè)由計(jì)算機(jī)科學(xué)家、認(rèn)知科學(xué)家、神經(jīng)科學(xué)家、經(jīng)濟(jì)學(xué)家、數(shù)學(xué)家、統(tǒng)計(jì)學(xué)家等組成的跨學(xué)科研究團(tuán)體)集體寫(xiě)的,都是引起領(lǐng)域內(nèi)廣泛關(guān)注的書(shū),尤其是前一本,後一本則是對(duì) Herbert Simon (決策科學(xué)之父,諾獎(jiǎng)獲得者)提出的人類(lèi)理性模型的擴(kuò)充研究),可以說(shuō)是把什么是真正的人類(lèi)智能這個(gè)問(wèn)題提上了臺(tái)面。核心思想是,我們的大腦根本不能做大量的統(tǒng)計(jì)計(jì)算,使用fancy的數(shù)學(xué)手法去解釋和預(yù)測(cè)這個(gè)世界,而是通過(guò)簡(jiǎn)單而魯棒的啟發(fā)法來(lái)面對(duì)不確定的世界(比如第一本書(shū)中提到的兩個(gè)后來(lái)非常著名的啟發(fā)法:再認(rèn)啟發(fā)法(cognition heuristics)和選擇最佳(Take the Best)。當(dāng)然,這兩本書(shū)并沒(méi)有排斥統(tǒng)計(jì)方法就是了,數(shù)據(jù)量大的時(shí)候統(tǒng)計(jì)優(yōu)勢(shì)就出來(lái)了,而數(shù)據(jù)量小的時(shí)候統(tǒng)計(jì)方法就變得非常糟糕;人類(lèi)簡(jiǎn)單的啟發(fā)法則充分利用生態(tài)環(huán)境中的規(guī)律性(regularities),都做到計(jì)算復(fù)雜性小且魯棒。
關(guān)于第二本書(shū)的簡(jiǎn)介:
1. 誰(shuí)是 Herbert Simon
2. 什么是 Bounded Rationality
3. 這本書(shū)講啥的:
我一直覺(jué)得人類(lèi)的決策與判斷是一個(gè)非常迷人的問(wèn)題。這本書(shū)簡(jiǎn)單地說(shuō)可以看作是《決策與判斷》的更全面更理論的版本。系統(tǒng)且理論化地介紹人類(lèi)決策與判斷過(guò)程中的各種啟發(fā)式方法(heuristics)及其利弊(為什么他們是最優(yōu)化方法在信息不足情況下的快捷且魯棒的逼近,以及為什么在一些情況下會(huì)帶來(lái)糟糕的后果等,比如學(xué)過(guò)機(jī)器學(xué)習(xí)的都知道樸素貝葉斯方法在許多情況下往往并不比貝葉斯網(wǎng)絡(luò)效果差,而且還速度快;比如多項(xiàng)式插值的維數(shù)越高越容易o(hù)verfit,而基于低階多項(xiàng)式的分段樣條插值卻被證明是一個(gè)非常魯棒的方案)。
2/3 首頁(yè) 上一頁(yè) 1 2 3 下一頁(yè) 尾頁(yè)