Fregata項目名稱的中文是軍艦鳥,TalkingData的開源項目命名都是用的鳥名,而軍艦鳥是世界上飛得最快的鳥,最高時速達(dá)到418km/小時,體重最大1.5公斤,而翼展能夠達(dá)到2.3米,在全球分布也很廣泛。我們希望Fregata項目能夠像軍艦鳥一樣,體量輕盈,但是能夠支持大規(guī)模,高效的機器學(xué)習(xí),而且具有很強的適用性。目前Fregata還是只雛鳥, 期望未來能夠成長為一只展翅翱翔的猛禽。
引用
- Cheng T. Chu, Sang K. Kim, Yi A. Lin, Yuanyuan Yu, Gary R. Bradski, Andrew Y. Ng, Kunle Olukotun, Map-Reduce for Machine Learning on Multicore, NIPS, 2006.
- https://www.zhihu.com/question/48282030
- https://github.com/TalkingData/Fregata
- http://arxiv.org/abs/1611.03608
- http://www.ibm.com/developerworks/cn/analytics/library/ba-1603-random-decisiontree-algorithm-1/index.html
- http://www.ibm.com/developerworks/cn/analytics/library/ba-1603-random-decisiontree-algorithm-2/index.html
- Rosenblatt J D, Nadler B. On the optimality of averaging in distributed statistical learning[J]. Information and Inference, 2016: iaw013 MLA
- https://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/binary.html#epsilon
- https://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/
作者介紹
張夏天:TalkingData首席數(shù)據(jù)科學(xué)家,12年大規(guī)模機器學(xué)習(xí)和數(shù)據(jù)挖掘經(jīng)驗,對推薦系統(tǒng)、計算廣告、大規(guī)模機器學(xué)習(xí)算法并行化、流式機器學(xué)習(xí)算法有很深的造詣;在國際頂級會議和期刊上發(fā)表論文12篇,申請專利9項;前IBM CRL、騰訊、華為諾亞方舟實驗室數(shù)據(jù)科學(xué)家;KDD2015、DSS2016國際會議主題演講;機器學(xué)習(xí)開源項目Dice創(chuàng)始人。