每個(gè)受訪者平均用到了8.1種算法,這相比于 2011 的相似調(diào)查顯示的結(jié)果有了巨大的增長(zhǎng)。
相比2011年對(duì)數(shù)據(jù)分析算法的調(diào)查,我們注意到最常用的方法仍然是回歸,聚類,決策樹(shù)/規(guī)則以及可視化。比例增幅最大的是(增幅=%2016/%2011 -1):
- Boosting算法,提升了40%。由2011年的23.5%提升倒2016年的40%
- 文本挖掘(Text Mining),提升了30%。從27.7%提升到35.9%
- 可視化(Visualization),提升了27%。從38.3%提升到48.7%
- 時(shí)間序列/序列分析(Time series/Sequence analysis),提升了25%。從29.6%提升到37.0%
- 異常檢測(cè)(Anomaly/Deviation detection),提升了19%,從16.4%提升到19.5%
- 組合方法(Ensemble methods),提升了19%,從28.3%提升到33.6%
- 支持向量機(jī)(SVM),提升了18%,從28.6%提升到33.6%
- 回歸(Regression),提升了16%,從57.9%提升到67.1%
◆ ◆ ◆
2016年新秀中最為流行的是