為了更清楚地展示這些差異,我們用一個公式來計算不同職業(yè)類型的算法使用率偏倚:
偏倚=某種職業(yè)類型的算法使用率/所有職業(yè)類型的算法使用率-1

圖2:不同場所的算法使用率偏倚
我們注意到,產(chǎn)業(yè)數(shù)據(jù)科學家們更傾向于用回歸,可視化,統(tǒng)計,隨機森林和時間序列。政府/非盈利組織則更傾向于使用可視化,主成分分析和時間序列。學術界的研究人員們更多的用到主成分分析和深度學習。學生們普遍使用的算法較少,但多用到文本挖掘和深度學習。
接下來,我們看看某一具體地域的參與度,表示整體的KDnuggets用戶。