“在過去,我們處理幾千條記錄的時(shí)候不是特別難。但是,當(dāng)數(shù)據(jù)量達(dá)到數(shù)十億條記錄的時(shí)候我們就需要真本事來得到一個(gè)規(guī)范的格式,以便我們進(jìn)一步做回歸或機(jī)器學(xué)習(xí)”他說。“對(duì)于這種情況,我想要聘請(qǐng)的是一名掌握python或者是C、Perl、Ruby亦或是一門更多做數(shù)據(jù)處理而不是做數(shù)據(jù)分析的語言的數(shù)據(jù)科學(xué)家”。