很多企業(yè)都紛紛開始關(guān)注大數(shù)據(jù)和數(shù)據(jù)分析,但是人才難尋啊!事實上,要把一個編程新人訓(xùn)練成一個能力卓越的數(shù)據(jù)科學(xué)家是一件很簡單的事,只需要幾臺云計算服務(wù)器,然后再跟數(shù)據(jù)專家在網(wǎng)上學(xué)上幾周機器學(xué)習(xí)就可以了。
最著名的數(shù)據(jù)科學(xué)家培養(yǎng)案例要數(shù)“企業(yè)預(yù)測解決方案平臺”Kaggle上最近的一次大獎得主Carter S。這名Kaggle用戶利用簡單但是效率非常高的方法開發(fā)出了一款“過度殺傷型”分析工具來預(yù)測保險行業(yè)的風(fēng)險。
這是一款讓人感到驚奇的工具,Carter將自己在網(wǎng)絡(luò)課堂上學(xué)到的內(nèi)容用于保險行業(yè)風(fēng)險預(yù)測,并以此找到了好工作。他之前學(xué)過自然語言處理和社交網(wǎng)絡(luò)分析,所以大數(shù)據(jù)分析根本就難不倒他。但是怎么把那些干剛走出大學(xué)校園而且還沒有經(jīng)驗的畢業(yè)生培養(yǎng)成大數(shù)據(jù)科學(xué)家呢?網(wǎng)絡(luò)課堂速成即可!
Luis Tandalla在Coursera等網(wǎng)絡(luò)課堂上學(xué)習(xí)了一些免費課程之后,就利用自己所學(xué)的知識在Kaggle的比賽上獲了獎,他的作品可以幫助教師批改簡單題并評分。而他此前根本就不知道人工智能和機器學(xué)習(xí)是什么東西。
Luis Tandalla說要做數(shù)據(jù)科學(xué)家,首先要有學(xué)習(xí)的激情。所以他就在Coursera上選修了自然語言處理和概率模版課程,然后邊學(xué)邊在Kaggle上實踐自己的觀點。他將于明年畢業(yè),取得機械工程學(xué)士學(xué)位,而非大家想象中的計算機科學(xué)專業(yè)。他說自己畢業(yè)后想創(chuàng)立一家自己的預(yù)測軟件服務(wù)公司。
Tandalla可能不是唯一的例子。Kaggle上的獲獎?wù)叽蠖荚贑oursera上學(xué)習(xí)了機器學(xué)習(xí)課程。新加坡人Xavier Conort去年決心轉(zhuǎn)型數(shù)據(jù)科學(xué)家,他通過在網(wǎng)絡(luò)課堂學(xué)習(xí),僅僅用了一年的時間久成了Kaggle上數(shù)一數(shù)二的數(shù)據(jù)科學(xué)家。
數(shù)據(jù)分析領(lǐng)路人
Andrew Ng,斯坦福大學(xué)教授、Coursera聯(lián)合創(chuàng)始人之一。他在Coursera上教授的機器學(xué)期課程是所有網(wǎng)絡(luò)選修課程中完成度最高,這不僅僅是一個巧合。如果你想進(jìn)跟大數(shù)據(jù)步伐,成為一個數(shù)據(jù)科學(xué)家,在本國沒有優(yōu)勢資源的情況下,可以考慮Coursera、Udacity、EdX等網(wǎng)絡(luò)課堂,免費進(jìn)行學(xué)習(xí)。在中國,許多數(shù)據(jù)挖掘企業(yè)應(yīng)該會非常喜歡這樣的課程,可以省下一大筆培訓(xùn)費用。
Ng說,要成為一個數(shù)據(jù)科學(xué)家,首先要對代數(shù)、概率非常了解,前提條件還包括對編程有基本的了解。
他還提到:“機器學(xué)習(xí)正成為硅谷最受追捧的技術(shù)之一。”許多企業(yè)的人事官員說,因為企業(yè)目前急缺此類數(shù)據(jù)分析人才,所以只要一名員工能夠按時保質(zhì)完成網(wǎng)絡(luò)課程就可以顯著提高他的工資和職業(yè)展望。
為什么此類網(wǎng)絡(luò)課程會風(fēng)靡?為什么數(shù)據(jù)分析能夠改變世界?
Ng認(rèn)為當(dāng)前之所以這些網(wǎng)絡(luò)課程如此受歡迎,就是因為它將已有的、成熟的理論變成可以應(yīng)用的技術(shù),讓已經(jīng)學(xué)會前提條件的學(xué)生有施展才能的機會,而不是只會編程和寫程序、寫應(yīng)用。除此以外,學(xué)生可以根據(jù)自己的學(xué)習(xí)能力調(diào)整學(xué)習(xí)步伐,論壇上的信息也可以幫助他們完成課程。
Ng說,如果不是有幸在硅谷與那些全球最聰明的計算機專家混在一起的話,他也不可能講出這么出色的機器學(xué)習(xí)課程。在他的課程中,他很少談及算法,說的更多地還是如何將機器學(xué)習(xí)應(yīng)用于實踐。他認(rèn)為學(xué)會應(yīng)用比學(xué)會知識更重要。這就好比學(xué)編程和學(xué)編程語言,一個是實踐,一個只是理論知識而已。
好好學(xué)習(xí),你可能就是下一個愛因斯坦
其實,成為一個數(shù)據(jù)科學(xué)家并不是終極目標(biāo),即使是Kaggle比賽的冠軍也不能將其視作自己職業(yè)生涯的重點。通過網(wǎng)絡(luò)課程還可以學(xué)到更多知識,讓有能力的人學(xué)到真正有用的知識,創(chuàng)造更多成果。
“這事讓我感到疑惑,”Ng說,“說不定下一個愛因斯坦就是一個坐在電腦前看教學(xué)視頻的阿富汗小女孩。”
文章來源:GigaOM