d、保持各業(yè)務(wù)邏輯的統(tǒng)一性,不要出現(xiàn)同樣的業(yè)務(wù)邏輯,同一個組別的人統(tǒng)計出來的結(jié)果不同。原因在于共同的邏輯沒有落地成通用的東西,所以導(dǎo)致每個人寫法不同。這點其實需要特別注意。
針對以上,這個崗位的技能要求是:不要成為僅僅會寫SQL的人,現(xiàn)在工具都很發(fā)達(dá),如果你的技能很單一的話,那么可替代指數(shù)是非常高的,并且你自身也沒有什么成就感。這里并不是說會寫SQL的人很low,只是說應(yīng)該多學(xué)一些技能,否則會很危險。
倉庫人員應(yīng)該要常常思考,如何進行架構(gòu)設(shè)計是最合理的,你要考慮是否需要字段冗余、行存儲還是列存儲、字段如何擴展最有效,熱數(shù)據(jù)和冷數(shù)據(jù)如何拆分等,所以需要有架構(gòu)思維。
技能上,除了SQL熟練之外,還需要知道如何寫Transform,MapReduce,因為有很多業(yè)務(wù)邏輯用SQL實現(xiàn)起來非常復(fù)雜,但是如果你會其他腳本語言,那么就能給你提供便利,讓你的效率提升很多。另外好的倉庫人員需要寫Java或者Scala,通過寫UDTF或者UDAF來提升你的效率是很有必要的。
數(shù)據(jù)倉庫人員也應(yīng)該常??紤]自動化和工具化方面的事情,需要很好的工具或者模塊的抽象能力,動手實現(xiàn)自動化的工具來提高整個組織效能。針對經(jīng)常碰到的數(shù)據(jù)傾斜問題,需要很快定位問題并進行優(yōu)化。
說完了數(shù)據(jù)存儲這塊,接下來是數(shù)據(jù)應(yīng)用的幾個關(guān)鍵職位,在此之前,我想說數(shù)據(jù)應(yīng)用的一個最關(guān)鍵的前提是:數(shù)據(jù)質(zhì)量、數(shù)據(jù)質(zhì)量、數(shù)據(jù)質(zhì)量!!在每次闡述你的觀點、分析結(jié)論或者用算法的時候,都需要先檢查,源頭數(shù)據(jù)正確性,否則任何結(jié)論都是偽命題。
3、數(shù)據(jù)可視化
這是個很炫的工作,最好是能懂點前端,比如js。數(shù)據(jù)可視化人員需要有很好的分析思維,不能為了炫技而忽視對業(yè)務(wù)的幫助程度。因為我對這個崗位客串的不多,所以沒有特別深入的感悟,不過我覺得這個崗位需要有分析的能力,才能把可視化做好。
另外一方面來說,做數(shù)據(jù)應(yīng)用的人都應(yīng)該懂點數(shù)據(jù)可視化,要知道觀點表達(dá)的素材順序是:圖片>表格>文字,一個能夠用圖片來闡述的機會千萬別用文字來描述,因為這樣更易于讓別人理解。要知道,給大領(lǐng)導(dǎo)講解事情的時候,需要把大領(lǐng)導(dǎo)設(shè)想成是個“數(shù)據(jù)白癡”,這樣才能把一件事情說的比較生動。
4、數(shù)據(jù)分析師
現(xiàn)在對數(shù)據(jù)分析的需求是很大的,因為大家都想著說:數(shù)據(jù)有了,但是能做些什么呢?這就需要有數(shù)據(jù)分析師,對數(shù)據(jù)進行分析和挖掘,然后做數(shù)據(jù)應(yīng)用。
對數(shù)據(jù)分析師吐槽最多的是:你分析出來的不就是正常的業(yè)務(wù)邏輯嗎,還需要你分析什么?或者是你分析的結(jié)論不對,跟我們的業(yè)務(wù)邏輯不符合。特別是:ABTest的結(jié)果和當(dāng)初設(shè)定的預(yù)期不相符合的時候,分析師會常常被拉過去說:分析一下,為什么我的AB實驗結(jié)果不顯著,里面肯定有原因的。
很多時候,寶寶的心里苦啊,你說這個轉(zhuǎn)化率下降了,從數(shù)據(jù)上可以看出哪個細(xì)分渠道下降了,至于為什么客戶不下單,我們得去用戶去,很多時候,數(shù)據(jù)上也體現(xiàn)不出來為什么,只能告訴你現(xiàn)狀是什么。
如果你一直在寫分析報告,給結(jié)論中,持續(xù)周而復(fù)始,沒有直接在業(yè)務(wù)中體現(xiàn)成績的時候,數(shù)據(jù)分析師們該醒醒了,你該想想這個是你要的崗位嗎?
對于數(shù)據(jù)分析師的定位:個人認(rèn)為,成為優(yōu)秀的數(shù)據(jù)分析師是非常難的,現(xiàn)在市面上也沒有多少優(yōu)秀的分析師。數(shù)據(jù)分析師的技能要求,除了會數(shù)據(jù)分析、提煉結(jié)論、洞察數(shù)據(jù)背后的原因之外,還需要了解業(yè)務(wù),懂算法。
只有這樣,當(dāng)面對一個業(yè)務(wù)問題時,數(shù)據(jù)分析師們才可以針對問題抽絲剝繭,層層遞進去解決問題,再根據(jù)定位的問題進行策略的應(yīng)對,比如是先做上策略進行測試還是應(yīng)用算法進行優(yōu)化,用算法用在哪個場景上,能不能用算法來解決問題。
一個優(yōu)秀的數(shù)據(jù)分析師,是個精通業(yè)務(wù)和算法的全能數(shù)據(jù)科學(xué)家,不是那個只會聽從業(yè)務(wù)的需求而進行拉數(shù)據(jù)、做報表、只做分析的閑雜人等。我們都說分析要給出結(jié)論,優(yōu)秀分析師的結(jié)論就是一個能解決問題的一攬子策略和應(yīng)對措施,同時很多需求是分析師去主動發(fā)現(xiàn)并通過數(shù)據(jù)來挖掘出來的。
從上述描述中,可以看到對數(shù)據(jù)分析師的要求是:會寫sql拉數(shù)據(jù),精通業(yè)務(wù)、會數(shù)據(jù)洞察、精通算法,主動性強,要求還是很高的。
如果你一直只是忙于應(yīng)付日常分析需求,熱衷于寫華麗的報告,那么你要記得,你很危險,因為會有一堆人在那里質(zhì)疑你存在的價值,特別是小公司。因為數(shù)據(jù)人員的薪資是個不小的支出。