大數據是什么
多大的數據叫大數據?
很多沒有接觸過大數據的人,都很難清楚地知道,究竟多大的數據量才可以稱之為大數據。那么,根據數據收集的端口,企業(yè)端與個人端之間,大數據的數量級別是不同的。
企業(yè)端(B端)數據近十萬的級別,就可以稱為大數據;個人端(C端)的大數據要達到千萬級別。收集渠道沒有特定要求,PC端、移動端或傳統(tǒng)渠道都可以,重點要達到這樣數量級的有效數據,形成數據服務即可。很有趣,大家可以看到2B和2C,兩類大數據差了兩個數量級。
有些小公司,數據只有千到萬級的規(guī)模,但經過收集分析,也能從中有針對性的總結出這一群體的原則,同樣能指導企業(yè)進行一定程度的用戶分析、獲取或者是服務工作,但這并不是大數據,而是一般性的數據挖掘。
剛剛天小妹分享的那個案例,說今年年初有個用50塊本金擺地攤賣水果的中年人,他并不懂得大數據,但是他對水果的收成了若指掌:他知道哪個地方下了多少雨,水果的甜度會到多少,哪些地方的消費者會喜歡吃這個甜度的水果。賣到最后賣出了137家門店、4.7億的年銷售額。
這確實是一種小的數據挖掘,但并不是數據分析。大數據分析雖然脫胎于此,但大數據面向的是更海量的一個數據,借助了更廣義的知識數據庫的分析方法。大部分的數據公司的數據來源是海量的,它的收集和分析,并不是局限于個體,而是以一個非常非常廣泛的群體為對象展開的。
大數據的產業(yè)鏈是怎樣的
我在接受21世紀經濟報道采訪的時候,依照大數據公司在產業(yè)鏈的上下游關系,提出把它們分成三種不同類別:
1.大數據采集公司
所謂“找數據”,內部可以再分兩種:
1).在自身正常運營的過程中就能產生大量數據源;
2).通過跟電信運營商、金融企業(yè)合作,獲取數據源。
2.大數據分析公司
這一類公司,基本上都有自己的套模型,但大部分數據庫模型源于相同的幾個機理,包括統(tǒng)計學模型、深度學習算法等等。也基于美國IBM、cloudera公司開發(fā)的應用型分析模塊等等。
3.大數據銷售公司
雖然說是賣數據,但出售的并不是單一數據,而是基于數據的全套解決方案,比如精準營銷等等。
這三類公司是如何協作,并把大數據作用于我們的生活呢?最容易理解的就是現在在微信朋友圈上投放的廣告。
騰訊在把廣告推廣給每個用戶的時候,都已經對用戶做過精準的分析。通過收集人們在微信上使用習慣,進而分析用戶的消費能力、消費習慣,形成一套精準營銷方案后,給廣告商生成一些定向的廣告。
比如說,蘭蔻的廣告就從來不會推廣給男性用戶、豪車廣告也不會推給應屆畢業(yè)生。整個的微信廣告體系都用到了大數據的分析模式,大家普遍反饋,在騰訊上投放的廣告比網易、新浪等平臺上投放的廣告轉化率高,正是得益于騰訊的大數據基礎。
大數據公司的投資價值
如何理解大數據的投資價值?
大數據如今這么火,其商業(yè)價值顯而易見,但是能真正兌現的人并不多。
要兌現大數據的商業(yè)價值,第一個要求,就是達到大數據的數據量級。那么目前,在數據量上最有優(yōu)勢是BAT三家。在PC時代,百度在數據上的優(yōu)勢非常強,但到移動時代,騰訊和阿里實現了反超。
騰訊有微信、QQ,拿到了移動端數據生成量的九成;阿里利用它的消費數據資源,更有垂直性。那么對于中小企業(yè)、創(chuàng)業(yè)企業(yè)而言,兌現商業(yè)價值的重點就變成了,如何在自身規(guī)模較小的時候,利用別人的大數據資源為自己的創(chuàng)業(yè)更好的服務。這是需要深層次判斷和挖掘的。
所以,對于數據相關的公司,在投資判斷的時候,不單是看現有業(yè)務的發(fā)展,更重要的是在他不斷的發(fā)展的過程中,能不能積累有效數據、積累高準確性的數據,實現數據的實時更新性。這樣的企業(yè)才能夠更好地建立起競爭壁壘。
比如,在開發(fā)者服務領域,比如talkingdata極光等等,我們復星昆仲在看項目時非常看重的一點,就是現在項目所經營的業(yè)務是單一為開發(fā)者提供服務?還是在服務之余,給自己的積累有效數據,形成長期壁壘?
2B是大數據行業(yè)的突破口
我之前有提到BAT對大數據收集是壟斷性的,創(chuàng)業(yè)企業(yè)想要在C端達到海量數據(千萬級甚至上億的C端用戶)非常難。目前,國內月活真正過億的app只有15個,滲透率前10的app都是BAT所控制的,比如微信、QQ、淘寶、UC瀏覽器等。如果繞開BAT,能擁有C端海量數據的,就只有相對傳統(tǒng)的電信業(yè)、金融業(yè)等等。