這個話題就牽扯到大數(shù)據(jù)怎么進入到個體端。我們看到現(xiàn)在的FICO,金融屬性本身對個體的模型,只覆蓋了3億人。我們怎么去對這個資本進行刻劃呢?我們引入了一些KLOUT的描述。你的成功不取決與你擁有什么,而取決于你認識誰。這里強調(diào)的是社會。
我怎么提煉加工社會關系呢?資本描述一個人的真實的社會資本??梢酝ㄟ^通話的記錄,提煉出行為變量。學習互聯(lián)網(wǎng),應該看最核心的內(nèi)容。臉譜的核心競爭力就是評價信息,谷歌的最核心是網(wǎng)頁的質(zhì)量評估體系。我們?nèi)绾斡眠@樣的方式描繪人與人?我們用這樣的算法,把一個省的一千四百萬的用戶,做了一個大排序。無需預先標識出主要人物,由算法模型來實現(xiàn)迭代,評估每一個人個體與群體中的社會資本。
第一個是篩選出來的,是垃圾電話制造者低跟人工標注的完全一樣的,說明算法保證了非常精準的提交過程。在數(shù)據(jù)魔方里面,我們做了很多的內(nèi)容。
我們看到行為數(shù)據(jù),開始取代資產(chǎn)的數(shù)據(jù),我們以前關注太多的數(shù)據(jù),是關注含金量比較高的交易賬戶數(shù)據(jù),而現(xiàn)在借助大數(shù)據(jù)可以處理大量的碎片化的行為。
因為我們本身的商業(yè)模式是2B的,我們在為大企業(yè)服務過程中看到內(nèi)部的數(shù)據(jù)更有價值。很多人關注獲取外部的數(shù)據(jù),比如用社交數(shù)據(jù)、論壇的數(shù)據(jù),我們發(fā)現(xiàn)了內(nèi)部數(shù)據(jù)是啟動大數(shù)據(jù)最有效的捷徑。
比如說電子帳單的數(shù)據(jù),我們以前拿到一個帳單,判斷一個人是VIP還是核心的用戶,看消費的金額,而現(xiàn)在可以基于語義分類他的消費明細,做更細化的刻畫。
這是我們團隊的一個博士,他自己的描述,我們把他豆瓣閱讀抓下來。
在內(nèi)部的數(shù)據(jù)里面,在大數(shù)據(jù)上時代上,有一個很大的變化,就是在全局和個性化兩個方向的拓展。以前在小數(shù)據(jù)的時代,牛頓把蘋果扔下來一定要落下來砸到他,這是經(jīng)典的力學定律驅動的。近一百年都是在非常微觀和宏觀的世界里面,我們在突破了傳統(tǒng)參照系的世界里做探索。大數(shù)據(jù)把我們的金融視野開闊,我們開始關注到個體,關注到全局。整個企業(yè)的資金的流轉性,我們有一個全局的企業(yè)金融圖譜。
我們對中小微企業(yè)放貸,也看資產(chǎn)負債表、利潤表、現(xiàn)金流量表這三個表的結構,過去只能用個體歷史數(shù)據(jù)與現(xiàn)在的比較,無法在全局的行業(yè)橫切面上看。中國四千多萬的中小型企業(yè),這個過程使我們失去了全局化的度量標準,我們要擁有這種全局的視圖。
個體與群眾的關系,群體的智慧怎么形成?生物學家通過觀察蜜蜂的行為,蜂巢的形狀決定蜜巢的智慧。行為本身成為我們描繪整體事物的本身。這個行為是什么呢?我們在全局的評估里面就用復雜網(wǎng)絡去做。我們把所有的經(jīng)濟往來和行為,就像蜜蜂的八字舞一樣連起來。
把原來點對點的數(shù)據(jù),做成大的網(wǎng)格化。這是一些截圖,它事實上獲得了更大的企業(yè)圖譜。以前我們看供應鏈的金融,是在一次的偶發(fā)事件,我拿一個定單做評估替代的抵押物?,F(xiàn)在是拿6個月的數(shù)據(jù),描述整個的企業(yè)圖譜。每個企業(yè)都量化了,這個企業(yè)跟上下游的關系鏈條。它是基于數(shù)據(jù)發(fā)現(xiàn)的。我知道上下游企業(yè)是誰。現(xiàn)在我們是用資金鏈條,發(fā)現(xiàn)很多小規(guī)模的鏈條的企業(yè)。
每一個節(jié)點與節(jié)點的關系全部量化了,做了一個大排序。這些數(shù)值計算出來做結算成本的指導依據(jù)。這個給的是絕對的坐標值,它提供的是什么?我們給餐飲行業(yè)放貸,我了解到的企業(yè),通過供應的鏈條發(fā)現(xiàn)流通數(shù)值很高的節(jié)點,這個節(jié)點我不知道它是什么,它是每天批發(fā)胡椒、辣椒佐料給上百個火鍋店。他的資金利用率是最高的。這個過程怎么量化?傳統(tǒng)意義上是靠經(jīng)驗的評估結果?,F(xiàn)在有數(shù)據(jù)的手段,通過數(shù)據(jù)本身回答,從中也發(fā)現(xiàn)很多的風險的問題,這四個企業(yè)實現(xiàn)了閉環(huán)的操作,從數(shù)據(jù)中識別出來有關聯(lián)交易的可能。
數(shù)據(jù)本身是有價值的,把視野從金融的流程封裝,轉向金融數(shù)據(jù)產(chǎn)品封裝,在選用數(shù)據(jù)的過程當中,不僅要考慮那些密度很高的資產(chǎn)性的數(shù)據(jù),也投入視野去看行為數(shù)據(jù),它能夠客觀的反映每一個C端個體客戶的價值。
當我們看外部大量數(shù)據(jù)的時候,歷史上自己積累的數(shù)據(jù)本身含金量很高。以前我們關注的是技術本身,信息在今天有了數(shù)據(jù)科學的改變,在二維數(shù)據(jù)結構里面,我們可以用多維去做。這樣因為云計算的強計算能力以及數(shù)據(jù)科學,在結構化的數(shù)據(jù)上產(chǎn)生新的價值。