中國(guó)IDC圈6月16日?qǐng)?bào)道,如果說“大數(shù)據(jù)”是當(dāng)今商業(yè)社會(huì)最熱門的話題之一,相信沒有人會(huì)反對(duì)。從商業(yè)大佬的戰(zhàn)略布局,到科技大牛的科普分享,再到數(shù)據(jù)科學(xué)家、數(shù)據(jù)專家及數(shù)據(jù)工程師等職位的大量涌現(xiàn),大數(shù)據(jù)的風(fēng)頭一起,短短數(shù)年間,已經(jīng)發(fā)展得勢(shì)不可擋。《失控》的作者凱文凱利(Kevin Kelly)曾預(yù)言:“未來一切的生意都是數(shù)據(jù)的生意。”
然而在大數(shù)據(jù)概念似乎與每個(gè)公司乃至每個(gè)人都緊密相關(guān)的今日,如果有人問大數(shù)據(jù)到底是什么?怎樣才能讓大數(shù)據(jù)為我創(chuàng)造實(shí)實(shí)在在的價(jià)值?大部分時(shí)候,你所得到的答案或者艱澀難懂,或者虛無縹緲,比如說3V(Volume(容量)、Velocity(速度)和Variety(多樣性)),甚至是5V (再加上Veracity(真實(shí)性)和Value(價(jià)值)),又或者“結(jié)構(gòu)化數(shù)據(jù)”和“半結(jié)構(gòu)化數(shù)據(jù)”。上到天體太空,下到海底勘探,大到教育文化,小到細(xì)胞DNA,總有一款可以迷惑你。
或許真相是,想在在大數(shù)據(jù)時(shí)代乘風(fēng)破浪勇奪先機(jī),你根本不需要知道這些。中國(guó)有句老話,術(shù)業(yè)有專攻。從大數(shù)據(jù)到商業(yè)價(jià)值,你需要的只是根據(jù)業(yè)務(wù)經(jīng)驗(yàn)提出需求和目標(biāo),其他的一切都可以交給數(shù)據(jù)機(jī)器人來搞定。
聽起來像是一個(gè)神話?其實(shí)這一切已經(jīng)在發(fā)生。
“讓天下沒有難用的數(shù)據(jù),讓人人都可以成為數(shù)據(jù)科學(xué)家。”是桃樹科技創(chuàng)始人最初的理想。桃樹科技起源于2015年,其創(chuàng)始人楊滔和汪秦宇均為海歸博士,在美中兩國(guó)頂級(jí)互聯(lián)網(wǎng)及金融公司具有資深的大數(shù)據(jù)技術(shù)和管理經(jīng)驗(yàn),因?yàn)榭礈?zhǔn)了大數(shù)據(jù)領(lǐng)域全自動(dòng)建模預(yù)測(cè)這一趨勢(shì),毅然放棄穩(wěn)定高薪的大公司職位,轉(zhuǎn)而投身創(chuàng)業(yè)這一荊棘艱險(xiǎn)之旅。
如前文提到,大數(shù)據(jù)似乎可以在各個(gè)領(lǐng)域落地,但是能真正產(chǎn)生爆發(fā)效應(yīng)的領(lǐng)域卻并不多。根據(jù)多年的大數(shù)據(jù)應(yīng)用經(jīng)驗(yàn),桃樹選擇了金融和電商大數(shù)據(jù)應(yīng)用為公司起步的切入點(diǎn)。在金融領(lǐng)域,數(shù)據(jù)應(yīng)用的需求屬于剛需。尤其銀行對(duì)貸款客戶信用的評(píng)估關(guān)系到銀行壞賬率的比例。在電商領(lǐng)域,大數(shù)據(jù)應(yīng)用可以產(chǎn)生規(guī)模化效應(yīng),形成數(shù)據(jù)積累的閉環(huán),最終帶動(dòng)流量的獲取。
信用風(fēng)險(xiǎn)評(píng)估機(jī)器人:CAN
“極客看什么不順眼,就自己動(dòng)手做一個(gè)。”以數(shù)據(jù)極客自詡的楊滔這樣說,“大數(shù)據(jù)應(yīng)用的廣泛訴求,就是輸入數(shù)據(jù),輸出結(jié)果。”于是他創(chuàng)造了第一個(gè)數(shù)據(jù)機(jī)器人CAN。CAN是一個(gè)專門應(yīng)用于金融行業(yè)的風(fēng)險(xiǎn)評(píng)估機(jī)器人。在以民生銀行為代表的多家知名銀行和互聯(lián)網(wǎng)金融機(jī)構(gòu)中,都已經(jīng)存在CAN的身影。當(dāng)你給這臺(tái)機(jī)器輸入散落在各個(gè)角落的原始數(shù)據(jù),它便如同一匹永不疲憊的戰(zhàn)馬夜以繼日地飛奔,輸出銀行/p2p中申請(qǐng)貸款客戶的信用打分及每個(gè)客戶的風(fēng)險(xiǎn)點(diǎn)。這臺(tái)機(jī)器,可以提早發(fā)現(xiàn)這些金融機(jī)構(gòu)貸款業(yè)務(wù)中90%以上的貸款壞賬,并且可以提早預(yù)測(cè)客戶是否逾期歸還貸款,預(yù)測(cè)準(zhǔn)確率均在80%以上。傳統(tǒng)的銀行風(fēng)險(xiǎn)建模一般一個(gè)數(shù)據(jù)團(tuán)隊(duì)工作3到6個(gè)月,而CAN只需要3天。
無論是數(shù)據(jù)的清洗整理,還是算法的復(fù)雜處理,都是CAN的內(nèi)在機(jī)制。對(duì)于銀行客戶經(jīng)理,CAN提供的數(shù)據(jù)結(jié)果無比簡(jiǎn)單——客戶經(jīng)理負(fù)責(zé)客戶的信用風(fēng)險(xiǎn)打分及對(duì)應(yīng)的風(fēng)險(xiǎn)因子。CAN建立了這個(gè)數(shù)據(jù)提煉機(jī)制之后,自然把外部大量數(shù)據(jù)與內(nèi)部數(shù)據(jù)動(dòng)態(tài)整合,整合后的風(fēng)險(xiǎn)數(shù)據(jù)不僅包括客戶的基本信息、金融行為、動(dòng)態(tài)還款行為,并且還包括客戶以及他的網(wǎng)絡(luò)關(guān)系對(duì)應(yīng)的央行征信數(shù)據(jù)、法院工商數(shù)據(jù)、房產(chǎn)資產(chǎn)數(shù)據(jù)以及在P2P平臺(tái)上的貸款及表現(xiàn)數(shù)據(jù)等。從臟亂復(fù)雜的大數(shù)據(jù)到包含豐富預(yù)測(cè)信息的大數(shù)據(jù),正是CAN的輸入和輸出。
當(dāng)客戶經(jīng)理負(fù)責(zé)客戶出現(xiàn)風(fēng)險(xiǎn),他將第一時(shí)間獲得風(fēng)險(xiǎn)預(yù)警,并可以根據(jù)CAN輸出的風(fēng)險(xiǎn)因子去追蹤事實(shí)真相。對(duì)于銀行客戶經(jīng)理,大數(shù)據(jù)經(jīng)過CAN的處理,成為在他們?nèi)粘I(yè)務(wù)流程中的“決策抓手”。大數(shù)據(jù)遠(yuǎn)在天邊,也近在眼前。
商品銷量預(yù)測(cè)機(jī)器人:BOB
在CAN被多家銀行客戶高度認(rèn)可之后,楊滔又帶領(lǐng)他的團(tuán)隊(duì)開發(fā)了桃樹機(jī)器人工廠的第二個(gè)機(jī)器人BOB。BOB是一款選品機(jī)器人,它可以基于商品的行業(yè)、類目、關(guān)鍵字、款式、價(jià)格、產(chǎn)地和營(yíng)銷渠道數(shù)據(jù),預(yù)測(cè)商品在一定流量中,不同的場(chǎng)景、時(shí)間下,可獲得的成交額(或轉(zhuǎn)化率)。