互聯(lián)網(wǎng)金融的浪潮中,每一位新生軍都希望把科技創(chuàng)新和金融業(yè)務(wù)完美融合。而作為一把利劍,數(shù)據(jù)可以改造金融的流程,定義一個新的零消費市場。
但駕馭這把利器的前提是,你需要懂得行為數(shù)據(jù)如何發(fā)揮比資產(chǎn)數(shù)據(jù)更大的價值,以及內(nèi)部結(jié)構(gòu)化數(shù)據(jù)如何在數(shù)據(jù)科學(xué)下重新資產(chǎn)化。這也是天云融創(chuàng)數(shù)據(jù)科技有限公司CEO雷濤,一直在思考的問題。
下面是雷濤在第一財經(jīng)年會·互聯(lián)網(wǎng)金融產(chǎn)品峰會上的演講。
雷濤:大家下午好,很高興有這樣一個機會跟大家交流。今天我們產(chǎn)業(yè)互聯(lián)網(wǎng)軍跨界來到這里,希望把科技的創(chuàng)新和金融的業(yè)務(wù)內(nèi)容融合在一起。數(shù)據(jù)怎么改造金融的流程,定義一個新的零消費市場。
我今天跟大家匯報兩個內(nèi)容。第一,行為數(shù)據(jù)如何發(fā)揮比資產(chǎn)數(shù)據(jù)更大的價值;第二,內(nèi)部結(jié)構(gòu)化數(shù)據(jù)如何在數(shù)據(jù)科學(xué)下重新資產(chǎn)化。
互聯(lián)網(wǎng)帶給我們便捷的方式和手段,使我們的交易成本變得更低,對現(xiàn)有的金融業(yè)務(wù)實現(xiàn)了更優(yōu)化的配置,以更低成本的提交,發(fā)揮了互聯(lián)網(wǎng)去媒介化的作用。這里面會形成網(wǎng)銀、電子支付、P2P撮合交易等,其中互聯(lián)網(wǎng)扮演了工具的角色。
我們可以看到今天的市場發(fā)生了根本的變化。
傳統(tǒng)的金融核心的生產(chǎn)資料還是貨幣以及資產(chǎn),把它作為產(chǎn)品化的封裝。但今天我們看到數(shù)據(jù)作為新的生產(chǎn)資料的出現(xiàn)?;谙M者的行為,如在淘寶店的行為痕跡作為獲取數(shù)據(jù)的基礎(chǔ),顧客和生產(chǎn)者不再對立,而這個價值就是數(shù)據(jù)。
數(shù)據(jù)搜集了以后,利用大數(shù)據(jù)技術(shù),可以低成本匯集起來形成生產(chǎn)力。由流程經(jīng)驗驅(qū)動,逐步轉(zhuǎn)向數(shù)據(jù)驅(qū)動。金融的屬性更多轉(zhuǎn)向風(fēng)險和定價,從賣方市場向買方市場轉(zhuǎn)型的,這是一個數(shù)據(jù)金融產(chǎn)品代替抵押物的過程。
以前的數(shù)據(jù)量很少,因為它是在已經(jīng)建立了成熟系統(tǒng)的大型的機構(gòu)里面才能夠沉淀的數(shù)據(jù)。此外支撐某些業(yè)務(wù)的時的應(yīng)用系統(tǒng),通過交易流量產(chǎn)生的數(shù)據(jù)作為數(shù)據(jù)副產(chǎn)品。這些副產(chǎn)品作為數(shù)據(jù)來源的信息被加工出來。
這一塊的數(shù)據(jù)含金量很高,包括支付的數(shù)據(jù),支付的數(shù)據(jù)體量也很大。這些以前只是被作為審計的需求,現(xiàn)在它有新的價值的發(fā)揮,一會兒我們看一個案例。
互聯(lián)網(wǎng)打開的第二個很大的市場空間,是在行為數(shù)據(jù)上,facebook、谷歌能夠賺取較大的利潤,靠的是提煉海量數(shù)據(jù)的稀釋價值數(shù)據(jù)。
這兩天我們召開了大規(guī)模的產(chǎn)業(yè)互聯(lián)網(wǎng),產(chǎn)業(yè)互聯(lián)網(wǎng)和互聯(lián)網(wǎng)區(qū)別是碎片化了入口,不再基于流量平臺這一目前主導(dǎo)互聯(lián)網(wǎng)的核心指標(biāo)。
這些入口是什么呢?剛才太平洋保險講了我們怎么計算你的生命周期表、怎么算你的壽命。我們現(xiàn)在跟大型的保險機構(gòu)探索個性生命周期表。蘊含生命體征的行為數(shù)據(jù),在可穿戴設(shè)備中出現(xiàn)。
來之前我看了一些金融里面提到的行為數(shù)據(jù)。這兩天大盤反饋了一些比較好的信息,對此百度做了一個量化的算法方式,把互聯(lián)網(wǎng)的行為、搜索框的行為引入,跟廣發(fā)合作成立了一個量化指數(shù)基金。這是怎么實現(xiàn)的,我來剖析一下。
這是一個交易所,我們首先實現(xiàn)的是讓海量的信息機器可讀。現(xiàn)在已經(jīng)變成機器產(chǎn)生數(shù)據(jù)的時代。以前可能是專業(yè)的編輯生產(chǎn)數(shù)據(jù),媒體的編輯在生產(chǎn)數(shù)據(jù)(PGC),后來是用戶在產(chǎn)生數(shù)據(jù)(UGC),現(xiàn)在進入了更海量的時代。
右邊的這個部分是機器寫的,像小學(xué)生一樣寫中心思想,把你這一段的內(nèi)容抽出來,形成一個縮略。左邊一個是數(shù)值,做量化,從下面期貨的價格你可以看到他們之間的相關(guān)性,這些都是對數(shù)億的碎片的信息實現(xiàn)量化。
量化的另一個應(yīng)用是情緒判斷,以前我們給大型的公司做過品牌價值。我們可以看到字的大小表示它的權(quán)重。養(yǎng)老是它最核心的主題,左邊這個又區(qū)分出正向、負(fù)向的情緒。這些內(nèi)容是做了,傳統(tǒng)數(shù)據(jù)庫在金融上無法完成的事情,就可以把品牌價值實現(xiàn)有效的量化。這個量化對板塊而言,對投資而言,可以做很多的內(nèi)容。
對于個體數(shù)據(jù)而言也是同樣的,他們把我社交言論的數(shù)據(jù)也放上去了?;旧夏軌蚍答伋鑫覀兊膬?nèi)容,左邊的數(shù)據(jù)比較多,每天都是談工作的內(nèi)容。右上角用的是hadoop模型,他刻劃的這個蜘蛛圖用6萬5千個形容詞變量五六十個性格特征描述這個人。讓機器在二秒內(nèi)閱讀一個人的品行等。