說(shuō)到商業(yè)、金融,一般人想到的金融是期貨、債券、基金,智能投資就會(huì)想到利用人工智能的方法預(yù)測(cè)投資市場(chǎng)走勢(shì),從而量化配置資產(chǎn)。對(duì)此,在日前由KDD China和通聯(lián)數(shù)據(jù)合辦的AI金融研習(xí)班上,微軟亞洲研究院城市計(jì)算領(lǐng)域負(fù)責(zé)人鄭宇博士表示,這個(gè)部分是可以做的,但是這個(gè)數(shù)據(jù)是三手?jǐn)?shù)據(jù),是一個(gè)結(jié)果。但市場(chǎng)更多應(yīng)該關(guān)注,在此環(huán)節(jié)之前的一手?jǐn)?shù)據(jù)、二手?jǐn)?shù)據(jù)的結(jié)果帶來(lái)的表現(xiàn)。
往前推一步,一般而言,投資會(huì)根據(jù)一家公司的財(cái)報(bào)進(jìn)行業(yè)績(jī)調(diào)研,預(yù)判股價(jià),這算是對(duì)二手?jǐn)?shù)據(jù)的利用。而鄭宇指出,從業(yè)者還應(yīng)該再往前多對(duì)一手?jǐn)?shù)據(jù)進(jìn)行分析,“一手?jǐn)?shù)據(jù)其實(shí)決定了公司運(yùn)營(yíng)情況和財(cái)報(bào),這個(gè)數(shù)據(jù)在我們現(xiàn)實(shí)生活之中。”
來(lái)自日常生活的數(shù)據(jù)帶來(lái)的先知
關(guān)于人工智能的技術(shù)原理在此我們不必過(guò)多科普,雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng))此前已有相當(dāng)詳細(xì)的報(bào)道講述,現(xiàn)在可直接從案例進(jìn)行觀察。以萬(wàn)科為例,要判斷萬(wàn)科未來(lái)走勢(shì),除了看財(cái)報(bào)之外更往前看:拿的地是否都在增值?已建房產(chǎn)銷(xiāo)售情況如何?周邊配套是否越來(lái)越好、人氣是不是越來(lái)越旺?租金是否在上漲?……“如果知道公司旗下產(chǎn)業(yè)都在增值,你可以預(yù)期未來(lái)財(cái)報(bào)比較好,可以更早地預(yù)判股價(jià)會(huì)上升。”反之可看空。
摩拜、滴滴的融資成果也是一樣的道理。在這些企業(yè)尚未開(kāi)始盈利的情況下,投資人是根據(jù)用戶量、日活用戶、有效歷程等數(shù)據(jù)分析,對(duì)公司進(jìn)行的價(jià)值預(yù)估。
反過(guò)來(lái),如果真的在一手?jǐn)?shù)據(jù)里面挖掘出可利用價(jià)值,那么久未必非要在股票上謀求利益點(diǎn)。根據(jù)從一手?jǐn)?shù)據(jù)分析出來(lái)的信息,直接就可以計(jì)算商業(yè)利益和價(jià)值。
投資價(jià)值預(yù)判
仍是以商業(yè)地產(chǎn)為例,根據(jù)鄭宇的研究,我們很難預(yù)測(cè)房地產(chǎn)價(jià)格,但是可以對(duì)房產(chǎn)相對(duì)價(jià)值進(jìn)行評(píng)估和排序,以數(shù)據(jù)進(jìn)行量化,找出高價(jià)值的房產(chǎn)——并非高價(jià)格,而是在同一個(gè)市場(chǎng)中,房產(chǎn)價(jià)格漲得比別人更快,而跌的時(shí)候會(huì)跌得更慢。
“比如說(shuō)分成五個(gè)離散化等級(jí)之后,根據(jù)北京市2013年的數(shù)據(jù)觀察一類(lèi)房的分布,發(fā)現(xiàn)漲得最快、跌得最慢的一類(lèi)房,并不是大家所理想當(dāng)然地認(rèn)為都應(yīng)該在市中心。很可能隔兩個(gè)街區(qū)一個(gè)是一類(lèi)房、一個(gè)是五類(lèi)房。為什么有這樣的現(xiàn)象呢?房屋價(jià)值又是什么決定的呢?如果大家聽(tīng)過(guò)李嘉誠(chéng)說(shuō)過(guò)房地產(chǎn)價(jià)值怎么決定的,三個(gè)因素:地段、地段、地段。”
據(jù)雷鋒網(wǎng)了解,鄭宇的報(bào)告顯示,如果用大數(shù)據(jù)量化,會(huì)有以下的結(jié)果:
第一個(gè)地段是周邊的配套、交通、基礎(chǔ)設(shè)施。周邊有多少商嘗學(xué)校、醫(yī)院以及周邊的地鐵、公交、便利程度,這都是地段。第一個(gè)地段,同樣是一個(gè)學(xué)校,好的學(xué)校、好的學(xué)區(qū)對(duì)房屋價(jià)值拉動(dòng)比一個(gè)普通學(xué)校價(jià)值拉動(dòng)要大。同樣是一個(gè)商場(chǎng),好的商嘗精品商場(chǎng),破舊不堪的商場(chǎng)對(duì)地段價(jià)值拉動(dòng)也是不一樣的。
第二個(gè)地段可以用好幾個(gè)來(lái)量化,社交媒體對(duì)它的評(píng)價(jià),以及人們的出行規(guī)律等非常重要——多少人打車(chē)進(jìn)來(lái)、開(kāi)車(chē)進(jìn)來(lái),什么時(shí)候進(jìn)來(lái),什么時(shí)候出去等等都反映了這個(gè)地段的價(jià)值。如果有兩個(gè)區(qū)域,一個(gè)區(qū)域都是早上七八點(diǎn)坐公交地鐵出去,晚上七八點(diǎn)坐公交地鐵回來(lái)。另外一個(gè)區(qū)域出門(mén)的時(shí)間非常的自由和松散,不規(guī)律,多半以開(kāi)車(chē)或者坐計(jì)程車(chē)出去的,覺(jué)得哪一個(gè)地方的品質(zhì)更高一點(diǎn)?應(yīng)該是后者。所以這需要以人們出行規(guī)律、公交地鐵、出租,社交媒體等人文地理信息對(duì)此進(jìn)行評(píng)價(jià)。
第三個(gè)地段是我們理解的商圈,如果房子在一個(gè)好的商圈里面對(duì)這個(gè)房子有帶動(dòng)作用的,但是還要考慮前面兩個(gè)因素。
這里面我們會(huì)用到學(xué)習(xí)排序的方法來(lái)做。根據(jù)以上三個(gè)地段的數(shù)據(jù)變量,我們可以做一些回歸算法,進(jìn)行線性回歸分析,但這個(gè)方法并不是很好,必然會(huì)有冗余性,有什么樣的路網(wǎng)結(jié)構(gòu)決定有什么樣的交通流量。所以這里面變成一個(gè)學(xué)習(xí)排序,這是跟以前方法不一樣的地方。