隨著大數(shù)據(jù)技術(shù)的成熟和發(fā)展,大數(shù)據(jù)在商業(yè)上的應(yīng)用越來(lái)越廣泛,有關(guān)大數(shù)據(jù)的交互、整合、交換、交易的例子也日益增多。本文就進(jìn)行大數(shù)據(jù)交易的一些問(wèn)題, 以及建立大數(shù)據(jù)交易所的必要性, 做一些探討和研究。我們認(rèn)為,建立大數(shù)據(jù)交易所是勢(shì)在必行的市場(chǎng)需求。
目前下列公司和機(jī)構(gòu)通常擁有大數(shù)據(jù):
大型實(shí)體商業(yè)公司或電子商務(wù)公司,如大型連鎖商店walmart,sears等,或amazon,阿里巴巴。這類(lèi)公司大都擁有大量的客戶數(shù)量、長(zhǎng)期的客戶購(gòu)賣(mài)記錄、客戶的支付歷史等。這類(lèi)公司最感興趣的是客戶購(gòu)物的消費(fèi)偏好和消費(fèi)習(xí)慣。目前這類(lèi)公司的大數(shù)據(jù)應(yīng)用包括推薦關(guān)聯(lián)產(chǎn)品和推出其它新的產(chǎn)品、 新的服務(wù)上。
大型服務(wù)公司,如銀行、電信服務(wù)等公司。這類(lèi)公司也擁有客戶的某個(gè)方面歷史消費(fèi)記錄,比如銀行可能擁有客戶的金融賬戶收入支出信息,電信公司擁有客戶的電話或網(wǎng)絡(luò)使用歷史。這類(lèi)公司通常對(duì)本行業(yè)內(nèi)推出新的產(chǎn)品和服務(wù),以及尋找潛在客戶,降低業(yè)務(wù)風(fēng)險(xiǎn)較感興趣,比如熱門(mén)的推薦系統(tǒng)等。
大型制造企業(yè),如福特汽車(chē)公司等。這類(lèi)公司因?yàn)槠浯罅康目蛻艋A(chǔ),往往可以在推出新產(chǎn)品服務(wù)上使用大數(shù)據(jù)技術(shù)和應(yīng)用。
大型網(wǎng)絡(luò)服務(wù)公司,如google,百度,yahoo 等。這類(lèi)公司由于在其服務(wù)行業(yè)的壟斷性,積累有海量的用戶在網(wǎng)絡(luò)虛擬世界的行為信息。這類(lèi)公司通過(guò)歸納和機(jī)器學(xué)習(xí)等,可以挖掘出非常多有價(jià)值的應(yīng)用產(chǎn)品和服務(wù)。目前使用大數(shù)據(jù)最好的公司是google。google廣告系統(tǒng)adsense就是利用大數(shù)據(jù)技術(shù)來(lái)實(shí)現(xiàn)的。另外,google公司還可以利用大數(shù)據(jù)做出一些預(yù)測(cè),如流感的爆發(fā),政治性事件的預(yù)測(cè)等。google公司還進(jìn)一步推出如自動(dòng)駕駛等大數(shù)據(jù)應(yīng)用,及google眼鏡等結(jié)合大數(shù)據(jù)收集與應(yīng)用于一身的產(chǎn)品應(yīng)用。
大型社交網(wǎng)站,如facebook,twitter,及其它社交網(wǎng)站如linkedin和其它活躍論壇等。 全世界用戶每天都在社交網(wǎng)站上產(chǎn)生大量的內(nèi)容。僅facebook每天需要處理的社交信息就達(dá)到了500tb之多。 目前這些數(shù)據(jù)正在被大量的個(gè)人開(kāi)發(fā)者和技術(shù)公司使用,用來(lái)做各種商業(yè)服務(wù)推薦或新的產(chǎn)品。
政府部門(mén)和科研機(jī)構(gòu)的公開(kāi)數(shù)據(jù),如有關(guān)天氣、交通狀態(tài)、道路、地質(zhì)、環(huán)境 以及科學(xué)研究的進(jìn)展等部分。美國(guó)聯(lián)邦政府特別提出,將聯(lián)邦政府各部門(mén)的數(shù)據(jù)開(kāi)放給公眾,這些數(shù)據(jù)的應(yīng)用包括自動(dòng)駕駛、智能交通監(jiān)測(cè)系統(tǒng)等。
除了上述商業(yè)機(jī)構(gòu)的大數(shù)據(jù)之外,國(guó)家機(jī)構(gòu)還擁有大量有關(guān)國(guó)家安全的敏感信息。本文只討論商業(yè)應(yīng)用,故不討論這部分大數(shù)據(jù)的應(yīng)用和交互。