讓我們通過一系列早期成果與實(shí)驗(yàn)項(xiàng)目窺探未來前景。
時(shí)至今日,我們的數(shù)據(jù)管理能力日益提升,但數(shù)據(jù)分析能力則相對(duì)落后。盡管工具與流程皆已齊備,但仍然缺少充足的數(shù)據(jù)科學(xué)家人員。在今天的文章中,我們將專注于能夠交付實(shí)際分析結(jié)論的大數(shù)據(jù)應(yīng)用,同時(shí)追蹤其發(fā)展及當(dāng)前狀態(tài),最終借此窺探大數(shù)據(jù)技術(shù)的未來發(fā)展方向。
早期大數(shù)據(jù)技術(shù)采納方指明令人感興趣的跨行業(yè)發(fā)展可能性
根據(jù)2012年《福布斯》雜志發(fā)表的文章,早期大數(shù)據(jù)技術(shù)采納方主要來自金融服務(wù)、電信、制造(特別是消費(fèi)級(jí)產(chǎn)品)以及政府領(lǐng)域。
早期采納方在起步階段會(huì)使用其新近安裝的大數(shù)據(jù)基礎(chǔ)設(shè)施(例如HDFS、MapReduce以及NoSQL數(shù)據(jù)庫等等)以實(shí)驗(yàn)各類新型應(yīng)用。根據(jù) Pacific Crest公司收集到的數(shù)據(jù),各早期采納方往往希望利用這些方案處理數(shù)據(jù)中心日志信息(包括服務(wù)器、路由器以及各類物聯(lián)網(wǎng)傳感器等),旨在實(shí)現(xiàn)網(wǎng)絡(luò)分析與 IT系統(tǒng)性能監(jiān)控。在此基礎(chǔ)之上,亦有相當(dāng)一部分企業(yè)嘗試?yán)么髷?shù)據(jù)技術(shù)進(jìn)行財(cái)務(wù)數(shù)據(jù)(欺詐檢測)與Web數(shù)據(jù)(情感分析以實(shí)現(xiàn)個(gè)性化體驗(yàn))分析。
表1 大數(shù)據(jù)應(yīng)用早期實(shí)驗(yàn)方向
用例
早期采納方比例 網(wǎng)絡(luò)分析 29% IT系統(tǒng)日志分析 28% 傳感器數(shù)據(jù)分析 19% Web行為數(shù)據(jù)分析 16%基因組數(shù)據(jù)分析
9% 社交媒體情感分析 6% 欺詐檢測 6%