從 2012 年到 2015 年,大數(shù)據(jù)持續(xù)發(fā)威,IDC 市場調(diào)查機構預測 2017 年大數(shù)據(jù)市場將價值 324 億,擁有這樣“Big Data、Big Deal”遠見的人,正在利用大數(shù)據(jù)激蕩出最有創(chuàng)意的構想,用數(shù)據(jù)的力量來創(chuàng)造出大量的價值。從讓資料搜尋分析平臺,到利用大數(shù)據(jù)幫助癌癥治療,大數(shù)據(jù)新創(chuàng)公司這幾年內(nèi)如雨后春筍般出現(xiàn),2015 年這些“Big Data Startups”也會持續(xù)挖掘大數(shù)據(jù)的價值、微調(diào)其企業(yè)策略,期盼在市場中展露頭角。以下幾家新創(chuàng)公司都已經(jīng)各自獲得好幾輪金額可觀的融資,在大數(shù)據(jù)市場中十分有潛力,值得我們關注并參考,從中瞭解大數(shù)據(jù)的應用方向及潛能。
SumAll
SumAll 是一家位于紐約的新創(chuàng)公司,成立于 2011 年,主要為中小型企業(yè)提供即時數(shù)據(jù)分析服務。SumAll 的線上分析平臺收集社交媒體及電子商務上的數(shù)據(jù),并進行分析后,把可視化的分析結果展示在互動介面上供企業(yè)客戶參考。例如社交頁面上的網(wǎng)頁流量、ebay 上的銷售量等數(shù)據(jù),生成每星期、每個月的分析報導,讓企業(yè)客戶追蹤且分析使用者/消費者。

這家公司還有一個很酷的地方:他們分了百分之十的股份給旗下的 SumAll.org —— 一家旨在用資料分析增加社會福利的非盈利組織。
Luminoso

Luminoso 成立于 2010 年,原本是麻省理工大學媒體實驗室的一個研究項目,后來發(fā)展成利用人工智慧進行文本分析的新創(chuàng)公司。從通訊工具里的訊息、網(wǎng)絡上的評論等數(shù)據(jù)來源,利用自然語言處理和機器學習技術,幫助企業(yè)分析消費者在各種通訊渠道中討論的話題。
舉例來說,Luminoso 提供的服務可以幫助企業(yè)追蹤時下發(fā)生的熱門討論,還可以根據(jù)需求迅速回應,如果消費者對于某產(chǎn)品的缺陷在網(wǎng)上進行了投訴或者抱怨,企業(yè)可以及時進行補救。

Flatiron Health
同樣發(fā)源于紐約的 Flatiron Health 成立于 2012 年,是大數(shù)據(jù)應用界中是十分有名的“醫(yī)療大數(shù)據(jù)技術”新創(chuàng)公司,主要專注于癌癥數(shù)據(jù)分析1。
Flatiron Health 透過各種管道收集病患的臨床紀錄、醫(yī)師診斷紀錄、患者治療結果、基因數(shù)據(jù)及繳費紀錄等數(shù)據(jù),透過分析整合后提交給腫瘤學家,透過分析過往的治療方法跟紀錄,幫助醫(yī)生做出更好的臨床診斷跟醫(yī)治手段。全美現(xiàn)在有約 1000 名腫瘤學家在使用 Flatiron Health 的數(shù)據(jù)。

Flatiron 的分析平臺 border="1" width="600" alt="大數(shù)據(jù)" height="686" />
Tamr
Tamr 成立于 2013 年,其技術來自于麻省理工的電腦與人工智慧實驗室,由麻省理工學院教授兼數(shù)據(jù)專家 Michael Stonebraker 跟種子投資家 Andy Palmer 共同創(chuàng)辦,在 2014 年正式營運。
大數(shù)據(jù)的其中一個問題就是資料量太大了,而且資料來源劇增又不斷變換,Tamr 的機器學習演算法跟軟件能有效而大規(guī)模地廣泛整合和管理現(xiàn)有和未來的多種數(shù)據(jù)來源,大量降低數(shù)據(jù)來源的搜集與連結所用的時間,同時辨別資料來源及之間的關聯(lián)。

Alpine Data Labs
Alpine Data Labs 成立于 2010 年,總部位于舊金山,算是十分有名的大數(shù)據(jù)分析挖掘軟件新創(chuàng)公司,該公司總裁兼首席執(zhí)行長 Joe Otto 和首席產(chǎn)品長 Steven Hillion 都來自于被云端儲存服務提供商 EMC 收購的 Greenplum 公司。

大部份的大數(shù)據(jù)新創(chuàng)公司都在做“資料可視化(Data Visualization)”,Alpine 則是提供大數(shù)據(jù)及 Hadoop 的預測性分析功能,且號稱是全球第一個針對大數(shù)據(jù)的團隊合作分析解決方案。
DataStax
DataStax 成立于 2010 年,總部位于加州,在去年 9 月曾獲得驚人的 1 億 600 萬美元 E 輪融資。
DataStax 主要業(yè)務是開發(fā)和銷售開源分布式數(shù)據(jù)庫 Apache Cassandra 的商業(yè)化版本。Apache Cassandra 是高擴展性、高容錯的 NoSQL 數(shù)據(jù)庫,比傳統(tǒng)的關系式數(shù)據(jù)庫多了許多優(yōu)勢,其設計不僅兼顧了擴展性和開發(fā)靈活性,而且搜尋效率也相當不錯,特別適合大數(shù)據(jù)的儲存,像是 Cisco、eBay 等大公司都在使用這種數(shù)據(jù)庫。