大數(shù)據(jù)技術(shù)市場正處于這樣一個階段:Garnter認(rèn)為是從IT主導(dǎo)的、報告系統(tǒng)轉(zhuǎn)向業(yè)務(wù)主導(dǎo)、自助式服務(wù)分析的最后階段。其結(jié)果是出現(xiàn)了很多新業(yè)務(wù)智能和分析平臺可以滿足企業(yè)機(jī)構(gòu)對可訪問性、敏捷性和更深入的分析洞察力的要求。
現(xiàn)在有很多初創(chuàng)公司提供這種下一代系統(tǒng),他們開發(fā)新技術(shù)用于收集、管理和分析大數(shù)據(jù),不管這些數(shù)據(jù)是結(jié)構(gòu)化的還是非結(jié)構(gòu)化的、動態(tài)的還是靜態(tài)的、本地的還是在云中的。
下面就是2016年引起我們注意的10個很酷的大數(shù)據(jù)初創(chuàng)公司。
Anodot
CEO: David Drai
Anodot在2015年11月走出隱身模式,推出了實時異常檢測和操作智能技術(shù)——擁有機(jī)器學(xué)習(xí)專利算法的軟件,可以自動進(jìn)行業(yè)務(wù)分析、查明性能問題并尋找商業(yè)機(jī)會。Anodot的目標(biāo)是從大量數(shù)據(jù)中查找異常值,并將這些結(jié)果轉(zhuǎn)化為有價值的業(yè)務(wù)洞察。
Anodot的技術(shù)旨在用于電子商務(wù)網(wǎng)站、數(shù)字廣告系統(tǒng)和物聯(lián)網(wǎng)網(wǎng)絡(luò),以提高運(yùn)營效率,最大限度增加收入。
Anodot位于以色列的Ra'Anana,以及加州的桑尼維爾,在9月的B輪融資中獲得了800萬美元。
Confluent
CEO: Jay Kreps
在大數(shù)據(jù)管理和分析中,處理實時的流式數(shù)據(jù)是最大的挑戰(zhàn)之一。解決這個問題的其中一項技術(shù)就是開源的Apache Kafka通訊代理項目,提供了高吞吐、低延遲的軟件,用于處理實時數(shù)據(jù)。
Confluent是由Apache Kafka創(chuàng)始開發(fā)者創(chuàng)建的,提供了一個圍繞Kafka的完整實時數(shù)據(jù)平臺,可作為一個容錯的、高度可擴(kuò)展的通訊系統(tǒng)。該軟件可用于手機(jī)來自用戶活動日志、股票行情系統(tǒng)、設(shè)備儀表的數(shù)據(jù),以及其他廣泛用例中的數(shù)據(jù)。
今年5月,這家位于加州帕洛阿爾托的公司宣布提供Confluent Platform 3.0,通過融合Kafka Streams把流處理能力添加到應(yīng)用中,還有在企業(yè)機(jī)構(gòu)上下操作Kafka的Confluent Control Center。
Koverse
CEO: Jon Matsuo
Koverse開發(fā)了一款“盒中數(shù)據(jù)湖”的平臺,并稱它可以收集大數(shù)據(jù)并更快速地運(yùn)用于生產(chǎn)中,其成本要低于現(xiàn)有的技術(shù)和方法。
這家位于西雅圖的公司創(chuàng)建于2012年,最早的1.0版本是在兩年前首次公布的。Koverse Platform 2.0是在6月發(fā)布的,將Apache Accumulo“分布式鍵值庫”技術(shù)和該公司自己的Universal Indexing Engine結(jié)合到一起。
聯(lián)合創(chuàng)始人Paul Brown(首席產(chǎn)品官)和Aaron Cordova(首席技術(shù)官)曾經(jīng)是美國國家安全局的數(shù)據(jù)科學(xué)家,在那里他們幫助開發(fā)了最早的Accumulo項目,重新架構(gòu)了國家安全局的數(shù)據(jù)基礎(chǔ)架構(gòu),以更好地處理意外的數(shù)據(jù)分析情況。
Maana
CEO: Babur Ozden
Maana開發(fā)了Maana Knowledge Platform,這個數(shù)據(jù)搜索和發(fā)現(xiàn)軟件是從大量系統(tǒng)或者“孤島”中收集數(shù)據(jù),并將其轉(zhuǎn)變?yōu)榭梢员粯I(yè)務(wù)線應(yīng)用采用的業(yè)務(wù)洞察。該系統(tǒng)是構(gòu)建在Apache Spark處理引擎的。
Maana位于加州帕洛阿爾托,創(chuàng)建于2012年,在2015年5月正式發(fā)布,定位是收集和分析由物聯(lián)網(wǎng)網(wǎng)絡(luò)生成的大量數(shù)據(jù)。9月該公司首次公布了其產(chǎn)品的Winter '17版本,Knowledge Applications用于優(yōu)化像供應(yīng)鏈和呼叫中心管理這樣的業(yè)務(wù)流程,Knowledge Assistants用于創(chuàng)建新的分析模型。
Maana在2016年5月進(jìn)行的B輪融資中獲得2600萬美元,氣走好難過大部分來自該公司的石油和天然氣及行業(yè)客戶,包括殼牌、雪佛龍、沙特阿美、英特爾和通用電氣等公司。
Pachyderm
CEO: Joe Doliner
掌握著當(dāng)前一代大數(shù)據(jù)技術(shù)的初創(chuàng)公司Pachyderm,已經(jīng)開發(fā)出了一種開源分析引擎,采用Docker容器做分布式計算。
這里的重點(diǎn)是提供了一個容器化、模塊化、可擴(kuò)展的數(shù)據(jù)分析基礎(chǔ)設(shè)施,采用像Docker和Kubernetes這樣的工具作為構(gòu)建塊。該公司的Pachyderm File System和Pachyderm Pipeline System軟件幫助數(shù)據(jù)經(jīng)理和分析師構(gòu)建機(jī)器學(xué)習(xí)通道和數(shù)據(jù)ETL(提取、轉(zhuǎn)換和加載)工作流程。
Pachyderm創(chuàng)建于2014年,位于舊金山,在今年6月的種子輪融資中獲得了200萬美元。
StreamSets
CEO: Girish Pancha
StreamSets是另外一家解決管理動態(tài)數(shù)據(jù)挑戰(zhàn)的公司。更具體地說,StreamSets開發(fā)的軟件防止“數(shù)據(jù)漂移”的潛在問題——數(shù)據(jù)在源頭的時候可能會遇到這種不可預(yù)測的突變情況,并在應(yīng)用使用這些數(shù)據(jù)的時候出現(xiàn)問題。