ThoughtSpot3起始售價(jià)為90000美元,是一種為企業(yè)快速尋找大數(shù)據(jù)的數(shù)據(jù)科學(xué)家依賴的工具。“我們已經(jīng)看到企業(yè)使用該產(chǎn)品的數(shù)據(jù)科學(xué)家正在增加。”ThoughtSpot公司營(yíng)銷副總裁史葛霍爾頓說,“二十億人都在搜索,但在工作中,我們?nèi)匀灰蕾囉跀?shù)據(jù)專家。”
霍爾頓在加利福尼亞公司總部PaloAlto進(jìn)行了一個(gè)演示,顯示系統(tǒng)使用熟悉的搜索欄界面是如何工作的.剛剛發(fā)布的ThoughtSpot3.0具有一些新功能,包括“DataRank”的工作方式,類似于谷歌的PageRank和typeahead。該軟件使用機(jī)器學(xué)習(xí)算法建議的關(guān)鍵詞為客戶搜索,以加快這一進(jìn)程。
Popcharts無疑是最酷的新功能。當(dāng)你在搜索框中輸入“由東海岸銷售......”ThoughtSpot瞬間創(chuàng)建基于查詢相關(guān)的圖表,并利用機(jī)器學(xué)習(xí)給出10多個(gè)可以選擇的圖表。
另一個(gè)“即時(shí)”功能是AutoJoins,其目的是為一般都有數(shù)百個(gè)數(shù)據(jù)源的企業(yè)導(dǎo)航。AutoJoins使用ThoughtSpot的數(shù)據(jù)索引,通過索引模式和機(jī)器學(xué)習(xí),以了解表格是否相關(guān),并在一秒內(nèi)呈現(xiàn)研究結(jié)果。
霍爾頓說,ThoughtSpot更側(cè)重于對(duì)歷史數(shù)據(jù)的傳統(tǒng)BI分析(速度超快,使用十分方便),其預(yù)測(cè)性和規(guī)范性分析功能會(huì)在未來的軟件中體現(xiàn)。
(3)Connotate軟件
Connotate公司是一家為美聯(lián)社、路透社、道瓊斯等大型公司對(duì)全球上千個(gè)網(wǎng)站的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行實(shí)時(shí)分類和分析的企業(yè)。在Web數(shù)據(jù)抽取和監(jiān)控上,Connotate軟件是世界上最簡(jiǎn)單、最合算的解決方案,以有效地利用海量數(shù)據(jù),從中挖掘出對(duì)企業(yè)增長(zhǎng)有價(jià)值的信息,并可以進(jìn)行高度可擴(kuò)展性的數(shù)據(jù)監(jiān)控和數(shù)據(jù)收集。
Gartner公司分析師道格·萊尼表示,Connotate和BrightPlanet在他所列的大數(shù)據(jù)工具名單上,因?yàn)樗鼈冇兄趶钠髽I(yè)自身的數(shù)據(jù)庫(kù)和互聯(lián)網(wǎng)上收割和構(gòu)建豐富多彩的內(nèi)容。
“隨著數(shù)字化和經(jīng)濟(jì)增長(zhǎng),企業(yè)認(rèn)識(shí)到只關(guān)注自己的數(shù)據(jù)不再是萬無一失的創(chuàng)新良方,他們?cè)絹碓蕉嗟剞D(zhuǎn)向外源數(shù)據(jù)(即公司外部的數(shù)據(jù))。”萊尼說。
Connotate公司表示,其從網(wǎng)頁抽取內(nèi)容的專利技術(shù)遠(yuǎn)遠(yuǎn)超出了網(wǎng)頁抓取或自定義腳本。取而代之的是對(duì)于網(wǎng)站工作如何使用機(jī)器學(xué)習(xí)采用一種直觀的視覺理解,Connotate公司表示,使其內(nèi)容提取“準(zhǔn)確可靠,并且可擴(kuò)展。”
據(jù)該公司介紹,Connotate平臺(tái)”可以很容易處理成百上千的網(wǎng)站和百萬兆字節(jié)。”并提供與業(yè)務(wù)相關(guān)的有針對(duì)性的信息。其提供的內(nèi)容采集平均成本比傳統(tǒng)方法少55%。
例舉一個(gè)使用案例,Connotate幫助銷售情報(bào)提供者從數(shù)千個(gè)醫(yī)院網(wǎng)站提取聯(lián)系人資料(姓名,職務(wù),電話,電子郵件和隸屬關(guān)系),并建立一個(gè)全國(guó)性的醫(yī)生檔案數(shù)據(jù)庫(kù)。
Connotate公司表示,其大數(shù)據(jù)解決方案賣給了幾家大型制藥公司,并沒有花費(fèi)額外的硬件或IT資源。大數(shù)據(jù)提取的規(guī)模化,甚至可以提供50萬名醫(yī)生的數(shù)據(jù)。
(4)BrightPlanet工具
BrightPlanet公司也從網(wǎng)絡(luò)中提取數(shù)據(jù),該公司宣稱其搜索具有所謂的“深網(wǎng)”見解的能力。其深網(wǎng)可以挖掘那些具有密碼保護(hù)的網(wǎng)站和通常不會(huì)被傳統(tǒng)的搜索引擎索引的其他網(wǎng)站的數(shù)據(jù)。
BrightPlanet公司表示,其收集的數(shù)據(jù)條目數(shù)以百萬計(jì),其中包括推特和新聞數(shù)據(jù)庫(kù)和醫(yī)學(xué)期刊的數(shù)據(jù),并可以根據(jù)企業(yè)的具體需求和條件進(jìn)行過濾。
該公司為使用該軟件的數(shù)據(jù)采集工程師提供一個(gè)免費(fèi)的數(shù)據(jù)即服務(wù)(DaaS)咨詢,并介紹他們的服務(wù)是一個(gè)不錯(cuò)的選擇。咨詢的目的是幫助企業(yè)數(shù)據(jù)中心找到合適的收集數(shù)據(jù),并得到正確的格式,這樣客戶可以得到一個(gè)好主意的過程和結(jié)果。
最終用戶或客戶可以選擇哪些網(wǎng)站收獲的內(nèi)容。反過來,BrightPlanet公司又將其內(nèi)容進(jìn)行充實(shí)。例如,像在社交媒體網(wǎng)站評(píng)論這樣的非結(jié)構(gòu)化數(shù)據(jù),通過一個(gè)自定義格式設(shè)計(jì),使其在更便于使用的客戶端提交。