最新發(fā)布的Paxata平臺(tái)將能為后端工具準(zhǔn)備更大規(guī)模的種類更多的數(shù)據(jù)。該軟件搭配無(wú)模型、內(nèi)存管道處理器和基于Spark的分布式處理引擎HDFS使用。
為了提高數(shù)據(jù)準(zhǔn)備工作的自動(dòng)化能力,Paxata采用了機(jī)器學(xué)習(xí)和語(yǔ)義檢索能力。這能幫助數(shù)據(jù)科學(xué)家和業(yè)務(wù)分析師處理數(shù)據(jù)轉(zhuǎn)換等相關(guān)工作。
Paxata聯(lián)合創(chuàng)始人、副總裁Nenshad Bardoliwalla表示,軟件的任務(wù)是幫助人解決難題,對(duì)數(shù)據(jù)科學(xué)家而言,我們的軟件可以幫助實(shí)現(xiàn)前端數(shù)據(jù)準(zhǔn)備和大數(shù)據(jù)集成。不過(guò)Bardoliwalla也指出希望在后端的虛擬化軟件有所作為,現(xiàn)在主要的供應(yīng)商是Tableau,但產(chǎn)品要完善的地方還很多。
Bardoliwalla表示,Paxata的Spring 15平臺(tái)支持使用RESTAPI工具集的數(shù)據(jù)提取。“如果使用可視化工具之前還要花大量時(shí)間準(zhǔn)備數(shù)據(jù),那也太不友好了。”
Paxata還提供機(jī)器學(xué)習(xí)界面。Bardoliwalla表示:“數(shù)據(jù)分析最困難的部分就是錄入很多數(shù)據(jù)源。在這方面,Tableau采用了可視化的方式,而我們希望采用另一種新的方式進(jìn)行數(shù)據(jù)準(zhǔn)備。”