柏安娜表示,英特爾的可信分析平臺(TAP),是一個開源的平臺級服務(wù),專門適合數(shù)據(jù)科學(xué)家和應(yīng)用開發(fā)人員,能夠為用戶提供預(yù)測性的模型和數(shù)據(jù)模型服務(wù)。“我們歡迎大家參與TAP做出貢獻,使得整個分析解決方案開發(fā)和部署變得更加簡便,以此為基礎(chǔ),來為數(shù)據(jù)分析市場提供更多服務(wù)。”
這些產(chǎn)品全面支持當前蓬勃興起的數(shù)據(jù)分析類應(yīng)用,例如機器學(xué)習(xí)??拼笥嶏w研究院副院長王智國博士指出,科大訊飛的人工智能開放平臺每天在線交互達到近20億次,這些工作都離不開一個強大的計算平臺。“我們和英特爾更加深度的合作,在源頭上進行軟硬件一體化整合,必將能夠創(chuàng)造出更多更先進的人工智能解決方案,共同推動產(chǎn)業(yè)發(fā)展。”
批處理本是大型機時代的主題,近十年來隨著HadoopMapReduce的關(guān)注度逐漸增加,批處理現(xiàn)在又重新成為熱門主題。但是 Hadoop分布式供應(yīng)商的高級管理人員認為,ApacheSpark和其它流處理架構(gòu)正在改變現(xiàn)狀。
JackNorris是MapR公司前任首席營銷官及現(xiàn)任數(shù)據(jù)和應(yīng)用高級副總裁,他認為,隨著ApacheSpark加入Hadoop,我們將看到更多實時應(yīng)用和批處理架構(gòu),事件流與大數(shù)據(jù)存儲是配套的。
MapR公司與Hortonworks公司、Cloudera公司一起共同打造Hadoop并帶來了商業(yè)價值。而現(xiàn)在,SparkStreaming和其它相關(guān)技術(shù)的出現(xiàn)給大數(shù)據(jù)應(yīng)用帶來了變化,這似乎刺激了Hadoop生態(tài)系統(tǒng)新一輪的變革。
Spark已經(jīng)成為了原生Hadoop組件特別有用的補充。Norris估計MapR的Hadoop分布式用戶有一半正在使用Spark,可能用于生產(chǎn)環(huán)境的不同場景。
他表示,Spark引發(fā)了一連串興奮點,其中一部分原因是因為MapReduce編程比較困難,在早期MapReduce編程基本就是Hadoop計算的代名詞。
“Spark使開發(fā)變得相對容易了。它引入了新的API,支持使用Scala和Python編程語言,這樣開發(fā)應(yīng)用就更方便了。同時,它還幫助實現(xiàn)了流分析的結(jié)構(gòu)化,”Norris補充道。
Spark可以監(jiān)視到事件到達并且執(zhí)行自動聚合和過濾,從而把原始數(shù)據(jù)轉(zhuǎn)化為有用信息,Spark使這些工作變得更加容易。Norris表示,一些應(yīng)用由于整體系統(tǒng)限制不得不在批處理模式下工作,但是這種情況正在改變。