第三,開發(fā)了“數(shù)據(jù)科學(xué)工作臺”(Data Science Workench)。它可以在一個電腦上能夠充分使數(shù)據(jù)科學(xué)家大量地直接使用Hadoop里面的數(shù)據(jù),而不是像過去只取一個子集。這一平臺既滿足了數(shù)據(jù)科學(xué)家對使用完善的環(huán)境進(jìn)行編程,結(jié)合Spark、Hadoop和深度學(xué)習(xí)框架(比如TensorFlow、BigDL)的需求,也滿足了數(shù)據(jù)的管理者對數(shù)據(jù)存儲集群的安全、穩(wěn)定和可靠性的工作要求,這是Cloudera目前的貢獻(xiàn)和主要的進(jìn)展。
專注行業(yè)用戶需求,做開源領(lǐng)域領(lǐng)導(dǎo)者
基于開源技術(shù)的公司,其在開源社區(qū)的地位直接決定其技術(shù)實力以及未來發(fā)展前景,而Cloudera作為Hadoop開源社區(qū)的領(lǐng)導(dǎo)者,在這方面無疑占據(jù)優(yōu)勢。
凌琦表示,通過Spark,Cloudera將技術(shù)直接貢獻(xiàn)給開源社區(qū),同時也從開源社區(qū)獲得我們希望的技術(shù)思想。
“開源社區(qū)發(fā)展的非???,Cloudera要做兩個事情:第一,貢獻(xiàn);第二,也把開源社區(qū)的東西真正用到商業(yè)領(lǐng)域里面,這之前需要整理、認(rèn)證、打包,使它在商業(yè)環(huán)境里面能得到很好的應(yīng)用和支持。開源社區(qū)相對比較松散,要讓里面的東西得到7×24小時的支持,讓商業(yè)環(huán)境里面的廠商能夠直接使用,這里有很多工作要做,這是Cloudera要做的工作。”凌琦說。
在筆者看來,未來在品路線圖上,Cloudera會繼續(xù)專注于打造和演進(jìn)平臺,這是一個跨越行業(yè)的橫向非常寬廣的平臺,能夠盡可能多地去滿足各行各業(yè)的需求,這是Cloudera的專注點(diǎn)。與此同時,要能夠為每個客戶更好地去服務(wù),Cloudera也非常注重解決方案的垂直行業(yè)化。