你懂得视频亚洲,亚洲国产AV孕妇

參與本皮性能專項認證的產(chǎn)品是五間，新華三，騰訊，北京東方金信，星環(huán)和百分點。大家可以看到性能的部分測試結(jié)果，這是TPC-DS，執(zhí)行的時間量都在百秒內(nèi)，可以看到，上下兩個圖可以看出來，第二個SQL47最優(yōu)和中位的差別很大，說明這個是比較難的，有的測的特別好，有的測的特別不好。還有一個是SQL71，它的標準差也是比較高的，說明大家在這塊也是差距比較大的。SQL82，53和84的標準方差較小，說明大家在這三個水平是比較接近的，而且這三個任務(wù)是相對來說沒那么費時的。

性能測試的YCSB分別模擬了寫入，并發(fā)寫，模擬了更新任務(wù)比較重的場景，模擬了度曲2數(shù)據(jù)再更改，再寫回的場景?？梢钥匆幌?，這塊是誰的操作數(shù)越大，誰就越厲害，這不是時間維度來衡量的，剛才的是誰的時間越短越快，這塊美妙的操作數(shù)，最優(yōu)的是175萬美妙的操作數(shù)，獨占大比例的是148萬每秒的操作數(shù)，讀寫各半的是164萬，最后一個是7萬?？梢钥吹阶顑?yōu)的往往在百萬級別的。標準方差也可以看到，厲害的有非常厲害的，不厲害的有特別差的。這塊應(yīng)該是以后參測廠家應(yīng)該注意的。這塊可能大家有的不太熟悉，做的不太好。

這塊是YCSB執(zhí)行的單位，可以看到執(zhí)行的難以程度，總體來說，寫是最簡單的，因為它的任務(wù)是比較單一的，讀的話，還有95%是讀，還有5%的更新。5%的各半稍微難一點，這兩個是相當?shù)模盥氖莚ead wand wwrite，我對比了一下，它總歸寫了2億條數(shù)據(jù)，但是modify像寫了2億，下面還有1億，它的操作數(shù)比別的多，所以他操作的慢，所以這也解釋通。所以總體來看，寫是最簡單的，最容易的，中間這兩個都差不多，第二個和第三個是差不多50分鐘左右，最后一個是80分鐘。可以看到Y(jié)CSB的耗時也是非常厲害的，在小時級別以上。這是對廠商參加測評的時候負荷是非常大的。

看看機器學習，Kmeans是最優(yōu)是272，中位是913，標準方差是572，這塊大家的水平差距特別大，貝葉斯最優(yōu)是46，它的差別相對小一些，因為執(zhí)行時間是比較少的，標準方差也比較低。這塊我們未來會增加它的難度，因為數(shù)據(jù)量小的話，大家的差別看不出來。

terasort比較有意思，去年是13.6TB最后執(zhí)行時間是在8000多秒，2個小時多一點。這邊是32個節(jié)點，等于說節(jié)點數(shù)擴了一倍多一點點，數(shù)據(jù)規(guī)模也是差不多它的兩倍多一點點。發(fā)現(xiàn)去年的15臺結(jié)點算下來151703，畫到圖上簡單來看，并沒有呈現(xiàn)一個完全線性的擴展，或者是一個線性可比性。而有兩種解釋，一種是本身terasort或者是Hadoop數(shù)據(jù)擴展就不會出現(xiàn)線性的擴展。另外，最年的最優(yōu)的測試沒有去年測試好。

terasort最優(yōu)是10083左右，中位值是3小時，這說明這個測試對大家的考驗還是比較大的，因為準方差差不多是1434，一個周期是十個小時，一個測試是一次就3個小時，一天也沒有多少時間。整個測試的周期，我們七天的時間還是非常的緊張的。

總結(jié)和下一步的計劃。

性能方面有一些優(yōu)化的思路。硬件的調(diào)優(yōu)，操作系統(tǒng)的調(diào)優(yōu)，數(shù)據(jù)的分布均勻不均勻，代碼的應(yīng)用調(diào)優(yōu)，核心目標是用盡所有的物理資源，不能讓它閑著。關(guān)于Spark，這次SQL和機器學習大部分廠商都采用了Spark，關(guān)于Spark，我們調(diào)優(yōu)也有一些總結(jié)，就是壓縮和分布數(shù)據(jù)，包括資源參數(shù)，主要是包括CPU，內(nèi)存比例的關(guān)系，這塊需要大家常常去摸索，得出一些經(jīng)驗值。很重要的是要通過資源的監(jiān)控不停的反饋這次調(diào)優(yōu)的參數(shù)比例是不是合理，這跟算法的調(diào)優(yōu)都很像。

Hadoop也是主要是壓縮任務(wù)自數(shù)據(jù)，還有資源參數(shù)的調(diào)優(yōu)。HBase涉及到壓縮，讀寫的優(yōu)化的策略，還有按選擇合適的線程數(shù)。

還有性能的評測總結(jié)，跟去年一樣，我們在統(tǒng)一的平臺，統(tǒng)一的測試數(shù)據(jù)，統(tǒng)一的測試供給，統(tǒng)一的測試周期，統(tǒng)一的測試規(guī)則，很多東西你能調(diào)，別人也能調(diào)，你不能調(diào)，別人也不能調(diào)，大家的規(guī)則是一樣的。在我們這就是統(tǒng)一的規(guī)則，大家能調(diào)的就都調(diào)，不能調(diào)的就都不能調(diào)。大家看到我們評測的應(yīng)是統(tǒng)一的思路?？疾斓慕Y(jié)果一個是產(chǎn)品本身的性能，有穩(wěn)定性，包括它的易部署性，包括易運維性，還有組建本身的性能。還有是考察參測團隊綜合使用大數(shù)據(jù)平臺的能力，包括你環(huán)境部署與集群規(guī)劃，測試工具的使用，多任務(wù)調(diào)優(yōu)的能力，包括怎么安排你的測試的進度，先測哪些，后測哪些。最后是集群的故障處理和運行維護。在我們的測試中很多集群出現(xiàn)了宕機，因為你是在測性能的極限值?？梢钥闯隹疾斓氖钱a(chǎn)品和調(diào)優(yōu)團隊整個的能力。所以考察上是比較全面，綜合。

2/3 首頁上一頁 1 2 3 下一頁尾頁

第三批大數(shù)據(jù)產(chǎn)品能力認證情況綜述