本文是對《CY12-Q2 OpenStack, OpenNebula,Eucalyptus,CloudStack社區(qū)活躍度比較》一文的補(bǔ)充和更新。對本文內(nèi)容感興趣的讀者,可以通過電子郵件或者新浪微博(@qyjohn_)與我聯(lián)系。
本文同時(shí)發(fā)布了一個(gè)英文版本,可以參見CY12-Q3 Community Analysis — OpenStack vs OpenNebula vs Eucalyptus vs CloudStack這個(gè)帖子。
本文的目的是通過論壇和郵件列表的原始數(shù)據(jù)對OpenStack、OpenNebula、Eucalyptus和CloudStack項(xiàng)目的社區(qū)活躍度進(jìn) 行分析和比較。主要的原始數(shù)據(jù)是自2009年來這四個(gè)項(xiàng)目的官方論壇和郵件列表每個(gè)月所產(chǎn)生的討論主題數(shù)、帖子數(shù)、以及參與討論的總?cè)藬?shù)(郵件地址或者用 戶賬號)。為了獲取這些數(shù)據(jù),我寫了一個(gè)Java程 序自動地從這四個(gè)項(xiàng)目的網(wǎng)站下載了所有的論壇和郵件列表信息,并且從這些信息中分析提取出我所需要的數(shù)據(jù)。程序提取的數(shù)據(jù)被導(dǎo)入MySQL數(shù)據(jù)庫中以便進(jìn) 行統(tǒng)計(jì)分析,統(tǒng)計(jì)分析的結(jié)果通過LibreOffice生成分析圖表。
在CY12-Q3的分析中,我們增加了長期被忽視的數(shù)據(jù)源https://answers.launchpad.net/openstack和http://lists.openstack.org/pipermail/*/。這兩個(gè)數(shù)據(jù)源的數(shù)據(jù)量很大,對分析結(jié)果有較大的影響。
此外,我們發(fā)布CY12-Q2分析報(bào)告之后,有些讀者指出來自incubator-cloudstack-dev郵件列表的數(shù)據(jù)可能有些問題。這個(gè)郵件列表里包含了一些由JIRA自動生成的郵件內(nèi)容。在CY12-Q3的分析中,我們設(shè)置了一個(gè)過濾器,自動地排除了所有標(biāo)題中含有”[jira]“標(biāo)識符的信息。
圖1 和圖2分別是如上所述四個(gè)項(xiàng)目每個(gè)月所產(chǎn)生的討論主題數(shù)和帖子數(shù)??梢钥闯觯?/p>
(1) 與OpenStack和CloudStack相關(guān)的討論數(shù)量遠(yuǎn)大于與Eucalyptus和OpenNebula相關(guān)的討論數(shù)量;
(2) 在過去三個(gè)月中,與Eucalyptus和OpenNebula相關(guān)的討論數(shù)量在同等水平上,只有非常細(xì)微的差別。