需要哪些數(shù)據(jù)?第一,一些基本信息。這個(gè)葉片是哪個(gè)廠家生產(chǎn)的、哪個(gè)型號,需要關(guān)系型數(shù)據(jù)庫,都可以記錄它這些信息,以及吊裝更換的流程,貨物生產(chǎn)周期,都是可以量化的。但是怎么提前兩個(gè)月發(fā)現(xiàn)這個(gè)設(shè)備會(huì)壞,我們需要對設(shè)備的狀態(tài)進(jìn)行監(jiān)控。葉片不是天天轉(zhuǎn)的,風(fēng)大了開始轉(zhuǎn),風(fēng)小不轉(zhuǎn),每一個(gè)風(fēng)機(jī)的工作使度,比如下大雪它是不是轉(zhuǎn)了。以及表面的平整度,阻尼系數(shù),葉輪轉(zhuǎn)的時(shí)候遇到的阻力系數(shù)。發(fā)電運(yùn)行狀態(tài)進(jìn)行數(shù)據(jù)的采集。數(shù)據(jù)的特點(diǎn)是格式固定,不同特性的特征采集周期不一致,采集點(diǎn)的數(shù)量極其多,一個(gè)風(fēng)機(jī)上面采集點(diǎn)的數(shù)量都是成千上萬的。采集到的數(shù)據(jù)需要高壓縮存儲,高壓縮存儲有一個(gè)典型的特點(diǎn),第一次采到的值是這個(gè)值,第二次采到的如果跟第一次一樣我就不變了。不可更改,一旦記錄下來就不用更改了。預(yù)警模型,達(dá)到什么狀態(tài)要提前預(yù)警告知。
必要時(shí)場景在線,比如在工業(yè)化的工廠里出現(xiàn)了什么故障。一家著名工控廠提到軋鋼機(jī)的工控機(jī),銀行的業(yè)務(wù)可以停一小時(shí)、兩小時(shí)算只顧,停15分鐘不算事故,但是對于一個(gè)鋼廠來說一個(gè)設(shè)備停3秒鐘、2秒鐘可能就是事故,為什么?鋼水上來以后,如果控制系統(tǒng)停了一秒鐘,軋鋼機(jī)可能就壞掉了。遇到問題以后要提前預(yù)警,或出現(xiàn)問題以后要回過頭來把當(dāng)時(shí)的場景調(diào)出來,分析為什么會(huì)出現(xiàn)這種問題。一系列的數(shù)據(jù)記錄都需要數(shù)據(jù)庫支持時(shí)間序列特征。
風(fēng)機(jī)數(shù)據(jù)采集下來怎么辦,下邊有一個(gè)盒子,盒子里有數(shù)據(jù)傳輸回來。盒子要存數(shù)據(jù)就要內(nèi)嵌一個(gè)數(shù)據(jù)庫,要支持嵌入式的特性。
超長的車來了以后,為什么直接走到那臺風(fēng)機(jī)上,它要跟地理位置信息很好的兼容。
是在一個(gè)風(fēng)和日麗的時(shí)間來的,它要對地理信息等等復(fù)雜信息進(jìn)行記錄,這些都是非結(jié)構(gòu)化的。有一款數(shù)據(jù)庫產(chǎn)品叫做GBase 8t,它就是支持這種工業(yè)化生產(chǎn)需求的。
某化工集團(tuán)在德國引進(jìn)技術(shù)新建工廠,包括廠房建設(shè)、生產(chǎn)工藝等等,德國那邊怎么干我把它完全搬過來怎么辦。剛開始德國過來一組工程師指導(dǎo),跟德國的生產(chǎn)效果差不多。然后這個(gè)集團(tuán)說既然這樣一樣的做法又建了兩家工廠,建完兩家工廠以后發(fā)現(xiàn),這兩家工廠能耗比第一家工廠要高,原材料投入比第一家工廠高,就是產(chǎn)出怎么也趕不上第一家。
他們把德國專家叫過來分析也沒戲了,怎么辦?他們借了一套系統(tǒng),對整個(gè)系統(tǒng)的運(yùn)行狀況、經(jīng)營分析狀況、生產(chǎn)狀況進(jìn)行了跟蹤。這個(gè)狀況的跟蹤極其艱苦,要跟蹤每一個(gè)工藝環(huán)節(jié)的執(zhí)行時(shí)間、執(zhí)行時(shí)差、溫度、氣壓等等。跟蹤之后發(fā)現(xiàn)他們這么多的數(shù)據(jù)與過去的記錄,最初他們說找兩臺計(jì)算機(jī)記錄下來就行了,后來發(fā)現(xiàn)記錄不下來,這么多數(shù)據(jù)存儲需要有數(shù)據(jù)庫的特性。記錄是用結(jié)構(gòu)化的數(shù)據(jù)記錄,同時(shí)它是海量運(yùn)行數(shù)據(jù)存儲,要支持P級,甚至EP級這樣大數(shù)據(jù)量的存儲。
用兩臺機(jī)器不行,再擴(kuò)展兩臺、四臺、六臺,一直擴(kuò)展到上百臺,他有這樣的擴(kuò)展要求。
同時(shí)對所有的數(shù)據(jù)進(jìn)行分析之后,用甲骨文去分析的話,可能有一個(gè)master級,執(zhí)行不出來,遇到執(zhí)行瓶頸,是不是每一臺機(jī)器都能提供分析結(jié)果。提供無master最后匯總的需求。
最后是支持海量數(shù)據(jù)高速加載。分析系統(tǒng)推數(shù)據(jù)的時(shí)候要求的時(shí)間窗口很短,時(shí)間長了加載不進(jìn)來就無效了、作廢了。
在滿足這種大數(shù)據(jù)要求的時(shí)候,我們還有一種產(chǎn)品叫GBase 8a mpp,支持無master大數(shù)據(jù)的查詢、存儲、復(fù)雜分析,金融行業(yè)有一個(gè)比較典型的例子,農(nóng)行的數(shù)據(jù)倉庫已經(jīng)是P級數(shù)據(jù)了,上百臺機(jī)器的集群了,后面移動(dòng)、電信都有,工業(yè)化這一塊我們希望也找到自己的落腳點(diǎn)。
剛才介紹了兩個(gè)產(chǎn)品,這兩個(gè)產(chǎn)品是南大通用做的。南大通用成立于2004年,是一家專門做國產(chǎn)數(shù)據(jù)庫的公司。
南大核心產(chǎn)品有三款,一款產(chǎn)品是GBase 8a,基于大數(shù)據(jù)的復(fù)雜分析。另一款產(chǎn)品就是GBase 8t,針對交易型的數(shù)據(jù)庫。還有一款是內(nèi)存數(shù)據(jù)庫,內(nèi)存數(shù)據(jù)庫是我們買了韓國內(nèi)存數(shù)據(jù)庫的原碼以及一個(gè)團(tuán)隊(duì)。