工業(yè)大數(shù)據(jù)的目的是為了改變以往工業(yè)價(jià)值鏈從生產(chǎn)端向消費(fèi)端、上游向下游推動(dòng)的模式,實(shí)現(xiàn)以客戶價(jià)值為核心的定制化產(chǎn)品和服務(wù),以及與之相適應(yīng)的全產(chǎn)業(yè)鏈協(xié)同優(yōu)化。為此,工業(yè)大數(shù)據(jù)應(yīng)滿足用戶需求定義、工業(yè)智能制造、活動(dòng)協(xié)同優(yōu)化三方面的應(yīng)用。
在這些應(yīng)用中,工業(yè)大數(shù)據(jù)的落地需要與之相適應(yīng)的技術(shù)架構(gòu)作為支撐。目前,李杰教授提出的“5C”架構(gòu)體現(xiàn)了工業(yè)大數(shù)據(jù)“數(shù)據(jù)->知識(shí)->應(yīng)用”的信息架構(gòu),而工業(yè)互聯(lián)網(wǎng)參考架構(gòu)(IIRA)和工業(yè)4.0參考架構(gòu)(RAMI4.0)均是頂層系統(tǒng)架構(gòu),還有一些公司企業(yè)依據(jù)自身的業(yè)務(wù)提出了自定義的技術(shù)架構(gòu),如通用的Predix、三一的根云等。
我們知道技術(shù)架構(gòu)應(yīng)由應(yīng)用場(chǎng)景的特征來(lái)決定,就現(xiàn)狀而言,工業(yè)大數(shù)據(jù)還處在產(chǎn)業(yè)的初級(jí)階段,對(duì)工業(yè)大數(shù)據(jù)應(yīng)用場(chǎng)景的認(rèn)知還不太深入,但大數(shù)據(jù)在互聯(lián)網(wǎng)的應(yīng)用已具備成熟的技術(shù)體系和應(yīng)用框架,因此,本文主要通過(guò)比較工業(yè)應(yīng)用場(chǎng)景和互聯(lián)網(wǎng)應(yīng)用場(chǎng)景的差異性,期望能夠修正互聯(lián)網(wǎng)大數(shù)據(jù)的相關(guān)應(yīng)用技術(shù)框架,以滿足工業(yè)大數(shù)據(jù)落地對(duì)技術(shù)框架的要求。
工業(yè)大數(shù)據(jù)和互聯(lián)網(wǎng)大數(shù)據(jù)的技術(shù)架構(gòu)都具備數(shù)據(jù)環(huán)境、知識(shí)環(huán)境和應(yīng)用環(huán)境三個(gè)層,如下圖所示。
數(shù)據(jù)環(huán)境
從數(shù)據(jù)環(huán)境來(lái)看,首先,互聯(lián)網(wǎng)大數(shù)據(jù)和工業(yè)大數(shù)據(jù)具備不同特征。如下表所示:
由于上述對(duì)數(shù)據(jù)的差異性,互聯(lián)網(wǎng)大數(shù)據(jù)更多的是關(guān)注數(shù)據(jù)的持久化,其技術(shù)架構(gòu)側(cè)重于實(shí)現(xiàn)異構(gòu)數(shù)據(jù)的存儲(chǔ)、訪問(wèn)的一致性,滿足多負(fù)載的并行讀能力。所以,互聯(lián)網(wǎng)催生了大量的非關(guān)系型數(shù)據(jù)庫(kù)、實(shí)時(shí)數(shù)據(jù)庫(kù)、分布式文件存儲(chǔ)的技術(shù)。
工業(yè)大數(shù)據(jù)同樣關(guān)注數(shù)據(jù)持久化,但工業(yè)大數(shù)據(jù)部署應(yīng)用的一個(gè)原則是將應(yīng)用盡可能部署在離數(shù)據(jù)產(chǎn)生源越近的地方。這是因?yàn)?,就近部署其可靠性、?shí)時(shí)性越高。需要按照業(yè)務(wù)需要進(jìn)行部署,因此,很多應(yīng)用部署在設(shè)備、生產(chǎn)車間等。所以,與互聯(lián)網(wǎng)大數(shù)據(jù)集中式存放的方式相比,工業(yè)大數(shù)據(jù)對(duì)數(shù)據(jù)存放更加離散化,在空間中形成跨網(wǎng)的分布式存儲(chǔ),且各數(shù)據(jù)節(jié)點(diǎn)對(duì)數(shù)據(jù)存放、訪問(wèn)的能力要求不一樣。比如以在某一公司實(shí)施的智能風(fēng)場(chǎng)項(xiàng)目為例,在風(fēng)機(jī)上部署的采集終端,需要存儲(chǔ)結(jié)構(gòu)化且要求實(shí)時(shí)性高的技術(shù)方案;在相應(yīng)業(yè)務(wù)端,如生產(chǎn)系統(tǒng)或調(diào)度系統(tǒng),數(shù)據(jù)是半結(jié)構(gòu)化且實(shí)時(shí)性要求一般;在公司數(shù)據(jù)中心,數(shù)據(jù)是非結(jié)構(gòu)化且需要語(yǔ)義組織。因此,需要抽象和設(shè)計(jì)一個(gè)統(tǒng)一的數(shù)據(jù)持久化環(huán)境,為工業(yè)大數(shù)據(jù)的上層應(yīng)用提供基于語(yǔ)義的數(shù)據(jù)發(fā)現(xiàn)和相適宜的訪問(wèn)能力。
另外,工業(yè)大數(shù)據(jù)的數(shù)據(jù)環(huán)境,更關(guān)注數(shù)據(jù)采集的能力。工業(yè)大數(shù)據(jù)的數(shù)據(jù)采集依賴于物聯(lián)網(wǎng)(IOT)的實(shí)現(xiàn),IOT關(guān)注的采集的可靠性,實(shí)現(xiàn)數(shù)據(jù)接入的總線化,但工業(yè)大數(shù)據(jù)對(duì)IOT提出了更多的需要。以在某一公司實(shí)施的智能風(fēng)場(chǎng)項(xiàng)目為例,在設(shè)計(jì)數(shù)據(jù)采集時(shí),考慮了如下一系列的需要。
一、IOT終端需要具備邊緣計(jì)算能力,首先是風(fēng)機(jī)高頻運(yùn)行狀態(tài)數(shù)據(jù)沒(méi)必要全部上傳,只需要上傳從風(fēng)機(jī)運(yùn)行狀態(tài)數(shù)據(jù)提取的相應(yīng)特征數(shù)據(jù),在必要時(shí),如發(fā)生故障需要原始數(shù)據(jù)進(jìn)行深入分析或者為訓(xùn)練模型需要原始數(shù)據(jù),才需要終端上傳數(shù)據(jù)。因此IOT終端需要運(yùn)行特征提取算法;
二、IOT終端需要具備對(duì)采集數(shù)據(jù)的辨?zhèn)文芰?,需要?duì)數(shù)據(jù)質(zhì)量進(jìn)行預(yù)判和修復(fù)。在采集風(fēng)機(jī)運(yùn)行數(shù)據(jù)時(shí),數(shù)據(jù)大多是通過(guò)傳感器,傳感器本身存在故障、標(biāo)定、存在壽命等問(wèn)題,產(chǎn)生錯(cuò)誤數(shù)據(jù)的概率較大,而壞數(shù)據(jù)對(duì)基于物理關(guān)聯(lián)和因果分析的模型影響相對(duì)于互聯(lián)網(wǎng)應(yīng)用基于統(tǒng)計(jì)分析的影響更高;