剛才講到了我們的產品架構、落地架構,其實里面還有很重要的一點,就是我們數據模型的建立。因為數據模型里面其實是有大量工作要做的,比如說原數據的建立,比如說關于分組定義、實體定義、實體的屬性,這些都是需要在真正的每個項目當中去大量實踐得出來的一些比較經典的模型體系在里面。上面講完是關于我們軍事研判的解決方案,接下來我會跟大家分享一下關于這種軍事目標事件,和目標態(tài)勢的分析。
首先我們看一下關于軍事事件的分析,首先我們看一下他的價值。因為很多的軍事事件的發(fā)展脈絡,包括因果關系,由于這種時間跨度較長被打散,很難做出有效的分析,這就是他的一個很現實的痛點。為什么我們可以通過大數據解決這個痛點呢。
因為大數據的形勢,突破了以前傳統(tǒng)數據的一種分析理論。所以說我們可以一個特定的軍事事件分結構化,通過若干元素構成一個結構化的模型,然后通過這種反復訓練的最優(yōu)算法。最終我們是想得到一個什么情況呢,是得到一些比如基于該事件的一些內容推薦。然后,基于同事件相關結構化數據的推薦,還有一些反饋式,怎么講,怎么理解,其實就是可以基于一個事件,我會基于時間軸的一個演變,甚至可以推演出以前發(fā)生過類似的事件,他的類似事件的演變情況是如何的。所以說基于事件的這種分析演變,包括展示,包括事件的這種起因、轉折、高潮、結尾,甚至重要參與者的一些言論,相關國家的一些態(tài)度,相關方的一些行為。我們通過大數據都會做一個很好的展示。
這是民用里面的一個輿情,真正的一個軍事事件里面的輿情分析是很關鍵的。就是說大眾包括媒體,對這種某個事件的關注度如何,他的傾向度如何,其實這個很關鍵,所以說我們所謂的這種輿情分析,在一個軍事事件分析當中是至關重要的。這個也是我們做的一個真實案例。就是說你可以看到,一個輿情的重要性,他的傾向性,包括對媒體的轉載性以及他后期產生的效果,我們可以把這些輿情都進行歸納總結,通過大數據的這種能力展現出來,其實這個是很好的對軍事事件的一個梳理,甚至對他結果的一個分類。
其實所有的軍事事件分析的核心理論是做這種文本的挖掘還有標簽的建立,這個是偏理論的東西。因為當前一個事件的分析,其實他要借助于很多歷史事件的,很多歷史事件是存在于哪兒呢?存在于很多這種非結構化的數據當中。所以說我們要通過這種大量的非結構化數據,尋找里面的高頻詞或者拓展詞。
通過這些拓展詞我們會發(fā)現某兩個事件是有類似特征的,這兩個事件是有關聯(lián)性的。所以我們會對這兩個事件做標簽。然后這樣達到一個什么效果呢,我們就會查詢到類似的事件,實際以前是很難做到這點的,關于類似事件的一個分析研判。這是基于文本數據的挖掘。然后這里面還有很重要的一點,就是關于文本的達標和自動摘要。我們的檔案的文本上來之后,我們進行預處理,然后預處理完之后要進行最關鍵的兩點要打標,就是打標簽。貼上一個標簽,某個事件是什么樣的標簽,他是一個偵查的事件,還是說一個間諜的事件,這個是要打上標簽的。所以說打上標簽之后未來就基于標簽做很多這種預測或者是關聯(lián)的分析。然后還有自動摘要,所謂的自動摘要就是說我要從這種事件里面得到這種關鍵字關鍵信息。
可以看到一個事件模型大致提取的算法邏輯是什么樣子,你可以看到,一個典型的事件模型是由什么構成的,是時間、地點、人物、事件就構成了一個事件模型。他是有主語和謂語還有賓語的。所以說主語我們提取出來一些主題庫,這就是我們構成未來數據模型的思路。比如說是名人,還是說一些在軍事領域比較突出的人,我們會把他作為一個主體抽取到我們的原數據庫里面,還有會構成一些謂語的庫。比如說是風暴是爆炸,就是類似。所以說我們在大量的事件當中提取這種關鍵字,然后這種關鍵詞會構成我們原數據的倉儲里面。然后可以看到通過這種文本的內容之后進行這種事件挖掘,事件挖掘的結果我們可以對這種事件發(fā)展的脈絡,包括事件的影響力做出一個精準的判斷。其實這個是最主要的一個因素。
剛才講的是關于目標事件的,下面我們可以看一下關于目標態(tài)勢的。所謂的目標態(tài)勢,其實目標是有很多種的。目標態(tài)勢就是說比如說一個飛機軌跡,或者是說一個航行軌跡,或者是說船舶的軌跡,其實這都叫目標。