Q
數(shù)字化自我(Quantified Self) – 使用應(yīng)用程序跟蹤用戶一天的一舉一動,從而更好地理解其相關(guān)的行為
查詢(Query) – 查找某個問題答案的相關(guān)信息
R
再識別(Re-identification) – 將多個數(shù)據(jù)集合并在一起,從匿名化的數(shù)據(jù)中識別出個人信息
回歸分析(Regression analysis) – 確定兩個變量間的依賴關(guān)系。這種方法假設(shè)兩個變量之間存在單向的因果關(guān)系(譯者注:自變量,因變量,二者不可互換)
RFID – 射頻識別; 這種識別技術(shù)使用一種無線非接觸式射頻電磁場傳感器來傳輸數(shù)據(jù)
實(shí)時數(shù)據(jù)(Real-time data) – 指在幾毫秒內(nèi)被創(chuàng)建、處理、存儲、分析并顯示的數(shù)據(jù)
推薦引擎(Recommendation engine) – 推薦引擎算法根據(jù)用戶之前的購買行為或其他購買行為向用戶推薦某種產(chǎn)品
路徑分析(Routing analysis) – 針對某種運(yùn)輸方法通過使用多種不同的變量分析從而找到一條最優(yōu)路徑,以達(dá)到降低燃料費(fèi)用,提高效率的目的
S
半結(jié)構(gòu)化數(shù)據(jù)(Semi-structured data) – 半結(jié)構(gòu)化數(shù)據(jù)并不具有結(jié)構(gòu)化數(shù)據(jù)嚴(yán)格的存儲結(jié)構(gòu),但它可以使用標(biāo)簽或其他形式的標(biāo)記方式以保證數(shù)據(jù)的層次結(jié)構(gòu)
情感分析(Sentiment Analysis) – 通過算法分析出人們是如何看待某些話題
信號分析(Signal analysis) – 指通過度量隨時間或空間變化的物理量來分析產(chǎn)品的性能。特別是使用傳感器數(shù)據(jù)。
相似性搜索(Similarity searches) – 在數(shù)據(jù)庫中查詢最相似的對象,這里所說的數(shù)據(jù)對象可以是任意類型的數(shù)據(jù)
仿真分析(Simulation analysis) – 仿真是指模擬真實(shí)環(huán)境中進(jìn)程或系統(tǒng)的操作。仿真分析可以在仿真時考慮多種不同的變量,確保產(chǎn)品性能達(dá)到最優(yōu)
智能網(wǎng)格(Smart grid) – 是指在能源網(wǎng)中使用傳感器實(shí)時監(jiān)控其運(yùn)行狀態(tài),有助于提高效率
軟件即服務(wù)(SaaS: Software-as-a-Service) – 基于Web的通過瀏覽器使用的一種應(yīng)用軟件
空間分析(Spatial analysis) – 空間分析法分析地理信息或拓?fù)湫畔⑦@類空間數(shù)據(jù),從中得出分布在地理空間中的數(shù)據(jù)的模式和規(guī)律
SQL – 在關(guān)系型數(shù)據(jù)庫中,用于檢索數(shù)據(jù)的一種編程語言
結(jié)構(gòu)化數(shù)據(jù)(Structured data) -可以組織成行列結(jié)構(gòu),可識別的數(shù)據(jù)。這類數(shù)據(jù)通常是一條記錄,或者一個文件,或者是被正確標(biāo)記過的數(shù)據(jù)中的某一個字段,并且可以被精確地定位到。
T
T字節(jié)(TB: Terabytes) – 約等于1000 GB(gigabytes)。1 TB容量可以存儲約300小時的高清視頻。
時序分析(Time series analysis) – 分析在重復(fù)測量時間里獲得的定義良好的數(shù)據(jù)。分析的數(shù)據(jù)必須是良好定義的,并且要取自相同時間間隔的連續(xù)時間點(diǎn)。
拓?fù)鋽?shù)據(jù)分析(Topological Data Analysis) – 拓?fù)鋽?shù)據(jù)分析主要關(guān)注三點(diǎn):復(fù)合數(shù)據(jù)模型、集群的識別、以及數(shù)據(jù)的統(tǒng)計學(xué)意義。
交易數(shù)據(jù)(Transactional data) – 隨時間變化的動態(tài)數(shù)據(jù)
透明性(Transparency) – 消費(fèi)者想要知道他們的數(shù)據(jù)有什么作用、被作何處理,而組織機(jī)構(gòu)則把這些信息都透明化了。
U
非結(jié)構(gòu)化數(shù)據(jù)(Un-structured data) – 非結(jié)構(gòu)化數(shù)據(jù)一般被認(rèn)為是大量純文本數(shù)據(jù),其中還可能包含日期,數(shù)字和實(shí)例。
V
價值(Value) – (譯者注:大數(shù)據(jù)4V特點(diǎn)之一) 所有可用的數(shù)據(jù),能為組織機(jī)構(gòu)、社會、消費(fèi)者創(chuàng)造出巨大的價值。這意味著各大企業(yè)及整個產(chǎn)業(yè)都將從大數(shù)據(jù)中獲益。
可變性(Variability) – 也就是說,數(shù)據(jù)的含義總是在(快速)變化的。例如,一個詞在相同的推文中可以有完全不同的意思。
多樣(Variety) – (譯者注:大數(shù)據(jù)4V特點(diǎn)之一) 數(shù)據(jù)總是以各種不同的形式呈現(xiàn),如結(jié)構(gòu)化數(shù)據(jù),半結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù),甚至還有復(fù)雜結(jié)構(gòu)化數(shù)據(jù)
高速(Velocity) – (譯者注:大數(shù)據(jù)4V特點(diǎn)之一) 在大數(shù)據(jù)時代,數(shù)據(jù)的創(chuàng)建、存儲、分析、虛擬化都要求被高速處理。
真實(shí)性(Veracity) – 組織機(jī)構(gòu)需要確保數(shù)據(jù)的真實(shí)性,才能保證數(shù)據(jù)分析的正確性。因此,真實(shí)性(Veracity)是指數(shù)據(jù)的正確性。
可視化(Visualization) – 只有正確的可視化,原始數(shù)據(jù)才可被投入使用。這里的“可視化”并非普通的圖型或餅圖,可視化指是的復(fù)雜的圖表,圖表中包含大量的數(shù)據(jù)信息,但可以被很容易地理解和閱讀。
大量(Volume) – (譯者注:大數(shù)據(jù)4V特點(diǎn)之一) 指數(shù)據(jù)量,范圍從Megabytes至Brontobytes