數(shù)據(jù)道德準(zhǔn)則(Data ethical guidelines) – 這些準(zhǔn)則有助于組織機(jī)構(gòu)使其數(shù)據(jù)透明化,保證數(shù)據(jù)的簡(jiǎn)潔、安全及隱私
數(shù)據(jù)訂閱(Data feed) – 一種數(shù)據(jù)流,例如Twitter訂閱和RSS
數(shù)據(jù)集市(Data marketplace) – 進(jìn)行數(shù)據(jù)集買賣的在線交易場(chǎng)所
數(shù)據(jù)挖掘(Data mining) – 從數(shù)據(jù)集中發(fā)掘特定模式或信息的過程
數(shù)據(jù)建模(Data modelling) – 使用數(shù)據(jù)建模技術(shù)來(lái)分析數(shù)據(jù)對(duì)象,以此洞悉數(shù)據(jù)的內(nèi)在涵義
數(shù)據(jù)集(Data set) – 大量數(shù)據(jù)的集合
數(shù)據(jù)虛擬化(Data virtualization) – 數(shù)據(jù)整合的過程,以此獲得更多的數(shù)據(jù)信息,這個(gè)過程通常會(huì)引入其他技術(shù),例如數(shù)據(jù)庫(kù),應(yīng)用程序,文件系統(tǒng),網(wǎng)頁(yè)技術(shù),大數(shù)據(jù)技術(shù)等等
去身份識(shí)別(De-identification) – 也稱為匿名化(anonymization),確保個(gè)人不會(huì)通過數(shù)據(jù)被識(shí)別
判別分析(Discriminant analysis) – 將數(shù)據(jù)分類;按不同的分類方式,可將數(shù)據(jù)分配到不同的群組,類別或者目錄。是一種統(tǒng)計(jì)分析法,可以對(duì)數(shù)據(jù)中某些群組或集群的已知信息進(jìn)行分析,并從中獲取分類規(guī)則。
分布式文件系統(tǒng)(Distributed File System) – 提供簡(jiǎn)化的,高可用的方式來(lái)存儲(chǔ)、分析、處理數(shù)據(jù)的系統(tǒng)
文件存貯數(shù)據(jù)庫(kù)(Document Store Databases) – 又稱為文檔數(shù)據(jù)庫(kù)(document-oriented database), 為存儲(chǔ)、管理、恢復(fù)文檔數(shù)據(jù)而專門設(shè)計(jì)的數(shù)據(jù)庫(kù),這類文檔數(shù)據(jù)也稱為半結(jié)構(gòu)化數(shù)據(jù)
E
探索性分析(Exploratory analysis) – 在沒有標(biāo)準(zhǔn)的流程或方法的情況下從數(shù)據(jù)中發(fā)掘模式。是一種發(fā)掘數(shù)據(jù)和數(shù)據(jù)集主要特性的一種方法
E字節(jié)(EB: Exabytes) – 約等于1000 PB(petabytes), 約等于1百萬(wàn) GB。如今全球每天所制造的新信息量大約為1 EB
提取-轉(zhuǎn)換-加載(ETL: Extract, Transform and Load) – 是一種用于數(shù)據(jù)庫(kù)或者數(shù)據(jù)倉(cāng)庫(kù)的處理過程。即從各種不同的數(shù)據(jù)源提取(E)數(shù)據(jù),并轉(zhuǎn)換(T)成能滿足業(yè)務(wù)需要的數(shù)據(jù),最后將其加載(L)到數(shù)據(jù)庫(kù)
F
故障切換(Failover) – 當(dāng)系統(tǒng)中某個(gè)服務(wù)器發(fā)生故障時(shí),能自動(dòng)地將運(yùn)行任務(wù)切換到另一個(gè)可用服務(wù)器或節(jié)點(diǎn)上
容錯(cuò)設(shè)計(jì)(Fault-tolerant design) – 一個(gè)支持容錯(cuò)設(shè)計(jì)的系統(tǒng)應(yīng)該能夠做到當(dāng)某一部分出現(xiàn)故障也能繼續(xù)運(yùn)行
G
游戲化(Gamification) – 在其他非游戲領(lǐng)域中運(yùn)用游戲的思維和機(jī)制,這種方法可以以一種十分友好的方式進(jìn)行數(shù)據(jù)的創(chuàng)建和偵測(cè),非常有效。
圖形數(shù)據(jù)庫(kù)(Graph Databases) – 運(yùn)用圖形結(jié)構(gòu)(例如,一組有限的有序?qū)Γ蛘吣撤N實(shí)體)來(lái)存儲(chǔ)數(shù)據(jù),這種圖形存儲(chǔ)結(jié)構(gòu)包括邊緣、屬性和節(jié)點(diǎn)。它提供了相鄰節(jié)點(diǎn)間的自由索引功能,也就是說(shuō),數(shù)據(jù)庫(kù)中每個(gè)元素間都與其他相鄰元素直接關(guān)聯(lián)。
網(wǎng)格計(jì)算(Grid computing) – 將許多分布在不同地點(diǎn)的計(jì)算機(jī)連接在一起,用以處理某個(gè)特定問題,通常是通過云將計(jì)算機(jī)相連在一起。
H
Hadoop – 一個(gè)開源的分布式系統(tǒng)基礎(chǔ)框架,可用于開發(fā)分布式程序,進(jìn)行大數(shù)據(jù)的運(yùn)算與存儲(chǔ)。
Hadoop數(shù)據(jù)庫(kù)(HBase) – 一個(gè)開源的、非關(guān)系型、分布式數(shù)據(jù)庫(kù),與Hadoop框架共同使用
HDFS – Hadoop分布式文件系統(tǒng)(Hadoop Distributed File System);是一個(gè)被設(shè)計(jì)成適合運(yùn)行在通用硬件(commodity hardware)上的分布式文件系統(tǒng)
高性能計(jì)算(HPC: High-Performance-Computing) – 使用超級(jí)計(jì)算機(jī)來(lái)解決極其復(fù)雜的計(jì)算問題
I
內(nèi)存數(shù)據(jù)庫(kù)(IMDB: In-memory) – 一種數(shù)據(jù)庫(kù)管理系統(tǒng),與普通數(shù)據(jù)庫(kù)管理系統(tǒng)不同之處在于,它用主存來(lái)存儲(chǔ)數(shù)據(jù),而非硬盤。其特點(diǎn)在于能高速地進(jìn)行數(shù)據(jù)的處理和存取。
物聯(lián)網(wǎng)(Internet of Things) – 在普通的設(shè)備中裝上傳感器,使這些設(shè)備能夠在任何時(shí)間任何地點(diǎn)與網(wǎng)絡(luò)相連。
J
法律上的數(shù)據(jù)一致性(Juridical data compliance) – 當(dāng)你使用的云計(jì)算解決方案,將你的數(shù)據(jù)存儲(chǔ)于不同的國(guó)家或不同的大陸時(shí),就會(huì)與這個(gè)概念扯上關(guān)系了。你需要留意這些存儲(chǔ)在不同國(guó)家的數(shù)據(jù)是否符合當(dāng)?shù)氐姆伞?/p>
K
鍵值數(shù)據(jù)庫(kù)(KeyValue Databases) – 數(shù)據(jù)的存儲(chǔ)方式是使用一個(gè)特定的鍵,指向一個(gè)特定的數(shù)據(jù)記錄,這種方式使得數(shù)據(jù)的查找更加方便快捷。鍵值數(shù)據(jù)庫(kù)中所存的數(shù)據(jù)通常為編程語(yǔ)言中基本數(shù)據(jù)類型的數(shù)據(jù)。
L
延遲(Latency) – 表示系統(tǒng)時(shí)間的延遲
遺留系統(tǒng)(Legacy system) – 是一種舊的應(yīng)用程序,或是舊的技術(shù),或是舊的計(jì)算系統(tǒng),現(xiàn)在已經(jīng)不再支持了。