大數(shù)據(jù)的3V定義基本是從大數(shù)據(jù)的特征出發(fā),即:規(guī)模性(Volume)、多樣性(Variety)和高速性(Velocity).目前比較認(rèn)可是4V定義,如國際數(shù)據(jù)公司(IDC)認(rèn)為,大數(shù)據(jù)是符合4V特征的數(shù)據(jù)集,即在3V基礎(chǔ)上增加價(jià)值性(Value)。而IBM認(rèn)為大數(shù)據(jù)必然具有真實(shí)性(Veracity)。維基百科對(duì)大數(shù)據(jù)的定義是:“巨量資料(Big Data),或稱大數(shù)據(jù)、海量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊”。
另一方面,教育大數(shù)據(jù)的定義最早從產(chǎn)生教育大數(shù)據(jù)的主體出發(fā),將教育大數(shù)據(jù)分為廣義的和狹義的兩類:廣義的教育大數(shù)據(jù)泛指所有來源于日常教育活動(dòng)中人類的行為數(shù)據(jù);狹義的教育大數(shù)據(jù)是指學(xué)習(xí)者行為數(shù)據(jù)。也有研究指出教育大數(shù)據(jù)指整個(gè)教育活動(dòng)過程中所產(chǎn)生的以及根據(jù)教育需要采集到的,一切用于教育發(fā)展并可創(chuàng)造巨大潛在價(jià)值的數(shù)據(jù)集合。
基于以上研究,可以認(rèn)為教育大數(shù)據(jù)的定義包含三層含義:第一個(gè)含義,教育大數(shù)據(jù)是教育領(lǐng)域的大數(shù)據(jù),是面向特定教育主題的多類型、多維度、多形態(tài)的數(shù)據(jù)集合;第二個(gè)含義,教育大數(shù)據(jù)是面向教育全過程的數(shù)據(jù),通過數(shù)據(jù)挖掘和學(xué)習(xí)分析支持教育決策和個(gè)性化學(xué)習(xí);第三個(gè)含義,教育大數(shù)據(jù)是一種分布式計(jì)算架構(gòu)方式,通過數(shù)據(jù)共享的各種支持技術(shù)達(dá)到共建共享的思想。也就是說,我們把教育大數(shù)據(jù)定義為:面向教育全過程時(shí)空的多種類型的全樣本的數(shù)據(jù)集合。教育大數(shù)據(jù)不僅僅是建設(shè)教育大數(shù)據(jù)中心,不僅僅是分析全過程學(xué)習(xí)數(shù)據(jù),更多的是一種共享的生態(tài)思想。
與用傳統(tǒng)方法收集的教育數(shù)據(jù)相比,教育大數(shù)據(jù)有更強(qiáng)的實(shí)時(shí)性、連續(xù)性、綜合性和自然性,并使用不同的應(yīng)用程序來分析和處理不同復(fù)雜度和深度的數(shù)據(jù)。傳統(tǒng)教育數(shù)據(jù)收集的大多是階段性的數(shù)據(jù),而且大多在用戶知情的情況下收集,使用的分析方法也通常是簡單的統(tǒng)計(jì)分析方法。教育大數(shù)據(jù)收集的是整個(gè)教育教學(xué)過程中靜態(tài)和動(dòng)態(tài)的所有數(shù)據(jù),可以在不影響教師和學(xué)生活動(dòng)的情況下,連續(xù)記錄整個(gè)教學(xué)活動(dòng)的所有數(shù)據(jù),如教學(xué)資料、互動(dòng)反映和學(xué)生在每個(gè)知識(shí)點(diǎn)上停留的時(shí)間等。