圖3 基于教育大數(shù)據(jù)的數(shù)據(jù)挖掘過程
教育大數(shù)據(jù)公認(rèn)的特征之一是規(guī)模性,面對(duì)海量數(shù)據(jù),可以采取分布式文件的系統(tǒng)進(jìn)行并行運(yùn)算。對(duì)于半結(jié)構(gòu)化或非結(jié)構(gòu)化的數(shù)據(jù),可以采用自然語言理解和信息抽取等方式將其轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)。對(duì)于雜質(zhì)較多的數(shù)據(jù),可以在數(shù)據(jù)挖掘時(shí)進(jìn)行數(shù)據(jù)清洗。對(duì)于實(shí)時(shí)產(chǎn)生的數(shù)據(jù)可以使用自動(dòng)獲取效率優(yōu)先的方式來采集數(shù)據(jù)。
2.教育大數(shù)據(jù)和學(xué)習(xí)分析
新媒體聯(lián)盟(New Media Consortium)將學(xué)習(xí)分析定義為:利用松散耦合的數(shù)據(jù)收集工具和分析技術(shù),研究分析學(xué)習(xí)者學(xué)習(xí)參與、學(xué)習(xí)表現(xiàn)和學(xué)習(xí)過程的相關(guān)數(shù)據(jù),進(jìn)而對(duì)課程、教學(xué)和評(píng)價(jià)進(jìn)行實(shí)時(shí)修正。總之,學(xué)習(xí)分析運(yùn)用多種方法采集、存儲(chǔ)和分析學(xué)習(xí)者數(shù)據(jù),如移動(dòng)終端的數(shù)據(jù)和現(xiàn)場(chǎng)智能數(shù)據(jù)等,再使用多種技術(shù)來分析處理這些數(shù)據(jù),最終應(yīng)用于教育者和學(xué)習(xí)者,產(chǎn)生評(píng)估、預(yù)測(cè)和干預(yù)?;诮逃髷?shù)據(jù)的學(xué)習(xí)分析過程如圖4所示。