三、基于大數(shù)據(jù)教育研究的局限與超越
正如傳統(tǒng)的小數(shù)據(jù)時(shí)代一樣,大數(shù)據(jù)將會(huì)有很廣闊的應(yīng)用前景。它將在很大程度上彌補(bǔ)傳統(tǒng)科研方式的種種弊端。但是,大數(shù)據(jù)也和小數(shù)據(jù)一樣,僅僅是我們探究真理的工具而已,卻不是“真理”本身。進(jìn)入了大數(shù)據(jù)時(shí)代,我們顯然對“信息”情有獨(dú)鐘,“它已經(jīng)對身處其中的人們形成了壓力,我們有必要積極主動(dòng)地重獲平衡,保住想象力的領(lǐng)地。我們能從數(shù)據(jù)也能從生活中獲得意義,但要指出的是,這一能力高低,全賴于我們的想象力能否抵擋來自集體思維的壓力,我們的想象力又是否足夠強(qiáng)大,強(qiáng)大到可以超越那些顯而易見的路徑,做出變革性的發(fā)現(xiàn),幫助我們最大化地發(fā)揮我們的潛力”。[10]所以,在教育研究領(lǐng)域,我們需要重新審視想象力這個(gè)問題,以超越大數(shù)據(jù)時(shí)代即將帶來的挑戰(zhàn)。
(一)基于大數(shù)據(jù)教育研究的局限
除了上述普遍意義上的挑戰(zhàn)之外,大數(shù)據(jù)時(shí)代的教育研究面臨著兩個(gè)很切實(shí)的矛盾問題:價(jià)值密度與技術(shù)難度的矛盾;數(shù)據(jù)廣度與信息安全度的矛盾。這些矛盾是大數(shù)據(jù)本身的固有矛盾,就像計(jì)算機(jī)系統(tǒng)本身的誤差一樣不可避免,我們只能利用技術(shù)無限縮小而不能徹底消除誤差。事實(shí)上,這恰恰是一切教育研究想象力的空間所在。
1.“價(jià)值密度”與“技術(shù)難度”的矛盾
雖然大數(shù)據(jù)在教育研究中擁有很大的應(yīng)用前景,但是我們更應(yīng)該看到其局限性。首先便是大數(shù)據(jù)的價(jià)值密度與技術(shù)難度問題。“高價(jià)值”是大數(shù)據(jù)時(shí)代的四大特征之一,這里的“高價(jià)值”意指經(jīng)過多番提純后的關(guān)鍵數(shù)據(jù),而不是所有采集到的數(shù)據(jù),所以大量數(shù)據(jù)事實(shí)上具有極低的價(jià)值密度。一般來講,初始數(shù)據(jù)體量越大,越全面,其經(jīng)過數(shù)據(jù)分析后所得結(jié)論才會(huì)越準(zhǔn)確,價(jià)值越大,但是相應(yīng)的數(shù)據(jù)的價(jià)值密度也會(huì)越低,而技術(shù)難度卻越大。我們往往會(huì)樂觀預(yù)計(jì)其前景效益,但忽略其潛在的難題:數(shù)據(jù)采集的終端選取及標(biāo)準(zhǔn)化問題,數(shù)據(jù)存儲(chǔ)所需的基礎(chǔ)設(shè)施投入問題,數(shù)據(jù)分析所需的技術(shù)人才儲(chǔ)備與培養(yǎng)問題,大數(shù)據(jù)應(yīng)用階段的普及化問題,等等。另外,延伸到教育領(lǐng)域之內(nèi),我國教育資源在區(qū)域、城鄉(xiāng)、校際之間存在嚴(yán)重的分配失衡現(xiàn)象,大數(shù)據(jù)的引入是否會(huì)造成新的“數(shù)據(jù)鴻溝”,加劇新的教育不公平現(xiàn)象?在這些問題沒有很好的評估之前,跟盲目的跟風(fēng)歡呼沒有任何實(shí)際意義。以大數(shù)據(jù)模式下的課堂教學(xué)研究為例,“根據(jù)美國著名的課堂觀察應(yīng)用軟件開發(fā)商Classroom Observer的研究,在一節(jié)40分鐘的普通中學(xué)課堂中一個(gè)學(xué)生所產(chǎn)生的全息數(shù)據(jù)約有5GB~6GB,而其中可歸類、標(biāo)簽、并進(jìn)行分析的量化數(shù)據(jù)約有50MB~60MB,這相當(dāng)于他在傳統(tǒng)數(shù)據(jù)領(lǐng)域中積累5000年的數(shù)據(jù)總和”。[1]這么大的數(shù)據(jù)體量,如果沒有經(jīng)過提純,那么教育研究的價(jià)值幾乎無法得到展現(xiàn)。但也恰恰是大數(shù)據(jù)時(shí)代,教育者及教育研究者所面臨的困境與挑戰(zhàn)。這對于研究者的數(shù)據(jù)分析技術(shù)有很高的要求,那么也就意味著很多傳統(tǒng)的教育者和教育研究者要實(shí)現(xiàn)轉(zhuǎn)型,積極跟上大數(shù)據(jù)的時(shí)代潮流。但是缺乏數(shù)據(jù)統(tǒng)計(jì)與分析人才是我國目前面對的普遍短板,不是短時(shí)間內(nèi)可以解決的。這肯定會(huì)影響大數(shù)據(jù)在教育研究中的應(yīng)用。
2.“數(shù)據(jù)廣度”與“信息安全度”的矛盾
教育研究的倫理問題也是大數(shù)據(jù)教育研究所不能回避的?;\統(tǒng)來說,在教育活動(dòng)中進(jìn)行教育數(shù)據(jù)采集的時(shí)候,我們會(huì)直接面臨三個(gè)問題:哪些信息可以采集?通過什么樣的方式采集?采集所得數(shù)據(jù)的應(yīng)用范圍?這都涉及教育研究的倫理問題。首先,大數(shù)據(jù)依賴的是海量的信息搜集,比如全景式或關(guān)鍵區(qū)域的視頻監(jiān)控,學(xué)生、尤其涉及中小學(xué)生的非結(jié)構(gòu)化信息都可能涉及隱私問題,而矛盾在于數(shù)據(jù)采集的范圍越廣,程度越深,其所涉及的信息的安全度就越低,數(shù)據(jù)泄露所帶來的危害風(fēng)險(xiǎn)也越大。但是,大量數(shù)據(jù)的搜集總會(huì)或多或少地侵犯到對象的隱私。因此,在教育領(lǐng)域內(nèi),制定具有針對性的信息采集規(guī)范是十分必要的。第二個(gè)問題是“通過什么樣的方式采集信息?”大數(shù)據(jù)采集信息的方式、方法無疑是合乎互聯(lián)網(wǎng)精神的,即開放、分享、平等、合作。但是信息的主動(dòng)開放與無意開放,主動(dòng)分享與被動(dòng)分享完全是兩個(gè)概念。教育系統(tǒng)內(nèi),學(xué)生大多是未成年人,其個(gè)人數(shù)據(jù)信息具有特殊性,他們對自身的數(shù)據(jù)以及開放范圍是否具有決定權(quán),依據(jù)年齡不同,其決定權(quán)的程度是什么?都是需要加以考慮的。例如,谷歌公司所研發(fā)的可穿戴設(shè)備“谷歌眼鏡”(Google Glass)是未來很好的收集大數(shù)據(jù)的工具,但是這種設(shè)備也意味著我們的隱私幾乎處于無限的開放狀態(tài)。第三個(gè)問題所涉及的是“應(yīng)用范圍”,學(xué)生的海量數(shù)據(jù)被用來改進(jìn)教學(xué)策略,提高教學(xué)質(zhì)量,進(jìn)行特定問題預(yù)測等等。以預(yù)測為例,我們能不能利用某個(gè)學(xué)生的海量信息推測其暴力傾向與輟學(xué)可能等敏感問題?我們應(yīng)不應(yīng)該相信預(yù)測結(jié)果?大數(shù)據(jù)在我們的教育決策當(dāng)中到底應(yīng)該占多大比重?這些都是大數(shù)據(jù)之于教育研究的倫理問題。畢竟,教育是培養(yǎng)人的活動(dòng),教育研究也是研究如何培養(yǎng)人的活動(dòng),在用數(shù)據(jù)衡量和預(yù)測人性行為在多大程度上是合理和可以接受的,大數(shù)據(jù)如何在保持自身科學(xué)性和有效性的前提下,估計(jì)到教育本應(yīng)有的人文關(guān)懷,讓冰冷的數(shù)字閃耀人性的光輝?本質(zhì)上,數(shù)字與技術(shù)都是工具和雙刃劍,關(guān)鍵在于我們?nèi)绾握疹櫟狡鋺?yīng)用倫理,并以此為指導(dǎo),發(fā)揮大數(shù)據(jù)在教育研究領(lǐng)域的最大效益。