■以物聯(lián)網(wǎng)、云計算等綜合技術(shù)的成熟為基礎(chǔ),在學生管理數(shù)據(jù)庫中挖掘出有價值的數(shù)據(jù),經(jīng)過過程性和綜合性的考量,找到學生各種行為之間的內(nèi)在聯(lián)系,考量背后的邏輯關(guān)系,并作出恰當?shù)慕虒W決策,這才能被稱為大數(shù)據(jù)。
■隨著技術(shù)的發(fā)展,大數(shù)據(jù)在教育領(lǐng)域有了越來越廣泛的應(yīng)用,學校擁有可用的、高質(zhì)量的海量數(shù)據(jù)逐漸成為現(xiàn)實,但如何進行信息挖掘,給未來教育帶來更大的可能,則對教育研究者的想象力提出了挑戰(zhàn)。
■大數(shù)據(jù)需要每個人做基礎(chǔ)工作,給未來留下數(shù)據(jù),就是每個人對大數(shù)據(jù)最好的貢獻。
“發(fā)現(xiàn)你上個月餐飲消費較少,不知是否有經(jīng)濟困難?”不久前,華東師范大學某女生收到了學校勤助中心發(fā)來的這樣一條短信。而實際上,該女生不過是因為減肥而減少了食堂就餐的開銷。
此事讓人們驚呼學校“有愛”的同時,更讓大家關(guān)注的,是學校實現(xiàn)“有愛”的方式,即華東師大利用預(yù)警系統(tǒng)跟蹤學生的餐飲消費數(shù)據(jù),發(fā)現(xiàn)低于警戒值就發(fā)出短信慰問,以確定學生是否有經(jīng)濟困難、是否需要幫助。
有人將此稱作大數(shù)據(jù),即通過分析行為數(shù)據(jù),讓對象選擇更具有精準性。但更多的專家認為,這不過是大數(shù)據(jù)的起步階段,是一種簡單的數(shù)據(jù)挖掘,真正的大數(shù)據(jù),將給教育帶來翻天覆地的變化,甚至帶來一場新的革命。
那么,究竟什么是真正的大數(shù)據(jù)?大數(shù)據(jù)是否已經(jīng)悄悄進入教育領(lǐng)域?大數(shù)據(jù)將會給教育帶來哪些不可思議的可能?擁抱大數(shù)據(jù),我們又會面臨哪些困境和挑戰(zhàn)?
不要總喊“狼來了”,“狼”已經(jīng)來了
一直以來,人們普遍認為,只有在物理學、化學、生物學、天文學等自然科學領(lǐng)域,觀測、記錄、挖掘海量數(shù)據(jù)才是有價值的,而在教育學、社會學、心理學、管理學等社會科學領(lǐng)域,通過設(shè)計實驗及“正義的程序”調(diào)查出來的結(jié)果,常常難以得到普遍承認。
直到2012年,發(fā)生了一件重要的事情。
奧巴馬的數(shù)據(jù)團隊對數(shù)以千萬計的選民郵件進行了大數(shù)據(jù)挖掘,精確預(yù)測出了更可能擁護奧巴馬的選民類型,并進行了有針對性的宣傳,從而幫助奧巴馬成為了美國歷史上唯一一位在競選經(jīng)費處于劣勢下實現(xiàn)連任的總統(tǒng)。
“奧巴馬的例子告訴我們,只要數(shù)據(jù)量夠大,夠及時,挖掘夠深刻,我們完全可以洞悉每個選民的投票幾率。”上海思來氏信息咨詢有限公司教育測評中心首席研究員張韞說,“迅速普及的互聯(lián)網(wǎng)與移動互聯(lián)網(wǎng),悄然為記錄人的行為數(shù)據(jù)提供了最為便利、持久的載體。最重要的是,在這些強大的數(shù)據(jù)收集終端面前,人們沒有掩飾的意圖,從而創(chuàng)造著過去無法收集與分析的海量數(shù)據(jù),這讓所有社會科學領(lǐng)域能夠從宏觀群體走向微觀個體,讓跟蹤每一個人的數(shù)據(jù)成為了可能,從而讓研究人性成為了可能。”
而在教育領(lǐng)域,海量數(shù)據(jù)早在技術(shù)變革的浪潮中席卷而來。
2009年,孟加拉裔美國人薩爾曼·可汗創(chuàng)立了一家非營利教育組織——可汗學院,利用網(wǎng)絡(luò)視頻進行免費授課,涵蓋數(shù)學、歷史、金融、物理、化學、生物、天文學等科目的內(nèi)容,他的教學視頻像病毒一樣廣為傳播,如今全球已有成千上萬的學生通過互聯(lián)網(wǎng)學習其視頻課程。
隨后,類似的課程如雨后春筍般冒出,普林斯頓、伯克利、賓夕法尼亞大學等知名學府都宣布加盟在線教育,逐步向全世界開放自己的課程。
在賓夕法尼亞州,從小學到高中都建立了在線學校,有的地方免費為選擇參加在線學習的學生配發(fā)筆記本電腦、打印機和掃描儀,作為學習的工具。
……
“以在線教育為代表的各種綜合技術(shù)的集合,讓學生關(guān)于學習行為的各種數(shù)據(jù)被自動留存,例如做一道題花多長時間,是否經(jīng)過修改,做題的順序是否有跳躍,是否會回頭重新檢查……但要明確的是,僅僅是遠程教育和在線課程,不過是數(shù)字而已,并不能稱之為數(shù)據(jù)。”上海海事大學經(jīng)濟管理學院管理科學系副教授魏忠說,“以物聯(lián)網(wǎng)、云計算等綜合技術(shù)的成熟為基礎(chǔ),在學生管理數(shù)據(jù)庫中挖掘出有價值的數(shù)據(jù),經(jīng)過過程性和綜合性的考慮,找到學生各種行為之間的內(nèi)在聯(lián)系,考量背后的邏輯關(guān)系,并作出恰當?shù)慕虒W決策,這才能被稱為大數(shù)據(jù)。”
“舉個簡單的例子,一個學生考試得了78分,這只是一個數(shù)字,如果把這78分背后的因素考慮進去,例如學生的家庭背景、努力程度、學習態(tài)度、智力水平等,把它們和78分聯(lián)系在一起,這就成了數(shù)據(jù)。”魏忠說。
在研究者們看來,大數(shù)據(jù)有著明顯的特征。
“一般來說有四點。第一,數(shù)據(jù)體量巨大。從數(shù)量單位的TB(太)級別,躍升到PB(帕)級別,也就是大了至少100倍。第二,數(shù)據(jù)類型繁多。包括所有的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化(如圖片、視頻等)數(shù)據(jù)。第三,價值密度低,商業(yè)價值高。以視頻為例,連續(xù)不間斷監(jiān)控過程中,可能有用的數(shù)據(jù)僅有一兩秒。第四,處理速度快。”魏忠說。
顯而易見,考試、課堂、師生互動、校園設(shè)備使用、家校關(guān)系……只要技術(shù)達到的地方,各個環(huán)節(jié)都將滲透大數(shù)據(jù)。
“無論是教育管理部門,還是校長、教師,以及學生和家長,都可以提供針對不同應(yīng)用的個性化分析報告。通過大數(shù)據(jù)的分析來優(yōu)化教育機制,做出更科學的決策,這將帶來潛在的教育革命。”首都師范大學遠程教育所所長方海光說,“誰能在其中把握好大數(shù)據(jù),誰就能在將來的競爭中贏得主動權(quán)。”
于教育領(lǐng)域而言,大數(shù)據(jù)時代的到來,正如魏忠所說,不要總喊“狼來了”,“狼”真的已經(jīng)來了。
學校在玩大數(shù)據(jù)
近年來,我國已有不少學校開始了數(shù)據(jù)挖掘的探索,但真正被業(yè)內(nèi)人士承認的教育領(lǐng)域的大數(shù)據(jù)應(yīng)用卻為數(shù)不多,其中被公認的當數(shù)東華大學的智能實驗室項目。
幾年前,東華大學的實驗室極為分散,十幾個學院,每個學院都有三四個實驗室,有的實驗室甚至還在系里,教學評估要通過表格填報的方式來解決,數(shù)據(jù)的科學性和真實性都得不到保障,東華大學教務(wù)處處長吳良深感人工管理太吃力、效率也太低。
“2009年,我們提出智能管理的思路,即用物聯(lián)網(wǎng)的方式把實驗室里所有的儀器設(shè)備都管理起來。我們和專門研究數(shù)據(jù)挖掘的公司合作,在材料學院做了試點。”吳良說,“只要學生進入實驗室,哪個學生使用了哪臺儀器設(shè)備,使用了多長時間,基本所有的使用情況都能記錄下來,所有儀器的電流、電壓都可以監(jiān)控。之后想要的數(shù)據(jù)由電信號直接產(chǎn)生,自動計算出來自動生成表格,實驗室利用率等情況在表格上一目了然。”
如今,東華大學所有學院的實驗室都納入了智能實驗室的管理。“從表格就可以看出,哪些實驗室申請的設(shè)備根本不必購買,哪些實驗室不再需要撥錢。實驗室的使用率和第二年的經(jīng)費完全掛鉤,最后實現(xiàn)教育經(jīng)費使用的集約高效。”吳良說。
另外,東華大學智能實驗室還實現(xiàn)了24小時開放無人管理、跨學院使用等人工無法實現(xiàn)的管理,數(shù)據(jù)顯示,智能實驗室的管理對學生學習自主性的提高有顯著影響,學生在實驗室的時間甚至超過了在教室的時間。
“總體來看,目前開始進行數(shù)據(jù)挖掘的高?;径际切畔⒒龅幂^好、規(guī)模較大的學校,其主要原因是他們有充足的數(shù)據(jù)量。”魏忠說。
據(jù)了解,浙江大學通過對資產(chǎn)的歸納、整理,最終形成權(quán)威、全面的資產(chǎn)數(shù)據(jù),并提供數(shù)據(jù)查詢和分析服務(wù)。這些數(shù)據(jù)分析的成果已經(jīng)被真正地應(yīng)用起來,能夠幫助教務(wù)處更好地利用教室、實驗室等資源。
復(fù)旦大學則對特定的學生進行數(shù)據(jù)分析,并且得到一些非常有價值的數(shù)據(jù)。比如,從平均績點看,來自東部地區(qū)、中部地區(qū)、西部地區(qū)學生的成績呈遞減趨勢。在中部和西部地區(qū),城鎮(zhèn)學生成績優(yōu)于農(nóng)村學生,東部地區(qū)則相反。分析認為,出現(xiàn)這種情況或與學生所受基礎(chǔ)教育相關(guān):在中、西部地區(qū),城鎮(zhèn)的基礎(chǔ)教育資源和水平明顯高于農(nóng)村;而在東部地區(qū),不少農(nóng)村學生在基礎(chǔ)教育階段反而可能學得更深。
清華大學正在做一些學生成長類的數(shù)據(jù)分析。比如,針對進校時成績很優(yōu)秀的一批學生,追蹤其在大學四年的各種數(shù)據(jù),觀察其成長路徑,或者對畢業(yè)時表現(xiàn)很優(yōu)秀的學生進行追溯。
“可以看出,目前高校對信息數(shù)據(jù)的挖掘主要集中在針對網(wǎng)絡(luò)系統(tǒng)運行所做的數(shù)據(jù)分析、針對教學教務(wù)管理所做的支持、針對特定學生的分析、針對科研所做的數(shù)據(jù)分析支持等方面。”魏忠說。
而在中小學,一些數(shù)據(jù)挖掘的項目也在起步。
“在基于電子書包的一對一課堂數(shù)字化課堂教學中,國內(nèi)也積累了大量大數(shù)據(jù)分析決策的典型案例。”方海光說,比如首都師范大學數(shù)字化學習實驗室開發(fā)的數(shù)字化課堂的大數(shù)據(jù)分析應(yīng)用,已經(jīng)在揚州、常州等地中小學的200多個班級進行了多個學期的系統(tǒng)性試點應(yīng)用,帶來了教育效果的明顯改變。
“在數(shù)字化課堂教學過程中,可以對學習過程進行數(shù)據(jù)形式化采集和描述,并基于課堂單元和學期單元進行學習過程的大數(shù)據(jù)挖掘和分析。教師通過這些數(shù)據(jù)和分析結(jié)果,可以即時進行教學控制和教學反思,從而提高課堂教學水平。學生和家長通過這些數(shù)據(jù)和分析結(jié)果,也可以盡快發(fā)現(xiàn)自己學習中的不足,進而也可以提高自己的學習水平。”方海光說。
“在國內(nèi)尤其是北京、上海、廣東等城市,大數(shù)據(jù)在教育領(lǐng)域有了越來越多的應(yīng)用,像慕課、在線課程、翻轉(zhuǎn)課堂等,已經(jīng)有越來越多的學生加入到網(wǎng)上學習的行列中來。”北京師范大學教育技術(shù)學院教授、現(xiàn)代教育技術(shù)研究所所長何克抗說。
隨著技術(shù)的發(fā)展,大數(shù)據(jù)在教育領(lǐng)域有了越來越廣泛的應(yīng)用,學校擁有可用的、高質(zhì)量的海量數(shù)據(jù)逐漸成為現(xiàn)實,但如何進行信息挖掘,給未來教育帶來更大的可能,則對教育研究者的想象力提出了挑戰(zhàn)。
大數(shù)據(jù)時代,教育有哪些可能
“你現(xiàn)在上網(wǎng)的時候,有沒有發(fā)現(xiàn),這些網(wǎng)站正在變得越來越了解你?”張韞說,“比如淘寶網(wǎng)會根據(jù)你買過什么、瀏覽過什么,來判斷你還有可能購買什么,而新浪微博會根據(jù)你關(guān)注了誰來判斷你還可能對哪些人感興趣。”
那么,如果技術(shù)能夠幫助我們了解每一個學生的需求,綿延了2000多年的“因材施教”的理想,是否離我們更近了呢?
在張韞看來,這完全可能。“比如A同學做對了第4題,系統(tǒng)馬上可以告訴他,他可以跳過第7題,因為做對第4題的同學幾乎不可能做錯第7題。如果B同學做錯了第5題,那么系統(tǒng)會提示他繼續(xù)練習第6題,因為這個知識點可能是該學生需要反復(fù)進行操練與鞏固的。”張韞說,“學習分析系統(tǒng)讓學生接受個性化的教育具有了可能。”
“基于在線學習和學習分析技術(shù),大數(shù)據(jù)在老師的教學與學生的自主學習中,將會有更多應(yīng)用和更重要的意義。”何克抗說,“在自主學習方面,網(wǎng)絡(luò)將跟蹤學生的整個學習過程,從中了解學生的學習方法和學習習慣,了解學生的個性、興趣、愛好,從而獲取相關(guān)數(shù)據(jù),幫助學生了解自己的學習成果,更好地進行自主學習。而在教學方面,相關(guān)數(shù)據(jù)將便于老師了解學生的學習能力、認知能力,及時改進教學方法,使教學更加有針對性。另外,將來老師的在線課堂可能會擁有好幾萬學生,眾多學生的思想交流所碰撞出的思想火花,將遠遠超過只有幾十個人的傳統(tǒng)課堂,教學效果可能比傳統(tǒng)課堂更加明顯。”
魏忠認為,大數(shù)據(jù)將會給更多的教育行為、教育活動帶來新的可能。
“今后,高校的錄取方式、用人單位的招聘方式,都可能發(fā)生極大的變化。”魏忠說,“在學生的學習成長過程中,將會積累大量的結(jié)構(gòu)性、非結(jié)構(gòu)性數(shù)據(jù),例如每一次考試的成績、學習的速度、在哪方面有特長、曾經(jīng)獲得過哪些獎勵、參加過哪些社會活動等,在電子檔案中將一目了然,包括學生的微博、社交活動中也會留下大量的信息,成長軌跡非常清晰,整個過程如果想要造假,成本會相當高。高校招人只需要看這些過程化的數(shù)據(jù),選擇適合自己學校的學生,整個高考錄取行為可能變成持續(xù)不斷的錄取方式。學生的過程數(shù)據(jù)還可以顯示,這個學生是更適合做醫(yī)生還是工程師,更應(yīng)該從哪個方向努力、從事什么工作,這對學生更為重要。”
同樣,高校及用人單位的真實情況也將被數(shù)據(jù)記錄下來。“我們都說清華大學好,但它好在哪里?哪些學科排名多少?有哪些名師?特色在哪里?大數(shù)據(jù)將為學生提供精確的信息,結(jié)果是,不再有那么多學生追求名校,而是會選擇適合自己的學校和學科。”魏忠說。
“未來,當數(shù)據(jù)量積累到了一定的程度,教育將從社會科學變成實證學科,大數(shù)據(jù)將成為研究人類教育行為的基石。”魏忠說。
方海光認為,對于不同層面的決策者,大數(shù)據(jù)都會帶來不同的驚喜。對于教育行政部門、學校而言,大數(shù)據(jù)將幫助他們在管理行為上做出更加科學而非經(jīng)驗判斷式的決策;對于教育研究者來說,他們能夠重新審視學生的需求,通過高新的技術(shù)以及細致的分析,找到怎樣的課程、課堂、教師能夠更加吸引學生;對于學生而言,新技術(shù)能夠解放他們本來就有的學習能力和天分,人力資本將成倍地增長。
“總之,大數(shù)據(jù)將讓學習變成一種服務(wù)。”方海光說。
什么在阻擋大數(shù)據(jù)的來襲
大數(shù)據(jù)在教育領(lǐng)域應(yīng)用的前景很光明,但在專家們看來,道路卻十分曲折。
“好的內(nèi)容比平臺重要。”張韞說。在他看來,國內(nèi)教育領(lǐng)域最大的問題在于沒有留存數(shù)據(jù)、收集數(shù)據(jù)的意識。
對此,魏忠深有同感。“照理說,我國教育領(lǐng)域的數(shù)據(jù)資源是非常豐富的,但是我們卻面臨著數(shù)據(jù)的嚴重匱乏。比如教計算機的老師,如果不愿意進實驗室,那么數(shù)據(jù)從何而來?如果老師有心把作業(yè)變成資源放在網(wǎng)絡(luò)上,把知識變成題庫實施任務(wù)教學,那將會給未來的教學帶來成千倍的回饋。”
采集工具的研發(fā)也是大數(shù)據(jù)發(fā)展的絆腳石之一。“這需要開放市場,鼓勵和發(fā)展一些中小企業(yè)、私營企業(yè)來開發(fā)平臺和系統(tǒng),技術(shù)的研發(fā)才會生長出活力,否則,研發(fā)的速度太慢。”魏忠說。
有了數(shù)據(jù)、有了研發(fā)工具,大數(shù)據(jù)的應(yīng)用仍面臨諸多難題。
在不久前中國高等教育學會信息化分會青委會舉行的一次技術(shù)論壇上,多個高校的相關(guān)研究人員提出了自己的困惑。
清華大學信息化技術(shù)中心袁芳認為,業(yè)務(wù)需求是所有數(shù)據(jù)分析的目的,擁有了需求,高校才能有針對性地對數(shù)據(jù)進行分析,但最讓她困惑的,是不知道數(shù)據(jù)挖掘有哪些“需求”。她認為,這對于高校研究人員而言,是一種很被動的情形。“我們只好先假設(shè)一些目標,做一些我們認為有意義的分析,然后把結(jié)果給業(yè)務(wù)部門看,期待著他們會發(fā)現(xiàn),原來數(shù)據(jù)挖掘可以幫助他們實現(xiàn)這樣的功能。那么,也許可以啟發(fā)出他有別的需求。反正就是盡自己可能變被動為主動。”袁芳說。
當有了數(shù)據(jù)挖掘的需求,技術(shù)人才的缺乏又將成為挑戰(zhàn)。“數(shù)據(jù)分析對于技術(shù)人員的要求很高,要求他們不僅精通技術(shù),也要熟悉校園網(wǎng)業(yè)務(wù),而這樣的人才目前很缺乏。”張韞說。
此外,數(shù)據(jù)挖掘機制方面,學校也急需理順。華東師范大學信息化辦公室主任沈富可在論壇上提出,關(guān)于數(shù)據(jù)挖掘,國內(nèi)的院校研究也已起步,但尚停留在學術(shù)研究層面,高校內(nèi)鮮有帶有行政管理職能的院校研究機構(gòu)成立,其功能定位、研究范疇和研究方法與國外院校研究相比,尚有較大差距。其研究人員多是高等教育學專業(yè)背景的人員,雖從美國引進、傳播了院校研究的概念,并嘗試推動了院校研究的實踐,但數(shù)據(jù)分析作為現(xiàn)代院校研究的基礎(chǔ)和重要內(nèi)容,尚未引起我國大多數(shù)致力于院校研究的學者的重視。
沈富可認為,數(shù)據(jù)分析作為推動高校未來發(fā)展的一項很有戰(zhàn)略眼光的事業(yè),應(yīng)當從整個管理體制中完善。以美國紐約大學為例,其數(shù)據(jù)管理體制中有兩個重要角色,即數(shù)據(jù)管理員和院校研究辦公室。他們的數(shù)據(jù)分析是由院校研究辦公室自上而下地開展工作,院校研究辦公室直接從學校數(shù)據(jù)倉庫獲取數(shù)據(jù),信息化部門密切與之配合,雙方協(xié)同確保學校數(shù)據(jù)的準確性和完整性,我國高校在數(shù)據(jù)挖掘方面也可以參考這一機制。
在方海光看來,教育行政部門、學校等教育組織的決策者還將面臨打破常規(guī)、加大創(chuàng)新力度、增加主動性等方面的挑戰(zhàn),而這,往往是最艱難的一步。
可以想見,走向大數(shù)據(jù)時代,教育領(lǐng)域還有重重困難需要跨越。
“但是,不管怎樣,我們至少需要跨出第一步。”魏忠說,“大數(shù)據(jù)需要每個人做基礎(chǔ)工作,給未來留下數(shù)據(jù),就是每個人對大數(shù)據(jù)最好的貢獻。” (記者 易鑫)
《中國教育報》2014年3月24日第5版