還記得那個(gè)關(guān)于大數(shù)據(jù)挖掘的經(jīng)典案例嗎?掌握海量信息的商店甚至?xí)纫粋€(gè)母親更先知道她的女兒已經(jīng)懷孕。而備考題庫(kù)產(chǎn)品猿題庫(kù)的產(chǎn)品愿景也類似:在考試方面,它要做到比你自己更了解你,從而幫助你更有效率地練習(xí)。你哪道題不會(huì),什么地方有遺漏,它都會(huì)告訴你;如果你練習(xí)得夠勤快,它還可以告訴你,在尚未舉行的考試中,你能拿到多少分。
這也正是猿題庫(kù)的CEO李勇強(qiáng)調(diào)自己做的其實(shí)是大數(shù)據(jù)業(yè)務(wù)的原因。他說,猿題庫(kù)做的就是通過人工智能算法對(duì)考點(diǎn)、考頻和難度進(jìn)行分析,基于大數(shù)據(jù)挖掘準(zhǔn)確評(píng)估出用戶當(dāng)前的能力水平,做到一對(duì)一的針對(duì)性出題。
昨日上線的猿題庫(kù)司考-國(guó)家司法考試,是猿題庫(kù)推出的第二個(gè)備考題庫(kù)類產(chǎn)品。此前的猿題庫(kù)-公務(wù)員考試系列已經(jīng)在兩個(gè)多月內(nèi)吸引了20萬的注冊(cè)用戶,并預(yù)計(jì)在今年會(huì)達(dá)到150萬。在先嘗試過社區(qū)平臺(tái)類產(chǎn)品粉筆網(wǎng)之后,李勇團(tuán)隊(duì)選擇從資格考試備考這個(gè)小角度,再次切入到在線教育中。
“和很多教育類網(wǎng)站不同,猿題庫(kù)并不是簡(jiǎn)單地想把線下的內(nèi)容搬到線上,而要是把運(yùn)算和云服務(wù)帶到傳統(tǒng)教育中去。所以我們實(shí)際上是一個(gè)云計(jì)算公司。這件事沒有人干,但是很有價(jià)值。”
李勇說:“事實(shí)表明,用戶對(duì)互聯(lián)網(wǎng)背靠產(chǎn)品的接受意愿,是比我們想的要樂觀很多,云計(jì)算和數(shù)據(jù)挖掘能發(fā)揮很大的作用,考生的行為也能參與到產(chǎn)品完善中來,再加上移動(dòng)互聯(lián)網(wǎng),這個(gè)產(chǎn)品發(fā)展的比預(yù)想的好很多。”
職業(yè)考試備考是強(qiáng)需求,用戶們都是主動(dòng)在各大網(wǎng)站和論壇上找信息,所以產(chǎn)品并不難接觸到用戶,但用戶對(duì)產(chǎn)品質(zhì)量高度敏感,所以李勇團(tuán)隊(duì)的做法就是,和傳統(tǒng)機(jī)構(gòu)合作保證內(nèi)容專業(yè)性,再利用數(shù)據(jù)挖掘技術(shù)和用戶體驗(yàn)來構(gòu)建自己的核心價(jià)值。
李勇說,在傳統(tǒng)教育方式中,無論是題庫(kù)準(zhǔn)備還是能力測(cè)試,建立模型時(shí)賦值的方法都很粗暴,主要是憑借老師的經(jīng)驗(yàn)來進(jìn)行,并且很難根據(jù)考生的表現(xiàn)來優(yōu)化。但是對(duì)于猿題庫(kù)來說,則會(huì)分成兩步走:在產(chǎn)品剛推出來、還沒積累起有效數(shù)據(jù)時(shí),他們會(huì)先采取經(jīng)驗(yàn)賦值,但是隨著用戶數(shù)據(jù)的積累,他們基于項(xiàng)目反應(yīng)理論、遺傳基因算法、和艾賓浩斯記憶曲線建立起來的算法模型就會(huì)發(fā)揮價(jià)值,讓每一個(gè)用戶做的試卷都不一樣。
而且,傳統(tǒng)教育的數(shù)據(jù)處理是樣本式的,而猿題庫(kù)只要有用戶進(jìn)行練習(xí)后,就能開始收集數(shù)據(jù),全部用戶行為都是數(shù)據(jù)來源,一旦不再需要樣本,數(shù)據(jù)值的標(biāo)簽就特別大,可以把偏差減到最小。而從他們的公務(wù)員行測(cè)產(chǎn)品來看,推出兩個(gè)多月,用戶累計(jì)有效答題量已經(jīng)超過了2235萬。
這些算法和數(shù)據(jù),從產(chǎn)品層面來說,體現(xiàn)在了猿題庫(kù)的兩個(gè)主要模塊上:智能練習(xí)和能力評(píng)估。
在智能練習(xí)這一塊,猿題庫(kù)會(huì)從兩個(gè)角度考慮:1.誰在做題。結(jié)合用戶之前做題的歷史數(shù)據(jù),實(shí)時(shí)評(píng)估個(gè)人能力;2.題是哪些,根據(jù)全部有效用戶的海量做題數(shù)據(jù),實(shí)時(shí)統(tǒng)計(jì)題目的相關(guān)信息,包括每道題的答題時(shí)間、正確率、難度、易錯(cuò)項(xiàng)、難度值等,結(jié)合考點(diǎn)和難度值的要求,選擇題目。
就拿模擬試卷來說,猿題庫(kù)的做法并非是把題庫(kù)里的題隨機(jī)抽取組合,而是結(jié)合遺傳基因算法,有一個(gè)復(fù)雜的計(jì)算過程:系統(tǒng)先在題庫(kù)里生成一百套題目,然后兩兩組合,新生成兩百套題目,再以考點(diǎn)與原來用戶練習(xí)的情況為標(biāo)準(zhǔn),對(duì)題目進(jìn)行打分,把打分低的去除,保留一百套。這樣做一百次之后,最后才會(huì)生成一套試卷提供給用戶。
從能力評(píng)估上來說,他們會(huì)根據(jù)用戶的歷史練習(xí)數(shù)據(jù),計(jì)算出用戶對(duì)各個(gè)考點(diǎn)的掌握能力,然后通過與以往考試重點(diǎn)的匹配,映射到實(shí)際考試中,對(duì)用戶在實(shí)際可能取得的分?jǐn)?shù)進(jìn)行預(yù)測(cè)。運(yùn)營(yíng)總監(jiān)帥科稱,在今年公務(wù)員省考成績(jī)出來后,部分用戶反饋說,猿題庫(kù)的預(yù)測(cè)和他們實(shí)際取得的分?jǐn)?shù)差異,在5分以內(nèi)。
由于用戶對(duì)教育產(chǎn)品的付費(fèi)意愿很強(qiáng),而且出于團(tuán)隊(duì)的意愿,猿題庫(kù)選擇的是按月訂閱的收費(fèi)方式,司考題庫(kù)和行測(cè)題庫(kù)的定價(jià)都為每月25元,所有新用戶擁有3天全功能的免費(fèi)體驗(yàn)期。李勇稱,公務(wù)員題庫(kù)推出兩個(gè)月,付費(fèi)用戶約為5%,這已經(jīng)不低。
“增值服務(wù)的方式老讓我想起SP,說是免費(fèi),但其實(shí)這也收費(fèi)那也收費(fèi),這種方式太low。所以我們寧愿選擇付費(fèi)訂閱的方式。”