7.文國(guó)尋寶記http://www.sinica.edu.tw/wen/
在搜文解字的基礎(chǔ)之上,以華語(yǔ)文學(xué)習(xí)者為對(duì)象,進(jìn)一步將字、詞、音的檢索功能與國(guó)編、華康、南一等三種版本的國(guó)小國(guó)語(yǔ)課本結(jié)合,與唐詩(shī)三百首、宋詞三百首、紅樓夢(mèng)、水滸傳等文學(xué)典籍結(jié)合,提供網(wǎng)絡(luò)上國(guó)語(yǔ)文學(xué)習(xí)的素材。
8.唐詩(shī)三百首http://cls.admin.yzu.edu.tw/300/
以國(guó)中、小學(xué)學(xué)生為主要使用對(duì)象,提供吟唱、繪畫、書法等多媒體數(shù)據(jù),文字?jǐn)?shù)據(jù)報(bào)含作者生平、讀音標(biāo)注、翻譯、批注、評(píng)注、典故出處等資料;檢索點(diǎn)包含作者、詩(shī)題、詩(shī)句、綜合資料、體裁分類等;檢索結(jié)果可以列出全文,并選擇標(biāo)示相關(guān)之文字及多媒體數(shù)據(jù)。并提供了一套可以自動(dòng)檢查格律、韻腳、批改的「依韻入詩(shī)格律自動(dòng)檢測(cè)索引教學(xué)系統(tǒng)」,協(xié)助孩子們依韻作詩(shī),協(xié)助教師批改習(xí)作。
9.漢籍電子文獻(xiàn)http://www.sinica.edu.tw/~tdbproj/handy1/
包含整部25史 整部阮刻13經(jīng)、超過(guò)2000萬(wàn)字的臺(tái)灣史料、1000萬(wàn)字的大正藏以及其他典籍。
10.紅樓夢(mèng)網(wǎng)絡(luò)教學(xué)研究數(shù)據(jù)中心http://cls.hs.yzu.edu.tw/HLM/home.htm
元智大學(xué)中國(guó)文學(xué)網(wǎng)絡(luò)系統(tǒng)研究室所開發(fā)的「網(wǎng)絡(luò)展書讀—中國(guó)文學(xué)網(wǎng)絡(luò)系統(tǒng)」,為研究中心負(fù)責(zé)人羅鳳珠老師主持,紅樓夢(mèng)是其中一個(gè)子系統(tǒng),其他還包括善本書、詩(shī)經(jīng)、唐宋詩(shī)詞、作詩(shī)填詞等子系統(tǒng)。此網(wǎng)站為國(guó)內(nèi)Internet最大中國(guó)文學(xué)研究數(shù)據(jù)庫(kù),提供用戶最完整的中國(guó)文學(xué)研究數(shù)據(jù)。
(五)中國(guó)傳媒大學(xué)
1.中國(guó)傳媒大學(xué)文本語(yǔ)料庫(kù)檢索系統(tǒng)
http://ling.cuc.edu.cn/RawPub/
2.在線分詞標(biāo)注系統(tǒng)
http://ling.cuc.edu.cn/cucseg/
3.新詞語(yǔ)研究資源庫(kù)
http://ling.cuc.edu.cn/newword/web/index.asp
4.音視頻語(yǔ)料檢索系統(tǒng)
http://ling.cuc.edu.cn/mmcpub(目前系統(tǒng)正在升級(jí)改造中)
(六)哈爾濱工業(yè)大學(xué)
哈工大信息檢索研究室對(duì)外共享語(yǔ)料庫(kù)資源http://ir.hit.edu.cn/demo/ltp/Sharing_Plan.htm
該語(yǔ)料庫(kù)為漢英雙語(yǔ)語(yǔ)料庫(kù),10萬(wàn)對(duì)齊雙語(yǔ)句對(duì),文本文件格式,同義詞詞林?jǐn)U展版,77,343條詞語(yǔ),秉承《同義詞詞林》的編撰風(fēng)格,同時(shí)采用五級(jí)編碼體系,多文檔自動(dòng)文摘語(yǔ)料庫(kù),40個(gè)主題,文本文件格式,同一主題下是同一事件的不同報(bào)道,漢語(yǔ)依存樹庫(kù),不帶關(guān)系5萬(wàn)句,帶關(guān)系1萬(wàn)句,LTML化,分詞、詞性、句法部分人工標(biāo)注,可以圖形化查看,問(wèn)答系統(tǒng)問(wèn)題集,6264句,已標(biāo)注問(wèn)題類型,LTML化,分詞、詞性、句法、詞義、淺層語(yǔ)義等程序處理得到,單文檔自動(dòng)文摘語(yǔ)料庫(kù),211篇,分不同體裁,LTML化,文摘句標(biāo)注,分詞、詞性、句法、詞義、淺層語(yǔ)義、文本分類、指代消解等程序處理得到。
(七)清華大學(xué)
漢語(yǔ)均衡語(yǔ)料庫(kù)TH-ACorpus:http://www.lits.tsinghua.edu.cn/ainlp/source.htm(似乎在改版,一直上不去)
(八)香港教育學(xué)院
語(yǔ)言資訊科學(xué)中心及其語(yǔ)料庫(kù)實(shí)驗(yàn)室http://www.livac.org/index.php?lang=sc
自1995年開始,以「共時(shí)」方式處理了超常的大量漢語(yǔ)語(yǔ)料,通過(guò)精密的技術(shù),累積眾多精確的統(tǒng)計(jì)數(shù)據(jù),建立了LIVAC (Linguistic Variation in Chinese Speech Communities)共時(shí)語(yǔ)料庫(kù)。本語(yǔ)料庫(kù)最大特點(diǎn)是采用「共時(shí)性」視窗模式,嚴(yán)謹(jǐn)?shù)囟〞r(shí)分別收集來(lái)自多地的定量同類語(yǔ)料,可供各種客觀的比較研究,方便有關(guān)的信息科技發(fā)展與應(yīng)用。此外,語(yǔ)料庫(kù)又兼顧了「歷時(shí)性」,方便各方人士客觀地觀察與研究視窗內(nèi)的有代表性的語(yǔ)言發(fā)展全面動(dòng)態(tài)。
(九)中國(guó)科學(xué)院計(jì)算技術(shù)研究所
跨語(yǔ)言語(yǔ)料庫(kù)http://mtgroup.ict.ac.cn/new/resource/index.php