網站成果資源 : 現代漢語平衡語料庫

現代漢語平衡語料庫
類型:
合集
網站名稱:
現代漢語平衡語料庫
作者:
中央研究院資訊科學研究所、中央研究院語言學研究所、中央研究院計算中心
主題:
語言
描述:
中央研究院現代漢語語料庫」(簡稱「研究院語料庫」(Sinica Corpus))專門針對語言分析而設計,每個文句皆依詞斷開,並標示詞類語料蒐集也盡量做到現代漢語分配在不同的主題和語式上,是現代漢語無窮多語句中一個代表性的樣本。
本語料庫由中央研究院資訊所、語言所詞庫小組完成的。該小組由陳克健(資訊所)、黃居仁 (語言所) 兩位研究員主持,自1990年前後便開始致力於漢語語料的蒐集。於1991年得蔣經國基金會補助,開始構建語料庫;並於1994年分別得到中央研究院「中文資訊」跨所研究群專案計畫及國科會計畫補助,正式開始進行語料標誌。1995年7月完成第一版(兩百萬詞),1996年11月經計算中心設計規劃完成WWW版,開放供各界使用(On www since November 1996)。並於1997年完成3.0版,約五百萬詞。(本說明整理自原網站簡介)
語言:
中文
資源類型:
文字,資料集
適用對象:
研究人員
著作權:
中央研究院資訊科學研究所、中央研究院語言學研究所、中央研究院計算中心
用途:
學術研究
備註:
已更新至4.0版(2021年註)

網站連結

現代漢語平衡語料庫

您即將離開本站前往成果網站!

庫存網站紀錄

庫存網站網址

庫存網站收錄時間:2014/9/26
庫存網站授權情形:同意本計畫「非商業營利目的之使用,同時不得改作」

您即將離開本站前往庫存網站!

所屬計畫

執行期間:2002/1~2006/12
計畫名稱:中央研究院國家典藏數位化計畫-語言典藏計畫:漢語典藏與典藏架構:二十世紀漢語語料庫與句法結構資料庫

推薦分享





分享

「庫存網站」是以Cache Page方式擷取網站,或是向執行單位收取資料,所整理之網站歷史紀錄。