這些年來電腦科技蓬勃發展,數位化的呼聲不絕於耳,很少有一門學科能置身事外而不受影響。然而各門學科數位化的進展快慢不同,漢學在這方面是比較落後的,尤其是文字學。中研院資訊所文獻處理實驗室自1993年起,開始進行漢字數位化的工作,至今已有十三年,其中最主要的成果為建立了「漢字構形資料庫」。
漢字構形資料庫早期收錄的字形是以楷書的現代印刷字體為主,其後陸續增加小篆、金文、楚系簡帛文字及甲骨文。因此,現今的漢字構形資料庫是由甲骨文、金文、楚系簡帛文字、小篆及楷書構形資料庫組合而成,如圖一。
小篆構形資料庫目前已完成,而其他的資料庫則持續在擴充中。表一是2006年8月份推出的漢字構形資料庫2.4版的內容簡介,
|
甲骨文 |
金文 |
楚系文字 |
小篆 |
楷書 |
主要參考
字書 |
殷墟甲骨刻辭類纂 |
金文編 |
楚系簡帛文字編 |
說文解字詁林 |
漢語大字典 |
字數 |
1970 |
3781 |
2627 |
11100 |
62242 |
部件數 |
440 |
804 |
704 |
2004 |
5587 |
基礎部件數 |
330 |
469 |
464 |
367 |
1128 |
異體字表
組數 |
(待) |
767 |
372 |
1081 |
12809 |
電腦字型 |
中研院甲骨文 |
中研院金文 |
中研院楚系簡帛文字 |
北師大說文小篆 |
標楷體及細明體外字集 |
字書索引 |
殷墟甲骨刻辭類纂、甲骨文字詁林、甲骨文字集釋 |
金文編、金文詁林、殷周金文集成引得 |
楚系簡帛文字編 |
說文解字詁林 |
漢語大字典、中文大辭典 |
其他屬性 |
|
殷周金文集成器號、器名 |
出土墓號及簡號 |
|
Unicode、Big5 |
合作單位 |
中研院史語所 |
中研院史語所 |
中研院史語所 |
北京師範大學、台灣師範大學 |
中研院史語所 |
|
這個版本有以下四個特色: