這些年來電腦科技蓬勃發展,數位化的呼聲不絕於耳,很少有一門學科能置身事外而不受影響。然而各門學科數位化的進展快慢不同,漢學在這方面是比較落後的,尤其是文字學。中研院資訊所文獻處理實驗室自1993年起,開始進行漢字數位化的工作,至今已有十三年,其中最主要的成果為建立了「漢字構形資料庫」。

  漢字構形資料庫早期收錄的字形是以楷書的現代印刷字體為主,其後陸續增加小篆、金文、楚系簡帛文字及甲骨文。因此,現今的漢字構形資料庫是由甲骨文、金文、楚系簡帛文字、小篆及楷書構形資料庫組合而成,如圖一。

圖一

 

小篆構形資料庫目前已完成,而其他的資料庫則持續在擴充中。表一是2006年8月份推出的漢字構形資料庫2.4版的內容簡介,

  甲骨文

金文

楚系文字

小篆

楷書

主要參考
字書

殷墟甲骨刻辭類纂

金文編

楚系簡帛文字編

說文解字詁林

漢語大字典

字數

1970

3781

2627

11100

62242

部件數

440

804

704

2004

5587

基礎部件數

330

469

464

367

1128

異體字表
組數

(待)

767

372

1081

12809

電腦字型

中研院甲骨文

中研院金文

中研院楚系簡帛文字

北師大說文小篆

標楷體及細明體外字集

字書索引

殷墟甲骨刻辭類纂、甲骨文字詁林、甲骨文字集釋

金文編、金文詁林、殷周金文集成引得

楚系簡帛文字編

說文解字詁林

漢語大字典、中文大辭典

其他屬性

 

殷周金文集成器號、器名

出土墓號及簡號

 

Unicode、Big5

合作單位

中研院史語所

中研院史語所

中研院史語所

北京師範大學、台灣師範大學

中研院史語所

 

這個版本有以下四個特色:

     
   
   

 

     
     
   

     
     
   
   

     
   
   
     
     
   
     
   
類別
符號
說明
構字式範例
連接 當部件的連接順序由左至右 順=川
當部件的連接順序由上至下 含=今
當部件的連接順序由外至內 圍=囗

部件序

按部件書寫順序輸入,
前後以起始符號(
和終止符號( )包夾。
解= 角刀牛
方便符號 二個相同部件直連 炎=
三個相同部件直連  
二個相同部件橫連 朋=
三個相同部件橫連  
三個相同部件呈三角狀排列 焱=
四個相同部件橫連  
四個相同部件直連  
四個相同部件呈四角狀排列 燚=
     
   
 
 
       
 
  數位典藏國家型科技計畫 版權所有
Copyright@National Digital Archives Program, Taiwan, All Right Reserve.