本儲存庫包含台灣CNS11643全字庫開放資料中的對照表與屬性資料。CNS11643是台灣的國家標準交換碼,這些資料對中文資訊處理和研究極為有用。
資料來自台灣政府的公開資料平台,最後更新日期為2024年8月15日。
本儲存庫僅包含對照表與屬性資料。原始資料集還包含字型檔案(楷體和宋體)以及中文字音檔。如需完整資料集,請訪問CNS11643全字庫官方網站或台灣政府開放資料平台下載。
Tables/
: 對照表與屬性資料MapingTables/
: 各種編碼對照表Big5/
: CNS對Big5的對照表Unicode/
: CNS對Unicode的對照表地政/
: 25個縣市的對照表(縣市未合併及升格前)- 其他特殊對照表:DCI、FIN、INC、TAX等
Properties/
: 字符屬性資料- 包含注音、倉頡、筆畫數、部首、拼音、部件等資料表格
release.json
: 發布說明和更新日誌
-
對照表(MapingTables):
- CNS與Big5、Unicode、地政系統等的對照
- 特殊領域對照表(如公路監理、稅務、工商內碼等)
-
屬性資料(Properties):
CNS_phonetic.txt
: 注音資料CNS_cangjei.txt
: 倉頡碼資料CNS_stroke.txt
: 筆畫數資料CNS_radical.txt
: 部首資料CNS_pinyin.txt
: 拼音資料CNS_component.txt
: 部件資料CNS_strokes_sequence.txt
: 筆順資料CNS_source.txt
: 字形來源資料
- clone 或下載本儲存庫
- 對照表和屬性資料可用於開發或研究目的
- 詳細的資料格式說明請參考各資料夾中的說明文件
使用本資料時,請遵守台灣政府對開放資料的使用規範。
資料集通常每月更新一次。請定期檢查是否有新的更新。