Skip to content

Commit

Permalink
Merge pull request #9 from mozillazg/8105
Browse files Browse the repository at this point in the history
增加 kMandarin_8105.txt :《通用规范汉字表》里 8105 个汉字最常用的一个读音
  • Loading branch information
mozillazg authored Sep 25, 2016
2 parents 62ed693 + ebba504 commit 980d62b
Show file tree
Hide file tree
Showing 3 changed files with 8,142 additions and 16 deletions.
5 changes: 4 additions & 1 deletion README.md
Original file line number Diff line number Diff line change
Expand Up @@ -7,7 +7,7 @@

数据格式:

* 格式:`{code point}: {pinyins} # {hanzi}` (示例:`U+4E2D: zhōng,zhòng # 中`
* 格式:`{code point}: {pinyins} # {hanzi} {comments}` (示例:`U+4E2D: zhōng,zhòng # 中`
*`#` 开头的行是注释


Expand All @@ -22,6 +22,7 @@
* `GBK_PUA.txt`: [Private Use Area](https://en.wikipedia.org/wiki/Private_Use_Areas) 中有拼音的汉字,参考 [GB 18030 - 维基百科,自由的百科全书](https://zh.wikipedia.org/wiki/GB_18030#PUA)
* `nonCJKUI.txt`: 不属于 [CJK Unified Ideograph](https://en.wikipedia.org/wiki/CJK_Unified_Ideographs) 但是却有拼音的字符
* `overwrite.txt`: 手工纠正的拼音数据(**上面的拼音数据都是通过程序生成的,修改的话只修改这个就可以了**
* `kMandarin_8105.txt`: [《通用规范汉字表》](https://zh.wikipedia.org/wiki/通用规范汉字表)里 8105 个汉字最常用的一个读音 (**可以修改**)
* `pinyin.txt`: 合并上述文件后的拼音数据
* `zdic.txt`: [汉典网](http://zdic.net) 的拼音数据

Expand All @@ -33,5 +34,7 @@
* [字海网,叶典网](http://zisea.com/)
* [Unicode、GB2312、GBK和GB18030中的汉字](http://www.fmddlmyy.cn/text24.html)
* [GB 18030 - 维基百科,自由的百科全书](https://zh.wikipedia.org/wiki/GB_18030#PUA)
* [通用规范汉字表 - 维基百科,自由的百科全书](https://zh.wikipedia.org/wiki/%E9%80%9A%E7%94%A8%E8%A7%84%E8%8C%83%E6%B1%89%E5%AD%97%E8%A1%A8)
* [China’s 通用规范汉字表 (Tōngyòng Guīfàn Hànzìbiǎo)](https://blogs.adobe.com/CCJKType/2014/03/china-8105.html)

[unihan]: http://www.unicode.org/charts/unihan.html
Loading

0 comments on commit 980d62b

Please sign in to comment.