Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

多音字如何处理? #10

Open
feartango opened this issue Sep 20, 2015 · 2 comments
Open

多音字如何处理? #10

feartango opened this issue Sep 20, 2015 · 2 comments

Comments

@feartango
Copy link

如题

@Zhangxu0501
Copy link

有两个想法
1,找一个多音字词典资源去匹配
2,爬虫,爬取百度百科该关键字的解释,我刚刚看了一下,这里是带拼音的
比如音乐:
[yīn yuè]
音乐 (艺术类型之一) 编辑
音乐是反映人类现实生活情感的一种艺术(英文名称:music;法文名称: musique;意大利文:musica)。音乐可以分为声乐和器乐两大类型,又可以分为古典音乐、流行音乐、民族音乐、乡村音乐、原生态音乐等。在艺术类型中,音乐是比较抽象的艺术,音乐从历史发展上可分为东方音乐和西方音乐。东方以中国为首的中国古代理论基础是五声音阶,即宫、商、角、徵、羽,西方是以七声音阶为主。音乐让人赏心悦目,并为您带来听觉的享受。一般一首音乐时长在3分29秒左右,让人更加享受每首音乐的时间,可以陶冶情操。

@bicongwang
Copy link

有一个比较初级的想法,跟楼上差不多。拿到一个常用词组与拼音的映射表,跟目前字和映射表一样。然后优先查找词组映射表,找不到的情况下再用字。应该有现成的。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants