榕典新数据模型 #692
Replies: 7 comments
-
读音类型的问题zingzeu_words 中设想的 SC(读音类型)包括 :连读音、本字音两种。V包括:市区、长乐、etc。SC和V是两个维度,可以任意组合。
|
Beta Was this translation helpful? Give feedback.
-
不同口音的处理
|
Beta Was this translation helpful? Give feedback.
-
同义词、近义词目前是在contrib里面开了个同义词字段记录同义词。但是这会担心由于人工维护导致数据不一致的问题。 @ztl8702 这个其实是一个网络模型(图 / linked-data)。看一下 WordNet,Wikitionary,Wikidata等怎么处理。
|
Beta Was this translation helpful? Give feedback.
-
待遇表現日语词。中文不知道怎么叫。意思是在社交活动所涉及的语言主体(说话人,写作者)与对方、话题人物三者之间的上下、亲疏等人际关系,以及这些关系在语言中的反映。体现在福州话里,就好像我们不敢在长辈面前说“講脬”“𡳞脬”一样,在吃宴席的时候不好说“食飽了”,因为“BA”一声不好听,只好说“食完了”,甚至听过福清牧师讲道说“今天”不说“今旦”。这也需要另外一张表单去按庄重程度线性排列(目前福州只想到庄重程度一个维度,怕搞太复杂;日语的话一般是坐标轴:横轴是庄重,纵轴是口语、书面) |
Beta Was this translation helpful? Give feedback.
-
何为条目,何为义项zingzeu_words 目前理论上是给每个(字,音,义)组合 开一个ID。同字不同音-> 不同ID;同字同音不同义-> 不同ID(虽然说不同义,一般来说音也会不同? e.g. 树兜)。但是每个ID又可能指向一个冯版条目、一个李版条目。冯、李对词义的划分,可能有所不同。 |
Beta Was this translation helpful? Give feedback.
-
短语、熟语、歌谣、诗歌能不能加进来?有的冯条目就是短语或熟语。未来也计划把几本熟语数据导入。熟语也用zingzeu ID?
|
Beta Was this translation helpful? Give feedback.
-
不过在实践过程中,发现除了使用zingzeu ID的熟语本身,还需要两种ID: |
Beta Was this translation helpful? Give feedback.
-
近期要设计一下。
先开个issue记录问题。
Beta Was this translation helpful? Give feedback.
All reactions