Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

kana-rule.conf の文字コードについて #60

Open
na4zagin3 opened this issue Sep 26, 2016 · 5 comments
Open

kana-rule.conf の文字コードについて #60

na4zagin3 opened this issue Sep 26, 2016 · 5 comments

Comments

@na4zagin3
Copy link

kana-rule.conf を記述するのに、EUC-JIS-2004 の代わりに UTF-8 を用いることはできませんか?

@zonuexe
Copy link

zonuexe commented Sep 26, 2016

現状ではEUC-JIS-2004を利用してることに起因して #23 のような定義が全角ダッシュのマッピング問題の影響を直接受けますが、UTF-8化することで回避できれば嬉しいです。

@mzp
Copy link
Member

mzp commented Sep 26, 2016

なるほどー。ざっと調べたところ内部的にはUTF-8で扱ってるので、特に大きな問題はないと思います。

が、互換性には配慮したいので、うまくEUC-JPと共存させたいですね。 ざっと思いつくのは以下のような方法かなぁ。

  • 最初の行に # UTF-8 とか書くとUTF-8モードになる
  • EUC-JPとして扱えないバイト列が含まれていると、UTF-8モードになる

@mzp
Copy link
Member

mzp commented Sep 27, 2016

kana-rule.utf8.conf とか作ってもいいな。

@na4zagin3
Copy link
Author

検討して下さって嬉しく思います。

最初の行にエンコードを書くのや、ファイル名で区別するのは大丈夫そうですが、

  • EUC-JPとして扱えないバイト列が含まれていると、UTF-8モードになる

のは、実用上問題は無さそうなものの、駄目なコーナーケースがあるそうです
https://twitter.com/NaOHaq/status/780584798427283456

@S-zebra
Copy link

S-zebra commented May 30, 2019

MacBook(JISキーボード)のdeleteの左隣にあるキーを押したとき、「¥」(半角円マーク)ではなく「\」(半角バックスラッシュ)が出るようにしたいので、ぜひ検討していただければ幸いです。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

4 participants