Skip to content
This repository has been archived by the owner on Apr 15, 2020. It is now read-only.

단어 빈도 관리 - 단어가 보이지 않음 #46

Open
songyonge opened this issue Oct 21, 2019 · 7 comments
Open

단어 빈도 관리 - 단어가 보이지 않음 #46

songyonge opened this issue Oct 21, 2019 · 7 comments
Assignees
Labels
bug Something isn't working feedback wanted Need feedback help wanted Extra attention is needed

Comments

@songyonge
Copy link

안녕하세요!
사전을 살펴보다 다음과 같은 특이사항을 발견하였습니다.

  • 단어 빈도 관리>특정 단어가 빈값으로 보임(15번째 단어)
    image

  • 사전데이터(dic.word)와 비교해보았을 때 "-" 이 보이지 않는 것 같았습니다.

@9bow
Copy link
Member

9bow commented Oct 21, 2019

안녕하세요, 저도 동일하게 해당 4번째 페이지에 15번째 / 16번째 단어가 비어보이는 것을 확인하였습니다.

이유를 확인해보니, 현재 KOMORAN 관리도구는 초기 실행 시 resources/defaults/dic.word의 것을 읽어오는데요, 이 파일의 93번째 부분이 정상적으로 표시되지 않는 것으로 보입니다.

원본 파일인 shin285/KOMORAN/blob/master/corpus_build/dic.word의 93번째 줄에서도 동일한 문제가 발생하고 있어, 이를 해결한 후 반영하는 것이 맞을 것 같습니다.

@shin285 님, 해당 파일 확인 부탁드립니다.

@9bow 9bow added this to the 1.1 milestone Oct 21, 2019
@9bow 9bow added the bug Something isn't working label Oct 21, 2019
@9bow
Copy link
Member

9bow commented Oct 21, 2019

@shin285
좀 더 확인해보니 해당 공백에 들어간 글자는 <U+00AD>로 보입니다.
image

UTF-8로는 아무것도 안 보이는 것처럼 보이는데요, 이게 맞을까요?

@9bow 9bow added the feedback wanted Need feedback label Oct 21, 2019
@shin285
Copy link
Member

shin285 commented Oct 22, 2019

위 유니코드는 soft-hyphen으로 보여집니다. https://www.fileformat.info/info/unicode/char/00ad/index.htm
브라우저 상에서만 안 보이는 걸로 보이며 실제 파일에는 내용이 포함되어 있습니다.
image

@9bow
Copy link
Member

9bow commented Oct 23, 2019

@shin285
Slack에서 해당 파일의 업데이트 계획을 알려주셔서 이 이슈는 v1.1에 포함하지 않고 PR Merge 및 v1.1 Release를 하였습니다. 이후 진행 상황이 있으시면 알려주세요~

@9bow 9bow removed this from the 1.1 milestone Oct 30, 2019
@9bow 9bow added the help wanted Extra attention is needed label Oct 30, 2019
@9bow
Copy link
Member

9bow commented Nov 13, 2019

@shin285
확인 부탁드립니다~

@shin285
Copy link
Member

shin285 commented Nov 15, 2019

soft-hyphen을 corpub_build 밑에 있는 사전에서 제거하였습니다. KOMORAN master 버전에 반영되어 있습니다.

@9bow
Copy link
Member

9bow commented Nov 15, 2019

#48 에서 처리하여 1.3에 반영할 예정입니다.

Sign up for free to subscribe to this conversation on GitHub. Already have an account? Sign in.
Labels
bug Something isn't working feedback wanted Need feedback help wanted Extra attention is needed
Projects
None yet
Development

No branches or pull requests

3 participants