You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
즤와 그의 받침이 들어가게 되면 작동이 안되는 듯 합니다.
텍스트를 위와 같이 replace했더니 문제가 생기지 않았습니다.
기대 상황
에러 없이 정상 작동되어야 합니다.
환경 정보
모듈 버전은 2024-07-10 기준 최신 버전입니다.
OS 종류 / 버전: Mac OSX Sonoma 14.5
PyKomoran 버전: 0.1.6.post1
Python 버전: 3.12.2
Py4J 버전: 0.10.9.2
추가 정보
py4j.protocol.Py4JJavaError: An error occurred while calling o0.analyze.
: java.lang.NullPointerException: Cannot invoke "java.util.List.iterator()" because "scoredTags" is null
at kr.co.shineware.nlp.komoran.core.model.Lattice.putIrregularExtendTokens(Lattice.java:160)
at kr.co.shineware.nlp.komoran.core.model.Lattice.put(Lattice.java:144)
at kr.co.shineware.nlp.komoran.core.Komoran.insertLattice(Komoran.java:563)
at kr.co.shineware.nlp.komoran.core.Komoran.irregularParsing(Komoran.java:556)
at kr.co.shineware.nlp.komoran.core.Komoran.analyze(Komoran.java:243)
at kr.co.shineware.nlp.komoran.core.Komoran.analyze(Komoran.java:189)
at kr.co.shineware.nlp.pykomoran.KomoranEntryPoint.analyze(KomoranEntryPoint.java:142)
at java.base/jdk.internal.reflect.DirectMethodHandleAccessor.invoke(DirectMethodHandleAccessor.java:103)
at java.base/java.lang.reflect.Method.invoke(Method.java:580)
at py4j.reflection.MethodInvoker.invoke(MethodInvoker.java:244)
at py4j.reflection.ReflectionEngine.invoke(ReflectionEngine.java:357)
at py4j.Gateway.invoke(Gateway.java:282)
at py4j.commands.AbstractCommand.invokeMethod(AbstractCommand.java:132)
at py4j.commands.CallCommand.execute(CallCommand.java:79)
at py4j.GatewayConnection.run(GatewayConnection.java:238)
at java.base/java.lang.Thread.run(Thread.java:1583)
The text was updated successfully, but these errors were encountered:
문제 설명
특정 텍스트에서 get_plain_text를 호출할 때 Java Exception이 발생합니다.
재현 경로
뉴스 댓글이라 텍스트가 자극적일 수 있는 점 양해 부탁드립니다.
komoran 사이트에서 같은 텍스트를 입력하면 결과가 나오지 않습니다.
komoran = Komoran("EXP")
komoran.get_plain_text(text)
"아예 # # # #... 독립투사들 영정을 내걸자 개가 즺던말던"
"ㅋㅋㅋㅋㅋㅋㅋ 생체실험이즤랄ㅋㅋㅋㅋㅋㅋㅋㅋㅋ 전 국민 대상을 조스로 본 #은????? ㅋㅋㅋㅋㅋ"
text
.replace('즺', '짖')
.replace('즵', '집')
.replace('즫', '짇')
.replace('즥', '직')
.replace('즷', '짓')
.replace('즴', '짐')
.replace('즨', '진')
.replace('즹', '징')
.replace('즬', '질')
.replace('즿', '짛')
.replace('즼', '짘')
.replace('즽', '짙')
.replace('즻', '짗')
.replace('즾', '짚')
.replace('즤', '지')
즤와 그의 받침이 들어가게 되면 작동이 안되는 듯 합니다.
텍스트를 위와 같이 replace했더니 문제가 생기지 않았습니다.
기대 상황
에러 없이 정상 작동되어야 합니다.
환경 정보
모듈 버전은 2024-07-10 기준 최신 버전입니다.
추가 정보
py4j.protocol.Py4JJavaError: An error occurred while calling o0.analyze.
: java.lang.NullPointerException: Cannot invoke "java.util.List.iterator()" because "scoredTags" is null
at kr.co.shineware.nlp.komoran.core.model.Lattice.putIrregularExtendTokens(Lattice.java:160)
at kr.co.shineware.nlp.komoran.core.model.Lattice.put(Lattice.java:144)
at kr.co.shineware.nlp.komoran.core.Komoran.insertLattice(Komoran.java:563)
at kr.co.shineware.nlp.komoran.core.Komoran.irregularParsing(Komoran.java:556)
at kr.co.shineware.nlp.komoran.core.Komoran.analyze(Komoran.java:243)
at kr.co.shineware.nlp.komoran.core.Komoran.analyze(Komoran.java:189)
at kr.co.shineware.nlp.pykomoran.KomoranEntryPoint.analyze(KomoranEntryPoint.java:142)
at java.base/jdk.internal.reflect.DirectMethodHandleAccessor.invoke(DirectMethodHandleAccessor.java:103)
at java.base/java.lang.reflect.Method.invoke(Method.java:580)
at py4j.reflection.MethodInvoker.invoke(MethodInvoker.java:244)
at py4j.reflection.ReflectionEngine.invoke(ReflectionEngine.java:357)
at py4j.Gateway.invoke(Gateway.java:282)
at py4j.commands.AbstractCommand.invokeMethod(AbstractCommand.java:132)
at py4j.commands.CallCommand.execute(CallCommand.java:79)
at py4j.GatewayConnection.run(GatewayConnection.java:238)
at java.base/java.lang.Thread.run(Thread.java:1583)
The text was updated successfully, but these errors were encountered: