-
Notifications
You must be signed in to change notification settings - Fork 125
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
你好有几个问题想问下 #1
Comments
用于汉字是可以的 |
训练的时候 输入的图像只能是固定尺度的吗? |
我测试了下 八位的验证码也是可以识别的哦 不过好像黑底白字的验证码才好识别,灰底黑字的就不行,估计由于训练样本都是黑底白字导致的 |
对训练的时候是黑色低的 |
我这里面设计的双向lstm就是抄的你发的网址里面的 |
if (predict_label != blank_label && predict_label != prev_label){ |
不会,因为time_step有足够的间隙 |
是CTPN里面的,你能看到影子的,ctc忘记哪里的了 |
hello,关于LSTM的输入还有个些问题想请教你哦
非常感谢啊,哎,对LSTM的输入和输出都不是很懂哦 |
@piaobuliao 中文的话 是随机汉字,还是词组啊 |
@xiaomaxiao 我最近刚开始搞汉字,用词典里选一些词组成一串文字在搞,目前一级汉字+二级汉字+一些英文字符总共六千多类 |
你好,请问你的label是怎样产生的?如果不是按照你的方式编码需要修改的是哪里呢?谢谢 |
@piaobuliao 我实验了一下 英文,效果还行。 你的一个样本里面是多少个字? |
@xiaomaxiao 我是随机的,最多三十个,英文肯定没问题,我六千多类汉字训练的时候识别率也有90% |
@piaobuliao 我的英文 是97%,但是 如果定位的时候 方框定的大了,效果就不行了。 |
@xiaomaxiao 背景是杂乱的也有,纯色的也有。 |
@piaobuliao 如果旋转,位置随机 ,字体大小的最小限制是多少呀,我看如果20个像素 基本汉字基本上看不清了。 shear是什么? 训练样本要相同size。 |
@xiaomaxiao 这个具体你自己根据实际图像大小控制啊,shear你可以参考https://github.com/aleju/imgaug。训练样本要相同size,这个你自己最后一部缩放下就好了 |
@piaobuliao 汉语和英文的语料 是从哪里找的?目前我只找到了几万个英文词组。汉字不知在哪找。 |
@piaobuliao 实验了旋转+位置 , 目前对定位大小 不敏感了。 赞~ |
@xiaomaxiao https://pan.baidu.com/s/10anmu 密码直接搜“千万级巨型汉语词库分享” |
@piaobuliao 谢谢发现了这个词库,里面的内容有点杂,需要整理下。 |
@xiaomaxiao 我是图片大小先固定,字体大小会变化的,然后python里会计算这个字符串的box的size,判断一下会不会出界,出界就不要了 |
@piaobuliao 额 , 你90%的识别率 是不是 因为从语料库取词组的时候 有些字取的概率太少了,所以没充分? |
@dlunion @piaobuliao good job,实现了end2end的ocr, 我在使用本项目做车牌字符直接回归时发现lable size大于5会报错,注视掉lmdb生成对应代码能成功生成7位以上的label,修改训练配置labe countsl和time_step后,训练时一直卡在 |
@xiaomaxiao 90%识别率各种原因吧,汉字种类多了相近地多了,我加了噪声和模糊等 有些字还是比较模糊的 |
@aitaoquanyi 很多位都可以的,这个你自己改了,对应的prototxt的也要改的, |
@piaobuliao thanks!已经搞定,原因是我把train和val设置为同样的lmdb文件,caffe的bug。我用来做lpr end2end 识别率>=99.x,还可以把lstm加上残差的方式和使用双层,指标可提高2%左右 |
@aitaoquanyi 你车牌照片是实际的? 有多少张用于训练,多少张测试? |
|
@xiaomaxiao [2] 这个看你想识别多长的字符串了 [3] 我是就用那个字典库里的,他怎么样就这么样,好像标点符号有的是没有出现在哪里的 |
@piaobuliao |
@aitaoquanyi 有七八十万训练那识别率应该会挺高的,你这些数据是哪来的啊? |
私聊 |
@piaobuliao 我qq270525694 |
@aitaoquanyi 大神好,qq加你了 ,lpr据集能不能分享下?谢谢 |
3位的或者6位的能识别吗?
非常感谢啊!
The text was updated successfully, but these errors were encountered: