Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

kaldi 数据准备 #174

Open
bringtree opened this issue May 29, 2019 · 0 comments
Open

kaldi 数据准备 #174

bringtree opened this issue May 29, 2019 · 0 comments

Comments

@bringtree
Copy link
Owner

来源:https://blog.csdn.net/chinatelecom08/article/details/81252343

使用compute-mfcc-feats提取特征,生成对应的特征文件feats.ark;
使用copy-feats来拷贝特征文件,并创建特征的scp文件,生成feat.scp feat.ark ;
使用compute-cmvn-stats计算CMVN归一化,得到cmvn.scp cmvn.ark ;
使用apply-cmvn得到了applycmvn.ark文件;
使用splice-feats来继续变换特征 ,拼接相邻帧的特征;
使用transform-feats来进行特征转换,为了解码调用 ;
最后通过得到的transform.ark进行解码的操作,得到解码后的lattice文件 。
3. 具体流程指令:
首先列出具体文件,这里我就按照自己的文件给出了,如果用别的,改相应文件就行了
2. wav.scp(里面是保存了wav的绝对路径)
3. final.mdl(训练模型得到的模型文件)
4. final.mat(用来特征转换)
5. HCLG.fst(fst文件,用于解码)
使用compute-mfcc-feats生成对应的特征文件feats.ark:
compute-mfcc-feats --use-energy=false scp:wav.scp ark:feats.ark
使用copy-feats来拷贝特征文件,并创建特征的scp文件,生成feat.scp feat.ark
copy-feats ark:feats.ark ark,scp:feat.ark,feat.scp
使用compute-cmvn-stats计算CMVN归一化,得到cmvn.scp cmvn.ark
compute-cmvn-stats scp:feat.scp ark,scp:cmvn.ark,cmvn.scp
使用apply-cmvn,得到了applycmvn.ark文件
apply-cmvn scp:cmvn.scp scp:feat.scp ark:applycmvn.ark
使用splice-feats来继续变换特征
splice-feats --left-context=3 --right-context=3 ark:applycmvn.ark ark:splice.ark
使用transform来进行特征转换,为了解码调用
transform-feats final.mat ark:splice.ark ark:transform.ark
最后通过得到的transform.ark进行解码的操作,得到一个晶格文件
nnet-latgen-faster [options] <fst-in|fsts-rspecifier>

作者:Audior
来源:CSDN
原文:https://blog.csdn.net/chinatelecom08/article/details/81252343
版权声明:本文为博主原创文章,转载请附上博文链接!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant