Speech recognition using tensorflow in aliyun pai.
阿里云深度学习pai下用tensorflow实现的语音识别。
LibriSpeech ASR corpus http://www.openslr.org/12
我使用的是dev-clean,test-clean,train-clean-100.
下载下来的数据音频文件是flac格式。还有label是单个txt格式。
三个脚本预处理一下数据。
建议在阿里云华东2内网操作,因为生成出来有几十个g,内网传上去比较快。
我是买那种按小时收费的机子处理数据,装一下cpu版的tensorflow,处理完挂载ossfs传上oss。
pai上就选好文件个输入输出目录就可以了。
输出目录的 model/nn/debug_models/summary 是TensorBoard的目录,pai上选择该目录可以查看TensorBoard