Skip to content

Latest commit

 

History

History
6 lines (5 loc) · 490 Bytes

readme.md

File metadata and controls

6 lines (5 loc) · 490 Bytes

##基于语音的语种识别
根据一段音频判断该音频是英语、中语还是法语,即判断音频的语种。
语种识别项目的整体思想就是将语音数据转换成相应的语谱图或者MFCC特征,再对特征进行分析,从而判断出该语音数据的语种类别。
基于fastai,效果还不错
唯一需要注意的是,传入进来的音频数据必须以话语为启点,可以依据端点检测的启点,这个点很是重要。