基于Emotion2Vec模型的批量音频情感自动标注工具

简介

基于emotion2vec对输入的音频进行情绪八分类（生气、厌恶、恐惧、开心、中立、其他、难过、吃惊）或emotion2vec+large对输入的音频进行情绪进行五分类（生气、开心、中性、伤心、未知）

此项目包含一个音频时长筛选/批量重命名脚本preprocess_audio.py批量推理脚本recognize.py和一个音频分类脚本classify.py和一个webui.py界面

如果您想快速使用可以使用此打包好的文件数据集格式可以参考此数据集输入可以参考此格式:

input
└───speaker
   ├───xxx.wav
   └─── xxx.lab

参考输出为此格式:

output
└───speaker0
   └───emotion
       └───【emotion】{text}

经过处理后的文件将会被自动归类并重命名，以反映出音频中包含的情感及其相关内容。一个典型的输出文件示例如下：

Name		Name	Last commit message	Last commit date
Latest commit History 42 Commits
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
classify.py		classify.py
go-web.bat		go-web.bat
preprocess_audio.py		preprocess_audio.py
recognize.py		recognize.py
recognizev2.py		recognizev2.py
requirements.txt		requirements.txt
webui.py		webui.py