GitHub - HannibalWangLecter/CRM_QualityInspection_Violation_BERT: CRM_QualityInspection_Violation_BERT

基于 bert 的二分类质检模型代码整理

依赖环境：

使用方法：

以【孝亲保-现金价值】为例：

clone 项目到本地
将 bert 中文预训练模型放到 code-format-bert/目录下
准备原始数据 xqb_cash_value_merge 放入 data/xqb_cash_value/ 目录下原始数据格式每一行为句子 + '\t' + label，其中label 1代表违规，2代表不违规
修改 run.sh 文件中开头的 name=xqb_cash_value
指定要用的 gpu_id (从0开始计算，指定一块即可)
在 run.sh 下面选择是要 split_data, train 还是 test，其中 split_data 运行一次即可， train运行后会在 model/xqb_cash_value/ 目录中保存最后五个模型（相隔1000），test 会计算准确率、召回率

预测方式：

以【孝亲保-现金价值】为例：

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
source		source
.gitignore		.gitignore
Readme.md		Readme.md
run.sh		run.sh

Provide feedback