模型名称 | repvgg_b0_imagenet |
---|---|
类别 | 图像-图像分类 |
网络 | RepVGG |
数据集 | ImageNet-2012 |
是否支持Fine-tuning | 是 |
模型大小 | 92MB |
指标 | - |
最新更新日期 | 2021-09-14 |
-
- RepVGG(Making VGG-style ConvNets Great Again)系列模型是清华大学(丁桂光团队)、旷视科技(孙建等)、香港科技大学和阿伯里斯特威斯大学于2021年提出的一种简单但功能强大的卷积神经网络架构。有一个类似于 VGG 的推理时间代理。主体由3x3卷积和relu stack组成,而训练时间模型具有多分支拓扑。训练时间和推理时间的解耦是通过重新参数化技术实现的,因此该模型被称为repvgg。
-
-
paddlepaddle >= 2.0.0
-
paddlehub >= 2.0.0
-
-
-
$ hub install repvgg_b0_imagenet
-
如您安装时遇到问题,可参考:零基础windows安装 | 零基础Linux安装 | 零基础MacOS安装
-
-
$ hub run repvgg_b0_imagenet --input_path "/PATH/TO/IMAGE" --top_k 5
-
import paddle import paddlehub as hub if __name__ == '__main__': model = hub.Module(name='repvgg_b0_imagenet') result = model.predict(['flower.jpg'])
-
-
在完成安装PaddlePaddle与PaddleHub后,通过执行
python train.py
即可开始使用repvgg_b0_imagenet对Flowers等数据集进行Fine-tune。 -
代码步骤
-
Step1: 定义数据预处理方式
-
import paddlehub.vision.transforms as T transforms = T.Compose([T.Resize((256, 256)), T.CenterCrop(224), T.Normalize(mean=[0.485, 0.456, 0.406], std = [0.229, 0.224, 0.225])], to_rgb=True)
transforms
数据增强模块定义了丰富的数据预处理方式,用户可按照需求替换自己需要的数据预处理方式。
-
-
Step2: 下载数据集并使用
-
from paddlehub.datasets import Flowers flowers = Flowers(transforms) flowers_validate = Flowers(transforms, mode='val')
-
transforms
: 数据预处理方式。 -
mode
: 选择数据模式,可选项有train
,test
,val
, 默认为train
。 -
数据集的准备代码可以参考 flowers.py。
hub.datasets.Flowers()
会自动从网络下载数据集并解压到用户目录下$HOME/.paddlehub/dataset
目录。
-
-
-
Step3: 加载预训练模型
-
model = hub.Module(name="repvgg_b0_imagenet", label_list=["roses", "tulips", "daisy", "sunflowers", "dandelion"])
name
: 选择预训练模型的名字。label_list
: 设置输出分类类别,默认为Imagenet2012类别。
-
-
Step4: 选择优化策略和运行配置
optimizer = paddle.optimizer.Adam(learning_rate=0.001, parameters=model.parameters()) trainer = Trainer(model, optimizer, checkpoint_dir='img_classification_ckpt') trainer.train(flowers, epochs=100, batch_size=32, eval_dataset=flowers_validate, save_interval=1)
-
运行配置
-
Trainer
主要控制Fine-tune的训练,包含以下可控制的参数:model
: 被优化模型;optimizer
: 优化器选择;use_vdl
: 是否使用vdl可视化训练过程;checkpoint_dir
: 保存模型参数的地址;compare_metrics
: 保存最优模型的衡量指标;
-
trainer.train
主要控制具体的训练过程,包含以下可控制的参数:train_dataset
: 训练时所用的数据集;epochs
: 训练轮数;batch_size
: 训练的批大小,如果使用GPU,请根据实际情况调整batch_size;num_workers
: works的数量,默认为0;eval_dataset
: 验证集;log_interval
: 打印日志的间隔, 单位为执行批训练的次数。save_interval
: 保存模型的间隔频次,单位为执行训练的轮数。
-
-
-
模型预测
-
当完成Fine-tune后,Fine-tune过程在验证集上表现最优的模型会被保存在
${CHECKPOINT_DIR}/best_model
目录下,其中${CHECKPOINT_DIR}
目录为Fine-tune时所选择的保存checkpoint的目录。 我们使用该模型来进行预测。predict.py脚本如下:-
import paddle import paddlehub as hub if __name__ == '__main__': model = hub.Module(name='repvgg_b0_imagenet', label_list=["roses", "tulips", "daisy", "sunflowers", "dandelion"], load_checkpoint='/PATH/TO/CHECKPOINT') result = model.predict(['flower.jpg'])
-
NOTE: 进行预测时,所选择的module,checkpoint_dir,dataset必须和Fine-tune所用的一样。
-
-
-
-
PaddleHub Serving可以部署一个在线分类任务服务。
-
-
运行启动命令:
-
$ hub serving start -m repvgg_b0_imagenet
-
这样就完成了一个分类任务服务化API的部署,默认端口号为8866。
-
NOTE: 如使用GPU预测,则需要在启动服务之前,请设置CUDA_VISIBLE_DEVICES环境变量,否则不用设置。
-
-
-
配置好服务端,以下数行代码即可实现发送预测请求,获取预测结果
import requests import json import cv2 import base64 import numpy as np def cv2_to_base64(image): data = cv2.imencode('.jpg', image)[1] return base64.b64encode(data.tostring()).decode('utf8') def base64_to_cv2(b64str): data = base64.b64decode(b64str.encode('utf8')) data = np.fromstring(data, np.uint8) data = cv2.imdecode(data, cv2.IMREAD_COLOR) return data # 发送HTTP请求 org_im = cv2.imread('/PATH/TO/IMAGE') data = {'images':[cv2_to_base64(org_im)], 'top_k':2} headers = {"Content-type": "application/json"} url = "http://127.0.0.1:8866/predict/repvgg_b0_imagenet" r = requests.post(url=url, headers=headers, data=json.dumps(data)) data =r.json()["results"]['data']
-
-
1.0.0
初始发布