-
Notifications
You must be signed in to change notification settings - Fork 71
模型版本书写样例
vigo999 edited this page Nov 6, 2024
·
3 revisions
- 根据版本配套表,书写模型构建的ms+ascend+cann版本信息
- 表头统一小写,表格内容居中
mindspore | ascend driver | firmware | cann toolkit/kernel |
---|---|---|---|
2.3.1 | 24.1.RC2 | 7.3.0.1.231 | 8.0.RC2.beta1 |
2.3.0 | 24.1.RC2 | 7.3.0.1.231 | 8.0.RC2.beta1 |
2.1.0 | 23.0.rc2 | 6.4.12.1.241 | 6.3.RC2 |
例如:模型是在mindspore 2.3.0 验证过的。书写如下,表头统一小写:
mindspore | ascend driver | firmware | cann toolkit/kernel |
---|---|---|---|
2.3.0 | 24.1.RC2 | 7.3.0.1.231 | 8.0.RC2.beta1 |
-
指明模型测试的机器和模式,该信息单独阐述在表格上方: Experiments are tested on ascend [910/910*] with mindspore [2.3.1/xxxx] graph mode
-
如支持多个mindspore版本,请针对不同版本分开多张表
-
表头统一小写,表格居中
-
填写名称
【MUST】- 以下内容必须填写
- model name - 模型名称,例如 dit
- cards - 训练卡数,例如 1
- batch size - 单卡的批量大小,例如 64
- resolution - 文生图/文生视频分辨率,例如 1024x1024 or 16x512x512
- jit level - mindspore 2.3 版本后,例如 O0/O1/O2
- graph compile - 图编译时间, 例如 3~5 mins
- s/step - 单步速度,保留2位小数,例如 0.89
- img/s - FPS,等于 cards * batch size / step time,保留2位小数,例如 71.91
- [推理] scheduler/sampler - scheduler/采样器名称(如有),例如 DDIM
- [推理] step - 推理步数,例如 40
【OPTIONAL】- 以下内容可根据不同模型选择性填写
- method - 同一模型如有不同训练方法可指明,例如 dreambooth/lora
- stage - 文生视频模型训练可能涉及多阶段训练,如涉及需指明训练阶段,例如 1
- grad accu - grad accumulation step 梯度累加,例如 1
- sink - 是否开启数据下沉模式, ON/OFF
- flash attn - 是否使用 flash attention, ON/OFF
- recompute - 是否开启重计算,ON/OFF
- cache - 是否开启数据缓存,ON/OFF
- discriminator - 是否使用discriminator,ON/OFF
- precision - 精度,例如 fp32/fp16/bf16,如涉及混合精度可在表格下写note注释
- [推理] s/img - 单图推理速度,保留2位小数,例如 3.22
- [推理] s/video - 单视频推理速度,保留2位小数,例如 25.22
- [推理] psnr 推理结果metric,保留2位小数,例如 28.95
- [推理] ssim 推理结果metric,保留2位小数,例如 0.87
- recipe - yaml文件配置链接,例如 yaml
- weight - 权重链接,例如 weight
- 其他内容(持续补充)
-
填写顺序
前面 4 (或者5)列固定为:
model name method (如有) cards batch size resolution 中间optional列 sd 1.5 lora 1 1 512x512 ... 倒数列顺序固定为:
- 训练
中间optional列 precision(如有) jit level graph compile s/step img/s ... fp16 O1 5 mins 0.50 2.00 - 推理
中间optional列 scheduler steps jit level graph compile s/step (如有) img/s psnr (如有) ssim (如有) ... ddim 40 O1 5 mins 0.11 4.40 xx.xx xx.xx - 如有 recipe 与 weight 文件列,则放最后两列:
前面固定列 中间optional列 倒数固定列 recipe weight ... ... ... yaml weight
以dit模型为例,模型表现书写如下:
Experiments are tested on ascend 910* with mindspore 2.3.1 graph mode.
model name | cards | batch size | resolution | recompute | sink | jit level | graph compile | s/step | img/s |
---|---|---|---|---|---|---|---|---|---|
dit | 1 | 64 | 256x256 | OFF | ON | O2 | 3~5 mins | 0.89 | 71.91 |
dit | 1 | 64 | 256x256 | ON | ON | O2 | 3~5 mins | 0.95 | 67.37 |
dit | 4 | 64 | 256x256 | ON | ON | O2 | 3~5 mins | 1.03 | 248.52 |
dit | 8 | 64 | 256x256 | ON | ON | O2 | 3~5 mins | 0.93 | 515.61 |