Skip to content

模型版本书写样例

vigo999 edited this page Nov 6, 2024 · 3 revisions

版本配套信息 -> Requirements

  • 根据版本配套表,书写模型构建的ms+ascend+cann版本信息
  • 表头统一小写,表格内容居中
mindspore ascend driver firmware cann toolkit/kernel
2.3.1 24.1.RC2 7.3.0.1.231 8.0.RC2.beta1
2.3.0 24.1.RC2 7.3.0.1.231 8.0.RC2.beta1
2.1.0 23.0.rc2 6.4.12.1.241 6.3.RC2

例如:模型是在mindspore 2.3.0 验证过的。书写如下,表头统一小写:

Requirements

mindspore ascend driver firmware cann toolkit/kernel
2.3.0 24.1.RC2 7.3.0.1.231 8.0.RC2.beta1

性能表现书写 -> Performance

  • 指明模型测试的机器和模式,该信息单独阐述在表格上方: Experiments are tested on ascend [910/910*] with mindspore [2.3.1/xxxx] graph mode

  • 如支持多个mindspore版本,请针对不同版本分开多张表

  • 表头统一小写,表格居中

  • 填写名称

    【MUST】- 以下内容必须填写

    • model name - 模型名称,例如 dit
    • cards - 训练卡数,例如 1
    • batch size - 单卡的批量大小,例如 64
    • resolution - 文生图/文生视频分辨率,例如 1024x1024 or 16x512x512
    • jit level - mindspore 2.3 版本后,例如 O0/O1/O2
    • graph compile - 图编译时间, 例如 3~5 mins
    • s/step - 单步速度,保留2位小数,例如 0.89
    • img/s - FPS,等于 cards * batch size / step time,保留2位小数,例如 71.91
    • [推理] scheduler/sampler - scheduler/采样器名称(如有),例如 DDIM
    • [推理] step - 推理步数,例如 40

    【OPTIONAL】- 以下内容可根据不同模型选择性填写

    • method - 同一模型如有不同训练方法可指明,例如 dreambooth/lora
    • stage - 文生视频模型训练可能涉及多阶段训练,如涉及需指明训练阶段,例如 1
    • grad accu - grad accumulation step 梯度累加,例如 1
    • sink - 是否开启数据下沉模式, ON/OFF
    • flash attn - 是否使用 flash attention, ON/OFF
    • recompute - 是否开启重计算,ON/OFF
    • cache - 是否开启数据缓存,ON/OFF
    • discriminator - 是否使用discriminator,ON/OFF
    • precision - 精度,例如 fp32/fp16/bf16,如涉及混合精度可在表格下写note注释
    • [推理] s/img - 单图推理速度,保留2位小数,例如 3.22
    • [推理] s/video - 单视频推理速度,保留2位小数,例如 25.22
    • [推理] psnr 推理结果metric,保留2位小数,例如 28.95
    • [推理] ssim 推理结果metric,保留2位小数,例如 0.87
    • recipe - yaml文件配置链接,例如 yaml
    • weight - 权重链接,例如 weight
    • 其他内容(持续补充)
  • 填写顺序

    前面 4 (或者5)列固定为:

    model name method (如有) cards batch size resolution 中间optional列
    sd 1.5 lora 1 1 512x512 ...

    倒数列顺序固定为:

    • 训练
    中间optional列 precision(如有) jit level graph compile s/step img/s
    ... fp16 O1 5 mins 0.50 2.00
    • 推理
    中间optional列 scheduler steps jit level graph compile s/step (如有) img/s psnr (如有) ssim (如有)
    ... ddim 40 O1 5 mins 0.11 4.40 xx.xx xx.xx
    • 如有 recipe 与 weight 文件列,则放最后两列:
    前面固定列 中间optional列 倒数固定列 recipe weight
    ... ... ... yaml weight

以dit模型为例,模型表现书写如下:

Performance

Experiments are tested on ascend 910* with mindspore 2.3.1 graph mode.

model name cards batch size resolution recompute sink jit level graph compile s/step img/s
dit 1 64 256x256 OFF ON O2 3~5 mins 0.89 71.91
dit 1 64 256x256 ON ON O2 3~5 mins 0.95 67.37
dit 4 64 256x256 ON ON O2 3~5 mins 1.03 248.52
dit 8 64 256x256 ON ON O2 3~5 mins 0.93 515.61
Clone this wiki locally