From 1c2ff38e86c2951d543206842a53fa21a31c2aa8 Mon Sep 17 00:00:00 2001 From: Meals Date: Fri, 14 Jun 2024 17:10:29 +0800 Subject: [PATCH] =?UTF-8?q?update=EF=BC=9Atuning-fast?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- docs/zh/docs/dtx/fine-tuning-fast.md | 86 ++++++++++++++++------------ 1 file changed, 48 insertions(+), 38 deletions(-) diff --git a/docs/zh/docs/dtx/fine-tuning-fast.md b/docs/zh/docs/dtx/fine-tuning-fast.md index 66718e0..a7e988e 100644 --- a/docs/zh/docs/dtx/fine-tuning-fast.md +++ b/docs/zh/docs/dtx/fine-tuning-fast.md @@ -1,33 +1,45 @@ # 模型微调快速入门手册 -大致流程为:[前置要求准备](#_2) -> [创建数据集](#_3) -> [创建参数组](#_4) -> [创建微调实验](#_5) -> [部署微调模型](#_6) -> [对话](#_7) +## 操作步骤 + +- 前置要求准备 +- 创建数据集 +- 创建参数组 +- 创建微调实验 +- 部署微调模型 +- 对话 ## 前置要求 1. 已购买算力集群,并且该算力集群被加入当前用户所在的 workspace 中 2. 集群有可用的大模型(目前微调只适用与 llama2-7b 模型) -3. 已准备本地/远程数据集,数据集格式为 Q&A(目前仅支持 CSV 格式且文件大小不超过 50M) +3. 已准备本地/远程数据集,数据集格式为 Q&A(目前仅支持 CSV 格式且文件不超过 50M) ## 创建数据集 -在 **模型微调** -> **数据集** 中,点击 **上传数据集** 按钮。 +1. 点击创建 **数据集** ![创建数据集](images/dataset01.png) -- 输入数据集名称 -- 为数据集添加自定义标签 -- 选择数据集语言,当前支持中文/英文 -- 选择要创建的数据集所属的集群以及命名空间。注意:数据集所有集群以及命名空间应该和微调实验所属集群/命名空间保持一致。 -- 根据数据集的属性,设置授权协议 -- 根据数据集的大小,选择词条的数目 -- 根据数据集属性,选择数据集被应用的任务的类型,同时可以添加子类型 -- 配置数据集的信息,可以上传本地数据集文件配置三种类型的数据集地址,或者设置插件,配置参数让插件拉取数据集 -- 数据集的特征映射填写数据集中文件的表头。该数据集分为两列,列名分别为:question/answer +2. 填写表单 -点击 **确认** ,创建数据集。以 DCE 数据集为例: +- 输入数据集名称(不支持中文,长度限制 63 字符)。 +- 为数据集添加自定义标签。 +- 选择数据集语言,当前支持中文/英文。 +- 选择要创建的数据集所属的集群以及命名空间,注意:数据集所在集群/命名空间应该和微调实验所属集群/命名空间保一致。 +- 根据数据集的属性,设置授权协议。 +- 根据数据集的大小,选择词条的数目。 +- 根据数据集属性,选择数据集被应用的任务的类型,同时支持添加子类型。 +- 配置数据集的信息,可以上传本地数据集文件配置三种类型的数据集地址,或者设置插件,配置参数让插件拉取数据集。 +- 数据集的特征映射填写数据集中文件的表头。 +- 该数据集分为两列,列名分别为:question/answer。 ![数据集](images/dataset02.png) +> 点击 [DCEdata_en_test.csv](images/DCEdata_en_test.csv) 可下载该测试集文件。 +> 点击 [DCEdata_en_Trainning.csv](images/DCEdata_en_Trainning.csv) 可下载该训练集文件。 +> 点击 [DCEdata_en_validation.csv](images/DCEdata_en_validation.csv) 可下载该验证集文件。 + ## 创建参数组 在 **模型微调** -> **数据集** 中,点击 **创建** 按钮。 @@ -47,45 +59,43 @@ ## 创建微调实验 -1. 在 **模型微调** -> **数据集** 中,点击 **创建微调实验** 按钮 +1. 在 **模型微调** -> **数据集** 中,点击 **创建微调实验** 按钮 - ![创建微调实验](images/create-fine-tuning-experiment、.png) +![创建微调实验](images/create-fine-tuning-experiment.png) -2. 填写表单 +2. 填写表单 - 实验名称:由小写字母、数字字符或“-”组成,并且必须以字母或数字字符开头及结尾。 - 选择评估方式:实验中对模型使用的评分准则。 - 选择命名空间。 - ![实验基本信息](images/basic-information-of-experiment.png) - - - 任务名称:由小写字母、数字字符或“-”组成,并且必须以字母或数字字符开头及结尾。 - - 选择算力类型并填写物理卡个数。 +![实验基本信息](images/basic-information-of-experiment.png) - !!! info +- 任务名称:由小写字母、数字字符或“-”组成,并且必须以字母或数字字符开头及结尾。 +- 选择算力类型并填写物理卡个数。 - 当前模型服务仅支持Nvidia的GPU,模型会根据物理卡个数在GPU上进行分布式微调。 +!!! info - - 资源配置: + 当前模型服务仅支持Nvidia的GPU,模型会根据物理卡个数在GPU上进行分布式微调。 - - CPU 配额:通常需要使用多核 CPU 来加速训练和推理过程。具体的 CPU 配额需要根据任务的需求和可用的硬件资源来确定。 - - 内存配置:根据模型的大小和数据集的大小来确定内存需求,并根据需要调整内存配置。 +- CPU 配额:通常需要使用多核 CPU 来加速训练和推理过程。具体的 CPU 配额需要根据任务的需求和可用的硬件资源来确定。 +- 内存配置:根据模型的大小和数据集的大小来确定内存需求,并根据需要调整内存配置。 - 推荐 CPU 配额和内存配置请求值为 **4** Core,限制值为 **8** Core + 推荐 CPU 配额和内存配置请求值为 **16** Core,限制值为 **32** Core。 - !!! note +!!! note - 两者的请求值皆不可超过限制值。 + 两者的请求值皆不可超过限制值。 - ![任务配置](images/resource-allocation.png) +![任务配置](images/resource-allocation.png) - - 选择实验中要使用的 **基础大模型** 、 **数据组** 以及 **参数组** 。 +- 选择实验中要使用的 **基础大模型** 、 **数据组** 以及 **参数组** 。 - - 若要设置多个微调任务,可点击左下角 **添加任务** 创建新任务。 +- 若要设置多个微调任务,可点击左下角 **添加任务** 创建新任务。 - ![alt text](images/add-task.png) +![alt text](images/add-task.png) -3. 点击右下角 **确认** 按钮创建微调实验。 +3. 点击右下角 **确认** 按钮创建微调实验。 ## 部署微调模型 @@ -93,11 +103,11 @@ 1. 点击右侧的 **...** ,在弹出的选项中选择 **部署** 。 - ![微调模型部署](images/dtx-chat01.png) + ![微调模型部署](images/dtx-chat01.png) -2. 填写模型服务名称、命名空间、算力配额、资源配置后点击 **确定** (注:资源给的太少服务会起不来)。 +2. 填写模型服务名称、命名空间、算力配额、资源配置后点击 **确定** (注:推荐 CPU 配额和内存配置请求值为 **16** Core, **32** Gi)。 - ![微调模型部署](images/dtx-chat02.png) + ![微调模型部署](images/dtx-chat02.png) 3. 创建成功,接下来可以通过部署的模型提供服务 @@ -107,8 +117,8 @@ 点击右侧 **对比对话** 即可与该模型 **对话** (注:最多可选中三个微调模型进行对话)。 - ![模型服务对话](images/dtx-chat03.png) +![模型服务对话](images/dtx-chat03.png) 2. 可以输入训练集中的问题,点击发送给微调模型,以此验证模型微调的效果,微调模型会回答用户提出的问题。 - ![模型服务对话](images/dtx-chat04.png) +![模型服务对话](images/dtx-chat04.png)