add script to fine-tune models

flexflow · Oct 27, 2023 · aa9f004 · aa9f004
1 parent c83c376
commit aa9f004
Show file tree

Hide file tree

Showing 3 changed files with 39 additions and 11 deletions.
diff --git a/.gitignore b/.gitignore
@@ -186,4 +186,6 @@ gpt_tokenizer
 # pip version
 python/flexflow/version.txt
 
-inference_tensors
+inference_tensors
+
+Untitled-1.ipynb
diff --git a/tests/peft/fine_tune.sh b/tests/peft/fine_tune.sh
@@ -0,0 +1,19 @@
+#! /usr/bin/env bash
+set -e
+set -x
+
+# Cd into directory holding this script
+cd "${BASH_SOURCE[0]%/*}"
+
+python hf_finetune.py --model-name decapoda-research/llama-7b-hf --lora-target-modules down_proj --use-full-precision --publish-peft-with-id goliaro/llama-7b-lora-full
+python hf_finetune.py --model-name decapoda-research/llama-7b-hf --lora-target-modules down_proj --publish-peft-with-id goliaro/llama-7b-lora-half
+python hf_finetune.py --model-name JackFram/llama-160m-base --lora-target-modules down_proj --use-full-precision --publish-peft-with-id goliaro/llama-160m-lora-full
+python hf_finetune.py --model-name JackFram/llama-160m-base --lora-target-modules down_proj --publish-peft-with-id goliaro/llama-160m-lora-half
+
+python hf_finetune.py --model-name meta-llama/Llama-2-7b-hf --lora-target-modules down_proj --use-full-precision --publish-peft-with-id goliaro/llama-2-7b-lora-full
+python hf_finetune.py --model-name meta-llama/Llama-2-7b-hf --lora-target-modules down_proj --publish-peft-with-id goliaro/llama-2-7b-lora-half
+
+python hf_finetune.py --model-name facebook/opt-6.7b --lora-target-modules fc2 --use-full-precision --publish-peft-with-id goliaro/opt-6.7b-lora-full
+python hf_finetune.py --model-name facebook/opt-6.7b --lora-target-modules fc2 --publish-peft-with-id goliaro/opt-6.7b-lora-half
+python hf_finetune.py --model-name facebook/opt-125m --lora-target-modules fc2 --use-full-precision --publish-peft-with-id goliaro/opt-125m-lora-full
+python hf_finetune.py --model-name facebook/opt-125m --lora-target-modules fc2 --publish-peft-with-id goliaro/opt-125m-lora-half
diff --git a/tests/peft/hf_finetune.py b/tests/peft/hf_finetune.py
@@ -32,16 +32,22 @@ def main():
     parser.add_argument("--model-name", type=str, default="decapoda-research/llama-7b-hf")
     parser.add_argument("--lora-rank", type=int, default=16)
     parser.add_argument("--lora-alpha", type=int, default=32)
+    parser.add_argument("--lora-target-modules", type=str, default="down_proj", help="Comma-separated list of layers from the base model to target")
     parser.add_argument("--lora-dropout", type=float, default=0.05)
     parser.add_argument("--use-full-precision", action="store_true", help="Use full precision")
-    parser.add_argument("--output-dir", type=str, default="./finetuned-llama")
+    parser.add_argument("--output-dir", type=str, default="")
+    parser.add_argument("--publish-peft-with-id", type=str, default="")
     args = parser.parse_args()
     model_name = args.model_name
     use_full_precision=args.use_full_precision
     lora_rank = args.lora_rank
     lora_alpha = args.lora_alpha
+    lora_target_modules = args.lora_target_modules.split(",")
     lora_dropout = args.lora_dropout
     output_dir = args.output_dir
+    publish_peft_with_id = args.publish_peft_with_id
+    if len(output_dir) == 0 and len(publish_peft_with_id) == 0:
+        raise ValueError("Please pass either a --output-dir or a --publish-peft-with-id to specify where to store the fine-tuned model")
 
     # Change working dir to folder storing this script
     abspath = os.path.abspath(__file__)
@@ -81,7 +87,8 @@ def main():
         r=lora_rank,
         lora_alpha=lora_alpha,
         #target_modules=["q_proj", "v_proj"],
-        target_modules=["down_proj"],
+        #target_modules=["down_proj"],
+        target_modules=lora_target_modules,
         lora_dropout=lora_dropout,
         bias="none",
         task_type="CAUSAL_LM"
@@ -105,20 +112,20 @@ def main():
             learning_rate=2e-4,
             fp16=True if not use_full_precision else False,
             logging_steps=1,
-            output_dir=os.path.join(output_dir, "logs"),
+            output_dir=os.path.join(output_dir if len(output_dir) > 0 else "./", "lora_training_logs"),
         ),
         data_collator=transformers.DataCollatorForLanguageModeling(tokenizer, mlm=False)
     )
     model.config.use_cache = False  # silence the warnings. Please re-enable for inference!
     trainer.train()
 
-    print(f"Done fine-tuning! Saving the model to {output_dir}...")
-    model.save_pretrained(output_dir)
-
-    # Upload to HF hub
-    #from huggingface_hub import notebook_login
-    #notebook_login()
-    #model.push_to_hub("goliaro/llama-7b-lora-half", use_auth_token=True)
+    if len(output_dir) > 0:
+        print(f"Done fine-tuning! Saving the model to {output_dir}...")
+        model.save_pretrained(output_dir)
+
+    if len(publish_peft_with_id) > 0:
+        print(f"Done fine-tuning! Uploading the model to HF hub with id: {publish_peft_with_id}...")
+        model.push_to_hub(publish_peft_with_id, use_auth_token=True)
 
 if __name__ == "__main__":
     main()