Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Tại sao không tách cặp question-answer khi train model #12

Open
tuanio opened this issue Apr 22, 2023 · 1 comment
Open

Tại sao không tách cặp question-answer khi train model #12

tuanio opened this issue Apr 22, 2023 · 1 comment

Comments

@tuanio
Copy link

tuanio commented Apr 22, 2023

Em chào mọi người, gần đây em có tận dụng code này và code alpaca-lora gốc để thực hiện instruction fine-tuning cho GPT-J 6B của VietAI. Tuy nhiên em đọc code em thấy có một phần khá lạ, code này và code alpaca-lora đều đưa cả triplet instruction-input-output vào model luôn (input_ids và labels giống nhau) thay vì tách ra instruction-input và output riêng.

from prompt import make_prompt
def generate_prompt(data_point):
    question = data_point["prompt"].strip()
    answer = data_point["response"].strip()
    return f"{make_prompt(question)}\n{answer}"

Em đã thực hiện train model theo kiểu đưa cả 3 vào, nhưng lúc inference hoàn toàn không sử dụng được khi chỉ đưa instruction-input, em đã thử đưa cả instruction-input-output vào và đương nhiên nó sẽ predict ra giống hệt. Nhưng điều này hoàn toàn vô nghĩa khi mình không có output trước.

Mong các anh giải thích giúp em ạ.

@tiendung
Copy link
Contributor

Vì cách sử dụng input trong Alpaca anh thấy nó hơi thừa: 1/ là số lượng input = None nhiều 2/ là giả sử như mình dùng giao diện chat, mình cũng đâu có trường tiêng để nhập input đâu, vì thế gắn input vào sau instruct để tạo prompt thì hợp lý hơn. Vậy nên anh format lại dữ liệu thành prompt và response.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants