-
Notifications
You must be signed in to change notification settings - Fork 889
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
全量微调vision端不稳定 #585
Comments
补充一下,一阶段的纯llm微调使用的无图数据,希望llm端能适应新的任务,后面的阶段尽量仿造了minicpm的预训练阶段的过程 |
大佬,您好!能不能上传一下funetune文件夹下的dataset.py文件,想参考一下您的,我发现我在微调的时候老是报data fetch error的错误(报错位置定位在dataset.py文件中)。万分感谢! |
可以按照这个pr改一下试试 #579 |
|
感谢感谢,就是这个问题 |
对你有用的话,帮忙给pr点个👍,让它更加容易合入吧,免得后面的人在遇到这个问题😊 |
我的训练方式是分两个阶段
但现在loss曲线很差,请问是什么问题呢
数据集为数学相关,输入题目和图片,输出题目关键点
以下为bash文件中的设置:
不同阶段会修改--llm_tune等设置,其他不变
以下为loss曲线
另外还试了二阶段是train resampler的情况,以下为loss曲线
大概什么问题呢,是任务太难了吗?
The text was updated successfully, but these errors were encountered: