Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

微调蒸馏训练时loss一直是nan #99

Open
DHY-2020 opened this issue Apr 13, 2022 · 8 comments
Open

微调蒸馏训练时loss一直是nan #99

DHY-2020 opened this issue Apr 13, 2022 · 8 comments

Comments

@DHY-2020
Copy link

楼主您好,非常感谢您的工作。
我现在碰到一个问题,模型剪枝后普通微调训练时没问题,但是使用微调蒸馏训练时loss一直为nan,不知道是什么原因
1

@ZJU-lishuang
Copy link
Owner

训练时部分loss值为nan,建议debug调试

@dddmmmyyy1998
Copy link

训练时部分loss值为nan,建议debug调试

您好,可以回答一下我发布的问题么?我在所有的best.pt权重上剪枝后的指标都是0,但是last.pt的指标是可以显示的。问题在列表中,我看您没有回复,谢谢

@sdustzcm1995
Copy link

楼主您好,非常感谢您的工作。 我现在碰到一个问题,模型剪枝后普通微调训练时没问题,但是使用微调蒸馏训练时loss一直为nan,不知道是什么原因 1

您好,请问问题解决了么?我也是同样的问题,跑了两步loss就nan了

@DHY-2020
Copy link
Author

楼主您好,非常感谢您的工作。 我现在碰到一个问题,模型剪枝后普通微调训练时没问题,但是使用微调蒸馏训练时loss一直为nan,不知道是什么原因 1

您好,请问问题解决了么?我也是同样的问题,跑了两步loss就nan了
还没有解决

@sdustzcm1995
Copy link

楼主您好,非常感谢您的工作。 我现在碰到一个问题,模型剪枝后普通微调训练时没问题,但是使用微调蒸馏训练时loss一直为nan,不知道是什么原因 1

您好,请问问题解决了么?我也是同样的问题,跑了两步loss就nan了
还没有解决

好的,谢谢,再研究吧。谢谢您。

@Wanghe1997
Copy link

楼主您好,非常感谢您的工作。 我现在碰到一个问题,模型剪枝后普通微调训练时没问题,但是使用微调蒸馏训练时loss一直为nan,不知道是什么原因 1

你好,可以加个联系方式吗?知识蒸馏我运行遇到了问题,想请教一下,谢谢您

@Wanghe1997
Copy link

请问楼主您解决了吗?loss一直是nan的问题

@SCKnife
Copy link

SCKnife commented Apr 27, 2023

请问楼上的各位,有解决了这个问题的吗?我也是跑了两步之后就开始变nan了!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

6 participants