像截图中微调大模型任务，微调不到10%损失函数就下降那么低了之后就收敛了，我还有必要继续训练还是直接中断进行部署？ #208

New Issue

XPH · 2024-10-17T14:17:00+08:00

XPH commented

No description provided.

75 KiB

best_newnew commented

我觉得确实是可以考虑直接中断的，如果训练得过多甚至可能会出现过拟合。
但是要小心喔，提前结束训练需要先确定你的模型会在适当的检查点进行保存，然后再在算法中调用相应的检查点结合原来的预训练模型进行部署。

我觉得确实是可以考虑直接中断的，如果训练得过多甚至可能会出现过拟合。但是要小心喔，提前结束训练需要先确定你的模型会在适当的检查点进行保存，然后再在算法中调用相应的检查点结合原来的预训练模型进行部署。

XPH commented

我觉得确实是可以考虑直接中断的，如果训练得过多甚至可能会出现过拟合。
但是要小心喔，提前结束训练需要先确定你的模型会在适当的检查点进行保存，然后再在算法中调用相应的检查点结合原来的预训练模型进行部署。

好的感谢您的回复，训练的时候每训练50步进行保存的

> 我觉得确实是可以考虑直接中断的，如果训练得过多甚至可能会出现过拟合。 > 但是要小心喔，提前结束训练需要先确定你的模型会在适当的检查点进行保存，然后再在算法中调用相应的检查点结合原来的预训练模型进行部署。好的感谢您的回复，训练的时候每训练50步进行保存的

XPH closed this issue

Sign in to join this conversation.

No Label

No Milestone

No project

No Assignees

2 Participants

Notifications

Due Date

The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: HswOAuth/llm_course#208