微调大模型的时候,训练集损失函数没有下降趋势,但是验证集损失函数一直下降,这种情况应该还不算是过拟合现象吧? #253

Open
opened 2024-10-21 18:51:36 +08:00 by XPH · 1 comment
No description provided.

这应该不算是过拟合。不过这个现象好奇怪,我认为这种情况已经算是收敛了,虽然这里面验证集损失在下降,但是真的下降的太少了,这都不能算下降了吧

这应该不算是过拟合。不过这个现象好奇怪,我认为这种情况已经算是收敛了,虽然这里面验证集损失在下降,但是真的下降的太少了,这都不能算下降了吧
Sign in to join this conversation.
No Milestone
No project
No Assignees
2 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: HswOAuth/llm_course#253
No description provided.