【求助帖】10/20 大模型初探-基于LLaMA-Factory的模型微调训练 #242

Open
opened 2024-10-20 22:21:59 +08:00 by rebibabo · 3 comments

为什么我开始微调之后先是报错
image
然后训练过程中梯度一直是nan,降低学习率、降低max_grad_norm、设置为f32精度,还是这样,请问怎么解决呢
image

为什么我开始微调之后先是报错 ![image](/attachments/722d0f82-e1b5-4830-b4b1-fb30f8a5e308) 然后训练过程中梯度一直是nan,降低学习率、降低max_grad_norm、设置为f32精度,还是这样,请问怎么解决呢 ![image](/attachments/ed4909ca-ca79-4a99-b42a-60fc58b632e1)
Owner

是否是按上课时一幕一样操作?所使用的环境能否告知一下?比如说autodl租用,还是自己私有化服务器?

是否是按上课时一幕一样操作?所使用的环境能否告知一下?比如说autodl租用,还是自己私有化服务器?
Author

是autodl租用的,操作都是按照老师的一步一步来

是autodl租用的,操作都是按照老师的一步一步来

请将LLaMA-Factory放置在/root/目录下,也就是:/root/LLaMA-Factory,然后再重复做一次实验

image

请将LLaMA-Factory放置在/root/目录下,也就是:/root/LLaMA-Factory,然后再重复做一次实验 ![image](/attachments/ab4fecf5-5b65-4286-9a03-4adba02af08e)
Sign in to join this conversation.
No Milestone
No project
No Assignees
3 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: HswOAuth/llm_course#242
No description provided.