模型的微调出错 #258
Labels
No Label
bug
duplicate
enhancement
help wanted
invalid
question
wontfix
No Milestone
No project
No Assignees
6 Participants
Notifications
Due Date
No due date set.
Dependencies
No dependencies set.
Reference: HswOAuth/llm_course#258
Loading…
Reference in New Issue
Block a user
No description provided.
Delete Branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
按照教材和老师数据以及步骤,微调时始终没有出现曲线,从后台来看似乎没有问题,调整了训练轮数和学习率都没有效果,chat时明显看出数据被污染了,模型回复完全不对。不知道要怎么处理
您好,有解决吗?我也是相同问题,一直没找到什么原因。
这个是我之前提的问题
#229
没有呢,等着老师回复吧
+1,一样的问题
今天又做了一遍,还是不行。
重新换了qwen8B的模型,同样的数据训练轮数为6和学习率5e-4,微调成功,量化8和4都成功
千问的我也试过了,确实没问题。
请录屏整个屏幕操作流程,或者截图时候截取完整网页界面,便于后续问题排查
我也是同样的问题,哪位兄台解决了没?
请将LLaMA-Factory放置在/root/目录下,也就是:/root/LLaMA-Factory,然后再重复做一次实验
