【求助帖】autoDL基于LLaMA-Factory微调glm4-9b后,模型乱回复 #279
Labels
No Label
bug
duplicate
enhancement
help wanted
invalid
question
wontfix
No Milestone
No project
No Assignees
3 Participants
Notifications
Due Date
No due date set.
Dependencies
No dependencies set.
Reference: HswOAuth/llm_course#279
Loading…
Reference in New Issue
Block a user
No description provided.
Delete Branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
训练过程
-(按照pdf教程做环境):

训练结果
想请教是哪里的问题导致的
Could not load library libnvrtc.so.12. Error: libnvrtc.so.12: cannot open shared ob ject file: No such file or directory
看训练时日志也存在这个报错

基于前面Could not load library libnvrtc.so.12. Error: libnvrtc.so.12: cannot open shared ob ject file: No such file or directory的报错,
通过find命令找到libnvrtc.so.12,通过export设置环境变量。重新做了一次训练。最终控制台日志见附件failed.log。
依旧没有损失图,模型依旧乱回复。
不少同学都出现了这个问题,麻烦同学在这个帖子后面进行一下跟进,后续如果有解决方案会在这里更新#273 (comment)
我也遇到了这个问题,试了两遍,都是这个问题。然后换了个机器,发现还是这个问题。
然后我换了模型,不用GLM-9B-Chat,换成Qwen-7B-Chat, 就可以正常训练,正常回复了,结果跟老师在课堂上演示的一样。
不确定是不是 GLM模型的问题。
哈哈,还真是,我也做出来了,感谢分享。这个GLM模型就是不行。