【求助帖】llama factory微调后,大模型乱回复 #285

Open
opened 2024-10-25 09:22:13 +08:00 by qiuzhen · 4 comments

微调时不显示损失曲线。微调前可以正常回复,微调后胡言乱语。
如图

微调时不显示损失曲线。微调前可以正常回复,微调后胡言乱语。 如图

我也是同样的问题,步骤都和文档一样的做,体现为这里的损失曲线没有,且纵坐标特别大,我看老师视频中是1.x,还有就是加载微调后的模型,回复胡言乱语。

我也是同样的问题,步骤都和文档一样的做,体现为这里的损失曲线没有,且纵坐标特别大,我看老师视频中是1.x,还有就是加载微调后的模型,回复胡言乱语。

请将LLaMA-Factory放置在/root/目录下,也就是:/root/LLaMA-Factory,然后再重复做一次实验

image

请将LLaMA-Factory放置在/root/目录下,也就是:/root/LLaMA-Factory,然后再重复做一次实验 ![image](/attachments/5ae1541a-d25f-48ba-898c-1caa81293095)
Author

请将LLaMA-Factory放置在/root/目录下,也就是:/root/LLaMA-Factory,然后再重复做一次实验

image

我的LLaMA-Factory就是在root下的,上午有老师评论让我录屏,不知道为什么评论删了,完整的录屏放在下面了(前1:50在克隆容器)

> 请将LLaMA-Factory放置在/root/目录下,也就是:/root/LLaMA-Factory,然后再重复做一次实验 > > ![image](/attachments/5ae1541a-d25f-48ba-898c-1caa81293095) 我的LLaMA-Factory就是在root下的,上午有老师评论让我录屏,不知道为什么评论删了,完整的录屏放在下面了(前1:50在克隆容器)
Owner

找到问题了,已经更新了课件,请按最新课件操作流程来:https://www.yuque.com/hkutangyu/di80sc/oy84gbs16y1ubzdd?singleDoc# 《基于LLaMA-Factory的模型微调训练》 密码:amos

找到问题了,已经更新了课件,请按最新课件操作流程来:https://www.yuque.com/hkutangyu/di80sc/oy84gbs16y1ubzdd?singleDoc# 《基于LLaMA-Factory的模型微调训练》 密码:amos
Sign in to join this conversation.
No Milestone
No project
No Assignees
4 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: HswOAuth/llm_course#285
No description provided.