模型的微调出错 #258

Open
opened 2024-10-21 21:13:11 +08:00 by flys_zhb · 8 comments

按照教材和老师数据以及步骤,微调时始终没有出现曲线,从后台来看似乎没有问题,调整了训练轮数和学习率都没有效果,chat时明显看出数据被污染了,模型回复完全不对。不知道要怎么处理

按照教材和老师数据以及步骤,微调时始终没有出现曲线,从后台来看似乎没有问题,调整了训练轮数和学习率都没有效果,chat时明显看出数据被污染了,模型回复完全不对。不知道要怎么处理

您好,有解决吗?我也是相同问题,一直没找到什么原因。
这个是我之前提的问题
#229

您好,有解决吗?我也是相同问题,一直没找到什么原因。 这个是我之前提的问题 https://hsw-git.huishiwei.cn/HswOAuth/llm_course/issues/229
Author

您好,有解决吗?我也是相同问题,一直没找到什么原因。
这个是我之前提的问题
#229

没有呢,等着老师回复吧

> 您好,有解决吗?我也是相同问题,一直没找到什么原因。 > 这个是我之前提的问题 > https://hsw-git.huishiwei.cn/HswOAuth/llm_course/issues/229 没有呢,等着老师回复吧

+1,一样的问题

+1,一样的问题
98 KiB
259 KiB
Author

今天又做了一遍,还是不行。
重新换了qwen8B的模型,同样的数据训练轮数为6和学习率5e-4,微调成功,量化8和4都成功

今天又做了一遍,还是不行。 重新换了qwen8B的模型,同样的数据训练轮数为6和学习率5e-4,微调成功,量化8和4都成功

今天又做了一遍,还是不行。
重新换了qwen8B的模型,同样的数据训练轮数为6和学习率5e-4,微调成功,量化8和4都成功

千问的我也试过了,确实没问题。

> 今天又做了一遍,还是不行。 > 重新换了qwen8B的模型,同样的数据训练轮数为6和学习率5e-4,微调成功,量化8和4都成功 千问的我也试过了,确实没问题。
Owner

请录屏整个屏幕操作流程,或者截图时候截取完整网页界面,便于后续问题排查

请录屏整个屏幕操作流程,或者截图时候截取完整网页界面,便于后续问题排查

我也是同样的问题,哪位兄台解决了没?

我也是同样的问题,哪位兄台解决了没?

请将LLaMA-Factory放置在/root/目录下,也就是:/root/LLaMA-Factory,然后再重复做一次实验
image

请将LLaMA-Factory放置在/root/目录下,也就是:/root/LLaMA-Factory,然后再重复做一次实验 ![image](/attachments/c3fc3dac-11fb-4a14-bfc9-e2d00bcbde7d)
Sign in to join this conversation.
No Milestone
No project
No Assignees
6 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: HswOAuth/llm_course#258
No description provided.