21484771638cs
  • Joined on 2024-08-02
21484771638cs commented on issue HswOAuth/llm_course#229 2024-10-23 12:47:23 +08:00
【求助】LLaMA-Factory对 GLM-4-9B-Chat 进行模型微调loss直接为0

可以尝试将模型删除,然后重新下载基座模型试试,另外请保持与上课时参数一模一样,再尝试看能否可以微调

都试过了。老师,我看这个好像…

21484771638cs commented on issue HswOAuth/llm_course#258 2024-10-22 16:39:12 +08:00
模型的微调出错

今天又做了一遍,还是不行。 重新换了qwen8B的模型,同样的数据训练轮数为6和学习率5e-4,微调成功,量化8和4都成功

千问的我也试过了,确实…

21484771638cs commented on issue HswOAuth/llm_course#258 2024-10-21 21:43:42 +08:00
模型的微调出错

您好,有解决吗?我也是相同问题,一直没找到什么原因。 这个是我之前提的问题 HswOAuth/llm_course#229

21484771638cs opened issue HswOAuth/llm_course#229 2024-10-19 11:08:36 +08:00
【求助】LLaMA-Factory对 GLM-4-9B-Chat 进行模型微调loss直接为0