• Joined on 2025-03-08
ljy commented on issue HswOAuth/llm_course#609 2025-04-15 19:06:10 +08:00
【求助帖】20250207,大模型初探- 基于LLaMA-Factory的模型微调

我这边新出现一个报错,(原本没有这个报错的)没成功解决这个报错,可以帮我看看吗?谢谢

ljy commented on issue HswOAuth/llm_course#609 2025-03-19 15:33:09 +08:00
【求助帖】20250207,大模型初探- 基于LLaMA-Factory的模型微调

换了两台服务器的显卡都是这个问题哦,怎么检查是什么问题,希望远程帮助排查问题

ljy commented on issue HswOAuth/llm_course#609 2025-03-15 23:35:15 +08:00
【求助帖】20250207,大模型初探- 基于LLaMA-Factory的模型微调

image

有的哦老师,真的没其他任务在占用的显存的,我不明白为什么同样 24G显存,9B我微调不了 checkpoint都…

ljy commented on issue HswOAuth/llm_course#609 2025-03-12 22:31:30 +08:00
【求助帖】20250207,大模型初探- 基于LLaMA-Factory的模型微调

可以在命令行,输入nvidia-smi查看是否还有其他进程占用显存

没有其他进程占用,我有附上watch nvidia-smi的截图,只有当前进程占用

ljy opened issue HswOAuth/llm_course#609 2025-03-08 20:38:19 +08:00
【求助帖】20250207,大模型初探- 基于LLaMA-Factory的模型微调