【求助帖】基于LLaMA-Factory的模型微调训练 训练一次后就出错 #544

Open
opened 2025-02-13 20:41:45 +08:00 by CharlieXie · 2 comments

第一次训练成功,第二次训练后出错
image
CUDA out of memory
image
我的实例配置:
image

第一次训练成功,第二次训练后出错 <img width="1388" alt="image" src="/attachments/19a4c96c-e9c1-450c-8db0-b70da57a1d88"> CUDA out of memory <img width="887" alt="image" src="/attachments/22715742-8ce7-4baf-bd41-9b1b4f41b2b5"> 我的实例配置: <img width="688" alt="image" src="/attachments/8de5107e-4f2d-459b-85c3-61eda940b291">

应该是没有释放模型。

应该是没有释放模型。

应该是没有释放模型。

我也有这个报错,那么要怎么释放模型?

> 应该是没有释放模型。 我也有这个报错,那么要怎么释放模型?
Sign in to join this conversation.
No Milestone
No project
No Assignees
3 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: HswOAuth/llm_course#544
No description provided.