【求助帖】我在微调大模型的时候,经常报错,导致微调训练报错,需要怎么处理哇 #574

Open
opened 2025-02-21 17:50:03 +08:00 by guoyue · 3 comments

一开始微调,就会报错,需要怎么处理呢?
image

一开始微调,就会报错,需要怎么处理呢? ![image](/attachments/196d4425-3d8e-4757-a1ce-da1802f48b4b)
328 KiB

GPU的显存没有释放。是不是其他应用占用,或者llama-factory的chat模块没有释放。

GPU的显存没有释放。是不是其他应用占用,或者llama-factory的chat模块没有释放。
Author

GPU的显存没有释放。是不是其他应用占用,或者llama-factory的chat模块没有释放。
应该是的吧,我加载完成模型之后,gpu的内存就没有下去过。但是我要怎么让它释放呢

> GPU的显存没有释放。是不是其他应用占用,或者llama-factory的chat模块没有释放。 应该是的吧,我加载完成模型之后,gpu的内存就没有下去过。但是我要怎么让它释放呢
image
<img width="747" alt="image" src="/attachments/44de789d-d444-46a3-bbff-ed325703e007">
101 KiB
Sign in to join this conversation.
No Milestone
No project
No Assignees
2 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: HswOAuth/llm_course#574
No description provided.