【求助帖】prompt课程复现遇到的问题 #138

Open
opened 2024-09-27 16:42:23 +08:00 by 12390900721cs · 0 comments

这节课的课程复现主要包括两个:

  1. 用notebook微调大模型
  2. 用训练管理微调大模型

我的问题出现在:训练管理微调大模型后,无法将微调后的pth文件转换为hf格式的模型

Notebook微调后的大模型格式转换:

All done,没有出现问题。

这里的/code/xtuner-workdir/iter_500.pth/检查点文件也是8个

而训练管理微调后的大模型:

说是该目录(/userhome/xtuner-workdir/iter_500.pth/)下的该尾缀文件应该是8个但是有12个,不知道为什么会出现这个情况?

python final_test训练结果:

notebook测试结果:

测试没有问题。

为什么训练管理的跑不起来呀QwQ

这节课的课程复现主要包括两个: 1. 用notebook微调大模型 2. 用训练管理微调大模型 我的问题出现在:训练管理微调大模型后,**无法将微调后的pth文件转换为hf格式的模型**。 ### Notebook微调后的大模型格式转换: ![](https://cdn.nlark.com/yuque/0/2024/png/48516026/1727425094083-5a72ef37-9234-45eb-948d-89af5580c7c5.png) All done,没有出现问题。 这里的/code/xtuner-workdir/iter_500.pth/检查点文件也是8个 ### 而训练管理微调后的大模型: ![](https://cdn.nlark.com/yuque/0/2024/png/48516026/1727425301865-851a0b63-8866-44a5-9fd1-552ea06c9913.png) 说是该目录(/userhome/xtuner-workdir/iter_500.pth/)下的该尾缀文件应该是8个但是有12个,不知道为什么会出现这个情况? ![](https://cdn.nlark.com/yuque/0/2024/png/48516026/1727425765050-bbb9e81d-66e1-4163-bf23-1b49bf961f7a.png) ### python final_test训练结果: notebook测试结果: ![](https://cdn.nlark.com/yuque/0/2024/png/48516026/1727425965600-849ca0c0-89c4-44c9-9c2e-0f2245bcbd96.png) ![](https://cdn.nlark.com/yuque/0/2024/png/48516026/1727426308847-ed13d2e2-c194-4832-bd77-a1fd8904d11c.png) 测试没有问题。 为什么训练管理的跑不起来呀QwQ
Sign in to join this conversation.
No Milestone
No project
No Assignees
1 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: HswOAuth/llm_course#138
No description provided.