基于LLaMA-Factory的模型微调训练,拉大模型报错,帮看下问题在哪里? #140

Open
opened 2024-09-27 19:03:10 +08:00 by 18150087639 · 2 comments

基于LLaMA-Factory的模型微调训练,拉大模型报错,帮看下问题在哪里?

基于LLaMA-Factory的模型微调训练,拉大模型报错,帮看下问题在哪里?
133 KiB
224 KiB

基于LLaMA-Factory的模型微调训练,拉大模型报错,帮看下问题在哪里?

1.jpeg
模型路径填写问题,有两种方式可以加载模型
方式1: 加载本地模型的文件路径:如果已经提前下载模型文件,这里【模型路径】需要写下载模型路径的绝对地址(图中写的是THUDM/glm-4-9b-chat,非绝对路径)
方式2: HuggingFace的模型标识符: 在【模型名称】选择模型名称CLM-4-9B-Chat之后,【模型路径】会自动填写: ZhipuAI/glm-4-9b-chat。(可选择不同的【模型名称】观察【模型路径】处会被自动填写。)选择之后点击加载模型需要一定下载时间,要是遇到网络问题可多次尝试。
下图是HuggingFace的模型标识符的下载方式时的填写内容
2.png

> 基于LLaMA-Factory的模型微调训练,拉大模型报错,帮看下问题在哪里? ![1.jpeg](/attachments/24181661-7d9e-472e-bd0e-b1885462e692) 模型路径填写问题,有两种方式可以加载模型 方式1: 加载本地模型的文件路径:如果已经提前下载模型文件,这里【模型路径】需要写下载模型路径的绝对地址(图中写的是THUDM/glm-4-9b-chat,非绝对路径) 方式2: HuggingFace的模型标识符: 在【模型名称】选择模型名称CLM-4-9B-Chat之后,【模型路径】会自动填写: ZhipuAI/glm-4-9b-chat。(可选择不同的【模型名称】观察【模型路径】处会被自动填写。)选择之后点击加载模型需要一定下载时间,要是遇到网络问题可多次尝试。 下图是HuggingFace的模型标识符的下载方式时的填写内容 ![2.png](/attachments/38dd8f2a-4dbe-48bd-8e88-2b27032bb2df)
Owner

是不是没有配置LLaMA-Factory使用modelscope下载模型,请查看教案,是否正确设置了环境变量后,才启动llamafactory-cli webui
image

是不是没有配置LLaMA-Factory使用modelscope下载模型,请查看教案,是否正确设置了环境变量后,才启动llamafactory-cli webui <img width="795" alt="image" src="/attachments/d11bb67f-708f-4189-9382-ea184c2d7ff0">
132 KiB
Sign in to join this conversation.
No Milestone
No project
No Assignees
3 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: HswOAuth/llm_course#140
No description provided.