基于LLaMA-Factory的模型微调训练,拉大模型报错,帮看下问题在哪里? #140
Labels
No Label
bug
duplicate
enhancement
help wanted
invalid
question
wontfix
No Milestone
No project
No Assignees
3 Participants
Notifications
Due Date
No due date set.
Dependencies
No dependencies set.
Reference: HswOAuth/llm_course#140
Loading…
Reference in New Issue
Block a user
No description provided.
Delete Branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
基于LLaMA-Factory的模型微调训练,拉大模型报错,帮看下问题在哪里?
模型路径填写问题,有两种方式可以加载模型
方式1: 加载本地模型的文件路径:如果已经提前下载模型文件,这里【模型路径】需要写下载模型路径的绝对地址(图中写的是THUDM/glm-4-9b-chat,非绝对路径)
方式2: HuggingFace的模型标识符: 在【模型名称】选择模型名称CLM-4-9B-Chat之后,【模型路径】会自动填写: ZhipuAI/glm-4-9b-chat。(可选择不同的【模型名称】观察【模型路径】处会被自动填写。)选择之后点击加载模型需要一定下载时间,要是遇到网络问题可多次尝试。
下图是HuggingFace的模型标识符的下载方式时的填写内容
是不是没有配置LLaMA-Factory使用modelscope下载模型,请查看教案,是否正确设置了环境变量后,才启动llamafactory-cli webui
