【求助帖】xtuner课程复现遇到的问题 【已解决】 #131
Labels
No Label
bug
duplicate
enhancement
help wanted
invalid
question
wontfix
No Milestone
No project
No Assignees
3 Participants
Notifications
Due Date
No due date set.
Dependencies
No dependencies set.
Reference: HswOAuth/llm_course#131
Loading…
Reference in New Issue
Block a user
No description provided.
Delete Branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
这里我尝试了qwen_1_8b和ChatGLM-6B模型,一开始都是遇到了相同的问题。
配置路径
运行代码
报错详情
requires bitsandbytes>=0.39.0
尝试使用pip install bitsandbytes==0.39.0 和 pip install --upgrade bitsandbytes 解决问题,出现如下报错:
google发现说是不兼容,求大佬帮助
xtuner课程复现遇到的问题to 【求助帖】xtuner课程复现遇到的问题课上提了一下,可能大家没注意:我们平台DCU目前支持的量化参数兼容性还不太好,大家可以将xtuner中的量化部分注释掉,可以参考老师写的代码,或者直接注释掉或者直接删掉下面这部分代码
quantization_config=dict(
type=BitsAndBytesConfig,
load_in_4bit=True,
load_in_8bit=False,
llm_int8_threshold=6.0,
llm_int8_has_fp16_weight=False,
bnb_4bit_compute_dtype=torch.float16,
bnb_4bit_use_double_quant=True,
bnb_4bit_quant_type='nf4')
另外,假设有同学在自己的机器上运行训练,如果发现自己的GPU不支持bfloat16,也需要修改下配置文件里的dtype字段的值
比如torch_dtype=torch.float16改成torch_dtype=torch.float16
完成注释后问题得到解决。
应该是使用DCU的情况都需要修改,平台暂时不支持量化训练。
【求助帖】xtuner课程复现遇到的问题to 【求助帖】xtuner课程复现遇到的问题 【已解决】有用!