07-使用xtuner微调开源模型 #147

New Issue

12535224197cs · 2024-09-30T17:53:12+08:00

12535224197cs commented

2024-09-30 17:53:12 +08:00

step1: 创建notebook

step2: 查找配置文件，复制配置文件

xtuner list-cfg -p  yi_6b_qlora_alpaca_enzh_e3
xtuner copy-cfg yi_6b_qlora_alpaca_enzh_e3 /code

step3: 下载模型文件和数据下载

1. 打开yi_6b_qlora_alpaca_enzh_e3.py文件，查看需要的模型文件和数据文件名并下载。
2. # 在平台上设置网络代理才能连接到互联网
#只有在汇视威计算平台才可用
export http_proxy=http://10.10.9.50:3000
export https_proxy=http://10.10.9.50:3000
export no_proxy=localhost,127.0.0.1
#设置huggingface的cache目录在共享目录下
export HF_HOME=/code/huggingface-cache
#设置huggingface访问站点为国内镜像站点
export HF_ENDPOINT=https://hf-mirror.com
3. 下载模型文件：huggingface-cli download 01-ai/Yi-6B --revision main --local-dir-use-symlinks False --local-dir /code/data/models/01-ai_Yi-6B
4. 下载数据文件：huggingface-cli download silk-road/alpaca-data-gpt4-chinese --repo-type dataset --revision main --local-dir-use-symlinks False --local-dir /code/data/datasets/silk-road--alpaca-data-gpt4-chinese
5. 下载数据文件： huggingface-cli download tatsu-lab/alpaca --repo-type dataset --revision main --local-dir-use-symlinks False --local-dir /code/data/datasets/tatsu-lab_alpaca

step4: 修改模型文件路径和数据文件路径为本地路径

step5: 注释掉量化参数（平台暂时不支持量化训练需要将相关参数注释掉不启用）

step6: 启动微调

NPROC_PER_NODE=4 xtuner train /code/yi_6b_qlora_alpaca_enzh_e3_copy.py --deepspeed deepspeed_zero3

### step1: 创建notebook ![1.jpeg](https://cdn.nlark.com/yuque/0/2024/jpeg/44993204/1727688756481-3ed1969a-6e7f-482d-a06b-38c81932a4df.jpeg?x-oss-process=image%2Fresize%2Cw_1500%2Climit_0%2Finterlace%2C1) ### step2: 查找配置文件，复制配置文件 ``` xtuner list-cfg -p yi_6b_qlora_alpaca_enzh_e3 xtuner copy-cfg yi_6b_qlora_alpaca_enzh_e3 /code ``` ![1.jpeg](https://cdn.nlark.com/yuque/0/2024/jpeg/44993204/1727688014329-26cba3b5-5e9a-4471-9f8d-75020af30685.jpeg?x-oss-process=image%2Fresize%2Cw_1500%2Climit_0%2Finterlace%2C1) ### step3: 下载模型文件和数据下载 ``` 1. 打开yi_6b_qlora_alpaca_enzh_e3.py文件，查看需要的模型文件和数据文件名并下载。 2. # 在平台上设置网络代理才能连接到互联网 #只有在汇视威计算平台才可用 export http_proxy=http://10.10.9.50:3000 export https_proxy=http://10.10.9.50:3000 export no_proxy=localhost,127.0.0.1 #设置huggingface的cache目录在共享目录下 export HF_HOME=/code/huggingface-cache #设置huggingface访问站点为国内镜像站点 export HF_ENDPOINT=https://hf-mirror.com 3. 下载模型文件：huggingface-cli download 01-ai/Yi-6B --revision main --local-dir-use-symlinks False --local-dir /code/data/models/01-ai_Yi-6B 4. 下载数据文件：huggingface-cli download silk-road/alpaca-data-gpt4-chinese --repo-type dataset --revision main --local-dir-use-symlinks False --local-dir /code/data/datasets/silk-road--alpaca-data-gpt4-chinese 5. 下载数据文件： huggingface-cli download tatsu-lab/alpaca --repo-type dataset --revision main --local-dir-use-symlinks False --local-dir /code/data/datasets/tatsu-lab_alpaca ``` ![1.jpeg](https://cdn.nlark.com/yuque/0/2024/jpeg/44993204/1727688040921-6f76a0c6-2de3-4137-84c1-93f3faad9afc.jpeg?x-oss-process=image%2Fresize%2Cw_1500%2Climit_0%2Finterlace%2C1) ![1.jpeg](https://cdn.nlark.com/yuque/0/2024/jpeg/44993204/1727688057207-aefbfd71-8a7e-4b1e-9098-13006a147d00.jpeg?x-oss-process=image%2Fresize%2Cw_1500%2Climit_0%2Finterlace%2C1) ### step4: 修改模型文件路径和数据文件路径为本地路径 ![1.jpeg](https://cdn.nlark.com/yuque/0/2024/jpeg/44993204/1727688087662-4c02b472-1e91-4664-b7de-4a714568a6ec.jpeg?x-oss-process=image%2Fresize%2Cw_1500%2Climit_0%2Finterlace%2C1) ### step5: 注释掉量化参数（平台暂时不支持量化训练需要将相关参数注释掉不启用） ![1.jpeg](https://cdn.nlark.com/yuque/0/2024/jpeg/44993204/1727688105928-7b2ff6be-4e5d-4c3d-993f-e2ecd4af6d98.jpeg?x-oss-process=image%2Fresize%2Cw_1500%2Climit_0%2Finterlace%2C1) ### step6: 启动微调 `NPROC_PER_NODE=4 xtuner train /code/yi_6b_qlora_alpaca_enzh_e3_copy.py --deepspeed deepspeed_zero3` ![1.jpeg](https://cdn.nlark.com/yuque/0/2024/jpeg/44993204/1727688128902-8b0480f4-0e18-463c-8bcb-f712e4d630ec.jpeg?x-oss-process=image%2Fresize%2Cw_1500%2Climit_0%2Finterlace%2C1) ![1.jpeg](https://cdn.nlark.com/yuque/0/2024/jpeg/44993204/1727688152164-c33b02f9-149a-4bfe-a2ae-81b7341aa4c7.jpeg?x-oss-process=image%2Fresize%2Cw_1500%2Climit_0%2Finterlace%2C1)

Sign in to join this conversation.