大语言模型训练篇:提示词工程【进阶版作业】 #45
Loading…
Reference in New Issue
Block a user
No description provided.
Delete Branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
模型调试
一、开发环境准备
准备算法
创建notebook
设置网络环境
准备数据集
下载数据
这个命令使用 Hugging Face 的
huggingface-cli
工具来下载一个名为b-mc2/sql-create-context
的数据集。以下是命令各部分的详细解释:huggingface-cli download
:这是调用huggingface-cli
工具的命令,用于下载模型、数据集或其他资源。b-mc2/sql-create-context
:这是要下载的数据集的名称。在 Hugging Face 上,数据集通常由用户名和数据集名组成,这里b-mc2
可能是用户名或组织名,而sql-create-context
是数据集的具体名称。--repo-type dataset
:这个参数指定要下载的资源类型是数据集(dataset)。--revision main
:这个参数指定要下载的版本或分支。在这里,main
通常指的是主分支或主版本。--local-dir-use-symlinks False
:这个参数设置为False
,意味着在本地目录中不会使用符号链接(symlinks)。如果设置为True
,则可能会在本地目录中创建指向数据集文件的符号链接,而不是复制文件。--local-dir /dataset/datasets/b-mc2___sql-create-context/
:这个参数指定了数据集下载到本地的目录路径。在这个例子中,数据集将被下载到/dataset/datasets/b-mc2___sql-create-context/
目录下。总结来说,这个命令的作用是从 Hugging Face 的数据集仓库中下载
b-mc2/sql-create-context
数据集的主版本到本地指定的目录/dataset/datasets/b-mc2___sql-create-context/
,并且在下载过程中不会使用符号链接。检查数据集及位置
准备模型
由于本次使用的是云平台上一下载好的模型,所以只需要打开训练文件llama2_7b_chat_qlora_sql_e3_copy.py(此文件位于code目录下),确认使用的模型及其路径。同时,也检查数据集的路径是否正确。
二、本地开源模型部署
使用FastChat部署codellama-7b-hf模型
终端一:
终端二:
终端三:
模型调用
根据数据修改prompt;然后打开新的终端,将其粘贴到终端里
终端四:
模型给出回答
三、微调训练
设置环境
获取master IP地址
用ifconfig查看主节点IP地址
启动训练
先转到code目录下
在第一台notebook中输入:
在第二台notebook中输入:
四、训练后测试
转换模型格式
测试
这里我测试了两条数据。
测试1:
修改测试文件
执行测试文件
测试2:
修改测试文件
执行测试文件
训练管理
一、开发环境准备
准备算法
准备notebook
设置环境
下载数据集
修改算法/训练文件
在code目录下打开llama2_7b_chat_qlora_sql_e3_copy.py文件
二、微调训练
在训练管理里创建新的训练任务:
输入以下命令,开启训练:
训练开始
训练完毕
三、训练后测试
查看模型保存位置
查看训练后模型被保存的位置
转换模型格式
从pth格式转到hf格式
测试1:
修改模型路径及提示词
执行测试文件
测试2 :
修改模型路径以及提示词
执行测试文件
大语言模型训练篇:提示词工程【进阶作业】to 大语言模型训练篇:提示词工程【进阶版作业】