【求助帖】10-27-提示词工程-多机多卡微调 作业二 #319

Closed
opened 2024-10-29 12:08:27 +08:00 by 21537776629cs · 5 comments

27号留下的第二个作业《使用中文数据微调code-llama》
如果用训练管理进行微调的话,是应该把数据集选择为我的数据,还是说依旧照着课上操作选择公共集,然后在train_configllama2_7b_chat_qlora_sql_e3_copy.py中修改data_path路径?

27号留下的第二个作业《使用中文数据微调code-llama》 如果用训练管理进行微调的话,是应该把数据集选择为我的数据,还是说依旧照着课上操作选择公共集,然后在train_configllama2_7b_chat_qlora_sql_e3_copy.py中修改data_path路径?

这个看你选择的数据集路径位于哪里。
data_path就是写你选择的数据集的路径,如果你选择的是公共数据集进行训练那么路径就选择公共数据集;如果你是使用的自己的数据,就看你把数据放在哪个路径下,然后在data_path中填写你数据集的路径就行。

这个看你选择的数据集路径位于哪里。 data_path就是写你选择的数据集的路径,如果你选择的是公共数据集进行训练那么路径就选择公共数据集;如果你是使用的自己的数据,就看你把数据放在哪个路径下,然后在data_path中填写你数据集的路径就行。
Author

这个看你选择的数据集路径位于哪里。
data_path就是写你选择的数据集的路径,如果你选择的是公共数据集进行训练那么路径就选择公共数据集;如果你是使用的自己的数据,就看你把数据放在哪个路径下,然后在data_path中填写你数据集的路径就行。

明白,我试试

> 这个看你选择的数据集路径位于哪里。 > data_path就是写你选择的数据集的路径,如果你选择的是公共数据集进行训练那么路径就选择公共数据集;如果你是使用的自己的数据,就看你把数据放在哪个路径下,然后在data_path中填写你数据集的路径就行。 明白,我试试
Author

@21547230244cs 老师我尝试了使用自己上传的数据集进行【训练任务】,但是报错了(错误日志在日志.txt中),之前您说要把data_path改成我上传的数据集路径,所以我自己在【模型调试】重新创建了一个NoteBook且选择了自己上传的数据集,但是我进入dataset目录发现并没有了CodeLlama-7b-hf,这样我即使改了data_path变量也没啥作用吧?那这要怎么用huggingface的数据集去微调呀

@21547230244cs 老师我尝试了使用自己上传的数据集进行【训练任务】,但是报错了(错误日志在日志.txt中),之前您说要把data_path改成我上传的数据集路径,所以我自己在【模型调试】重新创建了一个NoteBook且选择了自己上传的数据集,但是我进入dataset目录发现并没有了CodeLlama-7b-hf,这样我即使改了data_path变量也没啥作用吧?那这要怎么用huggingface的数据集去微调呀

这个codellama模型应该是被下载到huggingface公共数据集里的,所以如果要使用这个模型的话,在创建notebook时还是应该选择huggingface公共数据集。

打开notebook后,在终端里,你可以使用命令将你想使用的数据下载到某个路径下下。

然后打开你训练的文件,在文件里将数据替换成你刚下载好的数据集路径。

这个codellama模型应该是被下载到huggingface公共数据集里的,所以如果要使用这个模型的话,在创建notebook时还是应该选择huggingface公共数据集。 打开notebook后,在终端里,你可以使用命令将你想使用的数据下载到某个路径下下。 然后打开你训练的文件,在文件里将数据替换成你刚下载好的数据集路径。
Author

这个codellama模型应该是被下载到huggingface公共数据集里的,所以如果要使用这个模型的话,在创建notebook时还是应该选择huggingface公共数据集。

打开notebook后,在终端里,你可以使用命令将你想使用的数据下载到某个路径下下。

然后打开你训练的文件,在文件里将数据替换成你刚下载好的数据集路径。

了解,已通过模型调试实现作业二

> 这个codellama模型应该是被下载到huggingface公共数据集里的,所以如果要使用这个模型的话,在创建notebook时还是应该选择huggingface公共数据集。 > > 打开notebook后,在终端里,你可以使用命令将你想使用的数据下载到某个路径下下。 > > 然后打开你训练的文件,在文件里将数据替换成你刚下载好的数据集路径。 > > 了解,已通过模型调试实现作业二
Sign in to join this conversation.
No Milestone
No project
No Assignees
2 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: HswOAuth/llm_course#319
No description provided.