【求助帖】11提示词工程实践-llama7b模型微调报错 #157
Labels
No Label
bug
duplicate
enhancement
help wanted
invalid
question
wontfix
No Milestone
No project
No Assignees
4 Participants
Notifications
Due Date
No due date set.
Dependencies
No dependencies set.
Reference: HswOAuth/llm_course#157
Loading…
Reference in New Issue
Block a user
No description provided.
Delete Branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
如题,在根据教程在【03】步骤时报错
11\提示词工程实践-llama7b模型微调报错to 【求助帖】11提示词工程实践-llama7b模型微调报错对照视频进行第二次运行,报错
可以尝试把当前算法删除,重新复制算法创建一个新的算法试试
删除并重建算法:


如果能解决这个问题那么可能是之前在该算法中进行的一些操作导致环境或一些代码出现了修改。重新下一次这个算法再跑一次就能成功。
重新新建算法,在输入微调指令启动后是这个结果,跟课件里的不一致,是哪一步有问题嘛
这里应该是环境没有设置好,需要安装NCCL库。安装NCCL库的话在所有机器也就是notebook里输入:
export NCCL_DEBUG=INFO
export NCCL_IB_DISABLE=0
export NCCL_IB_HCA=mlx5
export NCCL_SOCKET_IFNAME=eth0
export NCCL_SOCKET_IFNAME=eth0
安装完毕后再尝试能否训练模型。