【求助贴】11提示词工程实践-llama7b微调结果 #172

Open
opened 2024-10-10 10:43:07 +08:00 by wofociba · 3 comments

重新新建算法,在notebook输入微调指令启动后是这个结果,跟课件里的不一致,是哪一步有问题嘛

Originally posted by @wofociba in #157 (comment)

重新新建算法,在notebook输入微调指令启动后是这个结果,跟课件里的不一致,是哪一步有问题嘛 _Originally posted by @wofociba in https://hsw-git.huishiwei.cn/HswOAuth/llm_course/issues/157#issuecomment-126_

这里应该是环境没有设置好,需要安装NCCL库。安装NCCL库的话在所有机器也就是notebook里输入:
export NCCL_DEBUG=INFO
export NCCL_IB_DISABLE=0
export NCCL_IB_HCA=mlx5
export NCCL_SOCKET_IFNAME=eth0
export NCCL_SOCKET_IFNAME=eth0

安装完毕后再尝试能否训练模型。

这里应该是环境没有设置好,需要安装NCCL库。安装NCCL库的话在所有机器也就是notebook里输入: export NCCL_DEBUG=INFO export NCCL_IB_DISABLE=0 export NCCL_IB_HCA=mlx5 export NCCL_SOCKET_IFNAME=eth0 export NCCL_SOCKET_IFNAME=eth0 安装完毕后再尝试能否训练模型。

需要提供以下信息进行排查哈

  1. 运行的日志贴一下,两个notebook中的都要;
  2. 两个notebook中运行的命令也贴一下;
  3. 作为master的notebook ip通过ifconfig查询的结果发一下
需要提供以下信息进行排查哈 1. 运行的日志贴一下,两个notebook中的都要; 2. 两个notebook中运行的命令也贴一下; 3. 作为master的notebook ip通过ifconfig查询的结果发一下
Sign in to join this conversation.
No Milestone
No project
No Assignees
3 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: HswOAuth/llm_course#172
No description provided.