【求助】多机多卡模型调试 #398

Closed
opened 2024-11-26 12:57:36 +08:00 by 11534018664cs · 3 comments

老师,一直卡在这里不往下运行了,这是什么问题

老师,一直卡在这里不往下运行了,这是什么问题
Author

显示TimeoutError: The client socket has timed out after 900s while trying to connect to (10.244.96.126, 22222).

显示TimeoutError: The client socket has timed out after 900s while trying to connect to (10.244.96.126, 22222).

两台notebook应该设置同一个IP地址,就是ADDR这个变量应该一样。
因为worker需要连接master,所以需要给定master的IP地址进行通信。
可以将任意notebook作为master

两台notebook应该设置同一个IP地址,就是ADDR这个变量应该一样。 因为worker需要连接master,所以需要给定master的IP地址进行通信。 可以将任意notebook作为master
Author

两台notebook设置成了同一个IP地址,但问题还是一样 @21970855250cs

两台notebook设置成了同一个IP地址,但问题还是一样 @21970855250cs
Sign in to join this conversation.
No Milestone
No project
No Assignees
2 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: HswOAuth/llm_course#398
No description provided.