lx 12019701659cs
  • Joined on 2024-09-05
12019701659cs commented on issue HswOAuth/llm_course#608 2025-03-11 16:12:56 +08:00
多机多卡微调--day_27--20250307--大语言模型训练篇--提示词工程--多机多卡微调及fastgpt模型部署--林希老师

通信问题,多机多卡随着机器的数量,发生通信问题的概率越大,多重新启动几次就行。

12019701659cs commented on issue HswOAuth/llm_course#611 2025-03-11 15:49:16 +08:00
【求助帖】20250218,eepseek理论介绍(下)-林希老师

可以测试下相同的ip postman和oneapi的调用情况,或者用curl测试下

12019701659cs commented on issue HswOAuth/llm_course#606 2025-03-10 13:06:38 +08:00
26-25.3.4-大语言模型训练篇:多机多卡微调 - 林希老师-执行报错

试下这里的复制 cd /code/ NPROC_PER_NODE=1 xtuner train qwen1_5_0_5b_chat_full_alpaca_e3_copy.py --work-dir /userhome/xtuner-workdir1 --deepspeed deepspeed_zero3_offload

12019701659cs commented on issue HswOAuth/llm_course#605 2025-03-10 13:03:51 +08:00
求助帖:26-25.3.4-大语言模型训练篇:多机多卡微调 - 林希老师——训练过程疑惑

训练管理和模型调试里面各自发布的任务,是占用各自的显卡对么?对 那训练管理发布的训练任务,怎么查看他内存占用情况?可以在代码中执行命…

12019701659cs commented on issue HswOAuth/llm_course#603 2025-03-10 13:00:57 +08:00
【求助帖】如何实现更精准的知识库经验请教
  1. 实现业务文档的精准向量化 (1)语义分割和分块: 不要简单地使用固定大小的分块方法,而是对文档进行语义分割。将文档分解成有意义的单元,…
12019701659cs commented on issue HswOAuth/llm_course#596 2025-03-06 11:16:51 +08:00
求助帖:autodl算力服务器实例使用ssh隧道后,本地配置oneapi渠道后测试报错

image 你可以先测试下命令行的教程,映射到6006看看。

12019701659cs commented on issue HswOAuth/llm_course#598 2025-03-06 11:06:56 +08:00
MimicMotion 模型报错

一般是网络问题,不是无卡模式的问题

12019701659cs commented on issue HswOAuth/llm_course#597 2025-03-06 11:05:56 +08:00
求助帖:Windows11系统 wsl 无法启动Docker

可以参考:

  1. 重启 Docker 服务
  2. 检查 Docker Desktop 日志文件
  3. 检查 Windows 事件查看器 (Event Viewer)
  4. 彻底卸载并重新安装 Docker Desktop (确保清理残留…
12019701659cs commented on issue HswOAuth/llm_course#593 2025-03-06 11:00:27 +08:00
如何用大模型做一个工具,提取文本中的“地理信息”

可以将文本数据拆分成小数据,然后每个数据调用deepseek,加上prompt来提取。 参考prompt: 请从以下文本中提取地理信息,包括地名、方位、方向、…

12019701659cs commented on issue HswOAuth/llm_course#585 2025-03-01 14:56:16 +08:00
【求助帖】LLM->多模态理论+案例讲解--video-llava运行报错

我一般会先检查torch、cuda版本,然后检查transformers的版本,之后看下代码库的issue,一般很少改builder文件。

还有一个通用性问题,就是https://…

12019701659cs commented on issue HswOAuth/llm_course#585 2025-03-01 14:52:43 +08:00
【求助帖】LLM->多模态理论+案例讲解--video-llava运行报错

我一般会先检查torch、cuda版本,然后检查transformers的版本,之后看下代码库的issue,一般很少改builder文件。

AttributeError: 'LlamaConfig' object has no…

12019701659cs commented on issue HswOAuth/llm_course#585 2025-02-26 23:00:04 +08:00
【求助帖】LLM->多模态理论+案例讲解--video-llava运行报错

我一般会先检查torch、cuda版本,然后检查transformers的版本,之后看下代码库的issue,一般很少改builder文件。

12019701659cs commented on issue HswOAuth/llm_course#585 2025-02-26 16:43:58 +08:00
【求助帖】LLM->多模态理论+案例讲解--video-llava运行报错

我没遇到过,可以参考下: 变量 image_processor 在被使用之前没有被正确地赋值或初始化。 具体来说,在文件 /root/autodl-tmp/Video-LLAVA/videollava/serve/gradio…

12019701659cs commented on issue HswOAuth/llm_course#584 2025-02-25 19:23:49 +08:00
[求助帖】在平台上xtuner遇到报错

可能是你的数据集修改的代码和训练使用的数据集格式不一致,报错说数据集的例子里面没有"messages",可能你的数据集代码构造没有构造messages。

12019701659cs commented on issue HswOAuth/llm_course#583 2025-02-25 19:21:28 +08:00
【求助帖】22-25.2.18-deepseek理论介绍 modelscope部署DeepSeekV3路径和启动
  1. 如何查看modelscope下载是否已经完成?再执行一遍命令,如果不再下载就完成了。
  2. 可以参考huggingface加载模型的代码,将模型目录的地址修改为下…
12019701659cs commented on issue HswOAuth/llm_course#568 2025-02-21 15:04:42 +08:00
【求助帖】22-25.2.18-deepseek理论介绍-林希老师 AutoDL使用modelscope部署DeepSeekV3

系统盘不能更改配置,推荐保存到数据盘,先cd autodl-tmp,然后再下载模型,这样会保存到数据盘。