hsw_jide 21970855250cs
  • Joined on 2024-07-20
21970855250cs commented on issue HswOAuth/llm_course#395 2024-12-11 22:27:12 +08:00
xtuner微调llama模型,出现异常情况退出

还是报一样的错误吗?可以截图看下

21970855250cs commented on issue HswOAuth/llm_course#420 2024-12-11 22:22:16 +08:00
xtuner训练llama3.2_3B的脚本应该怎么改

看了下xtuner还没有支持llama3.2,最近社区貌似不是特别活跃了。 可以试下其他工具,比如看到一个:https://github.com/pytorch/torchtune

21970855250cs commented on issue HswOAuth/llm_share#44 2024-11-26 23:06:58 +08:00
大模型04期Function Call实践-进阶版作业

可以尝试使用qwen模型做中文数据集的微调,此外,function call的微调可以适当提高context的长度,也就是参数max_length。 eval的数据不影响训练的。

21970855250cs commented on issue HswOAuth/llm_course#398 2024-11-26 22:56:35 +08:00
【求助】多机多卡模型调试

两台notebook应该设置同一个IP地址,就是ADDR这个变量应该一样。 因为worker需要连接master,所以需要给定master的IP地址进行通信。 可以将任意notebook作…

21970855250cs commented on issue HswOAuth/llm_course#395 2024-11-25 22:54:52 +08:00
xtuner微调llama模型,出现异常情况退出

问题1 应该是安装上有点问题,可以参考下这个mmdetection issue 问题2可以用du -h /root/autodl-tmp/ --max-depth=1看…

21970855250cs commented on issue HswOAuth/llm_course#394 2024-11-23 20:58:29 +08:00
求助贴---大模型04期Function Call实践作业问题

平台上/code目录在训练管理模式下不是共享目录导致的。 run.sh脚本里要改下HF_HOME的环境变量 export HF_HOME=/userhome/huggingface-cache/

21970855250cs commented on issue HswOAuth/llm_course#392 2024-11-23 20:13:25 +08:00
求助贴--大模型04期使用xtuner微调开源大模型

这里写的是如何下载数据和模型,教程了使用的是llama作为训练模版。 想要使用baichuan模型请使用这个训练模板,命令是:`xtuner copy-cfg baichuan_7b_qlora…

21970855250cs commented on issue HswOAuth/llm_course#393 2024-11-23 20:06:16 +08:00
1009 ollama本地模型部署

对的,autoDL 上提供的是docker容器,可以用阿里云的虚拟机来测试

21970855250cs commented on issue HswOAuth/llm_course#392 2024-11-21 22:56:35 +08:00
求助贴--大模型04期使用xtuner微调开源大模型

看训练模版,应该是要使用alpaca数据集格式; 如果想用百川模型,需要使用百川的训练模板 可以使用这个模板:`xtuner copy-cfg baichuan_7b_qlora_oasst1_e3…

21970855250cs commented on issue HswOAuth/llm_course#389 2024-11-20 22:45:43 +08:00
求助帖--大模型04期Function Call实践作业

需要改成jsonl的格式,一行一个json是一条数据,类似这样

{"instruction_zh": "给出三个保持健康的小贴士。", "input_zh": "", "output_zh": "1. 饮食要均衡且…
21970855250cs commented on issue HswOAuth/llm_course#388 2024-11-20 22:36:08 +08:00
求助帖-创建xtuner模型训练报错,无法选择版本

是的,copy算法需要一定的时间,copy完了之后就可以看到版本了

21970855250cs commented on issue HswOAuth/llm_course#356 2024-11-11 23:29:00 +08:00
请问大模型针对大量的PDF文件分析处理有什么好的方法吗?

主要难点在于PDF信息抽取, 可以使用PDF信息抽取工具,再输入到大模型进行总结 比如MinerU工具:https://www.shlab.org.cn/news/5443982 https://github.com/opendatal

21970855250cs commented on issue HswOAuth/llm_course#331 2024-11-11 23:16:34 +08:00
基于图片的智能信息检索问答-gradio_gpt4o.py运行结果错误

这个看起来是用的nginx做的反向代理配置问题,当文件大小超过1M,会出现413 Request Entity Too Large 如果是自己部署的改下nginx参数,如果是买的服务,…

21970855250cs commented on issue HswOAuth/llm_course#351 2024-11-08 23:00:18 +08:00
超算平台网卡infiniband功能不可用

平台提供的ib是infiniband设备 使用时可以照视频或者课件操作即可。 1 需要申请带ib字样的资源来创建notebook或者训练任务 2 进入notebook后可以使用ibst…

21970855250cs commented on issue HswOAuth/llm_course#346 2024-11-05 23:10:30 +08:00
【求助贴】fastgpt对接商业多模态模型API时接口异常?

可以的。 fastgpt 配置

    {
        "model": "glm-4v",
        "name": "glm-4v",
        "avatar": "/imgs/model/chatglm.svg",
        "maxContext": 1024,
        "maxResponse":…
21970855250cs commented on issue HswOAuth/llm_course#339 2024-11-05 00:00:42 +08:00
关于归一化参数的设置

预先对整个数据集进行计算得到的,分别表示图片三个通道的均值和标准差

21970855250cs commented on issue HswOAuth/llm_course#345 2024-11-04 23:49:26 +08:00
【求助帖】关于调用qianwen2.5模型加速的问题

调用的是阿里的api,还是自己部署的模型? 如果是阿里的线上模型,可能是网络模型; 如果是自己部署的模型,硬件以及部署方式需要提供下看看

21970855250cs commented on issue HswOAuth/llm_course#338 2024-11-01 19:34:49 +08:00
【求助帖】Ollama 启动 Open web UI后找不到已下载好的模型

这个IP可能得确认下,是192.168.31.50