hsw_jide

21970855250cs commented on issue HswOAuth/llm_course#395

2024-12-11 22:27:12 +08:00

xtuner微调llama模型，出现异常情况退出

还是报一样的错误吗？可以截图看下

21970855250cs commented on issue HswOAuth/llm_course#420

2024-12-11 22:22:16 +08:00

xtuner训练llama3.2_3B的脚本应该怎么改

看了下xtuner还没有支持llama3.2，最近社区貌似不是特别活跃了。可以试下其他工具，比如看到一个：https://github.com/pytorch/torchtune

21970855250cs commented on issue HswOAuth/llm_share#44

2024-11-26 23:06:58 +08:00

大模型04期Function Call实践-进阶版作业

可以尝试使用qwen模型做中文数据集的微调，此外，function call的微调可以适当提高context的长度，也就是参数max_length。 eval的数据不影响训练的。

21970855250cs commented on issue HswOAuth/llm_course#398

2024-11-26 22:56:35 +08:00

【求助】多机多卡模型调试

两台notebook应该设置同一个IP地址，就是ADDR这个变量应该一样。因为worker需要连接master，所以需要给定master的IP地址进行通信。可以将任意notebook作…

21970855250cs commented on issue HswOAuth/llm_course#395

2024-11-25 22:54:52 +08:00

xtuner微调llama模型，出现异常情况退出

问题1 应该是安装上有点问题，可以参考下这个mmdetection issue 问题2可以用du -h /root/autodl-tmp/ --max-depth=1看…

21970855250cs commented on issue HswOAuth/llm_course#394

2024-11-23 20:58:29 +08:00

求助贴---大模型04期Function Call实践作业问题

平台上/code目录在训练管理模式下不是共享目录导致的。 run.sh脚本里要改下HF_HOME的环境变量 export HF_HOME=/userhome/huggingface-cache/

21970855250cs commented on issue HswOAuth/llm_course#392

2024-11-23 20:13:25 +08:00

求助贴--大模型04期使用xtuner微调开源大模型

这里写的是如何下载数据和模型，教程了使用的是llama作为训练模版。想要使用baichuan模型请使用这个训练模板，命令是：`xtuner copy-cfg baichuan_7b_qlora…

21970855250cs commented on issue HswOAuth/llm_course#393

2024-11-23 20:06:16 +08:00

1009 ollama本地模型部署

对的，autoDL 上提供的是docker容器，可以用阿里云的虚拟机来测试

21970855250cs commented on issue HswOAuth/llm_course#392

2024-11-21 22:56:35 +08:00

求助贴--大模型04期使用xtuner微调开源大模型

看训练模版，应该是要使用alpaca数据集格式；如果想用百川模型，需要使用百川的训练模板可以使用这个模板：`xtuner copy-cfg baichuan_7b_qlora_oasst1_e3…

21970855250cs commented on issue HswOAuth/llm_course#389

2024-11-20 22:45:43 +08:00

求助帖--大模型04期Function Call实践作业

需要改成jsonl的格式，一行一个json是一条数据，类似这样

{"instruction_zh": "给出三个保持健康的小贴士。", "input_zh": "", "output_zh": "1. 饮食要均衡且…

21970855250cs commented on issue HswOAuth/llm_course#388

2024-11-20 22:36:08 +08:00

求助帖-创建xtuner模型训练报错，无法选择版本

是的，copy算法需要一定的时间，copy完了之后就可以看到版本了

21970855250cs commented on issue HswOAuth/llm_course#356

2024-11-11 23:29:00 +08:00

请问大模型针对大量的PDF文件分析处理有什么好的方法吗？

主要难点在于PDF信息抽取，可以使用PDF信息抽取工具，再输入到大模型进行总结比如MinerU工具：https://www.shlab.org.cn/news/5443982 https://github.com/opendatal…

21970855250cs commented on issue HswOAuth/llm_course#365

2024-11-11 23:20:40 +08:00

【求助帖】需求：当用户询问一个问题要得到答案。现在有三条路，一路是知识问答路，一路是数据查询路，一路是agent能力调用路，还有一路是问题匹配不出来的other路，通过什么方式能够实现问一个问题能精确判断是属于哪一路的问题类型来返回答案呢。我现在的项目背景是会有很大一批的各种数据进来，有没有高效的方式可以做到精确的判断问题类型来走不同的路，如果用户问题实在找不到对应的问题类型，也可以对用户问题进行改写，反正一定要返回一个路来给出答案。

提供一个思路，是否可以让大模型先对问题进行分类？提示词可以把问题的种类以及一些实际的分类示例给大模型，让大模型先做个分类，再让大模…

21970855250cs commented on issue HswOAuth/llm_course#331

2024-11-11 23:16:34 +08:00

基于图片的智能信息检索问答-gradio_gpt4o.py运行结果错误

这个看起来是用的nginx做的反向代理配置问题，当文件大小超过1M，会出现413 Request Entity Too Large 如果是自己部署的改下nginx参数，如果是买的服务，…

21970855250cs commented on issue HswOAuth/llm_course#351

2024-11-08 23:00:18 +08:00

超算平台网卡infiniband功能不可用

平台提供的ib是infiniband设备使用时可以照视频或者课件操作即可。 1 需要申请带ib字样的资源来创建notebook或者训练任务 2 进入notebook后可以使用ibst…

21970855250cs commented on issue HswOAuth/llm_course#346

2024-11-05 23:10:30 +08:00

【求助贴】fastgpt对接商业多模态模型API时接口异常？

可以的。 fastgpt 配置

    {
        "model": "glm-4v",
        "name": "glm-4v",
        "avatar": "/imgs/model/chatglm.svg",
        "maxContext": 1024,
        "maxResponse":…

21970855250cs commented on issue HswOAuth/llm_course#340

2024-11-05 00:20:42 +08:00

类似通义灵码的扩展，里面的自动补全功能是怎么实现的

不是特别清楚通义灵码的实现，找到一个开源项目可以参考看看， https://beginor.github.io/2024/07/12/ai-code-assistant-with-local-llm.html https://github.com/continuedev/c…

21970855250cs commented on issue HswOAuth/llm_course#339

2024-11-05 00:00:42 +08:00

关于归一化参数的设置

预先对整个数据集进行计算得到的，分别表示图片三个通道的均值和标准差

21970855250cs commented on issue HswOAuth/llm_course#345

2024-11-04 23:49:26 +08:00

【求助帖】关于调用qianwen2.5模型加速的问题

调用的是阿里的api，还是自己部署的模型？如果是阿里的线上模型，可能是网络模型；如果是自己部署的模型，硬件以及部署方式需要提供下看看

21970855250cs commented on issue HswOAuth/llm_course#338

2024-11-01 19:34:49 +08:00

【求助帖】Ollama 启动 Open web UI后找不到已下载好的模型

这个IP可能得确认下，是192.168.31.50吗