21547230244cs
  • Joined on 2024-09-02
21547230244cs commented on issue HswOAuth/llm_course#273 2024-10-23 18:49:26 +08:00
【求助帖】2024-10-20 基于LLaMA-Factory的模型微调训练过程中报错,查看控制台日志发现有一处有问题

能否方便录屏呢?这样方便排查问题。

或者跟进HswOAuth/llm_course#261 的帖子,这位同学已录屏。

21547230244cs commented on issue HswOAuth/llm_course#261 2024-10-23 18:44:37 +08:00
微调时,没有曲线,检查点选中后,大模型开始胡言乱语

在视频中看到有将数据路径从data改成了LLaMAFactory/data,可以保持原来的data,试试这样行不行

image

21547230244cs commented on issue HswOAuth/llm_course#215 2024-10-23 17:06:52 +08:00
求助贴

请用这个命令查看一下是否存在sql_datasets这个数据集:ls /root/.cache/huggingface/datasets/sql_datasets

然后确保训练的文件中的数据集(sql_datasets)的路径是…

21547230244cs commented on issue HswOAuth/llm_course#273 2024-10-23 15:22:21 +08:00
【求助帖】2024-10-20 基于LLaMA-Factory的模型微调训练过程中报错,查看控制台日志发现有一处有问题

请问是在运行基座模型时出的问题还是在开始微调后出现的问题?

21547230244cs commented on issue HswOAuth/llm_course#271 2024-10-23 11:45:42 +08:00
nextchat无法连接

根据报错显示没有提供API KEY,这里的API Key可以随意填写(但是必须得填上)

image

21547230244cs commented on issue HswOAuth/llm_course#267 2024-10-22 17:31:12 +08:00
无法下载netchat安装包

点击这里的三个点,确保信任就行了

image

21547230244cs commented on issue HswOAuth/llm_course#256 2024-10-22 17:00:33 +08:00
不能执行sudo命令,也不能切换到root下

第一张图显示的是用户id密码输入错误,或者用户没有权限使用su命令切换到root用户。

第二张图代表着用户wangjunjun没有在sudoers文件中被授权使用sud…

21547230244cs commented on issue HswOAuth/llm_course#261 2024-10-22 16:28:24 +08:00
微调时,没有曲线,检查点选中后,大模型开始胡言乱语

可以提供更多信息嘛?比如模型名称等。

然后在加载模型前先确保已经卸载了之前的模型。

21547230244cs commented on issue HswOAuth/llm_course#236 2024-10-21 18:31:54 +08:00
没有ernie-speed-128k和ernie-speed-128k模型

首先,在OneAPI渠道里确认已选中这两个模型:ERINE-Speed-128K与ERINE-Speed-8K。

然后,名称这里可以填写baidu-wenxin。

再确认已填好密钥,并且测试AP…

21547230244cs commented on issue HswOAuth/llm_course#237 2024-10-21 18:13:05 +08:00
@ray 老师 10.18日课程私有化LLM仿OpenAI API接口的高可用工程实践,如何远程在汇视威A1平台部署安装LLM ? (不知如何进入平台的Linux的命令行终端)

由于此次实验是在本地部署,所以需要使用自己的Linux服务系统的机器(云平台仅用来训练、微调等,本地部署的实验需要用大家自己的机器)。

21547230244cs commented on issue HswOAuth/llm_course#248 2024-10-21 17:56:37 +08:00
【求助帖】2024/10/18 在autodl的实例无卡启动后安装docker环境失败

AutoDL已经内置了Docker,所以无法在Docker上再安装Docker。

此次的实验建议在本机上下载Git Bash,用Git Bash做。

21547230244cs commented on issue HswOAuth/llm_course#250 2024-10-21 17:51:20 +08:00
【求助帖】llama3,CPU版本启动服务时Killed

是的 最好的解决办法就是使用具有更多内存的硬件或云服务

21547230244cs commented on issue HswOAuth/llm_course#217 2024-10-18 17:56:11 +08:00
@ray老师,关于下载大模型源码的问题

这节课的实验环境应该在Git Bash上操作,不是在本机的终端进行操作。

在开启实验之前应该先下载好Git Bash以及Next Chat

这里是Git Bash…

21547230244cs commented on issue HswOAuth/llm_course#215 2024-10-18 17:44:58 +08:00
求助贴

从提供的截图来看,应该是找不到训练的数据sql_datasets

进入两个notebook后,请先确保都code路径下;如果没有在code路径下,请先cd code

<img…

21547230244cs commented on issue HswOAuth/llm_course#222 2024-10-18 17:27:56 +08:00
【求助帖】2024/10/16,Chinese LLaMA Alpaca系列模型 - 连接本地的nextchat到remote ssh服务器

在GitBash上

首先先确保自己在这个目录下:cd ~/Chinese-LLaMA-Alpaca-3-3.0/scripts/oai_api_demo/

然后再输入如下命令启动大模型: python openai_api_server.py…

21547230244cs commented on issue HswOAuth/llm_course#203 2024-10-17 14:55:39 +08:00
【求助贴】llm接口高可用工程实践 安装oneapi 的时候报错 (autodl 平台上 使用无卡模式), #11248284577cs

此实验最好在本机上下载GitHub,在GitHub上进行操作。

CPU启动不了可能是此任务对CPU的内存超过的这个配置。

从截图上看,安装oneapi报错的原…

21547230244cs commented on issue HswOAuth/llm_course#189 2024-10-14 11:32:59 +08:00
【求助帖】9月24日课程--基于LLaMA-Factory的模型微调训练

修改数据集只需要修改两个地方(my_demo.json以及dataset_info.json),并没有用到dataset.json这个文件。

  1. 修改my_demo.json文件 在JupyterNotebook里左边的文件目…
21547230244cs closed issue HswOAuth/llm_course#187 2024-10-12 11:53:23 +08:00
Function Call 训练管理操作以及视频
21547230244cs opened issue HswOAuth/llm_course#187 2024-10-12 11:53:13 +08:00
Function Call 训练管理操作以及视频
21547230244cs commented on issue HswOAuth/llm_course#172 2024-10-10 18:33:43 +08:00
【求助贴】11提示词工程实践-llama7b微调结果

这里应该是环境没有设置好,需要安装NCCL库。安装NCCL库的话在所有机器也就是notebook里输入: export NCCL_DEBUG=INFO export NCCL_IB_DISABLE=0 export NCCL_IB_HCA=ml…