【求助帖】vLLM作业遇到的问题 #214
Labels
No Label
bug
duplicate
enhancement
help wanted
invalid
question
wontfix
No Milestone
No project
No Assignees
2 Participants
Notifications
Due Date
No due date set.
Dependencies
No dependencies set.
Reference: HswOAuth/llm_course#214
Loading…
Reference in New Issue
Block a user
No description provided.
Delete Branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
查看vLLM支持的模型后,选择了vLLM支持的并且平台上已经下载好了的模型chatglm3-6b。
离线推理
使用单卡推理时把模型路径换成了chatglm3-6b的路径。执行执行python vllm_standalone.py没出现问题。
分布式推理
启动ray后,将vllm_distributed_ray.py文件中pretrained的模型改成了chatglm3-6b。启动 python vllm_distributed_ray.py 也没问题。
在线推理
单卡
输入以下命令报错
然后添加了
--trust-remote-code
后执行成功了多卡推理
多卡推理也是加了
--trust-remote-code
后执行成功了使用OpenAI python SDK调用vllm部署的模型
然后将vllm_openai_call.py文件中的模型改为chatglm3-6b,在执行该文件时显示404报错
建议在使用vllm的时候添加参数
--served-model-name
把模型名字改一下,因为模型名字里有特殊符号/,可能会有bug