【求助帖】关于调用qianwen2.5模型加速的问题 #345

Open
opened 2024-11-04 14:49:11 +08:00 by guozhushu · 1 comment

最近尝试调用qianwen2.5 70B 模型的api,请求一次,响应结果为45秒,请问有什么办法进行加速处理呢?

最近尝试调用qianwen2.5 70B 模型的api,请求一次,响应结果为45秒,请问有什么办法进行加速处理呢?

调用的是阿里的api,还是自己部署的模型?
如果是阿里的线上模型,可能是网络模型;
如果是自己部署的模型,硬件以及部署方式需要提供下看看

调用的是阿里的api,还是自己部署的模型? 如果是阿里的线上模型,可能是网络模型; 如果是自己部署的模型,硬件以及部署方式需要提供下看看
Sign in to join this conversation.
No Milestone
No project
No Assignees
2 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: HswOAuth/llm_course#345
No description provided.