A800的推理速度竟然比不上RTX3090 #325

Open
opened 2024-10-29 19:01:10 +08:00 by xiaer · 0 comments

目前有在使用vLLM引擎做大模型并发测试,无论是在100、200、300并发测试,A800的推理时间都落后于RTX3090,这是为什么

目前有在使用vLLM引擎做大模型并发测试,无论是在100、200、300并发测试,A800的推理时间都落后于RTX3090,这是为什么
Sign in to join this conversation.
No Milestone
No project
No Assignees
1 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: HswOAuth/llm_course#325
No description provided.