对中文LLAMA3开源版本的GPU实现以及使用ChatGPTNextWeb工具进行测试 #80
Labels
No Label
bug
duplicate
enhancement
help wanted
invalid
question
wontfix
No Milestone
No project
No Assignees
1 Participants
Notifications
Due Date
No due date set.
Dependencies
No dependencies set.
Reference: HswOAuth/llm_course#80
Loading…
Reference in New Issue
Block a user
No description provided.
Delete Branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
前文:

https://hsw-git.huishiwei.cn/HswOAuth/llm_course/issues/79
4.用GPU启动开源版openai接口;
这里利用之前已经下载好的requirements.txt进行依赖的安装:
pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple
,随后利用CPU启动服务:
python openai_api_server.py --gpus 0 --base_model /home/llm_course/.cache/modelscope/hub/ChineseAlpacaGroup/llama-3-chinese-8b-instruct-v3
。在这张图中可以看到使用的接口,这里需要注意一下,后续需要使用此接口来设置ChatGPTNextWeb工具。
2024-09-13 13:28:36,749 - INFO - Uvicorn running on http://0.0.0.0:19327 (Press CTRL+C to quit)
5.使用ChatGPTNextWeb工具测试的接口。


其他的讲义上写的很清楚,接口的这个地方需要用前文提到的接口进行修改。
运行结果如下:
这里跑的时候可以去另开一个终端使用
nvidia-smi
来看CPU利用率,这里我没有等他跑完,可能因为CPU不太好跑得很慢,不过确定是有结果的。