11 多模态案例实操 #27
Loading…
Reference in New Issue
Block a user
No description provided.
Delete Branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
BLIP和BLIP 2模型的使用
BLIP模型使用
创建实例
环境配置
克隆BLIP代码库
配置环境
检查pytorch是否可以调⽤GPU
下载模型
下载 bert-base-uncased模型
下载Image Captioning模型
上传成功。
下载VQA模型
上传成功。
执行任务
模型执行 Image Captioning 任务
这里我命名为Image_Captioning_Demo.ipynb。
模型执行VQA任务
BLIP2模型使用
创建实例
使用BLIP模型相同的实例。
环境配置
下载模型
使用hugging face镜像网站下载或者手动下载后上传
执行任务
在/root/autodl-tmp/BLIP2/下创建jupyter note文件。
执行image caption任务
执行image caption with prompt任务
执行VQA任务
用于视觉问答时,提示必须遵循特定格式: "Question: {} Answer:”
基于聊天的提示
MiniGPT-V2模型
创建实例
环境配置
下载模型
下载Llama-2-7b-chat-hf
使用魔塔api下载,或者本地下载后上传到/root/autodl-tmp/MiniGPT-4
下载MiniGPT-v2 (after stage-3)模型
下载后上传到/root/autodl-tmp/MiniGPT-4
MiniGPT-v2 (after stage-3)
修改 autodl-tmp/MiniGPT-4/minigpt4/configs/models/minigpt_v2.yaml的模型路径
修改 autodl-tmp/MiniGPT4/eval_configs/minigptv2_eval.yaml 的模型路径
模型部署
报错如下
按步骤解决
下载 https://cdn-media.huggingface.co/frpc-gradio-0.2/frpc_linux_amd64
重命名文件: frpc_linux_amd64_v0.2
移动文件: mv frpc_linux_amd64_v0.2 /root/miniconda3/envs/minigptv/lib/python3.9/site-
packages/gradio
DEMO启动
模型使用
进入Demo网页:
Video-LLaVA模型的介绍和使用
创建实例
配置和MiniGPT-4的实例配置一致。
配置环境
初始化conda init然后重启shell;
安装环境
倒数第二行卡死
pip install flash-attn --no-build-isolation卡死
最后一行报错
pip install decord opencv-python git+https://github.com/facebookresearch/py torchvideo.git@28fe037d212663c6a24f373b94cc5d478c8c1a1d报错
下载模型
修改 /root/autodl-tmp/Video-LLaVA/videollava/serve/gradio_web_server.py的模型路径
模型运行