RAG-含有图片的文档读取 #371

Open
opened 2024-11-12 09:47:25 +08:00 by PeterWang · 2 comments

含有图片的PDF/Word/Excel应该怎么进行处理?

含有图片的PDF/Word/Excel应该怎么进行处理?
  1. 使用多模态嵌入模型来嵌入图像和文本以进行答案合成。
  2. 使用多模态LLM从图像生成文本摘要,然后嵌入和检索文本,将文本块传递给LLM以进行答案合成。
  3. 使用OCR技术提取成文本。
1. 使用多模态嵌入模型来嵌入图像和文本以进行答案合成。 2. 使用多模态LLM从图像生成文本摘要,然后嵌入和检索文本,将文本块传递给LLM以进行答案合成。 3. 使用OCR技术提取成文本。

或者只处理文本,去掉图片。

或者只处理文本,去掉图片。
Sign in to join this conversation.
No Milestone
No project
No Assignees
2 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: HswOAuth/llm_course#371
No description provided.