【求助粘】老师,一个非常复杂的Table,如何用RAG,langgraph,或者其它技术实现解析。 #755

Open
opened 2025-06-27 14:19:36 +08:00 by Stong · 2 comments

老师,一个非常复杂的Table,如何用RAG,langgraph,或者其它技术实现解析。

有什么好的建议?

老师,一个非常复杂的Table,如何用RAG,langgraph,或者其它技术实现解析。 有什么好的建议?
112 KiB
248 KiB

可以参考:

  1. Donut 或 Pix2Struct 处理结构 + 内容合并,输出 HTML 或 Markdown 表格。
  2. 将表格转为 Markdown 或 JSON,每一行转为自然语言句子。
  3. 将表格的行/列/块分段嵌入,存入向量数据库。
  4. 使用 LangGraph 调度,判断输入是表格结构查询,还是自由问答。
可以参考: 1. Donut 或 Pix2Struct 处理结构 + 内容合并,输出 HTML 或 Markdown 表格。 2. 将表格转为 Markdown 或 JSON,每一行转为自然语言句子。 3. 将表格的行/列/块分段嵌入,存入向量数据库。 4. 使用 LangGraph 调度,判断输入是表格结构查询,还是自由问答。
Author

可以参考:

  1. Donut 或 Pix2Struct 处理结构 + 内容合并,输出 HTML 或 Markdown 表格。
  2. 将表格转为 Markdown 或 JSON,每一行转为自然语言句子。
  3. 将表格的行/列/块分段嵌入,存入向量数据库。
  4. 使用 LangGraph 调度,判断输入是表格结构查询,还是自由问答。

有没有可以借鉴的Github 代码?

> 可以参考: > 1. Donut 或 Pix2Struct 处理结构 + 内容合并,输出 HTML 或 Markdown 表格。 > 2. 将表格转为 Markdown 或 JSON,每一行转为自然语言句子。 > 3. 将表格的行/列/块分段嵌入,存入向量数据库。 > 4. 使用 LangGraph 调度,判断输入是表格结构查询,还是自由问答。 有没有可以借鉴的Github 代码?
Sign in to join this conversation.
No Milestone
No project
No Assignees
2 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: HswOAuth/llm_course#755
No description provided.