【求助帖】如何系统性评估RAG的准确性 #766

Open
opened 2025-07-19 22:50:09 +08:00 by threestraw · 0 comments

目前有一个项目是给客户搭建RAG知识库,但是知识库的内容非常专业,一般技术人员无法理解大模型生成的准确性。知识涵盖大量的文档,专业知识,并且有文献类的知识,存在同一知识在不同文档里,但是可能说法也有不一样的地方。让业务人员去人工标注效率非常低。是否有系统性的评估工具或者方法,去评判大模型的准确性,以及系统性改善知识库的内容

目前有一个项目是给客户搭建RAG知识库,但是知识库的内容非常专业,一般技术人员无法理解大模型生成的准确性。知识涵盖大量的文档,专业知识,并且有文献类的知识,存在同一知识在不同文档里,但是可能说法也有不一样的地方。让业务人员去人工标注效率非常低。是否有系统性的评估工具或者方法,去评判大模型的准确性,以及系统性改善知识库的内容
Sign in to join this conversation.
No Milestone
No project
No Assignees
1 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: HswOAuth/llm_course#766
No description provided.