【紧急求助帖】如何验证工作流处理之后数据的准确性? #682
Labels
No Label
bug
duplicate
enhancement
help wanted
invalid
question
wontfix
No Milestone
No project
No Assignees
2 Participants
Notifications
Due Date
No due date set.
Dependencies
No dependencies set.
Reference: HswOAuth/llm_course#682
Loading…
Reference in New Issue
Block a user
No description provided.
Delete Branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
背景:我创建了一个工作流去回答各种问题,但是这些问题的回答是通过工作流里面的知识库外加sql 或者 api查询之后,整理在一起回复的。目前经常使用的问题有100多个了,几乎每个都是需要使用不同的方式去查询的
问题:如何去批量测试问题答案的准确性呢?可以使用什么工具去批量测试呢?
可以参考:
建一个测试集文件(如Excel、CSV、JSON、数据库等),每条数据包含:问题文本、标准答案(或可接受的答案)、查询方式(是否SQL、是否API、是否只依赖知识库);可选:预期的SQL语句、API参数
工具:LangChain/TestChain、Postman + Newman、Python + pytest之类的