Block a user
【求助帖】想请假一下各位大佬 怎么解决 语音 spk模型在面对两个对话者场景 结束语是嗯 , 再见,拜拜这种短语句识别不准。 以及 在识别的过程中,如果中间对话穿插 嗯,好的 这种类型的短句,也并不会识别分开两个说话者 关于当前问题,有什么好的优化方向 或者 思路嘛?
老师您好,您的思路我尝试仍然发现存在问题,因为数据量相对较大,所以规则判断还是过于局限,并不能够达到目前的要求呢 目前有结合asr,spk,…
【求助帖】想请假一下各位大佬 怎么解决 语音 spk模型在面对两个对话者场景 结束语是嗯 , 再见,拜拜这种短语句识别不准。 以及 在识别的过程中,如果中间对话穿插 嗯,好的 这种类型的短句,也并不会识别分开两个说话者 关于当前问题,有什么好的优化方向 或者 思路嘛?
【求助帖】当前在做语音模型相关的项目,由于是对话音频,涉及到说话者身份识别客户和客服,但是当前spk或语音分离模型效果并不好,特别是短句,比如说你好,了解这种效果就很差,所以想提升一下效果,想请教一下有没有什么好的提升思路;比如说语音增强方式或者优化spk识别效果提升
【求助帖】当前在做语音模型相关的项目,由于是对话音频,涉及到说话者身份识别客户和客服,但是当前spk或语音分离模型效果并不好,特别是短句,比如说你好,了解这种效果就很差,所以想提升一下效果,想请教一下有没有什么好的提升思路;比如说语音增强方式或者优化spk识别效果提升
【求助帖】我目前对pdf里的文字以及图片进行处理 但是现在出现文字丢失 以及图片模糊识别不准的情况,想请教下 该如何优化才能准确识别呢,目前采用ocr,用paddle做的
嗯嗯 现在处理好了,但是如果是存储向量库的话,我是单分出一个集合来存储好一点,还是直接添加存储到我之前构建的metadate向量库中呢?想咨询…
【求助贴】目前搭建了一个 元数据RAG向量库,但是只对word纯文本做了转向量处理,现在想对表格内容做处理,要如何处理合适嘞,后续也会处理pdf数据,
目前是想到了 表格和图表我可以用多模态转为纯文本存储,ocr+多模态的方式,但是 想要一些更具体性的宝贵意见
【求助贴】目前搭建了一个 元数据RAG向量库,但是只对word纯文本做了转向量处理,现在想对表格内容做处理,要如何处理合适嘞,后续也会处理pdf数据,
【求助帖】现在公司大模型分为三个线路,当一个问题进来优先判断问题类型 看类型属于知识问答、agent能力调用或者数据查询;判断用户问题属于哪个类型,知识问答就是正常大模型问答,agent就是调用对应能力,数据查询就直接去表查询问题;现在我基于agent做了一下,单靠模型能力和提示词并不能达到当前准确率需求,请教下有没有什么好的优化思路可以高效率提高判断水平。
好的 数据的话就是 问题:山上信号不好怎么办 标签“知识问答” 帮我查询工单数据 标签“数据查询” …
【求助帖】现在公司大模型分为三个线路,当一个问题进来优先判断问题类型 看类型属于知识问答、agent能力调用或者数据查询;判断用户问题属于哪个类型,知识问答就是正常大模型问答,agent就是调用对应能力,数据查询就直接去表查询问题;现在我基于agent做了一下,单靠模型能力和提示词并不能达到当前准确率需求,请教下有没有什么好的优化思路可以高效率提高判断水平。
请问是用bert模型吗?比如bert-base-chinese 数据集构建 需要大概多少数据才能准确率达到九十以上呢?
【求助帖】现在公司大模型分为三个线路,当一个问题进来优先判断问题类型 看类型属于知识问答、agent能力调用或者数据查询;判断用户问题属于哪个类型,知识问答就是正常大模型问答,agent就是调用对应能力,数据查询就直接去表查询问题;现在我基于agent做了一下,单靠模型能力和提示词并不能达到当前准确率需求,请教下有没有什么好的优化思路可以高效率提高判断水平。
呃呃呃 其实用什么不重要,现在真正想实现的是 用户询问一个问题 可以知道这个问题对应哪个类型 然后对应去哪个类型找答案 类型一共分为正常…
【求助帖】现在公司大模型分为三个线路,当一个问题进来优先判断问题类型 看类型属于知识问答、agent能力调用或者数据查询;知识问答就是正常大模型问答,agent就是调用对应能力,数据查询就直接去表查询问题