18234414483
  • Joined on 2024-11-20
18234414483 opened issue HswOAuth/llm_course#478 2025-01-16 18:02:29 +08:00
【求助帖】想请假一下各位大佬 怎么解决 语音 spk模型在面对两个对话者场景 结束语是嗯 , 再见,拜拜这种短语句识别不准。 以及 在识别的过程中,如果中间对话穿插 嗯,好的 这种类型的短句,也并不会识别分开两个说话者 关于当前问题,有什么好的优化方向 或者 思路嘛?
18234414483 closed issue HswOAuth/llm_course#473 2025-01-16 18:00:41 +08:00
【求助帖】当前在做语音模型相关的项目,由于是对话音频,涉及到说话者身份识别客户和客服,但是当前spk或语音分离模型效果并不好,特别是短句,比如说你好,了解这种效果就很差,所以想提升一下效果,想请教一下有没有什么好的提升思路;比如说语音增强方式或者优化spk识别效果提升
18234414483 opened issue HswOAuth/llm_course#473 2025-01-10 17:19:01 +08:00
【求助帖】当前在做语音模型相关的项目,由于是对话音频,涉及到说话者身份识别客户和客服,但是当前spk或语音分离模型效果并不好,特别是短句,比如说你好,了解这种效果就很差,所以想提升一下效果,想请教一下有没有什么好的提升思路;比如说语音增强方式或者优化spk识别效果提升
18234414483 commented on issue HswOAuth/llm_course#441 2024-12-24 10:23:08 +08:00
【求助帖】我目前对pdf里的文字以及图片进行处理 但是现在出现文字丢失 以及图片模糊识别不准的情况,想请教下 该如何优化才能准确识别呢,目前采用ocr,用paddle做的

嗯嗯 现在处理好了,但是如果是存储向量库的话,我是单分出一个集合来存储好一点,还是直接添加存储到我之前构建的metadate向量库中呢?想咨询…

18234414483 opened issue HswOAuth/llm_course#441 2024-12-23 11:42:19 +08:00
【求助帖】我目前对pdf
18234414483 commented on issue HswOAuth/llm_course#430 2024-12-20 10:52:28 +08:00
【求助贴】目前搭建了一个 元数据RAG向量库,但是只对word纯文本做了转向量处理,现在想对表格内容做处理,要如何处理合适嘞,后续也会处理pdf数据,

目前是想到了 表格和图表我可以用多模态转为纯文本存储,ocr+多模态的方式,但是 想要一些更具体性的宝贵意见

18234414483 opened issue HswOAuth/llm_course#430 2024-12-20 10:51:12 +08:00
【求助贴】目前搭建了一个 元数据RAG向量库,但是只对word纯文本做了转向量处理,现在想对表格内容做处理,要如何处理合适嘞,后续也会处理pdf数据,
18234414483 opened issue HswOAuth/llm_course#412 2024-12-04 15:54:43 +08:00
【求助帖】现在公司大模型分为三个线路,当一个问题进来优先判断问题类型 看类型属于知识问答、agent能力调用或者数据查询;知识问答就是正常大模型问答,agent就是调用对应能力,数据查询就直接去表查询问题
18234414483 opened issue HswOAuth/llm_course#387 2024-11-20 09:53:05 +08:00
【求助帖】11