【笔记】RAG外挂知识库-上 #64

Open
opened 2024-09-12 01:48:52 +08:00 by 11704491662cs · 0 comments

大模型局限

  • 不实时
  • 没有私有领域知识
  • 幻觉

RAG好处

  • 成本低(省钱省事)
  • 信息实时(更灵活好用)
  • 来源可追溯(更可信,更易修复)
  • 信息检索可拆权限(千人千面)

RAG概念
检索增强生成,通过检索的方式增强大模型的生成能力

  • 检索:从知识库进行检索
  • 增强:将检索到的内容附加到上下文中,形成增强后的prompt
  • 生成:大模型接收prompt,生成内容

RAG流程
创建索引
  - 加载文档
  - 文档切片
  - 文档向量化
  - 存入向量数据库
进行检索
  - 读取用户问题
  - 问题向量化
  - 相似度检索
  - 检索结果与用户问题相结合
  - 借助到模型进行生成

向量检索
一些概念

  • 检索:分为关键字检索、语义检索,语义检索可以更好的匹配出符合用户的真实意图的内容
  • 向量:具有大小和方向的量(带箭头的线段)
  • 向量化:将文本转化为一组浮点数。这组数对应多维空间中的一个点,数组长度代表维度,不同的向量模型会转换出不同大小的维度
  • 语义相似度:向量之间的距离

相似度计算
https://www.shuxuele.com/sine-cosine-tangent.html
https://www.shuxuele.com/algebra/trig-sin-cos-tan-graphs.html

  • 欧氏距离:越小越相似(绝对距离)
  • 余弦距离:越大越相似(cosθ)
大模型局限 - 不实时 - 没有私有领域知识 - 幻觉 RAG好处 - 成本低(省钱省事) - 信息实时(更灵活好用) - 来源可追溯(更可信,更易修复) - 信息检索可拆权限(千人千面) RAG概念 检索增强生成,通过检索的方式增强大模型的生成能力 - 检索:从知识库进行检索 - 增强:将检索到的内容附加到上下文中,形成增强后的prompt - 生成:大模型接收prompt,生成内容 RAG流程 创建索引   - 加载文档   - 文档切片   - 文档向量化   - 存入向量数据库 进行检索   - 读取用户问题   - 问题向量化   - 相似度检索   - 检索结果与用户问题相结合   - 借助到模型进行生成 向量检索 一些概念 - 检索:分为关键字检索、语义检索,语义检索可以更好的匹配出符合用户的真实意图的内容 - 向量:具有大小和方向的量(带箭头的线段) - 向量化:将文本转化为一组浮点数。这组数对应多维空间中的一个点,数组长度代表维度,不同的向量模型会转换出不同大小的维度 - 语义相似度:向量之间的距离 相似度计算 https://www.shuxuele.com/sine-cosine-tangent.html https://www.shuxuele.com/algebra/trig-sin-cos-tan-graphs.html - 欧氏距离:越小越相似(绝对距离) - 余弦距离:越大越相似(cosθ)
Sign in to join this conversation.
No Milestone
No project
No Assignees
1 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: HswOAuth/llm_course#64
No description provided.