语义搜索与 RAG

#2025/12/31 #ai

语义搜索 (semantic search)

  • 其核心在于通过语义理解非简单的关键词匹配来实现精准检索。
    幻觉
  • 尽管模型能够流畅自信地输出答案,但其内容在准确性和时效性方面仍存在不足。
  • 这种现象被称为“幻觉”,
    RAG(检索增强生成)
  • 解决 幻觉 的主要方法之一,便是构建能够实时检索相关信息并输入 LLM 的系统,从而生成有事实依据的答案。

目录

语义搜索与 RAG 技术全景

围绕如何优化语言模型在搜索领域的应用,学界已形成丰富的研究成果。当前主流技术可分为三大类:稠密检索(dense retrieval)、重排序(reranking)与 RAG。 更详细的参考 1. 语义搜索与RAG技术全景

语言模型驱动的语义搜索实践

更多详情参考 2. 语言模型驱动的语义搜索实践

8.3 RAG

参考 3. RAG(检索增强生成)

小结

本章系统探讨了语言模型搜索系统中的创新应用。

  • 稠密检索
    • 基于文本嵌入相似性的检索机制,通过将搜索查询向量化,匹配最相近的文档嵌入。
  • 重排器
    • monoBERT 为代表的系统,通过评估查询与候选文档的相关性分数实现结果排序优化。
  • RAG
    • 在搜索流程末端部署生成式 LLM,基于检索所得文档生成附带引证的回答。