语义搜索与 RAG
#2025/12/31 #ai
语义搜索 (semantic search)
- 其核心在于通过
语义理解而非简单的关键词匹配来实现精准检索。
幻觉 - 尽管模型能够流畅自信地输出答案,但其内容在
准确性和时效性方面仍存在不足。 - 这种现象被称为“
幻觉”,
RAG(检索增强生成) - 解决
幻觉的主要方法之一,便是构建能够实时检索相关信息并输入 LLM 的系统,从而生成有事实依据的答案。
目录
语义搜索与 RAG 技术全景
围绕如何优化语言模型在搜索领域的应用,学界已形成丰富的研究成果。当前主流技术可分为三大类:稠密检索(dense retrieval)、重排序(reranking)与 RAG。 更详细的参考 1. 语义搜索与RAG技术全景
语言模型驱动的语义搜索实践
更多详情参考 2. 语言模型驱动的语义搜索实践
8.3 RAG
小结
本章系统探讨了语言模型在搜索系统中的创新应用。
- 稠密检索 :
- 基于文本嵌入相似性的检索机制,通过将搜索查询向量化,匹配最相近的文档嵌入。
- 重排器 :
- 以
monoBERT为代表的系统,通过评估查询与候选文档的相关性分数实现结果排序优化。
- 以
- RAG :
- 在搜索流程末端部署生成式 LLM,基于检索所得文档生成附带引证的回答。