PinnedPinnedPrivate
pub.towardsai.net

图解高级 RAG 技术

格罗宁根,马蒂尼托伦,在 Noorderplatsoen 的和平时期撰写文章的地方 对先进的检索增强生成技术和算法的全面研究,将各种方法系统化。检索增强生成(Retrieval Augmented Generation),又称 RAG,为 LLM 提供从某些数据源检索到的信息,作为生成答案的基础。chroma、weavaite.io 和 pinecone 等矢量数据库初创公司都建立在现有的开源搜索索引(主要是 faiss 和 nmslib)基础上,并在最近增加了输入文本的额外存储空间和其他一些工具。这个问题的目的是系统地介绍关键的高级 RAG 技术,并参考其实现方法(主要是 LlamaIndex 中的实现方法),以方便其他开发人员深入研究该技术。显然,尽管 OpenAI 是 LLM 供应商的市场领导者,但也有许多替代方案,例如 Anthropic 的 Claude、最近流行的较小但能力很强的模型 Mixtral form Mistral、微软的 Phi-2,以及许多开源方案,例如 Llama2、OpenLLaMA、Falcon,因此您可以为您的 RAG 管道选择大脑。