PinnedPinnedPrivate
pinecone.io

什么是矢量数据库?

矢量数据库是专门存储和检索向量嵌入的数据库,用来让 AI 系统按语义相似度查找信息。大语言模型、生成式应用和语义搜索会把文本、图片或其他内容转换成高维向量,这些向量包含概念、关系和上下文信息。传统数据库擅长精确匹配字符串、数字和字段,难以高效处理“意思相近”的查询;独立向量索引如 FAISS 能加速相似度搜索,却缺少完整的数据管理能力。矢量数据库把向量索引、原始内容引用、元数据过滤、插入更新、扩展、安全和备份放在一起。典型流程是先用嵌入模型把内容转成向量并写入数据库,查询时再把问题转成向量,寻找最接近的邻居,然后返回关联内容。底层常用近似最近邻搜索,通过随机投影、量化或图结构在速度和准确性之间取舍。它让 AI 获得可检索的长期记忆,而不必把所有知识塞进模型参数。