有了向量数据库,我们还需要 SQL 关系型数据库吗?

最近直播超级多,预约保你有收获

今晚直播:高吞吐量实时场景向量数据库应用实战

 1

除了向量数据库外,是否还需要 SQL 关系型数据库?

最近经常被问到这问题“有了向量数据库,我们是否还需要 SQL 关系型数据库呢?”
如果用户除了向量数据查询以外,还有其他 SQL 数据查询(简称:标量数据),那么用户的业务流程可能是以下的情况:第一步:根据某种条件先过滤数据(标量查询);第二步:继续进行语义相似性搜索(向量查询)。比如:以下的业务需求场景。
  • 在电商行业,可能需要搜索某个尺寸的女鞋;
  • 在图像搜索时,可能希望搜索 2023年上映且电影评分高于 8.0 的电影的海报;
  • 在法律领域,可能需要从某个特定数据库中搜索相关的法律条款。
对此,我们的答案是:不需要
目前主流的向量数据库(比如:Milvus、Tencent Cloud VectorDB 等)既支持了向量数据查询,又支持了标量数据查询,就无需额外再维护一个关系型数据库,只要一个系统,用户便可实现“向量搜索+标量过滤”的混合查询,从而更精准的获取查询结果。
更详细的剖析,放在今晚直播进行,请同学们扫码一键免费全部预约观看!

 2

“向量搜索+标量过滤”的混合查询如何实现?

第一、开源 Milvus 向量数据库混合查询实现
Milvus 允许用户在进行向量搜索时依据标量数据进行条件过滤,数据属性可以是除向量以外的任何字段。Milvus 会对向量字段创建向量索引并进行向量相似性搜索,与此同时,还可以通过表达式对搜索结果进行元数据过滤。只需在搜索时输入过滤表达式,Milvus 就会帮你自动进行这两种操作。
第二、Tencent Cloud VectorDB 混合查询实现
腾讯云向量数据库(Tencent Cloud VectorDB)架构分为接入层、计算层、存储层,架构设计如下:
在接入层,支持自然语言文本的输入,同时采用“标量+向量”的查询方式,支持全内存索引,最高支持每秒百万的查询量(QPS);在计算层,AI Native 开发范式能实现全量数据AI计算,一站式解决企业在搭建私域知识库时的文本切分(segment)、向量化(embedding)等难题;在存储层,腾讯云向量数据库支持数据智能存储分布。
为了帮助每一个程序员掌握以上向量数据库等12项核心技能,我们准备了一系列免费直播干货,覆盖以上向量数据库大模型架构内核、Fine-tuning 微调、RAG、LangChain 开发框架、Agent 开发、部署治理等核心技术,扫码一键免费全部预约领取

END



请使用浏览器的分享功能分享到微信等