Vearch 是一个云原生分布式向量数据库,用于在 AI 应用程序中对向量进行高效的相似性搜索。
-
混合检索: 向量搜索和标量过滤。
-
性能: 快速矢量检索 - 在几毫秒内搜索数百万个对象。
-
可扩展性和可靠性: 弹性扩展和高可用。
- 图片检索插件: Vearch 可用于构建完整的视觉搜索系统来索引数十亿张图像。 还需要用于对象检测和特征提取的图像检索插件。
通过仓库添加 charts
$ helm repo add vearch https://vearch.github.io/vearch-helm
$ helm repo update && helm install my-release vearch/vearch
本地添加 charts
$ git clone https://github.com/vearch/vearch-helm.git && cd vearch-helm
$ helm install my-release ./charts -f ./charts/values.yaml
通过 docker-compose 使用 vearch
单节点模式
$ cd cloud
$ cp ../config/config.toml .
$ docker-compose --profile standalone up -d
集群模式
$ cd cloud
$ cp ../config/config_cluster.toml .
$ docker-compose --profile cluster up -d
Docker 编译部署: 通过 vearch docker 镜像快速使用,请查看 docker 编译部署.
源码编译部署: 通过源码快速编译部署,请查看 源码编译部署.
Vearch 架构
Master: 负责模式管理、集群级元数据和资源协调。
Router: 提供 RESTful API:upsert
、delete
、search
和 query
; 请求路由和结果合并。
PartitionServer (PS): 使用基于 raft 的复制托管文档分区。 Gamma 是基于faiss实现的核心矢量搜索引擎,提供了存储、索引和检索向量和标量的能力。
在研究论文中使用 Vearch 时的引用参考:
@misc{li2019design,
title={The Design and Implementation of a Real Time Visual Search System on JD E-commerce Platform},
author={Jie Li and Haifeng Liu and Chuanghua Gui and Jianyu Chen and Zhenyun Ni and Ning Wang},
year={2019},
eprint={1908.07389},
archivePrefix={arXiv},
primaryClass={cs.IR}
}
可以在问题页面中报告错误或提出问题。
如需对 Vearch 进行公开讨论或提出问题,您还可以发送电子邮件至 [email protected]。
slack:https://vearchworkspace.slack.com
欢迎在此 issue #230 中登记公司名称
根据 Apache 许可证 2.0 版本授权。详细请参见 LICENSE and NOTICE.