TCVectorDB 向量数据库简介
简介
尽管目前大多数开源向量数据库来自海外,配置简单且性能优异,但由于网络原因,如果向量数据库部署在海外,而产品面向国内市场,网络延迟将是必须考虑的问题。因此,选择国内服务提供商的云向量数据库往往是最佳选择。
腾讯云向量数据库(TCVectorDB)是一款全托管的、自研的企业级分布式数据库服务,专用于存储、检索和分析多维向量数据。该数据库支持多种索引类型和相似度计算方法,能够处理千亿级向量规模,支持百万级 QPS 及毫秒级查询延迟。目前,经过认证的腾讯云账号可以免费使用 TCVectorDB 一个月。
相关文档
- 💡大模型中转API推荐
- ✨中转使用教程
- TCVectorDB 产品链接
- TCVectorDB 产品文档
- LangChain TCVectorDB 翻译文档
TCVectorDB 的设计理念与 Pinecone 十分接近,其中也包含类似的概念,如数据库、集合和记录:
- 数据库: 包括普通向量数据库和 AI 数据库。AI 数据库无需外部配置文本分割、Embedding、文档解析等功能,由腾讯云在底层实现。普通向量数据库需要外部程序处理数据,这种数据库功能更具可定制化。
- 集合: 集合是数据库的下一级单位,类似于传统数据库中的表。需要在集合中设置集合名称、分片数、索引等信息。
- 记录: 集合中的每一条数据就是记录。
TCVectorDB 默认只能在内网中使用,生产环境中也尽可能不将数据库暴露到外网。不过在开发中,需要配置并开启外网访问功能,并在项目中导入相应的环境变量以使用 API 秘钥。
TC_VECTOR_DB_URL=xxx
TC_VECTOR_DB_USERNAME=root
TC_VECTOR_DB_KEY=xxx
TC_VECTOR_DB_DATABASE=llmops
TC_VECTOR_DB_TIMEOUT=30
接下来,安装对应的 Python 包,使用以下命令:
# 示例命令(请根据实际需求调整)
pip install tcvectordb
接下来就可以像 Faiss
、Pinecone
一样正常使用即可,整体功能和 Pinecone
几乎一模一样,只是 filter
、namespace
等概念的操作有些许差异。