在 RAG、语义搜索、推荐系统等 AI 应用中,如何快速、低成本地从海量向量(如文本嵌入)中找到最相似的几个?传统方案常受限于内存爆炸(千万条 float32 向量动辄消耗 30GB+ RAM)和查询延迟高。TurboVec 正是为此而生——它不是另一个 Faiss 封装,而是基于 Google 最新突破性量化算法 TurboQuant 实现的高性能向量索引,用 Rust 写就、Python 调用,真正做到了「边写入边检索、不训练、不调参、更小更快」。
核心功能
- 极致内存压缩:1000 万条 768 维 float32 向量,原需约 31 GB 内存,TurboVec 仅需 4 GB —— 压缩率超 7.5 倍,且无需牺牲精度
- 零训练、实时索引:无需预训练码本、无需离线建模阶段;新增向量即刻加入索引,支持动态增长的生产环境场景
- 硬件加速搜索:深度优化 NEON(ARM)与 AVX-512BW(x86)指令集,实测比 FAISS 的 IndexPQFastScan 快 12–20%(ARM)或持平/略优(x86)
- 搜索时灵活过滤:支持传入 ID 白名单或位掩码(bitmask),在 SIMD 计算层直接跳过无关向量,大幅提升条件检索效率
- 端到端 Python 友好:提供简洁易用的 Python API(pip install 即可),底层 Rust 引擎完全隐藏,开发者专注业务逻辑
- 学术与工程双背书:核心算法源自 Google Research 发表于 arXiv 的 TurboQuant 论文,理论逼近香农失真下界,工程落地经严格验证
适合哪些人用
如果你正在构建以下系统,TurboVec 值得立刻关注:
• 搭建轻量级 RAG 应用(如本地知识库、客服机器人),希望单机跑完千万级文档检索;
• 运维资源紧张的团队,想大幅降低向量服务的内存成本与 GPU 依赖;
• 需要高频更新向量库的场景(如实时新闻推荐、用户行为流 embedding);
• ARM 架构设备(如 Mac M 系列芯片、树莓派集群、边缘服务器)上的向量服务开发者;
• 对 FAISS / Annoy / HNSWLib 性能瓶颈感到困扰,又不愿深入 C++/Rust 底层调优的 Python 工程师。
快速上手
安装仅需一行命令:
pip install turbovec
三行代码完成索引构建与搜索:
from turbovec import TurboVec
index = TurboVec(dim=768) # 创建 768 维索引
index.add(vectors) # 添加 numpy.ndarray 或 torch.Tensor 向量数组
results = index.search(query_vector, k=5) # 返回 top-5 相似 ID 与距离
进阶用法(如 ID 过滤)也极简:index.search(query, k=10, allow_ids=[1, 5, 12, 99]) —— 搜索仅限指定 ID 的向量。
项目信息
A vector index built on TurboQuant, written in Rust with Python bindings
7.1k
今日 +1,533 stars today
Stars
694
Forks
Python
MIT
编程语言:Rust(核心) + Python(绑定)
GitHub Star 数:7114
开源协议:MIT
项目地址:https://github.com/RyanCodrai/turbovec
如果你厌倦了为向量搜索妥协性能、内存或开发效率,TurboVec 是目前中文社区最值得尝试的「开箱即用型」下一代向量引擎。



