万点研究 09-26
VexDB向量数据库正式发布:让AI真正“看懂”你的数据
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

文 / 章程

编辑 / 陈默

来源 / 万点研究

AI 加速赋能千行百业,大语言模型正在迅速渗透并改变世界。

LLM 生态正以前所未有的速度改变着各行各业的发展格局。从金融服务到医疗健康,从制造业到教育培训,从零售电商到法律服务,AI 技术正在深度模拟传统业务流程,带来颠覆性的变革。

尽管大模型表现出强大的能力,但在纵向垂直领域的实际应用中却常常不理想。基于互联网大规模数据训练的通用大模型,虽然具备广泛的知识基础和强大的推理能力,但在面向特定行业和专业领域时,常常暴露出明显的局限性。根据最新的 HHEM 基准测试,即使是最主流的大模型,其幻觉率仍然高达 14.3%。" 胡编乱造 "、" 一问三不知 " 等幻觉问题深受用户诟病。

由于缺乏领域的深度专业知识,大模型在回答专业问题时可能生成合理但实际错误的信息,这在金融、医疗等对准确性要求极高的领域极为危险。性能不理想也是一个普遍问题。通用模型在处理特定行业术语、专业化需求时,往往无法达到预期效果,影响用户体验和业务应用价值。

在以 " 领域预训练(成本高、周期长)"、" 提示工程(提示设计领域专家知识要求高)" 等为代表的大模型适配领域场景应用的各类解决方案中,"RAG" 技术路线正成为市场主流选择。RAG(检索增强生成)将外部知识库与大模型结合,既保留了大模型的基础能力,又注入了领域专业知识,既发挥了大模型的强大理解和生成能力,又通过领域知识搜索解决了专业知识匮乏问题,从而减少幻觉、提高输出准确性与可靠性。

在 RAG 架构中,向量数据库发挥着至关重要的作用,它用于高效存储和检索非结构化数据(如文本、图像等)的向量化表示,而更为重要且不可忽视的一点是:这些数据往往是本地化、非公开或私有领域知识(如企业内部的文档、专业数据库等)。

当下,从开源、到商用、再到云厂商都推出了向量数据库,各家都在这个赛道上激烈竞争。尽管向量数据库在 RAG 中表现出巨大价值,但检索精度与效率平衡(精度不够、面对亿级数据查询响应缓慢等并存问题)、数据更新易出现不一致性、如何支持复杂查询等问题仍旧突出,加之国际科技脱钩对 " 自主可控、安全合规 " 的急迫需求,于国产向量数据库而言,市场更加期待迎来新的参与者和积极变化。

如此情形下,每个企业都在思考一个问题:如何让 AI 真正理解企业机构的数据和业务,如何高效、安全地驾驭大模型与私域数据?这成为当下智能化转型的核心业务需求。

作为 AI 基础设施的核心组件,如何基于向量数据库构建更高效、更紧密的 " 数据 + 大模型 " 协同方式,充分释放出企业领域数据的巨大潜能,以驱动业务实现高质量跃迁,正成为 AI 时代各行各业面临的核心关切。

9 月 25 日,源于清华大学研发团队的北京数智引航科技有限公司,重磅发布高性能向量数据库产品 VexDB。

VexDB 帮助企业一站式解决 AI 应用落地过程中的知识管理、语义检索、多模态分析等复杂场景需求,为企业构建高可信、低延迟的 AI 应用提供数据管理能力,重新定义 AI 时代的数据基座新范式。

据了解,VexDB 是一款融合关系数据、多路语义检索能力的向量数据库,具备大容量、高精度、高性能、高安全、高可用、实时性、易用性的特点,能够支持百亿千维向量数据毫秒级结果查询,召回准确度达 99% 以上。从创新性、可靠性层面观察,VexDB 数据代理系统 AgenticData 在国际权威的 DABstep Benchmark 和 Spider-2.0-Lite 的近期测试中获得了最高分。

向量数据库:AI 时代的数据基座

什么是向量数据库?向量数据库是专为高效存储、索引和查询海量向量数据而设计的数据库。它的核心价值在于解决了 " 从海量非结构化数据中快速进行语义搜索 " 的难题。它是一座桥梁,将人类能理解的语义世界与计算机能处理的数字世界高效地连接起来。用户将文字、图像、音频等非结构化数据转换成高维向量,这可以理解为给每段内容打上一个独特的 " 语义指纹 "。当你提出问题时,系统会将问题也转换成向量,然后在海量的向量空间中寻找最相似的 " 指纹 ",从而找到最为精准的答案。

在数据爆炸式增长、非结构化数据占主导、以及 AI 应用蓬勃发展的今天,向量数据库作为底层基础设施,是释放数据价值、构建智能应用(尤其是基于大模型的应用)的关键引擎和核心组件。没有它,很多 AI 应用将无法实现或体验会大打折扣。

VexDB 提供全面的向量计算能力,可高效支撑搜索业务与大模型业务场景。

那么,VexDB 都是如何做到的?

向标混合查询与多路召回:让 AI 更懂你的意图

当人们使用传统向量数据库进行向量检索时,如果要同时进行标量过滤(比如筛选特定时间段或特定类别的数据),性能往往会大幅下降。而 VexDB 创新性地提出了向量标量混合索引技术,能够根据不同的查询条件动态选择最优的执行路径。与业界流行产品相比,VexDB 在高并发向标混合查询上,展现出了 1.3 倍 -8 倍的吞吐性能优势。且 VexDB 使用自适应算法来决定是否可以提前终止检索,从而将检索速度提升了 40%。

另外,在实际应用中,用户的查询意图也往往是多维度的。

比如,搜索 " 最近一周关于货币政策的研究报告 ",这里既有时间维度(最近一周),又有主题维度(货币政策),还有文档类型维度(研究报告)。

传统的向量数据库往往只能处理单一维度的语义相似性,而 VexDB 创新性地实现了稠密向量、稀疏向量和全文检索的多路召回机制。多路召回是大模型检索增强业务提高端到端召回率的关键手段,VexDB 是业界少数能在稠密向量查询和全文检索查询任务上,同时达到性能最优的向量数据库产品之一。

这个技术听起来很复杂,但原理其实很好理解:第一支队伍(稠密向量)负责理解深层语义,比如 " 货币政策 " 和 " 财税政策 " 是相似的概念;第二支队伍(稀疏向量)负责精确匹配关键词,确保不遗漏重要的专业术语;第三支队伍(条件过滤)负责进行标量属性的过滤筛选,比如价格范围、商品类型等。三支队伍协同工作,最终汇总出最相关的结果。

通过多路召回技术,VexDB 让 AI 更懂你的意图。

VexDB 能够让检索召回率提高 30%,这意味着用户更容易找到真正需要的信息、获得的回答也会更加准确和全面。而且,这一切只需要一条 SQL 语句就能实现,大大降低了开发门槛。

百亿向量毫秒响应:高效支撑搜索、大模型业务场景

革新性的向标混合索引与多路召回技术,为用户带来高效精准的便捷应用场景,而这背后,更离不开 " 百亿数据毫秒级响应 " 的夯实基础。

为此,在解决方案上、VexDB 团队创新性地实现了 GraphIndex 向量图索引技术。该索引结合了 HNSW(分层导航小世界网络)的层次化管理优势和 DiskANN 的磁盘存储能力。这就像给仓库建立了一个多层的导航系统,最上层粗略区域划分,越往下、越精细。查询时,系统先在上层快速定位相关区域,然后逐层深入、最终精准找到目标。

同时,VexDB 应用量化压缩技术,单节点支持超过 10 亿条向量数据的检索,而通过分布式查询优化、增量数据重分布等技术,即可轻松扩展到百亿规模。

值得一提的是,在强一致上,VexDB 利用多版本并发控制算法进行事务管理,支持数据原地更新以及动态实时更新。保持数据新鲜度的同时,提高了高频更新场景下的性能、稳定性、以及存储空间利用率。也就是说,VexDB 在高性能的前提下,确保数据的强一致,实现 0 延迟的数据新鲜度。

在金融、医疗、交通、电信等事关社会民生基础的行业数据应用场景,安全性是绕不开的话题。对此,VexDB 团队在数据安全与合规方面下足功夫,让机构数据固若金汤!

真实场景的验证,AI 时代的纯国产向量优选

真金,需火炼;利器,在实战。 VexDB 的核心能力,在金融风控、智慧医疗、智慧交通、公共安全等关键领域深度实践,经历了严苛场景的打磨,并且得到良好的验证和应用。

比如,海量公安技侦数据的闪电入库与毫秒级精准检索;

医疗电子病历中多模态非结构化数据的智能解析与精准问答;

出行服务场景下,高并发个性化推荐的极致性能保障……

目前, VexDB 已在金融、通信、制造、医疗等行业扎根落地;与 301 医院、创业慧康、彩讯、MedGO、东方通、飞致云 Max KB 等十余家伙伴的深度合作。

在医疗领域,VexDB 助力中国人民解放军总医院(301 医院)搭建了一整套 RAG 应用 - " 康复理疗知识库。借助 VexDB 高效的向量检索能力,基于患者病情等信息,结合大模型生成贴合实际的理疗建议与设备推荐,有效降低大模型幻觉风险。

在发布会现场,301 医院提及 " 针对于训练伤康复,这套 AI 应用已经能给出精准的设备推荐和理疗建议;在实际应用举例中,对比大模型在搭载 VexDB 前后的回答效果,对于 " 肩袖损伤 " 这一病症的康复方案,VexDB 向量库和 AI 大模型结合,能够给出更加专业的理疗建议——有具体的用药剂量、有准确的知识溯源。相比之下,通用大模型的回答比较模糊,无法确认信息来源。"

在辅助诊断场景中,该方案可实现相似病例匹配、诊疗方案关联,进而完成方案推荐、风险预警与通俗说明,既提升医生工作效率,又保障医疗服务质量,减少漏诊、误诊情况发生。

由于医疗领域专业性强、AI 应用门槛高,而通用大模型,缺乏医院私域知识,容易产生 " 模型幻觉 ";其次,要训练一个本地化的模型,往往需要上传高敏感的医患数据,从更深层次的保护用户数据隐私,创业慧康联合数智引航 VexDB 共同打造了国产医疗大模型解决方案,将 VexDB 作为 BsoftGPT 的本地知识库,搭建了一整套完整的 RAG 应用,从模型输出的质量把控、数据安全的全流程防护,到算力成本的优化,系统性的消除了用户的顾虑。

VexDB 向量数据库通过 " 离线预存 + 热门缓存 " 机制减少了模型的调用,能大幅降低算力消耗;而本地知识库则实现了 " 私域数据不出院 ",从根源杜绝隐私泄露风险,打消了用户顾虑;还能及时更新数据,保证数据的时效性和结果质量。

现如今,这套端到端的 AI 应用已经覆盖智能导诊、电子病历生成、APTS、AI 管理决策 60% 的时间。

比如,这套联合方案已应用在某大型三甲医院的智能电子病历系统。这套应用具备病历对比、自动总结、智能分析、病历续写等功能。在病历生成场景上,这套系统在数秒之内就能生成一份完整的出院小结,医生只需进行少量修改、审核,就能签名确认,整个过程从原来的二十多分钟缩短到八分钟以内,节省了超过 60% 的时间。

在电信行业,VexDB 联合彩讯科技,打造企业级 AI 中枢彩讯 Rich AIBox,解决企业知识资产分散、数据价值释放难的痛点。在运营商领域,通过 VexDB 实现云盘跨模态秒级检索、营销精准推荐、售前方案高效生成;在展会行业,支撑全链路 AI 服务,大幅降低人工成本,推动企业知识管理与业务效能升级。

实际上,如何充分利用硬件资源是行业用户颇为关注的重点。为此,VexDB 针对不同的 CPU 架构进行了深度优化,适配了包括 x86、ARM 在内的多种处理器的 SIMD(单指令多数据)指令集,让同样的硬件能够发挥出 3 倍以上的性能。

通过并行优化技术,VexDB 能够将查询时延降低两倍以上。这种性能提升、对于需要实时响应的在线业务来说,直接关系到用户体验的好坏。

开发者友好:让 AI 应用开发变简单

对于开发者来说,VexDB 也提供了极其友好的使用体验。它支持标准的 SQL 语法,这意味着熟悉传统数据库的开发者几乎可以零学习成本上手。同时,它提供了多种语言 SDK,高度兼容 LangChain、LlamaIndex 等主流 AI 生态组件。

更贴心的是,VexDB 推出了免费的开发版,为期一年的使用期限内,开发者可以获得完整的向量检索能力、详细的技术文档和活跃的社区支持。这对于想要尝试向量数据库但预算有限的个人开发者和初创企业来说,无疑是个福音。

商业版则面向有更高要求的企业用户,提供更完整的关系型数据库特性、SLA 服务保障和专业技术支持。这种差异化的版本策略,让不同规模和需求的用户都能找到适合自己的选择。

未来展望:AI 基础设施的新基石

随着大模型技术的快速发展,向量数据库正在成为 AI 基础设施的核心组件。就像关系型数据库之于互联网时代,向量数据库将成为 AI 时代不可或缺的基础设施。

Gartner 预测,到 2026 年,超过 70% 的企业将在生产环境中部署向量数据库。这个巨大的市场机会吸引了众多玩家入场,竞争也日趋激烈。而市场更需要的,是真正理解用户需求、持续创新技术、提供完善服务的产品。VexDB 的推出,不仅代表着中国在向量数据库领域的创新探索,更重要的是为企业提供了一个高效且安全可靠的 AI 基础设施选择。VexDB 的发布,为这个快速发展的市场带来了新的选择和可能。

无论你是正在探索 AI 应用的企业决策者,还是致力于构建智能系统的开发者,亦或是对技术趋势保持关注的行业观察者,VexDB 都值得你深入了解。VexDB 正在用实际行动证明,中国企业能够在 AI 应用层面快速跟进、实现创新突破。

本文由万点原创,如需转载、商务合作请 +V

zzdmw5728(微信号)

往期精选

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 数据库 核心业务 用户体验 制造业
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论