各行各业布局大模型的劲头,牵动着底层 IT 链条一并发生变化,向量数据库就是其中一环。
36 氪获悉,在 7 月 4 日举行的腾讯云发布会上,腾讯正式对外发布了向量数据库产品 Tencent Cloud VectorDB。腾讯云表示,这一数据库是 AI 原生(AI Native)的向量数据库,能广泛应用于大模型的训练、推理和知识库补充等场景。
从应用场景看,过去的向量数据库常和推荐、反欺诈等关系紧密。而如今随着更新模型数据、帮助模型推理等需求的出现,向量数据库正体现出新价值。
(资料图片仅供参考)
在模型训练环节,腾讯云数据库副总经理罗云介绍,向量数据库可以用于大模型预训练数据的分类、去重和清洗环节。从效果上,罗云表示,向量数据库相比传统的数据准备方式可以实现 10 倍效率的提升。另在推理环节,如果将腾讯云的向量数据库作为外部知识库使用,则能将成本降低 2-4 个数量级。
需求在前,不少新兴向量数据库的面孔也随之出现。对比同业,腾讯云强调,自身的向量数据库在腾讯业务内长期打磨,不仅性能稳定,还具备 AI Native 特点。
具体来说,Tencent Cloud VectorDB 提供了接入层、计算层、存储层的 AI 化解决方案,使用户使用向量数据库的全过程都能应用到 AI 能力。罗云进一步介绍,Tencent Cloud VectorDB 可以在接入层使用自然语言查询,在计算层的算法和存储层的索引上同样叠加 AI 能力,不仅让交互更自然,计算结果、效率、成本也能一并得到优化。
罗云对 36 氪等机构表示,不久后向量数据库的比拼会按阶段体现在三个维度上:
首先在第一阶段:厂商需要把产品打磨成一个真正的向量数据库,提供向量存储、检索、扩容等功能。这一能力腾讯早已具备。
在第二阶段:单 QPS 的成本成为指标。对此罗云表示,腾讯云的向量数据库基于腾讯集团每日处理千亿次检索的向量引擎(OLAMA),经腾讯内部腾讯视频、QQ 浏览器、QQ 音乐等多个业务 " 检验 ",持续为各类业务需求调优性能,具备先发优势。
在第三阶段:数据库使用的便捷性成为关键点。罗云解释,当前客户使用向量数据库的流程较多,而腾讯可以通过 AI 的方式,整体打包这类能力,提升易用性。
罗云表示,第三阶段,也就是经 AI 加持的 " 易用性 " 能力是腾讯近期打磨的重点。从效果上,企业原先接入一个大模型需要花 1 个月左右时间,而现在使用叠加了 AI 能力的腾讯云向量数据库只需要 3 天。"AI 时代,向量数据库也可以受益于 AI。" 罗云总结。