CN114245896A - 向量查询方法、装置、电子设备及存储介质 - Google Patents
向量查询方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114245896A CN114245896A CN201980099370.6A CN201980099370A CN114245896A CN 114245896 A CN114245896 A CN 114245896A CN 201980099370 A CN201980099370 A CN 201980099370A CN 114245896 A CN114245896 A CN 114245896A
- Authority
- CN
- China
- Prior art keywords
- vector
- sample
- query
- residual
- vectors
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种向量查询方法、装置、电子设备及存储介质,该安向量查询方法包括:获取查询向量;根据预先建立的第一索引,获取与查询向量的距离满足第一设定距离条件的第一聚类中心向量,作为目标向量;获取查询向量与目标向量之间的残差向量,作为查询残差向量;根据预先建立的第二索引,获取多个样本向量中每个样本向量对应的编码,第二索引包括采用乘积量化方法对每个样本向量对应的样本残差向量进行乘积量化获得的每个残差样本向量对应的编码;根据查询残差向量以及每个样本残差向量对应的编码,从多个样本向量中获取与查询向量的距离满足第二设定距离条件的样本向量,作为查询结果。本方法可以提升向量查询的速度。
Description
PCT国内申请,说明书已公开。
Claims (20)
- PCT国内申请,权利要求书已公开。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2019/114795 WO2021081913A1 (zh) | 2019-10-31 | 2019-10-31 | 向量查询方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114245896A true CN114245896A (zh) | 2022-03-25 |
Family
ID=75714814
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980099370.6A Pending CN114245896A (zh) | 2019-10-31 | 2019-10-31 | 向量查询方法、装置、电子设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN114245896A (zh) |
WO (1) | WO2021081913A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115169489A (zh) * | 2022-07-25 | 2022-10-11 | 北京百度网讯科技有限公司 | 数据检索方法、装置、设备以及存储介质 |
CN117194737A (zh) * | 2023-09-14 | 2023-12-08 | 上海交通大学 | 基于距离阈值的近似近邻搜索方法、***、介质及设备 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113626471B (zh) * | 2021-08-05 | 2024-02-23 | 北京达佳互联信息技术有限公司 | 数据检索方法、装置、电子设备及存储介质 |
CN114238329A (zh) * | 2021-12-15 | 2022-03-25 | 平安科技(深圳)有限公司 | 向量相似度计算方法、装置、设备及存储介质 |
CN116010669B (zh) * | 2023-01-18 | 2023-12-08 | 深存科技(无锡)有限公司 | 向量库重训练的触发方法、装置、检索服务器及存储介质 |
CN116541420B (zh) * | 2023-07-07 | 2023-09-15 | 上海爱可生信息技术股份有限公司 | 向量数据的查询方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10719509B2 (en) * | 2016-10-11 | 2020-07-21 | Google Llc | Hierarchical quantization for fast inner product search |
US11301509B2 (en) * | 2017-01-20 | 2022-04-12 | Rakuten Group, Inc. | Image search system, image search method, and program |
CN110134804B (zh) * | 2019-05-20 | 2021-09-17 | 北京达佳互联信息技术有限公司 | 图像检索方法、装置及存储介质 |
-
2019
- 2019-10-31 WO PCT/CN2019/114795 patent/WO2021081913A1/zh active Application Filing
- 2019-10-31 CN CN201980099370.6A patent/CN114245896A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115169489A (zh) * | 2022-07-25 | 2022-10-11 | 北京百度网讯科技有限公司 | 数据检索方法、装置、设备以及存储介质 |
CN117194737A (zh) * | 2023-09-14 | 2023-12-08 | 上海交通大学 | 基于距离阈值的近似近邻搜索方法、***、介质及设备 |
CN117194737B (zh) * | 2023-09-14 | 2024-06-07 | 上海交通大学 | 基于距离阈值的近似近邻搜索方法、***、介质及设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2021081913A1 (zh) | 2021-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114245896A (zh) | 向量查询方法、装置、电子设备及存储介质 | |
KR101515660B1 (ko) | 두 번의 패스를 통한 텍스트 스트링의 해시 추출 | |
CN110119745B (zh) | 深度学习模型的压缩方法、装置、计算机设备及存储介质 | |
CN109697451B (zh) | 相似图像聚类方法及装置、存储介质、电子设备 | |
US20100088342A1 (en) | Incremental feature indexing for scalable location recognition | |
CN109948735B (zh) | 一种多标签分类方法、***、装置及存储介质 | |
CN110825894A (zh) | 数据索引建立、数据检索方法、装置、设备和存储介质 | |
CN113255370A (zh) | 基于语义相似度的行业类型推荐方法、装置、设备及介质 | |
WO2023019933A1 (zh) | 构建检索数据库的方法、装置、设备以及存储介质 | |
CN109993216B (zh) | 一种基于k最近邻knn的文本分类方法及其设备 | |
US11874866B2 (en) | Multiscale quantization for fast similarity search | |
CN112347246B (zh) | 一种基于谱分解的自适应文档聚类方法及*** | |
CN111985228A (zh) | 文本关键词提取方法、装置、计算机设备和存储介质 | |
CN112612887A (zh) | 日志处理方法、装置、设备和存储介质 | |
CN112036476A (zh) | 基于二分类业务的数据特征选择方法、装置及计算机设备 | |
CN115795000A (zh) | 基于联合相似度算法对比的围标识别方法和装置 | |
US7705754B2 (en) | Method and system for the compression of probability tables | |
CN115129949A (zh) | 向量范围检索的方法、装置、设备、介质及程序产品 | |
CN115455083A (zh) | 查重方法、装置、电子设备及计算机存储介质 | |
CN115269998A (zh) | 信息推荐方法、装置、电子设备及存储介质 | |
CN114528908A (zh) | 网络请求数据分类模型训练方法、分类方法及存储介质 | |
CN114266249A (zh) | 一种基于birch聚类的海量文本聚类方法 | |
CN112148902A (zh) | 数据处理方法、装置、服务器及存储介质 | |
US20230075932A1 (en) | Dynamic variable quantization of machine learning parameters | |
US11250339B2 (en) | Ensemble classification algorithms having subclass resolution |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |