CN116108072A - 数据查询方法及查询预测模型训练方法 - Google Patents

数据查询方法及查询预测模型训练方法 Download PDF

Info

Publication number
CN116108072A
CN116108072A CN202310362295.6A CN202310362295A CN116108072A CN 116108072 A CN116108072 A CN 116108072A CN 202310362295 A CN202310362295 A CN 202310362295A CN 116108072 A CN116108072 A CN 116108072A
Authority
CN
China
Prior art keywords
query
vector
data
association
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310362295.6A
Other languages
English (en)
Other versions
CN116108072B (zh
Inventor
李鹏飞
朱鎔
丁博麟
魏文卿
周靖人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN202310362295.6A priority Critical patent/CN116108072B/zh
Publication of CN116108072A publication Critical patent/CN116108072A/zh
Application granted granted Critical
Publication of CN116108072B publication Critical patent/CN116108072B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书实施例提供数据查询方法及查询预测模型训练方法,其中数据查询方法包括:获取针对目标数据库的查询请求和关联向量集合,关联向量集合通过对各数据编码向量之间进行关联分析获得,关联向量集合中的关联向量表征至少两个数据编码向量之间的关联程度,各数据编码向量基于对目标数据库中的各数据进行编码获得;对查询请求进行编码,获得查询编码向量;对关联向量集合中的关联向量与查询编码向量之间进行关联分析,获得查询预测信息;基于查询预测信息在目标数据库中进行查询,获得查询请求对应的查询结果。通过对目标数据库中各数据和查询请求之间的关联关系进行分析,并提供查询结果,提高查询效率和查询的准确性。

Description

数据查询方法及查询预测模型训练方法
技术领域
本说明书实施例涉及计算机技术领域,特别涉及数据查询方法。
背景技术
在快速发展的各个领域中,都会涉及到数据查询,在现有的数据查询中,大多依赖于传统的基数估计方法。传统的基数估计方法通过设定数据库关系表中的每列数据之间的分布是相互独立的,来进行基数估计,这导致了基数估计的方法做出的估计准确性较低,进而使得查询优化器无法得到对应的查询计划,降低查询效率。
因此,如何提高数据查询的效率和准确性,是一个亟待解决的问题。
发明内容
有鉴于此,本说明书实施例提供了数据查询方法。本说明书一个或者多个实施例同时涉及数据查询装置,一种查询预测模型训练方法,一种查询预测模型训练装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种数据查询方法,包括:
获取针对目标数据库的查询请求和关联向量集合,其中,所述关联向量集合通过对各数据编码向量之间进行关联分析获得,所述关联向量集合中的关联向量表征至少两个数据编码向量之间的关联程度,所述各数据编码向量基于对所述目标数据库中的各数据进行编码获得;
对所述查询请求进行编码,获得查询编码向量;
对所述关联向量集合中的关联向量与所述查询编码向量之间进行关联分析,获得查询预测信息;
基于所述查询预测信息在所述目标数据库中进行查询,获得所述查询请求对应的查询结果。
根据本说明书实施例的第二方面,提供了一种数据查询装置,包括:
获取模块,被配置为获取针对目标数据库的查询请求和关联向量集合,其中,所述关联向量集合通过对各数据编码向量之间进行关联分析获得,所述关联向量集合中的关联向量表征至少两个数据编码向量之间的关联程度,所述各数据编码向量基于对所述目标数据库中的各数据进行编码获得;
编码模块,被配置为对所述查询请求进行编码,获得查询编码向量;
分析模块,被配置为对所述关联向量集合中的关联向量与所述查询编码向量之间进行关联分析,获得查询预测信息;
查询模块,被配置为基于所述查询预测信息在所述目标数据库中进行查询,获得所述查询请求对应的查询结果。
根据本说明书实施例的第三方面,提供了一种查询预测模型训练方法,应用于云侧设备,包括:
获取样本数据、样本查询请求,和所述样本查询请求对应的样本查询信息;
将所述样本数据和所述样本查询请求,输入至查询预测模型的数据预处理层,获得所述样本数据对应的样本数据编码向量和所述样本查询请求对应的样本查询编码向量;
将所述样本数据编码向量输入至所述查询预测模型的数据编码层,获得样本关联向量集合;
将所述样本查询编码向量和所述样本关联向量集合,输入至所述查询预测模型的查询解释层,获得预测查询信息;
根据所述样本查询信息和所述预测查询信息计算所述查询预测模型的损失值;
根据所述损失值调整所述查询预测模型的模型参数,并继续训练所述查询预测模型,直至达到训练停止条件;
将训练完成的查询预测模型参数反馈至目标终端。
根据本说明书实施例的第四方面,提供了一种查询预测模型训练装置,应用于云侧设备,包括:
样本获取模块,被配置为获取样本数据、样本查询请求,和所述样本查询请求对应的样本查询信息;
数据预处理模块,被配置为将所述样本数据和所述样本查询请求,输入至查询预测模型的数据预处理层,获得所述样本数据对应的样本数据编码向量和所述样本查询请求对应的样本查询编码向量;
数据编码模块,被配置为将所述样本数据编码向量输入至所述查询预测模型的数据编码层,获得样本关联向量集合;
查询解释模块,被配置为将所述样本查询编码向量和所述样本关联向量集合,输入至所述查询预测模型的查询解释层,获得预测查询信息;
损失计算模块,被配置为根据所述样本查询信息和所述预测查询信息计算所述查询预测模型的损失值;
参数调整模块,被配置为根据所述损失值调整所述查询预测模型的模型参数,并继续训练所述查询预测模型,直至达到训练停止条件;
参数反馈模块,被配置为将训练完成的查询预测模型参数反馈至目标终端。
根据本说明书实施例的第五方面,提供了一种商品数据查询方法,包括:
获取针对目标商品数据库的商品查询请求和关联向量集合,其中,所述关联向量集合通过对各商品数据编码向量之间进行关联分析获得,所述关联向量集合中的关联向量表征至少两个商品数据编码向量之间的关联程度,所述各商品数据编码向量基于对所述目标商品数据库中的各商品数据进行编码获得;
对所述商品查询请求进行编码,获得商品查询编码向量;
对所述关联向量集合中的关联向量与所述商品查询编码向量之间进行关联分析,获得商品查询预测信息;
基于所述商品查询预测信息在所述目标商品数据库中进行查询,获得所述商品查询请求对应的商品查询结果,并将所述商品查询结果反馈至目标终端。
根据本说明书实施例的第六方面,提供了一种商品数据查询装置,包括:
请求获取模块,被配置为获取针对目标商品数据库的商品查询请求和关联向量集合,其中,所述关联向量集合通过对各商品数据编码向量之间进行关联分析获得,所述关联向量集合中的关联向量表征至少两个商品数据编码向量之间的关联程度,所述各商品数据编码向量基于对所述目标商品数据库中的各商品数据进行编码获得;
请求编码模块,被配置为对所述商品查询请求进行编码,获得商品查询编码向量;
向量分析模块,被配置为对所述关联向量集合中的关联向量与所述商品查询编码向量之间进行关联分析,获得商品查询预测信息;
结果查询模块,被配置为基于所述商品查询预测信息在所述目标商品数据库中进行查询,获得所述商品查询请求对应的商品查询结果,并将所述商品查询结果反馈至目标终端。
根据本说明书实施例的第七方面,提供了一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述数据查询方法或查询预测模型训练方法的步骤。
根据本说明书实施例的第八方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述数据查询方法或查询预测模型训练方法的步骤。
根据本说明书实施例的第九方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述数据查询方法或查询预测模型训练方法的步骤。
本说明书提供的数据查询方法,包括:获取针对目标数据库的查询请求和关联向量集合,其中,所述关联向量集合通过对各数据编码向量之间进行关联分析获得,所述关联向量集合中的关联向量表征至少两个数据编码向量之间的关联程度,所述各数据编码向量基于对所述目标数据库中的各数据进行编码获得;对所述查询请求进行编码,获得查询编码向量;对所述关联向量集合中的关联向量与所述查询编码向量之间进行关联分析,获得查询预测信息;基于所述查询预测信息在所述目标数据库中进行查询,获得所述查询请求对应的查询结果。
本说明书一实施例,通过结合目标数据库中各数据和查询请求两部分数据进行查询,既实现了数据驱动,也实现了查询驱动。通过对目标数据库中各数据和查询请求之间的关联关系进行分析,并提供查询结果,提高查询效率和查询的准确性。
附图说明
图1是本说明书一个实施例提供的一种数据查询方法的应用场景示意图;
图2是本说明书一个实施例提供的一种数据查询方法的流程图;
图3是本说明书一个实施例提供的一种查询预测模型的结构示意图;
图4是本说明书一个实施例提供的一种数据查询方法的流程框架图;
图5是本说明书一个实施例提供的一种数据查询方法的处理过程流程图;
图6是本说明书一个实施例提供的一种数据查询装置的结构示意图;
图7是本说明书一个实施例提供的一种查询预测模型训练方法的流程图;
图8是本说明书一个实施例提供的一种查询预测模型训练装置的结构示意图;
图9是本说明书一个实施例提供的一种商品数据查询方法的流程图;
图10是本说明书一个实施例提供的一种商品数据查询装置的结构示意图;
图11是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
基数估计:Cardinality estimation,是查询优化器中的重要组成部分。
注意力机制:Attention mechanism,是一种常用的机器学习加权查询技术,该机制的输入由键-值对集合和查询集合两部分构成,其中,键-值对集合包括键集合和值集合。
自注意力机制:Self-attention mechanism,是一种特殊的注意力机制,作为其输入的键集合、值集合和查询集合中的数据是相同的。
在目前的数据库管理***中,一般通过查询优化器进行数据查询,对于数据库管理***来说,查询优化是关系到查询执行效率的重要部分之一。现关系数据库中的查询优化器一直依赖于传统但不高效的基数估计方法。
传统的基数估计方法在进行基数估计的过程中,对数据库中的数据会进行不合理的假设,比如设定数据库关系表中的每列数据之间的分布是相互独立的,但在实际应用中,关系表中的数据往往具有数据关联性,关系表与关系表之间也存在相关性,这样的假设导致了基数估计的方法做出的估计准确性较低,进而使得在数据库中不能进行准确的查询,为了保证查询的准确性,需要在数据库中进行反复查询,从而增长查询周期,降低查询效率。
在本说明书中,提供了数据查询方法,本说明书同时涉及数据查询装置,一种查询预测模型训练方法,一种查询预测模型训练装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
参见图1,图1示出了根据本说明书一个实施例提供的一种数据查询方法的应用场景示意图。如图1所示,以用户需要进行查询的数据信息为选课信息为例进行说明。用户可以在用户终端的显示页面上,选择想要查询的XX选课信息,用户终端基于此生成对应的查询请求。存储有XX选课信息的数据库,在获取XX选课信息的查询请求后,基于本说明书提供的数据查询方法,在数据库存储的各数据中进行查询,并将查询结果(XX选课信息)反馈至用户终端,用户即可获取XX选课信息。
参见图2,图2示出了根据本说明书一个实施例提供的一种数据查询方法的流程图,具体包括以下步骤。
步骤202:获取针对目标数据库的查询请求和关联向量集合。
本说明书提供的数据查询方法,可以应用于数据库,具体可以为关系数据库,例如,MySQL数据库、Oracle数据库等,也可以为非关系数据库,例如,MongoDB数据库等。也可以应用于查询终端,该查询终端可以是笔记本电脑、台式电脑、平板电脑、智能设备、服务器、云服务器、分布式服务器等。在本说明书提供的实施例中,对查询终端的具体形式不做限定。
相应地,目标数据库即为用于执行所述数据查询方法的数据库,查询请求是指,用于在目标数据库中进行数据查询的请求,查询请求可以为用于进行数据查询的查询语句。
例如,所述数据查询方法应用于数据库A,那么,需要进行获取的查询请求则为针对数据库A的查询请求,以实现对数据库A中的数据查询,针对数据库A生成的查询请求即为针对目标数据库的查询请求。
关联向量用于表征至少两个数据编码向量之间的关联程度,关联向量集合则是指由关联向量所构成的向量集合。关联向量集合通过对各数据编码向量之间进行关联分析获得,关联向量集合中的关联向量表征至少两个数据编码向量之间的关联程度,各数据编码向量基于对目标数据库中的各数据进行编码获得。数据编码向量是指,对存储于目标数据库中的数据分别进行编码后所获得的编码向量。
为了获取各数据编码向量之间的关联关系,可以通过神经网络进行编码实现,例如循环神经网络(RNN)、全连接神经网络(DNN)、自注意力机制(Self-attentionmechanism)等。在本说明书中,优选自注意力机制对各数据编码向量之间的关联关系进行分析,并进而获取关联向量集合。
优选的,在本说明书提供的一具体实施方式中,获取关联向量集合,包括:
对所述目标数据库中的各数据进行编码,获得所述各数据对应的数据编码向量;
将所述各数据编码向量进行拼接,获得数据编码向量矩阵;
将所述数据编码向量矩阵分别作为第一查询向量矩阵、第一键向量矩阵和第一值向量矩阵,通过自注意力计算,获得所述关联向量集合。
具体的,将各数据对应的数据编码向量进行拼接,获得数据编码向量矩阵,并将数据编码向量矩阵分别作为自注意力机制对应的第一查询向量矩阵、第一键向量矩阵和第一值向量矩阵,基于第一查询向量矩阵、第一键向量矩阵和第一值向量矩阵,进行自注意力计算,获得关联向量集合。
例如,对20个数据属性对应的存储数据进行编码,获得20个数据编码向量,且20个数据编码向量均是1*50维的直方图,则将这20个1*50维的直方图进行拼接,获得20*50维的直方图,即数据编码向量矩阵为20*50维的向量矩阵。将20*50维的向量矩阵同时作为第一查询向量矩阵、第一键向量矩阵和第一值向量矩阵,并进行自注意力计算,获得关联向量集合。
关联向量集合是对各数据编码向量之间的相关性的确定,其向量的数量与各数据编码向量的数量一致,但维度方面可能存在差异。以上述内容为例,20个数据编码向量为1*50维的直方图,那么,关联向量集合中包括20个关联向量,但20个关联向量的维度可以为50维、100维等维度。
本说明书提供的数据查询方法,引入自注意力机制,来确定各数据编码向量之间的关联程度,获取的各数据编码向量之间的关联程度的准确性更高。
具体的,在获取到针对目标数据库的查询请求后,对目标数据库中的各数据进行编码,以获得各数据对应的数据编码向量,进而使得根据编码后的各数据编码向量获取关联向量集合。
进一步的,在本说明书提供的一具体实施方式中,对所述目标数据库中的各数据进行编码,获得所述各数据对应的数据编码向量,包括:
获取所述各数据的数据属性;
基于所述数据属性,对所述数据属性对应的数据进行编码,获得所述数据编码向量。
其中,数据属性是指目标数据库中各数据的字段名称或字段标识,例如,在目标数据库中存储的关系表R1中,存储有字段名称“姓名”“学号”“课程”对应的数据,则字段名称“姓名”“学号”“课程”均为关系表R1的数据属性。数据属性也可以为字段标识,表示形式可以为“Ri.Aj”,其中,Ri用于表示关系表,Aj用于表示关系表Ri中数据属性,例如,“R1.A1”可以用于表示关系表R1中的“姓名”、“R1.A2”可以用于表示关系表R1中的“学号”、“R1.A3”可以用于表示关系表R1中的“课程”等;数据属性的字段标识的表示形式也可以为“Aj i”,其中,i表示关系表Ri,j表示关系表Ri中的第j个数据属性,例如,“A1 1”可以表示为关系表R1中的“姓名”、“A2 1”可以表示为关系表R1中的“学号”、“A3 1”可以表示为关系表R1中的“课程”等。需要说明的是,上述举例仅用于解释说明,数据属性与字段标识的对应关系,可以根据实际应用进行设定,并不局限于上述举例。
具体地,获取存储于目标数据库中的各数据的数据属性,并根据数据属性,对数据属性对应的存储数据进行编码,获得数据属性对应的存储数据的数据编码向量。
沿用上例,在关系表R1中,获取到的数据属性包括“姓名”、“学号”和“课程”,分别对“姓名”对应的存储数据、“学号”对应的存储数据和“课程”对应的存储数据进行编码,获得“姓名”、“学号”、“课程”对应的数据编码向量。由于不同的数据属性对应存储的数据不同,因此,不同数据属性编码获得的数据编码向量不同,例如,“姓名”对应的存储数据的数据编码向量可以为1*50维的直方图,“学号”对应的存储数据的数据编码向量可以为1*100维的直方图,“课程”对应的存储数据的数据编码向量可以为1*50维的直方图。
需要说明的是,基于实际应用的存储情况不同,对不同数据属性对应的存储数据进行编码后,所获得的数据编码向量的维度不同,具体根据实际的存储情况进行确定,本说明书在此不做任何限定。
本说明书提供的数据查询方法,在获取到针对目标数据库的查询请求后,可以进一步获取针对目标数据库的关联向量集合,以使得后续可以在关联向量集合的基础上,进一步对关联向量集合中的关联向量进行分析,提高获取查询结果的准确性。
步骤204:对所述查询请求进行编码,获得查询编码向量。
查询编码向量是指,对查询请求进行编码后所获得的编码向量。具体的,对获取到的查询请求进行编码,以获得查询请求对应的查询编码向量。
进一步的,在本说明书提供的一具体实施方式中,对所述查询请求进行编码,获得查询编码向量,包括:
对所述查询请求进行字段识别,确定待编码信息;
对所述待编码信息进行编码,获得查询编码向量。
其中,待编码信息是指,根据查询请求确定的,需要进行编码的数据信息。
具体的,对查询请求中的字段进行识别,并根据查询请求中的字段确定需要进行编码的数据信息,进而,对需要进行编码的数据信息进行编码,获得查询请求对应的查询编码向量。
更进一步的,待编码信息可以包括查询字段,以及目标关系表之间的连接信息,目标关系表与所述查询字段对应。
查询字段是指,查询请求中具有或起到查询作用的字段。例如,对查询语句S进行字段识别,在查询语句S中,识别到的字段包括“身高”、“大于”、“小于”、“160cm”、“190cm”,查询字段可以为“身高”、“160cm”、“190cm”。
目标关系表是指,与查询字段对应的关系表,目标关系表基于查询字段确定。以查询字段为“学生”和“教师”为例进行说明,若在查询请求中包括“学生”和“教师”字段,则目标关系表为包含有“学生”数据属性的关系表和包含有“教师”数据属性的关系表。
目标关系表之间的连接信息,具体是指目标关系表之间的连接关系信息,沿用上例,目标关系表为包含有“学生”数据属性的关系表和包含有“教师”数据属性的关系表,则目标关系表之间的连接信息则为包含有“学生”数据属性的关系表和包含有“教师”数据属性的关系表之间的连接关系信息。需要说明的是,目标关系表之间的连接信息,不包括目标关系表中所存储的数据信息。确定待编码信息的实现方式具体如下:
在本说明书提供的一具体实施方式中,对所述查询请求进行字段识别,确定待编码信息,包括:
对所述查询请求中的查询字段进行识别;
基于所述查询字段,确定至少两个目标关系表;
确定所述至少两个目标关系表之间的连接信息。
具体的,对查询请求中的查询字段进行识别,并根据识别到的查询字段,在目标数据库中确定与查询字段对应的目标关系表,进一步确定目标关系表之间的连接信息。
仍以查询字段为“学生”和“教师”为例进行说明。对获取到的查询请求进行字段识别,确定查询字段为“学生”和“教师”,基于查询字段为“学生”和“教师”,在目标数据库中,确定包含有“学生”数据属性的关系表(下述简称“学生表”)和包含有“教师”数据属性的关系表(下述简称“教师表”),并确定“学生表”和“教师表”之间连接关系信息。具体可以为“学生表”与“教师表”之间是多对多的连接关系,例如,“学生表”中的学生都是“教师表”中主键为1的老师的学生,表明了一个老师有多个学生,而“学生表”中主键为2的学生还有一个老师,表明了一个学生可以有多个老师。如此,“学生表”与“教师表”之间建立了多对多的连接关系。除此之外,“学生表”与“教师表”之间还可以是一对多的连接关系,确定“学生表”与“教师表”之间是一对多的连接关系的过程,可以参考上述多对多的连接关系的过程,本说明书在此不再赘述。
基于此,对待编码信息进行编码,即为对查询字段进行编码,以及对目标关系表之间的连接信息进行编码,并根据编码后的信息确定查询编码向量。
在本说明书提供的一具体实施方式中,对所述待编码信息进行编码,获得查询编码向量,包括:
对所述查询字段进行编码,获得所述查询字段对应的查询字段编码向量;
对所述连接信息进行编码,获得所述连接信息对应的连接信息编码向量;
将所述查询字段编码向量和所述连接信息编码向量进行拼接,获得所述查询编码向量。
其中,查询字段编码向量,具体是指对查询字段进行编码后所获得的编码向量,连接信息编码向量,具体是指对目标关系表之间的连接信息进行编码后所获得的编码向量。
具体的,对查询字段进行编码,获得查询字段对应的查询字段编码向量,对目标关系表之间的连接信息进行编码,获得连接信息对应的连接信息编码向量,进而,将查询字段编码向量和连接信息编码向量进行拼接,即可获得查询请求对应的查询编码向量。
例如,编码后获得的查询字段编码向量为x维编码向量,连接信息编码向量为y维编码向量,则拼接获得的查询编码向量则为x+y维的编码向量。
本说明书提供的数据查询方法,分别对目标数据库中的各数据和查询请求进行编码,并获得对应的数据编码向量和查询编码向量,在进行关联分析前,进行数据预处理,有利于提高后续进行关联分析的效率和准确性。
步骤206:对所述关联向量集合中的关联向量与所述查询编码向量之间进行关联分析,获得查询预测信息。
其中,查询预测信息,可以理解为用于确定查询请求对应的查询结果的查询预测值。
与上述对各数据编码向量之间进行关联分析类似,对关联向量与查询编码向量之间进行关联分析,同样可以基于循环神经网络、全连接神经网络等神经网络模型实现,除此之外,还可以基于注意力机制(Attention mechanism)进行实现,在本说明书中,优选注意力机制进行实现。
在本说明书提供的一具体实施方式中,对所述关联向量集合中的关联向量与所述查询编码向量之间进行关联分析,获得查询预测信息,包括:
将所述关联向量集合中的关联向量进行拼接,获得关联向量矩阵;
将所述查询编码向量作为第二查询向量矩阵、所述关联向量矩阵作为第二键向量矩阵和第二值向量矩阵,通过注意力计算,获得所述查询预测信息。
具体的,将关联向量集合中的关联向量进行拼接,获得关联向量矩阵,并将关联向量矩阵分别作为注意力机制对应的第二查询向量矩阵、第二键向量矩阵和第二值向量矩阵,基于第二查询向量矩阵、第二键向量矩阵和第二值向量矩阵,进行注意力计算,获得查询预测信息。
进一步的,在本说明书提供的一具体实施方式中,将所述查询编码向量作为第二查询向量矩阵,将所述关联向量矩阵作为第二键向量矩阵和第二值向量矩阵,通过注意力计算,获得所述查询预测信息,包括:
基于所述第二查询向量矩阵、所述第二键向量矩阵和所述第二值向量矩阵,通过注意力计算,确定预测表示向量;
对所述预测表示向量进行映射处理,获得所述查询预测信息。
其中,预测表示向量,是指用于表征查询请求和目标数据库中各数据之间的关联程度的向量,预测表示向量集成了查询请求和目标数据库中各数据的数据信息。
具体的,通过第二查询向量矩阵、第二键向量矩阵和第二值向量矩阵,进行注意力计算,获得预测表示向量,并将预测表示向量进行映射处理,即可获得查询预测信息。对预测表示向量的映射处理,可以通过线性回归模型实现。
本说明书提供的数据查询方法,通过注意力机制对各数据编码向量和查询编码向量之间的关联关系进行分析,并得到用于表征各数据编码向量和查询编码向量之间的关联关系的预测表示向量,再对预测表示向量进行映射处理,以获得查询预测信息。提高获取查询预测信息的准确性。
步骤208:基于所述查询预测信息在所述目标数据库中进行查询,获得所述查询请求对应的查询结果。
在实际应用中,往往会出现对数据库中的数据进行访问查询的情况,但由于针对查询请求的查询预测信息确定存在误差,使得查询结果出现错误。
基于本说明书提供的数据查询方法,可以实现对目标数据库中的各数据进行编码,获取各数据编码向量之间的关联关系,并获得关联向量集合,对查询请求进行编码,获取查询编码向量与各关联向量之间的关联关系,从而既可以获取各数据编码向量之间的关联关系,也可以获取各关联向量与查询编码向量之间的关联关系,实现基于目标数据库中各数据与查询请求之间的联系,进一步确定查询预测信息。基于查询预测信息在目标数据库中进行查询,即可获取查询请求对应的查询结果。
本说明书提供的数据查询方法,通过获知目标数据库中的各数据与查询请求之间关联关系,确定针对查询请求的查询预测信息,使得在后续基于查询预测信息,在目标数据库中进行查询的过程中,提高数据查询的准确性。
具体地,在基于自注意力机制和注意力机制,对查询请求和目标数据库中的各数据进行关联程度上的分析后,获得查询预测信息,并基于查询预测信息在目标数据库中进行查询,获取查询请求对应的查询结果。基于查询预测信息进行查询,并获取查询结果的实现方式如下:
本说明书提供的一具体实施方式中,基于所述查询预测信息在所述目标数据库中进行查询,获得所述查询请求对应的查询结果,包括:
将所述查询预测信息输入至查询优化器,获取所述查询优化器输出的查询任务信息;
基于所述查询任务信息在所述目标数据库中进行查询,获得所述查询请求对应的查询结果。
其中,查询任务信息,具体是指,目标数据库执行查询动作的查询连接方式。查询连接方式,可以为哈希连接、顺序连接等。
具体的,将查询预测信息输入至查询优化器,并获取查询优化器输出的查询任务信息,根据查询任务信息,即可以查询任务信息的查询连接方式,在目标数据库中进行查询,进而获取查询请求对应的查询结果。
例如,查询请求包括查询10名学生的选课记录,则将查询预测信息输入至查询优化器,根据查询优化器输出的查询任务信息,在目标数据库中进行查询,可以获得上述10名学生的选课记录。
本说明书提供的数据查询方法,结合目标数据库中各数据和查询请求两部分数据进行查询,既实现了数据驱动,也实现了查询驱动。通过自注意力机制和注意力机制的结合,对目标数据库中各数据和查询请求之间的关联关系进行分析,提高查询效率和查询的准确度。
为了进一步提高查询效率,缩短处理周期,还可以通过查询预测模型来确定查询请求对应的查询预测信息。
在本说明书提供的一具体实施方式中,在获取关联向量集合之前,还包括:
获取查询预测模型,所述查询预测模型包括数据预处理层、数据编码层和查询解释层。
查询预测模型是指用于确定查询请求对应的查询预测信息的模型。图3示出了根据本说明书一实施例提供的一种查询预测模型的结构示意图。结合图3来看,查询预测模型包括数据预处理层、数据编码层和查询解释层。在实际应用的过程中,将目标数据库中的各数据和查询请求输入至数据预处理层,可以获取数据预处理层输出的数据编码向量和查询编码向量;将数据编码向量输入至数据编码层,可以获取数据编码层输出的关联向量集合;将查询编码向量和关联向量集合,输入至查询解释层,可以获取查询解释层输出的查询预测信息。
相应的,对所述目标数据库中的各数据进行编码,获得所述各数据对应的数据编码向量,包括:
将所述目标数据库中的各数据,输入至所述数据预处理层,获得所述各数据对应的数据编码向量;
对所述查询请求进行编码,获得查询编码向量,包括:
将所述查询请求,输入至所述数据预处理层,获得所述查询请求对应的查询编码向量;
获取关联向量集合,包括:
将所述各数据编码向量输入至所述数据编码层,获得关联向量集合;
对所述关联向量集合中的关联向量与所述查询编码向量之间进行关联分析,获得查询预测信息,包括:
将所述查询编码向量和所述关联向量集合,输入至所述查询解释层,获得查询预测信息。
通过查询预测模型获取查询预测信息后,将查询预测信息输入至查询优化器,获取查询任务信息,并根据查询任务信息在目标数据库中进行查询,以获得查询请求对应的查询结果。
由于数据库中的数据并不是一成不变的,而是会基于对存储数据的增添、删除和修改等操作,致使数据库中的存储数据进行相应的更新。
因此,在本说明书提供的一具体实施方式中,所述方法还包括:
获取针对所述目标数据库的数据更新请求;
确定所述数据更新请求的请求类型;
基于所述请求类型,对所述目标数据库进行数据更新。
其中,数据更新请求是指,用于更新目标数据库中各数据的请求,请求类型是指,数据更新请求的类型,包括增添请求、删除请求和修改请求中的任意一项。
具体的,获取针对目标数据库中的数据更新请求,并确定该数据更新请求的请求类型,若确定数据更新请求为增添请求,则将数据更新请求中携带的数据存储至目标数据库;若确定数据更新请求为删除请求,则将数据更新请求中携带的数据,从目标数据库中进行删除,数据更新请求中也可以携带需要进行删除的数据的数据标识,基于数据标识,从目标数据库中将数据标识对应的数据进行删除;若确定数据更新请求为修改请求,则基于数据更新请求中携带的数据,对目标数据库中对应需要进行修改的数据进行修改。
通过对目标数据库中的各数据的增添、删除和修改,实现对目标数据库的数据更新。
参见图4,图4示出了根据本说明书一实施例提供的一种数据查询方法的流程框架图。首先,将目标数据库中的各数据和查询请求输入至查询预测模型的数据预处理层,获取数据预处理层输出的与各数据对应的数据编码向量和查询请求对应的查询编码向量;其次,将各数据编码向量输入至查询预测模型的数据编码层,获取数据编码层输出的关联向量集合;然后,将查询编码向量和关联向量集合输入至查询预测模型的查询解释层,获取查询解释层输出的查询预测信息;再者,将查询预测信息输入至查询优化器,获取查询优化器输出的查询任务信息;最后,将查询任务信息输入至查询执行器,查询执行器会在目标数据库中进行在线查询,进而获取查询请求对应的查询结果。
需要进行说明的是,在实际应用的过程中,在目标数据库中的各数据没有进行更新的情况下,可以直接获取目标数据库中的各数据对应的数据编码向量,无需再次重新对目标数据库中的各数据进行编码;在目标数据库中的各数据发生更新的情况下,除了需要对查询请求进行编码之外,还需要对更新后的目标数据库中的各数据进行编码,以获得更新后的数据编码向量。
在获取查询预测模型,确定查询预测信息之前,需要对查询预测模型进行训练,具体如下:
在本说明书提供的一具体实施方式中,在获取查询预测模型之前,所述方法还包括:
获取针对样本数据库的样本查询请求,和所述样本查询请求对应的样本查询信息;
将所述样本数据库中的各样本数据和所述样本查询请求,输入至所述数据预处理层,获得所述各样本数据对应的样本数据编码向量和所述样本查询请求对应的样本查询编码向量;
将所述各样本数据编码向量输入至所述数据编码层,获得样本关联向量集合;
将所述样本查询编码向量和所述样本关联向量集合,输入至所述查询解释层,获得预测查询信息;
根据所述样本查询信息和所述预测查询信息计算所述查询预测模型的损失值;
根据所述损失值调整所述查询预测模型的模型参数,并继续训练所述查询预测模型,直至达到训练停止条件。
其中,样本查询请求是指在样本查询请求集合中获取的查询请求,是所述查询预测模型的训练样本;样本查询请求集合是指通过采集历史查询请求,获得的查询请求组成的集合;样本查询信息是指样本查询请求对应的实际查询信息;预测查询信息是指将样本数据库中的各样本数据和样本查询请求输入至查询预测模型所输出的查询信息;损失值是指样本查询信息与预测查询信息之间的差异值,用于度量样本查询信息与预测查询信息之间的差异。
具体的,通过上述获取查询请求的获取方式获取样本查询请求,将样本数据库中的各样本数据和样本查询请求输入至查询预测模型的数据预处理层,获得各样本数据对应的样本数据编码向量和样本查询请求对应的样本查询编码向量;将各样本数据编码向量输入至查询预测模型的数据编码层,获得样本关联向量集合;将样本查询编码向量和样本关联向量集合,输入至查询预测模型的查询解释层,获得预测查询信息。
查询预测模型用于确定样本查询请求的查询信息,此时的查询预测模型是还未训练好的模型,确定的预测查询信息与实际的样本查询信息之间会存在偏差,需要对查询预测模型的模型参数进行相应的调整,具体的,根据输出的预测查询信息和样本查询信息计算查询预测模型的损失值,计算损失值的损失函数在实际应用中可以为0-1损失函数、平方损失函数、交叉熵损失函数等等,在本说明书中,优选的,选择交叉熵函数作为计算损失值的损失函数,并根据损失值调整查询预测模型的模型参数,基于调整后的模型参数用于下一批次样本查询请求继续训练查询预测模型,直至达到模型训练的停止条件。
具体的,模型训练停止条件包括模型损失值小于预设阈值和/或训练轮次达到预设的轮次。
在本说明书提供的一具体实施方式中,以通过模型损失值小于预设阈值为训练停止条件为例,预设阈值为0.3,当模型损失值小于0.3时,则认为查询预测模型训练完成。
在本说明书提供的另一具体实施方式中,以预设的训练轮次作为训练停止条件为例,预设的训练轮次为30轮,当样本查询请求的训练轮次达到30轮后,则认为查询预测模型训练完成。
在本说明书提供的又一具体实施方式中,设置预设阈值和预设训练轮次两个训练停止条件,同时确定损失值和训练轮次,当模型损失值或训练轮次中任意一项满足训练停止条件时,则认为查询预测模型训练完成。
为了进一步保证查询预测模型的预测准确性,提高用户的查询使用体验,在本说明书提供的一具体实施方式中,在获取查询结果之后,所述方法还包括:
将所述查询结果反馈给用户;
接收所述用户针对所述查询结果反馈的调整信息;
根据所述调整信息,对所述查询预测模型进行微调训练。
其中,调整信息具体是指,用于调整查询预测模型的模型参数的信息,调整信息为用户基于查询结果进行反馈的数据,例如,调整信息可以包括确定查询结果存在误差的提示信息,查询结果的误差信息等。
具体的,在获取查询请求对应的查询结果后,将查询结果反馈给用户,并接收用户针对查询结果所生成的用于调整查询预测模型的模型参数的调整信息,根据调整信息对查询预测模型进行微调训练。
以调整信息包括确定查询结果存在误差的提示信息为例进行说明,针对用户的查询请求,向用户反馈的查询结果包括“XXX选课信息1”、“XXX选课信息2”和“XXX选课信息3”三条选课信息。用户针对查询结果“XXX选课信息1”进行反馈,生成“XXX选课信息1”存在误差的提示信息,终端或数据库在接收该提示信息后,可以根据该提示信息确定“XXX选课信息1”存在的误差,并针对该误差对查询预测模型的模型参数进行调整,进行后续模型训练。
本说明书提供的数据查询方法,在获取查询请求对应的查询结果后,将该查询结果反馈给用户,基于用户的反馈对查询预测模型进行微调,进一步保证查询预测模型的准确率,提升用户的使用体验。
本说明书提供的数据查询方法,包括:获取针对目标数据库的查询请求和关联向量集合,其中,所述关联向量集合通过对各数据编码向量之间进行关联分析获得,所述关联向量集合中的关联向量表征至少两个数据编码向量之间的关联程度,所述各数据编码向量基于对所述目标数据库中的各数据进行编码获得;对所述查询请求进行编码,获得查询编码向量;对所述关联向量集合中的关联向量与所述查询编码向量之间进行关联分析,获得查询预测信息;基于所述查询预测信息在所述目标数据库中进行查询,获得所述查询请求对应的查询结果。
本说明书一实施例,通过结合目标数据库中各数据和查询请求两部分数据进行查询,既实现了数据驱动,也实现了查询驱动。通过自注意力机制和注意力机制的结合,对目标数据库中各数据和查询请求之间的关联关系进行分析,并提供查询结果,提高查询效率和查询的准确性。
下述结合附图5,以本说明书提供的数据查询方法在数据库查询的应用为例,对所述数据查询方法进行进一步说明。其中,图5示出了本说明书一个实施例提供的一种数据查询方法的处理过程流程图,具体包括以下步骤。
步骤502:获取针对目标数据库的查询请求。
步骤504:获取所述目标数据库中的各数据的数据属性,基于所述数据属性,对所述数据属性对应的数据进行编码,获得所述各数据对应的数据编码向量。
步骤506:对所述查询请求中的查询字段进行识别,基于所述查询字段,确定至少两个目标关系表,确定所述至少两个目标关系表之间的连接信息。
步骤508:对所述查询字段进行编码,获得查询字段编码向量,对所述连接信息进行编码,获得连接信息编码向量,将所述查询字段编码向量和所述连接信息编码向量进行拼接,获得所述查询编码向量。
步骤510:将各数据编码向量进行拼接,获得数据编码向量矩阵,将所述数据编码向量矩阵分别作为第一查询向量矩阵、第一键向量矩阵和第一值向量矩阵,通过自注意力计算,获得关联向量集合。
步骤512:将所述关联向量集合中的关联向量进行拼接,获得关联向量矩阵,将所述查询编码向量作为第二查询向量矩阵、所述关联向量矩阵作为第二键向量矩阵和第二值向量矩阵,通过注意力计算,确定预测表示向量。
步骤514:对所述预测表示向量进行映射处理,获得查询预测信息。
步骤516:将所述查询预测信息输入至查询优化器,获取所述查询优化器输出的查询任务信息。
步骤518:基于所述查询任务信息在所述目标数据库中进行查询,获得所述查询请求对应的查询结果。
本说明书一实施例,通过结合目标数据库中各数据和查询请求两部分数据进行查询,既实现了数据驱动,也实现了查询驱动。通过自注意力机制和注意力机制的结合,对目标数据库中各数据和查询请求之间的关联关系进行分析,并提供查询结果,提高查询效率和查询的准确性。
与上述方法实施例相对应,本说明书还提供了数据查询装置实施例,图6示出了本说明书一个实施例提供的一种数据查询装置的结构示意图。如图6所示,该装置包括:
获取模块602,被配置为获取针对目标数据库的查询请求和关联向量集合,其中,所述关联向量集合通过对各数据编码向量之间进行关联分析获得,所述关联向量集合中的关联向量表征至少两个数据编码向量之间的关联程度,所述各数据编码向量基于对所述目标数据库中的各数据进行编码获得;
编码模块604,被配置为对所述查询请求进行编码,获得查询编码向量;
分析模块606,被配置为对所述关联向量集合中的关联向量与所述查询编码向量之间进行关联分析,获得查询预测信息;
查询模块608,被配置为基于所述查询预测信息在所述目标数据库中进行查询,获得所述查询请求对应的查询结果。
可选的,所述获取模块602,进一步被配置为:
获取所述各数据中的数据属性;
基于所述数据属性,对所述数据属性对应的数据进行编码,获得所述数据编码向量。
可选的,所述编码模块604,进一步被配置为:
对所述查询请求进行字段识别,确定待编码信息;
对所述待编码信息进行编码,获得查询编码向量。
可选的,所述待编码信息包括查询字段,以及目标关系表之间的连接信息,其中,所述目标关系表与所述查询字段对应;
相应的,所述编码模块604,进一步被配置为:
对所述查询请求中的查询字段进行识别;
基于所述查询字段,确定至少两个目标关系表;
确定所述至少两个目标关系表之间的连接信息。
可选的,所述所述编码模块604,进一步被配置为:
对所述查询字段进行编码,获得所述查询字段对应的查询字段编码向量;
对所述连接信息进行编码,获得所述连接信息对应的连接信息编码向量;
将所述查询字段编码向量和所述连接信息编码向量进行拼接,获得所述查询编码向量。
可选的,所述获取模块602,进一步被配置为:
对所述目标数据库中的各数据进行编码,获得所述各数据对应的数据编码向量;
将各数据编码向量进行拼接,获得数据编码向量矩阵;
将所述数据编码向量矩阵分别作为第一查询向量矩阵、第一键向量矩阵和第一值向量矩阵,通过自注意力计算,获得所述关联向量集合。
可选的,所述分析模块606,进一步被配置为:
将所述关联向量集合中的关联向量进行拼接,获得关联向量矩阵;
将所述查询编码向量作为第二查询向量矩阵、所述关联向量矩阵作为第二键向量矩阵和第二值向量矩阵,通过注意力计算,获得所述查询预测信息。
可选的,所述分析模块606,进一步被配置为:
基于所述第二查询编码向量、所述第二键向量矩阵和所述第二值向量矩阵,通过注意力计算,确定预测表示向量;
对所述预测表示向量进行映射处理,获得所述查询预测信息。
可选的,所述查询模块608,进一步被配置为:
将所述查询预测信息输入至查询优化器,获取所述查询优化器输出的查询任务信息;
基于所述查询任务信息在所述目标数据库中进行查询,获得所述查询请求对应的查询结果。
可选的,所述数据查询装置,还包括:
模型获取模块,被配置为获取查询预测模型,所述查询预测模型包括数据预处理层、数据编码层和查询解释层;
所述获取模块602,进一步被配置为:
将所述目标数据库中的各数据,输入至所述数据预处理层,获得所述各数据对应的数据编码向量;
所述编码模块604,进一步配置为:
将所述查询请求,输入至所述数据预处理层,获得所述查询请求对应的查询编码向量;
所述获取模块602,进一步被配置为:
将所述各数据编码向量输入至所述数据编码层,获得关联向量集合;
所述分析模块606,进一步被配置为:
将所述查询编码向量和所述关联向量集合,输入至所述查询解释层,获得查询预测信息。
可选的,所述数据查询装置,还包括:
样本获取模块,被配置为获取针对样本数据库的样本查询请求,和所述样本查询请求对应的样本查询信息;
数据预处理模块,被配置为将所述样本数据库中的各样本数据和所述样本查询请求,输入至所述数据预处理层,获得所述各样本数据对应的样本数据编码向量和所述样本查询请求对应的样本查询编码向量;
数据编码模块,被配置为将所述各样本数据编码向量输入至所述数据编码层,获得样本关联向量集合;
查询解释模块,被配置为将所述样本查询编码向量和所述样本关联向量集合,输入至所述查询解释层,获得预测查询信息;
损失计算模块,被配置为根据所述样本查询信息和所述预测查询信息计算所述查询预测模型的损失值;
参数调整模块,被配置为根据所述损失值调整所述查询预测模型的模型参数,并继续训练所述查询预测模型,直至达到训练停止条件。
可选的,所述数据查询装置,还包括:
反馈模块,被配置为将所述查询结果反馈给用户;
接收模块,被配置为接收所述用户针对所述查询结果反馈的调整信息;
微调模块,被配置为根据所述调整信息,对所述查询预测模型进行微调训练。
可选的,所述数据查询装置,还包括:
请求获取模块,被配置为获取针对所述目标数据库的数据更新请求;
类型确定模块,被配置为确定所述数据更新请求的请求类型;
数据更新模块,被配置为基于所述请求类型,对所述目标数据库进行数据更新。
本说明书提供的数据查询装置,包括:获取模块,被配置为获取针对目标数据库的查询请求和关联向量集合,其中,所述关联向量集合通过对各数据编码向量之间进行关联分析获得,所述关联向量集合中的关联向量表征至少两个数据编码向量之间的关联程度,所述各数据编码向量基于对所述目标数据库中的各数据进行编码获得;编码模块,被配置为对所述查询请求进行编码,获得查询编码向量;分析模块,被配置为对所述关联向量集合中的关联向量与所述查询编码向量之间进行关联分析,获得查询预测信息;查询模块,被配置为基于所述查询预测信息在所述目标数据库中进行查询,获得所述查询请求对应的查询结果。
本说明书一实施例,通过结合目标数据库中各数据和查询请求两部分数据进行查询,既实现了数据驱动,也实现了查询驱动。通过自注意力机制和注意力机制的结合,对目标数据库中各数据和查询请求之间的关联关系进行分析,并提供查询结果,提高查询效率和查询的准确性。
上述为本实施例的一种数据查询装置的示意性方案。需要说明的是,该数据查询装置的技术方案与上述的数据查询方法的技术方案属于同一构思,数据查询装置的技术方案未详细描述的细节内容,均可以参见上述数据查询方法的技术方案的描述。
参见图7,图7示出了根据本说明书一个实施例提供的一种查询预测模型训练方法的流程图,该方法应用于云侧设备,具体包括以下步骤。
步骤702:获取样本数据、样本查询请求,和所述样本查询请求对应的样本查询信息。
步骤704:将所述样本数据和所述样本查询请求,输入至查询预测模型的数据预处理层,获得所述样本数据对应的样本数据编码向量和所述样本查询请求对应的样本查询编码向量。
步骤706:将所述样本数据编码向量输入至所述查询预测模型的数据编码层,获得样本关联向量集合,其中,所述数据编码层用于对各样本数据编码向量之间进行关联分析。
步骤708:将所述样本查询编码向量和所述样本关联向量集合,输入至所述查询预测模型的查询解释层,获得预测查询信息,其中,所述查询解释层用于对所述样本查询编码向量和所述样本关联向量集合中的样本关联向量之间进行关联分析。
步骤710:根据所述样本查询信息和所述预测查询信息计算所述查询预测模型的损失值。
步骤712:根据所述损失值调整所述查询预测模型的模型参数,并继续训练所述查询预测模型,直至达到训练停止条件。
步骤714:将训练完成的查询预测模型参数反馈至目标终端。
其中,样本数据是指在样本数据集合中获取的数据,样本查询请求是指在样本查询请求集合中获取的查询请求,是所述查询预测模型的训练样本;样本查询请求集合是指通过采集历史查询请求,获得的查询请求组成的集合;样本查询信息是指样本查询请求对应的实际查询信息;预测查询信息是指将样本数据和样本查询请求输入至查询预测模型所输出的查询信息;损失值是指样本查询信息与预测查询信息之间的差异值,用于度量样本查询信息与预测查询信息之间的差异。
具体的,获取样本查询请求,将样本数据和样本查询请求输入至查询预测模型的数据预处理层,获得样本数据对应的样本数据编码向量和样本查询请求对应的样本查询编码向量;将样本数据编码向量输入至查询预测模型的数据编码层,获得样本关联向量集合;将样本查询编码向量和样本关联向量集合,输入至查询预测模型的查询解释层,获得预测查询信息。
查询预测模型用于确定样本查询请求的查询信息,此时的查询预测模型是还未训练好的模型,确定的预测查询信息与实际的样本查询信息之间会存在偏差,需要对查询预测模型的模型参数进行相应的调整,具体的,根据输出的预测查询信息和样本查询信息计算查询预测模型的损失值,计算损失值的损失函数在实际应用中可以为0-1损失函数、平方损失函数、交叉熵损失函数等等,在本说明书中,优选的,选择交叉熵函数作为计算损失值的损失函数,并根据损失值调整查询预测模型的模型参数,基于调整后的模型参数用于下一批次样本查询请求继续训练查询预测模型,直至达到模型训练的停止条件。
具体的,模型训练停止条件包括模型损失值小于预设阈值和/或训练轮次达到预设的轮次。
在本说明书提供的一具体实施方式中,以通过模型损失值小于预设阈值为训练停止条件为例,预设阈值为0.3,当模型损失值小于0.3时,则认为查询预测模型训练完成。
在本说明书提供的另一具体实施方式中,以预设的训练轮次作为训练停止条件为例,预设的训练轮次为30轮,当样本查询请求的训练轮次达到30轮后,则认为查询预测模型训练完成。
在本说明书提供的又一具体实施方式中,设置预设阈值和预设训练轮次两个训练停止条件,同时确定损失值和训练轮次,当模型损失值或训练轮次中任意一项满足训练停止条件时,则认为查询预测模型训练完成。
在查询预测模型训练完成后,将训练完成的查询预测模型参数反馈至目标终端。
本说明提供的查询预测模型训练方法,应用于云侧设备,通过样本数据和样本查询请求,对查询预测模型进行训练,使得查询预测模型可以在训练的过程中,学习样本数据和样本查询请求之间的关联关系,提供查询预测的准确率。
与上述方法实施例相对应,本说明书还提供了查询预测模型训练装置实施例,图8示出了本说明书一个实施例提供的一种查询预测模型训练装置的结构示意图。如图8所示,该装置应用于云侧设备,包括:
样本获取模块802,被配置为获取样本数据、样本查询请求,和所述样本查询请求对应的样本查询信息;
数据预处理模块804,被配置为将所述样本数据和所述样本查询请求,输入至查询预测模型的数据预处理层,获得所述样本数据对应的样本数据编码向量和所述样本查询请求对应的样本查询编码向量;
数据编码模块806,被配置为将所述样本数据编码向量输入至所述查询预测模型的数据编码层,获得样本关联向量集合;
查询解释模块808,被配置为将所述样本查询编码向量和所述样本关联向量集合,输入至所述查询预测模型的查询解释层,获得预测查询信息;
损失计算模块810,被配置为根据所述样本查询信息和所述预测查询信息计算所述查询预测模型的损失值;
参数调整模块812,被配置为根据所述损失值调整所述查询预测模型的模型参数,并继续训练所述查询预测模型,直至达到训练停止条件;
参数反馈模块814,被配置为将训练完成的查询预测模型参数反馈至目标终端。
本说明提供的查询预测模型训练装置,应用于云侧设备,通过样本数据和样本查询请求,对查询预测模型进行训练,使得查询预测模型可以在训练的过程中,学习样本数据和样本查询请求之间的关联关系,提供查询预测的准确率。
上述为本实施例的一种查询预测模型训练装置的示意性方案。需要说明的是,该查询预测模型训练装置的技术方案与上述的查询预测模型训练方法的技术方案属于同一构思,查询预测模型训练装置的技术方案未详细描述的细节内容,均可以参见上述查询预测模型训练方法的技术方案的描述。
参见图9,图9示出了根据本说明书一个实施例提供的一种商品数据查询方法的流程图,具体包括以下步骤。
步骤902:获取针对目标商品数据库的商品查询请求和关联向量集合。
数据查询方法可以应用于各个需要进行数据查询的领域,例如医药领域、仓储领域、电商领域等。为了提高数据查询的准确性,本说明书提供了一种商品数据查询方法,该方法可以应用于任意需要进行商品数据查询的领域。
其中,目标商品数据库即为存储有需要进行查询的商品数据的数据库,也是用于执行所述商品数据查询方法的数据库;商品查询请求是指,用于在目标商品数据库中进行商品数据查询的请求,商品查询请求可以为用于进行商品数据查询的查询语句。
关联向量集合是通过对各商品数据编码向量之间进行关联分析获得的,关联向量集合中的关联向量用于表征至少两个商品数据编码向量之间的关联程度,各商品数据编码向量基于对所述目标商品数据库中的各商品数据进行编码获得。
优选的,在本说明书提供的一具体实施方式中,获取关联向量集合,包括:
对所述目标商品数据库中的各商品数据进行编码,获得所述各商品数据对应的商品数据编码向量;
将各商品数据编码向量进行拼接,获得数据编码向量矩阵;
将所述数据编码向量矩阵分别作为第一查询向量矩阵、第一键向量矩阵和第一值向量矩阵,通过自注意力计算,获得所述关联向量集合。
具体的,将各商品数据对应的商品数据编码向量进行拼接,获得数据编码向量矩阵,并将数据编码向量矩阵分别作为自注意力机制对应的第一查询向量矩阵、第一键向量矩阵和第一值向量矩阵,基于第一查询向量矩阵、第一键向量矩阵和第一值向量矩阵,进行自注意力计算,获得关联向量集合。
例如,对20个数据属性对应的商品存储数据进行编码,获得20个商品数据编码向量,且20个商品数据编码向量均是1*50维的直方图,则将这20个1*50维的直方图进行拼接,获得20*50维的直方图,即数据编码向量矩阵为20*50维的向量矩阵。将20*50维的向量矩阵同时作为第一查询向量矩阵、第一键向量矩阵和第一值向量矩阵,并进行自注意力计算,获得关联向量集合。
关联向量集合是对各商品数据编码向量之间的相关性的确定,其向量的数量与各商品数据编码向量的数量一致,但维度方面可能存在差异。以上述内容为例,20个商品数据编码向量为1*50维的直方图,那么,关联向量集合中包括20个关联向量,但20个关联向量的维度可以为50维、100维等维度。
步骤904:对所述商品查询请求进行编码,获得商品查询编码向量。
商品查询编码向量是指,对商品查询请求进行编码后所获得的编码向量。具体的,对获取到的商品查询请求进行编码,以获得商品查询请求对应的商品查询编码向量。
步骤906:对所述关联向量集合中的关联向量与所述商品查询编码向量之间进行关联分析,获得商品查询预测信息。
其中,商品查询预测信息,可以理解为用于确定商品查询请求对应的商品查询结果的商品查询预测值。在本说明书中,优选注意力机制进行确定商品查询请求对应的商品查询预测信息。
在本说明书提供的一具体实施方式中,对所述关联向量集合中的关联向量与所述商品查询编码向量之间进行关联分析,获得商品查询预测信息,包括:
将所述关联向量集合中的关联向量进行拼接,获得关联向量矩阵;
将所述商品查询编码向量作为第二查询向量矩阵、所述关联向量矩阵作为第二键向量矩阵和第二值向量矩阵,通过注意力计算,获得所述商品查询预测信息。
具体的,将关联向量集合中的关联向量进行拼接,获得关联向量矩阵,并将关联向量矩阵分别作为注意力机制对应的第二查询向量矩阵、第二键向量矩阵和第二值向量矩阵,基于第二查询向量矩阵、第二键向量矩阵和第二值向量矩阵,进行注意力计算,获得商品查询预测信息。
进一步的,在本说明书提供的一具体实施方式中,将所述商品查询编码向量作为第二查询向量矩阵、所述关联向量矩阵作为第二键向量矩阵和第二值向量矩阵,通过注意力计算,获得所述商品查询预测信息,包括:
基于所述第二查询向量矩阵、所述第二键向量矩阵和所述第二值向量矩阵,通过注意力计算,确定预测表示向量;
对所述预测表示向量进行映射处理,获得所述商品查询预测信息。
其中,预测表示向量,是指用于表征商品查询请求和目标商品数据库中各商品数据之间的关联程度的向量,预测表示向量集成了商品查询请求和目标商品数据库中各商品数据的数据信息。
具体的,通过第二查询向量矩阵、第二键向量矩阵和第二值向量矩阵,进行注意力计算,获得预测表示向量,并将预测表示向量进行映射处理,即可获得商品查询预测信息。对预测表示向量的映射处理,可以通过线性回归模型实现。
本说明书提供的商品数据查询方法,通过注意力机制对各商品数据编码向量和商品查询编码向量之间的关联关系进行分析,并得到用于表征各商品数据编码向量和商品查询编码向量之间的关联关系的预测表示向量,再对预测表示向量进行映射处理,以获得商品查询预测信息,提高获取商品查询预测信息的准确性。
步骤908:基于所述商品查询预测信息在所述目标商品数据库中进行查询,获得所述商品查询请求对应的商品查询结果,并将所述商品查询结果反馈至目标终端。
具体地,在基于自注意力机制和注意力机制,对商品查询请求和目标商品数据库中的各商品数据进行关联程度上的分析后,获得商品查询预测信息,并基于商品查询预测信息在目标商品数据库中进行查询,获取商品查询请求对应的商品查询结果,并将获取的商品查询结果反馈至目标终端,以使用户获取商品查询请求对应的商品查询结果。基于商品查询预测信息进行查询,并获取商品查询结果的实现方式如下:
本说明书提供的一具体实施方式中,基于所述商品查询预测信息在所述目标商品数据库中进行查询,获得所述商品查询请求对应的商品查询结果,包括:
将所述商品查询预测信息输入至查询优化器,获取所述查询优化器输出的商品查询任务信息;
基于所述商品查询任务信息在所述目标商品数据库中进行查询,获得所述商品查询请求对应的商品查询结果。
其中,商品查询任务信息,具体是指,目标商品数据库执行商品查询动作的查询连接方式。查询连接方式,可以为哈希连接、顺序连接等。
具体的,将商品查询预测信息输入至查询优化器,并获取查询优化器输出的商品查询任务信息,根据商品查询任务信息,即可以商品查询任务信息的查询连接方式,在目标商品数据库中进行查询,进而获取商品查询请求对应的商品查询结果。
例如,商品查询请求包括查询10件衣服的存储记录,则将商品查询预测信息输入至查询优化器,根据查询优化器输出的商品查询任务信息,在目标商品数据库中进行查询,可以获得上述10件衣服的存储记录。
本说明书提供的商品数据查询方法,结合目标商品数据库中各商品数据和商品查询请求两部分数据进行查询,既实现了数据驱动,也实现了查询驱动。通过自注意力机制和注意力机制的结合,对目标商品数据库中各商品数据和商品查询请求之间的关联关系进行分析,提高查询效率和查询的准确度。
与上述方法实施例相对应,本说明书还提供了商品数据查询装置实施例,图10示出了本说明书一个实施例提供的一种商品数据查询装置的结构示意图。如图10所示,包括:
请求获取模块1002,被配置为获取针对目标商品数据库的商品查询请求和关联向量集合,其中,所述关联向量集合通过对各商品数据编码向量之间进行关联分析获得,所述关联向量集合中的关联向量表征至少两个商品数据编码向量之间的关联程度,所述各商品数据编码向量基于对所述目标商品数据库中的各商品数据进行编码获得;
请求编码模块1004,被配置为对所述商品查询请求进行编码,获得商品查询编码向量;
向量分析模块1006,被配置为对所述关联向量集合中的关联向量与所述商品查询编码向量之间进行关联分析,获得商品查询预测信息;
结果查询模块1008,被配置为基于所述商品查询预测信息在所述目标商品数据库中进行查询,获得所述商品查询请求对应的商品查询结果,并将所述商品查询结果反馈至目标终端。
可选的,所述请求获取模块1002,进一步被配置为:
对所述目标商品数据库中的各商品数据进行编码,获得所述各商品数据对应的商品数据编码向量;
将各商品数据编码向量进行拼接,获得数据编码向量矩阵;
将所述数据编码向量矩阵分别作为第一查询向量矩阵、第一键向量矩阵和第一值向量矩阵,通过自注意力计算,获得所述关联向量集合。
可选的,所述向量分析模块1006,进一步被配置为:
将所述关联向量集合中的关联向量进行拼接,获得关联向量矩阵;
将所述商品查询编码向量作为第二查询向量矩阵、所述关联向量矩阵作为第二键向量矩阵和第二值向量矩阵,通过注意力计算,获得所述商品查询预测信息。
可选的,所述向量分析模块1006,进一步被配置为:
基于所述第二查询向量矩阵、所述第二键向量矩阵和所述第二值向量矩阵,通过注意力计算,确定预测表示向量;
对所述预测表示向量进行映射处理,获得所述商品查询预测信息。
可选的,结果查询模块1008,进一步被配置为:
将所述商品查询预测信息输入至查询优化器,获取所述查询优化器输出的商品查询任务信息;
基于所述商品查询任务信息在所述目标商品数据库中进行查询,获得所述商品查询请求对应的商品查询结果。
本说明书提供的商品数据查询装置,结合目标商品数据库中各商品数据和商品查询请求两部分数据进行查询,既实现了数据驱动,也实现了查询驱动。通过自注意力机制和注意力机制的结合,对目标商品数据库中各商品数据和商品查询请求之间的关联关系进行分析,提高查询效率和查询的准确度。
上述为本实施例的一种商品数据查询装置的示意性方案。需要说明的是,该商品数据查询装置的技术方案与上述的商品数据查询方法的技术方案属于同一构思,商品数据查询装置的技术方案未详细描述的细节内容,均可以参见上述商品数据查询方法的技术方案的描述。
图11示出了根据本说明书一个实施例提供的一种计算设备1100的结构框图。该计算设备1100的部件包括但不限于存储器1110和处理器1120。处理器1120与存储器1110通过总线1130相连接,数据库1150用于保存数据。
计算设备1100还包括接入设备1140,接入设备1140使得计算设备1100能够经由一个或多个网络1160通信。这些网络的示例包括公用交换电话网(PSTN,Public SwitchedTelephone Network)、局域网(LAN,Local Area Network)、广域网(WAN,Wide AreaNetwork)、个域网(PAN,Personal Area Network)或诸如因特网的通信网络的组合。接入设备1140可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC,networkinterface controller))中的一个或多个,诸如IEEE802.11无线局域网(WLAN,WirelessLocal Area Network)无线接口、全球微波互联接入(Wi-MAX,WorldwideInteroperability for Microwave Access)接口、以太网接口、通用串行总线(USB,Universal Serial Bus)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC,Near FieldCommunication)。
在本说明书的一个实施例中,计算设备1100的上述部件以及图11中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图11所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备1100可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或个人计算机(PC,Personal Computer)的静止计算设备。计算设备1100还可以是移动式或静止式的服务器。
其中,处理器1120用于执行如下计算机可执行指令,该计算机可执行指令被处理器执行时实现上述数据查询方法、查询预测模型训练方法或商品数据查询方法的步骤。上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的数据查询方法、查询预测模型训练方法或商品数据查询方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述数据查询方法、查询预测模型训练方法或商品数据查询方法的技术方案的描述。
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述数据查询方法、查询预测模型训练方法或商品数据查询方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的数据查询方法、查询预测模型训练方法或商品数据查询方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述数据查询方法、查询预测模型训练方法或商品数据查询方法的技术方案的描述。
本说明书一实施例还提供一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述数据查询方法、查询预测模型训练方法或商品数据查询方法的步骤。
上述为本实施例的一种计算机程序的示意性方案。需要说明的是,该计算机程序的技术方案与上述的数据查询方法、查询预测模型训练方法或商品数据查询方法的技术方案属于同一构思,计算机程序的技术方案未详细描述的细节内容,均可以参见上述数据查询方法、查询预测模型训练方法或商品数据查询方法的技术方案的描述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

Claims (14)

1.一种数据查询方法,包括:
获取针对目标数据库的查询请求和关联向量集合,其中,所述关联向量集合通过对各数据编码向量之间进行关联分析获得,所述关联向量集合中的关联向量表征至少两个数据编码向量之间的关联程度,所述各数据编码向量基于对所述目标数据库中的各数据进行编码获得;
对所述查询请求进行编码,获得查询编码向量;
对所述关联向量集合中的关联向量与所述查询编码向量之间进行关联分析,获得查询预测信息;
基于所述查询预测信息在所述目标数据库中进行查询,获得所述查询请求对应的查询结果。
2.如权利要求1所述的方法,对所述查询请求进行编码,获得查询编码向量,包括:
对所述查询请求进行字段识别,确定待编码信息;
对所述待编码信息进行编码,获得查询编码向量。
3.如权利要求2所述的方法,所述待编码信息包括查询字段,以及目标关系表之间的连接信息,其中,所述目标关系表与所述查询字段对应;
相应的,对所述查询请求进行字段识别,确定待编码信息,包括:
对所述查询请求中的查询字段进行识别;
基于所述查询字段,确定至少两个目标关系表;
确定所述至少两个目标关系表之间的连接信息。
4.如权利要求1所述的方法,获取关联向量集合,包括:
对所述目标数据库中的各数据进行编码,获得所述各数据对应的数据编码向量;
将各数据编码向量进行拼接,获得数据编码向量矩阵;
将所述数据编码向量矩阵分别作为第一查询向量矩阵、第一键向量矩阵和第一值向量矩阵,通过自注意力计算,获得所述关联向量集合。
5.如权利要求1所述的方法,对所述关联向量集合中的关联向量与所述查询编码向量之间进行关联分析,获得查询预测信息,包括:
将所述关联向量集合中的关联向量进行拼接,获得关联向量矩阵;
将所述查询编码向量作为第二查询向量矩阵、所述关联向量矩阵作为第二键向量矩阵和第二值向量矩阵,通过注意力计算,获得所述查询预测信息。
6.如权利要求4所述的方法,在获取关联向量集合之前,还包括:
获取查询预测模型,所述查询预测模型包括数据预处理层、数据编码层和查询解释层;
对所述目标数据库中的各数据进行编码,获得所述各数据对应的数据编码向量,包括:
将所述目标数据库中的各数据,输入至所述数据预处理层,获得所述各数据对应的数据编码向量;
对所述查询请求进行编码,获得查询编码向量,包括:
将所述查询请求,输入至所述数据预处理层,获得所述查询请求对应的查询编码向量;
获取关联向量集合,包括:
将所述各数据编码向量输入至所述数据编码层,获得关联向量集合;
对所述关联向量集合中的关联向量与所述查询编码向量之间进行关联分析,获得查询预测信息,包括:
将所述查询编码向量和所述关联向量集合,输入至所述查询解释层,获得查询预测信息。
7.如权利要求6所述的方法,在获取查询预测模型之前,所述方法还包括:
获取针对样本数据库的样本查询请求,和所述样本查询请求对应的样本查询信息;
将所述样本数据库中的各样本数据和所述样本查询请求,输入至所述数据预处理层,获得所述各样本数据对应的样本数据编码向量和所述样本查询请求对应的样本查询编码向量;
将所述各样本数据编码向量输入至所述数据编码层,获得样本关联向量集合;
将所述样本查询编码向量和所述样本关联向量集合,输入至所述查询解释层,获得预测查询信息;
根据所述样本查询信息和所述预测查询信息计算所述查询预测模型的损失值;
根据所述损失值调整所述查询预测模型的模型参数,并继续训练所述查询预测模型,直至达到训练停止条件。
8.如权利要求6所述的方法,所述方法还包括:
将所述查询结果反馈给用户;
接收所述用户针对所述查询结果反馈的调整信息;
根据所述调整信息,对所述查询预测模型进行微调训练。
9.一种查询预测模型训练方法,应用于云侧设备,包括:
获取样本数据、样本查询请求,和所述样本查询请求对应的样本查询信息;
将所述样本数据和所述样本查询请求,输入至查询预测模型的数据预处理层,获得所述样本数据对应的样本数据编码向量和所述样本查询请求对应的样本查询编码向量;
将所述样本数据编码向量输入至所述查询预测模型的数据编码层,获得样本关联向量集合,其中,所述数据编码层用于对各样本数据编码向量之间进行关联分析;
将所述样本查询编码向量和所述样本关联向量集合,输入至所述查询预测模型的查询解释层,获得预测查询信息,其中,所述查询解释层用于对所述样本查询编码向量和所述样本关联向量集合中的样本关联向量之间进行关联分析;
根据所述样本查询信息和所述预测查询信息计算所述查询预测模型的损失值;
根据所述损失值调整所述查询预测模型的模型参数,并继续训练所述查询预测模型,直至达到训练停止条件;
将训练完成的查询预测模型参数反馈至目标终端。
10.一种商品数据查询方法,包括:
获取针对目标商品数据库的商品查询请求和关联向量集合,其中,所述关联向量集合通过对各商品数据编码向量之间进行关联分析获得,所述关联向量集合中的关联向量表征至少两个商品数据编码向量之间的关联程度,所述各商品数据编码向量基于对所述目标商品数据库中的各商品数据进行编码获得;
对所述商品查询请求进行编码,获得商品查询编码向量;
对所述关联向量集合中的关联向量与所述商品查询编码向量之间进行关联分析,获得商品查询预测信息;
基于所述商品查询预测信息在所述目标商品数据库中进行查询,获得所述商品查询请求对应的商品查询结果,并将所述商品查询结果反馈至目标终端。
11.如权利要求10所述的方法,获取关联向量集合,包括:
对所述目标商品数据库中的各商品数据进行编码,获得所述各商品数据对应的商品数据编码向量;
将各商品数据编码向量进行拼接,获得数据编码向量矩阵;
将所述数据编码向量矩阵分别作为第一查询向量矩阵、第一键向量矩阵和第一值向量矩阵,通过自注意力计算,获得所述关联向量集合。
12.如权利要求10所述的方法,对所述关联向量集合中的关联向量与所述商品查询编码向量之间进行关联分析,获得商品查询预测信息,包括:
将所述关联向量集合中的关联向量进行拼接,获得关联向量矩阵;
将所述商品查询编码向量作为第二查询向量矩阵、所述关联向量矩阵作为第二键向量矩阵和第二值向量矩阵,通过注意力计算,获得所述商品查询预测信息。
13.一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至8或者9或者10至12任意一项所述方法的步骤。
14.一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至8或者9或者10至12任意一项所述方法的步骤。
CN202310362295.6A 2023-04-04 2023-04-04 数据查询方法及查询预测模型训练方法 Active CN116108072B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310362295.6A CN116108072B (zh) 2023-04-04 2023-04-04 数据查询方法及查询预测模型训练方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310362295.6A CN116108072B (zh) 2023-04-04 2023-04-04 数据查询方法及查询预测模型训练方法

Publications (2)

Publication Number Publication Date
CN116108072A true CN116108072A (zh) 2023-05-12
CN116108072B CN116108072B (zh) 2023-09-19

Family

ID=86264026

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310362295.6A Active CN116108072B (zh) 2023-04-04 2023-04-04 数据查询方法及查询预测模型训练方法

Country Status (1)

Country Link
CN (1) CN116108072B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100318548A1 (en) * 2009-06-16 2010-12-16 Florian Alexander Mayr Querying by Concept Classifications in an Electronic Data Record System
CN109739876A (zh) * 2019-01-10 2019-05-10 中化石化销售有限公司 基于Sqltoy-orm框架的数据库的数据查询方法和装置
CN110232403A (zh) * 2019-05-15 2019-09-13 腾讯科技(深圳)有限公司 一种标签预测方法、装置、电子设备及介质
WO2020264118A1 (en) * 2019-06-25 2020-12-30 Paypal, Inc. Threat detection using machine learning query analysis
CN112632406A (zh) * 2020-10-10 2021-04-09 咪咕文化科技有限公司 查询方法、装置、电子设备及存储介质
US20210406218A1 (en) * 2020-06-29 2021-12-30 Paypal, Inc. Query-based recommendation systems using machine learning-trained classifier
CN114116778A (zh) * 2021-09-26 2022-03-01 中国电子口岸数据中心成都分中心 一种数据库查询优化方法
CN114897163A (zh) * 2022-05-23 2022-08-12 阿里巴巴(中国)有限公司 预训练模型数据处理方法、电子设备及计算机存储介质
CN115495504A (zh) * 2022-10-10 2022-12-20 北京达佳互联信息技术有限公司 数据查询方法和装置、电子设备、计算机可读存储介质
CN115587111A (zh) * 2022-10-13 2023-01-10 东北大学 用于数据库查询优化的基数估计方法及装置
CN115600017A (zh) * 2022-10-24 2023-01-13 杭州网易云音乐科技有限公司(Cn) 特征编码模型训练方法及装置、媒体对象推荐方法及装置
CN115769198A (zh) * 2020-07-01 2023-03-07 国际商业机器公司 用于查询优化的自动反馈和连续学习

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100318548A1 (en) * 2009-06-16 2010-12-16 Florian Alexander Mayr Querying by Concept Classifications in an Electronic Data Record System
CN109739876A (zh) * 2019-01-10 2019-05-10 中化石化销售有限公司 基于Sqltoy-orm框架的数据库的数据查询方法和装置
CN110232403A (zh) * 2019-05-15 2019-09-13 腾讯科技(深圳)有限公司 一种标签预测方法、装置、电子设备及介质
WO2020264118A1 (en) * 2019-06-25 2020-12-30 Paypal, Inc. Threat detection using machine learning query analysis
US20210406218A1 (en) * 2020-06-29 2021-12-30 Paypal, Inc. Query-based recommendation systems using machine learning-trained classifier
CN115769198A (zh) * 2020-07-01 2023-03-07 国际商业机器公司 用于查询优化的自动反馈和连续学习
CN112632406A (zh) * 2020-10-10 2021-04-09 咪咕文化科技有限公司 查询方法、装置、电子设备及存储介质
CN114116778A (zh) * 2021-09-26 2022-03-01 中国电子口岸数据中心成都分中心 一种数据库查询优化方法
CN114897163A (zh) * 2022-05-23 2022-08-12 阿里巴巴(中国)有限公司 预训练模型数据处理方法、电子设备及计算机存储介质
CN115495504A (zh) * 2022-10-10 2022-12-20 北京达佳互联信息技术有限公司 数据查询方法和装置、电子设备、计算机可读存储介质
CN115587111A (zh) * 2022-10-13 2023-01-10 东北大学 用于数据库查询优化的基数估计方法及装置
CN115600017A (zh) * 2022-10-24 2023-01-13 杭州网易云音乐科技有限公司(Cn) 特征编码模型训练方法及装置、媒体对象推荐方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HAO XUE 等: "A document-relation associated query system based on distributed middleware", 2016 5TH INTERNATIONAL CONFERENCE ON COMPUTER SCIENCE AND NETWORK TECHNOLOGY (ICCSNT), pages 1 - 6 *
陈桂英;汪金龙;: "大数据中目标信息准确查询仿真研究", 计算机仿真, no. 02, pages 291 - 294 *

Also Published As

Publication number Publication date
CN116108072B (zh) 2023-09-19

Similar Documents

Publication Publication Date Title
Penha et al. Curriculum learning strategies for IR: An empirical study on conversation response ranking
CN111553479B (zh) 一种模型蒸馏方法、文本检索方法及装置
CN111353033B (zh) 一种训练文本相似度模型的方法和***
CN107545000A (zh) 基于知识图谱的信息推送方法及装置
WO2020232874A1 (zh) 基于迁移学习的建模方法、装置、计算机设备和存储介质
US20120102018A1 (en) Ranking Model Adaptation for Domain-Specific Search
CN111259647A (zh) 基于人工智能的问答文本匹配方法、装置、介质及电子设备
CN113157863A (zh) 问答数据处理方法、装置、计算机设备及存储介质
CN111368096A (zh) 基于知识图谱的信息分析方法、装置、设备和存储介质
CN113159187B (zh) 分类模型训练方法及装置、目标文本确定方法及装置
CN112131261B (zh) 基于社区网络的社区查询方法、装置和计算机设备
CN113641805B (zh) 结构化问答模型的获取方法、问答方法及对应装置
CN113836885A (zh) 文本匹配模型训练方法、文本匹配方法、装置和电子设备
CN116483962A (zh) 一种问答方法、装置、终端设备及可读存储介质
CN116910561A (zh) 数据集构建的方法和服务器
CN113806487A (zh) 基于神经网络的语义搜索方法、装置、设备和存储介质
CN111309878A (zh) 检索式问答方法、模型训练方法、服务器及存储介质
CN116757270A (zh) 基于人机交互模型或大模型的数据处理方法、服务器
CN115982597A (zh) 语义相似度模型训练方法及装置、语义匹配方法及装置
CN111552787A (zh) 问答处理方法、装置、设备及存储介质
CN116108072B (zh) 数据查询方法及查询预测模型训练方法
CN117235238A (zh) 问答方法、装置、存储介质及计算机设备
CN117009541A (zh) 临床医学检验知识库构建与应用方法、装置、设备及介质
CN114218287B (zh) 一种面向时序数据库的查询时间预测方法
WO2023173550A1 (zh) 一种跨领域数据推荐方法、装置、计算机设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant