CN116522003B

CN116522003B - 基于嵌入表压缩的信息推荐方法、装置、设备和介质

Info

Publication number: CN116522003B
Application number: CN202310805640.9A
Authority: CN
Inventors: 张军阳; 郑若楠; 王兆祥; 王志超; 王辰; 张瑜; 蒋田仔
Original assignee: Zhejiang Lab
Current assignee: Zhejiang Lab
Priority date: 2023-07-03
Filing date: 2023-07-03
Publication date: 2023-09-12
Anticipated expiration: 2043-07-03
Also published as: CN116522003A

Abstract

本申请涉及一种基于嵌入表压缩的信息推荐方法、装置、设备和介质。所述方法包括：通过根据预设压缩比例，确定推荐模型的待压缩嵌入表中的待压缩特征与非压缩特征，基于所述待压缩特征与所述非压缩特征之间的相似度，生成相似度索引矩阵。然后基于所述相似度索引矩阵，生成索引字典，根据所述索引字典对第一特征映射字典进行替换，生成第二特征映射字典。最后在获取待推荐数据后，根据所述第二特征映射字典替换所述待推荐数据中的特征，将替换后的特征输入至所述推荐模型，输出预测结果。实现了在不过度影响推荐模型的模型精度前提下，提高嵌入表的压缩效率，大幅降低模型的存储开销，提高模型的推理速度。

Description

基于嵌入表压缩的信息推荐方法、装置、设备和介质

技术领域

本申请涉及机器学习领域，特别是涉及一种基于嵌入表压缩的信息推荐方法、装置、设备和介质。

背景技术

推荐***作为一种能够从海量信息中为用户寻找其感兴趣信息的技术手段，已成为了互联网中必不可少的重要工具。

随着各类网站用户规模的***式增长以及供应商提供物品种类的快速增多，推荐***的存储压力也日益增大，如何减小推荐***的存储压力已成为目前亟需解决的问题。

面对如何减小推荐模型存储压力对模型进行压缩是目前常见的方式。现有的模型压缩方法，大体可分为低秩分解、量化、剪枝蒸馏等对模型嵌入层（Embedding）的压缩，轻量化模型结构的设计以及编码。在现有的对模型嵌入层进行压缩的方法中，其压缩过程中使用的函数往往受到限制，需要反复进行循环运算，进而导致了压缩后推荐模型的运行速度以及模型精度的下降。

针对相关技术中如何在保证推荐模型模型精度的前提下，提高模型的压缩效率，目前还没有提出有效的解决方案。

发明内容

基于此，有必要针对上述技术问题，提供一种能够在保证推荐模型模型精度的前提下，提高模型的压缩效率的基于嵌入表压缩的信息推荐方法、装置、计算机设备和存储介质。

第一方面，本申请提供了一种基于嵌入表压缩的信息推荐方法。所述方法包括：

根据预设压缩比例，确定推荐模型的待压缩嵌入表中的待压缩特征与非压缩特征；

基于所述待压缩特征与所述非压缩特征之间的相似度，生成相似度索引矩阵；

基于所述相似度索引矩阵，生成索引字典；

根据所述索引字典对第一特征映射字典进行替换，生成第二特征映射字典，其中，所述第一特征映射字典基于数据集所生成；

获取待推荐数据，根据所述第二特征映射字典替换所述待推荐数据中的特征，将替换后的特征输入至所述推荐模型，输出预测结果。

在其中一个实施例中，所述基于所述压缩特征与所述非压缩特征之间的相似度，生成相似度索引矩阵，包括：

基于所述待压缩特征与所述非压缩特征之间的相似度，生成相似度矩阵；

确定所述相似度矩阵中每行的矩阵元数值排序；

根据所述矩阵元数值排序生成相似度索引矩阵。

在其中一个实施例中，所述基于所述待压缩特征与所述非压缩特征之间的相似度，生成相似度矩阵，包括：

获取所述待压缩特征的第一特征向量，所述非压缩特征的第二特征向量；

获取各所述第一特征向量与各所述第二特征向量之间的向量距离，基于所述向量距离确定各所述压缩特征与各所述非压缩特征之间的相似度，生成相似度矩阵。

在其中一个实施例中，所述生成第二特征映射字典之后，所述方法还包括：

基于所述第二特征映射字典更新推荐模型，获取所述推荐模型的当前模型精度；

获取推荐模型的初始模型精度，根据所述初始模型精度与所述当前模型精度确定推荐模型的模型精度变化值；

判断所述模型精度变化值是否不大于预设模型精度下降阈值，若是，则保存所述第二特征映射字典。

在其中一个实施例中，若所述模型精度变化值大于预设模型精度下降阈值，则更改所述压缩比例，重新获取第二特征映射字典，直至所述推荐模型的模型精度变化值不大于预设模型精度阈值。

在其中一个实施例中，所述第一特征映射字典基于数据集所生成包括：

获取数据集，统计所述数据集中商品的属性特征数据，以及对应的属性推荐标签；

对所述数据集中的属性特征数据进行掩码，生成第一特征映射字典。

在其中一个实施例中，所述生成第一特征映射字典之后，所述方法还包括：

确定推荐模型的类型，对掩码后的所述数据集进行划分，得到训练集，验证集以及测试集；

根据所述训练集与所述验证集训练推荐模型，在训练完成后，基于所述测试集获取推荐模型的初始模型精度。

第二方面，本申请还提供了一种基于嵌入表压缩的信息推荐装置，所述装置包括：

获取模块，用于获取根据预设压缩比例，确定推荐模型的待压缩嵌入表中的待压缩特征与非压缩特征；

压缩模块，用于基于所述待压缩特征与所述非压缩特征之间的相似度，生成相似度索引矩阵；基于所述相似度索引矩阵，生成索引字典；

索引模块，用于根据所述索引字典对第一特征映射字典进行替换，生成第二特征映射字典，其中，所述第一特征映射字典基于数据集所生成；

预测模块，用于获取待推荐数据，根据所述第二特征映射字典替换所述待推荐数据中的特征，将替换后的特征输入至所述推荐模型，输出预测结果。

第三方面，本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

基于所述相似度索引矩阵，生成索引字典；

第四方面，本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

基于所述相似度索引矩阵，生成索引字典；

上述基于嵌入表压缩的信息推荐方法、装置、计算机设备和存储介质，通过根据预设压缩比例，确定推荐模型的待压缩嵌入表中的待压缩特征与非压缩特征，基于所述待压缩特征与所述非压缩特征之间的相似度，生成相似度索引矩阵。然后基于所述相似度索引矩阵，生成索引字典，根据所述索引字典对第一特征映射字典进行替换，生成第二特征映射字典，其中，所述第一特征映射字典基于数据集所生成。最后在获取待推荐数据后，根据所述第二特征映射字典替换所述待推荐数据中的特征，将替换后的特征输入至所述推荐模型，输出预测结果。实现了在不过度影响推荐模型的模型精度前提下，将推荐模型中的嵌入表进行压缩，进而提高嵌入表的压缩效率，大幅降低模型的存储开销，提高模型的推理速度。

附图说明

图1为一个实施例中基于嵌入表压缩的信息推荐方法的应用环境图；

图2为一个实施例中基于嵌入表压缩的信息推荐方法的流程示意图；

图3为现有技术中嵌入表查表过程的示意图；

图4为一个优选实施例中基于嵌入表压缩的信息推荐方法的流程示意图；

图5为一个示例性实施例中推荐模型压缩后在真实数据集上的压缩效果对比图；

图6为一个实施例中基于嵌入表压缩的信息推荐装置的结构示意图；

图7为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

推荐模型包含很多表，每个表可包含多大千万大小16~300维的嵌入向量，其大小已达10TB级，约99%以上的内存用来存放嵌入表。此外嵌入表在自然语言处理（NaturalLanguage Processing，简称NLP）和图表示学习等大模型里也占据重要位置，因此探索能够高效压缩同时不降低模型推荐精度的压缩方法十分有必要。

本申请实施例提供基于嵌入表压缩的信息推荐方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104进行通信。数据存储***可以存储服务器104需要处理的数据。数据存储***可以集成在服务器104上，也可以放在云上或其他网络服务器上。具体的，服务器104在获取到终端102上传的数据集之后，可根据预设压缩比例，确定推荐模型的待压缩嵌入表中的待压缩特征与非压缩特征，基于所述待压缩特征与所述非压缩特征之间的相似度，生成相似度索引矩阵。然后基于所述相似度索引矩阵，生成索引字典，根据所述索引字典对第一特征映射字典进行替换，生成第二特征映射字典，其中，所述第一特征映射字典基于数据集所生成。最后，获取待推荐数据，根据所述第二特征映射字典替换所述待推荐数据中的特征，将替换后的特征输入至所述推荐模型，输出预测结果。其中，终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑等。该服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

图2为一个实施例中一种基于嵌入表压缩的信息推荐方法的流程示意图，如图2所示，包括以下步骤：

S201，根据预设压缩比例，确定推荐模型的待压缩嵌入表中的待压缩特征与非压缩特征。

其中，预设压缩比例为由专业人员预先确定好的百分点数据，其并非为固定数据，可根据推荐模型的精度进行进一步的调整。进一步的，预设压缩比例可用于确定对应待压缩嵌入表的待压缩特征与非压缩特征的分界位置，进而确定待压缩嵌入表中的待压缩特征与非压缩特征。

待压缩嵌入表为推荐模型嵌入层所存储的数据表格，具体的，可对商品的每个属性或用户的每个行为属性均建立对应的待压缩嵌入表。例如，针对商品的颜色、价格、形状、产地等属性均建立对应的待压缩嵌入表为颜色嵌入表、价格嵌入表、形状嵌入表、产地嵌入表。假设在颜色嵌入表中存在5行数据，则每行数据可表示一种颜色特征类别，颜色嵌入表的行数即为颜色特征类别的数量，而颜色嵌入表的列则表示为嵌入表的向量维度T_N，一般地，嵌入表的向量维度T_N可以为8，16，32，64等2的幂次方。

在一个优选的示例性实施例中，若当前预设压缩比例为40%，对于一个5行的待压缩嵌入表而言，表中前2行属于非压缩特征，后3行数据待压缩特征。

优选的，在本申请实施例中还需要获取待压缩嵌入表的类别数阈值，当待压缩嵌入表的类别数量不大于类别数阈值时，则该待压缩嵌入表并不需要进行压缩。示例性的，若颜色嵌入表中仅存在3种颜色特征类别，而该嵌入表的类别数阈值恰好为3，则此时的颜色嵌入表并不需要进行压缩。

S202，基于所述待压缩特征与所述非压缩特征之间的相似度，生成相似度索引矩阵。

在一个实施例中，所述基于所述压缩特征与所述非压缩特征之间的相似度，生成相似度索引矩阵，包括：基于所述待压缩特征与所述非压缩特征之间的相似度，生成相似度矩阵，确定所述相似度矩阵中每行的矩阵元数值排序，根据所述矩阵元数值排序生成相似度索引矩阵。

其中，在一个实施例中，所述基于所述待压缩特征与所述非压缩特征之间的相似度，生成相似度矩阵，包括：获取所述待压缩特征的第一特征向量，所述非压缩特征的第二特征向量；获取各所述第一特征向量与各所述第二特征向量之间的向量距离，基于所述向量距离确定各所述压缩特征与各所述非压缩特征之间的相似度，生成相似度矩阵。

示例性的，假设当前推荐模型中颜色嵌入表有8个向量维度，其在各维度的值如表1所示。

表1

在该颜色嵌入表中，共有索引号为0至4的5个特征类别，且当前的压缩比例为40%，则可确定每个压缩嵌入表中的前两行表示非压缩特征（第一特征向量），后三行表示待压缩特征（第二特征向量），其中，索引号为对原有的数据集进行掩码后，用于表征对应特征类别的编号。对应的颜色相似度矩阵即为一个2×3的矩阵，矩阵的每行表示一个待压缩特征，矩阵的每列表示一个非压缩特征，每个矩阵元即为一个待压缩特征与一个非压缩特征之间的相似度。

根据表1，通过计算余弦距离获取各所述第一特征向量与各所述第二特征向量之间的向量距离。具体的，余弦距离的计算公式为：

其中，A表示非压缩特征对应的第一特征向量，B表示待压缩特征对应的第二特征向量，表示第一特征向量在第i个向量维度上的值，/>表示第二特征向量在在第i个向量维度上的值，n表示待压缩嵌入表的总向量维度。

进一步的，上述向量距离即可标准两个向量之间的相似度，因此，可基于上述向量距离确定各压缩特征与各非压缩特征之间的相似度，生成相似度矩阵。对应的表2的第一部分即为根据相似度生成的颜色相似度矩阵。同理，针对推荐模型中的其余价格嵌入表、形状嵌入表以及产地嵌入表也可使用余弦距离计算公式其各压缩特征与各非压缩特征之间的相似度，生成对应的价格相似度矩阵、形状相似度矩阵以及产地相似度矩阵。具体的四段结果如表2所示。

表2

可选的，在其他实施例中，还可以根据欧式距离、曼哈顿距离等度量方式确定各压缩特征与各非压缩特征之间的相似度。

在本实施例中，通过确定各压缩特征与各非压缩特征之间的向量距离以确定其对应的相似度，以便于根据相似度确定各压缩特征与非压缩特征之间的关系，为后续根据各个特征之间的关系压缩嵌入表提供了数据基础。

进一步的，在得到相似度矩阵后，可对相似度矩阵中每行的矩阵元进行数值排序，根据矩阵元数值排序确定各待压缩特征的最相似非压缩特征。如表2所示，已根据余弦距离分别计算得到索引号为2的待压缩特征与索引号为0以及索引号为1的非压缩特征之间的相似度，得到索引号为2的待压缩特征与索引号为0的非压缩特征之间的相似度为0.8，与索引号为1的非压缩特征之间的相似度为0.9，对得到的两个相似度进行排序，并根据余弦距离的特性，余弦距离越大的两个向量之间的相似度越大，确定索引号为0的非压缩特征为索引号为2的待压缩特征的最相似非压缩特征。因此，在确定颜色相似度索引矩阵时，第一行可确定为（1，0），其中1表示与待压缩特征最相似的非压缩特征对应的索引号，0表示与待压缩特征第二相似的非压缩特征对应的索引号。同理，针对索引号为3和4的待压缩特征，根据其相似度矩阵可确定的颜色相似度索引矩阵如表3所示。同理，根据表2中的价格相似度矩阵、形状相似度矩阵以及产地相似度矩阵，对应得到的价格相似度索引矩阵、形状相似度索引矩阵以及产地相似度索引矩阵也如表3所示。在相似度索引矩阵中，矩阵每行表征待压缩特征，每列表示非压缩特征，矩阵元表示各待压缩特征与各非压缩特征是否相似，其中1表示相似，0表示不相似。

表3

在本实施例中，通过待压缩特征与非压缩特征之间的相似度确定每个特征对应的相似度索引矩阵，能够借助待压缩特征与非压缩特征之间的相似度快速确定两者之间的索引映射关系，为后续对嵌入表进行压缩提供了数据支持，进而实现了对待压缩嵌入表的快速压缩。

S203，基于所述相似度索引矩阵，生成索引字典。

具体的，可根据相似度索引矩阵中各待压缩特征与各非压缩特征是否相似确定对应各待压缩特征与各非压缩特征之间的索引关系，根据索引关系生成索引字典。具体的，在确定某一待压缩特征与某一非压缩特征相似时，可确定上述待压缩特征与上述非压缩特征可进行索引映射，在确定某一待压缩特征与某一非压缩特征不相似时，则确定上述待压缩特征与上述非压缩特征不存在索引映射关系。示例性的，根据表3中的颜色索引矩阵所示，可确定索引号2对应的待压缩特征与索引号0对应的非压缩特征相似，与索引号1对应的非压缩特征不相似，则可确定索引号2对应的待压缩特征与索引号0对应的非压缩特征存在索引映射关系，在压缩嵌入表中可通过上述索引映射关系确定将索引号2对应的待压缩特征的数据，无需记录该待压缩特征本身的数据。同理，可知索引号为3的待压缩特征与索引号为1的非压缩特征之间存在索引映射关系，索引号为4的待压缩特征与索引号为1的非压缩特征之间存在索引映射关系，对应的可得到颜色索引字典为：{0ABCDE:0，A0BCDE:1，AB0CDE:1，ABC0DE:0，ABCD0E:0}。

同理，根据表3可确定价格索引字典为：{1ABCDE:0，A1BCDE:1，AB1CDE:1，ABC1DE:1，ABCD1E:1}，形状索引字典为：{2ABCDE:0，A2BCDE:1，AB2CDE:0，ABC2DE:0，ABCD2E:1}，产地字索引典为：{3ABCDE:0，A3BCDE:1，AB3CDE:1，ABC3DE:1，ABCD3E:0}。

即可得到索引字典为：颜色索引字典{0ABCDE:0，A0BCDE:1，AB0CDE:1，ABC0DE:0，ABCD0E:0}，价格索引字典{1ABCDE:0，A1BCDE:1，AB1CDE:1，ABC1DE:1，ABCD1E:1}，形状索引字典{2ABCDE:0，A2BCDE:1，AB2CDE:0，ABC2DE:0，ABCD2E:1}，产地索引字典{3ABCDE:0，A3BCDE:1，AB3CDE:1，ABC3DE:1，ABCD3E:0}。

S204，根据所述索引字典对第一特征映射字典进行替换，生成第二特征映射字典，其中，所述第一特征映射字典基于数据集所生成。

具体的，在一个实施例中，所述第一特征映射字典基于数据集所生成包括：获取数据集，统计所述数据集中商品的属性特征数据，以及对应的属性推荐标签，对所述数据集中的属性特征数据进行掩码，生成第一特征映射字典。

本申请实施例中，在对推荐模型中的嵌入表进行压缩之前，还需要预先确定推荐算法以及对应的数据集，由于基于不同网络模型的推荐算法以及不同的大规模数据集所对应的推荐模型的嵌入表的数量和维度均不相同，因此在本实施例中，需要预先确定数据集以及对应的算法。

在上述颜色嵌入表、形状嵌入表、价格嵌入表以及产地嵌入表对应的一个示例性实施例中，获取到的数据集如表4所示，对应的采用的推荐模型为DLRM模型，标签表示模型训练过程中的对比目标（target），其中0表示不推荐，1表示推荐。

表4

统计表4中的商品的属性特征数据可知本示例性实施例中存在四种属性特征，分别为颜色、价格、形状以及产地，因此，该数据集中嵌入表的个数为4，分别为颜色嵌入表、价格嵌入表、形状嵌入表以及产地嵌入表。

进一步的，在确定商品的属性特征数据之后，还需要确定每个嵌入表中包含的每个类别对应的数量T_M。根据表2所示，可知对于颜色嵌入表而言，其包含5个特征类别，分别为0ABCDE、A0BCDE、AB0CDE、ABC0DE、ABCD0E，其中，特征类别0ABCDE对应的数量为6，特征类别A0BCDE对应的数量为5，特征类别AB0CDE对应的数量为4，特征类别ABC0DE对应的数量为3，特征类别ABCD0E对应的数量为2。同理可知，对于价格嵌入表而言，其包含5个特征类别，分别为0ABCDE、A0BCDE、AB0CDE、ABC0DE、ABCD0E，其中，特征类别0ABCDE对应的数量为6，特征类别A0BCDE对应的数量为5，特征类别AB0CDE对应的数量为4，特征类别ABC0DE对应的数量为3，特征类别ABCD0E对应的数量为2。对于形状嵌入表而言，其包含5个特征类别，分别为0ABCDE、A0BCDE、AB0CDE、ABC0DE、ABCD0E，其中，特征类别0ABCDE对应的数量为6，特征类别A0BCDE对应的数量为5，特征类别AB0CDE对应的数量为4，特征类别ABC0DE对应的数量为3，特征类别ABCD0E对应的数量为2。对于产地嵌入表而言，其包含5个特征类别，分别为0ABCDE、A0BCDE、AB0CDE、ABC0DE、ABCD0E，其中，特征类别0ABCDE对应的数量为6，特征类别A0BCDE对应的数量为5，特征类别AB0CDE对应的数量为4，特征类别ABC0DE对应的数量为3，特征类别ABCD0E对应的数量为2。

需要说明的是，在实际的应用场景中特征类别的数量T_M非常庞大，可达到千万或者亿万级别，特征类别的数量T_M越大即其对存储的要求也越大。一般的，特征类别的数量T_M由数据集中某一商品的某个特征类别的数量所决定。上述实施例中所展示的特征类别的数量仅用于示例性说明，在本申请中并不进行具体的限定。

可以理解的是，考虑到实际应用场景中的数据隐私问题，一般的，用户的属性特征以及商品的数据特征均要要进行加密掩码处理，生成第一特征映射字典，以确保数据的安全性。在本实施例中，第一特征映射字典主要由如下步骤实现：

步骤一、构建特征-数量字典{key，value}，在特征-数量字典中key为特征类别，value为该特征类别的数量，且key需要根据value的值从大到小进行排列。根据对上述数据集（表2）的统计结果可知，在本示例性实施例中，可构建四个特征-数量字典，分别为颜色字典{0ABCDE:6，A0BCDE:5，AB0CDE:4，ABC0DE:3，ABCD0E:2}、价格字典{1ABCDE:6，A1BCDE:5，AB1CDE:4，ABC1DE:3，ABCD1E:2}、形状字典{2ABCDE:6，A2BCDE:5，AB2CDE:4，ABC2DE:3，ABCD2E:2}以及产地字典{3ABCDE:6，A3BCDE:5，AB3CDE:4，ABC3DE:3，ABCD3E:2}。

步骤二、根据特征-数量字典构建第一特征映射字典{key，value}，在第一特征映射字典key为特征，value为整数。在本步骤中，value根据特征-数量字典的特征类别的数量大小所确定，从0开始，按顺序递增进行编号，直至编码完所有特征，对应的建第一特征映射字典分别为：颜色特征映射字典{0ABCDE:0，A0BCDE:1，AB0CDE:2，ABC0DE:3，ABCD0E:4}，价格特征映射字典{1ABCDE:0，A1BCDE:1，AB1CDE:2，ABC1DE:3，ABCD1E:4}，形状特征映射字典{2ABCDE:0，A2BCDE:1，AB2CDE:2，ABC2DE:3，ABCD2E:4}，产地特征映射字典{3ABCDE:0，A3BCDE:1，AB3CDE:2，ABC3DE:3，ABCD3E:4}。其中，编号0至4为每个特征中各个特征类别的初始的索引号，用于对对应的特征类别进行掩码。

进一步的，基于第一特征映射字典对数据集中的各个特征进行转换即可得到如表5所示的掩码数据集。

表5

在本实施例中，通过对数据集进行预处理，对数据集中的数据进行掩码，并构建对应的第一特征映射字典，以便于后续在对嵌入表进行压缩时，能够快速确定待压缩嵌入表，为后续提高嵌入表的压缩效率提供基础。

进一步的，即可根据索引字典颜色索引字典{0ABCDE:0，A0BCDE:1，AB0CDE:1，ABC0DE:0，ABCD0E:0}，价格索引字典{1ABCDE:0，A1BCDE:1，AB1CDE:1，ABC1DE:1，ABCD1E:1}，形状索引字典{2ABCDE:0，A2BCDE:1，AB2CDE:0，ABC2DE:0，ABCD2E:1}，产地索引字典{3ABCDE:0，A3BCDE:1，AB3CDE:1，ABC3DE:1，ABCD3E:0}对第一特征映射字典颜色特征映射字典{0ABCDE:0，A0BCDE:1，AB0CDE:2，ABC0DE:3，ABCD0E:4}，价格特征映射字典{1ABCDE:0，A1BCDE:1，AB1CDE:2，ABC1DE:3，ABCD1E:4}，形状特征映射字典{2ABCDE:0，A2BCDE:1，AB2CDE:2，ABC2DE:3，ABCD2E:4}，产地特征映射字典{3ABCDE:0，A3BCDE:1，AB3CDE:2，ABC3DE:3，ABCD3E:4}进行替换，替换后的结果为：颜色特征映射字典{0ABCDE:0，A0BCDE:1，AB0CDE:1，ABC0DE:0，ABCD0E:0}，价格特征映射字典{1ABCDE:0，A1BCDE:1，AB1CDE:1，ABC1DE:1，ABCD1E:1}，形状特征映射字典{2ABCDE:0，A2BCDE:1，AB2CDE:0，ABC2DE:0，ABCD2E:1}，产地特征映射字典{3ABCDE:0，A3BCDE:1，AB3CDE:1，ABC3DE:1，ABCD3E:0}。

S205，获取待推荐数据，根据所述第二特征映射字典替换所述待推荐数据中的特征，将替换后的特征输入至所述推荐模型，输出预测结果。

示例性的，图3为一个实施例中嵌入表查表过程的示意图。如图3所示，在获取到待推荐数据，确定该待推荐数据中存在两个特征（sparse feature #1；sparse feature #2），对应于两组标识（1245；4329），可借助嵌入表（Embedding Table）查询每组特征标识对应的值，然后根据查找结果生成对应的向量输出（embedding output #1；embedding output #2），再由推荐模型中的神经网络根据嵌入表查表后输出的向量确定对应的预测结果进行输出。

在本申请实施例中，当推荐模型对新的推荐数据进行预测时，在特征映射时，并不需要映射嵌入表第三行及之后的向量，即推荐模型中不需要保存嵌入表矩阵第三行及之后的矩阵，进而达到了模型压缩的目的。

上述基于嵌入表压缩的信息推荐方法中，根据预设压缩比例，确定推荐模型的待压缩嵌入表中的待压缩特征与非压缩特征，基于所述待压缩特征与所述非压缩特征之间的相似度，生成相似度索引矩阵。进而实现了通过获取推荐模型嵌入表中各个特征类别之间的相似度确定各个特征类别之间的索引映射关系。然后基于所述相似度索引矩阵，生成索引字典；根据所述索引字典对第一特征映射字典进行替换，生成第二特征映射字典，其中，所述第一特征映射字典基于数据集所生成。进而实现了根据上述各个特征类别之间的索引映射关系对推荐模型中的嵌入表进行压缩，最后获取待推荐数据，根据所述第二特征映射字典替换所述待推荐数据中的特征，将替换后的特征输入至所述推荐模型，输出预测结果。进而在对推荐模型进行压缩时，能够在不影响推荐模型的模型精度的前提下，将推荐模型中的嵌入表进行压缩，进而提高嵌入表的压缩效率，大幅降低模型的存储开销，提高模型的推理速度。

在一个实施例中，所述生成第二特征映射字典之后，所述方法还包括：基于所述第二特征映射字典更新推荐模型，获取所述推荐模型的当前模型精度。获取推荐模型的初始模型精度，根据所述初始模型精度与所述当前模型精度确定推荐模型的模型精度变化值。判断所述模型精度变化值是否不大于预设模型精度下降阈值，若是，则保存所述第二特征映射字典。

可以理解的是，在第一特征映射字典被替换之后，推荐模型中保存的嵌入表也将发生变化，相应的推荐模型的模型精度也随之产生的变化。因此，在本实施例中，还需要对推荐模型的模型精度的变化值进行测试，确定推荐模型的精度变化值。具体的，可借助预先确定的测试集再次验证推荐模型的当前模型精度，对比推荐模型的初始模型精度和当前模型精度确定模型精度变化值。然后获取预设的模型精度下降阈值t_v，若模型精度变化值不大于预设模型精度下降阈值t_v，则说明当前的模型精度变化值处于推荐模型的模型精度下降可接受范围，第二特征映射字典可用，直接保存使用即可。

在本实施例中，通过判断推荐模型的模型精度变化值是否处于推荐模型的模型精度下降可接受范围，确保了在压缩嵌入表的同时不过度影响推荐模型的模型精度，进而能够在压缩推荐模型中嵌入表的同时确保模型的模型精度。

在一个实施例中，若所述模型精度变化值大于预设模型精度下降阈值，则更改所述压缩比例，重新获取第二特征映射字典，直至所述推荐模型的模型精度变化值不大于预设模型精度阈值。

在本实施例中，在推荐模型当前的模型精度变化值超出推荐模型的模型精度下降可接受范围的情况下，则说明当前的压缩比例过大或过小，需要重新调整压缩比例，避免推荐模型的模型精度过度下降。示例性的，可适当减小压缩比例，然后重新对原有的待压缩嵌入表进行压缩，获取新的第二特征映射字典，然后再获取对应的推荐模型的模型精度变化值，判断新的模型精度变化值是否处于推荐模型的模型精度下降可接受范围，若是，则可保存该新的第二特征映射字典。若否，则还是需要继续调整压缩比例，直至该压缩比例对应的推荐模型的模型精度变化值处于模型精度下降可接受范围。

在本实施例中，在判断推荐模型的模型精度变化值超出推荐模型的模型精度下降可接受范围时，及时调整了待压缩嵌入表的压缩比例，以确保在能够提高模型的压缩效率的同时又能保证推荐模型模型精度不过度受到嵌入表压缩的影响。

在一个实施例中，所述生成第一特征映射字典之后，所述方法还包括：确定推荐模型的类型，对掩码后的所述数据集进行划分，得到训练集，验证集以及测试集。根据所述训练集与所述验证集训练推荐模型，在训练完成后，基于所述测试集获取推荐模型的初始模型精度。

常见的推荐模型有wide&deep、DLRM、DeepFM等，在本实施例中，以DLRM模型为例，在对推荐模型进行训练之前，还需要对上述掩码后的数据集进行划分，得到训练集，验证集以及测试集。示例性的可将划分比例设置为8：1：1。然后通过训练集对推荐模型进行训练，借助验证集验证推荐模型的输出结果，直至推荐模型收敛，即模型精度不在提高，最后在测试集上验证推荐模型的初始模型精度。

在本实施例中，在获取到数据集对应的第一特征映射字典之后，对所用的推荐模型进行了预训练，然后获取推荐模型的初始模型精度，以便于后续推荐模型在随着嵌入表的压缩发生变化时能够及时发现推荐模型的模型精下降情况，避免嵌入表的压缩导致推荐模型的模型精度过度下降。

图4为一个优选实施例中基于嵌入表压缩的信息推荐方法的流程示意图，如图4所示，在确定推荐算法以及获取到对应的数据集之后，可先确定数据集中待压缩嵌入表的数量T_T，然后对上述待压缩嵌入表中的数据进行排序，并构建第一特征映射字典。之后，再根据第一特征映射字典训练推荐模型直至模型收敛。在推荐模型训练完成之后，即可通过推荐模型输出得到待压缩嵌入表对应的T_T个嵌入表矩阵，然后可设定待压缩嵌入表的类别数阈值cat_num，确定每个待压缩嵌入表矩阵中的行数Len(table)是否大于上述类别数阈值cat_num，若是则则对待压缩嵌入表进行压缩，设定对应的百分位数P_num，即压缩比例，根据百分位数确定待压缩嵌入表中待压缩特征与非压缩特征之间的分界点，压缩待压缩特征，保留非压缩特征。然后再确定计算待压缩特征与非压缩特征之间相似度的度量方式，根据预设度量方式计算待压缩嵌入表对应的相似度矩阵simi_mat，在相似度矩阵中，行表示待压缩嵌入表的行，列表示待压缩嵌入表的每行与非压缩矩阵每行的相似度值。接着求出相似度矩阵每行最大的前N个索引列表，以确定对应的相似度索引矩阵。然后再设定预设模型精度下降阈值，判断当前模型精度变化值是否大于预设模型精度下降阈值，进而确定增加压缩比例或者减少压缩比例，具体的，若当前模型精度变化值不大于预设模型精度下降阈值，若是，则保存相似度索引矩阵，进行下一个嵌入表的压缩，直至所有的待压缩嵌入表完成压缩，否则重新设定百分位数P_num，重新进行本待压缩嵌入表的压缩，直至推荐模型的模型精度变化值不大于预设模型精度下降阈值。在完成所有待压缩嵌入表的压缩之后，对于T_T个相似度索引矩阵，取对应相似度索引矩阵中最相似的前N个索引对应的特征向量，生成对应的索引字典，使用索引字典替换第一特征映射字典得到对应的第二特征映射字典。优选的，在生成索引字典时，可对最相似的前N个索引对应的向量进行ReLU激活后取平均值进而得到新的待压缩向量，根据新的待压缩向量生成索引字典，以进一步提高模型精度，通过上述激活后的待压缩向量建立索引字典，并生成对应的第二特征映射字典能够使得推荐模型的模型精度有效提高，对应的压缩后推荐模型的模型精度能够超过未压缩模型的模型精度。

对应的，图5为一个示例性实施例中推荐模型压缩后在真实数据集上的压缩效果对比图，如图5所示，未压缩前的原始模型其所需的存储空间为2160MB，在现有商余法、组合法仅能将压缩比控制在10以内，压缩后的推荐模型仍需要较大的存储空间，而本申请，却够将压缩比提高至100以上，压缩后的推荐模型其存储开销明显降低。

应该理解的是，虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

基于同样的发明构思，本申请实施例还提供了一种用于实现上述所涉及的基于嵌入表压缩的信息推荐方法的基于嵌入表压缩的信息推荐装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似，故下面所提供的一个或多个基于嵌入表压缩的信息推荐装置实施例中的具体限定可以参见上文中对于基于嵌入表压缩的信息推荐方法的限定，在此不再赘述。

图6为一个实施例中基于嵌入表压缩的信息推荐装置的结构示意图，包括：获取模块61、压缩模块62、索引模块63和预测模块64，其中：

获取模块61，用于获取根据预设压缩比例，确定推荐模型的待压缩嵌入表中的待压缩特征与非压缩特征；

压缩模块62，用于基于所述待压缩特征与所述非压缩特征之间的相似度，生成相似度索引矩阵；基于所述相似度索引矩阵，生成索引字典；

索引模块63，用于根据所述索引字典对第一特征映射字典进行替换，生成第二特征映射字典，其中，所述第一特征映射字典基于数据集所生成；

预测模块64，用于获取待推荐数据，根据所述第二特征映射字典替换所述待推荐数据中的特征，将替换后的特征输入至所述推荐模型，输出预测结果。

上述基于嵌入表压缩的信息推荐装置中，根据预设压缩比例，确定推荐模型的待压缩嵌入表中的待压缩特征与非压缩特征，基于所述待压缩特征与所述非压缩特征之间的相似度，生成相似度索引矩阵。进而实现了通过获取推荐模型嵌入表中各个特征类别之间的相似度确定各个特征类别之间的索引映射关系。然后基于所述相似度索引矩阵，生成索引字典；根据所述索引字典对第一特征映射字典进行替换，生成第二特征映射字典，其中，所述第一特征映射字典基于数据集所生成。进而实现了根据上述各个特征类别之间的索引映射关系对推荐模型中的嵌入表进行压缩，最后获取待推荐数据，根据所述第二特征映射字典替换所述待推荐数据中的特征，将替换后的特征输入至所述推荐模型，输出预测结果。进而在对推荐模型进行压缩时，能够在不影响推荐模型的模型精度的前提下，将推荐模型中的嵌入表进行压缩，进而提高嵌入表的压缩效率，大幅降低模型的存储开销，提高模型的推理速度。

进一步的，压缩模块62还用于基于所述待压缩特征与所述非压缩特征之间的相似度，生成相似度矩阵；

确定所述相似度矩阵中每行的矩阵元数值排序；

根据所述矩阵元数值排序生成相似度索引矩阵。

进一步的，压缩模块62还用于获取所述待压缩特征的第一特征向量，所述非压缩特征的第二特征向量；

进一步的，索引模块63还用于基于所述第二特征映射字典更新推荐模型，获取所述推荐模型的当前模型精度；

进一步的，索引模块63还用于若所述模型精度变化值大于预设模型精度下降阈值，则更改所述压缩比例，重新获取第二特征映射字典，直至所述推荐模型的模型精度变化值不大于预设模型精度阈值。

进一步的，所述装置还包括预处理模块65，用于获取数据集，统计所述数据集中商品的属性特征数据，以及对应的属性推荐标签；

进一步的，所述装置还包括训练模块66，用于确定推荐模型的类型，对掩码后的所述数据集进行划分，得到训练集，验证集以及测试集；

上述基于嵌入表压缩的信息推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图7所示。该计算机设备包括通过***总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信，无线方式可通过WIFI、移动蜂窝网络、NFC（近场通信）或其他技术实现。该计算机程序被处理器执行时以实现一种基于嵌入表压缩的信息推荐方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图7中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现以下步骤：

基于所述相似度索引矩阵，生成索引字典；

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

基于所述相似度索引矩阵，生成索引字典；

需要说明的是，本申请所涉及的用户信息（包括但不限于用户设备信息、用户个人信息等）和数据（包括但不限于用于分析的数据、存储的数据、展示的数据等），均为经用户授权或者经过各方充分授权的信息和数据。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器（Read-OnlyMemory，ROM）、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器（ReRAM）、磁变存储器（Magnetoresistive Random Access Memory，MRAM）、铁电存储器（Ferroelectric Random Access Memory，FRAM）、相变存储器（Phase Change Memory，PCM）、石墨烯存储器等。易失性存储器可包括随机存取存储器（Random Access Memory，RAM）或外部高速缓冲存储器等。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器（Static Random AccessMemory，SRAM）或动态随机存取存储器（Dynamic RandomAccess Memory，DRAM）等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等，不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等，不限于此。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请的保护范围应以所附权利要求为准。

Claims

1.一种基于嵌入表压缩的信息推荐方法，其特征在于，所述方法包括：

获取所述待压缩特征的第一特征向量，所述非压缩特征的第二特征向量；获取各所述第一特征向量与各所述第二特征向量之间的向量距离，基于所述向量距离确定各所述压缩特征与各所述非压缩特征之间的相似度，生成相似度矩阵；确定所述相似度矩阵中每行的矩阵元数值排序；根据所述矩阵元数值排序生成相似度索引矩阵；

基于所述相似度索引矩阵，生成索引字典；

根据所述索引字典对第一特征映射字典进行替换，生成第二特征映射字典，其中，所述第一特征映射字典基于对数据集中的属性特征数据进行掩码所生成；

2.根据权利要求1所述的方法，其特征在于，所述生成第二特征映射字典之后，所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，若所述模型精度变化值大于预设模型精度下降阈值，则更改所述压缩比例，重新获取第二特征映射字典，直至所述推荐模型的模型精度变化值不大于预设模型精度阈值。

4.根据权利要求1所述的方法，其特征在于，所述第一特征映射字典基于数据集所生成包括：

5.根据权利要求4所述的方法，其特征在于，所述生成第一特征映射字典之后，所述方法还包括：

6.一种基于嵌入表压缩的信息推荐装置，其特征在于，所述装置包括：

压缩模块，用于获取所述待压缩特征的第一特征向量，所述非压缩特征的第二特征向量；获取各所述第一特征向量与各所述第二特征向量之间的向量距离，基于所述向量距离确定各所述压缩特征与各所述非压缩特征之间的相似度，生成相似度矩阵；确定所述相似度矩阵中每行的矩阵元数值排序；根据所述矩阵元数值排序生成相似度索引矩阵；基于所述相似度索引矩阵，生成索引字典；

索引模块，用于根据所述索引字典对第一特征映射字典进行替换，生成第二特征映射字典，其中，所述第一特征映射字典基于对数据集中的属性特征数据进行掩码所生成；

7.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至权利要求5中任一项所述的方法的步骤。

8.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至权利要求5中任一项所述的方法的步骤。