CN113744006A - 类目推荐方法、装置、电子设备及存储介质 - Google Patents
类目推荐方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113744006A CN113744006A CN202010476089.4A CN202010476089A CN113744006A CN 113744006 A CN113744006 A CN 113744006A CN 202010476089 A CN202010476089 A CN 202010476089A CN 113744006 A CN113744006 A CN 113744006A
- Authority
- CN
- China
- Prior art keywords
- category
- prediction
- specified
- hierarchy
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 83
- 238000000605 extraction Methods 0.000 claims description 49
- 238000012549 training Methods 0.000 claims description 39
- 238000012545 processing Methods 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 12
- 230000002829 reductive effect Effects 0.000 abstract description 11
- 238000007781 pre-processing Methods 0.000 description 37
- 230000008569 process Effects 0.000 description 35
- 239000013598 vector Substances 0.000 description 34
- 238000010586 diagram Methods 0.000 description 17
- 235000013305 food Nutrition 0.000 description 8
- 238000013507 mapping Methods 0.000 description 8
- 230000009286 beneficial effect Effects 0.000 description 7
- 238000001914 filtration Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 6
- 230000011218 segmentation Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 235000011888 snacks Nutrition 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 235000005135 Micromeria juliana Nutrition 0.000 description 1
- 241000246354 Satureja Species 0.000 description 1
- 235000007315 Satureja hortensis Nutrition 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000012550 audit Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 235000015895 biscuits Nutrition 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 235000014571 nuts Nutrition 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Game Theory and Decision Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提供了一种类目推荐方法、装置、电子设备及存储介质,所述方法包括:获取待进行类目推荐的目标商品的文字描述和/或图片;将所述文字描述和/或图片输入预先建立的类目推荐模型中,通过所述类目推荐模型同时进行多个类目预测任务,获取多个类目预测结果;所述多个类目预测任务分别与指定类目体系所包括的多个层级一一对应;所述类目预测任务用于预测所述目标商品在其中一个层级中被划分到的类目;将符合预设条件的类目预测结果作为推荐类目输出。本实施例无需用户进行繁琐的手动选择类目的操作,减少用户的操作步骤,提高用户的使用体验。
Description
技术领域
本公开涉及计算机软件技术领域,尤其涉及一种类目推荐方法、装置、电子设备及存储介质。
背景技术
随着电子商务平台的蓬勃发展,电子商务平台的商品数以亿计,分类规模已达数万,用户需求多样,覆盖的市场范围极大。
在商家上传商品的过程中,需要填写商品对应的类目信息,比如服装、食品等,实现对所述商品的归类过程,便于根据商品分类向用户推荐该商品或进行其他业务。但是在类目数量非常多的情况下,商家在选择商品类目的过程中,非常耗时,甚至在不熟悉电商平台的情况下,商家也不清楚自己的商品属于哪些类目,可能导致归类错误的情况发生,不利于用户的使用体验。
发明内容
为克服相关技术中存在的问题,本公开提供了一种类目推荐方法、装置、电子设备及存储介质。
根据本公开实施例的第一方面,提供一种类目推荐方法,包括:
获取待进行类目推荐的目标商品的文字描述和/或图片;
将所述文字描述和/或图片输入预先建立的类目推荐模型中,通过所述类目推荐模型同时进行多个类目预测任务,获取多个类目预测结果;所述多个类目预测任务分别与指定类目体系所包括的多个层级一一对应;所述类目预测任务用于预测所述目标商品在其中一个层级中被划分到的类目;
将符合预设条件的类目预测结果作为推荐类目输出。
可选地,所述类目推荐模型通过以下步骤训练得到:
获取训练样本;所述训练样本至少包括若干商品的文字描述或图片,每一所述商品对应多个标签,每一所述标签表征在指定类目体系的其中一个层级中所述商品被划分到的类目;不同所述标签对应所述指定类目体系中的不同层级;
将所述训练样本输入指定模型中,通过所述指定模型同时进行多个类目预测任务,获得多个预测结果;所述多个类目预测任务分别与所述指定类目体系所包括的多个层级一一对应;所述类目预测任务用于预测所述商品在其中一个层级中被划分到的类目;
将属于同一层级的所述预测结果与所述标签进行比对,根据比对结果反向调整用于构建所述指定模型的参数,获得所述类目推荐模型。
可选地,所述指定类目体系包括根层级、非叶子层级和叶子层级,各个层级之间的关系以树状关系表示;
所述将属于同一层级的所述预测结果与所述标签进行比对,根据比对结果反向调整用于构建所述指定模型的参数,包括:
按照从叶子层级到根层级的顺序,依次将属于同一层级的所述预测结果与所述标签进行对比,根据比对结果确定本层级是否预测正确;
若本层级预测错误,继续下一层级的比对步骤;
若本层级预测正确或者所有层级均预测错误,结束层级之间的比对步骤并执行以下步骤:基于预设的损失函数分别计算预测错误的层级对应的所述预测结果与所述标签之间的损失值;将预测错误的层级对应的所述损失值累加,得到所述指定模型的损失值;根据所述指定模型的损失值调整用于构建所述指定模型的参数,获得所述类目推荐模型。
可选地,所述指定类目体系包括根层级、非叶子层级和叶子层级,各个层级之间的关系以树状关系表示;
所述多个类目预测结果与所述指定类目体系中的各个层级一一对应;
所述将符合预设条件的类目预测结果作为推荐类目输出,包括:
将叶子层级对应的类目预测结果作为推荐类目输出。
可选地,还包括:
根据所述推荐类目以及所述指定类目体系各个层级之间的树状关系,获取所述推荐类目对应的根层级的类目并输出。
可选地,所述将符合预设条件的类目预测结果作为推荐类目输出,包括:
根据预存的类目体系映射关系,将所述符合预设条件的类目预测结果转换为第三方平台的类目;所述类目体系映射关系表示所述指定类目体系中的类目与第三方平台的类目体系中的类目之间的对应关系;
将所述第三方平台的类目作为所述目标商品的推荐类目输出。
可选地,所述类目推荐模型至少包括文字特征提取网络和/或图片特征提取网络;
所述文字提取网络用于对所述目标商品的文字描述进行特征提取,获取文字特征;所述文字特征用于预测所述目标商品在各个层级中被划分到的类目;
所述图片特征提取网络用于对所述目标商品的图片进行特征提取,获取图片特征;所述图片特征用于预测所述目标商品在各个层级中被划分到的类目。
可选地,所述文字特征提取网络包括预处理层、嵌入层以及第一拼接层;
所述预处理层用于对所述目标商品的文字描述进行预处理,获取多个单词;
所述嵌入层用于分别将多个所述单词转化为嵌入向量;
所述第一拼接层用于对多个所述嵌入向量进行拼接,获取所述文字特征;所述文字特征用于预测所述目标商品在各个层级中被划分到的类目。
可选地,所述文字特征提取网络还包括文字识别层;
所述文字识别层用于对所述目标商品的图片中的文字进行识别,获取文字识别结果;
所述预处理层具体用于对所述目标商品的文字描述和/或所述文字识别结果进行预处理,获取多个单词;所述单词用于预测所述目标商品在各个层级中被划分到的类目。
可选地,所述文字特征提取网络还包括图片分类器;
所述图片分类器用于对所述目标商品的图片进行识别,获取商品标签;所述商品标签表征对所述目标商品的图片的识别结果;
所述预处理层具体用于对所述目标商品的文字描述和/或所述商品标签进行预处理,获取多个单词;所述单词用于预测所述目标商品在各个层级中被划分到的类目。
可选地,所述预处理的过程包括以下至少一种操作:
过滤指定文字的操作、文字拼接操作以及分词操作。
可选地,所述类目推荐模型还包括第二拼接层;
所述第二拼接层用于对所述文字特征和图片特征进行拼接,获取拼接特征;所述拼接特征用于预测所述目标商品在各个层级中被划分到的类目。
可选地,所述类目推荐模型还包括分别对应于所述类目预测任务的多个预测网络;
所述预测网络用于对所述拼接特征进行处理,获取所述目标商品在相应层级对应的类目预测结果。
可选地,每一所述预测网络由多个全连接层依次连接构成。
根据本公开实施例的第二方面,提供一种类目推荐装置,包括:
目标商品信息获取模块,用于获取待进行类目推荐的目标商品的文字描述和/或图片;
类目预测结果获取模块,用于将所述文字描述和/或图片输入预先建立的类目推荐模型中,通过所述类目推荐模型同时进行多个类目预测任务,获取多个类目预测结果;所述多个类目预测任务分别与指定类目体系所包括的多个层级一一对应;所述类目预测任务用于预测所述目标商品在其中一个层级中被划分到的类目;
推荐类目输出模块,用于将符合预设条件的类目预测结果作为推荐类目输出。
可选地,所述类目推荐模型通过以下模块得到:
训练样本获取模块,用于获取训练样本;所述训练样本至少包括若干商品的文字描述或图片,每一所述商品对应多个标签,每一所述标签表征在指定类目体系的其中一个层级中所述商品被划分到的类目;不同所述标签对应所述指定类目体系中的不同层级;
预测结果获取模块,用于将所述训练样本输入指定模型中,通过所述指定模型同时进行多个类目预测任务,获得多个预测结果;所述多个类目预测任务分别与所述指定类目体系所包括的多个层级一一对应;所述类目预测任务用于预测所述商品在其中一个层级中被划分到的类目;
类目推荐模型获取模块,用于将属于同一层级的所述预测结果与所述标签进行比对,根据比对结果反向调整用于构建所述指定模型的参数,获得所述类目推荐模型。
可选地,所述指定类目体系包括根层级、非叶子层级和叶子层级,各个层级之间的关系以树状关系表示;
所述类目推荐模型获取模块包括:
比对模块,用于按照从叶子层级到根层级的顺序,依次将属于同一层级的所述预测结果与所述标签进行对比,根据比对结果确定本层级是否预测正确;
第一执行模块,用于若本层级预测错误,继续下一层级的比对步骤;
第二执行模块,用于若本层级预测正确或者所有层级均预测错误,结束层级之间的比对步骤并执行以下步骤:基于预设的损失函数分别计算预测错误的层级对应的所述预测结果与所述标签之间的损失值;将预测错误的层级对应的所述损失值累加,得到所述指定模型的损失值;根据所述指定模型的损失值调整用于构建所述指定模型的参数,获得所述类目推荐模型。
可选地,所述指定类目体系包括根层级、非叶子层级和叶子层级,各个层级之间的关系以树状关系表示;
所述多个类目预测结果与所述指定类目体系中的各个层级一一对应;
所述推荐类目输出模块包括:
将叶子层级对应的类目预测结果作为推荐类目输出。
可选地,还包括:
类目输出模块,用于根据所述推荐类目以及所述指定类目体系各个层级之间的树状关系,获取所述推荐类目对应的根层级的类目并输出。
可选地,所述推荐类目输出模块包括:根据预存的类目体系映射关系,将所述符合预设条件的类目预测结果转换为第三方平台的类目;所述类目体系映射关系表示所述指定类目体系中的类目与第三方平台的类目体系中的类目之间的对应关系;将所述第三方平台的类目作为所述目标商品的推荐类目输出。
可选地,所述类目推荐模型至少包括文字特征提取网络和/或图片特征提取网络;
所述文字提取网络用于对所述目标商品的文字描述进行特征提取,获取文字特征;所述文字特征用于预测所述目标商品在各个层级中被划分到的类目;
所述图片特征提取网络用于对所述目标商品的图片进行特征提取,获取图片特征;所述图片特征用于预测所述目标商品在各个层级中被划分到的类目。
可选地,所述文字特征提取网络包括预处理层、嵌入层以及第一拼接层;
所述预处理层用于对所述目标商品的文字描述进行预处理,获取多个单词;
所述嵌入层用于分别将多个所述单词转化为嵌入向量;
所述第一拼接层用于对多个所述嵌入向量进行拼接,获取所述文字特征;所述文字特征用于预测所述目标商品在各个层级中被划分到的类目。
可选地,所述文字特征提取网络还包括文字识别层;
所述文字识别层用于对所述目标商品的图片中的文字进行识别,获取文字识别结果;
所述预处理层具体用于对所述目标商品的文字描述和/或所述文字识别结果进行预处理,获取多个单词;所述单词用于预测所述目标商品在各个层级中被划分到的类目。
可选地,所述文字特征提取网络还包括图片分类器;
所述图片分类器用于对所述目标商品的图片进行识别,获取商品标签;所述商品标签表征对所述目标商品的图片的识别结果;
所述预处理层具体用于对所述目标商品的文字描述和/或所述商品标签进行预处理,获取多个单词;所述单词用于预测所述目标商品在各个层级中被划分到的类目。
可选地,所述预处理的过程包括以下至少一种操作:
过滤指定文字的操作、文字拼接操作以及分词操作。
可选地,所述类目推荐模型还包括第二拼接层;
所述第二拼接层用于对所述文字特征和图片特征进行拼接,获取拼接特征;所述拼接特征用于预测所述目标商品在各个层级中被划分到的类目。
可选地,所述类目推荐模型还包括分别对应于所述类目预测任务的多个预测网络;
所述预测网络用于对所述拼接特征进行处理,获取所述目标商品在相应层级对应的类目预测结果。
可选地,每一所述预测网络由多个全连接层依次连接构成。
根据本公开实施例的第三方面,提供一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现第一方面中任一项所述的方法。
根据本公开实施例的第四方面,提供一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行第一方面中任一项所述的方法
根据本公开实施例的第五方面,提供一种计算机程序产品,包括第一方面或第二方面中任一所述方法的计算机程序。
本公开的实施例提供的技术方案至少带来以下有益效果:
本公开实施例中,所述电子设备在获取所述目标商品的文字描述和图片、或者两者之一之后,将所述文字描述和/或图片输入预先建立的类目推荐模型中,通过所述类目推荐模型同时进行多个类目预测任务,获取多个类目预测结果,然后将符合预设条件的类目预测结果作为推荐类目输出,本实施中实现在商家上传商品的过程中,无需进行繁琐的手动选择类目的操作,通过所述类目推荐模型可以有效识别商品所属类目进而推荐给商家,有利于减少用户的操作步骤,进一步提高商家的商品上传效率,从而提高用户的使用体验,另一方面,也使得商家可以根据类目推荐模型识别出的类目正确上传商品,保证商品的安全性问题,降低电商平台的运营风险和消费者的购买风险,有利于保障消费者的财产安全。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本公开的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是本公开根据一示例性实施例示出的一种类目推荐模型的训练方法的流程图。
图2是本公开根据一示例性实施例示出的类目体系的示意图。
图3是本公开根据一示例性实施例示出的损失计算逻辑示意图。
图4是本公开根据一示例性实施例示出的一种类目推荐方法的流程图。
图5是本公开根据一示例性实施例示出的第一种类目推荐模型的结构图。
图6是本公开根据一示例性实施例示出的第二种类目推荐模型的结构图。
图7是本公开根据一示例性实施例示出的第三种类目推荐模型的结构图。
图8是本公开根据一示例性实施例示出的第四种类目推荐模型的结构图。
图9是本公开根据一示例性实施例示出的第五种类目推荐模型的结构图。
图10是本公开根据一示例性实施例示出的一种电子设备的结构图。
图11是本公开根据一示例性实施例提供的一种类目推荐装置的结构图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在本公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
针对于相关技术中的问题,本公开实施例提供了一种类目推荐方法,能够利用预先建立的类目推荐模型对目标商品进行类目预测得到类目预测结果,进而根据类目预测结果输出推荐的类目,从而用户无需手动选择目标商品的类目,减少了用户的繁琐操作过程,有利于提高用户的使用体验。
接下来,先对所述类目推荐模型的训练过程进行说明:请参阅图1,是本公开根据一示例性实施例示出的一种类目推荐模型的训练方法的流程图,所述方法可由电子设备来执行,所述电子设备可以是服务器、云端、电脑、个人数字助理(PDA,Personal DigitalAssistant)或者手机终端等具备计算能力的设备,所述方法包括:
在步骤S101中,获取训练样本;所述训练样本至少包括若干商品的文字描述或图片,每一所述商品对应多个标签,每一所述标签表征在指定类目体系的其中一个层级中所述商品被划分到的类目;不同所述标签对应所述指定类目体系中的不同层级。
在步骤S102中,将所述训练样本输入指定模型中,通过所述指定模型同时进行多个类目预测任务,获得多个预测结果;所述多个类目预测任务分别与所述指定类目体系所包括的多个层级一一对应;所述类目预测任务用于预测所述商品在其中一个层级中被划分到的类目。
在步骤S103中,将属于同一层级的所述预测结果与所述标签进行比对,根据比对结果反向调整用于构建所述指定模型的参数,获得所述类目推荐模型。
首先,在开始进行所述类目推荐模型的训练之前,所述电子设备需要获取训练样本,在本公开实施例中,以有监督学习方式进行模型训练过程,所述训练样本至少包括若干商品的文字描述或图片,每一所述商品对应多个标签,每一所述标签表征在指定类目体系的其中一个层级中所述商品被划分到的类目,即是说,所述多个标签与所述指定类目体系的多个层级一一对应,不同所述标签对应所述指定类目体系中的不同层级。
可以理解的是,本公开实施例对于所述训练样本的获取来源、所述指定类目体系的划分以及所述商品的文字描述不做任何限制,可依据实际应用场景进行具体设置。作为例子,所述商品的文字描述可以包括商品的标题以及详情描述,比如某一食品的文字描述为“源氏老式大辣片148g*5包豆制品香辣味零食新鲜日期保质期6个月”。
所述指定类目体系包括根层级、非叶子层级和叶子层级,各个层级之间的关系以树状关系表示。在一个例子中,比如所述指定类目体系包括3个层级,层级之间的关系可以以树状关系表示,父层级可以具有多个孩子层级,而孩子层级只能具有一个父层级,请参阅图2,为本公开根据一示例性实施例示出的类目体系的示意图,以图2进行举例说明:第1层级为根层级,包括{服装、食品};第2层级为非叶子层级,其中“服装”节点下包括{男装、女装},“食品”节点下包括{生鲜、零食};第3层级为叶子层级,“男装”节点下包括{上装、男裤},“女装”节点下包括{上装、女裤、女裙},“生鲜”节点下包括{水产、水果},“零食”节点下包括{糖果、饼干、坚果},则在包括3个层级的类目体系中,一件“连衣裙”的商品对应有3个标签,其中,对应于第一层级的标签为“服装”,对应于第二层级的标签为“女装”,对应于第三层级的标签为“女裙”。
在一实施例中,在获取与商品有关的所述训练样本以及标签之后,所述电子设备可以根据所述训练样本以及标签进行模型训练,所述电子设备将所述训练样本输入指定模型中,通过所述指定模型同时进行多个类目预测任务,所述类目预测任务用于预测所述商品在其中一个层级中被划分到的类目,所述多个类目预测任务分别与所述指定类目体系所包括的多个层级一一对应,从而所述电子设备可以通过所述指定模型获得多个预测结果,所述多个预测结果分别与所述指定类目体系所包括的多个层级一一对应,然后将属于同一层级的所述预测结果与所述标签进行比对,根据比对结果反向调整用于构建所述指定模型的参数,获得所述类目推荐模型。
可以理解的是,本公开实施例对于所述指定类目体系所包括的层级数量不做任何限制,图2所述的实施例仅为举例说明,其中非叶子层级的数量可以是一个或多个,可依据实际应用场景进行具体设置。
在一个例子中,比如所述指定类目体系包括3个层级,层级之间的关系可以以树状关系表示,分别为根层级、非叶子层级和叶子层级,相应的,所述训练样本包括若干商品的文字描述或图片,所述商品对应有3个标签,所述指定模型中包括3个类目预测任务,每个类目预测任务对应其中一个层级,所述电子设备在对指定模型进行训练的过程中,同时进行3个类目预测任务,获取3个预测结果,然后将属于同一层级的所述预测结果与所述标签进行比对,根据比对结果反向调整用于构建所述指定模型的参数,获得所述类目推荐模型。
本实施例中,在获取训练样本之后,将所述训练样本输入指定模型中,通过所述指定模型同时进行多个类目预测任务,所述多个类目预测任务分别与所述指定类目体系所包括的多个层级一一对应,所述类目预测任务用于预测所述商品在其中一个层级中被划分到的类目,从而获取多个预测结果,然后将属于同一层级的所述预测结果与所述标签进行比对,根据比对结果反向调整用于构建所述指定模型的参数,获得所述类目推荐模型;本实施例实现了多任务学习的过程,多个类目预测任务在训练过程中相互辅助,实现部分参数的共享,实现了对商品类目的准确预测,从而用户无需进行繁琐的手动选择类目的操作,将通过所述类目推荐模型获取的预测结果作为商品的推荐类目,有利于减少用户的操作步骤,进一步提高商户的商品上传效率,从而提高用户的使用体验。
这里对反向调整用于构建所述指定模型的参数进行具体说明:所述指定类目体系包括根层级、非叶子层级和叶子层级,各个层级之间的关系以树状关系表示,在根据比对结果反向调整用于构建所述指定模型的参数的过程中,所述电子设备按照从叶子层级到根层级的顺序,依次将属于同一层级的所述预测结果与所述标签进行对比,根据比对结果确定本层级是否预测正确;若本层级预测错误,继续下一层级的比对步骤;若本层级预测正确或者所有层级均预测错误,结束层级之间的比对步骤并执行以下步骤:基于预设的损失函数分别计算预测错误的层级对应的所述预测结果与所述标签之间的损失值;将预测错误的层级对应的所述损失值累加,得到所述指定模型的损失值;根据所述指定模型的损失值调整用于构建所述指定模型的参数,获得所述类目推荐模型。
可见,基于上述描述,按照从叶子层级到根层级的顺序进行比对过程,可以自适应加大或缩小损失,在某一层级预测正确的情况下,无需再比对剩下的其他层级,而是计算之前已经比对过的层级对应的损失值,无需计算未比对过的层级的损失值,从而实现减少损失的目的,而在某一层预测错误的情况下,继续比对剩下的其他层级,如果全部层级都预测错误,则计算所有层级对应的损失值,从而实现放大损失的目的,使得在反向传播优化指定模型参数的过程中,可以有效提高指定模型的预测准确率。
这里所述指定类目体系包括3个层级为例进行说明:所述指定类目体系包括根层级、非叶子层级和叶子层级,各个层级之间的关系以树状关系表示,请参阅图3,所述电子设备首先将叶子层级的所述预测结果与所述标签进行对比,根据比对结果确定本层级是否预测正确;若是,则所述指定模型的总损失(设为loss)为0;若否,将非叶子层级的所述预测结果与所述标签进行对比,根据比对结果确定本层级是否预测正确;若是,则所述指定模型的总损失(设为loss)为叶子层级对应的损失值(设为loss3);若否,将根层级的所述预测结果与所述标签进行对比,根据比对结果确定本层级是否预测正确;若是,则所述指定模型的总损失(设为loss)为叶子层级对应的损失值(设为loss3)和非叶子层级对应的损失值(设为loss2)累加的结果;若否,则所述指定模型的总损失(设为loss)为叶子层级对应的损失值(设为loss3)、非叶子层级对应的损失值(设为loss2)和根层级对应的损失值(设为loss1)累加的结果;本实施例中,在某一层预测错误的情况下,继续比对剩下的其他层级,直到确定比对的本层级预测正确,将预测错误的层级对应的损失值累加,从而实现放大损失的目的,使得在反向传播优化指定模型参数的过程中,可以有效提高指定模型的预测准确率。
在获取所述类目推荐模型之后,以下对利用所述类目推荐模型进行类目推荐的过程进行说明:请参阅图4,为本公开实施例提供的一种类目推荐方法,所述方法可应用于电子设备上,所述方法包括:
在步骤S201中,获取待进行类目推荐的目标商品的文字描述和/或图片。
在步骤S202中,将所述文字描述和/或图片输入预先建立的类目推荐模型中,通过所述类目推荐模型同时进行多个类目预测任务,获取多个类目预测结果;所述多个类目预测任务分别与指定类目体系所包括的多个层级一一对应;所述类目预测任务用于预测所述目标商品在其中一个层级中被划分到的类目。
在步骤S203中,将符合预设条件的类目预测结果作为推荐类目输出。
在一实施例中,所述电子设备在获取所述目标商品的文字描述和图片、或者两者之一之后,将所述文字描述和/或图片输入预先建立的类目推荐模型中,通过所述类目推荐模型同时进行多个类目预测任务,获取多个类目预测结果,然后将符合预设条件的类目预测结果作为推荐类目输出,本实施中实现在商家上传商品的过程中,无需进行繁琐的手动选择类目的操作,通过所述类目推荐模型可以有效识别商品所属类目进而推荐给商家,有利于减少用户的操作步骤,进一步提高商家的商品上传效率,从而提高用户的使用体验,另一方面,也使得商家可以根据类目推荐模型识别出的类目正确上传商品,保证商品的安全性问题,降低电商平台的运营风险和消费者的购买风险,有利于保障消费者的财产安全。
可理解的是,本实施例对于所述预设条件不做任何限制,可依据实际应用场景进行具体设置。在一个例子中,考虑到所述指定类目体系包括根层级、非叶子层级和叶子层级,各个层级之间的关系以树状关系表示,即所述指定类目体系是树状结构,而通常在商品归类中商家最关注的是叶子层级对应的类目,因此,所述预设条件可以是叶子层级对应的类目预测结果,即将多个类目推荐结果中与叶子层级对应的类目预测结果作为推荐类目输出,从而方便用户使用。在另一个例子中,所述预设条件也可以是用户根据自身实际需要选择的层级,可以基于用户选择的层级输出对应的类目预测结果,本实施例对此不做任何限制。
进一步地,当将叶子层级对应的类目预测结果作为推荐类目输出之后,所述电子设备还可以根据所述推荐类目以及所述指定类目体系各个层级之间的树状关系,获取所述推荐类目对应的根层级的类目并输出,这样对于想要知道该推荐类目对应的根层级的类目的商户,也可以基于所述类目体系的结构特点快速简便地获取,从而方便用户使用。
在一示例性的应用场景中,在电商平台上,基于安全性考虑,某些类目需要商家具备相应的许可证,而有些类目对于商家的资质要求较低,则不需要相应的许可证,比如高危类目“食品”需要《食品经营许可证》,而低危类目“衣服”则不需要,由于不同行业的要求不同,在商家手动填写或者手动选择商品类目的过程中,存在某些商家钻行业要求的漏洞,比如某食品商家为规避许可证审查,则在上传食品商品的过程中,将类目选择为“衣服”,此种行为严重侵害了电商平台和消费者用户的权益,基于此,通过本公开实施例的类目推荐模型获得商品的预测结果,并将其作为商品的推荐类目,从而使得商家可以根据所述推荐类目正确上传商品,保证商品的安全性问题,降低电商平台的运营风险和消费者的购买风险,有利于保障消费者的财产安全。
进一步地,可以将商家针对该商品手动填写或选择的商品类目与该商品通过所述类目推荐模型获得的推荐类目进行比对,若两者差异过大,可以将该商品、商家自动填写的商品类目以及所述推荐类目发送至审核人员对应的终端上,经审核人员审核正确与否,进一步保证商品的安全性问题,降低电商平台的运营风险和消费者的购买风险,同时也有利于减少审核人员的工作量,无需审核商家上传的所有商品的分类,提高工作效率。
在另一示例性的应用场景中,考虑到不同平台之间的类目体系可能有所不同,所述电子设备可以预先确定所述类目推荐模型指向的类目体系与其他类目体系(比如第三方平台的类目体系)之间的类目体系映射关系,即建立所述类目体系中的类目与第三方平台的类目体系中的类目之间的对应关系,在所述目标商品为第三方平台上的商品时,所述电子设备在获取多个类目预测结果之后,从中获取符合预设条件的类目预测结果,然后根据预设的类目体系映射关系,将所述符合预设条件的类目预测结果转换为第三方平台的类目,并将所述第三方平台的类目作为所述目标商品的推荐类目输出;本实施例可以有效解决平台不同类目体系中的类目划分不同的问题,进一步提高类目划分的准确性,同时也有利于提高所述类目推荐模型的兼容性,使之具有广泛的适用性。
以下对本实施例的所述类目推荐模型的结构进行说明,以进一步明确所述类目推荐模型获取所述目标商品的多种类目推荐结果的过程。请参阅图5,是本公开根据一示例性实施例示出的第一种类目推荐模型的结构图,所述类目推荐模型至少包括文字特征提取网络11或图片特征提取网络12;所述文字提取网络用于对所述目标商品的文字描述进行特征提取,获取文字特征;所述文字特征用于预测所述目标商品在各个层级中被划分到的类目;所述图片特征提取网络12用于对所述目标商品的图片进行特征提取,获取图片特征;所述图片特征用于预测所述目标商品在各个层级中被划分到的类目。本实施例通过获取所述目标商品的文字特征和图片特征,或者两者之一,由于文字描述和图片都是与目标商品密切相关的,且通过文字特征和图片特征的融合,有利于提高模型预测的准确性。
在一实施例中,在所述类目推荐模型包括文字特征提取网络11和图片特征提取网络12的情况下,所述类目推荐模型还包括第二拼接层13以及分别对应于所述类目预测任务的多个预测网络14,所述第二拼接层13用于对所述文字特征和图片特征进行拼接,获取拼接特征;所述拼接特征用于预测所述目标商品在各个层级中被划分到的类目,然后所述预测网络14用于对所述拼接特征进行处理,获取所述目标商品在相应层级对应的预测结果;本实施例通过所述第二拼接层13的拼接处理,有利于方便后续的其他处理过程,提高处理效率,并且通过多个预测网络14实现多任务学习的过程,多个类目预测任务在训练过程中相互辅助,实现部分参数(与文字特征提取网络11、图片特征提取网络12以及第二拼接层13相关的参数)的共享,实现了对目标商品所属类目的准确预测。
在另一实施例中,在所述类目推荐模型包括文字特征提取网络或图片特征提取网络的情况下,所述类目推荐模型还包括分别对应于所述类目预测任务的多个预测网络,所述预测网络用于对所述文字特征或图片特征进行处理,获取所述目标商品在相应层级对应的预测结果;本实施例实现多个类目预测任务在训练过程中相互辅助,实现部分参数(与文字特征提取网络或图片特征提取网络相关的参数)的共享,有利于提高模型预测准确率。
其中,对于所述预测网络的具体结构,本公开实施例对此不做任何限制,可依据实际应用场景进行具体设置。在一个例子中,所述预测网络可以由多个全连接层依次连接构成。
请参阅图6,是本公开根据一示例性实施例示出的第二种类目推荐模型的结构图,所述文字特征提取网络11包括预处理层111、嵌入层112以及第一拼接层113;所述预处理层111用于对所述目标商品的文字描述进行预处理,获取多个单词;所述嵌入层112用于分别将多个所述单词转化为嵌入向量;所述第一拼接层113用于对多个所述嵌入向量进行拼接,获取所述文字特征;所述文字特征用于预测所述目标商品在各个层级中被划分到的类目。本实施例通过预处理过程实现对所述目标商品的文字描述的初步处理,有利于提高模型预测的准确率,再经过所述嵌入层112将获取的多个单词转化为稠密向量,从而避免大量的稀疏向量对资源的过度占用,最后通过所述第一拼接层113将所述嵌入向量拼接起来,以便后续的处理过程,提高处理效率。
请参阅图7,是本公开根据一示例性实施例示出的第三种类目推荐模型的结构图,所述文字特征提取网络11包括文字识别层114、预处理层111、嵌入层112以及第一拼接层113,所述文字识别层114用于对所述目标商品的图片中的文字进行识别,获取文字识别结果;所述预处理层111具体用于对所述目标商品的文字描述以及所述文字识别结果进行预处理,获取多个单词;所述嵌入层112用于分别将多个所述单词转化为嵌入向量;所述第一拼接层113用于对多个所述嵌入向量进行拼接,获取所述文字特征;本实施例通过获取所述图片的文字识别结果,实现所述文字识别结果和所述目标商品的文字描述的融合,有利于提高模型的预测准确率。
请参阅图8,是本公开根据一示例性实施例示出的第四种类目推荐模型的结构图,所述文字特征提取网络11包括图片分类器115、预处理层111、嵌入层112以及第一拼接层113;所述图片分类器115用于对所述目标商品的图片进行识别,获取商品标签;所述商品标签表征对所述图片的识别结果;所述预处理层111具体用于对所述目标商品的文字描述以及所述商品标签进行预处理,获取多个单词;所述嵌入层112用于分别将多个所述单词转化为嵌入向量;所述第一拼接层113用于对多个所述嵌入向量进行拼接,获取所述文字特征;所述文字特征用于预测所述目标商品在各个层级中被划分到的类目。本实施例通过获取所述图片的识别结果,实现所述图片的识别结果和所述目标商品的文字描述的融合,有利于提高模型的预测准确率。
可以理解的是,本公开实施例对于所述预处理过程不做任何限制,可依据实际应用场景进行具体设置。在一个例子中,所述预处理的过程包括以下至少一种操作:过滤指定文字的操作、文字拼接操作以及分词操作;其中,过滤指定文字的操作可以是过滤到数字、标点符号或者其他无区分能力的常用词如我、你、他、的、来、去等,实现去除干扰因素,从而有利于提高模型预测准确率;所述文字拼接操作可以是将所述目标商品的文字描述、文字识别结果和标签拼接成一个句子;所述分词操作是将一个句子分割成多个单词的过程。
在一个示例性的实施例中,请参阅图9,为本公开根据一示例性实施例示出的第五种类目推荐模型的结构图,所述类目推荐模型包括文字特征提取网络11、图片特征提取网络12、第二拼接层13和分别对应于所述类目预测任务的多个预测网络14。
其中,所述文字提取网络用于对所述目标商品的文字描述进行特征提取,获取文字特征;所述文字特征用于预测所述目标商品在各个层级中被划分到的类目;所述文字特征用于预测所述目标商品在各个层级中被划分到的类目;所述文字提取网络包括文字识别层114、图片分类器115、预处理层111、嵌入层112以及第一拼接层113。
所述文字识别层114用于对所述目标商品的图片中的文字进行识别,获取文字识别结果;可以理解的是,本公开实施例对于文字识别的具体算法不做任何限制,可依据实际应用场景进行具体设置,例如可以通过OCR算法对所述目标商品的图片中的文字进行识别。
所述图片分类器115用于对所述目标商品的图片进行识别,获取商品标签;所述商品标签表征对所述图片的识别结果;可以理解的是,本公开实施例对于所述图片分类器115不做任何限制,可依据实际应用场景进行具体设置,比如所述图片分类器115可基于深度学习算法训练获取;在一个例子中,所述图片分类器115可以通过图片样本集对残差网络(residual network,ResNet)进行训练至收敛得到,所述图片样本集包括若干商品的图片,所述图片带有标签,比如一张“连衣裙”的图片的标签是“裙”。因此训练好的图片分类器115可以更准确地对图片进行识别。
所述预处理层111具体用于对所述目标商品的文字描述、所述商品标签以及所述文字识别结果进行预处理,获取多个单词;在一个例子中,所述电子设备通过所述预处理层111对所述目标商品的文字描述、所述商品标签以及所述文字识别结果进行指定文字过滤操作,可以是过滤到数字、标点符号或者其他无区分能力的常用词如我、你、他、的、来、去等,实现去除干扰因素,从而有利于提高模型预测准确率,然后将剩余的3部分以空格为分隔符拼接起来作为一个整体句子,再对该句子进行分词操作,从而获取多个单词;本实施例实现多种数据源的融合,有利于提高模型预测的准确率。
所述嵌入层112用于分别将多个所述单词转化为嵌入向量;所述第一拼接层113用于对多个所述嵌入向量进行拼接,获取所述文字特征;所述文字特征用于预测所述目标商品在各个层级中被划分到的类目;本实施例经过所述嵌入层112将获取的多个单词转化为稠密向量,从而避免大量的稀疏向量对资源的过度占用,最后通过所述第一拼接层113将所述嵌入向量拼接起来,以便后续的处理过程,提高处理效率。可以理解的是,本实施例对于所述嵌入向量的表示形式和所述第一拼接层113的拼接方式不做任何限制,可依据实际应用场景进行具体设置。在一个例子中,所述嵌入向量可以表示成整型向量或浮点型向量,比如所述嵌入向量表示成64位的浮点型向量(64仅为举例说明,不包含其他含义)。在一个例子中,所述第一拼接层113可以采用sum pooling方式,将所述嵌入向量相加,得到所述文字特征,比如所述嵌入向量表示为64位的浮点型向量,所述电子设备可以通过所述第一拼接层113将多个嵌入向量对应位置相加,得到表示为64位的浮点型向量的所述文字特征。
所述图片特征提取网络12用于对所述目标商品的图片进行特征提取,获取图片特征;所述图片特征用于预测所述目标商品在各个层级中被划分到的类目。可以理解的是,本公开实施例对于所述图片提取网络不做任何限制,可依据实际应用场景进行具体设置。在一个例子中,可通过神经网络结构(比如残差网络)实现对所述图片特征的提取,提取出的图片特征包含了图片的细节信息,将图片特征作为输入之一,有利于提高模型的预测准确率。本实施例对于所述图片特征的表示形式不做任何限制,例如所述图片特征可表示成128维特征向量(128仅为举例说明,不包含其他含义)。
所述第二拼接层13用于对所述文字特征和图片特征进行拼接,获取拼接特征;所述拼接特征用于预测所述目标商品在各个层级中被划分到的类目。本实施例实现多种数据源的融合,有利于提高模型预测的准确率。可以理解的是,本实施例对于所述第二拼接层13的拼接方式不做任何限制,可依据实际应用场景进行具体设置。在一个例子中,所述第二拼接层13用于将所述文字特征和图片特征相加,获取拼接特征,比如所述图片特征表示成128维特征向量,所述文字特征表示成64维特征向量,获取的拼接特征为192(128+64)维特征向量。
所述预测网络14用于对所述拼接特征进行处理,获取所述目标商品在相应层级对应的预测结果。每一所述预测网络14用于进行其中一个类目预测任务,所述类目预测任务用于预测所述目标商品在其中一个层级中被划分到的类目,所述多个类目预测任务分别与所述指定类目体系所包括的多个层级一一对应。本实施例实现多任务学习的过程,多个类目预测任务在训练过程中相互辅助,实现了对目标商品类目的准确预测;同时,本公开实施例的类目预测模型可以基于深度神经网络进行学习,在数据量庞大的情况下,会自适应的学习数据中的模式,从而在出现新的商品的情况下,所述类目预测模型依然能够准确预测。
与前述方法的实施例相对应,本公开还提供了类目推荐装置及其所应用的设备的实施例。
本公开中类目推荐装置的实施例可以应用在计算机设备上,例如终端设备。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在文件处理的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图10所示,为本公开实施例类目推荐装置所在电子设备的一种硬件结构图,除了图10所示的处理器310、内存330、网络接口320、以及非易失性存储器340之外,实施例中装置331所在的电子设备,通常根据该计算机设备的实际功能,还可以包括其他硬件,对此不再赘述。
相应地,本公开实施例还提供一种计算机存储介质,所述存储介质中存储有程序,所述程序被处理器执行时实现上述任一实施例中的方法。
本公开可采用在一个或多个其中包含有程序代码的存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。计算机可用存储介质包括永久性和非永久性、可移动和非可移动媒体,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括但不限于:相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
请参阅图11,为本公开根据一示例性实施例提供的一种类目推荐装置的结构图,所述装置包括:
目标商品信息获取模块401,用于获取待进行类目推荐的目标商品的文字描述和/或图片。
类目预测结果获取模块402,用于将所述文字描述和/或图片输入预先建立的类目推荐模型中,通过所述类目推荐模型同时进行多个类目预测任务,获取多个类目预测结果;所述多个类目预测任务分别与指定类目体系所包括的多个层级一一对应;所述类目预测任务用于预测所述目标商品在其中一个层级中被划分到的类目。
推荐类目输出模块403,用于将符合预设条件的类目预测结果作为推荐类目输出。
可选地,所述类目推荐模型通过以下模块得到:
训练样本获取模块,用于获取训练样本;所述训练样本至少包括若干商品的文字描述或图片,每一所述商品对应多个标签,每一所述标签表征在指定类目体系的其中一个层级中所述商品被划分到的类目;不同所述标签对应所述指定类目体系中的不同层级。
预测结果获取模块,用于将所述训练样本输入指定模型中,通过所述指定模型同时进行多个类目预测任务,获得多个预测结果;所述多个类目预测任务分别与所述指定类目体系所包括的多个层级一一对应;所述类目预测任务用于预测所述商品在其中一个层级中被划分到的类目。
类目推荐模型获取模块,用于将属于同一层级的所述预测结果与所述标签进行比对,根据比对结果反向调整用于构建所述指定模型的参数,获得所述类目推荐模型。
可选地,所述指定类目体系包括根层级、非叶子层级和叶子层级,各个层级之间的关系以树状关系表示。
所述类目推荐模型获取模块包括:
比对模块,用于按照从叶子层级到根层级的顺序,依次将属于同一层级的所述预测结果与所述标签进行对比,根据比对结果确定本层级是否预测正确。
第一执行模块,用于若本层级预测错误,继续下一层级的比对步骤。
第二执行模块,用于若本层级预测正确或者所有层级均预测错误,结束层级之间的比对步骤并执行以下步骤:基于预设的损失函数分别计算预测错误的层级对应的所述预测结果与所述标签之间的损失值;将预测错误的层级对应的所述损失值累加,得到所述指定模型的损失值;根据所述指定模型的损失值调整用于构建所述指定模型的参数,获得所述类目推荐模型。
可选地,所述指定类目体系包括根层级、非叶子层级和叶子层级,各个层级之间的关系以树状关系表示。
所述多个类目预测结果与所述指定类目体系中的各个层级一一对应。
所述推荐类目输出模块包括:将叶子层级对应的类目预测结果作为推荐类目输出。
可选地,还包括:类目输出模块,用于根据所述推荐类目以及所述指定类目体系各个层级之间的树状关系,获取所述推荐类目对应的根层级的类目并输出。
可选地,所述推荐类目输出模块包括:根据预存的类目体系映射关系,将所述符合预设条件的类目预测结果转换为第三方平台的类目;所述类目体系映射关系表示所述指定类目体系中的类目与第三方平台的类目体系中的类目之间的对应关系;将所述第三方平台的类目作为所述目标商品的推荐类目输出。
可选地,所述类目推荐模型至少包括文字特征提取网络和/或图片特征提取网络;
所述文字提取网络用于对所述目标商品的文字描述进行特征提取,获取文字特征;所述文字特征用于预测所述目标商品在各个层级中被划分到的类目。
所述图片特征提取网络用于对所述目标商品的图片进行特征提取,获取图片特征;所述图片特征用于预测所述目标商品在各个层级中被划分到的类目。
可选地,所述文字特征提取网络包括预处理层、嵌入层以及第一拼接层。
所述预处理层用于对所述目标商品的文字描述进行预处理,获取多个单词。
所述嵌入层用于分别将多个所述单词转化为嵌入向量。
所述第一拼接层用于对多个所述嵌入向量进行拼接,获取所述文字特征。所述文字特征用于预测所述目标商品在各个层级中被划分到的类目。
可选地,所述文字特征提取网络还包括文字识别层。
所述文字识别层用于对所述目标商品的图片中的文字进行识别,获取文字识别结果。
所述预处理层具体用于对所述目标商品的文字描述和/或所述文字识别结果进行预处理,获取多个单词;所述单词用于预测所述目标商品在各个层级中被划分到的类目。
可选地,所述文字特征提取网络还包括图片分类器。
所述图片分类器用于对所述目标商品的图片进行识别,获取商品标签;所述商品标签表征对所述目标商品的图片的识别结果;
所述预处理层具体用于对所述目标商品的文字描述和/或所述商品标签进行预处理,获取多个单词;所述单词用于预测所述目标商品在各个层级中被划分到的类目。
可选地,所述预处理的过程包括以下至少一种操作:过滤指定文字的操作、文字拼接操作以及分词操作。
可选地,所述类目推荐模型还包括第二拼接层;所述第二拼接层用于对所述文字特征和图片特征进行拼接,获取拼接特征;所述拼接特征用于预测所述目标商品在各个层级中被划分到的类目。
可选地,所述类目推荐模型还包括分别对应于所述类目预测任务的多个预测网络;所述预测网络用于对所述拼接特征进行处理,获取所述目标商品在相应层级对应的类目预测结果。
可选地,每一所述预测网络由多个全连接层依次连接构成。
上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本公开方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
相应的,本公开还提供一种电子设备,所述电子设备包括有处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:执行所述指令时完成本公开实施例中任一项的方法实施例所述的方法。
所述处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器可以包括至少一种类型的存储介质,存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等等。而且,设备可以与通过网络连接执行存储器的存储功能的网络存储装置协作。存储器可以是设备的内部存储单元,例如设备的硬盘或内存。存储器也可以是设备的外部存储设备,例如设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器还可以既包括设备的内部存储单元也包括外部存储设备。存储器用于存储计算机程序以及设备所需的其他程序和数据。存储器还可以用于暂时地存储已经输出或者将要输出的数据。
这里描述的各种实施方式可以使用例如计算机软件、硬件或其任何组合的计算机可读介质来实施。对于硬件实施,这里描述的实施方式可以通过使用特定用途集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理装置(DSPD)、可编程逻辑装置(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器、被设计为执行这里描述的功能的电子单元中的至少一种来实施。对于软件实施,诸如过程或功能的实施方式可以与允许执行至少一种功能或操作的单独的软件模块来实施。软件代码可以由以任何适当的编程语言编写的软件应用程序(或程序)来实施,软件代码可以存储在存储器中并且由控制器执行。
电子设备包括但不限于以下存在形式:(1)移动终端:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等;(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad;(3)其他具有计算功能的电子设备。设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,可以包括比上述更多或更少的部件,或者组合某些部件,或者不同的部件,例如设备还可以包括输入输出设备、网络接入设备、总线、摄像设备等。
在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器,上述指令可由电子设备的处理器执行以完成上述方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当存储介质中的指令由终端的处理器执行时,使得终端能够执行上述方法。
在示例性实施例中,还提供了一种计算机程序产品,包括可执行程序代码,其中,所述程序代码在通过上述装置执行时实施上述任意一项的方法实施例。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (10)
1.一种类目推荐方法,其特征在于,包括:
获取待进行类目推荐的目标商品的文字描述和/或图片;
将所述文字描述和/或图片输入预先建立的类目推荐模型中,通过所述类目推荐模型同时进行多个类目预测任务,获取多个类目预测结果;所述多个类目预测任务分别与指定类目体系所包括的多个层级一一对应;所述类目预测任务用于预测所述目标商品在其中一个层级中被划分到的类目;
将符合预设条件的类目预测结果作为推荐类目输出。
2.根据权利要求1所述的方法,其特征在于,所述类目推荐模型通过以下步骤训练得到:
获取训练样本;所述训练样本至少包括若干商品的文字描述或图片,每一所述商品对应多个标签,每一所述标签表征在指定类目体系的其中一个层级中所述商品被划分到的类目;不同所述标签对应所述指定类目体系中的不同层级;
将所述训练样本输入指定模型中,通过所述指定模型同时进行多个类目预测任务,获得多个预测结果;所述多个类目预测任务分别与所述指定类目体系所包括的多个层级一一对应;所述类目预测任务用于预测所述商品在其中一个层级中被划分到的类目;
将属于同一层级的所述预测结果与所述标签进行比对,根据比对结果反向调整用于构建所述指定模型的参数,获得所述类目推荐模型。
3.根据权利要求2所述的方法,其特征在于,所述指定类目体系包括根层级、非叶子层级和叶子层级,各个层级之间的关系以树状关系表示;
所述将属于同一层级的所述预测结果与所述标签进行比对,根据比对结果反向调整用于构建所述指定模型的参数,包括:
按照从叶子层级到根层级的顺序,依次将属于同一层级的所述预测结果与所述标签进行对比,根据比对结果确定本层级是否预测正确;
若本层级预测错误,继续下一层级的比对步骤;
若本层级预测正确或者所有层级均预测错误,结束层级之间的比对步骤并执行以下步骤:基于预设的损失函数分别计算预测错误的层级对应的所述预测结果与所述标签之间的损失值;将预测错误的层级对应的所述损失值累加,得到所述指定模型的损失值;根据所述指定模型的损失值调整用于构建所述指定模型的参数,获得所述类目推荐模型。
4.根据权利要求1所述的方法,其特征在于,所述指定类目体系包括根层级、非叶子层级和叶子层级,各个层级之间的关系以树状关系表示;
所述多个类目预测结果与所述指定类目体系中的各个层级一一对应;
所述将符合预设条件的类目预测结果作为推荐类目输出,包括:
将叶子层级对应的类目预测结果作为推荐类目输出。
5.根据权利要求1所述的方法,其特征在于,所述类目推荐模型至少包括文字特征提取网络和/或图片特征提取网络;
所述文字提取网络用于对所述目标商品的文字描述进行特征提取,获取文字特征;所述文字特征用于预测所述目标商品在各个层级中被划分到的类目;
所述图片特征提取网络用于对所述目标商品的图片进行特征提取,获取图片特征;所述图片特征用于预测所述目标商品在各个层级中被划分到的类目。
6.根据权利要求5所述的方法,其特征在于,所述类目推荐模型还包括第二拼接层;
所述第二拼接层用于对所述文字特征和图片特征进行拼接,获取拼接特征;所述拼接特征用于预测所述目标商品在各个层级中被划分到的类目。
7.根据权利要求6所述的方法,其特征在于,所述类目推荐模型还包括分别对应于所述类目预测任务的多个预测网络;
所述预测网络用于对所述拼接特征进行处理,获取所述目标商品在相应层级对应的类目预测结果。
8.一种类目推荐装置,其特征在于,包括:
目标商品信息获取模块,用于获取待进行类目推荐的目标商品的文字描述和/或图片;
类目预测结果获取模块,用于将所述文字描述和/或图片输入预先建立的类目推荐模型中,通过所述类目推荐模型同时进行多个类目预测任务,获取多个类目预测结果;所述多个类目预测任务分别与指定类目体系所包括的多个层级一一对应;所述类目预测任务用于预测所述目标商品在其中一个层级中被划分到的类目;
推荐类目输出模块,用于将符合预设条件的类目预测结果作为推荐类目输出。
9.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至7中任一项所述的方法。
10.一种存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010476089.4A CN113744006A (zh) | 2020-05-29 | 2020-05-29 | 类目推荐方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010476089.4A CN113744006A (zh) | 2020-05-29 | 2020-05-29 | 类目推荐方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113744006A true CN113744006A (zh) | 2021-12-03 |
Family
ID=78724690
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010476089.4A Pending CN113744006A (zh) | 2020-05-29 | 2020-05-29 | 类目推荐方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113744006A (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103810208A (zh) * | 2012-11-14 | 2014-05-21 | 腾讯科技(深圳)有限公司 | 一种类目映射方法及装置 |
CN104978328A (zh) * | 2014-04-03 | 2015-10-14 | 北京奇虎科技有限公司 | 一种获取层级分类器以及文本分类的方法及装置 |
CN105740389A (zh) * | 2016-01-27 | 2016-07-06 | 上海晶赞科技发展有限公司 | 一种分类方法及装置 |
CN106469182A (zh) * | 2015-08-21 | 2017-03-01 | 阿里巴巴集团控股有限公司 | 一种基于映射关系的信息推荐方法及装置 |
CN107679121A (zh) * | 2017-09-20 | 2018-02-09 | 晶赞广告(上海)有限公司 | 分类体系的映射方法及装置、存储介质、计算设备 |
CN108171254A (zh) * | 2017-11-22 | 2018-06-15 | 北京达佳互联信息技术有限公司 | 图像标签确定方法、装置及终端 |
CN109598517A (zh) * | 2017-09-29 | 2019-04-09 | 阿里巴巴集团控股有限公司 | 商品通关处理、对象的处理及其类别预测方法和装置 |
CN109858558A (zh) * | 2019-02-13 | 2019-06-07 | 北京达佳互联信息技术有限公司 | 分类模型的训练方法、装置、电子设备及存储介质 |
CN110287329A (zh) * | 2019-07-04 | 2019-09-27 | 刘凡 | 一种基于商品文本分类的电商类目属性挖掘方法 |
CN111046170A (zh) * | 2018-10-15 | 2020-04-21 | 北京京东尚科信息技术有限公司 | 用于输出信息的方法和装置 |
CN111191741A (zh) * | 2020-01-15 | 2020-05-22 | 中国地质调查局发展研究中心 | 一种岩石识别深度学习模型岩石分类约束继承性损失方法 |
-
2020
- 2020-05-29 CN CN202010476089.4A patent/CN113744006A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103810208A (zh) * | 2012-11-14 | 2014-05-21 | 腾讯科技(深圳)有限公司 | 一种类目映射方法及装置 |
CN104978328A (zh) * | 2014-04-03 | 2015-10-14 | 北京奇虎科技有限公司 | 一种获取层级分类器以及文本分类的方法及装置 |
CN106469182A (zh) * | 2015-08-21 | 2017-03-01 | 阿里巴巴集团控股有限公司 | 一种基于映射关系的信息推荐方法及装置 |
CN105740389A (zh) * | 2016-01-27 | 2016-07-06 | 上海晶赞科技发展有限公司 | 一种分类方法及装置 |
CN107679121A (zh) * | 2017-09-20 | 2018-02-09 | 晶赞广告(上海)有限公司 | 分类体系的映射方法及装置、存储介质、计算设备 |
CN109598517A (zh) * | 2017-09-29 | 2019-04-09 | 阿里巴巴集团控股有限公司 | 商品通关处理、对象的处理及其类别预测方法和装置 |
CN108171254A (zh) * | 2017-11-22 | 2018-06-15 | 北京达佳互联信息技术有限公司 | 图像标签确定方法、装置及终端 |
CN111046170A (zh) * | 2018-10-15 | 2020-04-21 | 北京京东尚科信息技术有限公司 | 用于输出信息的方法和装置 |
CN109858558A (zh) * | 2019-02-13 | 2019-06-07 | 北京达佳互联信息技术有限公司 | 分类模型的训练方法、装置、电子设备及存储介质 |
CN110287329A (zh) * | 2019-07-04 | 2019-09-27 | 刘凡 | 一种基于商品文本分类的电商类目属性挖掘方法 |
CN111191741A (zh) * | 2020-01-15 | 2020-05-22 | 中国地质调查局发展研究中心 | 一种岩石识别深度学习模型岩石分类约束继承性损失方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108875776B (zh) | 模型训练方法和装置、业务推荐的方法和装置、电子设备 | |
CN110348580B (zh) | 构建gbdt模型的方法、装置及预测方法、装置 | |
CN112164391A (zh) | 语句处理方法、装置、电子设备及存储介质 | |
CN110310114B (zh) | 对象分类方法、装置、服务器及存储介质 | |
CN112529663A (zh) | 商品推荐方法、装置、终端设备及存储介质 | |
CN110765774A (zh) | 信息抽取模型的训练方法、装置及信息抽取方法、装置 | |
CN111582932A (zh) | 场景间信息推送方法、装置、计算机设备及存储介质 | |
CN110766460A (zh) | 一种用户画像的方法、装置、存储介质及计算机设备 | |
CN110929764A (zh) | 图片审核方法和装置,电子设备及存储介质 | |
CN113222022A (zh) | 一种网页分类识别方法及装置 | |
CN112347361A (zh) | 推荐对象的方法、神经网络及其训练方法、设备和介质 | |
CN112819073A (zh) | 分类网络训练、图像分类方法、装置和电子设备 | |
CN110990523A (zh) | 一种法律文书的确定方法及*** | |
CN108197660A (zh) | 多模型特征融合方法/***、计算机可读存储介质及设备 | |
CN113837836A (zh) | 模型推荐方法、装置、设备及存储介质 | |
CN116821516B (zh) | 资源推荐方法、装置、设备及存储介质 | |
CN112465012A (zh) | 机器学习建模方法、装置、电子设备和可读存储介质 | |
CN112307199A (zh) | 信息识别、数据处理方法、装置及设备、信息交互方法 | |
CN113744006A (zh) | 类目推荐方法、装置、电子设备及存储介质 | |
CN112541357B (zh) | 实体识别方法、装置及智能设备 | |
CN114529191A (zh) | 用于风险识别的方法和装置 | |
CN113901175A (zh) | 物品关系判别方法和装置 | |
CN115345687A (zh) | 一种跨网站商品对齐方法及装置 | |
CN117708340B (zh) | 标签文本的确定方法、模型训练及调整方法、设备和介质 | |
CN114219084B (zh) | 一种快消行业的访销陈列造假识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |