CN115936805A - 商品推荐方法及其装置、设备、介质 - Google Patents

商品推荐方法及其装置、设备、介质 Download PDF

Info

Publication number
CN115936805A
CN115936805A CN202211515071.6A CN202211515071A CN115936805A CN 115936805 A CN115936805 A CN 115936805A CN 202211515071 A CN202211515071 A CN 202211515071A CN 115936805 A CN115936805 A CN 115936805A
Authority
CN
China
Prior art keywords
commodity
commodities
text
nodes
recommendation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211515071.6A
Other languages
English (en)
Inventor
黄丕帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huanju Shidai Information Technology Co Ltd
Original Assignee
Guangzhou Huanju Shidai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huanju Shidai Information Technology Co Ltd filed Critical Guangzhou Huanju Shidai Information Technology Co Ltd
Priority to CN202211515071.6A priority Critical patent/CN115936805A/zh
Publication of CN115936805A publication Critical patent/CN115936805A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及电商技术领域中一种商品推荐方法及其装置、设备、介质,所述方法包括:获取全量商品的商品图片,采用预设的图文匹配模型确定出各个商品对应的多个商品标签,所述商品标签属于预设的商品标签集的成员;以各个商品标签为节点,确定每两个节点之间的共现评分,构建知识图谱;根据知识图谱中各个商品对应的多个节点分别与其他商品对应的多个节点之间的共现评分,计算出各个商品之间的推荐评分;针对每个商品筛选出满足预设条件的推荐评分对应的推荐商品。本申请为基于独立站点的跨境电商平台提供了商品推荐解决方案,能提升服务体验。

Description

商品推荐方法及其装置、设备、介质
技术领域
本申请涉及电商技术领域,尤其涉及一种商品推荐方法及其相应的装置、计算机设备、计算机可读存储介质。
背景技术
跨境电商是近几年飞速发展的行业,独立站点是跨境电商的一种新的形式,在运营中,自主权高,更加灵活,避免了很多平台规则的制约。相较于传统的电商平台来说,线上店铺的体量也各不相同,有的店铺的商品数量有几百项,有时可能达到几千甚至上万项。基于独立站点的这种特殊性,对独立站点的商品推荐提出了区别于传统电商平台的要求,行业内一般的商品推荐方法,在这种场景下都不再完全适用。
传统技术中,通过根据目标商品与其他商品对应的商品标题之间的相似度,判断其他商品是否与目标商品相似,从而将相似的其他商品作为目标商品的推荐商品,然而基于独立站点的跨境电商平台的商家相对独立,商家编辑商品标题无固定格式,通常包含大部分个性化编辑的文本内容,严重影响相似度的准确性,难以确保推荐商品与目标商品相似,使得商品推荐效果不佳。
对于传统技术的不足,本申请人做出相应的探索。
发明内容
本申请的首要目的在于解决上述问题至少之一而提供一种商品推荐方法及其相应的装置、计算机设备、计算机可读存储介质。
为满足本申请的各个目的,本申请采用如下技术方案:
适应本申请的目的之一而提供的一种商品推荐方法,包括如下步骤:
获取全量商品的商品图片,采用预设的图文匹配模型确定出各个商品对应的多个商品标签,所述商品标签属于预设的商品标签集的成员;
以各个商品标签为节点,确定每两个节点之间的共现评分,构建知识图谱;
根据知识图谱中各个商品对应的多个节点分别与其他商品对应的多个节点之间的共现评分,计算出各个商品之间的推荐评分;
针对每个商品筛选出满足预设条件的推荐评分对应的推荐商品。
进一步的实施例中,获取全量商品的商品图片,采用预设的图文匹配模型确定出各个商品对应的多个商品标签,包括如下步骤:
获取全量商品的商品图片,采用预设的图文匹配模型,由其中的图像编码器提取商品图片的图像特征信息,以及由其中的文本编码器提取预设的商品标签集中各个商品标签对应的文本特征信息;
针对各个商品,计算其商品图片对应的图像特征信息与所述各个商品标签对应的文本特征信息之间的相似度,筛选出相似度大于预设阈值的多个商品标签。
进一步的实施例中,以各个商品标签为节点,确定每两个节点之间的共现评分,构建知识图谱,包括如下步骤:
以各个商品标签为节点,若两个节点相同则共现评分为预设值,否则,计算每两个节点同时属于同一商品时所述商品的数量作为共现次数,归一化所述共现次数,获得每两个节点之间的共现评分;
将各个商品对应的多个节点分别与其他商品对应的多个节点相连接构成边,每条边的权重为该边所连接的两个节点的共现评分,构建出知识图谱。
进一步的实施例中,根据知识图谱中各个商品对应的多个节点分别与其他商品对应的多个节点之间的共现评分,计算出各个商品之间的推荐评分,包括:
针对每个商品根据知识图谱确定其对应的多个节点分别与其他商品对应的多个节点之间的共现评分,计算相应的多个所述共现评分之和除以所述商品对应的节点数,获得各个商品之间的推荐评分。
进一步的实施例中,获取全量商品的商品图片之前,还包括如下步骤:
获取多个商品的商品标题,根据商品类目对各个商品标题进行分类,获得各个商品类目对应的商品标题;
对各个商品标题进行分词,统计各个词元在相应的商品类目下的词频及逆文本频率指数,计算出关键词评分;
筛选出满足预设条件的关键词评分对应的词元作为商品标签,构造商品标签集。
进一步的实施例中,获取全量商品的商品图片之前,还包括如下步骤:
获取多个商品的商品图片分别与预设的商品标签集中的各个商品标签构成多个图文数据对作为训练样本,根据训练样本的图文数据对中商品图片与商品标签是否匹配相应标注监督标签;
将所述训练样本输入至图文匹配模型,提取各个图文数据对中商品图片和商品标签相对应的深层语义信息,获得相应的图像特征信息和文本特征信息;
将各个所述图文数据对相对应的图像特征信息和文本特征信息映射至同一多模态空间,计算各个图文数据对相对应的图像特征信息与文本特征信息之间的相似度;
采用所述训练样本的监督标签,确定所述相似度的损失值,在所述损失值未达到预设阈值时,对图文匹配模型实施权重更新,并继续调用其他训练样本实施迭代训练直至模型收敛。
进一步的实施例中,针对每个商品筛选出满足预设条件的推荐评分对应的推荐商品,包括:
针对每个商品根据其与其他商品之间的推荐评分进行排序,筛选出排序靠前的多个推荐商品。
另一方面,适应本申请的目的之一而提供的一种商品推荐装置,包括商品打标模块、图谱构建模块、评分计算模块以及商品筛选模块,其中,商品打标模块,用于获取全量商品的商品图片,采用预设的图文匹配模型确定出各个商品对应的多个商品标签,所述商品标签属于预设的商品标签集的成员;图谱构建模块,用于以各个商品标签为节点,确定每两个节点之间的共现评分,构建知识图谱;评分计算模块,用于根据知识图谱中各个商品对应的多个节点分别与其他商品对应的多个节点之间的共现评分,计算出各个商品之间的推荐评分;商品筛选模块,用于针对每个商品筛选出满足预设条件的推荐评分对应的推荐商品。
进一步的实施例中,所述商品筛选模块,包括:特征提取子模块,用于获取全量商品的商品图片,采用预设的图文匹配模型,由其中的图像编码器提取商品图片的图像特征信息,以及由其中的文本编码器提取预设的商品标签集中各个商品标签对应的文本特征信息;标签确定子模块,用于针对各个商品,计算其商品图片对应的图像特征信息与所述各个商品标签对应的文本特征信息之间的相似度,筛选出相似度大于预设阈值的多个商品标签。
进一步的实施例中,所述图谱构建模块,包括:共现评分确定子模块,用于以各个商品标签为节点,若两个节点相同则共现评分为预设值,否则,计算每两个节点同时属于同一商品时所述商品的数量作为共现次数,归一化所述共现次数,获得每两个节点之间的共现评分;知识图谱构建子模块,用于将各个商品对应的多个节点分别与其他商品对应的多个节点相连接构成边,每条边的权重为该边所连接的两个节点的共现评分,构建出知识图谱。
进一步的实施例中,所述评分计算模块,包括:推荐评分计算子模块,用于针对每个商品根据知识图谱确定其对应的多个节点分别与其他商品对应的多个节点之间的共现评分,计算相应的多个所述共现评分之和除以所述商品对应的节点数,获得各个商品之间的推荐评分。
进一步的实施例中,所述商品打标模块之前,还包括:类目标题模块,用于获取多个商品的商品标题,根据商品类目对各个商品标题进行分类,获得各个商品类目对应的商品标题;关键词评分计算模块,用于对各个商品标题进行分词,统计各个词元在相应的商品类目下的词频及逆文本频率指数,计算出关键词评分;标签筛选模块,用于筛选出满足预设条件的关键词评分对应的词元作为商品标签,构造商品标签集。
进一步的实施例中,所述商品打标模块之前,还包括:样本构建及标注模块,用于获取多个商品的商品图片分别与预设的商品标签集中的各个商品标签构成多个图文数据对作为训练样本,根据训练样本的图文数据对中商品图片与商品标签是否匹配相应标注监督标签;特征提取模块,用于将所述训练样本输入至图文匹配模型,提取各个图文数据对中商品图片和商品标签相对应的深层语义信息,获得相应的图像特征信息和文本特征信息;相似度计算模块,用于将各个所述图文数据对相对应的图像特征信息和文本特征信息映射至同一多模态空间,计算各个图文数据对相对应的图像特征信息与文本特征信息之间的相似度;迭代训练模块,用于采用所述训练样本的监督标签,确定所述相似度的损失值,在所述损失值未达到预设阈值时,对图文匹配模型实施权重更新,并继续调用其他训练样本实施迭代训练直至模型收敛。
进一步的实施例中,所述商品筛选模块,包括:排序优选子模块,用于针对每个商品根据其与其他商品之间的推荐评分进行排序,筛选出排序靠前的多个推荐商品。
又一方面,适应本申请的目的之一而提供的一种计算机设备,包括中央处理器和存储器,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行本申请所述的商品推荐方法的步骤。
又一方面,适应本申请的另一目的而提供的一种计算机可读存储介质,其以计算机可读指令的形式存储有依据所述的商品推荐方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行该方法所包括的步骤。
本申请的技术方案存在多方面优势,包括但不限于如下各方面:
本申请为运营于电商平台的独立站点中的线上店铺统一提供商品推荐解决方案,通过基于线上店铺内全量商品的商品图片,采用图文匹配模型确定出各个商品对应的多个商品标签,以各个商品标签为节点,确定每两个节点之间的共现评分,构建知识图谱,从而根据其中各个商品对应的多个节点分别与其他商品对应的多个节点之间的共现评分,计算出各个商品之间的推荐评分,据此,筛选出符合预设条件的推荐评分对应的推荐商品。一方面,采用图文匹配模型适用于多模态数据处理,确定出与商品的商品图片相匹配的多个商品标签,十分简便高效,无需人工干预,另一方面,利用多个商品标签细粒度精准地表示相应的商品,以使基于两两商品对应的每个商品标签之间的共现评分计算出的推荐评分足够准确,据此,筛选出的推荐商品的推荐效果较佳。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请的商品推荐方法的典型实施例的流程示意图;
图2为本申请的实施例中确定各个商品对应的多个商品标签的流程示意图;
图3为本申请的实施例中构建知识图谱的流程示意图;
图4为本申请的实施例中预先构建商品标签集的流程示意图;
图5为本申请的实施例中图文匹配模型的训练过程的示意图;
图6为本申请的商品推荐装置的原理框图;
图7为本申请所采用的一种计算机设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本技术领域技术人员可以理解,这里所使用的“客户端”、“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他诸如个人计算机、平板电脑之类的通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(Persona lCommun i cat ions Service,个人通信***),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Persona l D igita l Ass i stant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(G l oba l Pos it ioni ng System,全球定位***)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“客户端”、“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“客户端”、“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MI D(Mob i l e I nternet Dev i ce,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
本申请所称的“服务器”、“客户端”、“服务节点”等名称所指向的硬件,本质上是具备个人计算机等效能力的电子设备,为具有中央处理器(包括运算器和控制器)、存储器、输入设备以及输出设备等冯诺依曼原理所揭示的必要构件的硬件装置,计算机程序存储于其存储器中,中央处理器将存储在外存中的程序调入内存中运行,执行程序中的指令,与输入输出设备交互,借此完成特定的功能。
需要指出的是,本申请所称的“服务器”这一概念,同理也可扩展到适用于服务器机群的情况。依据本领域技术人员所理解的网络部署原理,所述各服务器应是逻辑上的划分,在物理空间上,这些服务器既可以是互相独立但可通过接口调用的,也可以是集成到一台物理计算机或一套计算机机群的。本领域技术人员应当理解这一变通,而不应以此约束本申请的网络部署方式的实施方式。
本申请的一个或数个技术特征,除非明文指定,既可部署于服务器实施而由客户端远程调用获取服务器提供的在线服务接口来实施访问,也可直接部署并运行于客户端来实施访问。
本申请中所引用或可能引用到的神经网络模型,除非明文指定,既可部署于远程服务器且在客户端实施远程调用,也可部署于设备能力胜任的客户端直接调用,某些实施例中,当其运行于客户端时,其相应的智能可通过迁移学习来获得,以便降低对客户端硬件运行资源的要求,避免过度占用客户端硬件运行资源。
本申请所涉及的各种数据,除非明文指定,既可远程存储于服务器,也可存储于本地终端设备,只要其适于被本申请的技术方案所调用即可。
本领域技术人员对此应当知晓:本申请的各种方法,虽然基于相同的概念而进行描述而使其彼此间呈现共通性,但是,除非特别说明,否则这些方法都是可以独立执行的。同理,对于本申请所揭示的各个实施例而言,均基于同一发明构思而提出,因此,对于相同表述的概念,以及尽管概念表述不同但仅是为了方便而适当变换的概念,应被等同理解。
本申请即将揭示的各个实施例,除非明文指出彼此之间的相互排斥关系,否则,各个实施例所涉的相关技术特征可以交叉结合而灵活构造出新的实施例,只要这种结合不背离本申请的创造精神且可满足现有技术中的需求或解决现有技术中的某方面的不足即可。对此变通,本领域技术人员应当知晓。
本申请的一种商品推荐方法,可被编程为计算机程序产品,部署于客户端或服务器中运行而实现,例如,本申请的示例性应用场景中,可以在电商平台的服务器中部署实现,藉此可以通过访问该计算机程序产品运行后开放的接口,通过图形用户界面与该计算机程序产品的进程进行人机交互而执行该方法。
请参阅图1,本申请的商品推荐方法,在其典型实施例中,包括如下步骤:
步骤S1100、获取全量商品的商品图片,采用预设的图文匹配模型确定出各个商品对应的多个商品标签,所述商品标签属于预设的商品标签集的成员;
本申请的技术方案以电商平台的运行环境为其应用环境,所述电商平台,可以是开放独立站点服务的电商平台,典型的,例如跨境电商平台。此类平台由于需要考虑全球各地之间的网络环境以及各商家之间的独立性,而通过将每个商家的线上店铺配置为一个个的独立站点,从而使电商平台服务于大量的此类独立站点。
独立站点的商家可配置在其线上店铺上架的各个商品对应的商品信息,以将其提交至服务器,使得服务器接收到所述商品信息后,将相应的商品上架以向消费者展示。所述商品信息包含但不限于商品的文本信息、图片信息,所述文本信息,可以包括商品的商品标题、商品详情文本、商品类目等。所述商品信息包括但不限于图片、文本等不同类型的数据。商品信息中的图片包括是线上店铺的商家上架商品时为该商品上传的用于展示的图片,能够从总体和/或不同侧面展示商品,包含商品主图、商品详情图等,通常以商品主图作为首要展示商品的图片,因其通常能够展示相应的商品的全貌。商品信息中的文本包括商品标题、商品详情文本、商品类目等任意一项或多项。本申请中,推荐使用商品的商品主图作为后续所赖以处理的商品图片。
所述图文匹配模型,其中包含图像编码器及文本编码器,所述图像编码器可采用适用于提取图像特征的模型,推荐选型为ViT(Vi s ion Transformer)模型,亦可采用其他的例如CNN模型、深度卷积模型Effi cientNet、DenseNet、Resnet等任一种模型,所述文本编码器可采用NLP领域中适用于提取文本特征的模型,推荐选型为BERT模型,亦可采用其他的例如Text Transfomer、RoBERTa、XLM-RoBERTa、MPNet等任意一种模型。所述图文匹配模型可经过预先训练至收敛,习得确定提取图片对应的图像特征与提取文本对应的文本特征之间的相似度的能力,具体的训练过程由后续部分实施例进一步揭示,本步骤暂且按下不表。所述图文匹配模型推荐采用CLI P(Contrast ive Language-Image Pre-tra in i ng)模型。
一般而言,每个独立站点均可创建并维护自身的商品数据库,以存储线上店铺内各个商品对应的商品信息,可预先封装相应的数据接口用于访问商品数据库中的商品信息,对其进行增删查改等操作。所述数据接口可由本领域技术人员灵活变通实现。由此,调用所述数据接口访问商品数据库中全量商品的商品信息,从中获取每个商品的商品图片。进一步,采用预设的所述图文匹配模型,由其中的图像编码器提取商品图片的图像特征信息,以及由其中的文本编码器提取预设的商品标签集中各个商品标签对应的文本特征信息。针对各个商品,计算其商品图片对应的图像特征信息与所述各个商品标签对应的文本特征信息之间内积作为相似度,筛选出相似度大于预设阈值的多个商品标签。所述图像特征信息为以向量化表示提取商品图片的图像特征,所述文本特征信息为以向量化表示提取商品标签的文本特征。
所述商品标签为描述至少一种商品属性的文本,所述商品属性包含品牌、材质、规格、颜色、重量,功能、卖点、效果等,商品标签可从多个商品标题中提取而得,进一步以多个商品标签预先构建出所述商品标签集,以备调用,具体实现由后续部分实施例进一步揭示,本步骤暂且按下不表。
步骤S1200、以各个商品标签为节点,确定每两个节点之间的共现评分,构建知识图谱;
以各个商品标签为节点,若两个节点相同时,该两个节点之间的共现评分直接为1,否则,计算每两个节点同时属于同一商品时所述商品的数量作为共现次数,示范性举例,节点a和节点b同时属于商品a、商品b、商品c,对应的共现次数为所述商品数量即为3,归一化所述共现次数,使其值域属于[0-1],获得每两个节点之间的共现评分,可以理解,若两个节点不存在同时属于同一商品时,该两个节点的共现次数为0,可无需归一化,该两个节点之间的共现评分直接为0。
进一步,针对各个商品,其对应的每个节点分别与其他商品对应的多个节点相连接,每两个相连接的节点之间构成一条边,每条边的权重为该边所连接的两个节点的共现评分,构建出知识图谱。
步骤S1300、根据知识图谱中各个商品对应的多个节点分别与其他商品对应的多个节点之间的共现评分,计算出各个商品之间的推荐评分;
针对每个商品根据知识图谱确定其对应的多个节点分别与其他商品对应的多个节点之间的共现评分,计算相应的多个所述共现评分之和除以所述商品对应的节点数,获得各个商品之间的推荐评分,示范性公式举例:以两个商品(商品a、商品b)为例,
Figure BDA0003970296790000101
其中:scor两个商品之间的推荐评分,分子是商品a对应的多个节点与商品b对应的多个节点之间的共现评分之和,分母为商品a的节点数。
步骤S1400、针对每个商品筛选出满足预设条件的推荐评分对应的推荐商品。
一种实施中,针对每个商品根据其与其他商品之间的推荐评分从高到低的顺序进行排序,筛选出排序靠前的多个商品作为推荐商品,所述推荐商品的具体数量可由本领域技术人员按需设定。
另一种实施例中,针对每个商品筛选出大于预设阈值的推荐评分对应的商品作为推荐商品,所述预设阈值可由本领域技术人员按需设定。
根据本申请的典型实施例可以知晓,本申请的技术方案存在多方面优势,包括但不限于如下各方面:
本申请为运营于电商平台的独立站点中的线上店铺统一提供商品推荐解决方案,通过基于线上店铺内全量商品的商品图片,采用图文匹配模型确定出各个商品对应的多个商品标签,以各个商品标签为节点,确定每两个节点之间的共现评分,构建知识图谱,从而根据其中各个商品对应的多个节点分别与其他商品对应的多个节点之间的共现评分,计算出各个商品之间的推荐评分,据此,筛选出符合预设条件的推荐评分对应的推荐商品。一方面,采用图文匹配模型适用于多模态数据处理,确定出与商品的商品图片相匹配的多个商品标签,十分简便高效,无需人工干预,另一方面,利用多个商品标签细粒度精准地表示相应的商品,以使基于两两商品对应的每个商品标签之间的共现评分计算出的推荐评分足够准确,据此,筛选出的推荐商品的推荐效果较佳。
请参阅图2,进一步的实施例中,步骤S1100、获取全量商品的商品图片,采用预设的图文匹配模型确定出各个商品对应的多个商品标签,包括如下步骤:
步骤S1110、获取全量商品的商品图片,采用预设的图文匹配模型,由其中的图像编码器提取商品图片的图像特征信息,以及由其中的文本编码器提取预设的商品标签集中各个商品标签对应的文本特征信息;
所述图文匹配模型及其中的图像编码器和文本编码器分别对应的选型,可参考步骤S1100相关部分揭示。
一种实施例中,采用Vi T作为图文匹配模型中的图像编码器,采用Bert作为图文匹配模型中的文本编码器,使得能够确保图文匹配模型的鲁棒性和泛化能力。基于所述图像编码器及文本编码器的前向推理函数实现相应特征的提取,便可提取出商品图片的图像特征信息及商品标签的文本特征信息。
调用所述数据接口访问商品数据库中全量商品的商品信息,从中获取每个商品的商品图片。
所述图像特征信息为以向量化表示提取商品图片的图像特征,所述文本特征信息为以向量化表示提取商品标签的文本特征。
步骤S1120、针对各个商品,计算其商品图片对应的图像特征信息与所述各个商品标签对应的文本特征信息之间的相似度,筛选出相似度大于预设阈值的多个商品标签。
本领域技术人员可以理解,通过将所述商品图片的图像特征信息和上述商品标签的文本特征信息进行规范化操作,使得统一图像特征信息和文本特征信息至相同的维度,便可计算图像特征信息与文本特征信息之间相似度。
所述相似度计算,可以Fa i ss、E l ast i cSearch、M i l vus等大规模向量检索引擎中的任意一种来实施,也可以采用诸如余弦相似度、内积、曼哈顿距离、欧氏距离等任意一种现成的算法来计算。
本实施例中,通过图文匹配模型能够精准地提取出商品图片和商品标签对应的图像特征信息及文本特征信息,使得基于统一维度的图像特征信息及文本特征信息之间的相似度,便可确定相匹配的商品图片与商品标签,十分高效便捷。
请参阅图3,进一步的实施例中,步骤S1200、以各个商品标签为节点,确定每两个节点之间的共现评分,构建知识图谱,包括如下步骤:
步骤S1210、以各个商品标签为节点,若两个节点相同则共现评分为预设值,否则,计算每两个节点同时属于同一商品时所述商品的数量作为共现次数,归一化所述共现次数,获得每两个节点之间的共现评分;
以各个商品标签为节点,若两个节点相同时,该两个节点之间的共现评分为预设值,所述预设值可为1,否则,计算每两个节点同时属于同一商品时所述商品的数量作为共现次数,示范性举例,节点a和节点b同时属于商品a、商品b、商品c,对应的共现次数为所述商品数量即为3,归一化所述共现次数,使其值域属于[0-1],获得每两个节点之间的共现评分,可以理解,若两个节点不存在同时属于同一商品时,该两个节点的共现次数为0,可无需归一化,该两个节点之间的共现评分直接为0。
所述归一化可由领域技术人员按需采取截尾、分箱、对数变换、mi n-max标准化、中心标准化等中任一种实现。
步骤S1220、将各个商品对应的多个节点分别与其他商品对应的多个节点相连接构成边,每条边的权重为该边所连接的两个节点的共现评分,构建出知识图谱。
针对各个商品,其对应的每个节点分别与其他商品对应的多个节点相连接,每两个相连接的节点之间构成一条边。
本实施例中,以各个商品标签为节点,确定每两个节点之间的共现评分,各个商品对应的多个节点分别与其他商品对应的多个节点相连接构成边,构建知识图谱,使其能够通过各个商品对应的多个节点与其他商品对应的多个节点之间量化的共现评分,细粒度且准确地表示出各个商品之间的关联。
请参阅图4,进一步的实施例中,步骤S1100、获取全量商品的商品图片之前,还包括如下步骤:
步骤S1010、获取多个商品的商品标题,根据商品类目对各个商品标题进行分类,获得各个商品类目对应的商品标题;
一般而言,电商平台为服务各个独立站点相应设置商品类目体系,商品类目体系包含多层级商品类目,每个上级商品类目包含一个或多个下级商品类目,示范性举例所述上级商品类目为服装,对应的下级商品类目为上衣、下衣、帽子、围巾、腰带、袜子,对应下级商品类目为上衣的再下一级商品类目为短袖T恤、长袖T恤、衬衫、卫衣、外套,对应下级商品类目为下衣的再下一级商品类目为短裤/五分裤、牛仔裤、休闲裤/卫裤、运动裤,据此,应用所述商品类目体系的独立站点,使得独立站点的商品都有对应的商品类目,可以理解,所述商品所属的商品类目通常由一层或多层的层级商品类目构成,示范性举例服装-上衣-短袖T恤、服装-下衣-牛仔裤。
调用多个独立站点相应预封装的数据接口,访问各个独立站点的商品数据库中全量商品的商品信息,从中获取每个商品的商品标题及商品类目,以使得通过获取丰富的商品标题,从而一定程度上确保后续从中提取的商品标签足够丰富。进一步,根据各个商品标题对应的商品所属的商品类目进行分类,获得各个商品类目对应的商品标题。
步骤S1020、对各个商品标题进行分词,统计各个词元在相应的商品类目下的词频及逆文本频率指数,计算出关键词评分;
对各个商品标题进行预处理,所述预处理可为去除标点符号操作、去除停用词操作中任意一项或多项操作,采用分词算法对各个商品标题进行分词,获得各个商品标题对应的多个词元,所述分词算法可以采用j i eba、N-gram中任意一种。
针对每个商品类目下的各个商品标题对应的每个词元,统计每个词元在相应的商品类目下的所有商品标题中出现的频率即词频,统计在相应的商品类目下出现每个词元的商品标题的个数,计算相应的商品类目下的商品标题的总个数除以该商品标题的个数,取该计算结果的对数作为逆文本频率指数。进一步,计算每个词元对应的词频乘上逆文本频率指数得出关键词评分。
步骤S1030、筛选出满足预设条件的关键词评分对应的词元作为商品标签,构造商品标签集。
针对各个商品类目,将其下的各个商品标题对应的每个词元,以关键词评分从高到低的顺序进行排序,筛选出各个商品类目对应的排序靠前的多个词元作为商品标签,具体所述商品标签数量可由本领域技术人员灵活变通设定。
本实施例中,通过计算出各个商品类目下的各个商品标题对应的每个词元的关键词评分,从而筛选出关键词评分较高的词元作为商品标签构建商品标签集,能够确保商品标签足够丰富,十分简便高效、无需人工干预。
请参阅图5,进一步的实施例中,步骤S1100、获取全量商品的商品图片之前,还包括如下步骤:
步骤S1000、获取多个商品的商品图片分别与预设的商品标签集中的各个商品标签构成多个图文数据对作为训练样本,根据训练样本的图文数据对中商品图片与商品标签是否匹配相应标注监督标签;
一种实施例中,可将训练样本分批,每批包含多个图文数据对,每次向图文匹配模型输入一批训练样本进行训练。根据训练样本的图文数据对中商品图片与商品标签匹配标注监督标签为1,不匹配则标注监督标签为0。
步骤S1001、将所述训练样本输入至图文匹配模型,提取各个图文数据对中商品图片和商品标签相对应的深层语义信息,获得相应的图像特征信息和文本特征信息;
将一批多个图文数据对输入至图文匹配模型,一种实施例中,采用ViT作为图文匹配模型中的图像编码器,采用Bert作为图文匹配模型中的文本编码器,使得能够确保图文匹配模型的鲁棒性和泛化能力。基于所述图像编码器及文本编码器的前向推理函数实现相应特征即所述深层语义信息的提取,便可提取出各个图文数据对中商品图片的图像特征信息及商品标签的文本特征信息。
步骤S1002、将各个所述图文数据对相对应的图像特征信息和文本特征信息映射至同一多模态空间,计算各个图文数据对相对应的图像特征信息与文本特征信息之间的相似度;
由于图像特征信息和文本特征信息两者为不同模态的数据,故而对各个所述图文数据对相对应的图像特征信息和文本特征信息进行线性映射,映射至同一多模态空间,得到相同维度的图像特征信息及文本特征信息,从而基于相同维度下计算各个图文数据对相对应的图像特征信息与文本特征信息之间的相似度,所述相似度可采用余弦相似度算法计算。
步骤S1003、采用所述训练样本的监督标签,确定所述相似度的损失值,在所述损失值未达到预设阈值时,对图文匹配模型实施权重更新,并继续调用其他训练样本实施迭代训练直至模型收敛。
调用预设的交叉熵损失函数,此处可由本领域技术人员根据先验知识或实验经验灵活变通设置,基于根据所述训练样本的监督标签计算相应的各个图文数据对的所述相似度的交叉熵损失值,当该损失值达到预设阈值时,表明图文匹配模型已被训练至收敛状态,从而可以终止模型训练;损失值未达到预设阈值时,表明模型未收敛,于是根据该损失值对模型实施梯度更新,通常通过反向传播修正模型各个环节的权重参数以使模型进一步逼近收敛,然后,继续调用其他批的训练样本对该模型实施迭代训练,直至该模型被训练至收敛状态为止。
本实施例中,通过监督训练图文匹配模型的至收敛,使得图文匹配模型习得根据商品图片与商品标签,便能精准确定出两者之间的相似度,从而根据优化概率分布相应取词构造出高质量的目标广告文本的能力。
请参阅图6,适应本申请的目的之一而提供的一种商品推荐装置,是对本申请的商品推荐方法的功能化体现,该装置包括商品打标模块1100、图谱构建模块1200、评分计算模块1300以及商品筛选模块1400,其中,商品打标模块1100,用于获取全量商品的商品图片,采用预设的图文匹配模型确定出各个商品对应的多个商品标签,所述商品标签属于预设的商品标签集的成员;图谱构建模块1200,用于以各个商品标签为节点,确定每两个节点之间的共现评分,构建知识图谱;评分计算模块1300,用于根据知识图谱中各个商品对应的多个节点分别与其他商品对应的多个节点之间的共现评分,计算出各个商品之间的推荐评分;商品筛选模块1400,用于针对每个商品筛选出满足预设条件的推荐评分对应的推荐商品。
进一步的实施例中,所述商品筛选模块1400,包括:特征提取子模块,用于获取全量商品的商品图片,采用预设的图文匹配模型,由其中的图像编码器提取商品图片的图像特征信息,以及由其中的文本编码器提取预设的商品标签集中各个商品标签对应的文本特征信息;标签确定子模块,用于针对各个商品,计算其商品图片对应的图像特征信息与所述各个商品标签对应的文本特征信息之间的相似度,筛选出相似度大于预设阈值的多个商品标签。
进一步的实施例中,所述图谱构建模块1200,包括:共现评分确定子模块,用于以各个商品标签为节点,若两个节点相同则共现评分为预设值,否则,计算每两个节点同时属于同一商品时所述商品的数量作为共现次数,归一化所述共现次数,获得每两个节点之间的共现评分;知识图谱构建子模块,用于将各个商品对应的多个节点分别与其他商品对应的多个节点相连接构成边,每条边的权重为该边所连接的两个节点的共现评分,构建出知识图谱。
进一步的实施例中,所述评分计算模块1300,包括:推荐评分计算子模块,用于针对每个商品根据知识图谱确定其对应的多个节点分别与其他商品对应的多个节点之间的共现评分,计算相应的多个所述共现评分之和除以所述商品对应的节点数,获得各个商品之间的推荐评分。
进一步的实施例中,所述商品打标模块1100之前,还包括:类目标题模块,用于获取多个商品的商品标题,根据商品类目对各个商品标题进行分类,获得各个商品类目对应的商品标题;关键词评分计算模块,用于对各个商品标题进行分词,统计各个词元在相应的商品类目下的词频及逆文本频率指数,计算出关键词评分;标签筛选模块,用于筛选出满足预设条件的关键词评分对应的词元作为商品标签,构造商品标签集。
进一步的实施例中,所述商品打标模块1100之前,还包括:样本构建及标注模块,用于获取多个商品的商品图片分别与预设的商品标签集中的各个商品标签构成多个图文数据对作为训练样本,根据训练样本的图文数据对中商品图片与商品标签是否匹配相应标注监督标签;特征提取模块,用于将所述训练样本输入至图文匹配模型,提取各个图文数据对中商品图片和商品标签相对应的深层语义信息,获得相应的图像特征信息和文本特征信息;相似度计算模块,用于将各个所述图文数据对相对应的图像特征信息和文本特征信息映射至同一多模态空间,计算各个图文数据对相对应的图像特征信息与文本特征信息之间的相似度;迭代训练模块,用于采用所述训练样本的监督标签,确定所述相似度的损失值,在所述损失值未达到预设阈值时,对图文匹配模型实施权重更新,并继续调用其他训练样本实施迭代训练直至模型收敛。
进一步的实施例中,所述商品筛选模块1400,包括:排序优选子模块,用于针对每个商品根据其与其他商品之间的推荐评分进行排序,筛选出排序靠前的多个推荐商品。
为解决上述技术问题,本申请实施例还提供计算机设备。如图7所示,计算机设备的内部结构示意图。该计算机设备包括通过***总线连接的处理器、计算机可读存储介质、存储器和网络接口。其中,该计算机设备的计算机可读存储介质存储有操作***、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种商品推荐方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行本申请的商品推荐方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施方式中处理器用于执行图6中的各个模块及其子模块的具体功能,存储器存储有执行上述模块或子模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有本申请的商品推荐装置中执行所有模块/子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
本申请还提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行本申请任一实施例的商品推荐方法的步骤。
本领域普通技术人员可以理解实现本申请上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-On l y Memory,ROM)等计算机可读存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
综上所述,本申请基于独立站点的跨境电商平台提供了商品推荐解决方案,能提升服务体验。
本技术领域技术人员可以理解,本申请中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本申请中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本申请中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种商品推荐方法,其特征在于,包括:
获取全量商品的商品图片,采用预设的图文匹配模型确定出各个商品对应的多个商品标签,所述商品标签属于预设的商品标签集的成员;
以各个商品标签为节点,确定每两个节点之间的共现评分,构建知识图谱;
根据知识图谱中各个商品对应的多个节点分别与其他商品对应的多个节点之间的共现评分,计算出各个商品之间的推荐评分;
针对每个商品筛选出满足预设条件的推荐评分对应的推荐商品。
2.根据权利要求1所述的商品推荐方法,其特征在于,获取全量商品的商品图片,采用预设的图文匹配模型确定出各个商品对应的多个商品标签,包括如下步骤:
获取全量商品的商品图片,采用预设的图文匹配模型,由其中的图像编码器提取商品图片的图像特征信息,以及由其中的文本编码器提取预设的商品标签集中各个商品标签对应的文本特征信息;
针对各个商品,计算其商品图片对应的图像特征信息与所述各个商品标签对应的文本特征信息之间的相似度,筛选出相似度大于预设阈值的多个商品标签。
3.根据权利要求1所述的商品推荐方法,其特征在于,以各个商品标签为节点,确定每两个节点之间的共现评分,构建知识图谱,包括如下步骤:
以各个商品标签为节点,若两个节点相同则共现评分为预设值,否则,计算每两个节点同时属于同一商品时所述商品的数量作为共现次数,归一化所述共现次数,获得每两个节点之间的共现评分;
将各个商品对应的多个节点分别与其他商品对应的多个节点相连接构成边,每条边的权重为该边所连接的两个节点的共现评分,构建出知识图谱。
4.根据权利要求1所述的商品推荐方法,其特征在于,根据知识图谱中各个商品对应的多个节点分别与其他商品对应的多个节点之间的共现评分,计算出各个商品之间的推荐评分,包括:
针对每个商品根据知识图谱确定其对应的多个节点分别与其他商品对应的多个节点之间的共现评分,计算相应的多个所述共现评分之和除以所述商品对应的节点数,获得各个商品之间的推荐评分。
5.根据权利要求1所述的商品推荐方法,其特征在于,获取全量商品的商品图片之前,还包括如下步骤:
获取多个商品的商品标题,根据商品类目对各个商品标题进行分类,获得各个商品类目对应的商品标题;
对各个商品标题进行分词,统计各个词元在相应的商品类目下的词频及逆文本频率指数,计算出关键词评分;
筛选出满足预设条件的关键词评分对应的词元作为商品标签,构造商品标签集。
6.根据权利要求1所述的商品推荐方法,其特征在于,获取全量商品的商品图片之前,还包括如下步骤:
获取多个商品的商品图片分别与预设的商品标签集中的各个商品标签构成多个图文数据对作为训练样本,根据训练样本的图文数据对中商品图片与商品标签是否匹配相应标注监督标签;
将所述训练样本输入至图文匹配模型,提取各个图文数据对中商品图片和商品标签相对应的深层语义信息,获得相应的图像特征信息和文本特征信息;
将各个所述图文数据对相对应的图像特征信息和文本特征信息映射至同一多模态空间,计算各个图文数据对相对应的图像特征信息与文本特征信息之间的相似度;
采用所述训练样本的监督标签,确定所述相似度的损失值,在所述损失值未达到预设阈值时,对图文匹配模型实施权重更新,并继续调用其他训练样本实施迭代训练直至模型收敛。
7.根据权利要求1所述的商品推荐方法,其特征在于,针对每个商品筛选出满足预设条件的推荐评分对应的推荐商品,包括:
针对每个商品根据其与其他商品之间的推荐评分进行排序,筛选出排序靠前的多个推荐商品。
8.一种商品推荐装置,其特征在于,包括:
商品打标模块,用于获取全量商品的商品图片,采用预设的图文匹配模型确定出各个商品对应的多个商品标签,所述商品标签属于预设的商品标签集的成员;
图谱构建模块,用于以各个商品标签为节点,确定每两个节点之间的共现评分,构建知识图谱;
评分计算模块,用于根据知识图谱中各个商品对应的多个节点分别与其他商品对应的多个节点之间的共现评分,计算出各个商品之间的推荐评分;
商品筛选模块,用于针对每个商品筛选出满足预设条件的推荐评分对应的推荐商品。
9.一种计算机设备,包括中央处理器和存储器,其特征在于,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行如权利要求1至7中任意一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,其以计算机可读指令的形式存储有依据权利要求1至7中任意一项所述的方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行相应的方法所包括的步骤。
CN202211515071.6A 2022-11-29 2022-11-29 商品推荐方法及其装置、设备、介质 Pending CN115936805A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211515071.6A CN115936805A (zh) 2022-11-29 2022-11-29 商品推荐方法及其装置、设备、介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211515071.6A CN115936805A (zh) 2022-11-29 2022-11-29 商品推荐方法及其装置、设备、介质

Publications (1)

Publication Number Publication Date
CN115936805A true CN115936805A (zh) 2023-04-07

Family

ID=86697120

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211515071.6A Pending CN115936805A (zh) 2022-11-29 2022-11-29 商品推荐方法及其装置、设备、介质

Country Status (1)

Country Link
CN (1) CN115936805A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117688251A (zh) * 2024-02-04 2024-03-12 北京奥维云网大数据科技股份有限公司 一种基于知识图谱的商品检索方法及***

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117688251A (zh) * 2024-02-04 2024-03-12 北京奥维云网大数据科技股份有限公司 一种基于知识图谱的商品检索方法及***
CN117688251B (zh) * 2024-02-04 2024-04-26 北京奥维云网大数据科技股份有限公司 一种基于知识图谱的商品检索方法及***

Similar Documents

Publication Publication Date Title
CN114332680A (zh) 图像处理、视频搜索方法、装置、计算机设备和存储介质
CN113869048A (zh) 商品对象搜索方法及其装置、设备、介质、产品
CN114186056A (zh) 商品标签标注方法及其装置、设备、介质、产品
CN116521906B (zh) 元描述生成方法及其装置、设备、介质
CN114663197A (zh) 商品推荐方法及其装置、设备、介质、产品
CN114638646A (zh) 广告投放推荐方法及其装置、设备、介质、产品
CN114898349A (zh) 目标商品识别方法及其装置、设备、介质、产品
CN114186013A (zh) 实体识别模型热更新方法及其装置、设备、介质、产品
CN116108267A (zh) 一种推荐方法及相关设备
CN115689672A (zh) 聊天式商品导购方法及其装置、设备、介质
CN116976920A (zh) 商品导购方法及其装置、设备、介质
CN113792786A (zh) 商品对象自动分类方法及其装置、设备、介质、产品
CN113962224A (zh) 命名实体识别方法及其装置、设备、介质、产品
CN115018549A (zh) 广告文案生成方法及其装置、设备、介质、产品
CN115545832A (zh) 商品搜索推荐方法及其装置、设备、介质
CN114818674A (zh) 商品标题关键词提取方法及其装置、设备、介质、产品
CN114862480A (zh) 广告投放定向方法及其装置、设备、介质、产品
CN115936805A (zh) 商品推荐方法及其装置、设备、介质
CN113971599A (zh) 广告投放选品方法及其装置、设备、介质、产品
CN116823404A (zh) 商品组合推荐方法及其装置、设备、介质
US11941681B2 (en) System, method, and computer program product for determining compatibility between items in images
CN115907928A (zh) 商品推荐方法及其装置、设备、介质
CN116029793A (zh) 商品推荐方法及其装置、设备、介质
CN113343684B (zh) 核心产品词识别方法、装置、计算机设备及存储介质
CN116957128A (zh) 业务指标预测方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination