CN114581207B - 一种面向电商平台的商品图像大数据精准推送方法及*** - Google Patents
一种面向电商平台的商品图像大数据精准推送方法及*** Download PDFInfo
- Publication number
- CN114581207B CN114581207B CN202210495869.2A CN202210495869A CN114581207B CN 114581207 B CN114581207 B CN 114581207B CN 202210495869 A CN202210495869 A CN 202210495869A CN 114581207 B CN114581207 B CN 114581207B
- Authority
- CN
- China
- Prior art keywords
- image
- commodity
- vocabulary
- commodity image
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种面向电商平台的商品图像大数据精准推送方法及***,涉及数据处理技术领域。该方法包括:采用多尺度信噪比检测方法和显著性区域信噪比检测方法确定低质量图像;对目标用户的已消费商品图像和待识别商品图像进行多尺度优化处理并对词汇进行识别,得到并将高频词汇和目标词汇进行匹配,确定非目标商品图像;基于正样本和负样本采用谱聚类方法对待识别商品图像进行聚类处理,确定待识别商品图像为目标推送图像或非目标推送图像。本发明利用多尺度信噪比检测和显著性区域信噪比检测的方法对低质量商品图像进行排除,利用基于OCR技术的高频词汇匹配方法和谱聚类方法对待识别商品图像进行检测,为用户提供精准商品图像推荐。
Description
技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种面向电商平台的商品图像大数据精准推送方法及***。
背景技术
随着互联网技术的高速发展,智能电商越来越得到消费者的认可,给商家和消费者都提供了更方便的交易平台。商家可以利用电商平台更好地销售商品,消费者可以利用电商平台更好地对比和挑选商品。然而,海量的商品图像也成为了一种负担,由于商品图像数量过于庞大,消费者往往无法精准地浏览和挑选自己感兴趣的商品图像。
传统的图像检索方法虽然能够为消费者检索及推荐部分高质量商品图像,但这些方法往往无法实现较高精度的检索,也无法根据消费者的消费偏好进行有针对性的推荐。
发明内容
为了克服上述问题或者至少部分地解决上述问题,本发明实施例提供一种面向电商平台的商品图像大数据精准推送方法及***,利用多尺度信噪比检测、显著性区域信噪比检测的方法对部分低质量的商品图像进行排除,在此基础上,利用基于OCR技术的高频词汇匹配方法和谱聚类方法对待识别商品图像进行检测,进而为用户提供针对性的精准商品图像推荐。
本发明的实施例是这样实现的:
第一方面,本发明实施例提供一种面向电商平台的商品图像大数据精准推送方法,包括以下步骤:
获取并采用多尺度信噪比检测方法和显著性区域信噪比检测方法对电商平台的商品图像数据集中的商品图像进行检测,以确定商品图像数据集中的低质量图像;
对商品图像数据集中的低质量图像进行标记,并建立非推荐商品图像数据集和待推荐商品图像数据集;
获取并对目标用户的已消费商品图像进行多尺度优化处理,以得到优化图像;
利用OCR识别技术对优化图像中的词汇进行识别,得到并统计高频词汇;
获取并对电商平台中的待推荐商品图像数据集中的待识别商品图像进行多尺度优化处理,以得到待匹配商品优化图像;
利用OCR识别技术对待匹配商品优化图像中的词汇进行识别,以得到对应的目标词汇;
将目标词汇与高频词汇进行匹配,生成并根据匹配结果确定非目标商品图像;
获取并将目标用户的已消费商品图像作为正样本,获取并将电商平台的待推荐商品图像数据集中的目标用户未消费图像作为负样本;
基于正样本和负样本采用谱聚类方法对待推荐商品图像数据集中的待识别商品图像进行聚类处理,以得到聚类结果;
根据聚类结果确定待识别商品图像为目标推送图像或非目标推送图像,并将目标推送图像推送给目标用户。
为了解决现有技术中针对电商平台的商品图像无法实现较高精度的检索,也无法根据消费者的消费偏好进行有针对性的推荐的技术问题,本发明利用多尺度信噪比检测、显著性区域信噪比检测等方法对低质量的商品图像进行排除,不再将它们列入后面的计算步骤中,减少了计算资源的消耗;并利用基于多尺度优化处理的OCR识别方法,更高精度地对商品图像中的核心词汇进行了识别,提升了词汇匹配的精度,为商品图像精准推送提供了直接支持;先利用基于OCR技术的高频词汇匹配方法对待识别商品图像进行初步判别,再利用谱聚类技术对待识别商品图像进行最终判别,不仅增加了商品图像推送的精准度,也减少了不必要的计算资源消耗。可为用户提供针对性的精准商品图像推荐。
基于第一方面,在本发明的一些实施例中,上述获取并采用多尺度信噪比检测方法和显著性区域信噪比检测方法对电商平台的商品图像数据集中的商品图像进行检测,以确定低质量图像的方法包括以下步骤:
获取并对电商平台的商品图像数据集中的任意一副商品图像进行多尺度重建,以得到多个尺度下的商品图像;
检测并根据各个尺度下的商品图像的峰值信噪比确定低质量图像;
获取并对电商平台的商品图像数据集中的任意一副商品图像进行显著性检测,以得到商品显著性区域图像;
检测并根据商品显著性区域图像的峰值信噪比确定低质量图像。
基于第一方面,在本发明的一些实施例中,上述检测并根据各个尺度下的商品图像的峰值信噪比确定低质量图像的方法包括以下步骤:
计算各个尺度下的商品图像的峰值信噪比,以得到多个尺度下的图像峰值信噪比;
判断各个尺度下的图像峰值信噪比是否小于预置的峰值信噪比阈值,若至少一个尺度下的图像峰值信噪比小于峰值信噪比阈值,则将该商品图像确定为低质量图像。
基于第一方面,在本发明的一些实施例中,上述利用OCR技术对优化图像中的词汇进行识别,得到并统计高频词汇的方法包括以下步骤:
利用OCR技术对优化图像中的词汇进行识别,以得到词汇识别结果;
统计词汇识别结果中的各个词汇出现的次数,生成各个词汇的统计结果;
判断各个词汇的统计结果是否超出预置的高频次数阈值,如果是,则将对应词汇标注为高频词汇。
基于第一方面,在本发明的一些实施例中,上述根据聚类结果确定待识别商品图像为目标推送图像或非目标推送图像,并将目标推送图像推送给目标用户的方法包括以下步骤:
根据聚类结果中的与正样本聚为一类信息将待识别商品图像确定为目标推送图像;
根据聚类结果中的与负样本聚为一类信息将待识别商品图像确定为非目标推送图像;
统计并基于电商平台的待推荐商品图像数据集中的目标推送图像建立商品图像推送数据集,并将商品图像推送数据集中的图像推送给目标用户。
基于第一方面,在本发明的一些实施例中,上述获取并对目标用户的已消费商品图像进行多尺度优化处理,以得到优化图像的方法包括以下步骤:
获取并对目标用户的已消费商品图像进行多个尺度的高斯模糊处理,以得到多个尺度下的已消费商品模糊图像;
分别将各个尺度下的已消费商品模糊图像与对应的已消费商品图像进行细节差异对比,以得到多个细节信息;
将多个细节信息加权到对应的已消费商品图像中,以得到优化图像。
基于第一方面,在本发明的一些实施例中,上述OCR识别技术包括CTPN文本检测方法、Seglink模型和EAST算法其中一种或多种。
第二方面,本发明实施例提供一种面向电商平台的商品图像大数据精准推送***,包括低质量确定模块、标记模块、消费图像处理模块、第一识别模块、待识别处理模块、第二识别模块、词汇匹配模块、样本选定模块、图像聚类模块以及目标推送模块,其中:
低质量确定模块,用于获取并采用多尺度信噪比检测方法和显著性区域信噪比检测方法对电商平台的商品图像数据集中的商品图像进行检测,以确定商品图像数据集中的低质量图像;
标记模块,用于对商品图像数据集中的低质量图像进行标记,并建立非推荐商品图像数据集和待推荐商品图像数据集;
消费图像处理模块,用于获取并对目标用户的已消费商品图像进行多尺度优化处理,以得到优化图像;
第一识别模块,用于利用OCR识别技术对优化图像中的词汇进行识别,得到并统计高频词汇;
待识别处理模块,用于获取并对电商平台中的待推荐商品图像数据集中的待识别商品图像进行多尺度优化处理,以得到待匹配商品优化图像;
第二识别模块,用于利用OCR识别技术对待匹配商品优化图像中的词汇进行识别,以得到对应的目标词汇;
词汇匹配模块,用于将目标词汇与高频词汇进行匹配,生成并根据匹配结果确定非目标商品图像;
样本选定模块,用于获取并将目标用户的已消费商品图像作为正样本,获取并将电商平台的待推荐商品图像数据集中的目标用户未消费图像作为负样本;
图像聚类模块,用于基于正样本和负样本采用谱聚类方法对待推荐商品图像数据集中的待识别商品图像进行聚类处理,以得到聚类结果;
目标推送模块,用于根据聚类结果确定待识别商品图像为目标推送图像或非目标推送图像,并将目标推送图像推送给目标用户。
为了解决现有技术中针对电商平台的商品图像无法实现较高精度的检索,也无法根据消费者的消费偏好进行有针对性的推荐的技术问题,本***通过低质量确定模块、标记模块、消费图像处理模块、第一识别模块、待识别处理模块、第二识别模块、词汇匹配模块、样本选定模块、图像聚类模块以及目标推送模块等多个模块的结合,利用多尺度信噪比检测、显著性区域信噪比检测等方法对低质量的商品图像进行排除,不再将它们列入后面的计算步骤中,减少了计算资源的消耗;并利用基于多尺度优化处理的OCR识别方法,更高精度地对商品图像中的核心词汇进行了识别,提升了词汇匹配的精度,为商品图像精准推送提供了直接支持;先利用基于OCR技术的高频词汇匹配方法对待识别商品图像进行初步判别,再利用谱聚类技术对待识别商品图像进行最终判别,不仅增加了商品图像推送的精准度,也减少了不必要的计算资源消耗。可为用户提供针对性的精准商品图像推荐。
第三方面,本申请实施例提供一种电子设备,其包括存储器,用于存储一个或多个程序;处理器。当一个或多个程序被处理器执行时,实现如上述第一方面中任一项的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面中任一项的方法。
本发明实施例至少具有如下优点或有益效果:
本发明实施例提供一种面向电商平台的商品图像大数据精准推送方法及***,解决了现有技术中针对电商平台的商品图像无法实现较高精度的检索,也无法根据消费者的消费偏好进行有针对性的推荐的技术问题,本发明利用多尺度信噪比检测、显著性区域信噪比检测等方法对低质量的商品图像进行排除,不再将它们列入后面的计算步骤中,减少了计算资源的消耗;并利用基于多尺度优化处理的OCR识别方法,更高精度地对商品图像中的核心词汇进行了识别,提升了词汇匹配的精度,为商品图像精准推送提供了直接支持;先利用基于OCR技术的高频词汇匹配方法对待识别商品图像进行初步判别,再利用谱聚类技术对待识别商品图像进行最终判别,不仅增加了商品图像推送的精准度,也减少了不必要的计算资源消耗。可为用户提供针对性的精准商品图像推荐。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例一种面向电商平台的商品图像大数据精准推送方法的流程图;
图2为本发明实施例一种面向电商平台的商品图像大数据精准推送方法中信噪比检测方法的流程图;
图3为本发明实施例一种面向电商平台的商品图像大数据精准推送方法中多尺度优化处理的流程图;
图4为本发明实施例一种面向电商平台的商品图像大数据精准推送***的原理框图;
图5为本发明实施例提供的一种电子设备的结构框图。
附图标记说明:100、低质量确定模块;200、标记模块;300、消费图像处理模块;400、第一识别模块;500、待识别处理模块;600、第二识别模块;700、词汇匹配模块;800、样本选定模块;900、图像聚类模块;1000、目标推送模块;101、存储器;102、处理器;103、通信接口。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
在本发明实施例的描述中,“多个”代表至少2个。
实施例:
如图1-图3所示,第一方面,本发明实施例提供一种面向电商平台的商品图像大数据精准推送方法,包括以下步骤:
S1、获取并采用多尺度信噪比检测方法和显著性区域信噪比检测方法对电商平台的商品图像数据集中的商品图像进行检测,以确定商品图像数据集中的低质量图像;
进一步地,如图2所示,上述确定低质量图像的方法包括:
S11、获取并对电商平台的商品图像数据集中的任意一副商品图像进行多尺度重建,以得到多个尺度下的商品图像;
S12、检测并根据各个尺度下的商品图像的峰值信噪比确定低质量图像;包括:计算各个尺度下的商品图像的峰值信噪比,以得到多个尺度下的图像峰值信噪比;判断各个尺度下的图像峰值信噪比是否小于预置的峰值信噪比阈值,若至少一个尺度下的图像峰值信噪比小于峰值信噪比阈值,则将该商品图像确定为低质量图像;
S13、获取并对电商平台的商品图像数据集中的任意一副商品图像进行显著性检测,以得到商品显著性区域图像;
S14、检测并根据商品显著性区域图像的峰值信噪比确定低质量图像。
在本发明的一些实施例中,对于电商平台的商品图像数据集中的任意一幅商品图像,进行多尺度重建,并在多个尺度下检测商品图像的峰值信噪比,如果该图像在任意一个尺度下峰值信噪比很低,低于预置的信噪比阈值,直接将该图像认定为低质量图像。同时,对于电商平台的商品图像数据集中的任意一幅商品图像,对其进行显著性检测,并对显著性区域进行峰值信噪比检测,如果显著性区域峰值信噪比很低,低于预置的信噪比阈值,直接将该图像认定为低质量图像。上述显著性检测方法包括采用FT模型、GBVS模型、SWD模型、ITTI模型等进行图像显著性检测。上述显著性检测方法为常用显著性检测模型,在此不做赘述。
S2、对商品图像数据集中的低质量图像进行标记,并建立非推荐商品图像数据集和待推荐商品图像数据集;在上述信噪比检测排除低质量商品图像的步骤的基础上,将电商平台的商品图像数据集中噪声较高的图像定义为低质量图像,进行标记,此类图像不推荐给消费者,建立对应的非推荐商品图像数据集,并将电商平台的商品图像数据集中其他的非低质量图像作为待推荐商品图像,并建立待推荐商品图像数据集,为后续提供更为精准的数据,减少后续的运算量。
S3、获取并对目标用户的已消费商品图像进行多尺度优化处理,以得到优化图像;
进一步地,如图3所示,上述多尺度优化处理的方法包括:
S31、获取并对目标用户的已消费商品图像进行多个尺度的高斯模糊处理,以得到多个尺度下的已消费商品模糊图像;
S32、分别将各个尺度下的已消费商品模糊图像与对应的已消费商品图像进行细节差异对比,以得到多个细节信息;
S33、将多个细节信息加权到对应的已消费商品图像中,以得到优化图像。
在本发明的一些实施例中,对于某一特定消费者,在个人消费***中查找出已经消费过的商品图像(例如已经消费过的网球、足球、手机等商品图像),并对目标用户的已消费商品图像进行3个不同尺度的高斯模糊;将模糊后的图像分别和原图做减法,得到不同程度的细节信息;将不同程度的细节信息加权到原图中,得到含有丰富细节信息的加强优化图像。提高后续图像处理的精准度。
S4、利用OCR识别技术对优化图像中的词汇进行识别,得到并统计高频词汇;上述OCR识别技术包括CTPN文本检测方法、Seglink模型和EAST算法其中一种或多种。
进一步地,利用OCR技术对优化图像中的词汇进行识别,以得到词汇识别结果;统计词汇识别结果中的各个词汇出现的次数,生成各个词汇的统计结果;判断各个词汇的统计结果是否超出预置的高频次数阈值,如果是,则将对应词汇标注为高频词汇。
在本发明的一些实施例中,对于此消费者所有消费过的商品图像,先对它们进行多尺度优化处理,再利用OCR技术识别出图像中的所有词汇,并对高频词汇进行汇总,例如鼠标、键盘、网球等词汇出现频率较高,出现次数超过预置的高频次数阈值,例如出现3次以上,则直接将这些词汇认定为高频词汇,为后续词汇匹配提供数据参考。
S5、获取并对电商平台中的待推荐商品图像数据集中的待识别商品图像进行多尺度优化处理,以得到待匹配商品优化图像;
S6、利用OCR识别技术对待匹配商品优化图像中的词汇进行识别,以得到对应的目标词汇;
S7、将目标词汇与高频词汇进行匹配,生成并根据匹配结果确定非目标商品图像;
在本发明的一些实施例中,对于电商平台的商品图像数据集中的一幅新的商品图像,首先对其进行多尺度优化处理,在此基础上利用OCR技术进行识别,如果识别出的词汇中没有出现上述步骤中的高频词汇,直接认定为非目标商品图像,不推送给消费者。
S8、获取并将目标用户的已消费商品图像作为正样本,获取并将电商平台的待推荐商品图像数据集中的目标用户未消费图像作为负样本;
在本发明的一些实施例中,将某一特定消费者(目标用户)已经消费的商品图像在个人消费***中进行收集,并将其定义为正样本;同时收集一些消费者未曾消费的商品图像,并将它们定义为负样本。选择合适的样本为后续参照对比提供精准的数据。
S9、基于正样本和负样本采用谱聚类方法对待推荐商品图像数据集中的待识别商品图像进行聚类处理,以得到聚类结果;
S10、根据聚类结果确定待识别商品图像为目标推送图像或非目标推送图像,并将目标推送图像推送给目标用户。
进一步地,根据聚类结果中的与正样本聚为一类信息将待识别商品图像确定为目标推送图像;根据聚类结果中的与负样本聚为一类信息将待识别商品图像确定为非目标推送图像;统计并基于电商平台的待推荐商品图像数据集中的目标推送图像建立商品图像推送数据集,并将商品图像推送数据集中的图像推送给目标用户。
在本发明的一些实施例中,对于数据库中的一幅待识别商品图像(即步骤S5中的待识别商品图像),基于上述步骤中选择的正负样本利用谱聚类技术进行判别,如果该待识别图像和正样本聚为一类,将其定义为目标商品图像,推送给消费者;如果该待识别图像和负样本聚为一类,将其定义为非目标商品图像,不推送给消费者。对于电商平台的商品图像数据集中的每一幅新商品图像都进行判别,最终将所有的目标商品图像都推送给消费者。针对目标用户建立对应的商品图像推送数据集,以便更为精准全面的为特定用户提供特定的商品图像推荐,更好的满足用户消费购物需求。
为了解决现有技术中针对电商平台的商品图像无法实现较高精度的检索,也无法根据消费者的消费偏好进行有针对性的推荐的技术问题,本发明利用多尺度信噪比检测、显著性区域信噪比检测等方法对低质量的商品图像进行排除,不再将它们列入后面的计算步骤中,减少了计算资源的消耗;并利用基于多尺度优化处理的OCR识别方法,更高精度地对商品图像中的核心词汇进行了识别,提升了词汇匹配的精度,为商品图像精准推送提供了直接支持;先利用基于OCR技术的高频词汇匹配方法对待识别商品图像进行初步判别,再利用谱聚类技术对待识别商品图像进行最终判别,不仅增加了商品图像推送的精准度,也减少了不必要的计算资源消耗。可为用户提供针对性的精准商品图像推荐。
如图4所示,第二方面,本发明实施例提供一种面向电商平台的商品图像大数据精准推送***,包括低质量确定模块100、标记模块200、消费图像处理模块300、第一识别模块400、待识别处理模块500、第二识别模块600、词汇匹配模块700、样本选定模块800、图像聚类模块900以及目标推送模块1000,其中:
低质量确定模块100,用于获取并采用多尺度信噪比检测方法和显著性区域信噪比检测方法对电商平台的商品图像数据集中的商品图像进行检测,以确定商品图像数据集中的低质量图像;
标记模块200,用于对商品图像数据集中的低质量图像进行标记,并建立非推荐商品图像数据集和待推荐商品图像数据集;
消费图像处理模块300,用于获取并对目标用户的已消费商品图像进行多尺度优化处理,以得到优化图像;
第一识别模块400,用于利用OCR识别技术对优化图像中的词汇进行识别,得到并统计高频词汇;
待识别处理模块500,用于获取并对电商平台中的待推荐商品图像数据集中的待识别商品图像进行多尺度优化处理,以得到待匹配商品优化图像;
第二识别模块600,用于利用OCR识别技术对待匹配商品优化图像中的词汇进行识别,以得到对应的目标词汇;
词汇匹配模块700,用于将目标词汇与高频词汇进行匹配,生成并根据匹配结果确定非目标商品图像;
样本选定模块800,用于获取并将目标用户的已消费商品图像作为正样本,获取并将电商平台的待推荐商品图像数据集中的目标用户未消费图像作为负样本;
图像聚类模块900,用于基于正样本和负样本采用谱聚类方法对待推荐商品图像数据集中的待识别商品图像进行聚类处理,以得到聚类结果;
目标推送模块1000,用于根据聚类结果确定待识别商品图像为目标推送图像或非目标推送图像,并将目标推送图像推送给目标用户。
为了解决现有技术中针对电商平台的商品图像无法实现较高精度的检索,也无法根据消费者的消费偏好进行有针对性的推荐的技术问题,本***通过低质量确定模块100、标记模块200、消费图像处理模块300、第一识别模块400、待识别处理模块500、第二识别模块600、词汇匹配模块700、样本选定模块800、图像聚类模块900以及目标推送模块1000等多个模块的结合,利用多尺度信噪比检测、显著性区域信噪比检测等方法对低质量的商品图像进行排除,不再将它们列入后面的计算步骤中,减少了计算资源的消耗;并利用基于多尺度优化处理的OCR识别方法,更高精度地对商品图像中的核心词汇进行了识别,提升了词汇匹配的精度,为商品图像精准推送提供了直接支持;先利用基于OCR技术的高频词汇匹配方法对待识别商品图像进行初步判别,再利用谱聚类技术对待识别商品图像进行最终判别,不仅增加了商品图像推送的精准度,也减少了不必要的计算资源消耗。可为用户提供针对性的精准商品图像推荐。
如图5所示,第三方面,本申请实施例提供一种电子设备,其包括存储器101,用于存储一个或多个程序;处理器102。当一个或多个程序被处理器102执行时,实现如上述第一方面中任一项的方法。
还包括通信接口103,该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器101可用于存储软件程序及模块,处理器102通过执行存储在存储器101内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口103可用于与其他节点设备进行信令或数据的通信。
其中,存储器101可以是但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
处理器102可以是一种集成电路芯片,具有信号处理能力。该处理器102可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请所提供的实施例中,应该理解到,所揭露的方法及***和方法,也可以通过其它的方式实现。以上所描述的方法及***实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的方法及***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器102执行时实现如上述第一方面中任一项的方法。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
Claims (8)
1.一种面向电商平台的商品图像大数据精准推送方法,其特征在于,包括以下步骤:
获取并采用多尺度信噪比检测方法和显著性区域信噪比检测方法对电商平台的商品图像数据集中的商品图像进行检测,以确定商品图像数据集中的低质量图像;包括:获取并对电商平台的商品图像数据集中的任意一副商品图像进行多尺度重建,以得到多个尺度下的商品图像;检测并根据各个尺度下的商品图像的峰值信噪比确定低质量图像;获取并对电商平台的商品图像数据集中的任意一副商品图像进行显著性检测,以得到商品显著性区域图像;检测并根据商品显著性区域图像的峰值信噪比确定低质量图像;
对商品图像数据集中的低质量图像进行标记,并建立非推荐商品图像数据集和待推荐商品图像数据集;
获取并对目标用户的已消费商品图像进行多尺度优化处理,以得到优化图像;
利用OCR识别技术对优化图像中的词汇进行识别,得到并统计高频词汇;包括:利用OCR技术对优化图像中的词汇进行识别,以得到词汇识别结果;统计词汇识别结果中的各个词汇出现的次数,生成各个词汇的统计结果;判断各个词汇的统计结果是否超出预置的高频次数阈值,如果是,则将对应词汇标注为高频词汇;
获取并对电商平台中的待推荐商品图像数据集中的待识别商品图像进行多尺度优化处理,以得到待匹配商品优化图像;
利用OCR识别技术对待匹配商品优化图像中的词汇进行识别,以得到对应的目标词汇;
将目标词汇与高频词汇进行匹配,生成并根据匹配结果确定非目标商品图像;
获取并将目标用户的已消费商品图像作为正样本,获取并将电商平台的待推荐商品图像数据集中的目标用户未消费图像作为负样本;
基于正样本和负样本采用谱聚类方法对待推荐商品图像数据集中的待识别商品图像进行聚类处理,以得到聚类结果;
根据聚类结果确定待识别商品图像为目标推送图像或非目标推送图像,并将目标推送图像推送给目标用户。
2.根据权利要求1所述的一种面向电商平台的商品图像大数据精准推送方法,其特征在于,所述检测并根据各个尺度下的商品图像的峰值信噪比确定低质量图像的方法包括以下步骤:
计算各个尺度下的商品图像的峰值信噪比,以得到多个尺度下的图像峰值信噪比;
判断各个尺度下的图像峰值信噪比是否小于预置的峰值信噪比阈值,若至少一个尺度下的图像峰值信噪比小于峰值信噪比阈值,则将该商品图像确定为低质量图像。
3.根据权利要求1所述的一种面向电商平台的商品图像大数据精准推送方法,其特征在于,所述根据聚类结果确定待识别商品图像为目标推送图像或非目标推送图像,并将目标推送图像推送给目标用户的方法包括以下步骤:
根据聚类结果中的与正样本聚为一类信息将待识别商品图像确定为目标推送图像;
根据聚类结果中的与负样本聚为一类信息将待识别商品图像确定为非目标推送图像;
统计并基于电商平台的待推荐商品图像数据集中的目标推送图像建立商品图像推送数据集,并将商品图像推送数据集中的图像推送给目标用户。
4.根据权利要求1所述的一种面向电商平台的商品图像大数据精准推送方法,其特征在于,所述获取并对目标用户的已消费商品图像进行多尺度优化处理,以得到优化图像的方法包括以下步骤:
获取并对目标用户的已消费商品图像进行多个尺度的高斯模糊处理,以得到多个尺度下的已消费商品模糊图像;
分别将各个尺度下的已消费商品模糊图像与对应的已消费商品图像进行细节差异对比,以得到多个细节信息;
将多个细节信息加权到对应的已消费商品图像中,以得到优化图像。
5.根据权利要求1所述的一种面向电商平台的商品图像大数据精准推送方法,其特征在于,所述OCR识别技术包括CTPN文本检测方法、Seglink模型和EAST算法其中一种或多种。
6.一种面向电商平台的商品图像大数据精准推送***,其特征在于,包括低质量确定模块、标记模块、消费图像处理模块、第一识别模块、待识别处理模块、第二识别模块、词汇匹配模块、样本选定模块、图像聚类模块以及目标推送模块,其中:
低质量确定模块,用于获取并采用多尺度信噪比检测方法和显著性区域信噪比检测方法对电商平台的商品图像数据集中的商品图像进行检测,以确定商品图像数据集中的低质量图像;包括:获取并对电商平台的商品图像数据集中的任意一副商品图像进行多尺度重建,以得到多个尺度下的商品图像;检测并根据各个尺度下的商品图像的峰值信噪比确定低质量图像;获取并对电商平台的商品图像数据集中的任意一副商品图像进行显著性检测,以得到商品显著性区域图像;检测并根据商品显著性区域图像的峰值信噪比确定低质量图像;
标记模块,用于对商品图像数据集中的低质量图像进行标记,并建立非推荐商品图像数据集和待推荐商品图像数据集;
消费图像处理模块,用于获取并对目标用户的已消费商品图像进行多尺度优化处理,以得到优化图像;
第一识别模块,用于利用OCR识别技术对优化图像中的词汇进行识别,得到并统计高频词汇;包括:利用OCR技术对优化图像中的词汇进行识别,以得到词汇识别结果;统计词汇识别结果中的各个词汇出现的次数,生成各个词汇的统计结果;判断各个词汇的统计结果是否超出预置的高频次数阈值,如果是,则将对应词汇标注为高频词汇;
待识别处理模块,用于获取并对电商平台中的待推荐商品图像数据集中的待识别商品图像进行多尺度优化处理,以得到待匹配商品优化图像;
第二识别模块,用于利用OCR识别技术对待匹配商品优化图像中的词汇进行识别,以得到对应的目标词汇;
词汇匹配模块,用于将目标词汇与高频词汇进行匹配,生成并根据匹配结果确定非目标商品图像;
样本选定模块,用于获取并将目标用户的已消费商品图像作为正样本,获取并将电商平台的待推荐商品图像数据集中的目标用户未消费图像作为负样本;
图像聚类模块,用于基于正样本和负样本采用谱聚类方法对待推荐商品图像数据集中的待识别商品图像进行聚类处理,以得到聚类结果;
目标推送模块,用于根据聚类结果确定待识别商品图像为目标推送图像或非目标推送图像,并将目标推送图像推送给目标用户。
7.一种电子设备,其特征在于,包括:
存储器,用于存储一个或多个程序;
处理器;
当所述一个或多个程序被所述处理器执行时,实现如权利要求1-5中任一项所述的方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210495869.2A CN114581207B (zh) | 2022-05-09 | 2022-05-09 | 一种面向电商平台的商品图像大数据精准推送方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210495869.2A CN114581207B (zh) | 2022-05-09 | 2022-05-09 | 一种面向电商平台的商品图像大数据精准推送方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114581207A CN114581207A (zh) | 2022-06-03 |
CN114581207B true CN114581207B (zh) | 2022-09-13 |
Family
ID=81769169
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210495869.2A Active CN114581207B (zh) | 2022-05-09 | 2022-05-09 | 一种面向电商平台的商品图像大数据精准推送方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114581207B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116543373B (zh) * | 2023-04-14 | 2024-05-28 | 北京嘉沐安科技有限公司 | 基于区块链的直播视频大数据智能分析和优化方法及*** |
CN116562991B (zh) * | 2023-07-10 | 2024-02-13 | 北京未来链技术有限公司 | 面向元宇宙电商平台的商品大数据信息识别方法及*** |
CN117078358A (zh) * | 2023-10-13 | 2023-11-17 | 北京未来链技术有限公司 | 基于语音识别的元宇宙电商平台***智能构建方法及*** |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104765891A (zh) * | 2015-05-06 | 2015-07-08 | 苏州搜客信息技术有限公司 | 一种基于图像的搜索购物方法 |
CN105046277A (zh) * | 2015-07-15 | 2015-11-11 | 华南农业大学 | 特征显著性在图像质量评价中的鲁棒机理研究方法 |
CN109685806A (zh) * | 2018-11-14 | 2019-04-26 | 武汉科技大学 | 图像显著性检测方法及装置 |
CN110297935A (zh) * | 2019-06-28 | 2019-10-01 | 京东数字科技控股有限公司 | 图像检索方法、装置、介质及电子设备 |
CN110992141A (zh) * | 2019-11-28 | 2020-04-10 | 上海识装信息科技有限公司 | 基于识别商品图像推荐商品的方法、装置和电子设备 |
CN112329810A (zh) * | 2020-09-28 | 2021-02-05 | 北京师范大学 | 一种基于显著性检测的图像识别模型训练方法及装置 |
CN112347295A (zh) * | 2020-11-13 | 2021-02-09 | 杭州微洱网络科技有限公司 | 电商客服场景图片处理*** |
CN114139042A (zh) * | 2020-09-03 | 2022-03-04 | 阿里巴巴集团控股有限公司 | 图像的处理方法、装置、***、存储介质及处理器 |
CN114241484A (zh) * | 2022-02-23 | 2022-03-25 | 北京嘉沐安科技有限公司 | 一种面向社交网络的图像大数据精准检索方法及*** |
CN114443898A (zh) * | 2022-04-02 | 2022-05-06 | 北京吉道尔科技有限公司 | 一种面向互联网智慧教育的视频大数据推送方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2431793B (en) * | 2005-10-31 | 2011-04-27 | Sony Uk Ltd | Image processing |
US20210118020A1 (en) * | 2019-10-21 | 2021-04-22 | The Yes Platform | Price-Based User Feedback System |
US11468491B2 (en) * | 2020-05-01 | 2022-10-11 | Walmart Apollo, Llc | Systems and methods of product identification within an image |
KR102183143B1 (ko) * | 2020-05-20 | 2020-11-25 | 이창욱 | 빅데이터에 기반한 타깃 제품의 추천 색 결정 방법 및 장치 |
CN114238692A (zh) * | 2022-02-23 | 2022-03-25 | 北京嘉沐安科技有限公司 | 一种面向网络直播的视频大数据精准检索方法及*** |
-
2022
- 2022-05-09 CN CN202210495869.2A patent/CN114581207B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104765891A (zh) * | 2015-05-06 | 2015-07-08 | 苏州搜客信息技术有限公司 | 一种基于图像的搜索购物方法 |
CN105046277A (zh) * | 2015-07-15 | 2015-11-11 | 华南农业大学 | 特征显著性在图像质量评价中的鲁棒机理研究方法 |
CN109685806A (zh) * | 2018-11-14 | 2019-04-26 | 武汉科技大学 | 图像显著性检测方法及装置 |
CN110297935A (zh) * | 2019-06-28 | 2019-10-01 | 京东数字科技控股有限公司 | 图像检索方法、装置、介质及电子设备 |
CN110992141A (zh) * | 2019-11-28 | 2020-04-10 | 上海识装信息科技有限公司 | 基于识别商品图像推荐商品的方法、装置和电子设备 |
CN114139042A (zh) * | 2020-09-03 | 2022-03-04 | 阿里巴巴集团控股有限公司 | 图像的处理方法、装置、***、存储介质及处理器 |
CN112329810A (zh) * | 2020-09-28 | 2021-02-05 | 北京师范大学 | 一种基于显著性检测的图像识别模型训练方法及装置 |
CN112347295A (zh) * | 2020-11-13 | 2021-02-09 | 杭州微洱网络科技有限公司 | 电商客服场景图片处理*** |
CN114241484A (zh) * | 2022-02-23 | 2022-03-25 | 北京嘉沐安科技有限公司 | 一种面向社交网络的图像大数据精准检索方法及*** |
CN114443898A (zh) * | 2022-04-02 | 2022-05-06 | 北京吉道尔科技有限公司 | 一种面向互联网智慧教育的视频大数据推送方法 |
Non-Patent Citations (2)
Title |
---|
Android平台中基于LBS的视频个性化推送***的设计与实现;亢沛沛;《中国优秀硕士学位论文全文数据库信息科技辑》;20200515;I136-32 * |
基于大数据聚类的用户画像提取与智能推送***;薛晓璇;《电子设计工程》;20220120;第30卷(第2期);184-188 * |
Also Published As
Publication number | Publication date |
---|---|
CN114581207A (zh) | 2022-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114581207B (zh) | 一种面向电商平台的商品图像大数据精准推送方法及*** | |
CN107798571B (zh) | 恶意地址/恶意订单的识别***、方法及装置 | |
CN107194430B (zh) | 一种样本筛选方法及装置,电子设备 | |
EP3308301A1 (en) | Image and text data hierarchical classifiers | |
CN114494982B (zh) | 一种基于人工智能的直播视频大数据精准推荐方法及*** | |
CN114241484B (zh) | 一种面向社交网络的图像大数据精准检索方法及*** | |
CN106997350B (zh) | 一种数据处理的方法及装置 | |
CN111666275A (zh) | 一种数据处理方法、装置、电子设备及存储介质 | |
CN106033455B (zh) | 一种处理用户操作信息的方法与设备 | |
CN110363206B (zh) | 数据对象的聚类、数据处理及数据识别方法 | |
CN105786936A (zh) | 用于对搜索数据进行处理的方法及设备 | |
CN115019374A (zh) | 基于人工智能的智慧课堂学生专注度低耗检测方法及*** | |
CN116739704A (zh) | 基于人工智能的电商平台兴趣分析式商品推荐方法及*** | |
CN115018492A (zh) | 一种基于人工智能的智慧校园自动结账方法及*** | |
CN107944946B (zh) | 商品标签生成方法及装置 | |
CN114723536B (zh) | 基于图像大数据比对的电商平台廉价商品选取方法及*** | |
CN116562991B (zh) | 面向元宇宙电商平台的商品大数据信息识别方法及*** | |
CN117078358A (zh) | 基于语音识别的元宇宙电商平台***智能构建方法及*** | |
CN109284384B (zh) | 文本分析方法、装置、电子设备及可读存储介质 | |
CN115661833A (zh) | 一种基于简易拍照的目标商品大数据精准识别方法与*** | |
CN108280766B (zh) | 交易行为风险识别方法及装置 | |
CN115641191A (zh) | 一种基于数据分析的数据推送方法及ai*** | |
CN113516165B (zh) | 一种基于图像金字塔匹配后验的客户满意度判别方法 | |
CN112907306B (zh) | 一种客户满意度判别方法及装置 | |
CN112949752B (zh) | 业务预测***的训练方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220726 Address after: 464000 nongnongpu digital economy industrial park, Xinyang City, Henan Province Applicant after: Nongfu shop Development Group Co.,Ltd. Address before: No. a2584, second floor, College Park, Dongsheng Science Park, Zhongguancun, No. 18 Xueqing Road, Haidian District, Beijing 100089 Applicant before: Beijing jiamuan Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |