CN107729900A - 一种利用图片属性提取完成录入信息补全的方法及设备 - Google Patents

一种利用图片属性提取完成录入信息补全的方法及设备 Download PDF

Info

Publication number
CN107729900A
CN107729900A CN201710833179.2A CN201710833179A CN107729900A CN 107729900 A CN107729900 A CN 107729900A CN 201710833179 A CN201710833179 A CN 201710833179A CN 107729900 A CN107729900 A CN 107729900A
Authority
CN
China
Prior art keywords
module
item property
picture
commodity
property value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710833179.2A
Other languages
English (en)
Other versions
CN107729900B (zh
Inventor
徐然
张智祺
郭安琪
黄惠燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Pinwei Software Co Ltd
Original Assignee
Guangzhou Vipcom Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Vipcom Research Institute Co Ltd filed Critical Guangzhou Vipcom Research Institute Co Ltd
Priority to CN201710833179.2A priority Critical patent/CN107729900B/zh
Publication of CN107729900A publication Critical patent/CN107729900A/zh
Application granted granted Critical
Publication of CN107729900B publication Critical patent/CN107729900B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing
    • G06Q30/0635Processing of requisition or of purchase orders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Finance (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Accounting & Taxation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种利用图片属性提取完成录入信息补全的方法,包括供应商终端录入目标商品的商品信息;对商品的文本信息进行数据提取和清理,将所述文本信息对应的商品属性值上传并存储至数据库;利用预先训练的神经网络提取商品的图片特征,进行对目标商品的图像属性预测;比较商品属性的预测分数与设置阈值的相对大小,将预测分数高于设置阈值的商品属性值补入数据库或更新原有商品属性值。本发明还公开了应用该方法的设备。本发明通过图像识别、结合图像对应的知识图谱,实现了对于对于缺失的商品信息的补充,使得商品信息更加准确、完备,给用户带来便捷、高效和准确的搜索及购物体验。

Description

一种利用图片属性提取完成录入信息补全的方法及设备
技术领域
本发明涉及计算机技术领域,特别涉及一种利用图片属性提取完成录入信息补全的方法及设备。
背景技术
近些年电商进入蓬勃发展的高速阶段,一些大型B2C在纷纷涌向资本市场的同时,一些专注面向B2C的导购平台也在纷纷突起。电商导购平台发展的前期阶段主要是单纯为用户提供流量引导和商品推荐。而且,现有电商导购一般采用用户搜索查询或者分类查询的方式来找到目标商品。
商品录入信息主要包括品牌、商品名称、规格属性、尺码等相关信息,原本录入工作时由供货商直接将所有信息录入到数据库中,但是由于商品本身信息不全和录入失败等主客观原因,很大一部分商品属性的数据并没有被写入数据库,或者存在数据库中商品信息录入错误的情况,为后期调取商品信息的人,例如消费者检索商品带来不便。
因此,商品信息的完备、准确对于用户搜索和购买的意义重大,亟需一种基于图片属性提取的录如下信息补全的方法和设备的建立,对于缺失的商品信息的及时、快速、准确补充,使得商品信息更加准确、完备,给用户带来便捷、高效和准确的搜索及购物体验。
发明内容
为了解决现有技术中商品信息录入不完备的问题,本发明实施例提供了一种利用图片属性提取完成录入信息补全的方法及设备,所述技术方案如下:
一方面,提供了一种利用图片属性提取完成录入信息补全的方法,所述方法包括:
供应商终端录入目标商品的商品信息,所述商品信息包括商品文本信息和商品图片;
对商品的文本信息进行数据提取和清理,将所述文本信息对应的商品属性值上传并存储至数据库;
利用预先训练的神经网络提取商品的图片特征,进行对目标商品的图像属性预测;
比较商品属性的预测分数与设置阈值的相对大小,将预测分数高于设置阈值的商品属性值补入数据库或更新原有商品属性值。
具体地,供应商终端录入目标商品的商品信息的方法包括用户在电商平台主动输入的商品信息和搜索、浏览、购买和收藏的商品信息。
进一步地,所述方法还包括:
对商品图片进行预处理,通过深度学习模型从一张图片中提出多个局部细节图,利用预先训练的神经网络提取商品的图片特征,获取与上述图片特征相对应的语义特征,将语义特征定义为商品属性,赋予商品属性值;
利用目标商品的商品属性的文本信息对商品属性类别进行确认;
结合获得的目标商品的商品类别属性,应用训练得到的多任务CNN模型进行商品属性预测,获得商品属性的预测分数。
其中,对商品图片进行预处理的步骤包括模式的采集、模数转换、滤波、消除模糊、减少噪声、纠正几何失真。
具体地,所述图像特征提取包括图像形状特征提取、图像纹理特征提取和图像颜色特征提取。
进一步地,所述比较商品属性的预测分数与设置阈值的相对大小的步骤还包括:
比较目标商品的商品属性的预测分数与设置的阈值的相对大小,
若所得预测分数大于等于设置的阈值,则将该商品属性值直接录入数据库或更新原有商品属性值;
若所得预测分数小于设置的阈值,则将该商品属性值被弃去。
进一步地,所述方法还包括对数据库中的属性值进行自然语言化处理,得到目标商品补充后的商品属性的文本信息。
另一方面,本发明提供了一种利用图片属性提取完成录入信息补全的设备,所述设备包括:
录入模块,用于录入目标商品的商品信息,包括商品图片和文本信息;
数据提取模块和数据清理模块分别对录入的文本信息进行数据提取和清理;
数据传输模块和数据存储模块分别用于将所述商品信息对应的商品属性值上传至并存储至数据库;
图像识别模块,用于利用深度神经网络对目标商品的图像进行识别;
图像特征提取模块,用于利用深度神经网络对目标商品的图像进行特征提取;
商品属性类别确认模块用于利用目标商品的商品属性的文本信息对商品属性类别进行确认;
图像属性预测模块用于对目标商品的图片属性预测,获得商品属性的预测分数;
其中,所述录入模块的输出端与所述数据提取模块的输入端相连,所述数据提取模块的输出端与所述数据清理模块输入端相连;所述录入模块的输出端与所述图像识别模块和图像特征提取模块的输入端相连,所述图像特征提取模块的输出端和商品属性类别确认模块的输入端相连,所述商品属性类别确认模块的输出端与所述图像属性预测模块的输入端相连。
进一步地,所述设备还包括:
比较模块,用于比较目标商品的商品属性的预测分数与设置的阈值的相对大小;
补充模块,用于当数据库中没有某一商品属性值且其预测分数高于设置阈值,将该商品属性值补入数据库中;
更新模块,用于当数据库中有某一商品属性值,且其预测分数高于设置阈值,将该商品属性值更新数据库中原有商品属性值;
舍弃模块,用于某一商品属性值所得预测分数小于设置阈值,将该商品属性值弃去;
所述图像属性预测模块的输出端于所述比较模块的输入端相连;所述比较模块的输出端分别与所述补充模块、更新模块和舍弃模块的输入端相连。
进一步地,所述设备还包括自然语言化处理模块,用于对数据库中的属性值进行自然语言化处理,得到目标商品补充后的商品属性的文本信息;所述补充模块、更新模块和舍弃模块的输出端分别与所述自然语言化处理模块相连。
本发明实施例提供的技术方案带来的有益效果是:
1、本发明涉及的一种利用图片属性提取完成录入信息补全的方法对于缺失的商品信息的及时、快速、准确补充,使得商品信息更加准确、完备,给用户带来便捷、高效和准确的搜索及购物体验;
2、本发明涉及的一种利用图片属性提取完成录入信息补全的方法采用了计算机识别商品的图片并进行图像特征提取,转换成对应的文字描述,利用自然语言处理相关技术将文字描述与用户和商品的专属特性对应起来,完成商品信息的补充,为商品搜索提供更精准的信息源;
3、本发明涉及的一种利用图片属性提取完成录入信息补全的方法采用了图像补充信息的新的信息录入模式,经历了图像录入、属性识别、属性预测、信息补全的逻辑链条,使得更准确的获取商品信息的关键词,有利于快速便捷准确补充商品信息,为后期用户搜索商品提供了更便捷、高效、准确的信息基础;
4、本发明涉及的一种利用图片属性提取完成录入信息补全的设备结构紧凑,功能完备,采用了图像补充信息的新的信息录入模式,实现对缺失的商品信息的及时、快速、准确补充。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例1提供的利用图片属性提取完成录入信息补全的方法流程图;
图2是本发明实施例2提供的提取商品的图片特征、进行对目标商品的图像属性预测的方法流程图;
图3是本发明实施例2提供的比较商品属性的预测分数与设置阈值的相对大小的方法流程图;
图4是本发明实施例3提供的利用图片属性提取完成录入信息补全的设备结构示意图;
图中标号表示为:
41-录入模块,42-数据提取模块,43-数据清理模块,44-数据传输模块,45-数据存储模块,46-图像识别模块,47-图像特征提取模块,48-商品属性类别确认模块,49-图像属性预测模块,410-比较模块,411-补充模块,412-更新模块,413-舍弃模块,414-自然语言化处理模块。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
本发明实施例提供了一种利用图片属性提取完成录入信息补全的方法,如图1所示,所述方法包括:
S1:供应商终端录入目标商品的商品信息,所述商品信息包括商品文本信息和商品图片;之前现有技术中只有商品的单一的文本信息,本发明具体实施中,录入目标商品的信息增加了图片信息,不仅极大程度的丰富了信息量,而且信息描述更加客观、真实;
S2:对商品的文本信息进行数据提取和清理,将所述文本信息对应的商品属性值上传并存储至数据库;先将文本信息进行提取,获得与之对应的商品属性及其属性值,存入数据库中,与图片中提取的商品属性值做比对;
S3:利用预先训练的神经网络提取商品的图片特征,进行对目标商品的图像属性预测;基于神经网络进行物品识别、训练学习之后去识别录入的图片,读取图片中商品的信息,将提取的图片特征转换为对应的语义特征,在转换为商品的属性值,与上述文本信息中提取的属性值进行比对,图片中商品属性值的确定是本发明实施例的技术基础和信息基础;
S4:比较商品属性的预测分数与设置阈值的相对大小,将预测分数高于设置阈值的商品属性值补入数据库或更新原有商品属性值;通过属性预测,将图片中读取的商品属性值的预测分数与设置的分数的阈值进行比较,决定该商品属性值的取舍。
本发明实施例提供的技术方案带来的有益效果是:
1、本发明涉及的一种利用图片属性提取完成录入信息补全的方法对于缺失的商品信息的及时、快速、准确补充,使得商品信息更加准确、完备,给用户带来便捷、高效和准确的搜索及购物体验;
2、本发明涉及的一种利用图片属性提取完成录入信息补全的方法采用了计算机识别商品的图片并进行图像特征提取,转换成对应的文字描述,利用自然语言处理相关技术将文字描述与用户和商品的专属特性对应起来,完成商品信息的补充,为商品搜索提供更精准的信息源;
3、本发明涉及的一种利用图片属性提取完成录入信息补全的方法采用了图像补充信息的新的信息录入模式,经历了图像录入、属性识别、属性预测、信息补全的逻辑链条,使得更准确的获取商品信息的关键词,有利于快速便捷准确补充商品信息,为后期用户搜索商品提供了更便捷、高效、准确的信息基础。
实施例2
本发明实施例提供了一种利用图片属性提取完成录入信息补全的方法,如图2所示,所述方法包括:
S1:供应商终端录入目标商品的商品信息,所述商品信息包括商品文本信息和商品图片;之前现有技术中只有商品的单一的文本信息,本发明具体实施中,录入目标商品的信息增加了图片信息,不仅极大程度的丰富了信息量,而且信息描述更加客观、真实;具体地,供应商终端录入目标商品的商品信息的方法包括但不限于用户在电商平台主动输入的商品信息和搜索、浏览、购买和收藏的商品信息。
S2:对商品的文本信息进行数据提取和清理,将所述文本信息对应的商品属性值上传并存储至数据库;
将所述文本信息对应的商品属性值上传并存储至数据库的具体方法还包括:
对商品图片进行预处理,对商品图片进行预处理的步骤包括模式的采集、模数转换、滤波、消除模糊、减少噪声、纠正几何失真;预处理步骤保证了计算机识别和图片特征提取步骤的准确和高效。
通过深度学习模型从一张图片中提出多个局部细节图,利用预先训练的神经网络提取商品的图片特征,图像特征提取具体包括图像形状特征提取、图像纹理特征提取和图像颜色特征提取;
获取与上述图片特征相对应的语义特征,将语义特征定义为商品属性,赋予商品属性值;基于神经网络进行物品识别、训练学习之后去识别录入的图片,读取图片中商品的信息,将提取的图片特征转换为对应的语义特征,在转换为商品的属性值,与上述文本信息中提取的属性值进行比对,图片中商品属性值的确定是本发明实施例的技术基础和信息基础。
利用目标商品的商品属性的文本信息对商品属性类别进行确认;
结合获得的目标商品的商品类别属性,应用训练得到的多任务CNN模型进行商品属性预测,获得商品属性的预测分数。
S3:利用预先训练的神经网络提取商品的图片特征,进行对目标商品的图像属性预测;通过属性预测,将图片中读取的商品属性值的预测分数与设置的分数的阈值进行比较,决定该商品属性值的取舍。
S4:比较商品属性的预测分数与设置阈值的相对大小,将预测分数高于设置阈值的商品属性值补入数据库或更新原有商品属性值;
具体地,如图3所示,比较商品属性的预测分数与设置阈值的相对大小的步骤还包括:
比较目标商品的商品属性的预测分数与设置的阈值的相对大小,
若所得预测分数大于等于设置的阈值,则将该商品属性值直接录入数据库或更新原有商品属性值;
若所得预测分数小于设置的阈值,则将该商品属性值被弃去。
进一步地,所述方法还包括对数据库中的属性值进行自然语言化处理,得到目标商品补充后的商品属性的文本信息。
本发明实施例具有如下有益效果:
1、本发明涉及的一种利用图片属性提取完成录入信息补全的方法对于缺失的商品信息的及时、快速、准确补充,使得商品信息更加准确、完备,给用户带来便捷、高效和准确的搜索及购物体验;
2、本发明涉及的一种利用图片属性提取完成录入信息补全的方法采用了计算机识别商品的图片并进行图像特征提取,转换成对应的文字描述,利用自然语言处理相关技术将文字描述与用户和商品的专属特性对应起来,完成商品信息的补充,为商品搜索提供更精准的信息源;
3、本发明涉及的一种利用图片属性提取完成录入信息补全的方法采用了图像补充信息的新的信息录入模式,经历了图像录入、属性识别、属性预测、信息补全的逻辑链条,使得更准确的获取商品信息的关键词,有利于快速便捷准确补充商品信息,为后期用户搜索商品提供了更便捷、高效、准确的信息基础。
实施例3
本发明实施例提供了一种利用图片属性提取完成录入信息补全的方法,以白色连衣裙的商品为例,所述方法包括:
供应商终端主动录入文本信息“女款纯白长袖套头针织衫、百搭舒适”和白色连衣裙的商品对应的图片;相对于之前现有技术中只有商品的单一的文本信息,本发明具体实施中,白色连衣裙的图片信息极大程度的丰富了信息量,信息描述也更加客观、真实。
对商品对应的数据库中的文本信息“女款纯白长袖套头针织衫、百搭舒适”进行数据提取和清理,获得所述文本信息对应的商品属性“女款”“纯白”“长袖”“套头”“针织衫”“百搭”“舒适”,将所述文本信息对应的商品属性值上传并存储至数据库;
具体步骤包括:
对白色连衣裙的商品图片进行预处理,预处理的步骤包括模式的采集、模数转换、滤波、消除模糊、减少噪声、纠正几何失真;预处理步骤保证了计算机识别和图片特征提取步骤的准确和高效。
通过深度学习模型从这个单张图片中提出多个局部细节图,利用预先训练的深度卷曲神经网络提取白色连衣裙的图片特征,具体包括图像形状特征提取、图像纹理特征提取和图像颜色特征提取;获取与上述图片特征相对应的语义特征,将语义特征定义为商品属性,赋予商品属性值;并且经过VGG图像分类模型,将提取到的商品属性进行分类。
利用目标商品的商品属性的文本信息“女款纯白长袖套头针织衫、百搭舒适”对商品属性类别进行确认;
结合获得的白色连衣裙的商品类别属性,应用训练得到的多任务CNN模型进行商品属性预测,获得商品属性的预测分数。
通过属性预测,将图片中读取的商品属性值的预测分数与设置的分数的阈值进行比较,决定该商品属性值的取舍。
比较白色连衣裙的商品属性的预测分数与设置阈值的相对大小,将预测分数高于设置阈值的商品属性值补入数据库或更新原有商品属性值;
若所得预测分数大于等于设置的阈值,则将该商品属性值直接录入数据库或更新原有商品属性值;
若所得预测分数小于设置的阈值,则将该商品属性值被弃去。
在本实施例中,还包括对数据库中的属性值进行自然语言化处理,得到白色连衣裙的图片经过识别、特征提取、自然语言化处理后得到的文本信息补充到数据库中原有的商品属性的文本信息中。
本发明实施例具有如下有益效果:
1、本发明涉及的一种利用图片属性提取完成录入信息补全的方法对于缺失的商品信息的及时、快速、准确补充,使得商品信息更加准确、完备,给用户带来便捷、高效和准确的搜索及购物体验;
2、本发明涉及的一种利用图片属性提取完成录入信息补全的方法采用了计算机识别商品的图片并进行图像特征提取,转换成对应的文字描述,利用自然语言处理相关技术将文字描述与用户和商品的专属特性对应起来,完成商品信息的补充,为商品搜索提供更精准的信息源;
3、本发明涉及的一种利用图片属性提取完成录入信息补全的方法采用了图像补充信息的新的信息录入模式,经历了图像录入、属性识别、属性预测、信息补全的逻辑链条,使得更准确的获取商品信息的关键词,有利于快速便捷准确补充商品信息,为后期用户搜索商品提供了更便捷、高效、准确的信息基础。
实施例4
本发明提供了一种利用图片属性提取完成录入信息补全的设备,如图4所示,所述设备包括:
录入模块41,用于录入目标商品的商品信息,包括商品图片和文本信息;之前现有技术中录入的只有商品的单一的文本信息,本发明具体实施中,录入目标商品的信息增加了图片信息,不仅极大程度的丰富了信息量,而且信息描述更加客观、真实;具体地,供应商终端录入目标商品的商品信息的方法包括但不限于用户在电商平台主动输入的商品信息和搜索、浏览、购买和收藏的商品信息。
数据提取模块42和数据清理模块43分别对录入的文本信息进行数据提取和清理;对于录入的文本信息进行了数据的提取并存入数据库中,对于数据库中已有信息进行清理;是后期信息补全和校正的信息基础。
数据传输模块44和数据存储模块45分别用于将所述商品信息对应的商品属性值上传至并存储至数据库;
图像识别模块46,用于利用深度神经网络对目标商品的图像进行识别;
图像特征提取模块47,用于利用深度神经网络对目标商品的图像进行特征提取;
基于神经网络进行物品识别、训练学习之后去识别录入的图片,读取图片中商品的信息,将提取的图片特征转换为对应的语义特征,在转换为商品的属性值,与上述文本信息中提取的属性值进行比对,图片中商品属性值的确定是本发明实施例的技术基础和信息基础。
商品属性类别确认模块48用于利用目标商品的商品属性的文本信息对商品属性类别进行确认;
图像属性预测模块49用于对目标商品的图片属性预测,获得商品属性的预测分数;
其中,所述录入模块41的输出端与所述数据提取模块42的输入端相连,所述数据提取模块42的输出端与所述数据清理模块43输入端相连;所述录入模块41的输出端与所述图像识别模块46和图像特征提取模块47的输入端相连,所述图像特征提取模块47的输出端和商品属性类别确认模块48的输入端相连,所述商品属性类别确认模块48的输出端与所述图像属性预测模块49的输入端相连。
进一步地,在比较商品属性的预测分数与设置阈值的相对大小,将预测分数高于设置阈值的商品属性值补入数据库或更新原有商品属性值时,所述设备还包括:
比较模块410,用于比较目标商品的商品属性的预测分数与设置的阈值的相对大小;
补充模块411,用于当数据库中没有某一商品属性值且其预测分数高于设置阈值,将该商品属性值补入数据库中;
更新模块412,用于当数据库中有某一商品属性值,且其预测分数高于设置阈值,将该商品属性值更新数据库中原有商品属性值;
舍弃模块413,用于某一商品属性值所得预测分数小于设置阈值,将该商品属性值弃去;
所述图像属性预测模块49的输出端于所述比较模块410的输入端相连;所述比较模块410的输出端分别与所述补充模块411、更新模块412和舍弃模块413的输入端相连。
进一步地,所述设备还包括自然语言化处理模块414,用于对数据库中的属性值进行自然语言化处理,得到目标商品补充后的商品属性的文本信息;所述补充模块411、更新模块412和舍弃模块413的输出端分别与所述自然语言化处理模块414相连。
综上所述,本发明实施例提供的技术方案带来的有益效果是:
1、本发明涉及的一种利用图片属性提取完成录入信息补全的设备结构紧凑,功能完备,采用了图像补充信息的新的信息录入模式,实现对缺失的商品信息的及时、快速、准确补充;
2、本发明涉及的一种利用图片属性提取完成录入信息补全的设备对于缺失的商品信息的及时、快速、准确补充,使得商品信息更加准确、完备,给用户带来便捷、高效和准确的搜索及购物体验;
3、本发明涉及的一种利用图片属性提取完成录入信息补全的设备采用了计算机识别商品的图片并进行图像特征提取,转换成对应的文字描述,利用自然语言处理相关技术将文字描述与用户和商品的专属特性对应起来,完成商品信息的补充,为商品搜索提供更精准的信息源;
4、本发明涉及的一种利用图片属性提取完成录入信息补全的设备采用了图像补充信息的新的信息录入模式,经历了图像录入、属性识别、属性预测、信息补全的逻辑链条,使得更准确的获取商品信息的关键词,有利于快速便捷准确补充商品信息,为后期用户搜索商品提供了更便捷、高效、准确的信息基础。
需要说明的是:上述实施例利用图片属性提取完成录入信息补全的设备在进行录入信息补全业务时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的利用图片属性提取完成录入信息补全的设备与利用图片属性提取完成录入信息补全的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种利用图片属性提取完成录入信息补全的方法,其特征在于,所述方法包括:
供应商终端录入目标商品的商品信息,所述商品信息包括商品文本信息和商品图片;
对商品的文本信息进行数据提取和清理,将所述文本信息对应的商品属性值上传并存储至数据库;
利用预先训练的神经网络提取商品的图片特征,进行对目标商品的图像属性预测;
比较商品属性的预测分数与设置阈值的相对大小,将预测分数高于设置阈值的商品属性值补入数据库或更新原有商品属性值。
2.根据权利要求1所述的利用图片属性提取完成录入信息补全的方法,其特征在于,所述供应商终端录入目标商品的商品信息的方法包括用户在电商平台的主动输入的商品信息和搜索、浏览、购买和收藏的商品信息。
3.根据权利要求1所述的利用图片属性提取完成录入信息补全的方法,其特征在于,所述方法还包括:
对商品图片进行预处理,通过深度学习模型从一张图片中提出多个局部细节图,利用预先训练的神经网络提取商品的图片特征,获取与上述图片特征相对应的语义特征,将语义特征定义为商品属性,赋予商品属性值;
利用目标商品的商品属性的文本信息对商品属性类别进行确认;
结合获得的目标商品的商品类别属性,应用训练得到的多任务CNN模型进行商品属性预测,获得商品属性的预测分数。
4.根据权利要求3所述的利用图片属性提取完成录入信息补全的方法,其特征在于,对商品图片进行预处理的步骤包括模式的采集、模数转换、滤波、消除模糊、减少噪声、纠正几何失真。
5.根据权利要求3所述的利用图片属性提取完成录入信息补全的方法,其特征在于,所述图像特征提取包括图像形状特征提取、图像纹理特征提取和图像颜色特征提取。
6.根据权利要求1或3所述的利用图片属性提取完成录入信息补全的方法,其特征在于,所述比较商品属性的预测分数与设置阈值的相对大小的步骤还包括:
比较目标商品的商品属性的预测分数与设置的阈值的相对大小,
若所得预测分数大于等于设置的阈值,则将该商品属性值直接录入数据库或更新原有商品属性值;
若所得预测分数小于设置的阈值,则将该商品属性值被弃去。
7.根据权利要求1所述的利用图片属性提取完成录入信息补全的方法,其特征在于,所述方法还包括对数据库中的属性值进行自然语言化处理,得到目标商品补充后的商品属性的文本信息。
8.一种利用图片属性提取完成录入信息补全的设备,其特征在于,所述设备包括:
录入模块,用于录入目标商品的商品信息,包括商品图片和文本信息;
数据提取模块和数据清理模块分别对录入的文本信息进行数据提取和清理;
数据传输模块和数据存储模块分别用于将所述商品信息对应的商品属性值上传至并存储至数据库;
图像识别模块,用于利用深度神经网络对目标商品的图像进行识别;
图像特征提取模块,用于利用深度神经网络对目标商品的图像进行特征提取;
商品属性类别确认模块用于利用目标商品的商品属性的文本信息对商品属性类别进行确认;
图像属性预测模块用于对目标商品的图片属性预测,获得商品属性的预测分数;
所述录入模块的输出端与所述数据提取模块的输入端相连,所述数据提取模块的输出端与所述数据清理模块输入端相连;所述录入模块的输出端与所述图像识别模块和图像特征提取模块的输入端相连,所述图像特征提取模块的输出端和商品属性类别确认模块的输入端相连,所述商品属性类别确认模块的输出端与所述图像属性预测模块的输入端相连。
9.根据权利要求8所述的利用图片属性提取完成录入信息补全的设备,其特征在于,所述设备还包括:
比较模块,用于比较目标商品的商品属性的预测分数与设置的阈值的相对大小;
补充模块,用于当数据库中没有某一商品属性值且其预测分数高于设置阈值,将该商品属性值补入数据库中;
更新模块,用于当数据库中有某一商品属性值,且其预测分数高于设置阈值,将该商品属性值更新数据库中原有商品属性值;
舍弃模块,用于某一商品属性值所得预测分数小于设置阈值,将该商品属性值弃去;
所述图像属性预测模块的输出端于所述比较模块的输入端相连;所述比较模块的输出端分别与所述补充模块、更新模块和舍弃模块的输入端相连。
10.根据权利要求8或9所述的利用图片属性提取完成录入信息补全的设备,其特征在于,所述设备还包括自然语言化处理模块,用于对数据库中的属性值进行自然语言化处理,得到目标商品补充后的商品属性的文本信息;所述补充模块、更新模块和舍弃模块的输出端分别与所述自然语言化处理模块相连。
CN201710833179.2A 2017-09-15 2017-09-15 一种利用图片属性提取完成录入信息补全的方法及设备 Active CN107729900B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710833179.2A CN107729900B (zh) 2017-09-15 2017-09-15 一种利用图片属性提取完成录入信息补全的方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710833179.2A CN107729900B (zh) 2017-09-15 2017-09-15 一种利用图片属性提取完成录入信息补全的方法及设备

Publications (2)

Publication Number Publication Date
CN107729900A true CN107729900A (zh) 2018-02-23
CN107729900B CN107729900B (zh) 2021-04-27

Family

ID=61207209

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710833179.2A Active CN107729900B (zh) 2017-09-15 2017-09-15 一种利用图片属性提取完成录入信息补全的方法及设备

Country Status (1)

Country Link
CN (1) CN107729900B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108776673A (zh) * 2018-05-23 2018-11-09 哈尔滨工业大学 关系模式的自动转换方法、装置及存储介质
CN109255290A (zh) * 2018-07-27 2019-01-22 北京三快在线科技有限公司 菜单识别方法、装置、电子设备及存储介质
CN109767397A (zh) * 2019-01-09 2019-05-17 三星电子(中国)研发中心 一种基于人工智能的图像优化方法和***
CN109902733A (zh) * 2019-02-22 2019-06-18 北京三快在线科技有限公司 录入物品信息的方法、装置及存储介质
CN110472078A (zh) * 2019-08-08 2019-11-19 中国石油集团川庆钻探工程有限公司 一种钻头身份信息录入到钻井数据库的方法
CN110968775A (zh) * 2018-09-30 2020-04-07 北京京东尚科信息技术有限公司 商品属性生成模型的训练方法及生成、搜索方法和***
CN111539779A (zh) * 2019-01-21 2020-08-14 阿里巴巴集团控股有限公司 商品页面的生成方法、电子设备及计算机存储介质
CN112258259A (zh) * 2019-08-14 2021-01-22 北京京东尚科信息技术有限公司 数据处理方法、装置和计算机可读存储介质
CN112559783A (zh) * 2019-09-26 2021-03-26 北京京东尚科信息技术有限公司 一种基于图像分析的商品数据提取方法和装置
CN113570427A (zh) * 2021-07-22 2021-10-29 上海普洛斯普新数字科技有限公司 一种提取识别线上或***商品特征信息的***
CN113592512A (zh) * 2021-07-22 2021-11-02 上海普洛斯普新数字科技有限公司 一种线上商品身份唯一性识别确认***
CN114140696A (zh) * 2022-01-27 2022-03-04 深圳市慧为智能科技股份有限公司 商品识别***优化方法、装置、设备及存储介质
CN115034866A (zh) * 2022-08-10 2022-09-09 新立讯科技股份有限公司 一种基于多源数据融合的图像处理方法及***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102957663A (zh) * 2011-08-17 2013-03-06 阿里巴巴集团控股有限公司 一种商品信息提供方法、***及装置
CN103489008A (zh) * 2012-06-14 2014-01-01 中兴通讯股份有限公司 图像产品信息提取方法和装置
US9384422B2 (en) * 2014-04-04 2016-07-05 Ebay Inc. Image evaluation
CN106776710A (zh) * 2016-11-18 2017-05-31 广东技术师范学院 一种基于垂直搜索引擎的图文知识库构建方法
CN106919619A (zh) * 2015-12-28 2017-07-04 阿里巴巴集团控股有限公司 一种商品聚类方法、装置及电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102957663A (zh) * 2011-08-17 2013-03-06 阿里巴巴集团控股有限公司 一种商品信息提供方法、***及装置
CN103489008A (zh) * 2012-06-14 2014-01-01 中兴通讯股份有限公司 图像产品信息提取方法和装置
US9384422B2 (en) * 2014-04-04 2016-07-05 Ebay Inc. Image evaluation
CN106919619A (zh) * 2015-12-28 2017-07-04 阿里巴巴集团控股有限公司 一种商品聚类方法、装置及电子设备
CN106776710A (zh) * 2016-11-18 2017-05-31 广东技术师范学院 一种基于垂直搜索引擎的图文知识库构建方法

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108776673B (zh) * 2018-05-23 2020-08-18 哈尔滨工业大学 关系模式的自动转换方法、装置及存储介质
CN108776673A (zh) * 2018-05-23 2018-11-09 哈尔滨工业大学 关系模式的自动转换方法、装置及存储介质
CN109255290B (zh) * 2018-07-27 2021-06-25 北京三快在线科技有限公司 菜单识别方法、装置、电子设备及存储介质
CN109255290A (zh) * 2018-07-27 2019-01-22 北京三快在线科技有限公司 菜单识别方法、装置、电子设备及存储介质
CN110968775A (zh) * 2018-09-30 2020-04-07 北京京东尚科信息技术有限公司 商品属性生成模型的训练方法及生成、搜索方法和***
CN109767397A (zh) * 2019-01-09 2019-05-17 三星电子(中国)研发中心 一种基于人工智能的图像优化方法和***
CN111539779A (zh) * 2019-01-21 2020-08-14 阿里巴巴集团控股有限公司 商品页面的生成方法、电子设备及计算机存储介质
CN109902733A (zh) * 2019-02-22 2019-06-18 北京三快在线科技有限公司 录入物品信息的方法、装置及存储介质
CN110472078A (zh) * 2019-08-08 2019-11-19 中国石油集团川庆钻探工程有限公司 一种钻头身份信息录入到钻井数据库的方法
CN112258259A (zh) * 2019-08-14 2021-01-22 北京京东尚科信息技术有限公司 数据处理方法、装置和计算机可读存储介质
CN112559783A (zh) * 2019-09-26 2021-03-26 北京京东尚科信息技术有限公司 一种基于图像分析的商品数据提取方法和装置
CN113570427A (zh) * 2021-07-22 2021-10-29 上海普洛斯普新数字科技有限公司 一种提取识别线上或***商品特征信息的***
CN113592512A (zh) * 2021-07-22 2021-11-02 上海普洛斯普新数字科技有限公司 一种线上商品身份唯一性识别确认***
CN114140696A (zh) * 2022-01-27 2022-03-04 深圳市慧为智能科技股份有限公司 商品识别***优化方法、装置、设备及存储介质
CN115034866A (zh) * 2022-08-10 2022-09-09 新立讯科技股份有限公司 一种基于多源数据融合的图像处理方法及***
CN115034866B (zh) * 2022-08-10 2022-10-21 新立讯科技股份有限公司 一种基于多源数据融合的图像处理方法及***

Also Published As

Publication number Publication date
CN107729900B (zh) 2021-04-27

Similar Documents

Publication Publication Date Title
CN107729900A (zh) 一种利用图片属性提取完成录入信息补全的方法及设备
CN107861972A (zh) 一种用户录入商品信息后显示商品全结果的方法及设备
CN107944913B (zh) 基于大数据用户行为分析的高***购买意向预测方法
CN107748754B (zh) 一种知识图谱完善方法和装置
CN107705066B (zh) 一种商品入库时信息录入方法及电子设备
CN107679960B (zh) 一种基于服装图像和标签文本双模态内容分析的个性化服装的推荐方法
TWI631474B (zh) Method and device for product identification label and method for product navigation
CN107193962B (zh) 一种互联网推广信息的智能配图方法及装置
US10360623B2 (en) Visually generated consumer product presentation
CN105550369B (zh) 一种搜索目标商品集的方法及装置
CN105095187A (zh) 一种搜索意图识别方法及装置
CN107133345A (zh) 基于人工智能的交互方法和装置
CN107862561A (zh) 一种基于图片属性提取建立用户兴趣库的方法及设备
CN108509465A (zh) 一种视频数据的推荐方法、装置和服务器
CN110019943B (zh) 视频推荐方法、装置、电子设备和存储介质
CN107833082A (zh) 一种商品图片的推荐方法和装置
CN105868686A (zh) 视频分类方法及装置
CN114332680A (zh) 图像处理、视频搜索方法、装置、计算机设备和存储介质
Chen et al. Recognizing the style of visual arts via adaptive cross-layer correlation
CN113239159B (zh) 基于关系推理网络的视频和文本的跨模态检索方法
CN112699232A (zh) 文本标签提取方法、装置、设备和存储介质
CN116975615A (zh) 基于视频多模态信息的任务预测方法和装置
CN110413825A (zh) 面向时尚电商的街拍推荐***
CN116089645A (zh) 一种基于层次化风格的条件文本-电商图片检索方法和***
CN103136221B (zh) 一种生成需求模板的方法、需求识别的方法及其装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20221229

Address after: 510123 building 6, No. 20, Huahai street, Fangcun, Liwan District, Guangzhou, Guangdong (office only)

Patentee after: GUANGZHOU PINWEI SOFTWARE Co.,Ltd.

Address before: 510000 room 01, No.314, Fangcun Avenue middle, Liwan District, Guangzhou City, Guangdong Province

Patentee before: GUANGZHOU WEIPINHUI RESEARCH INSTITUTE CO.,LTD.

TR01 Transfer of patent right