CN107748754B - 一种知识图谱完善方法和装置 - Google Patents

一种知识图谱完善方法和装置 Download PDF

Info

Publication number
CN107748754B
CN107748754B CN201710833203.2A CN201710833203A CN107748754B CN 107748754 B CN107748754 B CN 107748754B CN 201710833203 A CN201710833203 A CN 201710833203A CN 107748754 B CN107748754 B CN 107748754B
Authority
CN
China
Prior art keywords
commodity
knowledge graph
extracted
label
tags
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710833203.2A
Other languages
English (en)
Other versions
CN107748754A (zh
Inventor
徐然
崔燕红
张智祺
黄惠燕
郭安琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Pinwei Software Co Ltd
Original Assignee
Guangzhou Weipinhui Research Institute Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Weipinhui Research Institute Co ltd filed Critical Guangzhou Weipinhui Research Institute Co ltd
Priority to CN201710833203.2A priority Critical patent/CN107748754B/zh
Publication of CN107748754A publication Critical patent/CN107748754A/zh
Application granted granted Critical
Publication of CN107748754B publication Critical patent/CN107748754B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种知识图谱完善方法和装置,属于电子商务技术领域。方法包括:从至少包含商品图片的商品信息中提取商品的标签;将提取到的标签添加至知识图谱,知识图谱包括商品知识图谱和/或用户知识图谱;在知识图谱中设置与标签相对应的关系。本发明实施例能够丰富知识图谱中的标签,以实现用户对商品的精准搜索以及实现对用户购买商品的精准推荐。

Description

一种知识图谱完善方法和装置
技术领域
本发明涉及电子商务技术领域,特别涉及一种知识图谱完善方法和装置。
背景技术
知识图谱是一种基于图的数据结构,其结点代表实体(entity)或者概念(concept),边代表实体/概念之间的各种语义关系,在搜索引擎中通过使用知识图谱,能够更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如,在电子商务领域,利用商品知识图谱能够有助于用户搜索到相应的商品,以及利用用户知识图谱能够有助于向用户进行商品推荐。
现有技术中,商品知识图谱或用户知识图谱中所包括商品的标签通常只标识出商品的品牌、颜色、材质、尺寸、基本样式等基本特性,并且标签是根据卖家用户上传商品时提供的信息,经过人工审核后直接标识在商品上的,然而目前用户对商品关注的角度越来越多,若用户想针对商品的基本特性以外的特性进行商品搜索时,比如搜索指定花纹的某个商品,就会导致由于知识图谱未包含对应的标签而无法实现对商品的精准搜索;另外,也无法根据用户对商品关注的角度实现对用户购买商品的精准推荐。
因此现有技术中存在知识图谱的商品标签比较简单粗糙的问题,亟需对知识图谱进行完善,丰富知识图谱中的标签,以实现用户对商品的精准搜索以及实现对用户购买商品的精准推荐。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种知识图谱完善方法和装置,丰富知识图谱中的标签,以实现用户对商品的精准搜索以及实现对用户购买商品的精准推荐。所述技术方案如下:
第一方面,提供了一种知识图谱完善方法,所述方法包括:
从至少包含商品图片的商品信息中提取商品的标签;
将提取到的所述标签添加至知识图谱,所述知识图谱包括商品知识图谱和/或用户知识图谱;
在所述知识图谱中设置与提取到的所述标签相对应的关系。
结合第一方面,在第一种可能的实现方式中,所述商品信息仅包含所述商品图片,所述从包含商品图片的商品信息中提取商品的标签包括:
从所述商品图片中提取图像特征;
获取与所述图像特征对应的标签。
结合第一方面,在第二种可能的实现方式中,所述商品信息包含所述商品图片和所述商品的文本描述信息,所述从至少包含商品图片的商品信息中提取商品的标签包括:
提取所述商品图片中的图像特征;以及
提取所述文本描述信息中的关键词;
根据所述图像特征和所述关键词,确定所述商品的标签;
所述文本描述信息包括所述商品的标题信息、所述商品的网页信息和所述商品的评论信息中的至少一种。
结合第一方面的第一种或第二种可能的实现方式,在第三种可能的实现方式中,
所述将提取到的所述标签添加至知识图谱包括:
确定提取到的所述标签对应的标签类别;
根据所述标签类别,将提取到的所述标签添加至所述知识图谱;
所述在所述知识图谱中设置与提取到的所述标签相对应的关系包括:
在所述商品知识图谱中设置提取到的所述标签与所述商品之间的关系;
在所述用户知识图谱中匹配提取到的所述标签与其他标签之间的关系;以及
在所述用户知识图谱中更新提取到的所述标签与其他标签之间的关系。
结合第一方面的第一种或第二种可能的实现方式,在第四种可能的实现方式中,
所述将提取到的所述标签添加至知识图谱包括:
将提取到的所述标签添加至所述标签库;
定义提取到的所述标签所属的标签类别;
根据所述标签类别,将提取到的所述标签添加至所述知识图谱;
所述在所述知识图谱中设置与提取到的所述标签相对应的关系包括:
在所述商品知识图谱中设置提取到的所述标签与所述商品之间的关系;
在所述用户知识图谱中更新提取到的所述标签与其他标签之间的关系。
第二方面,提供了一种知识图谱完善装置,所述装置包括:
提取模块,用于从至少包含商品图片的商品信息中提取商品的标签;
添加模块,用于将提取到的所述标签添加至知识图谱,所述知识图谱包括商品知识图谱和/或用户知识图谱;
设置模块,用于在所述知识图谱中设置与提取到的所述标签相对应的关系。
结合第二方面,在第一种可能的实现方式中,所述商品信息仅包含所述商品图片,所述提取模块具体用于:
从所述商品图片中提取图像特征;
获取与所述图像特征对应的标签。
结合第二方面,在第二种可能的实现方式中,所述商品信息包含所述商品图片和所述商品的文本描述信息,所述提取模块具体还用于:
提取所述商品图片中的图像特征;以及
提取所述文本描述信息中的关键词;
根据所述图像特征和所述关键词,确定所述商品的标签;
所述文本描述信息包括所述商品的标题信息、所述商品的网页信息和所述商品的评论信息中的至少一种。
结合第二方面的第一种或第二种可能的实现方式,在第三种可能的实现方式中,
所述添加模块具体用于:
确定提取到的所述标签对应的标签类别;
根据所述标签类别,将提取到的所述标签添加至所述知识图谱;
所述设置模块具体用于:
在所述商品知识图谱中设置提取到的所述标签与所述商品之间的关系;
在所述用户知识图谱中匹配提取到的所述标签与其他标签之间的关系;以及
在所述用户知识图谱中更新提取到的所述标签与其他标签之间的关系。
结合第二方面的第一种或第二种可能的实现方式,在第四种可能的实现方式中,
所述添加模块具体还用于:
将所述标签添加至所述标签库;
定义所述标签所属的标签类别;
根据所述标签类别,将提取到的所述标签添加至所述知识图谱;
所述设置模块具体还用于:
在所述商品知识图谱中设置提取到的所述标签与所述商品之间的关系;
在所述用户知识图谱中更新提取到的所述标签与其他标签之间的关系。
本发明实施例提供的技术方案带来的有益效果是:
通过从至少包含商品图片的商品信息中提取商品的标签,并将标签添加至知识图谱,知识图谱包括商品知识图谱和/或用户知识图谱,以及在知识图谱中设置与提取到的标签相对应的关系,相比较现有技术的知识图谱仅标识出商品的品牌、颜色、材质、尺寸、基本样式等基本特性而言,从至少包含商品图片的商品信息中所提取的商品的标签更能够反映商品的更多信息和特性,因此使得商品知识图谱和/或用户知识图谱中的标签更加丰富、多样化,从而实现用户对商品的精准搜索以及实现对用户购买商品的精准推荐。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种知识图谱完善方法流程图;
图2是本发明实施例提供的一种知识图谱完善方法流程图;
图3是本发明实施例提供的一种知识图谱完善方法流程图;
图4是本发明实施例提供的一种知识图谱完善装置结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
本发明实施例提供了一种知识图谱完善方法,参照图1所示,该方法包括:
101、从至少包含商品图片的商品信息中提取商品的标签。
具体的,商品信息仅包含商品图片,从包含商品图片的商品信息中提取商品的标签,该过程可以包括:
从商品图片中提取图像特征;
获取与图像特征对应的标签。
商品信息包含商品图片和商品的文本描述信息,从至少包含商品图片的商品信息中提取商品的标签,该过程可以包括:
提取商品图片中的图像特征;以及
提取文本描述信息中的关键词;
根据图像特征和关键词,确定商品的标签;
文本描述信息包括商品的标题信息、商品的网页信息和商品的评论信息中的至少一种。
102、将提取到的标签添加至知识图谱,知识图谱包括商品知识图谱和/或用户知识图谱。
103、在知识图谱中设置与提取到的标签相对应的关系。
本发明实施例提供了一种知识图谱完善方法,通过从至少包含商品图片的商品信息中提取商品的标签,并将提取到的标签添加至知识图谱,知识图谱包括商品知识图谱和/或用户知识图谱,以及在知识图谱中设置与提取到的标签相对应的关系,相比较现有技术的知识图谱仅标识出商品的品牌、颜色、材质、尺寸、基本样式等基本特性而言,从至少包含商品图片的商品信息中所提取的商品的标签更能够反映商品的更多信息和特性,因此使得商品知识图谱和/或用户知识图谱中的标签更加丰富、多样化、精细化,从而实现用户对商品的精准搜索以及实现对用户购买商品的精准推荐。
实施例二
本发明实施例提供了一种知识图谱完善方法,参照图2所示,该方法包括:
201、从至少包含商品图片的商品信息中提取商品的标签。
其中,商品图片中的商品可以是服装、食品、化妆品、家具、生活用品或其他商品。
商品的标签用于描述商品,标签可以标识商品的品名、品牌、尺码、颜色、风格、版型、花纹或用于指示商品中概括或总结性特征范围的界定等,其中,风格可以包括“原创风”、“军旅风”、“复古风”、“甜美可爱”等;用于指示商品中概括或总结性特征范围的界定,比如“显瘦”、“亮色”等。
除此以外,标签还可以是其他能够用于标识商品的信息,本发明实施例对具体的标签不加以限定。
具体的,商品信息仅包含商品图片,从包含商品图片的商品信息中提取商品的标签,该过程可以包括:
获取买家用户上传的至少包含商品图片的商品信息;
从商品图片中提取图像特征;
获取与图像特征对应的标签。
其中,从商品图片中提取图像特征,该过程可以包括:
具体的,该过程可以包括:
对商品图片进行预处理;
提取预处理后的商品图片中的图像特征。
本实施例中,通过对商品图片进行预处理,以消除商品图片中无关的信息,比如滤除干扰、噪声、恢复有用的真实信息,由此能够确保提取商品图片中的图像特征的可靠性。
其中,获取与图像特征对应的标签,该过程可以包括:
获取训练好的识别模型,训练好的识别模型的输入为图像特征,输出为与该图像特征相对应的标签,其中,识别模型可以是深度卷积神经网络;
在图像特征输入到训练好的识别模型时,确定训练好的识别模型所输出的标签为与图像特征对应的标签。
比如,获取与商品的图像特征对应的标签可以包括“女式外套”、“短款”、“学院风”、“格子花纹”;又比如,获取与商品的图像特征对应的标签可以包括“挎包”、“浅棕色”、“细致”、“牛皮”,或者“挎包”、“深棕色”、“粗粒”、“牛皮”等。
由于从包含商品图片的商品信息中提取商品的标签,能够反映商品的更多信息和特性,因此使得商品的标签丰富、细致。
具体的,商品信息包含商品图片和商品的文本描述信息,从至少包含商品图片的商品信息中提取商品的标签,该过程可以包括:
提取商品图片中的图像特征;以及
提取文本描述信息中的关键词;
根据图像特征和关键词,确定商品的标签;
其中,商品的文本描述信息包括商品的标题信息、商品的网页信息或商品的评论信息中的至少一种。
其中,提取文本描述信息中的关键词,该过程可以包括:
从文本描述信息中抽取到有效文本;
对文本进行中文分词和词性标注,利用LDA(Latent Dirichlet Allocation)模型或PLSA(Probabilistic Latent Semantic Analysis)模型对文本进行聚类;
整理聚类结果后进行类别标注,进行有监督学习,对未来的未标注文本进行分类训练;
过滤停用词,利用TF-LDF(term frequency-inverse document frequency)或者TextRank算法对聚类后的文本进行关键词抽取。
其中,根据图像特征和关键词,确定商品的标签,该过程可以包括:
确定图像特征对应的多个标签,以及确定关键词对应的多个标签;
对与图像特征对应的标签和与关键词对应的标签进行合并去重处理;
将去重处理后的标签确定为从用户输入的商品信息中提取的标签。
示例性的,与商品的图像特征对应的标签包括“女式婚纱”、“白色”、“连衣裙”、“纱布”、“皱边花纹”,与商品的文本描述信息所包含的关键词对应的标签包括“一字肩”、“白色”、“女式婚纱”,对这些标签进行合并去重处理,商品的标签包括“女式婚纱”、“一字肩”、“白色”、“皱边花纹”、“白色”、“连衣裙”。
本发明实施例中,由于从包含商品图片和文本描述信息的商品信息中提取商品的标签,更能够反映商品的更多信息和特性,因此进一步使得商品的标签更丰富、多样化、更精细化。
202、确定提取到的标签所对应的标签类别。
其中,知识图谱中预设有多个标签类别,知识图谱包括商品知识图谱和/或用户知识图谱,标签类别至少为“品名”、“品牌”、“颜色”、“风格”、“版型”和“花纹”中的一种或多种。
其中,商品知识图谱中包括商品、商品对应的多个标签以及各标签之间的关系信息;用户知识图谱中包含了用户、用户对应的多个标签以及各标签之间的关系信息。
具体的,识别出提取到的标签包含在知识图谱的标签库内时,确定提取到的标签对应的标签类别,其中标签库内设有标签与标签类别之间的对应关系。
示例性的,提取到的标签为“学院风”、“米色”,根据标签与标签类别的对应关系,“学院风”对应的标签类别为“风格”,“米色”对应的标签类别为“颜色”。
本发明对具体的确定过程不加以限定。
203、根据标签类别,将提取到的标签添加至知识图谱。
具体的,本发明对具体的添加过程不加以限定。
值得注意的是,步骤202至步骤203是实现将提取到的标签添加至知识图谱,知识图谱包括商品知识图谱和/或用户知识图谱的过程,除了上述步骤的方式之外,还可以通过其他方式实现该过程,本发明实施例对具体的方式不加以限定。
需要说明的是,对于将提取到的标签添加至商品知识图谱,该标签除了可以从买家用户上传的至少包含商品图片的商品信息中提取外,还可以从卖家用户上传的至少包含商品图片的商品信息中提取。
本发明实施例中,通过将提取到的标签添加至知识图谱,实现了对知识图谱的完善,从而使得知识图谱中的标签更丰富、多样化、精细化。
204、在商品知识图谱中设置提取到的标签与商品之间的关系。
具体的,根据提取到的标签所对应的标签类别,在商品知识图谱中建立提取到的标签与对应的商品之间的关联关系;以及
根据预设的商品搭配信息,建立提取到的标签所对应的商品与其他商品之间的关系。
本发明实施例中,通过将提取到的标签添加至商品知识图谱,并在商品知识图谱中设置与标签相对应的关系,使得用户能够根据商品知识图谱中的标签进行搜索对应的商品,从而实现了用户对商品的精准搜索。
205、在用户知识图谱中匹配提取到的标签与其他标签之间的关系。
具体的,该过程可以包括:
获取预先建立的标签之间的匹配关系,其中,匹配关系是基于标签之间的关联性所建立的;
根据标签之间的匹配关系,在用户知识图谱中匹配提取到的标签与用户的其他标签之间的关系。
示例性的,比如预先建立标签“卫衣”与标签“休闲运动”之间的匹配关系,如提取出的标签为“卫衣”,用户知识图谱中存在标签“休闲运动”,则在用户知识图谱中匹配标签“卫衣”与标签“休闲运动”。
206、在用户知识图谱中更新提取到的标签与其他标签之间的关系。
具体的,该过程可以包括:
获取用户的历史购买记录,并根据历史购买记录确定用户的兴趣模型,兴趣模型至少用于指示用户在消费偏好、爱好描述和搭配偏好中的至少一种;
根据用户的兴趣模型,在用户知识图谱中更新标签与从属于其他标签类别的标签之间的关系。
通过在用户知识图谱中更新提取到的标签与其他标签之间的关系,进一步描述出用户的喜好兴趣,从而进一步实现对用户购买商品的精准推荐。
值得注意的是,步骤204至步骤206是实现在知识图谱中设置与标签相对应的关系的过程,除了上述步骤的方式之外,还可以通过其他方式实现该过程,本发明实施例对具体的方式不加以限定。
需要说明的是,本发明实施例对步骤204、步骤205和步骤206的执行先后顺序步骤具体限定,在实际应用中,同时执行步骤204、步骤205和步骤206,为优选方案,以提高完善知识图谱的效率。
本发明实施例中,通过将提取到的标签添加至用户知识图谱,并在用户知识图谱中设置与标签相对应的关系,使得用户知识图谱中与用户相关的标签更丰富、多样化、精细化,从而实现了对用户购买商品的精准推荐。
本发明实施例提供了一种知识图谱完善方法,通过从至少包含商品图片的商品信息中提取商品的标签,并将提取到的标签添加至知识图谱,知识图谱包括商品知识图谱和/或用户知识图谱,以及在知识图谱中设置与提取到的标签相对应的关系,相比较现有技术的知识图谱仅标识出商品的品牌、颜色、材质、尺寸、基本样式等基本特性而言,从至少包含商品图片的商品信息中所提取的商品的标签更能够反映商品的更多信息和特性,因此使得商品知识图谱和/或用户知识图谱中的标签更加丰富、多样化,从而实现用户对商品的精准搜索以及实现对用户购买商品的精准推荐。
实施例三
本发明实施例提供了一种知识图谱完善方法,参照图3所示,该方法包括:
301、从至少包含商品图片的商品信息中提取商品的标签。
具体的,该步骤与步骤201相同,此处不再加以赘述。
本发明实施例中,由于从包含商品图片和文本描述信息的商品信息中提取商品的标签,更能够反映商品的更多信息和特性,因此进一步使得商品的标签更丰富、多样化、更精细化。
302、将提取到的标签添加至标签库。
具体的,识别出提取到的标签未包含在知识图谱的标签库内时,将提取到的标签添加至标签库。
本发明对具体的确定过程不加以限定。
由于将提取到的标签添加至原先未包含该标签的标签库内,因此使得标签库包含的标签更加丰富。
303、定义提取到的标签所属的标签类别。
具体的,判断标签库内是否存在与所提取到的标签具有相同属性的标签;
若存在,则确定与所提取到的标签具有相同属性的标签所对应的标签类别为所提取到的标签对应的标签类别;
否则,则创建与所提到的标签相对应的标签类别。
304、根据标签类别,将提取到的标签添加至知识图谱。
本发明对具体的定义过程不加以限定。
值得注意的是,步骤302至步骤304是实现将提取到的标签添加至知识图谱的过程,除了上述步骤的方式之外,还可以通过其他方式实现该过程,本发明实施例对具体的方式不加以限定。
需要说明的是,对于将提取到的标签添加至商品知识图谱,该标签除了可以从买家用户上传的至少包含商品图片的商品信息中提取外,还可以从卖家用户上传的至少包含商品图片的商品信息中提取。
本发明实施例中,通过将提取到的标签添加至对应的标签类别,实现了对知识图谱的完善,从而使得知识图谱中的标签更丰富、多样化、精细化。
305、在商品知识图谱中设置提取到的标签与商品之间的关系。
具体的,该步骤与步骤204相同,此处不再加以赘述。
本发明实施例中,通过将提取到的标签添加至商品知识图谱,并在商品知识图谱中设置与标签相对应的关系,使得用户能够根据商品知识图谱中的标签进行搜索对应的商品,从而实现了用户对商品的精准搜索。
306、在用户知识图谱中更新提取到的标签与用户的其他标签之间的关系。
具体的,该步骤与步骤206相同,此处不再加以赘述。
值得注意的是,步骤304至步骤305是实现在知识图谱中设置与提取到的标签相对应的关系的过程,除了上述步骤的方式之外,还可以通过其他方式实现该过程,本发明实施例对具体的方式不加以限定。
需要说明的是,本发明实施例对步骤304和步骤305的执行先后顺序步骤具体限定,在实际应用中,同时执行步骤304和步骤305,为优选方案,以提高完善知识图谱的效率。
本发明实施例中,通过将提取到的标签添加至用户知识图谱,并在用户知识图谱中设置与提取到的标签相对应的关系,使得用户知识图谱中与用户相关的标签更丰富、多样化、精细化,从而实现了对用户购买商品的精准推荐。
本发明实施例提供了一种知识图谱完善方法,通过从至少包含商品图片的商品信息中提取商品的标签,并将提取到的标签添加至知识图谱,知识图谱包括商品知识图谱和/或用户知识图谱,以及在知识图谱中设置与提取到的标签相对应的关系,相比较现有技术的知识图谱仅标识出商品的品牌、颜色、材质、尺寸、基本样式等基本特性而言,从至少包含商品图片的商品信息中所提取的商品的标签更能够反映商品的更多信息和特性,因此使得商品知识图谱和/或用户知识图谱中的标签更加丰富、多样化,从而实现用户对商品的精准搜索以及实现对用户购买商品的精准推荐。
实施例四
本发明实施例提供了一种知识图谱完善装置,参见图4所示,装置4包括:
提取模块41,用于从至少包含商品图片的商品信息中提取商品的标签;
添加模块42,用于将提取到的标签添加至知识图谱,知识图谱包括商品知识图谱和/或用户知识图谱;
设置模块43,用于在知识图谱中设置与提取到的标签相对应的关系。
可选的,商品信息仅包含商品图片,提取模块41具体用于:
从商品图片中提取图像特征;
获取与图像特征对应的标签。
可选的,商品信息包含商品图片和商品的文本描述信息,提取模块41具体还用于:
提取商品图片中的图像特征;以及
提取文本描述信息中的关键词;
根据图像特征和关键词,确定商品的标签;
文本描述信息包括商品的标题信息、商品的网页信息和商品的评论信息中的至少一种。
可选的,添加模块42具体用于:
确定提取到的标签对应的标签类别;
根据标签类别,将提取到的标签添加至知识图谱;
设置模块43具体用于:
在商品知识图谱中设置提取到的标签与商品之间的关系;
在用户知识图谱中匹配提取到的标签与其他标签之间的关系;以及
在用户知识图谱中更新提取到的标签与其他标签之间的关系。
可选的,添加模块42具体还用于:
将标签添加至标签库;
定义标签所属的标签类别;
根据标签类别,将提取到的标签添加至知识图谱;
设置模块43具体还用于:
在商品知识图谱中设置提取到的标签与商品之间的关系;
在用户知识图谱中更新提取到的标签与其他标签之间的关系。
本发明实施例提供了一种知识图谱完善装置,该装置通过从至少包含商品图片的商品信息中提取商品的标签,并将提取到的标签添加至知识图谱,知识图谱包括商品知识图谱和/或用户知识图谱,以及在知识图谱中设置与提取到的标签相对应的关系,相比较现有技术的知识图谱仅标识出商品的品牌、颜色、材质、尺寸、基本样式等基本特性而言,从至少包含商品图片的商品信息中所提取的商品的标签更能够反映商品的更多信息和特性,因此使得商品知识图谱和/或用户知识图谱中的标签更加丰富、多样化,从而实现用户对商品的精准搜索以及实现对用户购买商品的精准推荐。
上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
需要说明的是:上述实施例提供的知识图谱完善装置在执行知识图谱完善方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的知识图谱完善装置与知识图谱完善方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关联的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种知识图谱完善方法,其特征在于,所述方法包括:
从至少包含商品图片和商品的文本描述信息的商品信息中提取商品的标签,包括:提取所述商品图片中的图像特征,以及从文本描述信息中抽取有效文本,对有效文本进行中文分词和词性标注,利用LDA模型或PLSA模型对文本进行聚类,利用TF-LDF算法或TextRank算法抽取聚类后的文本中的关键词,根据所述图像特征和所述关键词,确定所述商品的标签,其中,所述文本描述信息包括所述商品的标题信息、所述商品的网页信息和所述商品的评论信息中的至少一种;
将提取到的所述标签添加至知识图谱,所述知识图谱包括商品知识图谱和/或用户知识图谱;
在所述知识图谱中设置与提取到的所述标签相对应的关系。
2.根据权利要求1所述的方法,其特征在于,
所述将提取到的所述标签添加至知识图谱包括:
确定提取到的所述标签对应的标签类别;
根据所述标签类别,将提取到的所述标签添加至所述知识图谱;
所述在所述知识图谱中设置与提取到的所述标签相对应的关系包括:
在所述商品知识图谱中设置提取到的所述标签与所述商品之间的关系;
在所述用户知识图谱中匹配提取到的所述标签与其他标签之间的关系;以及
在所述用户知识图谱中更新提取到的所述标签与其他标签之间的关系。
3.根据权利要求1所述的方法,其特征在于,
所述将提取到的所述标签添加至知识图谱包括:
将提取到的所述标签添加至标签库;
定义提取到的所述标签所属的标签类别;
根据所述标签类别,将提取到的所述标签添加至所述知识图谱;
所述在所述知识图谱中设置与提取到的所述标签相对应的关系包括:
在所述商品知识图谱中设置提取到的所述标签与所述商品之间的关系;
在所述用户知识图谱中更新提取到的所述标签与其他标签之间的关系。
4.一种知识图谱完善装置,其特征在于,所述装置包括:
提取模块,用于从至少包含商品图片和商品的文本描述信息的商品信息中提取商品的标签,包括:提取所述商品图片中的图像特征,以及从文本描述信息中抽取有效文本,对有效文本进行中文分词和词性标注,利用LDA模型或PLSA模型对文本进行聚类,利用TF-LDF算法或TextRank算法抽取聚类后的文本中的关键词,根据所述图像特征和所述关键词,确定所述商品的标签,其中,所述文本描述信息包括所述商品的标题信息、所述商品的网页信息和所述商品的评论信息中的至少一种;添加模块,用于将提取到的所述标签添加至知识图谱,所述知识图谱包括商品知识图谱和/或用户知识图谱;
设置模块,用于在所述知识图谱中设置与提取到的所述标签相对应的关系。
5.根据权利要求4所述的装置,其特征在于,
所述添加模块具体用于:
确定提取到的所述标签对应的标签类别;
根据所述标签类别,将提取到的所述标签添加至所述知识图谱;
所述设置模块具体用于:
在所述商品知识图谱中设置提取到的所述标签与所述商品之间的关系;
在所述用户知识图谱中匹配提取到的所述标签与其他标签之间的关系;以及
在所述用户知识图谱中更新提取到的所述标签与其他标签之间的关系。
6.根据权利要求4所述的装置,其特征在于,
所述添加模块具体还用于:
将所述标签添加至所述标签库;
定义所述标签所属的标签类别;
根据所述标签类别,将提取到的所述标签添加至所述知识图谱;
所述设置模块具体还用于:
在所述商品知识图谱中设置提取到的所述标签与所述商品之间的关系;
在所述用户知识图谱中更新提取到的所述标签与其他标签之间的关系。
CN201710833203.2A 2017-09-15 2017-09-15 一种知识图谱完善方法和装置 Active CN107748754B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710833203.2A CN107748754B (zh) 2017-09-15 2017-09-15 一种知识图谱完善方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710833203.2A CN107748754B (zh) 2017-09-15 2017-09-15 一种知识图谱完善方法和装置

Publications (2)

Publication Number Publication Date
CN107748754A CN107748754A (zh) 2018-03-02
CN107748754B true CN107748754B (zh) 2021-10-26

Family

ID=61255746

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710833203.2A Active CN107748754B (zh) 2017-09-15 2017-09-15 一种知识图谱完善方法和装置

Country Status (1)

Country Link
CN (1) CN107748754B (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108427749B (zh) * 2018-03-12 2021-06-18 上海哔哩哔哩科技有限公司 商品标签管理方法、服务器及商品标签管理***
CN108710695B (zh) * 2018-05-23 2019-08-06 掌阅科技股份有限公司 基于电子书的思维导图生成方法及电子设备
CN109145098B (zh) * 2018-07-20 2021-10-29 西北大学 基于知识图谱的中华文化元素信息搜索方法
CN109189937B (zh) * 2018-08-22 2021-02-09 创新先进技术有限公司 一种特征关系推荐方法及装置、一种计算设备及存储介质
CN109189938A (zh) * 2018-08-31 2019-01-11 北京字节跳动网络技术有限公司 用于更新知识图谱的方法和装置
CN109299287A (zh) * 2018-10-24 2019-02-01 深圳素问智能信息技术有限公司 一种酒类信息的查询方法和装置
CN109710776B (zh) * 2018-12-29 2022-10-28 中国科学技术大学 相册的知识图谱的构建方法
CN109840288A (zh) * 2019-02-21 2019-06-04 北京一品智尚信息科技有限公司 图片检索方法、设备和存储介质
CN109977233B (zh) * 2019-03-15 2021-02-23 北京金山数字娱乐科技有限公司 一种成语知识图谱构建方法及装置
CN110609903B (zh) * 2019-08-01 2022-11-11 华为技术有限公司 信息表示方法及装置
CN110737779B (zh) * 2019-09-18 2021-05-04 北京三快在线科技有限公司 知识图谱的构建方法、装置、存储介质和电子设备
CN110990584B (zh) * 2019-11-26 2021-02-09 口口相传(北京)网络技术有限公司 知识图谱的生成方法及装置
CN111143575B (zh) * 2019-12-06 2023-07-04 苏宁云计算有限公司 一种店铺商品结构的优化方法及***
CN111738802A (zh) * 2020-06-30 2020-10-02 广东奥园奥买家电子商务有限公司 一种电商商品的介绍方法和装置以及设备
CN112102029B (zh) * 2020-08-20 2022-10-14 浙江大学 一种基于知识图谱的长尾推荐计算方法
CN113535985A (zh) * 2021-08-17 2021-10-22 北京爱奇艺科技有限公司 一种对象标签确定方法及装置
CN113505245A (zh) * 2021-09-10 2021-10-15 深圳平安综合金融服务有限公司 知识图谱的生成方法、计算机可读存储介质及计算机设备
CN117972041A (zh) * 2023-12-28 2024-05-03 慈兴权 准确理解语义的电商平台智能客服问答***

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5241671C1 (en) * 1989-10-26 2002-07-02 Encyclopaedia Britannica Educa Multimedia search system using a plurality of entry path means which indicate interrelatedness of information
US7917492B2 (en) * 2007-09-21 2011-03-29 Limelight Networks, Inc. Method and subsystem for information acquisition and aggregation to facilitate ontology and language-model generation within a content-search-service system
CN102254043B (zh) * 2011-08-17 2013-04-03 电子科技大学 一种基于语义映射的服装图像检索方法
CN104750795B (zh) * 2015-03-12 2017-09-01 北京云知声信息技术有限公司 一种智能语义检索***和方法
CN105550190B (zh) * 2015-06-26 2019-03-29 许昌学院 面向知识图谱的跨媒体检索***
CN106355627A (zh) * 2015-07-16 2017-01-25 中国石油化工股份有限公司 一种用于生成知识图谱的方法及***
CN105912656B (zh) * 2016-04-07 2020-03-17 桂林电子科技大学 一种商品知识图谱的构建方法
CN106708940B (zh) * 2016-11-11 2020-06-30 百度在线网络技术(北京)有限公司 用于处理图片的方法和装置
CN106815307A (zh) * 2016-12-16 2017-06-09 中国科学院自动化研究所 公共文化知识图谱平台及其使用办法

Also Published As

Publication number Publication date
CN107748754A (zh) 2018-03-02

Similar Documents

Publication Publication Date Title
CN107748754B (zh) 一种知识图谱完善方法和装置
CN107833082B (zh) 一种商品图片的推荐方法和装置
CN107705066B (zh) 一种商品入库时信息录入方法及电子设备
CN110059271B (zh) 运用标签知识网络的搜索方法及装置
TWI631474B (zh) Method and device for product identification label and method for product navigation
CN106294425B (zh) 商品相关网络文章之自动图文摘要方法及***
CN104636402B (zh) 一种业务对象的分类、搜索、推送方法和***
US10360623B2 (en) Visually generated consumer product presentation
WO2022033199A1 (zh) 一种获得用户画像的方法及相关装置
CN105550369B (zh) 一种搜索目标商品集的方法及装置
CN109815308A (zh) 意图识别模型的确定及检索意图识别方法、装置
KR20190108838A (ko) 미술 작품 추천 큐레이션 방법 및 시스템
CN107632984A (zh) 一种聚类数据表的展现方法、装置和***
US20230214895A1 (en) Methods and systems for product discovery in user generated content
KR20210098884A (ko) 사용자의 체형 및 구매 이력을 이용하여 패션 아이템 추천 서비스를 제공하는 방법
US20200226168A1 (en) Methods and systems for optimizing display of user content
CN115048583A (zh) 基于用户画像的信息推送方法、***、设备及存储介质
CN107908749B (zh) 一种基于搜索引擎的人物检索***及方法
CN113744019A (zh) 一种商品推荐方法、装置、设备及存储介质
CN113821718A (zh) 一种物品信息推送方法和装置
US11410418B2 (en) Methods and systems for tagged image generation
Lodkaew et al. Fashion finder: A system for locating online stores on instagram from product images
KR20210041733A (ko) 패션 상품 추천 방법, 장치 및 컴퓨터 프로그램
KR101498944B1 (ko) 상품 판매 업체 관련 글 판단 방법 및 그 장치
Kang et al. Recognising informative Web page blocks using visual segmentation for efficient information extraction.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230106

Address after: 510123 building 6, No. 20, Huahai street, Fangcun, Liwan District, Guangzhou, Guangdong (office only)

Patentee after: GUANGZHOU PINWEI SOFTWARE Co.,Ltd.

Address before: 510000 room 01, No.314, Fangcun Avenue middle, Liwan District, Guangzhou City, Guangdong Province

Patentee before: GUANGZHOU WEIPINHUI RESEARCH INSTITUTE CO.,LTD.

TR01 Transfer of patent right