CN117272056A - 对象特征构建方法、装置和计算机可读存储介质 - Google Patents
对象特征构建方法、装置和计算机可读存储介质 Download PDFInfo
- Publication number
- CN117272056A CN117272056A CN202210680834.6A CN202210680834A CN117272056A CN 117272056 A CN117272056 A CN 117272056A CN 202210680834 A CN202210680834 A CN 202210680834A CN 117272056 A CN117272056 A CN 117272056A
- Authority
- CN
- China
- Prior art keywords
- tag
- label
- information
- association
- constructed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title claims abstract description 82
- 238000010586 diagram Methods 0.000 claims description 42
- 238000000034 method Methods 0.000 claims description 37
- 238000012216 screening Methods 0.000 claims description 22
- 230000005540 biological transmission Effects 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 abstract description 5
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 230000006399 behavior Effects 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 238000000605 extraction Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 235000015243 ice cream Nutrition 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例公开了一种对象特征构建方法、装置和计算机可读存储介质,可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景;通过获取待构建对象在目标***中的对象标签信息;计算对象标签之间的标签相似度,并基于标签相似度和标签权重,在对象标签信息中确定基础对象标签;基于基础对象标签的语义信息,在预设标签关系图中进行语义传播,得到关联对象标签和标签关联路径;统计标签关联路径的节点数量,并根据节点数量对关联对象标签对应的基础对象标签的标签权重进行调节,得到关联标签权重;基于关联对象标签和关联标签权重,构建待构建对象对应的对象特征。以此,提高了对象特征构建的准确性,进而提升对象特征构建的效率。
Description
技术领域
本申请涉及互联网技术领域,具体涉及一种对象特征构建方法、装置和计算机可读存储介质。
背景技术
近年来,随着互联网技术的快速发展,网络上产生了大量的信息,满足了用户在信息时代对信息的需求,同时,大量的信息也使得用户难以从中快速获得到真正需要的信息,降低了信息的获取效率,为此,现有技术中通过将用户兴趣偏好等信息进行标签化,并根据这些标签构建对象特征,再基于用户的对象特征将用户感兴趣的内容推送到用户,以此提高内容推送、业务分析及运营等应用业务的准确性。
在对现有技术的研究和实践过程中发现,在现有对象特征构建方法中,对于低活跃用户或新用户,会因为历史行为较少而使得构建的对象特征的标签数量较少,从而无法对用户的偏好进行准确刻画,进而使得对象特征构建的准确性较低,从而导致对象特征构建的效率较低。
发明内容
本申请实施例提供一种对象特征构建方法、装置和计算机可读存储介质,可以提高对象特征构建的准确性,进而提升对象特征构建的效率。
本申请实施例提供一种对象特征构建方法,包括:
获取待构建对象在目标***中的对象标签信息,所述对象标签信息包括至少一个针对所述待构建对象的对象属性的对象标签和所述对象标签对应的标签权重,所述标签权重用于表征所述对象属性对于所述待构建对象的重要程度;
计算所述对象标签之间的标签相似度,并基于所述标签相似度和标签权重,在所述对象标签信息中确定基础对象标签;
提取所述基础对象标签对应的语义信息,并基于所述语义信息,在预设标签关系图中进行语义传播,得到至少一个关联对象标签和所述关联对象标签对应的标签关联路径,所述预设标签关系图包括至少一个节点以及基于所述节点之间的语义关系进行连接的节点边,每一所述节点对应一个预设对象标签;
统计所述标签关联路径的节点数量,并根据所述节点数量对所述关联对象标签对应的基础对象标签的标签权重进行调节,得到所述关联对象标签对应的关联标签权重;
基于所述关联对象标签和所述关联对象标签对应的关联标签权重对所述对象标签信息进行更新,并基于更新后的对象标签信息,构建所述待构建对象对应的对象特征。
相应的,本申请实施例提供一种对象特征构建装置,包括:
获取单元,用于获取待构建对象在目标***中的对象标签信息,所述对象标签信息包括至少一个针对所述待构建对象的对象属性的对象标签和所述对象标签对应的标签权重,所述标签权重用于表征所述对象属性对于所述待构建对象的重要程度;
确定单元,用于计算所述对象标签之间的标签相似度,并基于所述标签相似度和标签权重,在所述对象标签信息中确定基础对象标签;
传播单元,用于提取所述基础对象标签对应的语义信息,并基于所述语义信息,在预设标签关系图中进行语义传播,得到至少一个关联对象标签和所述关联对象标签对应的标签关联路径,所述预设标签关系图包括至少一个节点以及基于所述节点之间的语义关系进行连接的节点边,每一所述节点对应一个预设对象标签;
调节单元,用于统计所述标签关联路径的节点数量,并根据所述节点数量对所述关联对象标签对应的基础对象标签的标签权重进行调节,得到所述关联对象标签对应的关联标签权重;
构建单元,用于基于所述关联对象标签和所述关联对象标签对应的关联标签权重对所述对象标签信息进行更新,并基于更新后的对象标签信息,构建所述待构建对象对应的对象特征。
在一实施例中,所述传播单元,包括:
语义传播子单元,用于基于所述语义信息,在预设标签关系图中进行语义传播,得到至少一个候选关联对象标签和所述候选关联对象标签对应的候选标签关联路径;
关联度计算子单元,用于统计所述候选关联对象标签的标签数量,并在所述标签数量大于预设标签数量阈值时,计算所述候选关联对象标签与所述基础对象标签之间的关联度;
标签筛选子单元,用于基于所述关联度,在所述候选关联对象标签筛选出至少一个关联对象标签,并获取所述关联对象标签对应的标签关联路径。
在一实施例中,所述确定单元,包括:
对象标签组识别子单元,用于基于所述标签相似度,在所述对象标签中识别出至少一个对象标签组,所述对象标签组中包括至少两个对象标签;
基础对象标签筛选子单元,用于根据所述标签权重,在所述对象标签组中筛选出至少一个基础对象标签。
在一实施例中,所述对象标签组识别子单元,包括:
阈值获取模块,用于获取第一相似度阈值以及第二相似度阈值,所述第一相似度阈值大于所述第二相似度阈值;
标签组筛选模块,用于基于所述第一相似度阈值和标签相似度,在所述对象标签中筛选出至少一个第一对象标签组,并基于所述第二相似度阈值和标签相似度,在所述对象标签中筛选出至少一个第二对象标签组;
赋值模块,用于将所述第一对象标签组和第二对象标签组作为对象标签组。
在一实施例中,所述获取单元,包括:
对象标签信息数量统计子单元,用于统计目标对象在目标***中对应的目标对象标签信息的数量,得到所述目标对象对应的对象标签信息数量;
待构建对象识别子单元,用于基于所述对象标签信息数量,在所述目标对象中识别出待构建对象;
对象标签信息获取子单元,用于获取所述待构建对象在所述目标***中的对象标签信息。
在一实施例中,所述对象标签信息数量统计子单元,包括:
设备属性信息获取模块,用于获取所述目标对象对应的设备属性信息;
设备更新对象标签信息确定模块,用于基于所述设备属性信息,在所述目标对象中识别出至少一个设备更新对象,并根据所述设备属性信息,确定所述设备更新对象的设备更新对象标签信息;
对象标签信息数量统计模块,用于基于所述设备更新对象标签信息,对所述目标对象标签信息进行更新,得到更新后目标对象标签信息,并统计所述目标对象对应的更新后目标对象标签信息的数量,得到所述目标对象对应的对象标签信息数量。
在一实施例中,所述设备更新对象标签信息确定模块,包括:
设备标签信息获取子模块,用于根据所述设备属性信息,获取所述设备更新对象对应的当前设备对象标签信息和历史设备对象标签信息;
标签信息融合子模块,用于将所述当前设备对象标签信息和历史设备对象标签信息进行融合,得到所述设备更新对象对应的设备更新对象标签信息。
在一实施例中,所述对象特征构建装置,还包括:
待推送内容获取单元,用于获取至少一个待推送内容;
目标内容识别单元,用于基于所述待构建对象对应的对象特征,在所述待推送内容中识别出至少一个与所述对象特征匹配的目标内容;
内容推送单元,用于将所述目标内容推送至所述待构建对象。
此外,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本申请实施例所提供的任一种对象特征构建方法中的步骤。
此外,本申请实施例还提供一种计算机设备,包括处理器和存储器,所述存储器存储有应用程序,所述处理器用于运行所述存储器内的应用程序实现本申请实施例提供的对象特征构建方法。
本申请实施例还提供一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取所述计算机指令,处理器执行所述计算机指令,使得所述计算机设备执行本申请实施例提供的对象特征构建方法中的步骤。
本申请实施例通过获取待构建对象在目标***中的对象标签信息,该对象标签信息包括至少一个针对该待构建对象的对象属性的对象标签和该对象标签对应的标签权重,该标签权重用于表征该对象属性对于该待构建对象的重要程度;计算该对象标签之间的标签相似度,并基于该标签相似度和标签权重,在该对象标签信息中确定基础对象标签;提取基础对象标签对应的语义信息,并基于语义信息,在预设标签关系图中进行语义传播,得到至少一个关联对象标签和关联对象标签对应的标签关联路径,该预设标签关系图包括至少一个节点以及基于节点之间的语义关系进行连接的节点边,每一节点对应一个预设对象标签;统计标签关联路径的节点数量,并根据节点数量对关联对象标签对应的基础对象标签的标签权重进行调节,得到关联对象标签对应的关联标签权重;基于关联对象标签和关联对象标签对应的关联标签权重对该对象标签信息进行更新,并基于更新后的对象标签信息,构建该待构建对象对应的对象特征。以此,通过在对象标签信息中确定基础对象标签,并根据该基础对象标签的语义信息在预设标签关系图中进行语义传播,得到至少一个关联对象标签和关联对象标签对应的标签关联路径,进而统计标签关联路径的节点数量,并根据节点数量对关联对象标签对应的基础对象标签的标签权重进行调节,得到关联对象标签对应的关联标签权重,从而基于关联对象标签和关联对象标签对应的关联标签权重对待推荐对象的对象标签信息进行扩展,丰富了待构建对象可能感兴趣的对象标签的数量,进而根据扩展后的对象标签信息构建该待构建对象对应的对象特征,提高了对象特征构建的准确性,进而提升对象特征构建的效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种对象特征构建方法实施场景示意图;
图2是本申请实施例提供的一种对象特征构建方法的流程示意图;
图3是本申请实施例提供的一种对象特征构建方法的整体框架示意图;
图4是本申请实施例提供的一种对象特征构建方法的设备更新对象标签信息获取流程示意图;
图5a是本申请实施例提供的一种对象特征构建方法的特征提取框架示意图;
图5b是本申请实施例提供的一种对象特征构建方法的对象标签扩展流程示意图;
图6是本申请实施例提供的一种对象特征构建方法的另一流程示意图;
图7是本申请实施例提供的对象特征构建装置的结构示意图;
图8是本申请实施例提供的计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种对象特征构建方法、装置和计算机可读存储介质。其中,该对象特征构建装置可以集成在计算机设备中,该计算机设备可以是服务器,也可以是终端等设备。
其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、网络加速服务(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端、飞行器等。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
请参阅图1,以对象特征构建装置集成在计算机设备中为例,图1为本申请实施例所提供的对象特征构建方法的实施场景示意图,其中,该计算机设备可以为服务器,也可以为终端,该计算机设备可以获取待构建对象在目标***中的对象标签信息,该对象标签信息包括至少一个针对该待构建对象的对象属性的对象标签和该对象标签对应的标签权重,该标签权重用于表征该对象属性对于该待构建对象的重要程度;计算该对象标签之间的标签相似度,并基于该标签相似度和标签权重,在该对象标签信息中确定基础对象标签;提取基础对象标签对应的语义信息,并基于语义信息,在预设标签关系图中进行语义传播,得到至少一个关联对象标签和关联对象标签对应的标签关联路径,该预设标签关系图包括至少一个节点以及基于节点之间的语义关系进行连接的节点边,每一节点对应一个预设对象标签;统计标签关联路径的节点数量,并根据节点数量对关联对象标签对应的基础对象标签的标签权重进行调节,得到关联对象标签对应的关联标签权重;基于关联对象标签和关联对象标签对应的关联标签权重对该对象标签信息进行更新,并基于更新后的对象标签信息,构建该待构建对象对应的对象特征。
需要说明的是,本发明实施例可应用于各种场景,包括但不限于云技术、人工智能、智慧交通、辅助驾驶等。图1所示的对象特征构建方法的实施环境场景示意图仅仅是一个示例,本申请实施例描述的对象特征构建方法的实施环境场景是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定。本领域普通技术人员可知,随着对象特征构建的演变和新业务场景的出现,本申请提供的技术方案对于类似的技术问题,同样适用。
本申请实施例提供的方案具体通过如下实施例进行说明。需要说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
本实施例将从对象特征构建装置的角度进行描述,该对象特征构建装置具体可以集成在计算机设备中,该计算机设备可以是服务器,本申请在此不作限制。
请参阅图2,图2是本申请实施例提供的对象特征构建方法的流程示意图。该对象特征构建方法包括:
在步骤101中,获取待构建对象在目标***中的对象标签信息。
其中,该待构建对象可以为待进行对象特征构建的对象,该对象特征可以为表征待构建对象的特征信息,可以表征待构建对象的兴趣偏好、行为、习惯等信息,该对象可以为用户,该目标***可以为构建对象的对象标签信息的***。可选的,该对象特征可以将对象的兴趣偏好等信息进行标签化,采用一系列<标签,权重>对的集合来刻画对象的兴趣,即可以采用对象标签信息来构建对象特征,该对象标签信息可以包括至少一个针对该待构建对象的对象属性的对象标签和该对象标签对应的标签权重,该对象属性可以为表征待构建对象的性质以及该待构建对象与其他待构建对象之间的关系的信息,例如,可以表征待构建对象的兴趣偏好、行为、习惯等信息,该对象标签可以为标志待构建对象的对象属性的分类或者内容的信息,例如,以该待构建对象为用户为例,假设该用户存在对象标签为相声,可以为标志该用户对相声类别的内容感兴趣。该标签权重可以用于表征该对象属性对于该待构建对象的重要程度,例如,可以表征待构建对象对某一对象标签的偏好程度,也可以表征待构建对象对某一对象标签的感兴趣程度等。该标签权重可以归一化为区间1到100的数字来表征该对象属性对于该待构建对象的重要程度,也可以采用归一化到区间0到1的数字来表征该对象属性对于该待构建对象的重要程度,数字越大,可以表示重要程度越大,具体可以根据实际需求进行设定,本申请在此不做限定。例如,假设某一待构建对象在目标***中存在对象标签信息<相声,40>以及<冰淇淋,80>,其中,对象标签“相声”对应的标签权重为40,对象标签“冰淇淋”对应的标签权重为80,表示待构建对象对冰淇淋的感兴趣程度大于相声。
在现有的基于用户历史观看记录和历史播放行为构建用户的对象特征的对象特征构建方法中,对于低活跃用户或新用户,会因为历史行为较少而使得构建的对象特征的对象标签数量较少,从而无法对用户的兴趣偏好等信息进行准确刻画,进而使得对象特征构建的准确性较低,从而导致对象特征构建的效率较低,在对象的对象标签数量较少时。为此,可以将对象集合中对象标签数量较少的对象进行对象标签的扩展,以获得更多的对象标签来对用户的兴趣偏好等信息进行准确的刻画,从而提高对象特征构建的准确性,此时,该待构建对象可以为对象集合中标签数量较缺乏的对象,该对象集合可以为至少一个对象构成的整体。可选的,获取待构建对象在目标***中的对象标签信息的方式可以有多种,例如,可以统计目标对象在目标***中对应的目标对象标签信息的数量,得到该目标对象对应的对象标签信息数量,基于该对象标签信息数量,在该目标对象中识别出待构建对象,获取该待构建对象在该目标***中的对象标签信息。
其中,该目标对象可以为构建对象特征的对象,例如,可以为某一应用的所有用户,该待构建对象可以为目标对象中需要进行对象标签扩展的对象,例如,可以为目标对象中对象标签信息的数量较少的对象。该对象标签信息数量可以为每一目标对象存在的对象标签信息的数量。
在一实施例中,可以将同一目标对象在其不同设备中对应的对象标签信息进行融合,以此来增加目标对象对应的对象标签信息的数量。其中,统计目标对象在目标***中对应的目标对象标签信息的数量,得到该目标对象对应的对象标签信息数量的方式可以有多种,例如,请参考图3,图3是本申请实施例提供的一种对象特征构建方法的整体框架示意图,可以获取该目标对象对应的设备属性信息,基于该设备属性信息,在该目标对象中识别出至少一个设备更新对象,并根据该设备属性信息,确定该设备更新对象的设备更新对象标签信息,基于该设备更新对象标签信息,对该目标对象标签信息进行更新,得到更新后目标对象标签信息,并统计该目标对象对应的更新后目标对象标签信息的数量,得到该目标对象对应的对象标签信息数量。
其中,该设备属性信息可以为目标对象对应的设备的属性信息,例如可以为目标对象当前使用的设备以及历史使用过的设备的属性信息,该设备可以为手机、电脑等计算机设备,例如,可以为用户使用的手机,该属性信息可以包括设备的激活时间、使用记录等信息,可以根据目标对象对应的设备的激活时间、使用记录等属性信息来确定目标对象对应的设备的使用时间,该设备更新对象可以为目标对象中当前设备的使用时间在预设时间段内的目标对象,例如,可以为目标对象中近期更换新设备的目标对象,该预设时间段可以为根据实际需求预先设定的一个时间区间,当目标对象当前使用的设备的使用时间处于该时间区间内时,可以表明目标对象当前对应的设备为新设备,可以将该目标对象确定为设备更新对象。
其中,基于该设备属性信息,在该目标对象中识别出至少一个设备更新对象的方式可以有多种,例如,可以在设备属性信息中,提取出目标对象对应的设备使用时间,将目标对象对应的设备使用时间与预设时间段进行对比,根据对比结果将设备使用时间处于该预设时间段内的目标对象确定为设备更新对象。其中,该设备使用时间可以为目标对象对应的设备的使用时间,例如为用户更换新设备的时间。
可选的,请参考图4,图4是本申请实施例提供的一种对象特征构建方法的设备更新对象标签信息获取流程示意图。可以获取目标对象中在近d天内使用新设备进行登录的目标对象,该d可以为一个预先设定的数值,例如,可以为30等,具体可以根据实际需求进行设定。然后,可以通过自然人识别来判断近d天内使用新设备进行登录的目标对象是否为设备更新对象。其中,自然人识别就是判断使用不同设备的用户是否对应同一个自然人,例如,可以通过账号与设备的登录关系,建立由“设备-账号-设备”的三元组关系对的关系图,并可以使用一些策略去除异常结点和裁剪不合理的边,对“设备-设备”的边的权重进行打分并排序,同时可以根据“设备-设备”的边的权重大小来进行过滤,从而选出可信度高的“设备-设备”边,若某一设备存在于多个“设备-设备”边中,则可以选用边权重最高的边,从而可以在目标对象中识别出至少一个设备更新对象。
在基于该设备属性信息,在该目标对象中识别出至少一个设备更新对象之后,便可以根据该设备属性信息,确定该设备更新对象的设备更新对象标签信息。其中,根据该设备属性信息,确定该设备更新对象的设备更新对象标签信息的方式可以有多种,例如,可以根据该设备属性信息,获取该设备更新对象对应的当前设备对象标签信息和历史设备对象标签信息,将该当前设备对象标签信息和历史设备对象标签信息进行融合,得到该设备更新对象对应的设备更新对象标签信息。
其中,该当前设备对象标签信息可以为目标对象基于当前使用的设备对应的对象标签信息,例如,可以为基于用户当前使用的设备构建的对象标签信息,该历史设备对象标签信息可以为目标对象基于历史使用的历史设备对应的对象标签信息,例如,可以为基于用户历史使用过的历史设备构建的对象标签信息,该设备更新对象标签信息可以为将设备更新对象对应的当前设备对象标签信息和历史设备对象标签信息进行融合后得到的对象标签信息。
其中,将该当前设备对象标签信息和历史设备对象标签信息进行融合的方式可以有多种,例如,可以提取当前设备对象标签信息和历史设备对象标签信息中的对象标签,并将提取出的对象标签中重复的对象标签进行去重,例如,可以对将当前设备对象标签信息和历史设备对象标签信息融合后的<标签,权重>列表做去重处理,若融合后的<标签,权重>列表中存在重复的对象标签,则将该重复的对象标签对应的标签权重的权重值进行相加后,将相加的结果作为该对象标签的新权重,比如,对于对象标签ti,列表中可能存在<ti,wi1>和<ti,wi2>,其中,wi1和wi2分别为对象标签ti在当前设备对象标签信息和历史设备对象标签信息中对应的标签权重,则可以去除<ti,wi1>和<ti,wi2>,并新增<ti,wi1+wi2>。
在统计目标对象在目标***中对应的目标对象标签信息的数量,得到该目标对象对应的对象标签信息数量之后,便可以基于该对象标签信息数量,在该目标对象中识别出待构建对象。其中,基于该对象标签信息数量,在该目标对象中识别出待构建对象的方式可以有多种,例如,可以获取一个数量阈值,将该数量阈值与目标对象的对象标签信息数量进行对比,根据对比结果将对象标签信息数量小于该数量阈值的目标对象确定为待构建对象。其中,该数量阈值可以为预先设定的一个临界值,在对象标签信息不小于该临界值时,可以表明该目标对象的对象标签信息的数量还算充足,此时可以确定该目标对象不为待构建对象,在对象标签信息小于该临界值时,可以表明该目标对象的对象标签信息的数量较缺乏,此时可以确定该目标对象为待构建对象。该数量阈值的具体取值可以根据实际情况进行选取,在此不做限定。例如,该数量阈值可以为10个、20个等。
在步骤102中,计算对象标签之间的标签相似度,并基于标签相似度和标签权重,在对象标签信息中确定基础对象标签。
其中,该标签相似度可以表征对象标签之间的相似程度,该基础对象标签可以为基于标签相似度和标签权重,在对象标签信息中确定的对象标签,可以用于表征对象标签信息中的对象标签。
其中,计算对象标签之间的标签相似度的方式可以有多种,例如,可以对对象标签进行特征提取,得到对象标签对应的对象标签特征,计算对象标签特征之间的相似度,得到对象标签之间的标签相似度。
其中,该对象标签特征可以为表征对象标签的特征信息,可以为一个词嵌入(Embedding)向量。其中,对对象标签进行特征提取,得到对象标签对应的对象标签特征的方式可以有多种,例如,可以选用自然语言处理领域的词向量模型(word2vec)、词表征模型(glove)、语义表示模型(ELMo)、基于深度自注意力变换网络双向编码器表示(Bidirectional Encoder Representation from Transformers,简称BERT)等语言模型,例如,可以采BERT来获取对象标签对应的对象标签特征。可选的,请参考图5a,图5a是本申请实施例提供的一种对象特征构建方法的特征提取框架示意图,以本申请实施例提供的对象特征构建方法应用于视频内容推荐领域为例,可以在预训练模型BERT模型的基础上,利用视频领域语料对预训练模型进行微调(fine-tuning),以使得微调后的BERT模型对视频领域的对象标签的词语能学习到更好的Embedding向量表示。以此,可以将待构建对象的对象标签输入到微调后的BERT模型,来得到对应的对象标签特征。
在对对象标签进行特征提取,得到对象标签对应的对象标签特征之后,便可以计算对象标签特征之间的相似度,得到对象标签之间的标签相似度。其中,计算对象标签特征之间的相似度的方式可以有多种,例如,可以采用对象标签特征之间的欧式距离、余弦距离等对对象标签特征之间的相似度进行度量。例如,可以通过计算对象标签特征之间的余弦距离来得到对象标签特征之间的相似度,即在向量空间中的两个对象标签特征Ei和Ej夹角间的余弦值作为两个标签之间差异的大小。余弦值的取值范围可以为[-1,1],余弦值接近于1,夹角趋于0,表明两个对象标签越相似。余弦距离计算公式可以表示为
在计算对象标签之间的标签相似度之后,便可以基于标签相似度和标签权重,在对象标签信息中确定基础对象标签。其中,基于该标签相似度和标签权重,在该对象标签信息中确定基础对象标签的方式可以有多种,例如,可以基于该标签相似度,在该对象标签中识别出至少一个对象标签组,根据该标签权重,在该对象标签组中筛选出至少一个基础对象标签。
其中,该对象标签组中可以包括至少两个对象标签。
其中,基于该标签相似度,在该对象标签中识别出至少一个对象标签组的方式可以有多种,例如,可以获取第一相似度阈值以及第二相似度阈值,基于该第一相似度阈值和标签相似度,在该对象标签中筛选出至少一个第一对象标签组,并基于该第二相似度阈值和标签相似度,在该对象标签中筛选出至少一个第二对象标签组,将该第一对象标签组和第二对象标签组作为对象标签组。
其中,为了可以扩展到更有表征意义的标签,可以去除标签相似度高的对象标签组中标签权重值低的对象标签,保留标签相似度高的对象标签组中标签权重值高的对象标签,同时,可以保留标签相似度低的对象标签组中的每一标签,以对对象标签进行有效扩展。此时,该第一相似度阈值可以大于该第二相似度阈值,该第一相似度阈值以及第二相似度阈值可以为预先设定的一个临界值,当对象标签之间的标签相似度大于第一相似度阈值时,可以将大于第一相似度阈值的对象标签组合到第一对象标签组中,当对象标签之间的标签相似度小于第二相似度阈值时,可以将小于第二相似度阈值的对象标签组合到第二对象标签组中,以此可以基于至少一个第一对象标签组和第二对象标签组,可以得到对象标签组。
在基于该标签相似度,在该对象标签中识别出至少一个对象标签组之后,便可以根据该标签权重,在该对象标签组中筛选出至少一个基础对象标签。其中,根据该标签权重,在该标签组中筛选出至少一个基础对象标签的方式可以有多种,例如,可以将该第一对象标签组中的对象标签对应的标签权重进行比对,并根据比对结果在第一对象标签对中筛选出目标对象标签,根据该目标对象标签以及第二对象标签组中的对象标签,确定基础对象标签。
其中,目标对象标签可以为第一对象标签组中标签权重较大的对象标签,以此,可以将第一对象标签组中标签权重较大的目标对象标签以及第二对象标签组中的对象标签确定为基础对象标签。
在步骤103中,提取基础对象标签对应的语义信息,并基于语义信息,在预设标签关系图中进行语义传播,得到至少一个关联对象标签和关联对象标签对应的标签关联路径。
其中,该语义信息可以为表征基础对象标签的语义的信息,语义可以表示对基础对象标签中的数据符号的解释,该预设标签关系图可以为预先根据预设对象标签进行构建的节点关系图,该预设标签关系图可以包括至少一个节点以及基于节点之间的语义关系进行连接的节点边,每一节点可以对应一个预设对象标签,该预设对象标签可以为预先获取的对象标签,该节点边可以为预设对象标签对应的节点之间根据预设对象标签之间的语义关系进行连接的边。可选的,该预设标签关系图可以为知识图谱,例如,可以为基于预设对象标签为实体的知识图谱,该关联对象标签可以为基于基础对象标签的语义信息在预设标签关系图中进行语义传播,确定的与基础对象标签关联的至少一个预设对象标签。该标签关联路径可以为关联对象标签在预设标签关系图中对应的语义传播路径。例如,请参考图5b,图5b是本申请实施例提供的一种对象特征构建方法的对象标签扩展流程示意图,关联对象标签即可以为基于标签语义传播扩展在预设标签关系图中确定的预设对象标签。
其中,基于语义信息,在预设标签关系图中进行语义传播,得到至少一个关联对象标签和关联对象标签对应的标签关联路径的方式可以有多种,例如,可以基于该语义信息,在预设标签关系图中进行语义传播,得到至少一个候选关联对象标签和该候选关联对象标签对应的候选标签关联路径,统计该候选关联对象标签的标签数量,并在该标签数量大于预设标签数量阈值时,计算该候选关联对象标签与该基础对象标签之间的关联度,基于该关联度,在该候选关联对象标签筛选出至少一个关联对象标签,并获取该关联对象标签对应的标签关联路径。
其中,该候选关联对象标签可以为基于基础对象标签的语义信息在预设标签关系图中进行语义传播,得到的与基础对象标签关联的至少一个预设对象标签。该候选标签关联路径可以为候选关联对象标签在预设标签关系图中对应的语义传播路径。该标签数量可以为候选关联对象标签的数量,该预设标签数量阈值可以为一个预先设定的数量临界值,在标签数量不大于该数量临界值时,可以表明此时候选关联对象标签的数量不多,可以不用进行进一步筛选,在标签数量大于该数量临界值时,可以表明此时候选关联对象标签的数量较多,为了提高候选关联对象标签的准确性,以及减少不必要的计算,可以对候选关联对象标签进行进一步的筛选。该关联度可以为表征候选关联对象标签与其对应的基础对象标签的关联程度的信息,例如,可以为候选关联对象标签与其对应的基础对象标签之间的相似程度。
其中,基于该语义信息,在预设标签关系图中进行语义传播,得到至少一个候选关联对象标签和该候选关联对象标签对应的候选标签关联路径的方式可以有多种,例如,可以在基础对象标签对应的语义信息中提取出该基础对象标签对应的至少一个概念信息以及至少一个类别信息,根据该概念信息以及类别信息之间的关联关系,在预设标签关系图中识别出与该基础对象标签关联的至少一个候选关联对象标签以及候选关联对象标签对应的候选标签关联路径。
其中,该概念信息可以为包括基础对象标签对应的概念的信息,该类别信息可以为包括基础对象标签对应的类别的信息,例如,假设基础对象标签为“郭××”(一相声演员),则可以得到该基础对象标签对应的概念信息“相声”以及类别信息“语言类戏剧”等。
其中,根据该概念信息以及类别信息之间的关联关系,在预设标签关系图中识别出与该基础对象标签关联的至少一个候选关联对象标签以及候选关联对象标签对应的候选标签关联路径的方式可以有多种,例如,该预设标签关系图可以为知识图谱,可以通过知识图谱来对基础对象标签的语义信息进行传播,以基于候选关联对象标签对应的语义信息和预设对象标签对应的语义信息之间的语义关联程度扩展出与该基础对象标签关联的至少一个候选关联对象标签。具体的,可以预先基于预设对象标签以及预设对象标签的语义信息构建以标签为实体的知识图谱,例如,基于标签实体—>概念—>类别的三层语义关系来构建预设对象标签为实体的知识图谱,该知识图谱中包含三层语义关系,例如,“郭××—>相声—>语言类喜剧”。从而,可以将基础对象标签输入到该知识图谱中,根据基础对象标签的语义信息,在知识图谱中进行传播,从而可以基于传播路径在预设对象标签中筛选出与该基础对象标签关联的至少一个候选关联对象标签以及候选关联对象标签对应的候选标签关联路径。例如,以本申请实施例提供的对象特征构建方法应用于视频内容推荐领域为例,可以将基础对象标签输入到视频领域的实体知识图谱中,利用该基础对象标签的语义信息中的概念信息和类别信息的关联性进行对象标签的传播扩展。假设一个待构建对象存在一个“郭××”的对象标签,则可以通过概念信息和类别信息的关联性在知识图谱中进行传播遍历,比如某一传播路径“郭××—>相声—>语言类喜剧—>小品—>宋××(一小品演员)”,就可以基于该传播路径扩展出一个新的对象标签“宋××”。通过语义信息在知识图谱中进行传播可以有多条类似的路径,从而可以生成多个待构建对象可能感兴趣的候选关联对象标签,以此提高对象标签的数量,进而提高对象特征构建的准确性。
其中,基于该关联度,在该候选关联对象标签筛选出至少一个关联对象标签的方式可以有多种,例如,可以获取一个关联度阈值,在该关联度大于该关联度阈值时,可以将该关联度对应的候选关联对象标签确定为关联对象标签等,该关联度阈值可以为预先设定的一个关联度的临界值,该临界值的选取可以根据实际需求进行确定。
在步骤104中,统计标签关联路径的节点数量,并根据节点数量对关联对象标签对应的基础对象标签的标签权重进行调节,得到关联对象标签对应的关联标签权重。
其中,该节点数量可以为标签关联路径中的节点的数量,该关联标签权重可以为关联对象标签对应的标签权重。
其中,根据节点数量对关联对象标签对应的基础对象标签的标签权重进行调节,得到关联对象标签对应的关联标签权重的方式可以有多种,例如,可以根据关联对象标签对应的标签关联路径的节点数量,确定关联对象标签对应的权重系数,根据所述权重系数,对该关联对象标签对应的基础对象标签的标签权重进行加权,得到关联对象标签对应的关联标签权重。
其中,该权重系数可以为一个对标签权重进行调节的系数,该权重系数可以为0.8等数值,例如,在关联对象标签对应的标签关联路径的节点数量较多时,可以表明该关联对象标签与其对应的基础对象标签的差距较大,即待构建对象对该关联对象标签感兴趣的可能程度较小,此时可以设定一个较小的权重系数,来减小该关联对象标签对待构建对象的对象特征的影响,在关联对象标签对应的标签关联路径的节点数量较少时,可以表明该关联对象标签与其对应的基础对象标签的差距较小,即待构建对象对该关联对象标签感兴趣的可能程度较大,此时可以设定一个较大的权重系数,以增加该关联对象标签对待构建对象的对象特征的影响,以此提高对象特征构建的准确性,同时又保证了对待构建对象的兴趣扩展。需要说明的是,该权重系数的具体取值可以根据实际需求进行设定,在此不做限定。
其中,根据关联对象标签对应的标签关联路径的节点数量,确定关联对象标签对应的权重系数的方式可以有多种,例如,可以在预设权重系数集合中筛选出与该节点数量匹配的权重系数来作为关联对象标签对应的权重系数。其中,该预设权重系数集合可以为预先设定的权重系数集合,该权重系数集合中可以包括至少一个候选权重系数,该候选权重系数可以与节点数量进行对应。从而可以根据关联对象标签对应的标签关联路径的节点数量,在预设权重系数集合中筛选出与该节点数量匹配的权重系数。
在步骤105中,基于关联对象标签和关联对象标签对应的关联标签权重对对象标签信息进行更新,并基于更新后的对象标签信息,构建待构建对象对应的对象特征。
其中,该更新后的对象标签信息可以为根据基于关联对象标签和关联对象标签对应的关联标签权重对对象标签信息进行更新后的对象标签信息,该对象特征可以为表征待构建对象的特征信息,可以表征待构建对象的兴趣偏好、行为、习惯等信息,以此可以通过语义传播扩展找到待构建对象可能会感兴趣的关联对象标签,并可以将基础对象标签和新生成的关联对象标签进行融合,可以得到的待构建对象对应的对象特征,从而丰富了待构建对象可能感兴趣的对象标签的数量,进而提高了对象特征构建的准确性,进而提升对象特征构建的效率。
其中,基于关联对象标签和关联对象标签对应的关联标签权重对对象标签信息进行更新的方式可以有多种,例如,可以基于该关联对象标签以及关联标签权重,确定关联对象标签信息,并根据该关联对象标签信息对该对象标签信息进行更新。
其中,该关联对象标签信息可以为关联对象标签对应的对象标签信息,即基于基础对象标签的语义传播扩展的对象标签信息。
其中,根据该关联对象标签信息对该对象标签信息进行更新的方式可以有多种,例如,请继续参考图5b,可以将关联对象标签信息融合到待构建对象的对象标签信息中,从而可以得到更新后的对象标签信息。
在一实施例中,在根据本申请实施例提供的对象特征构建方法构建待构建对象对应的对象特征之后,可以基于待构建对象的对象特征,对待构建对象进行内容推送处理。其中,基于待构建对象的对象特征,对待构建对象进行内容推送处理的方式可以有多种,例如,可以获取至少一个待推送内容,基于该待构建对象对应的对象特征,在该待推送内容中识别出至少一个与该对象特征匹配的目标内容,将该目标内容推送至该待构建对象。
其中,该待推送内容可以为待进行推送的内容,该内容可以为承载信息的载体,可以通过展现给用户进行消费,以使得用户获取相应的信息,比如,该内容可以包括但不限于视频、音频、文本和图像等形式的内容,例如,可以为视频、资讯、新闻等内容。该目标内容可以为基于该待构建对象对应的对象特征,在该待推送内容中识别出的至少一个与该对象特征匹配的内容。
以此,通过对待构建对象的对象标签信息进行扩展,增加了待构建对象的对象标签信息的数量,从而基于扩展后的对象标签信息进行对象特征的构建,对于原有对象特征的对象标签数量很少或没有的待构建对象,可以推荐出更多符合用户兴趣点的内容,从而可以提供对象特征构建的准确性,进而可以基于构建的对象特征对待构建对象进行更加准确的内容推送处理,提高了内容推送的准确性。
由以上可知,本申请实施例通过获取待构建对象在目标***中的对象标签信息,该对象标签信息包括至少一个针对该待构建对象的对象属性的对象标签和该对象标签对应的标签权重,该标签权重用于表征该对象属性对于该待构建对象的重要程度;计算该对象标签之间的标签相似度,并基于该标签相似度和标签权重,在该对象标签信息中确定基础对象标签;提取基础对象标签对应的语义信息,并基于语义信息,在预设标签关系图中进行语义传播,得到至少一个关联对象标签和关联对象标签对应的标签关联路径,该预设标签关系图包括至少一个节点以及基于节点之间的语义关系进行连接的节点边,每一节点对应一个预设对象标签;统计标签关联路径的节点数量,并根据节点数量对关联对象标签对应的基础对象标签的标签权重进行调节,得到关联对象标签对应的关联标签权重;基于关联对象标签和关联对象标签对应的关联标签权重对该对象标签信息进行更新,并基于更新后的对象标签信息,构建该待构建对象对应的对象特征。以此,通过在对象标签信息中确定基础对象标签,并根据该基础对象标签的语义信息在预设标签关系图中进行语义传播,得到至少一个关联对象标签和关联对象标签对应的标签关联路径,进而统计标签关联路径的节点数量,并根据节点数量对关联对象标签对应的基础对象标签的标签权重进行调节,得到关联对象标签对应的关联标签权重,从而基于关联对象标签和关联对象标签对应的关联标签权重对待推荐对象的对象标签信息进行扩展,丰富了待构建对象可能感兴趣的对象标签的数量,进而根据扩展后的对象标签信息构建该待构建对象对应的对象特征,提高了对象特征构建的准确性,进而提升对象特征构建的效率。
根据上面实施例所描述的方法,以下将举例作进一步详细说明。
在本实施例中,将以该对象特征构建装置具体集成在计算机设备为例进行说明。其中,该对象特征构建方法以服务器为执行主体,以对象特征构建方法应用于内容推送领域为例进行具体的描述。其中,可以理解的是,在本申请的具体实施方式中,涉及到用户信息等相关的数据,当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
为了更好的描述本申请实施例,请参阅图6,图6为本申请实施例提供的对象特征构建方法的另一流程示意图。具体流程如下:
在步骤201中,服务器获取该目标对象对应的设备属性信息,基于该设备属性信息,在该目标对象中识别出至少一个设备更新对象,根据该设备属性信息,获取该设备更新对象对应的当前设备对象标签信息和历史设备对象标签信息,将该当前设备对象标签信息和历史设备对象标签信息进行融合,得到该设备更新对象对应的设备更新对象标签信息。
其中,服务器基于该设备属性信息,在该目标对象中识别出至少一个设备更新对象的方式可以有多种,例如,服务器可以在设备属性信息中,提取出目标对象对应的设备使用时间,将目标对象对应的设备使用时间与预设时间段进行对比,根据对比结果将设备使用时间处于该预设时间段内的目标对象确定为设备更新对象。其中,该设备使用时间可以为目标对象对应的设备的使用时间,例如为用户更换新设备的时间。
可选的,请继续参考图4,可以获取目标对象中在近d天内使用新设备进行登录的目标对象,该d可以为一个预先设定的数值,例如,可以为30等,具体可以根据实际需求进行设定。然后,服务器可以通过自然人识别来判断近d天内使用新设备进行登录的目标对象是否为设备更新对象。其中,自然人识别就是判断使用不同设备的用户是否对应同一个自然人,例如,服务器可以通过账号与设备的登录关系,建立由“设备-账号-设备”的三元组关系对的关系图,并可以使用一些策略去除异常结点和裁剪不合理的边,对“设备-设备”的边的权重进行打分并排序,同时可以通过对“设备-设备”的边的权重做阈值过滤,选出可信度高的“设备-设备”边,若某一设备存在于多个“设备-设备”边中,则可以选用边权重最高的边,从而可以在目标对象中识别出至少一个设备更新对象。
其中,服务器将该当前设备对象标签信息和历史设备对象标签信息进行融合的方式可以有多种,例如,服务器可以提取当前设备对象标签信息和历史设备对象标签信息中的对象标签,并将提取出的对象标签中重复的对象标签进行去重,例如,可以对将当前设备对象标签信息和历史设备对象标签信息融合后的<标签,权重>列表做去重处理,若融合后的<标签,权重>列表中存在重复的对象标签,则将该重复的对象标签对应的标签权重的权重值进行相加后,将相加的结果作为该对象标签的新权重,比如,对于对象标签ti,列表中可能存在<ti,wi1>和<ti,wi2>,其中,wi1和wi2分别为对象标签ti在当前设备对象标签信息和历史设备对象标签信息中对应的标签权重,则可以去除<ti,wi1>和<ti,wi2>,并新增<ti,wi1+wi2>。
在步骤202中,服务器基于该设备更新对象标签信息,对该目标对象标签信息进行更新,得到更新后目标对象标签信息,并统计该目标对象对应的更新后目标对象标签信息的数量,得到该目标对象对应的对象标签信息数量,基于该对象标签信息数量,在该目标对象中识别出待构建对象。
其中,服务器基于该对象标签信息数量,在该目标对象中识别出待构建对象的方式可以有多种,例如,服务器可以获取一个数量阈值,将该数量阈值与目标对象的对象标签信息数量进行对比,根据对比结果将对象标签信息数量小于该数量阈值的目标对象确定为待构建对象。其中,该数量阈值可以为预先设定的一个临界值,在对象标签信息不小于该临界值时,可以表明该目标对象的对象标签信息的数量还算充足,此时可以确定该目标对象不为待构建对象,在对象标签信息小于该临界值时,可以表明该目标对象的对象标签信息的数量较缺乏,此时可以确定该目标对象为待构建对象。该数量阈值的具体取值可以根据实际情况进行选取,在此不做限定。例如,该数量阈值可以为10个、20个等。
在步骤203中,服务器获取该待构建对象在该目标***中的对象标签信息,计算该对象标签之间的标签相似度,获取第一相似度阈值以及第二相似度阈值。
其中,服务器计算对象标签之间的标签相似度的方式可以有多种,例如,可以对对象标签进行特征提取,得到对象标签对应的对象标签特征,计算对象标签特征之间的相似度,得到对象标签之间的标签相似度。
其中,该对象标签特征可以为表征对象标签的特征信息,可以为一个词嵌入向量。其中,对对象标签进行特征提取,得到对象标签对应的对象标签特征的方式可以有多种,例如,可以选用word2vec、glove、ELMo、BERT等语言模型,例如,可以采BERT来获取对象标签对应的对象标签特征。可选的,请参考图5a,以本申请实施例提供的对象特征构建方法应用于视频内容推荐领域为例,可以在预训练模型BERT模型的基础上,利用视频领域语料对预训练模型进行微调,以使得微调后的BERT模型对视频领域的对象标签的词语能学习到更好的Embedding向量表示。以此,可以将待构建对象的对象标签输入到微调后的BERT模型,来得到对应的对象标签特征。
服务器在对对象标签进行特征提取,得到对象标签对应的对象标签特征之后,便可以计算对象标签特征之间的相似度,得到对象标签之间的标签相似度。其中,服务器计算对象标签特征之间的相似度的方式可以有多种,例如,可以采用对象标签特征之间的欧式距离、余弦距离等对对象标签特征之间的相似度进行度量。例如,可以通过计算对象标签特征之间的余弦距离来得到对象标签特征之间的相似度,即在向量空间中的两个对象标签特征Ei和Ej夹角间的余弦值作为两个标签之间差异的大小。余弦值的取值范围可以为[-1,1],余弦值接近于1,夹角趋于0,表明两个对象标签越相似。余弦距离计算公式可以表示为
在步骤204中,服务器基于该第一相似度阈值和标签相似度,在该对象标签中筛选出至少一个第一对象标签组,并基于该第二相似度阈值和标签相似度,在该对象标签中筛选出至少一个第二对象标签组,将该第一对象标签组和第二对象标签组作为对象标签组,根据该标签权重,在该对象标签组中筛选出至少一个基础对象标签。
其中,服务器根据该标签权重,在该标签组中筛选出至少一个基础对象标签的方式可以有多种,例如,服务器可以将该第一对象标签组中的对象标签对应的标签权重进行比对,并根据比对结果在第一对象标签对中筛选出目标对象标签,根据该目标对象标签以及第二对象标签组中的对象标签,确定基础对象标签。其中,目标对象标签可以为第一对象标签组中标签权重较大的对象标签,以此,服务器可以将第一对象标签组中标签权重较大的目标对象标签以及第二对象标签组中的对象标签确定为基础对象标签。
在步骤205中,服务器提取基础对象标签对应的语义信息,基于该语义信息,在预设标签关系图中进行语义传播,得到至少一个候选关联对象标签和该候选关联对象标签对应的候选标签关联路径。
其中,服务器基于该语义信息,在预设标签关系图中进行语义传播,得到至少一个候选关联对象标签和该候选关联对象标签对应的候选标签关联路径的方式可以有多种,例如,服务器可以在基础对象标签对应的语义信息中提取出该基础对象标签对应的至少一个概念信息以及至少一个类别信息,根据该概念信息以及类别信息之间的关联关系,在预设标签关系图中识别出与该基础对象标签关联的至少一个候选关联对象标签以及候选关联对象标签对应的候选标签关联路径。
其中,服务器根据该概念信息以及类别信息之间的关联关系,在预设标签关系图中识别出与该基础对象标签关联的至少一个候选关联对象标签以及候选关联对象标签对应的候选标签关联路径的方式可以有多种,例如,该预设标签关系图可以为知识图谱,服务器可以通过知识图谱来对基础对象标签的语义信息进行传播,以基于候选关联对象标签对应的语义信息和预设对象标签对应的语义信息之间的语义关联程度扩展出与该基础对象标签关联的至少一个候选关联对象标签。具体的,可以预先基于预设对象标签以及预设对象标签的语义信息构建以标签为实体的知识图谱,例如,基于标签实体—>概念—>类别的三层语义关系来构建预设对象标签为实体的知识图谱,该知识图谱中包含三层语义关系,例如,“郭××—>相声—>语言类喜剧”。从而,服务器可以将基础对象标签输入到该知识图谱中,根据基础对象标签的语义信息,在知识图谱中进行传播,从而可以基于传播路径在预设对象标签中筛选出与该基础对象标签关联的至少一个候选关联对象标签以及候选关联对象标签对应的候选标签关联路径。例如,以本申请实施例提供的对象特征构建方法应用于视频内容推荐领域为例,可以将基础对象标签输入到视频领域的实体知识图谱中,利用该基础对象标签的语义信息中的概念信息和类别信息的关联性进行对象标签的传播扩展。假设一个待构建对象存在一个“郭××”的对象标签,则可以通过概念信息和类别信息的关联性在知识图谱中进行传播遍历,比如某一传播路径“郭××—>相声—>语言类喜剧—>小品—>宋××(一小品演员)”,就可以基于该传播路径扩展出一个新的对象标签“宋××”。通过语义信息在知识图谱中进行传播可以有多条类似的路径,从而可以生成多个待构建对象可能感兴趣的候选关联对象标签,以此提高对象标签的数量,进而提高对象特征构建的准确性。
在步骤206中,服务器统计该候选关联对象标签的标签数量,并在该标签数量大于预设标签数量阈值时,计算该候选关联对象标签与该基础对象标签之间的关联度,基于该关联度,在该候选关联对象标签筛选出至少一个关联对象标签,并获取该关联对象标签对应的标签关联路径。
其中,服务器计算该候选关联对象标签与该基础对象标签之间的关联度的方式可以有多种,例如,可以计算该候选关联对象标签与该基础对象标签之间的相似度,根据该相似度确定候选关联对象标签与该基础对象标签之间的关联度。
其中,服务器基于该关联度,在该候选关联对象标签筛选出至少一个关联对象标签的方式可以有多种,例如,服务器可以获取一个关联度阈值,在该关联度大于该关联度阈值时,可以将该关联度对应的候选关联对象标签确定为关联对象标签等,该关联度阈值可以为预先设定的一个关联度的临界值,该临界值的选取可以根据实际需求进行确定。
在步骤207中,服务器统计标签关联路径的节点数量,并根据节点数量对关联对象标签对应的基础对象标签的标签权重进行调节,得到关联对象标签对应的关联标签权重。
其中,服务器根据节点数量对关联对象标签对应的基础对象标签的标签权重进行调节,得到关联对象标签对应的关联标签权重的方式可以有多种,例如,服务器可以根据关联对象标签对应的标签关联路径的节点数量,确定关联对象标签对应的权重系数,根据所述权重系数,对该关联对象标签对应的基础对象标签的标签权重进行加权,得到关联对象标签对应的关联标签权重。
其中,该权重系数可以为一个对标签权重进行调节的系数,该权重系数可以为0.8等数值,例如,在关联对象标签对应的标签关联路径的节点数量较多时,可以表明该关联对象标签与其对应的基础对象标签的差距较大,即待构建对象对该关联对象标签感兴趣的可能程度较小,此时可以设定一个较小的权重系数,来减小该关联对象标签对待构建对象的对象特征的影响,在关联对象标签对应的标签关联路径的节点数量较少时,可以表明该关联对象标签与其对应的基础对象标签的差距较小,即待构建对象对该关联对象标签感兴趣的可能程度较大,此时可以设定一个较大的权重系数,以增加该关联对象标签对待构建对象的对象特征的影响,以此提高对象特征构建的准确性,同时又保证了对待构建对象的兴趣扩展。需要说明的是,该权重系数的具体取值可以根据实际需求进行设定,在此不做限定。
其中,服务器根据关联对象标签对应的标签关联路径的节点数量,确定关联对象标签对应的权重系数的方式可以有多种,例如,服务器可以在预设权重系数集合中筛选出与该节点数量匹配的权重系数来作为关联对象标签对应的权重系数。
在步骤208中,服务器基于关联对象标签和关联对象标签对应的关联标签权重对对象标签信息进行更新,并基于更新后的对象标签信息,构建待构建对象对应的对象特征。
其中,服务器基于所述关联对象标签和所述关联对象标签对应的关联标签权重对所述对象标签信息进行更新的方式可以有多种,例如,可以基于该关联对象标签以及关联标签权重,确定关联对象标签信息,并根据该关联对象标签信息对该对象标签信息进行更新。
其中,服务器基于该关联对象标签以及关联标签权重,确定关联对象标签信息的方式可以有多种,例如,假设基于待构建对象的基础对象标签扩展得到关联对象标签T以及该关联对象标签T对应的关联标签权重W,则可以得到关联对象标签信息为<T,W>。
服务器在基于该关联对象标签以及关联标签权重,确定关联对象标签信息之后,便可以根据该关联对象标签信息对该对象标签信息进行更新。其中,服务器根据该关联对象标签信息对该对象标签信息进行更新的方式可以有多种,例如,请继续参考图5b,服务器可以将关联对象标签信息融合到待构建对象的对象标签信息中,从而可以得到更新后的对象标签信息。
在步骤209中,服务器获取至少一个待推送内容,基于该待构建对象对应的对象特征,在该待推送内容中识别出至少一个与该对象特征匹配的目标内容,将该目标内容推送至该待构建对象。
其中,服务器通过对待构建对象的对象标签信息进行扩展,增加了待构建对象的对象标签信息的数量,从而基于扩展后的对象标签信息进行对象特征的构建,丰富了待构建对象的对象特征,以此,对于原有对象特征的对象标签数量很少或没有的待构建对象,可以推荐出更多符合用户兴趣点的内容,从而可以提供对象特征构建的准确性,服务器在接收到针对待构建对象的内容推送请求时,可以根据待构建对象对应的对象特征,在获取到的待推送内容中筛选出与该待构建对象匹配的,即待构建对象可能感兴趣的目标内容,再将该目标内容推送给待构建对象,以此可以基于构建的对象特征对待构建对象进行更加准确的内容推送处理,提高了内容推送的准确性。
由以上可知,本申请实施例通过服务器获取该目标对象对应的设备属性信息,基于该设备属性信息,在该目标对象中识别出至少一个设备更新对象,根据该设备属性信息,获取该设备更新对象对应的当前设备对象标签信息和历史设备对象标签信息,将该当前设备对象标签信息和历史设备对象标签信息进行融合,得到该设备更新对象对应的设备更新对象标签信息;服务器基于该设备更新对象标签信息,对该目标对象标签信息进行更新,得到更新后目标对象标签信息,并统计该目标对象对应的更新后目标对象标签信息的数量,得到该目标对象对应的对象标签信息数量,基于该对象标签信息数量,在该目标对象中识别出待构建对象;服务器获取该待构建对象在该目标***中的对象标签信息,计算该对象标签之间的标签相似度,获取第一相似度阈值以及第二相似度阈值;服务器基于该第一相似度阈值和标签相似度,在该对象标签中筛选出至少一个第一对象标签组,并基于该第二相似度阈值和标签相似度,在该对象标签中筛选出至少一个第二对象标签组,将该第一对象标签组和第二对象标签组作为对象标签组,根据该标签权重,在该对象标签组中筛选出至少一个基础对象标签;服务器提取基础对象标签对应的语义信息,基于该语义信息,在预设标签关系图中进行语义传播,得到至少一个候选关联对象标签和该候选关联对象标签对应的候选标签关联路径;服务器统计该候选关联对象标签的标签数量,并在该标签数量大于预设标签数量阈值时,计算该候选关联对象标签与该基础对象标签之间的关联度,基于该关联度,在该候选关联对象标签筛选出至少一个关联对象标签,并获取该关联对象标签对应的标签关联路径;服务器统计标签关联路径的节点数量,并根据节点数量对关联对象标签对应的基础对象标签的标签权重进行调节,得到关联对象标签对应的关联标签权重;服务器基于关联对象标签和关联对象标签对应的关联标签权重对对象标签信息进行更新,并基于更新后的对象标签信息,构建待构建对象对应的对象特征;服务器获取至少一个待推送内容,基于该待构建对象对应的对象特征,在该待推送内容中识别出至少一个与该对象特征匹配的目标内容,将该目标内容推送至该待构建对象。以此,通过在对象标签信息中确定基础对象标签,并并根据该基础对象标签的语义信息在预设标签关系图中进行语义传播,得到至少一个关联对象标签和关联对象标签对应的标签关联路径,进而统计标签关联路径的节点数量,并根据节点数量对关联对象标签对应的基础对象标签的标签权重进行调节,得到关联对象标签对应的关联标签权重,从而基于关联对象标签和关联对象标签对应的关联标签权重对待推荐对象的对象标签信息进行扩展,丰富了待构建对象可能感兴趣的对象标签的数量,进而根据扩展后的对象标签信息构建该待构建对象对应的对象特征,提高了对象特征构建的准确性,进而提升对象特征构建的效率,同时,对于原有对象特征的对象标签数量很少或没有的待构建对象,可以推荐出更多符合用户兴趣点的内容,从而可以提供对象特征构建的准确性,进而可以基于构建的对象特征对待构建对象进行更加准确的内容推送处理,提高了内容推送的准确性。
为了更好地实施以上方法,本发明实施例还提供一种对象特征构建装置,该对象特征构建装置可以集成在计算机设备中,该计算机设备可以为服务器。
例如,如图7所示,为本申请实施例提供的对象特征构建装置的结构示意图,该对象特征构建装置可以包括获取单元301、确定单元302、传播单元303、调节单元304和构建单元305,如下:
获取单元301,用于获取待构建对象在目标***中的对象标签信息,该对象标签信息包括至少一个针对该待构建对象的对象属性的对象标签和该对象标签对应的标签权重,该标签权重用于表征该对象属性对于该待构建对象的重要程度;
确定单元302,用于计算该对象标签之间的标签相似度,并基于该标签相似度和标签权重,在该对象标签信息中确定基础对象标签;
传播单元303,用于提取该基础对象标签对应的语义信息,并基于该语义信息,在预设标签关系图中进行语义传播,得到至少一个关联对象标签和该关联对象标签对应的标签关联路径,该预设标签关系图包括至少一个节点以及基于该节点之间的语义关系进行连接的节点边,每一该节点对应一个预设对象标签;
调节单元304,用于统计该标签关联路径的节点数量,并根据该节点数量对该关联对象标签对应的基础对象标签的标签权重进行调节,得到该关联对象标签对应的关联标签权重;
构建单元305,用于基于该关联对象标签和该关联对象标签对应的关联标签权重对该对象标签信息进行更新,并基于更新后的对象标签信息,构建该待构建对象对应的对象特征。
在一实施例中,该传播单元303,包括:
语义传播子单元,用于基于该语义信息,在预设标签关系图中进行语义传播,得到至少一个候选关联对象标签和该候选关联对象标签对应的候选标签关联路径;
关联度计算子单元,用于统计该候选关联对象标签的标签数量,并在该标签数量大于预设标签数量阈值时,计算该候选关联对象标签与该基础对象标签之间的关联度;
标签筛选子单元,用于基于该关联度,在该候选关联对象标签筛选出至少一个关联对象标签,并获取该关联对象标签对应的标签关联路径。
在一实施例中,该确定单元302,包括:
对象标签组识别子单元,用于基于该标签相似度,在该对象标签中识别出至少一个对象标签组,该对象标签组中包括至少两个对象标签;
基础对象标签筛选子单元,用于根据该标签权重,在该对象标签组中筛选出至少一个基础对象标签。
在一实施例中,该对象标签组识别子单元,包括:
阈值获取模块,用于获取第一相似度阈值以及第二相似度阈值,该第一相似度阈值大于该第二相似度阈值;
标签组筛选模块,用于基于该第一相似度阈值和标签相似度,在该对象标签中筛选出至少一个第一对象标签组,并基于该第二相似度阈值和标签相似度,在该对象标签中筛选出至少一个第二对象标签组;
赋值模块,用于将该第一对象标签组和第二对象标签组作为对象标签组。
在一实施例中,该获取单元301,包括:
对象标签信息数量统计子单元,用于统计目标对象在目标***中对应的目标对象标签信息的数量,得到该目标对象对应的对象标签信息数量;
待构建对象识别子单元,用于基于该对象标签信息数量,在该目标对象中识别出待构建对象;
对象标签信息获取子单元,用于获取该待构建对象在该目标***中的对象标签信息。
在一实施例中,该对象标签信息数量统计子单元,包括:
设备属性信息获取模块,用于获取该目标对象对应的设备属性信息;
设备更新对象标签信息确定模块,用于基于该设备属性信息,在该目标对象中识别出至少一个设备更新对象,并根据该设备属性信息,确定该设备更新对象的设备更新对象标签信息;
对象标签信息数量统计模块,用于基于该设备更新对象标签信息,对该目标对象标签信息进行更新,得到更新后目标对象标签信息,并统计该目标对象对应的更新后目标对象标签信息的数量,得到该目标对象对应的对象标签信息数量。
在一实施例中,该设备更新对象标签信息确定模块,包括:
设备标签信息获取子模块,用于根据该设备属性信息,获取该设备更新对象对应的当前设备对象标签信息和历史设备对象标签信息;
标签信息融合子模块,用于将该当前设备对象标签信息和历史设备对象标签信息进行融合,得到该设备更新对象对应的设备更新对象标签信息。
在一实施例中,该对象特征构建装置,还包括:
待推送内容获取单元,用于获取至少一个待推送内容;
目标内容识别单元,用于基于该待构建对象对应的对象特征,在该待推送内容中识别出至少一个与该对象特征匹配的目标内容;
内容推送单元,用于将该目标内容推送至该待构建对象。
具体实施时,以上各个单元可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。
由以上可知,本申请实施例通过获取单元301获取待构建对象在目标***中的对象标签信息,该对象标签信息包括至少一个针对该待构建对象的对象属性的对象标签和该对象标签对应的标签权重,该标签权重用于表征该对象属性对于该待构建对象的重要程度;确定单元302计算该对象标签之间的标签相似度,并基于该标签相似度和标签权重,在该对象标签信息中确定基础对象标签;传播单元303提取基础对象标签对应的语义信息,并基于语义信息,在预设标签关系图中进行语义传播,得到至少一个关联对象标签和关联对象标签对应的标签关联路径,该预设标签关系图包括至少一个节点以及基于节点之间的语义关系进行连接的节点边,每一节点对应一个预设对象标签;调节单元304统计标签关联路径的节点数量,并根据节点数量对关联对象标签对应的基础对象标签的标签权重进行调节,得到关联对象标签对应的关联标签权重;构建单元305基于关联对象标签和关联对象标签对应的关联标签权重对该对象标签信息进行更新,并基于更新后的对象标签信息,构建该待构建对象对应的对象特征。以此,通过在对象标签信息中确定基础对象标签,并根据该基础对象标签的语义信息在预设标签关系图中进行语义传播,得到至少一个关联对象标签和关联对象标签对应的标签关联路径,进而统计标签关联路径的节点数量,并根据节点数量对关联对象标签对应的基础对象标签的标签权重进行调节,得到关联对象标签对应的关联标签权重,从而基于关联对象标签和关联对象标签对应的关联标签权重对待推荐对象的对象标签信息进行扩展,丰富了待构建对象可能感兴趣的对象标签的数量,进而根据扩展后的对象标签信息构建该待构建对象对应的对象特征,提高了对象特征构建的准确性,进而提升对象特征构建的效率。
本申请实施例还提供一种计算机设备,如图8所示,其示出了本申请实施例所涉及的计算机设备的结构示意图,该计算机设备可以是服务器,具体来讲:
该计算机设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解,图8中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器401是该计算机设备的控制中心,利用各种接口和线路连接整个计算机设备的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行计算机设备的各种功能和处理数据。可选的,处理器401可包括一个或多个处理核心;优选的,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及对象特征构建。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
计算机设备还包括给各个部件供电的电源403,优选的,电源403可以通过电源管理***与处理器401逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电***、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该计算机设备还可包括输入单元404,该输入单元404可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,计算机设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,计算机设备中的处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能,如下:
获取待构建对象在目标***中的对象标签信息,该对象标签信息包括至少一个针对该待构建对象的对象属性的对象标签和该对象标签对应的标签权重,该标签权重用于表征该对象属性对于该待构建对象的重要程度;计算该对象标签之间的标签相似度,并基于该标签相似度和标签权重,在该对象标签信息中确定基础对象标签;提取基础对象标签对应的语义信息,并基于语义信息,在预设标签关系图中进行语义传播,得到至少一个关联对象标签和关联对象标签对应的标签关联路径,该预设标签关系图包括至少一个节点以及基于节点之间的语义关系进行连接的节点边,每一节点对应一个预设对象标签;统计标签关联路径的节点数量,并根据节点数量对关联对象标签对应的基础对象标签的标签权重进行调节,得到关联对象标签对应的关联标签权重;基于关联对象标签和关联对象标签对应的关联标签权重对该对象标签信息进行更新,并基于更新后的对象标签信息,构建该待构建对象对应的对象特征。
以上各个操作的具体实施可参见前面的实施例,在此不作赘述。应当说明的是,本申请实施例提供的计算机设备与上文实施例中的适用于对象特征构建方法属于同一构思,其具体实现过程详见以上方法实施例,此处不再赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请实施例所提供的任一种对象特征构建方法中的步骤。例如,该指令可以执行如下步骤:
获取待构建对象在目标***中的对象标签信息,该对象标签信息包括至少一个针对该待构建对象的对象属性的对象标签和该对象标签对应的标签权重,该标签权重用于表征该对象属性对于该待构建对象的重要程度;计算该对象标签之间的标签相似度,并基于该标签相似度和标签权重,在该对象标签信息中确定基础对象标签;提取基础对象标签对应的语义信息,并基于语义信息,在预设标签关系图中进行语义传播,得到至少一个关联对象标签和关联对象标签对应的标签关联路径,该预设标签关系图包括至少一个节点以及基于节点之间的语义关系进行连接的节点边,每一节点对应一个预设对象标签;统计标签关联路径的节点数量,并根据节点数量对关联对象标签对应的基础对象标签的标签权重进行调节,得到关联对象标签对应的关联标签权重;基于关联对象标签和关联对象标签对应的关联标签权重对该对象标签信息进行更新,并基于更新后的对象标签信息,构建该待构建对象对应的对象特征。
其中,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该计算机可读存储介质中所存储的指令,可以执行本申请实施例所提供的任一种对象特征构建方法中的步骤,因此,可以实现本申请实施例所提供的任一种对象特征构建方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
其中,根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例提供的各种可选实现方式中提供的方法。
以上对本申请实施例所提供的一种对象特征构建方法、装置和计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种对象特征构建方法,其特征在于,包括:
获取待构建对象在目标***中的对象标签信息,所述对象标签信息包括至少一个针对所述待构建对象的对象属性的对象标签和所述对象标签对应的标签权重,所述标签权重用于表征所述对象属性对于所述待构建对象的重要程度;
计算所述对象标签之间的标签相似度,并基于所述标签相似度和标签权重,在所述对象标签信息中确定基础对象标签;
提取所述基础对象标签对应的语义信息,并基于所述语义信息,在预设标签关系图中进行语义传播,得到至少一个关联对象标签和所述关联对象标签对应的标签关联路径,所述预设标签关系图包括至少一个节点以及基于所述节点之间的语义关系进行连接的节点边,每一所述节点对应一个预设对象标签;
统计所述标签关联路径的节点数量,并根据所述节点数量对所述关联对象标签对应的基础对象标签的标签权重进行调节,得到所述关联对象标签对应的关联标签权重;
基于所述关联对象标签和所述关联对象标签对应的关联标签权重对所述对象标签信息进行更新,并基于更新后的对象标签信息,构建所述待构建对象对应的对象特征。
2.如权利要求1所述的对象特征构建方法,其特征在于,所述基于所述语义信息,在预设标签关系图中进行语义传播,得到至少一个关联对象标签和所述关联对象标签对应的标签关联路径,包括:
基于所述语义信息,在预设标签关系图中进行语义传播,得到至少一个候选关联对象标签和所述候选关联对象标签对应的候选标签关联路径;
统计所述候选关联对象标签的标签数量,并在所述标签数量大于预设标签数量阈值时,计算所述候选关联对象标签与所述基础对象标签之间的关联度;
基于所述关联度,在所述候选关联对象标签筛选出至少一个关联对象标签,并获取所述关联对象标签对应的标签关联路径。
3.如权利要求1所述的对象特征构建方法,其特征在于,所述基于所述标签相似度和标签权重,在所述对象标签信息中确定基础对象标签,包括:
基于所述标签相似度,在所述对象标签中识别出至少一个对象标签组,所述对象标签组中包括至少两个对象标签;
根据所述标签权重,在所述对象标签组中筛选出至少一个基础对象标签。
4.如权利要求3所述的对象特征构建方法,其特征在于,所述基于所述标签相似度,在所述对象标签中识别出至少一个对象标签组,包括:
获取第一相似度阈值以及第二相似度阈值,所述第一相似度阈值大于所述第二相似度阈值;
基于所述第一相似度阈值和标签相似度,在所述对象标签中筛选出至少一个第一对象标签组,并基于所述第二相似度阈值和标签相似度,在所述对象标签中筛选出至少一个第二对象标签组;
将所述第一对象标签组和第二对象标签组作为对象标签组。
5.如权利要求1至4中任一项所述的对象特征构建方法,其特征在于,所述获取待构建对象在目标***中的对象标签信息,包括:
统计目标对象在目标***中对应的目标对象标签信息的数量,得到所述目标对象对应的对象标签信息数量;
基于所述对象标签信息数量,在所述目标对象中识别出待构建对象;
获取所述待构建对象在所述目标***中的对象标签信息。
6.如权利要求5所述的对象特征构建方法,其特征在于,所述统计目标对象在目标***中对应的目标对象标签信息的数量,得到所述目标对象对应的对象标签信息数量,包括:
获取所述目标对象对应的设备属性信息;
基于所述设备属性信息,在所述目标对象中识别出至少一个设备更新对象,并根据所述设备属性信息,确定所述设备更新对象的设备更新对象标签信息;
基于所述设备更新对象标签信息,对所述目标对象标签信息进行更新,得到更新后目标对象标签信息,并统计所述目标对象对应的更新后目标对象标签信息的数量,得到所述目标对象对应的对象标签信息数量。
7.如权利要求6所述的对象特征构建方法,其特征在于,所述根据所述设备属性信息,确定所述设备更新对象的设备更新对象标签信息,包括:
根据所述设备属性信息,获取所述设备更新对象对应的当前设备对象标签信息和历史设备对象标签信息;
将所述当前设备对象标签信息和历史设备对象标签信息进行融合,得到所述设备更新对象对应的设备更新对象标签信息。
8.如权利要求1所述的对象特征构建方法,其特征在于,所述基于更新后的对象标签信息,构建所述待构建对象对应的对象特征之后,还包括:
获取至少一个待推送内容;
基于所述待构建对象对应的对象特征,在所述待推送内容中识别出至少一个与所述对象特征匹配的目标内容;
将所述目标内容推送至所述待构建对象。
9.一种对象特征构建装置,其特征在于,包括:
获取单元,用于获取待构建对象在目标***中的对象标签信息,所述对象标签信息包括至少一个针对所述待构建对象的对象属性的对象标签和所述对象标签对应的标签权重,所述标签权重用于表征所述对象属性对于所述待构建对象的重要程度;
确定单元,用于计算所述对象标签之间的标签相似度,并基于所述标签相似度和标签权重,在所述对象标签信息中确定基础对象标签;
传播单元,用于提取所述基础对象标签对应的语义信息,并基于所述语义信息,在预设标签关系图中进行语义传播,得到至少一个关联对象标签和所述关联对象标签对应的标签关联路径,所述预设标签关系图包括至少一个节点以及基于所述节点之间的语义关系进行连接的节点边,每一所述节点对应一个预设对象标签;
调节单元,用于统计所述标签关联路径的节点数量,并根据所述节点数量对所述关联对象标签对应的基础对象标签的标签权重进行调节,得到所述关联对象标签对应的关联标签权重;
构建单元,用于基于所述关联对象标签和所述关联对象标签对应的关联标签权重对所述对象标签信息进行更新,并基于更新后的对象标签信息,构建所述待构建对象对应的对象特征。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至8任一项所述的对象特征构建方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210680834.6A CN117272056A (zh) | 2022-06-15 | 2022-06-15 | 对象特征构建方法、装置和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210680834.6A CN117272056A (zh) | 2022-06-15 | 2022-06-15 | 对象特征构建方法、装置和计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117272056A true CN117272056A (zh) | 2023-12-22 |
Family
ID=89218371
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210680834.6A Pending CN117272056A (zh) | 2022-06-15 | 2022-06-15 | 对象特征构建方法、装置和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117272056A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117609412A (zh) * | 2024-01-19 | 2024-02-27 | 中国地质大学(北京) | 一种基于网络结构信息的空间对象关联方法及装置 |
-
2022
- 2022-06-15 CN CN202210680834.6A patent/CN117272056A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117609412A (zh) * | 2024-01-19 | 2024-02-27 | 中国地质大学(北京) | 一种基于网络结构信息的空间对象关联方法及装置 |
CN117609412B (zh) * | 2024-01-19 | 2024-04-23 | 中国地质大学(北京) | 一种基于网络结构信息的空间对象关联方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107436875B (zh) | 文本分类方法及装置 | |
CN110569496B (zh) | 实体链接方法、装置及存储介质 | |
CN110909182B (zh) | 多媒体资源搜索方法、装置、计算机设备及存储介质 | |
CN108989397B (zh) | 数据推荐方法、装置及存储介质 | |
CN109471978B (zh) | 一种电子资源推荐方法及装置 | |
CN113254711B (zh) | 一种互动图像的显示方法、装置、计算机设备和存储介质 | |
CN110209809B (zh) | 文本聚类方法和装置、存储介质及电子装置 | |
CN111258995A (zh) | 数据处理方法、装置、存储介质及设备 | |
CN109635157A (zh) | 模型生成方法、视频搜索方法、装置、终端及存储介质 | |
CN111552884A (zh) | 用于内容推荐的方法和设备 | |
CN113641797A (zh) | 数据处理方法、装置、设备、存储介质及计算机程序产品 | |
CN112861963A (zh) | 训练实体特征提取模型的方法、装置和存储介质 | |
CN105335466A (zh) | 一种音频数据的检索方法与装置 | |
CN117272056A (zh) | 对象特征构建方法、装置和计算机可读存储介质 | |
CN110162769B (zh) | 文本主题输出方法和装置、存储介质及电子装置 | |
CN114461783A (zh) | 关键词生成方法、装置、计算机设备、存储介质和产品 | |
KR101752474B1 (ko) | 지식 공유 서비스 제공 장치, 방법 및 컴퓨터 프로그램 | |
CN112925912A (zh) | 文本处理方法、同义文本召回方法及装置 | |
CN105430536B (zh) | 一种视频推送方法和装置 | |
CN116955788A (zh) | 一种内容处理的方法、装置、设备、存储介质及程序产品 | |
CN113705683B (zh) | 推荐模型的训练方法、装置、电子设备及存储介质 | |
CN114449342A (zh) | 视频推荐方法、装置、计算机可读存储介质和计算机设备 | |
CN114443904A (zh) | 视频查询方法、装置、计算机设备及计算机可读存储介质 | |
CN115774797A (zh) | 视频内容检索方法、装置、设备和计算机可读存储介质 | |
CN113569067A (zh) | 标签分类方法、装置、电子设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |