CN118012920A - 基于大数据的用户画像标签快速匹配方法 - Google Patents
基于大数据的用户画像标签快速匹配方法 Download PDFInfo
- Publication number
- CN118012920A CN118012920A CN202410417349.9A CN202410417349A CN118012920A CN 118012920 A CN118012920 A CN 118012920A CN 202410417349 A CN202410417349 A CN 202410417349A CN 118012920 A CN118012920 A CN 118012920A
- Authority
- CN
- China
- Prior art keywords
- recommended
- content
- score
- target
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 82
- 238000010276 construction Methods 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 5
- 230000001174 ascending effect Effects 0.000 claims description 3
- 238000003058 natural language processing Methods 0.000 claims description 3
- 238000012913 prioritisation Methods 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 7
- 230000006399 behavior Effects 0.000 description 27
- 238000004590 computer program Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 235000013305 food Nutrition 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 235000021168 barbecue Nutrition 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 235000014102 seafood Nutrition 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及信息推荐技术领域,本发明公开了基于大数据的用户画像标签快速匹配方法;包括基于历史推荐内容构建用户画像,计算兴趣评分,生成待推荐内容,并计算待推荐评分,基于兴趣评分和待推荐评分,生成评分差值,同时标记出目标评分,从待推荐内容中匹配到目标推荐内容;相对于现有技术,能够基于综合标签,构建出准确的用户画像,计算出用户画像的兴趣评分,同时将数据库中的待推荐内容的待推荐评分与兴趣评分比较,快速且准确的匹配到满足用户画像兴趣度的目标推荐内容,并且在排列优先级的限制下,对目标推荐内容进行有序排列,从而确保目标推荐内容能够有序、整齐且准确的推荐给用户,实现用户画像标签快速、准确的匹配效果。
Description
技术领域
本发明涉及信息推荐技术领域,更具体地说,本发明涉及基于大数据的用户画像标签快速匹配方法。
背景技术
用户画像是对特定用户群体的描述和概括,通常基于一系列属性和特征来描绘用户的行为、兴趣、偏好和其他相关信息,通过对用户画像标签匹配,可以更精准地定位和识别用户群体,优化产品设计、营销活动和服务提供,从而对用户感兴趣的内容进行准确推荐。
申请公开号为CN117539881A的中国专利申请公开了基于区块链和大数据的人工智能电商推送***,其用户画像构建模块用于采集用户属性,对用户进行标签画像构建,生成用户画像;店铺标签构建模块用于采集店铺属性,对店铺进行标签画像构建,生成店铺画像;分布储存模块用于将用户画像和店铺画像通过区块链技术去中心化储存;意向收集模块用于采集用户购买意向;线下推送模块用于采集用户实时定位信息以及店铺定位信息,根据用户购买意向和用户画像匹配店铺,生成商品推荐信息,然后根据匹配的店铺定位与用户实时定位的距离判断商品推荐信息的推送时机;线上推送模块用于采集用户状态信息,判断用户空闲情况,并根据用户购买意向和用户画像匹配商品推荐信息,然后根据用户空闲情况判断商品推荐信息的推送时机;能够减少推送信息的重复率,防止用户出现消息疲劳;
现有技术存在以下不足:
现有的用户画像标签匹配通过比较推荐内容与用户画像的相似度,即可向用户推荐感兴趣的内容,并将感兴趣的内容推荐给用户,当用户画像标签匹配后获得的感兴趣内容数量较多时,大量的感兴趣内容在向用户集中推荐时容易出现推荐顺序错乱的现象,导致推荐过程出现无序的问题,从而不能够根据用户对于内容的兴趣度高低进行有序推荐,降低了感兴趣内容的推荐准确度。
鉴于此,本发明提出基于大数据的用户画像标签快速匹配方法以解决上述问题。
发明内容
为了克服现有技术的上述缺陷,为实现上述目的,本发明提供如下技术方案:基于大数据的用户画像标签快速匹配方法,应用于数据服务器,包括:
S1:从数据库中筛选出用户的历史推荐内容,基于历史推荐内容,获取综合标签;
S2:基于构建准则,以综合标签为基础,构建用户画像,并计算用户画像的兴趣评分;
S3:标记数据库中的待推荐标签,基于待推荐标签生成待推荐内容,并计算待推荐内容的待推荐评分;
S4:基于兴趣评分和待推荐评分,生成评分差值,将评分差值与预设的评分差阈值比较,基于比较结果,标记出目标评分;
S5:基于目标评分,从待推荐内容中匹配到目标推荐内容,并基于排列优先级对目标推荐内容进行排列。
进一步的,综合标签包括类型标签、内容标签和行为标签。
进一步的,构建准则为:一个子区域内至多包含一个第一语义或一个第二语义;
用户画像的构建方法包括:
建立个空白的画像单元,将画像单元划分为三个独立的子区域,分别记为第一子区域、第二子区域和第三子区域;
通过自然语言处理技术识别类型标签和内容标签的语义,分别获得个第一语义和/>个第二语义;
基于构建准则,将一个第一语义和一个第二语义分别填充到第一子区域和第二子区域中;
将与第一语义和第二语义对应的行为标签填充到第三子区域中,获得个填充后的画像单元;
将个填充后的画像单元排列,并在/>个画像单元***建立环形且封闭的轮廓,获得用户画像。
进一步的,兴趣评分的计算方法包括:
通过自然语义识别技术识别个画像单元中第三子区域内的行为标签,获得观看时长、评论字数、转发次数和点击次数;
分别统计观看时长、评论字数、转发次数和点击次数的数量,获得个观看时长值、个评论字数值、/>个转发次数值和/>个点击次数值;
将个观看时长值、/>个评论字数值、/>个转发次数值和/>个点击次数值赋予不同的权重因子后,生成/>个单元评分;
单元评分的表达式为:
;
式中,为第/>个单元评分,/>为第/>个观看时长值,/>为第/>个评论字数值,/>为第/>个转发次数值,/>为第/>个点击次数值,/>、/>、/>、/>为权重因子;
将个单元评分由大到小降序排列,将位于第一名的单元评分标记为兴趣评分。
进一步的,待推荐标签包括待推荐类型标签、待推荐内容标签和待推荐行为标签;
待推荐内容的生成方法包括:
查询数据库中个内容文件的格式属性和内容属性,分别获得/>个待推荐类型标签和/>个待推荐内容标签;
分别标记与个待推荐类型标签和/>个待推荐内容标签对应的观看时长、评论字数、转发次数和点击次数,获得/>个待推荐行为标签;
将个待推荐类型标签、/>个待推荐内容标签和/>个待推荐行为标签逐一对应组合,获得/>个待推荐内容。
进一步的,待推荐评分的计算方法包括:
分别统计个待推荐内容中的观看时长、评论字数、转发次数和点击次数的数量,获得/>个待观看时长值、/>个待评论字数值、/>个待转发次数值和/>个待点击次数值;
将个待观看时长值、/>个待评论字数值、/>个待转发次数值和/>个待点击次数值赋予不同的权重因子后,生成/>个待推荐评分;
待推荐评分的表达式为:
;
式中,为第/>个待推荐评分,/>为第/>个待观看时长值,/>为第个待评论字数值,/>为第/>个待转发次数值,/>为第/>个待点击次数值。
进一步的,评分差值的生成方法包括:
将个待推荐评分逐一与兴趣评分作差比较,获得/>个评分差值;
评分差值的表达式为:
;
式中,为第/>个评分差值,/>为兴趣评分;
目标评分的标记方法包括:
将个评分差值/>分别与预设的评分差阈值/>比较;
当大于等于/>时,第/>个评分差值被标记为目标评分;
当小于/>时,第/>个评分差值不被标记为目标评分。
进一步的,目标推荐内容的匹配方法包括:
当目标评分唯一时,将目标评分对应的待推荐内容标记为目标推荐内容;
当目标评分不唯一时,将将个目标评分对应的/>个待推荐内容标记为/>个目标推荐内容。
进一步的,排列优先级为:观看时长值的优先级第一,评论字数值的优先级第二,点击次数值的优先级第三,转发次数值的优先级第四。
进一步的,对目标推荐内容进行排列的方法包括:
依次标记个目标推荐内容中的观看时长值、评论字数值、点击次数值和转发次数值;
当个观看时长值的大小不一致时,将/>个观看时长值由大到小降序排列;
将降序排列后的个观看时长值依次升序编号,并按照编号对/>个目标推荐内容依次排列;
当个观看时长值的大小一致时,将/>个评论字数值由大到小降序排列;
将降序排列后的个评论字数值依次升序编号,并按照编号对/>个目标推荐内容依次排列;
当个观看时长值和/>个评论字数值的大小一致时,将/>个点击次数值由大到小降序排列;
将降序排列后的个点击次数值依次升序编号,并按照编号对/>个目标推荐内容依次排列;
当个观看时长值、/>个评论字数值和/>个点击次数值的大小一致时,则对/>个目标推荐内容随机排列。
本发明基于大数据的用户画像标签快速匹配方法的技术效果和优点:
本发明通过从数据库中筛选出用户的历史推荐内容,基于历史推荐内容,获取综合标签,基于构建准则,以综合标签为基础,构建用户画像,并计算用户画像的兴趣评分,标记数据库中的待推荐标签,基于待推荐标签生成待推荐内容,并计算待推荐内容的待推荐评分,基于兴趣评分和待推荐评分,生成评分差值,将评分差值与预设的评分差阈值比较,基于比较结果,标记出目标评分,基于目标评分,从待推荐内容中匹配到目标推荐内容,并基于排列优先级对目标推荐内容进行排列;相对于现有技术,能够基于综合标签,构建出准确的用户画像,计算出用户画像的兴趣评分,同时将数据库中的待推荐内容的待推荐评分与兴趣评分比较,快速且准确的匹配到满足用户画像兴趣度的目标推荐内容,并且在排列优先级的限制下,对目标推荐内容进行有序排列,从而确保目标推荐内容能够有序、整齐且准确的推荐给用户,实现用户画像标签快速、准确的匹配效果,进而可以向用户准确的推荐感兴趣的内容。
附图说明
图1为本发明实施例1提供的基于大数据的用户画像标签快速匹配方法的流程示意图;
图2为本发明实施例2提供的基于大数据的用户画像标签快速匹配***的示意图;
图3为本发明实施例3提供的一种电子设备的结构示意图的示意图;
图4为本发明实施例4提供的一种计算机可读存储介质的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:请参阅图1所示,本实施例所述基于大数据的用户画像标签快速匹配方法,应用于数据服务器,包括:
S1:从数据库中筛选出用户的历史推荐内容,基于历史推荐内容,获取综合标签;
历史推荐内容是指过往历史时间段内推荐给用户且被用户观看到的所有内容的集合,在筛选历史推荐内容时,需要确保内容是被推荐且被用户观看的,即可去除掉一些未被观看的内容,使得每一个历史推荐内容都能够包含所需的综合标签;
综合标签是指用户在观看历史推荐内容时所产生的能够表示用户对内容兴趣度高低、内容所属类别和操作信息等多方面的综合信息,通过获取综合标签,可以获得准确表示用户全面信息的标签,从而方便后续对标签的匹配操作;
综合标签包括类型标签、内容标签和行为标签;
类型标签是指历史推荐内容中的信息被用户观看了解到的表达形式,同一个推荐内容中的信息通过不同类型的表达形式被用户观看了解时,会对用户产生不同的作用,从而生成对应的标签;类型标签通过查阅历史推荐内容对应文件的属性格式获取;
类型标签包括但不限于视频和图文,示例性的,当类型标签为视频时,历史推荐内容对应文件的属性格式为MP4、AVI、FLV、MOV等,当类型标签为图文时,历史推荐内容对应文件的属性格式为BMP、JPG、PNG、TIF、GIF等;
内容标签是指历史推荐内容中的信息所表达指代的含义,每一个历史推荐内容的内容标签可能唯一,也可能不唯一,且不同的内容标签所表达的含义也不同;
内容标签包括但不限于美食、旅游和汽车,示例性的,当内容标签为美食时,历史推荐内容中的文件信息为火锅、料理、烧烤和海鲜等,当内容标签为美旅游时,历史推荐内容中的文件信息为海边风景区、山区风景区和古城风景区等,当内容标签为汽车时,历史推荐内容中的文件信息为燃油车、电车、新车和二手车等;
行为标签是指用户在观看了解历史推荐内容时所进行的操作行为数据,每一个历史推荐内容对应的行为标签均不一致,从而反映出用户对于每一个历史推荐内容的兴趣度,行为标签包括但不限于观看时长、评论字数和转发次数,观看时长、评论字数和转发次数等行为数据会整体出现在一个历史推荐内容中,使得行为标签为一个整体,示例性的,历史推荐内容的行为标签为观看时长30秒、评论字数15字和转发次数3次等;
S2:基于构建准则,以综合标签为基础,构建用户画像,并计算用户画像的兴趣评分;
当获取到综合标签后,需要基于综合标签,构建用户画像,使得用户画像能够准确、真实且全面的反映用户感兴趣的内容,从而作为后续标签匹配的对比基础,而在构建用户画像时,需要依靠特定的构建准则,以确保综合标签能够构建出符合要求的用户画像;
构建准则为:一个子区域内至多包含一个第一语义或一个第二语义;
用户画像的构建方法包括:
建立个空白的画像单元,将画像单元划分为三个独立的子区域,分别记为第一子区域、第二子区域和第三子区域;空白的画像单元是指当前已用容量为零的画像单元,而一个画像单元是对应用户在某一个类型标签、内容标签和行为标签的子集合,使得一个画像单元能够包含一个类型标签,一个内容标签和一个行为标签,从而可以用户画像分割为若干个独立的子集合,实现了化整为零的效果,便于用户画像的快速、准确构建;
通过自然语言处理技术识别类型标签和内容标签的语义,分别获得个第一语义和/>个第二语义;第一语义是指类型标签中所指代的内容信息,包括但不限于视频和图文;第二语义是指内容标签中所指代的内容信息,包括但不限于美食、旅游和汽车;
基于构建准则,将一个第一语义和一个第二语义分别填充到第一子区域和第二子区域中;
将与第一语义和第二语义对应的行为标签填充到第三子区域中,获得个填充后的画像单元;
将个填充后的画像单元排列,并在/>个画像单元***建立环形且封闭的轮廓,获得用户画像;通过环形且封闭的轮廓可以将所有的画像单元进行集中包裹,使得所有的画像单元能够在一个封闭的区域内整合,从而汇总成一个完整的用户画像,避免出现画像单元丢失或遗漏的现象,提高了用户画像的真实性和全面性;
兴趣评分是指用户对用户画像中兴趣度最高的画像单元的兴趣度的数值表示,当获取到兴趣评分时,说明用户对兴趣评分对应的画像单元所指代的内容兴趣度最高;
兴趣评分的计算方法包括:
通过自然语义识别技术识别个画像单元中第三子区域内的行为标签,获得观看时长、评论字数、转发次数和点击次数;
分别统计观看时长、评论字数、转发次数和点击次数的数量,获得个观看时长值、个评论字数值、/>个转发次数值和/>个点击次数值;统计观看时长、评论字数、转发次数和点击次数的数量能够直观且准确的表示用户对于特定内容的兴趣度高低,从而作为兴趣评分的数据基础;
将个观看时长值、/>个评论字数值、/>个转发次数值和/>个点击次数值赋予不同的权重因子后,生成/>个单元评分;单元评分是指能够对用户画像中每一个画像单元所指代内容的兴趣度高低的数值表示,可以对每一个画像单元的兴趣度高低进行表示;
单元评分的表达式为:
;
式中,为第/>个单元评分,/>为第/>个观看时长值,/>为第/>个评论字数值,/>为第/>个转发次数值,/>为第/>个点击次数值,/>、/>、/>、/>为权重因子;
其中,示例性的,/>为0.32,/>为0.25,/>为0.26,为0.17;需要说明的是,权重因子的大小是为了将各个数据进行量化得到的一个具体的数值,便于后续比较,关于权重因子的大小,取决于观看时长值、评论字数值、转发次数值和点击次数值的多少及本领域技术人员对每一组观看时长值、评论字数值、转发次数值和点击次数值初步设定对应的权重因子;
将个单元评分由大到小降序排列,将位于第一名的单元评分标记为兴趣评分;
S3:标记数据库中的待推荐标签,基于待推荐标签生成待推荐内容,并计算待推荐内容的待推荐评分;
待推荐标签是指数据库中待推荐内容文件的标签属性,用来对每一个待推荐文件进行专属的表示;
待推荐标签包括待推荐类型标签、待推荐内容标签和待推荐行为标签;
待推荐内容是指数据库内由待推荐类型标签、待推荐内容标签和待推荐行为标签生成的准备向用户进行推荐的内容;
待推荐内容的生成方法包括:
查询数据库中个内容文件的格式属性和内容属性,分别获得/>个待推荐类型标签和/>个待推荐内容标签;
分别标记与个待推荐类型标签和/>个待推荐内容标签对应的观看时长、评论字数、转发次数和点击次数,获得/>个待推荐行为标签;
将个待推荐类型标签、/>个待推荐内容标签和/>个待推荐行为标签逐一对应组合,获得/>个待推荐内容;
待推荐评分是指用户对待推荐内容中兴趣度大小的数值体现,每一个待推荐内容均对应一个特定的待推荐评分,从而对待推荐内容的兴趣度高低进行数值表示;
待推荐评分的计算方法包括:
分别统计个待推荐内容中的观看时长、评论字数、转发次数和点击次数的数量,获得/>个待观看时长值、/>个待评论字数值、/>个待转发次数值和/>个待点击次数值;
将个待观看时长值、/>个待评论字数值、/>个待转发次数值和/>个待点击次数值赋予不同的权重因子后,生成/>个待推荐评分;
待推荐评分的表达式为:
;
式中,为第/>个待推荐评分,/>为第/>个待观看时长值,/>为第个待评论字数值,/>为第/>个待转发次数值,/>为第/>个待点击次数值。
S4:基于兴趣评分和待推荐评分,生成评分差值,将评分差值与预设的评分差阈值比较,基于比较结果,标记出目标评分;
评分差值是指兴趣评分与待推荐评分之间的差距大小的数值表示,当评分差值越大时,说明兴趣评分与待推荐评分之间的差距越大,则用户对待推荐内容的兴趣度高低与用户画像的兴趣度高低越不匹配,该则用户对该待推荐内容的兴趣度越低;
评分差值的生成方法包括:
将个待推荐评分逐一与兴趣评分作差比较,获得/>个评分差值;
评分差值的表达式为:
;
式中,为第/>个评分差值,/>为兴趣评分;
目标评分是指评分差值达到预定范围内的待推荐评分对应的兴趣评分,使得用户对于目标评分对应的目标推荐内容的兴趣度满足预期,从而能够从待推荐内容中匹配到与用户画像相符合的推荐内容,进而推荐给用户;
目标评分的标记方法包括:
将个评分差值/>分别与预设的评分差阈值/>比较;预设的评分差阈值是能够将评分差值的大小进行区分的数值依据,从而将评分差值划分为满足用户兴趣度预期范围和不满足用户兴趣度预期范围;预设的评分差阈值通过采集历史大量的满足用户兴趣度预期范围和不满足用户兴趣度预期范围对应的目标评分后,求其平均值获得的;
当大于等于/>时,说明第/>个评分差值大于等于预设的评分差阈值,此时第/>个评分差值对应的待推荐内容的兴趣度达到了用户预期范围,则第/>个评分差值被标记为目标评分;
当小于/>时,说明第/>个评分差值小于预设的评分差阈值,此时第/>个评分差值对应的待推荐内容的兴趣度没有达到用户预期范围,则第/>个评分差值不被标记为目标评分。
S5:基于目标评分,从待推荐内容中匹配到目标推荐内容,并基于排列优先级对目标推荐内容进行排列;
目标推荐内容是指目标评分对应的待推荐内容,使得目标推荐内容能够满足用户的兴趣预期,从而实现用户画像标签的快速匹配效果;
目标推荐内容的匹配方法包括:
当目标评分唯一时,说明此时目标评分对应的待推荐内容的数量是唯一的,将目标评分对应的待推荐内容标记为目标推荐内容;
当目标评分不唯一时,说明此时目标评分对应的待推荐内容的数量不是唯一对应的,至少存在两个,此时需要对个目标评分分别与对应的/>个待推荐行为标签进行标记,并从待推荐内容中匹配与标记的/>个目标评分对应的/>个待推荐行为标签;
将个目标评分对应的/>个待推荐内容标记为/>个目标推荐内容;
当匹配到目标推荐内容后,需要将目标推荐内容按照一定的顺序推荐给用户,使得用户能够有序且快速的接收到目标推荐内容并进行观看、操作,为了确保多个目标推荐内容在推荐时保持有序、整齐,需要对目标推荐内容设置排列优先级;
排列优先级是用于对目标评分对应的待推荐内容中观看时长值、评论字数值、转发次数值和点击次数值进行级别高低区分的排列规则,从而确保不同的待推荐内容可以有序排列;
由于用户对于待推荐内容兴趣度高低会通过观看时长值、评论字数值、转发次数值和点击次数值的数值进行体现,所以待推荐行为标签作为排列优先级的基础,当用户对待推荐内容的兴趣度越高时,则用户观看时长越长,使得观看时长值的排列优先级最高,当观看时长越长时,用户对待推荐内容进行评论的字数也会越多,使得评论字数值的排列优先级第二,当评论字数越多时,则用户对待推荐内容的点击操作也会越多,则点击次数值的排列优先级第三,余下的转发次数值的排列优先级第四;
综上可知,排列优先级为:观看时长值的优先级第一,评论字数值的优先级第二,点击次数值的优先级第三,转发次数值的优先级第四;
对目标推荐内容进行排列的方法包括:
依次标记个目标推荐内容中的观看时长值、评论字数值、点击次数值和转发次数值;
当个观看时长值的大小不一致时,逐一比较/>个观看时长值的大小,将/>个观看时长值由大到小降序排列;
将降序排列后的个观看时长值依次升序编号,并按照编号对/>个目标推荐内容依次排列;
当个观看时长值的大小一致时,逐一比较/>个评论字数值的大小,将/>个评论字数值由大到小降序排列;
将降序排列后的个评论字数值依次升序编号,并按照编号对/>个目标推荐内容依次排列;
当个观看时长值和/>个评论字数值的大小一致时,逐一比较/>个点击次数值的大小,将/>个点击次数值由大到小降序排列;
将降序排列后的个点击次数值依次升序编号,并按照编号对/>个目标推荐内容依次排列;
当个观看时长值、/>个评论字数值和/>个点击次数值的大小一致时,说明此时目标评分对应的观看时长值、评论字数值、转发次数值和点击次数值大小均一致,则对/>个目标推荐内容随机排列;
本实施例中,通过从数据库中筛选出用户的历史推荐内容,基于历史推荐内容,获取综合标签,基于构建准则,以综合标签为基础,构建用户画像,并计算用户画像的兴趣评分,标记数据库中的待推荐标签,基于待推荐标签生成待推荐内容,并计算待推荐内容的待推荐评分,基于兴趣评分和待推荐评分,生成评分差值,将评分差值与预设的评分差阈值比较,基于比较结果,标记出目标评分,基于目标评分,从待推荐内容中匹配到目标推荐内容,并基于排列优先级对目标推荐内容进行排列;相对于现有技术,能够基于综合标签,构建出准确的用户画像,计算出用户画像的兴趣评分,同时将数据库中的待推荐内容的待推荐评分与兴趣评分比较,快速且准确的匹配到满足用户画像兴趣度的目标推荐内容,并且在排列优先级的限制下,对目标推荐内容进行有序排列,从而确保目标推荐内容能够有序、整齐且准确的推荐给用户,实现用户画像标签快速、准确的匹配效果,进而可以向用户准确的推荐感兴趣的内容。
实施例2:请参阅图2所示,本实施例未详细叙述部分见实施例1描述内容,提供基于大数据的用户画像标签快速匹配***,应用于数据服务器,用于实现基于大数据的用户画像标签快速匹配方法,包括综合标签获取模块、兴趣评分计算模块、待推荐评分计算模块、目标评分标记模块和目标推荐内容排列模块,其中,各个模块之间通过有线或无线网络方式连接:
综合标签获取模块,用于从数据库中筛选出用户的历史推荐内容,基于历史推荐内容,获取综合标签;
兴趣评分计算模块,用于基于构建准则,以综合标签为基础,构建用户画像,并计算用户画像的兴趣评分;
待推荐评分计算模块,用于标记数据库中的待推荐标签,基于待推荐标签生成待推荐内容,并计算待推荐内容的待推荐评分;
目标评分标记模块,用于基于兴趣评分和待推荐评分,生成评分差值,将评分差值与预设的评分差阈值比较,基于比较结果,标记目标评分;
目标推荐内容排列模块,用于基于目标评分,从待推荐内容中匹配到目标推荐内容,并基于排列优先级对目标推荐内容进行排列。
实施例3:请参阅图3所示,本实施例公开提供了一种电子设备,包括处理器和存储器;
其中,所述存储器中存储有可供处理器调用的计算机程序;
所述处理器通过调用所述存储器中存储的计算机程序,执行实现所述的基于大数据的用户画像标签快速匹配方法。
由于本实施例所介绍的电子设备为实施本申请实施例1中基于大数据的用户画像标签快速匹配方法所采用的电子设备,故而基于本申请实施例中所介绍的基于大数据的用户画像标签快速匹配方法,本领域所属技术人员能够了解本实施例的电子设备的具体实施方式以及其各种变化形式,所以在此对于该电子设备如何实现本申请实施例中的方法不再详细介绍。只要本领域所属技术人员实施本申请实施例中基于大数据的用户画像标签快速匹配方法所采用的电子设备,都属于本申请所欲保护的范围。
实施例4:请参阅图4所示,本实施例公开提供了一种计算机可读存储介质,其上存储有可擦写的计算机程序;
当所述计算机程序被运行时,执行实现所述的基于大数据的用户画像标签快速匹配方法。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.基于大数据的用户画像标签快速匹配方法,应用于数据服务器,其特征在于,包括:
S1:从数据库中筛选出用户的历史推荐内容,基于历史推荐内容,获取综合标签;
S2:基于构建准则,以综合标签为基础,构建用户画像,并计算用户画像的兴趣评分;
S3:标记数据库中的待推荐标签,基于待推荐标签生成待推荐内容,并计算待推荐内容的待推荐评分;
S4:基于兴趣评分和待推荐评分,生成评分差值,将评分差值与预设的评分差阈值比较,基于比较结果,标记出目标评分;
S5:基于目标评分,从待推荐内容中匹配到目标推荐内容,并基于排列优先级对目标推荐内容进行排列。
2.根据权利要求1所述的基于大数据的用户画像标签快速匹配方法,其特征在于,所述综合标签包括类型标签、内容标签和行为标签。
3.根据权利要求2所述的基于大数据的用户画像标签快速匹配方法,其特征在于,所述构建准则为:一个子区域内至多包含一个第一语义或一个第二语义;
用户画像的构建方法包括:
建立个空白的画像单元,将画像单元划分为三个独立的子区域,分别记为第一子区域、第二子区域和第三子区域;
通过自然语言处理技术识别类型标签和内容标签的语义,分别获得个第一语义和/>个第二语义;
基于构建准则,将一个第一语义和一个第二语义分别填充到第一子区域和第二子区域中;
将与第一语义和第二语义对应的行为标签填充到第三子区域中,获得个填充后的画像单元;
将个填充后的画像单元排列,并在/>个画像单元***建立环形且封闭的轮廓,获得用户画像。
4.根据权利要求3所述的基于大数据的用户画像标签快速匹配方法,其特征在于,所述兴趣评分的计算方法包括:
通过自然语义识别技术识别个画像单元中第三子区域内的行为标签,获得观看时长、评论字数、转发次数和点击次数;
分别统计观看时长、评论字数、转发次数和点击次数的数量,获得个观看时长值、/>个评论字数值、/>个转发次数值和/>个点击次数值;
将个观看时长值、/>个评论字数值、/>个转发次数值和/>个点击次数值赋予不同的权重因子后,生成/>个单元评分;
单元评分的表达式为:
;
式中,为第/>个单元评分,/>为第/>个观看时长值,/>为第/>个评论字数值,为第/>个转发次数值,/>为第/>个点击次数值,/>、/>、/>、/>为权重因子;
将个单元评分由大到小降序排列,将位于第一名的单元评分标记为兴趣评分。
5.根据权利要求4所述的基于大数据的用户画像标签快速匹配方法,其特征在于,所述待推荐标签包括待推荐类型标签、待推荐内容标签和待推荐行为标签;
待推荐内容的生成方法包括:
查询数据库中个内容文件的格式属性和内容属性,分别获得/>个待推荐类型标签和/>个待推荐内容标签;
分别标记与个待推荐类型标签和/>个待推荐内容标签对应的观看时长、评论字数、转发次数和点击次数,获得/>个待推荐行为标签;
将个待推荐类型标签、/>个待推荐内容标签和/>个待推荐行为标签逐一对应组合,获得/>个待推荐内容。
6.根据权利要求5所述的基于大数据的用户画像标签快速匹配方法,其特征在于,所述待推荐评分的计算方法包括:
分别统计个待推荐内容中的观看时长、评论字数、转发次数和点击次数的数量,获得个待观看时长值、/>个待评论字数值、/>个待转发次数值和/>个待点击次数值;
将个待观看时长值、/>个待评论字数值、/>个待转发次数值和/>个待点击次数值赋予不同的权重因子后,生成/>个待推荐评分;
待推荐评分的表达式为:
;
式中,为第/>个待推荐评分,/>为第/>个待观看时长值,/>为第/>个待评论字数值,/>为第/>个待转发次数值,/>为第/>个待点击次数值。
7.根据权利要求6所述的基于大数据的用户画像标签快速匹配方法,其特征在于,所述评分差值的生成方法包括:
将个待推荐评分逐一与兴趣评分作差比较,获得/>个评分差值;
评分差值的表达式为:
;
式中,为第/>个评分差值,/>为兴趣评分;
目标评分的标记方法包括:
将个评分差值/>分别与预设的评分差阈值/>比较;
当大于等于/>时,第/>个评分差值被标记为目标评分;
当小于/>时,第/>个评分差值不被标记为目标评分。
8.根据权利要求7所述的基于大数据的用户画像标签快速匹配方法,其特征在于,所述目标推荐内容的匹配方法包括:
当目标评分唯一时,将目标评分对应的待推荐内容标记为目标推荐内容;
当目标评分不唯一时,将个目标评分对应的/>个待推荐内容标记为/>个目标推荐内容。
9.根据权利要求8所述的基于大数据的用户画像标签快速匹配方法,其特征在于,所述排列优先级为:观看时长值的优先级第一,评论字数值的优先级第二,点击次数值的优先级第三,转发次数值的优先级第四。
10.根据权利要求9所述的基于大数据的用户画像标签快速匹配方法,其特征在于,所述对目标推荐内容进行排列的方法包括:
依次标记个目标推荐内容中的观看时长值、评论字数值、点击次数值和转发次数值;
当个观看时长值的大小不一致时,将/>个观看时长值由大到小降序排列;
将降序排列后的个观看时长值依次升序编号,并按照编号对/>个目标推荐内容依次排列;
当个观看时长值的大小一致时,将/>个评论字数值由大到小降序排列;
将降序排列后的个评论字数值依次升序编号,并按照编号对/>个目标推荐内容依次排列;
当个观看时长值和/>个评论字数值的大小一致时,将/>个点击次数值由大到小降序排列;
将降序排列后的个点击次数值依次升序编号,并按照编号对/>个目标推荐内容依次排列;
当个观看时长值、/>个评论字数值和/>个点击次数值的大小一致时,则对/>个目标推荐内容随机排列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410417349.9A CN118012920A (zh) | 2024-04-09 | 2024-04-09 | 基于大数据的用户画像标签快速匹配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410417349.9A CN118012920A (zh) | 2024-04-09 | 2024-04-09 | 基于大数据的用户画像标签快速匹配方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118012920A true CN118012920A (zh) | 2024-05-10 |
Family
ID=90956710
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410417349.9A Pending CN118012920A (zh) | 2024-04-09 | 2024-04-09 | 基于大数据的用户画像标签快速匹配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118012920A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105824923A (zh) * | 2016-03-17 | 2016-08-03 | 海信集团有限公司 | 影视资源推荐方法及装置 |
CN106651533A (zh) * | 2016-12-29 | 2017-05-10 | 合肥华凌股份有限公司 | 一种基于用户行为的个性化商品推荐方法及装置 |
WO2018032790A1 (zh) * | 2016-08-16 | 2018-02-22 | 武汉斗鱼网络科技有限公司 | 基于加权k近邻评分的直播间推荐方法及*** |
CN109543111A (zh) * | 2018-11-28 | 2019-03-29 | 广州虎牙信息科技有限公司 | 推荐信息筛选方法、装置、存储介质及服务器 |
CN109933720A (zh) * | 2019-01-29 | 2019-06-25 | 汕头大学 | 一种基于用户兴趣自适应演化的动态推荐方法 |
CN110334202A (zh) * | 2019-03-28 | 2019-10-15 | 平安科技(深圳)有限公司 | 基于新闻应用软件的用户兴趣标签构建方法及相关设备 |
CN110674410A (zh) * | 2019-10-08 | 2020-01-10 | 北京物灵科技有限公司 | 用户画像构建、内容推荐方法、装置及设备 |
-
2024
- 2024-04-09 CN CN202410417349.9A patent/CN118012920A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105824923A (zh) * | 2016-03-17 | 2016-08-03 | 海信集团有限公司 | 影视资源推荐方法及装置 |
WO2018032790A1 (zh) * | 2016-08-16 | 2018-02-22 | 武汉斗鱼网络科技有限公司 | 基于加权k近邻评分的直播间推荐方法及*** |
CN106651533A (zh) * | 2016-12-29 | 2017-05-10 | 合肥华凌股份有限公司 | 一种基于用户行为的个性化商品推荐方法及装置 |
CN109543111A (zh) * | 2018-11-28 | 2019-03-29 | 广州虎牙信息科技有限公司 | 推荐信息筛选方法、装置、存储介质及服务器 |
CN109933720A (zh) * | 2019-01-29 | 2019-06-25 | 汕头大学 | 一种基于用户兴趣自适应演化的动态推荐方法 |
CN110334202A (zh) * | 2019-03-28 | 2019-10-15 | 平安科技(深圳)有限公司 | 基于新闻应用软件的用户兴趣标签构建方法及相关设备 |
CN110674410A (zh) * | 2019-10-08 | 2020-01-10 | 北京物灵科技有限公司 | 用户画像构建、内容推荐方法、装置及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10223454B2 (en) | Image directed search | |
US9959467B2 (en) | Image processing client | |
US9830522B2 (en) | Image processing including object selection | |
US9058611B2 (en) | System and method for advertising using image search and classification | |
US9213733B2 (en) | Computerized internet search system and method | |
US9575995B2 (en) | Image processing methods | |
US10825048B2 (en) | Image processing methods | |
US20220207274A1 (en) | Client Based Image Analysis | |
US20160342624A1 (en) | Image Tagging System | |
CA2885880C (en) | Image processing including object selection | |
CA2885858A1 (en) | Image tagging system | |
CA2885879C (en) | Image processing methods | |
US9639867B2 (en) | Image processing system including image priority | |
CA2885874A1 (en) | Image processing system including image priority | |
US9569465B2 (en) | Image processing | |
US20170315676A1 (en) | Dynamic content insertion | |
US8281245B1 (en) | System and method of preparing presentations | |
CN118012920A (zh) | 基于大数据的用户画像标签快速匹配方法 | |
KR102429104B1 (ko) | 인공지능에 기반한 상품 카탈로그 자동 분류 시스템 | |
US20150220569A1 (en) | Priority Based Image Processing Methods | |
CN113822566A (zh) | 业务考核处理方法、装置、计算机设备和存储介质 | |
CN113254775A (zh) | 一种基于客户浏览行为序列的***产品推荐方法 | |
CA2885835A1 (en) | Image processing server | |
US11282104B2 (en) | Provision device, provision method and non-transitory computer readable storage medium | |
CN117651165B (zh) | 基于客户数据的视频推荐方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |