CN109325179B - 一种内容推广的方法及装置 - Google Patents

一种内容推广的方法及装置 Download PDF

Info

Publication number
CN109325179B
CN109325179B CN201811081806.2A CN201811081806A CN109325179B CN 109325179 B CN109325179 B CN 109325179B CN 201811081806 A CN201811081806 A CN 201811081806A CN 109325179 B CN109325179 B CN 109325179B
Authority
CN
China
Prior art keywords
user
content
weight
tag
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811081806.2A
Other languages
English (en)
Other versions
CN109325179A (zh
Inventor
王中伟
孙永良
王玮
刘邦
别贤得
刘墩建
肖尚青
王栋梁
陈玉静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hisense TransTech Co Ltd
Original Assignee
Hisense TransTech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hisense TransTech Co Ltd filed Critical Hisense TransTech Co Ltd
Priority to CN201811081806.2A priority Critical patent/CN109325179B/zh
Publication of CN109325179A publication Critical patent/CN109325179A/zh
Application granted granted Critical
Publication of CN109325179B publication Critical patent/CN109325179B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种内容推广的方法及装置,该方法包括:获取推广内容,提取推广内容的关键词,根据推广内容的关键词和用户画像中的用户标签,确定待推广的用户,其中,用户画像包括用户标签和用户标签对应的权重,用户标签对应的权重是根据用户浏览网站的用户标识权重、时间权重、内容权重和行为权重确定的,将推广内容推送给待推广的用户。该方案根据用户浏览网站动态行为分析,结合用户之间的相似度,获取推广内容精准目标用户,提高推广的准确率。

Description

一种内容推广的方法及装置
技术领域
本发明实施例涉及数据挖掘技术领域,尤其涉及一种内容推广的方法及装置。
背景技术
近年来,互联网上各式各样的应用和服务出现了井喷式的增长,为了能让目标用户快速知晓和使用这些服务,应用的开发者和服务提供者通过各种途径和平台来推广自己的应用和服务。而如何使开发者以最小的推广成本,获取尽可能精准的目标用户,成为各大互联网推广平台着力解决的问题。
当前的互联网推广平台一般采用定价或者竞价的模式,要推广的应用出价够高就可以占据有利的广告位,有比较高的曝光率,或者按照特定地区来推广地域性的内容,推广的针对性不够。
发明内容
本发明实施例提供一种内容推广的方法及装置,用以通过获取精准目标用户,提高推广的准确率。
本发明实施例提供的一种内容推广的方法,包括:
获取推广内容,提取所述推广内容的关键词;
根据所述推广内容的关键词和用户画像中的用户标签,确定待推广的用户;所述用户画像包括用户标签和所述用户标签对应的权重,所述用户标签对应的权重是根据用户浏览网站的用户标识权重、时间权重、内容权重和行为权重确定的;
将所述推广内容推送给所述待推广的用户。
上述实施例中,根据用户浏览网站的用户标识权重、时间权重、内容权重和行为权重确定用户标签对应的权重,根据推广内容的关键词和用户画像中的用户标签,确定待推广的用户,即根据用户的动态行为分析,结合时间维度信息形成用户画像,对推广内容进行精准推送。
可选的,所述根据用户浏览网站的用户标识权重、时间权重、内容权重和行为权重确定用户标签对应的权重,包括:
获取所述用户浏览网站的浏览内容、用户标识和浏览时间;
根据所述浏览内容,确定所述用户标签以及所述用户标签对应的内容权重;
根据所述用户标识以及所述用户标识对应的浏览时间,确定所述用户标签对应的用户标识权重;
根据所述用户标签对应的浏览时间,确定所述用户标签对应的时间权重和行为权重;
根据所述用户标签对应的用户标识权重、时间权重、内容权重和行为权重确定所述用户标签对应的权重。
上述实施例中,获取用户浏览网站的浏览内容、用户标识和浏览时间,根据用户浏览网站的浏览内容、用户标识和浏览时间确定用户标签对应的用户标识权重、时间权重、内容权重和行为权重,进而确定用户标签对应的权重。
可选的,所述根据所述浏览内容,确定所述用户标签以及所述用户标签对应的内容权重,包括:
根据所述浏览内容,确定所述用户标签的关键词;
根据所述用户标签的关键词在所述浏览内容中出现的次数、所述浏览内容包含的浏览页面的页面个数、每个所述浏览页面的词汇总数以及包含所述用户标签的关键词的浏览页面的页面个数,确定所述用户标签的关键词对应的TF-IDF((Term Frequency-InverseDocument Frequency,词频-逆文本频率)指标;
将多个所述用户标签的关键词中最大的TF-IDF指标确定为所述用户标签对应的内容权重。
上述实施例中,确定用户标签的关键词,将用户标签的关键词中最大的TF-IDF指标确定为用户标签对应的内容权重。
可选的,所述根据所述用户标签对应的浏览时间,确定所述用户标签对应的时间权重和行为权重,包括:
将预设时段分为多个子时段,确定出每个子时段内的浏览时间;
根据所述用户在每个子时段内浏览所述用户标签的起始时刻和终止时刻、所述每个子时段的起始时刻和终止时刻以及所述每个子时段的衰减系数,确定所述用户标签对应的时间权重;
根据所述用户标签对应的时间权重、所述用户标签对应行为系数,确定所述用户标签对应的行为权重。
上述实施例中,提供确定用户标签对应的时间权重的实现方式,同时根据用户标签对应的时间权重、用户标签对应行为系数,确定用户标签对应的行为权重。将用户标签对应行为权重采用时间权重衡量。为后续确定用户标签对应的权重做准备。
可选的,所述根据所述推广内容的关键词和用户画像中的用户标签,确定待推广的用户,包括:
将所述推广内容的关键词与所述用户画像中的用户标签进行对比,确定所述推广内容和所述用户画像的匹配度;
将所述推广内容和所述用户画像的匹配度高于匹配阈值的用户确定为待推广的用户。
上述实施例中,将推广内容和用户画像的匹配度高于匹配阈值的用户确定为待推广的用户,也就是确定了与推广内容相匹配的用户。
可选的,在所述将所述推广内容推送给所述待推广的用户之后,还包括:
根据所述用户画像中的用户标签以及用户标签对应的权重,确定所述待推广的用户的用户画像与各用户的用户画像的相似度;
将所述推广内容推送给与所述待推广的用户的用户画像的相似度大于第一阈值的用户。
上述实施例中,确定与待推广的用户的用户画像的相似度大于第一阈值的用户,可以避免根据推广内容的关键词和用户画像中的用户标签,确定待推广的用户时,遗漏推广内容的目标用户。
可选的,在所述根据所述推广内容的关键词和用户画像中的用户标签,确定待推广的用户之前,还包括:
获取所述推广内容的初步推广人群类别,将所述推广内容推送给属于所述初步推广人群类别的用户。
上述实施例中,根据推广内容的初步推广人群类别,将推广内容推送给属于初步推广人群类别的用户,适用于推广冷启动阶段。
相应的,本发明实施例还提供了一种内容推广的装置,包括:
获取单元,用于获取推广内容,提取所述推广内容的关键词;
处理单元,用于根据所述推广内容的关键词和用户画像中的用户标签,确定待推广的用户;所述用户画像包括用户标签和所述用户标签对应的权重,所述用户标签对应的权重是根据用户浏览网站的用户标识权重、时间权重、内容权重和行为权重确定的;并将所述推广内容推送给所述待推广的用户。
可选的,所述处理单元具体用于:
获取所述用户浏览网站的浏览内容、用户标识和浏览时间;
根据所述浏览内容,确定所述用户标签以及所述用户标签对应的内容权重;
根据所述用户标识以及所述用户标识对应的浏览时间,确定所述用户标签对应的用户标识权重;
根据所述用户标签对应的浏览时间,确定所述用户标签对应的时间权重和行为权重;
根据所述用户标签对应的用户标识权重、时间权重、内容权重和行为权重确定所述用户标签对应的权重。
可选的,所述处理单元具体用于:
根据所述浏览内容,确定所述用户标签的关键词;
根据所述用户标签的关键词在所述浏览内容中出现的次数、所述浏览内容包含的浏览页面的页面个数、每个所述浏览页面的词汇总数以及包含所述用户标签的关键词的浏览页面的页面个数,确定所述用户标签的关键词对应的词频-逆文本频率TF-IDF指标;
将多个所述用户标签的关键词中最大的TF-IDF指标确定为所述用户标签对应的内容权重。
可选的,所述处理单元具体用于:
将预设时段分为多个子时段,确定出每个子时段内的浏览时间;
根据所述用户在每个子时段内浏览所述用户标签的起始时刻和终止时刻、所述每个子时段的起始时刻和终止时刻以及所述每个子时段的衰减系数,确定所述用户标签对应的时间权重;
根据所述用户标签对应的时间权重、所述用户标签对应行为系数,确定所述用户标签对应的行为权重。
可选的,所述处理单元具体用于:
将所述推广内容的关键词与所述用户画像中的用户标签进行对比,确定所述推广内容和所述用户画像的匹配度;
将所述推广内容和所述用户画像的匹配度高于匹配阈值的用户确定为待推广的用户。
可选的,所述处理单元还用于:
在所述将所述推广内容推送给所述待推广的用户之后,根据所述用户画像中的用户标签以及用户标签对应的权重,确定所述待推广的用户的用户画像与各用户的用户画像的相似度;
将所述推广内容推送给与所述待推广的用户的用户画像的相似度大于第一阈值的用户。
可选的,所述处理单元还用于:
在所述根据所述推广内容的关键词和用户画像中的用户标签,确定待推广的用户之前,获取所述推广内容的初步推广人群类别,将所述推广内容推送给属于所述初步推广人群类别的用户。
相应的,本发明实施例还提供了一种计算设备,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行上述内容推广的方法。
相应的,本发明实施例还提供了一种计算机可读非易失性存储介质,包括计算机可读指令,当计算机读取并执行所述计算机可读指令时,使得计算机执行上述内容推广的方法。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种***架构的示意图;
图2为本发明实施例提供的一种内容推广的方法的流程示意图;
图3为本发明实施例提供的一种确定用户标签对应的权重的流程示意图;
图4为本发明实施例提供的一种内容推广的装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
图1示例性的示出了本发明实施例提供内容推广的方法所适用的***架构,该***架构可以包括广告接入平台101、内容推广平台102、用户终端103。其中,广告接入平台101可以为推广内容的接入平台;内容推广平台102为用于推广内容的平台,其可以为互联网平台、APP等,内容推广平台102为面向用户对象类型广泛、支持第三方接入服务或者推广广告的综合服务平台;用户终端103可以为手机、平板电脑或其他可以向用户推广广告的终端。
基于上述描述,图2示例性的示出了本发明实施例提供的一种内容推广的方法的流程,该流程可以由内容推广的装置执行,该装置可以位于内容推广平台中,可以是该内容推广平台。如图2所示,该流程具体包括:
步骤201,获取推广内容,提取所述推广内容的关键词。
其中,推广内容为广告商需要进行推广的内容,可以为购物广告、实事新闻、娱乐新闻等。在获取到推广内容时,该推广内容中包含推广内容的关键词以及功能介绍,通过提取推广内容的关键词,为确定与推广内容相匹配的待推广用户做准备。例如,推广内容为购物广告中的护肤品,则可以提取到护肤品的关键词“补水、保湿、祛痘等”。
步骤202,根据所述推广内容的关键词和用户画像中的用户标签,确定待推广的用户。
其中,用户画像包括用户标签和用户标签对应的权重,用户标签对应的权重是根据用户浏览网站的用户标识权重、时间权重、内容权重和行为权重确定的。
通过获取用户浏览网站的实体静态数据和动态交互数据,来分析出用户类型和用户特征,进而确定与推广内容相匹配的用户。用于建立用户画像的数据包括自然数据、行为数据以及内容数据。自然数据表示包括用户性别、年龄等用户自身固有的属性,可以在用户注册等环节中向用户收集。行为数据描述用户所执行的行为,包括访问次数、访问频度、访问停留时间、操作活跃时间、信息输入、用点击链接、交互操作(如加关注、取消关注、打分、保存为书签、加入购物车、取出购物车、形成订单、取消订单、付款、退款等)。内容数据表示用户行为的对象,例如用户所加关注的微博ID(Identity,身份标识号)、用户打分的歌曲、用户保存为书签的网页上的内容、用户加入购物车或者形成订单的商品等。
作为一种实现方式,基于建立用户画像采集的数据,运用Spark任务处理与Storm流式处理相结合的方式,分析出用户随机互联网行为的用户标识、时间、内容、行为四大因素,可全面地描述用户的随机互联网行为。根据用户浏览网站的用户标识权重、时间权重、内容权重和行为权重确定用户标签对应的权重,具体可以如图3。
步骤301,获取用户浏览网站的浏览内容、用户标识和浏览时间。
此处,浏览网站包括多个浏览页面、浏览页面包含多个关键词,浏览页面中的关键词又可以组成用户标签。
步骤302,根据浏览内容,确定用户标签以及用户标签对应的内容权重。
具体的,根据浏览内容,确定用户标签的关键词。例如,用户浏览内容包括关键词“手机摄像头、手机显示芯片、手机内存卡”,则可以确定用户标签“手机”的关键词为“手机摄像头、手机显示芯片、手机内存卡”。
确定用户标签的关键词之后,根据用户标签的关键词在浏览内容中出现的次数、浏览内容包含的浏览页面的页面个数、每个浏览页面的词汇总数以及包含用户标签的关键词的浏览页面的页面个数,确定用户标签的关键词对应的TF-IDF指标,将多个用户标签的关键词中最大的TF-IDF指标确定为用户标签对应的内容权重。
优选的,用户标签对应的内容权重可以如公式(1)所示。
该公式(1)为:
Figure BDA0001802158640000081
其中,Ci(lj)为用户Ui的用户标签lj对应的内容权重,TF-IDF(lj)为用户标签的关键词对应的TF-IDF指标,TF-IDF(lj)可以如公式(2)所示。
该公式(2)为:
Figure BDA0001802158640000091
其中,count(w)为用户标签的关键词w在浏览内容中出现的次数,
Figure BDA0001802158640000092
为每个浏览页面的词汇总数,N为检测所用的页面总数,Nw为所有N个检测页面中含关键词w的页面数。
步骤303,根据用户标识以及用户标识对应的浏览时间,确定用户标签对应的用户标识权重。
此处,用户标识可以理解为互联网上区分用户的标识,用户标识可以为Cookie、IP(Internet Protocol,网络之间互连的协议)、Email、身份证等。其中,Cookie值可以解释为某些网站为了辨别用户身份、进行会话控制跟踪(session)而储存在用户本地终端上的数据(通常经过加密)。
不同用户标识的准确度不同,本实施例中,通过用户行为及注册信息等判断用户身份。用户标签对应的用户标识权重可以理解为该用户标签产生于同一个用户的可能性,假设用户总数量为n,构建用户为U1,U2,……,Un,用户标签lj产生于同一个用户Ui的可能性,可以如公式(3)所示。
该公式(3)为:
Figure BDA0001802158640000093
其中,Obji(lj)为用户Ui的用户标签lj对应的用户标识权重,lj为第j个用户标签,
Figure BDA0001802158640000094
为用户Ui的第m种标识的准确度,
Figure BDA0001802158640000095
为用户Ui的第m种标识的总浏览时间。
此外,浏览时长越长的用户,其用户标签的可用性更强。例如,用户A的浏览时长为10h,用户B的浏览时长为1h,则可以认为用户A的用户标签的可用性更强。
步骤304,根据用户标签对应的浏览时间,确定用户标签对应的时间权重和行为权重。
具体的,时间包含时间戳和时间间隔,时间戳用于标识事件发生、结束的时刻,时间间隔用于标识浏览时间。将预设时段分为多个子时段,确定出每个子时段内的浏览时间,根据用户在每个子时段内浏览用户标签的起始时刻和终止时刻、每个子时段的起始时刻和终止时刻以及每个子时段的衰减系数,确定用户标签对应的时间权重。
优选的,将预设时段分为S个子时段,T1,T2,…,Tk,…,TS,其中Tk为预设时段中的第k个子时段,每个子时段对应各自的衰减系数Ek。Ek可以如公式(4)所示。
该公式(4)为:
Figure BDA0001802158640000101
其中,λ为遗忘系数,λ的取值决定了信息随时间的衰减速度,λ越大则衰减速度越快,衰减速度同时也与划分时间段的数量相关。λ可根据经验设定为1≤λ≤4,也可以根据不同的用户标签类型,对λ赋予不同的数值。例如时效性较强的用户标签类型,其λ赋予较大,衰减速度较快。
用户标签对应的时间权重可以如公式(5)所示。
该公式(5)为:
Figure BDA0001802158640000102
其中,
Figure BDA0001802158640000103
为用户Ui在第k个子时段的用户标签lj对应的时间权重,
Figure BDA0001802158640000104
为用户在第k个子时段浏览用户标签lj的起始时刻,
Figure BDA0001802158640000105
为用户在第k个子时段浏览用户标签lj的终止时刻,
Figure BDA0001802158640000106
第k个子时段的起始时刻,
Figure BDA0001802158640000107
第k个子时段的终止时刻,Ek为第k个子时段的衰减系数。
用户的行为是用户对网站内容的操作,如浏览、收藏、评分、分享等,不同的用户行为对应的权重不同,对用户标签产生的行为权重也不同。具体的,可以根据用户标签对应的时间权重、用户标签对应行为系数,确定用户标签对应的行为权重。
当用户对网站内容的操作为浏览时,可以根据用户标签对应的浏览时间,确定用户标签对应的时间权重,也就相当于上述实施例中的确定用户标签对应的时间权重的实施方式。
当用户对网站内容的操作为收藏时,用户标签对应的收藏权重可以根据公式(6)确定。
该公式(6)为:
Figure BDA0001802158640000111
其中,
Figure BDA0001802158640000112
为用户Ui在第k个子时段的用户标签lj对应的收藏权重;
Figure BDA0001802158640000113
为判断函数,当
Figure BDA0001802158640000114
时,确定
Figure BDA0001802158640000115
Figure BDA0001802158640000116
时,确定
Figure BDA0001802158640000117
Figure BDA0001802158640000118
为用户Ui在第k个子时段的用户标签lj对应的时间权重;α为用户标签对应的收藏行为系数,α可根据经验设定为0.2≤α≤1。
当用户对网站内容的操作为评分时,用户标签对应的评分权重可以根据公式(7)确定。
该公式(7)为:
Figure BDA0001802158640000119
其中,
Figure BDA00018021586400001110
为用户Ui在第k个子时段的用户标签lj对应的评分权重;
Figure BDA00018021586400001111
Figure BDA00018021586400001112
的平均函数,
Figure BDA00018021586400001113
为用户Ui在第k个子时段的用户标签lj对应的时间权重;
Figure BDA00018021586400001114
Figure BDA00018021586400001115
的平均函数,
Figure BDA00018021586400001116
为用户Ui对用户标签lj的评分;β为用户标签对应的评分行为系数,β可根据经验设定为0.5≤β≤2。
当用户对网站内容的操作为分享时,用户标签对应的分享权重可以根据公式(8)确定。
该公式(8)为:
Figure BDA0001802158640000121
其中,
Figure BDA0001802158640000122
为用户Ui在第k个子时段的用户标签lj对应的分享权重;
Figure BDA0001802158640000123
Figure BDA0001802158640000124
的平均函数,
Figure BDA0001802158640000125
为用户Ui在第k个子时段的用户标签lj对应的时间权重;γ为用户标签对应的分享行为系数,γ可根据经验设定为0.2≤β≤3。
由上述实施例可知,用户标签对应的行为权重都可以由用户标签对应的时间权重
Figure BDA0001802158640000126
以及用户标签对应行为系数(收藏行为系数、评分行为系数、分享行为系数)确定。当然,也可以说,用户标签对应的行为权重都可以用用户标签对应的时间权重
Figure BDA0001802158640000127
衡量。
步骤305,根据用户标签对应的用户标识权重、时间权重、内容权重和行为权重确定用户标签对应的权重。
可以说,用户标签对应的权重可以由用户标签对应的用户标识权重、时间权重、内容权重和行为权重确定。作为一种实现方式,用户标签对应的权重可以如公式(9)所示。
该公式(9)为:
Figure BDA0001802158640000128
其中,
Figure BDA0001802158640000129
为用户Ui的用户标签lj对应的用户标签权重;Obji(lj)为用户Ui的用户标签lj对应的用户标识权重,Ci(lj)为用户Ui的用户标签lj对应的内容权重,
Figure BDA00018021586400001210
为用户Ui在第k个子时段的用户标签lj对应的时间权重,
Figure BDA00018021586400001211
为用户Ui在第k个子时段的用户标签lj对应的收藏权重;
Figure BDA00018021586400001212
为用户Ui在第k个子时段的用户标签lj对应的评分权重;
Figure BDA00018021586400001213
为用户Ui在第k个子时段的用户标签lj对应的分享权重。其中,j=1,2,……,sumi
可选的,通过上述实施方式确定了用户标签以及用户标签对应的权重,进而基于自动挖掘出来的用户标签,进行用户标签的信息聚合,得到可读性更强、描述性更强的标签,形成用户画像。例如,对某用户自动挖掘的“手机、平板电脑、VR设备”等用户标签聚合成“电子产品”的标签,一个用户画像可对应多个聚合标签。
最后,根据推广内容的关键词和用户画像中的用户标签,确定待推广的用户。具体的,可以将推广内容的关键词与用户画像中的用户标签进行对比,确定推广内容和用户画像的匹配度,再将推广内容和用户画像的匹配度高于匹配阈值的用户确定为待推广的用户。这里的待推广的用户也就是与推广内容相匹配的用户,可以将推广内容推送的目标用户。
步骤203,将所述推广内容推送给所述待推广的用户。
将推广内容推送给步骤202中确定的待推广的用户。当然,在上述确定待推广的用户以及将推广内容推送给待推广的用户时,还可以将推广内容的关键词与用户画像中的用户标签进行对比,确定推广内容和用户画像的匹配度,对用户画像按照匹配度高低进行排序,优先将推广内容推送给匹配度排序在前的用户。
此外,本发明实施例提供另一种确定待推广的用户的方式,在上述将推广内容推送给所述待推广的用户之后,还可以根据用户画像中的用户标签以及用户标签对应的权重,确定待推广的用户的用户画像与各用户的用户画像的相似度;将所述推广内容推送给与待推广的用户的用户画像的相似度大于第一阈值的用户。相当于,用户画像相似的用户之间存在着相似的兴趣爱好,根据待推广的用户的用户画像确定与待推广的用户的用户画像相似的用户。可通过协同过滤的相关算法计算用户之间的喜好相似度,对喜好相似的用户推荐共同浏览的内容,具体实施方式如下。
先计算用户标签的相似度,合并相似的用户标签,并添加不同的用户标签,对不含此用户标签的用户的此用户标签赋值为0,由此统一了用户画像矩阵Li的维度,重新定义用户标签j=1,2,…,J。用户
Figure BDA0001802158640000131
之间的相似度可以满足公式(10)。
该公式(10)为:
Figure BDA0001802158640000141
其中,
Figure BDA0001802158640000142
为用户
Figure BDA0001802158640000143
之间的相似度,
Figure BDA0001802158640000144
为用户
Figure BDA0001802158640000145
在第k个子时段的用户标签lj对应的用户标签权重,
Figure BDA0001802158640000146
为用户
Figure BDA0001802158640000147
在第k个子时段的用户标签lj对应的用户标签权重。
通过上述方式,确定与待推广的用户的用户画像的相似度大于第一阈值的用户,可以避免根据推广内容的关键词和用户画像中的用户标签,确定待推广的用户时,遗漏推广内容的目标用户。
举例来说,用户A是推广内容a的待推广的用户,用户A可能喜欢推广内容a。用户B与推广内容a匹配时,由于用户B浏览网站的浏览时间、用户标识等原因,确定的推广内容和用户画像的匹配度小于匹配阈值,则根据匹配度判断用户B不是推广内容a的待推广的用户,但用户B与用户A之间的用户画像非常相似,则用户B与用户A的喜好相似,所以根据用户B与用户A二者的用户画像相似度可以确定用户B可能喜欢推广内容a,所以应该将推广内容a推送给用户B。
此外,在内容推广平台上新提交的推广内容,由于还没有积累用户数据,很难确定待推广的用户,因此,内容推广平台需要为广告接入平台提供最初推广对象选项,也就是在根据推广内容的关键词和用户画像中的用户标签,确定待推广的用户之前,获取推广内容的初步推广人群类别,将推广内容推送给属于初步推广人群类别的用户。例如,初步推广人群类别可以包括:学生、上班族、老年人、女白领、时尚达人等,若推广内容为钢笔,则初步推广人群类别可以为学生、上班族;若推广内容为口红,则初步推广人群类别可以为女白领、时尚达人。
上述实施例中,根据用户浏览网站的用户标识权重、时间权重、内容权重和行为权重确定用户标签对应的权重,根据用户标签与用户标签对应的权重,确定推广内容与用户画像的匹配度,最终确定与推广内容相匹配的用户。同时,将推广内容推送给与待推广用户相似的用户,弥补了通过推广内容与用户画像的匹配度判定的不足。根据对互联网用户动态行为分析,结合时间维度信息形成用户画像,并结合用户之间的相似度,对互联网平台上的内容进行精准推广。
基于同一发明构思,图4示例性的示出了本发明实施例提供的一种内容推广的装置的结构,该装置可以执行内容推广的方法的流程。
获取单元401,用于获取推广内容,提取所述推广内容的关键词;
处理单元402,用于根据所述推广内容的关键词和用户画像中的用户标签,确定待推广的用户;所述用户画像包括用户标签和所述用户标签对应的权重,所述用户标签对应的权重是根据用户浏览网站的用户标识权重、时间权重、内容权重和行为权重确定的;并将所述推广内容推送给所述待推广的用户。
可选的,所述处理单元402具体用于:
获取所述用户浏览网站的浏览内容、用户标识和浏览时间;
根据所述浏览内容,确定所述用户标签以及所述用户标签对应的内容权重;
根据所述用户标识以及所述用户标识对应的浏览时间,确定所述用户标签对应的用户标识权重;
根据所述用户标签对应的浏览时间,确定所述用户标签对应的时间权重和行为权重;
根据所述用户标签对应的用户标识权重、时间权重、内容权重和行为权重确定所述用户标签对应的权重。
可选的,所述处理单元402具体用于:
根据所述浏览内容,确定所述用户标签的关键词;
根据所述用户标签的关键词在所述浏览内容中出现的次数、所述浏览内容包含的浏览页面的页面个数、每个所述浏览页面的词汇总数以及包含所述用户标签的关键词的浏览页面的页面个数,确定所述用户标签的关键词对应的TF-IDF指标;
将多个所述用户标签的关键词中最大的TF-IDF指标确定为所述用户标签对应的内容权重。
可选的,所述处理单元402具体用于:
将预设时段分为多个子时段,确定出每个子时段内的浏览时间;
根据所述用户在每个子时段内浏览所述用户标签的起始时刻和终止时刻、所述每个子时段的起始时刻和终止时刻以及所述每个子时段的衰减系数,确定所述用户标签对应的时间权重;
根据所述用户标签对应的时间权重、所述用户标签对应行为系数,确定所述用户标签对应的行为权重。
可选的,所述处理单元402具体用于:
将所述推广内容的关键词与所述用户画像中的用户标签进行对比,确定所述推广内容和所述用户画像的匹配度;
将所述推广内容和所述用户画像的匹配度高于匹配阈值的用户确定为待推广的用户。
可选的,所述处理单元402还用于:
在所述将所述推广内容推送给所述待推广的用户之后,根据所述用户画像中的用户标签以及用户标签对应的权重,确定所述待推广的用户的用户画像与各用户的用户画像的相似度;
将所述推广内容推送给与所述待推广的用户的用户画像的相似度大于第一阈值的用户。
可选的,所述处理单元402还用于:
在所述根据所述推广内容的关键词和用户画像中的用户标签,确定待推广的用户之前,获取所述推广内容的初步推广人群类别,将所述推广内容推送给属于所述初步推广人群类别的用户。
基于同一发明构思,本发明实施例还提供了一种计算设备,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行上述内容推广的方法。
基于同一发明构思,本发明实施例还提供了一种计算机可读非易失性存储介质,包括计算机可读指令,当计算机读取并执行所述计算机可读指令时,使得计算机执行上述内容推广的方法。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (9)

1.一种内容推广的方法,其特征在于,包括:
获取推广内容,提取所述推广内容的关键词;
根据所述推广内容的关键词和用户画像中的用户标签,确定待推广的用户;所述用户画像包括用户标签和所述用户标签对应的权重,所述用户标签对应的权重是根据用户浏览网站的用户标识权重、时间权重、内容权重和行为权重确定的;
将所述推广内容推送给所述待推广的用户;
所述根据用户浏览网站的用户标识权重、时间权重、内容权重和行为权重确定用户标签对应的权重,包括:
获取所述用户浏览网站的浏览内容、用户标识和浏览时间;
根据所述浏览内容,确定所述用户标签以及所述用户标签对应的内容权重;
根据所述用户标识以及所述用户标识对应的浏览时间,确定所述用户标签对应的用户标识权重;
根据所述用户标签对应的浏览时间,确定所述用户标签对应的时间权重和行为权重;
根据所述用户标签对应的用户标识权重、时间权重、内容权重和行为权重确定所述用户标签对应的权重;
用户标签对应的权重可以如公式(9)所示;
该公式(9)为:
Figure FDA0002596156550000011
其中,
Figure FDA0002596156550000012
为用户Ui的用户标签lj对应的用户标签权重;Obji(lj)为用户Ui的用户标签lj对应的用户标识权重,Ci(lj)为用户Ui的用户标签lj对应的内容权重,
Figure FDA0002596156550000013
为用户Ui在第k个子时段的用户标签lj对应的时间权重,
Figure FDA0002596156550000014
为用户Ui在第k个子时段的用户标签lj对应的收藏权重;
Figure FDA0002596156550000015
为用户Ui在第k个子时段的用户标签lj对应的评分权重;
Figure FDA0002596156550000021
为用户Ui在第k个子时段的用户标签lj对应的分享权重;其中,j=1,2,……,sumi
2.如权利要求1所述的方法,其特征在于,所述根据所述浏览内容,确定所述用户标签以及所述用户标签对应的内容权重,包括:
根据所述浏览内容,确定所述用户标签的关键词;
根据所述用户标签的关键词在所述浏览内容中出现的次数、所述浏览内容包含的浏览页面的页面个数、每个所述浏览页面的词汇总数以及包含所述用户标签的关键词的浏览页面的页面个数,确定所述用户标签的关键词对应的词频-逆文本频率TF-IDF指标;
将多个所述用户标签的关键词中最大的TF-IDF指标确定为所述用户标签对应的内容权重。
3.如权利要求1所述的方法,其特征在于,所述根据所述用户标签对应的浏览时间,确定所述用户标签对应的时间权重和行为权重,包括:
将预设时段分为多个子时段,确定出每个子时段内的浏览时间;
根据所述用户在每个子时段内浏览所述用户标签的起始时刻和终止时刻、所述每个子时段的起始时刻和终止时刻以及所述每个子时段的衰减系数,确定所述用户标签对应的时间权重;
根据所述用户标签对应的时间权重、所述用户标签对应行为系数,确定所述用户标签对应的行为权重。
4.如权利要求1所述的方法,其特征在于,所述根据所述推广内容的关键词和用户画像中的用户标签,确定待推广的用户,包括:
将所述推广内容的关键词与所述用户画像中的用户标签进行对比,确定所述推广内容和所述用户画像的匹配度;
将所述推广内容和所述用户画像的匹配度高于匹配阈值的用户确定为待推广的用户。
5.如权利要求1所述的方法,其特征在于,在所述将所述推广内容推送给所述待推广的用户之后,还包括:
根据所述用户画像中的用户标签以及用户标签对应的权重,确定所述待推广的用户的用户画像与各用户的用户画像的相似度;
将所述推广内容推送给与所述待推广的用户的用户画像的相似度大于第一阈值的用户。
6.如权利要求1至5任一项所述的方法,其特征在于,在所述根据所述推广内容的关键词和用户画像中的用户标签,确定待推广的用户之前,还包括:
获取所述推广内容的初步推广人群类别,将所述推广内容推送给属于所述初步推广人群类别的用户。
7.一种内容推广的装置,其特征在于,包括:
获取单元,用于获取推广内容,提取所述推广内容的关键词;
处理单元,用于根据所述推广内容的关键词和用户画像中的用户标签,确定待推广的用户;所述用户画像包括用户标签和所述用户标签对应的权重,所述用户标签对应的权重是根据用户浏览网站的用户标识权重、时间权重、内容权重和行为权重确定的;并将所述推广内容推送给所述待推广的用户;
所述处理单元具体用于:
获取所述用户浏览网站的浏览内容、用户标识和浏览时间;
根据所述浏览内容,确定所述用户标签以及所述用户标签对应的内容权重;
根据所述用户标识以及所述用户标识对应的浏览时间,确定所述用户标签对应的用户标识权重;
根据所述用户标签对应的浏览时间,确定所述用户标签对应的时间权重和行为权重;
根据所述用户标签对应的用户标识权重、时间权重、内容权重和行为权重确定所述用户标签对应的权重;
用户标签对应的权重可以如公式(9)所示;
该公式(9)为:
Figure FDA0002596156550000041
其中,
Figure FDA0002596156550000042
为用户Ui的用户标签lj对应的用户标签权重;Obji(lj)为用户Ui的用户标签lj对应的用户标识权重,Ci(lj)为用户Ui的用户标签lj对应的内容权重,
Figure FDA0002596156550000043
为用户Ui在第k个子时段的用户标签lj对应的时间权重,
Figure FDA0002596156550000044
为用户Ui在第k个子时段的用户标签lj对应的收藏权重;
Figure FDA0002596156550000045
为用户Ui在第k个子时段的用户标签lj对应的评分权重;
Figure FDA0002596156550000046
为用户Ui在第k个子时段的用户标签lj对应的分享权重;其中,j=1,2,……,sumi
8.一种计算设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行权利要求1至6任一项所述的方法。
9.一种计算机可读非易失性存储介质,其特征在于,包括计算机可读指令,当计算机读取并执行所述计算机可读指令时,使得计算机执行如权利要求1至6任一项所述的方法。
CN201811081806.2A 2018-09-17 2018-09-17 一种内容推广的方法及装置 Active CN109325179B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811081806.2A CN109325179B (zh) 2018-09-17 2018-09-17 一种内容推广的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811081806.2A CN109325179B (zh) 2018-09-17 2018-09-17 一种内容推广的方法及装置

Publications (2)

Publication Number Publication Date
CN109325179A CN109325179A (zh) 2019-02-12
CN109325179B true CN109325179B (zh) 2020-12-04

Family

ID=65266047

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811081806.2A Active CN109325179B (zh) 2018-09-17 2018-09-17 一种内容推广的方法及装置

Country Status (1)

Country Link
CN (1) CN109325179B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114861074A (zh) * 2022-07-07 2022-08-05 深圳市乐易网络股份有限公司 一种用户数据分析方法和***

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110033316A (zh) * 2019-03-22 2019-07-19 微梦创科网络科技(中国)有限公司 一种目标投放账号的确定方法、装置及设备
CN110222191B (zh) * 2019-04-19 2023-08-22 平安科技(深圳)有限公司 用户兴趣画像的构建方法、装置、计算机设备及计算机存储介质
CN110310163A (zh) * 2019-07-11 2019-10-08 易联众民生(厦门)科技有限公司 一种精准制定营销策略的方法、设备及可读介质
CN110880013A (zh) * 2019-08-02 2020-03-13 华为技术有限公司 识别文本的方法及装置
CN110659417A (zh) * 2019-09-12 2020-01-07 广东浪潮大数据研究有限公司 一种信息推送方法、***、电子设备及存储介质
CN111324724B (zh) * 2020-02-13 2023-04-11 腾讯科技(深圳)有限公司 数据处理方法及装置、电子设备和计算机可读存储介质
CN113723984A (zh) * 2021-03-03 2021-11-30 京东城市(北京)数字科技有限公司 人群消费画像信息的获取方法、装置和存储介质
CN113643070A (zh) * 2021-08-20 2021-11-12 林秀珍 一种基于大数据的智能信息推送方法及***
CN115130007B (zh) * 2022-08-29 2022-11-15 深圳市亲邻科技有限公司 一种基于用户场景定位的品牌推广方法及***
CN116881574B (zh) * 2023-09-07 2023-11-28 中科数创(北京)数字传媒有限公司 一种基于用户画像的定向科普推送方法及***

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103024585A (zh) * 2012-12-28 2013-04-03 Tcl集团股份有限公司 一种节目推荐***、方法及终端设备
CN103366299A (zh) * 2012-03-30 2013-10-23 索尼公司 用于推荐物品的方法和推荐***
WO2014009400A1 (en) * 2012-07-13 2014-01-16 Telefonica, S.A. A method and a system for generating context-based content recommendations to users
CN104935970A (zh) * 2015-07-09 2015-09-23 三星电子(中国)研发中心 进行电视内容推荐的方法及电视客户端
CN106815297A (zh) * 2016-12-09 2017-06-09 宁波大学 一种学术资源推荐服务***与方法
CN107025310A (zh) * 2017-05-17 2017-08-08 长春嘉诚信息技术股份有限公司 一种自动实时新闻推荐方法
CN108133011A (zh) * 2017-12-22 2018-06-08 新奥(中国)燃气投资有限公司 一种资讯推送方法及装置
CN108153857A (zh) * 2017-12-22 2018-06-12 北京奇虎科技有限公司 一种用于对网络访问数据进行关联处理的方法和***
CN108536694A (zh) * 2017-03-02 2018-09-14 广州市动景计算机科技有限公司 用户偏好的推测方法、装置和终端设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103870505B (zh) * 2012-12-17 2017-10-27 阿里巴巴集团控股有限公司 一种查询词推荐方法和查询词推荐***
CN104602042B (zh) * 2014-12-31 2017-11-03 合一网络技术(北京)有限公司 基于用户行为的标签设置方法
JP6434188B2 (ja) * 2015-07-27 2018-12-05 マスターカード インターナシヨナル インコーポレーテツド ユーザから提供されたデータタグを用いてデータを追跡するシステム及び方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103366299A (zh) * 2012-03-30 2013-10-23 索尼公司 用于推荐物品的方法和推荐***
WO2014009400A1 (en) * 2012-07-13 2014-01-16 Telefonica, S.A. A method and a system for generating context-based content recommendations to users
CN103024585A (zh) * 2012-12-28 2013-04-03 Tcl集团股份有限公司 一种节目推荐***、方法及终端设备
CN104935970A (zh) * 2015-07-09 2015-09-23 三星电子(中国)研发中心 进行电视内容推荐的方法及电视客户端
CN106815297A (zh) * 2016-12-09 2017-06-09 宁波大学 一种学术资源推荐服务***与方法
CN108536694A (zh) * 2017-03-02 2018-09-14 广州市动景计算机科技有限公司 用户偏好的推测方法、装置和终端设备
CN107025310A (zh) * 2017-05-17 2017-08-08 长春嘉诚信息技术股份有限公司 一种自动实时新闻推荐方法
CN108133011A (zh) * 2017-12-22 2018-06-08 新奥(中国)燃气投资有限公司 一种资讯推送方法及装置
CN108153857A (zh) * 2017-12-22 2018-06-12 北京奇虎科技有限公司 一种用于对网络访问数据进行关联处理的方法和***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于用户画像的信息智能推送方法;姜建武等;《微型机与应用》;20161230;第35卷(第23期);86-89、92 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114861074A (zh) * 2022-07-07 2022-08-05 深圳市乐易网络股份有限公司 一种用户数据分析方法和***

Also Published As

Publication number Publication date
CN109325179A (zh) 2019-02-12

Similar Documents

Publication Publication Date Title
CN109325179B (zh) 一种内容推广的方法及装置
US20190197416A1 (en) Information recommendation method, apparatus, and server based on user data in an online forum
JP7356206B2 (ja) コンテンツ推薦及び表示
CN105989004B (zh) 一种信息投放的预处理方法和装置
JP6301958B2 (ja) 検索語句を構成し、広告を配信し、製品情報を検索するための方法および装置
TWI512508B (zh) Recommended methods and systems for recommending information
US20190332602A1 (en) Method of data query based on evaluation and device
CN108537578A (zh) 基于大数据的广告推送方法及装置
CN106445963B (zh) App平台的广告索引关键词自动生成方法和装置
CN108805598B (zh) 相似度信息确定方法、服务器及计算机可读存储介质
US8868570B1 (en) Selection and display of online content items
EP2941724A1 (en) Method and apparatus for generating webpage content
CN113744016B (zh) 一种对象推荐方法及装置、设备、存储介质
CN108256537A (zh) 一种用户性别预测方法和***
CN102929939A (zh) 个性化信息的提供方法及装置
US20240202769A1 (en) Method, apparatus, device, storage medium and program product for promoter determination
CN110929138A (zh) 推荐信息生成方法、装置、设备及存储介质
CN110597987A (zh) 一种搜索推荐方法及装置
CN107590267A (zh) 基于图片的信息推送方法及装置、终端和可读存储介质
CN108229991B (zh) 展示聚合推广信息的方法、装置、浏览器和终端设备
US20240202800A1 (en) Method, apparatus, device, storage medium and program product for object determination
CN114219586A (zh) 基于视频的购物推荐方法、装置、设备和存储介质
US20230231930A1 (en) Content processing method and apparatus, computer device, and storage medium
KR101441164B1 (ko) 오브젝트 커스터마이제이션 및 관리 시스템
CN114881685A (zh) 广告投送方法、装置、电子装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant