CN109325179B - 一种内容推广的方法及装置 - Google Patents
一种内容推广的方法及装置 Download PDFInfo
- Publication number
- CN109325179B CN109325179B CN201811081806.2A CN201811081806A CN109325179B CN 109325179 B CN109325179 B CN 109325179B CN 201811081806 A CN201811081806 A CN 201811081806A CN 109325179 B CN109325179 B CN 109325179B
- Authority
- CN
- China
- Prior art keywords
- user
- content
- weight
- tag
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种内容推广的方法及装置,该方法包括:获取推广内容,提取推广内容的关键词,根据推广内容的关键词和用户画像中的用户标签,确定待推广的用户,其中,用户画像包括用户标签和用户标签对应的权重,用户标签对应的权重是根据用户浏览网站的用户标识权重、时间权重、内容权重和行为权重确定的,将推广内容推送给待推广的用户。该方案根据用户浏览网站动态行为分析,结合用户之间的相似度,获取推广内容精准目标用户,提高推广的准确率。
Description
技术领域
本发明实施例涉及数据挖掘技术领域,尤其涉及一种内容推广的方法及装置。
背景技术
近年来,互联网上各式各样的应用和服务出现了井喷式的增长,为了能让目标用户快速知晓和使用这些服务,应用的开发者和服务提供者通过各种途径和平台来推广自己的应用和服务。而如何使开发者以最小的推广成本,获取尽可能精准的目标用户,成为各大互联网推广平台着力解决的问题。
当前的互联网推广平台一般采用定价或者竞价的模式,要推广的应用出价够高就可以占据有利的广告位,有比较高的曝光率,或者按照特定地区来推广地域性的内容,推广的针对性不够。
发明内容
本发明实施例提供一种内容推广的方法及装置,用以通过获取精准目标用户,提高推广的准确率。
本发明实施例提供的一种内容推广的方法,包括:
获取推广内容,提取所述推广内容的关键词;
根据所述推广内容的关键词和用户画像中的用户标签,确定待推广的用户;所述用户画像包括用户标签和所述用户标签对应的权重,所述用户标签对应的权重是根据用户浏览网站的用户标识权重、时间权重、内容权重和行为权重确定的;
将所述推广内容推送给所述待推广的用户。
上述实施例中,根据用户浏览网站的用户标识权重、时间权重、内容权重和行为权重确定用户标签对应的权重,根据推广内容的关键词和用户画像中的用户标签,确定待推广的用户,即根据用户的动态行为分析,结合时间维度信息形成用户画像,对推广内容进行精准推送。
可选的,所述根据用户浏览网站的用户标识权重、时间权重、内容权重和行为权重确定用户标签对应的权重,包括:
获取所述用户浏览网站的浏览内容、用户标识和浏览时间;
根据所述浏览内容,确定所述用户标签以及所述用户标签对应的内容权重;
根据所述用户标识以及所述用户标识对应的浏览时间,确定所述用户标签对应的用户标识权重;
根据所述用户标签对应的浏览时间,确定所述用户标签对应的时间权重和行为权重;
根据所述用户标签对应的用户标识权重、时间权重、内容权重和行为权重确定所述用户标签对应的权重。
上述实施例中,获取用户浏览网站的浏览内容、用户标识和浏览时间,根据用户浏览网站的浏览内容、用户标识和浏览时间确定用户标签对应的用户标识权重、时间权重、内容权重和行为权重,进而确定用户标签对应的权重。
可选的,所述根据所述浏览内容,确定所述用户标签以及所述用户标签对应的内容权重,包括:
根据所述浏览内容,确定所述用户标签的关键词;
根据所述用户标签的关键词在所述浏览内容中出现的次数、所述浏览内容包含的浏览页面的页面个数、每个所述浏览页面的词汇总数以及包含所述用户标签的关键词的浏览页面的页面个数,确定所述用户标签的关键词对应的TF-IDF((Term Frequency-InverseDocument Frequency,词频-逆文本频率)指标;
将多个所述用户标签的关键词中最大的TF-IDF指标确定为所述用户标签对应的内容权重。
上述实施例中,确定用户标签的关键词,将用户标签的关键词中最大的TF-IDF指标确定为用户标签对应的内容权重。
可选的,所述根据所述用户标签对应的浏览时间,确定所述用户标签对应的时间权重和行为权重,包括:
将预设时段分为多个子时段,确定出每个子时段内的浏览时间;
根据所述用户在每个子时段内浏览所述用户标签的起始时刻和终止时刻、所述每个子时段的起始时刻和终止时刻以及所述每个子时段的衰减系数,确定所述用户标签对应的时间权重;
根据所述用户标签对应的时间权重、所述用户标签对应行为系数,确定所述用户标签对应的行为权重。
上述实施例中,提供确定用户标签对应的时间权重的实现方式,同时根据用户标签对应的时间权重、用户标签对应行为系数,确定用户标签对应的行为权重。将用户标签对应行为权重采用时间权重衡量。为后续确定用户标签对应的权重做准备。
可选的,所述根据所述推广内容的关键词和用户画像中的用户标签,确定待推广的用户,包括:
将所述推广内容的关键词与所述用户画像中的用户标签进行对比,确定所述推广内容和所述用户画像的匹配度;
将所述推广内容和所述用户画像的匹配度高于匹配阈值的用户确定为待推广的用户。
上述实施例中,将推广内容和用户画像的匹配度高于匹配阈值的用户确定为待推广的用户,也就是确定了与推广内容相匹配的用户。
可选的,在所述将所述推广内容推送给所述待推广的用户之后,还包括:
根据所述用户画像中的用户标签以及用户标签对应的权重,确定所述待推广的用户的用户画像与各用户的用户画像的相似度;
将所述推广内容推送给与所述待推广的用户的用户画像的相似度大于第一阈值的用户。
上述实施例中,确定与待推广的用户的用户画像的相似度大于第一阈值的用户,可以避免根据推广内容的关键词和用户画像中的用户标签,确定待推广的用户时,遗漏推广内容的目标用户。
可选的,在所述根据所述推广内容的关键词和用户画像中的用户标签,确定待推广的用户之前,还包括:
获取所述推广内容的初步推广人群类别,将所述推广内容推送给属于所述初步推广人群类别的用户。
上述实施例中,根据推广内容的初步推广人群类别,将推广内容推送给属于初步推广人群类别的用户,适用于推广冷启动阶段。
相应的,本发明实施例还提供了一种内容推广的装置,包括:
获取单元,用于获取推广内容,提取所述推广内容的关键词;
处理单元,用于根据所述推广内容的关键词和用户画像中的用户标签,确定待推广的用户;所述用户画像包括用户标签和所述用户标签对应的权重,所述用户标签对应的权重是根据用户浏览网站的用户标识权重、时间权重、内容权重和行为权重确定的;并将所述推广内容推送给所述待推广的用户。
可选的,所述处理单元具体用于:
获取所述用户浏览网站的浏览内容、用户标识和浏览时间;
根据所述浏览内容,确定所述用户标签以及所述用户标签对应的内容权重;
根据所述用户标识以及所述用户标识对应的浏览时间,确定所述用户标签对应的用户标识权重;
根据所述用户标签对应的浏览时间,确定所述用户标签对应的时间权重和行为权重;
根据所述用户标签对应的用户标识权重、时间权重、内容权重和行为权重确定所述用户标签对应的权重。
可选的,所述处理单元具体用于:
根据所述浏览内容,确定所述用户标签的关键词;
根据所述用户标签的关键词在所述浏览内容中出现的次数、所述浏览内容包含的浏览页面的页面个数、每个所述浏览页面的词汇总数以及包含所述用户标签的关键词的浏览页面的页面个数,确定所述用户标签的关键词对应的词频-逆文本频率TF-IDF指标;
将多个所述用户标签的关键词中最大的TF-IDF指标确定为所述用户标签对应的内容权重。
可选的,所述处理单元具体用于:
将预设时段分为多个子时段,确定出每个子时段内的浏览时间;
根据所述用户在每个子时段内浏览所述用户标签的起始时刻和终止时刻、所述每个子时段的起始时刻和终止时刻以及所述每个子时段的衰减系数,确定所述用户标签对应的时间权重;
根据所述用户标签对应的时间权重、所述用户标签对应行为系数,确定所述用户标签对应的行为权重。
可选的,所述处理单元具体用于:
将所述推广内容的关键词与所述用户画像中的用户标签进行对比,确定所述推广内容和所述用户画像的匹配度;
将所述推广内容和所述用户画像的匹配度高于匹配阈值的用户确定为待推广的用户。
可选的,所述处理单元还用于:
在所述将所述推广内容推送给所述待推广的用户之后,根据所述用户画像中的用户标签以及用户标签对应的权重,确定所述待推广的用户的用户画像与各用户的用户画像的相似度;
将所述推广内容推送给与所述待推广的用户的用户画像的相似度大于第一阈值的用户。
可选的,所述处理单元还用于:
在所述根据所述推广内容的关键词和用户画像中的用户标签,确定待推广的用户之前,获取所述推广内容的初步推广人群类别,将所述推广内容推送给属于所述初步推广人群类别的用户。
相应的,本发明实施例还提供了一种计算设备,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行上述内容推广的方法。
相应的,本发明实施例还提供了一种计算机可读非易失性存储介质,包括计算机可读指令,当计算机读取并执行所述计算机可读指令时,使得计算机执行上述内容推广的方法。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种***架构的示意图;
图2为本发明实施例提供的一种内容推广的方法的流程示意图;
图3为本发明实施例提供的一种确定用户标签对应的权重的流程示意图;
图4为本发明实施例提供的一种内容推广的装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
图1示例性的示出了本发明实施例提供内容推广的方法所适用的***架构,该***架构可以包括广告接入平台101、内容推广平台102、用户终端103。其中,广告接入平台101可以为推广内容的接入平台;内容推广平台102为用于推广内容的平台,其可以为互联网平台、APP等,内容推广平台102为面向用户对象类型广泛、支持第三方接入服务或者推广广告的综合服务平台;用户终端103可以为手机、平板电脑或其他可以向用户推广广告的终端。
基于上述描述,图2示例性的示出了本发明实施例提供的一种内容推广的方法的流程,该流程可以由内容推广的装置执行,该装置可以位于内容推广平台中,可以是该内容推广平台。如图2所示,该流程具体包括:
步骤201,获取推广内容,提取所述推广内容的关键词。
其中,推广内容为广告商需要进行推广的内容,可以为购物广告、实事新闻、娱乐新闻等。在获取到推广内容时,该推广内容中包含推广内容的关键词以及功能介绍,通过提取推广内容的关键词,为确定与推广内容相匹配的待推广用户做准备。例如,推广内容为购物广告中的护肤品,则可以提取到护肤品的关键词“补水、保湿、祛痘等”。
步骤202,根据所述推广内容的关键词和用户画像中的用户标签,确定待推广的用户。
其中,用户画像包括用户标签和用户标签对应的权重,用户标签对应的权重是根据用户浏览网站的用户标识权重、时间权重、内容权重和行为权重确定的。
通过获取用户浏览网站的实体静态数据和动态交互数据,来分析出用户类型和用户特征,进而确定与推广内容相匹配的用户。用于建立用户画像的数据包括自然数据、行为数据以及内容数据。自然数据表示包括用户性别、年龄等用户自身固有的属性,可以在用户注册等环节中向用户收集。行为数据描述用户所执行的行为,包括访问次数、访问频度、访问停留时间、操作活跃时间、信息输入、用点击链接、交互操作(如加关注、取消关注、打分、保存为书签、加入购物车、取出购物车、形成订单、取消订单、付款、退款等)。内容数据表示用户行为的对象,例如用户所加关注的微博ID(Identity,身份标识号)、用户打分的歌曲、用户保存为书签的网页上的内容、用户加入购物车或者形成订单的商品等。
作为一种实现方式,基于建立用户画像采集的数据,运用Spark任务处理与Storm流式处理相结合的方式,分析出用户随机互联网行为的用户标识、时间、内容、行为四大因素,可全面地描述用户的随机互联网行为。根据用户浏览网站的用户标识权重、时间权重、内容权重和行为权重确定用户标签对应的权重,具体可以如图3。
步骤301,获取用户浏览网站的浏览内容、用户标识和浏览时间。
此处,浏览网站包括多个浏览页面、浏览页面包含多个关键词,浏览页面中的关键词又可以组成用户标签。
步骤302,根据浏览内容,确定用户标签以及用户标签对应的内容权重。
具体的,根据浏览内容,确定用户标签的关键词。例如,用户浏览内容包括关键词“手机摄像头、手机显示芯片、手机内存卡”,则可以确定用户标签“手机”的关键词为“手机摄像头、手机显示芯片、手机内存卡”。
确定用户标签的关键词之后,根据用户标签的关键词在浏览内容中出现的次数、浏览内容包含的浏览页面的页面个数、每个浏览页面的词汇总数以及包含用户标签的关键词的浏览页面的页面个数,确定用户标签的关键词对应的TF-IDF指标,将多个用户标签的关键词中最大的TF-IDF指标确定为用户标签对应的内容权重。
优选的,用户标签对应的内容权重可以如公式(1)所示。
该公式(1)为:
其中,Ci(lj)为用户Ui的用户标签lj对应的内容权重,TF-IDF(lj)为用户标签的关键词对应的TF-IDF指标,TF-IDF(lj)可以如公式(2)所示。
该公式(2)为:
步骤303,根据用户标识以及用户标识对应的浏览时间,确定用户标签对应的用户标识权重。
此处,用户标识可以理解为互联网上区分用户的标识,用户标识可以为Cookie、IP(Internet Protocol,网络之间互连的协议)、Email、身份证等。其中,Cookie值可以解释为某些网站为了辨别用户身份、进行会话控制跟踪(session)而储存在用户本地终端上的数据(通常经过加密)。
不同用户标识的准确度不同,本实施例中,通过用户行为及注册信息等判断用户身份。用户标签对应的用户标识权重可以理解为该用户标签产生于同一个用户的可能性,假设用户总数量为n,构建用户为U1,U2,……,Un,用户标签lj产生于同一个用户Ui的可能性,可以如公式(3)所示。
该公式(3)为:
此外,浏览时长越长的用户,其用户标签的可用性更强。例如,用户A的浏览时长为10h,用户B的浏览时长为1h,则可以认为用户A的用户标签的可用性更强。
步骤304,根据用户标签对应的浏览时间,确定用户标签对应的时间权重和行为权重。
具体的,时间包含时间戳和时间间隔,时间戳用于标识事件发生、结束的时刻,时间间隔用于标识浏览时间。将预设时段分为多个子时段,确定出每个子时段内的浏览时间,根据用户在每个子时段内浏览用户标签的起始时刻和终止时刻、每个子时段的起始时刻和终止时刻以及每个子时段的衰减系数,确定用户标签对应的时间权重。
优选的,将预设时段分为S个子时段,T1,T2,…,Tk,…,TS,其中Tk为预设时段中的第k个子时段,每个子时段对应各自的衰减系数Ek。Ek可以如公式(4)所示。
该公式(4)为:
其中,λ为遗忘系数,λ的取值决定了信息随时间的衰减速度,λ越大则衰减速度越快,衰减速度同时也与划分时间段的数量相关。λ可根据经验设定为1≤λ≤4,也可以根据不同的用户标签类型,对λ赋予不同的数值。例如时效性较强的用户标签类型,其λ赋予较大,衰减速度较快。
用户标签对应的时间权重可以如公式(5)所示。
该公式(5)为:
其中,为用户Ui在第k个子时段的用户标签lj对应的时间权重,为用户在第k个子时段浏览用户标签lj的起始时刻,为用户在第k个子时段浏览用户标签lj的终止时刻,第k个子时段的起始时刻,第k个子时段的终止时刻,Ek为第k个子时段的衰减系数。
用户的行为是用户对网站内容的操作,如浏览、收藏、评分、分享等,不同的用户行为对应的权重不同,对用户标签产生的行为权重也不同。具体的,可以根据用户标签对应的时间权重、用户标签对应行为系数,确定用户标签对应的行为权重。
当用户对网站内容的操作为浏览时,可以根据用户标签对应的浏览时间,确定用户标签对应的时间权重,也就相当于上述实施例中的确定用户标签对应的时间权重的实施方式。
当用户对网站内容的操作为收藏时,用户标签对应的收藏权重可以根据公式(6)确定。
该公式(6)为:
其中,为用户Ui在第k个子时段的用户标签lj对应的收藏权重;为判断函数,当时,确定当时,确定 为用户Ui在第k个子时段的用户标签lj对应的时间权重;α为用户标签对应的收藏行为系数,α可根据经验设定为0.2≤α≤1。
当用户对网站内容的操作为评分时,用户标签对应的评分权重可以根据公式(7)确定。
该公式(7)为:
其中,为用户Ui在第k个子时段的用户标签lj对应的评分权重;为的平均函数,为用户Ui在第k个子时段的用户标签lj对应的时间权重;为的平均函数,为用户Ui对用户标签lj的评分;β为用户标签对应的评分行为系数,β可根据经验设定为0.5≤β≤2。
当用户对网站内容的操作为分享时,用户标签对应的分享权重可以根据公式(8)确定。
该公式(8)为:
由上述实施例可知,用户标签对应的行为权重都可以由用户标签对应的时间权重以及用户标签对应行为系数(收藏行为系数、评分行为系数、分享行为系数)确定。当然,也可以说,用户标签对应的行为权重都可以用用户标签对应的时间权重衡量。
步骤305,根据用户标签对应的用户标识权重、时间权重、内容权重和行为权重确定用户标签对应的权重。
可以说,用户标签对应的权重可以由用户标签对应的用户标识权重、时间权重、内容权重和行为权重确定。作为一种实现方式,用户标签对应的权重可以如公式(9)所示。
该公式(9)为:
其中,为用户Ui的用户标签lj对应的用户标签权重;Obji(lj)为用户Ui的用户标签lj对应的用户标识权重,Ci(lj)为用户Ui的用户标签lj对应的内容权重,为用户Ui在第k个子时段的用户标签lj对应的时间权重,为用户Ui在第k个子时段的用户标签lj对应的收藏权重;为用户Ui在第k个子时段的用户标签lj对应的评分权重;为用户Ui在第k个子时段的用户标签lj对应的分享权重。其中,j=1,2,……,sumi。
可选的,通过上述实施方式确定了用户标签以及用户标签对应的权重,进而基于自动挖掘出来的用户标签,进行用户标签的信息聚合,得到可读性更强、描述性更强的标签,形成用户画像。例如,对某用户自动挖掘的“手机、平板电脑、VR设备”等用户标签聚合成“电子产品”的标签,一个用户画像可对应多个聚合标签。
最后,根据推广内容的关键词和用户画像中的用户标签,确定待推广的用户。具体的,可以将推广内容的关键词与用户画像中的用户标签进行对比,确定推广内容和用户画像的匹配度,再将推广内容和用户画像的匹配度高于匹配阈值的用户确定为待推广的用户。这里的待推广的用户也就是与推广内容相匹配的用户,可以将推广内容推送的目标用户。
步骤203,将所述推广内容推送给所述待推广的用户。
将推广内容推送给步骤202中确定的待推广的用户。当然,在上述确定待推广的用户以及将推广内容推送给待推广的用户时,还可以将推广内容的关键词与用户画像中的用户标签进行对比,确定推广内容和用户画像的匹配度,对用户画像按照匹配度高低进行排序,优先将推广内容推送给匹配度排序在前的用户。
此外,本发明实施例提供另一种确定待推广的用户的方式,在上述将推广内容推送给所述待推广的用户之后,还可以根据用户画像中的用户标签以及用户标签对应的权重,确定待推广的用户的用户画像与各用户的用户画像的相似度;将所述推广内容推送给与待推广的用户的用户画像的相似度大于第一阈值的用户。相当于,用户画像相似的用户之间存在着相似的兴趣爱好,根据待推广的用户的用户画像确定与待推广的用户的用户画像相似的用户。可通过协同过滤的相关算法计算用户之间的喜好相似度,对喜好相似的用户推荐共同浏览的内容,具体实施方式如下。
先计算用户标签的相似度,合并相似的用户标签,并添加不同的用户标签,对不含此用户标签的用户的此用户标签赋值为0,由此统一了用户画像矩阵Li的维度,重新定义用户标签j=1,2,…,J。用户之间的相似度可以满足公式(10)。
该公式(10)为:
通过上述方式,确定与待推广的用户的用户画像的相似度大于第一阈值的用户,可以避免根据推广内容的关键词和用户画像中的用户标签,确定待推广的用户时,遗漏推广内容的目标用户。
举例来说,用户A是推广内容a的待推广的用户,用户A可能喜欢推广内容a。用户B与推广内容a匹配时,由于用户B浏览网站的浏览时间、用户标识等原因,确定的推广内容和用户画像的匹配度小于匹配阈值,则根据匹配度判断用户B不是推广内容a的待推广的用户,但用户B与用户A之间的用户画像非常相似,则用户B与用户A的喜好相似,所以根据用户B与用户A二者的用户画像相似度可以确定用户B可能喜欢推广内容a,所以应该将推广内容a推送给用户B。
此外,在内容推广平台上新提交的推广内容,由于还没有积累用户数据,很难确定待推广的用户,因此,内容推广平台需要为广告接入平台提供最初推广对象选项,也就是在根据推广内容的关键词和用户画像中的用户标签,确定待推广的用户之前,获取推广内容的初步推广人群类别,将推广内容推送给属于初步推广人群类别的用户。例如,初步推广人群类别可以包括:学生、上班族、老年人、女白领、时尚达人等,若推广内容为钢笔,则初步推广人群类别可以为学生、上班族;若推广内容为口红,则初步推广人群类别可以为女白领、时尚达人。
上述实施例中,根据用户浏览网站的用户标识权重、时间权重、内容权重和行为权重确定用户标签对应的权重,根据用户标签与用户标签对应的权重,确定推广内容与用户画像的匹配度,最终确定与推广内容相匹配的用户。同时,将推广内容推送给与待推广用户相似的用户,弥补了通过推广内容与用户画像的匹配度判定的不足。根据对互联网用户动态行为分析,结合时间维度信息形成用户画像,并结合用户之间的相似度,对互联网平台上的内容进行精准推广。
基于同一发明构思,图4示例性的示出了本发明实施例提供的一种内容推广的装置的结构,该装置可以执行内容推广的方法的流程。
获取单元401,用于获取推广内容,提取所述推广内容的关键词;
处理单元402,用于根据所述推广内容的关键词和用户画像中的用户标签,确定待推广的用户;所述用户画像包括用户标签和所述用户标签对应的权重,所述用户标签对应的权重是根据用户浏览网站的用户标识权重、时间权重、内容权重和行为权重确定的;并将所述推广内容推送给所述待推广的用户。
可选的,所述处理单元402具体用于:
获取所述用户浏览网站的浏览内容、用户标识和浏览时间;
根据所述浏览内容,确定所述用户标签以及所述用户标签对应的内容权重;
根据所述用户标识以及所述用户标识对应的浏览时间,确定所述用户标签对应的用户标识权重;
根据所述用户标签对应的浏览时间,确定所述用户标签对应的时间权重和行为权重;
根据所述用户标签对应的用户标识权重、时间权重、内容权重和行为权重确定所述用户标签对应的权重。
可选的,所述处理单元402具体用于:
根据所述浏览内容,确定所述用户标签的关键词;
根据所述用户标签的关键词在所述浏览内容中出现的次数、所述浏览内容包含的浏览页面的页面个数、每个所述浏览页面的词汇总数以及包含所述用户标签的关键词的浏览页面的页面个数,确定所述用户标签的关键词对应的TF-IDF指标;
将多个所述用户标签的关键词中最大的TF-IDF指标确定为所述用户标签对应的内容权重。
可选的,所述处理单元402具体用于:
将预设时段分为多个子时段,确定出每个子时段内的浏览时间;
根据所述用户在每个子时段内浏览所述用户标签的起始时刻和终止时刻、所述每个子时段的起始时刻和终止时刻以及所述每个子时段的衰减系数,确定所述用户标签对应的时间权重;
根据所述用户标签对应的时间权重、所述用户标签对应行为系数,确定所述用户标签对应的行为权重。
可选的,所述处理单元402具体用于:
将所述推广内容的关键词与所述用户画像中的用户标签进行对比,确定所述推广内容和所述用户画像的匹配度;
将所述推广内容和所述用户画像的匹配度高于匹配阈值的用户确定为待推广的用户。
可选的,所述处理单元402还用于:
在所述将所述推广内容推送给所述待推广的用户之后,根据所述用户画像中的用户标签以及用户标签对应的权重,确定所述待推广的用户的用户画像与各用户的用户画像的相似度;
将所述推广内容推送给与所述待推广的用户的用户画像的相似度大于第一阈值的用户。
可选的,所述处理单元402还用于:
在所述根据所述推广内容的关键词和用户画像中的用户标签,确定待推广的用户之前,获取所述推广内容的初步推广人群类别,将所述推广内容推送给属于所述初步推广人群类别的用户。
基于同一发明构思,本发明实施例还提供了一种计算设备,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行上述内容推广的方法。
基于同一发明构思,本发明实施例还提供了一种计算机可读非易失性存储介质,包括计算机可读指令,当计算机读取并执行所述计算机可读指令时,使得计算机执行上述内容推广的方法。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (9)
1.一种内容推广的方法,其特征在于,包括:
获取推广内容,提取所述推广内容的关键词;
根据所述推广内容的关键词和用户画像中的用户标签,确定待推广的用户;所述用户画像包括用户标签和所述用户标签对应的权重,所述用户标签对应的权重是根据用户浏览网站的用户标识权重、时间权重、内容权重和行为权重确定的;
将所述推广内容推送给所述待推广的用户;
所述根据用户浏览网站的用户标识权重、时间权重、内容权重和行为权重确定用户标签对应的权重,包括:
获取所述用户浏览网站的浏览内容、用户标识和浏览时间;
根据所述浏览内容,确定所述用户标签以及所述用户标签对应的内容权重;
根据所述用户标识以及所述用户标识对应的浏览时间,确定所述用户标签对应的用户标识权重;
根据所述用户标签对应的浏览时间,确定所述用户标签对应的时间权重和行为权重;
根据所述用户标签对应的用户标识权重、时间权重、内容权重和行为权重确定所述用户标签对应的权重;
用户标签对应的权重可以如公式(9)所示;
该公式(9)为:
2.如权利要求1所述的方法,其特征在于,所述根据所述浏览内容,确定所述用户标签以及所述用户标签对应的内容权重,包括:
根据所述浏览内容,确定所述用户标签的关键词;
根据所述用户标签的关键词在所述浏览内容中出现的次数、所述浏览内容包含的浏览页面的页面个数、每个所述浏览页面的词汇总数以及包含所述用户标签的关键词的浏览页面的页面个数,确定所述用户标签的关键词对应的词频-逆文本频率TF-IDF指标;
将多个所述用户标签的关键词中最大的TF-IDF指标确定为所述用户标签对应的内容权重。
3.如权利要求1所述的方法,其特征在于,所述根据所述用户标签对应的浏览时间,确定所述用户标签对应的时间权重和行为权重,包括:
将预设时段分为多个子时段,确定出每个子时段内的浏览时间;
根据所述用户在每个子时段内浏览所述用户标签的起始时刻和终止时刻、所述每个子时段的起始时刻和终止时刻以及所述每个子时段的衰减系数,确定所述用户标签对应的时间权重;
根据所述用户标签对应的时间权重、所述用户标签对应行为系数,确定所述用户标签对应的行为权重。
4.如权利要求1所述的方法,其特征在于,所述根据所述推广内容的关键词和用户画像中的用户标签,确定待推广的用户,包括:
将所述推广内容的关键词与所述用户画像中的用户标签进行对比,确定所述推广内容和所述用户画像的匹配度;
将所述推广内容和所述用户画像的匹配度高于匹配阈值的用户确定为待推广的用户。
5.如权利要求1所述的方法,其特征在于,在所述将所述推广内容推送给所述待推广的用户之后,还包括:
根据所述用户画像中的用户标签以及用户标签对应的权重,确定所述待推广的用户的用户画像与各用户的用户画像的相似度;
将所述推广内容推送给与所述待推广的用户的用户画像的相似度大于第一阈值的用户。
6.如权利要求1至5任一项所述的方法,其特征在于,在所述根据所述推广内容的关键词和用户画像中的用户标签,确定待推广的用户之前,还包括:
获取所述推广内容的初步推广人群类别,将所述推广内容推送给属于所述初步推广人群类别的用户。
7.一种内容推广的装置,其特征在于,包括:
获取单元,用于获取推广内容,提取所述推广内容的关键词;
处理单元,用于根据所述推广内容的关键词和用户画像中的用户标签,确定待推广的用户;所述用户画像包括用户标签和所述用户标签对应的权重,所述用户标签对应的权重是根据用户浏览网站的用户标识权重、时间权重、内容权重和行为权重确定的;并将所述推广内容推送给所述待推广的用户;
所述处理单元具体用于:
获取所述用户浏览网站的浏览内容、用户标识和浏览时间;
根据所述浏览内容,确定所述用户标签以及所述用户标签对应的内容权重;
根据所述用户标识以及所述用户标识对应的浏览时间,确定所述用户标签对应的用户标识权重;
根据所述用户标签对应的浏览时间,确定所述用户标签对应的时间权重和行为权重;
根据所述用户标签对应的用户标识权重、时间权重、内容权重和行为权重确定所述用户标签对应的权重;
用户标签对应的权重可以如公式(9)所示;
该公式(9)为:
8.一种计算设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行权利要求1至6任一项所述的方法。
9.一种计算机可读非易失性存储介质,其特征在于,包括计算机可读指令,当计算机读取并执行所述计算机可读指令时,使得计算机执行如权利要求1至6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811081806.2A CN109325179B (zh) | 2018-09-17 | 2018-09-17 | 一种内容推广的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811081806.2A CN109325179B (zh) | 2018-09-17 | 2018-09-17 | 一种内容推广的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109325179A CN109325179A (zh) | 2019-02-12 |
CN109325179B true CN109325179B (zh) | 2020-12-04 |
Family
ID=65266047
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811081806.2A Active CN109325179B (zh) | 2018-09-17 | 2018-09-17 | 一种内容推广的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109325179B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114861074A (zh) * | 2022-07-07 | 2022-08-05 | 深圳市乐易网络股份有限公司 | 一种用户数据分析方法和*** |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110033316A (zh) * | 2019-03-22 | 2019-07-19 | 微梦创科网络科技(中国)有限公司 | 一种目标投放账号的确定方法、装置及设备 |
CN110222191B (zh) * | 2019-04-19 | 2023-08-22 | 平安科技(深圳)有限公司 | 用户兴趣画像的构建方法、装置、计算机设备及计算机存储介质 |
CN110310163A (zh) * | 2019-07-11 | 2019-10-08 | 易联众民生(厦门)科技有限公司 | 一种精准制定营销策略的方法、设备及可读介质 |
CN110880013A (zh) * | 2019-08-02 | 2020-03-13 | 华为技术有限公司 | 识别文本的方法及装置 |
CN110659417A (zh) * | 2019-09-12 | 2020-01-07 | 广东浪潮大数据研究有限公司 | 一种信息推送方法、***、电子设备及存储介质 |
CN111324724B (zh) * | 2020-02-13 | 2023-04-11 | 腾讯科技(深圳)有限公司 | 数据处理方法及装置、电子设备和计算机可读存储介质 |
CN113723984A (zh) * | 2021-03-03 | 2021-11-30 | 京东城市(北京)数字科技有限公司 | 人群消费画像信息的获取方法、装置和存储介质 |
CN113643070A (zh) * | 2021-08-20 | 2021-11-12 | 林秀珍 | 一种基于大数据的智能信息推送方法及*** |
CN115130007B (zh) * | 2022-08-29 | 2022-11-15 | 深圳市亲邻科技有限公司 | 一种基于用户场景定位的品牌推广方法及*** |
CN116881574B (zh) * | 2023-09-07 | 2023-11-28 | 中科数创(北京)数字传媒有限公司 | 一种基于用户画像的定向科普推送方法及*** |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103024585A (zh) * | 2012-12-28 | 2013-04-03 | Tcl集团股份有限公司 | 一种节目推荐***、方法及终端设备 |
CN103366299A (zh) * | 2012-03-30 | 2013-10-23 | 索尼公司 | 用于推荐物品的方法和推荐*** |
WO2014009400A1 (en) * | 2012-07-13 | 2014-01-16 | Telefonica, S.A. | A method and a system for generating context-based content recommendations to users |
CN104935970A (zh) * | 2015-07-09 | 2015-09-23 | 三星电子(中国)研发中心 | 进行电视内容推荐的方法及电视客户端 |
CN106815297A (zh) * | 2016-12-09 | 2017-06-09 | 宁波大学 | 一种学术资源推荐服务***与方法 |
CN107025310A (zh) * | 2017-05-17 | 2017-08-08 | 长春嘉诚信息技术股份有限公司 | 一种自动实时新闻推荐方法 |
CN108133011A (zh) * | 2017-12-22 | 2018-06-08 | 新奥(中国)燃气投资有限公司 | 一种资讯推送方法及装置 |
CN108153857A (zh) * | 2017-12-22 | 2018-06-12 | 北京奇虎科技有限公司 | 一种用于对网络访问数据进行关联处理的方法和*** |
CN108536694A (zh) * | 2017-03-02 | 2018-09-14 | 广州市动景计算机科技有限公司 | 用户偏好的推测方法、装置和终端设备 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103870505B (zh) * | 2012-12-17 | 2017-10-27 | 阿里巴巴集团控股有限公司 | 一种查询词推荐方法和查询词推荐*** |
CN104602042B (zh) * | 2014-12-31 | 2017-11-03 | 合一网络技术(北京)有限公司 | 基于用户行为的标签设置方法 |
JP6434188B2 (ja) * | 2015-07-27 | 2018-12-05 | マスターカード インターナシヨナル インコーポレーテツド | ユーザから提供されたデータタグを用いてデータを追跡するシステム及び方法 |
-
2018
- 2018-09-17 CN CN201811081806.2A patent/CN109325179B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103366299A (zh) * | 2012-03-30 | 2013-10-23 | 索尼公司 | 用于推荐物品的方法和推荐*** |
WO2014009400A1 (en) * | 2012-07-13 | 2014-01-16 | Telefonica, S.A. | A method and a system for generating context-based content recommendations to users |
CN103024585A (zh) * | 2012-12-28 | 2013-04-03 | Tcl集团股份有限公司 | 一种节目推荐***、方法及终端设备 |
CN104935970A (zh) * | 2015-07-09 | 2015-09-23 | 三星电子(中国)研发中心 | 进行电视内容推荐的方法及电视客户端 |
CN106815297A (zh) * | 2016-12-09 | 2017-06-09 | 宁波大学 | 一种学术资源推荐服务***与方法 |
CN108536694A (zh) * | 2017-03-02 | 2018-09-14 | 广州市动景计算机科技有限公司 | 用户偏好的推测方法、装置和终端设备 |
CN107025310A (zh) * | 2017-05-17 | 2017-08-08 | 长春嘉诚信息技术股份有限公司 | 一种自动实时新闻推荐方法 |
CN108133011A (zh) * | 2017-12-22 | 2018-06-08 | 新奥(中国)燃气投资有限公司 | 一种资讯推送方法及装置 |
CN108153857A (zh) * | 2017-12-22 | 2018-06-12 | 北京奇虎科技有限公司 | 一种用于对网络访问数据进行关联处理的方法和*** |
Non-Patent Citations (1)
Title |
---|
基于用户画像的信息智能推送方法;姜建武等;《微型机与应用》;20161230;第35卷(第23期);86-89、92 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114861074A (zh) * | 2022-07-07 | 2022-08-05 | 深圳市乐易网络股份有限公司 | 一种用户数据分析方法和*** |
Also Published As
Publication number | Publication date |
---|---|
CN109325179A (zh) | 2019-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109325179B (zh) | 一种内容推广的方法及装置 | |
US20190197416A1 (en) | Information recommendation method, apparatus, and server based on user data in an online forum | |
JP7356206B2 (ja) | コンテンツ推薦及び表示 | |
CN105989004B (zh) | 一种信息投放的预处理方法和装置 | |
JP6301958B2 (ja) | 検索語句を構成し、広告を配信し、製品情報を検索するための方法および装置 | |
TWI512508B (zh) | Recommended methods and systems for recommending information | |
US20190332602A1 (en) | Method of data query based on evaluation and device | |
CN108537578A (zh) | 基于大数据的广告推送方法及装置 | |
CN106445963B (zh) | App平台的广告索引关键词自动生成方法和装置 | |
CN108805598B (zh) | 相似度信息确定方法、服务器及计算机可读存储介质 | |
US8868570B1 (en) | Selection and display of online content items | |
EP2941724A1 (en) | Method and apparatus for generating webpage content | |
CN113744016B (zh) | 一种对象推荐方法及装置、设备、存储介质 | |
CN108256537A (zh) | 一种用户性别预测方法和*** | |
CN102929939A (zh) | 个性化信息的提供方法及装置 | |
US20240202769A1 (en) | Method, apparatus, device, storage medium and program product for promoter determination | |
CN110929138A (zh) | 推荐信息生成方法、装置、设备及存储介质 | |
CN110597987A (zh) | 一种搜索推荐方法及装置 | |
CN107590267A (zh) | 基于图片的信息推送方法及装置、终端和可读存储介质 | |
CN108229991B (zh) | 展示聚合推广信息的方法、装置、浏览器和终端设备 | |
US20240202800A1 (en) | Method, apparatus, device, storage medium and program product for object determination | |
CN114219586A (zh) | 基于视频的购物推荐方法、装置、设备和存储介质 | |
US20230231930A1 (en) | Content processing method and apparatus, computer device, and storage medium | |
KR101441164B1 (ko) | 오브젝트 커스터마이제이션 및 관리 시스템 | |
CN114881685A (zh) | 广告投送方法、装置、电子装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |