CN110717788A - 一种目标用户的筛选方法及装置 - Google Patents

一种目标用户的筛选方法及装置 Download PDF

Info

Publication number
CN110717788A
CN110717788A CN201910967710.4A CN201910967710A CN110717788A CN 110717788 A CN110717788 A CN 110717788A CN 201910967710 A CN201910967710 A CN 201910967710A CN 110717788 A CN110717788 A CN 110717788A
Authority
CN
China
Prior art keywords
target
keyword
user
information
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910967710.4A
Other languages
English (en)
Inventor
周通
于潇潇
廖晨晓
冯浩
张绪玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sohu New Media Information Technology Co Ltd
Original Assignee
Beijing Sohu New Media Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sohu New Media Information Technology Co Ltd filed Critical Beijing Sohu New Media Information Technology Co Ltd
Priority to CN201910967710.4A priority Critical patent/CN110717788A/zh
Publication of CN110717788A publication Critical patent/CN110717788A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种目标用户的筛选方法及装置,响应于接收到信息投放请求,获取用户群体的关键词列表,并且依据信息投放请求,确定与待投放信息相匹配的目标关键词,根据该目标关键词在关键词列表进行筛选,得到与目标关键词相匹配的目标用户,从而可以将待投放信息发送至目标用户。这样能够对每个信息投放请求,根据关键词匹配到精准的投放用户,节省了处理器的处理资源,从而提升了信息投放精度及用户体验度。

Description

一种目标用户的筛选方法及装置
技术领域
本发明涉及信息处理技术领域,特别是涉及一种目标用户的筛选方法及装置。
背景技术
伴随着互联网技术的发展,互联网用户也越来越多,如何能够为互联网用户精准地投放商品资讯和热门信息已经成为了目前信息运营商所要面临的主要问题。
例如,在现有的商品资讯信息投放过程中,都是基于已经分类号的人群进行定向投放。在这种人群定向方式下,当处理器接收到商品资讯信息投放请求时,会基于已有的用户标签选定目标人群,进行商品资讯信息投放,由于投放精度较差,在无法获得满足的用户群流量时,会使得处理器继续进行投放浪费处理器的处理资源,并且使得用户的体验效果较差。
发明内容
针对于上述问题,本发明提供一种目标用户的筛选方法及装置,实现了节省处理器的处理资源及提升信息投放精度、用户体验度的目的。
为了实现上述目的,本发明提供了如下技术方案:
一种目标人群的筛选方法,该方法包括:
响应于接收到信息投放请求,获取用户群体的关键词列表,其中,所述关键词列表表征用户与关键词的映射关系;
依据所述信息投放请求,确定与待投放信息相匹配的目标关键词;
根据所述目标关键词,在所述关键词列表进行筛选,获得与所述目标关键词相匹配的目标用户,使得将与所述信息投放请求对应的待投放信息发送至所述目标用户。
可选地,该方法还包括:
创建目标信息的第一关键词列表,所述目标信息表征用户能够获取到的信息;
其中,所述创建目标信息的第一关键词列表,包括:
依据目标分词,生成分词词库,所述目标分词表征与信息投放关联的词语;
依据所述分词词库,对目标信息进行分词处理,得到第一关键词列表,所述目标信息表征用户群体能够获知的信息,所述第一关键词列表表征目标信息与关键词的对应关系。
可选地,该方法还包括:
依据用户获得的目标信息,生成用户群体的关键词列表;
其中,所述依据用户获得的目标信息,生成用户群体的关键词列表,包括:
对用户获得的目标信息进行数据清洗,得到清洗后的数据;
按照时间维度,在清洗后的数据中获取用户对目标信息的点击数据;
依据所述点击数据和所述第一关键词列表,生成用户群体的关键词列表,所述用户群体包括至少一个用户。
可选地,所述依据点击数据和所述第一关键词列表,生成用户群体的关键词列表,包括:
依据点击数据,确定关键词的权重值;
通过第一关键词列表,获取用户获得的目标信息的初始关键词;
根据所述关键词的权重值对所述初始关键词进行过滤,得到与所述用户匹配的关键词集合;
依据与所述用户匹配的关键词集合,生成用户群体的关键词列表。
可选地,所述依据所述目标关键词,在所述关键词列表进行筛选,获得与所述目标关键词相匹配的目标用户,包括:
获取与所述目标关键词相匹配的关联词;
依据所述目标关键词和所述关联词,在所述关键词列表进行筛选,获得与所述目标关键词相匹配的目标用户。
可选地,所述获取与所述目标关键词相匹配的关联词,包括:
依据预设词向量模型,获得与所述目标关键词相匹配的关联词;
其中,所述预设词向量模型为根据关联词样本训练得到的模型,用于预测关键词的关联词。
一种目标人群的筛选装置,该装置包括:
获取单元,用于响应于接收到信息投放请求,获取用户群体的关键词列表,其中,所述关键词列表表征用户与关键词的映射关系;
确定单元,用于依据所述信息投放请求,确定与待投放信息相匹配的目标关键词;
筛选单元,用于根据所述目标关键词,在所述关键词列表进行筛选,获得与所述目标关键词相匹配的目标用户,使得将与所述信息投放请求对应的待投放信息发送至所述目标用户。
可选地,该装置还包括:
列表创建单元,用于创建目标信息的第一关键词列表,所述目标信息表征用户能够获取到的信息;
其中,所述列表创建单元包括:
词库生成子单元,用于依据目标分词,生成分词词库,所述目标分词表征与信息投放关联的词语;
分词子单元,用于依据所述分词词库,对目标信息进行分词处理,得到第一关键词列表,所述目标信息表征用户群体能够获知的信息,所述第一关键词列表表征目标信息与关键词的对应关系;
所述装置还包括:
列表生成单元,用于依据用户获得的目标信息,生成用户群体的关键词列表;
其中,所述列表生成单元包括:
数据清洗子单元,用于对用户获得的目标信息进行数据清洗,得到清洗后的数据;
数据获取子单元,用于按照时间维度,在清洗后的数据中获取用户对目标信息的点击数据;
列表生成子单元,用于依据所述点击数据和所述第一关键词列表,生成用户群体的关键词列表,所述用户群体包括至少一个用户。
可选地,所述列表生成子单元具体用于:
依据点击数据,确定关键词的权重值;
通过第一关键词列表,获取用户获得的目标信息的初始关键词;
根据所述关键词的权重值对所述初始关键词进行过滤,得到与所述用户匹配的关键词集合;
依据与所述用户匹配的关键词集合,生成用户群体的关键词列表。
可选地,所述筛选单元包括:
关联词获取子单元,用于获取与所述目标关键词相匹配的关联词;
用户筛选子单元,用于依据所述目标关键词和所述关联词,在所述关键词列表进行筛选,获得与所述目标关键词相匹配的目标用户;
所述关联词获取子单元具体用于:
依据预设词向量模型,获得与所述目标关键词相匹配的关联词;
其中,所述预设词向量模型为根据关联词样本训练得到的模型,用于预测关键词的关联词。
本发明提供了一种目标用户的筛选方法及装置,响应于接收到信息投放请求,获取用户群体的关键词列表,并且依据信息投放请求,确定与待投放信息相匹配的目标关键词,根据该目标关键词在关键词列表进行筛选,得到与目标关键词相匹配的目标用户,从而可以将待投放信息发送至目标用户。这样能够对每个信息投放请求,根据关键词匹配到精准的投放用户,节省了处理器的处理资源,从而提升了信息投放精度及用户体验度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种目标用户的筛选方法的流程示意图;
图2为本发明实施例提供的一种目标用户的筛选装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”和“第二”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有设定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
在本发明实施例中提供了一种目标用户的筛选方法,参见图1,该方法包括:
S101、响应于接收到信息投放请求,获取用户群体的关键词列表。
在本申请实施例中信息投放请求可以是针对商品推广的信息投放请求,即广告请求,也可以是针对资讯进行推广的信息投放请求,即资讯推送请求。其中,用户群体的关键词列表表征用户与关键词的映射关系。用户群体中包括多个用户,即用户全体的关键词列表中针对每一个用户其记载的信息格式可以为(用户A,{关键词a,关键词b,关键词c…})、(用户B,{关键词a,关键词d,关键词e…})等等。
需要说明的是,用户群体的关键词列表是预先创建的,即根据用户历史浏览的信息进行关键词提取得到的。用户历史浏览的信息可以包括各种资讯,例如,新闻、视频等。在对应用户的关键词中根据不同的信息投放请求,其侧重不同,若对应产品投放信息,则对应的可以对用户的关键词进行筛选,得到具有商业价值的关键词,便于后续信息的精准投放。
S102、依据信息投放请求,确定与待投放信息相匹配的目标关键词。
信息投放请求会携带待投放信息的相关内容,待投放信息表征商品推广信息,则会携带商品类型或者商品属性信息等,然后,根据待投放信息获取与之对应的目标关键词,该目标关键词为表征该待投放信息的属性特征。例如,待投放信息为家电产品的广告,则对应的目标关键词为家电、家具、电器等。
S103、根据目标关键词,在关键词列表进行筛选,获得与目标关键词相匹配的目标用户。
由于关键词列表表征了用户与关键词的映射关系,若目标关键词为关键词a,而对应的关键词列表中记载的信息为用户A,{关键词a,关键词b,关键词c…})、(用户B,{关键词a,关键词d,关键词e…})、用户C,{关键词w,关键词b,关键词c…})、(用户D,{关键词p,关键词d,关键词e…})。在该关键词列表中需要筛选出标签包括关键词a的用户,即得到用户A和用户B,从而可以将与信息投放请求对应的待投放信息发送至用户A和用户B。这样能够使得用户A和用户B更能关注接收到的信息,使得投放效率更加精准,用户的感兴趣程度更高。
对应的,当处理器接收到信息投放请求时,根据该投放请求对应的关键词,得到与该关键词相匹配的用户,并将信息投放请求对应的待投放信息发送至该用户。使得处理器对信息投放请求的处理更具有针对性,相较于现有技术中若要获得满意的用户流量,需要多次对同一信息投放请求进行处理或者对多个没有针对性的用户群体进行投放,节省了处理器的处理资源,提高了其处理效率。
本发明提供了一种目标用户的筛选方法,响应于接收到信息投放请求,获取用户群体的关键词列表,并且依据信息投放请求,确定与待投放信息相匹配的目标关键词,根据该目标关键词在关键词列表进行筛选,得到与目标关键词相匹配的目标用户,从而可以将待投放信息发送至目标用户。这样能够对每个信息投放请求,根据关键词匹配到精准的投放用户,节省了处理器的处理资源,从而提升了信息投放精度及用户体验度。
在本发明的另一实施例中还提供了一种创建目标信息的第一关键词列表的方法,其中,目标信息表征用户能够获取到的信息。该方法包括:
S201、依据目标分词,生成分词词库,所述目标分词表征与信息投放关联的词语;
S202、依据所述分词词库,对目标信息进行分词处理,得到第一关键词列表,所述目标信息表征用户群体能够获知的信息,所述第一关键词列表表征目标信息与关键词的对应关系。
在本发明实施例中目标信息是指用户能够获取到的信息,即用户能够进行关注、阅读和订阅的相关信息。例如,用户历史阅读的新闻、观看的视频、订阅的资讯信息等。
根据用户能够获取到的目标信息中的关键词来确定用户对应的关键词标签,在获取目标信息的关键词时在本发明实施例中利用了分词处理技术。首先确定分词词库,即将能够切分的词记录在该分词词库中,需要说明的是,可以通过人工标注的方式或者信息爬取技术来获得目标分词,并且在本发明实施例中目标分词是表征与信息投放关联的词语,例如,该信息投放应用在广告投放场景中,对应的目标分词则表征更具有商业价值的关键词。因此,在目标分词词库中除了目标信息中包括的关键词外,在本申请实施例中还添加了具有商业价值的商业词。例如,对应广告投放场景中,加入的商业词可以包括餐饮类、母婴儿童类、汽车类、科技数码类、财经类、旅游类等对应的词语。
然后可以依据分词词库,对目标信息进行分词处理,得到第一关键词列表,其中,第一关键词列表的可以包括若干个目标信息与关键词的对应关系。例如,第一关键词列表包括(文章1,{关键词a,关键词b,关键词c})、(文章2,{关键词b,关键词d,关键词f})、(视频1,{关键词c,关键词d,关键词e})等等。
具体的,可以使用隐式马尔科夫模型,对文章库标题、内容和视频库的标题、间接做全量切词,即遍历所有语句,将所有符合***词库的词切分出来。利用实时计算,实时更新的文章和视频进行切词结果,以文章ID和视频ID为主键,得到第一关键词列表。
对应的,在本发明实施例中还包括依据用户获得的目标信息,生成用户群体的关键词列表的方法,该方法具体包括:
对用户获得的目标信息进行数据清洗,得到清洗后的数据;
按照时间维度,在清洗后的数据中获取用户对目标信息的点击数据;
依据所述点击数据和所述第一关键词列表,生成用户群体的关键词列表,所述用户群体包括至少一个用户。
具体的,目标信息是指用户已观看的新闻、视频,或者对应的订阅的新闻、视频等信息。需要对用户点击或者观看的新闻和视频数据进行数据清洗,其中,数据清洗字段包括但不局限于时间、手机的唯一设备号、文章ID、视频ID等。可以设置数据清洗的周期,例如,APP端以30天为时间窗;PC/WAP端以7天为时间窗。对每天清洗后的数据,按照用户ID(其中,用户ID可以以手机的唯一设备号进行标记)对浏览的文章、观看的视频进行聚合,即统计用户每天的对相应的新闻或者视频的点击次数,得到点击数据。该点击数据表示每个用户每天点击各种文章或视频的次数。
然后依据点击数据,确定文章的关键词的权重值,通过第一关键词列表,获取用户获得的目标信息的初始关键词;根据所述关键词的权重值对所述初始关键词进行过滤,得到与所述用户匹配的关键词集合;依据与所述用户匹配的关键词集合,生成用户群体的关键词列表。
具体的,在本发明实施例中的生成用户对应的关键词的标签可以通过如下方法实现:
权重计算:关键词权重=时间衰减因子*∑次数
其中,时间衰减因子β,可以通过下式(1)表示:
Figure BDA0002231051510000091
在式(1)中,tn表示统计时间,tn-1表示目标信息最近一次出现时间。
在计算得到各个关键词的权重后,可以根据归一化函数,对关键词的权重进行归一化处理,例如,采用Sigmoid函数
Figure BDA0002231051510000092
进行归一化处理。
然后,生成每个用户的关键词标签集合。同时需要过滤低权重关键词标签。例如,获取每个用户按权重从高到低排序的前50个关键词作为该用户的兴趣关键词标签。
对应的,用户的兴趣关键词数据存储格式可以为:
兴趣关键词{keyword1:权重,keyword2:权重,…,keyword50:权重}
在本发明实施例中依据目标关键词在包括用户信息的关键词列表进行筛选时,以获得目标用户的过程中,除了得到的目标关键词之外,还需要根据该目标关键词进行词语联想得到关联词,这样会使得筛选得到的目标用户更加准确。
在获取到信息投放请求时,会得到与该信息投放请求对应的关键词,从而可以通过词语联想得到与该关键词对应的关联词。在本发明实施了中可以通过预设词向量模型,获得与所述目标关键词相匹配的关联词。
其中,所述预设词向量模型为根据关联词样本训练得到的模型,用于预测关键词的关联词。
具体的,对历史数据应用词向量模型,采用word2vec模型,通过双层的神经网络,训练样本重构语言学之间的词文本。
给定一个由n个词语按顺序组成的句子:
S=(w1,w2,…,wn)
则概率p(S)为预设词向量模型,通过贝叶斯公式,可以将概率p(S)进行分解。
要计算一个句子出现的概率,要计算一个句子出现的概率,只需要计算出在给定上下文的情况下,下一个词为某个词的概率即可,即:
Figure BDA0002231051510000101
当所有条件概率均计算出来后,可以通过各个条件概率进行连乘得到p(S),因此预设词向量模型的关键是找到计算条件概率的模型。
通过上述模型,可以得到一个训练好的词向量模型,后续只需要输入一个词及联想词的个数,即可以得到相应数量的联想词结果,即与目标关键词对应的关联词。
因此,在本发明实施例中通过在分词词库中加入商业词,可有效提高广告选择词的质量和效率;通过权重策略优化,即加入了时间衰减函数和归一化权重,可以高效的更新用户最近的兴趣状态,通过联想词处理使得可以更加快捷的获取目标关键词的词集合。
对应的,在本发明实施例中还提供了一种目标用户的筛选装置,参见图2,该装置包括:
获取单元10,用于响应于接收到信息投放请求,获取用户群体的关键词列表,其中,所述关键词列表表征用户与关键词的映射关系;
确定单元20,用于依据所述信息投放请求,确定与待投放信息相匹配的目标关键词;
筛选单元30,用于根据所述目标关键词,在所述关键词列表进行筛选,获得与所述目标关键词相匹配的目标用户,使得将与所述信息投放请求对应的待投放信息发送至所述目标用户。
在上述实施例的基础上,该装置还包括:
列表创建单元,用于创建目标信息的第一关键词列表,所述目标信息表征用户能够获取到的信息;
其中,所述列表创建单元包括:
词库生成子单元,用于依据目标分词,生成分词词库,所述目标分词表征与信息投放关联的词语;
分词子单元,用于依据所述分词词库,对目标信息进行分词处理,得到第一关键词列表,所述目标信息表征用户群体能够获知的信息,所述第一关键词列表表征目标信息与关键词的对应关系;
所述装置还包括:
列表生成单元,用于依据用户获得的目标信息,生成用户群体的关键词列表;
其中,所述列表生成单元包括:
数据清洗子单元,用于对用户获得的目标信息进行数据清洗,得到清洗后的数据;
数据获取子单元,用于按照时间维度,在清洗后的数据中获取用户对目标信息的点击数据;
列表生成子单元,用于依据所述点击数据和所述第一关键词列表,生成用户群体的关键词列表,所述用户群体包括至少一个用户。
在上述实施例的基础上,所述列表生成子单元具体用于:
依据点击数据,确定关键词的权重值;
通过第一关键词列表,获取用户获得的目标信息的初始关键词;
根据所述关键词的权重值对所述初始关键词进行过滤,得到与所述用户匹配的关键词集合;
依据与所述用户匹配的关键词集合,生成用户群体的关键词列表。
在上述实施例的基础上,所述筛选单元包括:
关联词获取子单元,用于获取与所述目标关键词相匹配的关联词;
用户筛选子单元,用于依据所述目标关键词和所述关联词,在所述关键词列表进行筛选,获得与所述目标关键词相匹配的目标用户;
所述关联词获取子单元具体用于:
依据预设词向量模型,获得与所述目标关键词相匹配的关联词;
其中,所述预设词向量模型为根据关联词样本训练得到的模型,用于预测关键词的关联词。
本发明提供了一种目标用户的筛选装置,获取单元响应于接收到信息投放请求,获取用户群体的关键词列表,并且确定单元依据信息投放请求,确定与待投放信息相匹配的目标关键词,筛选单元根据该目标关键词在关键词列表进行筛选,得到与目标关键词相匹配的目标用户,从而可以将待投放信息发送至目标用户。这样能够对每个信息投放请求,根据关键词匹配到精准的投放用户,节省了处理器的处理资源,从而提升了信息投放精度及用户体验度。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述目标用户的筛选方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述目标用户的筛选方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
响应于接收到信息投放请求,获取用户群体的关键词列表,其中,所述关键词列表表征用户与关键词的映射关系;
依据所述信息投放请求,确定与待投放信息相匹配的目标关键词;
根据所述目标关键词,在所述关键词列表进行筛选,获得与所述目标关键词相匹配的目标用户,使得将与所述信息投放请求对应的待投放信息发送至所述目标用户。
进一步地,该方法还包括:
创建目标信息的第一关键词列表,所述目标信息表征用户能够获取到的信息;
其中,所述创建目标信息的第一关键词列表,包括:
依据目标分词,生成分词词库,所述目标分词表征与信息投放关联的词语;
依据所述分词词库,对目标信息进行分词处理,得到第一关键词列表,所述目标信息表征用户群体能够获知的信息,所述第一关键词列表表征目标信息与关键词的对应关系。
进一步地,该方法还包括:
依据用户获得的目标信息,生成用户群体的关键词列表;
其中,所述依据用户获得的目标信息,生成用户群体的关键词列表,包括:
对用户获得的目标信息进行数据清洗,得到清洗后的数据;
按照时间维度,在清洗后的数据中获取用户对目标信息的点击数据;
依据所述点击数据和所述第一关键词列表,生成用户群体的关键词列表,所述用户群体包括至少一个用户。
进一步地,所述依据点击数据和所述第一关键词列表,生成用户群体的关键词列表,包括:
依据点击数据,确定关键词的权重值;
通过第一关键词列表,获取用户获得的目标信息的初始关键词;
根据所述关键词的权重值对所述初始关键词进行过滤,得到与所述用户匹配的关键词集合;
依据与所述用户匹配的关键词集合,生成用户群体的关键词列表。
进一步地,所述依据所述目标关键词,在所述关键词列表进行筛选,获得与所述目标关键词相匹配的目标用户,包括:
获取与所述目标关键词相匹配的关联词;
依据所述目标关键词和所述关联词,在所述关键词列表进行筛选,获得与所述目标关键词相匹配的目标用户。
进一步地,所述获取与所述目标关键词相匹配的关联词,包括:
依据预设词向量模型,获得与所述目标关键词相匹配的关联词;
其中,所述预设词向量模型为根据关联词样本训练得到的模型,用于预测关键词的关联词。
本文中的设备可以是服务器、PC、PAD、手机等。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、***或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种目标用户的筛选方法,其特征在于,该方法包括:
响应于接收到信息投放请求,获取用户群体的关键词列表,其中,所述关键词列表表征用户与关键词的映射关系;
依据所述信息投放请求,确定与待投放信息相匹配的目标关键词;
根据所述目标关键词,在所述关键词列表进行筛选,获得与所述目标关键词相匹配的目标用户,使得将与所述信息投放请求对应的待投放信息发送至所述目标用户。
2.根据权利要求1所述的方法,其特征在于,该方法还包括:
创建目标信息的第一关键词列表,所述目标信息表征用户能够获取到的信息;
其中,所述创建目标信息的第一关键词列表,包括:
依据目标分词,生成分词词库,所述目标分词表征与信息投放关联的词语;
依据所述分词词库,对目标信息进行分词处理,得到第一关键词列表,所述目标信息表征用户群体能够获知的信息,所述第一关键词列表表征目标信息与关键词的对应关系。
3.根据权利要求2所述的方法,其特征在于,该方法还包括:
依据用户获得的目标信息,生成用户群体的关键词列表;
其中,所述依据用户获得的目标信息,生成用户群体的关键词列表,包括:
对用户获得的目标信息进行数据清洗,得到清洗后的数据;
按照时间维度,在清洗后的数据中获取用户对目标信息的点击数据;
依据所述点击数据和所述第一关键词列表,生成用户群体的关键词列表,所述用户群体包括至少一个用户。
4.根据权利要求3所述的方法,其特征在于,所述依据点击数据和所述第一关键词列表,生成用户群体的关键词列表,包括:
依据点击数据,确定关键词的权重值;
通过第一关键词列表,获取用户获得的目标信息的初始关键词;
根据所述关键词的权重值对所述初始关键词进行过滤,得到与所述用户匹配的关键词集合;
依据与所述用户匹配的关键词集合,生成用户群体的关键词列表。
5.根据权利要求1所述的方法,其特征在于,所述依据所述目标关键词,在所述关键词列表进行筛选,获得与所述目标关键词相匹配的目标用户,包括:
获取与所述目标关键词相匹配的关联词;
依据所述目标关键词和所述关联词,在所述关键词列表进行筛选,获得与所述目标关键词相匹配的目标用户。
6.根据权利要求5所述的方法,其特征在于,所述获取与所述目标关键词相匹配的关联词,包括:
依据预设词向量模型,获得与所述目标关键词相匹配的关联词;
其中,所述预设词向量模型为根据关联词样本训练得到的模型,用于预测关键词的关联词。
7.一种目标用户的筛选装置,其特征在于,该装置包括:
获取单元,用于响应于接收到信息投放请求,获取用户群体的关键词列表,其中,所述关键词列表表征用户与关键词的映射关系;
确定单元,用于依据所述信息投放请求,确定与待投放信息相匹配的目标关键词;
筛选单元,用于根据所述目标关键词,在所述关键词列表进行筛选,获得与所述目标关键词相匹配的目标用户,使得将与所述信息投放请求对应的待投放信息发送至所述目标用户。
8.根据权利要求7所述的装置,其特征在于,该装置还包括:
列表创建单元,用于创建目标信息的第一关键词列表,所述目标信息表征用户能够获取到的信息;
其中,所述列表创建单元包括:
词库生成子单元,用于依据目标分词,生成分词词库,所述目标分词表征与信息投放关联的词语;
分词子单元,用于依据所述分词词库,对目标信息进行分词处理,得到第一关键词列表,所述目标信息表征用户群体能够获知的信息,所述第一关键词列表表征目标信息与关键词的对应关系;
所述装置还包括:
列表生成单元,用于依据用户获得的目标信息,生成用户群体的关键词列表;
其中,所述列表生成单元包括:
数据清洗子单元,用于对用户获得的目标信息进行数据清洗,得到清洗后的数据;
数据获取子单元,用于按照时间维度,在清洗后的数据中获取用户对目标信息的点击数据;
列表生成子单元,用于依据所述点击数据和所述第一关键词列表,生成用户群体的关键词列表,所述用户群体包括至少一个用户。
9.根据权利要求8所述的装置,其特征在于,所述列表生成子单元具体用于:
依据点击数据,确定关键词的权重值;
通过第一关键词列表,获取用户获得的目标信息的初始关键词;
根据所述关键词的权重值对所述初始关键词进行过滤,得到与所述用户匹配的关键词集合;
依据与所述用户匹配的关键词集合,生成用户群体的关键词列表。
10.根据权利要求7所述的装置,其特征在于,所述筛选单元包括:
关联词获取子单元,用于获取与所述目标关键词相匹配的关联词;
用户筛选子单元,用于依据所述目标关键词和所述关联词,在所述关键词列表进行筛选,获得与所述目标关键词相匹配的目标用户;
所述关联词获取子单元具体用于:
依据预设词向量模型,获得与所述目标关键词相匹配的关联词;
其中,所述预设词向量模型为根据关联词样本训练得到的模型,用于预测关键词的关联词。
CN201910967710.4A 2019-10-12 2019-10-12 一种目标用户的筛选方法及装置 Pending CN110717788A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910967710.4A CN110717788A (zh) 2019-10-12 2019-10-12 一种目标用户的筛选方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910967710.4A CN110717788A (zh) 2019-10-12 2019-10-12 一种目标用户的筛选方法及装置

Publications (1)

Publication Number Publication Date
CN110717788A true CN110717788A (zh) 2020-01-21

Family

ID=69211474

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910967710.4A Pending CN110717788A (zh) 2019-10-12 2019-10-12 一种目标用户的筛选方法及装置

Country Status (1)

Country Link
CN (1) CN110717788A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112528138A (zh) * 2020-11-30 2021-03-19 深圳市中博科创信息技术有限公司 社区活动信息准确推荐方法、终端设备及可读存储介质
CN113643070A (zh) * 2021-08-20 2021-11-12 林秀珍 一种基于大数据的智能信息推送方法及***
CN115101164A (zh) * 2022-06-24 2022-09-23 杭州华卓信息科技有限公司 一种药物推荐方法和***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103514227A (zh) * 2012-06-29 2014-01-15 阿里巴巴集团控股有限公司 一种更新数据库的方法及装置
CN108897734A (zh) * 2018-06-13 2018-11-27 康键信息技术(深圳)有限公司 用户画像生成方法、装置、计算机设备和存储介质
CN109993570A (zh) * 2019-01-14 2019-07-09 深圳市东信时代信息技术有限公司 一种定向投放移动广告的方法及***
CN110020880A (zh) * 2018-01-10 2019-07-16 腾讯科技(深圳)有限公司 广告投放方法、装置及设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103514227A (zh) * 2012-06-29 2014-01-15 阿里巴巴集团控股有限公司 一种更新数据库的方法及装置
CN110020880A (zh) * 2018-01-10 2019-07-16 腾讯科技(深圳)有限公司 广告投放方法、装置及设备
CN108897734A (zh) * 2018-06-13 2018-11-27 康键信息技术(深圳)有限公司 用户画像生成方法、装置、计算机设备和存储介质
CN109993570A (zh) * 2019-01-14 2019-07-09 深圳市东信时代信息技术有限公司 一种定向投放移动广告的方法及***

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112528138A (zh) * 2020-11-30 2021-03-19 深圳市中博科创信息技术有限公司 社区活动信息准确推荐方法、终端设备及可读存储介质
CN113643070A (zh) * 2021-08-20 2021-11-12 林秀珍 一种基于大数据的智能信息推送方法及***
CN115101164A (zh) * 2022-06-24 2022-09-23 杭州华卓信息科技有限公司 一种药物推荐方法和***

Similar Documents

Publication Publication Date Title
CN108509465B (zh) 一种视频数据的推荐方法、装置和服务器
CN108521439B (zh) 一种消息推送的方法和装置
CN106940705B (zh) 一种用于构建用户画像的方法与设备
CN106919619B (zh) 一种商品聚类方法、装置及电子设备
CN106982256B (zh) 信息推送方法、装置、设备及存储介质
CN105989004B (zh) 一种信息投放的预处理方法和装置
US9213996B2 (en) System and method for analyzing social media trends
CN102262647B (zh) 信息处理装置、信息处理方法和程序
US20090177651A1 (en) Information processing device and method, program, and recording medium
CN104090919A (zh) 推荐广告的方法及广告推荐服务器
US20140143013A1 (en) System and method for analyzing social media trends
CN110717788A (zh) 一种目标用户的筛选方法及装置
CN107908616B (zh) 预测趋势词的方法和装置
CN111429161B (zh) 特征提取方法、特征提取装置、存储介质及电子设备
CN112989213B (zh) 内容推荐方法、装置、***、电子设备及存储介质
WO2020258773A1 (zh) 确定推送用户群的方法、装置、设备及存储介质
CN110795613A (zh) 商品搜索方法、装置、***及电子设备
Araújo et al. Tensorcast: forecasting time-evolving networks with contextual information
CN110796505B (zh) 一种业务对象推荐方法以及装置
CN111143546A (zh) 一种获得推荐语的方法、装置及电子设备
CN112989174A (zh) 信息推荐方法及装置、介质和设备
CN113705683B (zh) 推荐模型的训练方法、装置、电子设备及存储介质
US11373210B2 (en) Content interest from interaction information
CN111353688B (zh) 一种用户资源分配方法以及装置
CN110413899B (zh) 服务器存储新闻的存储资源优化方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200121

RJ01 Rejection of invention patent application after publication