CN114996571A - 一种信息推送方法及装置、存储介质和电子设备 - Google Patents

一种信息推送方法及装置、存储介质和电子设备 Download PDF

Info

Publication number
CN114996571A
CN114996571A CN202210538857.3A CN202210538857A CN114996571A CN 114996571 A CN114996571 A CN 114996571A CN 202210538857 A CN202210538857 A CN 202210538857A CN 114996571 A CN114996571 A CN 114996571A
Authority
CN
China
Prior art keywords
user
information
target
characteristic
pushed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210538857.3A
Other languages
English (en)
Inventor
李国库
佟德超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jindi Technology Co Ltd
Original Assignee
Beijing Jindi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jindi Technology Co Ltd filed Critical Beijing Jindi Technology Co Ltd
Priority to CN202210538857.3A priority Critical patent/CN114996571A/zh
Publication of CN114996571A publication Critical patent/CN114996571A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种信息推送方法、装置、存储介质和电子设备,其中方法包括:提取用户特征;提取目标用户的用户特征;提取待推送的目标信息的消息特征;在基于匹配策略确定所述目标信息的推送模式为模型推送模式的情况下,基于双层网络模型对所述用户特征和所述消息特征的处理结果确定是否将所述目标信息作为优选信息推送给所述目标用户;以及在基于匹配策略确定所述目标信息的推送模式为匹配规则推送模式的情况下,基于预定规则比对所述用户特征和所述消息特征以确定是否将所述目标信息作为优选信息推送给所述目标用户。该方法通过用户不同的特征来为不同用户推送不同的信息,实现了信息个性化推送,提升了信息利用率,提升效率。

Description

一种信息推送方法及装置、存储介质和电子设备
技术领域
本发明涉及信息处理领域,尤其是一种信息推送方法及装置、存储介质和电子设备。
背景技术
随着互联网技术的飞速发展,互联网信息呈现***式增长,用户的时间和精力都较为有限,为了提高用户粘性,需要对用户进行分析,向用户精准推送用户感兴趣的信息。以推送新闻为例,当前新闻、快讯等都是运营人员人工筛选新闻推送给全量用户,筛选的新闻千人一面,即所有用户接收到的新闻都相同,忽略了不同用户的兴趣差异,不能保证筛选出来的文章被接收到的用户喜欢。造成推送的新闻点击率较低、波动较大。推送新闻的有效性严重依赖于人工的经验和新闻的热度。
为了解决这一问题,需要通过适当的推送算法来实现个性化的信息推送,从而提升推送的信息的点击率。
发明内容
有鉴于此,本发明提供了一种信息推送方法及装置、存储介质和电子设备,能够解决难以有效地向用户推送信息的技术问题。
本发明提供一种信息推送方法。所述方法包括:
提取目标用户的用户特征;
提取待推送的目标信息的消息特征;
在基于匹配策略确定所述目标信息的推送模式为模型推送模式的情况下,基于双层网络模型对所述用户特征和所述消息特征的处理结果确定是否将所述目标信息作为优选信息推送给所述目标用户,其中,所述双层网络模型的第一层用于接收输入的特征信息并从接收到的输入特征信息中选取对应的特征子集,所述双层网络模型的第二层用于对所述第一层选取的特征子集中的各个特征的权重进行学习;以及
在基于匹配策略确定所述目标信息的推送模式为匹配规则推送模式的情况下,基于预定规则比对所述用户特征和所述消息特征以确定是否将所述目标信息作为优选信息推送给所述目标用户。
可选地,获取所述目标用户的基础数据;以及
基于所述目标用户的基础数据,将对应的用户特征映射为数值,以形成所述目标用户的基础特征。
可选地,获取针对所述目标用户的自定义用户特征;
基于所述目标用户的基础特征,将所述自定义用户特征也映射为对应的数值。
可选地,在所述目标信息的消息特征与所述目标用户的用户特征的相关度高于或等于预设阈值的情况下,确定所述目标信息的推送模式为规则推送模式;
在所述目标信息的消息特征与所述目标用户的用户特征的相关度低于所述预设阈值的情况下,确定所述目标信息的推送模式为模型推送模式。
可选地,所述基于匹配规则推送,即设置匹配规则,所述匹配规则预先选择所述用户特征的子集、待推送的目标信息的消息特征的子集,若所述用户特征的子集与所述待推送的目标信息的消息特征的子集中存在相互匹配的特征,则所述待推送的目标信息作为优选推送信息,用于推送给所述目标用户。
可选地,在将优选信息推送给所述目标用户之前,对优选推送信息进行去重处理。
本发明提供一种信息推送装置。所述装置包括:
用户特征提取模块:配置为提取目标用户的用户特征;
消息特征提取模块:配置为提取待推送的目标信息的消息特征;
模式确定模块:配置为在基于匹配策略确定所述目标信息的推送模式为模型推送模式的情况下,基于双层网络模型对所述用户特征和所述消息特征的处理结果确定是否将所述目标信息作为优选信息推送给所述目标用户,其中,所述双层网络模型的第一层用于接收输入的特征信息并从接收到的输入特征信息中选取对应的特征子集,所述双层网络模型的第二层用于对所述第一层选取的特征子集中的各个特征的权重进行学习;以及
在基于匹配策略确定所述目标信息的推送模式为规则推送模式的情况下,基于预定规则比对所述用户特征和所述消息特征以确定是否将所述目标信息作为优选信息推送给所述目标用户。
本发明提供一种存储介质,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如前任一项所述方法。
本发明提供一种电子设备,所述电子设备,包括:
处理器,用于执行多条指令;
存储器,用于存储多条指令;
其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行如前任一项所述方法。
本发明构建了新闻的内容池,对用户和新闻对应的文章内容提取了多维特征,对计算出的待推送新闻对应的文章去重。即从内容池中获取大量文章,再利用推送算法模型来给每一个用户推送不同的文章,实现文章的个性化推送(push),通过每个人不同的特征的行为等属性来给每个人推送不同的新闻快讯,实现了信息推送的千人千面,提升了快讯点击率,提升效率,减小波动。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
通过结合附图对本发明实施例进行更详细的描述,本发明的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与本发明实施例一起用于解释本发明,并不构成对本发明的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1是本发明一示例性实施例提供的方法的流程示意图。
图2是本发明一示例性实施例提供的方法的效果示意图。
图3是本发明一示例性实施例提供的装置的结构示意图。
图4是本发明一示例性实施例提供的电子设备的结构。
具体实施方式
下面,将参考附图详细地描述根据本发明的示例实施例。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是本发明的全部实施例,应理解,本发明不受这里描述的示例实施例的限制。
应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
本领域技术人员可以理解,本发明实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
还应理解,在本发明实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。
还应理解,对于本发明实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
另外,本发明中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本发明中字符“/”,一般表示前后关联对象是一种“或”的关系。
还应理解,本发明对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,技术、方法和设备应当被视为说明书的一部分。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
本发明实施例可以应用于终端设备、计算机***、服务器等电子设备,其可与众多其它通用或专用计算***环境或配置一起操作。适于与终端设备、计算机***、服务器等电子设备一起使用的众所周知的终端设备、计算***、环境和/或配置的例子包括但不限于:个人计算机***、服务器计算机***、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的***、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机***﹑大型计算机***和包括上述任何***的分布式云计算技术环境,等等。
终端设备、计算机***、服务器等电子设备可以在由计算机***执行的计算机***可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机***/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算***存储介质上。
示例性方法
图1是本发明一示例性实施例提供的信息推送方法的流程示意图。本实施例可应用在电子设备上,如图1所示,包括以下步骤:
步骤S1,提取目标用户的用户特征。
所述用户特征能够表征目标用户的行为特征、喜好特征,即能够反应目标用户自身个性化的特征。本实施例中,所述用户特征具有num1个维度,每个维度对应一个特征,num1个维度的特征能够以第一特征向量的形式表示。所述num1个维度的特征分为营销属性、基本属性、行为属性、交易属性、企业属性五个大类。以某网站或应用作为收集目标用户信息的主体为例,所述营销属性为所述目标用户的注册渠道名称,即所述目标用户通过好友推送进行网站或应用的注册、通过优惠活动进行网站或应用的注册等。所述基本属性为所述目标用户的职业、年龄、性别、地区、城市中的一个或多个。所述行为属性为所述目标用户在所述网站或应用进行搜索、浏览、监控、Push点击、收藏、评论等的行为中抽取的行为属性。所述交易属性为获取所述目标用户在所述网站或应用上的交易信息所提取的属性,例如获取用户的VIP相关数据、消费所开***相关数据(包含单位、消费日期、开票日期、开票次数等)、VIP订单支付数据、企服订单与行为,进而获取目标用户的交易属性。所述企业属性是指目标用户为企业用户,具有企业所处行业、企业纳税行为等信息,进而确定目标用户的企业属性。
进一步地,获取所述目标用户的基础数据;以及基于所述目标用户的基础数据,将对应的用户特征映射为数值,以形成所述目标用户的基础特征。所述基础数据包括所述目标用户的行为数据、注册数据。
进一步地,获取针对所述目标用户的自定义用户特征;基于所述目标用户的基础特征,将所述自定义用户特征也映射为对应的数值。所述自定义用户特征是基于所述目标用户的基础数据,自定义指标及与指标对应的公式,求解出的所述自定义指标的值,即为所述目标用户的自定义用户特征。
本实施例中,以所述网站或应用设置埋点事件为例,所述网站或应用收集到的埋点数据作为获取的用户数据,形成所述目标用户的原始埋点数据宽表。由于埋点数据中获取到的数据并不规整,数据类型繁多,因此,需要将埋点数据中不规整的数据结构结构化。本实施例中,所埋点数据可以作为基础数据,基于埋点数据可以定义若干指标,即自定义指标,根据埋点数据对应的数值,计算得到的所述自定义指标的值,即为所述目标用户的自定义用户特征。
以收集到的埋点数据中的首次活跃日期为例,首次活跃日期对应的数据类型为日期型数据,为了便于后续的使用需要,例如自定义指标可能涉及到的计算,将首次活跃日期对应的具体日期类型的数值转换成距离当前时间的天数,即将日期型数据转换成数值型数据。
再以收集到的埋点数据中的目标用户活跃时间分布为例,其数值形式如下所示:
{"00":0,"01":0,"02":0,"03":0,"04":0,"05":0,"06":3,"07":0,"08":0,"09":2,"10":0,"11":3,"12":0,"13":0,"14":0,"15":1,"16":0,"17":0,"18":0,"19":0,"20":0,"21":0,"22":0,"23":0}。
为了便于后续的使用需要,将目标用户活跃时间分布对应的数值转换成数值型数据,转化为活跃比例最大的整点时间。以该目标用户活跃时间分布对应的数值为例,目标用户在09、11、15时活跃,其最活跃的时间点为11点,则将目标用户活跃时间分布对应的数值转换成11,即表明目标用户在11时最为活跃,且将复杂型数据类型转换为数值型数据。
另以收集到的目标用户的数据中的用户所在城市、阅读喜欢的标签、查询功能偏好等类别型特征为例,因为计算机只能识别数字,因此,需要对一部分类别型用户特征进行解析和编码。如用户特征“三查偏好”,所述三查包括查公司、查老板、查关联关系,将特征值进行解析和编码,编码例如:{“查公司”:1,“查老板”:2,“查关联关系”:3},若收集到的用户的数据确定其特征为“查公司”,那么就将该用户的三查偏好的特征值置为数值1。
步骤S2:提取待推送的目标信息的消息特征。
以所述待推送的目标信息为新闻、文章为例。本实施例中,所述待推送的目标信息的消息特征具有num2个维度,每个维度对应一个特征,num2个维度的特征能够以第二特征向量的形式表示。所述num2个维度的消息特征分为基础特征、交互特征、内容特征、类别特征、情感特征等。
所述待推送的目标信息通常包括标题和内容两部分。相应地,所述待推送的目标信息的特征包括文章来源媒体、文章发送时间、文章浏览、点击、收藏等基础特征。所述交互特征是指所述待推送的目标信息与用户的交互行为,例如,所述待推送的目标信息的浏览、点击、收藏等。所述内容特征用于对所述待推送的目标信息的内容要点进行表征,例如,所述待推送的目标信息的标题字数、标题中各词性的次数、所述待推送的目标信息的要点字数等。所述类别特征指所述待推送的目标信息所属的类别,例如,通过自然语言处理算法提取所述待推送的目标信息的特征,通过分类算法将所述待待推送的目标信息映射到具体类别,所述类别包括但不限于:1、国际2、体育3、娱乐4、社会5、财经6、时事7、科技8、情感9、汽车10、教育11、时尚12、游戏13、军事14、旅游15、美食16、文化17、健康养生18、搞笑19、家居20、动漫21、宠物22、母婴育儿23、星座运势24、历史25、音乐26、综合。所述情感特征是表征所述待推送的目标信息的情感的特征,例如,通过jieba工具包识别出的所述待推送的目标信息中各种词性和实体的数量,文章标题字数、push内容字数,分析所述待推送信息对应的文本内容的情感信息。
步骤S3,在基于匹配策略确定所述目标信息的推送模式为模型推送模式的情况下,基于双层网络模型对所述用户特征和所述消息特征的处理结果确定是否将所述目标信息作为优选信息推送给所述目标用户,其中,所述双层网络模型的第一层用于接收输入的特征信息并从接收到的输入特征信息中选取对应的特征子集,所述双层网络模型的第二层用于对所述第一层选取的特征子集中的各个特征的权重进行学习;以及
在基于匹配策略确定所述目标信息的推送模式为匹配规则推送模式的情况下,基于预定规则比对所述用户特征和所述消息特征以确定是否将所述目标信息作为优选信息推送给所述目标用户。
本实施列中,在所述目标信息的消息特征与所述目标用户的用户特征的相关度高于或等于预设阈值的情况下,确定所述目标信息的推送模式为规则推送模式;在所述目标信息的消息特征与所述目标用户的用户特征的相关度低于所述预设阈值的情况下,确定所述目标信息的推送模式为模型推送模式。
所述双层网络模型的输入为所述用户特征和所述消息特征。所述双层网络模型的第一层用于接收输入的特征,并从所述输入的特征中选取特征子集;所述双层网络模型的第二层用于对选取的所述特征子集中的各个特征的权重进行学习。所述双层网络模型的结构与常规的神经网络模型相同,例如使用CNN、RNN等神经网络模型。本实施例中,使用lightgbm结合lr的方式对所述双层网络模型进行训练。所述双层网络模型的第一层用于接收输入的特征,并使用lightgbm对所述双层网络模型的第一层进行训练,用于从输入的若干个特征中筛选部分特征,组成特征子集,起到降维的作用。使用lr对所述双层网络模型的第二层进行训练,用于对选取的所述特征子集中的各个特征的权重进行学习,能够调整所述特征子集中的各个特征的权重。实现调整所述特征子集中特征的权重,进而影响后续的特征匹配的效果。所述双层网络模型的输出为所述待推送信息与所述用户的匹配得分。
进一步地,所述双层网络模型,是将所述用户特征与所述消息特征拼接,作为所述双层网络模型的输入,获取所述待推送的目标信息与所述目标用户的匹配得分。
进一步地,所述双层神经网络模型设置第二阈值,若所述待推送的目标信息的特征与所述目标用户的用户特征的匹配得分大于或等于所述第二阈值,则所述目标信息作为优选信息,推送给所述目标用户。即基于双层网络模型对所述用户特征和所述消息特征的处理结果确定是否将所述目标信息作为优选信息推送给所述目标用户,本实施例中,所述第二阈值设置为0.7,以保证匹配效果,如果所述待推送的目标信息的特征与所述目标用户的用户特征的匹配得分大于或等于0.7则将所述待推送的目标信息作为优选推送信息,推送给所述目标用户。
进一步地,本实施例支持对多个所述待推送的目标信息的特征与所述目标用户的用户特征的同步匹配,对每个所述待推送的目标信息,构建所述用户特征、所述待推送信息的特征的拼接向量;再将全部待推送信息的拼接向量组合成矩阵,将矩阵输入所述双层网络模型,实现多个待推送的目标信息的特征与所述目标用户的用户特征的同步匹配。
由于神经网络模型具有梯度下降缓慢而陷入局部优化的潜在缺陷,则训练得到的所述双层网络模型存在匹配精度略有不足的潜在缺陷。
因此,本实施例中设置了匹配策略,确定所述待推送的目标信息的推送模式,不同的推送模式采用不同的方式对所述用户特征与待推送的目标信息的特征进行匹配。
所述匹配策略为,若所述待推送的目标信息的消息特征与所述用户特征的相关性高于或等于预设阈值,则采用基于匹配规则推送;否则,基于双层网络模型推送。本实施例中,所述相关性基于欧氏距离等常规方式确定,所述预设阈值基于经验预先设定。
所述基于匹配规则推送,即设置匹配规则,所述匹配规则预先选择所述用户特征的子集、待推送的目标信息的消息特征的子集,若所述用户特征的子集与所述待推送的目标信息的消息特征的子集中存在相互匹配的特征,则所述待推送的目标信息作为优选推送信息,用于推送给所述目标用户。
例如,设置匹配规则为(实体相关;地区;标签;行业),即所述用户特征的子集、待推送的目标信息的消息特征的子集中选取与实体相关、地区、标签、行业对应的特征。其中实体相关用于表明所述待推送的目标信息与所述用户实体对应,其中地区用于表明所述待推送的目标信息涉及到的地区与所述用户对应,其中标签表明所述待推送的目标信息与所述用户标签对应,其中行业表明所述待推送的目标信息与所述用户行业一致。若所述待推送的目标信息的特征具有15个特征,所述用户特征具有12个特征,二者都具有实体相关、地区、标签、行业特征,且特征值相匹配,则所述用户特征的子集、待推送的目标信息的消息特征的子集中的全部特征都是相互匹配的,则所述所述待推送的目标信息作为优选推送信息,用于推送给所述目标用户。
进一步地,在所述步骤S1,提取目标用户的用户特征之前,包括:
获取所述待推送的目标信息,对所述待推送的目标信息进行预处理。
本实施例中,例如,从合作媒体网站爬取新闻、快讯作为待推送的目标信息。对所述待推送的目标信息的预处理包括:对所述待推送的目标信息进行解析和清洗,用于去除掉所述待推送的目标信息中多余的html标签、由转码导致的乱码、乱码造成的特殊符号、无效链接、过滤敏感词等。所述无效链接例如由于不完整导致无法打开链接,所述过滤敏感词可以通过设置敏感词黑名单的方式,将所述待推送的目标信息与所述敏感词黑名单中的敏感词进行比较,若存在相同的词组,则过滤掉所述待推送信息,实现低俗不良等信息的过滤。
进一步地,预处理后的待推送的目标信息存储于内容池。所述内容池为存储待推送的目标信息和/或预处理后的待推送的目标信息的数据库。
进一步地,在所述步骤S3之后,还包括步骤S4。
所述步骤S4,确定用于推送的优选推送信息,在将优选信息推送给所述目标用户之前,对优选推送信息进行去重处理。
本实施例中,对所述优选推送信息去重,以保证用户接收到不重复的优选推送信息。不会接收到多个重复的同一优选推送信息,或内容高度相仿的多个优选推送信息。
进一步地,对各个所述优选推送信息计算索引,并为其分配索引值similar_key。在内容池对应的数据表中增加索引列,用于记录similar_key。基于所述优选推送信息的标题和/或文本相似度,确定所述优选推送信息的相同或相似性。将相同或者相似的优选推送信息会分配一个相同的索引值similar_key,再通过所述索引值similar_key来对所述优选推送信息去重。
计算索引值的方式为:对某一所述优选推送信息中的句子划分为长句及短句,划分长句与短句的标准为本领域通用的划分标准。基于符号、字数阈值对所述短句进行多轮切分,使切分后的子句长度在预设范围内。本实施例中,所述字数阈值例如为20,所述符号包括顿号、逗号、分号、句号等标点符号。将切割好的子句,与所述待推送信息中的长句比较,返回格式塔及编辑距离中比较大的数值。基于返回的数据、以及切割后的子句占短句长度的比例进行加权,比较该加权值与所述内容池中其它推送信息的加权值的相似度。相似度大于或等于阈值则认为是相近的文章,设定相同的similar_key。
计算索引值的又一方式为:对所述优选推送信息中的句子划分为长句及短句,划分长句与短句的标准为本领域通用的划分标准。基于符号、字数阈值对所述短句进行多轮切分,使切分后的子句长度在预设范围内。本实施例中,所述字数阈值例如为20,所述符号包括顿号、逗号、分号、句号等标点符号。将切割好的子句,与所述待推送信息中的长句比较,返回格式塔及编辑距离中比较大的数值。基于返回的数据、以及切割后的子句占短句长度的比例进行加权,获得的数值作为所述优选推送信息的索引值。将索引值相同的优选推送信息作为相同的优选推送信息,将索引值偏差度小于阈值的优选推送信息作为相似的优选推送信息。在一组相似的优选推送信息中,将优选推送信息的特征与所述用户特征的匹配得分最高的优选推送信息推送给用户。
图2是本发明一示例性实施例提供的信息推送方法的技术效果图。
示例性装置
图3是本发明一示例性实施例提供的信息推送装置的结构示意图。如图3所示,本实施例包括:
用户特征提取模块:配置为提取目标用户的用户特征;
消息特征提取模块:配置为提取待推送的目标信息的消息特征;
模式确定模块:配置为在基于匹配策略确定所述目标信息的推送模式为模型推送模式的情况下,基于双层网络模型对所述用户特征和所述消息特征的处理结果确定是否将所述目标信息作为优选信息推送给所述目标用户,其中,所述双层网络模型的第一层用于接收输入的特征信息并从接收到的输入特征信息中选取对应的特征子集,所述双层网络模型的第二层用于对所述第一层选取的特征子集中的各个特征的权重进行学习;以及
在基于匹配策略确定所述目标信息的推送模式为规则推送模式的情况下,基于预定规则比对所述用户特征和所述消息特征以确定是否将所述目标信息作为优选信息推送给所述目标用户。
示例性电子设备
图4是本发明一示例性实施例提供的电子设备的结构。该电子设备可以是第一设备和第二设备中的任一个或两者、或与它们独立的单机设备,该单机设备可以与第一设备和第二设备进行通信,以从它们接收所采集到的输入信号。图4图示了根据本公开实施例的电子设备的框图。如图4所示,电子设备包括一个或多个处理器41和存储器42。
处理器41可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备中的其他组件以执行期望的功能。
存储器42可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器41可以运行所述程序指令,以实现上文所述的本公开的各个实施例的软件程序的信息推送方法以及/或者其他期望的功能。在一个示例中,电子设备还可以包括:输入装置43和输出装置44,这些组件通过总线***和/或其他形式的连接机构(未示出)互连。
此外,该输入装置43还可以包括例如键盘、鼠标等等。
该输出装置44可以向外部输出各种信息。该输出装置34可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图4中仅示出了该电子设备中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的信息推送方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的信息推送方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于***实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本公开中涉及的器件、装置、设备、***的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、***。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (9)

1.一种信息推送方法,其特征在于,包括:
提取目标用户的用户特征;
提取待推送的目标信息的消息特征;
在基于匹配策略确定所述目标信息的推送模式为模型推送模式的情况下,基于双层网络模型对所述用户特征和所述消息特征的处理结果确定是否将所述目标信息作为优选信息推送给所述目标用户,其中,所述双层网络模型的第一层用于接收输入的特征信息并从接收到的输入特征信息中选取对应的特征子集,所述双层网络模型的第二层用于对所述第一层选取的特征子集中的各个特征的权重进行学习;以及
在基于匹配策略确定所述目标信息的推送模式为匹配规则推送模式的情况下,基于预定规则比对所述用户特征和所述消息特征以确定是否将所述目标信息作为优选信息推送给所述目标用户。
2.如权利要求1所述的方法,其特征在于,还包括:
获取所述目标用户的基础数据;以及
基于所述目标用户的基础数据,将对应的用户特征映射为数值,以形成所述目标用户的基础特征。
3.根据权利要求2所述的方法,其特征在于,还包括:
获取针对所述目标用户的自定义用户特征;
基于所述目标用户的基础特征,将所述自定义用户特征也映射为对应的数值。
4.如权利要求1所述的方法,其特征在于:
在所述目标信息的消息特征与所述目标用户的用户特征的相关度高于或等于预设阈值的情况下,确定所述目标信息的推送模式为规则推送模式;
在所述目标信息的消息特征与所述目标用户的用户特征的相关度低于所述预设阈值的情况下,确定所述目标信息的推送模式为模型推送模式。
5.如权利要求1所述的方法,其特征在于,所述基于匹配规则推送,即设置匹配规则,所述匹配规则预先选择所述用户特征的子集、待推送的目标信息的消息特征的子集,若所述用户特征的子集与所述待推送的目标信息的消息特征的子集中存在相互匹配的特征,则所述待推送的目标信息作为优选推送信息,用于推送给所述目标用户。
6.如权利要求1所述的方法,其特征在于,还包括:
在将优选信息推送给所述目标用户之前,对优选推送信息进行去重处理。
7.一种信息推送装置,其特征在于,包括:
用户特征提取模块:配置为提取目标用户的用户特征;
消息特征提取模块:配置为提取待推送的目标信息的消息特征;
模式确定模块:配置为在基于匹配策略确定所述目标信息的推送模式为模型推送模式的情况下,基于双层网络模型对所述用户特征和所述消息特征的处理结果确定是否将所述目标信息作为优选信息推送给所述目标用户,其中,所述双层网络模型的第一层用于接收输入的特征信息并从接收到的输入特征信息中选取对应的特征子集,所述双层网络模型的第二层用于对所述第一层选取的特征子集中的各个特征的权重进行学习;以及
在基于匹配策略确定所述目标信息的推送模式为规则推送模式的情况下,基于预定规则比对所述用户特征和所述消息特征以确定是否将所述目标信息作为优选信息推送给所述目标用户。
8.一种计算机可读存储介质,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如权利要求1-6中任一项所述方法。
9.一种电子设备,其特征在于,所述电子设备,包括:
处理器,用于执行多条指令;
存储器,用于存储多条指令;
其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行如权利要求1-6中任一项所述方法。
CN202210538857.3A 2022-05-17 2022-05-17 一种信息推送方法及装置、存储介质和电子设备 Pending CN114996571A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210538857.3A CN114996571A (zh) 2022-05-17 2022-05-17 一种信息推送方法及装置、存储介质和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210538857.3A CN114996571A (zh) 2022-05-17 2022-05-17 一种信息推送方法及装置、存储介质和电子设备

Publications (1)

Publication Number Publication Date
CN114996571A true CN114996571A (zh) 2022-09-02

Family

ID=83026394

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210538857.3A Pending CN114996571A (zh) 2022-05-17 2022-05-17 一种信息推送方法及装置、存储介质和电子设备

Country Status (1)

Country Link
CN (1) CN114996571A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116405453A (zh) * 2023-04-23 2023-07-07 中航信移动科技有限公司 一种基于多特征的信息推送方法、存储介质及电子设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116405453A (zh) * 2023-04-23 2023-07-07 中航信移动科技有限公司 一种基于多特征的信息推送方法、存储介质及电子设备

Similar Documents

Publication Publication Date Title
Chua et al. Automatic summarization of events from social media
US8676730B2 (en) Sentiment classifiers based on feature extraction
US10565519B2 (en) Systems and method for performing contextual classification using supervised and unsupervised training
Venugopalan et al. Exploring sentiment analysis on twitter data
US8972408B1 (en) Methods, systems, and articles of manufacture for addressing popular topics in a social sphere
Alharbi et al. Evaluation of sentiment analysis via word embedding and RNN variants for Amazon online reviews
US11727211B2 (en) Systems and methods for colearning custom syntactic expression types for suggesting next best correspondence in a communication environment
Kaur Incorporating sentimental analysis into development of a hybrid classification model: A comprehensive study
CN107832338B (zh) 一种识别核心产品词的方法和***
CN113934941B (zh) 一种基于多维度信息的用户推荐***及方法
Yun et al. Computationally analyzing social media text for topics: A primer for advertising researchers
Yang et al. A topic model for co-occurring normal documents and short texts
Sasmita et al. Unsupervised aspect-based sentiment analysis on Indonesian restaurant reviews
Rani et al. Study and comparision of vectorization techniques used in text classification
Tang et al. Evaluation of Chinese sentiment analysis APIs based on online reviews
CN112115712A (zh) 基于话题的群体情感分析方法
US20230214679A1 (en) Extracting and classifying entities from digital content items
Al-Otaibi et al. Finding influential users in social networking using sentiment analysis
US10614100B2 (en) Semantic merge of arguments
CN114996571A (zh) 一种信息推送方法及装置、存储介质和电子设备
CN111737607B (zh) 数据处理方法、装置、电子设备以及存储介质
CN117113973A (zh) 一种信息处理方法及相关装置
Lo et al. An emperical study on application of big data analytics to automate service desk business process
Clarizia et al. Sentiment analysis in social networks: A methodology based on the latent dirichlet allocation approach
Pera et al. Web-based closed-domain data extraction on online advertisements

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination