CN115208946B - 一种消息推送方法、消息推送服务器及存储介质 - Google Patents

一种消息推送方法、消息推送服务器及存储介质 Download PDF

Info

Publication number
CN115208946B
CN115208946B CN202210843062.3A CN202210843062A CN115208946B CN 115208946 B CN115208946 B CN 115208946B CN 202210843062 A CN202210843062 A CN 202210843062A CN 115208946 B CN115208946 B CN 115208946B
Authority
CN
China
Prior art keywords
keyword
suspicious
message
preset
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210843062.3A
Other languages
English (en)
Other versions
CN115208946A (zh
Inventor
夏苗苗
王玉婷
吕婉晴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202210843062.3A priority Critical patent/CN115208946B/zh
Publication of CN115208946A publication Critical patent/CN115208946A/zh
Application granted granted Critical
Publication of CN115208946B publication Critical patent/CN115208946B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种消息推送方法、消息推送服务器及存储介质,可以应用于移动互联领域或金融领域,其中,方法包括:接收目标移动终端发送的消息推送请求,对初始关键词组中的各初始关键词:确定该初始关键词的词语类型,并调用与词语类型对应的预设词语数据表,基于预设词语数据表计算该初始关键词的匹配度,基于匹配度对各初始关键词进行筛选,获得关键词组和可疑关键词组,对各可疑关键词:利用预设误判检验算法,根据该可疑关键词的词语类型计算关联参数,将关联参数大于第二预设阈值的各可疑关键词确定为备选关键词,根据关键词组和各备选关键词,确定待推送消息,并将待推送消息推送至目标移动终端。本发明提高了消息推送的准确度。

Description

一种消息推送方法、消息推送服务器及存储介质
技术领域
本发明涉及互联网技术领域,特别是涉及一种消息推送方法、消息推送服务器及存储介质。
背景技术
伴随着终端应用的普及,出于提升用户体验及业务拓展的需求,基于应用信息和服务推广的消息推送服务愈加频繁。消息推送方式多是通过消息服务器将全量的消息进行推送。但是,这些全量推送的消息与用户需求的匹配度较低,导致消息推送的准确度降低。因此,现有技术采用机器学习模型,通过获取用户浏览数据对待推送的消息进行过滤的方式来提高消息推送的准确度。然而,由于机器学习模型具有较强的泛化性,导致在进行过滤时,机器学习模型会错误的将与用户需求匹配的部分消息过滤掉,从而使得消息推送的准确度降低。
发明内容
本发明实施例的目的在于提供一种消息推送方法、消息推送服务器及存储介质,以实现提高消息推送的准确度的发明目的。具体技术方案如下:
一种消息推送方法,所述消息推送方法包括:
接收目标移动终端发送的消息推送请求,其中,所述消息推送请求包括初始关键词组。
对所述初始关键词组中的各初始关键词:确定该初始关键词的词语类型,并调用与所述词语类型对应的预设词语数据表,基于所述预设词语数据表计算该初始关键词的匹配度。
基于所述匹配度对各初始关键词进行筛选,获得关键词组和可疑关键词组,其中,所述可疑关键词组包括多个可疑关键词,所述可疑关键词的所述匹配度小于第一预设阈值。
对各可疑关键词:利用预设误判检验算法,根据该可疑关键词的所述词语类型计算该可疑关键词的关联参数。
将所述关联参数大于第二预设阈值的各所述可疑关键词确定为备选关键词,其中所述第一预设阈值和所述第二预设阈值不同。
根据所述关键词组和各备选关键词,确定待推送消息,并将所述待推送消息推送至所述目标移动终端。
可选的,所述利用预设误判检验算法,根据该可疑关键词的所述词语类型计算该可疑关键词的关联参数,包括:
根据该可疑关键词的所述词语类型,确定该可疑关键词的词频和逆文档频率。
利用所述预设误判检验算法,对所述词频和所述逆文档频率进行乘积运算,并将运算结果确定为该可疑关键词的所述关联参数。
可选的,所述根据该可疑关键词的所述词语类型,确定该可疑关键词的词频和逆文档频率,包括:
根据该可疑关键词的所述词语类型确定第一数值,其中,所述第一数值是所述可疑关键词组中,与该可疑关键词的词语类型一致的可疑关键词的数量。
将该可疑关键词在所述第一数值中出现的次数确定为第二数值。
利用所述预设误判检验算法,将所述第二数值除以所述第一数值的商值,确定为该可疑关键词的所述词频。
可选的,所述根据该可疑关键词的所述词语类型,确定该可疑关键词的词频和逆文档频率,还包括:
将所述可疑关键词组中的可疑关键词总数确定为第三数值。
通过公式:
IDFt=lg(Dn/Nt),
计算该可疑关键词t的所述逆文档频率IDFt,其中,所述Dn是所述第三数值,所述Nt是所述第二数值,所述n是所述可疑关键词组中的可疑关键词个数。
可选的,所述基于所述预设词语数据表计算该初始关键词的匹配度,包括:
将该初始关键词和所述预设词语数据表中的各词语数据作为输入,输入至预设字符串匹配算法中,获得由所述预设字符串匹配算法输出的所述匹配度,其中,所述匹配度表征了该初始关键词与所述预设词语数据表中各词语数据的关联程度。
可选的,所述消息推送请求还包括所述移动终端的终端使用数据,所述将所述待推送消息推送至所述目标移动终端,包括:
读取所述终端使用数据中的使用时段。
判断所述待推送消息的推送时刻是否处于所述使用时段内,若是,则将所述待推送消息推送至所述目标移动终端。
一种消息推送服务器,所述消息推送服务器包括:
数据接收模块,用于接收目标移动终端发送的消息推送请求,其中,所述消息推送请求包括初始关键词组。
匹配度计算模块,用于对所述初始关键词组中的各初始关键词:确定该初始关键词的词语类型,并调用与所述词语类型对应的预设词语数据表,基于所述预设词语数据表计算该初始关键词的匹配度。
第一数据筛选模块,基于所述匹配度对各初始关键词进行筛选,获得关键词组和可疑关键词组,其中,所述可疑关键词组包括多个可疑关键词,所述可疑关键词的所述匹配度小于第一预设阈值。
误判检验模块,用于对各可疑关键词:利用预设误判检验算法,根据该可疑关键词的所述词语类型计算该可疑关键词的关联参数。
第二数据筛选模块,用于将所述关联参数大于第二预设阈值的各所述可疑关键词确定为备选关键词,其中所述第一预设阈值和所述第二预设阈值不同。
消息推送模块,用于根据所述关键词组和各备选关键词,确定待推送消息,并将所述待推送消息推送至所述目标移动终端。
可选的,所述误判检验模块被设置为:
根据该可疑关键词的所述词语类型,确定该可疑关键词的词频和逆文档频率。
利用所述预设误判检验算法,对所述词频和所述逆文档频率进行乘积运算,并将运算结果确定为该可疑关键词的所述关联参数。
可选的,所述误判检验模块在根据该可疑关键词的所述词语类型,确定该可疑关键词的词频和逆文档频率时,被设置为:
根据该可疑关键词的所述词语类型确定第一数值,其中,所述第一数值是所述可疑关键词组中,与该可疑关键词的词语类型一致的可疑关键词的数量。
将该可疑关键词在所述第一数值中出现的次数确定为第二数值。
利用所述预设误判检验算法,将所述第二数值除以所述第一数值的商值,确定为该可疑关键词的所述词频。
可选的,所述误判检验模块在根据该可疑关键词的词语类型,确定该可疑关键词的词频和逆文档频率时,还被设置为:
将所述可疑关键词组中的可疑关键词总数确定为第三数值。
通过公式:
IDFt=lg(Dn/Nt),
计算该可疑关键词t的所述逆文档频率IDFt,其中,所述Dn是所述第三数值,所述Nt是所述第二数值,所述n是所述可疑关键词组中的可疑关键词个数。
可选的,所述匹配度计算模块被设置为:
将该初始关键词和所述预设词语数据表中的各词语数据作为输入,输入至预设字符串匹配算法中,获得由所述预设字符串匹配算法输出的所述匹配度,其中,所述匹配度表征了该初始关键词与所述预设词语数据表中各词语数据的关联程度。
可选的,所述消息推送模块被设置为:
读取所述终端使用数据中的使用时段。
判断所述待推送消息的推送时刻是否处于所述使用时段内,若是,则将所述待推送消息推送至所述目标移动终端。
一种消息推送服务器,所述消息推送服务器包括:
处理器;
用于存储所述处理器可执行指令的存储器。
其中,所述处理器被配置为执行所述指令,以实现如上述任一项所述的消息推送方法。
一种计算机可读存储介质,当所述计算机可读存储介质中的指令由消息推送服务器的处理器执行时,使得所述消息推送服务器能够执行如上述任一项所述的消息推送方法。
本发明实施例提供的消息推送方法、消息推送服务器及存储介质,通过预设的匹配度计算模型计算初始关键词的匹配度,可以实现对初始关键词词语类型的二次校验。从而提高对初始关键词的词语类型的确定精度。进而提升最终根据该初始关键词确定待推送消息的准确度。同时,通过引入预设误判检验算法,计算关联参数,从而对可疑关键词与词语类型的关联性进行校验。使得本发明相较于现有技术,避免了由于机器学习模型的泛化性,导致对关键词进行误过滤的风险。提高了对关键词的词语类型的确定精度,进而提高了最终的消息推送准确度。可见,本发明实现了提高消息推送准确度的发明目的。
当然,实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种消息推送方法的流程图;
图2为本发明的一个可选实施例提供的一种消息推送服务器的框图;
图3为本发明的另一个可选实施例提供的一种消息推送服务器的框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明提供的一种消息推送方法、消息推送服务器及存储介质,可用于移动互联领域或金融领域。上述仅为示例,并不对本发明提供的一种消息推送方法、消息推送服务器及存储介质的应用领域进行限定。
本发明实施例提供了一种消息推送方法,如图1所示,该消息推送方法包括:
S101、接收目标移动终端发送的消息推送请求,其中,消息推送请求包括初始关键词组。
其中,上述消息推送请求可以是由部署于上述目标移动终端中的应用插件发送的。
可选的,在本发明的一个可选实施例中,上述初始关键词组可以是由表征用户订阅需求或意图的关键词构成的数据组。初始关键词组可以包括多种类型的初始关键字,例如用户的职业、订阅的公众号名称、浏览器搜索数据、浏览网页标题、浏览器标签内容等。本发明基于上述初始关键词组对推送消息进行过滤,可以提高消息推送的准确度。
S102、对初始关键词组中的各初始关键词:确定该初始关键词的词语类型,并调用与词语类型对应地预设词语数据表,基于预设词语数据表计算该初始关键词的匹配度。
可选的,在本发明的一个可选实施例中,上述初始关键词的词语类型,可根据初始关键词的类型标签确定。例如:判断该初始关键词的类型标签,是否存在与预设类型数据表中的数据匹配,若是,则预设类型数据表中与该类型标签匹配的词语类型,确定为该初始关键词的词语类型。
可选的,在本发明的另一个可选实施例中,上述预设词语数据表可以是根据历史统计数据确定的,包括多个词语类型一致的词语的数据表。例如,设定当前预设词语数据表匹配的词语类型为“金融”,则该表中的词语可以是“原油价格”、“黄金价格”等词语。
可选的,在本发明的另一个可选实施例中,本发明通过预设的匹配度计算模型计算上述初始关键词的匹配度,可以实现对初始关键词词语类型的二次校验。从而提高对初始关键词的词语类型的确定精度。进而提升最终根据该初始关键词确定待推送消息的准确度。
S103、基于匹配度对各初始关键词进行筛选,获得关键词组和可疑关键词组,其中,可疑关键词组包括多个可疑关键词,可疑关键词的匹配度小于第一预设阈值。
需要说明的是,在实际应用场景中,上述第一预设阈值可以根据历史数据以及上述预设的匹配度计算模型的计算精度来确定,本发明对该第一预设阈值的具体数值及确定方式不作过多限定和赘述。
S104、对各可疑关键词:利用预设误判检验算法,根据该可疑关键词的词语类型计算该可疑关键词的关联参数。
其中,上述预设误判检验算法可以是基于词频-逆文档频率(TermFrequency–Inverse Document Frequency,TF-IDF)技术构建的文本挖掘算法。
其中,上述关联参数可以是用于表征该可疑关键词与上述词语类型间关联程度的参数。
需要说明的是,上述TF-IDF的技术构思是对存在于一个语料库中的词语,该词语与该语料库的关联性,会随着词语在语料库中出现的次数成正比增加,同时会伴随其在语料库中出现的频率成反比下降。因此,在上述如图1所示的步骤S103中,上述匹配度会伴随预设词语数据表中词语的数量产生波动,例如,若表中词语数量多,则初始关键词与该数据表中词语匹配的几率大。若表中词语数量少,则初始关键词与数据表中词语匹配的几率小。从而导致经过上述如图1所示的步骤S103筛选出的可疑关键词,存在一定误判的几率。本发明通过引入上述预设误判检验算法,计算上述关联参数,从而对上述可疑关键词与词语类型的关联性进行校验。使得本发明相较于现有技术,避免了由于机器学习模型的泛化性,导致对关键词进行误过滤的风险。提高了对关键词的词语类型的确定精度,进而提高了最终的消息推送准确度。
S105、将关联参数大于第二预设阈值的各可疑关键词确定为备选关键词,其中第一预设阈值和第二预设阈值不同。
可选的,在本发明的一个可选实施例中,上述如图1所示的步骤S103和步骤S105中预设阈值进行词语过滤的方式可以有多种,例如通过随机抽样一致(RandomSampleConsensus,RANSAC)算法实现。
S106、根据关键词组和各备选关键词,确定待推送消息,并将待推送消息推送至目标移动终端。
可选的,在本发明的一个可选实施例中,上述如图1所示的步骤S106可以存在多种实现方式,例如:
提取各备选关键词和关键词组中各关键词的词语类型的类型标识符。并将预设推送消息库中,与各类型标识符对应的推送消息确定为上述待推送消息。然后根据目标移动终端的标识符,调用对应的通讯接口。将待推送消息通过该通讯接口发送至目标移动终端。
本发明通过预设的匹配度计算模型计算初始关键词的匹配度,可以实现对初始关键词词语类型的二次校验。从而提高对初始关键词的词语类型的确定精度。进而提升最终根据该初始关键词确定待推送消息的准确度。同时,通过引入预设误判检验算法,计算关联参数,从而对可疑关键词与词语类型的关联性进行校验。使得本发明相较于现有技术,避免了由于机器学习模型的泛化性,导致对关键词进行误过滤的风险。提高了对关键词的词语类型的确定精度,进而提高了最终的消息推送准确度。可见,本发明实现了提高消息推送准确度的发明目的。
可选的,利用预设误判检验算法,根据该可疑关键词的词语类型计算该可疑关键词的关联参数,包括:
根据该可疑关键词的词语类型,确定该可疑关键词的词频和逆文档频率。
利用预设误判检验算法,对词频和逆文档频率进行乘积运算,并将运算结果确定为该可疑关键词的关联参数。
可选的,根据该可疑关键词的词语类型,确定该可疑关键词的词频和逆文档频率,包括:
根据该可疑关键词的词语类型确定第一数值,其中,第一数值是可疑关键词组中,与该可疑关键词的词语类型一致的可疑关键词的数量。
将该可疑关键词在第一数值中出现的次数确定为第二数值。
利用预设误判检验算法,将第二数值除以第一数值的商值,确定为该可疑关键词的词频。
可选的,上述根据该可疑关键词的词语类型,确定该可疑关键词的词频和逆文档频率,还包括:
将可疑关键词组中的可疑关键词总数确定为第三数值。
通过公式:
IDFt=lg(Dn/Nt),
计算该可疑关键词t的逆文档频率IDFt,其中,Dn是第三数值,Nt是第二数值,n是可疑关键词组中的可疑关键词个数。
需要说明的是,在实际应用场景下,上述根据该可疑关键词的词语类型,确定该可疑关键词的词频和逆文档频率的实施方式有多种,在此示例性的提供一种:
设定当前可疑关键词组中包括10个可疑关键词。这些关键词共存在3个词语类型。其中的一个词语类型是“金融”。与该词语类型匹配的关键词有3个,分别是“油价”、“粮价”和“油价”。需要说明的是,由于上述初始关键词的来源可以有多种,因此上述“油价”可以是由用户订阅的公众号名称和浏览器搜索数据中分别提取的两个关键词。
则对于“粮价”这一关键词,由于当前可疑关键词组中与“粮价”的词语类型一致的可疑关键词有3个,因此,上述第一数值为3。由于“粮价”只出现了1次,则上述第二数值为1。则通过公式:
TF=Nt/Nn
求得“粮价”的词频(TermFrequency,TF)是1/3。
又由于当前可疑关键词组中包括10个可疑关键词,则上述第三数值为10。则通过上述公式求得“粮价”拟文档频率是1。
可选的,基于预设词语数据表计算该初始关键词的匹配度,包括:
将该初始关键词和预设词语数据表中的各词语数据作为输入,输入至预设字符串匹配算法中,获得由预设字符串匹配算法输出的匹配度,其中,匹配度表征了该初始关键词与预设词语数据表中各词语数据的关联程度。
需要说明的是,在实际应用场景下,上述预设字符串匹配算法的具体类型可以有多种,例如模式匹配(The Knuth-Morris-Pratt Algorithm,KMP)算法。本发明对该算法的具体构建过程不作过多限定和赘述。
可选的,消息推送请求还包括移动终端的终端使用数据,将待推送消息推送至目标移动终端,包括:
读取终端使用数据中的使用时段。
判断待推送消息的推送时刻是否处于使用时段内,若是,则将待推送消息推送至目标移动终端。
需要说明的是,上述终端使用数据除上述使用时段外,还可以包括浏览器使用时段、终端定位数据等。本发明对终端使用数据的具体类型不作过多限定。
可选的,在本发明的一个可选实施例中,由于上述待推送消息中的类型属于用户的个人隐私数据。因此,为了避免由于待推送消息被窃取而导致隐私泄露的问题,可以通过区块链进行上述待推送消息的推送。其具体实施方式可以是:
将待推送消息压缩为数据块,并对数据块进行上链操作。并设定对应的发送触发条件。在当前时刻满足上述触发条件的触发要求时,存储有上述数据块的区块链节点将数据块通过区块链发送至部署于目标移动终端的应用插件中。
与上述方法实施例相对应地,本发明还提供了一种消息推送服务器,如图2所示,该消息推送服务器包括:
数据接收模块201,用于接收目标移动终端发送的消息推送请求,其中,消息推送请求包括初始关键词组。
匹配度计算模块202,用于对初始关键词组中的各初始关键词:确定该初始关键词的词语类型,并调用与词语类型对应地预设词语数据表,基于预设词语数据表计算该初始关键词的匹配度。
第一数据筛选模块203,基于匹配度对各初始关键词进行筛选,获得关键词组和可疑关键词组,其中,可疑关键词组包括多个可疑关键词,可疑关键词的匹配度小于第一预设阈值。
误判检验模块204,用于对各可疑关键词:利用预设误判检验算法,根据该可疑关键词的词语类型计算该可疑关键词的关联参数。
第二数据筛选模块205,用于将关联参数大于第二预设阈值的各可疑关键词确定为备选关键词,其中第一预设阈值和第二预设阈值不同。
消息推送模块206,用于根据关键词组和各备选关键词,确定待推送消息,并将待推送消息推送至目标移动终端。
可选的,上述误判检验模块204被设置为:
根据该可疑关键词的词语类型,确定该可疑关键词的词频和逆文档频率。
利用预设误判检验算法,对词频和逆文档频率进行乘积运算,并将运算结果确定为该可疑关键词的关联参数。
可选的,上述误判检验模块204在根据该可疑关键词的词语类型,确定该可疑关键词的词频和逆文档频率时,被设置为:
根据该可疑关键词的词语类型确定第一数值,其中,第一数值是可疑关键词组中,与该可疑关键词的词语类型一致的可疑关键词的数量。
将该可疑关键词在第一数值中出现的次数确定为第二数值。
利用预设误判检验算法,将第二数值除以第一数值的商值,确定为该可疑关键词的词频。
可选的,上述误判检验模块204在根据该可疑关键词的词语类型,确定该可疑关键词的词频和逆文档频率时,还被设置为:
将可疑关键词组中的可疑关键词总数确定为第三数值。
通过公式:
IDFt=lg(Dn/Nt),
计算该可疑关键词t的逆文档频率IDFt,其中,Dn是第三数值,Nt是第二数值,n是可疑关键词组中的可疑关键词个数。
可选的,上述匹配度计算模块202被设置为:
将该初始关键词和预设词语数据表中的各词语数据作为输入,输入至预设字符串匹配算法中,获得由预设字符串匹配算法输出的匹配度,其中,匹配度表征了该初始关键词与预设词语数据表中各词语数据的关联程度。
可选的,上述消息推送模块206被设置为:
读取终端使用数据中的使用时段。
判断待推送消息的推送时刻是否处于使用时段内,若是,则将待推送消息推送至目标移动终端。
本发明实施例还提供了一种消息推送服务器,如图3所示,该消息推送服务器包括:
处理器301;
用于存储处理器301可执行指令的存储器302。
其中,处理器301被配置为执行指令,以实现如上述任一项的消息推送方法。
本发明实施例还提供了一种计算机可读存储介质,当计算机可读存储介质中的指令由消息推送服务器的处理器执行时,使得消息推送服务器能够执行如上述任一项的消息推送方法。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
本领域技术人员应明白,本申请的实施例可提供为方法、***或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (7)

1.一种消息推送方法,其特征在于,所述消息推送方法包括:
接收目标移动终端发送的消息推送请求,其中,所述消息推送请求包括初始关键词组;
对所述初始关键词组中的各初始关键词:确定该初始关键词的词语类型,并调用与所述词语类型对应的预设词语数据表,基于所述预设词语数据表计算该初始关键词的匹配度;
基于所述匹配度对各初始关键词进行筛选,获得关键词组和可疑关键词组,其中,所述可疑关键词组包括多个可疑关键词,所述可疑关键词的所述匹配度小于第一预设阈值;
对各可疑关键词:根据该可疑关键词的所述词语类型确定第一数值,其中,所述第一数值是所述可疑关键词组中,与该可疑关键词的词语类型一致的可疑关键词的数量;将该可疑关键词在所述第一数值中出现的次数确定为第二数值;利用预设误判检验算法,将所述第二数值除以所述第一数值的商值,确定为该可疑关键词的词频;利用所述预设误判检验算法,对所述词频和逆文档频率进行乘积运算,并将运算结果确定为该可疑关键词的关联参数;
将所述关联参数大于第二预设阈值的各所述可疑关键词确定为备选关键词,其中所述第一预设阈值和所述第二预设阈值不同;
根据所述关键词组和各备选关键词,确定待推送消息,并将所述待推送消息推送至所述目标移动终端。
2.根据权利要求1所述的消息推送方法,其特征在于,所述逆文档频率的生成过程,包括:
将所述可疑关键词组中的可疑关键词总数确定为第三数值;
通过公式:
IDFt=lg(Dn/Nt),
计算该可疑关键词t的所述逆文档频率IDFt,其中,所述Dn是所述第三数值,所述Nt是所述第二数值,所述n是所述可疑关键词组中的可疑关键词个数。
3.根据权利要求1所述的消息推送方法,其特征在于,所述基于所述预设词语数据表计算该初始关键词的匹配度,包括:
将该初始关键词和所述预设词语数据表中的各词语数据作为输入,输入至预设字符串匹配算法中,获得由所述预设字符串匹配算法输出的所述匹配度,其中,所述匹配度表征了该初始关键词与所述预设词语数据表中各词语数据的关联程度。
4.根据权利要求1所述的消息推送方法,其特征在于,所述消息推送请求还包括所述移动终端的终端使用数据,所述将所述待推送消息推送至所述目标移动终端,包括:
读取所述终端使用数据中的使用时段;
判断所述待推送消息的推送时刻是否处于所述使用时段内,若是,则将所述待推送消息推送至所述目标移动终端。
5.一种消息推送服务器,其特征在于,所述消息推送服务器包括:
数据接收模块,用于接收目标移动终端发送的消息推送请求,其中,所述消息推送请求包括初始关键词组;
匹配度计算模块,用于对所述初始关键词组中的各初始关键词:确定该初始关键词的词语类型,并调用与所述词语类型对应的预设词语数据表,基于所述预设词语数据表计算该初始关键词的匹配度;
第一数据筛选模块,基于所述匹配度对各初始关键词进行筛选,获得关键词组和可疑关键词组,其中,所述可疑关键词组包括多个可疑关键词,所述可疑关键词的所述匹配度小于第一预设阈值;
误判检验模块,用于对各可疑关键词:根据该可疑关键词的所述词语类型确定第一数值,其中,所述第一数值是所述可疑关键词组中,与该可疑关键词的词语类型一致的可疑关键词的数量;将该可疑关键词在所述第一数值中出现的次数确定为第二数值;利用预设误判检验算法,将所述第二数值除以所述第一数值的商值,确定为该可疑关键词的词频;利用所述预设误判检验算法,对所述词频和逆文档频率进行乘积运算,并将运算结果确定为该可疑关键词的关联参数;
第二数据筛选模块,用于将所述关联参数大于第二预设阈值的各所述可疑关键词确定为备选关键词,其中所述第一预设阈值和所述第二预设阈值不同;
消息推送模块,用于根据所述关键词组和各备选关键词,确定待推送消息,并将所述待推送消息推送至所述目标移动终端。
6.一种消息推送服务器,其特征在于,所述消息推送服务器包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至4中任一项所述的消息推送方法。
7.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由消息推送服务器的处理器执行时,使得所述消息推送服务器能够执行如权利要求1至4中任一项所述的消息推送方法。
CN202210843062.3A 2022-07-18 2022-07-18 一种消息推送方法、消息推送服务器及存储介质 Active CN115208946B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210843062.3A CN115208946B (zh) 2022-07-18 2022-07-18 一种消息推送方法、消息推送服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210843062.3A CN115208946B (zh) 2022-07-18 2022-07-18 一种消息推送方法、消息推送服务器及存储介质

Publications (2)

Publication Number Publication Date
CN115208946A CN115208946A (zh) 2022-10-18
CN115208946B true CN115208946B (zh) 2024-03-01

Family

ID=83581685

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210843062.3A Active CN115208946B (zh) 2022-07-18 2022-07-18 一种消息推送方法、消息推送服务器及存储介质

Country Status (1)

Country Link
CN (1) CN115208946B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105868377A (zh) * 2016-03-31 2016-08-17 北京奇艺世纪科技有限公司 一种信息推送方法及装置
CN107172151A (zh) * 2017-05-18 2017-09-15 百度在线网络技术(北京)有限公司 用于推送信息的方法和装置
CN107220386A (zh) * 2017-06-29 2017-09-29 北京百度网讯科技有限公司 信息推送方法和装置
CN108616444A (zh) * 2018-03-30 2018-10-02 平安科技(深圳)有限公司 一种推送消息处理方法、计算机可读存储介质及终端设备
CN109325182A (zh) * 2018-10-12 2019-02-12 平安科技(深圳)有限公司 基于会话的信息推送方法、装置、计算机设备及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108334533B (zh) * 2017-10-20 2021-12-24 腾讯科技(深圳)有限公司 关键词提取方法和装置、存储介质及电子装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105868377A (zh) * 2016-03-31 2016-08-17 北京奇艺世纪科技有限公司 一种信息推送方法及装置
CN107172151A (zh) * 2017-05-18 2017-09-15 百度在线网络技术(北京)有限公司 用于推送信息的方法和装置
CN107220386A (zh) * 2017-06-29 2017-09-29 北京百度网讯科技有限公司 信息推送方法和装置
CN108616444A (zh) * 2018-03-30 2018-10-02 平安科技(深圳)有限公司 一种推送消息处理方法、计算机可读存储介质及终端设备
CN109325182A (zh) * 2018-10-12 2019-02-12 平安科技(深圳)有限公司 基于会话的信息推送方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN115208946A (zh) 2022-10-18

Similar Documents

Publication Publication Date Title
CN105590055B (zh) 用于在网络交互***中识别用户可信行为的方法及装置
US10216848B2 (en) Method and system for recommending cloud websites based on terminal access statistics
US20170091303A1 (en) Client-Side Web Usage Data Collection
CN110058989B (zh) 用户行为意图预测方法和装置
CN108319628B (zh) 一种用户兴趣确定方法及装置
CN110956503B (zh) 基于用户网络行为的具有借贷需求的用户识别方法及装置
CN110059981B (zh) 信任度评估方法、装置及终端设备
CN108306878A (zh) 钓鱼网站检测方法、装置、计算机设备和存储介质
CN104239552A (zh) 生成关联关键词、提供关联关键词的方法及***
CN111224923A (zh) 一种仿冒网站的检测方法、装置及***
CN111368227A (zh) 一种url处理方法以及装置
CN115687810A (zh) 网页搜索方法、装置及相关设备
CN115208946B (zh) 一种消息推送方法、消息推送服务器及存储介质
CN110020205B (zh) 数据信息的筛选方法和***
CN110443291B (zh) 一种模型训练方法、装置及设备
CN112217815A (zh) 钓鱼网站的识别方法、装置和计算机设备
CN109460500B (zh) 热点事件发现方法、装置、计算机设备和存储介质
CN112288510A (zh) 物品推荐方法、装置、设备及存储介质
CN105337946A (zh) 网页防伪验证的方法和装置
CN114257565B (zh) 挖掘潜在威胁域名的方法、***和服务器
CN111949916B (zh) 一种网页分析方法、装置、设备及存储介质
US20180150752A1 (en) Identifying artificial intelligence content
CN113674083A (zh) 互联网金融平台信用风险监测方法、装置及计算机***
CN110046180B (zh) 一种用于定位相似实例的方法、装置和电子设备
CN114172676A (zh) 恶意网址检测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant