CN101860822A - 垃圾短信监控方法和*** - Google Patents
垃圾短信监控方法和*** Download PDFInfo
- Publication number
- CN101860822A CN101860822A CN201010204259A CN201010204259A CN101860822A CN 101860822 A CN101860822 A CN 101860822A CN 201010204259 A CN201010204259 A CN 201010204259A CN 201010204259 A CN201010204259 A CN 201010204259A CN 101860822 A CN101860822 A CN 101860822A
- Authority
- CN
- China
- Prior art keywords
- note
- sender
- receives
- refuse messages
- rule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/21—Monitoring or handling of messages
- H04L51/212—Monitoring or handling of messages using filtering or selective blocking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/58—Message adaptation for wireless communication
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/02—Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls
- H04L63/0227—Filtering policies
- H04L63/0236—Filtering by address, protocol, port number or service, e.g. IP-address or URL
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W28/00—Network traffic management; Network resource management
- H04W28/02—Traffic management, e.g. flow control or congestion control
- H04W28/06—Optimizing the usage of the radio link, e.g. header compression, information sizing, discarding information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/12—Messaging; Mailboxes; Announcements
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种垃圾短信监控方法和***,其中,方法包括:接收到短信;确定接收到的短信的发送者发送短信的规律;判断发送者发送短信的规律与垃圾短信发送者发送短信的规律的相似度;根据相似度确定发送者是否为垃圾短信发送者以及接收到的短信是否为垃圾短信。本发明能够达到对垃圾短信的更为有效的监控,进一步提高了垃圾短信的监控和过滤成功率。
Description
技术领域
本发明涉及通信领域,具体而言,涉及一种垃圾短信监控方法和***。
背景技术
随着手机等便携式移动终端的普及和短信业务的迅速发展,人们越来越多地使用短信进行通信。然而,人们在享受着快捷方便的通信手段的同时,伴随而来的是日趋泛滥的垃圾短信。垃圾短信不仅对运营商的网络产生冲击,给广大用户的利益也带来了巨大的损害,更造成了严重的不良的社会影响。因此,需要采取必要的技术手段对垃圾短信进行监控和滤除。
目前,普遍采用的垃圾短信监控技术中,主要采用的是垃圾短信过滤机制。从原理上,又可以分为黑白名单过滤、基于流量的过滤、基于关键字的内容过滤三种方式。
(1)基于黑白名单的过滤方式是将已确定为垃圾短信制造者的主叫号码加入黑名单,并部署在短消息中心或者短信网关,这样就可以拒绝将来自黑名单中的主叫号码的短消息发送给用户。从而对黑名单进行号段或号码的拦截,而对白名单的主叫号码不做任何形式的拦截。这样过滤方式的缺陷在于需要事先已知某一号码为垃圾短信制造者的号码,而对绝大多数不知道的垃圾短信制造者的号码发送的短信就无法进行过滤。
(2)基于流量的过滤方式是对用户在某个时间段内的群发数量进行统计,当群发数量超过预先设定的阈值时,将其手动或自动添加到黑名单中。然而,这种过滤方式很容易通过“在多个手机发送少量信息的形式”进行逃避,并且这种方式在很多手机终端实现了群发功能之后很容易对过节类的祝贺短信产生误判。
(3)基于关键字的内容过滤方式是对短信内容进行关键字查询,短信内容一旦命中该关键字,即将发送号码加入到黑名单中。但是,这种过滤方式可以通过使用“同音词”、“错别字”、“结构拆分”、“换词”等方式规避。
综上,上述的垃圾短信过滤方法均存在对垃圾短信的监控成功率较低的问题。
发明内容
本发明的主要目的在于提供一种垃圾短信监控方法和***,以至少解决上述的垃圾短信的过滤成功率较低的问题。
根据本发明的一个方面,提供了一种垃圾短信监控方法,包括:接收到短信;确定接收到的短信的发送者发送短信的规律;判断发送者发送短信的规律与垃圾短信发送者发送短信的规律的相似度;根据相似度确定发送者是否为垃圾短信发送者以及接收到的短信是否为垃圾短信。
根据本发明的另一方面,提供了一种垃圾短信监控***,包括:接口模块,用于接收短信中心或者短信网关发送来的短信,并将接收到的短信分发到对应的监控业务处理模块;监控业务处理模块,用于确定接收到的短信的发送者发送短信的规律;判断发送者发送短信的规律与垃圾短信发送者发送短信的规律的相似度;根据相似度确定发送者是否为垃圾短信发送者以及接收到的短信是否为垃圾短信。
通过本发明,由于通过比较接收到的短信的发送者发送短信的规律与垃圾短信发送者发送短信的规律的相似度,根据相似度来确定该接收到的短信是否为垃圾短信,解决了相关技术存在的垃圾短信监控成功率不高的问题,从而能够达到对垃圾短信的更为有效的监控,进一步提高了垃圾短信的监控和过滤成功率。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的垃圾短信监控方法的流程图;
图2是根据本发明实施例的垃圾短信监控***的示意图;
图3是根据本发明优选实施例的垃圾短信监控***对垃圾短信进行监控的流程图;
图4是根据本发明优选实施例的垃圾短信监控***进行样本训练的流程图;
图5是根据本发明优选实施例的垃圾短信监控***对垃圾短信进行基于发送规律的监控的流程图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明
的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可
以相互组合。
在移动通信的运营商的运营网络中,通常会需要对垃圾短信进行监控和过滤以避免各种类型的垃圾短信对运营商的网络产生的冲击以及给广大用户的利益带来的损害。本发明的以下实施例在该网络中实现。
图1是根据本发明实施例的垃圾短信监控方法的流程图,包括以下步骤:
步骤S102,接收到短信(该短信为实时短信);
步骤S104,确定接收到的短信的发送者发送短信的规律;
步骤S106,判断步骤S104中确定的发送者发送短信的规律与垃圾短信发送者发送短信的规律的相似度(即度量接收到的短信的发送者属于垃圾短信发送者的概率);
其中,垃圾短信发送者发送短信的规律可以通过对一定时间段内的历史短信进行训练得到。
步骤S108,根据步骤S106中判断的相似度确定该发送者是否为垃圾短信发送者以及接收到的短信是否为垃圾短信。
例如,当确定接收到的短信的发送者属于垃圾短信发送者的时候,那么该接收到的短信记为垃圾短信,可以对其进行过滤。
该实施例由于通过比较接收到的短信的发送者发送短信的规律与垃圾短信发送者(为一类发送者)发送短信的规律的相似度,根据相似度来确定该接收到的短信是否为垃圾短信,解决了相关技术存在的垃圾短信监控成功率不高的问题,从而能够达到对垃圾短信的更为有效的监控,进一步提高了垃圾短信的监控和过滤成功率。上述步骤S104至步骤S108的对垃圾短信进行监控的方法可以称为基于发送规律的监控方法。
优选地,步骤S104包括:从短信记录数据库中获取接收到的短信的发送者的特征,其中,该特征包括以下至少之一:发送短信条数、接收短信条数、回复短信的接收者的数量、有相互通信记录的接收者的数量、以及短信的长度;使用上述特征,确定短信的发送者发送短信的规律。由于垃圾短信的发送者发送短信的规律同正常短信发送者的规律具有较为明显的区别。这样,可以通过比较实时短信的发送者与预先获得的垃圾短信发送者发送短信的规律,比如通过使用上述特征中的参数度量发送者发送短信的回复率以及发送者的关系网络中的联系人耦合度等特征,来确定处于该网络中心的发送者是否属于垃圾短信发送者。
优选地,步骤S106包括:对于接收到的短信的发送者与垃圾短信发送者,分别比较发送短信条数、接收短信条数、回复短信的接收者的数量、和有相互通信记录的接收者的数量;根据每项的比较结果,将上述相似度增加一定的百分比。这样,可以通过这些参数的比较,度量得到接收到的短信的发送者属于垃圾短信发送者的概率。
优选地,步骤S108包括:若计算得到的相似度小于相似度阈值,则确定接收到的短信的发送者不是垃圾短信发送者,并且上述接收到的短信不是垃圾短信;若计算得到的相似度不小于相似度阈值,则确定接收到的短信的发送者是垃圾短信发送者,并且上述接收到的短信是垃圾短信。这样,可以实现对垃圾短信的判断,并最终将判定为垃圾短信的接收到的短信进行过滤。
优选地,在上述的方法中,还包括:对一定时间段内的历史短信进行训练,得到上述垃圾短信发送者发送短信的规律。为了实现基于发送规律的垃圾短信监控方法,首先需要对一定时间段内短信话单中的短信发送记录(即上述历史短信)作为短信训练集合进行离线的训练以得到各种类型的短信发送者发送短信的规律(其中包括垃圾短信发送者发送短信的规律)。
其中,对一定时间段内的历史短信进行训练,得到上述垃圾短信发送者发送短信的规律包括:获取上述一定时间段内的历史短信的各个发送者的特征,其中,该特征包括以下至少之一:发送短信条数、接收短信条数、回复短信的接收者的数量、有相互通信记录的接收者的数量、以及短信的长度;使用模式识别算法对各个发送者的特征进行聚类分析,统计得到与发送者类型对应的发送短信的规律;在统计得到的规律中确定垃圾短信发送者发送短信的规律。
在实际实施的过程中,该训练过程包括:提取一定时间段内的短信话单中的短信发送记录中的所有发送者的特征,进行聚类分析,最终形成包含N个模板(即发送短信的规律)的模板库。模板库中每个模板对应了一组具有类似社会关系特征的短信发送者,其中也包含了具有垃圾短信发送特征的模板。在进行基于发送规律的垃圾短信监控时,同样提取实时短信中发送者的特征,通过计算该样本与模板库中模板相似度从而确定发送者是否为垃圾短信发送者。训练的过程是自适应的,***会定期取话单进行训练,并调整模板库。
优选地,在步骤S104之前(即在接收到短信之后以及在对接收到的短信进行基于发送规律的监控之前),还包括:判断接收到的短信的发送者是否在预先建立的黑名单和白名单中;若不在黑名单和白名单中,则执行步骤S104(即进行基于发送规律的监控)。
优选地,在步骤S108之后(即在对接收到的短信进行了基于发送规律的监控之后),还包括:若确定接收到的短信的发送者不是垃圾短信发送者以及接收到的短信不是垃圾短信,则判断接收到的短信的内容中是否包括预先配置的关键字;若包括,则确定接收到的短信是垃圾短信,并将该接收到的短信的发送者添加到黑名单中;若不包括,则确定接收到的短信不是垃圾短信(同时该接收到的短信的发送者也不是垃圾短信的发送者)。
由于基于发送规律的垃圾短信监控,使得垃圾短信发送者的规避成本提高,但是这种方法没有对短信内容的过滤,单单使用这一种过滤手段仍有可能造成对垃圾短信的识别覆盖不全;而传统的基于内容的垃圾监控***已经在运营商网络得到了广泛的部署,并且经实践检验对垃圾短信的过滤还是起到了很大的作用。因此,该优选实施例将基于发送规律的垃圾短信监控方法和传统的基于黑白名单和基于内容的监测方法相融合,对短信进行三重过滤,达到提高垃圾短信监控成功率的目的。
图2是根据本发明实施例的垃圾短信监控***的示意图,该***包括:接口模块10、监控业务处理模块20、黑白名单管理模块30、训练模块40、和配置模块50。下面对该***中的各模块的功能进行描述。
优选地,接口模块10,用于接收短信中心或者短信网关发送来的短信,并将接收到的短信分发到对应的监控业务处理模块20;监控业务处理模块20,用于确定接口模块10接收到的短信的发送者发送短信的规律;判断该发送者发送短信的规律与垃圾短信发送者发送短信的规律的相似度;根据判断得到的相似度确定该发送者是否为垃圾短信发送者以及接收到的短信是否为垃圾短信。
优选地,该垃圾短信监控***中包括多个监控业务处理模块20,该多个监控业务处理模块分别具有不同的编号,接口模块10包括:取模模块,用于将接收到的短信的发送者的号码的尾数对多个监控业务处理模块的个数取模,得到模值;第一确定模块,用于确定接收到的短信对应的监控业务处理模块是编号为模值的监控业务处理模块;发送模块,用于将接收到的短信发送至编号为模值的监控业务处理模块20。
监控业务处理模块负责短消息(即短信)的监控,垃圾短信的主要检测过程都由监控业务处理模块完成,因此该模块对***性能影响大,在部署时可以设置为多模块负荷分担,这样,可以确保***的监控性能。
优选地,监控业务处理模块20包括:获取模块,用于从短信记录数据库中获取接收到的短信的发送者的特征,其中,特征包括以下至少之一:发送短信条数、接收短信条数、回复短信的接收者的数量、有相互通信记录的接收者的数量、以及短信的长度;规律确定模块,用于使用上述特征,确定接收到的短信的发送者发送短信的规律。
监控业务处理模块20还包括:比较模块,用于在规律确定模块确定接收到的短信的发送者发送短信的规律之后,对于发送者与垃圾短信发送者,分别比较发送短信条数、接收短信条数、回复短信的接收者的数量、和有相互通信记录的接收者的数量;计算模块,用于根据比较模块的每项的比较结果,将相似度增加一定的百分比。
监控业务处理模块20还包括:检测模块,用于当计算模块计算得到的相似度小于相似度阈值时,确定接收到的短信的发送者不是垃圾短信发送者,并且接收到的短信不是垃圾短信;当计算模块计算得到的相似度不小于相似度阈值,则确定接收到的短信的发送者是垃圾短信发送者,并且接收到的短信是垃圾短信。
优选地,在上述的***中,还包括:训练模块40,用于对一定时间段内的历史短信进行训练,得到垃圾短信发送者发送短信的规律,即采集一定时间段内短信话单记录,进行离线训练生成模板库,并将模板库同步给所有的监控业务处理模块20。训练模块40包括:特征获取模块,用于获取一定时间段内的历史短信的各个发送者的特征,其中,特征包括以下至少之一:发送短信条数、接收短信条数、回复短信的接收者的数量、有相互通信记录的接收者的数量、以及短信的长度;统计模块,用于使用模式识别算法对各个发送者的特征进行聚类分析,统计得到与发送者类型对应的发送短信的规律;第二确定模块,用于在统计模块统计得到的规律中确定垃圾短信发送者发送短信的规律。
优选地,在上述的***中,还包括:黑白名单管理模块30,用于管理预先建立的黑名单和白名单(可以为一个列表,黑白名单管理模块负责管理人工添加的黑白名单和监控过程中动态产生的黑名单,供监控业务处理模块查询使用);
则,监控业务处理模块20,还用于在确定接收到的短信的发送者发送短信的规律之前,判断接收到的短信的发送者是否在黑白名单管理模块30中的黑名单和白名单中;若不在黑名单和白名单中,则执行确定接收到的短信的发送者发送短信的规律的步骤;还用于在根据相似度确定发送者是否为垃圾短信发送者以及接收到的短信是否为垃圾短信之后,若确定发送者不是垃圾短信发送者以及接收到的短信不是垃圾短信,则判断接收到的短信的内容中是否包括预先配置的关键字;若包括,则确定接收到的短信是垃圾短信,并将发送者添加到黑名单中;若不包括,则确定接收到的短信不是垃圾短信。
在实际实施的过程中,还可以增加配置模块50,用于配置监控规则、关键字等信息,并同步给其它相关模块。
其中,接口模块10还用于在监控业务处理模块20对接收到的短信进行了基于黑白名单的监控、基于发送规律的监控、以及基于内容的监控之后,将其得到的最终的监控结果返回给短信中心或短信网关。所有内部模块间可以采用基于TCP/IP或进程间的通讯机制进行通讯,接口模块和短消息中心以及短消息网关之间可以通过SMPP(Short Message Peer to Peer,点对点短消息发送)协议或内部消息接口连接。
下面结合图2,根据本发明实施例的垃圾短信监控***进行垃圾短信的监控的总的流程如图3所示,具体流程包括如下步骤:
步骤S302,接口模块10接收到短信中心或短信网关下发的实时短信,将实时短信中携带的发送者的号码尾数(通常取5位)对***中的监控业务处理模块20的个数(N)取模(即号码尾数modN)得到模值,将实时短信发送至编号为该模值的监控业务处理模块。如果与短信中心或短信网关以SMPP协议连接,则首先需要将实时短信解码成内部消息再分发;
步骤S304至步骤S306,监控业务处理模块20对收到的消息首先进行基于黑白名单的过滤。即提取发送号码,向黑白名单管理模块30查询该发送号码是否在黑白名单列表中,如果在,则无须进行进一步监控直接进入步骤S314,否则进入步骤S308;
步骤S308至步骤S310,监控业务处理模块20进一步进行基于发送规律的监控。之后,如果确认消息发送者为垃圾短信发送者则无须进行进一步监控直接进入步骤S314,否则进入步骤S312。在此步骤中根据监控结果还可能会向黑白名单管理模块动态添加黑名单。即当确认该消息发送者为垃圾短信发送者,则将其添加到黑白名单管理模块30中的黑名单中;
步骤S312,监控业务处理模块20再进一步进行基于传统的内容的过滤,过滤完成后进入步骤S314。在此步骤中根据监控结果还可能会向黑白名单管理模块30动态添加黑名单;
步骤S314,接口模块10最终将短信监控结果返回给短信中心或短信网关。
在***进行垃圾短信监控时,首先进行基于黑白名单的监控过滤,如果短信发送者在黑白名单列表上,则直接返回监控结果;然后进行基于发送规律的监控过滤,如果经基于发送规律的监控过滤确认发送者为垃圾短信发送者,则直接返回过滤结果;最后进行基于传统的内容的过滤。由于基于内容的过滤需要扫描整个文本,并且有时需要进行多关键字匹配,对***性能影响较大;基于发送规律的监控过滤,由于训练过程是离线的,***主要性能消耗在于检测过程发送者发送规律的确定,对***性能影响比基于内容的监控过滤要小;而基于黑白名单的过滤只需要查询黑白名单,对***性能影响最小。因此在安排监控方案次序时,首先是基于黑白名单的监控,然后是基于发送规律的监控,最后是基于内容的监控,以达到性能最优。
图4详细描述了训练模块进行样本训练的流程,具体流程包括如下步骤:
步骤S402,训练模块40取一定时间段内产生的短信话单(如图2所示),解析话单内容并存入自身内存库。话单记录包含了发送号码、接收号码、短信内容、发送时间等信息。
步骤S404,训练模块40从自身内存库中提取每个发送者的特征。特征包括发送短信条数,接收短信条数,接收者个数,回复短信的接收者个数,接收者之间相互间有通信记录的接收这个数以及短信长度等信息;
步骤S406,根据提取的特征确定发送者发送短信的规律。主要依据垃圾短信发送者和正常短信发送者不同的特征的特点,比如正常发送者短信回复率比垃圾短信发送者高,正常发送者的接收者之间往往是有一定联系的社会群组,垃圾短信发送者的接收者之间几乎没有任何联系等;
步骤S408,确定出所有发送者发送短信的规律后,根据已有的模式识别算法对发送者进行聚类分析,具有相似行为发送者聚合成一类,最终得到对应各种发送者类型的发送短信的规律(其中包括垃圾短信发送者发送短信的规律);
步骤S410,训练模块将得到的垃圾短信发送者发送短信的规律同步给所有的监控业务处理模块20供实时监控使用。
图5详细描述了基于发送规律的监控流程(对应上述图1中的步骤S102至步骤S108,也对应图3中的步骤S),具体流程包括如下步骤:
步骤S502,监控业务处理模块20接收接口模块10转发的短信中心或短信网关下发的实时短信;
步骤S504,监控业务处理模块20从短信记录数据库中提取该实时短信的发送者的特征,发送者的特征类型与训练模块40所提取的特征类型一致;
步骤S506,根据提取的发送者的特征确定发送者发送短信的规律,确定的依据同训练模块一致;
步骤S508,确定出发送者发送短信的规律后,计算该规律与垃圾短信发送者发送短信的规律的相似度从而判断该发送者是否为(属于)垃圾发送者,如果不能相匹配则不能确定发送者身份,须作进一步检测。
从以上的描述中,可以看出,本发明实现了如下技术效果:融合了新的基于发送规律的垃圾短信监控方案和传统的基于黑白名单和基于内容的监控方案,三重过滤能够更加有效地提高垃圾短信的监控过滤成功率。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种垃圾短信监控方法,其特征在于,包括:
接收到短信;
确定所述接收到的短信的发送者发送短信的规律;
判断所述发送者发送短信的规律与垃圾短信发送者发送短信的规律的相似度;
根据所述相似度确定所述发送者是否为垃圾短信发送者以及所述接收到的短信是否为垃圾短信。
2.根据权利要求1所述的方法,其特征在于,确定所述接收到的短信的发送者发送短信的规律包括:
从短信记录数据库中获取所述接收到的短信的发送者的特征,其中,所述特征包括以下至少之一:发送短信条数、接收短信条数、回复短信的接收者的数量、有相互通信记录的接收者的数量、以及短信的长度;
使用所述特征,确定所述接收到的短信的发送者发送短信的规律。
3.根据权利要求2所述的方法,其特征在于,判断所述发送者发送短信的规律与垃圾短信发送者发送短信的规律的相似度包括:
对于所述发送者与所述垃圾短信发送者,分别比较所述发送短信条数、所述接收短信条数、所述回复短信的接收者的数量、和所述有相互通信记录的接收者的数量;
根据每项的比较结果,将所述相似度增加一定的百分比。
4.根据权利要求1至3任一项所述的方法,其特征在于,根据所述相似度确定所述发送者是否为垃圾短信发送者以及所述接收到的短信是否为垃圾短信包括:
若计算得到的所述相似度小于相似度阈值,则确定所述接收到的短信的发送者不是垃圾短信发送者,并且所述接收到的短信不是垃圾短信;
若计算得到的所述相似度不小于所述相似度阈值,则确定所述接收到的短信的发送者是垃圾短信发送者,并且所述接收到的短信是垃圾短信。
5.根据权利要求1所述的方法,其特征在于,还包括:
对一定时间段内的历史短信进行训练,得到所述垃圾短信发送者发送短信的规律,其包括:
获取所述一定时间段内的历史短信的各个发送者的特征,其中,所述特征包括以下至少之一:发送短信条数、接收短信条数、回复短信的接收者的数量、有相互通信记录的接收者的数量、以及短信的长度;
使用模式识别算法对所述各个发送者的特征进行聚类分析,统计得到与发送者类型对应的发送短信的规律;
在统计得到的规律中确定所述垃圾短信发送者发送短信的规律。
6.根据权利要求1所述的方法,其特征在于,在确定所述接收到的短信的发送者发送短信的规律之前,还包括:
判断所述接收到的短信的发送者是否在预先建立的黑名单和白名单中;
若不在所述黑名单和白名单中,则执行所述确定所述接收到的短信的发送者发送短信的规律的步骤。
7.根据权利要求6所述的方法,其特征在于,在根据所述相似度确定所述发送者是否为垃圾短信发送者以及所述接收到的短信是否为垃圾短信之后,还包括:
若确定所述发送者不是垃圾短信发送者以及所述接收到的短信不是垃圾短信,则判断所述接收到的短信的内容中是否包括预先配置的关键字;
若包括,则确定所述接收到的短信是垃圾短信,并将所述发送者添加到所述黑名单中;
若不包括,则确定所述接收到的短信不是垃圾短信。
8.一种垃圾短信监控***,其特征在于,包括:
接口模块,用于接收短信中心或者短信网关发送来的短信,并将接收到的短信分发到对应的监控业务处理模块;
所述监控业务处理模块,用于确定所述接收到的短信的发送者发送短信的规律;判断所述发送者发送短信的规律与垃圾短信发送者发送短信的规律的相似度;根据所述相似度确定所述发送者是否为垃圾短信发送者以及所述接收到的短信是否为垃圾短信。
9.根据权利要求8所述的***,其特征在于,所述监控业务处理模块为多个,所述多个监控业务处理模块分别具有不同的编号,所述接口模块包括:
取模模块,用于将所述接收到的短信的发送者的号码的尾数对所述多个监控业务处理模块的个数取模,得到模值;确定模块,用于确定所述接收到的短信对应的监控业务处理模块是编号为所述模值的监控业务处理模块;
发送模块,用于将所述接收到的短信发送至所述编号为所述模值的监控业务处理模块。
10.根据权利要求9所述的***,其特征在于,还包括:黑白名单管理模块,用于管理预先建立的黑名单和白名单;
所述监控业务处理模块,还用于在确定所述接收到的短信的发送者发送短信的规律之前,判断所述接收到的短信的发送者是否在所述黑白名单管理模块中的黑名单和白名单中;若不在所述黑名单和白名单中,则执行所述确定所述接收到的短信的发送者发送短信的规律的步骤;还用于在根据所述相似度确定所述发送者是否为垃圾短信发送者以及所述接收到的短信是否为垃圾短信之后,若确定所述发送者不是垃圾短信发送者以及所述接收到的短信不是垃圾短信,则判断所述接收到的短信的内容中是否包括预先配置的关键字;若包括,则确定所述接收到的短信是垃圾短信,并将所述发送者添加到所述黑名单中;若不包括,则确定所述接收到的短信不是垃圾短信。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010204259A CN101860822A (zh) | 2010-06-11 | 2010-06-11 | 垃圾短信监控方法和*** |
PCT/CN2010/077002 WO2011153744A1 (zh) | 2010-06-11 | 2010-09-16 | 垃圾短信监控方法和*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010204259A CN101860822A (zh) | 2010-06-11 | 2010-06-11 | 垃圾短信监控方法和*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101860822A true CN101860822A (zh) | 2010-10-13 |
Family
ID=42946414
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201010204259A Pending CN101860822A (zh) | 2010-06-11 | 2010-06-11 | 垃圾短信监控方法和*** |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN101860822A (zh) |
WO (1) | WO2011153744A1 (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101984415A (zh) * | 2010-11-02 | 2011-03-09 | 中兴通讯股份有限公司 | 一种设定监控指标阈值的方法和装置 |
CN102231873A (zh) * | 2011-06-22 | 2011-11-02 | 中兴通讯股份有限公司 | 垃圾短信监控方法、***和监控处理装置 |
CN102890688A (zh) * | 2011-07-22 | 2013-01-23 | 腾讯科技(深圳)有限公司 | 一种自动提交内容的检测方法以及装置 |
CN103139730A (zh) * | 2011-11-23 | 2013-06-05 | 上海粱江通信***股份有限公司 | 用于识别大量号码低频发送垃圾短信情况的方法 |
CN103634797A (zh) * | 2013-12-06 | 2014-03-12 | 中国联合网络通信集团有限公司 | 一种垃圾短信识别方法及装置 |
CN103838759A (zh) * | 2012-11-23 | 2014-06-04 | 阿里巴巴集团控股有限公司 | 基于sns环境的非正常行为过滤方法及装置 |
CN104539514A (zh) * | 2014-12-17 | 2015-04-22 | 广州酷狗计算机科技有限公司 | 消息过滤方法和装置 |
CN105323763A (zh) * | 2014-06-27 | 2016-02-10 | ***通信集团湖南有限公司 | 一种垃圾短消息的识别方法及装置 |
CN105516941A (zh) * | 2014-10-13 | 2016-04-20 | 中兴通讯股份有限公司 | 一种垃圾短信的拦截方法及装置 |
CN105721539A (zh) * | 2016-01-12 | 2016-06-29 | 深圳市深讯数据科技股份有限公司 | 一种基于行为特征的短信分类装置及方法 |
CN105828306A (zh) * | 2016-03-15 | 2016-08-03 | 中国联合网络通信集团有限公司 | 一种垃圾短信检测方法及装置 |
CN105824955A (zh) * | 2016-03-30 | 2016-08-03 | 北京小米移动软件有限公司 | 短信聚类方法及装置 |
CN105893501A (zh) * | 2016-03-30 | 2016-08-24 | 中国联合网络通信集团有限公司 | 信息查询短信处理方法和*** |
WO2017084521A1 (zh) * | 2015-11-18 | 2017-05-26 | 阿里巴巴集团控股有限公司 | 一种订单聚类方法及装置,以及反恶意信息的方法及装置 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103634471B (zh) * | 2013-12-05 | 2015-07-08 | 广东欧珀移动通信有限公司 | 一种垃圾短信的处理方法和*** |
CN108769933B (zh) * | 2018-05-31 | 2021-06-04 | 中国联合网络通信集团有限公司 | 彩信识别方法和彩信识别*** |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101184259A (zh) * | 2007-11-01 | 2008-05-21 | 浙江大学 | 垃圾短信中的关键词自动学习及更新方法 |
CN101340693A (zh) * | 2008-08-12 | 2009-01-07 | 中兴通讯股份有限公司 | 一种基于内容长度监控垃圾短信息的***与实现方法 |
CN101472247A (zh) * | 2007-12-28 | 2009-07-01 | ***通信集团公司 | 一种控制垃圾短信的方法和*** |
CN101472245A (zh) * | 2007-12-27 | 2009-07-01 | ***通信集团公司 | 垃圾短信拦截方法和装置 |
-
2010
- 2010-06-11 CN CN201010204259A patent/CN101860822A/zh active Pending
- 2010-09-16 WO PCT/CN2010/077002 patent/WO2011153744A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101184259A (zh) * | 2007-11-01 | 2008-05-21 | 浙江大学 | 垃圾短信中的关键词自动学习及更新方法 |
CN101472245A (zh) * | 2007-12-27 | 2009-07-01 | ***通信集团公司 | 垃圾短信拦截方法和装置 |
CN101472247A (zh) * | 2007-12-28 | 2009-07-01 | ***通信集团公司 | 一种控制垃圾短信的方法和*** |
CN101340693A (zh) * | 2008-08-12 | 2009-01-07 | 中兴通讯股份有限公司 | 一种基于内容长度监控垃圾短信息的***与实现方法 |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101984415A (zh) * | 2010-11-02 | 2011-03-09 | 中兴通讯股份有限公司 | 一种设定监控指标阈值的方法和装置 |
CN102231873A (zh) * | 2011-06-22 | 2011-11-02 | 中兴通讯股份有限公司 | 垃圾短信监控方法、***和监控处理装置 |
CN102890688A (zh) * | 2011-07-22 | 2013-01-23 | 腾讯科技(深圳)有限公司 | 一种自动提交内容的检测方法以及装置 |
CN102890688B (zh) * | 2011-07-22 | 2018-01-02 | 深圳市世纪光速信息技术有限公司 | 一种自动提交内容的检测方法以及装置 |
CN103139730B (zh) * | 2011-11-23 | 2016-03-30 | 上海粱江通信***股份有限公司 | 用于识别大量号码低频发送垃圾短信情况的方法 |
CN103139730A (zh) * | 2011-11-23 | 2013-06-05 | 上海粱江通信***股份有限公司 | 用于识别大量号码低频发送垃圾短信情况的方法 |
CN103838759B (zh) * | 2012-11-23 | 2017-04-26 | 阿里巴巴集团控股有限公司 | 基于sns环境的非正常行为过滤方法及装置 |
CN103838759A (zh) * | 2012-11-23 | 2014-06-04 | 阿里巴巴集团控股有限公司 | 基于sns环境的非正常行为过滤方法及装置 |
CN103634797A (zh) * | 2013-12-06 | 2014-03-12 | 中国联合网络通信集团有限公司 | 一种垃圾短信识别方法及装置 |
CN105323763B (zh) * | 2014-06-27 | 2019-03-05 | ***通信集团湖南有限公司 | 一种垃圾短消息的识别方法及装置 |
CN105323763A (zh) * | 2014-06-27 | 2016-02-10 | ***通信集团湖南有限公司 | 一种垃圾短消息的识别方法及装置 |
CN105516941A (zh) * | 2014-10-13 | 2016-04-20 | 中兴通讯股份有限公司 | 一种垃圾短信的拦截方法及装置 |
WO2016058390A1 (zh) * | 2014-10-13 | 2016-04-21 | 中兴通讯股份有限公司 | 一种垃圾短信的拦截方法及装置 |
CN104539514A (zh) * | 2014-12-17 | 2015-04-22 | 广州酷狗计算机科技有限公司 | 消息过滤方法和装置 |
WO2017084521A1 (zh) * | 2015-11-18 | 2017-05-26 | 阿里巴巴集团控股有限公司 | 一种订单聚类方法及装置,以及反恶意信息的方法及装置 |
US11100567B2 (en) | 2015-11-18 | 2021-08-24 | Advanced New Technologies Co., Ltd. | Order clustering and malicious information combating method and apparatus |
US11200615B2 (en) | 2015-11-18 | 2021-12-14 | Advanced New Technologies Co., Ltd. | Order clustering and malicious information combating method and apparatus |
CN105721539A (zh) * | 2016-01-12 | 2016-06-29 | 深圳市深讯数据科技股份有限公司 | 一种基于行为特征的短信分类装置及方法 |
CN105721539B (zh) * | 2016-01-12 | 2019-08-09 | 深圳市深讯数据科技股份有限公司 | 一种基于行为特征的短信分类装置及方法 |
CN105828306A (zh) * | 2016-03-15 | 2016-08-03 | 中国联合网络通信集团有限公司 | 一种垃圾短信检测方法及装置 |
CN105893501A (zh) * | 2016-03-30 | 2016-08-24 | 中国联合网络通信集团有限公司 | 信息查询短信处理方法和*** |
CN105824955A (zh) * | 2016-03-30 | 2016-08-03 | 北京小米移动软件有限公司 | 短信聚类方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2011153744A1 (zh) | 2011-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101860822A (zh) | 垃圾短信监控方法和*** | |
CN103763690B (zh) | 检测伪基站向移动终端发送短信息的方法和装置 | |
CN104301896B (zh) | 诈骗短信智能监控告警***和方法 | |
CN103354633B (zh) | 基于信令数据挖掘分析的特定移动用户粗定位***及方法 | |
CN101686444B (zh) | 垃圾短信发送号码实时检测***及方法 | |
CN103124254B (zh) | 一种建立定向推送的方法、服务器和装置 | |
CN101335920B (zh) | 基于主叫号码位置和发送内容的垃圾短消息识别***及方法 | |
CN101909261A (zh) | 一种垃圾短信监控的方法和*** | |
CN101784022A (zh) | 短信过滤、分类方法及*** | |
Wang et al. | A behavior-based SMS antispam system | |
CN104462509A (zh) | 垃圾评论检测方法及装置 | |
CN101459718A (zh) | 一种基于移动通信网的垃圾语音过滤方法及其*** | |
CN101938565A (zh) | 短信处理方法及移动终端 | |
CN103391547A (zh) | 一种信息处理的方法和终端 | |
CN103415004A (zh) | 一种检测垃圾短消息的方法及装置 | |
CN102315952A (zh) | 一种用于社区网络中检测垃圾帖子的方法与设备 | |
CN106899948B (zh) | 伪基站发现方法、***、终端及服务器 | |
CN105825129A (zh) | 一种融合通信中恶意软件鉴别方法和*** | |
CN110705926A (zh) | 一种物流对象配送信息的获取方法、装置和*** | |
CN101389085B (zh) | 基于发送行为的垃圾短消息识别***及方法 | |
CN106102082A (zh) | 一种嫌疑号码确定方法、装置、*** | |
CN103139730B (zh) | 用于识别大量号码低频发送垃圾短信情况的方法 | |
CN102905236B (zh) | 一种垃圾短消息监控方法、装置及*** | |
CN102098640A (zh) | 一种识别并阻止设备发送垃圾短信的方法、设备和*** | |
CN103679934A (zh) | 一种处理银行卡信息的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20101013 |