CN101335920B - 基于主叫号码位置和发送内容的垃圾短消息识别***及方法 - Google Patents
基于主叫号码位置和发送内容的垃圾短消息识别***及方法 Download PDFInfo
- Publication number
- CN101335920B CN101335920B CN200810116687XA CN200810116687A CN101335920B CN 101335920 B CN101335920 B CN 101335920B CN 200810116687X A CN200810116687X A CN 200810116687XA CN 200810116687 A CN200810116687 A CN 200810116687A CN 101335920 B CN101335920 B CN 101335920B
- Authority
- CN
- China
- Prior art keywords
- short message
- calling number
- content
- junk
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000001914 filtration Methods 0.000 claims abstract description 11
- 230000005540 biological transmission Effects 0.000 claims description 39
- 230000008569 process Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000004380 ashing Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000009418 renovation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Images
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本发明涉及基于主叫号码位置和发送内容的垃圾短消息识别***及方法。该方法包括:判断已发送的具有相同内容的短消息的数量是否达到第一阈值,如果是,则对后续发送具有所述相同内容的短消息的主叫号码的位置信息出现次数进行统计:如果具有所述相同内容的短消息的所有主叫号码位置信息出现次数之和达到第二阈值,或者如果具有所述相同内容的短消息的任意一个主叫号码位置信息出现次数达到第三阈值,则判断所述相同内容的短消息为垃圾短消息;将垃圾短消息的主叫号码发送至短消息中心,用于供短消息中心过滤垃圾短消息。本发明可保证短消息中心收到的大量短消息被实时高效地过滤、分类和处理,并实现对垃圾短消息的实时拦截。
Description
技术领域
本发明涉及垃圾短消息,尤其涉及基于主叫号码位置和发送内容的垃圾短消息识别***及方法。
背景技术
近年来,垃圾短消息泛滥的情况愈演愈烈,几乎每个手机用户都受到过垃圾短消息的侵扰。根据中国互联网协会发布的调查结果显示,我国手机用户平均每周收到8.29条垃圾短消息。
垃圾短消息按照其发送的方式可以分为两种模式,一种是利用移动运营商的短消息网关进行发送,用户收到短消息时,其显示的发送号码为短消息的接入号,而不是普通用户的手机号码。此种方法发送的垃圾短消息具有速度快、操作简单、需要运营商许可等特点,短消息类型以商品广告、服务类居多。
另一种是将手机卡***群发器,通过串口连接线连接到计算机的串口上,然后利用计算机上的***进行发送(以下简称该方式为群发器发送)。使用者或是购买大量无需注册的手机卡(如动感地带、神州行等)来进行透支,要么就抓住优惠套餐的软肋来狂发短消息。这类群发器可以同时连接16-20个以上端口,能在很短的时间内群发上万条的短消息,因此运营商往往来不及计费就被恶意透支话费。用户收到短消息时,其显示的发送号码为普通的手机号码。此方法发送的垃圾短消息具有号码多、速度快、不需运营商许可等特点。此外,在群发期间,垃圾短消息流量规模巨大,势必占用较多无线资源,为保证吞吐率,垃圾短消息发送者通常会选择多个位于不同基站的发送点并行发送。
随着公众媒体和社会舆论对垃圾短消息的关注度不断地提高,移动运营商加大了对利用短消息网关发送垃圾短消息的整治力度,实施了一些简单、有效的措施,如加强对短消息发送端口的内容监控,在短消息内容中加入公司真实签名,提高利用端口发送短消息资费,对投诉比较大的端口给予关闭等。
上述措施实施以后,通过短消息网关发送垃圾短消息的现象明显减少。但对于不法分子利用群发器发送垃圾短消息的现象目前仍然无有效的过滤手段。
针对不法分子利用群发器发送垃圾短消息的手段,运营商目前的实现方法主要有如下两种:
1、关键字匹配过滤
短消息中心维护人员一旦接到用户的垃圾短消息投诉后,就取出该垃圾短消息中的相关关键字,把它加入到短消息中心的关键字过滤列表中,以后短消息中心只要接收到包含该关键字的短消息,将对该短消息加以拦截和过滤,禁止它的下发。该方法的优点是***实现简单。缺点是很容易造成误判,导致正常的用户短消息被拦截和过滤,引起用户的投诉。同时,垃圾短消息发送者很容易通过变更关键字、关键字间加入分隔符、使用同音字等手段而绕过过滤。
2、监控同一号码单位时间内发送短消息数量的方法
由于垃圾短消息发送者利用电脑连接手机模块进行垃圾短消息的群发,因此同一号码单位时间内发送短消息的数量会比正常用户的手机发送短消息的数量大。因此,短消息中心的维护人员会对同一号码的单位时间内的短消息发送数量进行设定,通常是设为每小时不超过300条,一旦同一号码一小时内短消息的发送数量超过这个阈值,短消息中心就将这个号码加入黑名单,加入黑名单的号码不再能发送短消息(包括正常的短消息)。通常为了防止用户的投诉,黑名单中的号码具有时效性,经过一段时间后,会从黑名单中移去该号码,恢复它的短消息正常发送功能。该方法的优点在于***容易实现,但有两个缺点:(1)同一号码单位时间内发送短消息数的阈值很难界定,如果设的太大,达不到拦截和过滤的效果;设的太小,又容易把正常用户的正常短消息给拦截过滤(随着智能手机的普及,一些手机可支持短消息批量群发);(2)阈值参数很容易被垃圾短消息发送者试验出来,一旦发现后,他们就可以通过调整速度来逃避被监控和拦截。
发明内容
为了解决上述的技术问题,本发明提供了一种基于主叫号码位置和发送内容的垃圾短消息识别***及方法,其目的在于,提高垃圾短消息的识别率,实时地过滤利用群发器发送的垃圾短消息。
本发明提供了基于主叫号码位置和发送内容的垃圾短消息识别方法,包括:
步骤1,判断已发送的具有相同内容的短消息的数量是否达到第一阈值,如果是,执行步骤2;
步骤2,对后续发送具有所述相同内容的短消息的主叫号码的位置信息出现次数进行统计:如果具有所述相同内容的短消息的后续所有主叫号码的位置信息出现次数之和达到第二阈值,或者如果具有所述相同内容的短消息的任意一个位置信息出现次数达到第三阈值,则判断所述相同内容的短消息为垃圾短消息;
步骤3,将垃圾短消息的主叫号码发送至短消息中心,用于供短消息中心过滤垃圾短消息。
步骤1包括:
步骤21,依据短消息内容计算散列值;
步骤22,计算已发送的散列值相同的短消息的数量,并判断该数量是否达到第一阈值,如果是,执行步骤2。
步骤21中,只对短消息内容的长度大于预设值的短消息计算其短消息内容的散列值。
步骤22中,还将散列值相同的短消息归为一短消息类,并将短消息数量超过第一阈值的短消息类标记为可疑短消息类。
步骤3中,短消息中心还将垃圾短消息的主叫号码加入短消息禁发黑名单。
步骤21之前还包括步骤20:设置散列表,用于依据散列值记录短消息所属的短消息类以及标记可疑短消息类,并记录后续发送属于可疑短消息类的短消息的主叫号码的位置信息出现次数。
所述主叫号码的位置信息为主叫号码所在地的经纬度信息。
步骤2包括:
步骤61,接收后续发送的短消息;
步骤62,通过定位平台获取发送属于可疑短消息类的短消息的主叫号码所在地的经纬度信息,并在散列表中记录该经纬度信息的出现次数;
步骤63,如果所有经纬度信息的出现次数之和达到第二阈值,或者任意一个经纬度信息的出现次数达到第三阈值,则判断属于该可疑短消息类的短消息为垃圾短消息。
还包括步骤4,定期清除散列表中的非可疑短消息类。
本发明提供了基于主叫号码位置和发送内容的垃圾短消息识别***,包括:
短消息聚类模块,用于判断已发送的具有相同内容的短消息的数量是否达到第一阈值;
垃圾短消息识别模块,用于在已发送的具有相同内容的短消息的数量达到第一阈值时,对后续发送具有所述相同内容的短消息的主叫号码的位置信息出现次数进行统计:如果具有所述相同内容的短消息的所有主叫号码的位置信息出现次数之和达到第二阈值,或者如果具有所述相同内容的短消息的任意一个位置信息出现次数达到第三阈值,则判断所述相同内容的短消息为垃圾短消息;还用于将垃圾短消息的主叫号码发送至主叫号码发送模块;
主叫号码发送模块,用于将垃圾短消息的主叫号码发送至短消息中心,用于供短消息中心过滤垃圾短消息。
短消息聚类模块,还用于依据短消息内容计算散列值,计算已发送的散列值相同的短消息的数量,并判断该数量是否达到第一阈值。
短消息聚类模块,只对短消息内容的长度大于预设值的短消息内容计算散列值。
短消息聚类模块,还用于将散列值相同的短消息归为一短消息类,并将短消息的数量超过第一阈值的短消息类标记为可疑短消息类。
短消息聚类模块,还用于设置散列表,以依据散列值记录短消息所属的短消息类,并记录后续发送属于可疑短消息类的短消息的主叫号码的位置信息出现次数。
所述主叫号码的位置信息为主叫号码所在地的经纬度信息。
垃圾短消息识别模块,还用于利用定位平台获取发送属于可疑短消息类的短消息的主叫号码所在地的经纬度信息,并在散列表中记录该经纬度信息的出现次数;如果所有经纬度信息的出现次数之和达到第二阈值,或者任意一个经纬度信息的出现次数达到第三阈值,则判断属于该可疑短消息类的短消息为垃圾短消息。
还包括管理模块,用于定期清除散列表中的非可疑短消息类。
本发明提供了一种移动网络,包括短消息中心和定位平台,还包括上述的基于主叫号码位置和发送内容的垃圾短消息识别***;垃圾短消息识别***分别与短消息中心和定位平台连接;垃圾短消息识别***,通过定位平台获取主叫号码的位置信息。
本发明可保证短消息中心收到的大量短消息被实时高效地过滤、分类和处理,并实现对垃圾短消息的实时拦截。本发明首先根据群发垃圾短消息大量重复的特征,设计有效的散列算法保存短消息内容,并在此基础上对短消息流量进行内容聚分类,使得在线识别垃圾短消息成为可能。本发明进一步使用主叫号码的地理位置信息,从而有效识别群发器产生的垃圾短消息,且对合某个体用户批量发送的短消息不会产生误报。
附图说明
图1为本发明提供的垃圾短消息识别***结构图;
图2为本发明提供的垃圾短消息识别流程图;
图3为使用定位平台获取主叫号码的位置信息示意图;
图4为安装有垃圾短消息识别***的移动网络示意图。
具体实施方式
经过对大量垃圾短消息进行统计分析,发现使用群发器发送的垃圾短消息具有以下两个显著的特点:一是垃圾短消息内容大量重复,二是发送这些短消息主叫号码往往位于某一个或几个固定的位置且发送总数较大。而移动终端发送的短消息不会同时具有上述特征。
基于上述结论,本发明提出了一种基于主叫号码位置和发送内容的垃圾短消息识别方法:首先使用有效的散列算法,将短消息内容转化为易于比较与维护的散列值;其次,根据散列值间的比较结果将内容大量重复的短消息聚为一类;再次,如果某短消息类中短消息发送数量超过事先设定的阈值f0,则对后续发送相同短消息的主叫号码位置信息及出现次数进行统计;如果后续所有主叫号码的位置信息出现次数之和大于预先设定的阈值f1或某一个位置信息出现次数大于预先设定的阈值f2,则此短消息类中所有短消息为垃圾短消息。
本发明的垃圾短消息识别***(简称识别***)主要分为四个部分,如图1所示:短消息聚类模块201、垃圾短消息识别模块202、主叫号码发送模块203和管理模块204。短消息聚类模块201实时扫描短消息流量,将内容重复的短消息聚成一类,并统计各类中短消息数量,如果某个类中短消息数量超过设定阈值f0(f0为自然数),则将该短消息类标记为可疑短消息类,短消息数量达不到阈值f0的短消息类为非可疑短消息类;垃圾短消息识别模块202对可疑短消息类后续短消息的主叫号码位置信息进行统计,如果内容相同的短消息具有相同的地理位置且该地理位置出现次数达到f2(f2为自然数)或者所有内容相同的短消息的地理位置出现次数达到f1(f1为自然数),则此短消息类为垃圾短消息类,并将垃圾短消息的主叫号码发送至主叫号码发送模块203。主叫号码发送模块203将当前短消息对应的主叫号码发送至短消息中心,短消息中心将该号码加入短消息禁发黑名单,禁止它进一步发送垃圾短消息;管理模块204将定期删除散列表中的短消息类,以保证内存的可用性。通常,管理模块204处于闲置状态;另每隔一个周期t,管理模块204依据散列表中短消息类属性自动清除散列表中非可疑短消息类。
下面对短消息内容重复识别问题进行描述:将一封短消息的正文部分(以下简称为短消息)看成是长度为x的字节序列M=b1b2…bx.作为研究短消息聚类性质的一个方面,确定给定的k封短消息,其内容是否存在重复。
因此,一种可行的方法是依次比较短消息中各字节序列是否相同,为提高比较效率,要用数据结构T保存访问过的短消息内容。遇到一封新短消息,首先与T中的元素比较,若不在其中,则将它加入T中,并将短消息出现的次数计为1,否则直接将T中该短消息出现的次数加一。
一种具体的实现方法是将T组织成一个链表,按照短消息到达的顺序,将短消息内容依次写入链表。对于新到的短消息,首先查询链表中所有短消息,如果该短消息第一次出现,则将当前短消息加在链表尾部,并将该短消息出现次数记为1;否则更新链表中已经存在短消息的出现次数。重复此过程。
为保证快速完成检索、比较、统计等操作及减少内存开销,保证算法的可用性,另一种实现方法是将T组织成一个散列表。
散列方法通常有两种,一种是对整个短消息内容做散列,一封短消息内容对应着一个散列值,该方法对长度较短的散列对象有效;另一种方法是对短消息内容的若干个字节子序列做散列,一封短消息对应着一个散列值的集合,该方法对长度较大的散列对象比较有效。考虑到短消息内容长度较小(最大长度为140字节),为保证可读性,一次发送中短消息内容不会随机变化,因此在本发明中选用第一种散列方法。同时要保证散列值的值域足够大,能够唯一代表原始短消息。即,如果两个散列值不等,则它们代表的原始短消息不同;如果两个散列值相同,则它们所代表的原始短消息不同的概率极小。
在本发明中,使用散列算法为MD5算法,散列的对象是整个短消息内容M,散列表中保存的是对应的散列值hi。其中:hi=MD5(M)。通过对垃圾和非垃圾短消息的长度进行统计,发现垃圾短消息一般长度大于30字节,因此在本发明中,仅对长度大于30字节的短消息进行散列运算;对长度小于30的短消息不做任何操作。
散列表中每个表项都包括基础表项和扩展表项,并对应着一个短消息类。基础表项中有三个字段,第一个字段记录归入此短消息类中短消息的总数。第二个字段记录短消息内容对应的散列值。第三个字段记录短消息类属性,如果为可疑短消息类则此字段值为1,如果为垃圾短消息类则此字段值为2,如果为非可疑短消息类则该字段值为0。
扩展表项组织成一个链表,链表中每个单元由发送散列值为hi的短消息的主叫号码所在地的经纬度信息和该信息的出现次数组成。
短消息聚类模块201对收到的短消息内容进行MD5的散列计算,并检查散列表,如果散列值已经存在于表中,则增加短消息数量;否则在散列表中新建一个短消息类,并设置类中短消息数量为1。当该类中短消息数量达到预先设定的阈值f0,则将该短消息类标记为可疑短消息类。为了提高效率,短消息聚类模块201也可以先检查接收到的短消息内容的长度,如果小于30字节,则不做任何操作,否则对短消息内容进行MD5的散列计算,然后进行相应处理。
本发明中,散列表存放在短消息聚类模块201中,其余模块通过与短消息聚类模块201的接口访问散列表;当然散列表也可以独立存在,发明中各个模块与之进行独立的通信,以访问或修改散列表中的数据。
在移动通信***中,移动用户每时每刻的位置都可能是不定的,移动网络要为每个用户随时提供业务,就要求随时知道移动用户所在的位置,如用户所在地的LAC和Cell ID等信息。其中LAC(Location Area Code)为位置区域号码,是一个2字节BCD编码;Cell ID为小区识别号,代表着LAC内的一个小区。每次移动用户变换位置时,都会主动与网络进行联系,如用户跨越位置区时,会通过BSC向MSC/VLR报告,VLR会保存用户当前最新的LAC和Cell ID。当用户跨越MSC服务区边界时,VLR会向HLR报告用户所在VLR的位置,也即HLR总是保存所有用户所在的VLR的位置信息。在移动通信网中,用户可以通过现有定位平台提供定位业务获取某主叫号码的位置信息。定位平台的工作原理如下:用户通过平台提供的查询接口输入待查的主叫号码,平台根据主叫号码信息与相应的HLR、MSC/VLR进行通信,从而获取该主叫号码对应的无线环境信息,如LAC或/和Cell ID等值,并将这些参数转换成主叫号码所在地的经纬度信息返回给用户。
垃圾短消息识别模块202对可疑类后续短消息的主叫号码位置信息进行统计,如果后续所有主叫号码的位置信息出现次数之和大于预先设定的阈值f1或某一个位置信息出现次数大于预先设定的阈值f2(f2为自然数),则此短消息类为垃圾短消息类。
如果当前短消息被分入可疑短消息类,垃圾短消息识别模块202首先利用定位平台实时查询主叫号码的位置信息。定位平台收到查询请求后,通过与HLR、MSC/VLR进行通信,获取主叫号码所在地的无线环境信息,如LAC或/和Cell ID等值,并将这些参数转化为主叫号码所在地的经纬度信息,提供给垃圾短消息识别模块202。如果查询失败,则垃圾短消息识别模块202结束当前短消息处理流程。图3为使用定位平台获取主叫号码的位置信息示意图。
垃圾短消息识别模块202获取该主叫号码的位置信息,将该散列值(即hi)对应的位置信息保存在散列表的扩展表项中,本发明中用V来描述可疑短消息类中后续短消息的主叫号码的位置信息,其中Vi=[L1…Lm],m≤k。
如果Vi中所有主叫号码的位置信息出现次数之和大于预先设定的阈值f1或某个位置信息出现次数大于预先设定的阈值f2,则将该可疑类标记为垃圾短消息类,并将该短消息的主叫号码提交给主叫号码发送模块203。
主叫号码发送模块203,将垃圾短消息的主叫号码发送至短消息中心,用于供短消息中心过滤垃圾短消息。
上述参数f0取值为50,参数f1取值为800,参数f2取值为500,t取值为2小时。
本发明中的方法如图2所示,包括如下步骤:
步骤301,初始化,构建存储散列值的散列表,接收一条新的短消息。
步骤302,计算所接收到的新短消息的散列值。
步骤303,判断散列值是否存在于散列表中,如果是,执行步骤304,否则执行步骤311;
步骤304,修改散列表,则将散列值出现的次数增加1;
步骤305,判断散列值出现次数是否大于f0,如果是执行步骤306,否则执行步骤312;
步骤306,通过定位平台实时查询主叫号码的位置信息;
步骤307,判断本次查询是否成功,如果是执行步骤308,否则执行步骤312;
步骤308,获取主叫号码所在地的经纬度信息,如果该经纬度信息第一次出现,则将经纬度信息写入该散列值所对应的表项中,且其出现次数记为1;否则其出现次数增加1;
步骤309,判断Vi中所有经纬度信息出现次数之和是否大于预先设定的阈值f1或某个经纬度信息出现次数是否大于预先设定的阈值f2;如果上述条件至少一个成立,执行步骤310,否则执行步骤312;
步骤310,将发送该短消息的主叫号码加入黑名单,执行步骤312;
步骤311,将散列值加入散列表,将散列值出现的次数记为1,然后再执行步骤312;
步骤312,接收下一封短消息,并按照上述流程进行处理。
图4详细描述了本发明的网络结构,发送一侧移动终端和群发工具同时存在,通过接入网进入网络,通过短消息中心转发,经MSC选路最后到达接收一侧。本发明中的垃圾短消息识别***与短消息中心、定位平台连接。垃圾短消息识别***可从短消息中心获得短消息中心上短消息流量的镜像,不影响短消息中心正常的处理工作;同时垃圾短消息识别***可将垃圾短消息对应的主叫号码制成黑名单并传递给短消息中心,进行实时过滤。垃圾短消息识别***可通过定位平台实时获得主叫号码的位置信息。垃圾短消息识别***处理短消息中心分流的镜像数据,并将处理结果写入日志。
此外,短消息过滤方案具有较好的实时性能,一旦发现垃圾短消息后,可将该短消息对应的主叫号码制成黑名单,实时传给短消息中心,及时拦截群发器后续发送的垃圾短消息。另外,任何经运营商许可进行群发业务的主叫号码可设置在短消息中心的白名单列表中,且此白名单的优先级高于黑名单,因此本发明不会对合法主叫号码的群发业务产生影响。
本领域的技术人员在不脱离权利要求书确定的本发明的精神和范围的条件下,还可以对以上内容进行各种各样的修改。因此本发明的范围并不仅限于以上的说明,而是由权利要求书的范围来确定的。
Claims (16)
1.基于主叫号码位置和发送内容的垃圾短消息识别方法,其特征在于,包括:
步骤1,判断已发送的具有相同内容的短消息的数量是否达到第一阈值,如果是,执行步骤2;
步骤2,对后续发送具有所述相同内容的短消息的主叫号码的位置信息出现次数进行统计:如果具有所述相同内容的短消息的后续所有主叫号码的位置信息出现次数之和达到第二阈值,或者如果具有所述相同内容的短消息的任意一个位置信息出现次数达到第三阈值,则判断所述相同内容的短消息为垃圾短消息;
步骤3,将垃圾短消息的主叫号码发送至短消息中心,用于供短消息中心过滤垃圾短消息,
其中步骤1包括:
步骤21,依据短消息内容计算散列值;
步骤22,计算已发送的散列值相同的短消息的数量,并判断该数量是否达到第一阈值,如果是,执行步骤2。
2.如权利要求1所述的基于主叫号码位置和发送内容的垃圾短消息识别方法,其特征在于,步骤21中,只对短消息内容的长度大于预设值的短消息计算其短消息内容的散列值。
3.如权利要求1所述的基于主叫号码位置和发送内容的垃圾短消息识别方法,其特征在于,步骤22中,还将散列值相同的短消息归为一短消息类,并将短消息数量超过第一阈值的短消息类标记为可疑短消息类。
4.如权利要求1、2或3所述的基于主叫号码位置和发送内容的垃圾短消息识别方法,其特征在于,步骤3中,短消息中心还将垃圾短消息的主叫号码加入短消息禁发黑名单。
5.如权利要求4所述的基于主叫号码位置和发送内容的垃圾短消息识别方法,其特征在于,步骤21之前包括步骤20:设置散列表,用于依据散列值记录短消息所属的短消息类以及标记可疑短消息类,并记录后续发送属于可疑短消息类的短消息的主叫号码的位置信息出现次数。
6.如权利要求4所述的基于主叫号码位置和发送内容的垃圾短消息识别方法,其特征在于,所述主叫号码的位置信息为主叫号码所在地的经纬度信息。
7.如权利要求6所述的基于主叫号码位置和发送内容的垃圾短消息识别方法,其特征在于,步骤2包括:
步骤61,接收后续发送的短消息;
步骤62,通过定位平台获取发送属于可疑短消息类的短消息的主叫号码所在地的经纬度信息,并在散列表中记录该经纬度信息的出现次数;
步骤63,如果所有经纬度信息的出现次数之和达到第二阈值,或者任意一个经纬度信息的出现次数达到第三阈值,则判断属于该可疑短消息类的短消息为垃圾短消息。
8.如权利要求5、6或7所述的基于主叫号码位置和发送内容的垃圾短消息识别方法,其特征在于,进一步包括步骤4,定期清除散列表中的非可疑短消息类。
9.基于主叫号码位置和发送内容的垃圾短消息识别***,其特征在于,包括:
短消息聚类模块,用于判断已发送的具有相同内容的短消息的数量是否达到第一阈值;
垃圾短消息识别模块,用于在已发送的具有相同内容的短消息的数量达到第一阈值时,对后续发送具有所述相同内容的短消息的主叫号码的位置信息出现次数进行统计:如果具有所述相同内容的短消息的所有主叫号码的位置信息出现次数之和达到第二阈值,或者如果具有所述相同内容的短消息的任意一个位置信息出现次数达到第三阈值,则判断所述相同内容的短消息为垃圾短消息;还用于将垃圾短消息的主叫号码发送至主叫号码发送模块;
主叫号码发送模块,用于将垃圾短消息的主叫号码发送至短消息中心,用于供短消息中心过滤垃圾短消息,
其中短消息聚类模块还用于依据短消息内容计算散列值,计算已发送的散列值相同的短消息的数量,并判断该数量是否达到第一阈值。
10.如权利要求9所述的基于主叫号码位置和发送内容的垃圾短消息识别***,其特征在于,短消息聚类模块,只对短消息内容的长度大于预设值的短消息内容计算散列值。
11.如权利要求10所述的基于主叫号码位置和发送内容的垃圾短消息识别***,其特征在于,短消息聚类模块,还用于将散列值相同的短消息归为一短消息类,并将短消息的数量超过第一阈值的短消息类标记为可疑短消息类。
12.如权利要求9、10或11所述的基于主叫号码位置和发送内容的垃圾短消息识别***,其特征在于,短消息聚类模块,还用于设置散列表,以依据散列值记录短消息所属的短消息类,并记录后续发送属于可疑短消息类的短消息的主叫号码的位置信息出现次数。
13.如权利要求12所述的基于主叫号码位置和发送内容的垃圾短消息识别***,其特征在于,所述主叫号码的位置信息为主叫号码所在地的经纬度信息。
14.如权利要求13所述的基于主叫号码位置和发送内容的垃圾短消息识别***,其特征在于,垃圾短消息识别模块,还用于通过定位平台获取发送属于可疑短消息类的短消息的主叫号码所在地的经纬度信息,并在散列表中记录该经纬度信息的出现次数;如果所有经纬度信息的出现次数之和达到第二阈值,或者任意一个经纬度信息的出现次数达到第三阈值,则判断属于该可疑短消息类的短消息为垃圾短消息。
15.如权利要求14所述的基于主叫号码位置和发送内容的垃圾短消息识别***,其特征在于,还包括管理模块,用于定期清除散列表中的非可疑短消息类。
16.一种移动网络,包括短消息中心和定位平台,其特征在于,还包括如权利要求9所述的基于主叫号码位置和发送内容的垃圾短消息识别***;垃圾短消息识别***分别与短消息中心和定位平台连接;垃圾短消息识别***,通过定位平台获取主叫号码的位置信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810116687XA CN101335920B (zh) | 2008-07-15 | 2008-07-15 | 基于主叫号码位置和发送内容的垃圾短消息识别***及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810116687XA CN101335920B (zh) | 2008-07-15 | 2008-07-15 | 基于主叫号码位置和发送内容的垃圾短消息识别***及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101335920A CN101335920A (zh) | 2008-12-31 |
CN101335920B true CN101335920B (zh) | 2011-04-13 |
Family
ID=40198168
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200810116687XA Active CN101335920B (zh) | 2008-07-15 | 2008-07-15 | 基于主叫号码位置和发送内容的垃圾短消息识别***及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101335920B (zh) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101895828B (zh) * | 2009-05-20 | 2013-01-16 | 中兴通讯股份有限公司 | 一种短消息监控***及方法 |
CN101938714A (zh) * | 2009-06-29 | 2011-01-05 | 国际商业机器公司 | 用于垃圾短信检测的方法和设备 |
CN101990172B (zh) * | 2009-07-30 | 2013-05-29 | ***通信集团广东有限公司 | 一种消息识别方法、装置及消息业务处理方法和*** |
CN102111723B (zh) * | 2009-12-24 | 2015-07-01 | 上海粱江通信***股份有限公司 | 一种分析短信消息频次与内容识别垃圾短消息用户的方法 |
CN101771966B (zh) * | 2010-03-11 | 2013-01-23 | 上海粱江通信***股份有限公司 | 一种基于关键字和频次识别垃圾短信源的方法 |
CN102572747B (zh) * | 2010-12-28 | 2015-05-27 | ***通信集团吉林有限公司 | 一种垃圾短信监控方法及*** |
CN102333291A (zh) * | 2011-06-23 | 2012-01-25 | 中兴通讯股份有限公司 | 短消息处理方法及装置 |
CN102905236B (zh) * | 2011-07-27 | 2016-08-17 | 华为技术有限公司 | 一种垃圾短消息监控方法、装置及*** |
US20150286348A1 (en) * | 2012-11-02 | 2015-10-08 | Ge Intelligent Platforms, Inc. | Apparatus and method for intelligent querying and filtering |
CN103415004B (zh) * | 2013-07-26 | 2016-09-21 | 中国联合网络通信集团有限公司 | 一种检测垃圾短消息的方法及装置 |
CN104703185B (zh) * | 2013-12-05 | 2018-04-10 | 中国联合网络通信集团有限公司 | 信息识别方法及***、移动通信网络 |
CN103648165B (zh) * | 2013-12-30 | 2017-08-04 | 大唐移动通信设备有限公司 | 一种异常情况下的寻呼控制方法及装置 |
CN105592429A (zh) * | 2014-10-20 | 2016-05-18 | 中兴通讯股份有限公司 | 短信过滤方法及短信过滤装置 |
CN107181664B (zh) * | 2016-03-10 | 2021-04-09 | 创新先进技术有限公司 | 一种自动熔断的消息发送方法、装置及*** |
CN107241729A (zh) * | 2016-03-29 | 2017-10-10 | 努比亚技术有限公司 | 伪基站识别方法及装置 |
CN107509190A (zh) * | 2016-06-14 | 2017-12-22 | 中兴通讯股份有限公司 | 一种短消息监控方法、装置和监控中心 |
CN110139280A (zh) * | 2019-07-02 | 2019-08-16 | 中国联合网络通信集团有限公司 | 诈骗号码的检测方法、装置及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1905408A (zh) * | 2006-08-04 | 2007-01-31 | 华为技术有限公司 | 一种消息监控的方法和装置 |
CN101150762A (zh) * | 2007-11-06 | 2008-03-26 | ***通信集团江苏有限公司 | 一种垃圾短信实时拦截的方法与*** |
-
2008
- 2008-07-15 CN CN200810116687XA patent/CN101335920B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1905408A (zh) * | 2006-08-04 | 2007-01-31 | 华为技术有限公司 | 一种消息监控的方法和装置 |
CN101150762A (zh) * | 2007-11-06 | 2008-03-26 | ***通信集团江苏有限公司 | 一种垃圾短信实时拦截的方法与*** |
Also Published As
Publication number | Publication date |
---|---|
CN101335920A (zh) | 2008-12-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101335920B (zh) | 基于主叫号码位置和发送内容的垃圾短消息识别***及方法 | |
CN101790142B (zh) | 结合短信内容和发送频次识别垃圾短信源的***与方法 | |
CN102209326B (zh) | 基于智能手机无线电接口层的恶意行为检测方法及*** | |
CN103607705B (zh) | 垃圾短信过滤方法及引擎 | |
WO2016065908A1 (zh) | 一种欺诈用户的检测方法、装置和*** | |
CN101938565A (zh) | 短信处理方法及移动终端 | |
CN104867011A (zh) | 对移动支付进行安全控制的方法与装置 | |
CN100589606C (zh) | 一种短消息查询分析***及方法 | |
CN101389085B (zh) | 基于发送行为的垃圾短消息识别***及方法 | |
CN103763690A (zh) | 检测伪基站向移动终端发送短信息的方法和装置 | |
CN102982626B (zh) | 一种pos终端移机告警的方法及装置 | |
CN101860822A (zh) | 垃圾短信监控方法和*** | |
WO2010031294A1 (zh) | 基于区域策略的位置广告业务分众方法及其*** | |
CN103874058A (zh) | 短信处理方法及短信中心 | |
CN102801866B (zh) | 一种移动终端的***方法 | |
CN103415004A (zh) | 一种检测垃圾短消息的方法及装置 | |
CN102480705B (zh) | 一种根据号码关系图过滤垃圾短信的方法及*** | |
CN102098640B (zh) | 一种识别并阻止设备发送垃圾短信的方法、设备和*** | |
AU2010209629A1 (en) | Method and arrangement for gathering data from a communication network | |
CN103796184A (zh) | 垃圾短信识别方法和*** | |
CN108848278A (zh) | 一号多终端业务安全监控方法、装置和设备 | |
CN109104429B (zh) | 一种针对网络诈骗信息的检测方法 | |
CN103679934A (zh) | 一种处理银行卡信息的方法和装置 | |
CN102231874A (zh) | 一种短信处理方法、装置及*** | |
CN103096273A (zh) | 一种上行短消息发送的方法、设备及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |