CN105162931B - 一种通信号码的分类方法及装置 - Google Patents
一种通信号码的分类方法及装置 Download PDFInfo
- Publication number
- CN105162931B CN105162931B CN201510458100.3A CN201510458100A CN105162931B CN 105162931 B CN105162931 B CN 105162931B CN 201510458100 A CN201510458100 A CN 201510458100A CN 105162931 B CN105162931 B CN 105162931B
- Authority
- CN
- China
- Prior art keywords
- mark word
- word
- mark
- classification
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Telephonic Communication Services (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开是关于一种通信号码的分类方法及装置,该方法包括:获取目标号码对应的每个标注词和每个标注词被标记的次数;分别获取出每个标注词单独出现在每个类别标注词中的条件概率;根据每个标注词被标记的次数和条件概率,计算每个标注词分别在每个类别标注词中的事件概率;将最大的事件概率对应的类别标注词确定为目标号码的目标标注词。某个标注词在类别标注词中的事件概率表示目标号码属于该类别标注词的可能性,标注词在类别标注词中的事件概率越大说明该类别标注词属于目标号码的目标标注词的可能性就越大,所以最大的事件概率对应的类别标注词属于目标号码的目标标注词。因此,本公开提供的方案可以准确的对目标号码进行分类。
Description
技术领域
本发明涉及通信技术领域,更具体的说,涉及通信号码的分类方法及装置。
背景技术
目前,对陌生电话号码进行分类,最常用的分类方法为统计标注词的标记次数的方法。首先,收集不同的用户提交的陌生电话号码的标注词;然后,统计陌生电话号码被标记上的所有标注词;最后,在所有标注词中选择出被标记次数最多的标注词,并将被标记次数最多的标注词作为陌生电话号码的标注词。
在用户的手机接收到该陌生电话号码的呼叫请求时,手机会显示出该陌生电话号码被标记次数最多的标注词,以使用户可以根据该陌生电话号码的标注词选择是否接听电话,从而帮助用户拦截掉一些不希望接听的电话,例如,推销电话、诈骗电话和中介电话等。
但是,由于在用户与陌生电话号码进行通话时,用户很有可能在没有听清楚对方来意的情况下私下定论。例如,假设用户在心情不好时接听到了陌生电话号码的来电请求,用户很可能在没有搞清楚对方来意的情况下,将该陌生电话号码标记成骚扰电话,然而实际上,该陌生电话号码属于中介电话,而不属于骚扰电话。
因此,采用上述分类方法对陌生电话号码的分类不一定准确,经常出现陌生电话号码的实际情况与手机上显示的标注词不一致的问题。
发明内容
为克服相关技术中存在的问题,本公开提供一种通信号码的分类方法及装置,可对陌生号码分类更加准确。
根据本公开实施例的第一方面,提供一种通信号码的分类方法,包括:
获取目标号码对应的每个标注词和所述每个标注词被标记的次数;
分别获取出所述每个标注词单独出现在每个类别标注词中的条件概率;
根据所述每个标注词被标记的次数和所述条件概率,计算所述每个标注词分别在所述每个类别标注词中的事件概率;
将最大的所述事件概率对应的类别标注词确定为所述目标号码的目标标注词。
可选的,所述方法还包括:
记录确定出所述目标号码的目标标注词的起始日期;
判断当前日期是否等于所述起始日期与预设天数之和;
在所述当前日期等于所述起始日期与所述预设天数之和时,触发所述获取目标号码对应的每个标注词和所述每个标注词被标记的次数的步骤;
在所述当前日期不等于所述起始日期与所述预设天数之和时,触发所述判断当前日期是否等于所述起始日期与预设天数之和的步骤。
可选的,所述方法还包括:
在接收到客户端发送的获取所述目标号码对应的标注词的请求时,确定出与所述目标号码对应的所述目标标注词;
向所述客户端发送所述目标标注词。
可选的,所述方法还包括:
判断所述每个标注词被标记的次数是否符合预设条件;
在所述每个标注词被标记的次数符合预设条件时,触发所述分别获取出所述每个标注词单独出现在每个类别标注词中的条件概率的步骤;
在所述每个标注词被标记的次数不符合所述预设条件时,将所述目标号码确定为白名单号码。
可选的,所述方法还包括:
在所述目标标注词为预设标注词时,确定与所述目标号码对应的运营商服务器;
向所述运营商服务器发送所述目标号码和所述目标号码对应的所述目标标注词。
根据本公开实施例的第二方面,提供一种通信号码的分类装置,包括:
第一获取模块,用于获取目标号码对应的每个标注词和所述每个标注词被标记的次数;
第二获取模块,用于分别获取出所述每个标注词单独出现在每个类别标注词中的条件概率;
计算模块,用于根据所述每个标注词被标记的次数和所述条件概率,计算所述每个标注词分别在所述每个类别标注词中的事件概率;
第一确定模块,用于将最大的所述事件概率对应的类别标注词确定为所述目标号码的目标标注词。
可选的,所述装置还包括:
记录模块,用于记录确定出所述目标号码的目标标注词的起始日期;
第一判断模块,用于判断当前日期是否等于所述起始日期与预设天数之和;
第一触发模块,用于在所述当前日期等于所述起始日期与所述预设天数之和时,触发所述第一获取模块;
第二触发模块,用于在所述当前日期不等于所述起始日期与所述预设天数之和时,触发所述第一判断模块。
可选的,所述装置还包括:
第二确定模块,用于在接收到客户端发送的获取所述目标号码对应的标注词的请求时,确定出与所述目标号码对应的所述目标标注词;
第一发送模块,用于向所述客户端发送所述目标标注词。
可选的,所述装置还包括:
第二判断模块,用于判断所述每个标注词被标记的次数是否符合预设条件;
第三触发模块,用于在所述每个标注词被标记的次数符合预设条件时,触发所述第二获取模块;
第三确定模块,用于在所述每个标注词被标记的次数不符合所述预设条件时,将所述目标号码确定为白名单号码。
可选的,所述装置还包括:
第四确定模块,用于在所述目标标注词为预设标注词时,确定与所述目标号码对应的运营商服务器;
第一发送模块,用于向所述运营商服务器发送所述目标号码和所述目标号码对应的所述目标标注词。
根据本公开实施例的第三方面,提供一种通信号码的分类装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取目标号码对应的每个标注词和所述每个标注词被标记的次数;
在数据库中分别获取出所述每个标注词单独出现在每个类别标注词中的条件概率;
根据所述每个标注词被标记的次数和所述条件概率,计算所述每个标注词分别在所述每个类别标注词中的事件概率;
将最大的所述事件概率对应的类别标注词确定为所述目标号码的目标标注词。
本公开的实施例提供的技术方案可以包括以下有益效果:在获取到每个标注词被标记的次数和条件概率后,可以根据每个标注词被标记的次数和条件概率计算出每个标注词分别在每个类别标注词中的事件概率。某个标注词在类别标注词中的事件概率表示目标号码属于该类别标注词的可能性,标注词在类别标注词中的事件概率越大说明该类别标注词属于目标号码的目标标注词的可能性就越大,所以最大的事件概率对应的类别标注词属于目标号码的目标标注词。因此,本公开提供的方案可以准确的对陌生号码进行分类。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种通信号码的分类方法的流程图。
图2是根据一示例性实施例示出的另一种通信号码的分类方法的流程图。
图3是根据一示例性实施例示出的又一种通信号码的分类方法的流程图。
图4是根据一示例性实施例示出的又一种通信号码的分类方法的流程图。
图5是根据一示例性实施例示出的又一种通信号码的分类方法的流程图。
图6是根据一示例性实施例示出的一种通信号码的分类装置的示意图。
图7是根据一示例性实施例示出的另一种通信号码的分类装置的示意图。
图8是根据一示例性实施例示出的又一种通信号码的分类装置的示意图。
图9是根据一示例性实施例示出的又一种通信号码的分类装置的示意图。
图10是根据一示例性实施例示出的又一种通信号码的分类装置的示意图。
图11是根据一示例性实施例示出的又一种通信号码的分类装置的示意图。
图12是根据一示例性实施例示出的一种通信号码的分类装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种通信号码的分类方法的流程图,如图1所示,图1所示的通信号码的分类方法,可以用于服务器中。本公开提供的通信号码的分类方法可对陌生号码分类更加准确。该方法包括以下步骤。
在步骤S11中,获取目标号码对应的每个标注词和每个标注词被标记的次数。
其中,本公开提供的方法可以应用于服务器内,服务器可以为笔记本电脑或台式电脑等设备。目标号码可以为多种类型的号码,例如,目标号码可以为电话号码,目标号码还可以为应用软件的账号。当然,并不局限于此,目标号码还可以为其他类型的号码。
标注词的种类有很多,可以被工作人员预先设定好,例如,标注词的种类可以包括快递标注词、中介标注词、骚扰标注词、诈骗标注词、推销标注词、送餐标注词和理财标注词等。标注词被标记的次数指的是一个标注词被标注的次数,例如,在标注词为快递时,标注词被标记的次数指的是快递标注词被用户标注的次数。
目标号码对应的每个标注词可以为1个,也可以为多个。例如,假设标注词的种类只有三种,包括快递标注词、中介标注词和诈骗标注词,那么目标号码对应的每个标注词有可能仅为快递标注词、中介标注词或诈骗标注词,也有可能为快递标注词、中介标注词和诈骗标注词中的至少两个。每个标注词被标记的次数可以为1次,也可以为多次,例如,假设标注词的种类只有三种,包括快递标注词、中介标注词和诈骗标注词,且目标号码对应的每个标注词仅为快递标注词,那么快递标注词被用户标注的次数可以为1 次,也可以为多次。
本公开存在着几种应用场景。第一种应用场景为,在工作人员向服务器发送对号码库中的电话号码进行分类的指定时,服务器会获取号码库中的电话号码对应的每个标注词和每个标注词被标记的次数,并进行处理,目标号码只是号码库中的一个电话号码;第二种应用场景为,在用户的移动终端接收到目标号码的通信请求时,移动终端会向服务器发送查询该目标号码的标注词的请求,服务器在接收到移动终端发生送的查询该目标号码的标注词的请求时,服务器会获取号码库中的目标号码对应的每个标注词和每个标注词被标记的次数,并进行处理;第三种应用场景为,服务器按照预先设定的指令,定期的获取号码库中的电话号码对应的每个标注词和每个标注词被标记的次数,并进行处理,目标号码只是号码库中的一个电话号码。
例如,假设在服务器的号码库中标注词的种类包括快递标注词、中介标注词、骚扰标注词、诈骗标注词、推销标注词、送餐标注词和理财标注词这七大类。目标号码15900000000对应两个标注词,这两个标注词为推销标注词和诈骗标注词,其中,推销标注词被不同的用户标记过10次,诈骗标注词被不同的用户标记过15次。在用户的智能手机接收到目标号码15900000000的通话请求时,智能手机会向服务器发送查询该目标号码15900000000的标注词的请求,服务器在接收到智能手机发生送的查询该目标号码15900000000的标注词的请求时,服务器会获取号码库中的目标号码对应的每个标注词和每个标注词被标记的次数,最终,服务器获取到目标号码15900000000对应的标注词为推销标注词和诈骗标注词,推销标注词被标记的次数为10次,诈骗标注词被标记的次数为15次,这些信息在服务器获取到以后,会在后续步骤使用到。
在步骤S12中,分别获取出每个标注词单独出现在每个类别标注词中的条件概率。
其中,类别标注词为服务器的号码库中电话号码最终被确定为某一标注词的类别。例如,假设服务器的号码库中一共有100个电话号码,这100个电话号码中,有50个电话号码被确定的类别标注词为快递类别,有30个电话号码被确定的类别标注词为中介类别,有20个电话号码被确定的类别标注词为诈骗类别。
另外,每个标注词单独出现在某一个类别标注词中的条件概率指的是,每个标注词在某一个类别标注词中所占据的比例。每个标注词单独出现在每个类别标注词中的条件概率指的是,每个标注词在每个类别标注词中所占据的比例。
例如,假设服务器的号码库中一共有100个电话号码,这100个电话号码中,有50个电话号码被确定的类别标注词为快递类别,有30个电话号码被确定的类别标注词为中介类别,有20个电话号码被确定的类别标注词为诈骗类别。
假设在类别标注词为快递类别的50个电话号码中,被标记为快递标注词的次数为500次,被标记为中介标注词的次数为400次,被标记为诈骗标注词的次数为100次,那么快递标注词单独出现在快递类别的条件概率为500/(500+400+100)=0.5,中介标注词单独出现在快递类别的条件概率为400/(500+400+100)=0.4,诈骗标注词单独出现在快递类别的条件概率为100/(500+400+100)=0.1。
假设在类别标注词为中介类别的30个电话号码中,被标记为快递标注词的次数为200次,被标记为中介标注词的次数为600次,被标记为诈骗标注词的次数为200次,那么快递标注词单独出现在中介类别的条件概率为0.2,中介标注词单独出现在中介类别的条件概率为0.6,诈骗标注词单独出现在中介类别的条件概率为0.2。
假设在类别标注词为诈骗类别的20个电话号码中,被标记为快递标注词的次数为100次,被标记为中介标注词的次数为200次,被标记为诈骗标注词的次数为700次,那么诈骗标注词单独出现在诈骗类别的条件概率为0.1,诈骗标注词单独出现在中介类别的条件概率为0.2,诈骗标注词单独出现在中介类别的条件概率为0.7。
在步骤S13中,根据每个标注词被标记的次数和条件概率,计算每个标注词分别在每个类别标注词中的事件概率。
其中,每个标注词指的是目标号码对应的每个标注词。目标号码对应的每个标注词在某一个类别标注词中的事件概率指的是,目标号码对应的每个标注词同时出现在该类别标注词中的可能性。目标号码对应的每个标注词在每个类别标注词中的事件概率指的是,目标号码对应的每个标注词同时出现在每个类别标注词中的可能性。
例如,假设目标号码为159,目标号码对应的两个标注词,分别为快递标注词和中介标注词,快递标注词被标记的次数为2次,中介标注词被标记的次数为1次;假设快递标注词单独出现在快递类别中的条件概率为0.8,中介标注词单独出现在快递类别中的条件概率为0.2,快递标注词单独出现在中介类别中的条件概率为0.4,中介标注词单独出现在中介类别中的条件概率为0.6。
因此,快递标注词与中介标注词在快递类别中的事件概率为=0.82×0.21=0.64× 0.2=0.128。也就是说,在快递类别中,同时出现2次快递标注词和1次中介标注词的概率为0.128。快递标注词与中介标注词在中介类别中的事件概率为=0.42×0.61=0.16×0.6=0.096。也就是说,在中介类别中,同时出现2次快递标注词和1次中介标注词的概率为0.096。
在上述计算事件概率的例子中可以得知,在快递类别中,同时出现2次快递标注词和1次中介标注词的概率为0.128;在中介类别中,同时出现2次快递标注词和1次中介标注词的概率为0.096,所以相对于中介类别,目标号码159属于快递类别的可能性更大。
需要说明的是,将标注词被标记的次数限定在2次以内的目的是为了简化运算。在实际的数据中,标注词被标记的次数通常要远大于2次,标注词被标记的次数可能为几十次或几百次,甚至更高。
在步骤S14中,将最大的事件概率对应的类别标注词确定为目标号码的目标标注词。
其中,在计算出每个标注词分别在每个类别标注词中的事件概率后,服务器还需要在这些事件概率中选择一个最大的事件概率,并将最大的事件概率对应的类别标注词确定为目标号码的目标标注词。
例如,假设目标号码为159,目标号码对应的两个标注词,分别为快递标注词和中介标注词,而且,服务器已经计算出快递标注词与中介标注词在快递类别中的事件概率为0.128,快递标注词与中介标注词在中介类别中的事件概率为=0.096。此时,通过比较,服务器判断出快递标注词与中介标注词在快递类别中的事件概率更大,所以服务器会将快递类别确定为目标号码159的目标标注词。
另外,在步骤S14中,还可以包括以下三个子步骤:步骤一、分别获取每个类别标注词在号码库中的先验概率;步骤二、计算类别标注词的事件概率与类别标注词在号码库中的先验概率的乘积得到类别标注词的目标概率;步骤三、将最大的目标概率对应的类别标注词确定为目标号码的目标标注词。其中,类别标注词在号码库中的先验概率指的是类别标注词在号码库中所占据的比例,类别标注词在号码库中的先验概率也可以作为确定目标号码的目标标注词的因素之一。
例如,假设目标号码为159,目标号码对应的两个标注词,分别为快递标注词和中介标注词,假设在号码库中被标记为快递类别的电话号码所占据的比例为4/10,被标记为中介类别的电话号码所占据的比例为6/10。服务器已经计算出快递标注词与中介标注词在快递类别中的事件概率为0.128,快递标注词与中介标注词在中介类别中的事件概率为=0.096。此时,服务器会获取快递类别和中介类别在号码库中的先验概率,分别为 4/10和6/10;然后,服务器会计算快递类别的事件概率与快递类别在号码库中的先验概率的乘积为0.128×4/10=0.0512,并将0.0512确定为第一目标概率,中介类别的事件概率与中介类别在号码库中的先验概率的乘积为0.096×6/10=0.0576,并将0.0576确定为第二目标概率;最后,服务器会将第一目标概率0.0512和第二目标概率0.0576中最大的目标概率对应的类别标注词确定为目标号码为159的目标标注词,由于第二目标概率0.0576大于第一目标概率0.0512,所以服务器会将第二目标概率0.0576对应的中介类别确定为目标号码为159的目标标注词。
在图1所示的实施例中,在获取到每个标注词被标记的次数和条件概率后,可以根据每个标注词被标记的次数和条件概率计算出每个标注词分别在每个类别标注词中的事件概率。某个标注词在类别标注词中的事件概率表示目标号码属于该类别标注词的可能性,标注词在类别标注词中的事件概率越大说明该类别标注词属于目标号码的目标标注词的可能性就越大,所以最大的事件概率对应的类别标注词属于目标号码的目标标注词。因此,本公开提供的方案可以准确的对陌生号码进行分类。
图2是根据一示例性实施例示出的另一种通信号码的分类方法的流程图,如图2所示,图2所示的通信号码的分类方法,可以用于服务器中。图2为基于图1的一个可选的实施例,在图2所示的实施例中,与图1所示的实施例相同的部分可以参见图1所示的实施例中介绍和解释。图2所示的方法包括以下步骤。
在步骤S21中,获取目标号码对应的每个标注词和每个标注词被标记的次数。
在步骤S22中,分别获取出每个标注词单独出现在每个类别标注词中的条件概率。
在步骤S23中,根据每个标注词被标记的次数和条件概率,计算每个标注词分别在每个类别标注词中的事件概率。
在步骤S24中,将最大的事件概率对应的类别标注词确定为目标号码的目标标注词。
在步骤S25中,记录确定出目标号码的目标标注词的起始日期。
其中,在服务器将最大的事件概率对应的类别标注词确定为目标号码的目标标注词以后,服务器需要记录一下确定出目标号码的目标标注词的起始日期,以便于服务器可以在预定的时间段后,再根据最新的数据重新确定目标号码的目标标注词。
例如,在服务器将最大的事件概率对应的类别标注词确定为目标号码的目标标注词的日期为2015年1月1日,那么服务器便会将2015年1月1日作为起始日期。
在步骤S26中,判断当前日期是否等于起始日期与预设天数之和。在当前日期等于起始日期与预设天数之和时,触发步骤S21;在当前日期不等于起始日期与预设天数之和时,触发步骤S26。
其中,预设天数为预先设定好的,工作人员可以根据实际情况来设定预设天数的数值。例如,工作人员根据实际情况发现,每隔10天根据最新的数据重新确定目标号码的目标标注词最佳,那么工作人员就会将预设天数设定为10天。
在服务器记录确定出目标号码的目标标注词的起始日期以后,便会监测当前日期是否等于起始日期与预设天数之和,在当前日期等于起始日期与预设天数之和时,说明已经到了需要根据最新的数据重新确定目标号码的目标标注词的时候,那么便会触发步骤S21,以重新确定目标号码的目标标注词;在当前日期不等于起始日期与预设天数之和时,说明还未到需要根据最新的数据重新确定目标号码的目标标注词的时候,那么便会触发步骤S26,以继续监测当前日期是否等于起始日期与预设天数之和。
图3是根据一示例性实施例示出的又一种通信号码的分类方法的流程图,如图3所示,图3所示的通信号码的分类方法,可以用于服务器中。图3为基于图1的一个可选的实施例,在图3所示的实施例中,与图1所示的实施例相同的部分可以参见图1所示的实施例中介绍和解释。图3所示的方法包括以下步骤。
在步骤S31中,获取目标号码对应的每个标注词和每个标注词被标记的次数。
在步骤S32中,分别获取出每个标注词单独出现在每个类别标注词中的条件概率。
在步骤S33中,根据每个标注词被标记的次数和条件概率,计算每个标注词分别在每个类别标注词中的事件概率。
在步骤S34中,将最大的事件概率对应的类别标注词确定为目标号码的目标标注词。
在步骤S35中,在接收到客户端发送的获取目标号码对应的标注词的请求时,确定出与目标号码对应的目标标注词。
其中,在服务器将最大的事件概率对应的类别标注词确定为目标号码的目标标注词以后,服务器会监测是否接收到客户端发送的获取目标号码对应的标注词。在服务器接收到客户端发送的获取目标号码对应的标注词时,服务器便会确定出与目标号码对应的目标标注词。
在步骤S36中,向客户端发送目标标注词。
其中,在服务器确定出与目标号码对应的目标标注词以后,服务器便会向客户端发送目标标注词。
例如,假设目标号码为159,目标号码对应的两个标注词,分别为快递标注词和中介标注词,服务器已经计算出快递标注词与中介标注词在快递类别中的事件概率为0.128,快递标注词与中介标注词在中介类别中的事件概率为=0.096。由于快递标注词与中介标注词在快递类别中的事件概率较大,所以服务器将快递类别确定为目标号码159 的目标标注词。此时,服务器会监测是否接收到客户端发送的获取目标号码对应的标注词。在接收到客户端发送的获取目标号码159对应的标注词的请求时,服务器便会确定出与目标号码159对应的目标标注词为快递类别,并将目标标注词为快递类别发送给客户端。
图4是根据一示例性实施例示出的又一种通信号码的分类方法的流程图,如图4所示,图4所示的通信号码的分类方法,可以用于服务器中。图4为基于图1的一个可选的实施例,在图4所示的实施例中,与图1所示的实施例相同的部分可以参见图1所示的实施例中介绍和解释。图4所示的方法包括以下步骤。
在步骤S41中,获取目标号码对应的每个标注词和每个标注词被标记的次数。
在步骤S42中,判断每个标注词被标记的次数是否符合预设条件。在每个标注词被标记的次数符合预设条件时,触发步骤S43。在每个标注词被标记的次数不符合预设条件时,触发步骤S46。
其中,预设条件为预先设定的条件,用于限定每个标注词被标记的次数,预设条件可以根据工作人员的具体需要而设定。例如,预设条件可以为每个标注词被标记的次数均大于10次。
在服务器获取目标号码对应的每个标注词和每个标注词被标记的次数以后,服务器判断每个标注词被标记的次数是否符合预设条件。在每个标注词被标记的次数符合预设条件时,说明每个标注词被标记的次数符合确定目标号码对应的目标标注词的要求,那么执行步骤S43,以继续确定目标号码对应的目标标注词;在每个标注词被标记的次数不符合预设条件时,说明每个标注词被标记的次数不符合确定目标号码对应的目标标注词的要求,那么服务器便不会继续对目标号码进行分类,那么执行步骤S46,将目标号码确定为白名单号码,白名单号码指的是没有任何标注词的号码。
例如,假设预设条件为每个标注词被标记的次数均大于10次,目标号码为159,且服务器已经获取到目标号码159对应的两个标注词和这两个标注词被标记的次数,这两个标注词分别为快递标注词和中介标注词,快递标注词被标记的次数为20次,中介标注词被标记的次数22次。此时,服务器会判断每个标注词被标记的次数是否大于10次,经过判断可以得知,每个标注词被标记的次数均大于10次,所以服务器会继续确定出目标号码159对应的目标标注词。
又如,假设预设条件为每个标注词被标记的次数均大于10次,目标号码为159,且服务器已经获取到目标号码159对应的两个标注词和这两个标注词被标记的次数,这两个标注词分别为快递标注词和中介标注词,快递标注词被标记的次数为8次,中介标注词被标记的次数9次。此时,服务器会判断每个标注词被标记的次数是否大于10次,经过判断可以得知,每个标注词被标记的次数均小于10次,所以服务器会停止确定目标号码159对应的目标标注词,并将目标号码确定为白名单号码。
在步骤S43中,分别获取出每个标注词单独出现在每个类别标注词中的条件概率。
在步骤S44中,根据每个标注词被标记的次数和条件概率,计算每个标注词分别在每个类别标注词中的事件概率。
在步骤S45中,将最大的事件概率对应的类别标注词确定为目标号码的目标标注词。
在步骤S46中,将目标号码确定为白名单号码。
图5是根据一示例性实施例示出的又一种通信号码的分类方法的流程图,如图5所示,图5所示的通信号码的分类方法,可以用于服务器中。图5为基于图1的一个可选的实施例,在图5所示的实施例中,与图1所示的实施例相同的部分可以参见图1所示的实施例中介绍和解释。图5所示的方法包括以下步骤。
在步骤S51中,获取目标号码对应的每个标注词和每个标注词被标记的次数。
在步骤S52中,分别获取出每个标注词单独出现在每个类别标注词中的条件概率。
在步骤S53中,根据每个标注词被标记的次数和条件概率,计算每个标注词分别在每个类别标注词中的事件概率。
在步骤S54中,将最大的事件概率对应的类别标注词确定为目标号码的目标标注词。
在步骤S55中,在目标标注词为预设标注词时,确定与目标号码对应的运营商服务器。
其中,预设标注词为预先设定好的标注词,例如,可以预先将预设标注词设定为诈骗标注词,也可以预先将预设标注词设定为传销标注词。
在服务器将最大的事件概率对应的类别标注词确定为目标号码的目标标注词以后,服务器会检测目标标注词是否为预设标注词。在服务器检测出目标标注词为预设标注词时,那么服务器便会确定与目标号码对应的运营商服务器,并将目标号码和目标号码对应的目标标注词发送给该运营商服务器。这样做的目的是,对于诈骗标注词或传销标注词等标注词,对社会具有一定的危害性,为了避免更多人接到这类电话,服务器会将这类电话号码和标注词发送给运营商服务器。在运营商服务器接收到这类电话号码和标注词时,运营商服务器可以监视这类电话号码的通话内容,以协助警方破案。
在步骤S56中,向运营商服务器发送目标号码和目标号码对应的目标标注词。
图6是根据一示例性实施例示出的一种通信号码的分类装置的示意图。本公开提供的通信号码的分类装置可对陌生号码分类更加准确。参照图6,该装置包括第一获取模块11、第二获取模块12、计算模块13和第一确定模块14。其中:
第一获取模块11,用于获取目标号码对应的每个标注词和每个标注词被标记的次数。
第二获取模块12,用于分别获取出每个标注词单独出现在每个类别标注词中的条件概率。
计算模块13,用于根据每个标注词被标记的次数和条件概率,计算每个标注词分别在每个类别标注词中的事件概率。
第一确定模块14,用于将最大的事件概率对应的类别标注词确定为目标号码的目标标注词。
图7是根据一示例性实施例示出的另一种通信号码的分类装置的示意图。本公开提供的通信号码的分类装置可对陌生号码分类更加准确。参照图7,该装置包括第一获取模块21、第二获取模块22、计算模块23、第一确定模块24、记录模块25、第一判断模块26、第一触发模块27和第二触发模块28。其中:
第一获取模块21,用于获取目标号码对应的每个标注词和每个标注词被标记的次数。
第二获取模块22,用于分别获取出每个标注词单独出现在每个类别标注词中的条件概率。
计算模块23,用于根据每个标注词被标记的次数和条件概率,计算每个标注词分别在每个类别标注词中的事件概率。
第一确定模块24,用于将最大的事件概率对应的类别标注词确定为目标号码的目标标注词。
记录模块25,用于记录确定出目标号码的目标标注词的起始日期。
第一判断模块26,用于判断当前日期是否等于起始日期与预设天数之和。
第一触发模块27,用于在当前日期等于起始日期与预设天数之和时,触发第一获取模块21。
第二触发模块28,用于在当前日期不等于起始日期与预设天数之和时,触发第一判断模块26。
图8是根据一示例性实施例示出的又一种通信号码的分类装置的示意图。本公开提供的通信号码的分类装置可对陌生号码分类更加准确。参照图8,该装置包括第一获取模块31、第二获取模块32、计算模块33、第一确定模块34、第二确定模块35和第一发送模块36。其中:
第一获取模块31,用于获取目标号码对应的每个标注词和每个标注词被标记的次数。
第二获取模块32,用于分别获取出每个标注词单独出现在每个类别标注词中的条件概率。
计算模块33,用于根据每个标注词被标记的次数和条件概率,计算每个标注词分别在每个类别标注词中的事件概率。
第一确定模块34,用于将最大的事件概率对应的类别标注词确定为目标号码的目标标注词。
第二确定模块35,用于在接收到客户端发送的获取目标号码对应的标注词的请求时,确定出与目标号码对应的目标标注词。
第一发送模块36,用于向客户端发送目标标注词。
图9是根据一示例性实施例示出的又一种通信号码的分类装置的示意图。本公开提供的通信号码的分类装置可对陌生号码分类更加准确。参照图9,该装置包括第一获取模块41、第二判断模块42、第三触发模块43、第三确定模块44、第二获取模块45、计算模块46和第一确定模块47。其中:
第一获取模块41,用于获取目标号码对应的每个标注词和每个标注词被标记的次数。
第二判断模块42,用于判断每个标注词被标记的次数是否符合预设条件。
第三触发模块43,用于在每个标注词被标记的次数符合预设条件时,触发第二获取模块45。
第三确定模块44,用于在每个标注词被标记的次数不符合预设条件时,将目标号码确定为白名单号码。
第二获取模块45,用于分别获取出每个标注词单独出现在每个类别标注词中的条件概率。
计算模块46,用于根据每个标注词被标记的次数和条件概率,计算每个标注词分别在每个类别标注词中的事件概率。
第一确定模块47,用于将最大的事件概率对应的类别标注词确定为目标号码的目标标注词。
图10是根据一示例性实施例示出的又一种通信号码的分类装置的示意图。本公开提供的通信号码的分类装置可对陌生号码分类更加准确。参照图10,该装置包括第一获取模块51、第二获取模块52、计算模块53、第一确定模块54、第四确定模块55和第一发送模块56。其中:
第一获取模块51,用于获取目标号码对应的每个标注词和每个标注词被标记的次数。
第二获取模块52,用于分别获取出每个标注词单独出现在每个类别标注词中的条件概率。
计算模块53,用于根据每个标注词被标记的次数和条件概率,计算每个标注词分别在每个类别标注词中的事件概率。
第一确定模块54,用于将最大的事件概率对应的类别标注词确定为目标号码的目标标注词。
第四确定模块55,用于在目标标注词为预设标注词时,确定与目标号码对应的运营商服务器。
第一发送模块56,用于向运营商服务器发送目标号码和目标号码对应的目标标注词。
图11是根据一示例性实施例示出的又一种通信号码的分类装置的示意图。本公开提供的通信号码的分类装置可对陌生号码分类更加准确。参照图11,该装置包括处理器 61和用于存储处理器61可执行指令的存储器62。其中:
处理器61被配置为:获取目标号码对应的每个标注词和每个标注词被标记的次数,在数据库中分别获取出每个标注词单独出现在每个类别标注词中的条件概率,根据每个标注词被标记的次数和条件概率,计算每个标注词分别在每个类别标注词中的事件概率,将最大的事件概率对应的类别标注词确定为目标号码的目标标注词。
图12是根据一示例性实施例示出的一种通信号码的分类装置1900的框图。例如,装置1900可以被提供为一服务器。参照图12,装置1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法,该方法包括:获取目标号码对应的每个标注词和每个标注词被标记的次数,在数据库中分别获取出每个标注词单独出现在每个类别标注词中的条件概率,根据每个标注词被标记的次数和条件概率,计算每个标注词分别在每个类别标注词中的事件概率,将最大的事件概率对应的类别标注词确定为目标号码的目标标注词。
装置1900还可以包括一个电源组件1926被配置为执行装置1900的电源管理,一个有线或无线网络接口1950被配置为将装置1900连接到网络,和一个输入输出(I/O) 接口1958。装置1900可以操作基于存储在存储器1932的操作***,例如Windows ServerTM,MacOS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
Claims (11)
1.一种通信号码的分类方法,其特征在于,包括:
获取目标号码对应的每个标注词和所述每个标注词被标记的次数;
分别获取出所述每个标注词单独出现在每个类别标注词中的条件概率,所述条件概率为所述每个标注词在所述每个类别标注词中所占据的比例;
根据所述每个标注词被标记的次数和所述条件概率,计算所述每个标注词分别在所述每个类别标注词中的事件概率,所述事件概率为所述目标号码对应的所述每个标注词同时出现在所述每个类别标注词中的可能性;
将最大的所述事件概率对应的类别标注词确定为所述目标号码的目标标注词。
2.根据权利要求1所述的通信号码的分类方法,其特征在于,所述方法还包括:
记录确定出所述目标号码的目标标注词的起始日期;
判断当前日期是否等于所述起始日期与预设天数之和;
在所述当前日期等于所述起始日期与所述预设天数之和时,触发所述获取目标号码对应的每个标注词和所述每个标注词被标记的次数的步骤;
在所述当前日期不等于所述起始日期与所述预设天数之和时,触发所述判断当前日期是否等于所述起始日期与预设天数之和的步骤。
3.根据权利要求1所述的通信号码的分类方法,其特征在于,所述方法还包括:
在接收到客户端发送的获取所述目标号码对应的标注词的请求时,确定出与所述目标号码对应的所述目标标注词;
向所述客户端发送所述目标标注词。
4.根据权利要求1所述的通信号码的分类方法,其特征在于,所述方法还包括:
判断所述每个标注词被标记的次数是否符合预设条件;
在所述每个标注词被标记的次数符合预设条件时,触发所述分别获取出所述每个标注词单独出现在每个类别标注词中的条件概率的步骤;
在所述每个标注词被标记的次数不符合所述预设条件时,将所述目标号码确定为白名单号码。
5.根据权利要求1所述的通信号码的分类方法,其特征在于,所述方法还包括:
在所述目标标注词为预设标注词时,确定与所述目标号码对应的运营商服务器;
向所述运营商服务器发送所述目标号码和所述目标号码对应的所述目标标注词。
6.一种通信号码的分类装置,其特征在于,包括:
第一获取模块,用于获取目标号码对应的每个标注词和所述每个标注词被标记的次数;
第二获取模块,用于分别获取出所述每个标注词单独出现在每个类别标注词中的条件概率,所述条件概率为所述每个标注词在所述每个类别标注词中所占据的比例;
计算模块,用于根据所述每个标注词被标记的次数和所述条件概率,计算所述每个标注词分别在所述每个类别标注词中的事件概率,所述事件概率为所述目标号码对应的所述每个标注词同时出现在所述每个类别标注词中的可能性;
第一确定模块,用于将最大的所述事件概率对应的类别标注词确定为所述目标号码的目标标注词。
7.根据权利要求6所述的通信号码的分类装置,其特征在于,所述装置还包括:
记录模块,用于记录确定出所述目标号码的目标标注词的起始日期;
第一判断模块,用于判断当前日期是否等于所述起始日期与预设天数之和;
第一触发模块,用于在所述当前日期等于所述起始日期与所述预设天数之和时,触发所述第一获取模块;
第二触发模块,用于在所述当前日期不等于所述起始日期与所述预设天数之和时,触发所述第一判断模块。
8.根据权利要求6所述的通信号码的分类装置,其特征在于,所述装置还包括:
第二确定模块,用于在接收到客户端发送的获取所述目标号码对应的标注词的请求时,确定出与所述目标号码对应的所述目标标注词;
第一发送模块,用于向所述客户端发送所述目标标注词。
9.根据权利要求6所述的通信号码的分类装置,其特征在于,所述装置还包括:
第二判断模块,用于判断所述每个标注词被标记的次数是否符合预设条件;
第三触发模块,用于在所述每个标注词被标记的次数符合预设条件时,触发所述第二获取模块;
第三确定模块,用于在所述每个标注词被标记的次数不符合所述预设条件时,将所述目标号码确定为白名单号码。
10.根据权利要求6所述的通信号码的分类装置,其特征在于,所述装置还包括:
第四确定模块,用于在所述目标标注词为预设标注词时,确定与所述目标号码对应的运营商服务器;
第一发送模块,用于向所述运营商服务器发送所述目标号码和所述目标号码对应的所述目标标注词。
11.一种通信号码的分类装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取目标号码对应的每个标注词和所述每个标注词被标记的次数;
在数据库中分别获取出所述每个标注词单独出现在每个类别标注词中的条件概率,所述条件概率为所述每个标注词在所述每个类别标注词中所占据的比例;
根据所述每个标注词被标记的次数和所述条件概率,计算所述每个标注词分别在所述每个类别标注词中的事件概率,所述事件概率为所述目标号码对应的所述每个标注词同时出现在所述每个类别标注词中的可能性;
将最大的所述事件概率对应的类别标注词确定为所述目标号码的目标标注词。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510458100.3A CN105162931B (zh) | 2015-07-30 | 2015-07-30 | 一种通信号码的分类方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510458100.3A CN105162931B (zh) | 2015-07-30 | 2015-07-30 | 一种通信号码的分类方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105162931A CN105162931A (zh) | 2015-12-16 |
CN105162931B true CN105162931B (zh) | 2018-04-24 |
Family
ID=54803681
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510458100.3A Active CN105162931B (zh) | 2015-07-30 | 2015-07-30 | 一种通信号码的分类方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105162931B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109873908B (zh) * | 2017-12-04 | 2020-11-20 | ***通信集团湖北有限公司 | 垃圾电话标识识别方法、装置、计算机设备及存储介质 |
CN109348038B (zh) * | 2018-12-24 | 2022-02-22 | 努比亚技术有限公司 | 来电处理方法、移动终端以及计算机存储介质 |
CN111405107B (zh) * | 2020-03-26 | 2021-08-06 | 中移雄安信息通信科技有限公司 | 呼叫控制方法、装置、设备及存储介质 |
CN112968705B (zh) * | 2021-02-03 | 2022-05-31 | 杭州数梦工场科技有限公司 | 一种号码分类方法、装置、电子设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104601782A (zh) * | 2015-01-09 | 2015-05-06 | 深圳市宝尔爱迪科技有限公司 | 一种防止骚扰电话的方法及*** |
CN104683537A (zh) * | 2015-01-28 | 2015-06-03 | 北京羽乐创新科技有限公司 | 一种号码标记方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2881663B1 (fr) * | 2005-02-08 | 2007-03-16 | Solystic Sa | Procede de traitement d'envois postaux avec une detection des occurences d'attributs ocr |
-
2015
- 2015-07-30 CN CN201510458100.3A patent/CN105162931B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104601782A (zh) * | 2015-01-09 | 2015-05-06 | 深圳市宝尔爱迪科技有限公司 | 一种防止骚扰电话的方法及*** |
CN104683537A (zh) * | 2015-01-28 | 2015-06-03 | 北京羽乐创新科技有限公司 | 一种号码标记方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN105162931A (zh) | 2015-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107566358B (zh) | 一种风险预警提示方法、装置、介质及设备 | |
CN112417439B (zh) | 账号检测方法、装置、服务器及存储介质 | |
CN111125512B (zh) | 业务推荐处理方法、装置及*** | |
US11164091B1 (en) | Natural language troubleshooting engine | |
CN109684047A (zh) | 事件处理方法、装置、设备和计算机存储介质 | |
CN110428127B (zh) | 自动化分析方法、用户设备、存储介质及装置 | |
CN110490651B (zh) | 信息推送方法、装置、设备及计算机可读存储介质 | |
CN106113054B (zh) | 基于机器人的服务处理方法 | |
CN105162931B (zh) | 一种通信号码的分类方法及装置 | |
US20200356462A1 (en) | Systems and methods for determining performance metrics of remote relational databases | |
CN111931189B (zh) | Api接口转用风险检测方法、装置和api服务*** | |
CN109657107B (zh) | 一种基于第三方应用的终端匹配方法和装置 | |
CN110515793B (zh) | ***性能监控方法、装置、设备及存储介质 | |
CN107862425B (zh) | 风控数据采集方法、设备、***及可读存储介质 | |
CN109194689B (zh) | 异常行为识别方法、装置、服务器及存储介质 | |
CN110348471B (zh) | 异常对象识别方法、装置、介质及电子设备 | |
WO2019179030A1 (zh) | 产品购买预测方法、服务器及存储介质 | |
CN106534463A (zh) | 一种陌生来电处理方法、装置、终端及服务器 | |
CN109145590A (zh) | 一种函数hook检测方法、检测设备及计算机可读介质 | |
CN111815169A (zh) | 业务审批参数配置方法及装置 | |
CN112801670A (zh) | 针对支付操作的风险评估方法及装置 | |
CN113190562A (zh) | 一种报表生成方法、装置及电子设备 | |
US20230046813A1 (en) | Selecting communication schemes based on machine learning model predictions | |
CN111224865B (zh) | 基于付费会话的用户识别方法、电子装置及存储介质 | |
CN113763057A (zh) | 用户身份画像的数据处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |