CN104469025A - 一种基于聚类算法的实时拦截诈骗电话的方法和*** - Google Patents

一种基于聚类算法的实时拦截诈骗电话的方法和*** Download PDF

Info

Publication number
CN104469025A
CN104469025A CN201410693578.XA CN201410693578A CN104469025A CN 104469025 A CN104469025 A CN 104469025A CN 201410693578 A CN201410693578 A CN 201410693578A CN 104469025 A CN104469025 A CN 104469025A
Authority
CN
China
Prior art keywords
swindle
bunch
recording file
calling
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410693578.XA
Other languages
English (en)
Other versions
CN104469025B (zh
Inventor
廖建新
王彦青
林大庆
林建洪
张锦然
单瑞超
马宪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xinxun Digital Technology (Hangzhou) Co.,Ltd.
Original Assignee
Hangzhou Dongxin Beiyou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dongxin Beiyou Information Technology Co Ltd filed Critical Hangzhou Dongxin Beiyou Information Technology Co Ltd
Priority to CN201410693578.XA priority Critical patent/CN104469025B/zh
Publication of CN104469025A publication Critical patent/CN104469025A/zh
Application granted granted Critical
Publication of CN104469025B publication Critical patent/CN104469025B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

一种基于聚类算法的实时拦截诈骗电话的方法和***,方法包括:根据话单记录,计算所有主叫号码在一定时间周期内的若干个特征指标值,然后采用聚类算法将所有主叫号码划分到三个簇中,从而使得每个簇中的主叫号码具有相同或相近的特征指标值;将已确认诈骗号码的特征指标值分别和三个簇中主叫号码的特征指标值进行匹配,如果特征指标值所构成的取值区间越接近则说明匹配相似度越高,最后将其中匹配相似度最高的簇设置为诈骗电话簇、匹配相似度次之的簇设置为疑似诈骗电话簇;将诈骗号码簇和疑似诈骗号码簇中的所有主叫号码分别更新到取证号码表和拦截号码表中。本发明属于网络通信技术领域,能在全网范围内实现诈骗号码的自动精准识别和实时拦截。

Description

一种基于聚类算法的实时拦截诈骗电话的方法和***
技术领域
本发明涉及一种基于聚类算法的实时拦截诈骗电话的方法和***,属于网络通信技术领域。
背景技术
随着移动电话的普及,电话诈骗层出不穷。尽管政府有关部门已经向社会发出提醒,各类新闻媒体也频频报道,然而,每天仍有大量用户上当受骗,且经济损失呈逐年上升趋势。
目前对诈骗电话主要采取的是黑名单拦截方式,即将已确认诈骗号码写入黑名单中。例如:专利申请CN 201310004829.4(申请名称:一种基于通话模式识别的垃圾呼叫拦截***及其工作方法,申请人:上海欣方智能***有限公司,申请日:2013‐01‐07)基于电话用户听到语音提示时的行为习惯和结合语音识别技术而提出,该***需要在现有通信网的关口局或汇接局交换机上配置疑似风险的电话用户号码,并同时能根据用户签约的呼叫拦截业务属性,将疑似垃圾呼叫的信令消息流和媒体流分别送入该***执行呼叫拦截分析操作;还要增设下述装置:通话模式识别及呼叫拦截服务器及其业务数据库、音频分析服务器、信令网关和媒体网关。由于诈骗份子的手段在不断变换,诈骗号码越来越隐蔽,其形式也越来越多样化,尽管越来越多的诈骗号码被发现和确认,但是相对于全网所存在的诈骗电话来说,已确认诈骗号码只是其中很小的一部分。该技术方案并未涉及到全网范围内对诈骗号码的自动精准识别和实时拦截。
因此,在全网范围内实现诈骗号码的自动精准识别和实时拦截,是一个值得深入研究的技术问题。
发明内容
有鉴于此,本发明的目的是提供一种基于聚类算法的实时拦截诈骗电话的方法和***,能在全网范围内实现诈骗号码的自动精准识别和实时拦截。
为了达到上述目的,本发明提供了一种基于聚类算法的实时拦截诈骗电话的方法,包括有:
步骤一、根据所采集的话单记录,计算所有主叫号码在一定时间周期内的若干个特征指标值,然后采用聚类算法将所有主叫号码划分到三个簇中,从而使得每个簇中的主叫号码具有相同或相近的特征指标值;
步骤二、将已确认诈骗号码的特征指标值分别和三个簇中主叫号码的特征指标值进行匹配,如果特征指标值所构成的取值区间越接近则说明匹配相似度越高,最后将其中匹配相似度最高的簇设置为诈骗电话簇、匹配相似度次之的簇设置为疑似诈骗电话簇;
步骤三、将诈骗号码簇、和疑似诈骗号码簇中的所有主叫号码分别更新到取证号码表、和拦截号码表中。
为了达到上述目的,本发明还提供了一种基于聚类算法的实时拦截诈骗电话的***,包括有防诈骗平台,其中,防诈骗平台进一步包括有:
聚类分析装置,用于根据所采集的话单记录,计算所有主叫号码在一定时间周期内的若干个特征指标值,然后采用聚类算法将所有主叫号码划分到三个簇中,从而使得每个簇中的主叫号码具有相同或相近的特征指标值,再将已确认诈骗号码的特征指标值分别和三个簇中主叫号码的特征指标值进行匹配,如果特征指标值所构成的取值区间越接近则说明匹配相似度越高,最后将其中匹配相似度最高的簇设置为诈骗电话簇、匹配相似度次之的簇设置为疑似诈骗电话簇;
号码表更新装置,用于将诈骗号码簇、和疑似诈骗号码簇中的所有主叫号码分别更新到取证号码表、和拦截号码表中。
与现有技术相比,本发明的有益效果是:本发明通过聚类算法进行特征分类,将具有相同或相似特征的主叫号码分别划分到诈骗号码簇和疑似诈骗号码簇中,然后再各自根据逻辑回归算法遴选出确定的诈骗号码和疑似诈骗号码,从而能在全网范围内实现诈骗号码的自动精准识别和实时拦截;对于诈骗号码,本发明进一步进行录音取证,并将录音文件保存到样本库中,从而能保证样本库中的信息越来越丰富,诈骗电话的识别精度越来越高;对于疑似诈骗号码,本发明进一步将其录音文件和样本库中的诈骗样本进行自动识别,特别对于播放录音的诈骗电话,通过对语音进行时间和能量的双纬度特征值分析,从而能有效区分出不同语音,当识别出录音文件和诈骗样本是相同语音时,则对正在进行的通话实时拦截中断。
附图说明
图1是本发明一种基于聚类算法的实时拦截诈骗电话的方法的流程图。
图2是图1步骤一的具体操作流程图。
图3是当用户发起呼叫时,对其分别实施录音取证和实时拦截的具体操作流程图。
图4是将录音文件和重复音样本库中的诈骗样本一一比对的具体操作流程图。
图5是本发明一种基于聚类算法的实时拦截诈骗电话的***的组成结构示意图。
图6是聚类分析装置的组成结构示意图。
图7是诈骗拦截装置的组成结构示意图。
图8是重复音识别单元的组成结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。
根据研究发现,诈骗电话、疑似诈骗电话普遍都具有较明显的特征差异,例如,诈骗电话具有忙时高频呼叫、被叫用户相对集中、呼叫时间间隔离散度较高的特征,疑似诈骗电话具有高频呼叫、被叫用户相对分散、呼叫圈重合度较高、呼叫时间离散度较高的特征,非诈骗电话具有低频呼叫且时间集中,呼叫圈重合度较低、主叫呼叫行为较少、忙时基本无呼叫行为的特征。因此,本发明可以采用聚类算法,根据话单记录中所有主叫号码的多个特征指标值来对主叫号码进行特征分类,将具有相同或相似特征的主叫号码分到一个簇中,也即是,将全部用户分为具有明显特征差异的多个簇,再通过和已确认诈骗电话的特征对比,从而找到和已确认诈骗电话特征最接近的诈骗电话簇、以及较接近的疑似诈骗电话簇。对于诈骗电话簇和疑似诈骗电话簇,本发明再进一步采用逻辑回归算法来精准识别出其中的诈骗电话和疑似诈骗电话,从而实现全网范围内诈骗电话的精准识别和拦截。
如图1所示,本发明一种基于聚类算法的实时拦截诈骗电话的方法,包括有:
步骤一、根据所采集的话单记录,计算所有主叫号码在一定时间周期内的若干个特征指标值,然后采用聚类算法将所有主叫号码划分到三个簇中,从而使得每个簇中的主叫号码具有相同或相近的特征指标值;
步骤二、将已确认诈骗号码的特征指标值分别和三个簇中主叫号码的特征指标值进行匹配,如果特征指标值所构成的取值区间越接近则说明匹配相似度越高,最后将其中匹配相似度最高的簇设置为诈骗电话簇、匹配相似度次之的簇设置为疑似诈骗电话簇;
由于诈骗电话、疑似诈骗电话具有相同或相似的特征,可以选取多个有明显差异的特征指标,通过不断的试运行和验证发现,本发明可以选取如下特征指标来有效识别诈骗电话和非诈骗电话:主叫呼叫频次、被叫号码个数、呼叫时间间隔标准差、频繁被叫号码呼叫次数、最高呼叫时段、呼叫同一被叫号码次数的最大值、呼叫同一被叫号码次数的第二大值、呼叫同一被叫号码次数的第三大值。判断上述多个特征指标值是否和已确认诈骗电话的特征指标值在相同、或相近的区间范围内,当特征指标值越接近,则说明匹配相似度越高。同时,还可以将三个簇中的主叫号码和已确认诈骗号码进行比对,从而统计出三个簇中已确认诈骗号码的个数。最后,从多个特征指标值的匹配相似度、已确认诈骗号码的个数等多种因素综合考虑,从三个簇中遴选出一个诈骗电话簇、和一个疑似诈骗电话簇;
步骤三、采用逻辑回归算法,分别计算诈骗号码簇、或疑似诈骗号码簇中每个主叫号码的诈骗可疑度指数:其中,zij是簇j中的第i个主叫号码,j=1或2,簇1是诈骗号码簇,簇2是疑似诈骗号码簇,Y(zij)是主叫号码zij的诈骗特征值,N是特征指标数,αjt是簇j中的特征指标t的权重系数,是主叫号码zij的特征指标t的值,βj是簇j的极大似然估计值,然后判断主叫号码的诈骗可疑度指数是否大于诈骗可疑度指数的阈值?如果是,则说明该主叫号码是诈骗电话、或疑似诈骗电话;如果否,则说明该主叫号码不是诈骗号码、或疑似诈骗号码,从主叫号码所归属的诈骗号码簇、或疑似诈骗号码簇中删除所述主叫号码;
所述诈骗可疑度指数的阈值是在区间[0,1)之间的一个实数,其值可以根据实际情况而设,当诈骗可疑度指数越大时,主叫号码是诈骗电话/疑似诈骗电话的可能性也越大,例如诈骗可疑度指数的阈值设置为0.9,当主叫号码的诈骗可疑度指数大于或等于0.9时,则确定该主叫号码是诈骗电话/或疑似诈骗电话;对于αjt、βj的值,可以从诈骗号码簇、或疑似诈骗号码簇中提取部分已确认诈骗电话和非诈骗电话来作为样本,并对αjt、βj设置初始值,然后将样本中每个主叫号码所计算出的诈骗可疑度指数和是否是诈骗电话的实际情况进行对比,再对αjt、βj的值进行反复调整,从而使得根据样本所计算出的诈骗可疑度指数满足***实际需要,例如,通过不断调整后,将特征指标“主叫呼叫频次”的权重***设为-0.6626,特征指标“被叫号码个数”的权重***设为0.004633,特征指标“呼叫时间间隔标准差”的权重***设为-0.001043,特征指标“频繁被叫号码呼叫次数”的权重***设为0.351,极大似然估计值设为-6.189;
步骤四、将诈骗号码簇、和疑似诈骗号码簇中的所有主叫号码分别更新到取证号码表、和拦截号码表中。即,将诈骗号码簇中的主叫号码写到取证号码表中,疑似诈骗号码簇中的主叫号码写到拦截号码表中。
如图2所示,步骤一还可以进一步包括有:
步骤11、计算所有主叫号码在一定时间周期内的若干个特征指标值,并为所有主叫号码分别构建对应的特征指标集:Xi=(xi1,xi2,…,xiN),其中Xi是主叫号码zi的特征指标集,xi1、xi2、…xiN分别是主叫号码zi的若干个特征指标值,N是特征指标数;
例如,可以选取如下特征指标:主叫呼叫频次、被叫号码个数、呼叫时间间隔标准差、频繁被叫号码呼叫次数、最高呼叫时段、呼叫同一被叫号码次数的最大值、呼叫同一被叫号码次数的第二大值、呼叫同一被叫号码次数的第三大值,N=8;
步骤12、构建三个簇(例如簇1、簇2、簇3),并将所有主叫号码随机划分到三个簇中,其中每个主叫号码都唯一的归属于一个簇;
步骤13、计算每个簇的特征指标中心值集Cj其中Cj是簇j的特征指标中心值集,j=1、2或3,是Cj中的特征指标t的中心值,t是1到N之间的一个自然数,且i是1到Mj之间的一个自然数,Mj是簇j中的主叫号码数,是簇j中的主叫号码zij的特征指标t的值;
步骤14、计算所有主叫号码的平方误差和:并判断E是否小于或等于E的阈值?如果是,则本流程结束;如果否,则再计算每个主叫号码和所有簇的特征指标中心值集之间的距离,并从中挑选距离的最小值,然后将主叫号码重新划分到距离的最小值所对应的簇中,其中主叫号码zi和簇j的特征指标中心值集之间的距离的计算公式如下:xit是主叫号码zi的特征指标t的值,然后转向步骤13,其中,E的阈值是0到1之间的一个数,其值可以根据实际情况而设定,例如2.71828-5
对于取证号码表和拦截号码表中的诈骗电话和疑似诈骗电话,本发明还可以对其分别实施录音取证和实时拦截手段,以实现诈骗电话的有效防治。如图3所示,当用户发起呼叫时,本发明还包括有:
步骤A1、主叫MSC将用户发起的呼叫触发至SCP,SCP判断所述呼叫请求的主叫号码是否在取证号码表或拦截号码表中?如果是,则向主叫MSC返回呼叫接续CONTINUE消息,所述呼叫接续消息中携带有取证路由号或拦截路由号信息,并指示主叫MSC将呼叫继续触发至防诈骗平台,然后继续下一步;如果否,则执行原有业务流程,本流程结束;
当主叫号码在取证号码表中时,则呼叫接续消息中携带取证路由号,当主叫号码在拦截号码表中时,则呼叫接续消息中携带有拦截路由号;
步骤A2、防诈骗平台接收到主叫MSC发送来的呼叫请求时,判断呼叫请求中是否携带有取证路由号?如果是,则对呼叫请求中主、被叫之间的语音通道进行桥接,然后对主叫语音进行单向录音,生成一个录音文件,然后将所述录音文件保存到自然音样本库、或重复音样本库中,本流程结束;如果否,则继续下一步;
步骤A3、防诈骗平台判断呼叫请求中是否携带有拦截路由号?如果是,则对呼叫请求中主、被叫之间的语音通道进行桥接,然后对主叫语音进行单向录音,录音S秒后生成一个录音文件,然后将录音文件逐一和重复音样本库、自然音样本库中的所有诈骗样本一一比对,当录音文件和诈骗样本是相同语音时,则说明所述录音文件是诈骗电话,指示被叫MSC中断主、被叫之间的语音通道,当录音文件和所有诈骗样本都不是相同语音时,则说明录音文件不是诈骗电话,继续执行原有的业务流程。
通过桥接主、被叫之间的语音通道,主、被叫之间的语音数据都将经过防诈骗平台来传输,由于被叫侧的语音则会对主叫语音形成干扰,所以本发明仅对主叫语音进行单向录制。步骤A2中,可以采用人工方式对录音文件来试听甄别,如果录音文件中是真人说话的诈骗电话,则将录音文件作为诈骗样本保存到自然音样本库中;如果录音文件中是机器播放录音的诈骗电话,则将录音文件作为诈骗样本保存到重复音样本库中,如此下来,随着诈骗样本的不断增多,自然音样本库、或重复音样本库的信息会越来越丰富,对诈骗电话的识别正确率也会越来越高。步骤A3中,S的值可以根据实际需要而设定,以满足疑似诈骗电话在通话过程中被实时识别和拦截。
图3步骤A3中,将录音文件逐一和重复音样本库、自然音样本库中的所有诈骗样本一一比对,还可以进一步包括有:先将录音文件和重复音样本库中的诈骗样本一一比对,当录音文件和重复音样本库中的所有诈骗样本都不是相同语音时,再将录音文件和自然音样本库中的诈骗样本一一比对。
如图4所示,将录音文件和重复音样本库中的诈骗样本一一比对,还可以进一步包括有:
步骤A31、为录音文件构建一个时间特征值集:从录音文件的语音起始点开始,以n秒为一帧,逐一从录音文件中顺序提取出G个W帧语音信息,并利用语音端点检测技术,计算每个W帧语音信息中有效语音起始点到结束点之间的帧数,将所述帧数记为所述W帧语音信息的时间特征值,然后将计算出的G个时间特征值按照录音文件的先后次序保存到录音文件的时间特征值集中;
可以采用短时能量和过零率的双门限值判定方法来检测语音起始点和结束点,以剔除通话空白段的干扰;n、G、W的值可以根据实际需要而设定,例如n=10ms,G=100,W=5。通过多次测试发现,最短的语音长度设定在10s以上本发明具有较好的实施效果,即G≥100,W=5;
步骤A32、为录音文件构建一个能量特征值集:从录音文件的语音起始点开始,以n秒为一帧,逐一从录音文件或诈骗样本中顺序提取出G*W帧语音信息,并计算每一帧语音信息的短时能量值,将所述短时能量值记为每帧语音信息的能量特征值,然后将所述G*W个能量特征值按照录音文件的先后次序保存到录音文件的能量特征值集中;
步骤A33、从重复音样本库中读取一个诈骗样本的时间特征值集和能量特征值集;
重复音样本库中每个诈骗样本的时间特征值集和能量特征值集的构建方法和录音文件的时间特征值集和能量特征值集的构建方法相同,不在此赘述;
步骤A34、将录音文件和诈骗样本各自的时间特征值集中处于相同排序位置的时间特征值逐一比对,从而计算出录音文件和诈骗样本的时间特征值集中的时间特征值相同数TS;
步骤A35、分别从录音文件和诈骗样本的能量特征值集中提取前K个能量特征值,K的值可以根据实际需要而设定,例如K=5;
步骤A36、计算诈骗样本和录音文件的能量放大倍数:其中,YEb是诈骗样本的能量特征值集中的第b个能量特征值,GEb是录音文件的能量特征值集中的第b个能量特征值;
步骤A37、根据能量放大倍数B,对录音文件的能量特征值集中的每个能量特征值进行调整:GEb=B×GEb,其中,b是1到G*W之间的自然数;
步骤A38、将录音文件和诈骗样本的能量特征值集中处于相同排序位置的能量特征值逐一比对,从而计算出录音文件和诈骗样本的能量特征值集中的能量特征值相同数ES;
步骤A39、计算录音文件和诈骗样本的诈骗语音置信度:其中,F是置信度的加权系数,并判断录音文件和诈骗样本的诈骗语音置信度是否大于诈骗语音置信度的阈值CC?如果是,则表示录音文件和诈骗样本是相同语音,即录音文件对应的主叫来电可以被判定为诈骗电话,本流程结束;如果否,则表示录音文件和诈骗样本不是相同语音,继续从重复音样本库中读取下一个诈骗样本的时间特征值集和能量特征值集,然后转向步骤A34;其中,F、诈骗语音置信度的阈值CC的值可以根据实际情况而设置,例如,F=0.5,CC=90%。
通过文本无关的说话人识别技术(简称说话人识别技术)可以实现录音文件和自然音样本库中的诈骗样本的比对。说话人识别技术从本质上来说是个模式匹配的问题,基本原理是将待识别目标说话人的语音进行特征提取与模式训练,将得到的模型特征与自然音样本库里的模型特征进行匹配,然后根据匹配的相似度来判断最可能是自然音样本库中的哪个说话人。目前比较常用的特征提取方法有基于线性预测编码(Linear Predictive Coding,LPC)的线性预测倒普系数(Linear Predictive Cepstrum Coefficients,LPCC)、基于人声原理和听觉原理的Mel频率倒谱系数(Mel-scale Frequency Cepstral Coefficients,MFCC);常见的模式匹配方法有基于动态时间规整(dynamic time warping,DTW)、矢量量化(VectorQuantization,VQ)、隐马尔可夫模型(Hidden Markov Model,HMM)以及高斯混合模型(GaussianMixture Model,GMM)的模板匹配方法等。
采用不同的特征量提取和模式匹配方法,量化及识别的步骤不尽相同,这里不做详细描述。有研究数据表明,使用基于GMM的说话人识别技术,在高斯混合度为32、训练数据充分的情况下,准确率最高可达到98%。
如图5所示,本发明一种基于聚类算法的实时拦截诈骗电话的***,包括有防诈骗平台、业务控制点SCP和移动交换中心MSC,其中:
主叫MSC,用于当接收到用户发起的呼叫时,将所述呼叫触发至SCP,然后根据SCP的指示,继续将呼叫触发至防诈骗平台;
SCP,用于当接收到主叫MSC转发来的用户呼叫请求时,判断所述呼叫请求的主叫号码是否在取证号码表或拦截号码表中,如果是,则向主叫MSC返回呼叫接续CONTINUE消息,所述呼叫接续消息中携带有取证路由号或拦截路由号信息,并指示主叫MSC将呼叫继续触发至防诈骗平台;如果否,则执行原有业务流程,其中,当主叫号码在取证号码表中时,则呼叫接续消息中携带取证路由号,当主叫号码在拦截号码表中时,则呼叫接续消息中携带有拦截路由号;
防诈骗平台还可以进一步包括有:
聚类分析装置,用于根据所采集的话单记录,计算所有主叫号码在一定时间周期内的若干个特征指标值,然后采用聚类算法将所有主叫号码划分到三个簇中,从而使得每个簇中的主叫号码具有相同或相近的特征指标值,再将已确认诈骗号码的特征指标值分别和三个簇中主叫号码的特征指标值进行匹配,如果特征指标值所构成的取值区间越接近则说明匹配相似度越高,最后将其中匹配相似度最高的簇设置为诈骗电话簇、匹配相似度次之的簇设置为疑似诈骗电话簇;
逻辑回归装置,用于采用逻辑回归算法,分别计算诈骗号码簇、或疑似诈骗号码簇中每个主叫号码的诈骗可疑度指数:其中,zij是簇j中的第i个主叫号码,j=1或2,簇1是诈骗号码簇,簇2是疑似诈骗号码簇,Y(zij)是主叫号码zij的诈骗特征值,N是特征指标数,αjt是簇j中的特征指标t的权重系数,是主叫号码zij的特征指标t的值,βj是簇j的极大似然估计值,然后判断主叫号码的诈骗可疑度指数是否大于诈骗可疑度指数的阈值,如果是,则说明该主叫号码是诈骗电话、或疑似诈骗电话;如果否,则说明该主叫号码不是诈骗号码、或疑似诈骗号码,从主叫号码所归属的诈骗号码簇、或疑似诈骗号码簇中删除所述主叫号码;
号码表更新装置,用于将诈骗号码簇、和疑似诈骗号码簇中的所有主叫号码分别更新到取证号码表、和拦截号码表中;
呼叫转发装置,用于接收到主叫MSC发送来的呼叫请求时,判断呼叫请求中是否携带有取证路由号或拦截路由号,如果携带有取证路由号,则通知录音取证装置,如果携带有拦截路由号,则通知诈骗拦截装置;
录音取证装置,用于对呼叫请求中主、被叫之间的语音通道进行桥接,然后对主叫语音进行单向录音,生成一个录音文件,并将所述录音文件保存到自然音样本库、或重复音样本库中;
诈骗拦截装置,用于对呼叫请求中主、被叫之间的语音通道进行桥接,然后对主叫语音进行单向录音,录音S秒后生成一个录音文件,再将录音文件逐一和重复音样本库、自然音样本库中的所有诈骗样本一一比对,当录音文件和诈骗样本是相同语音时,说明录音文件是诈骗电话,则指示被叫MSC中断主、被叫之间的语音通道。
如图6所示,聚类分析装置还可以进一步包括有:
特征指标构建单元,用于计算所有主叫号码在一定时间周期内的若干个特征指标值,并为所有主叫号码分别构建对应的特征指标集:Xi=(xi1,xi2,…,xiN),其中Xi是主叫号码zi的特征指标集,xi1、xi2、…xiN分别是主叫号码zi的若干个特征指标值,N是特征指标数;
簇构建初始化单元,用于构建三个簇:簇1、簇2和簇3,并将所有主叫号码随机划分到三个簇中,其中每个主叫号码都唯一的归属于一个簇;
簇中心计算单元,用于计算每个簇的特征指标中心值集Cj其中Cj是簇j的特征指标中心值集,j=1、2或3,是Cj中的特征指标t的中心值,t是1到N之间的一个自然数,且i是1到Mj之间的一个自然数,Mj是簇j中的主叫号码数,是簇j中的主叫号码zij的特征指标t的值,然后通知簇调整单元计算所有主叫号码的平方误差和;
簇调整单元,用于计算所有主叫号码的平方误差和:并判断E是否小于或等于E的阈值,如果否,则再计算每个主叫号码和所有簇的特征指标中心值集之间的距离,并从中挑选距离的最小值,然后将主叫号码重新划分到距离的最小值所对应的簇中,其中主叫号码zi和簇j的特征指标中心值集之间的距离的计算公式如下:xit是主叫号码zi的特征指标t的值,最后通知簇中心计算单元重新计算每个簇的特征指标中心值集,其中,E的阈值是0到1之间的一个数,其值可以根据实际情况而设定,例如2.71828-5
如图7所示,诈骗拦截装置还可以进一步包括有:
语音录音单元,用于接收主叫发出的呼叫请求,然后桥接主、被叫之间的语音通道,并在主、被叫之间的语音通道建立后,对主叫语音进行单向录音,录音S秒后生成一个录音文件;
重复音识别单元,用于将录音文件和重复音样本库中的诈骗样本一一比对,以识别录音文件和重复音样本库中的诈骗样本是否是相同语音;
自然音识别单元,用于将录音文件和自然音样本库中的诈骗样本一一比对,以识别录音文件和自然音样本库中的诈骗样本是否是相同语音。
如图8所示,重复音识别单元还可以进一步包括有:
时间特征构建部件,用于为录音文件、或重复音样本库中每个诈骗样本构建各自的时间特征值集:从录音文件或诈骗样本的语音起始点开始,以n秒为一帧,逐一从录音文件或诈骗样本中顺序提取出G个W帧语音信息,并利用语音端点检测技术,计算每个W帧语音信息中有效语音起始点到结束点之间的帧数,将所述帧数记为所述W帧语音信息的时间特征值,然后将计算出的G个时间特征值按照录音文件或诈骗样本中的先后次序保存到录音文件或诈骗样本的时间特征值集中,其中,可以采用短时能量和过零率的双门限值判定方法来检测语音起始点和结束点,以剔除通话空白段的干扰;
能量特征构建部件,用于为录音文件、或重复音样本库中每个诈骗样本构建各自的能量特征值集:从录音文件或诈骗样本的语音起始点开始,以n秒为一帧,逐一从录音文件、或诈骗样本中顺序提取出G*W帧语音信息,并计算每一帧语音信息的短时能量值,将所述短时能量值记为每帧语音信息的能量特征值,然后将所述G*W个能量特征值按照录音文件、或诈骗样本的先后次序保存到录音文件、或诈骗样本的能量特征值集中;
诈骗置信度计算部件,用于从重复音样本库中读取每个诈骗样本的时间特征值集和能量特征值集,并将录音文件和诈骗样本的时间特征值集发送给时间特征识别部件,同时将录音文件和诈骗样本的能量特征值集发送给能量特征识别部件,然后计算录音文件和诈骗样本的诈骗语音置信度:其中,F是置信度的加权系数,并判断录音文件和诈骗样本的诈骗语音置信度是否大于阈值CC,如果是,则表示录音文件和诈骗样本是相同语音;如果否,则表示录音文件和诈骗样本不是相同语音;
时间特征识别部件,用于将录音文件和诈骗样本各自的时间特征值集中处于相同排序位置的时间特征值逐一比对,从而计算出录音文件和诈骗样本的时间特征值集中的时间特征值相同数TS;
能量特征识别部件,用于从录音文件和诈骗样本各自的能量特征值集中提取前K个能量特征值,然后计算诈骗样本和录音文件的能量放大倍数:其中,YEb是诈骗样本的能量特征值集中的第b个能量特征值,GEb是录音文件的能量特征值集中的第b个能量特征值,再根据能量放大倍数B,对录音文件的能量特征值集中的每个能量特征值进行调整:GEb=B×GEb,其中,b是1到G*W之间的自然数,最后将录音文件和诈骗样本的能量特征值集中处于相同排序位置的能量特征值逐一比对,从而计算出录音文件和诈骗样本的能量特征值集中的能量特征值相同数ES。
自然音识别单元可以通过文本无关的说话人识别技术(简称说话人识别技术)来实现录音文件和自然音样本库中的诈骗样本的比对。说话人识别技术从本质上来说是个模式匹配的问题,基本原理是将待识别目标说话人的语音进行特征提取与模式训练,将得到的模型特征与自然音样本库里的模型特征进行匹配,然后根据匹配的相似度来判断最可能是自然音样本库中的哪个说话人。目前比较常用的特征提取方法有基于线性预测编码(Linear PredictiveCoding,LPC)的线性预测倒普系数(Linear Predictive Cepstrum Coefficients,LPCC)、基于人声原理和听觉原理的Mel频率倒谱系数(Mel-scale Frequency CepstralCoefficients,MFCC);常见的模式匹配方法有基于动态时间规整(dynamic timewarping,DTW)、矢量量化(Vector Quantization,VQ)、隐马尔可夫模型(Hidden Markov Model,HMM)以及高斯混合模型(Gaussian Mixture Model,GMM)的模板匹配方法等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (12)

1.一种基于聚类算法的实时拦截诈骗电话的方法,其特征在于,包括有:
步骤一、根据所采集的话单记录,计算所有主叫号码在一定时间周期内的若干个特征指标值,然后采用聚类算法将所有主叫号码划分到三个簇中,从而使得每个簇中的主叫号码具有相同或相近的特征指标值;
步骤二、将已确认诈骗号码的特征指标值分别和三个簇中主叫号码的特征指标值进行匹配,如果特征指标值所构成的取值区间越接近则说明匹配相似度越高,最后将其中匹配相似度最高的簇设置为诈骗电话簇、匹配相似度次之的簇设置为疑似诈骗电话簇;
步骤三、将诈骗号码簇、和疑似诈骗号码簇中的所有主叫号码分别更新到取证号码表、和拦截号码表中。
2.根据权利要求1所述的方法,其特征在于,步骤二和步骤三之间还包括有:
采用逻辑回归算法,分别计算诈骗号码簇、或疑似诈骗号码簇中每个主叫号码的诈骗可疑度指数:其中,zij是簇j中的第i个主叫号码,j=1或2,簇1是诈骗号码簇,簇2是疑似诈骗号码簇,Y(zij)是主叫号码zij的诈骗特征值,N是特征指标数,αjt是簇j中的特征指标t的权重系数,是主叫号码zij的特征指标t的值,βj是簇j的极大似然估计值,然后判断主叫号码的诈骗可疑度指数是否大于诈骗可疑度指数的阈值,如果否,则从主叫号码所归属的诈骗号码簇、或疑似诈骗号码簇中删除所述主叫号码,所述诈骗可疑度指数的阈值是在区间[0,1)之间的一个实数。
3.根据权利要求1所述的方法,其特征在于,步骤一进一步包括有:
步骤11、计算所有主叫号码在一定时间周期内的若干个特征指标值,并为所有主叫号码分别构建对应的特征指标集:Xi=(xi1,xi2,…,xiN),其中Xi是主叫号码zi的特征指标集,xi1、xi2、…xiN分别是主叫号码zi的若干个特征指标值,N是特征指标数;
步骤12、构建三个簇:簇1、簇2和簇3,并将所有主叫号码随机划分到三个簇中,其中每个主叫号码都唯一的归属于一个簇;
步骤13、计算每个簇的特征指标中心值集Cj其中Cj是簇j的特征指标中心值集,j=1、2或3,是Cj中的特征指标t的中心值,t是1到N之间的一个自然数,且i是1到Mj之间的一个自然数,Mj是簇j中的主叫号码数,是簇j中的主叫号码zij的特征指标t的值;
步骤14、计算所有主叫号码的平方误差和:并判断E是否小于或等于E的阈值,如果是,则本流程结束;如果否,则再计算每个主叫号码和所有簇的特征指标中心值集之间的距离,并从中挑选距离的最小值,然后将主叫号码重新划分到距离的最小值所对应的簇中,其中主叫号码zi和簇j的特征指标中心值集之间的距离的计算公式如下:xit是主叫号码zi的特征指标t的值,然后转向步骤13,其中,E的阈值是0到1之间的一个数。
4.根据权利要求1所述的方法,其特征在于,当用户发起呼叫时,包括有:
步骤A1、主叫移动交换中心MSC将用户发起的呼叫触发至业务控制点SCP,SCP判断所述呼叫请求的主叫号码是否在取证号码表或拦截号码表中,如果是,则向主叫MSC返回呼叫接续消息,所述呼叫接续消息中携带有取证路由号或拦截路由号信息,并指示主叫MSC将呼叫继续触发至防诈骗平台,其中,当主叫号码在取证号码表中时,则呼叫接续消息中携带取证路由号,当主叫号码在拦截号码表中时,则呼叫接续消息中携带有拦截路由号。
5.根据权利要求4所述的方法,其特征在于,还包括有:
步骤A2、防诈骗平台接收到主叫MSC发送来的呼叫请求时,判断呼叫请求中是否携带有取证路由号,如果是,则对呼叫请求中主、被叫之间的语音通道进行桥接,然后对主叫语音进行单向录音,生成一个录音文件,然后将所述录音文件保存到自然音样本库、或重复音样本库中,本流程结束;如果否,则继续下一步;
步骤A3、防诈骗平台判断呼叫请求中是否携带有拦截路由号,如果是,则对呼叫请求中主、被叫之间的语音通道进行桥接,然后对主叫语音进行单向录音,录音S秒后生成一个录音文件,然后将录音文件逐一和重复音样本库、自然音样本库中的所有诈骗样本一一比对,当录音文件和诈骗样本是相同语音时,则说明所述录音文件是诈骗电话,指示被叫MSC中断主、被叫之间的语音通道。
6.根据权利要求5所述的方法,其特征在于,步骤A3中,将录音文件和重复音样本库中的诈骗样本一一比对,进一步包括有:
步骤A31、为录音文件构建一个时间特征值集:从录音文件的语音起始点开始,以n秒为一帧,逐一从录音文件中顺序提取出G个W帧语音信息,并利用语音端点检测技术,计算每个W帧语音信息中有效语音起始点到结束点之间的帧数,将所述帧数记为所述W帧语音信息的时间特征值,然后将计算出的G个时间特征值按照录音文件的先后次序保存到录音文件的时间特征值集中;
步骤A32、为录音文件构建一个能量特征值集:从录音文件的语音起始点开始,以n秒为一帧,逐一从录音文件或诈骗样本中顺序提取出G*W帧语音信息,并计算每一帧语音信息的短时能量值,将所述短时能量值记为每帧语音信息的能量特征值,然后将所述G*W个能量特征值按照录音文件的先后次序保存到录音文件的能量特征值集中;
步骤A33、从重复音样本库中读取一个诈骗样本的时间特征值集和能量特征值集;
步骤A34、将录音文件和诈骗样本各自的时间特征值集中处于相同排序位置的时间特征值逐一比对,从而计算出录音文件和诈骗样本的时间特征值集中的时间特征值相同数TS;
步骤A35、分别从录音文件和诈骗样本的能量特征值集中提取前K个能量特征值;
步骤A36、计算诈骗样本和录音文件的能量放大倍数:其中,YEb是诈骗样本的能量特征值集中的第b个能量特征值,GEb是录音文件的能量特征值集中的第b个能量特征值;
步骤A37、根据能量放大倍数B,对录音文件的能量特征值集中的每个能量特征值进行调整:GEb=B×GEb,其中,b是1到G*W之间的自然数;
步骤A38、将录音文件和诈骗样本的能量特征值集中处于相同排序位置的能量特征值逐一比对,从而计算出录音文件和诈骗样本的能量特征值集中的能量特征值相同数ES;
步骤A39、计算录音文件和诈骗样本的诈骗语音置信度:其中,F是置信度的加权系数,并判断录音文件和诈骗样本的诈骗语音置信度是否大于诈骗语音置信度的阈值CC,如果是,则表示录音文件和诈骗样本是相同语音,本流程结束;如果否,则表示录音文件和诈骗样本不是相同语音,继续从重复音样本库中读取下一个诈骗样本的时间特征值集和能量特征值集,然后转向步骤A34。
7.一种基于聚类算法的实时拦截诈骗电话的***,其特征在于,包括有防诈骗平台,其中,防诈骗平台进一步包括有:
聚类分析装置,用于根据所采集的话单记录,计算所有主叫号码在一定时间周期内的若干个特征指标值,然后采用聚类算法将所有主叫号码划分到三个簇中,从而使得每个簇中的主叫号码具有相同或相近的特征指标值,再将已确认诈骗号码的特征指标值分别和三个簇中主叫号码的特征指标值进行匹配,如果特征指标值所构成的取值区间越接近则说明匹配相似度越高,最后将其中匹配相似度最高的簇设置为诈骗电话簇、匹配相似度次之的簇设置为疑似诈骗电话簇;
号码表更新装置,用于将诈骗号码簇、和疑似诈骗号码簇中的所有主叫号码分别更新到取证号码表、和拦截号码表中。
8.根据权利要求7所述的***,其特征在于,防诈骗平台还包括有:
逻辑回归装置,用于采用逻辑回归算法,分别计算诈骗号码簇、或疑似诈骗号码簇中每个主叫号码的诈骗可疑度指数:其中,zij是簇j中的第i个主叫号码,j=1或2,簇1是诈骗号码簇,簇2是疑似诈骗号码簇,Y(zij)是主叫号码zij的诈骗特征值,N是特征指标数,αjt是簇j中的特征指标t的权重系数,是主叫号码zij的特征指标t的值,βj是簇j的极大似然估计值,然后判断主叫号码的诈骗可疑度指数是否大于诈骗可疑度指数的阈值,如果否,则从主叫号码所归属的诈骗号码簇、或疑似诈骗号码簇中删除所述主叫号码。
9.根据权利要求7所述的***,其特征在于,聚类分析装置还进一步包括有:
特征指标构建单元,用于计算所有主叫号码在一定时间周期内的若干个特征指标值,并为所有主叫号码分别构建对应的特征指标集:Xi=(xi1,xi2,…,xiN),其中Xi是主叫号码zi的特征指标集,xi1、xi2、…xiN分别是主叫号码zi的若干个特征指标值,N是特征指标数;
簇构建初始化单元,用于构建三个簇:簇1、簇2和簇3,并将所有主叫号码随机划分到三个簇中,其中每个主叫号码都唯一的归属于一个簇;
簇中心计算单元,用于计算每个簇的特征指标中心值集Cj其中Cj是簇j的特征指标中心值集,j=1、2或3,是Cj中的特征指标t的中心值,t是1到N之间的一个自然数,且i是1到Mj之间的一个自然数,Mj是簇j中的主叫号码数,是簇j中的主叫号码zij的特征指标t的值,然后通知簇调整单元计算所有主叫号码的平方误差和;
簇调整单元,用于计算所有主叫号码的平方误差和:并判断E是否小于或等于E的阈值,如果否,则再计算每个主叫号码和所有簇的特征指标中心值集之间的距离,并从中挑选距离的最小值,然后将主叫号码重新划分到距离的最小值所对应的簇中,其中主叫号码zi和簇j的特征指标中心值集之间的距离的计算公式如下:xit是主叫号码zi的特征指标t的值,最后通知簇中心计算单元重新计算每个簇的特征指标中心值集,其中,E的阈值是0到1之间的一个数。
10.根据权利要求7所述的***,其特征在于,还包括有:
业务控制点SCP,用于当接收到主叫移动交换中心MSC转发来的用户呼叫请求时,判断所述呼叫请求的主叫号码是否在取证号码表或拦截号码表中,如果是,则向主叫MSC返回呼叫接续消息,所述呼叫接续消息中携带有取证路由号或拦截路由号信息,并指示主叫MSC将呼叫继续触发至防诈骗平台,其中,当主叫号码在取证号码表中时,则呼叫接续消息中携带取证路由号,当主叫号码在拦截号码表中时,则呼叫接续消息中携带拦截路由号。
11.根据权利要求10所述的***,其特征在于,防诈骗平台还包括有:
呼叫转发装置,用于接收到主叫MSC发送来的呼叫请求时,判断呼叫请求中是否携带有取证路由号或拦截路由号,如果携带有取证路由号,则通知录音取证装置,如果携带有拦截路由号,则通知诈骗拦截装置;
录音取证装置,用于对呼叫请求中主、被叫之间的语音通道进行桥接,然后对主叫语音进行单向录音,生成一个录音文件,并将所述录音文件保存到自然音样本库、或重复音样本库中;
诈骗拦截装置,用于对呼叫请求中主、被叫之间的语音通道进行桥接,然后对主叫语音进行单向录音,录音S秒后生成一个录音文件,再将录音文件逐一和重复音样本库、自然音样本库中的所有诈骗样本一一比对,当录音文件和诈骗样本是相同语音时,则指示被叫MSC中断主、被叫之间的语音通道。
12.根据权利要求11所述的***,其特征在于,诈骗拦截装置进一步包括有重复音识别单元,所述重复音识别单元进一步包括有:
时间特征构建部件,用于为录音文件、或重复音样本库中每个诈骗样本构建各自的时间特征值集:从录音文件或诈骗样本的语音起始点开始,以n秒为一帧,逐一从录音文件或诈骗样本中顺序提取出G个W帧语音信息,并利用语音端点检测技术,计算每个W帧语音信息中有效语音起始点到结束点之间的帧数,将所述帧数记为所述W帧语音信息的时间特征值,然后将计算出的G个时间特征值按照录音文件或诈骗样本中的先后次序保存到录音文件或诈骗样本的时间特征值集中;
能量特征构建部件,用于为录音文件、或重复音样本库中每个诈骗样本构建各自的能量特征值集:从录音文件或诈骗样本的语音起始点开始,以n秒为一帧,逐一从录音文件、或诈骗样本中顺序提取出G*W帧语音信息,并计算每一帧语音信息的短时能量值,将所述短时能量值记为每帧语音信息的能量特征值,然后将所述G*W个能量特征值按照录音文件、或诈骗样本的先后次序保存到录音文件、或诈骗样本的能量特征值集中;
诈骗置信度计算部件,用于从重复音样本库中读取每个诈骗样本的时间特征值集和能量特征值集,并将录音文件和诈骗样本的时间特征值集发送给时间特征识别部件,同时将录音文件和诈骗样本的能量特征值集发送给能量特征识别部件,然后计算录音文件和诈骗样本的诈骗语音置信度:其中,F是置信度的加权系数,并判断录音文件和诈骗样本的诈骗语音置信度是否大于阈值CC,如果是,则表示录音文件和诈骗样本是相同语音;如果否,则表示录音文件和诈骗样本不是相同语音;
时间特征识别部件,用于将录音文件和诈骗样本各自的时间特征值集中处于相同排序位置的时间特征值逐一比对,从而计算出录音文件和诈骗样本的时间特征值集中的时间特征值相同数TS;
能量特征识别部件,用于从录音文件和诈骗样本各自的能量特征值集中提取前K个能量特征值,然后计算诈骗样本和录音文件的能量放大倍数:其中,YEb是诈骗样本的能量特征值集中的第b个能量特征值,GEb是录音文件的能量特征值集中的第b个能量特征值,再根据能量放大倍数B,对录音文件的能量特征值集中的每个能量特征值进行调整:GEb=B×GEb,其中,b是1到G*W之间的自然数,最后将录音文件和诈骗样本的能量特征值集中处于相同排序位置的能量特征值逐一比对,从而计算出录音文件和诈骗样本的能量特征值集中的能量特征值相同数ES。
CN201410693578.XA 2014-11-26 2014-11-26 一种基于聚类算法的实时拦截诈骗电话的方法和*** Active CN104469025B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410693578.XA CN104469025B (zh) 2014-11-26 2014-11-26 一种基于聚类算法的实时拦截诈骗电话的方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410693578.XA CN104469025B (zh) 2014-11-26 2014-11-26 一种基于聚类算法的实时拦截诈骗电话的方法和***

Publications (2)

Publication Number Publication Date
CN104469025A true CN104469025A (zh) 2015-03-25
CN104469025B CN104469025B (zh) 2017-08-25

Family

ID=52914360

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410693578.XA Active CN104469025B (zh) 2014-11-26 2014-11-26 一种基于聚类算法的实时拦截诈骗电话的方法和***

Country Status (1)

Country Link
CN (1) CN104469025B (zh)

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104853357A (zh) * 2015-04-21 2015-08-19 杭州东信北邮信息技术有限公司 一种自动识别和触发诈骗号码的方法及***
CN104936182A (zh) * 2015-04-21 2015-09-23 ***通信集团浙江有限公司 一种智能管控诈骗电话的方法和***
CN105611084A (zh) * 2016-01-29 2016-05-25 中国联合网络通信集团有限公司 一种欺诈用户的可疑度计算方法及可疑度计算***
CN105844475A (zh) * 2016-03-17 2016-08-10 流量海科技成都有限公司 风险控制方法及风险控制装置
CN106506769A (zh) * 2016-10-08 2017-03-15 浙江鹏信信息科技股份有限公司 一种利用实时算法实现恶意电话过滤的方法和***
CN106506880A (zh) * 2016-10-25 2017-03-15 杭州东信北邮信息技术有限公司 一种从黑名单号码库中自动识别可释放号码的方法
CN106657689A (zh) * 2015-11-04 2017-05-10 ***通信集团公司 一种对国际诈骗电话进行防控的方法、装置
CN106686264A (zh) * 2016-11-04 2017-05-17 国家计算机网络与信息安全管理中心 一种诈骗电话筛选分析方法及***
CN107819924A (zh) * 2017-11-06 2018-03-20 东软集团股份有限公司 一种垃圾电话号码的识别方法、装置及设备
CN107872590A (zh) * 2016-09-26 2018-04-03 北京搜狗科技发展有限公司 一种电话识别的方法、装置和设备
CN108259688A (zh) * 2016-12-28 2018-07-06 广东世纪网通信设备股份有限公司 VoIP平台电话诈骗行为检测方法、装置以及检测***
CN108462785A (zh) * 2017-02-21 2018-08-28 ***通信集团浙江有限公司 一种恶意呼叫电话的处理方法及装置
CN108696626A (zh) * 2017-04-12 2018-10-23 ***通信集团福建有限公司 非法信息的处理方法和装置
CN108810230A (zh) * 2017-04-26 2018-11-13 腾讯科技(深圳)有限公司 一种获取来电提示信息的方法、装置及设备
CN108881591A (zh) * 2018-05-31 2018-11-23 咪咕动漫有限公司 一种多平台信息推荐方法、装置及存储介质
CN109587350A (zh) * 2018-11-16 2019-04-05 国家计算机网络与信息安全管理中心 一种基于滑动时间窗口聚合的电信诈骗电话的序列异常检测方法
CN109587357A (zh) * 2018-11-14 2019-04-05 上海麦图信息科技有限公司 一种骚扰电话的识别方法
CN109600752A (zh) * 2018-11-28 2019-04-09 国家计算机网络与信息安全管理中心 一种深度聚类诈骗检测的方法和装置
CN109615116A (zh) * 2018-11-20 2019-04-12 中国科学院计算技术研究所 一种电信诈骗事件检测方法和检测***
CN109688275A (zh) * 2018-12-27 2019-04-26 中国联合网络通信集团有限公司 骚扰电话识别方法、装置及存储介质
CN109819089A (zh) * 2017-11-21 2019-05-28 ***通信集团广东有限公司 声纹提取的方法、核心网网元、电子设备和存储介质
CN110213448A (zh) * 2018-09-13 2019-09-06 腾讯科技(深圳)有限公司 恶意号码识别方法、装置、存储介质和计算机设备
CN110312047A (zh) * 2019-06-24 2019-10-08 深圳市趣创科技有限公司 自动屏蔽骚扰电话的方法及装置
CN110414543A (zh) * 2018-04-28 2019-11-05 ***通信集团有限公司 一种电话号码危险级别的判别方法、设备以及计算机存储介质
CN110830664A (zh) * 2018-08-14 2020-02-21 ***通信集团设计院有限公司 识别电信诈骗潜在受害用户的方法和装置
CN110913081A (zh) * 2019-11-28 2020-03-24 上海观安信息技术股份有限公司 一种识别呼叫中心骚扰电话的方法及***
CN111445259A (zh) * 2018-12-27 2020-07-24 ***通信集团辽宁有限公司 业务欺诈行为的确定方法、装置、设备及介质
CN113992797A (zh) * 2021-08-16 2022-01-28 浙江小易信息科技有限公司 一种欺诈防控平台及方法
CN114449106A (zh) * 2022-02-10 2022-05-06 恒安嘉新(北京)科技股份公司 一种异常电话号码的识别方法、装置、设备和存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110163684A (zh) * 2019-05-27 2019-08-23 北京思特奇信息技术股份有限公司 一种对电信合作伙伴欺诈行为的标记方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020021793A1 (en) * 2000-08-14 2002-02-21 Okon Shmuel Destination unavailable state and notification service for public telephone network
CN103152738A (zh) * 2011-12-07 2013-06-12 腾讯科技(深圳)有限公司 智能拦截的方法及装置
CN103559175A (zh) * 2013-10-12 2014-02-05 华南理工大学 一种基于聚类的垃圾邮件过滤***及方法
CN104244216A (zh) * 2014-09-29 2014-12-24 ***通信集团浙江有限公司 一种通话过程中实时拦截诈骗电话的方法和***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020021793A1 (en) * 2000-08-14 2002-02-21 Okon Shmuel Destination unavailable state and notification service for public telephone network
CN103152738A (zh) * 2011-12-07 2013-06-12 腾讯科技(深圳)有限公司 智能拦截的方法及装置
CN103559175A (zh) * 2013-10-12 2014-02-05 华南理工大学 一种基于聚类的垃圾邮件过滤***及方法
CN104244216A (zh) * 2014-09-29 2014-12-24 ***通信集团浙江有限公司 一种通话过程中实时拦截诈骗电话的方法和***

Cited By (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104936182A (zh) * 2015-04-21 2015-09-23 ***通信集团浙江有限公司 一种智能管控诈骗电话的方法和***
CN104853357A (zh) * 2015-04-21 2015-08-19 杭州东信北邮信息技术有限公司 一种自动识别和触发诈骗号码的方法及***
CN104853357B (zh) * 2015-04-21 2018-07-10 杭州东信北邮信息技术有限公司 一种自动识别和触发诈骗号码的方法及***
CN104936182B (zh) * 2015-04-21 2018-05-25 ***通信集团浙江有限公司 一种智能管控诈骗电话的方法和***
CN106657689A (zh) * 2015-11-04 2017-05-10 ***通信集团公司 一种对国际诈骗电话进行防控的方法、装置
CN105611084B (zh) * 2016-01-29 2019-04-09 中国联合网络通信集团有限公司 一种欺诈用户的可疑度计算方法及可疑度计算***
CN105611084A (zh) * 2016-01-29 2016-05-25 中国联合网络通信集团有限公司 一种欺诈用户的可疑度计算方法及可疑度计算***
CN105844475A (zh) * 2016-03-17 2016-08-10 流量海科技成都有限公司 风险控制方法及风险控制装置
CN107872590A (zh) * 2016-09-26 2018-04-03 北京搜狗科技发展有限公司 一种电话识别的方法、装置和设备
CN106506769A (zh) * 2016-10-08 2017-03-15 浙江鹏信信息科技股份有限公司 一种利用实时算法实现恶意电话过滤的方法和***
CN106506769B (zh) * 2016-10-08 2019-01-04 浙江鹏信信息科技股份有限公司 一种利用实时算法实现恶意电话过滤的方法和***
CN106506880A (zh) * 2016-10-25 2017-03-15 杭州东信北邮信息技术有限公司 一种从黑名单号码库中自动识别可释放号码的方法
CN106686264A (zh) * 2016-11-04 2017-05-17 国家计算机网络与信息安全管理中心 一种诈骗电话筛选分析方法及***
CN106686264B (zh) * 2016-11-04 2021-03-02 国家计算机网络与信息安全管理中心 一种诈骗电话筛选分析方法及***
CN108259688A (zh) * 2016-12-28 2018-07-06 广东世纪网通信设备股份有限公司 VoIP平台电话诈骗行为检测方法、装置以及检测***
CN108462785A (zh) * 2017-02-21 2018-08-28 ***通信集团浙江有限公司 一种恶意呼叫电话的处理方法及装置
CN108462785B (zh) * 2017-02-21 2020-02-21 ***通信集团浙江有限公司 一种恶意呼叫电话的处理方法及装置
CN108696626B (zh) * 2017-04-12 2021-05-04 ***通信集团福建有限公司 非法信息的处理方法和装置
CN108696626A (zh) * 2017-04-12 2018-10-23 ***通信集团福建有限公司 非法信息的处理方法和装置
CN108810230A (zh) * 2017-04-26 2018-11-13 腾讯科技(深圳)有限公司 一种获取来电提示信息的方法、装置及设备
CN107819924A (zh) * 2017-11-06 2018-03-20 东软集团股份有限公司 一种垃圾电话号码的识别方法、装置及设备
CN109819089A (zh) * 2017-11-21 2019-05-28 ***通信集团广东有限公司 声纹提取的方法、核心网网元、电子设备和存储介质
CN110414543A (zh) * 2018-04-28 2019-11-05 ***通信集团有限公司 一种电话号码危险级别的判别方法、设备以及计算机存储介质
CN108881591A (zh) * 2018-05-31 2018-11-23 咪咕动漫有限公司 一种多平台信息推荐方法、装置及存储介质
CN108881591B (zh) * 2018-05-31 2020-10-30 咪咕动漫有限公司 一种多平台信息推荐方法、装置及存储介质
CN110830664A (zh) * 2018-08-14 2020-02-21 ***通信集团设计院有限公司 识别电信诈骗潜在受害用户的方法和装置
CN110830664B (zh) * 2018-08-14 2021-03-05 ***通信集团设计院有限公司 识别电信诈骗潜在受害用户的方法和装置
CN110213448B (zh) * 2018-09-13 2021-08-24 腾讯科技(深圳)有限公司 恶意号码识别方法、装置、存储介质和计算机设备
CN110213448A (zh) * 2018-09-13 2019-09-06 腾讯科技(深圳)有限公司 恶意号码识别方法、装置、存储介质和计算机设备
CN109587357B (zh) * 2018-11-14 2021-04-06 上海麦图信息科技有限公司 一种骚扰电话的识别方法
CN109587357A (zh) * 2018-11-14 2019-04-05 上海麦图信息科技有限公司 一种骚扰电话的识别方法
CN109587350B (zh) * 2018-11-16 2021-06-22 国家计算机网络与信息安全管理中心 一种基于滑动时间窗口聚合的电信诈骗电话的序列异常检测方法
CN109587350A (zh) * 2018-11-16 2019-04-05 国家计算机网络与信息安全管理中心 一种基于滑动时间窗口聚合的电信诈骗电话的序列异常检测方法
CN109615116A (zh) * 2018-11-20 2019-04-12 中国科学院计算技术研究所 一种电信诈骗事件检测方法和检测***
CN109600752A (zh) * 2018-11-28 2019-04-09 国家计算机网络与信息安全管理中心 一种深度聚类诈骗检测的方法和装置
CN111445259A (zh) * 2018-12-27 2020-07-24 ***通信集团辽宁有限公司 业务欺诈行为的确定方法、装置、设备及介质
CN109688275A (zh) * 2018-12-27 2019-04-26 中国联合网络通信集团有限公司 骚扰电话识别方法、装置及存储介质
CN110312047A (zh) * 2019-06-24 2019-10-08 深圳市趣创科技有限公司 自动屏蔽骚扰电话的方法及装置
CN110913081A (zh) * 2019-11-28 2020-03-24 上海观安信息技术股份有限公司 一种识别呼叫中心骚扰电话的方法及***
CN113992797A (zh) * 2021-08-16 2022-01-28 浙江小易信息科技有限公司 一种欺诈防控平台及方法
CN113992797B (zh) * 2021-08-16 2022-08-23 浙江小易信息科技有限公司 一种欺诈防控平台及方法
CN114449106A (zh) * 2022-02-10 2022-05-06 恒安嘉新(北京)科技股份公司 一种异常电话号码的识别方法、装置、设备和存储介质
CN114449106B (zh) * 2022-02-10 2024-04-30 恒安嘉新(北京)科技股份公司 一种异常电话号码的识别方法、装置、设备和存储介质

Also Published As

Publication number Publication date
CN104469025B (zh) 2017-08-25

Similar Documents

Publication Publication Date Title
CN104469025A (zh) 一种基于聚类算法的实时拦截诈骗电话的方法和***
CN109600752B (zh) 一种深度聚类诈骗检测的方法和装置
CN103456305B (zh) 终端和基于多个声音采集单元的语音处理方法
CN107331385A (zh) 一种骚扰电话的识别与拦截方法
CN103578470B (zh) 一种电话录音数据的处理方法及***
CN103258535A (zh) 基于声纹识别的身份识别方法及***
CN109658939B (zh) 一种电话录音未接通原因识别方法
CN107705791B (zh) 基于声纹识别的来电身份确认方法、装置和声纹识别***
CN104410973B (zh) 一种播放录音的诈骗电话识别方法和***
CN100456881C (zh) 一种用户身份识别方法和呼叫控制方法与***
CN110337059A (zh) 一种用户家庭关系的分析算法、服务器及网络***
CN104936182A (zh) 一种智能管控诈骗电话的方法和***
CN106936997B (zh) 一种基于社交关系图谱的垃圾语音识别方法和***
CN104410974B (zh) 一种对诈骗电话发送提醒信息的方法和***
CN101867742A (zh) 一种基于声控控制下的电视***
CN104702759A (zh) 通讯录的设置方法及装置
CN101950564A (zh) 一种远程数字化语音采集分析识别***
CN117119387B (zh) 基于手机信令数据的用户出行链的构建方法和装置
CN101753657A (zh) 一种降低通话噪音的方法及装置
CN104575496A (zh) 一种自动发送多媒体文件的方法及装置、移动终端
EP4094400B1 (en) Computer-implemented detection of anomalous telephone calls
CN115659217A (zh) 诈骗识别模型训练方法、装置、电子设备及存储介质
CN114155845A (zh) 服务确定方法、装置、电子设备及存储介质
Chen et al. VB-HMM Speaker Diarization with Enhanced and Refined Segment Representation.
CN103811008A (zh) 一种音频内容识别方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder

Address after: 310013, Zhejiang, Xihu District, Wensanlu Road, No. 398, 4 floor, Hangzhou

Patentee after: EB Information Technology Ltd.

Address before: 100191 Beijing, Zhichun Road, No. 9, hearing the building on the floor of the 7 floor,

Patentee before: EB Information Technology Ltd.

CP02 Change in the address of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 310013 4th floor, No.398 Wensan Road, Xihu District, Hangzhou City, Zhejiang Province

Patentee after: Xinxun Digital Technology (Hangzhou) Co.,Ltd.

Address before: 310013 4th floor, No.398 Wensan Road, Xihu District, Hangzhou City, Zhejiang Province

Patentee before: EB Information Technology Ltd.

CP01 Change in the name or title of a patent holder