CN105679323B - 一种号码发现方法及*** - Google Patents
一种号码发现方法及*** Download PDFInfo
- Publication number
- CN105679323B CN105679323B CN201510998519.8A CN201510998519A CN105679323B CN 105679323 B CN105679323 B CN 105679323B CN 201510998519 A CN201510998519 A CN 201510998519A CN 105679323 B CN105679323 B CN 105679323B
- Authority
- CN
- China
- Prior art keywords
- target person
- information
- regular
- test number
- similarity score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000012360 testing method Methods 0.000 claims abstract description 143
- 230000001755 vocal effect Effects 0.000 claims abstract description 49
- 239000000284 extract Substances 0.000 claims abstract description 8
- 230000006870 function Effects 0.000 claims description 23
- 238000012790 confirmation Methods 0.000 abstract description 6
- 238000005516 engineering process Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 10
- 238000002474 experimental method Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000008676 import Effects 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000011840 criminal investigation Methods 0.000 description 3
- NGVDGCNFYWLIFO-UHFFFAOYSA-N pyridoxal 5'-phosphate Chemical compound CC1=NC=C(COP(O)(O)=O)C(C=O)=C1O NGVDGCNFYWLIFO-UHFFFAOYSA-N 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000001604 Rao's score test Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/08—Use of distortion metrics or a particular distance between probe pattern and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/16—Hidden Markov models [HMM]
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种号码发现方法及***,所述方法包括:根据收集的目标人的语音数据构建目标人声纹模型;获取目标人的已知使用号码和候选测试号码以及各号码的通话信息;提取所述候选测试号码的使用人的声纹特征;计算各候选测试号码的使用人的声纹特征与目标人声纹模型的相似度得分;计算结束后,基于候选测试号码的通话信息与目标人的已知使用号码的通话信息和/或外界导入的目标人相关信息的关联度对所述相似度得分进行规整;根据规整后的相似度得分确认目标人使用的号码。本发明由于对相似度得分的规整不仅仅依赖于非目标人的声纹模型的均值和方差均值,可以进一步地提升声纹识别的准确性。
Description
技术领域
本发明涉及声纹识别技术领域,具体涉及一种号码发现方法及***。
背景技术
声纹识别即根据用户输入语音信号中所反映的说话人生理特征和行为特征的声纹信息,自动识别认证说话人身份的技术。相比于其他生物认证(如人脸、虹膜等),声纹认证具有更简便、经济及良好扩展性等众多优势,可广泛应用于安全验证、控制等各方面,如刑侦中的目标人号码发现。
基于通话信息的目标人号码发现的应用的核心在于声纹识别,即通过候选测试号码的使用人的声纹与目标人的声纹的相似度对比,从候选测试号码中找到目标人使用的号码。在声纹识别过程中,通过目标人声纹和测试人声纹做比较,判断说话人语音的相似性。在相似度计算过程中,由于诸如目标人语音数据不足、信道、环境噪声等多方面的影响,从而导致同一说话人的声纹特征一致性不高或不同说话人的声纹特征不一致性不大等情况的出现。因而现有技术中,常对相似度得分进行得分规整,以减小同一说话人的不一致性,扩大不同说话人的不一致性。现有的得分规整的常用计算公式如式(1)所示:
其中,Lλ(X)是语句X对于说话人模型λ的得分,是规整后的得分、μλ是对于说话人模型λ的规整参数,δλ是非目标人的声纹模型的均值和方差均值,需要用大量数据进行估计。
现有的得分规整在一定程度上减小了同一说话人的不一致性,扩大了不同说话人的不一致性。但随着非目标人数据达到一定量时,其效果的提升就趋于稳定,无法再进一步地提升声纹识别的准确性。
发明内容
本发明实施例提供一种号码发现方法及***,解决现有技术中当非目标人数据达到一定量时,对相似度得分进行规整却无法提升声纹识别的准确性的问题。
为此,本发明实施例提供如下技术方案:
一种号码发现方法,包括:
预先根据收集的目标人的语音数据构建目标人声纹模型;
获取目标人的已知使用号码和候选测试号码以及各号码的通话信息;
提取所述候选测试号码的使用人的声纹特征;
计算各候选测试号码的使用人的声纹特征与目标人声纹模型的相似度得分;
计算结束后,基于候选测试号码的通话信息与目标人的已知使用号码的通话信息和/或外界导入的目标人相关信息的关联度对所述相似度得分进行规整;
根据规整后的相似度得分确定目标人使用的号码。
优选地,所述候选测试号码按照预设条件选取;所述预设条件包括以下任意一个或多个:号码的地域信息、使用年限、使用频率、某个时段的有效语音时长、是否拥有指定和/或共同的联系人。
优选地,所述基于候选测试号码的通话信息与目标人的已知使用号码的通话信息和/或外界导入的目标人相关信息的关联度对所述相似度得分进行规整,包括以下任意一个或多个步骤:
将各相似度得分乘以预设的函数以扩大候选测试号码的使用人的声纹特征与目标人声纹模型的相似度得分的区分性;
根据候选测试号码与目标人的已知使用号码的通话情况对相似度得分进行规整;
根据候选测试号码与目标人的已知使用号码的地域信息的关联度对相似度得分进行规整;
根据候选测试号码与外界导入目标人相关信息的关联度对相似度得分进行规整包括以下任意一种或多种:目标人某一时间段所处的地域信息、某一时间段的联系人通话信息、与目标人相关的案件信息。
优选地,所述预设的函数为分段函数,相似度得分所处不同函数段对应不同的系数。
优选地,所述方法还包括:
将相似度得分大于设定得分阈值的候选测试号码作为优选测试号码;
所述基于候选测试号码的通话信息与目标人的已知使用号码的通话信息和/或外界导入的目标人相关信息的关联度对相似度得分进行规整包括:
基于优选测试号码的通话信息与目标人的已知使用号码的通话信息和/或外界导入的目标人相关信息的关联度对相似度得分进行规整。
优选地,所述声纹模型包括以下任意一种:说话人因子向量模型、高斯混合模型、隐马尔可夫模型或动态时间规整模型。
一种号码发现***,包括:
建模模块,用于预先根据收集的目标人的语音数据构建目标人声纹模型;
获取模块,用于获取目标人的已知使用号码和候选测试号码以及各号码的通话信息;
特征提取模块,用于提取所述候选测试号码的使用人的声纹特征;
相似度获取模块,用于计算各候选测试号码的使用人的声纹特征与目标人声纹模型的相似度得分;
规整模块,用于在计算结束后,基于候选测试号码的通话信息与目标人的已知使用号码的通话信息和/或外界导入的目标人相关信息的关联度对所述相似度得分进行规整;
查找模块,用于根据规整后的相似度得分确定目标人使用的号码。
优选地,所述规整模块包括以下任意一个或多个单元:
第一规整单元,用于将各相似度得分乘以预设的函数以扩大候选测试号码的使用人的声纹特征与目标人声纹模型的相似度得分的区分性;
第二规整单元,用于根据候选测试号码与目标人的已知使用号码的通话情况对相似度得分进行规整;
第三规整单元,用于根据候选测试号码与目标人的已知使用号码的地域信息的关联度对相似度得分进行规整;
第四规整单元,用于根据候选测试号码与外界导入目标人相关信息的关联度对相似度得分进行规整包括以下任意一种或多种:目标人某一时间段所处的地域信息、某一时间段的联系人通话信息、与目标人相关的案件信息。
优选地,所述***还包括:
优选测试号码获取模块,与所述相似度获取模块相连接,将相似度得分大于设定得分阈值的候选测试号码作为优选测试号码;
所述规整模块具体用于基于优选测试号码的通话信息与目标人的已知使用号码的通话信息和/或外界导入的目标人相关信息的关联度对相似度得分进行规整。
优选地,所述声纹模型包括以下任意一种:说话人因子向量模型、高斯混合模型、隐马尔可夫模型或动态时间规整模型。
本发明实施例提供的号码发现方法及***,通过对收集的目标人的语音数据构建声纹模型,然后从获取的目标人已知使用号码及候选测试号码的相关信息中提取各号码的通话信息,并提取各候选测试号码的使用人的声纹特征,接着计算各候选测试号码的使用人的声纹特征与目标人声纹模型的相似度得分,然后根据候选测试号码的通话信息与外界导入的目标人相关信息和/或目标人的已知使用号码的通话信息的关联度对所述相似度得分进行规整,最终根据规整的结果找到目标人使用的号码。由于根据候选测试号码的通话信息与外界导入的目标人相关信息和/或目标人的已知使用号码的通话信息对所述相似度得分进行规整,使得对相似度得分的规整不仅仅依赖于非目标人的声纹模型的均值和方差均值,可以进一步地提升声纹识别的准确性。
进一步地,所述声纹模型包括:说话人因子向量模型。由于采用说话人因子向量模型,后续可以通过概率线性鉴别分析(Probabilistic linear discriminant analysis,PLDA)技术以去除信道的干扰信息,能够消除信道干扰对判断语音信号之间相似度的影响,从而提升判断语音信号类之间相似度的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例提供的一种号码发现方法的流程图;
图2是根据本发明实施例提供的号码发现***的一种结构示意图;
图3是根据本发明实施例提供的号码发现***的另一种结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明实施例的方案,下面结合附图和实施例的方式对本发明作进一步的详细说明。以下实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
为了更好地理解本发明,下面首先对现有技术中声纹识别技术进行简单说明。声纹识别(Voiceprint Recognition,VPR),也称为说话人识别(Speaker Recognition),有两类,即说话人辨认(Speaker Identification)和说话人确认(Speaker Verification)。前者用以判断某段语音是若干人中的哪一个所说的,是“多选一”问题;而后者用以确认某段语音是否是指定的某个人所说的,是“一对一判别”问题。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。不管是辨认还是确认,都需要先对说话人的声纹进行建模,这就是所谓的“训练”或“学习”过程,声纹模型可以包括以下任意一种:说话人因子向量模型、高斯混合模型、隐马尔可夫模型、动态时间规整模型或向量量化模型等。
在对说话的人辨认方面,根据待识别的说话人是否在注册的说话人集合内,说话人辨认可以分为开集(open-set)辨认和闭集(close-set)辨认。前者假定待识别说话人可以在集合外,而后者假定待识别说话人在集合内。显然,开集辨认需要有一个对集外说话人的“拒识问题”,而且闭集辨认的结果要好于开集辨认结果。本质上讲,说话人确认和开集说话人辨认都需要用到拒识技术,为了达到很好的拒识效果,通常需要训练一个假冒者模型或背景模型,以便在拒识时有可比较的对象,阈值容易选定。而建立背景模型的好坏直接影响到拒识甚至声纹识别的性能。一个好的背景模型,往往需要通过预先采集好的若干说话人的数据,通过某种算法去建立。
声纹识别主要有三个关键问题,一是声纹特征提取,二是模式匹配,即模式识别,三是相似度规整。其中,声纹特征可以是感知线性预测系数(Perceptual LinearPredictive,PLP),它是受人的听觉***研究成果推动而导出的声学特征,通过对人的听觉机理的研究发现,当两个频率相近的音调同时发出时,人只能听到一个音调,当然也可以是梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)、线性预测系数(linearprediction Coefficient,LPC)等声纹特征。解决前两个关键问题的技术已相对成熟,但是对于相似度规整技术,现有技术中随着非目标人数据达到一定量时,相似度规整效果的提升就趋于稳定,无法再进一步地提升声纹识别的准确性。
本发明提供的号码发现方法及***,通过从获取的目标人已知使用号码及候选测试号码的相关信息中提取各号码的通话信息,然后根据候选测试号码的通话信息与外界导入的目标人相关信息和/或目标人的已知使用号码的通话信息的关联度对所述相似度得分进行规整,使得对相似度得分的规整不仅仅依赖于上述假冒者模型或背景模型,可以进一步地提升声纹识别的准确性。
为了更好的理解本发明的技术方案和技术效果,以下将结合流程图和具体的实施例进行详细的描述。
如图1所示,是本发明实施例提供的号码发现方法的流程图,包括以下步骤:
步骤S01,根据收集的目标人的语音数据构建目标人声纹模型。
语音数据为通过具有麦克风的设备收集的语音数据,可以是说话人实时的发音,也可以是通过录音设备等保存的语音数据,当然,还可以是通讯设备,例如移动电话、远程电话会议***等手段传播的语音数据。
在本实施例中,所述目标人指实际应用中需要进行号码发现的人,号码发现属于说话人辨认技术的范围,简单说即从大量使用号码中发现目标人使用的号码。目标人语音数据的收集可以从其日常说话中自动获取,如通话语音,也可以是专门进行目标人语音数据录制,对此本实施例不作限定。
在实际应用中,所述语音数据的声纹特征,可以是PLP特征,当然也可以是MFCC、LPC等声纹特征。所述目标人声纹模型的构建,采用现有技术,如首先提取目标人语音数据的声纹特征,如PLP特征,再基于声纹特征构建声纹模型,如当下较为流行的说话人因子向量(ivector)。
在一个具体实施例中,说话人因子向量I的表达式如式(2)所示:
M=m+TI (2)
其中,M为从目标人的语音中提取的均值超矢量,m为通用背景模型的均值,T为因子载荷矩阵;通用背景模型为通过EM算法训练得到的混合高斯模型;通用背景模型及因子载荷矩阵的获取同现有技术,在此不再详述。
需要说明的是,所述声纹模型还可以为高斯混合模型、隐马尔可夫模型、动态时间规整模型、向量量化模型等,具体视使用效果而定。
步骤S02,获取目标人的已知使用号码和候选测试号码以及各号码的通话信息。
在本实施例中,所述候选测试号码按照预设条件选取;所述预设条件包括以下任意一个或多个:号码的地域信息、使用年限、使用频率、某个时段的有效语音时长、是否拥有指定和/或共同的联系人
在一个具体实施例中,根据目标人的已知使用号码的话单信息,选取在某一周期T内与目标人的已知使用号码a通话的所有话单A,并将与目标人的已知使用号码a通话次数大于n的所有话单记为A’。待发现的候选测试号码的通话信息,选取符合一定条件的待测试号码作为候选测试号码,而候选测试号码使用人的通话语音数据作为候选测试号码的通话信息。所述候选测试号码选取的条件,可以包括在周期T内选取有效语音时长大于时长阈值L1的测试号码作为候选测试号码,记为B。
步骤S03,提取所述候选测试号码的使用人的声纹特征。
在本实施中,通过各候选测试号码获取该号码相应说话人的语音数据,例如通过拨打该号码进行电话录音或运营商提供的通话录音等,当然,也可以通过找到该号码使用人以获取语音数据;然后从获取的各候选测试号码的语音数据中提取声纹特征,例如通过公式(2)获取各候选测试号码的使用人的语音数据的说话人因子向量。
步骤S04,计算过程:计算各候选测试号码的使用人的声纹特征与目标人声纹模型的相似度得分。
在本实施例中,根据说话人因子向量计算各候选测试号码的使用人的声纹特征与目标人声纹模型的相似度得分,具体地,可以根据各说话人因子向量之间的距离来判断说话人因子向量之间的相似度,例如,KLD距离,欧式距离,cos相关度距离等,本实施例采用cos相关度距离进行说明。
在一个具体实施例中,计算各候选测试号码使用人的说话人因子向量与目标人的说话人因子向量两两之间的cos相关度距离C1λ,C2λ,C3λ,...,其中,C1λ,C2λ,C3λ分别为第1、第2、第3候选测试号码的使用人的声纹特征与目标人λ声纹模型之间的cos相关度距离,当cos相关度距离越大,则代表这两个号码的使用人的语音信号特征越相似。具体数学公式如式(3)所示:
在其他实施例中,还可以通过采用概率线性鉴别分析PLDA技术以去除信道的干扰信息,从而提升判断语音信号类之间相似度的准确性。
当然,还可以根据其他计算各候选测试号码使用人与目标人声纹的相似度得分的方法获取相似度得分,在此不做限定。
步骤S05,计算过程结束后,基于候选测试号码的通话信息与目标人的已知使用号码的通话信息和/或外界导入的目标人相关信息的关联度对所述相似度得分进行规整。
在本实施例中,所述基于候选测试号码的通话信息与目标人的已知使用号码的通话信息和/或外界导入的目标人相关信息的关联度对所述相似度得分进行规整,包括以下任意一个或多个步骤:将各相似度得分乘以预设的函数以扩大候选测试号码的使用人的声纹特征与目标人声纹模型的相似度得分的区分性;根据候选测试号码与目标人的已知使用号码的通话情况对相似度得分进行规整;根据候选测试号码与目标人的已知使用号码的地域信息的关联度对相似度得分进行规整;根据候选测试号码与外界导入目标人相关信息的关联度对相似度得分进行规整包括以下任意一种或多种:目标人某一时间段所处的地域信息、某一时间段的联系人通话信息、与目标人相关的案件信息。其中,所述预设的函数为分段函数,相似度得分所处不同函数段对应不同的系数。
进一步地,所述方法还包括:将相似度得分大于设定得分阈值的候选测试号码作为优选测试号码;所述基于候选测试号码的通话信息与目标人的已知使用号码的通话信息和/或外界导入的目标人相关信息的关联度对相似度得分进行规整包括:基于优选测试号码的通话信息与目标人的已知使用号码的通话信息和/或外界导入的目标人相关信息的关联度对相似度得分进行规整。通过对候选测试号码进行筛选获取优选测试号码可以缩小需要进行相似度得分计算的对象的数量,以提高处理效率。
在一个具体实施例中,对所述相似度得分的规整过程可以包括:
首先,将各相似度得分乘以预设的函数以扩大候选测试号码的使用人的声纹特征与目标人声纹模型的相似度得分的区分性,其中,预设的函数为根据经验而获得的相似度得分分类而设定的函数,例如,为了扩大候选测试号码使用人与目标人之间相似得分的区分性,设定第二得分阈值,如果原始得分大于第二得分阈值,则原始得分乘以系数ε(一般为略大于1的一个值,如1.1),否则原始得分乘以系数ξ(一般为0-1之间的一个值,如0.8)。所述系数ε和系数ξ的值一般由大量实验结果或者经验确定。当然,该分段函数不仅仅可以为两段,还可以根据实际效果而分为三段或更多段。需要说明的是,该函数可以为分段函数外,还可以为根据实际使用效果选取的非线性函数等,例如余弦函数等,在此不做限定。
然后,判断集合B中任一个候选测试号码是否与集合A中任意号码有通话记录,若没有,则每一个候选测试号码的相似度得分减去α1;如果有,则记录该候选测试号码在周期T内的所有通话次数M,与集合A中号码的通话次数为m,与集合A’中号码的通话次数为m',此时每一个候选测试号码的相似度得分加上α2,α2的计算公式如式(5)所示:
其中,α1、β1、β2的值都是由大量实验或经验或实际应用情况确定。
接着,对集合B中的任一候选测试号码,如果其地域信息与已知号码a对应的地域信息相同、相邻或相关,则该候选测试号码的相似度得分加上α3,α3的值都是由大量实验或经验或实际应用情况确定。例如,当候选测试号码的地域信息和目标人的近亲属或关系密切人的地域信息相同时,可以在该候选测试号码的相似度得分加上α3,当然,低于信息相同、相邻或相关对应的α3的值可以相同或不同,根据使用效果而定。此外,如果地域信息不同、不相邻或不相关,也可以将该候选测试号码的相似度得分减去一个值,且对于相同和相邻两种情况可以加或减去不同的值,该值的大小一般与距离成反比,对此不做限定。
然后,根据外界导入的目标人相关信息和目标人的已知使用号码的通话信息的关联度对所述相似度得分进行规整。其中,目标人相关信息包括以下一种或多种:目标人某一时间段所处的地域信息、某一时间段的联系人通话信息、与目标人相关的案件信息。
具体地,目标人某一时间段的所处地域信息:由外界导入的目标人地域信息,简单说就是预先通过一些渠道(一般在刑侦中会调查出相关人或案件的信息)获取了目标人的活动地域信息,如果集合B中任一个测试号码的地域信息与目标人的地域信息一致,则该候选测试号码的相似度得分加上α4,α4的值都是由大量实验或经验或实际应用情况确定;某一时间段的联系人通话信息:由外界某些渠道获取到的某一时间段,目标人与某些人有通话,这些人的集合可以记为A”是集合A的子集,如果集合B中任一测试号码在该段时间内也与A”有通话,则该候选测试号码的相似度得分加上α5,α5的值都是由大量实验或经验或实际应用情况确定;可能与目标人相关的案件信息:由外界某些渠道获取到某个案件可能与目标人相关,且该案件同时涉及其他人,可记为集合C,若集合B中任一测试号码与集合C中人员有通话,则该候选测试号码的相似度得分加上α6,α6的值都是由大量实验或经验或实际应用情况确定。
同理,对于外界导入的目标人相关信息对相似度得分的影响,除了对满足上述条件的相似度得分进行提升,对于不满足上述条件的相似度得分也可以进行得分降低,该降低的值可以是与相应判断条件的提升的值相同,也可以不同,对此本实施例不做限定。需要说明的是,上述步骤可以仅选取其中任意一个或几个步骤对相似度得分进行规整,且相关顺序也不是固定的,可以根据实际使用效果或具体要求做相应的调整,以获得最佳识别效果。
在另一个实施例中,首先将相似度得分大于第一得分阈值的候选测试号码作为优选测试号码;然后将各相似度得分乘以预设的函数以扩大优选测试号码的使用人的声纹特征与目标人声纹模型的相似度得分的区分性;接着判断任一个优选测试号码是否与集合A中任意号码有通话记录等后续步骤,具体参考上一实施例,在此不再详述。
步骤S06,根据规整后的相似度得分确认目标人使用的号码。
在本实施例中,可以选取规整后相似度得分大于预先设定的第三得分阈值的候选测试号码,认为这些候选测试号码是目标人未知的使用号码。
本发明实施例提供的号码发现方法通过对目标人的语音数据构建声纹模型,然后从获取的目标人已知使用号码及候选测试号码的相关信息中提取各号码的通话信息,并提取各候选测试号码的使用人的声纹特征,以获取各候选测试号码的使用人的声纹特征与目标人声纹模型的相似度得分,然后根据候选测试号码的通话信息与外界导入的目标人相关信息和/或目标人的已知使用号码的通话信息的关联度对所述相似度得分进行规整,最终根据规整的结果确认目标人未知的使用号码。由于通过从获取的目标人已知使用号码及候选测试号码的相关信息中提取各号码的通话信息,然后根据候选测试号码的通话信息与外界导入的目标人相关信息和/或目标人的已知使用号码的通话信息的关联度对所述相似度得分进行规整,使得对相似度得分的规整不仅仅依赖于上述假冒者模型或背景模型,可以根据候外界导入的目标人相关信息和/或目标人的已知使用号码的通话信息进一步地提升识别结果的准确性。
相应的,本发明还提供了一种号码发现***,如图2所示:
建模模块201,用于根据收集的目标人的语音数据构建目标人声纹模型;
获取模块202,用于获取目标人的已知使用号码和候选测试号码以及各号码的通话信息;
特征提取模块203,用于提取所述候选测试号码的使用人的声纹特征;
相似度获取模块204,用于计算各候选测试号码的使用人的声纹特征与目标人声纹模型的相似度得分;
规整模块205,用于基于候选测试号码的通话信息与目标人的已知使用号码的通话信息和/或外界导入的目标人相关信息的关联度对所述相似度得分进行规整;
查找模块206,用于根据规整后的相似度得分确认目标人使用的号码。
在本实施例中,所述规整模块205包括以下任意一个或多个单元:
第一规整单元,用于将各相似度得分乘以预设的函数以扩大候选测试号码的使用人的声纹特征与目标人声纹模型的相似度得分的区分性;
第二规整单元,用于根据候选测试号码与目标人的已知使用号码的通话情况对相似度得分进行规整;
第三规整单元,用于根据候选测试号码与目标人的已知使用号码的地域信息的关联度对相似度得分进行规整;
第四规整单元,用于根据候选测试号码与外界导入目标人相关信息的关联度对相似度得分进行规整包括以下任意一种或多种:目标人某一时间段所处的地域信息、某一时间段的联系人通话信息、与目标人相关的案件信息。
进一步地,为了提升***的处理效率,仅对相似度得分大于设定得分阈值的候选测试号码进行相似度得分计算,如图3所示,所述***还包括:
优选测试号码获取模块307,与所述相似度获取模块204相连接,将相似度得分大于设定得分阈值的候选测试号码作为优选测试号码;
所述规整模块205具体用于基于优选测试号码的通话信息与目标人的已知使用号码的通话信息和/或外界导入的目标人相关信息的关联度对相似度得分进行规整。
优选地,所述声纹模型包括:说话人因子向量模型。以便于***在计算各候选测试号码的使用人的声纹特征与目标人声纹模型的相似度得分时,不受信道信号的干扰,以提升识别的准确率。
当然,该***还可以进一步包括存储模块(未图示),用于保存目标人相关信息、候选测试号码及通话信息、语音数据、声纹特征、声纹模型及相应模型参数等信息。这样,以方便对候选测试号码进行计算机自动处理,并存储号码发现结果相关信息等。
本发明实施例提供的号码发现***,通过建模模块201对目标人的语音数据构建声纹模型,然后通过获取模块202从目标人已知使用号码及候选测试号码的相关信息中提取各号码的通话信息,并通过特征提取模块203提取各候选测试号码的使用人的声纹特征,接着通过相似度获取模块204计算各候选测试号码的使用人的声纹特征与目标人声纹模型的相似度得分,然后通过规整模块205对所述相似度得分进行规整,最终通过查找模块206根据规整的结果确认目标人未知的使用号码。由于通过获取模块202获取目标人的已知使用号码和候选测试号码以及各号码的通话信息,并通过规整模块205根据候选测试号码的通话信息与外界导入的目标人相关信息和/或目标人的已知使用号码的通话信息的关联度对所述相似度得分进行规整,使得对相似度得分的规整不仅仅依赖于上述假冒者模型或背景模型,可以根据外界导入的目标人相关信息和/或目标人的已知使用号码的通话信息进一步地提升识别结果的准确性。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的***实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上对本发明实施例进行了详细介绍,本文件中应用了具体实施方式对本发明进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及***;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种号码发现方法,其特征在于,包括:
预先根据收集的目标人的语音数据构建目标人声纹模型;
获取目标人的已知使用号码和候选测试号码以及各号码的通话信息;
提取所述候选测试号码的使用人的声纹特征;
计算各候选测试号码的使用人的声纹特征与目标人声纹模型的相似度得分;
计算结束后,基于候选测试号码的通话信息与目标人的已知使用号码的通话信息和/或外界导入的目标人相关信息的关联度对所述相似度得分进行规整;
根据规整后的相似度得分确定目标人使用的号码。
2.根据权利要求1所述的方法,其特征在于,所述候选测试号码按照预设条件选取;所述预设条件包括以下任意一个或多个:号码的地域信息、使用年限、使用频率、某个时段的有效语音时长、是否拥有指定和/或共同的联系人。
3.根据权利要求1所述的方法,其特征在于,所述基于候选测试号码的通话信息与目标人的已知使用号码的通话信息和/或外界导入的目标人相关信息的关联度对所述相似度得分进行规整,包括以下任意一个或多个步骤:
将各相似度得分乘以预设的函数以扩大候选测试号码的使用人的声纹特征与目标人声纹模型的相似度得分的区分性;
根据候选测试号码与目标人的已知使用号码的通话情况对相似度得分进行规整;
根据候选测试号码与目标人的已知使用号码的地域信息的关联度对相似度得分进行规整;
根据候选测试号码与外界导入目标人相关信息的关联度对相似度得分进行规整,所述目标人相关信息包括以下任意一种或多种:目标人某一时间段所处的地域信息、某一时间段的联系人通话信息、与目标人相关的案件信息。
4.根据权利要求3所述的方法,其特征在于,所述预设的函数为分段函数,相似度得分所处不同函数段对应不同的系数。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:
将相似度得分大于设定得分阈值的候选测试号码作为优选测试号码;
所述基于候选测试号码的通话信息与目标人的已知使用号码的通话信息和/或外界导入的目标人相关信息的关联度对相似度得分进行规整包括:
基于优选测试号码的通话信息与目标人的已知使用号码的通话信息和/或外界导入的目标人相关信息的关联度对相似度得分进行规整。
6.根据权利要求1至4任一项所述的方法,其特征在于,所述声纹模型包括以下任意一种:说话人因子向量模型、高斯混合模型、隐马尔可夫模型或动态时间规整模型。
7.一种号码发现***,其特征在于,包括:
建模模块,用于预先根据收集的目标人的语音数据构建目标人声纹模型;
获取模块,用于获取目标人的已知使用号码和候选测试号码以及各号码的通话信息;
特征提取模块,用于提取所述候选测试号码的使用人的声纹特征;
相似度获取模块,用于计算各候选测试号码的使用人的声纹特征与目标人声纹模型的相似度得分;
规整模块,用于在计算结束后,基于候选测试号码的通话信息与目标人的已知使用号码的通话信息和/或外界导入的目标人相关信息的关联度对所述相似度得分进行规整;
查找模块,用于根据规整后的相似度得分确定目标人使用的号码。
8.根据权利要求7所述的***,其特征在于,所述规整模块包括以下任意一个或多个单元:
第一规整单元,用于将各相似度得分乘以预设的函数以扩大候选测试号码的使用人的声纹特征与目标人声纹模型的相似度得分的区分性;
第二规整单元,用于根据候选测试号码与目标人的已知使用号码的通话情况对相似度得分进行规整;
第三规整单元,用于根据候选测试号码与目标人的已知使用号码的地域信息的关联度对相似度得分进行规整;
第四规整单元,用于根据候选测试号码与外界导入目标人相关信息的关联度对相似度得分进行规整,所述目标人相关信息包括以下任意一种或多种:目标人某一时间段所处的地域信息、某一时间段的联系人通话信息、与目标人相关的案件信息。
9.根据权利要求7所述的***,其特征在于,所述***还包括:
优选测试号码获取模块,与所述相似度获取模块相连接,将相似度得分大于设定得分阈值的候选测试号码作为优选测试号码;
所述规整模块具体用于基于优选测试号码的通话信息与目标人的已知使用号码的通话信息和/或外界导入的目标人相关信息的关联度对相似度得分进行规整。
10.根据权利要求7至9任一项所述的***,其特征在于,所述声纹模型包括以下任意一种:说话人因子向量模型、高斯混合模型、隐马尔可夫模型或动态时间规整模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510998519.8A CN105679323B (zh) | 2015-12-24 | 2015-12-24 | 一种号码发现方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510998519.8A CN105679323B (zh) | 2015-12-24 | 2015-12-24 | 一种号码发现方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105679323A CN105679323A (zh) | 2016-06-15 |
CN105679323B true CN105679323B (zh) | 2019-09-03 |
Family
ID=56297651
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510998519.8A Active CN105679323B (zh) | 2015-12-24 | 2015-12-24 | 一种号码发现方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105679323B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108628877A (zh) * | 2017-03-20 | 2018-10-09 | 大有秦鼎(北京)科技有限公司 | 数据修复方法和装置 |
CN108900326B (zh) * | 2018-06-15 | 2021-08-31 | 中国联合网络通信集团有限公司 | 通信信息管理方法及装置 |
CN108962261A (zh) * | 2018-08-08 | 2018-12-07 | 联想(北京)有限公司 | 信息处理方法、信息处理装置和蓝牙耳机 |
CN109584886B (zh) * | 2018-12-04 | 2023-01-17 | 科大讯飞股份有限公司 | 基于声纹识别的身份认证方法、装置、设备及存储介质 |
CN111968650B (zh) * | 2020-08-17 | 2024-04-30 | 科大讯飞股份有限公司 | 语音匹配方法、装置、电子设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103258535A (zh) * | 2013-05-30 | 2013-08-21 | 中国人民财产保险股份有限公司 | 基于声纹识别的身份识别方法及*** |
CN103730114A (zh) * | 2013-12-31 | 2014-04-16 | 上海交通大学无锡研究院 | 一种基于联合因子分析模型的移动设备声纹识别方法 |
CN104240706A (zh) * | 2014-09-12 | 2014-12-24 | 浙江大学 | 一种基于GMM Token配比相似度校正得分的说话人识别方法 |
CN104639770A (zh) * | 2014-12-25 | 2015-05-20 | 北京奇虎科技有限公司 | 基于移动终端的电话举报方法、装置和*** |
CN105139856A (zh) * | 2015-09-02 | 2015-12-09 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 基于先验知识规整协方差的概率线性鉴别说话人识别方法 |
CN105161093A (zh) * | 2015-10-14 | 2015-12-16 | 科大讯飞股份有限公司 | 一种判断说话人数目的方法及*** |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9491167B2 (en) * | 2012-09-11 | 2016-11-08 | Auraya Pty Ltd | Voice authentication system and method |
-
2015
- 2015-12-24 CN CN201510998519.8A patent/CN105679323B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103258535A (zh) * | 2013-05-30 | 2013-08-21 | 中国人民财产保险股份有限公司 | 基于声纹识别的身份识别方法及*** |
CN103730114A (zh) * | 2013-12-31 | 2014-04-16 | 上海交通大学无锡研究院 | 一种基于联合因子分析模型的移动设备声纹识别方法 |
CN104240706A (zh) * | 2014-09-12 | 2014-12-24 | 浙江大学 | 一种基于GMM Token配比相似度校正得分的说话人识别方法 |
CN104639770A (zh) * | 2014-12-25 | 2015-05-20 | 北京奇虎科技有限公司 | 基于移动终端的电话举报方法、装置和*** |
CN105139856A (zh) * | 2015-09-02 | 2015-12-09 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 基于先验知识规整协方差的概率线性鉴别说话人识别方法 |
CN105161093A (zh) * | 2015-10-14 | 2015-12-16 | 科大讯飞股份有限公司 | 一种判断说话人数目的方法及*** |
Non-Patent Citations (1)
Title |
---|
"利用i-vector构建区分性话者模型的话者确认";方昕;《小型微型计算机***》;20140331(第3期);全文 |
Also Published As
Publication number | Publication date |
---|---|
CN105679323A (zh) | 2016-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110136727B (zh) | 基于说话内容的说话者身份识别方法、装置及存储介质 | |
Reynolds | An overview of automatic speaker recognition technology | |
CN105938716B (zh) | 一种基于多精度拟合的样本复制语音自动检测方法 | |
Singh et al. | Applications of speaker recognition | |
CN105679323B (zh) | 一种号码发现方法及*** | |
CN110473566A (zh) | 音频分离方法、装置、电子设备及计算机可读存储介质 | |
CN109215665A (zh) | 一种基于3d卷积神经网络的声纹识别方法 | |
CN102324232A (zh) | 基于高斯混合模型的声纹识别方法及*** | |
CN107731233A (zh) | 一种基于rnn的声纹识别方法 | |
CN109473105A (zh) | 与文本无关的声纹验证方法、装置和计算机设备 | |
CN108985776A (zh) | 基于多重信息验证的***安全监测方法 | |
CN113129867B (zh) | 语音识别模型的训练方法、语音识别方法、装置和设备 | |
CN108735200A (zh) | 一种说话人自动标注方法 | |
CN109473102A (zh) | 一种机器人秘书智能会议记录方法及*** | |
CN113744742B (zh) | 对话场景下的角色识别方法、装置和*** | |
CN110136726A (zh) | 一种语音性别的估计方法、装置、***及存储介质 | |
Sukhwal et al. | Comparative study of different classifiers based speaker recognition system using modified MFCC for noisy environment | |
Charisma et al. | Speaker recognition using mel-frequency cepstrum coefficients and sum square error | |
Pawar et al. | Speaker Identification using Neural Networks. | |
CN111091840A (zh) | 一种建立性别识别模型的方法及性别识别方法 | |
KR100779242B1 (ko) | 음성 인식/화자 인식 통합 시스템에서의 화자 인식 방법 | |
CN110556114B (zh) | 基于注意力机制的通话人识别方法及装置 | |
Koolagudi et al. | Speaker recognition in the case of emotional environment using transformation of speech features | |
CN106971712A (zh) | 一种自适应的快速声纹识别方法及*** | |
CN106971735A (zh) | 一种定期更新缓存中训练语句的声纹识别的方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |