CN102831890A - 一种对文本无关的声纹进行识别的方法 - Google Patents
一种对文本无关的声纹进行识别的方法 Download PDFInfo
- Publication number
- CN102831890A CN102831890A CN2011101605722A CN201110160572A CN102831890A CN 102831890 A CN102831890 A CN 102831890A CN 2011101605722 A CN2011101605722 A CN 2011101605722A CN 201110160572 A CN201110160572 A CN 201110160572A CN 102831890 A CN102831890 A CN 102831890A
- Authority
- CN
- China
- Prior art keywords
- guest
- acoustic models
- acoustic model
- eigenwert
- phonetic feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明发明的一种对文本无关的声纹进行识别的方法,属于语音信号处理领域,涉及对文本无关的声纹进行识别的方法,首先建立针对用户集的全部声学模型:使用***音频采集设备对用户的说话人语音信号进行采集,并为该说话人建立声学模型,并将该模型存储在语音特征库中;然后针对当前待识别用户进行模型匹配和识别:使用***音频采集设备采集当前说话人的语音信号,为当前说话人建立声学模型,将当前说话人的声学模型与语音特征库中的全部声学模型进行匹配,返回计算所的最为匹配的模型编号,以此确定所述待识别人的具体身份。方法识别效率高,结果准确。
Description
技术领域
本发明属于语音信号处理领域,涉及于对文本无关的声纹进行识别的方法。
背景技术
由于每个人的发音器官不同,所发出来的声音极其音调各不相同,因此声纹作为基本特征来实现人的身份识别具有实际的不可替代性和稳定性。从声纹识别的使用场合来看,需要判别的声音其来源基本分为3中情况,即文本提示型、文本相关型和文本无关型。文本提示型和文本相关型都需要用户根据规定的内容发音,并根据发音的内容建立模型进行匹配,虽然这样可以使得匹配效果较好,但需要用户完全配合,灵活性和容错性欠佳;而对于文本无关型则不规定说话人的声音内容,只要***中录有说话人的声音就能够识别是否为该说话人,因此对文本无关的声纹进行识别的技术含量要求比较高,它不仅仅需要解决匹配判断问题,还需要预先提取说话人的语音特征,才能进行判断。
发明内容
本发明发明的一种对文本无关的声纹进行识别的方法,包括以下步骤:
输入待识别人的语音信号步骤;
对所述输入的语音信号进行预处理步骤;
对所述输入的语音信号进行特征值提取步骤;
根据所述提取的特征值建立待识别人的声学模型步骤;
将所述声学模型与语音特征库中的全部声学模型进行匹配步骤;
返回计算所得最为匹配的模型编号,以此确定所述待识别的具体身份步骤;
在所述声学模型与语音特征库中的全部声学模型进行匹配步骤中,所述的全部声学模型的建立是采用预先收录用户客人的语音信号建立的,建立声学模型的步骤为:
采集所述客人的连续语音作为输入信号步骤;
对所述客人的连续语音信号进行预处理步骤;
对所述客人的连续语音信号进行特征值提取步骤;
对所提取的客人的连续语音信号的特征值建立声学模型步骤;
将所述客人的声学模型存储在语音特征库中。
本发明发明的对文本无关的声纹进行识别的方法识别效率高,结果准确。
附图说明
下面结合附图对本发明的具体实施方案做进一步说明。
图1为本发明发明的一种对文本无关的声纹进行识别的方法中的建立针对用户集得全部声学模型步骤流程图。
图2为本发明发明的一种对文本无关的声纹进行识别的方法中的针对当前待识别用户进行模型匹配和识别的步骤流程图。
具体实施方案
本发明发明的一种对文本无关的声纹进行识别的方法的步骤流程图如图1所示,包含以下步骤:
首先建立针对用户集的全部声学模型,步骤流程图如图1所示:通过***音频采集设备对用户的说话人语音信号进行采集;对采集到得连续语音信号进行预处理;对采集到的连续语音信号进行特征值提取;使用提取到的特征值对建立该说话人的声学模型;将该声学模型存储在语音特征库中;
然后针对当前待识别用户进行模型匹配和识别,步骤流程图如图1所示:利用***音频采集设备采集说话人的语音信号;对采集到得连续语音信号进行预处理;对采集到的连续语音信号进行特征值提取;使用提取到的特征值对建立当前说话人的声学模型;将当前说话人的声学模型与语音特征库中的全部声学模型进行匹配;返回计算所得最为匹配的模型编号,以此确定所述待识别人的具体身份。
Claims (1)
1.一种对文本无关的声纹进行识别的方法,其特征在于,包括以下步骤:
输入待识别人的语音信号步骤;
对所述输入的语音信号进行预处理步骤;
对所述输入的语音信号进行特征值提取步骤;
根据所述提取的特征值建立待识别人的声学模型步骤;
将所述声学模型与语音特征库中的全部声学模型进行匹配步骤;
返回计算所得最为匹配的模型编号,以此确定所述待识别的具体身份步骤;
在所述声学模型与语音特征库中的全部声学模型进行匹配步骤中,所述的全部声学模型的建立是采用预先收录用户客人的语音信号建立的,建立声学模型的步骤为:
采集所述客人的连续语音作为输入信号步骤;
对所述客人的连续语音信号进行预处理步骤;
对所述客人的连续语音信号进行特征值提取步骤;
对所提取的客人的连续语音信号的特征值建立声学模型步骤;
将所述客人的声学模型存储在语音特征库中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011101605722A CN102831890A (zh) | 2011-06-15 | 2011-06-15 | 一种对文本无关的声纹进行识别的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011101605722A CN102831890A (zh) | 2011-06-15 | 2011-06-15 | 一种对文本无关的声纹进行识别的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102831890A true CN102831890A (zh) | 2012-12-19 |
Family
ID=47334989
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011101605722A Pending CN102831890A (zh) | 2011-06-15 | 2011-06-15 | 一种对文本无关的声纹进行识别的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102831890A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103700371A (zh) * | 2013-12-13 | 2014-04-02 | 江苏大学 | 一种基于声纹识别的来电身份识别***及其识别方法 |
CN104268279A (zh) * | 2014-10-16 | 2015-01-07 | 魔方天空科技(北京)有限公司 | 语料数据的查询方法和装置 |
CN106296302A (zh) * | 2016-08-18 | 2017-01-04 | 中国联合网络通信集团有限公司 | 一种语音数据处理方法、装置、用具和*** |
CN110299150A (zh) * | 2019-06-24 | 2019-10-01 | 中国科学院计算技术研究所 | 一种实时语音说话人分离方法及*** |
CN111402898A (zh) * | 2020-03-17 | 2020-07-10 | 北京远鉴信息技术有限公司 | 音频信号处理方法、装置、设备及存储介质 |
CN111933157A (zh) * | 2020-08-16 | 2020-11-13 | 云知声智能科技股份有限公司 | 一种声纹识别方法和设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6122615A (en) * | 1997-11-19 | 2000-09-19 | Fujitsu Limited | Speech recognizer using speaker categorization for automatic reevaluation of previously-recognized speech data |
CN1547191A (zh) * | 2003-12-12 | 2004-11-17 | 北京大学 | 结合语义和声纹信息的说话人身份确认*** |
CN101540170A (zh) * | 2008-03-19 | 2009-09-23 | 中国科学院半导体研究所 | 一种基于仿生模式识别的声纹识别方法 |
CN101923855A (zh) * | 2009-06-17 | 2010-12-22 | 复旦大学 | 文本无关的声纹识别*** |
-
2011
- 2011-06-15 CN CN2011101605722A patent/CN102831890A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6122615A (en) * | 1997-11-19 | 2000-09-19 | Fujitsu Limited | Speech recognizer using speaker categorization for automatic reevaluation of previously-recognized speech data |
CN1547191A (zh) * | 2003-12-12 | 2004-11-17 | 北京大学 | 结合语义和声纹信息的说话人身份确认*** |
CN101540170A (zh) * | 2008-03-19 | 2009-09-23 | 中国科学院半导体研究所 | 一种基于仿生模式识别的声纹识别方法 |
CN101923855A (zh) * | 2009-06-17 | 2010-12-22 | 复旦大学 | 文本无关的声纹识别*** |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103700371A (zh) * | 2013-12-13 | 2014-04-02 | 江苏大学 | 一种基于声纹识别的来电身份识别***及其识别方法 |
CN103700371B (zh) * | 2013-12-13 | 2017-10-20 | 江苏大学 | 一种基于声纹识别的来电身份识别***及其识别方法 |
CN104268279A (zh) * | 2014-10-16 | 2015-01-07 | 魔方天空科技(北京)有限公司 | 语料数据的查询方法和装置 |
CN104268279B (zh) * | 2014-10-16 | 2018-04-20 | 魔方天空科技(北京)有限公司 | 语料数据的查询方法和装置 |
CN106296302A (zh) * | 2016-08-18 | 2017-01-04 | 中国联合网络通信集团有限公司 | 一种语音数据处理方法、装置、用具和*** |
CN106296302B (zh) * | 2016-08-18 | 2019-07-09 | 中国联合网络通信集团有限公司 | 一种语音数据处理方法、装置、用具和*** |
CN110299150A (zh) * | 2019-06-24 | 2019-10-01 | 中国科学院计算技术研究所 | 一种实时语音说话人分离方法及*** |
CN111402898A (zh) * | 2020-03-17 | 2020-07-10 | 北京远鉴信息技术有限公司 | 音频信号处理方法、装置、设备及存储介质 |
CN111402898B (zh) * | 2020-03-17 | 2023-07-25 | 北京远鉴信息技术有限公司 | 音频信号处理方法、装置、设备及存储介质 |
CN111933157A (zh) * | 2020-08-16 | 2020-11-13 | 云知声智能科技股份有限公司 | 一种声纹识别方法和设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105405439B (zh) | 语音播放方法及装置 | |
WO2020211354A1 (zh) | 基于说话内容的说话者身份识别方法、装置及存储介质 | |
CN103578470B (zh) | 一种电话录音数据的处理方法及*** | |
CN102831890A (zh) | 一种对文本无关的声纹进行识别的方法 | |
CN102332262B (zh) | 基于音频特征的歌曲智能识别方法 | |
WO2019137066A1 (zh) | 电器控制方法及装置 | |
CN109215665A (zh) | 一种基于3d卷积神经网络的声纹识别方法 | |
CN106504754A (zh) | 一种根据音频输出的实时字幕生成方法 | |
CN104036774A (zh) | 藏语方言识别方法及*** | |
CN102708867A (zh) | 一种基于声纹和语音的防录音假冒身份识别方法及*** | |
WO2020155490A1 (zh) | 基于语音分析的管理音乐的方法、装置和计算机设备 | |
CN104538034A (zh) | 一种语音识别方法及*** | |
CN103310788A (zh) | 一种语音信息识别方法及*** | |
CN102404278A (zh) | 一种基于声纹识别的点歌***及其应用方法 | |
CN101923855A (zh) | 文本无关的声纹识别*** | |
CN103730112B (zh) | 语音多信道模拟与采集方法 | |
CN109378006A (zh) | 一种跨设备声纹识别方法及*** | |
CN109817220A (zh) | 语音识别方法、装置及*** | |
CN103794207A (zh) | 一种双模语音身份识别方法 | |
CN104732969A (zh) | 语音处理***及语音处理方法 | |
TWI413106B (zh) | 電子記錄裝置及方法 | |
CN104992712A (zh) | 能识别音乐自动成谱的方法 | |
CN109935226A (zh) | 一种基于深度神经网络的远场语音识别增强***及方法 | |
CN109410956A (zh) | 一种音频数据的对象识别方法、装置、设备及存储介质 | |
CN102411929A (zh) | 声纹认证***及其实现方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20121219 |