CN111261171A - 一种可定制文本的声纹验证方法及*** - Google Patents
一种可定制文本的声纹验证方法及*** Download PDFInfo
- Publication number
- CN111261171A CN111261171A CN202010055493.4A CN202010055493A CN111261171A CN 111261171 A CN111261171 A CN 111261171A CN 202010055493 A CN202010055493 A CN 202010055493A CN 111261171 A CN111261171 A CN 111261171A
- Authority
- CN
- China
- Prior art keywords
- voiceprint
- user
- text
- content
- verification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012795 verification Methods 0.000 title claims abstract description 32
- 238000000034 method Methods 0.000 title claims abstract description 16
- 230000002452 interceptive effect Effects 0.000 claims abstract description 7
- 230000008901 benefit Effects 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 241000207961 Sesamum Species 0.000 description 1
- 235000003434 Sesamum indicum Nutrition 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种可定制文本的声纹验证方法,所述方法包括:S1,通过在交互界面上显示已定制文本的内容以提示用户进行朗读,所述定制文本为用户自定义内容;S2,并将采集到的朗读音频中的声纹与数据库中的声纹模型进行比对分析;S3,当文本内容正确且采集到的声纹与数据库中的声纹模型一致时判定验证通过。本发明不仅提高用户体验,满足用户个性化定制的需求;另外还提升产品多样性,利于产品推广。
Description
技术领域
本发明涉及声纹识别技术领域,尤其涉及一种可定制文本的声纹验证方法及***。
背景技术
随着人工智能时代的到来,越来越多的领域开始使用人工智能来辅助办公提高生产力。其中声纹识别就是人工智能领域不可或缺的一部分。声纹识别在银行的应用范围也是十分广泛,可以运用在呼叫中心作为用户的身份验证以及搭建声纹黑名单。其实固定文本识别,则是声纹识别中关键的一部分。目前固定文本识别,只能做到固定某一个词,或某一句话来做语音识别。类似于市面上已经存在的“小爱同学”等唤醒词,若说错则会导致验证失败。但这样的技术会导致用户体验过于枯燥,无法为用户提供个性化的定制。当用户是用固定文本识别时,所有用户都必须使用服务提供方所设置的关键词。如:“小爱同学”,“芝麻开门”等之类的词语或语句。当声纹识别***接收到用户语音时,将会同时判断声纹及内容。当且仅当两者同时通过时,声纹识别***才会让用户通过。
因此,目前的固定文本识别技术,在无意间抹杀了用户选择的权力,无法为用户提供个性化的定制需求。从而降低用户对产品的使用体验。
发明内容
本发明所要解决的技术问题是针对上述现有技术的不足提供一种可定制文本的声纹验证方法及***,从而可以更好的满足用户个性化的定制需求,进而提高对产品的使用体验感。
为实现上述目的,本发明提供一种可定制文本的声纹验证方法,所述方法包括:
S1,通过在交互界面上显示已定制文本的内容以提示用户进行朗读,所述定制文本为用户自定义内容;
S2,并将采集到的朗读音频中的声纹与数据库中的声纹模型进行比对分析;
S3,当文本内容正确且采集到的声纹与数据库中的声纹模型一致时判定验证通过。
优选的,所述用户自定义内容为用户根据需要所设计的词语或语句。
优选的,所述声纹模型存入数据库时与对应的用户自定义内容建立联系。
优选的,所述声纹模型为通过提取用户的语音声纹特征为其建立的声纹模型。
为实现上述目的,本发明还提供一种可定制文本的声纹验证***,所述***包括:
提示单元,通过在交互界面上显示已定制文本的内容以提示用户进行朗读,所述定制文本为用户自定义内容;
比对单元,并将采集到的朗读音频中的声纹与数据库中的声纹模型进行比对分析;
验证单元,当文本内容正确且采集到的声纹与数据库中的声纹模型一致时判定验证通过。
优选的,所述用户自定义内容为用户根据需要所设计的词语或语句。
优选的,所述声纹模型存入数据库时与对应的用户自定义内容建立联系。
优选的,所述声纹模型为通过提取用户的语音声纹特征为其建立的声纹模型。
通过本方案可以满足用户的个性化需求,该方案在用户第一次声纹入库时,会在用户交互界面上让用户输入自己想要定制的词语或语句。用户输入后,依照自己输入的内容朗诵。在声纹识别***接收到用户的语音之后,会进行内容识别。判断用户朗诵的内容是否为用户输入内容。如果两者一致则将声纹入库,并将该语句记录。在用户使用阶段,***会将记录好的语句,呈现在用户交互界面上,以提示用户。当用户用声纹进行验证的时候,声纹识别***将会同时进行内容识别及声纹识别,当两者全部通过时则验证通过。因此,本发明的具有以下优点:
1、提高用户体验,满足用户个性化定制的需求;
2、提升产品多样性,利于产品推广。
附图说明
图1为本发明一实施例提供的可定制文本的声纹验证方法的流程图;
图2为本发明一实施例提供的可定制文本的声纹验证***的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合实施例详细阐述本发明的内容。
参照图1所示,为本发明一实施例提供的一种可定制文本的声纹验证方法的流程图。所述方法包括:
S1,通过在交互界面上显示已定制文本的内容以提示用户进行朗读,所述定制文本为用户自定义内容;
S2,并将采集到的朗读音频中的声纹与数据库中的声纹模型进行比对分析;
S3,当文本内容正确且采集到的声纹与数据库中的声纹模型一致时判定验证通过。
优选的,所述用户自定义内容为用户根据需要所设计的词语或语句。
优选的,所述声纹模型存入数据库时与对应的用户自定义内容建立联系。
优选的,所述声纹模型为通过提取用户的语音声纹特征为其建立的声纹模型。
本方案解决了当前固定文本识别,用户无法自由定制文本的问题。用户个性化体验作为提升用户体验最为关键的一部分,在固定文本识别中被忽视。声纹识别之所以需用固定文本,是因为声纹识别在短语音自由文本的状态下,识别准确率不高。固定文本通过固定住语音的内容,从而提高识别率。这个识别率的提升主要依赖于,用户在声纹建模入库时所说的内容与用户之后用来验证身份所有的内容一致。因此声纹识别***无需剔除音频中的语义信息,直接进行声纹特征提取,从而提高识别准确率。本方案维持了短语音声纹识别的准确性,同时又满足了用户的个性化需求。
另外,本发明还提供一种可定制文本的声纹验证***,参照图2所示,为本发明一实施例提供的可定制文本的声纹验证***的结构框图。
所述***包括:
提示单元,通过在交互界面上显示已定制文本的内容以提示用户进行朗读,所述定制文本为用户自定义内容;
比对单元,并将采集到的朗读音频中的声纹与数据库中的声纹模型进行比对分析;
验证单元,当文本内容正确且采集到的声纹与数据库中的声纹模型一致时判定验证通过。
优选的,所述用户自定义内容为用户根据需要所设计的词语或语句。
优选的,所述声纹模型存入数据库时与对应的用户自定义内容建立联系。
优选的,所述声纹模型为通过提取用户的语音声纹特征为其建立的声纹模型。
在用户声纹建模入库阶段,用户按照自己的需求,设置词语或语句,并念诵词语或语句的内容。在声纹识别***接收到用户的音频之后,先进行内容识别,并将识别出的内容与用户输入的文本对应。如果文本和识别出的内容一致,对此段音频进行特征提取(即建模)并将其入库,并将文本记录并与对应的声纹模型建立联系。
在用户使用声纹识别***验证声纹时,声纹识别***将会在用户交互界面上显示用户声纹建模时所输入的文本作为提示。此时用户可以念诵自己个性化定制的文本。当声纹识别***接收到用户音频时,同时进行内容识别以及声纹识别。当两者同时通过时,则声纹识别***则会判定是用户本人。
本发明即保留了固定文本提高声纹识别***识别准确率的优点,同时又满足了用户个性化定制自己文本的需求。通过本发明能显著提高用户对产品的体验,满足用户的个性化需求。同时产生趣味性,用户可以根据个人的想象力,定制一些有意思的语句,这为前提产品的推广起到了宣传的作用。
上述实施例中的实施方案可以进一步组合或者替换,且实施例仅仅是对本发明的优选实施例进行描述,并非对本发明的构思和范围进行限定,在不脱离本发明设计思想的前提下,本领域中专业技术人员对本发明的技术方案作出的各种变化和改进,均属于本发明的保护范围。
Claims (8)
1.一种可定制文本的声纹验证方法,其特征在于,所述方法包括:
S1,通过在交互界面上显示已定制文本的内容以提示用户进行朗读,所述定制文本为用户自定义内容;
S2,并将采集到的朗读音频中的声纹与数据库中的声纹模型进行比对分析;
S3,当文本内容正确且采集到的声纹与数据库中的声纹模型一致时判定验证通过。
2.根据权利要求1所述的一种可定制文本的声纹验证方法,其特征在于,所述用户自定义内容为用户根据需要所设计的词语或语句。
3.根据权利要求1或2任一所述的一种可定制文本的声纹验证方法,其特征在于,所述声纹模型存入数据库时与对应的用户自定义内容建立联系。
4.根据权利要求1所述的一种可定制文本的声纹验证方法,其特征在于,所述声纹模型为通过提取用户的语音声纹特征为其建立的声纹模型。
5.一种可定制文本的声纹验证***,其特征在于,所述***包括:
提示单元,通过在交互界面上显示已定制文本的内容以提示用户进行朗读,所述定制文本为用户自定义内容;
比对单元,并将采集到的朗读音频中的声纹与数据库中的声纹模型进行比对分析;
验证单元,当文本内容正确且采集到的声纹与数据库中的声纹模型一致时判定验证通过。
6.根据权利要求5所述的一种可定制文本的声纹验证***,其特征在于,所述用户自定义内容为用户根据需要所设计的词语或语句。
7.根据权利要求5或6任一所述的一种可定制文本的声纹验证***,其特征在于,所述声纹模型存入数据库时与对应的用户自定义内容建立联系。
8.根据权利要求5所述的一种可定制文本的声纹验证***,其特征在于,所述声纹模型为通过提取用户的语音声纹特征为其建立的声纹模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010055493.4A CN111261171A (zh) | 2020-01-17 | 2020-01-17 | 一种可定制文本的声纹验证方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010055493.4A CN111261171A (zh) | 2020-01-17 | 2020-01-17 | 一种可定制文本的声纹验证方法及*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111261171A true CN111261171A (zh) | 2020-06-09 |
Family
ID=70947134
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010055493.4A Pending CN111261171A (zh) | 2020-01-17 | 2020-01-17 | 一种可定制文本的声纹验证方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111261171A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103646646A (zh) * | 2013-11-27 | 2014-03-19 | 联想(北京)有限公司 | 一种语音控制方法及电子设备 |
CN103685185A (zh) * | 2012-09-14 | 2014-03-26 | 上海掌门科技有限公司 | 移动设备声纹注册、认证的方法及*** |
AU2013315343A1 (en) * | 2012-09-11 | 2015-04-30 | Auraya Pty Ltd | Voice authentication system and method |
CN105575395A (zh) * | 2014-10-14 | 2016-05-11 | 中兴通讯股份有限公司 | 语音唤醒方法及装置、终端及其处理方法 |
CN108735209A (zh) * | 2018-04-28 | 2018-11-02 | 广东美的制冷设备有限公司 | 唤醒词绑定方法、智能设备及存储介质 |
-
2020
- 2020-01-17 CN CN202010055493.4A patent/CN111261171A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2013315343A1 (en) * | 2012-09-11 | 2015-04-30 | Auraya Pty Ltd | Voice authentication system and method |
CN103685185A (zh) * | 2012-09-14 | 2014-03-26 | 上海掌门科技有限公司 | 移动设备声纹注册、认证的方法及*** |
CN103646646A (zh) * | 2013-11-27 | 2014-03-19 | 联想(北京)有限公司 | 一种语音控制方法及电子设备 |
CN105575395A (zh) * | 2014-10-14 | 2016-05-11 | 中兴通讯股份有限公司 | 语音唤醒方法及装置、终端及其处理方法 |
CN108735209A (zh) * | 2018-04-28 | 2018-11-02 | 广东美的制冷设备有限公司 | 唤醒词绑定方法、智能设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6394709B2 (ja) | 話者識別装置および話者識別用の登録音声の特徴量登録方法 | |
Segal | Narrative comprehension and the role of deictic shift theory | |
EP2109097B1 (en) | A method for personalization of a service | |
US9070363B2 (en) | Speech translation with back-channeling cues | |
CN110689877A (zh) | 一种语音结束端点检测方法及装置 | |
US20070055520A1 (en) | Incorporation of speech engine training into interactive user tutorial | |
CN110517668B (zh) | 一种中英文混合语音识别***及方法 | |
CN109543021B (zh) | 一种面向智能机器人的故事数据处理方法及*** | |
Karat et al. | Conversational interface technologies | |
CN106910499A (zh) | 应用程序的控制方法及装置 | |
CN112309406A (zh) | 声纹注册方法、装置和计算机可读存储介质 | |
Shahin | Studying and enhancing talking condition recognition in stressful and emotional talking environments based on HMMs, CHMM2s and SPHMMs | |
CN109102807A (zh) | 个性化语音数据库创建***、语音识别控制***与终端 | |
Deka et al. | Speech corpora of under resourced languages of north-east india | |
CN115019787B (zh) | 一种交互式同音异义词消歧方法、***、电子设备和存储介质 | |
CN111261171A (zh) | 一种可定制文本的声纹验证方法及*** | |
Gilbert et al. | Intelligent virtual agents for contact center automation | |
WO2004034355A2 (en) | System and methods for comparing speech elements | |
CN109035896A (zh) | 一种口语训练方法及学习设备 | |
CN113160821A (zh) | 一种基于语音识别的控制方法及装置 | |
CN101304457A (zh) | 一种基于语音电话实现自动口语训练的方法与装置 | |
CN108831473A (zh) | 一种音频处理方法及装置 | |
WO2023100960A1 (ja) | 認証装置および認証方法 | |
Hura | Voice user interfaces | |
WO2023100905A1 (ja) | 認証装置および認証方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200609 |
|
RJ01 | Rejection of invention patent application after publication |