CN109963022A - 一种基于soundex算法的语音电话本找人方法及流程 - Google Patents
一种基于soundex算法的语音电话本找人方法及流程 Download PDFInfo
- Publication number
- CN109963022A CN109963022A CN201811608184.4A CN201811608184A CN109963022A CN 109963022 A CN109963022 A CN 109963022A CN 201811608184 A CN201811608184 A CN 201811608184A CN 109963022 A CN109963022 A CN 109963022A
- Authority
- CN
- China
- Prior art keywords
- code
- soundex
- people
- syllable
- voice call
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
- H04M1/27—Devices whereby a plurality of signals may be stored simultaneously
- H04M1/271—Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
- H04M1/27—Devices whereby a plurality of signals may be stored simultaneously
- H04M1/274—Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc
- H04M1/2745—Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips
- H04M1/27467—Methods of retrieving data
- H04M1/2748—Methods of retrieving data by matching character strings
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/74—Details of telephonic subscriber devices with voice recognition means
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种基于soundex算法的语音电话本找人方法及流程,包括步骤:S1、将电话本的汉字人名以soundex算法进行音码编码;S2、将soundex编码后的人名音码及其对应的电话本联系人信息,包括:真实人名、联系电话、邮箱等信息存储在语音电话本中心数据库;S3、将用户通过语音说话找人的语音流信息传给ASR引擎进行语音识别;S4、将ASR引擎语音识别结果以soundex算法进行音码编码;S5、将该音码在语音电话本中心数据库中以相似度算法搜索及比较,反馈匹配的结果。该基于soundex算法的语音电话本找人方法及流程,通过soundex算法把电话本的汉字人名进行音码编码,用户在IVR渠道说出要找人名的语音流传给ASR引擎进行语音识别,提高了语音找人效率,实现了使用方便的目的。
Description
技术领域
本发明涉及soundex算法及相似度计算技术领域,具体为一种基于 soundex算法的语音电话本找人方法及流程。
背景技术
传统语音电话本应用均是基于ASR引擎的语音识别文本结果与电话本人名进行文字完全匹配或模糊匹配处理,这在很大程度上依赖于ASR引擎能否准确翻译出人名汉字,但事实上中国汉字存在同音字,特别是在汉字人名范畴而言,同音字及生僻字的情况更普遍,而且用户在语音说话时普通话发音也是千差万别,这样会导致ASR引擎语音识别出来的汉字结果很难与目标电话本的汉字人名完全一致,在这样的结果上用字符串的相似度算法以是无法较为准确地匹配搜索出目标人名。
而基于soundex算法则与传统的基于文字字符串相似度比较算法不太相同,该算法的特点是,它所关注的问题并非两个字符串文本上的相似程度,而是发音的相似程度。首先,该算法会将两个字符串分别通过一定的hash算法转换成一个hash值,该值由4个字节的字符构成。进行转化的hash算法并非随机选取,而是利用了该汉字文字的读音近似值。当获得了两个字符串的读音上的hash值之后,该算法再对两个hash的相似度进行计算,便可以得出输入字符串的读音相似度。
发明人考虑利用soundex算法的发音相似度比较算法特点,结合对汉字发音特点,对汉字韵母、声母和声调进行编码,对编码结果进行可计算的相似度比较,从而提出一种可提高语音电话本应用的方法和流程。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种基于soundex算法的语音电话本找人方法及流程,具备语音电话本找人准确率高和使用方便等优点,解决了传统语音电话本找人准确率不高的问题。
(二)技术方案
为实现上述语音电话本找人准确率高的目的,本发明提供如下技术方案:
一种基于soundex算法的语音电话本找人方法及流程,包括步骤:
S1、将电话本的汉字人名以soundex算法进行音码编码;
S2、将soundex编码后的人名音码及其对应的电话本联系人信息,包括:真实人名、联系电话、邮箱等信息存储在语音电话本中心数据库;
S3、将用户通过语音说话找人的语音流信息传给ASR引擎进行语音识别;
S4、将ASR引擎语音识别结果以soundex算法进行音码编码;
S5、将该音码在语音电话本中心数据库中以相似度算法搜索及比较,反馈匹配的结果。
优选的,所述soundex算法的单汉字音码编码是一个4位字节长的可见字符编码,其中第1位是韵母编码位,第2位是声母编码位,第3位是一个补码编码位,补码编码位是对声母和韵母之间的辅音进行编码的结果,而第4 位是声调补码位。
优选的,所述soundex算法音码编码的韵母编码及声母编码是以有限编码表的方式进行对照翻译编码。
优选的,所述soundex算法音码编码结果相似度比较方法是对4位字节的音码每个位码进行权重标识,再对两个待比较相似度的音码编码每个位码的相等与否加权运算后得出两个音码编码的相似度结果,相似度结果值不超过1,不小于0,越接近1越相似。
(三)有益效果
与现有技术相比,本发明提供了一种基于soundex算法的语音电话本找人方法及流程,具备以下有益效果:
该基于soundex算法的语音电话本找人方法及流程,通过soundex算法把电话本的汉字人名进行音码编码,然后用户在语音电话本的IVR渠道说出要找人名的语音流传给ASR引擎进行语音识别,遍历语音电话本中心数据库,取得每一条联系人记录中的人名音码编码串,以本发明的相似度算法与所得到的用户说话内容音码编码串进行匹配,每一条联系人记录的人名音码编码串与用户说话内容音码编码串取用移动窗口方式对齐匹配,并记录下每一条联系人的最大相似度值,提高了语音找人效率,实现了使用方便的目的。
附图说明
图1为本发明提出的一种基于soundex算法的语音电话本找人方法及流程的流出示意图;
图2为本发明提出的一种基于soundex算法的语音电话本找人方法及流程的音码编码示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1与图2,一种基于soundex算法的语音电话本找人方法及流程, 包括步骤:
S1、将电话本的汉字人名以soundex算法进行音码编码;
S2、将soundex编码后的人名音码及其对应的电话本联系人信息,包括:真实人名、联系电话、邮箱等信息存储在语音电话本中心数据库;
S3、将用户通过语音说话找人的语音流信息传给ASR引擎进行语音识别;
S4、将ASR引擎语音识别结果以soundex算法进行音码编码;
S5、将该音码在语音电话本中心数据库中以相似度算法搜索及比较,反 馈匹配的结果,具体地,所述单汉字音码编码是一个4位字节长的可见字符 编码,分别是韵母编码位,声母编码位,辅音补码编码位,辅音补码编码位 是对声母和韵母之间的辅音进行编码的结果,事实上辅音也是一种韵母,另 一位是声调补码位。其中韵母、声母编码对照表如说明书附图图2所示。
对根据编码对照表所得的4位编码值按一定顺序组合成单汉字的音码编 码,音码编码结构如下表所示:
所述汉字人名每个单汉字音码编码组成汉字人名完整音码编码串,联合其对应的电话本联系人信息,包括:真实人名、联系电话、邮箱等信息存储在语音电话本中心数据库。
所述用户语音说话的ASR语音识别结果进行相同规则的汉字soundex算法音码编码,得出用户说话内容的音码编码串。
所述单汉字音码编码每一位进行权重标注以得出单汉字音码编码的相似 度计算过程。根据汉字的发音特点,第1位韵母占权重为0.4,第2位声母占 权重0.4,第3位辅音所占权重为0.1,而第4位补码所占权重为0.1,从而 得出该相似度计算公式如下式所示:
所述音码编码相似度比较算法对要校验的输入音码编码串及目标人名音码编码库以窗口移动方法进行逐条人名音码编码计算相似度值,以求出每条人名音码编码最大相似度值。还可以进一步地,根据语音电话本的应用场景,只对第1位韵母及第2位声母的音码进行二次hash值得出其音码编码的二次 hash编码,以支持模糊搜索。
进一步地,所述soundex算法的单汉字音码编码是一个4位字节长的可见字符编码,其中第1位是韵母编码位,第2位是声母编码位,第3位是一个补码编码位,补码编码位是对声母和韵母之间的辅音进行编码的结果,而第4位是声调补码位。
进一步地,所述soundex算法音码编码的韵母编码及声母编码是以有限编码表的方式进行对照翻译编码。
进一步地,所述soundex算法音码编码结果相似度比较方法是对4位字节的音码每个位码进行权重标识,再对两个待比较相似度的音码编码每个位码的相等与否加权运算后得出两个音码编码的相似度结果,相似度结果值不超过1,不小于0,越接近1越相似。
本发明方法的具体处理流程如下:
1、电话本用户在语音电话本管理台录入电话本联系人信息;
2、语音电话本应用后台将电话本用户所录入的联系人信息中的汉字人名以本发明的soundex算法对人名各个汉字进行音码编码;
3、语音电话本应用后台将联系人名汉字音码编码提取第1位韵母编码和第2位声母编码进行hash二次计算,得出hash编码串以支持后续可模糊搜索;
4、将实施步骤2、3中得出的音码编码串、hash编码串附加到联系人记录信息中并存储到语音电话本中心数据库;
5、将终端用户在语音电话本的IVR渠道说出要找人名的语音流传给ASR 引擎进行语音识别;
6、获取ASR引擎的语音识别结果,并对语音识别结果进行相同规则的soundex算法计算用户说话内容的音码编码串;
7、遍历语音电话本中心数据库,取得每一条联系人记录中的人名音码编码串,以本发明的相似度算法与所得到的用户说话内容音码编码串进行匹配;遍历时每一条联系人记录的人名音码编码串与用户说话内容音码编码串取用移动窗口方式对齐匹配,并记录下每一条联系人的最大相似度值;
8、根据业务需求返回遍历匹配相似度最大的前n条记录给终端用户;
9、如果匹配不到相关联系人记录,还可以以本发明的音码编码二次hash 算法计算出用户说话内容的音码编码二次hash值在语音电话本中进行模糊搜索,并反馈搜索结果给终端用户。
综上所述,该基于soundex算法的语音电话本找人方法及流程,通过 soundex算法把电话本的汉字人名进行音码编码,然后用户在语音电话本的 IVR渠道说出要找人名的语音流传给ASR引擎进行语音识别,遍历语音电话本中心数据库,取得每一条联系人记录中的人名音码编码串,以本发明的相似度算法与所得到的用户说话内容音码编码串进行匹配,每一条联系人记录的人名音码编码串与用户说话内容音码编码串取用移动窗口方式对齐匹配,并记录下每一条联系人的最大相似度值,提高了语音找人效率,实现了使用方便的目的。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (4)
1.一种基于soundex算法的语音电话本找人方法及流程,其特征在于:包括步骤:
S1、将电话本的汉字人名以soundex算法进行音码编码;
S2、将soundex编码后的人名音码及其对应的电话本联系人信息,包括:真实人名、联系电话、邮箱等信息存储在语音电话本中心数据库;
S3、将用户通过语音说话找人的语音流信息传给ASR引擎进行语音识别;
S4、将ASR引擎语音识别结果以soundex算法进行音码编码;
S5、将该音码在语音电话本中心数据库中以相似度算法搜索及比较,反馈匹配的结果。
2.根据权利要求1所述的一种基于soundex算法的语音电话本找人方法及流程,其特征在于:
所述soundex算法的单汉字音码编码是一个4位字节长的可见字符编码,其中第1位是韵母编码位,第2位是声母编码位,第3位是一个补码编码位,补码编码位是对声母和韵母之间的辅音进行编码的结果,而第4位是声调补码位。
3.根据权利要求2所述的一种基于soundex算法的语音电话本找人方法及流程,其特征在于:
所述soundex算法音码编码的韵母编码及声母编码是以有限编码表的方式进行对照翻译编码。
4.根据权利要求3所述的一种基于soundex算法的语音电话本找人方法及流程,其特征在于:
所述soundex算法音码编码结果相似度比较方法是对4位字节的音码每个位码进行权重标识,再对两个待比较相似度的音码编码每个位码的相等与否加权运算后得出两个音码编码的相似度结果,相似度结果值不超过1,不小于0,越接近1越相似。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811608184.4A CN109963022A (zh) | 2018-12-27 | 2018-12-27 | 一种基于soundex算法的语音电话本找人方法及流程 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811608184.4A CN109963022A (zh) | 2018-12-27 | 2018-12-27 | 一种基于soundex算法的语音电话本找人方法及流程 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109963022A true CN109963022A (zh) | 2019-07-02 |
Family
ID=67023422
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811608184.4A Pending CN109963022A (zh) | 2018-12-27 | 2018-12-27 | 一种基于soundex算法的语音电话本找人方法及流程 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109963022A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111445903A (zh) * | 2020-03-27 | 2020-07-24 | 中国工商银行股份有限公司 | 企业名称识别方法及装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102298582A (zh) * | 2010-06-23 | 2011-12-28 | 商业对象软件有限公司 | 数据搜索和匹配方法和*** |
CN103456297A (zh) * | 2012-05-29 | 2013-12-18 | ***通信集团公司 | 一种语音识别匹配的方法和设备 |
CN103970798A (zh) * | 2013-02-04 | 2014-08-06 | 商业对象软件有限公司 | 数据的搜索和匹配 |
CN104238991A (zh) * | 2013-06-21 | 2014-12-24 | 腾讯科技(深圳)有限公司 | 语音输入匹配方法及装置 |
CN104272223A (zh) * | 2012-02-28 | 2015-01-07 | 谷歌公司 | 用于将输入文本从第一字符集音译到第二字符集的技术 |
CN107016994A (zh) * | 2016-01-27 | 2017-08-04 | 阿里巴巴集团控股有限公司 | 语音识别的方法及装置 |
CN107707745A (zh) * | 2017-09-25 | 2018-02-16 | 百度在线网络技术(北京)有限公司 | 用于提取信息的方法和装置 |
CN108874872A (zh) * | 2018-04-26 | 2018-11-23 | 深圳市艾塔文化科技有限公司 | 一种基于拼音的语音识别字符串处理比对方法 |
-
2018
- 2018-12-27 CN CN201811608184.4A patent/CN109963022A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102298582A (zh) * | 2010-06-23 | 2011-12-28 | 商业对象软件有限公司 | 数据搜索和匹配方法和*** |
CN104272223A (zh) * | 2012-02-28 | 2015-01-07 | 谷歌公司 | 用于将输入文本从第一字符集音译到第二字符集的技术 |
CN103456297A (zh) * | 2012-05-29 | 2013-12-18 | ***通信集团公司 | 一种语音识别匹配的方法和设备 |
CN103970798A (zh) * | 2013-02-04 | 2014-08-06 | 商业对象软件有限公司 | 数据的搜索和匹配 |
CN104238991A (zh) * | 2013-06-21 | 2014-12-24 | 腾讯科技(深圳)有限公司 | 语音输入匹配方法及装置 |
CN107016994A (zh) * | 2016-01-27 | 2017-08-04 | 阿里巴巴集团控股有限公司 | 语音识别的方法及装置 |
CN107707745A (zh) * | 2017-09-25 | 2018-02-16 | 百度在线网络技术(北京)有限公司 | 用于提取信息的方法和装置 |
CN108874872A (zh) * | 2018-04-26 | 2018-11-23 | 深圳市艾塔文化科技有限公司 | 一种基于拼音的语音识别字符串处理比对方法 |
Non-Patent Citations (1)
Title |
---|
马立东: ""Soundex语音匹配算法综述"", 《现代计算机(专业版)》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111445903A (zh) * | 2020-03-27 | 2020-07-24 | 中国工商银行股份有限公司 | 企业名称识别方法及装置 |
CN111445903B (zh) * | 2020-03-27 | 2023-09-12 | 中国工商银行股份有限公司 | 企业名称识别方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10216725B2 (en) | Integration of domain information into state transitions of a finite state transducer for natural language processing | |
US8165877B2 (en) | Confidence measure generation for speech related searching | |
US9978364B2 (en) | Pronunciation accuracy in speech recognition | |
US20060265222A1 (en) | Method and apparatus for indexing speech | |
CN106598939A (zh) | 一种文本纠错方法及装置、服务器、存储介质 | |
CN102122298A (zh) | 一种中文相似性匹配方法 | |
KR20080069990A (ko) | 음성 세그먼트 색인 및 검색 방법과 컴퓨터 실행 가능명령어를 갖는 컴퓨터 판독 가능 매체 | |
WO2002080139A3 (en) | Method and apparatus for voice dictation and document production | |
CN101415259A (zh) | 嵌入式设备上基于双语语音查询的信息检索***及方法 | |
CN110941720B (zh) | 一种基于知识库的特定人员信息纠错方法 | |
CN103578471A (zh) | 语音辨识方法及其电子装置 | |
CN111462748B (zh) | 语音识别处理方法、装置、电子设备及存储介质 | |
CN102760436A (zh) | 一种语音词库筛选方法 | |
WO2016119604A1 (zh) | 一种语音信息搜索方法、装置及服务器 | |
CN106168954B (zh) | 一种基于编辑距离的负面信息模式模糊匹配方法 | |
CN103885949A (zh) | 一种基于歌词的歌曲检索***及其检索方法 | |
WO2010075015A2 (en) | Assigning an indexing weight to a search term | |
WO2023124648A1 (zh) | 一种文本纪要生成方法、装置、设备及存储介质 | |
CN106980620A (zh) | 一种对中文字串进行匹配的方法及装置 | |
WO2020185407A1 (en) | Characterizing accuracy of ensemble models for automatic speech recognition | |
Nishimura et al. | Automatic n-gram language model creation from web resources | |
CN109963022A (zh) | 一种基于soundex算法的语音电话本找人方法及流程 | |
Ondel et al. | Bayesian phonotactic language model for acoustic unit discovery | |
CN1753083B (zh) | 语音标记方法、***及基于语音标记的语音识别方法和*** | |
CN115831117A (zh) | 实体识别方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190702 |
|
RJ01 | Rejection of invention patent application after publication |