CN109963022A

CN109963022A - 一种基于soundex算法的语音电话本找人方法及流程

Info

Publication number: CN109963022A
Application number: CN201811608184.4A
Authority: CN
Inventors: 赵汝强; 白洋; 陈茂强
Original assignee: Guangzhou Yunqu Information Technology Co Ltd
Current assignee: Guangzhou Yunqu Information Technology Co Ltd
Priority date: 2018-12-27
Filing date: 2018-12-27
Publication date: 2019-07-02

Abstract

本发明公开了一种基于soundex算法的语音电话本找人方法及流程，包括步骤：S1、将电话本的汉字人名以soundex算法进行音码编码；S2、将soundex编码后的人名音码及其对应的电话本联系人信息，包括：真实人名、联系电话、邮箱等信息存储在语音电话本中心数据库；S3、将用户通过语音说话找人的语音流信息传给ASR引擎进行语音识别；S4、将ASR引擎语音识别结果以soundex算法进行音码编码；S5、将该音码在语音电话本中心数据库中以相似度算法搜索及比较，反馈匹配的结果。该基于soundex算法的语音电话本找人方法及流程，通过soundex算法把电话本的汉字人名进行音码编码，用户在IVR渠道说出要找人名的语音流传给ASR引擎进行语音识别，提高了语音找人效率，实现了使用方便的目的。

Description

一种基于soundex算法的语音电话本找人方法及流程

技术领域

本发明涉及soundex算法及相似度计算技术领域，具体为一种基于 soundex算法的语音电话本找人方法及流程。

背景技术

传统语音电话本应用均是基于ASR引擎的语音识别文本结果与电话本人名进行文字完全匹配或模糊匹配处理，这在很大程度上依赖于ASR引擎能否准确翻译出人名汉字，但事实上中国汉字存在同音字，特别是在汉字人名范畴而言，同音字及生僻字的情况更普遍，而且用户在语音说话时普通话发音也是千差万别，这样会导致ASR引擎语音识别出来的汉字结果很难与目标电话本的汉字人名完全一致，在这样的结果上用字符串的相似度算法以是无法较为准确地匹配搜索出目标人名。

而基于soundex算法则与传统的基于文字字符串相似度比较算法不太相同，该算法的特点是，它所关注的问题并非两个字符串文本上的相似程度，而是发音的相似程度。首先，该算法会将两个字符串分别通过一定的hash算法转换成一个hash值，该值由4个字节的字符构成。进行转化的hash算法并非随机选取，而是利用了该汉字文字的读音近似值。当获得了两个字符串的读音上的hash值之后，该算法再对两个hash的相似度进行计算，便可以得出输入字符串的读音相似度。

发明人考虑利用soundex算法的发音相似度比较算法特点，结合对汉字发音特点，对汉字韵母、声母和声调进行编码，对编码结果进行可计算的相似度比较，从而提出一种可提高语音电话本应用的方法和流程。

发明内容

(一)解决的技术问题

针对现有技术的不足，本发明提供了一种基于soundex算法的语音电话本找人方法及流程，具备语音电话本找人准确率高和使用方便等优点，解决了传统语音电话本找人准确率不高的问题。

(二)技术方案

为实现上述语音电话本找人准确率高的目的，本发明提供如下技术方案：

一种基于soundex算法的语音电话本找人方法及流程，包括步骤：

S1、将电话本的汉字人名以soundex算法进行音码编码；

S2、将soundex编码后的人名音码及其对应的电话本联系人信息，包括：真实人名、联系电话、邮箱等信息存储在语音电话本中心数据库；

S3、将用户通过语音说话找人的语音流信息传给ASR引擎进行语音识别；

S4、将ASR引擎语音识别结果以soundex算法进行音码编码；

S5、将该音码在语音电话本中心数据库中以相似度算法搜索及比较，反馈匹配的结果。

优选的，所述soundex算法的单汉字音码编码是一个4位字节长的可见字符编码，其中第1位是韵母编码位，第2位是声母编码位，第3位是一个补码编码位，补码编码位是对声母和韵母之间的辅音进行编码的结果，而第4 位是声调补码位。

优选的，所述soundex算法音码编码的韵母编码及声母编码是以有限编码表的方式进行对照翻译编码。

优选的，所述soundex算法音码编码结果相似度比较方法是对4位字节的音码每个位码进行权重标识，再对两个待比较相似度的音码编码每个位码的相等与否加权运算后得出两个音码编码的相似度结果，相似度结果值不超过1，不小于0，越接近1越相似。

(三)有益效果

与现有技术相比，本发明提供了一种基于soundex算法的语音电话本找人方法及流程，具备以下有益效果：

该基于soundex算法的语音电话本找人方法及流程，通过soundex算法把电话本的汉字人名进行音码编码，然后用户在语音电话本的IVR渠道说出要找人名的语音流传给ASR引擎进行语音识别，遍历语音电话本中心数据库，取得每一条联系人记录中的人名音码编码串，以本发明的相似度算法与所得到的用户说话内容音码编码串进行匹配，每一条联系人记录的人名音码编码串与用户说话内容音码编码串取用移动窗口方式对齐匹配，并记录下每一条联系人的最大相似度值，提高了语音找人效率，实现了使用方便的目的。

附图说明

图1为本发明提出的一种基于soundex算法的语音电话本找人方法及流程的流出示意图；

图2为本发明提出的一种基于soundex算法的语音电话本找人方法及流程的音码编码示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1与图2，一种基于soundex算法的语音电话本找人方法及流程，包括步骤：

S1、将电话本的汉字人名以soundex算法进行音码编码；

S4、将ASR引擎语音识别结果以soundex算法进行音码编码；

S5、将该音码在语音电话本中心数据库中以相似度算法搜索及比较，反馈匹配的结果，具体地，所述单汉字音码编码是一个4位字节长的可见字符编码，分别是韵母编码位，声母编码位，辅音补码编码位，辅音补码编码位是对声母和韵母之间的辅音进行编码的结果，事实上辅音也是一种韵母，另一位是声调补码位。其中韵母、声母编码对照表如说明书附图图2所示。

对根据编码对照表所得的4位编码值按一定顺序组合成单汉字的音码编码，音码编码结构如下表所示：

所述汉字人名每个单汉字音码编码组成汉字人名完整音码编码串，联合其对应的电话本联系人信息，包括：真实人名、联系电话、邮箱等信息存储在语音电话本中心数据库。

所述用户语音说话的ASR语音识别结果进行相同规则的汉字soundex算法音码编码，得出用户说话内容的音码编码串。

所述单汉字音码编码每一位进行权重标注以得出单汉字音码编码的相似度计算过程。根据汉字的发音特点，第1位韵母占权重为0.4，第2位声母占权重0.4，第3位辅音所占权重为0.1，而第4位补码所占权重为0.1，从而得出该相似度计算公式如下式所示：

所述音码编码相似度比较算法对要校验的输入音码编码串及目标人名音码编码库以窗口移动方法进行逐条人名音码编码计算相似度值，以求出每条人名音码编码最大相似度值。还可以进一步地，根据语音电话本的应用场景，只对第1位韵母及第2位声母的音码进行二次hash值得出其音码编码的二次 hash编码，以支持模糊搜索。

进一步地，所述soundex算法的单汉字音码编码是一个4位字节长的可见字符编码，其中第1位是韵母编码位，第2位是声母编码位，第3位是一个补码编码位，补码编码位是对声母和韵母之间的辅音进行编码的结果，而第4位是声调补码位。

进一步地，所述soundex算法音码编码的韵母编码及声母编码是以有限编码表的方式进行对照翻译编码。

进一步地，所述soundex算法音码编码结果相似度比较方法是对4位字节的音码每个位码进行权重标识，再对两个待比较相似度的音码编码每个位码的相等与否加权运算后得出两个音码编码的相似度结果，相似度结果值不超过1，不小于0，越接近1越相似。

本发明方法的具体处理流程如下：

1、电话本用户在语音电话本管理台录入电话本联系人信息；

2、语音电话本应用后台将电话本用户所录入的联系人信息中的汉字人名以本发明的soundex算法对人名各个汉字进行音码编码；

3、语音电话本应用后台将联系人名汉字音码编码提取第1位韵母编码和第2位声母编码进行hash二次计算，得出hash编码串以支持后续可模糊搜索；

4、将实施步骤2、3中得出的音码编码串、hash编码串附加到联系人记录信息中并存储到语音电话本中心数据库；

5、将终端用户在语音电话本的IVR渠道说出要找人名的语音流传给ASR 引擎进行语音识别；

6、获取ASR引擎的语音识别结果，并对语音识别结果进行相同规则的soundex算法计算用户说话内容的音码编码串；

7、遍历语音电话本中心数据库，取得每一条联系人记录中的人名音码编码串，以本发明的相似度算法与所得到的用户说话内容音码编码串进行匹配；遍历时每一条联系人记录的人名音码编码串与用户说话内容音码编码串取用移动窗口方式对齐匹配，并记录下每一条联系人的最大相似度值；

8、根据业务需求返回遍历匹配相似度最大的前n条记录给终端用户；

9、如果匹配不到相关联系人记录，还可以以本发明的音码编码二次hash 算法计算出用户说话内容的音码编码二次hash值在语音电话本中进行模糊搜索，并反馈搜索结果给终端用户。

综上所述，该基于soundex算法的语音电话本找人方法及流程，通过 soundex算法把电话本的汉字人名进行音码编码，然后用户在语音电话本的 IVR渠道说出要找人名的语音流传给ASR引擎进行语音识别，遍历语音电话本中心数据库，取得每一条联系人记录中的人名音码编码串，以本发明的相似度算法与所得到的用户说话内容音码编码串进行匹配，每一条联系人记录的人名音码编码串与用户说话内容音码编码串取用移动窗口方式对齐匹配，并记录下每一条联系人的最大相似度值，提高了语音找人效率，实现了使用方便的目的。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种基于soundex算法的语音电话本找人方法及流程，其特征在于：包括步骤：

S1、将电话本的汉字人名以soundex算法进行音码编码；

S4、将ASR引擎语音识别结果以soundex算法进行音码编码；

2.根据权利要求1所述的一种基于soundex算法的语音电话本找人方法及流程，其特征在于：

所述soundex算法的单汉字音码编码是一个4位字节长的可见字符编码，其中第1位是韵母编码位，第2位是声母编码位，第3位是一个补码编码位，补码编码位是对声母和韵母之间的辅音进行编码的结果，而第4位是声调补码位。

3.根据权利要求2所述的一种基于soundex算法的语音电话本找人方法及流程，其特征在于：

所述soundex算法音码编码的韵母编码及声母编码是以有限编码表的方式进行对照翻译编码。

4.根据权利要求3所述的一种基于soundex算法的语音电话本找人方法及流程，其特征在于：

所述soundex算法音码编码结果相似度比较方法是对4位字节的音码每个位码进行权重标识，再对两个待比较相似度的音码编码每个位码的相等与否加权运算后得出两个音码编码的相似度结果，相似度结果值不超过1，不小于0，越接近1越相似。