CN110489518B

CN110489518B - 一种基于特征提取的自助反馈方法和***

Info

Publication number: CN110489518B
Application number: CN201910579542.1A
Authority: CN
Inventors: 邢启洲; 李健; 张连毅; 武卫东
Original assignee: Beijing Sinovoice Technology Co Ltd
Current assignee: Beijing Sinovoice Technology Co Ltd
Priority date: 2019-06-28
Filing date: 2019-06-28
Publication date: 2021-09-17
Anticipated expiration: 2039-06-28
Also published as: CN110489518A

Abstract

本发明提供了一种基于特征提取的自助反馈方法和***，该方法和***具体为当用户进行提问时，利用语音识别技术对用户所发语音进行识别，得到与语音相匹配的文本；根据文本的特征信息，从预先构建的兴趣点知识库中定位用户问题；利用语音合成技术向用户反馈与用户问题相匹配的问题答案。本方案是基于所提取的特征信息进行问题匹配，其中关注的始终是问题的实质内容，因此不会与用户的本意产生偏差，也就不会反馈错误的答案，从而解决了现有方案在向用户反馈时常常答非所问的问题。

Description

一种基于特征提取的自助反馈方法和***

技术领域

本发明涉及人工智能技术领域，特别是涉及一种基于特征提取的自助反馈方法和***。

背景技术

在一些号码自助查询***或自动答复***中，需要根据用户所提问题进行自动识别并回复。传统的处理方案是进行语句匹配，即判断用户所提语句与问题库中的语句是否匹配，如果匹配则将该问题库中的语句所对应的答案反馈给用户。然而，这种方案没有抓住问题的本质，基于自然语言本身的模糊性，有时候与用户所提语句相似度较高的语句并非句意最相似的句子，从而造成答非所问，使用户的体验较差。

发明内容

有鉴于此，本发明提供了一种基于特征提取的自助反馈方法和***，以解决现有方案在向用户反馈时常常答非所问的问题。

为了解决上述问题，本发明公开了一种基于特征提取的自助反馈方法，包括步骤：

当用户进行提问时，利用语音识别技术对用户所发语音进行识别，得到与语音相匹配的文本；

根据所述文本的特征信息，从预先构建的兴趣点知识库中定位用户问题；

利用语音合成技术向用户反馈与所述用户问题相匹配的问题答案。

可选的，所述特征信息包括机构名特征和地址特征。

可选的，所述根据所述文本的特征信息，从预先构建的兴趣点知识库中定位用户问题，包括：

根据所述机构名特征对所述兴趣点知识库进行遍历，从其中的标准问题中选出包含所述机构名特征的多个第一候选问题；

根据所述地址特征从所述多个第一候选问题中进行选取，从中选取出包含所述地址特征的多个第二候选问题；

基于连续匹配字符权重补偿机制的匹配算法，并根据连续字符最长的原则从所述多个第二候选问题中进行选取，将所述连续字符最长的第二候选问题选定为所述用户问题。

可选的，在所述根据所述机构名特征对所述兴趣点知识库进行遍历步骤之前，还包括步骤：

利用预先构建的停用词表从所述文本中滤除无用信息。

对所述文本中的专有名词进行归一化处理。

相应的，为了保证上述方法的实施，本发明还提供了一种基于特征提取的自助反馈***，包括：

语音识别模块，用于当用户进行提问时，利用语音识别技术对用户所发语音进行识别，得到与语音相匹配的文本；

问题定位模块，用于根据所述文本的特征信息，从预先构建的兴趣点知识库中定位用户问题；

语音合成模块，用于利用语音合成技术向用户反馈与所述用户问题相匹配的问题答案。

可选的，所述特征信息包括机构名特征和地址特征。

可选的，所述问题定位模块包括：

第一筛选单元，用于根据所述机构名特征对所述兴趣点知识库进行遍历，从其中的标准问题中选出包含所述机构名特征的多个第一候选问题；

第二筛选单元，用于根据所述地址特征从所述多个第一候选问题中进行选取，从中选取出包含所述地址特征的多个第二候选问题；

第三筛选单元，用于基于连续匹配字符权重补偿机制的匹配算法，并根据连续字符最长的原则从所述多个第二候选问题中进行选取，将所述连续字符最长的第二候选问题选定为所述用户问题。

可选的，在所述根据所述机构名特征对所述兴趣点知识库进行遍历步骤之前，还包括：

信息滤除单元，用于在所述第一筛选单元根据所述机构名特征对所述兴趣点知识库进行遍历之前，利用预先构建的停用词表从所述文本中滤除无用信息。

可选的，还包括：

归一处理单元，用于在所述第一筛选单元根据所述机构名特征对所述兴趣点知识库进行遍历之前，对所述文本中的专有名词进行归一化处理。

从上述技术方案可以看出，本发明提供了一种基于特征提取的自助反馈方法和***，该方法和***具体为当用户进行提问时，利用语音识别技术对用户所发语音进行识别，得到与语音相匹配的文本；根据文本的特征信息，从预先构建的兴趣点知识库中定位用户问题；利用语音合成技术向用户反馈与用户问题相匹配的问题答案。本方案是基于所提取的特征信息进行问题匹配，其中关注的始终是问题的实质内容，因此不会与用户的本意产生偏差，也就不会反馈错误的答案，从而解决了现有方案在向用户反馈时常常答非所问的问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种基于特征提取的自助反馈方法的步骤流程图；

图2为本发明实施例提供的一种基于特征提取的自助反馈***的结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例一

图1为本发明实施例提供的一种基于特征提取的自助反馈方法的步骤流程图。

参照图1所示，该自助反馈方法应用于号码自助查询***或者其他自动答复***中，具体包括如下步骤：

S1、利用语音识别技术识别用户的语音，得到文本。

当用户通过电话或者现场用语音方式发出提问时，利用语音识别技术对用户所发语音进行识别，将语音转换为内容与语音的实际意义相匹配的文本。语音识别方法可以选用利用隐马尔科夫模型方法或者基于机器学习的神经网络模型识别方法。

S2、根据文本的特征信息定位用户问题。

具体来说是提取文本中的特征信息，根据提取到的特征信息从预先构建的兴趣点知识库中进行遍历，从中定位出与该特征信息相匹配的用户问题。该特征信息包括机构名特征和地址特征，本发明是通过如下方法实现对用户问题的定位。

这里的用户问题是指包含与用户所发提问的内容相匹配的问题，且在预先构建的兴趣点知识库中有与该用户内容相对应的问题答案。问题答案就是用户所发出提问所需的回复内容。

这里的兴趣点知识库中建立有机构名词表，机构名词表中包含有专有名词和兴趣点名词，专有名词是指“饭店”、“医院”等领域名词，兴趣点名词则是指饭店名、医院名等独一无二的专有名词。

在具体实施时，首先，在确定文本中存在的领域名词和兴趣点名词后，从兴趣点知识库中预置的所有标准问题中进行查找，将所有包含该领域名词和/或兴趣点名词的标准答案作为第一候选问题，当然，第一候选问题是很多个，甚至有几万个，当然，其范围已经比标准问题的范围小多了。

然后，在确定多个第一候选问题之后，根据上述的地址特征从多个第一候选问题中进行筛选，将其中所有包含该地址特征的第一候选问题选定为第二候选问题，此时虽然第二候选问题还是多个，但其数量已经大为减少。

由于地址在逻辑上存在包含关系，例如“中国北京市朝阳区”存在三层地址，通过分析发现，有时用户会出现所报地址过于详细的问题，而过细的地址有时候会过滤掉正确的答案，因此，通过提取最高两层地址的方法避免这个问题。

最后，进行问题相似匹配，本申请的发明人发现，往往相连越长的连续字符也是与真实的问题相匹配，因此，在此基于连续匹配字符权重补偿机制的匹配算法计算所有第二候选问题中的连续字符，并选取其中最长的第二候选问题作为最终选定的用户问题。

S3、利用语音合成技术向用户反馈问题答案。

在确定与最初的文本相匹配的用户问题后，从兴趣点知识库中选取与该用户问题相对应的问题答案向用户反馈。具体来说，是将该文本状态的问题答案利用语音合成技术合成为语音信号，然后向用户播放该语音信号，从而使用户得到问题反馈。

从上述技术方案可以看出，本实施例提供了一种基于特征提取的自助反馈方法，该方法具体为当用户进行提问时，利用语音识别技术对用户所发语音进行识别，得到与语音相匹配的文本；根据文本的特征信息，从预先构建的兴趣点知识库中定位用户问题；利用语音合成技术向用户反馈与用户问题相匹配的问题答案。本方案是基于所提取的特征信息进行问题匹配，其中关注的始终是问题的实质内容，因此不会与用户的本意产生偏差，也就不会反馈错误的答案，从而解决了现有方案在向用户反馈时常常答非所问的问题。

另外，用户的一句问题中，有很多无用信息，这些信息在计算时会成为干扰，使匹配率降低，比如“你能给我提供下北京前门肯德基的电话吗”这句话，由于我们已经固定了使用场景是电话查询，所以这句话中的“你能给我提供下”和“的电话吗”就是无用信息，所以通过停用词表，先将这些无用信息删除，从而简化提取特征的难度。

因此，在本实施例的一个具体实施方式中，在根据该机构名特征从兴趣点知识库中进行匹配之前，利用预先构建的停用词表对文本进行过滤，滤除其中无用信息，以简化特征提取的难度。

在日常生活中，对于许多专有名词不同人的说法是有区别的，比如“客运”和“汽车运输”、“的士”和“出租车”表达的都是完全相同的意思，只是因为不同人的说话方式不同才产生的差异。

鉴于此，在滤除无用信息之前或者单独的，可以采用归一化的方法，将不同的说法在归一化为统一的说法，这样可以避免由于说话方式不同而匹配错误问题的情况。

需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明实施例并不受所描述的动作顺序的限制，因为依据本发明实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明实施例所必须的。

实施例二

参照图2所示，该***应用于号码自助查询***或者其他自动答复***中，具体包括语音识别模块10、问题定位模块20和语音合成模块30。

语音识别模块用于利用语音识别技术识别用户的语音，得到文本。

具体为当用户通过电话或者现场用语音方式发出提问时，利用语音识别技术对用户所发语音进行识别，将语音转换为内容与语音的实际意义相匹配的文本。语音识别方法可以选用利用隐马尔科夫模型方法或者基于机器学习的神经网络模型识别方法。

问题定位模块用于根据文本的特征信息定位用户问题。

该模块具体包括第一过滤单元、第二过滤单元和第三过滤单元。第一过滤单元在确定文本中存在的领域名词和兴趣点名词后，从兴趣点知识库中预置的所有标准问题中进行查找，将所有包含该领域名词和/或兴趣点名词的标准答案作为第一候选问题，当然，第一候选问题是很多个，甚至有几万个，当然，其范围已经比标准问题的范围小多了。

第二过滤单元用于在第一过滤单元确定多个第一候选问题之后，根据上述的地址特征从多个第一候选问题中进行筛选，将其中所有包含该地址特征的第一候选问题选定为第二候选问题，此时虽然第二候选问题还是多个，但其数量已经大为减少。

第三过滤单元用于进行问题相似匹配，本申请的发明人发现，往往相连越长的连续字符也是与真实的问题相匹配，因此，在此基于连续匹配字符权重补偿机制的匹配算法，计算所有第二候选问题中的连续字符，并选取其中最长的第二候选问题作为最终选定的用户问题。

语音合成模块用于利用语音合成技术向用户反馈问题答案。

从上述技术方案可以看出，本实施例提供了一种基于特征提取的自助反馈***，该***具体为当用户进行提问时，利用语音识别技术对用户所发语音进行识别，得到与语音相匹配的文本；根据文本的特征信息，从预先构建的兴趣点知识库中定位用户问题；利用语音合成技术向用户反馈与用户问题相匹配的问题答案。本方案是基于所提取的特征信息进行问题匹配，其中关注的始终是问题的实质内容，因此不会与用户的本意产生偏差，也就不会反馈错误的答案，从而解决了现有方案在向用户反馈时常常答非所问的问题。

因此，该问题定位模块还可以包括一个信息滤除单元，该单元用于在根据该机构名特征从兴趣点知识库中进行匹配之前，利用预先构建的停用词表对文本进行过滤，滤除其中无用信息，以简化特征提取的难度。

鉴于此，该问题定位模块还可以在滤除无用信息之前或单独地，采用归一化的方法，将不同的说法在归一化为统一的说法，这样可以避免由于说话方式不同而匹配错误问题的情况。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白，本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本发明所提供的技术方案进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种基于特征提取的自助反馈方法，其特征在于，应用于电话查询；包括步骤：

根据所述文本的特征信息，从预先构建的兴趣点知识库中定位用户问题；所述特征信息包括机构名特征和地址特征；所述兴趣点知识库构建有机构名词表，所述机构名词表包括领域名词和兴趣点名词；

利用语音合成技术向用户反馈与所述用户问题相匹配的问题答案；所述问题答案存储在所述兴趣点知识库中，并且与用户所发提问的内容相对应；

其中，根据所述文本的特征信息，从预先构建的兴趣点知识库中定位用户问题，包括：

根据机构名特征对所述兴趣点知识库进行遍历，从其中的标准问题中选出包含所述机构名特征的多个第一候选问题；

根据地址特征从所述多个第一候选问题中进行选取，从中选取出包含地址特征的多个第二候选问题；所述地址特征是所述文本中的地址信息中的最高两层地址；

2.如权利要求1所述的自助反馈方法，其特征在于，在所述根据所述机构名特征对所述兴趣点知识库进行遍历步骤之前，还包括步骤：

利用预先构建的停用词表从所述文本中滤除无用信息。

3.如权利要求1所述的自助反馈方法，其特征在于，在所述根据所述机构名特征对所述兴趣点知识库进行遍历步骤之前，还包括步骤：

对所述文本中的专有名词进行归一化处理。

4.一种基于特征提取的自助反馈***，其特征在于，应用于电话查询；包括：

问题定位模块，用于根据所述文本的特征信息，从预先构建的兴趣点知识库中定位用户问题；所述特征信息包括机构名特征和地址特征；所述兴趣点知识库构建有机构名词表，所述机构名词表包括领域名词和兴趣点名词；

语音合成模块，用于利用语音合成技术向用户反馈与所述用户问题相匹配的问题答案；所述问题答案存储在所述兴趣点知识库中，并且与用户所发提问的内容相对应；

所述问题定位模块包括：

第二筛选单元，用于根据所述地址特征从所述多个第一候选问题中进行选取，从中选取出包含所述地址特征的多个第二候选问题；所述地址特征是所述文本中的地址信息中的最高两层地址；

5.如权利要求4所述的自助反馈***，其特征在于，在所述根据所述机构名特征对所述兴趣点知识库进行遍历步骤之前，还包括：

6.如权利要求4所述的自助反馈***，其特征在于，还包括：