CN109448701A

CN109448701A - 一种智能语音识别到语义理解的结果统计***及方法

Info

Publication number: CN109448701A
Application number: CN201811090843.XA
Authority: CN
Inventors: 马永飞; 王道宁; 马立民
Original assignee: Yicheng Borui (nanjing) Technology Co Ltd
Current assignee: Yicheng Borui (nanjing) Technology Co Ltd
Priority date: 2018-09-19
Filing date: 2018-09-19
Publication date: 2019-03-08

Abstract

本发明公开了一种智能语音识别到语义理解的结果统计***和方法，***包括运行状态获取单元、测试语音选取单元、响应结果获取单元、测试语义获取单元和测试单元。采用本发明所述方案能够得出一个更贴近与语音内容的识别文本，进行对比后计算出语义服务的精准率，方便快捷且能够自动看到报告，大大提高了效率，把割裂的语音语义测试活动串在了一起。

Description

一种智能语音识别到语义理解的结果统计***及方法

技术领域

本发明涉及计算机应用技术，具体涉及一种智能语音识别到语义理解的结果统计***及方法。

背景技术

随着语音识别技术的日益成熟，市场中正出现越来越多的智能家电、智能家居设备，这些智能设备基于语音识别技术，目前对这些语音智能设备的测试比较麻烦，主要问题在于，语音识别的准确率测试和语义理解的能力测试无法清晰的分离开，最终结果出现问题时，无法快速准确的归结到是语音识别问题还是语义理解的问题。

一句话从用户说出到得到回复，如果回答不满意，不知道中间莫名其妙的哪里出现了问题。比如问青蛙和蝌蚪，回答唱起来了一首小蝌蚪找妈妈；或者问你叫什么，机器回答小白最美丽。下划线这类问题时，却是无法知道是究竟是语音识别出了问题还是语义理解出了问题。

一旦语音识别出现和标准文本或标准答案不能匹配的情况时，测试语义理解没有意义，如上面的例子。

现有的语音识别和后处理技术没有一个可以“纠正”语音识别的过程，把人为判断的过程割裂开了。并且没有办法在一个测试工具内直接可视化的查看和修改，也没有修改后的自我学习，下次面对同样的语音还会识别错。

传统的语音识别到语义理解的测试对于中间结果不可感知，想知道哪些字识别错误或者正确不可见，而语义理解这一步想知道上下文的细节很难。

发明内容

本发明的目的在于提供一种智能语音识别到语义理解的结果统计***及方法，解决现有的智能语音识别测试过程中，无法区分开语音识别的准确率测试结果和语义理解的能力测试结果的问题。

为解决上述的技术问题，本发明采用以下技术方案：

一种智能语音识别到语义理解的结果统计***，

包括用于获取被测试设备的当前运行状态的运行状态获取单元；

包括用于根据被测试设备的当前运行状态从语音库中选取要播放的测试语音的测试语音选取单元；

包括用于向所述被测试设备播放选取的测试语音并获取所述被测试设备对所述测试语音的响应结果的响应结果获取单元；

包括根据识别的文本进行语义测试，选择已经被识别后文本的测试语义获取单元；

包括用于依据所述响应结果得到语音和语义测试结果，将所述响应结果与预期响应结果进行对比，得到最终的识别测试结果和语义测试结果汇总的测试单元。

进一步的，所述运行状态获取单元具体是通过被测试设备的唯一标识向测试服务器发送查询请求，获取被测试设备上报到测试服务器的当前运行状态。

进一步的，所述响应结果获取单元在选取要播放的测试语音时，若被测试设备的当前运行状态为待唤醒状态，则从语音库中调用唤醒音频；若被测试设备的当前运行状态为待识别状态，则从语音库中调用识别音频。

一种智能语音识别到语义理解的结果统计方法，包括以下方法：

测试单元选取待测试语音和语音识别服务API，对语音识别服务API输入待测试语音，

智能识别待测试语音，并编辑成文字文本作为识别结果，将识别结果与待测试语音中的标注文本进行识别对比；

如果识别结果经过对比后与测试文本一致，则该待测试语音作为语义测试文本；

将语义测试文本输入到语义理解服务API，进行语义理解测试，对比语义检查点，得出语义理解结果；

计算并统计语音识别率和语义精准率的结果。

进一步的技术方案是，如果语音识别的识别结果与测试文本不一致，则进行以下处理方式：

人工听取待测试语音，如果人工听取后赞同智能识别待测试语音的结果，则选取智能识别的结果；

如果人工听取后不赞同智能识别待测试语音的结果，则修改标注文本，并对修改后的标注文本进行评价；

如果修改后的标注文本评价高于修改前的标注文本，则待测试语音确定为修改后的标注文本；

如果修改后的标注文本评价低于修改前的标注文本，则待测试语音确定为修改前的标注文本。

将确定的标注文本作为语义测试文本。

进一步的技术方案是，待测试语音的识别结果设定10分满分诶为满分；

如果人工听取后赞同智能识别待测试语音的结果，则智能测试语音的识别结果记为10分；

如果人工听取后不赞同智能识别待测试语音的结果，则智能测试语音记为8分，当人工修改后的标注文本评价高于9分以上，则使用修改后的标注文本，当人工修改后的标注文本评价低于7分以下，则使用修改前的标注文本。

进一步的技术方案是，所述语义理解测试具体是：

根据集成的SDK来设计好文本的输入情况，通过语义理解服务API直接送入文本文件，得出结果；

根据结果对比准备的语义检查点的书写方式、字段、字段对应的返回值；

根据字段名相同后的结果判断，得出语义理解测试的精准率。

与现有技术相比，本发明的有益效果是：采用本发明所述方案能够帮助分析出“不清晰”的语音到底识别成了什么内容，人工打分和机器打分进行加权计算，得出一个更贴近与语音内容的识别文本，并且帮助机器做语音识别的训练。解决机器语音识别易错的问题，进行重新训练后的测试。并且能够依据待测试语音直接输出识别结果和语义返回结果，得出语义理解的检查点，进行对比后计算出语义服务的精准率，方便快捷且能够自动看到报告，大大提高了效率，把割裂的语音语义测试活动串在了一起。

附图说明

图1为本发明的是***框图。

图2为本发明的流程示意图。

图3为本发明中语音识别结果和标注文本的一种对比方式示意图。

图4为本发明中语音识别结果和语音标注文本不一样时的处理流程示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

图1示出了本发明的以下实施例：

一种智能语音识别到语义理解的结果统计装置，

根据上述实施例1，作为优选方案，所述运行状态获取单元具体是通过被测试设备的唯一标识向测试服务器发送查询请求，获取被测试设备上报到测试服务器的当前运行状态。

根据上述实施例1，作为优选方案，所述响应结果获取单元在选取要播放的测试语音时，若被测试设备的当前运行状态为待唤醒状态，则从语音库中调用唤醒音频；若被测试设备的当前运行状态为待识别状态，则从语音库中调用识别音频。

实施例2：

如图2所示，一种智能语音识别到语义理解的结果统计方法，包括以下方法：

智能识别待测试语音，并编辑成文字文本作为识别结果，将识别结果与待测试语音中的标注文本进行识别对比，如图3所示的对比方式；

计算并统计语音识别率和语义精准率的结果。

实施例3：

选待测试语音和语音识别服务API，对语音识别服务API输入待测试语音，

如果识别结果经过对比后与测试文本一致，则该待测试语音作为语义测试文本(图2中为语义测试文本1)；

如果语音识别的识别结果与测试文本不一致，则进行以下处理方式：人工听取待测试语音，如果人工听取后赞同智能识别待测试语音的结果，则选取智能识别的结果；如果人工听取后不赞同智能识别待测试语音的结果，则修改标注文本，并对修改后的标注文本进行评价；如果修改后的标注文本评价高于修改前的标注文本，则待测试语音确定为修改后的标注文本；如果修改后的标注文本评价低于修改前的标注文本，则待测试语音确定为修改前的标注文本；将确定的标注文本作为语义测试文本(图2中为语义测试文本2)；

计算并统计语音识别率和语义精准率的结果。

如图4所示，首先人工听一下4.wav，人工判断下到底此语音文件说的是什么(如果听到说的是张三说，则按照听到的结果保存；如果是其他结果则要修改机器答案，此按钮只是听取判断正确答)；点击“点赞”则赞同机器识别的结果(机器打分自动设为10分)，把“张三说”作为这句的结果保存；点击“保存”(机器打分自动设为8分)则进入下一个界面：可以编辑新的结果(如标注文本写错了，或者是人工帮助把识别错的语音可以继续测试语义)，报错后输入文本保存，点击保存后打分，弹出两个选项(9分以上，6分以下)，选择任意一个；综合机器的8分算出平均分，如果平均分大于8分则采用人工结果，如果小于7分则采用机器结果；这样就根据最像我们听到的语音文件的文本保存，作为语义测试文本。

实施例4：

如果语音识别的识别结果与测试文本不一致，则进行以下处理方式：人工听取待测试语音，如果人工听取后赞同智能识别待测试语音的结果，则选取智能识别的结果；如果人工听取后不赞同智能识别待测试语音的结果，则修改标注文本，并对修改后的标注文本进行评价；如果修改后的标注文本评价高于修改前的标注文本，则待测试语音确定为修改后的标注文本；如果修改后的标注文本评价低于修改前的标注文本，则待测试语音确定为修改前的标注文本；将确定的标注文本作为语义测试文本。例如：待测试语音的识别结果设定10分为满分；如果人工听取后赞同智能识别待测试语音的结果，则智能测试语音的识别结果记为10分；如果人工听取后不赞同智能识别待测试语音的结果，则智能测试语音记为8分，当人工修改后的标注文本评价高于9分以上，则使用修改后的标注文本，当人工修改后的标注文本评价低于7分以下，则使用修改前的标注文本；

计算并统计语音识别率和语义精准率的结果。

实施例4：

将语义测试文本输入到语义理解服务API，进行语义理解测试，对比语义检查点，得出语义理解结果；具体测试方法如下：根据集成的SDK来设计好文本的输入情况，通过语义理解服务API直接送入文本文件，得出结果；根据结果对比准备的语义检查点的书写方式、字段、字段对应的返回值；根据字段名相同后的结果判断，得出语义理解测试的精准率；

计算并统计语音识别率和语义精准率的结果。

作为上述实施例的优选：

本地工具集成了网上公开的语义理解服务API(如百度，讯飞等SDK)，根据集成的SDK来优先设计好文本的输入情况，可以通过接口API直接送入文本文件，得出结果，如一句话的解析格式。送的文本比如“北京今天天气”；返回结果如下

根据结果对比准备的语义检查点是如何书写的，是否字段相同，是否字段对应的返回值相同

如准备的文本结果预期如下

根据字段名相同后的结果判断，得出语义理解测试的精准率；

输出测试报告。

本申请中的特征名称解释：

待识别的语音：要测试语音识别率的语音文件。

语音标注文本：与待识别的语音一一对应的标注好的文本文件，标注了待识别的语音到底说了什么。

待测试语义文本：要测试语义理解的待测试物，纯文本文件，可以是语音标注文本直接作为语义测试文本。

语义检查点：与待测试语义文本一一对应的，标注好的文本文件。一个文本有多个检查点，要检测测试后是否检查点是否都有覆盖/覆盖率多少。

语音识别服务API：接入的语音识别服务接口，输入语音文件，得到识别结果，识别结果是文字。

计算语音识别率：用语音识别API输出，即识别出来的文本结果和语音标注文本进行对比后算出识别率。

语义理解服务API：接入的语义理解服务接口，输入文本文件，得到文本多个检查点结果。

计算语义理解的精准率：用语义服务API输出结果，对比语义检查点，计算出精准率。

尽管这里参照本发明的多个解释性实施例对本发明进行了描述，但是，应该理解，本领域技术人员可以设计出很多其他的修改和实施方式，这些修改和实施方式将落在本申请公开的原则范围和精神之内。更具体地说，在本申请公开、附图和权利要求的范围内，可以对主题组合布局的组成部件和/或布局进行多种变型和改进。除了对组成部件和/或布局进行的变形和改进外，对于本领域技术人员来说，其他的用途也将是明显的。

Claims

1.一种智能语音识别到语义理解的结果统计***，其特征在于：

2.根据权利要求1所述的一种智能语音识别到语义理解的结果统计***，其特征在于：所述运行状态获取单元具体是通过被测试设备的唯一标识向测试服务器发送查询请求，获取被测试设备上报到测试服务器的当前运行状态。

3.根据权利要求1所述的一种智能语音识别到语义理解的结果统计***，其特征在于：所述响应结果获取单元在选取要播放的测试语音时，若被测试设备的当前运行状态为待唤醒状态，则从语音库中调用唤醒音频；若被测试设备的当前运行状态为待识别状态，则从语音库中调用识别音频。

4.一种智能语音识别到语义理解的结果统计方法，其特征在于包括以下方法：

计算并统计语音识别率和语义精准率的结果。

5.根据权利要求4所述的一种智能语音识别到语义理解的结果统计方法，其特征在于：如果语音识别的识别结果与测试文本不一致，则进行以下处理方式：

如果修改后的标注文本评价低于修改前的标注文本，则待测试语音确定为修改前的标注文本；

将确定的标注文本作为语义测试文本。

6.根据权利要求5所述的一种智能语音识别到语义理解的结果统计方法，其特征在于：

待测试语音的识别结果设定10分为满分；

7.根据权利要求4所述的一种智能语音识别到语义理解的结果统计方法，其特征在于：所述语义理解测试具体是：