CN111128139B

CN111128139B - 无侵入式语音测试方法及装置

Info

Publication number: CN111128139B
Application number: CN201911309691.2A
Authority: CN
Inventors: 何龙; 秦以南
Original assignee: Sipic Technology Co Ltd
Current assignee: Sipic Technology Co Ltd
Priority date: 2019-12-18
Filing date: 2019-12-18
Publication date: 2022-07-08
Anticipated expiration: 2039-12-18
Also published as: CN111128139A

Abstract

本发明公开一种无侵入式语音测试方法，包括：配置操作指令信息；根据配置的操作指令信息获取测试目标的图像信息；对获取的测试目标的所述图像信息进行图像识别生成第一测试结果存储。本发明还公开了一种无侵入式语音测试装置，根据本发明公开的方法和***可以实现通过无侵入的方式进行测试等操作，大大的提高了测试效率，并且操作简单、方便，普通人员即可完成测试，节省人力成本。

Description

无侵入式语音测试方法及装置

技术领域

本发明涉及语音测试技术领域，特别是一种无侵入式语音测试方法及装置。

背景技术

由于语音技术产品的场景化特点，对于研发的多种语音技术产品，其后期调试尤为重要。在语音测试过程中，往往通过一些方式，将语音测试过程中人工的部分通过机器替代，从而提高测试效率、稳定性等，例如采用appium，通过对机器界面上元素的检索来获取机器的界面反馈情况，并借此判断当前的反馈是否符合预期，以此来替代人工辨别的方式来对某个语音功能进行测试。但是，appium的安装方式需要在宿主机器(被测试机器)中部署一个测试APP，借此APP来收集机器的界面反馈情况，而这一动作需要被测试机器满足下面的几个条件：

1.可调式的接口(android一般是usb)；

2.支持adb调试；

3.支持安装app；

4.通信端口可用。

上述的这些条件只要有一个不满足，该方式就无法实施，而某些被测试机器是不满足这些条件的，这就导致通过该方法进行测试的实现方式复杂，且具有很大的局限性。

发明内容

为了解决上述问题，发明人构思通过在外部设备上获取直接获取被测试机器的屏幕信息，再基于图像识别的技术对图片进行识别，以判断语音测试结果的方案来实现无侵入式的自动化语音测试，由此，可以通过无侵入的方式进行测试等操作，大大的提高了测试效率，并且操作简单、方便，克服了上述问题的弊端。

根据本发明的一个方面，提供了一种无侵入式语音测试方法，包括如下步骤：

配置操作指令信息；

根据配置的操作指令信息获取测试目标的图像信息；

对获取的测试目标的所述图像信息进行图像识别生成第一测试结果存储。

根据本发明的另一个方面，提供了一种无侵入式语音测试装置，包括：

第一配置模块，用于配置操作指令信息存储；

图像获取模块，用于根据配置的操作指令信息获取测试目标的图像信息；和

第一测试结果生成模块，用于对获取的测试目标的所述图像信息进行图像识别生成第一测试结果存储。

根据本发明的又一个方面，提供了一种电子设备，其包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述方法的步骤。

根据本发明的又一个方面，提供了一种存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述方法的步骤。

本发明实施例的方案，无需在目标设备上植入测试app，降低了对被测试设备的要求，实现简单、操作方便，无需专业测试人员也能完成测试，节省人力成本，提高测试效率。

附图说明

图1为本发明一实施方式的无侵入式语音测试方法流程图；

图2为本发明另一实施方式的无侵入式语音测试方法流程图；

图3为本发明一实施方式的无侵入式语音测试装置原理结构图；

图4为本发明一实施方式的无侵入式语音测试装置原理结构图；

图5为本发明一实施方式的电子设备原理结构图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、元件、数据结构等等。也可以在分布式计算环境中实践本发明，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

在本发明中，“模块”、“装置”、“***”等指应用于计算机的相关实体，如硬件、硬件和软件的组合、软件或执行中的软件等。详细地说，例如，元件可以、但不限于是运行于处理器的过程、处理器、对象、可执行元件、执行线程、程序和/或计算机。还有，运行于服务器上的应用程序或脚本程序、服务器都可以是元件。一个或多个元件可在执行的过程和/或线程中，并且元件可以在一台计算机上本地化和/或分布在两台或多台计算机之间，并可以由各种计算机可读介质运行。元件还可以根据具有一个或多个数据包的信号，例如，来自一个与本地***、分布式***中另一元件交互的，和/或在因特网的网络通过信号与其它***交互的数据的信号通过本地和/或远程过程来进行通信。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”，不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

由于本发明实施例涉及的无侵入式语音测试的实现方案可以应用于任何需要进行语音测试的目标设备上，实现对语音交互设备的语音测试，特别适用于不能够或不方便植入测试app的语音交互设备中，例如车载设备等，但是本发明的适用范围并不局限于此。通过本发明实施例提供的方案，能够使得在无需向目标设备植入测试app的情况下，实现无侵入式语音测试，降低了对测试设备的要求，操作方便，提高测试效率。

下面结合附图对本发明作进一步详细的说明。

图1示意性地显示了根据本发明的一种实施方式的无侵入式语音测试方法流程图，如图1所示，本实施例的方法包括如下步骤：

步骤S101：配置操作指令信息。为了能够实现自动化地进行无侵入式语音测试，本发明实施例采用预先根据需求配置的操作指令信息的方式来触发后续的操作。具体地，根据操作指令信息自动触发的后续操作在本发明实施例为获取测试目标的图像信息以进行后续处理，其实现为包括指令执行条件和第一指令内容，其中，指令执行条件为执行第一指令内容的触发条件，其可以根据用户测试需求进行自定义设置，示例性地可以设置为指令执行频率和执行次数(例如每10秒执行一次第一指令内容，共执行20次)，也可以设置为基于指定时间的条件(例如在XX日XX时XX分XX秒执行第一指令内容)等，本发明实施例对具体的条件不进行限制，满足基于用户测试需求来触发第一指令内容的执行即可。第一指令内容是指用于获取测试目标的图像信息的动作指令，示例性地，在一种具体实现例中，上述第一指令内容为启动摄像头进行拍照的指令，在另一种具体实现例种，上述第一指令内容还可以为获取屏幕截图的指令。

步骤S102：根据配置的操作指令信息获取测试目标的图像信息。在配置了上述操作指令信息后，就可以在启动该方法后，获取对应的指令执行条件进行监测(如通过实时检测条件来判断)，在判断满足指令执行条件时，获取第一指令内容，来执行获取测试目标的图像信息的动作，以获取测试目标的图像信息。示例性地，在第一指令内容为启动摄像头进行拍照的指令时，就可以根据该指令启动摄像头进行拍照，通过将摄像头防止在测试目标的屏幕前方，就可以通过自动执行该第一指令内容来自动获取测试目标的图像信息，例如为测试目标的屏幕照片。而在第一指令内容为获取屏幕截图的指令时(以测试目标为车载设备为例，为adb截图命令)，则无需通过摄像头来拍照，只需要启动测试目标如车载设备的截图指令即可，此时如果为车载设备则需要将允许该方法的装置如电脑通过调试线连接至车机，以通过adb命令来截图，这样能够稳定获取具有质量保证的测试目标的图像信息，不存在受角度等影响的缺陷。然而，相比而言，通过摄像头进行拍照的方式，操作简单方便，不需外设调试线，适用范围更广。

步骤S103：对获取的测试目标的图像信息进行图像识别生成第一测试结果存储。通过图像识别的方式来进行语音测试，如何保证图像识别的实现及效果优化是保证测试结果准确性的关键和难点。为了保证图像识别的效果，本发明实施例通过图像比对的方式来实现对获取的测试目标的图像信息的图像识别。具体地，其可以实现为：首先，配置语音动作特征与目标状态图像的映射关系，生成目标状态图像库存储，即将语音动作特征和采用该语音动作特征时对应应该呈现的正确的目标状态图像进行关联存储，形成目标状态图像库；其次，将获取的测试目标的图像信息与目标状态图像库中的目标状态图像进行比对，确认是否存在与之一致的目标状态图像；最后，根据比对结果，在确认存在与之一致的目标状态图像时，获取***时间和对应的语音动作特征，根据获取的语音动作特征和***时间生成第一测试结果存储。

其中，本发明实施例中提及的语音动作特征是指所采用的测试语音，示例性地，在唤醒测试中该语音动作特征为测试所采用的唤醒词，在语音识别测试中，该语音动作特征为测试所采用的语料。每个测试的语音即语音动作特征都对应有一个应当呈现的目标状态图像，该目标状态图像可以由研发人员或用户预先截图上传。

示例性地，进行图像比对可以采用python的图片库，就像素点矩阵来比较两个图片的相似程度实现，将相似程度达到预设阈值的作为两者一致的判断标准。

示例性地，进行图像比对还可以采用百度比对API实现。

在通过图像比对确定存在一致的目标状态图像时，则认为此次语音测试是成功的，否则认为是失败的。基于该比对结果，即可生成第一测试结果。示例性地，生成的第一测试结果可以是包括测试时间和测试结果(即成功还是失败)。其中，测试时间可以通过获取***时间的方式获得，而测试结果可以基于比对结果来判定，在生成该第一测试结果时，将其与对应的语音动作特征即所采用的测试语音绑定，以进行标记和方便后续使用。在具体实现中，生成的第一测试结果还可以根据用户的测试目的来自定义设置，本发明实施例不视为对此进行限制。

通过该方法就可以方便地对目标设备，尤其是在目标设备(即被测试设备)不具备安装测试app的条件时，进行自动化地语音测试，对设备要求低(只需要其具有屏幕即可)，且操作简单易行，无需专业测试人员即可实现，节省人力，能够有效提高测试效率。

图2示意性地显示了本发明另一实施方式的无侵入式语音测试方法，如图2所示，本发明实施例的方法在图1所示的实施例的基础上还包括：

在步骤S101中配置的操作指令信息还包括第二指令内容，示例性地，该第二指令内容配置为生成最终的测试报告发送给指定用户的指令。这样，就可以基于第二指令内容在结束测试时，形成所需的测试结果即第二测试结果输出至指定地址。其中，第二指令内容可以基于指令执行条件来获取，即在对指令执行条件进行监测时，如果监测到指令执行条件已经满足结束测试的条件时，就获取该第二指令内容自动触发后续操作。由此，基于该配置信息本发明实施例的方法还包括：

步骤S104：根据指令执行条件获取第二指令内容。示例性地，在指令执行条件一般根据测试目的来设置，在指令执行条件为误唤醒即终止时，就可以在根据图像比对结果检测到比对失败时，获取第二指令内容；而在指令执行条件为基于频率和次数进行测试时，就可以在达到预设的测试次数时，获取第二指令内容等。可以根据需求由用户自定义设置。

步骤S105：根据第二指令内容获取存储的第一测试结果，并根据存储的第一测试结果生成第二测试结果输出。其中，生成的第二测试结果根据用户的测试目的来定义，示例性地，在用户测试目的是获取唤醒率时，就根据存储的所有第一测试结果计算出唤醒率(唤醒成功的次数/总测试次数)输出给用户(例如可以输出给用户指定的邮箱等)。

通过该方法，就可以在实现自动化语音测试的基础上，自动获取所需的测试结果报告输出给用户，方便用户查看，对用户非常友好。

作为一种优选实施例，在具体实现中，为了保证上述方案的运行性能和效果，还可以设置成在每次进行图像比对生成第一测试结果存储后，设置预定时长如十秒的休眠时间，在休眠时间之后，再开启下一次的指令执行条件监测和图像获取。图3示意性地显示了本发明的一种实施方式的无侵入式语音测试装置的原理框图，如图3所示该装置1包括

第一配置模块30，用于配置操作指令信息存储，配置的指令操作信息包括指令执行条件、第一指令内容和第二指令内容，其具体配置方式和内容参见方法部分的描述；

第二配置模块31，用于配置语音动作特征与目标状＝态图像的映射关系，生成目标状态图像库存储，配置的语音动作特征和目标状态图像的内容参见前文方法部分的描述；

图像获取模块32，用于根据配置的操作指令信息获取测试目标的图像信息；和

第一测试结果生成模块33，用于对获取的测试目标的图像信息进行图像识别生成第一测试结果存储。

优选地，该装置的图像获取模块32可以是实现为摄像头，用于根据操作指令信息获取测试目标的屏幕照片，示例性地可以是笔记本电脑上自带的摄像头，这样配置的操作指令信息中的第一指令内容就可以基于调用其摄像头拍照的指令接口来设置。

如图3所示该装置的第一测试结果生成模块33则可以实现为包括

比对单元33A，用于将获取的屏幕照片与目标状态图像库中的目标状态图像进行比对，确认是否存在与之一致的目标状态图像，并在确认存在与之一致的目标状态图像时，输出对应的语音动作特征至结果生成单元32C；和

结果生成单元33B，用于获取***时间，根据语音动作特征和***时间生成第一测试结果存储，生成的第一测试结果可以包括语音动作特征、测试时间(记录为***时间)和测试结果(记录为失败或成功)。

在其他实现例中，图像获取模块32还可以不包括摄像单元32A，而是基于调试线连接目标设备，通过adb命令来获取屏幕截图作为测试目标的图像信息。

图4示意性地显示了本发明另一实施方式的无侵入式语音测试装置的原理框图，如图4所示，本发明实施例在图3所示实施例的基础上还包括：第二测试结果生成模块34，用于响应于结束测试的指令，获取存储的第一测试结果，并根据存储的第一测试结果生成第二测试结果输出。其中，结束测试的指令为上述的第二指令内容，生成的第二测试结果的内容根据测试目的由用户自定义设定，具体可以是输出至用户指定邮箱等。

其中，上述装置中各模块及单元的具体实现和交互过程参见前文方法部分的描述，在此不再赘述。

需要说明的是，本发明实施例的上述装置是独立于目标设备的智能设备，例如PC或智能手机等，不需要在目标设备(即被测设备)上植入测试app，只需要通过上述独立的装置就可以通过设备的摄像头或调试线来获取目标设备的屏幕照片或截图，从而实现自动化语音测试，执行方便，对目标设备要求低，大幅节省人力成本，提高测试效率。且上述装置能够在完成测试后，基于测试目的生成第二测试结果即测试报告输出给用户，非常智能，提高用户体验。

在一些实施方式中，本发明实施例还提供一种计算机可读存储介质，所述存储介质中存储有一个或多个包括执行指令的程序，所述执行指令能够被电子设备(包括但不限于计算机，服务器，或者网络设备等)读取并执行，以用于执行本发明上述无侵入式语音测试的方法。

在一些实施例中，本发明实施例还提供一种计算机程序产品，计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序，计算机程序包括程序指令，当所程序指令被计算机执行时，使计算机执行上述无侵入式语音测试的方法。

在一些实施例中，本发明实施例还提供一种电子设备，其包括：至少一个处理器，以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被所述至少一个处理器执行，以使至少一个处理器能够执行上述无侵入式语音测试的方法。

在一些实施例中，本发明实施例还提供一种存储介质，其上存储有计算机程序，该程序被处理器执行时能够执行上述无侵入式语音测试的方法。

上述本发明实施例的无侵入式语音测试装置可用于执行本发明实施例的无侵入式语音测试的方法，并相应的达到上述本发明实施例的实现无侵入式语音测试的方法所达到的技术效果，这里不再赘述。本发明实施例中可以通过硬件处理器(hardwareprocessor)来实现相关功能模块。

图5是本申请另一实施例提供的执行无侵入式语音测试的方法的电子设备的硬件结构示意图，如图5所示，该设备包括：

一个或多个处理器510以及存储器520，图5中以一个处理器510为例。

执行无侵入式语音测试的方法的设备还可以包括：输入装置530和输出装置540。

处理器510、存储器520、输入装置530和输出装置540可以通过总线或者其他方式连接，图3中以通过总线连接为例。

存储器520作为一种非易失性计算机可读存储介质，可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块，如本申请实施例中的无侵入式语音测试的方法对应的程序指令/模块。处理器510通过运行存储在存储器520中的非易失性软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的无侵入式语音测试的方法。

存储器520可以包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需要的应用程序；存储数据区可存储根据无侵入式语音测试的装置的使用所创建的数据等。此外，存储器520可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中，存储器520可选包括相对于处理器510远程设置的存储器，这些远程存储器可以通过网络连接至无侵入式语音测试的装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置530可接收输入的数字或字符信息，以及产生与无侵入式语音测试的装置的用户设置以及功能控制有关的信号。输出装置540可包括显示屏等显示设备。

上述一个或者多个模块存储在所述存储器520中，当被所述一个或者多个处理器510执行时，执行上述任意方法实施例中的无侵入式语音测试的方法。

上述产品可执行本申请实施例所提供的方法，具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，可参见本申请实施例所提供的方法。

本申请实施例的电子设备以多种形式存在，包括但不限于:

(1)移动通信设备:这类设备的特点是具备移动通信功能，并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机，以及低端手机等。

(2)超移动个人计算机设备:这类设备属于个人计算机的范畴，有计算和处理功能，一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等，例如iPad。

(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod)，掌上游戏机，电子书，以及智能玩具和便携式车载导航设备。

(4)服务器:提供计算服务的设备，服务器的构成包括处理器、硬盘、内存、***总线等，服务器和通用的计算机架构类似，但是由于需要提供高可靠的服务，因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。

(5)其他具有数据交互功能的电子装置。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围

以上所述的仅是本发明的一些实施方式。对于本领域的普通技术人员来说，在不脱离本发明创造构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。

Claims

1.无侵入式语音测试方法，其特征在于，包括如下步骤：

配置操作指令信息；

根据配置的操作指令信息获取测试目标的图像信息；

对获取的测试目标的所述图像信息进行图像识别生成第一测试结果存储，其包括如下步骤：

配置语音动作特征与目标状态图像的映射关系，生成目标状态图像库存储；

将获取的测试目标的所述图像信息与目标状态图像库中的目标状态图像进行比对，确认是否存在与之一致的目标状态图像；

在确认存在与之一致的目标状态图像时，获取***时间和对应的语音动作特征，根据获取的语音动作特征和***时间生成第一测试结果存储。

2.根据权利要求1所述的方法，其特征在于，配置的操作指令信息包括指令执行条件和第一指令内容，所述根据配置的操作指令信息获取测试目标的图像信息包括：

根据指令执行条件获取第一指令内容；

根据第一指令内容执行获取测试目标的图像信息的动作，以获取测试目标的图像信息。

3.根据权利要求2所述的方法，其特征在于，配置的操作指令信息还包括第二指令内容，所述方法还包括：

根据指令执行条件获取第二指令内容；

根据第二指令内容获取存储的第一测试结果，并根据存储的第一测试结果生成第二测试结果输出。

4.根据权利要求3所述的方法，其特征在于，所述第一指令内容为启动摄像头进行拍照的指令，所述获取的测试目标的图像信息为测试目标的屏幕照片。

5.无侵入式语音测试装置，其特征在于，包括：

第一配置模块，用于配置操作指令信息存储；

图像获取模块，用于根据配置的操作指令信息获取测试目标的图像信息；

第一测试结果生成模块，用于对获取的测试目标的所述图像信息进行图像识别生成第一测试结果存储；

第二配置模块，用于配置语音动作特征与目标状态图像的映射关系，生成目标状态图像库存储；

所述图像获取模块用于根据操作指令信息获取测试目标的屏幕照片；

所述第一测试结果生成模块包括

比对单元，用于将获取的屏幕照片与目标状态图像库中的目标状态图像进行比对，确认是否存在与之一致的目标状态图像，并在确认存在与之一致的目标状态图像时，输出对应的语音动作特征；和

结果生成单元，用于获取***时间，根据语音动作特征和***时间生成第一测试结果存储。

6.根据权利要求5所述的装置，其特征在于，还包括：

第二测试结果生成模块，用于响应于结束测试的指令，获取存储的第一测试结果，并根据存储的第一测试结果生成第二测试结果输出。

7.电子设备，其包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-4中任意一项所述方法的步骤。

8.存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1-4中任意一项所述方法的步骤。