CN110264995A - 智能设备的语音测试方法、装置电子设备及可读存储介质 - Google Patents

智能设备的语音测试方法、装置电子设备及可读存储介质 Download PDF

Info

Publication number
CN110264995A
CN110264995A CN201910578108.1A CN201910578108A CN110264995A CN 110264995 A CN110264995 A CN 110264995A CN 201910578108 A CN201910578108 A CN 201910578108A CN 110264995 A CN110264995 A CN 110264995A
Authority
CN
China
Prior art keywords
smart machine
audio
memory space
sub
testing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910578108.1A
Other languages
English (en)
Inventor
余明
陈果果
安爱辉
纪盛
徐木水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910578108.1A priority Critical patent/CN110264995A/zh
Publication of CN110264995A publication Critical patent/CN110264995A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/01Assessment or evaluation of speech recognition systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明实施例提供一种智能设备的语音测试方法、装置电子设备及可读存储介质,所述方法包括:向第一智能设备输入测试音频信息,由所述第一智能设备对所述测试音频信息进行识别,所述测试音频信息预先通过第二智能设备录制得到,所述第一智能设备与所述第二智能设备为品类相同的智能设备;获取所述第一智能设备的测试日志,所述测试日志在所述第一智能设备对所述测试音频信息进行识别时生成,所述测试日志中包括所述第一智能设备对所述测试音频信息的语音识别结果;根据所述测试日志中的所述语音识别结果,确定所述第一智能设备的语音测试结果。该方法能够极大减少人力成本,明显减少测试时间。

Description

智能设备的语音测试方法、装置电子设备及可读存储介质
技术领域
本发明实施例涉及智能语音技术,尤其涉及一种智能设备的语音测试方法、装置电子设备及可读存储介质。
背景技术
随着语音识别技术的不断发展,出现了越来越多支持自动语音识别的智能设备,例如支持自动语音识别的音箱、手机、平板电脑等。这些支持自动语音识别的智能设备在出厂之前,需要对这些设备的自动语音识别功能进行测试。
现有技术中,主要通过真人方式进行测试。具体的,由测试人员人工向智能设备发出唤醒语音和查询语音等测试语音,智能设备根据接收到的语音进行语音识别,得到语音识别结果,进而,对语音识别结果进行分析得到语音识别测试结果。
但是,使用现有技术的方法会导致语音识别测试的人力成本大、时间成本高。
发明内容
本发明实施例提供一种智能设备的语音测试方法、装置电子设备及可读存储介质,用于解决现有技术所导致的语音识别测试的人力成本大、时间成本高的问题。
本发明实施例第一方面提供一种智能设备的语音测试方法,包括:
向第一智能设备输入测试音频信息,由所述第一智能设备对所述测试音频信息进行识别,所述测试音频信息预先通过第二智能设备录制得到,所述第一智能设备与所述第二智能设备为品类相同的智能设备;
获取所述第一智能设备的测试日志,所述测试日志在所述第一智能设备对所述测试音频信息进行识别时生成,所述测试日志中包括所述第一智能设备对所述测试音频信息的语音识别结果;
根据所述测试日志中的所述语音识别结果,确定所述第一智能设备的语音测试结果。
进一步的,所述第一智能设备中包括第一存储空间和第二存储空间;
所述向第一智能设备输入测试音频信息,由所述第一智能设备对所述测试音频信息进行识别,包括:
交替从服务器向所述第一存储空间和所述第二存储空间中输入子音频,所述测试音频信息由多个按时间排列的所述子音频组成;
在向所述第一存储空间输入子音频时由所述第一智能设备从所述第二存储空间读取并识别子音频,在向所述第二存储空间输入子音频时由所述第一智能设备从所述第一存储空间读取并识别子音频。
进一步的,所述由所述第一智能设备从所述第二存储空间读取并识别子音频之后,还包括:
由所述第一智能设备将所述第二存储空间的音频的识别结果写入所述测试日志中;
所述由所述第一智能设备从所述第一存储空间读取并识别子音频之后,还包括:
由所述第一智能设备将所述第一存储空间的音频的识别结果写入所述测试日志中。
进一步的,所述在向所述第一存储空间输入子音频时由所述第一智能设备从所述第二存储空间读取并识别子音频,在向所述第二存储空间输入子音频时由所述第一智能设备从所述第一存储空间读取并识别子音频,包括:
向所述第一存储空间和所述第二存储空间分别输入一个子音频;
A、由所述第一智能设备从所述第一存储空间读取并识别子音频;
B、若所述第一存储空间的子音频读取完毕,则由所述第一智能设备从所述第二存储空间读取并识别子音频,同时,向所述第一存储空间输入新的子音频;
C、若所述第二存储空间的子音频读取完毕,则向所述第二存储空间输入新的子音频,同时,执行A;
循环执行A-C,直至所述测试音频信息输入完毕。
进一步的,所述向第一智能设备输入测试音频信息之前,还包括:
由所述第二智能设备接收待录制语音并对所述待录制语音进行信号处理,得到所述待录音语音对应的测试音频信息;
将所述待录制语音对应的测试音频信息上传至服务器。
进一步的,所述第二智能设备中包括第三存储空间和第四存储空间;
所述将所述待录制语音对应的测试音频信息上传至服务器,包括:
交替向所述第三存储空间和所述第四存储空间中输入子音频,所述待录制语音包括多个子语音,子语音经过信号处理得到子音频;
在向所述第三存储空间输入子音频时由所述第一智能设备从所述第四存储空间读取并向所述服务器上传子音频,在向所述第四存储空间输入子音频时由所述第一智能设备从所述第三存储空间读取并并向所述服务器上传子音频。
进一步的,所述根据所述测试日志中的所述语音识别结果,确定所述第一智能设备的语音测试结果,包括:
根据所述测试日志中的所述语音识别结果,确定所述第一智能设备的不同版本之间的测试差异信息。
本发明实施例第二方面提供一种智能设备的语音测试装置,包括:
输入模块,用于向第一智能设备输入测试音频信息,由所述第一智能设备对所述测试音频信息进行识别,所述测试音频信息预先通过第二智能设备录制得到,所述第一智能设备与所述第二智能设备为品类相同的智能设备;
获取模块,用于获取所述第一智能设备的测试日志,所述测试日志在所述第一智能设备对所述测试音频信息进行识别时生成,所述测试日志中包括所述第一智能设备对所述测试音频信息的语音识别结果;
确定模块,用于根据所述测试日志中的所述语音识别结果,确定所述第一智能设备的语音测试结果。
进一步的,所述第一智能设备中包括第一存储空间和第二存储空间;
所述输入模块具体用于:
交替从服务器向所述第一存储空间和所述第二存储空间中输入子音频,所述测试音频信息由多个按时间排列的所述子音频组成;
在向所述第一存储空间输入子音频时由所述第一智能设备从所述第二存储空间读取并识别子音频,在向所述第二存储空间输入子音频时由所述第一智能设备从所述第一存储空间读取并识别子音频。
进一步的,所述输入模块具体用于:
由所述第一智能设备将所述第二存储空间的音频的识别结果写入所述测试日志中;以及,
由所述第一智能设备将所述第一存储空间的音频的识别结果写入所述测试日志中。
进一步的,所述输入模块具体用于:
向所述第一存储空间和所述第二存储空间分别输入一个子音频;
A、由所述第一智能设备从所述第一存储空间读取并识别子音频;
B、若所述第一存储空间的子音频读取完毕,则由所述第一智能设备从所述第二存储空间读取并识别子音频,同时,向所述第一存储空间输入新的子音频;
C、若所述第二存储空间的子音频读取完毕,则向所述第二存储空间输入新的子音频,同时,执行A;
循环执行A-C,直至所述测试音频信息输入完毕。
进一步的,所述装置还包括:
录制模块,用于由所述第二智能设备接收待录制语音并对所述待录制语音进行信号处理,得到所述待录音语音对应的测试音频信息;
上传模块,用于将所述待录制语音对应的测试音频信息上传至服务器。
进一步的,所述第二智能设备中包括第三存储空间和第四存储空间;
所述上传模块具体用于:
交替向所述第三存储空间和所述第四存储空间中输入子音频,所述待录制语音包括多个子语音,子语音经过信号处理得到子音频;
在向所述第三存储空间输入子音频时由所述第一智能设备从所述第四存储空间读取并向所述服务器上传子音频,在向所述第四存储空间输入子音频时由所述第一智能设备从所述第三存储空间读取并并向所述服务器上传子音频。
进一步的,所述确定模块具体用于:
根据所述测试日志中的所述语音识别结果,确定所述第一智能设备的不同版本之间的测试差异信息。
本发明实施例第三方面提供一种电子设备,包括:
存储器,用于存储程序指令;
处理器,用于调用并执行所述存储器中的程序指令,执行上述第一方面所述的方法步骤。
本发明实施例第四方面提供一种可读存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序用于执行上述第一方面所述的方法。
本发明实施例所提供的智能设备的语音测试方法、装置电子设备及可读存储介质,预先在与被测试智能设备品类相同的智能设备上录制得到音频信息,在对被测试智能设备进行测试时,直接使用已经录制的音频信息进行测试,并根据被测试设备识别音频信息时所输出的测试日志确定语音测试结果,这种方式仅需要一次录音,即可应用于同一品类的所有智能设备的语音识别测试中,因此,无需每次组织真人测试,极大减少人力成本。同时,每次测试时,被测试智能设备直接对音频进行识别,无需执行接收语音,对语音进行信号处理再得到音频信息的过程,因此,能够明显减少测试时间。另外,对于同一品类的智能设备,均使用同一套音频信息进行测试,因此能够保证测试结果的确定性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的智能设备的语音测试方法的示例性***架构图;
图2为本发明实施例提供的智能设备的语音测试方法的流程示意图;
图3为第一智能设备接收测试音频信息进行语音识别的示意图;
图4为本发明实施例提供的智能设备的语音测试方法的流程示意图;
图5为交替向第一智能设备输入子音频并由第一智能设备读取和识别的示意图;
图6为本发明实施例提供的智能设备的语音测试方法的流程示意图;
图7为第二智能设备接收测试音频信息进行语音识别的示意图;
图8为本发明实施例提供的智能设备的语音测试方法的流程示意图;
图9为本发明实施例提供的智能设备的语音测试装置的模块结构图;
图10为本发明实施例提供的智能设备的语音测试装置的模块结构图;
图11为本发明实施例提供的一种电子设备1100的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有技术中使用真人测试方法对智能设备进行语音识别测试,这种方式每次需要组织大量的且不同地域的人员进行测试,同时,每次测试需要较长时间,因此,导致人力成本大、时间成本高。同时,由于每次使用真人测试,而真人的发声和周围的声学环境不一致,因此,导致每次测试的结果具有不确定性。
本发明实施例基于上述问题,提出一种智能设备的语音测试方法,预先在与被测试智能设备品类相同的智能设备上录制得到音频信息,在对被测试智能设备进行测试时,直接使用已经录制的音频信息进行测试,并根据被测试设备识别音频信息时所输出的测试日志确定语音测试结果,这种方式仅需要一次录音,即可应用于同一品类的所有智能设备的语音识别测试中,因此,无需每次组织真人测试,极大减少人力成本。同时,每次测试时,被测试智能设备直接对音频进行识别,无需执行接收语音,对语音进行信号处理再得到音频信息的过程,因此,测试时间也可以明显减少。另外,对于同一品类的智能设备,均使用同一套音频信息进行测试,因此能够保证测试结果的确定性。
图1为本发明实施例提供的智能设备的语音测试方法的示例性***架构图,如图1所示,该方法涉及被测试的智能设备、录制音频信息的智能设备、服务器以及测试设备。其中,录制音频信息的智能设备将音频信息发送到服务器保存,被测试的智能设备从服务器读取音频信息并识别,测试设备使用本发明实施例的方法向被测试的智能设备输入音频信息、从被测试的智能设备获取测试日志、将录制音频信息的智能设备的音频信息上传到服务器等。服务器和测试设备可以集成在同一台物理设备上,例如,同一台PC,可以同时实现上述服务器和测试设备的功能。或者,服务器和测试设备可以部署在不同的物理设备上。本发明实施例对此不作具体限定。
图2为本发明实施例提供的智能设备的语音测试方法的流程示意图,该方法的执行主体为上述的测试设备,如图2所示,该方法包括:
S201、向第一智能设备输入测试音频信息,由该第一智能设备对上述测试音频信息进行识别,上述测试音频信息预先通过第二智能设备录制得到,上述第一智能设备与上述第二智能设备为品类相同的智能设备。
其中,上述第一智能设备为上述图1中被测试的智能设备,上述第二智能设备为上述图1中录制音频信息的智能设备。本实施例中,对第一智能设备进行语音识别测试。
第一智能设备和第二智能设备属于同一品类,示例性的,第一智能设备和第二设备均为某种型号的智能音箱。
本发明实施例中,第一智能设备和第二智能设备可以为智能音箱、智能手机、智能手表等具有语音识别功能的智能设备,本发明实施例对第一智能设备和第二智能设备的具体形态不作具体限定。
可选的,在对第一智能设备进行测试之前,测试设备已经预先通过第二智能设备录制得到测试音频信息,并将该测试音频信息保存至服务器。录制音频和保存音频的过程将在下述实施例中详细说明。可选的,在本步骤中,测试设备从服务器读取测试音频信息,并输入至第一智能设备。
S202、获取上述第一智能设备的测试日志,该测试日志在上述第一智能设备对上述测试音频信息进行识别时生成,该测试日志中包括上述第一智能设备对上述测试音频信息的语音识别结果。
图3为第一智能设备接收测试音频信息进行语音识别的示意图,如图3所示,第一智能设备在正常工作时的处理过程为:接收语音、对语音进行信号处理得到音频、对音频进行前端处理、使用解码器进行解码识别、输出识别结果。而在本实施例中,服务器中保存的为音频信息,因此,测试设备直接将从服务器读取到的测试音频信息输入到前端处理模块进行前端处理,再执行后续的识别和输出过程,而无需再执行接收语音和信号处理过程,因此,本实施例的方式能够明显减少第一智能设备的测试时间。
在如上述图3所示的处理过程中,第一智能设备使用解码器对测试音频信息进行解码识别后,可以由第一智能设备或者其他设备将识别结果写入测试日志中,进而,测试设备可以获取第一智能设备到该测试日志。可选的,该测试日志中包括第一智能设备所识别出的每句文本信息以及发出该句信息的时间信息等。
S203、根据上述测试日志中的上述语音识别结果,确定上述第一智能设备的语音测试结果。
可选的,第一智能设备的语音测试结果可以包括唤醒率、字准率、句准率等指标,不同的智能设备可以具有不同的测试结果指标。
以第一智能设备为智能音箱为例,假设智能音箱的测试结果指标包括唤醒率、字准率和句准率,当测试设备获取到智能音箱的语音测试结果后,可以对语音测试结果与录音时的标准识别结果进行匹配,并根据匹配结果统计智能音箱的唤醒率、字准率和句准率。
本实施例中,预先在与被测试智能设备品类相同的智能设备上录制得到音频信息,在对被测试智能设备进行测试时,直接使用已经录制的音频信息进行测试,并根据被测试设备识别音频信息时所输出的测试日志确定语音测试结果,这种方式仅需要一次录音,即可应用于同一品类的所有智能设备的语音识别测试中,因此,无需每次组织真人测试,极大减少人力成本。同时,每次测试时,被测试智能设备直接对音频进行识别,无需执行接收语音,对语音进行信号处理再得到音频信息的过程,因此,能够明显减少测试时间。另外,对于同一品类的智能设备,均使用同一套音频信息进行测试,因此能够保证测试结果的确定性。
对于智能音箱等智能设备来说,其内部的存储空间有限,因此,在从服务器读取音频信息并向这些智能设备输入时,如何使得数据输入既能不占用过多的存储空间,又能保证智能设备持续接收并识别音频信息,是需要解决的问题。
可选的,本发明实施例通过下述的交替输入以及读取识别的方式解决上述问题。
图4为本发明实施例提供的智能设备的语音测试方法的流程示意图,如图4所示,上述步骤S201中向第一智能设备输入测试音频信息,由第一智能设备读取和识别的一种可选方式为:
S401、交替从服务器向第一存储空间和第二存储空间中输入子音频,上述测试音频信息由多个按时间排列的子音频组成。
可选的,第一智能设备中可以包括第一存储空间和第二存储空间。测试设备可以交替向这两个存储空间中输入子音频。
其中,可选的,上述的测试音频信息可以为子音频的集合,每个子音频可以为一个音频文件,集合中的子音频按照生成的时间排列,在向第一智能设备输入时,按照生成时间从早到晚选择子音频进行输入。
S402、在向上述第一存储空间输入子音频时由上述第一智能设备从上述第二存储空间读取并识别子音频,在向上述第二存储空间输入子音频时由上述第一智能设备从上述第一存储空间读取并识别子音频。
即在本实施例中,交替向第一存储空间和第二存储空间输入子音频,在向第一存储空间输入子音频的同时由第一智能设备从第二存储空间读取识别子音频,在向第二存储空间输入子音频的同时由第一智能设备从第一存储空间读取识别子音频,因此,实现了不间断从服务器输入子音频的同时,第一智能设备可以不间断地读取识别子音频,从而使得在智能设备存储空间有限的情况下,仍然可以保证智能设备持续接收并识别音频信息。
一种可选方式中,在上述交替处理过程中,第一智能设备每次从第一存储空间读取并识别子音频后,可以将第一存储空间的音频的识别结果写入测试日志中,第一智能设备每次从第二存储空间读取并识别子音频后,可以将第二存储空间的音频的识别结果写入测试日志中。
图5为交替向第一智能设备输入子音频并由第一智能设备读取和识别的示意图,如图5所示,假设第一存储空间为A,第二存储空间为B,则上述步骤S402的处理过程可以为:
首先,测试设备可以向第一存储空间和第二存储空间分别输入一个子音频。
其中,所输入的子音频可以为服务器保存的测试音频信息中生成时间最早的两个子音频,或者,也可以为预设的内容为空的子音频。
进而,不断循环执行下述A-C,直至服务器保存的测试音频信息传输完毕。
A、由第一智能设备从第一存储空间读取并识别子音频。
B、若第一存储空间的子音频读取完毕,则由第一智能设备从第二存储空间读取并识别子音频,同时,向第一存储空间输入新的子音频。
即从第二存储空间读取并识别子音频与向第一存储空间输入新的子音频同时进行。
C、若第二存储空间的子音频读取完毕,则向第二存储空间输入新的子音频,同时,执行A。
即从第一存储空间读取并识别子音频与向第二存储空间输入新的子音频同时进行。
其中,上述图5中实线表示正在执行处理,虚线表示未执行处理。
以下说明通过第二智能设备录制得到上述的测试音频信息的过程。
图6为本发明实施例提供的智能设备的语音测试方法的流程示意图,如图6所示,在上述步骤S201之前,还包括:
S601、由上述第二智能设备接收待录制语音并对该待录制语音进行信号处理,得到该待录音语音对应的测试音频信息。
S602、将上述待录制语音对应的测试音频信息上传至服务器。
可选的,上述待录制语音可以是时间上连续的语音,即第二智能设备除了接收用户发出的语音,在用户未发出语音时,第二智能设备仍然采集周围环境中的声音,这种方式能够真实还原测试场景,使得测试结果更加准确。
图7为第二智能设备接收测试音频信息进行语音识别的示意图,如图7所示,第二智能设备在正常工作时的处理过程为:接收语音、对语音进行信号处理得到音频、对音频进行前端处理、使用解码器进行解码识别、输出识别结果。而在本实施例中,第二智能设备主要用于生成并上传测试音频信息,因此,在第二智能设备对语音进行信号处理得到音频后,测试设备可以将音频上传至服务器进行保存。但是值得说明的是,对于第二智能设备来说,其仍然可以按照图7所示的过程继续进行前端处理、解码识别等过程,这些过程得到的语音识别结果可以用于对第二智能设备的语音识别测试。
对于智能音箱等智能设备来说,其内部的存储空间有限,因此,在智能设备生成音频之后,如何使得音频既能不占用过多的存储空间,又能保证智能设备持续向服务器上传音频,是需要解决的问题。
可选的,本发明实施例通过下述的交替输入以及上传的方式解决上述问题。
图8为本发明实施例提供的智能设备的语音测试方法的流程示意图,如图8所示,上述步骤S602中向服务器上传测试音频信息的一种可选方式包括:
S801、交替向第三存储空间和第四存储空间中输入子音频,上述的待录制语音包括多个子语音,子语音经过信号处理得到子音频。
其中,可选的,在交替向第三存储空间和第四存储空间输入子音频时,按照生成子音频的时间从早到晚进行输入。
S802、在向第三存储空间输入子音频时由第一智能设备从第四存储空间读取并向服务器上传子音频,在向第四存储空间输入子音频时由第一智能设备从第三存储空间读取并并向服务器上传子音频。
即在本实施例中,交替向第一存储空间和第二存储空间输入经过对语音进行信号处理得到的子音频,在向第三存储空间输入子音频的同时由第一智能设备从第四存储空间读取并上传子音频,在向第四存储空间输入子音频的同时由第一智能设备从第三存储空间读取并上传子音频,因此,实现了不间断向第三存储空间和第四存储空间输入子音频的同时,第一智能设备可以不间断地向服务器上报子音频,从而使得在智能设备存储空间有限的情况下,仍然可以保证智能设备持续向服务器上报音频信息。
本实施例的具体执行过程与上述图5所示例的过程类似,可以参照上述图5所示过程,此处不再赘述。
作为一种可选的实施方式,上述步骤S203中根据测试日志中的语音识别结果,确定第一智能设备的语音测试结果时,可以根据测试日志中的语音识别结果,确定第一智能设备的不同版本之间的测试差异信息。
具体的,对于不同版本的第一智能设备,可以分别使用上述的测试音频信息进行测试,并分别得到每个版本的语音识别结果以及语音测试结果,通过对不同版本的语音测试结果进行比对分析,可以得到各版本之间的测试差异信息。该测试差异信息例如可以包括:唤醒率的差异、字准的差异、句准的差异等。
图9为本发明实施例提供的智能设备的语音测试装置的模块结构图,如图9所示,该装置包括:
输入模块901,用于向第一智能设备输入测试音频信息,由所述第一智能设备对所述测试音频信息进行识别,所述测试音频信息预先通过第二智能设备录制得到,所述第一智能设备与所述第二智能设备为品类相同的智能设备。
获取模块902,用于获取所述第一智能设备的测试日志,所述测试日志在所述第一智能设备对所述测试音频信息进行识别时生成,所述测试日志中包括所述第一智能设备对所述测试音频信息的语音识别结果。
确定模块903,用于根据所述测试日志中的所述语音识别结果,确定所述第一智能设备的语音测试结果。
该装置用于实现前述方法实施例,其实现原理和技术效果类似,此处不再赘述。
另一实施例中,所述第一智能设备中包括第一存储空间和第二存储空间;
输入模块901具体用于:
交替从服务器向所述第一存储空间和所述第二存储空间中输入子音频,所述测试音频信息由多个按时间排列的所述子音频组成。
在向所述第一存储空间输入子音频时由所述第一智能设备从所述第二存储空间读取并识别子音频,在向所述第二存储空间输入子音频时由所述第一智能设备从所述第一存储空间读取并识别子音频。
另一实施例中,输入模块901具体用于:
由所述第一智能设备将所述第二存储空间的音频的识别结果写入所述测试日志中;以及,
由所述第一智能设备将所述第一存储空间的音频的识别结果写入所述测试日志中。
另一实施例中,输入模块901具体用于:
向所述第一存储空间和所述第二存储空间分别输入一个子音频。
A、由所述第一智能设备从所述第一存储空间读取并识别子音频。
B、若所述第一存储空间的子音频读取完毕,则由所述第一智能设备从所述第二存储空间读取并识别子音频,同时,向所述第一存储空间输入新的子音频。
C、若所述第二存储空间的子音频读取完毕,则向所述第二存储空间输入新的子音频,同时,执行A。
循环执行A-C,直至所述测试音频信息输入完毕。
图10为本发明实施例提供的智能设备的语音测试装置的模块结构图,如图10所示,该装置还包括:
录制模块904,用于由所述第二智能设备接收待录制语音并对所述待录制语音进行信号处理,得到所述待录音语音对应的测试音频信息。
上传模块905,用于将所述待录制语音对应的测试音频信息上传至服务器。
另一实施例中,所述第二智能设备中包括第三存储空间和第四存储空间;
上传模块905具体用于:
交替向所述第三存储空间和所述第四存储空间中输入子音频,所述待录制语音包括多个子语音,子语音经过信号处理得到子音频。
在向所述第三存储空间输入子音频时由所述第一智能设备从所述第四存储空间读取并向所述服务器上传子音频,在向所述第四存储空间输入子音频时由所述第一智能设备从所述第三存储空间读取并并向所述服务器上传子音频。
另一实施例中,确定模块903具体用于:
根据所述测试日志中的所述语音识别结果,确定所述第一智能设备的不同版本之间的测试差异信息。
需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,确定模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上确定模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(application specific integrated circuit,ASIC),或,一个或多个微处理器(digital signal processor,DSP),或,一个或者多个现场可编程门阵列(field programmable gate array,FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(centralprocessing unit,CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上***(system-on-a-chip,SOC)的形式实现。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘solid state disk(SSD))等。
图11为本发明实施例提供的一种电子设备1100的结构示意图。如图11所示,该电子设备可以包括:处理器111、存储器112、通信接口113和***总线114,所述存储器112和所述通信接口113通过所述***总线114与所述处理器111连接并完成相互间的通信,所述存储器112用于存储计算机执行指令,所述通信接口113用于和其他设备进行通信,所述处理器111执行所述计算机程序时实现如上述图1至图8所示实施例的方案。
该图11中提到的***总线可以是外设部件互连标准(peripheral componentinterconnect,PCI)总线或扩展工业标准结构(extended industry standardarchitecture,EISA)总线等。所述***总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于实现数据库访问装置与其他设备(例如客户端、读写库和只读库)之间的通信。存储器可能包含随机存取存储器(random access memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
上述的处理器可以是通用处理器,包括中央处理器CPU、网络处理器(networkprocessor,NP)等;还可以是数字信号处理器DSP、专用集成电路ASIC、现场可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
可选的,本发明实施例还提供一种存储介质,所述存储介质中存储有指令,当其在计算机上运行时,使得计算机执行如上述图1至图8所示实施例的方法。
可选的,本发明实施例还提供一种运行指令的芯片,所述芯片用于执行上述图1至图8所示实施例的方法。
本发明实施例还提供一种程序产品,所述程序产品包括计算机程序,所述计算机程序存储在存储介质中,至少一个处理器可以从所述存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序时可实现上述图1至图8所示实施例的方法。
在本发明实施例中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系;在公式中,字符“/”,表示前后关联对象是一种“相除”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中,a,b,c可以是单个,也可以是多个。
可以理解的是,在本发明实施例中涉及的各种数字编号仅为描述方便进行的区分,并不用来限制本发明实施例的范围。
可以理解的是,在本发明的实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种智能设备的语音测试方法,其特征在于,包括:
向第一智能设备输入测试音频信息,由所述第一智能设备对所述测试音频信息进行识别,所述测试音频信息预先通过第二智能设备录制得到,所述第一智能设备与所述第二智能设备为品类相同的智能设备;
获取所述第一智能设备的测试日志,所述测试日志在所述第一智能设备对所述测试音频信息进行识别时生成,所述测试日志中包括所述第一智能设备对所述测试音频信息的语音识别结果;
根据所述测试日志中的所述语音识别结果,确定所述第一智能设备的语音测试结果。
2.根据权利要求1所述的方法,其特征在于,所述第一智能设备中包括第一存储空间和第二存储空间;
所述向第一智能设备输入测试音频信息,由所述第一智能设备对所述测试音频信息进行识别,包括:
交替从服务器向所述第一存储空间和所述第二存储空间中输入子音频,所述测试音频信息由多个按时间排列的所述子音频组成;
在向所述第一存储空间输入子音频时由所述第一智能设备从所述第二存储空间读取并识别子音频,在向所述第二存储空间输入子音频时由所述第一智能设备从所述第一存储空间读取并识别子音频。
3.根据权利要求2所述的方法,其特征在于,所述由所述第一智能设备从所述第二存储空间读取并识别子音频之后,还包括:
由所述第一智能设备将所述第二存储空间的音频的识别结果写入所述测试日志中;
所述由所述第一智能设备从所述第一存储空间读取并识别子音频之后,还包括:
由所述第一智能设备将所述第一存储空间的音频的识别结果写入所述测试日志中。
4.根据权利要求2或3所述的方法,其特征在于,所述在向所述第一存储空间输入子音频时由所述第一智能设备从所述第二存储空间读取并识别子音频,在向所述第二存储空间输入子音频时由所述第一智能设备从所述第一存储空间读取并识别子音频,包括:
向所述第一存储空间和所述第二存储空间分别输入一个子音频;
A、由所述第一智能设备从所述第一存储空间读取并识别子音频;
B、若所述第一存储空间的子音频读取完毕,则由所述第一智能设备从所述第二存储空间读取并识别子音频,同时,向所述第一存储空间输入新的子音频;
C、若所述第二存储空间的子音频读取完毕,则向所述第二存储空间输入新的子音频,同时,执行A;
循环执行A-C,直至所述测试音频信息输入完毕。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述向第一智能设备输入测试音频信息之前,还包括:
由所述第二智能设备接收待录制语音并对所述待录制语音进行信号处理,得到所述待录音语音对应的测试音频信息;
将所述待录制语音对应的测试音频信息上传至服务器。
6.根据权利要求5所述的方法,其特征在于,所述第二智能设备中包括第三存储空间和第四存储空间;
所述将所述待录制语音对应的测试音频信息上传至服务器,包括:
交替向所述第三存储空间和所述第四存储空间中输入子音频,所述待录制语音包括多个子语音,子语音经过信号处理得到子音频;
在向所述第三存储空间输入子音频时由所述第一智能设备从所述第四存储空间读取并向所述服务器上传子音频,在向所述第四存储空间输入子音频时由所述第一智能设备从所述第三存储空间读取并并向所述服务器上传子音频。
7.根据权利要求5或6所述的方法,其特征在于,所述根据所述测试日志中的所述语音识别结果,确定所述第一智能设备的语音测试结果,包括:
根据所述测试日志中的所述语音识别结果,确定所述第一智能设备的不同版本之间的测试差异信息。
8.一种智能设备的语音测试装置,其特征在于,包括:
输入模块,用于向第一智能设备输入测试音频信息,由所述第一智能设备对所述测试音频信息进行识别,所述测试音频信息预先通过第二智能设备录制得到,所述第一智能设备与所述第二智能设备为品类相同的智能设备;
获取模块,用于获取所述第一智能设备的测试日志,所述测试日志在所述第一智能设备对所述测试音频信息进行识别时生成,所述测试日志中包括所述第一智能设备对所述测试音频信息的语音识别结果;
确定模块,用于根据所述测试日志中的所述语音识别结果,确定所述第一智能设备的语音测试结果。
9.一种电子设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用并执行所述存储器中的程序指令,执行权利要求1-7任一项所述的方法步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质中存储有计算机程序,所述计算机程序用于执行权利要求1-7任一项所述的方法。
CN201910578108.1A 2019-06-28 2019-06-28 智能设备的语音测试方法、装置电子设备及可读存储介质 Pending CN110264995A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910578108.1A CN110264995A (zh) 2019-06-28 2019-06-28 智能设备的语音测试方法、装置电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910578108.1A CN110264995A (zh) 2019-06-28 2019-06-28 智能设备的语音测试方法、装置电子设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN110264995A true CN110264995A (zh) 2019-09-20

Family

ID=67923072

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910578108.1A Pending CN110264995A (zh) 2019-06-28 2019-06-28 智能设备的语音测试方法、装置电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN110264995A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111145737A (zh) * 2018-11-06 2020-05-12 中移(杭州)信息技术有限公司 语音测试方法、装置和电子设备
CN112860582A (zh) * 2021-03-26 2021-05-28 成都启英泰伦科技有限公司 一种本地语音识别模块生产测试方法
CN113470618A (zh) * 2021-06-08 2021-10-01 阿波罗智联(北京)科技有限公司 唤醒测试的方法、装置、电子设备和可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1650272A (zh) * 2002-04-26 2005-08-03 飞思卡尔半导体公司 指令缓存和减少存储器冲突的方法
US9093071B2 (en) * 2012-11-19 2015-07-28 International Business Machines Corporation Interleaving voice commands for electronic meetings
CN107516510A (zh) * 2017-07-05 2017-12-26 百度在线网络技术(北京)有限公司 一种智能设备自动化语音测试方法及装置
CN108538296A (zh) * 2017-03-01 2018-09-14 广东神马搜索科技有限公司 语音识别测试方法及测试终端
CN109754801A (zh) * 2019-01-15 2019-05-14 东莞松山湖国际机器人研究院有限公司 一种基于手势识别的语音交互***及方法
CN109920429A (zh) * 2017-12-13 2019-06-21 上海擎感智能科技有限公司 一种用于车载的语音识别数据处理方法及***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1650272A (zh) * 2002-04-26 2005-08-03 飞思卡尔半导体公司 指令缓存和减少存储器冲突的方法
US9093071B2 (en) * 2012-11-19 2015-07-28 International Business Machines Corporation Interleaving voice commands for electronic meetings
CN108538296A (zh) * 2017-03-01 2018-09-14 广东神马搜索科技有限公司 语音识别测试方法及测试终端
CN107516510A (zh) * 2017-07-05 2017-12-26 百度在线网络技术(北京)有限公司 一种智能设备自动化语音测试方法及装置
CN109920429A (zh) * 2017-12-13 2019-06-21 上海擎感智能科技有限公司 一种用于车载的语音识别数据处理方法及***
CN109754801A (zh) * 2019-01-15 2019-05-14 东莞松山湖国际机器人研究院有限公司 一种基于手势识别的语音交互***及方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111145737A (zh) * 2018-11-06 2020-05-12 中移(杭州)信息技术有限公司 语音测试方法、装置和电子设备
CN111145737B (zh) * 2018-11-06 2022-07-01 中移(杭州)信息技术有限公司 语音测试方法、装置和电子设备
CN112860582A (zh) * 2021-03-26 2021-05-28 成都启英泰伦科技有限公司 一种本地语音识别模块生产测试方法
CN113470618A (zh) * 2021-06-08 2021-10-01 阿波罗智联(北京)科技有限公司 唤醒测试的方法、装置、电子设备和可读存储介质

Similar Documents

Publication Publication Date Title
CN107516510B (zh) 一种智能设备自动化语音测试方法及装置
WO2019192261A1 (zh) 一种支付方式推荐方法、装置及设备
US10529336B1 (en) Filtering sensitive information
CN110264995A (zh) 智能设备的语音测试方法、装置电子设备及可读存储介质
CN108538296A (zh) 语音识别测试方法及测试终端
CN110908913B (zh) 一种回访机器人的测试方法、装置,电子设备及存储介质
CN111368013B (zh) 基于多账户的统一标识方法、***、设备和存储介质
CN107239403A (zh) 一种问题定位方法和设备
US20140188910A1 (en) Determining reliability of online post
CN110750530B (zh) 一种业务***及其数据核对方法
WO2020082829A1 (zh) 一种用户年龄预测方法、装置及设备
CN110164474A (zh) 语音唤醒自动化测试方法及***
CN112309565A (zh) 用于匹配药品信息和病症信息的方法、装置、电子设备和介质
CN112199261A (zh) 应用程序性能分析方法及装置、电子设备
CN109271453B (zh) 一种数据库容量的确定方法和装置
WO2017020794A1 (zh) 一种交互***的语音识别方法和装置
CN110335628A (zh) 智能设备的语音测试方法、装置及电子设备
US11308273B2 (en) Prescan device activation prevention
CN112069796A (zh) 一种语音质检方法、装置,电子设备及存储介质
CN110490101A (zh) 一种图片截取方法、装置及计算机存储介质
CN113555031B (zh) 语音增强模型的训练方法及装置、语音增强方法及装置
CN115269347A (zh) 一种存储性能测试方法、装置、介质和电子设备
CN114968725A (zh) 任务依赖关系校正方法、装置、计算机设备及存储介质
US20180122404A1 (en) Determining a behavior of a user utilizing audio data
CN104915352B (zh) 一种验证MapReduce环境下处理数据正确性的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20190920

Assignee: Shanghai Xiaodu Technology Co.,Ltd.

Assignor: BAIDU ONLINE NETWORK TECHNOLOGY (BEIJING) Co.,Ltd.

Contract record no.: X2021990000330

Denomination of invention: Voice test method, device, electronic device and readable storage medium of intelligent device

License type: Common License

Record date: 20210531

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190920