CN109360550B - 语音交互***的测试方法、装置、设备和存储介质 - Google Patents
语音交互***的测试方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN109360550B CN109360550B CN201811493639.2A CN201811493639A CN109360550B CN 109360550 B CN109360550 B CN 109360550B CN 201811493639 A CN201811493639 A CN 201811493639A CN 109360550 B CN109360550 B CN 109360550B
- Authority
- CN
- China
- Prior art keywords
- text
- voice
- recognition
- test
- voice interaction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012360 testing method Methods 0.000 title claims abstract description 313
- 230000003993 interaction Effects 0.000 title claims abstract description 142
- 238000000034 method Methods 0.000 claims description 59
- 238000012795 verification Methods 0.000 claims description 53
- 230000008569 process Effects 0.000 claims description 28
- 230000004048 modification Effects 0.000 claims description 10
- 238000012986 modification Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 6
- 230000002452 interceptive effect Effects 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 238000010998 test method Methods 0.000 claims 1
- 230000015572 biosynthetic process Effects 0.000 description 11
- 238000003786 synthesis reaction Methods 0.000 description 11
- 238000004088 simulation Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/01—Assessment or evaluation of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/221—Announcement of recognition results
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明公开了一种语音交互***的测试方法、装置、设备和存储介质,所述测试方法包括:根据与文本测试数据对应的语音测试数据,与待测试的语音交互***进行语音交互;从所述语音交互***获取识别结果数据,所述识别结果数据由所述语音交互***响应所述语音交互识别得到;根据所述文本测试数据,对所述识别结果数据进行验证。本发明有效地简化整个语音交互***的测试流程,降低测试流程的耗时,并可以有效降低人力资源,降低人工的重复劳动。
Description
技术领域
本发明涉及计算机技术领域,特别是涉及一种语音交互***的测试方法、装置、设备和存储介质。
背景技术
现有语音交互***的测试中,较多关注的是语音交互***的输出结果准确性,但对于验证以及测试的过程都是通过人工进行。在人工测试流程中,需要大量人力资源、需要多人不断重复进行,以及需要人工统计数据;当修改内容或***更新后,仍然需要重复以上动作,非常耗时。
发明内容
为了克服上述缺陷,本发明要解决的技术问题是提供一种语音交互***的测试方法、装置、设备和存储介质,用以至少简化语音交互***的测试流程。
为解决上述技术问题,本发明实施例中的一种语音交互***的测试方法,包括:
根据与文本测试数据对应的语音测试数据,与待测试的语音交互***进行语音交互;
从所述语音交互***获取识别结果数据,所述识别结果数据由所述语音交互***响应所述语音交互识别得到;
根据所述文本测试数据,对所述识别结果数据进行验证。
可选地,所述根据与文本测试数据对应的语音测试数据,与待测试的语音交互***进行语音交互之前,包括:
响应录音请求;根据所述请求录制所述语音测试数据;和/或,
从预设的设备或存储位置调用所述语音测试数据;和/或,
根据所述文本测试数据,模拟生成所述语音测试数据。
可选地,所述根据所述请求录制所述语音测试数据之后,包括:
根据所述设备或存储位置,对录制的所述语音测试数据进行存储。
可选地,所述根据所述文本测试数据,模拟生成所述语音测试数据,包括:
根据所述文本测试数据,调用预设的从文本到语音合成工具模拟语音,以生成所述语音测试数据。
可选地,所述验证包括语音识别验证;所述根据所述文本测试数据,对所述识别结果数据进行验证,包括:
将所述识别结果数据中的识别文本与所述文本测试数据中的测试问句进行第一比对;所述识别文本为所述语音交互***响应所述语音交互时,对所述语音测试数据识别得到的文本;
根据所述第一比对的结果,进行所述语音识别验证。
可选地,所述将所述识别结果数据中的识别文本与所述文本测试数据中的测试问句进行第一比对,包括:
获取所述语音交互***的置信度;
在所述置信度高于预先配置的置信度阈值时,将所述识别结果数据中的第一识别文本与所述文本测试数据中的测试问句进行第一比对;所述第一识别文本为所述语音交互***根据第一语法对所述语音测试数据识别得到的文本;
在所述置信度低于预设的置信度阈值时,将所述识别结果数据中的第二识别文本与所述文本测试数据中的测试问句进行第一比对;所述第二识别文本为所述语音交互***根据第二语法对所述语音测试数据识别得到的文本。
可选地,所述验证还包括业务类别的流程验证;所述根据所述文本测试数据,对所述识别结果数据进行验证,还包括:
根据所述识别结果数据中的第一问答返回文本与所述文本测试数据中的测试问句所对应的第二问答返回文本进行第二比对;所述第一问答返回文本为所述语音交互***响应所述语音交互时,识别所述语音测试数据的问答得到的文本;
根据所述第二比对的结果,进行所述业务类别的流程验证。
可选地,所述根据所述文本测试数据,对所述识别结果数据进行验证之后,包括:
根据所述验证的结果,生成测试报告;所述测试报告用于指示对所述语音交互***进行错误修改和/或性能优化。
可选地,所述文本测试数据包括一个或多个测试问句以及与所述测试问句对应的业务类别、第一问答返回文本和语法文件;所述识别结果数据包括所述语音交互***响应所述语音交互的处理耗时和识别得到的识别文本以及与所述识别文本对应的业务类别、第二问答返回文本和语法文件;所述测试报告包括所述文本测试数据和所述识别结果数据。
为解决上述技术问题,本发明实施例中的一种语音交互***的测试装置,包括:
语音输入模块,用于根据与文本测试数据对应的语音测试数据,与待测试的语音交互***进行语音交互;
识别数据获取模块,用于从所述语音交互***获取识别结果数据,所述识别结果数据由所述语音交互***响应所述语音交互识别得到;
验证模块,用于根据所述文本测试数据,对所述识别数据获取模块获取的识别结果数据进行验证。
可选地,所述装置还包括:
语音数据获取模块,用于响应录音请求;根据所述请求录制所述语音测试数据;和/或,
用于从预设的设备或存储位置调用所述语音测试数据;和/或,
用于根据所述文本测试数据,模拟生成所述语音测试数据。
可选地,所述装置还包括:
语音数据存储模块,用于根据所述设备或存储位置,对录制的所述语音测试数据进行存储。
可选地,所述语音数据获取模块,在用于根据所述文本测试数据,模拟生成所述语音测试数据时,具体用于根据所述文本测试数据,调用预设的从文本到语音合成工具模拟语音,以生成所述语音测试数据。
可选地,所述验证包括语音识别验证;所述验证模块包括:
第一比对单元,用于将所述识别结果数据中的识别文本与所述文本测试数据中的测试问句进行第一比对;所述识别文本为所述语音交互***响应所述语音交互时,对所述语音测试数据识别得到的文本;
第一验证单元,用于根据所述第一比对的结果,进行所述语音识别验证。
可选地,所述第一比对单元,具体用于获取所述语音交互***的置信度;在所述置信度高于预先配置的置信度阈值时,将所述识别结果数据中的第一识别文本与所述文本测试数据中的测试问句进行第一比对;所述第一识别文本为所述语音交互***根据第一语法对所述语音测试数据识别得到的文本;在所述置信度低于预设的置信度阈值时,将所述识别结果数据中的第二识别文本与所述文本测试数据中的测试问句进行第一比对;所述第二识别文本为所述语音交互***根据第二语法对所述语音测试数据识别得到的文本。
可选地,所述验证还包括业务类别的流程验证;所述验证模块还包括:
第二比对单元,用于根据所述识别结果数据中的第一问答返回文本与所述文本测试数据中的测试问句所对应的第二问答返回文本进行第二比对;所述第一问答返回文本为所述语音交互***响应所述语音交互时,识别所述语音测试数据的问答得到的文本;
第二验证单元,用于根据所述第二比对的结果,进行所述业务类别的流程验证。
可选地,所述装置还包括:
报告生成模块,用于根据所述验证的结果,生成测试报告;所述测试报告用于指示对所述语音交互***进行错误修改和/或性能优化。
可选地,所述文本测试数据包括一个或多个测试问句以及与所述测试问句对应的业务类别、第一问答返回文本和语法文件;所述识别结果数据包括所述语音交互***响应所述语音交互的处理耗时和识别得到的识别文本以及与所述识别文本对应的业务类别、第二问答返回文本和语法文件;所述测试报告包括所述文本测试数据和所述识别结果数据。
为解决上述技术问题,本发明实施例中的一种电子设备,包括处理器和存储器;
所述存储器用于存储计算机指令,所述处理器用于运行所述存储器存储的计算机指令,以实现如上任一项所述方法的步骤。
为解决上述技术问题,本发明实施例中的一种计算机存储介质,存储有语音交互***的测试计算机程序;所述计算机程序可被至少一个处理器执行,以实现如上任意一项所述方法的步骤。
本发明各个实施例直接通过配置的语音测试数据,对语音交互***进行语音交互,从而可以收集语音交互***返回的识别结果数据,进而可以通过语音测试数据来对识别结果数据进行验证,从而简化整个语音交互***的测试流程,降低测试流程的耗时,并可以有效降低人力资源,降低人工的重复劳动。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是本发明实施例中一种语音交互***的测试方法的主流程图;
图2是本发明实施例中一种可选地语音交互***的测试方法的流程图;
图3是本发明实施例中一种语音交互***的测试装置的结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
使用用于区分元件的诸如“第一”、“第二”等前缀仅为了有利于本发明的说明,其本身没有特定的意义。
实施例一
本发明实施例提供一种语音交互***的测试方法,如图1所示,所述方法包括:
S101,根据与文本测试数据对应的语音测试数据,与待测试的语音交互***进行语音交互;
S102,从所述语音交互***获取识别结果数据,所述识别结果数据由所述语音交互***响应所述语音交互识别得到;
S103,根据所述文本测试数据,对所述识别结果数据进行验证。
其中,文本测试数据可以包括测试问句,以及测试问句对应的返回值或语法文件、业务类别名称等;业务类别主要用于区分语音测试数据所属的业务,例如用于银行自助业务。识别结果数据可以包括识别文本、问答返回文本、业务类别名称、语法文件等;其中识别文本为对语音测试数据识别得到的文本;问答返回文本为识别所述语音测试数据的问答,响应该问答得到的文本。
本发明实施例直接通过配置的语音测试数据,对语音交互***进行语音交互,从而可以收集语音交互***返回的识别结果数据,进而可以通过语音测试数据来对识别结果数据进行验证,从而简化整个语音交互***的测试流程,降低测试流程的耗时,并可以有效降低人力资源,降低人工的重复劳动。
当然,在具体实现过程中,在S101之前,可以将语音测试数据存储到对应数据库,并建立数据库索引;从而在执行S101时,可以根据数据库索引从相应的数据库中读取语音测试数据。
在本发明实施例的一些实施方式中,所述根据与文本测试数据对应的语音测试数据,与待测试的语音交互***进行语音交互之前,可以包括:
响应录音请求;根据所述请求录制所述语音测试数据;和/或,
从预设的设备或存储位置调用所述语音测试数据;和/或,
根据所述文本测试数据,模拟生成所述语音测试数据。
也就是说,在一些实施方式中,可以通过录音的方式、调用的方式以及模拟语音的方式来获取语音测试数据,从而使得本发明实施例中方法可以有效满足不同的测试场景。
其中,所述根据所述请求录制所述语音测试数据之后,可选地可以包括:根据所述设备或存储位置,对录制的所述语音测试数据进行存储。例如,通过预设的工具页面查找预置的录音界面进行录音,录音完成后可以选择试听确保自身录音与测试问句内容一致。语音测试数据保存在服务器固定目录下,可以反复调用,对指定接口进行测试。也就是说,将录制的语音测试数据进行存储后,在后续的测试过程中,可以直接调用该语音测试数据,从而无需人工进行多次录音,进而在录音场景中有效降低人力资源,进一步有效简化测试流程,并有效降低测试流程的耗时。
其中,所述根据所述文本测试数据,模拟生成所述语音测试数据,可选地包括:根据所述文本测试数据,调用预设的从文本到语音合成工具模拟语音,以生成所述语音测试数据。文本到语音合成工具可以为TTS(Text To Speech)合成工具。例如,通过TTS合成工具可以模拟男声与女声,虽然在合成的声音与真人声线略有差异,可能会与实际效果有所偏差,但是在测试内容导入后执行即可节约大量人力。也就是说,在一些实施方式中,通过的从文本到语音合成工具模拟语音,从而可以自动生成语音测试数据,而无需人工参与,进而有效降低人力资源,进一步有效简化测试流程,并有效降低测试流程的耗时。
在本发明实施例的一些实施方式中,所述验证包括语音识别验证;所述根据所述文本测试数据,对所述识别结果数据进行验证,可以包括:
将所述识别结果数据中的识别文本与所述文本测试数据中的测试问句进行第一比对;所述识别文本为所述语音交互***响应所述语音交互时,对所述语音测试数据识别得到的文本;
根据所述第一比对的结果,进行所述语音识别验证。在具体验证过程中,可以根据比对的结果进行标记。
也就是说,在一些实施方式中,通过将所述识别结果数据中的识别文本与所述文本测试数据中的测试问句进行第一比对,进而根据比对的结果,就可以实现语音识别验证,从而进一步简化测试流程。
其中,所述将所述识别结果数据中的识别文本与所述文本测试数据中的测试问句进行第一比对,可选地可以包括:
获取所述语音交互***的置信度;
在所述置信度高于预先配置的置信度阈值时,将所述识别结果数据中的第一识别文本与所述文本测试数据中的测试问句进行第一比对;所述第一识别文本为所述语音交互***根据第一语法对所述语音测试数据识别得到的文本;
在所述置信度低于预设的置信度阈值时,将所述识别结果数据中的第二识别文本与所述文本测试数据中的测试问句进行第一比对;所述第二识别文本为所述语音交互***根据第二语法对所述语音测试数据识别得到的文本。
其中,在所述置信度等于预先配置的置信度阈值时,可以将所述识别结果数据中的第一识别文本与所述文本测试数据中的测试问句进行第一比对,也可以将所述识别结果数据中的第二识别文本与所述文本测试数据中的测试问句进行第一比对。
其中,第一语法可以是小模型(语法);第二语法可以是大模型(语法)。语法是由语法文件确定的;例如小模型(语法)可能对应多个语法文件;大模型(语法)可能对应一个语法文件。
小模型(语法)是利用ASR技术(Automatic Speech Recognition)进行语音识别,但识别范围较小仅限在文件中编辑的内容。常解析文件的模块有NR(NuanceRecognition)。大模型(语法)是利用ASR技术(Automatic Speech Recognition)进行语音识别,识别范围包含较广但需要较多资源进行运行,所以多放在云端调用。常见的解析模块有NTE(Nuance Transcription Engine)。例如,语音测试数据进入语音交互***,通过NR调用小模型(语法)文件解析,通过NTE调用大模型(语法)文件解析;语音交互***计算置信度高于置信度阈值时,根据小模型结果输出返回内容;低于置信度阈值时,根据大模型结果输出返回内容;返回内容依照流程文件与语法文件的配置进行内容输出,语音交互***的前端播报对应的语音回复用户。
其中,语音识别验证主要用于单句识别,验证的正确规则包括:
置信度高于置信度阈值时,小模型(语法)识别结果包含测试问句;
置信度低于置信度阈值时,大模型(语法)识别结果包含测试问句。
验证的错误规则包括:
除识别正确的两项内容其余皆标记为错误。
当然,现有技术中需要人工多次测试,从而验证测试效果;而在本发明实施例中各语音***的置信度阈值可以设置在46到48,并且可以通过预设调整控件(例如按钮)对置信度阈值进行调整,从而将置信度阈值传输给语音交互***,使得语音交互***响应修改。
其中,所述验证还包括业务类别的流程验证;所述根据所述文本测试数据,对所述识别结果数据进行验证,可选地可以包括:
根据所述识别结果数据中的第一问答返回文本与所述文本测试数据中的测试问句所对应的第二问答返回文本进行第二比对;所述第一问答返回文本为所述语音交互***响应所述语音交互时,识别所述语音测试数据的问答得到的文本;
根据所述第二比对的结果,进行所述业务类别的流程验证。
在进行业务类别的流程验证时,所述文本测试数据还包括与业务类别对应的语音交互流程。
也就是说,所述根据所述识别结果数据中的第一问答返回文本与所述文本测试数据中的测试问句所对应的第二问答返回文本进行第二比对,可以包括:按照所述语音交互流程,根据所述识别结果数据中的第一问答返回文本与所述文本测试数据中的测试问句所对应的第二问答返回文本进行第二比对。
在业务类别的流程验证过程中,正确规则可以包括:
语音交互***的返回值(识别结果数据中的第一问答返回文本)与导入的数据(文本测试数据中的测试问句所对应的第二问答返回文本)相同
错误规则:
语音交互***的返回值与导入数据不同。
也就是说,在一些实施方式中,根据所述识别结果数据中的第一问答返回文本与所述文本测试数据中的测试问句所对应的第二问答返回文本进行第二比对,进而根据比对的结果,就可以实现业务类别的流程验证,从而进一步简化测试流程。
在本发明实施例的一些实施方式中,所述根据所述文本测试数据,对所述识别结果数据进行验证之后,可以包括:
根据所述验证的结果,生成测试报告;所述测试报告用于指示对所述语音交互***进行错误修改和/或性能优化。
也就是说,在一些实施方式中,无需人工参与即可生成测试报告,从而进一步简化语音交互***的测试流程。
其中,所述文本测试数据包括一个或多个测试问句以及与所述测试问句对应的业务类别、第一问答返回文本和语法文件;所述识别结果数据包括所述语音交互***响应所述语音交互的处理耗时和识别得到的识别文本以及与所述识别文本对应的业务类别、第二问答返回文本和语法文件;所述测试报告包括所述文本测试数据、所述识别结果数据和验证结果。
其中,在一些实施方式中,测试报告还可以包括测试耗时;测试耗时用于指示可根据预设的时间阈值,优化语音交互***中耗时大于时间阈值的逻辑模块。
例如,测试报告可以采用报表的形式,生成的报表可以包括了测试问句原文、语音交互***解析语音测试数据的文本形式的识别结果数据(大小2个模型的解析内容)、数据触发的语法文件(.Gram文件)、对应的标签(tag)、置信度、耗时、TTS性别、业务类别(根据语音项目客户需求人工填写,如银行语音***的余额查询功能,业务类别为余额查询流程。外呼催收流程,业务类别为催收本人同意流程或催收本人不同意流程,用来区分语句对应的内容属于那一项或哪个流程)、对错的判断结果。该报表为测试完成后最后的反馈表格,显示在专门的报表页面供用户查看、导出、分析使用。
本发明实施例提供的各种实施方式可以任意组合,从而可以得到一种具体的语音交互***的测试方法;并且上述的各个实施方式可以大量减少人力消耗,并通过生成反馈报告,通过直观的反馈内容改善及优化了错误修改的流程。
实施例二
本发明实施例基于实施例一,提供一种具体的语音交互***的测试方法,如图2所示,所述方法包括:
步骤1,导入文本测试数据。
步骤2,存储到相应的数据库,并建立数据库索引。文本测试数据中可以包括测试问句以及其对应的返回值或语法文件、类别名称。
步骤3,接收用户选择的语音测试数据的获取方式;选择录音方式执行步骤4;选择合成方式执行步骤6。
步骤4,进行录音:根据文本测试数据,通过预设的工具页面查找预置的录音界面进行录音,得到对应的语音测试数据,录音完成后可以选择试听确保自身录音与测试问句内容一致。
步骤5,语音测试数据保存在服务器固定目录下,可以反复调用,对指定接口进行测试;然后执行步骤7。
步骤6,根据文本测试数据,进行TTS合成,得到语音测试数据;然后执行步骤7。
步骤7,测试环境与参数配置,包括:配置语音交互***的接口、配置测试启动时间和配置置信度阈值。
步骤8,根据配置的参数,将对应的语音测试数据与待测试的语音交互***进行语音交互,从而进行测试。
步骤9,根据测试的结果,生成测试报告。
步骤10,存储测试报告。
步骤11,输出测试报告结果。
针对语音交互***的测试,现在绝大多数企业只能通过使用大量人力资源进行人工测试或上传语音批量测试。人工测试需要多人且不断重复进行测试识别率与流程的准确性,并且两者最后都需要人工统计数据,当修改内容或***更新后,需要重复以上动作,非常耗时。而本发明实施例可以有效解决这些问题,可以大量减少人力消耗,并通过生成反馈报告,通过直观的反馈内容,改善及优化错误修改的流程。
实施例三
本发明实施例提供一种语音交互***的测试装置,如图3所示,所述装置对应实施例一和实施例二中的方法,所述装置包括:
语音输入模块20,用于根据与文本测试数据对应的语音测试数据,与待测试的语音交互***进行语音交互;
识别数据获取模块22,用于从所述语音交互***获取识别结果数据,所述识别结果数据由所述语音交互***响应所述语音交互识别得到;
验证模块24,用于根据所述文本测试数据,对所述识别数据获取模块22获取的识别结果数据进行验证。
在本发明实施例的一些实施方式中,所述装置还包括:
语音数据获取模块,用于响应录音请求;根据所述请求录制所述语音测试数据;和/或,
用于从预设的设备或存储位置调用所述语音测试数据;和/或,
用于根据所述文本测试数据,模拟生成所述语音测试数据。
在本发明实施例的一些实施方式中,所述装置还包括:
语音数据存储模块,用于根据所述设备或存储位置,对录制的所述语音测试数据进行存储。
在本发明实施例的一些实施方式中,所述语音数据获取模块,在用于根据所述文本测试数据,模拟生成所述语音测试数据时,具体用于根据所述文本测试数据,调用预设的从文本到语音合成工具模拟语音,以生成所述语音测试数据。
在本发明实施例的一些实施方式中,所述验证包括语音识别验证;所述验证模块24包括:
第一比对单元,用于将所述识别结果数据中的识别文本与所述文本测试数据中的测试问句进行第一比对;所述识别文本为所述语音交互***响应所述语音交互时,对所述语音测试数据识别得到的文本;
第一验证单元,用于根据所述第一比对的结果,进行所述语音识别验证。
在本发明实施例的一些实施方式中,所述第一比对单元,具体用于获取所述语音交互***的置信度;在所述置信度高于预先配置的置信度阈值时,将所述识别结果数据中的第一识别文本与所述文本测试数据中的测试问句进行第一比对;所述第一识别文本为所述语音交互***根据第一语法对所述语音测试数据识别得到的文本;在所述置信度低于预设的置信度阈值时,将所述识别结果数据中的第二识别文本与所述文本测试数据中的测试问句进行第一比对;所述第二识别文本为所述语音交互***根据第二语法对所述语音测试数据识别得到的文本。
在本发明实施例的一些实施方式中,所述验证还包括业务类别的流程验证;所述验证模块24还包括:
第二比对单元,用于根据所述识别结果数据中的第一问答返回文本与所述文本测试数据中的测试问句所对应的第二问答返回文本进行第二比对;所述第一问答返回文本为所述语音交互***响应所述语音交互时,识别所述语音测试数据的问答得到的文本;
第二验证单元,用于根据所述第二比对的结果,进行所述业务类别的流程验证。
在本发明实施例的一些实施方式中,所述装置还包括:
报告生成模块,用于根据所述验证的结果,生成测试报告;所述测试报告用于指示对所述语音交互***进行错误修改和/或性能优化。
在本发明实施例的一些实施方式中,所述文本测试数据包括一个或多个测试问句以及与所述测试问句对应的业务类别、第一问答返回文本和语法文件;所述识别结果数据包括所述语音交互***响应所述语音交互的处理耗时和识别得到的识别文本以及与所述识别文本对应的业务类别、第二问答返回文本和语法文件;所述测试报告包括所述文本测试数据和所述识别结果数据。
实施例四
本发明实施例提供一种电子设备包括处理器和存储器;所述存储器用于存储计算机指令,所述处理器用于运行所述存储器存储的计算机指令,以实现如实施例一和实施例二中任意一项所述方法的步骤。
其中电子设备可以包括台式电脑和移动终端;移动终端可以包括手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant,PDA)、便捷式媒体播放器(Portable Media Player,PMP)、导航装置、可穿戴设备、智能手环、计步器等。
实施例五
本发明实施例提供一种计算机存储介质,其特征在于,所述介质存储有语音交互***的测试计算机程序;所述计算机程序可被至少一个处理器执行,以实现如实施例一和实施例二中任意一项所述方法的步骤。
需要说明的是,实施例三至实施例五的具体实现可以参阅实施例一和实施例二,具有相应的技术效果。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
Claims (8)
1.一种语音交互***的测试方法,其特征在于,所述方法包括:
根据与文本测试数据对应的语音测试数据,与待测试的语音交互***进行语音交互;
从所述语音交互***获取识别结果数据,所述识别结果数据由所述语音交互***响应所述语音交互识别得到;
根据所述文本测试数据,对所述识别结果数据进行验证;
所述验证包括语音识别验证;所述根据所述文本测试数据,对所述识别结果数据进行验证,包括:将所述识别结果数据中的识别文本与所述文本测试数据中的测试问句进行第一比对;所述识别文本为所述语音交互***响应所述语音交互时,对所述语音测试数据识别得到的文本;根据所述第一比对的结果,进行所述语音识别验证;
所述将所述识别结果数据中的识别文本与所述文本测试数据中的测试问句进行第一比对,包括:
获取所述语音交互***的置信度;
在所述置信度高于预先配置的置信度阈值时,将所述识别结果数据中的第一识别文本与所述文本测试数据中的测试问句进行第一比对;所述第一识别文本为所述语音交互***根据第一语法对所述语音测试数据识别得到的文本;
在所述置信度低于预设的置信度阈值时,将所述识别结果数据中的第二识别文本与所述文本测试数据中的测试问句进行第一比对;所述第二识别文本为所述语音交互***根据第二语法对所述语音测试数据识别得到的文本。
2.如权利要求1所述的方法,其特征在于,所述根据与文本测试数据对应的语音测试数据,与待测试的语音交互***进行语音交互之前,包括:
响应录音请求;根据所述请求录制所述语音测试数据;和/或,
从预设的设备或存储位置调用所述语音测试数据;和/或,
根据所述文本测试数据,模拟生成所述语音测试数据。
3.如权利要求1所述的方法,其特征在于,所述验证还包括业务类别的流程验证;所述根据所述文本测试数据,对所述识别结果数据进行验证,还包括:
根据所述识别结果数据中的第一问答返回文本与所述文本测试数据中的测试问句所对应的第二问答返回文本进行第二比对;所述第一问答返回文本为所述语音交互***响应所述语音交互时,识别所述语音测试数据的问答得到的文本;
根据所述第二比对的结果,进行所述业务类别的流程验证。
4.如权利要求1或2所述的方法,其特征在于,所述根据所述文本测试数据,对所述识别结果数据进行验证之后,包括:
根据所述验证的结果,生成测试报告;所述测试报告用于指示对所述语音交互***进行错误修改和/或性能优化。
5.如权利要求4所述的方法,其特征在于,所述文本测试数据包括一个或多个测试问句以及与所述测试问句对应的业务类别、第一问答返回文本和语法文件;所述识别结果数据包括所述语音交互***响应所述语音交互的处理耗时和识别得到的识别文本以及与所述识别文本对应的业务类别、第二问答返回文本和语法文件;所述测试报告包括所述文本测试数据和所述识别结果数据。
6.一种语音交互***的测试装置,其特征在于,所述装置包括:
语音输入模块,用于根据与文本测试数据对应的语音测试数据,与待测试的语音交互***进行语音交互;
识别数据获取模块,用于从所述语音交互***获取识别结果数据,所述识别结果数据由所述语音交互***响应所述语音交互识别得到;
验证模块,用于根据所述文本测试数据,对所述识别数据获取模块获取的识别结果数据进行验证;所述验证包括语音识别验证;所述根据所述文本测试数据,对所述识别结果数据进行验证,包括:将所述识别结果数据中的识别文本与所述文本测试数据中的测试问句进行第一比对;所述识别文本为所述语音交互***响应所述语音交互时,对所述语音测试数据识别得到的文本;根据所述第一比对的结果,进行所述语音识别验证;所述将所述识别结果数据中的识别文本与所述文本测试数据中的测试问句进行第一比对,包括:获取所述语音交互***的置信度;在所述置信度高于预先配置的置信度阈值时,将所述识别结果数据中的第一识别文本与所述文本测试数据中的测试问句进行第一比对;所述第一识别文本为所述语音交互***根据第一语法对所述语音测试数据识别得到的文本;在所述置信度低于预设的置信度阈值时,将所述识别结果数据中的第二识别文本与所述文本测试数据中的测试问句进行第一比对;所述第二识别文本为所述语音交互***根据第二语法对所述语音测试数据识别得到的文本;
报告生成模块,用于根据所述验证的结果,生成测试报告;所述测试报告用于指示对所述语音交互***进行错误修改和/或性能优化;
所述文本测试数据包括一个或多个测试问句以及与所述测试问句对应的业务类别、第一问答返回文本和语法文件;所述识别结果数据包括所述语音交互***响应所述语音交互的处理耗时和识别得到的识别文本以及与所述识别文本对应的业务类别、第二问答返回文本和语法文件;所述测试报告包括所述文本测试数据和所述识别结果数据。
7.一种电子设备,其特征在于,包括处理器和存储器;
所述存储器用于存储计算机指令,所述处理器用于运行所述存储器存储的计算机指令,以实现权利要求1至5中任一项所述的语音交互***的测试方法的步骤。
8.一种计算机存储介质,其特征在于,所述介质存储有语音交互***的测试计算机程序;所述计算机程序可被至少一个处理器执行,以实现如权利要求1至5中任意一项所述的语音交互***的测试方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811493639.2A CN109360550B (zh) | 2018-12-07 | 2018-12-07 | 语音交互***的测试方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811493639.2A CN109360550B (zh) | 2018-12-07 | 2018-12-07 | 语音交互***的测试方法、装置、设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109360550A CN109360550A (zh) | 2019-02-19 |
CN109360550B true CN109360550B (zh) | 2022-01-04 |
Family
ID=65331684
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811493639.2A Active CN109360550B (zh) | 2018-12-07 | 2018-12-07 | 语音交互***的测试方法、装置、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109360550B (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110581915B (zh) * | 2019-08-30 | 2021-02-19 | Oppo广东移动通信有限公司 | 稳定性测试方法、装置、存储介质及电子设备 |
CN110675857A (zh) * | 2019-09-23 | 2020-01-10 | 湖北亿咖通科技有限公司 | 一种语音识别自动化测试***及方法 |
CN110728975A (zh) * | 2019-10-10 | 2020-01-24 | 南京创维信息技术研究院有限公司 | 一种asr识别率自动化测试的***及方法 |
CN110838285A (zh) * | 2019-11-20 | 2020-02-25 | 青岛海尔科技有限公司 | 终端语音测试的***、方法及装置 |
CN111081252A (zh) * | 2019-12-03 | 2020-04-28 | 深圳追一科技有限公司 | 语音数据处理方法、装置、计算机设备和存储介质 |
CN113707128B (zh) * | 2020-05-20 | 2023-06-20 | 思必驰科技股份有限公司 | 用于全双工语音交互***的测试方法及*** |
CN113314149A (zh) * | 2021-04-19 | 2021-08-27 | 贵州电网有限责任公司 | 一种基于人工智能的电力调度智慧坐席指令优化方法 |
CN113608664B (zh) * | 2021-07-26 | 2024-06-18 | 京东科技控股股份有限公司 | 智能语音机器人交互效果优化方法、装置及智能机器人 |
CN113836010A (zh) * | 2021-09-14 | 2021-12-24 | 招商银行股份有限公司 | 语音智能客服自动化测试方法、***及存储介质 |
CN113782004B (zh) * | 2021-09-17 | 2023-10-24 | 深圳追一科技有限公司 | 人机语音交互测试方法、装置、计算机设备和存储介质 |
CN114006985A (zh) * | 2021-10-27 | 2022-02-01 | 易谷网络科技股份有限公司 | Ivr测试流程中音频测试方法、装置、设备及存储介质 |
CN114999494A (zh) * | 2022-05-20 | 2022-09-02 | 青岛海尔科技有限公司 | 语音交互功能的测试方法和装置、存储介质及电子装置 |
CN115171657A (zh) * | 2022-05-26 | 2022-10-11 | 青岛海尔科技有限公司 | 语音设备的测试方法和装置、存储介质 |
CN117809629B (zh) * | 2024-02-29 | 2024-05-24 | 青岛海尔科技有限公司 | 基于大模型的交互***更新方法、装置及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8050918B2 (en) * | 2003-12-11 | 2011-11-01 | Nuance Communications, Inc. | Quality evaluation tool for dynamic voice portals |
CN102723080B (zh) * | 2012-06-25 | 2014-06-11 | 惠州市德赛西威汽车电子有限公司 | 一种语音识别测试***及方法 |
CN107039050B (zh) * | 2016-02-04 | 2020-12-04 | 阿里巴巴集团控股有限公司 | 对待测试语音识别***的自动测试方法和装置 |
CN106448663B (zh) * | 2016-10-17 | 2020-10-23 | 海信集团有限公司 | 语音唤醒方法及语音交互装置 |
CN107221319A (zh) * | 2017-05-16 | 2017-09-29 | 厦门盈趣科技股份有限公司 | 一种语音识别测试***和方法 |
-
2018
- 2018-12-07 CN CN201811493639.2A patent/CN109360550B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109360550A (zh) | 2019-02-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109360550B (zh) | 语音交互***的测试方法、装置、设备和存储介质 | |
JP6799574B2 (ja) | 音声対話の満足度の確定方法及び装置 | |
JP7122341B2 (ja) | 翻訳品質を評価するための方法と装置 | |
US20210081611A1 (en) | Methods and systems for language-agnostic machine learning in natural language processing using feature extraction | |
CN115238101B (zh) | 一种面向多类型知识库的多引擎智能问答*** | |
CN112346567B (zh) | 基于ai的虚拟交互模型生成方法、装置及计算机设备 | |
JP5796496B2 (ja) | 入力支援システム、方法、およびプログラム | |
CN109325091B (zh) | 兴趣点属性信息的更新方法、装置、设备及介质 | |
CN111666746B (zh) | 会议纪要的生成方法及装置、电子设备及存储介质 | |
CN109949071A (zh) | 基于语音情绪分析的产品推荐方法、装置、设备和介质 | |
CN105657129A (zh) | 通话信息获取方法和装置 | |
CN108305618B (zh) | 语音获取及搜索方法、智能笔、搜索终端及存储介质 | |
CN105956053A (zh) | 一种基于网络信息的搜索方法及装置 | |
CN109801527B (zh) | 用于输出信息的方法和装置 | |
CN110619115B (zh) | 一种模板创建方法、装置、电子设备及存储介质 | |
CN110933225B (zh) | 通话信息获取方法、装置、存储介质及电子设备 | |
CN110543550B (zh) | 自动生成试题的方法和装置 | |
CN111177307A (zh) | 一种基于语义理解相似度阀值配置的测试方案及*** | |
CN110489747A (zh) | 一种图像处理方法、装置、存储介质及电子设备 | |
CN109460503A (zh) | 答案输入方法、装置、存储介质及电子设备 | |
CN111563029A (zh) | 对话机器人的测试方法、***、存储介质及计算机设备 | |
CN115509485A (zh) | 一种业务表单的填写方法、装置、电子设备和存储介质 | |
CN111354354B (zh) | 一种基于语义识别的训练方法、训练装置及终端设备 | |
CN112069833B (zh) | 日志分析方法、日志分析装置及电子设备 | |
CN112288584A (zh) | 保险报案处理方法、装置、计算机可读介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |