CN109243425A - 语音识别测试方法、装置、***、计算机设备及存储介质 - Google Patents

语音识别测试方法、装置、***、计算机设备及存储介质 Download PDF

Info

Publication number
CN109243425A
CN109243425A CN201810917052.3A CN201810917052A CN109243425A CN 109243425 A CN109243425 A CN 109243425A CN 201810917052 A CN201810917052 A CN 201810917052A CN 109243425 A CN109243425 A CN 109243425A
Authority
CN
China
Prior art keywords
server
audio
wake
equipment end
states
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810917052.3A
Other languages
English (en)
Inventor
王凯
张魁平
蒋琳
杜蕴璇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201810917052.3A priority Critical patent/CN109243425A/zh
Publication of CN109243425A publication Critical patent/CN109243425A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/01Assessment or evaluation of speech recognition systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/26Functional testing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了语音识别测试方法、装置、***、计算机设备及存储介质,其中方法可包括:服务端进行唤醒音频的播放;若接收到设备端上报的唤醒状态,则服务端进行待识别音频的播放,所述唤醒状态为设备端根据获取到的待测试智能设备输出的实时日志确定出待测试智能设备被唤醒后、向服务端上报的唤醒状态;服务端接收设备端上报的识别结果,并进行存储,所述识别结果为设备端从实时日志中获取的待测试智能设备针对待识别音频的识别结果。应用本发明所述方案,能够提升测试效率等。

Description

语音识别测试方法、装置、***、计算机设备及存储介质
【技术领域】
本发明涉及计算机应用技术,特别涉及语音识别测试方法、装置、***、计算机设备及存储介质。
【背景技术】
语音识别是智能设备获取用户意图的重要途径,在人工智能快速发展的今天,语音识别逐渐成为众多智能设备的标配。
业内通常采用播放音频的方式来对智能设备的语音识别能力进行测试,通过反复的测试和优化来提高智能设备的语音识别能力。相应地,如何快速的完成智能设备端到端的语音识别测试,已经成为影响产品研发进度和优化迭代速度的重要因素。
端到端的语音识别测试主要分为唤醒和识别两个过程,具体实现时,首先播放唤醒音频唤醒智能设备,当确定智能设备被唤醒后,播放待识别音频,智能设备会对待识别音频进行识别并返回识别结果。
但是,上述方式在实际应用中会存在一定的问题,如:一是开发测试工具的周期,对于每一个待测试的智能设备,都需要为其开发一套对应的工具,从工具的开发、调试到稳定可用大约需要一周的时间,严重影响了测试效率;二是工具的复用性,由于各智能设备使用的***、架构和编译环境等不同,无法提供一个通用的工具来对所有智能设备进行测试,导致需要不停的开发测试工具,从而进一步影响了测试效率。
【发明内容】
有鉴于此,本发明提供了语音识别测试方法、装置、***、计算机设备及存储介质。
具体技术方案如下:
一种语音识别测试方法,包括:
服务端进行唤醒音频的播放;
若接收到设备端上报的唤醒状态,则所述服务端进行待识别音频的播放,所述唤醒状态为所述设备端根据获取到的待测试智能设备输出的实时日志确定出所述待测试智能设备被唤醒后、向所述服务端上报的唤醒状态;
所述服务端接收所述设备端上报的识别结果,并进行存储,所述识别结果为所述设备端从所述实时日志中获取的所述待测试智能设备针对所述待识别音频的识别结果。
根据本发明一优选实施例,所述服务端进行唤醒音频的播放包括:
所述服务端进入就绪状态,若接收到所述设备端进入就绪状态后上报的就绪状态,则进行所述唤醒音频的播放。
根据本发明一优选实施例,所述服务端进入就绪状态之前,进一步包括:
所述服务端启动,进入等待所述设备端注册状态;
待所述设备端在所述服务端完成注册后,所述服务端进入就绪状态。
根据本发明一优选实施例,所述若接收到设备端上报的唤醒状态,则所述服务端进行待识别音频的播放包括:
所述服务端从所述唤醒音频播放完成开始计时,若在第一预定时长内接收到所述设备端上报的唤醒状态,则进行待识别音频的播放;
所述服务端接收所述设备端上报的识别结果,并进行存储包括:
所述服务端从所述待识别音频播放完成开始计时,若在第二预定时长内接收到所述设备端上报的识别结果,则对所述识别结果进行存储。
根据本发明一优选实施例,该方法进一步包括:若在所述第一预定时长内未接收到所述设备端上报的唤醒状态,则所述服务端执行以下预定处理:再次进行唤醒音频的播放,若在所述第一预定时长内接收到所述设备端上报的唤醒状态,则进行所述待识别音频的播放,否则,重复执行所述预定处理。
根据本发明一优选实施例,所述进行存储包括:所述服务端将所述识别结果存储到所创建的所述设备端对应的文本文件中;
该方法进一步包括:若在所述第二预定时长内未接收到所述设备端上报的识别结果,则所述服务端存放一个空行在所述文本文件中。
一种语音识别测试方法,包括:
设备端根据获取到的待测试智能设备输出的实时日志确定出所述待测试智能设备被唤醒,向服务端上报唤醒状态,所述待测试智能设备被所述服务端播放的唤醒音频唤醒;
所述设备端从所述实时日志中获取所述待测试智能设备针对所述服务端播放的待识别音频的识别结果,将所述识别结果上报给所述服务端进行存储,所述待识别音频为所述服务端接收到所述设备端上报的唤醒状态后进行播放的。
根据本发明一优选实施例,所述设备端向所述服务端上报唤醒状态之前,进一步包括:
所述设备端确定所述服务端进入就绪状态后,进入就绪状态,并将就绪状态上报给所述服务端,以便所述服务端进行所述唤醒音频的播放。
根据本发明一优选实施例,所述设备端确定所述服务端进入就绪状态之前,进一步包括:
所述设备端在所述服务端进行注册,注册成功,所述服务端进入就绪状态。
一种语音识别测试装置,包括:音频唤醒单元、音频测试单元以及结果存储单元;
所述音频唤醒单元,用于进行唤醒音频的播放;
所述音频测试单元,用于当接收到设备端上报的唤醒状态时,进行待识别音频的播放,所述唤醒状态为所述设备端根据获取到的待测试智能设备输出的实时日志确定出所述待测试智能设备被唤醒后上报的唤醒状态;
所述结果存储单元,用于接收所述设备端上报的识别结果,并进行存储,所述识别结果为所述设备端从所述实时日志中获取的所述待测试智能设备针对所述待识别音频的识别结果。
根据本发明一优选实施例,所述语音识别测试装置中进一步包括:第一预处理单元;
所述第一预处理单元,用于当所述语音识别测试装置进入就绪状态后,若接收到所述设备端进入就绪状态后上报的就绪状态,则通知所述音频唤醒单元执行自身功能。
根据本发明一优选实施例,所述第一预处理单元进一步用于,当所述语音识别测试装置启动并进入等待所述设备端注册状态后,为所述设备端在所述语音识别测试装置中完成注册,之后所述语音识别测试装置进入就绪状态。
根据本发明一优选实施例,所述音频测试单元进一步用于,从所述唤醒音频播放完成开始计时,若在第一预定时长内接收到所述设备端上报的唤醒状态,则进行待识别音频的播放;
所述结果存储单元进一步用于,从所述待识别音频播放完成开始计时,若在第二预定时长内接收到所述设备端上报的识别结果,则对所述识别结果进行存储。
根据本发明一优选实施例,所述音频测试单元进一步用于,若在所述第一预定时长内未接收到所述设备端上报的唤醒状态,则执行以下预定处理:通知所述音频唤醒单元再次进行唤醒音频的播放,若在所述第一预定时长内接收到所述设备端上报的唤醒状态,则进行所述待识别音频的播放,否则,重复执行所述预定处理。
根据本发明一优选实施例,所述结果存储单元将所述识别结果存储到所创建的所述设备端对应的文本文件中;
所述结果存储单元进一步用于,若在所述第二预定时长内未接收到所述设备端上报的识别结果,则存放一个空行在所述文本文件中。
一种语音识别测试装置,包括:唤醒上报单元以及结果上报单元;
所述唤醒上报单元,用于当根据获取到的待测试智能设备输出的实时日志确定出所述待测试智能设备被唤醒时,向服务端上报唤醒状态,所述待测试智能设备被所述服务端播放的唤醒音频唤醒;
所述结果上报单元,用于从所述实时日志中获取所述待测试智能设备针对所述服务端播放的待识别音频的识别结果,将所述识别结果上报给所述服务端进行存储,所述待识别音频为所述服务端接收到上报的唤醒状态后进行播放的。
根据本发明一优选实施例,所述语音识别测试装置中进一步包括:第二预处理单元;
所述第二预处理单元,用于当所述服务端进入就绪状态后,当所述语音识别测试装置进入就绪状态时,将就绪状态上报给所述服务端,以便所述服务端进行所述唤醒音频的播放。
根据本发明一优选实施例,所述第二预处理单元进一步用于,在所述服务端进行注册,注册成功,所述服务端进入就绪状态。
一种语音识别测试***,包括:如以上所述的两种语音识别测试装置。
一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如以上所述的方法。
一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如以上所述的方法。
基于上述介绍可以看出,采用本发明所述方案,不需要针对不同的待测试智能设备分别开发对应的测试工具,也就是说,本发明所述的包括设备端和服务端的测试工具可同时适用于各种待测试智能设备,具有很强的通用性,从而提升了测试效率等。
【附图说明】
图1为本发明所述语音识别测试方法第一实施例的流程图。
图2为本发明所述语音识别测试方法第二实施例的流程图。
图3为本发明所述语音识别测试方法的实现过程示意图。
图4为本发明所述语音识别测试装置第一实施例的组成结构示意图。
图5为本发明所述语音识别测试装置第二实施例的组成结构示意图。
图6示出了适于用来实现本发明实施方式的示例性计算机***/服务器12的框图。
【具体实施方式】
通过对大量智能设备进行测试发现,几乎所有的智能设备都会实时的打印详细日志,便于出现问题时排查和定位,而智能设备打印的实时日志中会包含语音识别测试所需的信息,如唤醒状态和识别结果等,在此基础上,本发明中提出了一种基于所述实时日志的语音识别测试方式(测试工具),从而提高了测试效率等。
根据业务逻辑的不同,可将本发明所述的测试工具分为设备端和服务端两部分,两部分可通过超文本传输协议(HTTP,HyperText Transfer Protocol)进行通信。其中,服务端主要负责音频的播放控制和识别结果的存储等,设备端主要负责从待测试智能设备的实时日志中查找设备状态和识别结果并上报给服务端等。
为了使本发明的技术方案更加清楚、明白,以下参照附图并举实施例,对本发明所述方案进行进一步说明。
显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
图1为本发明所述语音识别测试方法第一实施例的流程图。如图1所示,包括以下具体实现方式。
在101中,服务端进行唤醒音频的播放。
在102中,若接收到设备端上报的唤醒状态,则服务端进行待识别音频的播放,所述唤醒状态为设备端根据获取到的待测试智能设备输出的实时日志确定出待测试智能设备被唤醒后、向服务端上报的唤醒状态。
在103中,服务端接收设备端上报的识别结果,并进行存储,所述识别结果为设备端从实时日志中获取的待测试智能设备针对待识别音频的识别结果。
其中,服务端进入就绪状态,若接收到设备端进入就绪状态后上报的就绪状态,则可进行唤醒音频的播放。
在此之前,服务端启动,进入等待设备端注册状态,待设备端在服务端完成注册后,服务端可进入就绪状态。比如,服务端可获取设备端发送来的设备标识(deviceid),并创建一个文本文件,后续用于存放识别结果等,之后,服务端可进入就绪状态。deviceid具有唯一性,可以deviceid为key创建一个文本文件。
服务端进入就绪状态后,若接收到设备端进入就绪状态后上报的就绪状态,则可进行唤醒音频的播放,此时服务端将变为播放唤醒状态。播放唤醒音频可以是指播放预先设定的唤醒词。
若接收到设备端上报的唤醒状态,服务端可进一步进行待识别音频的播放。设备端可根据获取到的待测试智能设备输出的实时日志确定出待测试智能设备是否被唤醒,若是,则可向服务端上报唤醒状态。比如,设备端可查看待测试智能设备输出的实时日志中是否包含预先设定的唤醒词,若是,则可确定待测试智能设备被唤醒,进而可向服务端上报唤醒状态。
考虑到设备的状态具有时效性,本实施例中的服务端可进一步设置超时机制。比如,服务端可从唤醒音频播放完成开始计时,若在第一预定时长内接收到设备端上报的唤醒状态,则可进行待识别音频的播放。第一预定时长的具体取值可根据实际需要而定,比如可为2秒。若在播放唤醒音频之后的2秒之内服务端未接收到设备端上报的唤醒状态,服务端可认为待测试智能设备没有被唤醒,反之,则可进行待识别音频的播放。
设备的状态具有时效性,服务端通过设置2秒的超时机制,可避免出现由于网络延迟导致服务端获取到设备端上报的唤醒状态时待测试智能设备已退出唤醒状态的情况,从而保证了测试的顺利进行。
若在播放唤醒音频之后的2秒之内服务端未接收到设备端上报的唤醒状态,服务端还可执行以下预定处理:再次进行唤醒音频的播放,若在第一预定时长内接收到设备端上报的唤醒状态,则进行待识别音频的播放,否则,重复执行所述预定处理。也就是说,服务端可重复地进行唤醒音频的播放,直到待测试智能设备被唤醒。
服务端进入播放识别状态,进行待识别音频的播放,并等待设备端上报识别结果,若接收到设备端上报的识别结果,则进行存储,所述识别结果为设备端从实时日志中获取的待测试智能设备针对待识别音频的识别结果。
服务端可将接收到的识别结果存储到所创建的设备端对应的文本文件中。
类似地,服务端还可从待识别音频播放完成开始计时,若在第二预定时长内接收到设备端上报的识别结果,则可对识别结果进行存储。第二预定时长的具体取值同样可根据实际需要而定,比如30秒。
服务端将识别结果存储到文本文件中之后,可再次进入就绪状态。若在第二预定时长内未接收到设备端上报的识别结果,服务端可存放一个空行在文本文件中,这种情况下,服务端会认为待测试智能设备没有识别出待识别音频,从而存放一个空行在对应的文本文件中,并再次进入就绪状态。
再次进入就绪状态后,服务端可重复图1所示流程。
后续,可将文本文件中存储的各识别结果与待识别音频对应的标准识别结果进行比对,统计待测试智能设备的识别准确率等,从而对待测试智能设备的语音识别能力进行评估。
图2为本发明所述语音识别测试方法第二实施例的流程图。如图2所示,包括以下具体实现方式。
在201中,设备端根据获取到的待测试智能设备输出的实时日志确定出待测试智能设备被唤醒,向服务端上报唤醒状态,所述待测试智能设备被服务端播放的唤醒音频唤醒。
在202中,设备端从实时日志中获取待测试智能设备针对服务端播放的待识别音频的识别结果,将识别结果上报给服务端进行存储,所述待识别音频为服务端接收到设备端上报的唤醒状态后进行播放的。
设备端依赖于服务端,当服务端状态变化时,设备端的状态也会随之变化。
设备端启动后,可在服务端进行注册,注册成功,服务端进入就绪状态。比如,设备端可向服务端发送deviceid。
注册成功之后,设备端可主动获取服务端的状态,若服务端处于就绪状态,设备端也会立即进入就绪状态,并将就绪状态上报给服务端。
当服务端处于播放唤醒状态时,设备端可根据获取到的待测试智能设备输出的实时日志确定待测试智能设备是否被唤醒,若是,可向服务端上报唤醒状态。比如,设备端可查看实时日志中是否包含预先设定的唤醒词,若是,则可确定待测试智能设备被唤醒,进而可向服务端上报唤醒状态。
当服务端处于播放识别状态时,设备端可从实时日志中获取待测试智能设备针对服务端播放的待识别音频的识别结果,并将识别结果上报给服务端进行存储。
基于上述介绍,图3为本发明所述语音识别测试方法的实现过程示意图。
如图3所示,初始,服务端处于等待设备端注册状态,之后,设备端在服务端进行注册,如设备端向服务端发送deviceid,服务端可创建对应的文本文件,后续用于存放识别结果等,之后,服务端进入就绪状态。
设备端可主动获取服务端的状态,若服务端处于就绪状态,设备端也会立即进入就绪状态,并将就绪状态上报给服务端。服务端接收到设备端上报的就绪状态,确定设备端就绪,进入播放唤醒状态,进行唤醒音频的播放。
设备端根据实时日志确定待测试智能设备是否被唤醒,若是,则向服务端上报唤醒状态,服务端可从唤醒音频播放完开始计时,并确定是否在第一预定时长内接收到了设备端上报的唤醒状态,若是,则进入播放识别状态,进行待识别音频的播放,若否,执行以下预定处理:再次进行唤醒音频的播放,若在第一预定时长内接收到设备端上报的唤醒状态,则进行待识别音频的播放,否则,重复执行所述预定处理。
设备端可从实时日志中查找待测试智能设备针对待识别音频的识别结果,若能够查找到,则上报给服务端。服务端可从待识别音频播放完成开始计时,若在第二预定时长内接收到设备端上报的识别结果,则对识别结果进行存储,如存储到对应的文本文件中,并再次进入就绪状态,若在第二预定时长内未接收到设备端上报的识别结果,服务端可存放一个空行在文本文件中,并再次进入就绪状态。
需要说明的是,对于前述的各方法实施例,为了简单描述,将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
总之,采用本发明所述方案,将服务端与设备端分离,服务端只用于接收设备端传递的信息,因此,只要实现一个通用的设备端即可,而对于设备端来说,其只依赖于待测试智能设备输出的实时日志,而实时日志可以直接定向输出到个人计算机(PC,PersonalComputer)上,因此可以在PC上直接运行设备端程序,不需要依赖于待测试智能设备的***,从而可适用于各种不同的待测试智能设备,即不需要针对不同的待测试智能设备分别开发对应的测试工具,从而提升了测试效率。
另外,采用本发明所述方案,设备端独立运行于PC上,不占用待测试智能设备本身的资源,保证了测试结果的可靠性,
再有,在实际应用中,经常会遇到两个甚至更多个设备或版本对比测试的需求,采用本发明所述方案,将服务端与设备端分离,能够同时实现多台设备的对比测试。
以上是关于方法实施例的介绍,以下通过装置实施例,对本发明所述方案进行进一步说明。
图4为本发明所述语音识别测试装置第一实施例的组成结构示意图。如图4所示,包括:音频唤醒单元401、音频测试单元402以及结果存储单元403。
音频唤醒单元401,用于进行唤醒音频的播放。
音频测试单元402,用于当接收到设备端上报的唤醒状态时,进行待识别音频的播放,所述唤醒状态为设备端根据获取到的待测试智能设备输出的实时日志确定出待测试智能设备被唤醒后上报的唤醒状态。
结果存储单元403,用于接收设备端上报的识别结果,并进行存储,所述识别结果为设备端从实时日志中获取的待测试智能设备针对待识别音频的识别结果。
图4所示语音识别测试装置中还可进一步包括:第一预处理单元400,用于当语音识别测试装置进入就绪状态后,若接收到设备端进入就绪状态后上报的就绪状态,则通知音频唤醒单元401执行自身功能。
在此之前,第一预处理单元400还可当语音识别测试装置启动并进入等待设备端注册状态后,为设备端在语音识别测试装置中完成注册,之后语音识别测试装置进入就绪状态。
音频唤醒单元401进行唤醒音频的播放后,音频测试单元402可从唤醒音频播放完成开始计时,若在第一预定时长内接收到设备端上报的唤醒状态,则可进行待识别音频的播放。设备端可根据获取到的待测试智能设备输出的实时日志确定出待测试智能设备是否被唤醒,若是,则可向上报唤醒状态。
若在第一预定时长内未接收到设备端上报的唤醒状态,音频测试单元402可执行以下预定处理:通知音频唤醒单元401再次进行唤醒音频的播放,若在第一预定时长内接收到设备端上报的唤醒状态,则进行待识别音频的播放,否则,重复执行所述预定处理。
结果存储单元403可从待识别音频播放完成开始计时,若在第二预定时长内接收到设备端上报的识别结果,则对识别结果进行存储,所述识别结果为设备端从实时日志中获取的待测试智能设备针对待识别音频的识别结果。
结果存储单元403可将识别结果存储到所创建的设备端对应的文本文件中,另外,若在第二预定时长内未接收到设备端上报的识别结果,可存放一个空行在文本文件中。
图5为本发明语音识别测试装置第二实施例的组成结构示意图。如图5所示,包括:唤醒上报单元501以及结果上报单元502。
唤醒上报单元501,用于当根据获取到的待测试智能设备输出的实时日志确定出待测试智能设备被唤醒时,向服务端上报唤醒状态,待测试智能设备被服务端播放的唤醒音频唤醒。
结果上报单元502,用于从实时日志中获取待测试智能设备针对服务端播放的待识别音频的识别结果,将识别结果上报给服务端进行存储,所述待识别音频为服务端接收到上报的唤醒状态后进行播放的。
图5所示语音识别测试装置中还可进一步包括:第二预处理单元500,用于当服务端进入就绪状态后,当语音识别测试装置进入就绪状态时,将就绪状态上报给服务端,以便服务端进行唤醒音频的播放。
在此之前,第二预处理单元500还可在服务端进行注册,注册成功,服务端进入就绪状态。
当服务端进行唤醒音频的播放后,唤醒上报单元501可根据获取到的待测试智能设备输出的实时日志确定出待测试智能设备是否被唤醒,若是,可向服务端上报唤醒状态。比如,可查看实时日志中是否包含预先设定的唤醒词,若是,则可确定待测试智能设备被唤醒,进而可向服务端上报唤醒状态。
当服务端进行待识别语音的播放后,结果上报单元502可从实时日志中获取待测试智能设备针对服务端播放的待识别音频的识别结果,并将识别结果上报给服务端进行存储。
本发明同时公开了一种语音识别测试***,包括:如图4中所示的语音识别测试装置,以及,如图5中所示的语音识别测试装置。
图3、图4和图5所示装置和***实施例的具体工作流程请参照前述方法实施例中的相关说明,不再赘述。
图6示出了适于用来实现本发明实施方式的示例性计算机***/服务器12的框图。图6显示的计算机***/服务器12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机***/服务器12以通用计算设备的形式表现。计算机***/服务器12的组件可以包括但不限于:一个或者多个处理器(处理单元)16,存储器28,连接不同***组件(包括存储器28和处理器16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,***总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及***组件互连(PCI)总线。
计算机***/服务器12典型地包括多种计算机***可读介质。这些介质可以是任何能够被计算机***/服务器12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机***可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机***/服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例,存储***34可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括——但不限于——操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机***/服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机***/服务器12交互的设备通信,和/或与使得该计算机***/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机***/服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图6所示,网络适配器20通过总线18与计算机***/服务器12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机***/服务器12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
处理器16通过运行存储在存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现图1或图2所示实施例中的方法。
本发明同时公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时将实现如图1或图2所示实施例中的方法。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言-诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言-诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)-连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法等,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (21)

1.一种语音识别测试方法,其特征在于,包括:
服务端进行唤醒音频的播放;
若接收到设备端上报的唤醒状态,则所述服务端进行待识别音频的播放,所述唤醒状态为所述设备端根据获取到的待测试智能设备输出的实时日志确定出所述待测试智能设备被唤醒后、向所述服务端上报的唤醒状态;
所述服务端接收所述设备端上报的识别结果,并进行存储,所述识别结果为所述设备端从所述实时日志中获取的所述待测试智能设备针对所述待识别音频的识别结果。
2.根据权利要求1所述的方法,其特征在于,
所述服务端进行唤醒音频的播放包括:
所述服务端进入就绪状态,若接收到所述设备端进入就绪状态后上报的就绪状态,则进行所述唤醒音频的播放。
3.根据权利要求2所述的方法,其特征在于,
所述服务端进入就绪状态之前,进一步包括:
所述服务端启动,进入等待所述设备端注册状态;
待所述设备端在所述服务端完成注册后,所述服务端进入就绪状态。
4.根据权利要求1所述的方法,其特征在于,
所述若接收到设备端上报的唤醒状态,则所述服务端进行待识别音频的播放包括:
所述服务端从所述唤醒音频播放完成开始计时,若在第一预定时长内接收到所述设备端上报的唤醒状态,则进行待识别音频的播放;
所述服务端接收所述设备端上报的识别结果,并进行存储包括:
所述服务端从所述待识别音频播放完成开始计时,若在第二预定时长内接收到所述设备端上报的识别结果,则对所述识别结果进行存储。
5.根据权利要求4所述的方法,其特征在于,
该方法进一步包括:若在所述第一预定时长内未接收到所述设备端上报的唤醒状态,则所述服务端执行以下预定处理:再次进行唤醒音频的播放,若在所述第一预定时长内接收到所述设备端上报的唤醒状态,则进行所述待识别音频的播放,否则,重复执行所述预定处理。
6.根据权利要求4所述的方法,其特征在于,
所述进行存储包括:所述服务端将所述识别结果存储到所创建的所述设备端对应的文本文件中;
该方法进一步包括:若在所述第二预定时长内未接收到所述设备端上报的识别结果,则所述服务端存放一个空行在所述文本文件中。
7.一种语音识别测试方法,其特征在于,包括:
设备端根据获取到的待测试智能设备输出的实时日志确定出所述待测试智能设备被唤醒,向服务端上报唤醒状态,所述待测试智能设备被所述服务端播放的唤醒音频唤醒;
所述设备端从所述实时日志中获取所述待测试智能设备针对所述服务端播放的待识别音频的识别结果,将所述识别结果上报给所述服务端进行存储,所述待识别音频为所述服务端接收到所述设备端上报的唤醒状态后进行播放的。
8.根据权利要求7所述的方法,其特征在于,
所述设备端向所述服务端上报唤醒状态之前,进一步包括:
所述设备端确定所述服务端进入就绪状态后,进入就绪状态,并将就绪状态上报给所述服务端,以便所述服务端进行所述唤醒音频的播放。
9.根据权利要求8所述的方法,其特征在于,
所述设备端确定所述服务端进入就绪状态之前,进一步包括:
所述设备端在所述服务端进行注册,注册成功,所述服务端进入就绪状态。
10.一种语音识别测试装置,其特征在于,包括:音频唤醒单元、音频测试单元以及结果存储单元;
所述音频唤醒单元,用于进行唤醒音频的播放;
所述音频测试单元,用于当接收到设备端上报的唤醒状态时,进行待识别音频的播放,所述唤醒状态为所述设备端根据获取到的待测试智能设备输出的实时日志确定出所述待测试智能设备被唤醒后上报的唤醒状态;
所述结果存储单元,用于接收所述设备端上报的识别结果,并进行存储,所述识别结果为所述设备端从所述实时日志中获取的所述待测试智能设备针对所述待识别音频的识别结果。
11.根据权利要求10所述的语音识别测试装置,其特征在于,
所述语音识别测试装置中进一步包括:第一预处理单元;
所述第一预处理单元,用于当所述语音识别测试装置进入就绪状态后,若接收到所述设备端进入就绪状态后上报的就绪状态,则通知所述音频唤醒单元执行自身功能。
12.根据权利要求11所述的语音识别测试装置,其特征在于,
所述第一预处理单元进一步用于,当所述语音识别测试装置启动并进入等待所述设备端注册状态后,为所述设备端在所述语音识别测试装置中完成注册,之后所述语音识别测试装置进入就绪状态。
13.根据权利要求10所述的语音识别测试装置,其特征在于,
所述音频测试单元进一步用于,从所述唤醒音频播放完成开始计时,若在第一预定时长内接收到所述设备端上报的唤醒状态,则进行待识别音频的播放;
所述结果存储单元进一步用于,从所述待识别音频播放完成开始计时,若在第二预定时长内接收到所述设备端上报的识别结果,则对所述识别结果进行存储。
14.根据权利要求13所述的语音识别测试装置,其特征在于,
所述音频测试单元进一步用于,若在所述第一预定时长内未接收到所述设备端上报的唤醒状态,则执行以下预定处理:通知所述音频唤醒单元再次进行唤醒音频的播放,若在所述第一预定时长内接收到所述设备端上报的唤醒状态,则进行所述待识别音频的播放,否则,重复执行所述预定处理。
15.根据权利要求13所述的语音识别测试装置,其特征在于,
所述结果存储单元将所述识别结果存储到所创建的所述设备端对应的文本文件中;
所述结果存储单元进一步用于,若在所述第二预定时长内未接收到所述设备端上报的识别结果,则存放一个空行在所述文本文件中。
16.一种语音识别测试装置,其特征在于,包括:唤醒上报单元以及结果上报单元;
所述唤醒上报单元,用于当根据获取到的待测试智能设备输出的实时日志确定出所述待测试智能设备被唤醒时,向服务端上报唤醒状态,所述待测试智能设备被所述服务端播放的唤醒音频唤醒;
所述结果上报单元,用于从所述实时日志中获取所述待测试智能设备针对所述服务端播放的待识别音频的识别结果,将所述识别结果上报给所述服务端进行存储,所述待识别音频为所述服务端接收到上报的唤醒状态后进行播放的。
17.根据权利要求16所述的语音识别测试装置,其特征在于,
所述语音识别测试装置中进一步包括:第二预处理单元;
所述第二预处理单元,用于当所述服务端进入就绪状态后,当所述语音识别测试装置进入就绪状态时,将就绪状态上报给所述服务端,以便所述服务端进行所述唤醒音频的播放。
18.根据权利要求17所述的语音识别测试装置,其特征在于,
所述第二预处理单元进一步用于,在所述服务端进行注册,注册成功,所述服务端进入就绪状态。
19.一种语音识别测试***,其特征在于,包括:权利要求10-15中任一项所述的语音识别测试装置,以及,权利要求16-18中任一项所述的语音识别测试装置。
20.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~9中任一项所述的方法。
21.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1~9中任一项所述的方法。
CN201810917052.3A 2018-08-13 2018-08-13 语音识别测试方法、装置、***、计算机设备及存储介质 Pending CN109243425A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810917052.3A CN109243425A (zh) 2018-08-13 2018-08-13 语音识别测试方法、装置、***、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810917052.3A CN109243425A (zh) 2018-08-13 2018-08-13 语音识别测试方法、装置、***、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN109243425A true CN109243425A (zh) 2019-01-18

Family

ID=65070162

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810917052.3A Pending CN109243425A (zh) 2018-08-13 2018-08-13 语音识别测试方法、装置、***、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN109243425A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110379410A (zh) * 2019-07-22 2019-10-25 苏州思必驰信息科技有限公司 语音响应速度自动分析方法及***
CN111210817A (zh) * 2019-12-30 2020-05-29 深圳市优必选科技股份有限公司 数据处理方法及装置
CN111246200A (zh) * 2020-01-17 2020-06-05 四川长虹电器股份有限公司 智能电视唤醒率和误唤醒的自动化测试方法
CN111798833A (zh) * 2019-04-04 2020-10-20 北京京东尚科信息技术有限公司 一种语音测试方法、装置、设备和存储介质
CN113362806A (zh) * 2020-03-02 2021-09-07 北京奇虎科技有限公司 智能音响的评测方法、***、存储介质及其计算机设备
CN110164474B (zh) * 2019-05-08 2021-09-14 北京百度网讯科技有限公司 语音唤醒自动化测试方法及***
CN113470618A (zh) * 2021-06-08 2021-10-01 阿波罗智联(北京)科技有限公司 唤醒测试的方法、装置、电子设备和可读存储介质
CN113593549A (zh) * 2021-06-29 2021-11-02 青岛海尔科技有限公司 确定语音设备的唤醒率的方法及装置
CN113674769A (zh) * 2021-08-20 2021-11-19 湖北亿咖通科技有限公司 语音***测试方法、装置、设备、介质及程序产品
CN113707129A (zh) * 2021-08-30 2021-11-26 四川虹美智能科技有限公司 物联网设备中语音模块的自动化测试方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120252441A1 (en) * 2011-03-31 2012-10-04 Fujitsu Limited Mobile terminal device, self-diagnosis method and non-transitory, computer readable storage medium
KR20130053803A (ko) * 2011-11-16 2013-05-24 삼성전자주식회사 사용자 디바이스의 디버그 정보 제공 방법 및 시스템
CN107516510A (zh) * 2017-07-05 2017-12-26 百度在线网络技术(北京)有限公司 一种智能设备自动化语音测试方法及装置
CN107832214A (zh) * 2017-11-06 2018-03-23 广东欧珀移动通信有限公司 测试方法、装置、存储介质、终端设备及***
CN108021491A (zh) * 2017-12-28 2018-05-11 宇龙计算机通信科技(深圳)有限公司 终端日志抓取方法、装置及终端日志分析方法、装置
CN108228468A (zh) * 2018-02-12 2018-06-29 腾讯科技(深圳)有限公司 一种测试方法、装置、测试设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120252441A1 (en) * 2011-03-31 2012-10-04 Fujitsu Limited Mobile terminal device, self-diagnosis method and non-transitory, computer readable storage medium
KR20130053803A (ko) * 2011-11-16 2013-05-24 삼성전자주식회사 사용자 디바이스의 디버그 정보 제공 방법 및 시스템
CN107516510A (zh) * 2017-07-05 2017-12-26 百度在线网络技术(北京)有限公司 一种智能设备自动化语音测试方法及装置
CN107832214A (zh) * 2017-11-06 2018-03-23 广东欧珀移动通信有限公司 测试方法、装置、存储介质、终端设备及***
CN108021491A (zh) * 2017-12-28 2018-05-11 宇龙计算机通信科技(深圳)有限公司 终端日志抓取方法、装置及终端日志分析方法、装置
CN108228468A (zh) * 2018-02-12 2018-06-29 腾讯科技(深圳)有限公司 一种测试方法、装置、测试设备及存储介质

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111798833A (zh) * 2019-04-04 2020-10-20 北京京东尚科信息技术有限公司 一种语音测试方法、装置、设备和存储介质
CN111798833B (zh) * 2019-04-04 2023-12-01 北京京东尚科信息技术有限公司 一种语音测试方法、装置、设备和存储介质
CN110164474B (zh) * 2019-05-08 2021-09-14 北京百度网讯科技有限公司 语音唤醒自动化测试方法及***
CN110379410A (zh) * 2019-07-22 2019-10-25 苏州思必驰信息科技有限公司 语音响应速度自动分析方法及***
CN111210817A (zh) * 2019-12-30 2020-05-29 深圳市优必选科技股份有限公司 数据处理方法及装置
CN111246200A (zh) * 2020-01-17 2020-06-05 四川长虹电器股份有限公司 智能电视唤醒率和误唤醒的自动化测试方法
CN113362806A (zh) * 2020-03-02 2021-09-07 北京奇虎科技有限公司 智能音响的评测方法、***、存储介质及其计算机设备
CN113470618A (zh) * 2021-06-08 2021-10-01 阿波罗智联(北京)科技有限公司 唤醒测试的方法、装置、电子设备和可读存储介质
CN113593549A (zh) * 2021-06-29 2021-11-02 青岛海尔科技有限公司 确定语音设备的唤醒率的方法及装置
CN113674769A (zh) * 2021-08-20 2021-11-19 湖北亿咖通科技有限公司 语音***测试方法、装置、设备、介质及程序产品
CN113707129A (zh) * 2021-08-30 2021-11-26 四川虹美智能科技有限公司 物联网设备中语音模块的自动化测试方法
CN113707129B (zh) * 2021-08-30 2023-06-23 四川虹美智能科技有限公司 物联网设备中语音模块的自动化测试方法

Similar Documents

Publication Publication Date Title
CN109243425A (zh) 语音识别测试方法、装置、***、计算机设备及存储介质
CN108877791B (zh) 基于视图的语音交互方法、装置、服务器、终端和介质
WO2021259013A1 (zh) 数据处理方法、装置、电子设备及计算机可读介质
CN107277153A (zh) 用于提供语音服务的方法、装置和服务器
CN110417575A (zh) 运维监控平台的告警方法、装置和计算机设备
CN104246759A (zh) 应用程序接口测试服务
CN107516526A (zh) 一种声源跟踪定位方法、装置、设备和计算机可读存储介质
CN109710333A (zh) 寄宿应用的处理方法、设备及计算机可读存储介质
CN112286485B (zh) 通过语音控制应用的方法、装置、电子设备与存储介质
CN114528044B (zh) 一种接口调用方法、装置、设备及介质
CN109783345A (zh) 一种小程序性能测试方法和***
WO2022127196A1 (zh) 应用识别方法、装置、设备及存储介质
CN109346074A (zh) 一种语音处理方法及***
CN110826036A (zh) 用户操作行为安全性的识别方法、装置和电子设备
CN108696649A (zh) 图像处理方法、装置、设备及计算机可读存储介质
CN107943724A (zh) 一种寻找外接设备的方法、装置、终端设备及存储介质
CN109814915A (zh) 基于lua的参数配置方法、装置、介质和电子设备
JP2013198158A (ja) ハードウェアプロトコルスタック
EP3851803B1 (en) Method and apparatus for guiding speech packet recording function, device, and computer storage medium
CN107766070A (zh) 一种业务卡升级方法、装置、设备及计算机可读存储介质
CN109005469B (zh) 一种消息格式的转换方法、装置、存储介质及安卓终端
CN116633804A (zh) 网络流量检测模型的建模方法、防护方法及相关设备
CN103609193A (zh) 识别终端类型的方法及无线接入网设备
CN112379967B (zh) 模拟器检测方法、装置、设备及介质
CN105551500B (zh) 一种音频信号处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190118