CN111627461A - 一种语音质检方法、装置、服务器及存储介质 - Google Patents
一种语音质检方法、装置、服务器及存储介质 Download PDFInfo
- Publication number
- CN111627461A CN111627461A CN202010474699.0A CN202010474699A CN111627461A CN 111627461 A CN111627461 A CN 111627461A CN 202010474699 A CN202010474699 A CN 202010474699A CN 111627461 A CN111627461 A CN 111627461A
- Authority
- CN
- China
- Prior art keywords
- regular expression
- quality inspection
- voice quality
- audio data
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007689 inspection Methods 0.000 title claims abstract description 262
- 238000000034 method Methods 0.000 title claims abstract description 148
- 230000014509 gene expression Effects 0.000 claims abstract description 368
- 238000006243 chemical reaction Methods 0.000 claims description 71
- 238000012545 processing Methods 0.000 claims description 17
- 238000004891 communication Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 230000008451 emotion Effects 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 4
- 238000003780 insertion Methods 0.000 claims description 4
- 230000037431 insertion Effects 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims 1
- 238000010276 construction Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 13
- 238000004364 calculation method Methods 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 238000012372 quality testing Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请实施例提供了一种语音质检方法、装置、服务器及存储介质,该方法包括:响应于终端设备发送的对目标音频数据的语音质检请求,获取所述目标音频数据对应的文本数据,所述目标音频数据为待语音质检的音频数据;获取为所述目标音频数据配置的第一规则表达式;对所述第一规则表达式进行转换,得到所述服务器能够解析的第二规则表达式;根据所述第二规则表达式以及所述文本数据确定对所述目标音频数据的语音质检结果;向所述终端设备发送所述语音质检结果。采用本申请,可以提升语音质检效率。另外,本申请涉及区块链技术,同时本申请可应用于智慧教育领域中,从而推动智慧城市的建设。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种语音质检方法、装置、服务器及存储介质。
背景技术
传统的语音质检工作通常由质检人员进行人工检测,这种质检方式在面对大量的音频数据时,需要花费大量时间。
为了避免这种情况,可以将规则引擎用于语音质检。目前,规则引擎进行语音质检主要通过以下两种方式实现:一种是穷举法,一种是递归法。所谓的穷举法,就是尽最大可能实现规则表达式中各个运算符相互之间的各种组合的逻辑以实现语音质检。这种方式最大的弊端是可能存在未考虑的组合情况,这将导致规则表达式无法匹配到相应文本,此外,穷举的方式也会消耗大量时间,语音质检效率低下。所谓的递归法,本质上是通过调用递归函数实现,即通过计算规则表达式中每一层括号内的内容,然后层层递归得到最终的递归结果以实现语音质检。然而,递归的方式较为复杂,过程非常繁琐,语音质检效率低下。
发明内容
本申请实施例提供了一种语音质检方法、装置、服务器及存储介质,可以提升语音质检效率。
第一方面,本申请实施例提供了一种语音质检方法,应用于服务器,包括:
响应于终端设备发送的对目标音频数据的语音质检请求,获取所述目标音频数据对应的文本数据,所述目标音频数据为待语音质检的音频数据;
获取为所述目标音频数据配置的第一规则表达式;
对所述第一规则表达式进行转换,得到所述服务器能够解析的第二规则表达式;
根据所述第二规则表达式以及所述文本数据确定对所述目标音频数据的语音质检结果;
向所述终端设备发送所述语音质检结果。
可选地,所述第一规则表达式的类型为中缀表达式,所述第二规则表达式的类型为后缀表达式或前缀表达式;
所述第一规则表达式包括至少一个操作数以及至少一个操作符,所述操作数为以下任一项:字、词或句,所述操作符为使所述至少一个操作数之间建立运算关系的符号。
可选地,所述对所述第一规则表达式进行转换,得到所述服务器能够解析的第二规则表达式,包括:
采用预设的转换方法对所述第一规则表达式进行表达式转换,得到所述服务器能够解析的第二规则表达式;所述转换方法包括堆栈转换的方法或表达式树转换的方法。
可选地,所述根据所述第二规则表达式以及所述文本数据确定对所述目标音频数据的语音质检结果,包括:
根据所述第二规则表达式对所述文本数据进行文本匹配,得到文本匹配结果,所述文本匹配结果包括文本匹配成功或失败的结果;
根据所述文本匹配结果获得对所述目标音频数据的语音质检结果。
可选地,所述第二规则表达式的类型为后缀表达式,所述根据所述第二规则表达式对所述文本数据进行文本匹配,得到文本匹配结果,包括:
从左向右扫描所述第二规则表达式中的各个数据;
如果所述数据为操作数,则将所述数据放入堆栈;
如果所述数据为操作符,则从堆栈中弹出所述数据关联的操作数,并根据由所述数据和所述数据关联的操作数构成的表达式对所述文本数据进行文本匹配,得到中间匹配结果以放入堆栈,直到扫描结束,根据堆栈包括的数据获得文本匹配结果。
可选地,所述根据所述文本匹配结果获得对所述目标音频数据的语音质检结果,包括:
当所述文本匹配结果还包括所述第二规则表达式中各个操作数的匹配详情信息时,将所述匹配详情信息作为对所述目标音频数据的语音质检结果,所述匹配详情信息包括以下至少一项:出现次数、出现时间、出现位置;和/或,
当所述文本匹配结果还包括所述第二规则表达式中各个操作数的匹配详情信息且所述匹配详情信息包括出现时间和/或出现位置时,根据所述匹配详情信息定位所述文本数据包括的所述第二规则表达式中各个操作数以进行标记,得到标记后的所述文本数据,并将标记后的所述文本数据作为对所述目标音频数据的语音质检结果。
可选地,所述根据所述文本匹配结果获得对所述目标音频数据的语音质检结果,包括:
当所述文本匹配结果还包括所述第二规则表达式中各个操作数的匹配详情信息时,根据所述匹配详情信息确定所述文本数据对应的目标角色的对话数据;所述匹配详情信息包括以下至少一项:出现次数、出现时间、出现位置;所述对话数据包括以下至少一项:语速、静音信息、抢插话信息、情绪信息、沟通评价信息;
将所述对话数据作为对所述目标音频数据的语音质检结果。
第二方面,本申请实施例提供了一种语音质检装置,应用于服务器,包括:
处理模块,用于响应于终端设备发送的对目标音频数据的语音质检请求,获取所述目标音频数据对应的文本数据,所述目标音频数据为待语音质检的音频数据;
所述处理模块,还用于获取为所述目标音频数据配置的第一规则表达式,对所述第一规则表达式进行转换,得到所述服务器能够解析的第二规则表达式,并根据所述第二规则表达式以及所述文本数据确定对所述目标音频数据的语音质检结果;
通信模块,用于向所述终端设备发送所述语音质检结果。
第三方面,本申请实施例提供了一种服务器,包括处理器、输入设备、输出设备和存储器,所述处理器、所述输入设备、所述输出设备和所述存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如第一方面所述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如第一方面所述的方法。
综上所述,服务器可以响应于终端设备发送的对目标音频数据的语音质检请求,获取该目标音频数据对应的文本数据,并获取为该目标音频数据配置的第一规则表达式以进行转换,得到服务器能够解析的第二规则表达式,从而根据该第二规则表达式以及该文本数据确定对该目标音频数据的语音质检结果以发送至终端设备,相较于现有技术采用穷举法或递归法实现语音质检的过程,本申请实施例通过表达式转换来实现语音质检的过程,能够提升语音质检效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1A是本申请实施例提供的一种规则表达式配置界面的示意图;
图1B是本申请实施例提供的另一种规则表达式配置界面的示意图;
图1C是本申请实施例提供的一种语音质检界面的示意图;
图1D是本申请实施例提供的另一种语音质检界面的示意图;
图1E是本申请实施例提供的另一种语音质检界面的示意图;
图2是本申请实施例提供的一种语音质检方法的流程示意图;
图3A是本申请实施例提供的一种语音质检过程的示意图;
图3B是本申请实施例提供的另一种语音质检过程的示意图;
图4是本申请实施例提供的另一种语音质检方法的流程示意图;
图5是本申请实施例提供的一种语音质检***的网络架构示意图;
图6是本申请实施例提供的一种语音质检装置的结构意图;
图7是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
本申请实施例提供了一种语音质检方案,能够提升语音质检效率。该语音质检方案可以由服务器执行。此处的服务器可以为一个服务器或服务器集群。在一个实施例中,该语音质检方案还可以由诸如笔记本电脑、台式电脑等智能终端来执行。在一个实施例中,所述的服务器或智能终端可以设置有至少一个规则引擎,该语音质检方案可以由该至少一个规则引擎来执行。至少一个为一个或多个。其中,本申请实施例的规则引擎是指一种能够实现语音质检中一个或多个功能的嵌入在应用程序的组件。当所述至少一个为多个时,多个规则引擎可以相同或不同,该语音质检方案中各个步骤可以由多个规则引擎中各个规则引擎分别执行。
在该语音质检方案中,服务器可以响应于终端设备发送的对目标音频数据的语音质检请求,获取该目标音频数据对应的文本数据。该目标音频数据是指待语音质检的音频数据。服务器还可以获取在将为目标音频数据配置的第一规则表达式进行转换后得到的服务器能够解析的第二规则表达式,并根据第二规则表达式以及该文本数据确定对该目标音频数据的语音质检结果,向终端设备发送该语音质检结果。此处的第二规则表达式是在将为该目标音频数据配置的第一规则表达式进行转换后得到的。
在一个实施例中,服务器获取在将为目标音频数据配置的第一规则表达式进行转换后得到的服务器能够解析的第二规则表达式的过程可以如下:服务器获取为该目标音频数据配置的第一规则表达式,并对该第一规则表达式进行转换,得到服务器能够解析的第二规则表达式。在该过程中,服务器可以实时进行表达式转换,得到第二规则表达式。在一个实施例中,服务器获取服务器能够解析的第二规则表达式的过程还可以如下:服务器获取保存的在将为目标音频数据配置的第一规则表达式进行转换后得到的服务器能够解析的第二规则表达式。在该过程中,服务器可以提前进行表达式转换,从而获取已有的第二规则表达式。
在一个实施例中,服务器可以输出一个规则表达式配置界面,该规则表达式界面可以用于设置规则表达式,如为该目标音频数据配置该第一规则表达式。
在一个应用场景中,参见如图1A所示的规则表达式配置界面,该规则表达式配置界面可以包括至少一个规则表达式的输入框,用户A可以基于该规则表达式输入框为目标音频数据配置第一规则表达式,并将为该目标音频数据配置的第一规则表达式提交至服务器。
在一个应用场景中,参见如图1B所示的规则表达式配置界面,该规则表达式配置界面可以包括规则表达式输入栏,该规则表达式输入栏可以包括选择数据框,用户A可以基于该数据选择框为该目标音频数据配置操作数和操作符。服务器可以获取通过数据选择框输入的操作数和操作符,并根据该操作数和操作符得到为目标音频数据配置的第一规则表达式,并将为该目标音频数据配置的第一规则表达式提交至服务器。
在一个实施例中,服务器可以输出一个语音质检界面。终端设备可以基于该语音质检界面向服务器发送对目标音频数据的语音质检请求。
在一个应用场景中,参见图1C所示的语音质检界面,用户B可以基于该语音质检界面导入目标音频数据或目标音频数据的标识,然后使用终端设备向服务器提交对目标音频数据的语音质检请求,该语音质检请求至少携带该目标音频数据或该目标音频数据的标识。其中,用户B可以与前述提及的用户A相同或不同。即,本申请实施例提交语音质检请求的用户与配置第一规则表达式的用户可以相同或不同。
在一个应用场景中,参见图1D所示的语音质检界面,用户B除了可以基于该语音质检界面导入目标音频数据或目标音频数据的标识之外,用户B还可以基于该语音质检界面设置需要使用的规则表达式标识,然后使用终端设备向服务器提交对该目标音频数据的语音质检请求,该语音质检请求至少携带该目标音频数据或该目标音频数据的标识,并且还可以携带该规则表达式标识。
在一个应用场景中,参见图1E所示的语音质检界面,用户B除了可以基于该语音质检界面导入目标音频数据或目标音频数据的标识之外,用户B还可以基于该语音质检界面为目标音频数据配置第一规则表达式,然后向服务器提交对该目标音频数据的语音质检请求,该语音质检请求指示携带该目标音频数据或该目标音频数据的标识,并且还可以携带为该目标音频数据配置的第一规则表达式。
在一个应用场景中,该语音质检请求可以携带终端设备对应的用户B的用户标识。或,该语音质检请求除了可以携带该用户B标识之外,还可以携带目标音频数据或目标音频数据的标识。或,该语音质检请求除了可以携带用户B标识之外,还可以携带规则表达式标识。或,该语音质检请求除了可以携带用户B标识之外,还可以携带规则表达式标识,并且还可以携带该目标音频数据或该目标音频数据的标识。
需要说明的是,以上仅为本方案提供的场景示例,本方案还可以应用于其它应用场景中,在此不一一列举。
在一个实施例中,为了进一步保障语音质检过程的安全性和可靠性,所述的语音质检方案可以结合区块链技术实现。所指的区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。所指的区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链的后台服务架构可以包括区块链底层平台、平台产品服务层以及应用服务层等。
例如,所述的服务器或智能终端可以为区块链网络中的节点。所述的区块链网络是指可以实现点与点之间数据共享的网络,该区块链网络可以包括多个节点。所述的终端设备可以接入该区块链网络,并通过该区块链网络向所述的服务器或智能终端发送对目标音频数据的语音质检请求。所述的服务器或智能终端上可以运行有基于区块链的智能合约。服务器可以通过该智能合约执行本申请所述的语音质检方案。所述的智能合约是在满足一定条件时而执行的代码实现。智能合约允许在没有第三方的情况下进行可信交易,并且这些交易可追溯不可逆转。
请参阅图2,为本申请实施例提供的一种语音质检方法的流程示意图。该方法可以应用于服务器,该服务器可以为一个服务器或服务器集群。具体地,该方法可以包括以下步骤:
S201、响应于终端设备发送的对目标音频数据的语音质检请求,获取所述目标音频数据对应的文本数据,所述目标音频数据为待语音质检的音频数据。
本申请实施例中,终端设备可以向服务器发送对目标音频数据的语音质检请求,服务器可以响应于终端设备发送的对该目标音频数据的语音质检请求,获取该目标音频数据对应的文本数据。
在一个实施例中,该语音质检请求可以携带该目标音频数据的标识,服务器获取该目标音频数据对应的文本数据的过程可以为服务器根据该目标音频数据的标识查询出该目标音频数据,并对该目标音频数据进行文本转换,得到该目标音频数据对应的文本数据。
在一个实施例中,该语音质检请求可以携带该目标音频数据,服务器获取该目标音频数据对应的文本数据的过程可以为服务器获取该语音质检请求携带的该目标音频数据,并对该目标音频数据进行文本转换,得到该目标音频数据对应的文本数据。
在一个实施例中,服务器对该目标音频数据进行文本转换,得到该目标音频数据对应的文本数据的过程可以为:服务器对该目标音频数据进行语音转写,得到转写文本结果,并对该转写文本结果进行文本标准化处理,得到标准化文本数据作为该目标音频数据对应的文本数据。采用该过程,能够使得该目标音频数据对应的文本数据更规范,更易于第二规则表达式的运算,可以提升语音质检过程的准确度以及效率。
其中,上述提及的转写文本结果可以包括以下至少一项:句文本结果和词文本结果。在一个实施例中,该转写文本结果还可以包括以下至少一项:角色结果、情绪结果、语速结果。上述提及的标准化文本数据可以包括标准化源文本。在一实施例中,该标准化文本数据还可以包括以下至少一项:标准化角色信息和标准化时间。
在一个实施例中,服务器对该转写文本结果进行文本标准化处理可以为服务器提取该转写文本结果包括的各个文本结果,并对该转写文本结果包括的各个文本结果进行拼接处理,得到多个拼接的文本作为标准化源文本。在一个实施例中,每个拼接的文本中的长度相同。每个拼接的文本可以携带该文本对应的标准化角色信息或标准化时间。在一个实施例中,该文本中各个词可以携带该词对应的标准化角色信息或标准化时间。
在一个实施例中,服务器可以是调用语音识别引擎或语音转写引擎等规则项引擎对该目标音频数据进行文本转换,得到该目标音频数据对应的文本数据。
S202、获取为所述目标音频数据配置的第一规则表达式。
其中,该第一规则表达式可以为一个或多个。
本申请实施例中,服务器获取为该目标音频数据配置的第一规则表达式的方式可以有多种。下面将简要列举几种,本申请实施例包括但不限于以下列举的几种方式。
在一个实施例中,该语音质检请求可以携带为该目标音频数据配置的第一规则表达式,服务器获取为该目标音频数据配置的第一规则表达式的方式可以为服务器获取该语音质检请求携带的为该目标音频数据配置的第一规则表达式。
在一个实施例中,该语音质检请求可以携带规则表达式标识。其中,规则表达式标识可以为用于唯一标识规则表达式的信息。服务器获取为该目标音频数据配置的第一规则表达式的方式可以为服务器查询出该规则表达式标识对应的规则表达式作为为该目标音频数据配置的第一规则表达式。
在一个实施例中,该语音质检请求可以携带终端设备对应的用户的用户标识。其中,用户标识可以为用于唯一标识用户的信息。服务器获取为该目标音频数据配置的第一规则表达式的方式可以为服务器查询出该用户标识对应的规则表达式集合,并从该规则表达式集合中确定出为该目标音频数据配置的第一规则表达式。
S203、对所述第一规则表达式进行转换,得到所述服务器能够解析的第二规则表达式。
本申请实施例中,当第一规则表达式为多个时,所述的对该第一规则表达式进行转换,得到服务器能够解析的第二规则表达式的过程可以为服务器对多个第一规则表达式进行转换,得到多个第一规则表达式中每个第一规则表达式对应的服务器能够接解析的第二规则表达式。其中,多个第一规则表达式中每个第一规则表达式不同。
其中,所述的第一规则表达式可以包括至少一个操作数以及至少一个操作符。该操作数为以下任一项:字、词或句,该操作符为使所述至少一个操作数之间建立运算关系的符号。该操作符还可以被称为运算符。在一个实施例中,该第一规则表达式的类型可以为中缀表达式,该第二规则表达式的类型可以为后缀表达式或前缀表达式。其中,后缀表达式又可以称为逆波兰表达式或逆波兰式。前缀表达式又可以称为波兰表达式或波兰式。
第一规则表达式对于人来讲更符合人的理解逻辑,用户较易配置,但对于计算机来讲可能较难解析,因此本申请实施例借用了中缀表达式转后缀表达式或前缀表达式的思想,通过将第一规则表达式转换为服务器更易解析的第二规则表达式,并将其应用在语音质检过程中,既使得表达式配置过程更加便捷,也使得服务器能够通过表达式转换快速进行语音质检,提升语音质检效率。需要说明的是,本申请实施例由于应用在语音质检的场景下,因此本申请实施例的操作数以及操作符不同于现有技术的算术运算数和算术运算符,基于此,本方案的第一规则表达式也就不同于现有技术的中缀表达式。相应地,本申请实施例的操作符的优先级也与现有技术的算术运算符的优先级存在一定差异,这就使得本申请实施例的转换过程中的操作符优先级比较过程与现有技术的转换过程中的操作符优先级比较过程存在差异,进而使得得到的第二规则表达式也不同于现有技术由算术运算数和算术运算符构成的后缀表达式或前缀表达式。
在一个实施例中,本申请实施例的操作符优先级可以参见表1。其中,表1展现的仅为语音质检所用到的部分操作符及其对应的优先级。本申请实施例还可以包括语音质检所用到的其它操作符及其对应的优先级,在此不一一列举。
表1
优先级 | 操作符 |
1 | 以{w1/w2/w3形式的}数据类型 |
2 | 以{w1,w2,w3形式的}数据类型 |
3 | () |
4 | no |
5 | bf、ne、ex |
6 | and |
7 | or |
下面将对能够用于本申请实施例的部分操作符进行简要阐述。其中:
(1)and表示并且,例如“W1 and W2”:要求“W1”“W2”两个都满足。其中,W1和W2均为举例的操作符。
(2)or表示或者,例如“W1 or W2”:要求“W1”“W2”任一个满足即可。
(3)bf表示之前,例如“W1 bf W2”:要求“W2”在“W1”的前面。
(4)ne表示附近,例如“W1 ne W2”:要求“W1”在“W2”的附近,近似于“(W1 bf W2)or(W2 bf W1)”。
(5)ex表示过滤。ex可以写为except。例如“W1 except W1W2”:要求出现“W1”但过滤掉“W1W2”。即出现“W1”但不能出现“W1W2”。
(6)no表示取反,不存在满足相应表达式的情况。
(7)(、)用于表达式的组合。例如,可以在括号内顿号左边设置一个表达式,并在括号内顿号右边设置一个表达式。
(8),用于多个关键词bf关系的串联,必须位于()之内,至少两个关键词,例如“{W1,W2,W3}”:要求W1后有W2,W2后有W3。
(9)/用于多个同义词的串联。例如“{W1/W2/W3}”:要求W1、W2、W3是同义词。
在一个实施例中,服务器对该第一规则表达式进行转换,得到该服务器能够解析的第二规则表达式的过程可以为服务器采用预设的转换方法对该第一规则表达式进行表达式转换,得到所述服务器能够解析的第二规则表达式。其中,该转换方法包括堆栈转换的方法或表达式树转换的方法。
在一个实施例中,当该转换方法包括堆栈转换的方法时,所述的采用预设的转换方法对该第一规则表达式进行表达式转换,得到服务器能够解析的第二规则表达式的过程可以为采用堆栈转换的方法对该第一规则表达式执行栈操作,得到该服务器能够解析的第二规则表达式。
下面将具体阐述当第一规则表达式的类型为中缀表达式,第二规则表达式的类型为后缀表达式时,如何采用预设的转换方法对该第一规则表达式进行表达式转换,得到服务器能够解析的第二规则表达式的过程。
在一个实施例中,当第一规则表达式的类型为中缀表达式,第二规则表达式的类型为后缀表达式,该转换方法包括堆栈转换的方法时,服务器采用预设的转换方法对该第一规则表达式进行表达式转换,得到服务器能够解析的第二规则表达式的过程如下:服务器从左向右扫描该第一规则表达式的各个数据;如果该数据为操作数,服务器则输出该数据;如果该数据为左括号,服务器则将该数据放入堆栈;如果该数据为右括号,服务器则从堆栈的栈顶依次弹出并输出操作符,直到遇到左括号为止;如果该数据为操作符,且不为左括号和右括号,服务器则根据该数据的优先级执行操作符入栈出栈操作,直到扫描结束,得到服务器能够解析的第二规则表达式。其中,数据可以用“data”表示,左括号可以用“(”表示,右括号可以用“)”表示。
在一个实施例中,服务器根据该数据的优先级执行操作符入栈出栈操作的过程可以为服务器比较该数据与栈顶的操作符的优先级,如果该数据的优先级高于栈顶的操作符的优先级,服务器则将该数据放入堆栈,如果该数据的优先级低于或等于栈顶的操作符的优先级,服务器则弹出并输出栈顶的操作符,将该数据放入堆栈。在一个实施例中,服务器可以直到遇到优先级低于该数据的操作符后,将该数据放入堆栈。在一个实施例中,如果扫描结束,但是堆栈中还有操作符,则从堆栈的栈顶依次弹出并输出堆栈包括的操作符,得到服务器能够解析的第二规则表达式。在一个实施例中,服务器包括但不限于通过查询表1等方式确定操作符的优先级。
举例来说,假设第一规则表达式的类型为中缀表达式,该第二规则表达式的类型为后缀表达式,该第一规则表达式为:好and(今or天)。服务器可以采用上述提及的堆栈转换的方法对此处的第一规则表达式进行表达式转换,得到服务器能够解析的第二规则表达式:好今天and or。
在一个实施例中,当第一规则表达式的类型为中缀表达式,第二规则表达式的类型为后缀表达式,该转换方法包括表达式树转换的方法时,服务器采用预设的转换方法对该第一规则表达式进行表达式转换,得到服务器能够解析的第二规则表达式的过程如下:服务器将该第一规则表达式转换为表达式树,该表达式树的叶子节点为该第一规则表达式包括的操作数,该表达式树的除该叶子节点之外的节点为该第一规则表达式包括的操作符;服务器后序遍历该表达式树,得到服务器能够解析的第二规则表达式。
下面将具体阐述当第一规则表达式的类型为中缀表达式,第二规则表达式的类型为前缀表达式时,如何采用预设的转换方法对该第一规则表达式进行表达式转换,得到服务器能够解析的第二规则表达式的过程。
在一个实施例中,当第一规则表达式的类型为中缀表达式,第二规则表达式的类型为前缀表达式,该转换方法包括堆栈转换的方法时,服务器采用预设的转换方法对该第一规则表达式进行表达式转换,得到服务器能够解析的第二规则表达式的过程如下:服务器从右向左扫描该第一规则表达式的各个数据;如果该数据为操作数,服务器则输出该数据;如果该数据为右括号,服务器则将该数据放入堆栈;如果该数据为左括号,服务器则从堆栈的栈顶依次弹出并输出操作符,直到遇到右括号为止;如果该数据为操作符,且不为右括号和左括号,服务器则根据该数据的优先级执行操作符入栈出栈操作,直到扫描结束,得到服务器能够解析的第二规则表达式。
在一个实施例中,当第一规则表达式的类型为中缀表达式,第二规则表达式的类型为前缀表达式,该转换方法包括表达式树转换的方法时,服务器采用预设的转换方法对该第一规则表达式进行表达式转换,得到服务器能够解析的第二规则表达式的过程如下:服务器将该第一规则表达式转换为表达式树,该表达式树的叶子节点为该第一规则表达式包括的操作数,该表达式树的除该叶子节点之外的节点为该第一规则表达式包括的操作符;服务器前序遍历该表达式树,得到第服务器能够解析的二规则表达式。
S204、根据所述第二规则表达式以及所述文本数据确定对所述目标音频数据的语音质检结果。
S205、向所述终端设备发送所述语音质检结果。
本申请实施例中,服务器可以根据该第二规则表达式以及该文本数据实现对该目标音频的语音质检过程,得到对该目标音频数据的语音质检结果。
在一个实施例中,服务器可以基于该文本数据运算该第二规则表达式,得到对该目标音频数据的语音质检结果。在这个过程中,服务器可以基于该文本数据运算该第二规则表达式,得到运算结果,并根据该运算结果获得对该目标音频数据的语音质检结果。
在一个实施例中,服务器根据该运算结果获得对该目标音频数据的语音质检结果的过程可以为服务器可以将运算结果作为对该目标音频数据的语音质检结果。
可见,图2所示的实施例中,服务器可以响应于终端设备发送的对目标音频数据的语音质检请求,获取该目标音频数据对应的文本数据,并获取为该目标音频数据配置的第一规则表达式以进行转换,得到服务器能够解析的第二规则表达式,从而根据该第二规则表达式以及该文本数据确定对该目标音频数据的语音质检结果以发送至终端设备,采用该过程能够提升语音质检效率。
如图3A所示,在图3A所示的语音质检过程中,服务器可以获取到第一规则表达式,并可以将该第一规则表达式转换为第二规则表达式。进一步地,服务器可以运算该第二规则表达式,得到语音质检结果。
如图3B所示,在图3B所示的语音质检过程中,服务器可以对目标音频数据进行文本转换,得到该目标音频数据对应的文本数据。其中,文本转换的过程可以包括语音转写和文本标准化处理。此处提及的文本数据可以记录在标准化源文件中,该标准化源文件可以包括标准化源文本。在一个实施例中,该标准化源文本还可以包括如图3B所示的标准化时间和标准化角色信息。其中,如何进行语音转写以及文本标准化处理的内容具体可以参见图2实施例,本申请实施例在此不做赘述。
此外,在图3B所示的语音质检过程中,服务器还可以获取到第一规则表达式,并将第一规则表达式转换为第二规则表达式。此处,服务器可以根据预设转换规则对该第一规则表达式执行栈操作,得到服务器能够解析的第二规则表达式。此处的预设转换规则可以是指前述提及的堆栈转换的方法对应的转换规则。这里,在根据预设转换规则对该第一规则表达式执行栈操作的过程中,服务器可以结合操作符的优先级来执行操作符入栈出栈操作。例如,服务器可以将扫描到的操作符(即当扫描到的数据为操作符时)与栈中的操作符(如栈顶的操作符)进行优先级排序,并依据排序结果来执行操作符入栈出栈操作。或,服务器可以将扫描扫描到的操作符与栈中的操作符进行优先级比较,并依据比较结果来执行操作符的入栈出栈操作。
进一步地,服务器可以基于前述提及的文本数据运算该第二规则表达式,得到对该目标音频数据的语音质检结果。即,服务器可以根据文本数据以及该第二规则表达式确定对该目标音频数据的语音质检结果。具体地,在图3B所示的语音质检过程中,服务器可以扫描第二规则表达式中的各个数据,并可以对该各个数据进行为操作符或操作符的判断。例如,服务器当确定该数据为不为操作符时,可以将该数据放入堆栈;当确定该数据为操作符时,可以从堆栈中弹出一定数量的操作数以构建表达式,从而根据该表达式对该文本数据进行文本匹配,得到中间匹配结果以放入堆栈,直到扫描结束,根据堆栈包括的数据获得文本匹配结果。在这个过程中,服务器可以获得弹出的操作数的匹配详情信息,如匹配次数(即出现次数)和位置(即出现位置)等信息。
后续,服务器可以基于该文本匹配结果获得对该目标音频数据的语音质检结果以进行输出。例如,服务器可以根据该操作数的匹配详情信息定位出该文本数据包括的该操作数以进行标记,并将标记后的文本数据作为对该目标音频数据的语音质检结果。或,服务器可以根据该操作数的匹配详情信息定位出该文本数据包括的该操作数,并提取该操作数关联的文本(如该操作数的出现位置所在预设位置范围内的文本和/或其它标准化文本中该操作数的出现位置所在预设位置范围内的文本)。当语音质检结果为多个时,服务器可以对该多个语音质检结果进行聚合,得到最终的语音质检结果。
请参阅图4,为本申请实施例提供的另一种语音质检方法的流程示意图。该方法可以应用于服务器,该服务器可以为一个服务器或服务器集群。具体地,该方法可以包括以下步骤:
S401、响应于终端设备发送的对目标音频数据的语音质检请求,获取所述目标音频数据对应的文本数据,所述目标音频数据为待语音质检的音频数据。
S402、获取为所述目标音频数据配置的第一规则表达式。
S403、对所述第一规则表达式进行转换,得到所述服务器能够解析的第二规则表达式。
其中,步骤S401和步骤S403可参见图2实施例中的步骤S201和步骤S203,本申请实施例在此不做赘述。
S404、根据所述第二规则表达式对所述文本数据进行文本匹配,得到文本匹配结果,所述文本匹配结果包括文本匹配成功或失败的结果。
S405、根据所述文本匹配结果获得对所述目标音频数据的语音质检结果。
S406、向所述终端设备发送所述语音质检结果。
步骤S404-S406主要讲述了如何基于该文本数据来运算该第二规则表达式,得到运算结果,并根据该运算结果获得对该目标音频数据的语音质检结果以发送至终端设备的过程。
具体地,服务器根据该第二规则表达式对该文本数据进行文本匹配,得到文本匹配结果,并根据该文本匹配结果获得对该目标音频数据的语音质检结果。其中,该文本匹配结果可以包括文本匹配成功或失败的结果。例如,文件匹配成功的结果可以用真true或1表示,文本匹配失败的结果可以用假false或0表示。当然,该文本匹配成功或失败的结果也可以用其它形式表示,本申请实施例对其不做限制。
在一个实施例中,服务器根据文本匹配结果获得对该目标音频数据的语音质检结果的过程可以为服务器将该文本匹配结果作为对该目标音频数据的语音质检结果。
下面将具体阐述当第二规则表达式的类型为后缀表达式时,如何根据所述第二规则表达式对所述文本数据进行文本匹配,得到文本匹配结果的过程。
在一个实施例中,当第二规则表达式的类型为后缀表达式时,服务器根据该第二规则表达式对该文本数据进行文本匹配,得到文本匹配结果的过程具体为:服务器从左向右扫描该第二规则表达式中的各个数据;如果该数据为操作数,服务器则将该数据放入堆栈;如果该数据为操作符,服务器则从堆栈中弹出该数据关联的操作数,并根据由该数据和该数据关联的操作数构成的表达式对该文本数据进行文本匹配,得到中间匹配结果以放入堆栈,直到扫描结束,根据堆栈包括的数据获得文本匹配结果。其中,该数据关联的操作数可以是指该数据运算时用到的操作数。该中间匹配结果可以包括文本匹配成功或失败的结果。例如,假设文本数据:今天是个好日子,第二规则表达式:好今天and or。服务器采用上述过程可以得到包括文本匹配成功的结果,如true的文本匹配结果。
下面将具体阐述当第二规则表达式的类型为前缀表达式时,如何根据所述第二规则表达式对所述文本数据进行文本匹配,得到文本匹配结果的过程。
在一个实施例中,当第二规则表达式的类型为前缀表达式时,服务器根据该第二规则表达式对该文本数据进行文本匹配,得到文本匹配结果的过程具体为:服务器从右向左扫描该第二规则表达式中的各个数据;如果该数据为操作数,服务器则将该数据放入堆栈;如果该数据为操作符,服务器则从堆栈中弹出该数据关联的操作数,并根据由该数据和该数据关联的操作数构成的表达式对该文本数据进行文本匹配,得到中间匹配结果以放入堆栈,直到扫描结束,根据堆栈包括的数据获得文本匹配结果。其中,该中间匹配结果可以包括文本匹配成功或失败的结果。
在一个实施例中,服务器还可以在根据由该数据和该数据关联的操作数构成的表达式对该文本数据进行文本匹配时,记录该关联的操作数的匹配详情信息,得到第二规则表达式中各个操作数的匹配详情信息。和/或,服务器还可以记录与该数据和该数据关联的操作数构成的表达式匹配的内容的匹配详情信息。和/或,服务器还可以记录与该第二规则表达式匹配的内容的匹配详情信息。在一个实施例中,该文本匹配结果还可以包括此处提及的匹配详情信息。
例如,假设文本数据:今天是个好日子,第二规则表达式:好今天and or。服务器除了可以得到文本匹配成功的结果,如true,还可以得到“今”的匹配详情信息,如出现次数1以及出现位置1。“天”的匹配详情信息,如出现次数1以及出现位置2、“好”的出现次数1以及出现位置5。再如,文本数据为“今天是个好日子很好”,该文本数据包括的各个词语对应的角色可以为:AAAAAAABB。第二规则表达式:B-好今天and or。其中,B-好表明角色B对应的好。服务器采用上述过程除了可以得到文本匹配成功的结果,如true,还可以得到、“B-好”的匹配详情信息,如出现次数1和出现位置9,“今”的匹配详情信息,如出现次数1和出现位置1,“天”的匹配详情信息,如出现次数1和出现位置2。
根据实际语音质检场景的不同,相应地,得到的对该目标音频数据的语音质检结果也可能不同。下面将简要列举几种根据该文本匹配结果获得对该目标音频数据的语音质检结果的方式。
在一个实施例中,服务器根据该文本匹配结果获得对该目标音频数据的语音质检结果的过程可以为当该文本匹配结果还包括前述提及的匹配详情信息(如第二规则表达式中各个操作数的匹配详情信息)时,服务器将该匹配详情信息作为对该目标音频数据的语音质检结果,其中,该匹配详情信息包括以下至少一项:出现次数、出现时间、出现位置。在一个实施例中,服务器可以将该匹配详情信息以及该文本匹配结果包括的文本匹配成功或失败的结果作为对该目标音频数据的语音质检结果。
和/或,当该文本匹配结果还包括前述提及的匹配详情信息(如第二规则表达式中各个操作数的匹配详情信息)且该匹配详情信息包括出现时间和/或出现位置时,服务器根据该匹配详情信息定位该文本数据包括的该匹配详情信息对应的数据以进行标记,得到标记后的该文本数据,并将标记后的该文本数据作为对该目标音频数据的语音质检结果。其中,此处的标记方式包括但不限于高亮、加粗、下划线等方式。
例如,当该文本匹配结果还包括该第二规则表达式中各个操作数的匹配详情信息且该匹配详情信息包括出现时间和/或出现位置时,服务器可以根据该匹配详情信息定位该文本数据包括的该第二规则表达式中各个操作数以进行标记,得到标记后的该文本数据,并将标记后的该文本数据作为对该目标音频数据的语音质检结果。再如,当该文本匹配结果还包括与该第二规则表达式匹配的内容的匹配详情信息且该匹配详情信息包括出现时间和/或出现位置时,服务器可以根据该匹配详情信息定位该文本数据包括的与该第二规则表达式匹配的内容以进行标记,得到标记后的该文本数据,并将标记后的该文本数据作为对该目标音频数据的语音质检结果。
在一个实施例中,服务器可以确定该目标音频对应的质检方式,如果质检方式为内容检测(如关键词检测),则执行以下至少一个步骤:将该匹配详情信息作为对该目标音频数据的语音质检结果;根据该匹配详情信息定位该文本数据包括的该匹配详情信息对应的数据以进行标记,得到标记后的该文本数据,并将标记后的该文本数据作为对该目标音频数据的语音质检结果。在一个实施例中,服务器确定该目标音频对应的质检方式的过程,可以是服务器确定该语音质检请求指示的质检方式。例如,当该语音质检请求为内容检测请求时,该确定该语音质检请求指示的质检方式为内容检测,或当该语音质检请求携带的质检方式为内容检测时,可以确定该语音质检请求指示的质检方式为内容检测。
在一个实施例中,服务器根据该文本匹配结果获得对该目标音频数据的语音质检结果的过程为当该文本匹配结果还包括前述提及的匹配详情信息(如第二规则表达式包括的各个操作数的匹配详情信息)时,服务器根据该匹配详情信息确定该文本数据对应的目标角色的对话数据。该目标角色可以为该文本数据对应的至少一个角色中的任一角色。例如,对于呼叫中心,该目标角色可以为服务人员,也可以为客户。其中,此处的匹配详情信息可以包括以下至少一项:出现次数、出现时间、出现位置。此处的对话数据可以包括以下至少一项:语速、静音信息(如静音时长)、抢插话信息(如是否抢插话的结果、抢插话次数、情绪信息(如情绪类型)、沟通评价信息(如沟通方式是否符合标准的结果)。服务器将该对话数据作为对该目标音频数据的语音质检结果。在一个实施例中,服务器还可以将该对话数据以及匹配详情信息作为对该目标音频数据的语音质检结果。
在一个实施例中,服务器可以确定该目标音频对应的质检方式,如果质检方式为对话检测,则执行根据该匹配详情信息确定该文本数据对应的目标角色的对话数据的步骤。在一个实施例中,服务器确定该目标音频对应的质检方式的过程,可以是服务器确定该语音质检请求指示的质检方式。例如,当该语音质检请求为对话检测请求时,该确定该语音质检请求指示的质检方式为对话检测,或当该语音质检请求携带的质检方式为对话检测时,可以确定该语音质检请求指示的质检方式为对话检测。
在一个实施例中,服务器根据该文本匹配结果获得对该目标音频数据的语音质检结果的过程为当该文本匹配结果还包括前述提及的匹配详情信息(如第二规则表达式包括的各个参数的匹配详情信息)时,服务器可以根据预设评分规则以及该匹配详情信息确定指定角色的质检分数,并将该质检分数作为对该目标音频数据的语音质检结果。其中,该指定角色可以与前述提及的目标角色相同或不同。
在一个实施例中,服务器可以确定该目标音频对应的质检方式,如果质检方式为质检评分,则执行根据预设评分规则以及该匹配详情信息确定指定角色的质检分数的步骤。
可见,图4所示的实施例中,服务器可以根据所述第二规则表达式对所述文本数据进行文本匹配,得到文本匹配结果,并根据文本匹配结果获得对目标音频数据的语音质检结果,从而提升获得语音质检结果的准确度。
本申请可应用于智慧教育领域中,从而推动智慧城市的建设。如,可以通过本申请所述的语音质检方法对教师等人员的音频数据进行语音质检,从而获取对这些人员的音频数据的语音质检结果,以用于优化教学过程。
例如,在直播行业迅猛发展的今天,为了保障教学直播质量,可以采用本申请所述的语音质检方法对教师直播过程中的音频数据(包括教师的音频数据或包括教师的音频数据和学生的音频数据)进行语音质检,从而得到该音频数据对应的能够用于对教师教学质量评价的语音质检结果,该语音质检结果可以反映教师的教学水平。例如,该语音质检结果可以为教师的对话数据或教师的质检分数等数据。除了对直播过程中的音频数据进行语音质检,本申请也可以对已录制的音频数据进行语音质检,本申请在此不做赘述。
再如,为了了解学生在教师教学过程中的学习状态,也可以采用本申请所述的语音质检方法对教师直播过程中的音频数据(包括学生的音频数据或包括学生的音频数据和教师的音频数据)进行语音质检,从而得到该音频数据对应的能够用于对学生学习状态评价的语音质检结果,该语音质检结果能够反应学生的学习情况。例如,该语音质检结果可以为学生的对话数据等数据。除了可以对直播过程中的音频数据进行语音质检,本申请也可以用于对已录制的音频数据进行语音质检,在此不做赘述。
再如,在多名教师竞赛以从多名教师中确认出最优秀的教师时,也可以采用本申请所述的语音质检方法对各个教师的音频数据进行语音质检,从而得到能够各个教师的音频数据对应的语音质检结果,如各教师的对话数据或各教师的教学质量评分等信息。该各教师的语音质检结果可以作为从多名教师中确认出最优秀的教师的辅助信息。
此外,本申请还可以应用于智慧金融领域、智慧物流领域等领域,从而推动智慧城市的建设。例如,当将本申请应用于智慧金融领域时,可以获取客户与金融机构客服(可以为真实客服或虚拟客服)之间的音频数据,并通过本申请所述的语音质检方法得到对该音频数据的语音质检结果,从而利用该语音质检结果优化金融机构的服务。此处仅为将本申请应用与智慧金融领域的一个示例,本申请在智慧金融领域也可以有其它应用,在此不一一列举。
请参阅图5,为本申请实施例提供的一种语音质检***的网络架构示意图。该语音质检***可以包括终端设备10和服务器20。其中:
终端设备10可以向服务器20发送对目标音频数据的语音质检请求。服务器可以通过执行步骤S201-步骤S204得到对目标音频数据的语音质检结果以发送至终端设备10,本申请实施例通过表达式转换,能够提升语音质检效率。
请参阅图6,为本申请实施例提供的一种语音质检装置的结构示意图。该装置可以应用于服务器。具体地,该装置可以包括:
处理模块601,用于响应于终端设备发送的对目标音频数据的语音质检请求,获取所述目标音频数据对应的文本数据,所述目标音频数据为待语音质检的音频数据;
处理模块601,还用于获取为所述目标音频数据配置的第一规则表达式,对所述第一规则表达式进行转换,得到所述服务器能够解析的第二规则表达式,并根据所述第二规则表达式以及所述文本数据确定对所述目标音频数据的语音质检结果;
通信模块602,用于向所述终端设备发送所述语音质检结果。
在一种可选的实施方式中,所述第一规则表达式的类型为中缀表达式,所述第二规则表达式的类型为后缀表达式或前缀表达式;所述第一规则表达式包括至少一个操作数以及至少一个操作符,所述操作数为以下任一项:字、词或句,所述操作符为使所述至少一个操作数之间建立运算关系的符号。
在一种可选的实施方式中,处理模块601对所述第一规则表达式进行转换,得到所述服务器能够解析的第二规则表达式,具体为采用预设的转换方法对所述第一规则表达式进行表达式转换,得到所述服务器能够解析的第二规则表达式;所述转换方法包括堆栈转换的方法或表达式树转换的方法。
在一种可选的实施方式中,处理模块601根据所述第二规则表达式以及所述文本数据确定对所述目标音频数据的语音质检结果,具体为根据所述第二规则表达式对所述文本数据进行文本匹配,得到文本匹配结果,所述文本匹配结果包括文本匹配成功或失败的结果;根据所述文本匹配结果获得对所述目标音频数据的语音质检结果。
在一种可选的实施方式中,所述第二规则表达式的类型为后缀表达式,处理模块601根据所述第二规则表达式对所述文本数据进行文本匹配,得到文本匹配结果,具体为从左向右扫描所述第二规则表达式中的各个数据;如果所述数据为操作数,则将所述数据放入堆栈;如果所述数据为操作符,则从堆栈中弹出所述数据关联的操作数,并根据由所述数据和所述数据关联的操作数构成的表达式对所述文本数据进行文本匹配,得到中间匹配结果以放入堆栈,直到扫描结束,根据堆栈包括的数据获得文本匹配结果。
在一种可选的实施方式中,处理模块601根据所述文本匹配结果获得对所述目标音频数据的语音质检结果,具体为当所述文本匹配结果还包括所述第二规则表达式中各个操作数的匹配详情信息时,将所述匹配详情信息作为对所述目标音频数据的语音质检结果,所述匹配详情信息包括以下至少一项:出现次数、出现时间、出现位置;和/或,当所述文本匹配结果还包括所述第二规则表达式中各个操作数的匹配详情信息且所述匹配详情信息包括出现时间和/或出现位置时,根据所述匹配详情信息定位所述文本数据包括的所述第二规则表达式中各个操作数以进行标记,得到标记后的所述文本数据,并将标记后的所述文本数据作为对所述目标音频数据的语音质检结果。
在一种可选的实施方式中,处理模块601根据所述文本匹配结果获得对所述目标音频数据的语音质检结果,具体为当所述文本匹配结果还包括所述第二规则表达式中各个操作数的匹配详情信息时,根据所述匹配详情信息确定所述文本数据对应的目标角色的对话数据;所述匹配详情信息包括以下至少一项:出现次数、出现时间、出现位置;所述对话数据包括以下至少一项:语速、静音信息、抢插话信息、情绪信息、沟通评价信息;将所述对话数据作为对所述目标音频数据的语音质检结果。
可见,图6所示的实施例中,语音质检装置可以响应于终端设备发送的对目标音频数据的语音质检请求,获取该目标音频数据对应的文本数据,并获取为该目标音频数据配置的第一规则表达式以进行转换,得到服务器能够解析的第二规则表达式,从而根据该第二规则表达式以及该文本数据确定对该目标音频数据的语音质检结果以发送至终端设备,采用该过程能够提升语音质检效率。
请参阅图7,为本申请实施例提供的一种服务器的结构示意图。其中,本实施例中所描述的服务器可以包括:处理器1000、输入设备2000、输出设备3000和存储器4000。处理器1000、输入设备2000、输出设备3000和存储器4000之间可以通过总线或其它方式连接。输入设备2000和输出设备3000可以为标准的有线或无线通信接口。
处理器1000可以是中央处理模块(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器4000可以是高速RAM存储器,也可为非不稳定的存储器(non-volatilememory),例如磁盘存储器。存储器4000用于存储一组程序代码,处理器1000、输入设备2000和输出设备3000可以调用存储器4000中存储的程序代码。具体地:
处理器1000,用于响应于终端设备发送的对目标音频数据的语音质检请求,获取所述目标音频数据对应的文本数据,所述目标音频数据为待语音质检的音频数据;获取为所述目标音频数据配置的第一规则表达式;对所述第一规则表达式进行转换,得到所述服务器能够解析的第二规则表达式;根据所述第二规则表达式以及所述文本数据确定对所述目标音频数据的语音质检结果;通过输出设备3000向所述终端设备发送所述语音质检结果。
在一个实施例中,所述第一规则表达式的类型为中缀表达式,所述第二规则表达式的类型为后缀表达式或前缀表达式;所述第一规则表达式包括至少一个操作数以及至少一个操作符,所述操作数为以下任一项:字、词或句,所述操作符为使所述至少一个操作数之间建立运算关系的符号。
在一个实施例中,处理器1000对所述第一规则表达式进行转换,得到所述服务器能够解析的第二规则表达式,具体为采用预设的转换方法对所述第一规则表达式进行表达式转换,得到所述服务器能够解析的第二规则表达式;所述转换方法包括堆栈转换的方法或表达式树转换的方法。
在一个实施例中,处理器1000根据所述第二规则表达式以及所述文本数据确定对所述目标音频数据的语音质检结果,具体为根据所述第二规则表达式对所述文本数据进行文本匹配,得到文本匹配结果,所述文本匹配结果包括文本匹配成功或失败的结果;根据所述文本匹配结果获得对所述目标音频数据的语音质检结果。
在一个实施例中,第二规则表达式的类型为后缀表达式,处理器1000根据所述第二规则表达式对所述文本数据进行文本匹配,得到文本匹配结果,具体为从左向右扫描所述第二规则表达式中的各个数据;如果所述数据为操作数,则将所述数据放入堆栈;如果所述数据为操作符,则从堆栈中弹出所述数据关联的操作数,并根据由所述数据和所述数据关联的操作数构成的表达式对所述文本数据进行文本匹配,得到中间匹配结果以放入堆栈,直到扫描结束,根据堆栈包括的数据获得文本匹配结果。
在一个实施例中,处理器1000根据所述文本匹配结果获得对所述目标音频数据的语音质检结果,具体为当所述文本匹配结果还包括所述第二规则表达式中各个操作数的匹配详情信息时,将所述匹配详情信息作为对所述目标音频数据的语音质检结果,所述匹配详情信息包括以下至少一项:出现次数、出现时间、出现位置;和/或,当所述文本匹配结果还包括所述第二规则表达式中各个操作数的匹配详情信息且所述匹配详情信息包括出现时间和/或出现位置时,根据所述匹配详情信息定位所述文本数据包括的所述第二规则表达式中各个操作数以进行标记,得到标记后的所述文本数据,并将标记后的所述文本数据作为对所述目标音频数据的语音质检结果。
在一个实施例中,处理器1000根据所述文本匹配结果获得对所述目标音频数据的语音质检结果,具体为当所述文本匹配结果还包括所述第二规则表达式中各个操作数的匹配详情信息时,根据所述匹配详情信息确定所述文本数据对应的目标角色的对话数据;所述匹配详情信息包括以下至少一项:出现次数、出现时间、出现位置;所述对话数据包括以下至少一项:语速、静音信息、抢插话信息、情绪信息、沟通评价信息;将所述对话数据作为对所述目标音频数据的语音质检结果。
具体实现中,本申请实施例中所描述的处理器1000、输入设备2000、输出设备3000可执行图2和图4实施例所描述的实现方式,也可执行本申请实施例所描述的实现方式,在此不再赘述。
在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采样硬件的形式实现,也可以采样软件功能单元的形式实现。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,该计算机可读存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccess Memory,RAM)等。
以上所揭露的仅为本申请一种较佳实施例而已,当然不能以此来限定本申请之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本申请权利要求所作的等同变化,仍属于本申请所涵盖的范围。
Claims (10)
1.一种语音质检方法,其特征在于,应用于服务器,包括:
响应于终端设备发送的对目标音频数据的语音质检请求,获取所述目标音频数据对应的文本数据,所述目标音频数据为待语音质检的音频数据;
获取为所述目标音频数据配置的第一规则表达式;
对所述第一规则表达式进行转换,得到所述服务器能够解析的第二规则表达式;
根据所述第二规则表达式以及所述文本数据确定对所述目标音频数据的语音质检结果;
向所述终端设备发送所述语音质检结果。
2.根据权利要求1所述的方法,其特征在于,
所述第一规则表达式的类型为中缀表达式,所述第二规则表达式的类型为后缀表达式或前缀表达式;
所述第一规则表达式包括至少一个操作数以及至少一个操作符,所述操作数为以下任一项:字、词或句,所述操作符为使所述至少一个操作数之间建立运算关系的符号。
3.根据权利要求1或2所述的方法,其特征在于,所述对所述第一规则表达式进行转换,得到所述服务器能够解析的第二规则表达式,包括:
采用预设的转换方法对所述第一规则表达式进行表达式转换,得到所述服务器能够解析的第二规则表达式;所述转换方法包括堆栈转换的方法或表达式树转换的方法。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第二规则表达式以及所述文本数据确定对所述目标音频数据的语音质检结果,包括:
根据所述第二规则表达式对所述文本数据进行文本匹配,得到文本匹配结果,所述文本匹配结果包括文本匹配成功或失败的结果;
根据所述文本匹配结果获得对所述目标音频数据的语音质检结果。
5.根据权利要求4所述的方法,其特征在于,所述第二规则表达式的类型为后缀表达式,所述根据所述第二规则表达式对所述文本数据进行文本匹配,得到文本匹配结果,包括:
从左向右扫描所述第二规则表达式中的各个数据;
如果所述数据为操作数,则将所述数据放入堆栈;
如果所述数据为操作符,则从堆栈中弹出所述数据关联的操作数,并根据由所述数据和所述数据关联的操作数构成的表达式对所述文本数据进行文本匹配,得到中间匹配结果以放入堆栈,直到扫描结束,根据堆栈包括的数据获得文本匹配结果。
6.根据权利要求4或5所述的方法,其特征在于,所述根据所述文本匹配结果获得对所述目标音频数据的语音质检结果,包括:
当所述文本匹配结果还包括所述第二规则表达式中各个操作数的匹配详情信息时,将所述匹配详情信息作为对所述目标音频数据的语音质检结果,所述匹配详情信息包括以下至少一项:出现次数、出现时间、出现位置;和/或,
当所述文本匹配结果还包括所述第二规则表达式中各个操作数的匹配详情信息且所述匹配详情信息包括出现时间和/或出现位置时,根据所述匹配详情信息定位所述文本数据包括的所述第二规则表达式中各个操作数以进行标记,得到标记后的所述文本数据,并将标记后的所述文本数据作为对所述目标音频数据的语音质检结果。
7.根据权利要求4或5所述的方法,其特征在于,所述根据所述文本匹配结果获得对所述目标音频数据的语音质检结果,包括:
当所述文本匹配结果还包括所述第二规则表达式中各个操作数的匹配详情信息时,根据所述匹配详情信息确定所述文本数据对应的目标角色的对话数据;所述匹配详情信息包括以下至少一项:出现次数、出现时间、出现位置;所述对话数据包括以下至少一项:语速、静音信息、抢插话信息、情绪信息、沟通评价信息;
将所述对话数据作为对所述目标音频数据的语音质检结果。
8.一种语音质检装置,其特征在于,应用于服务器,包括:
处理模块,用于响应于终端设备发送的对目标音频数据的语音质检请求,获取所述目标音频数据对应的文本数据,所述目标音频数据为待语音质检的音频数据;
所述处理模块,还用于获取为所述目标音频数据配置的第一规则表达式,对所述第一规则表达式进行转换,得到所述服务器能够解析的第二规则表达式,并根据所述第二规则表达式以及所述文本数据确定对所述目标音频数据的语音质检结果;
通信模块,用于向所述终端设备发送所述语音质检结果。
9.一种服务器,其特征在于,包括处理器、输入设备、输出设备和存储器,所述处理器、所述输入设备、所述输出设备和所述存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010474699.0A CN111627461A (zh) | 2020-05-29 | 2020-05-29 | 一种语音质检方法、装置、服务器及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010474699.0A CN111627461A (zh) | 2020-05-29 | 2020-05-29 | 一种语音质检方法、装置、服务器及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111627461A true CN111627461A (zh) | 2020-09-04 |
Family
ID=72260764
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010474699.0A Pending CN111627461A (zh) | 2020-05-29 | 2020-05-29 | 一种语音质检方法、装置、服务器及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111627461A (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107193843A (zh) * | 2016-03-15 | 2017-09-22 | 阿里巴巴集团控股有限公司 | 一种基于ac自动机和后缀表达式的字符串筛选方法及装置 |
CN108962282A (zh) * | 2018-06-19 | 2018-12-07 | 京北方信息技术股份有限公司 | 语音检测分析方法、装置、计算机设备及存储介质 |
CN109448730A (zh) * | 2018-11-27 | 2019-03-08 | 广州广电运通金融电子股份有限公司 | 一种自动语音质检方法、***、装置及存储介质 |
CN110135669A (zh) * | 2018-02-08 | 2019-08-16 | 上海合寰信息科技有限公司 | 一种服务质检管理方法及*** |
CN110634471A (zh) * | 2019-09-21 | 2019-12-31 | 龙马智芯(珠海横琴)科技有限公司 | 一种语音质检方法、装置、电子设备和存储介质 |
CN110728996A (zh) * | 2019-10-24 | 2020-01-24 | 北京九狐时代智能科技有限公司 | 一种实时语音质检方法、装置、设备及计算机存储介质 |
US20200035216A1 (en) * | 2019-08-28 | 2020-01-30 | Lg Electronics Inc. | Speech synthesis method based on emotion information and apparatus therefor |
CN110929011A (zh) * | 2019-11-28 | 2020-03-27 | 北京思特奇信息技术股份有限公司 | 一种对话分析方法、装置和设备 |
CN110956956A (zh) * | 2019-12-13 | 2020-04-03 | 集奥聚合(北京)人工智能科技有限公司 | 基于策略规则的语音识别方法及装置 |
CN111147669A (zh) * | 2019-12-30 | 2020-05-12 | 科讯嘉联信息技术有限公司 | 一种全量实时自动服务质检***和方法 |
-
2020
- 2020-05-29 CN CN202010474699.0A patent/CN111627461A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107193843A (zh) * | 2016-03-15 | 2017-09-22 | 阿里巴巴集团控股有限公司 | 一种基于ac自动机和后缀表达式的字符串筛选方法及装置 |
CN110135669A (zh) * | 2018-02-08 | 2019-08-16 | 上海合寰信息科技有限公司 | 一种服务质检管理方法及*** |
CN108962282A (zh) * | 2018-06-19 | 2018-12-07 | 京北方信息技术股份有限公司 | 语音检测分析方法、装置、计算机设备及存储介质 |
CN109448730A (zh) * | 2018-11-27 | 2019-03-08 | 广州广电运通金融电子股份有限公司 | 一种自动语音质检方法、***、装置及存储介质 |
US20200035216A1 (en) * | 2019-08-28 | 2020-01-30 | Lg Electronics Inc. | Speech synthesis method based on emotion information and apparatus therefor |
CN110634471A (zh) * | 2019-09-21 | 2019-12-31 | 龙马智芯(珠海横琴)科技有限公司 | 一种语音质检方法、装置、电子设备和存储介质 |
CN110728996A (zh) * | 2019-10-24 | 2020-01-24 | 北京九狐时代智能科技有限公司 | 一种实时语音质检方法、装置、设备及计算机存储介质 |
CN110929011A (zh) * | 2019-11-28 | 2020-03-27 | 北京思特奇信息技术股份有限公司 | 一种对话分析方法、装置和设备 |
CN110956956A (zh) * | 2019-12-13 | 2020-04-03 | 集奥聚合(北京)人工智能科技有限公司 | 基于策略规则的语音识别方法及装置 |
CN111147669A (zh) * | 2019-12-30 | 2020-05-12 | 科讯嘉联信息技术有限公司 | 一种全量实时自动服务质检***和方法 |
Non-Patent Citations (1)
Title |
---|
"《计算机工程与应用》2018年(第54卷) 总目次", 《计算机工程与应用》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11709854B2 (en) | Artificial intelligence based smart data engine | |
US10777207B2 (en) | Method and apparatus for verifying information | |
US10997258B2 (en) | Bot networks | |
US9361891B1 (en) | Method for converting speech to text, performing natural language processing on the text output, extracting data values and matching to an electronic ticket form | |
WO2022156065A1 (zh) | 一种文本情感分析方法、装置、设备及存储介质 | |
CN109857846B (zh) | 用户问句与知识点的匹配方法和装置 | |
CN112468659B (zh) | 应用于电话客服的质量评价方法、装置、设备及存储介质 | |
WO2020199600A1 (zh) | 情感极性分析方法及相关装置 | |
CN112925898B (zh) | 基于人工智能的问答方法、装置、服务器及存储介质 | |
CN112699645B (zh) | 语料标注方法、装置及设备 | |
CN113626573B (zh) | 一种销售会话异议及应对提取方法及*** | |
CN112417158A (zh) | 文本数据分类模型的训练方法、分类方法、装置和设备 | |
CN115687980A (zh) | 数据表的脱敏分类方法、分类模型训练方法及装置 | |
US11687796B2 (en) | Document type-specific quality model | |
TW202123026A (zh) | 資料歸檔方法、裝置、電腦裝置及存儲介質 | |
CN113657773A (zh) | 话术质检方法、装置、电子设备及存储介质 | |
CN111783425B (zh) | 基于句法分析模型的意图识别方法及相关装置 | |
WO2021217866A1 (zh) | 用于ai智能面试的识别的方法、装置、计算机设备及存储介质 | |
CN110852082B (zh) | 同义词的确定方法及装置 | |
CN110263346B (zh) | 基于小样本学习的语意分析方法、电子设备及存储介质 | |
CN112669850A (zh) | 语音质量检测方法、装置、计算机设备及存储介质 | |
CN112069833A (zh) | 日志分析方法、日志分析装置及电子设备 | |
CN111651554A (zh) | 基于自然语言理解及处理的保险问答回答的方法和装置 | |
CN114528851B (zh) | 回复语句确定方法、装置、电子设备和存储介质 | |
CN111627461A (zh) | 一种语音质检方法、装置、服务器及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220523 Address after: 518000 China Aviation Center 2901, No. 1018, Huafu Road, Huahang community, Huaqiang North Street, Futian District, Shenzhen, Guangdong Province Applicant after: Shenzhen Ping An medical and Health Technology Service Co.,Ltd. Address before: Room 12G, Area H, 666 Beijing East Road, Huangpu District, Shanghai 200001 Applicant before: PING AN MEDICAL AND HEALTHCARE MANAGEMENT Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200904 |
|
RJ01 | Rejection of invention patent application after publication |