CN107342086A

CN107342086A - 语音处理方法及装置

Info

Publication number: CN107342086A
Application number: CN201710458436.9A
Authority: CN
Inventors: 全刚
Original assignee: Beijing Yunzhisheng Information Technology Co Ltd
Current assignee: Beijing Yunzhisheng Information Technology Co Ltd
Priority date: 2017-06-16
Filing date: 2017-06-16
Publication date: 2017-11-10

Abstract

本发明是关于一种语音处理方法及装置，其中，方法包括：从预设数据库中获取预设案件的文本信息；对所述文本信息进行文本识别，并进行专有名词标注，以得到关键词列表；根据所述文本信息和所述关键词列表生成所述预设案件对应的语音识别模型；获取关于所述预设案件的语音信息，根据所述语音识别模型对所述语音信息进行识别，以得到所述语音信息对应的识别文本信息。通过该技术方案，可以在识别庭审录音等语音信息时，提高识别结果的准确性和识别率，提升用户体验。

Description

语音处理方法及装置

技术领域

本发明涉及语音识别技术领域，尤其涉及一种语音处理方法及装置。

背景技术

相关技术中，当对案件的庭审录音等进行语音识别时，由于其中存在大量专业词汇，如人名、地名等，识别起来存在一定困难，因此，导致识别结果不准确。

发明内容

本发明实施例提供一种语音处理方法及装置，用以实现在识别庭审录音等语音信息时，提高识别结果的准确性和识别率，提升用户体验。

根据本发明实施例的第一方面，提供一种语音处理方法，包括：

从预设数据库中获取预设案件的文本信息；

对所述文本信息进行文本识别，并进行专有名词标注，以得到关键词列表；

根据所述文本信息和所述关键词列表生成所述预设案件对应的语音识别模型；

获取关于所述预设案件的语音信息，根据所述语音识别模型对所述语音信息进行识别，以得到所述语音信息对应的识别文本信息。

在一个实施例中，所述关于预设案件的语音信息包括所述预设案件的庭审录音。

在该实施例中，对预设案件的文本信息进行文本识别，标注出至少一个专有名词，组成关键词列表，进而根据关键词列表和案件的文本信息生成该案件对应的语音识别模型，这样，在识别该案件的庭审录音时，可以根据语音识别模型进行识别，从而提高识别结果的准确性和识别率，提升用户的使用体验。

例如，当法院里做一次庭审的语音转文字处理时，可在开庭前将包含本次案件关键人物名称、地点、时间的文本上传到数据库中，这样，可以事先生成语音识别模块，再做庭审录音的语音识别，则能有效提升此过程中对关键人物名称、地点的识别率。

在一个实施例中，从预设数据库中获取预设案件的文本信息，包括：

根据所述预设案件的案件标识获取所述预设案件的文本信息。

在该实施例中，为了便于对案件进行区分和便于用户查找，可以为每个案件设置案件标识，进而方便根据案件标识获取该案件的文本信息。

在一个实施例中，所述案件标识包括以下任一项：用户身份标识、用户设备标识和案件编号。

在该实施例中，在将案件文本输入数据库时，可以携带用户身份标识，以标记最终的庭审文本记录。该方案适用于单一设备实现，如庭审时书记员的设备。

当然，还可以在将案件文本输入数据库时，带上案件编号。这样可预先将多个案子的文本提前输入数据库，形成每个案件对应的语音识别模型。当开庭时，输入案件编号，即可加载相应的语音识别模型对庭审记录进行识别。当然，还可以利用设备标识作为案件标识。

在一个实施例中，在获取预设案件的文本信息之后，所述方法还包括：

对所述文本信息进行过滤，以将所述文本信息中的非文本内容转换成文本内容。

在该实施例中，可以对案件的文本信息进行过滤，从而将非文本内容转换成文本内容。如案件文本可能是文本、也可能含图、语音、视频等。文本过滤一种方式是只保留文本，丢弃图、语音、视频等；另一种方式是将图、语音、视频等都转换成文字。

在一个实施例中，所述方法还包括：

接收输入的预设案件对应的语音识别模型删除命令；

根据所述语音识别模型删除命令，删除所述语音识别模型。

在该实施例中，为了避免占用过多的存储空间，当对庭审案件识别结束后，可以将语音识别模型删除。

根据本发明实施例的第二方面，提供一种语音处理装置，包括：

获取模块，用于从预设数据库中获取预设案件的文本信息；

标注模块，用于对所述文本信息进行文本识别，并进行专有名词标注，以得到关键词列表；

生成模块，用于根据所述文本信息和所述关键词列表生成所述预设案件对应的语音识别模型；

识别模块，用于获取关于所述预设案件的语音信息，根据所述语音识别模型对所述语音信息进行识别，以得到所述语音信息对应的识别文本信息。

在一个实施例中，所述获取模块用于：

在一个实施例中，所述装置还包括：

转换模块，用于在获取预设案件的文本信息之后，对所述文本信息进行过滤，以将所述文本信息中的非文本内容转换成文本内容。

在一个实施例中，所述装置还包括：

接收模块，用于接收输入的预设案件对应的语音识别模型删除命令；

删除模块，用于根据所述语音识别模型删除命令，删除所述语音识别模型。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的一种语音处理方法的流程图。

图2是根据一示例性实施例示出的另一种语音处理方法的流程图。

图3是根据一示例性实施例示出的又一种语音处理方法的流程图。

图4是根据一示例性实施例示出的一种语音处理装置的框图。

图5是根据一示例性实施例示出的另一种语音处理装置的框图。

图6是根据一示例性实施例示出的又一种语音处理装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种语音处理方法的流程图。该语音处理方法应用于服务器中。如图1所示，该方法包括步骤S101-S104：

在步骤S101中，从预设数据库中获取预设案件的文本信息；用户可以预先将预设案件的文本信息存储至预设数据库中。

在步骤S102中，对所述文本信息进行文本识别，并进行专有名词标注，以得到关键词列表；其中，专有名词包括人名、地名等。

在步骤S103中，根据所述文本信息和所述关键词列表生成所述预设案件对应的语音识别模型；即利用文本信息和关键词列表进行训练，生成语音识别模块。

在步骤S104中，获取关于所述预设案件的语音信息，根据所述语音识别模型对所述语音信息进行识别，以得到所述语音信息对应的识别文本信息。

当然，还可以在将案件文本输入数据库时，带上案件编号。这样可预先将多个案子的文本提前输入数据库，形成每个案件对应的语音识别模型。当开庭时，输入案件编号，即可加载相应的语音识别模型对庭审记录进行识别。

如图2所示，在一个实施例中，在获取预设案件的文本信息之后，上述方法还包括步骤S201：

在步骤S201中，对所述文本信息进行过滤，以将所述文本信息中的非文本内容转换成文本内容。

如图3所示，在一个实施例中，上述方法还包括步骤S301-S302：

在步骤S301中，接收输入的预设案件对应的语音识别模型删除命令；

在步骤S302中，根据所述语音识别模型删除命令，删除所述语音识别模型。

下述为本发明装置实施例，可以用于执行本发明方法实施例。

图4是根据一示例性实施例示出的一种语音处理装置的框图，该装置可以通过软件、硬件或者两者的结合实现成为服务器的部分或者全部。如图4所示，该语音处理装置包括：

获取模块41，用于从预设数据库中获取预设案件的文本信息；

标注模块42，用于对所述文本信息进行文本识别，并进行专有名词标注，以得到关键词列表；

生成模块43，用于根据所述文本信息和所述关键词列表生成所述预设案件对应的语音识别模型；

识别模块44，用于获取关于所述预设案件的语音信息，根据所述语音识别模型对所述语音信息进行识别，以得到所述语音信息对应的识别文本信息。

在一个实施例中，所述获取模块41用于：

如图5所示，在一个实施例中，上述装置还包括：

转换模块51，用于在获取预设案件的文本信息之后，对所述文本信息进行过滤，以将所述文本信息中的非文本内容转换成文本内容。

如图6所示，在一个实施例中，上述装置还包括：

接收模块61，用于接收输入的预设案件对应的语音识别模型删除命令；

删除模块62，用于根据所述语音识别模型删除命令，删除所述语音识别模型。

本领域内的技术人员应明白，本发明的实施例可提供为方法、***、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种语音处理方法，用于服务器，其特征在于，包括：

从预设数据库中获取预设案件的文本信息；

2.根据权利要求1所述的方法，其特征在于，从预设数据库中获取预设案件的文本信息，包括：

3.根据权利要求2所述的方法，其特征在于，所述案件标识包括以下任一项：用户身份标识、用户设备标识和案件编号。

4.根据权利要求1所述的方法，其特征在于，在获取预设案件的文本信息之后，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

接收输入的预设案件对应的语音识别模型删除命令；

根据所述语音识别模型删除命令，删除所述语音识别模型。

6.根据权利要求1至5中任一项所述的方法，其特征在于，所述关于预设案件的语音信息包括所述预设案件的庭审录音。

7.一种语音处理装置，用于服务器，其特征在于，包括：

获取模块，用于从预设数据库中获取预设案件的文本信息；

8.根据权利要求7所述的装置，其特征在于，所述获取模块用于：

9.根据权利要求8所述的装置，其特征在于，所述案件标识包括以下任一项：用户身份标识、用户设备标识和案件编号。

10.根据权利要求7所述的装置，其特征在于，所述装置还包括：

11.根据权利要求7所述的装置，其特征在于，所述装置还包括：

12.根据权利要求7至12中任一项所述的装置，其特征在于，所述关于预设案件的语音信息包括所述预设案件的庭审录音。