CN112102854A

CN112102854A - 一种录音过滤方法、装置及计算机可读存储介质

Info

Publication number: CN112102854A
Application number: CN202010999917.2A
Authority: CN
Inventors: 严馨华
Original assignee: Fujian Hongxingfu Food Co ltd
Current assignee: Fujian Hongxingfu Food Co ltd
Priority date: 2020-09-22
Filing date: 2020-09-22
Publication date: 2020-12-18

Abstract

本发明公开的录音过滤方法对第一录音进行语音识别分析；按照预设规则对所述第一录音进行过滤，得到第二录音；其中，所述预设规则包括：保留或过滤预设语音类型的录音，所述预设语音类型包括：人声、音乐、噪声；或者，保留或过滤满足预设条件的录音，所述预设条件包括预设年龄范围、预设性别、预设声纹特征参数中的至少一种。这样，本发明提供的录音过滤方法能够按照预设规则对录音进行过滤，过滤掉无效录音，仅保留有效录音，减少人工对录音进行回放识别的时间，提高录音回放识别的效率。

Description

一种录音过滤方法、装置及计算机可读存储介质

技术领域

本发明涉及录音处理技术领域，尤其涉及一种录音过滤方法、装置及计算机可读存储介质。

背景技术

随着电子产品的不断推广与电子技术的不断发展，在需要实时记录的场景(例如会议场景或者监控场景)，人们通常会选择通过录音的方式进行记录，然后人工对录音文件进行回放，识别和筛选有效录音并由人工将其转化为文字。

由于录音文件的时长通常较长，且中间可能存在较多无效录音，人工对录音进行回放识别需要耗费较多的时间，效率较低。

发明内容

有鉴于此，本发明提出录音过滤方法、装置及计算机可读存储介质，以解决上述技术问题。

首先，为实现上述目的，本发明提出一种录音过滤方法，所述方法包括：

对第一录音进行语音识别分析；

按照预设规则对所述第一录音进行过滤，得到第二录音；

其中，所述预设规则包括：

保留或过滤预设语音类型的录音，所述预设语音类型包括：人声、音乐、噪声；

或者，保留或过滤满足预设条件的录音，所述预设条件包括预设年龄范围、预设性别、预设声纹特征参数中的至少一种。

可选地，所述对第一录音进行语音识别分析，包括：

对所述第一录音进行语音分类获得语音类型，所述语音类型包括：人声、噪声、音乐；

若所述语音类型是人声，则对所述第一录音进行声纹识别获取所述讲话者的声纹特征参数，和/或对所述第一录音进行讲话者的性别判断获取所述讲话者的性别，和/或对所述第一录音进行讲话者的年龄范围判断获取所述讲话者的年龄范围。

可选地，所述预设规则包括保留或过滤预设语音类型的录音，所述按照预设规则对所述第一录音进行过滤，包括：

保留第一预设语音类型的录音；

和/或，过滤第二预设语音类型的录音。

可选地，所述第一预设语音类型包括人声，和/或，所述第二预设语音类型包括音乐和/或噪声。

可选地，所述预设条件包括所述预设年龄范围；

所述保留或过滤满足预设条件的录音，包括：

判断所述第一录音中所述讲话者的年龄范围是否落入所述预设条件包括的所述预设年龄范围；

若所述第一录音中所述讲话者的年龄范围没有落入所述预设条件包括的所述预设年龄范围，保留或过滤所述讲话者的录音。

可选地，所述预设条件包括所述预设性别；

所述保留或过滤满足预设条件的语音，包括：

判断所述第一录音中所述讲话者的性别是否与所述预设条件包括的所述预设性别相同；

若所述第一录音中所述讲话者的所述性别与所述预设条件包括的所述预设性别相同，保留或过滤所述讲话者的录音。

可选地，所述预设条件包括所述预设声纹特征参数；

所述保留或过滤满足预设条件的语音，包括：

判断所述第一录音中所述讲话者的所述声纹特征参数是否与所述预设条件包括的所述声纹特征参数相匹配；

若所述第一录音中所述讲话者的所述声纹特征参数与所述预设条件包括的所述预设声纹特征参数相匹配，保留或过滤所述讲话者的录音。

可选地，所述对所述第一录音进行语音分类获得语音类型过程中，在噪声或音乐中包含人声时，所述语音类型为人声。

进一步地，为实现上述目的，本发明还提供一种录音过滤装置，所述录音过滤装置包括存储器、至少一个处理器以及存储在所述存储器上并可在所述至少一个处理器执行的至少一个程序，所述至少一个程序被所述至少一个处理器执行时实现上述方法中的步骤。

进一步地，为实现上述目的，本发明一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可执行的至少一个程序，所述至少一个程序被所述计算机执行时使所述计算机执行上述任一项所述的方法中的步骤。

相较于现有技术，本发明所提出的录音过滤方法对第一录音进行语音识别分析；按照预设规则对所述第一录音进行过滤，得到第二录音；其中，所述预设规则包括：保留或过滤预设语音类型的录音，所述预设语音类型包括：人声、音乐、噪声；或者，保留或过滤满足预设条件的录音，所述预设条件包括预设年龄范围、预设性别、预设声纹特征参数中的至少一种。这样，本发明提供的录音过滤方法能够按照预设规则对录音进行过滤，过滤掉无效录音，仅保留有效录音，减少人工对录音进行回放识别的时间，提高录音回放识别的效率。

附图说明

图1是本发明实施例提供的一种录音过滤装置的结构示意图；

图2是本发明实施例提供的一种车载***的结构示意图；

图3是本发明实施例提供的一种服务器的结构示意图；

图4是本发明实施例提供的录音过滤方法的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

在后续的描述中，使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明，其本身没有特定的意义。因此，“模块”、“部件”或“单元”可以混合地使用。

请参阅图1，图1是本发明实施例提供的一种录音过滤装置的结构示意图，如图1所示，录音过滤装置100包括处理器101以及存储器102，所述存储器102用于存储所述录音过滤装置100的相关数据，例如程序，所述处理器101用于执行所述存储器102中存储的程序，并实现相应的功能。本发明实施例中，所述录音过滤装置100可以为车载***，也可以为服务器。

请进一步参阅图2，图2是本发明实施例提供的一种车载***的结构示意图，如图2所示，车载***200包括处理器201以及存储器202，所述存储器202用于存储所述车载***200的相关数据，例如所述车载***200采集到的数据以及程序，所述处理器201用于执行所述处理器202中存储的程序，并实现相应的功能。

所述车载***200还包括定位模块203、录音模块204、无线通信模块205、震动传感器206、低电检测模块207以及电池模块208中的一种或多种。所述定位模块203用于对所述车载***200进行定位，获得所述车载***200的位置信息，所述定位模块203可以为GPS或北斗等定位芯片，通过获取车辆的经纬度信息，也可以为WIFI定位模块、蓝牙定位模块或者基站定位模块，通过获取周边的WIFI设备地址信息、蓝牙设备地址信息或者基站标识信息。

所述录音模块204用于收录所述车载***200周围的声音，所述无线通信模块205用于实现所述车载***200与外部设备之间的无线通信连接，所述无线通信模块205可以包括蓝牙通信模块、红外通信模块、WIFI通信模块、移动蜂窝网通信模块(如2G、3G、4G、5G通信模块)中的一种或多种。可以理解的是，在一些实施例中，所述车载***200可以包括有线通信模块，用于实现所述车载***200与车载终端之间的有线通信连接，进而通过所述车载终端实现为外部设备之间的通信连接。所述震动传感器206用于检测车辆的震动数据，所述处理器201可以根据所述震动传感器206检测的震动数据判断车辆的行驶状态(例如移动状态或静止状态)。所述低电检测模块207用于检测所述车载***200的电量信息，并向所述处理器201上报电池电量信息所述电池模块208用于为所述车载***200供电。

请参阅图3，图3是本发明实施例提供的一种服务器的结构示意图，如图3所示，服务器300包括处理器301以及存储器302，所述存储器302用于存储所述服务器300的相关数据，例如程序，所述处理器301用于执行所述存储器302中存储的程序，并实现相应的功能。

需要说明的是，当所述录音过滤装置100为如图2所示的车载***200，所述车载***200可以通过服务器300实现与客户端的通信连接，也可以不通过所述服务器300，直接与所述客户端建立通信连接。当所述录音过滤装置100为如图3所示的服务器300时，所述服务器300通过与所述车载***200建立通信连接，获取所述车载***200采集的数据，例如位置信息以及声音信息等。

基于上述录音过滤装置100的结构示意图，提出本发明方法各个实施例。

参阅图4，图4是本发明实施例提供的一种录音过滤方法的步骤流程图，所述方法应用于所述录音过滤装置100中，如图4所示，所述方法包括：

步骤401、对第一录音进行语音识别分析。

该步骤中，所述方法对第一录音进行语音识别分析，所述第一录音为通过录音设备记录的录音，例如在会议上通过录音笔记录的录音，或者通过设置在车辆中的车载***记录的声音。对于语音内容过长的情况，可以将语音内容拆分成多条，然后逐条进行语音分析。

所述对第一录音进行语音识别分析，具体可以包括所述第一录音进行语音分类获得语音类型，所述语音类型包括人声、噪声、音乐；若所述语音类型是人声，则对所述第一录音进行声纹识别获取所述讲话者的声纹特征参数，和/或对所述第一录音进行讲话者的性别判断获取所述讲话者的性别，和/或对所述第一录音进行讲话者的年龄范围判断获取所述讲话者的年龄范围。

需要说明的是，所述录音过滤装置内部可以部署语音识别装置，通过所述语音识别装置对所述第一录音进行语音分析，也可以不部署语音识别装置，通过调用外部语音识别服务器实现对所述第一录音进行语音分析的功能。

步骤402、按照预设规则对所述第一录音进行过滤，得到第二录音；其中，所述预设规则包括：保留或过滤预设语音类型的录音，所述预设语音类型包括：人声、音乐、噪声；或者，保留或过滤满足预设条件的录音，所述预设条件包括预设年龄范围、预设性别、预设声纹特征参数中的至少一种。

该步骤中，所述方法按照预设规则所述第一录音进行过滤，得到第二录音。所述预设规则可以包括根据语音类型进行过滤，例如保留或过滤预设语音类型的录音，所述预设语音类型包括人声、音乐、噪声；所述预设规则也可以包括根据讲话者的声纹特征进行过滤，例如保留或过滤满足预设条件的录音，所述预设条件包括预设年龄范围、预设性别、预设声纹特征参数中的至少一种。

举例而言，当用户只需要对人声进行识别时，可以将所述预设规则设置为保留预设语音类型的录音，所述预设语音类型为人声。当用户只需要对女性讲话者的声音进行识别时，可以将所述预设规则设置为保留性别为女性的录音，或者过滤性别为男性的录音。当用户只需要对指定讲话者(例如车主、驾驶员或固定乘客)的声音进行识别时，可以将所述预设规则设置为保留预设声纹特征参数的录音，所述预设声纹特征参数为所述指定讲话者对应的声纹特征参数。相反地，当用户需要对除了指定讲话者之外的其他讲话者的声音进行识别时，可以将所述预设规则设置为过滤预设声纹特征参数的录音，所述预设声纹特征参数为所述指定讲话者对应的声纹特征参数。

所述预设规则可以是用户根据实际需求预先设置的过滤规则，本发明一些实施例中，在录音过滤过程中和/或录音过滤完成后，所述方法还能够接收针对所述预设规则的修改操作，并根据所述修改操作更新所述预设规则。

本实施例中，所述录音过滤方法对第一录音进行语音识别分析；按照预设规则对所述第一录音进行过滤，得到第二录音；其中，所述预设规则包括：保留或过滤预设语音类型的录音，所述预设语音类型包括：人声、音乐、噪声；或者，保留或过滤满足预设条件的录音，所述预设条件包括预设年龄范围、预设性别、预设声纹特征参数中的至少一种。这样，本发明提供的录音过滤方法能够按照预设规则对录音进行过滤，过滤掉无效录音，仅保留有效录音，减少人工对录音进行回放识别的时间，提高录音回放识别的效率。

以下以所述录音过滤装置为服务器，所述第一录音为通过车载***记录的录音为例，对本发明提供的方法过程进行详细描述。

管理员需要对车辆上的录音进行回放识别时，可以在客户端上开启应用程序，并通过应用程序向服务器发送录音过滤请求，所述录音过滤请求中携带有过滤参数，所述过滤参数至少包括预设规则，还可以包括其他信息，例如用户账号、车载***标识、车辆限乘人数、用户信息(如姓名、性别、年龄、联系方式等)中的至少一种。所述服务器接收到所述客户端发送的录音过滤请求后，获取并保存所述驾乘人员识别请求中携带的过滤参数，用于后续对录音进行语音识别分析，并向所述客户端返回开启录音过滤应答消息，标识所述服务器成功接收所述客户端发送的录音过滤请求且已开启录音过滤功能，所述服务器向所述车载***标识对应的车载***发送录音过滤请求，用于请求获取所述车载***采集的第一录音，并根据获取的声音信息进行后续的录音过滤步骤。可以理解的是，所述服务器向所述车载***发送所述录音过滤请求之前，可以先判断所述车载***是否在线，若在线，则直接向所述车载***发送所述录音过滤请求，若不在线，则等待所述车载***上线之后向所述车载***发送所述录音过滤请求。所述车载***在接收到所述服务器发送的所述录音过滤请求后，保存所述录音过滤请求中的过滤参数，并向所述服务器返回录音过滤应答消息，此外，所述车载***还将采集到的第一录音向所述服务器上报。

以下以所述录音过滤装置为车载***，所述第一录音为通过车载***记录的录音为例，对本发明提供的方法过程进行详细描述。

管理员需要对车辆上的录音进行回放识别时，可以在客户端上开启应用程序，并通过应用程序向车载***发送录音过滤请求，所述录音过滤请求中携带有过滤参数，所述过滤参数至少包括预设规则，还可以包括其他信息，例如用户账号、车载***标识、车辆限乘人数、预设声纹特征参数、用户信息(如姓名、性别、年龄、联系方式等)中的至少一种。所述客户端可以直接与所述车载***建立通信连接并向所述车载***发送所述录音过滤请求，也可以通过服务器向所述车载***发送所述录音过滤请求。所述车载***接收到所述客户端发送的录音过滤请求后，获取并保存所述录音过滤请求中携带的过滤参数，用于后续对第一录音进行语音分析，并向所述客户端返回录音过滤应答消息，标识所述车载***成功接收所述客户端发送的录音过滤请求且已开启录音过滤功能，所述载***获取采集的第一录音，并根据获取的第一录音进行后续的录音过滤步骤。

可选地，所述对第一录音进行语音识别分析，包括：

保留第一预设语音类型的录音；

和/或，过滤第二预设语音类型的录音。

可选地，所述预设条件包括所述预设年龄范围；

所述保留或过滤满足预设条件的录音，包括：

可选地，所述预设条件包括所述预设性别；

所述保留或过滤满足预设条件的语音，包括：

可选地，所述预设条件包括所述预设声纹特征参数；

所述保留或过滤满足预设条件的语音，包括：

举例而言，当用户只需要回放识别指定讲话者(例如驾驶员)的录音时，可以预先设置该指定讲话者的声纹特征参数为预设声纹特征参数，若所述第一录音中讲话者的声纹特征参数与所述预设条件包括的所述预设声纹特征参数相匹配，则保留该讲话者的录音。

本发明一些实施例中，所述方法还可以对第一录音中不同讲话者的声音进行识别，将每一讲话者的录音进行集中保存，即将具有相同声纹特征参数的录音集中保存。例如假设第一录音中包括A、B、C三人的声音，所述方法将所述第一录音中A讲话的内容进行单独保存，将所述第一录音中B讲话的内容进行单独保存，将所述第一录音中C讲话的内容进行单独保存。

进一步地，还可以针对每一集中保存的录音进行标识，例如对每一相同的声纹特征参数分配一个乘客标识码，使用不同的乘客标识码标识不同乘客的讲话录音，对于有多个讲话者同时讲话的情况，可以将该段包括多个讲话者同时讲话的录音与多个乘客标识码进行标识，标识该段录音中包含多个讲话者的讲话录音。或者对每一讲话者的声音进行性别和/或年龄范围判断，确定每一讲话者的性别和/或年龄范围，并以讲话者的性别和/或年龄范围标识该江湖这的讲话录音。

本发明一些实施例中，所述方法将针对所述第一录音过滤后的得到的第二录音进行保存，将该第二录音标识为正常录音，同时，也可以将过滤掉的第三录音进行保存，标识为被过滤录音。这样，当用户需要对第一录音进行回放识别时，可以根据录音的标识确定哪个录音文件为过滤后的正常录音，方便用户准确选择正常录音文件进行回放识别。在一些实施例中，所述录音过滤装置还进一步将所述第二录音进行语音转文字处理，得到所述第二录音对应的文字内容。

本领域普通技术人员可以理解实现上述实施例方法的全部或者部分步骤是可以通过至少一个程序指令相关的硬件来完成，所述至少一个程序可以存储于如图1所示的录音过滤装置100的存储器102中，并能够被所述录音过滤装置100的处理器101执行，所述至少一个程序被所述处理器执行时实现如下步骤：

对第一录音进行语音识别分析；

按照预设规则对所述第一录音进行过滤，得到第二录音；

其中，所述预设规则包括：

可选地，所述对第一录音进行语音识别分析，包括：

保留第一预设语音类型的录音；

和/或，过滤第二预设语音类型的录音。

可选地，所述预设条件包括所述预设年龄范围；

所述保留或过滤满足预设条件的录音，包括：

可选地，所述预设条件包括所述预设性别；

所述保留或过滤满足预设条件的语音，包括：

可选地，所述预设条件包括所述预设声纹特征参数；

所述保留或过滤满足预设条件的语音，包括：

本领域普通技术人员可以理解实现上述实施例方法的全部或者部分步骤是可以通过至少一个程序指令相关的硬件来完成，所述至少一个程序可以存储于一计算机可读存储介质中，该至少一个程序被执行时，实现以下步骤：

对第一录音进行语音识别分析；

按照预设规则对所述第一录音进行过滤，得到第二录音；

其中，所述预设规则包括：

可选地，所述对第一录音进行语音识别分析，包括：

保留第一预设语音类型的录音；

和/或，过滤第二预设语音类型的录音。

可选地，所述预设条件包括所述预设年龄范围；

所述保留或过滤满足预设条件的录音，包括：

可选地，所述预设条件包括所述预设性别；

所述保留或过滤满足预设条件的语音，包括：

可选地，所述预设条件包括所述预设声纹特征参数；

所述保留或过滤满足预设条件的语音，包括：

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种录音过滤方法，其特征在于，所述方法包括：

对第一录音进行语音识别分析；

按照预设规则对所述第一录音进行过滤，得到第二录音；

其中，所述预设规则包括：

2.根据权利要求1所述的录音过滤方法，其特征在于，所述对第一录音进行语音识别分析，包括：

3.根据权利要求1所述的录音过滤方法，其特征在于，所述预设规则包括保留或过滤预设语音类型的录音，所述按照预设规则对所述第一录音进行过滤，包括：

保留第一预设语音类型的录音；

和/或，过滤第二预设语音类型的录音。

4.根据权利要求3所述的录音过滤方法，其特征在于，所述第一预设语音类型包括人声，和/或，所述第二预设语音类型包括音乐和/或噪声。

5.根据权利要求2所述的录音过滤方法，其特征在于，所述预设条件包括所述预设年龄范围；

所述保留或过滤满足预设条件的录音，包括：

6.根据权利要求2所述的录音过滤方法，其特征在于，所述预设条件包括所述预设性别；

所述保留或过滤满足预设条件的语音，包括：

7.根据权利要求2所述的录音过滤方法，其特征在于，所述预设条件包括所述预设声纹特征参数；

所述保留或过滤满足预设条件的语音，包括：

8.根据权利要求2所述的录音过滤方法，其特征在于，所述对所述第一录音进行语音分类获得语音类型过程中，在噪声或音乐中包含人声时，所述语音类型为人声。

9.一种录音过滤装置，其特征在于，所述录音过滤装置包括存储器、至少一个处理器以及存储在所述存储器上并可在所述至少一个处理器执行的至少一个程序，所述至少一个程序被所述至少一个处理器执行时实现上述权利要求1～8任一项所述的方法中的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可执行的至少一个程序，其特征在于，所述至少一个程序被所述计算机执行时使所述计算机执行上述权利要求1～8任一项所述的方法中的步骤。