CN112102854A - 一种录音过滤方法、装置及计算机可读存储介质 - Google Patents
一种录音过滤方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN112102854A CN112102854A CN202010999917.2A CN202010999917A CN112102854A CN 112102854 A CN112102854 A CN 112102854A CN 202010999917 A CN202010999917 A CN 202010999917A CN 112102854 A CN112102854 A CN 112102854A
- Authority
- CN
- China
- Prior art keywords
- recording
- preset
- voice
- filtering
- speaker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001914 filtration Methods 0.000 title claims abstract description 107
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000004891 communication Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10009—Improvement or modification of read or write signals
- G11B20/10046—Improvement or modification of read or write signals filtering or equalising, e.g. setting the tap weights of an FIR filter
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
- G11B2020/10537—Audio or video recording
- G11B2020/10546—Audio or video recording specifically adapted for audio data
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Quality & Reliability (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开的录音过滤方法对第一录音进行语音识别分析;按照预设规则对所述第一录音进行过滤,得到第二录音;其中,所述预设规则包括:保留或过滤预设语音类型的录音,所述预设语音类型包括:人声、音乐、噪声;或者,保留或过滤满足预设条件的录音,所述预设条件包括预设年龄范围、预设性别、预设声纹特征参数中的至少一种。这样,本发明提供的录音过滤方法能够按照预设规则对录音进行过滤,过滤掉无效录音,仅保留有效录音,减少人工对录音进行回放识别的时间,提高录音回放识别的效率。
Description
技术领域
本发明涉及录音处理技术领域,尤其涉及一种录音过滤方法、装置及计算机可读存储介质。
背景技术
随着电子产品的不断推广与电子技术的不断发展,在需要实时记录的场景(例如会议场景或者监控场景),人们通常会选择通过录音的方式进行记录,然后人工对录音文件进行回放,识别和筛选有效录音并由人工将其转化为文字。
由于录音文件的时长通常较长,且中间可能存在较多无效录音,人工对录音进行回放识别需要耗费较多的时间,效率较低。
发明内容
有鉴于此,本发明提出录音过滤方法、装置及计算机可读存储介质,以解决上述技术问题。
首先,为实现上述目的,本发明提出一种录音过滤方法,所述方法包括:
对第一录音进行语音识别分析;
按照预设规则对所述第一录音进行过滤,得到第二录音;
其中,所述预设规则包括:
保留或过滤预设语音类型的录音,所述预设语音类型包括:人声、音乐、噪声;
或者,保留或过滤满足预设条件的录音,所述预设条件包括预设年龄范围、预设性别、预设声纹特征参数中的至少一种。
可选地,所述对第一录音进行语音识别分析,包括:
对所述第一录音进行语音分类获得语音类型,所述语音类型包括:人声、噪声、音乐;
若所述语音类型是人声,则对所述第一录音进行声纹识别获取所述讲话者的声纹特征参数,和/或对所述第一录音进行讲话者的性别判断获取所述讲话者的性别,和/或对所述第一录音进行讲话者的年龄范围判断获取所述讲话者的年龄范围。
可选地,所述预设规则包括保留或过滤预设语音类型的录音,所述按照预设规则对所述第一录音进行过滤,包括:
保留第一预设语音类型的录音;
和/或,过滤第二预设语音类型的录音。
可选地,所述第一预设语音类型包括人声,和/或,所述第二预设语音类型包括音乐和/或噪声。
可选地,所述预设条件包括所述预设年龄范围;
所述保留或过滤满足预设条件的录音,包括:
判断所述第一录音中所述讲话者的年龄范围是否落入所述预设条件包括的所述预设年龄范围;
若所述第一录音中所述讲话者的年龄范围没有落入所述预设条件包括的所述预设年龄范围,保留或过滤所述讲话者的录音。
可选地,所述预设条件包括所述预设性别;
所述保留或过滤满足预设条件的语音,包括:
判断所述第一录音中所述讲话者的性别是否与所述预设条件包括的所述预设性别相同;
若所述第一录音中所述讲话者的所述性别与所述预设条件包括的所述预设性别相同,保留或过滤所述讲话者的录音。
可选地,所述预设条件包括所述预设声纹特征参数;
所述保留或过滤满足预设条件的语音,包括:
判断所述第一录音中所述讲话者的所述声纹特征参数是否与所述预设条件包括的所述声纹特征参数相匹配;
若所述第一录音中所述讲话者的所述声纹特征参数与所述预设条件包括的所述预设声纹特征参数相匹配,保留或过滤所述讲话者的录音。
可选地,所述对所述第一录音进行语音分类获得语音类型过程中,在噪声或音乐中包含人声时,所述语音类型为人声。
进一步地,为实现上述目的,本发明还提供一种录音过滤装置,所述录音过滤装置包括存储器、至少一个处理器以及存储在所述存储器上并可在所述至少一个处理器执行的至少一个程序,所述至少一个程序被所述至少一个处理器执行时实现上述方法中的步骤。
进一步地,为实现上述目的,本发明一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行的至少一个程序,所述至少一个程序被所述计算机执行时使所述计算机执行上述任一项所述的方法中的步骤。
相较于现有技术,本发明所提出的录音过滤方法对第一录音进行语音识别分析;按照预设规则对所述第一录音进行过滤,得到第二录音;其中,所述预设规则包括:保留或过滤预设语音类型的录音,所述预设语音类型包括:人声、音乐、噪声;或者,保留或过滤满足预设条件的录音,所述预设条件包括预设年龄范围、预设性别、预设声纹特征参数中的至少一种。这样,本发明提供的录音过滤方法能够按照预设规则对录音进行过滤,过滤掉无效录音,仅保留有效录音,减少人工对录音进行回放识别的时间,提高录音回放识别的效率。
附图说明
图1是本发明实施例提供的一种录音过滤装置的结构示意图;
图2是本发明实施例提供的一种车载***的结构示意图;
图3是本发明实施例提供的一种服务器的结构示意图;
图4是本发明实施例提供的录音过滤方法的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
请参阅图1,图1是本发明实施例提供的一种录音过滤装置的结构示意图,如图1所示,录音过滤装置100包括处理器101以及存储器102,所述存储器102用于存储所述录音过滤装置100的相关数据,例如程序,所述处理器101用于执行所述存储器102中存储的程序,并实现相应的功能。本发明实施例中,所述录音过滤装置100可以为车载***,也可以为服务器。
请进一步参阅图2,图2是本发明实施例提供的一种车载***的结构示意图,如图2所示,车载***200包括处理器201以及存储器202,所述存储器202用于存储所述车载***200的相关数据,例如所述车载***200采集到的数据以及程序,所述处理器201用于执行所述处理器202中存储的程序,并实现相应的功能。
所述车载***200还包括定位模块203、录音模块204、无线通信模块205、震动传感器206、低电检测模块207以及电池模块208中的一种或多种。所述定位模块203用于对所述车载***200进行定位,获得所述车载***200的位置信息,所述定位模块203可以为GPS或北斗等定位芯片,通过获取车辆的经纬度信息,也可以为WIFI定位模块、蓝牙定位模块或者基站定位模块,通过获取周边的WIFI设备地址信息、蓝牙设备地址信息或者基站标识信息。
所述录音模块204用于收录所述车载***200周围的声音,所述无线通信模块205用于实现所述车载***200与外部设备之间的无线通信连接,所述无线通信模块205可以包括蓝牙通信模块、红外通信模块、WIFI通信模块、移动蜂窝网通信模块(如2G、3G、4G、5G通信模块)中的一种或多种。可以理解的是,在一些实施例中,所述车载***200可以包括有线通信模块,用于实现所述车载***200与车载终端之间的有线通信连接,进而通过所述车载终端实现为外部设备之间的通信连接。所述震动传感器206用于检测车辆的震动数据,所述处理器201可以根据所述震动传感器206检测的震动数据判断车辆的行驶状态(例如移动状态或静止状态)。所述低电检测模块207用于检测所述车载***200的电量信息,并向所述处理器201上报电池电量信息所述电池模块208用于为所述车载***200供电。
请参阅图3,图3是本发明实施例提供的一种服务器的结构示意图,如图3所示,服务器300包括处理器301以及存储器302,所述存储器302用于存储所述服务器300的相关数据,例如程序,所述处理器301用于执行所述存储器302中存储的程序,并实现相应的功能。
需要说明的是,当所述录音过滤装置100为如图2所示的车载***200,所述车载***200可以通过服务器300实现与客户端的通信连接,也可以不通过所述服务器300,直接与所述客户端建立通信连接。当所述录音过滤装置100为如图3所示的服务器300时,所述服务器300通过与所述车载***200建立通信连接,获取所述车载***200采集的数据,例如位置信息以及声音信息等。
基于上述录音过滤装置100的结构示意图,提出本发明方法各个实施例。
参阅图4,图4是本发明实施例提供的一种录音过滤方法的步骤流程图,所述方法应用于所述录音过滤装置100中,如图4所示,所述方法包括:
步骤401、对第一录音进行语音识别分析。
该步骤中,所述方法对第一录音进行语音识别分析,所述第一录音为通过录音设备记录的录音,例如在会议上通过录音笔记录的录音,或者通过设置在车辆中的车载***记录的声音。对于语音内容过长的情况,可以将语音内容拆分成多条,然后逐条进行语音分析。
所述对第一录音进行语音识别分析,具体可以包括所述第一录音进行语音分类获得语音类型,所述语音类型包括人声、噪声、音乐;若所述语音类型是人声,则对所述第一录音进行声纹识别获取所述讲话者的声纹特征参数,和/或对所述第一录音进行讲话者的性别判断获取所述讲话者的性别,和/或对所述第一录音进行讲话者的年龄范围判断获取所述讲话者的年龄范围。
需要说明的是,所述录音过滤装置内部可以部署语音识别装置,通过所述语音识别装置对所述第一录音进行语音分析,也可以不部署语音识别装置,通过调用外部语音识别服务器实现对所述第一录音进行语音分析的功能。
步骤402、按照预设规则对所述第一录音进行过滤,得到第二录音;其中,所述预设规则包括:保留或过滤预设语音类型的录音,所述预设语音类型包括:人声、音乐、噪声;或者,保留或过滤满足预设条件的录音,所述预设条件包括预设年龄范围、预设性别、预设声纹特征参数中的至少一种。
该步骤中,所述方法按照预设规则所述第一录音进行过滤,得到第二录音。所述预设规则可以包括根据语音类型进行过滤,例如保留或过滤预设语音类型的录音,所述预设语音类型包括人声、音乐、噪声;所述预设规则也可以包括根据讲话者的声纹特征进行过滤,例如保留或过滤满足预设条件的录音,所述预设条件包括预设年龄范围、预设性别、预设声纹特征参数中的至少一种。
举例而言,当用户只需要对人声进行识别时,可以将所述预设规则设置为保留预设语音类型的录音,所述预设语音类型为人声。当用户只需要对女性讲话者的声音进行识别时,可以将所述预设规则设置为保留性别为女性的录音,或者过滤性别为男性的录音。当用户只需要对指定讲话者(例如车主、驾驶员或固定乘客)的声音进行识别时,可以将所述预设规则设置为保留预设声纹特征参数的录音,所述预设声纹特征参数为所述指定讲话者对应的声纹特征参数。相反地,当用户需要对除了指定讲话者之外的其他讲话者的声音进行识别时,可以将所述预设规则设置为过滤预设声纹特征参数的录音,所述预设声纹特征参数为所述指定讲话者对应的声纹特征参数。
所述预设规则可以是用户根据实际需求预先设置的过滤规则,本发明一些实施例中,在录音过滤过程中和/或录音过滤完成后,所述方法还能够接收针对所述预设规则的修改操作,并根据所述修改操作更新所述预设规则。
本实施例中,所述录音过滤方法对第一录音进行语音识别分析;按照预设规则对所述第一录音进行过滤,得到第二录音;其中,所述预设规则包括:保留或过滤预设语音类型的录音,所述预设语音类型包括:人声、音乐、噪声;或者,保留或过滤满足预设条件的录音,所述预设条件包括预设年龄范围、预设性别、预设声纹特征参数中的至少一种。这样,本发明提供的录音过滤方法能够按照预设规则对录音进行过滤,过滤掉无效录音,仅保留有效录音,减少人工对录音进行回放识别的时间,提高录音回放识别的效率。
以下以所述录音过滤装置为服务器,所述第一录音为通过车载***记录的录音为例,对本发明提供的方法过程进行详细描述。
管理员需要对车辆上的录音进行回放识别时,可以在客户端上开启应用程序,并通过应用程序向服务器发送录音过滤请求,所述录音过滤请求中携带有过滤参数,所述过滤参数至少包括预设规则,还可以包括其他信息,例如用户账号、车载***标识、车辆限乘人数、用户信息(如姓名、性别、年龄、联系方式等)中的至少一种。所述服务器接收到所述客户端发送的录音过滤请求后,获取并保存所述驾乘人员识别请求中携带的过滤参数,用于后续对录音进行语音识别分析,并向所述客户端返回开启录音过滤应答消息,标识所述服务器成功接收所述客户端发送的录音过滤请求且已开启录音过滤功能,所述服务器向所述车载***标识对应的车载***发送录音过滤请求,用于请求获取所述车载***采集的第一录音,并根据获取的声音信息进行后续的录音过滤步骤。可以理解的是,所述服务器向所述车载***发送所述录音过滤请求之前,可以先判断所述车载***是否在线,若在线,则直接向所述车载***发送所述录音过滤请求,若不在线,则等待所述车载***上线之后向所述车载***发送所述录音过滤请求。所述车载***在接收到所述服务器发送的所述录音过滤请求后,保存所述录音过滤请求中的过滤参数,并向所述服务器返回录音过滤应答消息,此外,所述车载***还将采集到的第一录音向所述服务器上报。
以下以所述录音过滤装置为车载***,所述第一录音为通过车载***记录的录音为例,对本发明提供的方法过程进行详细描述。
管理员需要对车辆上的录音进行回放识别时,可以在客户端上开启应用程序,并通过应用程序向车载***发送录音过滤请求,所述录音过滤请求中携带有过滤参数,所述过滤参数至少包括预设规则,还可以包括其他信息,例如用户账号、车载***标识、车辆限乘人数、预设声纹特征参数、用户信息(如姓名、性别、年龄、联系方式等)中的至少一种。所述客户端可以直接与所述车载***建立通信连接并向所述车载***发送所述录音过滤请求,也可以通过服务器向所述车载***发送所述录音过滤请求。所述车载***接收到所述客户端发送的录音过滤请求后,获取并保存所述录音过滤请求中携带的过滤参数,用于后续对第一录音进行语音分析,并向所述客户端返回录音过滤应答消息,标识所述车载***成功接收所述客户端发送的录音过滤请求且已开启录音过滤功能,所述载***获取采集的第一录音,并根据获取的第一录音进行后续的录音过滤步骤。
可选地,所述对第一录音进行语音识别分析,包括:
对所述第一录音进行语音分类获得语音类型,所述语音类型包括:人声、噪声、音乐;
若所述语音类型是人声,则对所述第一录音进行声纹识别获取所述讲话者的声纹特征参数,和/或对所述第一录音进行讲话者的性别判断获取所述讲话者的性别,和/或对所述第一录音进行讲话者的年龄范围判断获取所述讲话者的年龄范围。
可选地,所述预设规则包括保留或过滤预设语音类型的录音,所述按照预设规则对所述第一录音进行过滤,包括:
保留第一预设语音类型的录音;
和/或,过滤第二预设语音类型的录音。
可选地,所述第一预设语音类型包括人声,和/或,所述第二预设语音类型包括音乐和/或噪声。
可选地,所述预设条件包括所述预设年龄范围;
所述保留或过滤满足预设条件的录音,包括:
判断所述第一录音中所述讲话者的年龄范围是否落入所述预设条件包括的所述预设年龄范围;
若所述第一录音中所述讲话者的年龄范围没有落入所述预设条件包括的所述预设年龄范围,保留或过滤所述讲话者的录音。
可选地,所述预设条件包括所述预设性别;
所述保留或过滤满足预设条件的语音,包括:
判断所述第一录音中所述讲话者的性别是否与所述预设条件包括的所述预设性别相同;
若所述第一录音中所述讲话者的所述性别与所述预设条件包括的所述预设性别相同,保留或过滤所述讲话者的录音。
可选地,所述预设条件包括所述预设声纹特征参数;
所述保留或过滤满足预设条件的语音,包括:
判断所述第一录音中所述讲话者的所述声纹特征参数是否与所述预设条件包括的所述声纹特征参数相匹配;
若所述第一录音中所述讲话者的所述声纹特征参数与所述预设条件包括的所述预设声纹特征参数相匹配,保留或过滤所述讲话者的录音。
举例而言,当用户只需要回放识别指定讲话者(例如驾驶员)的录音时,可以预先设置该指定讲话者的声纹特征参数为预设声纹特征参数,若所述第一录音中讲话者的声纹特征参数与所述预设条件包括的所述预设声纹特征参数相匹配,则保留该讲话者的录音。
本发明一些实施例中,所述方法还可以对第一录音中不同讲话者的声音进行识别,将每一讲话者的录音进行集中保存,即将具有相同声纹特征参数的录音集中保存。例如假设第一录音中包括A、B、C三人的声音,所述方法将所述第一录音中A讲话的内容进行单独保存,将所述第一录音中B讲话的内容进行单独保存,将所述第一录音中C讲话的内容进行单独保存。
进一步地,还可以针对每一集中保存的录音进行标识,例如对每一相同的声纹特征参数分配一个乘客标识码,使用不同的乘客标识码标识不同乘客的讲话录音,对于有多个讲话者同时讲话的情况,可以将该段包括多个讲话者同时讲话的录音与多个乘客标识码进行标识,标识该段录音中包含多个讲话者的讲话录音。或者对每一讲话者的声音进行性别和/或年龄范围判断,确定每一讲话者的性别和/或年龄范围,并以讲话者的性别和/或年龄范围标识该江湖这的讲话录音。
本发明一些实施例中,所述方法将针对所述第一录音过滤后的得到的第二录音进行保存,将该第二录音标识为正常录音,同时,也可以将过滤掉的第三录音进行保存,标识为被过滤录音。这样,当用户需要对第一录音进行回放识别时,可以根据录音的标识确定哪个录音文件为过滤后的正常录音,方便用户准确选择正常录音文件进行回放识别。在一些实施例中,所述录音过滤装置还进一步将所述第二录音进行语音转文字处理,得到所述第二录音对应的文字内容。
可选地,所述对所述第一录音进行语音分类获得语音类型过程中,在噪声或音乐中包含人声时,所述语音类型为人声。
本领域普通技术人员可以理解实现上述实施例方法的全部或者部分步骤是可以通过至少一个程序指令相关的硬件来完成,所述至少一个程序可以存储于如图1所示的录音过滤装置100的存储器102中,并能够被所述录音过滤装置100的处理器101执行,所述至少一个程序被所述处理器执行时实现如下步骤:
对第一录音进行语音识别分析;
按照预设规则对所述第一录音进行过滤,得到第二录音;
其中,所述预设规则包括:
保留或过滤预设语音类型的录音,所述预设语音类型包括:人声、音乐、噪声;
或者,保留或过滤满足预设条件的录音,所述预设条件包括预设年龄范围、预设性别、预设声纹特征参数中的至少一种。
可选地,所述对第一录音进行语音识别分析,包括:
对所述第一录音进行语音分类获得语音类型,所述语音类型包括:人声、噪声、音乐;
若所述语音类型是人声,则对所述第一录音进行声纹识别获取所述讲话者的声纹特征参数,和/或对所述第一录音进行讲话者的性别判断获取所述讲话者的性别,和/或对所述第一录音进行讲话者的年龄范围判断获取所述讲话者的年龄范围。
可选地,所述预设规则包括保留或过滤预设语音类型的录音,所述按照预设规则对所述第一录音进行过滤,包括:
保留第一预设语音类型的录音;
和/或,过滤第二预设语音类型的录音。
可选地,所述第一预设语音类型包括人声,和/或,所述第二预设语音类型包括音乐和/或噪声。
可选地,所述预设条件包括所述预设年龄范围;
所述保留或过滤满足预设条件的录音,包括:
判断所述第一录音中所述讲话者的年龄范围是否落入所述预设条件包括的所述预设年龄范围;
若所述第一录音中所述讲话者的年龄范围没有落入所述预设条件包括的所述预设年龄范围,保留或过滤所述讲话者的录音。
可选地,所述预设条件包括所述预设性别;
所述保留或过滤满足预设条件的语音,包括:
判断所述第一录音中所述讲话者的性别是否与所述预设条件包括的所述预设性别相同;
若所述第一录音中所述讲话者的所述性别与所述预设条件包括的所述预设性别相同,保留或过滤所述讲话者的录音。
可选地,所述预设条件包括所述预设声纹特征参数;
所述保留或过滤满足预设条件的语音,包括:
判断所述第一录音中所述讲话者的所述声纹特征参数是否与所述预设条件包括的所述声纹特征参数相匹配;
若所述第一录音中所述讲话者的所述声纹特征参数与所述预设条件包括的所述预设声纹特征参数相匹配,保留或过滤所述讲话者的录音。
可选地,所述对所述第一录音进行语音分类获得语音类型过程中,在噪声或音乐中包含人声时,所述语音类型为人声。
本领域普通技术人员可以理解实现上述实施例方法的全部或者部分步骤是可以通过至少一个程序指令相关的硬件来完成,所述至少一个程序可以存储于一计算机可读存储介质中,该至少一个程序被执行时,实现以下步骤:
对第一录音进行语音识别分析;
按照预设规则对所述第一录音进行过滤,得到第二录音;
其中,所述预设规则包括:
保留或过滤预设语音类型的录音,所述预设语音类型包括:人声、音乐、噪声;
或者,保留或过滤满足预设条件的录音,所述预设条件包括预设年龄范围、预设性别、预设声纹特征参数中的至少一种。
可选地,所述对第一录音进行语音识别分析,包括:
对所述第一录音进行语音分类获得语音类型,所述语音类型包括:人声、噪声、音乐;
若所述语音类型是人声,则对所述第一录音进行声纹识别获取所述讲话者的声纹特征参数,和/或对所述第一录音进行讲话者的性别判断获取所述讲话者的性别,和/或对所述第一录音进行讲话者的年龄范围判断获取所述讲话者的年龄范围。
可选地,所述预设规则包括保留或过滤预设语音类型的录音,所述按照预设规则对所述第一录音进行过滤,包括:
保留第一预设语音类型的录音;
和/或,过滤第二预设语音类型的录音。
可选地,所述第一预设语音类型包括人声,和/或,所述第二预设语音类型包括音乐和/或噪声。
可选地,所述预设条件包括所述预设年龄范围;
所述保留或过滤满足预设条件的录音,包括:
判断所述第一录音中所述讲话者的年龄范围是否落入所述预设条件包括的所述预设年龄范围;
若所述第一录音中所述讲话者的年龄范围没有落入所述预设条件包括的所述预设年龄范围,保留或过滤所述讲话者的录音。
可选地,所述预设条件包括所述预设性别;
所述保留或过滤满足预设条件的语音,包括:
判断所述第一录音中所述讲话者的性别是否与所述预设条件包括的所述预设性别相同;
若所述第一录音中所述讲话者的所述性别与所述预设条件包括的所述预设性别相同,保留或过滤所述讲话者的录音。
可选地,所述预设条件包括所述预设声纹特征参数;
所述保留或过滤满足预设条件的语音,包括:
判断所述第一录音中所述讲话者的所述声纹特征参数是否与所述预设条件包括的所述声纹特征参数相匹配;
若所述第一录音中所述讲话者的所述声纹特征参数与所述预设条件包括的所述预设声纹特征参数相匹配,保留或过滤所述讲话者的录音。
可选地,所述对所述第一录音进行语音分类获得语音类型过程中,在噪声或音乐中包含人声时,所述语音类型为人声。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种录音过滤方法,其特征在于,所述方法包括:
对第一录音进行语音识别分析;
按照预设规则对所述第一录音进行过滤,得到第二录音;
其中,所述预设规则包括:
保留或过滤预设语音类型的录音,所述预设语音类型包括:人声、音乐、噪声;
或者,保留或过滤满足预设条件的录音,所述预设条件包括预设年龄范围、预设性别、预设声纹特征参数中的至少一种。
2.根据权利要求1所述的录音过滤方法,其特征在于,所述对第一录音进行语音识别分析,包括:
对所述第一录音进行语音分类获得语音类型,所述语音类型包括:人声、噪声、音乐;
若所述语音类型是人声,则对所述第一录音进行声纹识别获取所述讲话者的声纹特征参数,和/或对所述第一录音进行讲话者的性别判断获取所述讲话者的性别,和/或对所述第一录音进行讲话者的年龄范围判断获取所述讲话者的年龄范围。
3.根据权利要求1所述的录音过滤方法,其特征在于,所述预设规则包括保留或过滤预设语音类型的录音,所述按照预设规则对所述第一录音进行过滤,包括:
保留第一预设语音类型的录音;
和/或,过滤第二预设语音类型的录音。
4.根据权利要求3所述的录音过滤方法,其特征在于,所述第一预设语音类型包括人声,和/或,所述第二预设语音类型包括音乐和/或噪声。
5.根据权利要求2所述的录音过滤方法,其特征在于,所述预设条件包括所述预设年龄范围;
所述保留或过滤满足预设条件的录音,包括:
判断所述第一录音中所述讲话者的年龄范围是否落入所述预设条件包括的所述预设年龄范围;
若所述第一录音中所述讲话者的年龄范围没有落入所述预设条件包括的所述预设年龄范围,保留或过滤所述讲话者的录音。
6.根据权利要求2所述的录音过滤方法,其特征在于,所述预设条件包括所述预设性别;
所述保留或过滤满足预设条件的语音,包括:
判断所述第一录音中所述讲话者的性别是否与所述预设条件包括的所述预设性别相同;
若所述第一录音中所述讲话者的所述性别与所述预设条件包括的所述预设性别相同,保留或过滤所述讲话者的录音。
7.根据权利要求2所述的录音过滤方法,其特征在于,所述预设条件包括所述预设声纹特征参数;
所述保留或过滤满足预设条件的语音,包括:
判断所述第一录音中所述讲话者的所述声纹特征参数是否与所述预设条件包括的所述声纹特征参数相匹配;
若所述第一录音中所述讲话者的所述声纹特征参数与所述预设条件包括的所述预设声纹特征参数相匹配,保留或过滤所述讲话者的录音。
8.根据权利要求2所述的录音过滤方法,其特征在于,所述对所述第一录音进行语音分类获得语音类型过程中,在噪声或音乐中包含人声时,所述语音类型为人声。
9.一种录音过滤装置,其特征在于,所述录音过滤装置包括存储器、至少一个处理器以及存储在所述存储器上并可在所述至少一个处理器执行的至少一个程序,所述至少一个程序被所述至少一个处理器执行时实现上述权利要求1~8任一项所述的方法中的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行的至少一个程序,其特征在于,所述至少一个程序被所述计算机执行时使所述计算机执行上述权利要求1~8任一项所述的方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010999917.2A CN112102854A (zh) | 2020-09-22 | 2020-09-22 | 一种录音过滤方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010999917.2A CN112102854A (zh) | 2020-09-22 | 2020-09-22 | 一种录音过滤方法、装置及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112102854A true CN112102854A (zh) | 2020-12-18 |
Family
ID=73755742
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010999917.2A Pending CN112102854A (zh) | 2020-09-22 | 2020-09-22 | 一种录音过滤方法、装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112102854A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113014844A (zh) * | 2021-02-08 | 2021-06-22 | Oppo广东移动通信有限公司 | 一种音频处理方法、装置、存储介质及电子设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103714817A (zh) * | 2013-12-31 | 2014-04-09 | 厦门天聪智能软件有限公司 | 基于声纹识别技术的满意度调查作弊排查方法 |
CN108694954A (zh) * | 2018-06-13 | 2018-10-23 | 广州势必可赢网络科技有限公司 | 一种性别年龄识别方法、装置、设备及可读存储介质 |
CN108831440A (zh) * | 2018-04-24 | 2018-11-16 | 中国地质大学(武汉) | 一种基于机器学习及深度学习的声纹降噪方法及*** |
CN109448756A (zh) * | 2018-11-14 | 2019-03-08 | 北京大生在线科技有限公司 | 一种语音年龄识别方法及*** |
CN110473566A (zh) * | 2019-07-25 | 2019-11-19 | 深圳壹账通智能科技有限公司 | 音频分离方法、装置、电子设备及计算机可读存储介质 |
CN111246285A (zh) * | 2020-03-24 | 2020-06-05 | 北京奇艺世纪科技有限公司 | 一种解说视频中声音的分离方法、音量调节方法及装置 |
CN111640422A (zh) * | 2020-05-13 | 2020-09-08 | 广州国音智能科技有限公司 | 语音人声分离方法、装置、终端及存储介质 |
-
2020
- 2020-09-22 CN CN202010999917.2A patent/CN112102854A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103714817A (zh) * | 2013-12-31 | 2014-04-09 | 厦门天聪智能软件有限公司 | 基于声纹识别技术的满意度调查作弊排查方法 |
CN108831440A (zh) * | 2018-04-24 | 2018-11-16 | 中国地质大学(武汉) | 一种基于机器学习及深度学习的声纹降噪方法及*** |
CN108694954A (zh) * | 2018-06-13 | 2018-10-23 | 广州势必可赢网络科技有限公司 | 一种性别年龄识别方法、装置、设备及可读存储介质 |
CN109448756A (zh) * | 2018-11-14 | 2019-03-08 | 北京大生在线科技有限公司 | 一种语音年龄识别方法及*** |
CN110473566A (zh) * | 2019-07-25 | 2019-11-19 | 深圳壹账通智能科技有限公司 | 音频分离方法、装置、电子设备及计算机可读存储介质 |
CN111246285A (zh) * | 2020-03-24 | 2020-06-05 | 北京奇艺世纪科技有限公司 | 一种解说视频中声音的分离方法、音量调节方法及装置 |
CN111640422A (zh) * | 2020-05-13 | 2020-09-08 | 广州国音智能科技有限公司 | 语音人声分离方法、装置、终端及存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113014844A (zh) * | 2021-02-08 | 2021-06-22 | Oppo广东移动通信有限公司 | 一种音频处理方法、装置、存储介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106209138B (zh) | 一种车辆谨慎紧急响应***及方法 | |
CN107613144B (zh) | 自动呼叫方法、装置、存储介质及移动终端 | |
CN112086098B (zh) | 一种驾乘人员分析方法、装置及计算机可读存储介质 | |
US9420431B2 (en) | Vehicle telematics communication for providing hands-free wireless communication | |
JP2019191828A (ja) | 情報提供システムおよび情報提供方法 | |
CN106816149A (zh) | 车辆自动语音识别***的优先化内容加载 | |
WO2014137384A1 (en) | Emergency handling system using informative alarm sound | |
DE102018125966A1 (de) | System und verfahren zur erfassung von stichworten in einer unterhaltung | |
CN109101205B (zh) | 信息输出***、信息输出方法以及存储介质 | |
CN112785837A (zh) | 用户驾驶车辆时情绪识别方法及装置、存储介质和终端 | |
CN108597524B (zh) | 一种汽车人声识别提示装置及方法 | |
CN111028834B (zh) | 语音信息提醒方法、装置、服务器和语音信息提醒设备 | |
CN106156036B (zh) | 一种车载音频处理方法及车载设备 | |
CN112071309A (zh) | 网约车安全监测装置及*** | |
US12012107B2 (en) | Operator monitoring and engagement | |
CN112102854A (zh) | 一种录音过滤方法、装置及计算机可读存储介质 | |
CN113596247B (zh) | 闹钟信息处理方法、装置、车辆、存储介质及程序产品 | |
CN113094483B (zh) | 车辆反馈信息的处理方法、装置、终端设备及存储介质 | |
WO2016165403A1 (zh) | 一种交通辅助方法及*** | |
CN110826433B (zh) | 试驾用户情绪分析数据处理方法、装置、设备与存储介质 | |
JP2006121270A (ja) | ハンズフリー通話装置 | |
CN112116911B (zh) | 一种声音布控方法、装置及计算机可读存储介质 | |
CN112118536B (zh) | 一种装置的省电方法、省电装置及计算机可读存储介质 | |
CN113306487A (zh) | 车辆提示方法、装置、电子设备、存储介质及程序产品 | |
CN112261586A (zh) | 一种利用车载机器人自动识别驾驶员限制其行使范围的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201218 |