CN110097872A - 一种音频处理方法及电子设备 - Google Patents

一种音频处理方法及电子设备 Download PDF

Info

Publication number
CN110097872A
CN110097872A CN201910363067.4A CN201910363067A CN110097872A CN 110097872 A CN110097872 A CN 110097872A CN 201910363067 A CN201910363067 A CN 201910363067A CN 110097872 A CN110097872 A CN 110097872A
Authority
CN
China
Prior art keywords
sound source
audio signal
electronic equipment
sounding
target utterance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910363067.4A
Other languages
English (en)
Other versions
CN110097872B (zh
Inventor
覃宝强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Priority to CN201910363067.4A priority Critical patent/CN110097872B/zh
Publication of CN110097872A publication Critical patent/CN110097872A/zh
Application granted granted Critical
Publication of CN110097872B publication Critical patent/CN110097872B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Telephone Function (AREA)

Abstract

本发明涉及通信技术领域,提供一种音频处理方法及电子设备,以解决现有技术中电子设备录制的音频效果较差的问题。该方法包括:接收用户对声源中的目标发声对象的第一输入;响应于所述第一输入,对所述声源发出的音频信号进行处理;其中,处理后的所述音频信号中,所述目标发声对象发出的音频信号强度大于其他发声对象发出的音频信号强度;所述其他发声对象为,所述声源中除所述目标发声对象之外的发声对象。这样,电子设备可以根据用户操作重点录制需要的声音,能够提高录制的音频的效果。

Description

一种音频处理方法及电子设备
技术领域
本发明涉及通信技术领域,尤其涉及一种音频处理方法及电子设备。
背景技术
在现实生活中,用户常常会需要对声音进行录音。而自然界的很多声音是混杂在一起的,在不同的场景中,用户所需要录制的声音对象可能会不同。比如,用户在海边想录大海的声音而忽略其他人声,在下雨时想录制雨声而忽略汽车的噪声。
现有技术中,电子设备在进行录音的过程中,是根据实际采集的声音进行录制,这样,当环境中存在多种声音时,则录制的多种声音容易混杂在一起,例如,海声中夹杂着人声,雨声中混杂着汽车噪声,导致录制的音频效果较差。
发明内容
本发明实施例提供一种音频处理方法及电子设备,以解决现有技术中电子设备录制的音频效果较差的问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,本发明实施例提供了一种音频处理方法,应用于电子设备,包括:
接收用户对声源中的目标发声对象的第一输入;
响应于所述第一输入,对所述声源发出的音频信号进行处理;
其中,处理后的所述音频信号中,所述目标发声对象发出的音频信号强度大于其他发声对象发出的音频信号强度;
所述其他发声对象为,所述声源中除所述目标发声对象之外的发声对象。
第二方面,本发明实施例还提供一种电子设备,包括:
接收模块,用于接收用户对声源中的目标发声对象的第一输入;
处理模块,用于响应于所述第一输入,对所述声源发出的音频信号进行处理;
其中,处理后的所述音频信号中,所述目标发声对象发出的音频信号强度大于其他发声对象发出的音频信号强度;
所述其他发声对象为,所述声源中除所述目标发声对象之外的发声对象。
第三方面,本发明实施例还提供一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的音频处理方法中的步骤。
第四方面,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上所述的音频处理方法中的步骤。
本发明实施例中,接收用户对声源中的目标发声对象的第一输入;响应于所述第一输入,对所述声源发出的音频信号进行处理;其中,处理后的所述音频信号中,所述目标发声对象发出的音频信号强度大于其他发声对象发出的音频信号强度;所述其他发声对象为,所述声源中除所述目标发声对象之外的发声对象。这样,电子设备可以根据用户操作重点录制需要的声音,能够提高录制的音频的效果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的音频处理方法的流程图之一;
图1a是本发明实施例提供的电子设备的界面示意图之一;
图1b是本发明实施例提供的电子设备的界面示意图之二;
图1c是本发明实施例提供的音频处理方法的流程图之二;
图2是本发明实施例提供的音频处理方法的流程图之三;
图2a是本发明实施例提供的电子设备的界面示意图之三;
图2b是本发明实施例提供的音频处理方法的流程图之四;
图3是本发明实施例提供的电子设备的结构图之一;
图4是本发明实施例提供的电子设备的结构图之二;
图5是本发明实施例提供的电子设备的结构图之三;
图6是本发明实施例提供的电子设备的结构图之四;
图7是本发明实施例提供的电子设备的结构图之五。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,图1是本发明实施例提供的音频处理方法的流程图,如图1所示,包括以下步骤:
步骤101、接收用户对声源中的目标发声对象的第一输入。
其中,声源可以是电子设备实时采集的、已经获取的或者即将获取的音频中的声源。发声对象可以是发出声音的对象,例如,环境中包含狗叫声、汽车声,则发声对象包括狗和汽车。在此步骤中,用户可以对声源中的任意发声对象进行选择,例如,在电子设备上进行操作或者通过语音的方式输入。
其中,上述目标发声对象可以包括一个或者多个发声对象。
电子设备可以基于正在采集的音频或者已经获取的音频对发声对象进行识别,并在识别声源中的发声对象后,输出提示信息,以提示用户选择需要的发声对象。例如,电子设备显示如图1a所示的界面,用户可以基于界面内显示的发声对象进行选择操作,即第一输入。在上述选择界面中,可以显示复位按钮,通过对复位按钮进行操作,则所有选项恢复至初始的状态。如图1b所示,用户选择男1和男2之后,可以通过对复位按钮进行操作,以将界面中的选项恢复至图1a所示的选择状态。
电子设备还可以根据用户的第一输入,采集音频并识别发声对象。例如,用户输入狗叫声,则电子设备接收用户的输入,实时获取环境中的声音,并识别狗叫声。
步骤102、响应于所述第一输入,对所述声源发出的音频信号进行处理。
其中,处理后的所述音频信号中,所述目标发声对象发出的音频信号强度大于其他发声对象发出的音频信号强度;所述其他发声对象为,所述声源中除所述目标发声对象之外的发声对象。
电子设备可以根据发声对象发出的音频信号的特征,识别音频信号对应的发声对象,当环境中包括多个发声对象时,可以识别所有的发声对象或者部分发声对象。还可以根据发声对象的类型进行识别。例如,当识别到环境中包括男A和男B的声音,可以均识别为男人的声音,也可以将男A和男B的声音分别识别。
在此步骤中,电子设备通过对音频信号进行处理,例如,增强目标发声对象的音频信号的强度,或者屏蔽其他发声对象的音频信号强度,使得目标发声对象的音频比较突出,而其他发声对象的声音较弱或消失,即,目标发声对象的音频信号强度大于其他发声对象的音频信号强度。
由于目标发声对象的音频信号较强,能够较清晰地获得目标发声对象的声音,提高音频效果。
为了便于理解本发明实施例,以下结合具体实施方式进行举例说明。
参见图1c,电子设备识别音频中的全部声音,并分析声音成分判断发声体,即发声对象。电子设备在显示屏显示发声体选项,以供用户选择。若接收到用户对目标发声体的选择,则突出被选择的发声体的声音,弱化或屏蔽其他的声音;若没有接收到用户的选择,则按照预设的方式处理,可以不作处理或者按照现有技术的方式进行处理。
本发明实施例中,上述音频处理方法可以应用于电子设备,例如:手机、平板电脑(Tablet Personal Computer)、膝上型电脑(Laptop Computer)、个人数字助理(personaldigital assistant,简称PDA)、移动上网装置(Mobile Internet Device,MID)或可穿戴式设备(Wearable Device)等。
本发明实施例的音频处理方法,接收用户对声源中的目标发声对象的第一输入;响应于所述第一输入,对所述声源发出的音频信号进行处理;其中,处理后的所述音频信号中,所述目标发声对象发出的音频信号强度大于其他发声对象发出的音频信号强度;所述其他发声对象为,所述声源中除所述目标发声对象之外的发声对象。这样,电子设备可以根据用户操作重点录制需要的声音,能够提高录制的音频的效果。
参见图2,本实施例与上述实施例的主要区别在于,发声对象的数量包括至少两种时,输出相关联的至少两种关联对象,以便于用户选择。
图2是本发明实施例提供的音频处理方法的流程图,如图2所示,包括以下步骤:
步骤201、识别声源中的发声对象。
其中,此步骤的相关解释可以参见上述实施例中的描述,此处不再赘述。当环境中包括声源发出的音频时,可以识别声源中的所有或者部分发声对象。在此步骤中,电子设备可以根据发声对象发出的音频信号的特征,识别音频信号对应的发声对象,当环境中包括多个发声对象时,可以识别所有的发声对象或者部分发声对象。还可以根据发声对象的类型进行识别。例如,当识别到环境中包括男A和男B的声音,可以均识别为男人的声音,也可以将男A和男B的声音分别识别。
所述对所述声源发出的音频信号进行处理之前,所述方法还包括:
识别所述声源发出的音频信号的特征;
根据所述特征确定所述声源中的发声对象相对所述电子设备的方位;
基于所述方位识别所述目标发声对象。
在该实施方式中,电子设备可以根据发声对象相对电子设备的方位,识别发声对象,从而提高识别准确度。同时,还可以结合音频信号的特征和发声对象相对电子设备的方位,共同确定目标发声对象。
例如,在处于人较多的场景中,若用户需要录制某一个人的声音,可以使用上述方案。
在具体实现时,可以利用多个麦克风组成麦克风矩阵,麦克风矩阵可以定位发声对象的角度,通过角度和发声对象的特征可以更加细化发声对象,从而确定需要获取的发声对象,即目标发声对象。
在对其他音频信号进行弱化或屏蔽处理时,可以识别其他发声对象相对电子设备的方位,根据该方位确定对应的音频信号,从而对音频信号进行处理。
这样,能够提高对发声对象判断的准确性。该实施方式也可以应用于图1对应的实施例中以及达到相同的有益效果。
步骤202、在所述声源中的发声对象中,识别至少两种相关联的关联对象。
其中,发声对象相关联可以理解为发声对象通常在同一场景中配合发声。例如,人的歌声和乐器声;雨声和雷声。关联的声音往往配合在一起声音效果会更好,因此可以将关联对象识别出来。上述关联对象可以是电子设备预先设置的对象,例如,设置雷和雨相关联;或者是预先设置相关联的音频信号,例如,设置具备雷声特征和具备雨声特征的音频信号相关联。
步骤203、输出所述关联对象相关联的提示信息。
在此步骤中,输出关联对象,以使用户根据关联对象进行选择,提高音频的效果,便于用户操作。
例如,如图2a所示,在显示屏上显示相关联的三种发声对象“唱歌声”“乐器1”“乐器2”,便于用户选择。
步骤204、接收用户对声源中的目标发声对象的第一输入。
可选的,所述接收用户对声源中的目标发声对象的第一输入,包括:
接收用户对所述关联对象中的目标发声对象的第一输入。
在电子设备输出关联对象的提示信息的情况下,用户可以基于关联对象进行选择,即第一输入。例如,如图2a所示,选择唱歌声、乐器1和乐器2,这样,可以获得仅包括选择的对象的音频信号,且该音频信号较完整,效果较好。
可选的,所述接收用户对声源中的目标发声对象的第一输入之后,所述方法还包括:
识别与所述目标发声对象关联的目标关联对象;
显示所述目标关联对象的信息。
在该实施方式中,在用户选择目标发声对象的情况下,电子设备可以识别与目标发声对象关联的目标关联对象,以使用户基于关联选项进行选择操作。进一步地,还可以识别每个目标关联对象与目标发声对象的关联程度,并按照关联程序显示目标关联对象的提示信息。
例如,如图2a所示,若用户选择唱歌声,电子设备识别乐器1和乐器2与唱歌声相关联,则将乐器1和乐器2的选项的颜色增强显示。进一步地,电子设备识别乐器1和唱歌声关联的等级高,乐器2和唱歌声的关联等级低。则通过将乐器1和乐器2的选项显示为不同颜色以提示用户。这样,便于用户快速进行选择,提高操作效率,提高音频的效果。
步骤205、响应于所述第一输入,对所述声源发出的音频信号进行处理。
其中,处理后的所述音频信号中,所述目标发声对象发出的音频信号强度大于其他发声对象发出的音频信号强度;
所述其他发声对象为,所述声源中除所述目标发声对象之外的发声对象。
可选的,所述对所述声源发出的音频信号进行处理,包括:
增强所述目标发声对象发出的音频信号的强度;
和/或,
减弱或屏蔽所述其他发声对象发出的音频信号的强度。
在该实施方式中,可以仅对目标发声对象发出的音频信号进行处理,也可以仅对其他发声对象发出的音频信号进行处理,或者上述方式组合处理。通过上述任一处理方式,均可以使得目标发声对象的音频信号的强度大于其他发声对象的音频信号的强度。这样,能够获得更清晰的目标发声对象的音频,提高音频信号的效果。另外,上述方式可以择一使用或者同时选择多项。该实施方式也可以应用于图1对应的实施例中以及达到相同的有益效果。
其中,步骤204和步骤205的描述可以参见上述实施例中的描述,此处不再赘述。
为了便于理解发明本实施例,以下结合具体实施例进行举例说明。
参见图2b,电子设备启动录音功能,实时采集音频信号。电子设备根据音频信号识别发声体,并显示发声体选项供用户选择。当用户选择目标发声体的选项时,识别与目标发声体关联的发声体,并输出提示,以使用户基于提示信息进行选择。若接收到用户对关联发声体的选择,则突出所有被选择的发声体的声音,弱化或屏蔽其他的声音;若没有接收到用户的选择,则按照预设的方式处理,可以不作处理或者按照现有技术的方式进行处理。
上述实施例可以应用于以下场景中:如,在野外,听到鸟叫声,这时可以打开录音,待录音识别出鸟叫声后点击标记,这样录制所得的声音就会更加突出这个鸟叫声,满足用户对鸟叫声录制的需求;在听课时,想录制在黑板方位讲师的声音而忽略周围其他如翻书、空调、风扇、其他人低声交流等的声音,应用此方案可以达到更好的效果。
本发明实施例的音频处理方法,识别相关联的发声对象,并输出提示信息,便于用户快速进行选择,能够提高操作效率,提高音频的效果。
参见图3,图3是本发明实施例提供的电子设备的结构图,如图3所示,电子设备300包括:接收模块301和处理模块302。
接收模块301,用于接收用户对声源中的目标发声对象的第一输入;
处理模块302,用于响应于所述第一输入,对所述声源发出的音频信号进行处理;
其中,处理后的所述音频信号中,所述目标发声对象发出的音频信号强度大于其他发声对象发出的音频信号强度;
所述其他发声对象为,所述声源中除所述目标发声对象之外的发声对象。
可选的,所述处理模块302具体用于:增强所述目标发声对象发出的音频信号的强度;
和/或,
减弱或屏蔽所述其他发声对象发出的音频信号的强度。
可选的,如图4所示,所述电子设备还包括:
第一识别模块303,用于识别所述声源发出的音频信号的特征;
确定模块304,用于根据所述特征确定所述声源中的发声对象相对所述电子设备的方位;
第二识别模块305,用于基于所述方位识别所述目标发声对象。
可选的,所述声源中包括至少两种发声对象;
如图5所示,所述电子设备还包括:
第三识别模块306,用于识别所述声源中的发声对象;
第四识别模块307,用于在所述声源中的发声对象中,识别至少两种相关联的关联对象;
输出模块308,用于输出所述关联对象相关联的提示信息。
可选的,所述接收模块301具体用于:
接收用户对所述关联对象中的目标发声对象的第一输入。
可选的,如图6所示,所述电子设备还包括:
第五识别模块309,用于识别与所述目标发声对象关联的目标关联对象;
显示模块310,用于显示所述目标关联对象的信息。
电子设备300能够实现上述方法实施例中电子设备实现的各个过程,为避免重复,这里不再赘述。
本发明实施例的电子设备300,电子设备可以根据用户操作重点录制需要的声音,能够提高录制的音频的效果。
图7为实现本发明各个实施例的一种电子设备的硬件结构示意图,该电子设备700包括但不限于:射频单元701、网络模块702、音频输出单元703、输入单元704、传感器705、显示单元706、用户输入单元707、接口单元708、存储器709、处理器710、以及电源711等部件。本领域技术人员可以理解,图7中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,电子设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载移动终端、可穿戴设备、以及计步器等。
其中,用户输入单元707用于接收用户对声源中的目标发声对象的第一输入;处理器710用于响应于所述第一输入,对所述声源发出的音频信号进行处理;
其中,处理后的所述音频信号中,所述目标发声对象发出的音频信号强度大于其他发声对象发出的音频信号强度;
所述其他发声对象为,所述声源中除所述目标发声对象之外的发声对象。
这样,电子设备可以根据用户操作重点录制需要的声音,能够提高录制的音频的效果。
可选的,处理器710执行所述对所述声源发出的音频信号进行处理,包括:
增强所述目标发声对象发出的音频信号的强度;
和/或,
减弱或屏蔽所述其他发声对象发出的音频信号的强度。
可选的,处理器710执行所述对所述声源发出的音频信号进行处理之前,还用于:
识别所述声源发出的音频信号的特征;
根据所述特征确定所述声源中的发声对象相对所述电子设备的方位;
基于所述方位识别所述目标发声对象。
可选的,所述声源中包括至少两种发声对象;处理器710执行所述接收用户对声源中的目标发声对象的第一输入之前,还用于:
识别所述声源中的发声对象;
在所述声源中的发声对象中,识别至少两种相关联的关联对象;
输出所述关联对象相关联的提示信息。
可选的,处理器710执行所述接收用户对声源中的目标发声对象的第一输入,包括:
接收用户对所述关联对象中的目标发声对象的第一输入。
可选的,处理器710执行所述接收用户对声源中的目标发声对象的第一输入之后,还用于:
识别与所述目标发声对象关联的目标关联对象;
显示所述目标关联对象的信息。
应理解的是,本发明实施例中,射频单元701可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器710处理;另外,将上行的数据发送给基站。通常,射频单元701包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元701还可以通过无线通信***与网络和其他设备通信。
电子设备通过网络模块702为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元703可以将射频单元701或网络模块702接收的或者在存储器709中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元703还可以提供与电子设备700执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元703包括扬声器、蜂鸣器以及受话器等。
输入单元704用于接收音频或视频信号。输入单元704可以包括图形处理器(Graphics Processing Unit,GPU)7041和麦克风7042,图形处理器7041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元706上。经图形处理器7041处理后的图像帧可以存储在存储器709(或其它存储介质)中或者经由射频单元701或网络模块702进行发送。麦克风7042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元701发送到移动通信基站的格式输出。
电子设备700还包括至少一种传感器705,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板7061的亮度,接近传感器可在电子设备700移动到耳边时,关闭显示面板7061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别电子设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器705还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元706用于显示由用户输入的信息或提供给用户的信息。显示单元706可包括显示面板7061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板7061。
用户输入单元707可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元707包括触控面板7071以及其他输入设备7072。触控面板7071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板7071上或在触控面板7071附近的操作)。触控面板7071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器710,接收处理器710发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板7071。除了触控面板7071,用户输入单元707还可以包括其他输入设备7072。具体地,其他输入设备7072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板7071可覆盖在显示面板7061上,当触控面板7071检测到在其上或附近的触摸操作后,传送给处理器710以确定触摸事件的类型,随后处理器710根据触摸事件的类型在显示面板7061上提供相应的视觉输出。虽然在图7中,触控面板7071与显示面板7061是作为两个独立的部件来实现电子设备的输入和输出功能,但是在某些实施例中,可以将触控面板7071与显示面板7061集成而实现电子设备的输入和输出功能,具体此处不做限定。
接口单元708为外部装置与电子设备700连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元708可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到电子设备700内的一个或多个元件或者可以用于在电子设备700和外部装置之间传输数据。
存储器709可用于存储软件程序以及各种数据。存储器709可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器709可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器710是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器709内的软件程序和/或模块,以及调用存储在存储器709内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。处理器710可包括一个或多个处理单元;优选的,处理器710可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器710中。
电子设备700还可以包括给各个部件供电的电源711(比如电池),优选的,电源711可以通过电源管理***与处理器710逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。
另外,电子设备700包括一些未示出的功能模块,在此不再赘述。
优选的,本发明实施例还提供一种电子设备,包括处理器710,存储器709,存储在存储器709上并可在所述处理器710上运行的计算机程序,该计算机程序被处理器710执行时实现上述音频处理方法实施例中的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述音频处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台电子设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

Claims (14)

1.一种音频处理方法,应用于电子设备,其特征在于,包括:
接收用户对声源中的目标发声对象的第一输入;
响应于所述第一输入,对所述声源发出的音频信号进行处理;
其中,处理后的所述音频信号中,所述目标发声对象发出的音频信号强度大于其他发声对象发出的音频信号强度;
所述其他发声对象为,所述声源中除所述目标发声对象之外的发声对象。
2.根据权利要求1所述的方法,其特征在于,所述对所述声源发出的音频信号进行处理,包括:
增强所述目标发声对象发出的音频信号的强度;
和/或,
减弱或屏蔽所述其他发声对象发出的音频信号的强度。
3.根据权利要求1所述的方法,其特征在于,所述对所述声源发出的音频信号进行处理之前,所述方法还包括:
识别所述声源发出的音频信号的特征;
根据所述特征确定所述声源中的发声对象相对所述电子设备的方位;
基于所述方位识别所述目标发声对象。
4.根据权利要求1所述的方法,其特征在于,所述声源中包括至少两种发声对象;
所述接收用户对声源中的目标发声对象的第一输入之前,所述方法还包括:
识别所述声源中的发声对象;
在所述声源中的发声对象中,识别至少两种相关联的关联对象;
输出所述关联对象相关联的提示信息。
5.根据权利要求4所述的方法,其特征在于,所述接收用户对声源中的目标发声对象的第一输入,包括:
接收用户对所述关联对象中的目标发声对象的第一输入。
6.根据权利要求1所述的方法,其特征在于,所述接收用户对声源中的目标发声对象的第一输入之后,所述方法还包括:
识别与所述目标发声对象关联的目标关联对象;
显示所述目标关联对象的信息。
7.一种电子设备,其特征在于,包括:
接收模块,用于接收用户对声源中的目标发声对象的第一输入;
处理模块,用于响应于所述第一输入,对所述声源发出的音频信号进行处理;
其中,处理后的所述音频信号中,所述目标发声对象发出的音频信号强度大于其他发声对象发出的音频信号强度;
所述其他发声对象为,所述声源中除所述目标发声对象之外的发声对象。
8.根据权利要求7所述的电子设备,其特征在于,所述处理模块具体用于:增强所述目标发声对象发出的音频信号的强度;
和/或,
减弱或屏蔽所述其他发声对象发出的音频信号的强度。
9.根据权利要求7所述的电子设备,其特征在于,所述电子设备还包括:
第一识别模块,用于识别所述声源发出的音频信号的特征;
确定模块,用于根据所述特征确定所述声源中的发声对象相对所述电子设备的方位;
第二识别模块,用于基于所述方位识别所述目标发声对象。
10.根据权利要求7所述的电子设备,其特征在于,所述声源中包括至少两种发声对象;
所述电子设备还包括:
第三识别模块,用于识别所述声源中的发声对象;
第四识别模块,用于在所述声源中的发声对象中,识别至少两种相关联的关联对象;
输出模块,用于输出所述关联对象相关联的提示信息。
11.根据权利要求10所述的电子设备,其特征在于,所述接收模块具体用于:
接收用户对所述关联对象中的目标发声对象的第一输入。
12.根据权利要求7所述的电子设备,其特征在于,所述电子设备还包括:
第五识别模块,用于识别与所述目标发声对象关联的目标关联对象;
显示模块,用于显示所述目标关联对象的信息。
13.一种电子设备,其特征在于,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的音频处理方法中的步骤。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的音频处理方法中的步骤。
CN201910363067.4A 2019-04-30 2019-04-30 一种音频处理方法及电子设备 Active CN110097872B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910363067.4A CN110097872B (zh) 2019-04-30 2019-04-30 一种音频处理方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910363067.4A CN110097872B (zh) 2019-04-30 2019-04-30 一种音频处理方法及电子设备

Publications (2)

Publication Number Publication Date
CN110097872A true CN110097872A (zh) 2019-08-06
CN110097872B CN110097872B (zh) 2021-07-30

Family

ID=67446747

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910363067.4A Active CN110097872B (zh) 2019-04-30 2019-04-30 一种音频处理方法及电子设备

Country Status (1)

Country Link
CN (1) CN110097872B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111010608A (zh) * 2019-12-20 2020-04-14 维沃移动通信有限公司 视频播放的方法及电子设备
CN111370018A (zh) * 2020-02-28 2020-07-03 维沃移动通信有限公司 音频数据的处理方法、电子设备及介质
CN111785300A (zh) * 2020-06-12 2020-10-16 北京快鱼电子股份公司 一种基于深度神经网络的哭声检测方法和***
CN112015365A (zh) * 2020-08-27 2020-12-01 维沃移动通信有限公司 音量调整方法、装置及电子设备
CN113096686A (zh) * 2021-03-29 2021-07-09 维沃移动通信有限公司 音频处理方法、装置、电子设备及存储介质
CN115134465A (zh) * 2022-05-27 2022-09-30 青岛海尔科技有限公司 文本显示方法及装置、存储介质及电子装置

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101964192A (zh) * 2009-07-22 2011-02-02 索尼公司 声音处理设备、声音处理方法和程序
US20140278372A1 (en) * 2013-03-14 2014-09-18 Honda Motor Co., Ltd. Ambient sound retrieving device and ambient sound retrieving method
CN105073073A (zh) * 2013-01-25 2015-11-18 胡海 用于声音可视化及声源定位的设备与方法
CN105632508A (zh) * 2016-01-27 2016-06-01 广东欧珀移动通信有限公司 音频处理方法及音频处理装置
US20160216779A1 (en) * 2013-01-18 2016-07-28 Dell Products, Lp System and Method for Context Aware Usability Management of Human Machine Interfaces
CN105976829A (zh) * 2015-03-10 2016-09-28 松下知识产权经营株式会社 声音处理装置、声音处理方法
CN106297770A (zh) * 2016-08-04 2017-01-04 杭州电子科技大学 基于时频域统计特征提取的自然环境声音识别方法
CN106952654A (zh) * 2017-04-24 2017-07-14 北京奇虎科技有限公司 机器人降噪方法、装置及机器人
CN107094196A (zh) * 2017-04-21 2017-08-25 维沃移动通信有限公司 一种通话消噪的方法及移动终端
CN107342097A (zh) * 2017-07-13 2017-11-10 广东小天才科技有限公司 录音方法、录音装置、智能终端及计算机可读存储介质
US20180014107A1 (en) * 2016-07-06 2018-01-11 Bragi GmbH Selective Sound Field Environment Processing System and Method
US20180366135A1 (en) * 2015-12-02 2018-12-20 Nippon Telegraph And Telephone Corporation Spatial correlation matrix estimation device, spatial correlation matrix estimation method, and spatial correlation matrix estimation program
CN109065030A (zh) * 2018-08-01 2018-12-21 上海大学 基于卷积神经网络的环境声音识别方法及***
CN109545187A (zh) * 2018-11-21 2019-03-29 维沃移动通信有限公司 一种显示控制方法及终端

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101964192A (zh) * 2009-07-22 2011-02-02 索尼公司 声音处理设备、声音处理方法和程序
US20160216779A1 (en) * 2013-01-18 2016-07-28 Dell Products, Lp System and Method for Context Aware Usability Management of Human Machine Interfaces
CN105073073A (zh) * 2013-01-25 2015-11-18 胡海 用于声音可视化及声源定位的设备与方法
US20140278372A1 (en) * 2013-03-14 2014-09-18 Honda Motor Co., Ltd. Ambient sound retrieving device and ambient sound retrieving method
CN105976829A (zh) * 2015-03-10 2016-09-28 松下知识产权经营株式会社 声音处理装置、声音处理方法
US20180366135A1 (en) * 2015-12-02 2018-12-20 Nippon Telegraph And Telephone Corporation Spatial correlation matrix estimation device, spatial correlation matrix estimation method, and spatial correlation matrix estimation program
CN105632508A (zh) * 2016-01-27 2016-06-01 广东欧珀移动通信有限公司 音频处理方法及音频处理装置
US20180014107A1 (en) * 2016-07-06 2018-01-11 Bragi GmbH Selective Sound Field Environment Processing System and Method
CN106297770A (zh) * 2016-08-04 2017-01-04 杭州电子科技大学 基于时频域统计特征提取的自然环境声音识别方法
CN107094196A (zh) * 2017-04-21 2017-08-25 维沃移动通信有限公司 一种通话消噪的方法及移动终端
CN106952654A (zh) * 2017-04-24 2017-07-14 北京奇虎科技有限公司 机器人降噪方法、装置及机器人
CN107342097A (zh) * 2017-07-13 2017-11-10 广东小天才科技有限公司 录音方法、录音装置、智能终端及计算机可读存储介质
CN109065030A (zh) * 2018-08-01 2018-12-21 上海大学 基于卷积神经网络的环境声音识别方法及***
CN109545187A (zh) * 2018-11-21 2019-03-29 维沃移动通信有限公司 一种显示控制方法及终端

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
K. YAMAMOTO: "Estimation of the number of sound sources using support vector machines and its application to sound source separation", 《2003 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 2003. PROCEEDINGS. (ICASSP "03)》 *
景文倩: "多源相干/不相干声场的分离与重建方法研究", 《中国优秀博士学位论文全文数据库信息科技辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111010608A (zh) * 2019-12-20 2020-04-14 维沃移动通信有限公司 视频播放的方法及电子设备
CN111370018A (zh) * 2020-02-28 2020-07-03 维沃移动通信有限公司 音频数据的处理方法、电子设备及介质
CN111370018B (zh) * 2020-02-28 2023-10-24 维沃移动通信有限公司 音频数据的处理方法、电子设备及介质
CN111785300A (zh) * 2020-06-12 2020-10-16 北京快鱼电子股份公司 一种基于深度神经网络的哭声检测方法和***
CN112015365A (zh) * 2020-08-27 2020-12-01 维沃移动通信有限公司 音量调整方法、装置及电子设备
CN113096686A (zh) * 2021-03-29 2021-07-09 维沃移动通信有限公司 音频处理方法、装置、电子设备及存储介质
CN115134465A (zh) * 2022-05-27 2022-09-30 青岛海尔科技有限公司 文本显示方法及装置、存储介质及电子装置

Also Published As

Publication number Publication date
CN110097872B (zh) 2021-07-30

Similar Documents

Publication Publication Date Title
CN110097872A (zh) 一种音频处理方法及电子设备
CN108255378A (zh) 一种显示控制方法及移动终端
CN107734179A (zh) 一种消息提示方法、移动终端
CN109343755A (zh) 一种文件处理方法及终端设备
CN107808084A (zh) 一种触控操作方法及移动终端
CN107943390A (zh) 一种文字复制方法及移动终端
CN108897473A (zh) 一种界面显示方法及终端
CN108307106A (zh) 一种图像处理方法、装置及移动终端
CN108681483A (zh) 一种任务处理方法及装置
CN108037885A (zh) 一种操作提示方法及移动终端
CN110209332A (zh) 一种信息处理方法及终端设备
CN109523253A (zh) 一种支付方法和装置
CN107734172A (zh) 一种信息显示方法及移动终端
CN110096203A (zh) 一种截图方法及移动终端
CN107783747A (zh) 一种界面显示处理方法及移动终端
CN109618218A (zh) 一种视频处理方法及移动终端
CN109495638A (zh) 一种信息显示方法及终端
CN108984143A (zh) 一种显示控制方法及终端设备
CN108536349A (zh) 一种图标管理方法及移动终端
CN108763475A (zh) 一种录制方法、录制装置及终端设备
CN107728920A (zh) 一种复制方法及移动终端
CN108040001B (zh) 一种信息标记方法、终端
CN109814773A (zh) 一种柔性屏控制方法和显示组件
CN109933196A (zh) 一种屏幕控制方法、装置及终端设备
CN109348035A (zh) 一种电话号码的识别方法和终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant