CN113270082A - 一种车载ktv控制方法及装置、以及车载智能网联终端 - Google Patents
一种车载ktv控制方法及装置、以及车载智能网联终端 Download PDFInfo
- Publication number
- CN113270082A CN113270082A CN202010095631.1A CN202010095631A CN113270082A CN 113270082 A CN113270082 A CN 113270082A CN 202010095631 A CN202010095631 A CN 202010095631A CN 113270082 A CN113270082 A CN 113270082A
- Authority
- CN
- China
- Prior art keywords
- audio signal
- voice
- vehicle
- signal
- initial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 230000006855 networking Effects 0.000 title claims abstract description 17
- 230000005236 sound signal Effects 0.000 claims abstract description 215
- 230000001629 suppression Effects 0.000 claims abstract description 32
- 230000003313 weakening effect Effects 0.000 claims abstract description 11
- 238000003379 elimination reaction Methods 0.000 claims abstract description 9
- 230000008030 elimination Effects 0.000 claims abstract description 7
- 230000006870 function Effects 0.000 claims description 23
- 230000001960 triggered effect Effects 0.000 claims description 12
- 230000007613 environmental effect Effects 0.000 claims description 10
- 230000004807 localization Effects 0.000 claims description 5
- 230000008569 process Effects 0.000 description 12
- 230000000694 effects Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 230000001755 vocal effect Effects 0.000 description 8
- 238000005314 correlation function Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000005457 optimization Methods 0.000 description 4
- 238000011217 control strategy Methods 0.000 description 3
- 241001342895 Chorus Species 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- HAORKNGNJCEJBX-UHFFFAOYSA-N cyprodinil Chemical compound N=1C(C)=CC(C2CC2)=NC=1NC1=CC=CC=C1 HAORKNGNJCEJBX-UHFFFAOYSA-N 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000002592 echocardiography Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/36—Accompaniment arrangements
- G10H1/361—Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R16/00—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
- B60R16/02—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S5/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
- G01S5/18—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
- G01S5/22—Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/36—Accompaniment arrangements
- G10H1/361—Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
- G10H1/366—Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems with means for modifying or correcting the external signal, e.g. pitch correction, reverberation, changing a singer's voice
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mechanical Engineering (AREA)
- Remote Sensing (AREA)
- Radar, Positioning & Navigation (AREA)
- General Physics & Mathematics (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
Abstract
本发明公开了一种车载KTV控制方法及装置、以及车载智能网联终端,所述方法包括:对初始音频信号进行人声抑制处理,得到第一音频信号;其中,人声抑制包括人声消除和人声弱化,初始音频信号为多媒体音频信号;拾取车内环境音频信号并进行回声消除和人声定位处理,得到至少一个初始人声信号;其中,环境音频信号包括第一音频信号、人声信号和噪音信号;对第一音频信号和初始人声信号进行声音调制,得到目标音频信号。本发明利用车载智能网联终端的现有软硬件资源,例如麦克风、多媒体播放器、DSP音频处理器和喇叭等,而无需利用外加的唱K麦克风***或移动终端,不仅能实现在车内优质K歌的功能,还能实现车内多人同时K歌的功能,极大提高用车体验。
Description
技术领域
本发明涉及车载娱乐技术领域,尤其涉及一种车载KTV控制方法及装置、以及车载智能网联终端。
背景技术
目前车载KTV***通常依赖于第三方软硬件的支持,例如通过额外的唱K麦克风***来拾取人声,并通过移动终端作为伴奏设备输出伴奏信号,以此通过外加硬件设备的办法实现在车上K歌。然而,受限于外加硬件设备,若车内缺少唱K麦克风***或移动终端,则无法实现在车内K歌。
发明内容
本发明所要解决的技术问题在于,提供一种车载KTV控制方法及装置、以及车载智能网联终端,能够解决因外加硬件设备的缺失,而无法实现在车内K歌的问题。
本发明实施例提供一种车载KTV控制方法,包括:
对初始音频信号进行人声抑制处理,得到第一音频信号;其中,所述人声抑制包括人声消除和人声弱化,所述初始音频信号为多媒体音频信号;
拾取车内环境音频信号并进行回声消除和人声定位处理,得到至少一个初始人声信号;其中,所述环境音频信号包括第一音频信号、人声信号和噪音信号;
对所述第一音频信号和所述初始人声信号进行声音调制,得到目标音频信号;
输出所述目标音频信号。
本发明实施例还提供一种车载KTV控制装置,包括:
第一音频信号获取模块,用于对初始音频信号进行人声抑制处理,得到第一音频信号;其中,所述人声抑制包括人声消除和人声弱化,所述初始音频信号为多媒体音频信号;
初始人声信号获取模块,用于拾取车内环境音频信号并进行回声消除和人声定位处理,得到至少一个初始人声信号;其中,所述环境音频信号包括第一音频信号、人声信号和噪音信号;
目标音频信号获取模块,用于对所述第一音频信号和所述初始人声信号进行声音调制,得到目标音频信号;
目标音频信号输出模块,用于输出所述目标音频信号。
本发明实施例还提供一种车载智能网联终端,包括:
一个或多个处理器;
存储器,与所述处理器耦接,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述实施例所述的车载KTV控制方法。
本实施例通过预设的KTV控制策略,首先对初始音频信号进行人声抑制处理,得到用于伴奏的第一音频信号,当车内用户需要进行KTV操作时,通过拾取车内环境音频信号并进行回声消除和人声定位处理,得到至少一个初始人声信号,然后对第一音频信号和初始人声信号进行声音调制,得到混音的目标音频信号,最后输出目标音频信号。如此,本发明利用车载智能网联终端的现有软硬件资源,例如麦克风、多媒体播放器、DSP音频处理器和喇叭等,而无需利用外加的唱K麦克风***或移动终端,不仅能实现在车内优质K歌的功能,还能实现车内多人同时K歌的功能,极大提高了用车体验。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明某一实施例提供的车载KTV控制方法的流程示意图;
图2是本发明某一实施例中的车载KTV控制方法的另一流程示意图;
图3是本发明其他实施例提供的车载KTV控制方法的流程示意图;
图4是本发明其他实施例提供的车载KTV控制方法的流程示意图;
图5是本发明其他实施例提供的车载KTV控制方法的流程示意图;
图6是本发明其他实施例提供的车载KTV控制方法的流程示意图;
图7是本发明某一实施例提供的车载KTV控制装置的结构示意图;
图8是本发明其他实施例提供的车载KTV控制装置的结构示意图;
图9是本发明其他实施例提供的车载KTV控制装置的结构示意图;
图10是本发明其他实施例提供的车载KTV控制装置的结构示意图;
图11是本发明某一实施例提供的车载智能网联终端的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,文中所使用的步骤编号仅是为了方便描述,不对作为对步骤执行先后顺序的限定。
应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,本发明实施例提供一种车载KTV控制方法,包括:
S10、对初始音频信号进行人声抑制处理,得到第一音频信号。其中,人声抑制包括人声消除和人声弱化,初始音频信号为车载多媒体音频信号。
请结合图2,初始音频信号V10为未经处理的多媒体音频信号,其中人声占比大于伴奏占比。第一音频信号V11为初始音频信号V10经过人声抑制处理的多媒体音信号,其中伴奏占比大于人声占比,适用于作为K歌的音频信号。
其中,人声抑制处理包括人声消除处理,也包括人声弱化处理。人声消除处理为将初始音频信号的人声占比降低至零,人声弱化处理为将初始音频信号的人声占比降低至低于伴奏占比,以便在K歌时,用户的人声与伴奏和谐。
在某一个实施例中,初始音频信号V10可以为车载智能网联终端上存储的音频文件或通过无线通信等方式实时获取的音频文件。第一音频信号V11可以暂时或长期性存储在车载智能网联终端,从而为用户K歌时提供伴奏。
在一具体实施例当中,车载智能网联终端包括多媒体***,例如多媒体播放器和显示器,多媒体播放器用于播放音频文件,显示器用于显示多媒体文件。
S20、拾取车内环境音频信号并进行回声消除和人声定位处理,得到至少一个初始人声信号。其中,环境音频信号包括第一音频信号、人声信号和噪音信号。
目前的K歌***需要移动终端和额外的麦克风***支持,利用移动终端的受话器采集人声,然后通过蓝牙或NFC发送至麦克风***,然后利用麦克风***将人声和移动终端的音乐声进行处理产生第三音频信号,并通过FM方式发送到车机以实现K歌的功能。但是,当FM频道冲突时,K歌***则无法实现2人或者多人合唱。而本实施例无需采用FM方式发送到车机,不存在FM频道冲突的情况,实现了多人同时K歌的功能。
具体的,在拾取声音时,除了用户的人声,车内播放的伴奏和噪音也会被拾取。因此,通过对车内环境音频信号进行回声消除,可以消除噪音和回声,然后通过人声定位处理,例如分辨声音是由主驾、副驾还是后排传出的,可以确定声音来源。如此,以获得较为纯净的初始人声信号。
在某一个实施例中,车载智能网联终端还包括麦克风,当车辆进入K歌模式时,麦克风开始拾取车内环境音频信号。由于车内的麦克风通常包括多路支路,多路麦克风同时工作。以2至4路支路为例,一路麦克风作为一路输入。
当车内存在多人同时K歌时,通过对车内环境音频信号处理,可以得到车内各成员的初始人声信号。请结合图2,假设车内4个成员同时在K歌,则步骤S20可以分别输出4个初始人声信号,分别为初始人声信号V20、V21、V22和V23。
请参阅图3,在一具体实施例当中,上述步骤S20包括以下子步骤:
S21、拾取车内环境音频信号。
S22、根据预设的回声消除算法对环境音频信号进行回声消除处理。其中,回声消除算法包括回声抑制(acoustic echo suppression)算法和声学回声消除(acoustic echocancellation)算法。
回声抑制算法是较早的一种回声控制算法。回声抑制是一种非线性的回声消除,它通过简单的比较器将准备由扬声器播放的声音与当前麦克风拾取的声音的电平进行比较,如果前者高于某个阈值,那么就允许传至扬声器,而且麦克风被关闭,以阻止它拾取扬声器播放的声音而引起远端回声。如果麦克风拾取的声音电平高于某个阈值,扬声器被禁止,以达到消除回声的目的。
声学回声消除算法(AEC)是对扬声器信号与由它产生的多路径回声的相关性为基础,建立远端信号(s(n))的语音模型,利用它对回声进行估计(e`(n)),并不断地修改滤波器的系数,使得估计值更加逼近真实的回声(e(n))。然后,将回声估计值从麦克风的输入信号中减去,从而达到消除回声的目的。
S23、根据预设的声源定位算法对回声消除后的环境音频信号进行人声定位处理,得到至少一个初始人声信号。其中,声源定位算法包括时延估计(Time-Delay Estimation,TDE)算法和广义互相关(GCC)的时延估计算法。
声源定位是将麦克风在空间布置成一定几何形状的阵列,以接收目标噪声的声场信息,通过检测或计算各麦克风所测得的信号的时延来确定目标的方位信息。在本实例中,多路麦克风的位置可以确定。
时延估计算法利用传感器或传感器阵列之间由于信号传播距离不同而引起的时延估计,来完成目标的联合测向和测距;若能精确估计声波到达各阵元间存在的时延值,并根据麦克风阵列布设的几何关系,就可以计算出目标位置的参数估计量。
GCC方法是一种传统的TDE方法。由于来自同一声源的信号存在一定的相关性,通过计算不同麦克风所接收到的信号之间的相关函数,就可以估计出TDE值。然而在实际环境中,由于噪音和混响的影响,相关函数的最大峰会被弱化,有时还会出现多个峰值,这些都造成了实际峰值检测的困难。GCC方法就是在功率频谱对信号进行加权,突出相关的信号部分而抑制受噪声干扰的部分,以便使相关函数在时延处的峰值更为突出。
S30、对第一音频信号和初始人声信号进行声音调制,得到目标音频信号。
混音(Audio Mixing)是音乐制作中的一个步骤,是把多种来源的声音,整合至一个立体音轨(Stereo)或单音音轨(Mono)中。这些原始声音信号可能分别来自不同的乐器、人声或管弦乐,收录自现场演奏(live)或录音室内。在混音的过程中,将每一个别原始信号的频率、动态、音质、定位、残响和声场单独进行调整,让各音轨最佳化,之后再叠加于最终成品上。在本实施例中,将第一音频信号和初始人声信号,对二者进行声音调制,从而得到混音的目标音频信号。
混音设备可以是合成器(Sound Module)、音频处理器(Signal Processor)与混音座(Mixing Console),也可以是混音软件,以便完成复杂的混音作业。在本实例中,通过预设混音算法处理,当第一音频信号和初始人声信号输入至上述混音设备或混音软件时,自动进行混音处理,并输出混音后的目标音频信号。其中,混音的步骤包括但不限于对轨、修音、降噪、激励、齿音消除、均衡和压缩。
在某一个实施例中,车载智能网联终端还包括DSP音频处理器,DSP音频处理器用于对第一音频信号和初始人声信号进行声音调制,以获得目标音频信号。
请参阅图4,在一具体实施例当中,上述步骤S30包括以下子步骤:
S31、对第一音频信号和初始人声信号进行增益调节处理,得到增益后的第一音频信号和增益后的初始人声信号。
为了对第一音频信号和初始人声信号进行放大,以使输出的音频信号符合K歌要求,需对二者进行增益调节处理。
请继续结合图2,以4个初始人声信号为例,分别将初始人声信号V20、V21、V22、V23和音频文件V11进行增益调节,依次产生增益后的初始人声信号V200、V210、V220、V230和增益后的第一音频信号V110。
S32、对增益后的第一音频信号和增益后的初始人声信号进行混音处理,得到目标音频信号。
S40、输出目标音频信号。
目前的K歌***需要移动终端和额外的麦克风***支持,利用移动终端的受话器采集人声,然后通过蓝牙或NFC发送至麦克风***,利用麦克风***将人声和移动终端的音乐声进行处理产生第三音频信号,并通过FM方式发送到车机以实现K歌的功能。但是,初始人声通过蓝牙等传输后再通过FM模式传输,失真会较严重,而本实施例的初始人声信号不用经过多余的调制,保证优质的K歌效果。
在某一个实施例中,车载智能网联终端还包括功率放大器和喇叭,功率放大器用于放大输出的目标音频信号,喇叭用于将放大后的目标音频信号转换为声信号,以使用户可以听到混音后的目标音频信号,实现了车载K歌功能。
本实施例通过预设的KTV控制策略,首先对初始音频信号进行人声抑制处理,得到用于伴奏的第一音频信号,当车内用户需要进行KTV操作时,通过拾取车内环境音频信号并进行回声消除和人声定位处理,得到至少一个初始人声信号,然后对第一音频信号和初始人声信号进行声音调制,得到混音的目标音频信号,最后输出目标音频信号。如此,本发明利用车载智能网联终端的现有软硬件资源,例如麦克风、多媒体播放器、DSP音频处理器和喇叭等,而无需利用外加的唱K麦克风***或移动终端,不仅能实现在车内优质K歌的功能,还能实现车内多人同时K歌的功能,极大提高了用车体验。
请参阅图5,在某一个实施例中,步骤S30还进一步包括:
S33、对目标音频信号进行音质优化处理。
其中,音质优化处理包括对输入的音频信号进行音量、音效、音色等调制。对目标音频信号进行音质优化处理,可以对目标音频信号进行修饰,使得输出的目标音频信号更加好听,从而提供良好的K歌体验。
在某一个实施例中,车载智能网联终端还包括DSP音效调节器,DSP音效调节器用于对目标音频信号进行音质优化处理,以使输出的目标音频信号更加好听,从而提供良好的K歌体验。
请继续结合图2,以车内4人同时K歌为例,将增益后的初始人声信号V200、V210、V220、V230和增益后的第一音频信号V110输入至DSP音效调节器,DSP音效调节器对初始人声信号V200、V210、V220、V230和增益后的第一音频信号V110的音效、音色等进行调制,产生混音音频信号V300,混音音频信号V300经过功率放大器放大后产生目标音频信号V400,以直接推动喇叭发声。
请参阅图6,在某一个实施例中,在步骤S20拾取车内环境音频信号之前,还包括:
S60、判断K歌模式是否被触发。
若是,则根据K歌模式,触发拾取车内环境音频信号功能。
其中,K歌模式包括人声抑制比、增益调节、音效调制等参数。用户可以根据用户需求通过智能网联终端显示器触发K歌模式,也可以在智能网联终端显示器上更改***默认的K歌模式。当车载智能网联终端检测到K歌模式被触发时,则根据当前的K歌模式,触发S20的功能。当车载智能网联终端检测到K歌模式没有被触发时,则不触发S20的功能。如此,用户可以根据需求选择车内K歌功能,也可以根据自己的K歌习惯设置相应的K歌模式,车内K歌体验好。
在某一个实施例中,车载智能网联终端还预设有KTV控制应用程序,KTV控制应用程序作为一款桌面应用,用于为用户提供进入和退出K歌模式,以及设置人声抑制比、调节增益以及音频的音效的交互。
相较于目前的K歌***需要移动终端支持,导致K歌的歌词只能在移动终端显示,而无法同步到车载多媒体主机屏幕,本实施例中的KTV控制应用程序同步多媒体播放器与显示器,从而实现车载歌词同步,进一步提高了车载K歌体验。
请参阅图7,本发明实施例提供一种车载KTV控制装置,包括第一音频信号获取模块20、初始人声信号获取模块21、目标音频信号获取模块22和目标音频信号输出模块23。
第一音频信号获取模块20用于对初始音频信号进行人声抑制处理,得到第一音频信号。其中,人声抑制包括人声消除和人声弱化,初始音频信号为多媒体音频信号。
请结合图2,初始音频信号V10为未经处理的多媒体音频信号,其中人声占比大于伴奏占比。第一音频信号V11为初始音频信号V10经过人声抑制处理的多媒体音信号,其中伴奏占比大于人声占比,适用于作为K歌的音频信号。
其中,人声抑制处理包括人声消除处理,也包括人声弱化处理。人声消除处理为将初始音频信号的人声占比降低至零,人声弱化处理为将初始音频信号的人声占比降低至低于伴奏占比,以便在K歌时,用户的人声与伴奏和谐。
在某一个实施例中,初始音频信号V10可以为车载智能网联终端上存储的音频文件或通过无线通信等方式实时获取的音频文件。第一音频信号V11可以暂时或长期性存储在车载智能网联终端,从而为用户K歌时提供伴奏。
初始人声信号获取模块21用于拾取车内环境音频信号并进行回声消除和人声定位处理,得到至少一个初始人声信号。其中,环境音频信号包括第一音频信号、人声信号和噪音信号。
目前的K歌***需要移动终端和额外的麦克风***支持,利用移动终端的受话器采集人声,然后通过蓝牙或NFC发送至麦克风***,然后利用麦克风***将人声和移动终端的音乐声进行处理产生第三音频信号,并通过FM方式发送到车机以实现K歌的功能。但是,当FM频道冲突时,K歌***则无法实现2人或者多人合唱。而本实施例无需采用FM方式发送到车机,不存在FM频道冲突的情况,实现了多人同时K歌的功能。
具体的,在拾取声音时,除了用户的人声,车内播放的伴奏和噪音也会被拾取。因此,通过对车内环境音频信号进行回声消除,可以消除噪音和回声,然后通过人声定位处理,例如分辨声音是由主驾、副驾还是后排传出的,可以确定声音来源。如此,以获得较为纯净的初始人声信号。
当车内存在多人同时K歌时,通过对车内环境音频信号处理,可以得到车内各成员的初始人声信号。请结合图2,假设车内4个成员同时在K歌,则步骤S20可以分别输出4个初始人声信号,分别为初始人声信号V20、V21、V22和V23。
请参阅图8,在某一个实施例中,初始人声信号获取模块21包括环境音频信号拾取模块211、回声消除处理模块212和人声定位处理模块213。
环境音频信号拾取模块211用于拾取车内环境音频信号。
回声消除处理模块212用于根据预设的回声消除算法对环境音频信号进行回声消除处理。
其中,回声消除算法包括回声抑制(acoustic echo suppression)算法和声学回声消除(acoustic echo cancellation)算法。
回声抑制算法是较早的一种回声控制算法。回声抑制是一种非线性的回声消除,它通过简单的比较器将准备由扬声器播放的声音与当前麦克风拾取的声音的电平进行比较,如果前者高于某个阈值,那么就允许传至扬声器,而且麦克风被关闭,以阻止它拾取扬声器播放的声音而引起远端回声。如果麦克风拾取的声音电平高于某个阈值,扬声器被禁止,以达到消除回声的目的。
声学回声消除算法(AEC)是对扬声器信号与由它产生的多路径回声的相关性为基础,建立远端信号(s(n))的语音模型,利用它对回声进行估计(e`(n)),并不断地修改滤波器的系数,使得估计值更加逼近真实的回声(e(n))。然后,将回声估计值从麦克风的输入信号中减去,从而达到消除回声的目的。
人声定位处理模块213用于根据预设的声源定位算法对回声消除后的环境音频信号进行人声定位处理,得到至少一个初始人声信号。
其中,声源定位算法包括时延估计(Time-Delay Estimation,TDE)算法和广义互相关(GCC)的时延估计算法。
声源定位是将麦克风在空间布置成一定几何形状的阵列,以接收目标噪声的声场信息,通过检测或计算各麦克风所测得的信号的时延来确定目标的方位信息。在本实例中,多路麦克风的位置可以确定。
时延估计算法利用传感器或传感器阵列之间由于信号传播距离不同而引起的时延估计,来完成目标的联合测向和测距;若能精确估计声波到达各阵元间存在的时延值,并根据麦克风阵列布设的几何关系,就可以计算出目标位置的参数估计量。
GCC方法是一种传统的TDE方法。由于来自同一声源的信号存在一定的相关性,通过计算不同麦克风所接收到的信号之间的相关函数,就可以估计出TDE值。然而在实际环境中,由于噪音和混响的影响,相关函数的最大峰会被弱化,有时还会出现多个峰值,这些都造成了实际峰值检测的困难。GCC方法就是在功率频谱对信号进行加权,突出相关的信号部分而抑制受噪声干扰的部分,以便使相关函数在时延处的峰值更为突出。
目标音频信号获取模块22用于对第一音频信号和初始人声信号进行声音调制,得到目标音频信号。
混音(Audio Mixing)是音乐制作中的一个步骤,是把多种来源的声音,整合至一个立体音轨(Stereo)或单音音轨(Mono)中。这些原始声音信号可能分别来自不同的乐器、人声或管弦乐,收录自现场演奏(live)或录音室内。在混音的过程中,将每一个别原始信号的频率、动态、音质、定位、残响和声场单独进行调整,让各音轨最佳化,之后再叠加于最终成品上。在本实施例中,将第一音频信号和初始人声信号,对二者进行声音调制,从而得到混音的目标音频信号。
混音设备可以是合成器(Sound Module)、音频处理器(Signal Processor)与混音座(Mixing Console),也可以是混音软件,以便完成复杂的混音作业。在本实例中,通过预设混音算法处理,当第一音频信号和初始人声信号输入至上述混音设备或混音软件时,自动进行混音处理,并输出混音后的目标音频信号。其中,混音的步骤包括但不限于对轨、修音、降噪、激励、齿音消除、均衡和压缩。
请参阅图9,在某一个实施例中,目标音频信号获取模块22包括增益调节处理模块221和混音处理模块222。
增益调节处理模块221用于对第一音频信号和初始人声信号进行增益调节处理,得到增益后的第一音频信号和增益后的初始人声信号。
为了对第一音频信号和初始人声信号进行放大,以使输出的音频信号符合K歌要求,需对二者进行增益调节处理。
请继续结合图2,以4个初始人声信号为例,分别将初始人声信号V20、V21、V22、V23和音频文件V11进行增益调节,依次产生增益后的初始人声信号V200、V210、V220、V230和增益后的第一音频信号V110。
混音处理模块222用于对增益后的第一音频信号和增益后的初始人声信号进行混音处理,得到目标音频信号。
目标音频信号输出模块23用于输出目标音频信号。
目前的K歌***需要移动终端和额外的麦克风***支持,利用移动终端的受话器采集人声,然后通过蓝牙或NFC发送至麦克风***,利用麦克风***将人声和移动终端的音乐声进行处理产生第三音频信号,并通过FM方式发送到车机以实现K歌的功能。但是,初始人声通过蓝牙等传输后再通过FM模式传输,失真会较严重,而本实施例的初始人声信号不用经过多余的调制,保证优质的K歌效果。
本实施例通过预设的KTV控制策略,首先对初始音频信号进行人声抑制处理,得到用于伴奏的第一音频信号,当车内用户需要进行KTV操作时,通过拾取车内环境音频信号并进行回声消除和人声定位处理,得到至少一个初始人声信号,然后对第一音频信号和初始人声信号进行声音调制,得到混音的目标音频信号,最后输出目标音频信号。如此,本发明利用车载智能网联终端的现有软硬件资源,例如麦克风、多媒体播放器、DSP音频处理器和喇叭等,而无需利用外加的唱K麦克风***或移动终端,不仅能实现在车内优质K歌的功能,还能实现车内多人同时K歌的功能,极大提高了用车体验。
请参阅图10,在某一个实施例中,车载KTV控制装置还包括判断模块24,用于判断K歌模式是否被触发;
若是,则根据K歌模式,触发拾取车内环境音频信号功能。
其中,K歌模式包括人声抑制比、增益调节、音效调制等参数。用户可以根据用户需求通过智能网联终端显示器触发K歌模式,也可以在智能网联终端显示器上更改***默认的K歌模式。当车载智能网联终端检测到K歌模式被触发时,则根据当前的K歌模式,触发步骤S20的功能。当车载智能网联终端检测到K歌模式没有被触发时,则不触发步骤S20的功能。如此,用户可以根据需求选择车内K歌功能,也可以根据自己的K歌习惯设置相应的K歌模式,车内K歌体验好。
在某一个实施例中,车载智能网联终端还预设有KTV控制应用程序,KTV控制应用程序作为一款桌面应用,用于为用户提供进入和退出K歌模式,以及设置人声抑制比、调节增益以及音频的音效的交互。
相较于目前的K歌***需要移动终端支持,导致K歌的歌词只能在移动终端显示,而无法同步到车载多媒体主机屏幕,本实施例中的KTV控制应用程序同步多媒体播放器与显示器,从而实现车载歌词同步,进一步提高了车载K歌体验。
请参阅图11,本发明实施例提供一种车载智能网联终端。如图11所示,车载智能网联终端可以包括:一个或多个处理器、以及存储器。存储器与所述处理器耦接,用于存储一个或多个程序。当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述任一实施例所述的车载KTV控制方法,并达到如上述方法一致的技术效果。
处理器用于控制该车载智能网联终端的整体操作,以完成上述的车载KTV控制方法的全部或部分步骤。存储器用于存储各种类型的数据以支持在该车载智能网联终端的操作,这些数据例如可以包括用于在该车载智能网联终端上操作的任何应用程序或方法的指令,以及应用程序相关的数据。该存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-OnlyMemory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-OnlyMemory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
优选地,该车载智能网联终端还可以包括多媒体组件,输入/输出(I/O)接口,以及通信组件中的一者或多者。
多媒体组件可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器或通过通信组件发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口为处理器和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件用于该车载智能网联终端与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(Near Field Communication,简称NFC),2G、3G或4G,或它们中的一种或几种的组合,因此相应的该通信组件可以包括:Wi-Fi模块,蓝牙模块,NFC模块。
在一示例性实施例中,车载智能网联终端可以被一个或多个应用专用集成电路(Application Specific 1ntegrated Circuit,简称AS1C)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal ProcessingDevice,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的车载KTV控制方法,并达到如上述方法一致的技术效果。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的车载KTV控制方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器,上述程序指令可由车载智能网联终端的处理器执行以完成上述的车载KTV控制方法,并达到如上述方法一致的技术效果。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (9)
1.一种车载KTV控制方法,其特征在于,包括:
对初始音频信号进行人声抑制处理,得到第一音频信号;其中,所述人声抑制包括人声消除和人声弱化,所述初始音频信号为多媒体音频信号;
拾取车内环境音频信号并进行回声消除和人声定位处理,得到至少一个初始人声信号;其中,所述环境音频信号包括第一音频信号、人声信号和噪音信号;
对所述第一音频信号和所述初始人声信号进行声音调制,得到目标音频信号;
输出所述目标音频信号。
2.根据权利要求1所述的车载KTV控制方法,其特征在于,所述拾取车内环境音频信号并进行回声消除和人声定位处理,得到至少一个初始人声信号,包括:
拾取车内环境音频信号;
根据预设的回声消除算法对所述环境音频信号进行回声消除处理,所述回声消除算法包括回声抑制算法和声学回声消除算法;
根据预设的声源定位算法对所述回声消除后的环境音频信号进行人声定位处理,得到至少一个所述初始人声信号,所述声源定位算法包括声源定位算法包括时延估计算法和广义互相关的时延估计算法。
3.根据权利要求1所述的车载KTV控制方法,其特征在于,所述对所述第一音频信号和所述初始人声信号进行声音调制,得到目标音频信号,包括:
对所述第一音频信号和所述初始人声信号进行增益调节处理,得到增益后的第一音频信号和增益后的初始人声信号;
对增益后的所述第一音频信号和增益后的所述初始人声信号进行混音处理,得到所述目标音频信号。
4.根据权利要求1所述的车载KTV控制方法,其特征在于,在拾取车内环境音频信号之前,还包括:
判断K歌模式是否被触发;
若是,则根据所述K歌模式,触发拾取车内环境音频信号功能。
5.一种车载KTV控制装置,其特征在于,包括:
第一音频信号获取模块,用于对初始音频信号进行人声抑制处理,得到第一音频信号;其中,所述人声抑制包括人声消除和人声弱化,所述初始音频信号为多媒体音频信号;
初始人声信号获取模块,用于拾取车内环境音频信号并进行回声消除和人声定位处理,得到至少一个初始人声信号;其中,所述环境音频信号包括第一音频信号、人声信号和噪音信号;
目标音频信号获取模块,用于对所述第一音频信号和所述初始人声信号进行声音调制,得到目标音频信号;
目标音频信号输出模块,用于输出所述目标音频信号。
6.根据权利要求5所述的车载KTV控制装置,其特征在于,所述初始人声信号获取模块包括:
环境音频信号拾取模块,用于拾取车内环境音频信号;
回声消除处理模块,用于根据预设的回声消除算法对所述环境音频信号进行回声消除处理,所述回声消除算法包括回声抑制算法和声学回声消除算法;
人声定位处理模块,用于根据预设的声源定位算法对所述回声消除后的环境音频信号进行人声定位处理,得到至少一个所述初始人声信号,所述声源定位算法包括声源定位算法包括时延估计算法和广义互相关的时延估计算法。
7.根据权利要求5所述的车载KTV控制装置,其特征在于,所述目标音频信号获取模块包括:
增益调节处理模块,用于对所述第一音频信号和所述初始人声信号进行增益调节处理,得到增益后的第一音频信号和增益后的初始人声信号;
混音处理模块,用于对增益后的所述第一音频信号和增益后的所述初始人声信号进行混音处理,得到所述目标音频信号。
8.根据权利要求5所述的车载KTV控制装置,其特征在于,还包括:
判断模块,用于判断K歌模式是否被触发;
若是,则根据所述K歌模式,触发拾取车内环境音频信号功能。
9.一种车载智能网联终端,其特征在于,包括:
一个或多个处理器;
存储器,与所述处理器耦接,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至4任一项所述的车载KTV控制方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010095631.1A CN113270082A (zh) | 2020-02-14 | 2020-02-14 | 一种车载ktv控制方法及装置、以及车载智能网联终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010095631.1A CN113270082A (zh) | 2020-02-14 | 2020-02-14 | 一种车载ktv控制方法及装置、以及车载智能网联终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113270082A true CN113270082A (zh) | 2021-08-17 |
Family
ID=77227397
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010095631.1A Pending CN113270082A (zh) | 2020-02-14 | 2020-02-14 | 一种车载ktv控制方法及装置、以及车载智能网联终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113270082A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113808611A (zh) * | 2021-09-17 | 2021-12-17 | 深圳地平线机器人科技有限公司 | 音频播放方法、装置、计算机可读存储介质及电子设备 |
WO2023202370A1 (zh) * | 2022-04-19 | 2023-10-26 | 比亚迪股份有限公司 | 车载k歌***的控制方法、***、车辆及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108630185A (zh) * | 2018-03-27 | 2018-10-09 | 斑马网络技术有限公司 | 车载娱乐***及其方法 |
CN110223665A (zh) * | 2019-06-21 | 2019-09-10 | 延锋伟世通电子科技(南京)有限公司 | 一种极低噪音的车载Wi-Fi通信的卡拉OK***及其数据交互方法 |
CN110441738A (zh) * | 2018-05-03 | 2019-11-12 | 阿里巴巴集团控股有限公司 | 车载语音定位的方法、***、车辆和存储介质 |
CN209787421U (zh) * | 2019-06-19 | 2019-12-13 | 湖北亿咖通科技有限公司 | 车载娱乐***及车辆 |
-
2020
- 2020-02-14 CN CN202010095631.1A patent/CN113270082A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108630185A (zh) * | 2018-03-27 | 2018-10-09 | 斑马网络技术有限公司 | 车载娱乐***及其方法 |
CN110441738A (zh) * | 2018-05-03 | 2019-11-12 | 阿里巴巴集团控股有限公司 | 车载语音定位的方法、***、车辆和存储介质 |
CN209787421U (zh) * | 2019-06-19 | 2019-12-13 | 湖北亿咖通科技有限公司 | 车载娱乐***及车辆 |
CN110223665A (zh) * | 2019-06-21 | 2019-09-10 | 延锋伟世通电子科技(南京)有限公司 | 一种极低噪音的车载Wi-Fi通信的卡拉OK***及其数据交互方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113808611A (zh) * | 2021-09-17 | 2021-12-17 | 深圳地平线机器人科技有限公司 | 音频播放方法、装置、计算机可读存储介质及电子设备 |
WO2023202370A1 (zh) * | 2022-04-19 | 2023-10-26 | 比亚迪股份有限公司 | 车载k歌***的控制方法、***、车辆及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11348595B2 (en) | Voice interface and vocal entertainment system | |
US8204248B2 (en) | Acoustic localization of a speaker | |
US8705753B2 (en) | System for processing sound signals in a vehicle multimedia system | |
US9918174B2 (en) | Wireless exchange of data between devices in live events | |
US9264834B2 (en) | System for modifying an acoustic space with audio source content | |
US20090034750A1 (en) | System and method to evaluate an audio configuration | |
CN103559876A (zh) | 音效处理方法及*** | |
US20230239642A1 (en) | Three-dimensional audio systems | |
CN113270082A (zh) | 一种车载ktv控制方法及装置、以及车载智能网联终端 | |
JP2010288262A (ja) | 信号処理装置 | |
CN111341289A (zh) | 智能音箱k歌的方法和装置 | |
JP2010141468A (ja) | 車載音響装置 | |
JP2008289173A (ja) | 測定方法、測定装置、プログラム | |
JP6798561B2 (ja) | 信号処理装置、信号処理方法およびプログラム | |
JP5696828B2 (ja) | 信号処理装置 | |
CN113611272B (zh) | 基于多移动终端的扬声方法、装置及存储介质 | |
CN113611271B (zh) | 适用于移动终端的数字音量扩增方法、装置及存储介质 | |
CN113613143B (zh) | 适用于移动终端的音频处理方法、装置及存储介质 | |
US20230215449A1 (en) | Voice reinforcement in multiple sound zone environments | |
KR102650763B1 (ko) | 오디오 소스 지향성에 기초한 심리음향 강화 | |
JP7105320B2 (ja) | 音声認識装置、音声認識装置の制御方法、コンテンツ再生装置、及びコンテンツ送受信システム | |
WO2024107342A1 (en) | Dynamic effects karaoke | |
JP3471672B2 (ja) | ボーカル音量の自動フェードアウト機能を備えたカラオケ装置 | |
CN113612881A (zh) | 基于单移动终端的扬声方法、装置及存储介质 | |
CN115278499A (zh) | 延时测量方法及装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |