CN112017636B - 基于车辆的用户发音模拟方法、***、设备及存储介质 - Google Patents

基于车辆的用户发音模拟方法、***、设备及存储介质 Download PDF

Info

Publication number
CN112017636B
CN112017636B CN202010881113.2A CN202010881113A CN112017636B CN 112017636 B CN112017636 B CN 112017636B CN 202010881113 A CN202010881113 A CN 202010881113A CN 112017636 B CN112017636 B CN 112017636B
Authority
CN
China
Prior art keywords
playing
vehicle
play
target
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010881113.2A
Other languages
English (en)
Other versions
CN112017636A (zh
Inventor
张文瑜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Volkswagen Mobvoi Beijing Information Technology Co Ltd
Original Assignee
Volkswagen Mobvoi Beijing Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Volkswagen Mobvoi Beijing Information Technology Co Ltd filed Critical Volkswagen Mobvoi Beijing Information Technology Co Ltd
Priority to CN202010881113.2A priority Critical patent/CN112017636B/zh
Publication of CN112017636A publication Critical patent/CN112017636A/zh
Application granted granted Critical
Publication of CN112017636B publication Critical patent/CN112017636B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/01Assessment or evaluation of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明实施例公开了一种基于车辆的用户发音模拟方法、***、设备及存储介质。该方法包括:从预先存储的语音数据集中获取目标播放数据;根据车辆环境音,和/或目标播放数据的语义信息,确定与车辆中的播放设备匹配的播放控制参数,播放设备在车辆中的位置与真实人嘴所处位置相匹配;控制播放设备按照播放控制参数,播放目标播放数据。该方法可以通过播放设备播放目标播放数据,代替现有技术发音人上车进行语音采集的方式,可以降低发音模拟成本,实现方式简单,发音模拟高效;通过车辆环境音和/或语义信息确定播放设备的播放控制参数,可以使播放设备的播放质量达到与发音人上车进行语音采集同等质量效果。

Description

基于车辆的用户发音模拟方法、***、设备及存储介质
技术领域
本发明实施例涉及智能汽车技术领域,尤其涉及一种基于车辆的用户发音模拟方法、***、设备及存储介质。
背景技术
随着车辆智能应用的发展,越来越多的汽车内置语音识别技术以采集用户语音并识别语音指令,根据语音指令实现对应的功能。
现有技术通常采用预先采集多个发音人的语音进行不同真实环境的实验,以使语音识别准确无误。为了保证实验的真实行车环境,需要发音人上车进行语音采集,同时车辆需要达到指定速度、车窗和空调需要调整至指定状态。
但是,现有技术的方式占用发音人的时间包括车辆达到指定状态的等待时间以及语音采集时间,占用发音人时长长,需要支付发音人的费用高。同时,在一些行驶状态下,上车采集语音可能会造成发音人身体不适,比如车辆颠簸或者车内温度低时,造成发音人不愿参与语音采集,语音采集困难,影响语音采集的样本数量。此外,不同车型的语音不能复制,需要发音人多次上车采集,语音采集效率低。
发明内容
本发明实施例提供了一种基于车辆的用户发音模拟方法、***、设备及存储介质,可以降低发音模拟成本、提高发音模拟效率并保证发音模拟质量。
第一方面,本发明实施例提供了一种基于车辆的用户发音模拟方法,该方法包括:
从预先存储的语音数据集中获取目标播放数据;
根据车辆环境音,和/或所述目标播放数据的语义信息,确定与车辆中的播放设备匹配的播放控制参数,所述播放设备在车辆中的位置与真实人嘴所处位置相匹配;
控制所述播放设备按照所述播放控制参数,播放所述目标播放数据。
第二方面,本发明实施例还提供了一种基于车辆的用户发音模拟装置,该装置包括:
目标播放数据获取模块,用于从预先存储的语音数据集中获取目标播放数据;
播放控制参数确定模块,用于根据车辆环境音,和/或所述目标播放数据的语义信息,确定与车辆中的播放设备匹配的播放控制参数,所述播放设备在车辆中的位置与真实人嘴所处位置相匹配;
播放控制模块,用于控制所述播放设备按照所述播放控制参数,播放所述目标播放数据。
第三方面,本发明实施例还提供了一种基于车辆的用户发音模拟***,该***,包括:处理器、播放设备、声音采集组件、声卡、数字信号处理器和音频检测模块;
其中,所述播放设备、所述声音采集组件、所述声卡、所述数字信号处理器和所述音频检测模块均与所述处理器电连接;所述播放设备、所述声音采集组件、所述声卡、所述数字信号处理器和所述音频检测模块依次电连接;所述播放设备在车辆中的位置与真实人嘴所处位置相匹配;
所述处理器,用于从预先存储的语音数据集中获取目标播放数据;根据车辆环境音,和/或所述目标播放数据的语义信息,确定与车辆中的播放设备匹配的播放控制参数;将所述播放控制参数以及所述目标播放数据发送至所述播放设备;
所述播放设备,用于按照接收的所述播放控制参数,播放所述目标播放数据;
所述声音采集组件,用于对所述播放设备播放的所述目标播放数据进行音频采集,得到与所述目标播放数据对应的音频信号,并传输至所述声卡;
所述声卡,用于将接收的所述音频信号转化为数字信号,并将所述数字信号传输至所述数字信号处理器;
所述数字信号处理器,用于对接收的所述数字信号进行降噪处理和/或回声消除处理,得到待检测数字信号,将所述待检测数字信号传输至音频检测模块;
所述音频检测模块,用于显示接收的所述待检测数字信号,以根据显示的所述待检测数字信号确定所述基于车辆的用户发音模拟***是否正常。
第四方面,本发明实施例还提供了一种基于车辆的用户发音模拟方法,该方法,包括:
通过处理器从预先存储的语音数据集中获取目标播放数据;根据车辆环境音,和/或所述目标播放数据的语义信息,确定与车辆中的播放设备匹配的播放控制参数;将所述播放控制参数以及所述目标播放数据发送至所述播放设备;
通过所述播放设备按照接收的所述播放控制参数,播放所述目标播放数据;
通过声音采集组件对所述播放设备播放的所述目标播放数据进行音频采集,得到与所述目标播放数据对应的音频信号,并传输至声卡;
通过所述声卡将接收的所述音频信号转化为数字信号,并将所述数字信号传输至所述数字信号处理器;
通过所述数字信号处理器对接收的所述数字信号进行降噪处理和/或回声消除处理,得到待检测数字信号,将所述待检测数字信号传输至音频检测模块;
通过所述音频检测模块显示接收的所述待检测数字信号,以根据显示的所述待检测数字信号确定基于车辆的用户发音模拟***是否正常。
第五方面,本发明实施例还提供了一种计算机设备,该设备包括:
一个或多个处理器;
播放设备,用于按照设定的播放控制参数,播放设定的播放数据;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例所述的一种基于车辆的用户发音模拟方法。
第六方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所述的一种基于车辆的用户发音模拟方法。
本发明实施例的技术方案,通过从预先存储的语音数据集中获取目标播放数据;根据车辆环境音,和/或目标播放数据的语义信息,确定与车辆中的播放设备匹配的播放控制参数;控制播放设备按照播放控制参数,播放目标播放数据,解决了现有技术中发音人上车进行语音采集时成本高、效率低以及语音采集受采集条件影响而采集困难的问题,通过播放设备播放目标播放数据,代替现有技术发音人上车进行语音采集的方式,可以实现降低发音模拟成本,实现方式简单,发音模拟高效的效果;通过车辆环境音和/或语义信息确定播放设备的播放控制参数,可以实现使播放设备的播放质量达到与发音人上车进行语音采集同等质量的效果。
附图说明
图1是本发明实施例一提供的一种基于车辆的用户发音模拟方法的流程图;
图2是本发明实施例二提供的一种基于车辆的用户发音模拟方法的流程图;
图3是本发明实施例三提供的一种基于车辆的用户发音模拟方法的流程图;
图4是本发明实施例四提供的一种基于车辆的用户发音模拟装置的结构示意图;
图5是本发明实施例五提供的一种基于车辆的用户发音模拟***的结构示意图;
图6是本发明实施例六提供的一种基于车辆的用户发音模拟方法的流程图;
图7是本发明实施例七提供的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1是本发明实施例一提供的一种基于车辆的用户发音模拟方法的流程图,本实施例可适用于在车辆内播放语音并进行语音采集以检测车辆的语音采集设备是否正常的情况,该方法可以由基于车辆的用户发音模拟装置来执行,该装置可以通过软件,和/或硬件的方式实现,装置可以集成在车辆的控制器中,如图1所示,该方法具体包括:
步骤110、从预先存储的语音数据集中获取目标播放数据。
为了保证语音数据集中各音频的高质量,避免音频存在失真情况,在本发明实施例中,语音数据集为至少一个发音人在录音棚预先录制的高保真语音数据构成的集合。
其中,发音人是指用于对指定的语音数据进行播报形成音频的人。录音棚可以保证发音人在进行播报形成音频时无噪音,可以保证音频的高质量性。高保真语音数据是指通过能够完美再现原著声音的设备或者载体而生成的语音数据。采集发音人的音频构成语音数据集时,可以采用48千赫兹的采样频率,可以保证语音数据近于0失真。
语音数据可以是在车辆内发生的功能性指令对应的语音数据,例如,“打开空调”、“查询天气”或者“打开到A地的导航”等;或者,语音数据也可以是在车辆内发生的非功能性指令对应的语音数据,例如,“你的父母是谁?”、“你家在哪?”或者“你有对象吗?”等。对于语音数据的准确采集便于精准实现用户的功能指令或者可以避免用户在车辆内发生意外安全情况。语音数据构成的语音数据集可以预先存储在车辆的存储器中。对于不同型号的车辆可以存储相同或者不同的语音数据集。多种型号的车辆共享同一语音数据集,可以减少语音数据的多次录制,可以降低发音人录制语音数据的成本,也可以提高语音数据录制的效率。
目标播放数据是语音数据集中的任意一项或者多项语音数据,即发音人预先录制的语音数据可以作为目标播放数据。目标播放数据的获取方式可以是随机选取语音数据集中语音数据作为目标播放数据;或者,可以是按照预设顺序选取语音数据集中的语音数据作为目标播放数据。预设顺序可以是语音数据的存储顺序,或者管理人员指定的顺序等,本发明实施例不做具体限定。
步骤120、根据车辆环境音,和/或目标播放数据的语义信息,确定与车辆中的播放设备匹配的播放控制参数。
其中,播放设备在车辆中的位置与真实人嘴所处位置相匹配。播放设备是一种音频播放设备,是模拟人嘴进行语音数据播放的设备,例如,人工嘴,高保真音响或者喇叭等。真实人嘴是指发音人上车进行语音播报时的嘴巴。
在本发明实施例中,可选的播放设备为人工嘴,人工嘴具有比高保真音响更好的播放效果,可以理解为人工嘴是一种特殊的喇叭,可以发出与真人发出声音更为接近的声音。为了保证播放设备与真人效果接近,播放设备在车辆中的位置与真实人嘴所处位置相匹配,可以将播放设备设置在与真实人嘴所处位置相近的位置上。例如,可以确定发音人上车进行语音播报时,嘴巴所处的位置,将播放设备的摆放位置与嘴巴所述的位置保持一致。
播放设备进行语音数据播放时可以采用不同的播放控制参数,例如播放音量、播放声源方向以及播放速度等。为了保证播放设备与发音人的播放具有同等效果,在本实施例中播放速度可以采用语音数据本身的速度,不进行变速处理。而播放音量和播放声源方向可以分别根据车辆环境音和目标播放数据的语义信息进行确定。
其中,车辆环境音可以是车辆内部的噪声音量,例如可以是车辆内部的噪声分贝值。车辆环境音的获取方式可以是车辆的控制器或者处理器接收麦克风采集的噪声音量。车辆的控制器或者处理器可以根据车辆环境音确定播放设备的播放控制参数,例如,可以根据车辆环境音确定播放设备的播放音量。可以在车辆环境音越大时,确定的播放设备的播放音量越大;车辆环境音越小时,确定的播放设备的播放音量越小。
进一步的,为了精准控制播放设备的播放音量,可以预先在车辆的存储器中存储车辆环境音与播放设备播放音量之间的映射表。示例性的,表1是车辆环境音与播放设备播放音量之间的映射表。根据表1可知,可以为不同的车辆环境音确定不同的播放设备的播放音量。表1所示的映射表可以是根据实际环境中,发音人在不同车辆环境音中,播报习惯确定的。可以保证播放设备的播放音量与发音人在同情况下的播报音量保持一致,可以保证播放设备发出的声音接近真人发声,避免语音采集的失真。
表1
目标播放数据的语义信息可以包括目标播放数据的内容分类,例如,“打开空调”或者“调高温度”等属于空调类;“查询天气”或者“穿衣指数”等属于天气类;以及“导航到B菜馆”属于导航类等。对于不同的内容分类的目标播放数据在真人播放时可能具有不同的播放声源方向。为了保证播放设备与真人效果接近,可以根据目标播放数据的语义信息确定播放设备的播放声源方向。
示例性的,表2是语义信息与播放声源方向的映射表。可以人工确定预先存储的语音数据集中的语音数据进行语义信息,即语音数据集中可以包括至少一条语音数据以及各语音数据对应的语义信息。语义信息与播放声源方向的映射表可以预先存储在车辆的存储器中。车辆的处理器或者控制器可以根据表2中语义信息与播放声源方向的映射关系确定播放设备播放目标播放数据时的播放声源方向,可以保证播放设备与真人效果接近。
需要说明的是,表2中可能同一语义信息对应多个播放声源方向,对于属于同一语义信息的多条语音数据可以按照对应的各播放声源方向的比例分别确定播放声源方向。例如,空调类存在语音数据1000条,按照比例可以将任意500条确定为正前方偏下方向进行播放,将剩余的500条确定为正前方播放。语音数据的具体划分方式以及具体的播放顺序,本发明实施例不做限定。
表2
步骤130、控制播放设备按照播放控制参数,播放目标播放数据。
其中,车辆的控制器或处理器可以将播放控制参数传世至播放设备,控制播放设备按照播放控制参数播放目标播放数据,例如按照确定的播放音量、播放声源方向以及播放速度播放目标播放数据。其中,播放设备的播放音量的控制可以是按照目前的音量调整技术进行实现;播放声源方向的调整可以是通过机器人的脑袋旋转技术进行实现。
本实施例的技术方案,通过从预先存储的语音数据集中获取目标播放数据;根据车辆环境音,和/或目标播放数据的语义信息,确定与车辆中的播放设备匹配的播放控制参数;控制播放设备按照播放控制参数,播放目标播放数据,解决了现有技术中发音人上车进行语音采集时成本高、效率低以及语音采集受采集条件影响而采集困难的问题,通过播放设备播放目标播放数据,代替现有技术发音人上车进行语音采集的方式,可以实现降低发音模拟成本,实现方式简单,发音模拟高效的效果;通过车辆环境音和/或语义信息确定播放设备的播放控制参数,可以实现使播放设备的播放质量达到与发音人上车进行语音采集同等质量的效果。
实施例二
图2是本发明实施例二提供的一种基于车辆的用户发音模拟方法的流程图。本实施例是对上述技术方案的进一步细化,本实施例中的技术方案可以与上述一个或者多个实施例中的各个可选方案结合。如图2所示,该方法包括:
步骤210、从预先存储的语音数据集中获取目标播放数据。
其中,语音数据集为至少一个发音人在录音棚预先录制的高保真语音数据构成的集合。
步骤220、获取车辆环境音的噪声分贝值,并根据噪声分贝值确定与车辆中的播放设备匹配的播放音量。
其中,为了车辆环境音的噪声分贝值获取的精确性,可以在车内麦克风处安装声压检测装置,如声压计。通过麦克风处安装的声压计获取车辆环境音的噪声分贝值,传输至车辆的处理器或者控制器。麦克风处的声压计用于检测麦克风处采集到的声音音量的大小。在没有语音数据进行播放时,麦克风处的声压计采集的就是车辆环境音的噪声分贝值。可以在进行语音数据播放前,获取车辆环境音的噪声分贝值。
车辆的处理器或者控制器可以将接收的车辆环境音的噪声分贝值,传输至播放设备,控制播放设备自动调整到匹配的播放音量。车辆环境音的噪声分贝值与播放设备的播放音量之间的映射关系可以是预先设置好并存储于车辆的存储器中。车辆的处理器或者控制器可以直接从存储器调取映射关系,根据车辆环境音的噪声分贝值确定对应的播放设备的播放音量,以控制播放设备按照播放音量进行播放。具体的,车辆环境音的噪声分贝值与播放设备的播放音量之间的映射关系可以如表1所示。
为了保证播放设备的实际播放音量与车辆环境音的噪声分贝值相匹配,在本实施例的一个可选实施方式中,根据噪声分贝值确定与车辆中的播放设备匹配的播放音量,包括:根据噪声分贝值调整车辆中的播放设备的播放音量;控制播放设备按照播放音量播放设定音频,并获取与设定音频匹配的播放分贝值;若播放分贝值与噪声分贝值相匹配,则确定播放设备的当前播放音量与噪声分贝值对应;若播放分贝值与噪声分贝值不相匹配,则对播放设备的播放音量进行再调整后,返回执行控制播放设备按照播放音量播放设定音频的操作。
其中,车辆的处理器或者控制器可以根据麦克风处安装的声压计确定噪声分贝值,并根据噪声分贝值与播放音量的映射关系,确定匹配的播放设备的播放音量,对播放设备的播放音量进行调整。其中,播放音量与噪声分贝值的匹配是指两者存在映射关系。然后,可以控制播放设备按照匹配的播放音量播放设定音频。设定音频可以是预先设置的用于测试的音频,也可以是语音数据集中的任意语音数据,本发明实施例对此不做具体限定。
播放设备处可以安装声压装置,如声压计。通过播放设备处的声压计可以检测播放设备播放设定音频时的播放分贝值。如果播放设备的播放分贝值与噪声分贝值相匹配,那么播放设备当前的播放音量能够达到预期要求,播放设备可以继续将该播放音量作为车辆当前环境情况下的播放音量,无需调整。如果播放设备的播放分贝值与噪声分贝值不相匹配,可以根据噪声分贝值确定匹配的播放分贝值。其中,播放分贝值与噪声分贝值相匹配是指播放设备按照播放音量进行设定音频播放时的当前播放分贝值满足当前噪声分贝值对播放分贝值的要求。根据匹配的播放分贝值确定当前播放设备的播放分贝值是偏大或者偏小。根据确定的偏大或者偏小的结果,调整播放设备的播放音量。例如,确定结果为偏大时,可以降低播放设备的播放音量;或者,确定结果为偏小时,可以增大播放设备的播放音量。待播放设备重新确定播放音量后,可以继续播放设定音频,确定播放分贝值,直至播放设备采用播放音量播放设定音频时的播放分贝值与噪声分贝值匹配。
其中,播放设备播放设定音频的播放分贝值与噪声分贝值的映射关系,可以是预先通过实验手段得到的。表3是播放分贝值与噪声分贝值的映射关系表。如表3所示,当麦克风处的声压计检测到噪声分贝值时,可以根据表3的映射关系表预先确定播放设备的播放音量。播放设备处的声压计检测播放设备按照预先确定的播放音量播放设定音频时的播放分贝值,确定是否与噪声分贝值相匹配,进而确定是否对播放设备的播放音量进行调整。
事实上,播放设备通过预先确定的播放音量播放设定音频时,可以达到与噪声分贝值匹配的播放分贝值。但是,在一些情况下,播放设备可能存在一定的故障,致使播放设备通过预先确定的播放音量播放设定音频时,无法达到与噪声分贝值匹配的播放分贝值,需要对播放设备的播放音量进行调整,例如由于播放设备的长期使用导致的播放音量存在偏差。
表3
示例性的,如表3所示,在第一场景下,车辆停车状态时,麦克风处的声压计检测到车辆环境音的噪声分贝值在区间53-58分贝内。此时,真人正常讲话的分贝值在区间72-77分贝之间,麦克风可以采集到比较清晰的音频。因此,可以设定第一场景下的车辆环境音的噪声分贝值在区间53-58分贝内时,匹配的播放设备的播放分贝值为区间72-77分贝。根据播放分贝值为区间72-77分贝,可以预先确定播放设备的播放音量为第3档。可以控制播放设备按照播放音量为第3档,播放设定音频。播放设备处的声压计可以检测播放设备的当前播放分贝值是否在区间72-77分贝内。
如果播放设备的当前播放分贝值在区间72-77分贝内,确定播放设备的当前播放音量与噪声分贝值相匹配。在第一场景下,播放设备可以按照第3档的播放音量,播放语音数据集中的语音数据。如果播放设备的当前播放分贝值不在区间72-77分贝内,可以确定播放设备的当前播放分贝值大于77分贝,或者小于72分贝。
如果播放设备的当前播放分贝值大于77分贝,降低播放设备的当前播放音量,例如采用第2档进行播放。如果播放设备的当前播放分贝值小于72分贝,增大播放设备的当前播放音量,例如采用第4档进行播放。可以根据调整后的播放音量,通过播放设备处的声压计确定播放分贝值。如果播放分贝值在区间72-77分贝内,确定调整的播放音量与噪声分贝值匹配。如果播放分贝值不在区间72-77分贝内,可以继续调整播放设备的播放音量,直至播放设备处的声压计检测的播放分贝值在区间72-77分贝内。
步骤230、控制播放设备按照播放音量,播放目标播放数据。
其中,车辆的控制器或者处理器可以控制播放设备按照与车辆环境音的噪声分贝值匹配的播放音量,播放目标播放数据,可以达到与真人播报一样的效果,可以避免真人上车进行语音播放与语音采集,可见降低成本,提高效率。
本发明实施例的技术方案,通过声压装置确定车辆环境音的噪声分贝值,并根据噪声分贝值确定与车辆中的播放设备匹配的播放音量;控制播放设备按照匹配的播放音量播放目标播放数据,解决了现有技术中发音人上车进行语音采集时成本高、效率低以及语音采集受采集条件影响而采集困难的问题,为播放设备确定精准的播放音量,通过播放设备按照播放音量进行语音数据的播放达到与发音人上车进行语音采集一样的效果,同时还可以达到降低发音模拟成本,提高发音模拟效率的效果。
实施例三
图3是本发明实施例三提供的一种基于车辆的用户发音模拟方法的流程图。本实施例是对上述技术方案的进一步细化,本实施例中的技术方案可以与上述一个或者多个实施例中的各个可选方案结合。如图3所示,该方法包括:
步骤310、从预先存储的语音数据集中获取目标播放数据。
其中,语音数据集为至少一个发音人在录音棚预先录制的高保真语音数据构成的集合。
步骤320、获取目标播放数据的语义信息,并根据语义信息确定与车辆中的播放设备匹配的播放声源方向。
其中,语义信息的获取方式可以是多样的,例如,可以是预先通过人为设定的;或者,也可以是通过语义分析技术实现的。可以在车辆的处理器或者控制器中,或者在播放设备中设置芯片,芯片中可以设置语义分析相关的程序。通过语义分析程序可以实时确定语音数据集中语音数据的语音信息,例如确定语音数据的内容分类。当播放设备获取到目标播放数据时,可以根据语义分析技术同步确定目标播放数据的语义信息。
语义信息与播放声源方向的匹配关系可以是多种实现方式,例如,可以是人为预先确定的,或者,也可以是车辆的处理器或者控制器根据语义信息实时确定的。
示例性的,当目标播放数据的语义信息为空调类,车辆的处理器或者控制器可以根据空调类实时确定播放设备的播放声源方向为朝向正前方,或者朝向正前方偏下。对于语义信息为空调类的多个目标播放数据,车辆的处理器或者控制器可以控制播放设备的播放声源方向在正前方或者正前方偏下之间来回切换。
为了在用户发音模拟中,根据语义信息确定的播放声源方向更能代表用户的真实情况,在本实施例的一个可选实施方式中,语义信息至少包括下述一项:空调类、调侃类、天气类、智能家居类或者导航类;根据语义信息确定与车辆中的播放设备匹配的播放声源方向,包括:若所述语义信息为空调类,确定车辆中的播放设备匹配的播放声源方向为正前方偏下或者正前方;若所述语义信息为调侃类,确定车辆中的播放设备匹配的播放声源方向为车辆终端控制方向或者正前方;若所述语义信息为天气类,确定车辆中的播放设备匹配的播放声源方向为窗外、正前方或者车辆终端控制方向;若所述语义信息为智能家居类,确定车辆中的播放设备匹配的播放声源方向为正前方或者车辆终端控制方向;若所述语义信息为导航类,确定车辆中的播放设备匹配的播放声源方向为正前方或者车辆终端控制方向。
其中,对于同一语义信息可以存在对应的多条语音数据,各语音数据的播放声源方向可以是相同或不同的。对于同一语义信息,可以存在一个或者多个播放声源方向。为了确定语音数据的具体播放声源方向,可以为播放声源方向设置比例,更能反映真实的播放情况。具体的,语义信息与播放声源方向的映射关系可以如表2所示。可以在确定目标播放数据的语义信息时,按照语义信息对应的播放声源方向以及对应的比例,确定目标播放数据的播放声源方向。
其中,语义信息可以表示语音数据的含义分类,例如,空调类是指语音数据是与车辆内的空调相关的数据,如调整车辆温度,打开或者关闭空调等;调侃类是指语音数据是聊天时产生的不具有启动车辆某一功能的数据,如关于家庭或者工作情况的讨论等;天气类是指语音数据是与天气相关的数据,如查询天气;智能家居类是指语音数据是通过车辆控制与车辆相连的其他家庭设备的数据,如打开家里的空调或者开启家里的洗衣机等;导航类是指语音数据是与导航相关的数据,如导航到某地或者打开某导航软件等。
示例性的,目标播放数据的语义信息为天气类,车辆的处理器或者控制器可以控制播放设备在窗外、正前方和车辆终端控制方向,这三个方向之间进行切换,切换的比例为5:3:2。例如,车辆的存储器可以记录语义信息为天气类的目标播放数据的播放声源方向。可以以10条天气类的目标播放数据为一组。如果同一组内,已经存在未超过4条的天气类的目标播放数据的播放声源方向为窗外,那么该组内的目标播放数据的播放声源方向仍然可以为窗外。如果同一组内,已经存在5条播放声源方向为窗外的目标播放数据,那么目标播放数据的播放声源方向可以为正前方或者车辆终端控制。其中,如果同一组内,已经存在未超过2条的天气类的目标播放数据的播放声源方向为正前方,那么该组内的目标播放数据的播放声源方向仍然可以为正前方。如果同一组内,已经存在3条播放声源方向为正前方的目标播放数据,那么目标播放数据的播放声源方向可以为车辆终端控制。
步骤330、控制播放设备按照播放声源方向,播放目标播放数据。
其中,车辆的处理器或者控制器可以控制播放设备按照与目标播放数据的语义信息匹配的播放声源方向,播放目标播放数据。可以使播放设备的播放声源方向与真人播报时的方向保持一致。
本发明实施例的技术方案,通过获取目标播放数据的语义信息,并根据语义信息确定与车辆中的播放设备匹配的播放声源方向;控制播放设备按照播放声源方向,播放目标播放数据,解决了现有技术中发音人上车进行语音采集时成本高、效率低以及语音采集受采集条件影响而采集困难的问题,通过控制播放设备按照目标播放数据的语义信息匹配的播放声源方向播放目标播放数据,可以实现与发音人播报方向一致的效果,同时可以达到降低发音模拟成本,实现方式简单,发音模拟高效的效果。
在上述实施方式的基础上,可选的,在控制播放设备按照播放控制参数,播放目标播放数据之前,还包括:检测车辆的颠簸状态,并根据颠簸状态确定与车辆中的播放设备匹配的播放频率;控制播放设备按照播放控制参数,播放目标播放数据,包括:控制播放设备按照播放频率,播放目标播放数据。
其中,车辆的颠簸状态是指车辆在行驶中的颠簸情况,例如,是否颠簸或者颠簸程度等。颠簸状态的确定方式可以是多样的,例如,通过检测仪器进行检测或者实验测试等方式。其中,检测仪器可以是汽车颠簸测试仪。实验测试的方法可以是车辆运输待测试产品,待测试产品可以设置在托盘上,通过对待测试产品进行实时的状态监控,确定车辆的颠簸状态。
车辆的颠簸状态与播放设备的播放频率之间也可以存在映射关系,例如,车辆越颠簸时,播放频率越高。示例性的,车辆的颠簸状态可以划分为不同的颠簸等级,如轻微颠簸,播放频率为20赫兹至200赫兹;中度颠簸,播放频率为200赫兹至2000赫兹;重度颠簸,播放频率为2000赫兹至20000赫兹。又一示例性的,可以通过仪器测量车辆的震动频率作为车辆的颠簸状态,根据震动频率确定播放频率,如车辆的颠簸状态为震动频率为低于1赫兹,播放频率为20赫兹至200赫兹;震动频率为1赫兹至10赫兹,播放频率为200赫兹至2000赫兹;震动频率为大于10赫兹,播放频率为2000赫兹至20000赫兹。
可以根据颠簸状态与播放频率的映射关系,确定当前颠簸状态下的播放设备的当前播放频率;播放设备可以在当前播放频率下进行目标播放数据的播放,可以使车辆在各颠簸状态下,都可以保证播放设备的播放清晰,达到真实人播报的效果。
实施例四
图4是本发明实施例四提供的一种基于车辆的用户发音模拟装置的结构示意图。结合图4,该装置包括:目标播放数据获取模块410,播放控制参数确定模块420和播放控制模块430。
其中,目标播放数据获取模410,用于从预先存储的语音数据集中获取目标播放数据;
播放控制参数确定模块420,用于根据车辆环境音,和/或目标播放数据的语义信息,确定与车辆中的播放设备匹配的播放控制参数,播放设备在车辆中的位置与真实人嘴所处位置相匹配;
播放控制模块430,用于控制播放设备按照播放控制参数,播放目标播放数据。
可选的,播放控制参数确定模块420包括:
播放音量确定单元,用于获取车辆环境音的噪声分贝值,并根据噪声分贝值确定与车辆中的播放设备匹配的播放音量。
可选的,播放控制模块430包括:
播放音量控制单元,用于控制播放设备按照播放音量,播放目标播放数据。
可选的,播放音量确定单元,具体用于:
根据噪声分贝值调整车辆中的播放设备的播放音量;
控制播放设备按照播放音量播放设定音频,并获取与设定音频匹配的播放分贝值;
若播放分贝值与噪声分贝值相匹配,则确定播放设备的当前播放音量与噪声分贝值对应;
若播放分贝值与噪声分贝值不相匹配,则对播放设备的播放音量进行再调整后,返回执行控制播放设备按照播放音量播放设定音频的操作。
可选的,可选的,播放控制参数确定模块420包括:
播放声源方向确定单元,用于获取目标播放数据的语义信息,并根据语义信息确定与车辆中的播放设备匹配的播放声源方向。
可选的,播放控制模块430包括:
播放声源方向控制单元,用于控制播放设备按照播放声源方向,播放目标播放数据。
可选的,语义信息至少包括下述一项:空调类、调侃类、天气类、智能家居类或者导航类;
播放声源方向确定单元,具体用于:
若语义信息为空调类,确定车辆中的播放设备匹配的播放声源方向为正前方偏下或者正前方;
若语义信息为调侃类,确定车辆中的播放设备匹配的播放声源方向为车辆终端控制方向或者正前方;
若语义信息为天气类,确定车辆中的播放设备匹配的播放声源方向为窗外、正前方或者车辆终端控制方向;
若语义信息为智能家居类,确定车辆中的播放设备匹配的播放声源方向为正前方或者车辆终端控制方向;
若语义信息为导航类,确定车辆中的播放设备匹配的播放声源方向为正前方或者车辆终端控制方向。
可选的,语音数据集为至少一个发音人在录音棚预先录制的高保真语音数据构成的集合。
可选的,该装置还包括:
播放频率确定模块,用于在控制播放设备按照播放控制参数,播放目标播放数据之前,检测车辆的颠簸状态,并根据颠簸状态确定与车辆中的播放设备匹配的播放频率;
播放控制模块430包括:
播放频率控制单元,用于控制播放设备按照播放频率,播放目标播放数据。
可选的,播放设备为人工嘴。
本发明实施例所提供的基于车辆的用户发音模拟装置可执行本发明任意实施例所提供的基于车辆的用户发音模拟方法,具备执行方法相应的功能模块和有益效果。
实施例五
图5是本发明实施例五提供的一种基于车辆的用户发音模拟***的结构示意图。结合图5,该***包括:处理器(或者控制器)510、播放设备520、声音采集组件530、声卡540、数字信号处理器550和音频检测模块560。
其中,播放设备520、声音采集组件530、声卡540、数字信号处理器550和音频检测模块560均与处理器510电连接;播放设备520、声音采集组件530、声卡540、数字信号处理器550和音频检测模块560依次电连接;播放设备520在车辆中的位置与真实人嘴所处位置相匹配。
处理器510,用于从预先存储的语音数据集中获取目标播放数据;根据车辆环境音,和/或目标播放数据的语义信息,确定与车辆中的播放设备匹配的播放控制参数;将播放控制参数以及目标播放数据发送至播放设备。
其中,语音数据集为至少一个发音人在录音棚预先录制的高保真语音数据构成的集合。
可选的,根据车辆环境音,和/或目标播放数据的语义信息,确定与车辆中的播放设备520匹配的播放控制参数,包括:
获取车辆环境音的噪声分贝值,并根据噪声分贝值确定与车辆中的播放设备520匹配的播放音量;
将播放控制参数以及目标播放数据发送至播放设备520,包括:
将播放音量以及目标播放数据发送至播放设备520。
可选的,根据噪声分贝值确定与车辆中的播放设备520匹配的播放音量,包括:
根据噪声分贝值调整车辆中的播放设备520的播放音量;
控制播放设备520按照播放音量播放设定音频,并获取与设定音频匹配的播放分贝值;
若播放分贝值与噪声分贝值相匹配,则确定播放设备520的当前播放音量与噪声分贝值对应;
若播放分贝值与噪声分贝值不相匹配,则对播放设备520的播放音量进行再调整后,返回执行控制播放设备520按照播放音量播放设定音频的操作。
可选的,根据车辆环境音,和/或目标播放数据的语义信息,确定与车辆中的播放设备520匹配的播放控制参数,包括:
获取目标播放数据的语义信息,并根据语义信息确定与车辆中的播放设备520匹配的播放声源方向;
将播放控制参数以及目标播放数据发送至播放设备520,包括:
将播放声源方向以及目标播放数据发送至播放设备520。
可选的,语义信息至少包括下述一项:空调类、调侃类、天气类、智能家居类或者导航类;
根据语义信息确定与车辆中的播放设备520匹配的播放声源方向,包括:
若语义信息为空调类,确定车辆中的播放设备匹配的播放声源方向为正前方偏下或者正前方;
若语义信息为调侃类,确定车辆中的播放设备匹配的播放声源方向为车辆终端控制方向或者正前方;
若语义信息为天气类,确定车辆中的播放设备匹配的播放声源方向为窗外、正前方或者车辆终端控制方向;
若语义信息为智能家居类,确定车辆中的播放设备匹配的播放声源方向为正前方或者车辆终端控制方向;
若语义信息为导航类,确定车辆中的播放设备匹配的播放声源方向为正前方或者车辆终端控制方向。
播放设备520,用于按照接收的播放控制参数,播放目标播放数据。
可选的,播放设备520具体用于:按照接收的播放音量和/或播放声源方向,播放目标播放数据。
可选的,处理器510,还用于检测车辆的颠簸状态,并根据颠簸状态确定与车辆中的播放设备匹配的播放频率;将播放频率发送至播放设备;
播放设备520具体还用于:按照接收的播放频率,播放目标播放数据。
可选的,播放设备520为人工嘴。
声音采集组件530,用于对播放设备播放的目标播放数据进行音频采集,得到与目标播放数据对应的音频信号,并传输至声卡540。
其中,声音采集组件530可以是麦克风或者麦克风阵列等。声音采集组件530可以安装在车内车辆终端控制附件,便于采集真人或者播放设备播放的语音数据。
声卡540,用于将接收的音频信号转化为数字信号,并将数字信号传输至数字信号处理器550。
数字信号处理器550,用于对接收的数字信号进行降噪处理和/或回声消除处理,得到待检测数字信号,将待检测数字信号传输至音频检测模块560。
其中,声音采集组件530采集的音频信号中包括多种噪音信号,例如,风噪、胎噪、空调噪音、附近车辆噪音以及车外环境噪音等不同频率和强度的噪音。数字信号处理器550可以在一定程度上将噪音做削弱,减少噪音干扰,使待检测数字信息的信噪比更高,达到播放设备播报的目标播放数据的声音更易分辨,更清晰的效果。
音频检测模块560,用于显示接收的待检测数字信号,以根据显示的待检测数字信号确定基于车辆的用户发音模拟***是否正常。
其中,音频检测模块560可以包括显示器,显示器可以是一个独立模块,也可以是车辆内安装的显示器,或者也可以是电脑的显示器。待检测数字信号的音频波形图和频谱图等相关的结果可以通过音频检测模块560进行显示。语音采集的监听者可以通过显示的音频波形图和频谱图等判断待检测数字信号是否正常,例如是否存在截幅情况,音频采样率是否正确,或者有无特殊频率的信号干扰等。根据确定的待检测数字信号是否正常的结果,可以实时确定基于车辆的用户发音模拟***是否正常。
示例性的,车辆内部进行语音采集时,环境是比较复杂的,例如存在减速带产生的车辆颠簸导致意外情况发生致使语音采集出现问题。或者,车辆发动机死机、车辆颠簸导致的基于车辆的用户发音模拟***中各设备之间接线断开,导致的语音采集中断。又如,新能源汽车中电池产生的某一频率的稳定干扰等。
在本发明实施例中,可以对播放设备播放的目标播放数据进行实时的语音采集以及实时的检测。实时采样即检测可以避免批量处理导致语音采集中的问题不能及时被发现,无法对基于车辆的用户发音模拟***及时进行调整,致使需要对语音信号进行反复采集,效率低的问题。
本发明实施例的技术方案,采用基于车辆的用户发音模拟***,通过处理器获取高保真的语音数据集中的目标播放数据;根据车辆环境音,和/或目标播放数据的语义信息,确定与车辆中的播放设备匹配的播放控制参数;通过播放设备对目标播放数据按照播放控制参数进行播放;通过声音采集组件采集播放设备播放的目标播放数据得到音频信号;通过声卡将音频信号转化为数字信号;通过数字信号处理器将数字信号进行降噪处理和/或回声消除处理,得到待检测数字信号;通过音频检测模块显示待检测数字信号,以根据待检测数字信号确定基于车辆的用户发音模拟***是否正常,解决了现有技术真人上车播报语音数据进行采集进而检测语音采集***是否正常时,成本高、效率低以及采样困难的问题,实现了通过播放设备代替真人上车,达到与真人上车进行播报一样的效果,同时节省成本,采样高效,采样场景可以不受真人限制而更丰富,语音数据集可以多次重复使用,避免真人长期工作时因疲劳而导致的播报不清楚等问题,可以实时进行音频检测,及时发现音频信号的问题,进而确定语音采样设备是否存在问题。
实施例六
图6是本发明实施例六提供的一种基于车辆的用户发音模拟方法的流程图。结合图6,该方法包括:
步骤610、通过处理器从预先存储的语音数据集中获取目标播放数据;根据车辆环境音,和/或目标播放数据的语义信息,确定与车辆中的播放设备匹配的播放控制参数;将播放控制参数以及目标播放数据发送至播放设备。
其中,语音数据集为至少一个发音人在录音棚预先录制的高保真语音数据构成的集合。
可选的,根据车辆环境音,和/或目标播放数据的语义信息,确定与车辆中的播放设备匹配的播放控制参数,包括:
获取车辆环境音的噪声分贝值,并根据噪声分贝值确定与车辆中的播放设备匹配的播放音量;
将播放控制参数以及目标播放数据发送至播放设备,包括:
将播放音量以及目标播放数据发送至播放设备。
可选的,根据噪声分贝值确定与车辆中的播放设备匹配的播放音量,包括:
根据噪声分贝值调整车辆中的播放设备的播放音量;
控制播放设备按照播放音量播放设定音频,并获取与设定音频匹配的播放分贝值;
若播放分贝值与噪声分贝值相匹配,则确定播放设备的当前播放音量与噪声分贝值对应;
若播放分贝值与噪声分贝值不相匹配,则对播放设备的播放音量进行再调整后,返回执行控制播放设备按照播放音量播放设定音频的操作。
可选的,根据车辆环境音,和/或目标播放数据的语义信息,确定与车辆中的播放设备匹配的播放控制参数,包括:
获取目标播放数据的语义信息,并根据语义信息确定与车辆中的播放设备匹配的播放声源方向;
将播放控制参数以及目标播放数据发送至播放设备,包括:
将播放声源方向以及目标播放数据发送至播放设备。
可选的,根据语义信息确定与车辆中的播放设备匹配的播放声源方向,包括:
获取预先设置的语义信息与播放声源方向的映射关系,并根据映射关系确定语义信息匹配的播放声源方向。
步骤620、通过播放设备按照接收的播放控制参数,播放目标播放数据。
可选的,通过播放设备按照接收的播放控制参数,播放目标播放数据,包括:按照接收的播放音量和/或播放声源方向,播放目标播放数据。
步骤630、通过声音采集组件对播放设备播放的目标播放数据进行音频采集,得到与目标播放数据对应的音频信号,并传输至声卡。
步骤640、通过声卡将接收的音频信号转化为数字信号,并将数字信号传输至数字信号处理器。
步骤650、通过数字信号处理器对接收的数字信号进行降噪处理和/或回声消除处理,得到待检测数字信号,将待检测数字信号传输至音频检测模块。
步骤660、通过音频检测模块显示接收的待检测数字信号,以根据显示的待检测数字信号确定基于车辆的用户发音模拟***是否正常。
本发明实施例所提供的基于车辆的用户发音模拟方法是与基于车辆的用户发音模拟***对应的执行方法,具备与基于车辆的用户发音模拟***相同或相似的技术特征以及有益效果。
实施例七
图7是本发明实施例七提供的一种计算机设备的结构示意图,如图7所示,该设备包括:
一个或多个处理器510,图7中以一个处理器510为例;
播放设备520,用于按照设定的播放控制参数,播放设定的播放数据;
存储器720;
所述设备还可以包括:输入装置730和输出装置740。
所述设备中的处理器510、存储器720、输入装置730和输出装置740可以通过总线或者其他方式连接,图7中以通过总线连接为例。
存储器720作为一种非暂态计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的一种基于车辆的用户发音模拟方法对应的程序指令/模块(例如,附图4所示的目标播放数据获取模块410,播放控制参数确定模块420和播放控制模块430)。处理器510通过运行存储在存储器720中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述方法实施例的一种基于车辆的用户发音模拟方法,即:
从预先存储的语音数据集中获取目标播放数据;
根据车辆环境音,和/或所述目标播放数据的语义信息,确定与车辆中的播放设备匹配的播放控制参数,所述播放设备在车辆中的位置与真实人嘴所处位置相匹配;
控制所述播放设备按照所述播放控制参数,播放所述目标播放数据。
存储器720可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器720可以包括高速随机存取存储器,还可以包括非暂态性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态性固态存储器件。在一些实施例中,存储器720可选包括相对于处理器510远程设置的存储器,这些远程存储器可以通过网络连接至终端设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置730可用于接收输入的数字或字符信息,以及产生与计算机设备的用户设置以及功能控制有关的键信号输入。输出装置740可包括显示屏等显示设备。
实施例八
本发明实施例八提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例提供的一种基于车辆的用户发音模拟方法:
从预先存储的语音数据集中获取目标播放数据;
根据车辆环境音,和/或所述目标播放数据的语义信息,确定与车辆中的播放设备匹配的播放控制参数,所述播放设备在车辆中的位置与真实人嘴所处位置相匹配;
控制所述播放设备按照所述播放控制参数,播放所述目标播放数据。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (11)

1.一种基于车辆的用户发音模拟方法,其特征在于,包括:
从预先存储的语音数据集中获取目标播放数据;
根据车辆环境音,和所述目标播放数据的语义信息,确定与车辆中的播放设备匹配的播放控制参数,所述播放设备在车辆中的位置与真实人嘴所处位置相匹配;其中,所述目标播放数据的语义信息包括目标播放数据的内容分类;
控制所述播放设备按照所述播放控制参数,播放所述目标播放数据;
其中,所述根据所述目标播放数据的语义信息,确定与车辆中的播放设备匹配的播放控制参数,包括:
获取所述目标播放数据的语义信息,并根据所述语义信息确定与所述车辆中的播放设备匹配的播放声源方向;
其中,所述控制所述播放设备按照所述播放控制参数,播放所述目标播放数据,包括:
控制所述播放设备按照所述播放声源方向,播放所述目标播放数据。
2.根据权利要求1所述的方法,其特征在于,所述根据车辆环境音,确定与车辆中的播放设备匹配的播放控制参数,包括:
获取车辆环境音的噪声分贝值,并根据所述噪声分贝值确定与所述车辆中的播放设备匹配的播放音量;
所述控制所述播放设备按照所述播放控制参数,播放所述目标播放数据,还包括:
控制所述播放设备按照所述播放音量,播放所述目标播放数据。
3.根据权利要求2所述的方法,其特征在于,所述根据所述噪声分贝值确定与所述车辆中的播放设备匹配的播放音量,包括:
根据所述噪声分贝值调整车辆中的播放设备的播放音量;
控制所述播放设备按照所述播放音量播放设定音频,并获取与所述设定音频匹配的播放分贝值;
若所述播放分贝值与所述噪声分贝值相匹配,则确定所述播放设备的当前播放音量与所述噪声分贝值对应;
若所述播放分贝值与所述噪声分贝值不相匹配,则对所述播放设备的播放音量进行再调整后,返回执行控制所述播放设备按照所述播放音量播放设定音频的操作。
4.根据权利要求1所述的方法,其特征在于,所述语义信息至少包括下述一项:空调类、调侃类、天气类、智能家居类或者导航类;
所述根据所述语义信息确定与所述车辆中的播放设备匹配的播放声源方向,包括:
若所述语义信息为所述空调类,确定所述车辆中的播放设备匹配的播放声源方向为正前方偏下或者正前方;
若所述语义信息为所述调侃类,确定所述车辆中的播放设备匹配的播放声源方向为车辆终端控制方向或者正前方;
若所述语义信息为所述天气类,确定所述车辆中的播放设备匹配的播放声源方向为窗外、正前方或者车辆终端控制方向;
若所述语义信息为所述智能家居类,确定所述车辆中的播放设备匹配的播放声源方向为正前方或者车辆终端控制方向;
若所述语义信息为所述导航类,确定所述车辆中的播放设备匹配的播放声源方向为正前方或者车辆终端控制方向。
5.根据权利要求1所述的方法,其特征在于,在所述控制所述播放设备按照所述播放控制参数,播放所述目标播放数据之前,还包括:
检测车辆的颠簸状态,并根据所述颠簸状态确定与所述车辆中的播放设备匹配的播放频率;
所述控制所述播放设备按照所述播放控制参数,播放所述目标播放数据,还包括:
控制所述播放设备按照所述播放频率,播放所述目标播放数据。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述播放设备为人工嘴。
7.一种基于车辆的用户发音模拟***,其特征在于,包括:处理器、播放设备、声音采集组件、声卡、数字信号处理器和音频检测模块;
其中,所述播放设备、所述声音采集组件、所述声卡、所述数字信号处理器和所述音频检测模块均与所述处理器电连接;所述播放设备、所述声音采集组件、所述声卡、所述数字信号处理器和所述音频检测模块依次电连接;所述播放设备在车辆中的位置与真实人嘴所处位置相匹配;
所述处理器,用于从预先存储的语音数据集中获取目标播放数据;根据车辆环境音,和所述目标播放数据的语义信息,确定与车辆中的播放设备匹配的播放控制参数;将所述播放控制参数以及所述目标播放数据发送至所述播放设备;其中,所述目标播放数据的语义信息包括目标播放数据的内容分类;所述根据所述目标播放数据的语义信息,确定与车辆中的播放设备匹配的播放控制参数,包括:获取所述目标播放数据的语义信息,并根据所述语义信息确定与所述车辆中的播放设备匹配的播放声源方向;所述将所述播放控制参数以及所述目标播放数据发送至所述播放设备,包括:将所述播放声源方向以及所述目标播放数据发送至所述播放设备;
所述播放设备,用于按照接收的所述播放控制参数,播放所述目标播放数据;其中,所述按照接收的所述播放控制参数,播放所述目标播放数据,包括:按照接收的所述播放声源方向,播放所述目标播放数据;
所述声音采集组件,用于对所述播放设备播放的所述目标播放数据进行音频采集,得到与所述目标播放数据对应的音频信号,并传输至所述声卡;
所述声卡,用于将接收的所述音频信号转化为数字信号,并将所述数字信号传输至所述数字信号处理器;
所述数字信号处理器,用于对接收的所述数字信号进行降噪处理和/或回声消除处理,得到待检测数字信号,将所述待检测数字信号传输至音频检测模块;
所述音频检测模块,用于显示接收的所述待检测数字信号,以根据显示的所述待检测数字信号确定所述基于车辆的用户发音模拟***是否正常。
8.一种基于车辆的用户发音模拟装置,其特征在于,包括:
目标播放数据获取模块,用于从预先存储的语音数据集中获取目标播放数据;
播放控制参数确定模块,用于根据车辆环境音,和所述目标播放数据的语义信息,确定与车辆中的播放设备匹配的播放控制参数,所述播放设备在车辆中的位置与真实人嘴所处位置相匹配;其中,所述目标播放数据的语义信息包括目标播放数据的内容分类;
播放控制模块,用于控制所述播放设备按照所述播放控制参数,播放所述目标播放数据;
所述播放控制参数确定模块,包括:
播放声源方向确定单元,用于获取所述目标播放数据的语义信息,并根据所述语义信息确定与所述车辆中的播放设备匹配的播放声源方向;
所述播放控制模块,包括:
播放声源方向控制单元,用于控制所述播放设备按照所述播放声源方向,播放所述目标播放数据。
9.根据权利要求8所述的装置,其特征在于,所述播放控制参数确定模块,包括:
播放音量确定单元,用于获取车辆环境音的噪声分贝值,并根据所述噪声分贝值确定与所述车辆中的播放设备匹配的播放音量;
所述播放控制模块,包括:
播放音量控制单元,用于控制所述播放设备按照所述播放音量,播放所述目标播放数据。
10.一种计算机设备,其特征在于,包括:
一个或多个处理器;
播放设备,用于按照设定的播放控制参数,播放设定的播放数据;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6任一项所述的一种基于车辆的用户发音模拟方法。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6任一项所述的一种基于车辆的用户发音模拟方法。
CN202010881113.2A 2020-08-27 2020-08-27 基于车辆的用户发音模拟方法、***、设备及存储介质 Active CN112017636B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010881113.2A CN112017636B (zh) 2020-08-27 2020-08-27 基于车辆的用户发音模拟方法、***、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010881113.2A CN112017636B (zh) 2020-08-27 2020-08-27 基于车辆的用户发音模拟方法、***、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112017636A CN112017636A (zh) 2020-12-01
CN112017636B true CN112017636B (zh) 2024-02-23

Family

ID=73502609

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010881113.2A Active CN112017636B (zh) 2020-08-27 2020-08-27 基于车辆的用户发音模拟方法、***、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112017636B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114061941B (zh) * 2021-10-18 2023-12-19 吉林大学 一种新能源车辆变速箱的实验环境调节试验方法、***以及试验箱
CN113823334B (zh) * 2021-11-22 2022-02-08 腾讯科技(深圳)有限公司 一种应用于车载设备的环境模拟方法、相关装置及设备

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000002059U (ko) * 1998-06-30 2000-01-25 전주범 자동볼륨 조절기능을 구비한 카 오디오 제어회로
JP2003235092A (ja) * 2003-02-21 2003-08-22 Yamaha Corp 指向性拡声装置
CN101141118A (zh) * 2007-10-25 2008-03-12 南京工业职业技术学院 车用音响音量随环境噪声大小自动调节器
KR20090047643A (ko) * 2007-11-08 2009-05-13 에스케이 텔레콤주식회사 멀티미디어 컨텐츠를 제공하기 위한 단말기 및 그 제공방법
CN102695112A (zh) * 2012-06-09 2012-09-26 九江妙士酷实业有限公司 汽车播放器及其音量控制方法
CN102904536A (zh) * 2011-07-28 2013-01-30 富泰华工业(深圳)有限公司 音量调节装置及方法
CN105391837A (zh) * 2014-09-01 2016-03-09 三星电子株式会社 管理音频信号的方法和设备
CN105632521A (zh) * 2015-12-22 2016-06-01 深圳市智行畅联科技有限公司 一种基于汽车的随机音源自动声音控制装置
CN105788588A (zh) * 2014-12-23 2016-07-20 深圳市腾讯计算机***有限公司 导航语音播报方法和装置
CN108573718A (zh) * 2017-03-10 2018-09-25 厦门歌乐电子企业有限公司 一种车载播放器
DE102017213252A1 (de) * 2017-08-01 2019-02-07 Bayerische Motoren Werke Aktiengesellschaft Verfahren, Vorrichtung und Computerprogramm zum Variieren eines in einem Fahrzeug auszugebenden Audio-Inhalts
CN109979487A (zh) * 2019-03-07 2019-07-05 百度在线网络技术(北京)有限公司 语音信号检测方法和装置
CN111412587A (zh) * 2020-03-31 2020-07-14 广东美的制冷设备有限公司 空调器的语音处理方法、装置、空调器和存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2956515A1 (fr) * 2010-02-15 2011-08-19 France Telecom Procede de navigation dans un contenu sonore
KR20170101629A (ko) * 2016-02-29 2017-09-06 한국전자통신연구원 스테레오 오디오 신호 기반의 다국어 오디오 서비스 제공 장치 및 방법
WO2018101459A1 (ja) * 2016-12-02 2018-06-07 ヤマハ株式会社 コンテンツ再生機器、収音機器、及びコンテンツ再生システム

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000002059U (ko) * 1998-06-30 2000-01-25 전주범 자동볼륨 조절기능을 구비한 카 오디오 제어회로
JP2003235092A (ja) * 2003-02-21 2003-08-22 Yamaha Corp 指向性拡声装置
CN101141118A (zh) * 2007-10-25 2008-03-12 南京工业职业技术学院 车用音响音量随环境噪声大小自动调节器
KR20090047643A (ko) * 2007-11-08 2009-05-13 에스케이 텔레콤주식회사 멀티미디어 컨텐츠를 제공하기 위한 단말기 및 그 제공방법
CN102904536A (zh) * 2011-07-28 2013-01-30 富泰华工业(深圳)有限公司 音量调节装置及方法
CN102695112A (zh) * 2012-06-09 2012-09-26 九江妙士酷实业有限公司 汽车播放器及其音量控制方法
CN105391837A (zh) * 2014-09-01 2016-03-09 三星电子株式会社 管理音频信号的方法和设备
CN105788588A (zh) * 2014-12-23 2016-07-20 深圳市腾讯计算机***有限公司 导航语音播报方法和装置
CN105632521A (zh) * 2015-12-22 2016-06-01 深圳市智行畅联科技有限公司 一种基于汽车的随机音源自动声音控制装置
CN108573718A (zh) * 2017-03-10 2018-09-25 厦门歌乐电子企业有限公司 一种车载播放器
DE102017213252A1 (de) * 2017-08-01 2019-02-07 Bayerische Motoren Werke Aktiengesellschaft Verfahren, Vorrichtung und Computerprogramm zum Variieren eines in einem Fahrzeug auszugebenden Audio-Inhalts
CN109979487A (zh) * 2019-03-07 2019-07-05 百度在线网络技术(北京)有限公司 语音信号检测方法和装置
CN111412587A (zh) * 2020-03-31 2020-07-14 广东美的制冷设备有限公司 空调器的语音处理方法、装置、空调器和存储介质

Also Published As

Publication number Publication date
CN112017636A (zh) 2020-12-01

Similar Documents

Publication Publication Date Title
CN103208287B (zh) 使用声音相关的车辆信息以增强语音对话的方法和***
CN1941079B (zh) 语音识别方法和***
CN105489063B (zh) 一种具有主动预警功能的新能源汽车行人声音警示装置
US10861480B2 (en) Method and device for generating far-field speech data, computer device and computer readable storage medium
CN106782589B (zh) 移动终端及其语音输入方法和装置
CN112017636B (zh) 基于车辆的用户发音模拟方法、***、设备及存储介质
CN109273006B (zh) 车载***的语音控制方法、车载***、车辆及存储介质
CN112435682B (zh) 车辆降噪***、方法、装置、车辆及存储介质
CN111554317B (zh) 一种语音播报方法、设备、计算机存储介质及***
CN113674763B (zh) 利用线谱特性的鸣笛声识别方法及***、设备与存储介质
CN109361995B (zh) 一种电器设备的音量调节方法、装置、电器设备和介质
CN105761532B (zh) 动态语音提示方法及车载***
WO2020120754A1 (en) Audio processing device, audio processing method and computer program thereof
CN111081275B (zh) 基于声音分析的终端处理方法、装置、存储介质及终端
CN109600703A (zh) 扩声***及其扩声方法和计算机可读存储介质
CN113643704A (zh) 车机语音***的测试方法、上位机、***和存储介质
CN112003666B (zh) 车载收音机控制方法、装置、设备及存储介质
CN112995882B (zh) 一种智能设备音频开环测试方法
KR102488319B1 (ko) 오디오 인식 방법, 오디오 인식 장치, 전자 장비, 컴퓨터 판독가능 저장 매체 및 컴퓨터 프로그램
CN115904299A (zh) 音频播放音量的调节方法、装置和音频播放***
CN115811681A (zh) 一种耳机工作模式控制方法、装置、终端及介质
CN114187906A (zh) 一种车辆控制器及语音唤醒方法
CN108919277B (zh) 基于亚超声波的室内外环境识别方法、***及存储介质
CN112147780A (zh) 车载抬头显示装置、控制***、控制方法、存储介质
CN217124669U (zh) 一种自适应车内提示音***及车辆

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant