CN107886966A - 终端及其优化语音命令的方法、存储装置 - Google Patents
终端及其优化语音命令的方法、存储装置 Download PDFInfo
- Publication number
- CN107886966A CN107886966A CN201711038813.XA CN201711038813A CN107886966A CN 107886966 A CN107886966 A CN 107886966A CN 201711038813 A CN201711038813 A CN 201711038813A CN 107886966 A CN107886966 A CN 107886966A
- Authority
- CN
- China
- Prior art keywords
- audio signal
- terminal
- audio
- frequency range
- header information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000005457 optimization Methods 0.000 title description 7
- 230000005236 sound signal Effects 0.000 claims abstract description 80
- 238000012545 processing Methods 0.000 claims abstract description 41
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 33
- 230000008569 process Effects 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 7
- 238000004088 simulation Methods 0.000 claims description 6
- 230000005611 electricity Effects 0.000 description 4
- 230000005674 electromagnetic induction Effects 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000003750 conditioning effect Effects 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000005577 local transmission Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明公开一种终端及其优化语音命令的方法、存储装置。所述方法包括:接收或者从当前环境中采集音频信号;解析音频信号并获取所述音频信号的文件头信息;根据所述文件头信息选取音频处理算法;通过选取的音频处理算法对音频信号的带宽进行扩充,并对扩充后的音频信号的频段进行频段补偿。基于此,本发明能够在确保语音命令识别率的同时降低硬件要求,成本低且通用性强。
Description
技术领域
本发明涉及电子设备和音频技术领域,具体涉及一种终端及其优化语音命令的方法、存储装置。
背景技术
随着各种电子产品的快速普及,用户对终端的智能化、人性化要求越来越高,如何使终端更加智能化、专业化、多样化,以及更加高效的使用于日常生活中,已经成为当前研究方向之一。以基于语音识别技术的AI(Artificial Intelligence,人工智能)功能为例,为了提高语音命令的识别率,当前很多厂家只限于在终端产品上使用更好的语音采集器件,但是这种很高的硬件要求,不仅会增加成本,而且为了实现兼容需要对整个硬件***进行重新设计,通用性较差。
发明内容
鉴于此,本发明提供一种终端及其优化语音命令的方法、存储装置,能够在确保语音命令识别率的同时降低硬件要求,成本低且通用性强。
本发明一实施例的终端优化语音命令的方法,包括:
终端接收或者从当前环境中采集音频信号;
终端解析音频信号并获取所述音频信号的文件头信息;
终端根据所述文件头信息选取音频处理算法;
终端通过选取的音频处理算法对音频信号的带宽进行扩充,并对扩充后的音频信号的频段进行频段补偿。
本发明一实施例的具有音频处理功能的终端,包括处理器,与所述处理器连接的数字信号处理器DSP、无线通信器和存储器,以及与所述DSP连接的拾音器,其中,
无线通信器和拾音器分别用于接收或者从当前环境中采集音频信号;
处理器用于解析音频信号并获取其文件头信息,以及根据所述文件头信息从存储器中选取音频处理算法;
DSP用于通过选取的音频处理算法对音频信号的带宽进行扩充,并对扩充后的音频信号的频段进行频段补偿。
本发明一实施例的存储装置,存储有程序数据,所述程序数据能够被执行以实现上述终端优化语音命令的方法。
有益效果:本发明通过解析获取音频信号的文件头信息,并据此选取合适的音频处理算法,继而通过选取的音频处理算法对音频信号进行带宽扩充及频段补偿,这种纯算法的处理方式对硬件要求较低,因此能够在确保语音命令识别率的同时降低硬件要求,成本低且通用性强。
附图说明
图1是本发明第一实施例的优化语音命令的方法的流程示意图;
图2是本发明一实施例的拾音器采集音频信号的线路示意图;
图3是本发明一实施例的终端的结构示意图;
图4是本发明第二实施例的优化语音命令的方法的流程示意图。
具体实施方式
本发明的主要目的是:通过解析获取音频信号的文件头信息,并根据文件头信息选取合适的音频处理算法,继而通过选取的音频处理算法对音频信号的带宽进行扩充,以及对扩充后的音频信号的频段进行频段补偿,这种纯算法的处理方式对硬件要求较低,因此能够在确保语音命令识别率的同时降低硬件要求,成本低且通用性强。
本发明所适用的终端可以为电子消费装置、智能手机、便携式通信装置、PDA(Personal Digital Assistant,个人数字助理或平板电脑)、笔记本电脑等移动终端,也可以是佩戴于肢体或者嵌入于衣物、首饰、配件中的可穿戴设备,还可以是其他具有音频处理功能的电子设备。
下面将结合本发明实施例中的附图,对本发明所提供的各个示例性的实施例的技术方案进行清楚、完整地描述。在不冲突的情况下,下述各个实施例及其技术特征可以相互组合。
图1是本发明第一实施例的优化语音命令的方法的流程示意图。请参阅图1,本实施例的优化语音命令方法可以包括步骤S11~S14。
S11:终端接收或者从当前环境中采集音频信号。
在本实施例中,终端可以通过两种方式获取音频信号:
一是,终端从网络及云端下载,或者从与终端建立连接关系的其他设备接收。例如,终端可以通过自身的蓝牙、Wi-Fi以及网络等模块接入网络及云端,或者与其他设备建立连接关系,并由此获取音频信号。此时,终端获取的该音频信号为数字音频信号。
二是,终端通过麦克风等拾音器从当前环境中采集音频信号。在本实施例中,该拾音器可以为模拟麦克风,拾音器采集到的音频信号是模拟音频信号,其输出的也是模拟音频信号,为了便于后续对音频信号进行各种数字处理,终端可以将拾音器与模数转换器(Analog-to-Digital Converter,ADC)连接,模拟音频信号通过模数转换器的模数转换后变为数字音频信号,并继续传输给终端的后续电路以进行各种数字处理。当然,本实施例的拾音器还可以为数字麦克风,数字麦克风的最大优点是抗干扰能力强,无需像传统传声器那样内置高频滤波电容以及滤波器电路,并且,由于数字麦克风输出的是数字音频信号,因此终端可以直接将拾音器与后续电路连接并进行各种数字处理。
应理解,本实施例的拾音器包括但不限于上述。例如,终端还可以通过振动电机并基于反电动势原理从当前环境中采集音频信号,具体地:基于法拉第电磁感应定律,振动电机中的AC(Alternating Current,交流电)信号在线圈上产生变化的磁场,产生电磁感应电动势,与此同时,人说话产生的音频信号使空气压力发生变化,通过振动周围空气而引起振动电机的膜片振动,基于伦兹定律,当音频信号引起的振动和电磁感应引起的振动撞击在同一膜片时,膜片受到的外力方向相反,振动电机会产生与电磁感应电动势相反的电动势,即反电动势。通过监测反电动势产生的电流,并经过电声转换即可得到数字音频信号。相比较于麦克风,振动电机的膜片有效区域(适合声音撞击的区域)更大,能够捕捉到更广频段的音频信号,更加有利于提高语音命令识别率。
在本实施例中,位于当前环境中的目标声源(例如人类)可以播放20Hz-20kHz的正弦波信号,终端的拾音器可以沿网状路线移动并采集当前环境中的音频模拟信号。具体地,如图2所示,在目标声源的出声方向上,拾音器可以沿逐行或者逐列移动,并采集音频信号。
S12:终端解析音频信号并获取所述音频信号的文件头信息。
被解析的音频信号为数字音频信号,获取的文件头信息包括但不限于采样率、比特率、带宽以及数据字节位数中的至少一种。
S13:终端根据文件头信息选取音频处理算法。
终端选取得到的是与文件头信息所包含的各种数据最匹配的音频处理算法,该音频处理算法处理音频信号的效率和质量最佳,例如带宽扩充及频段补偿的效率和质量最佳。基于此,本实施例并不限制音频处理算法的类型及其进行带宽扩充和频段补偿的原理和过程。
S14:终端通过选取的音频处理算法对音频信号的带宽进行扩充,并对扩充后的音频信号的频段进行频段补偿。
在一种应用场景中,音频处理算法可以将音频信号(人声)在20Hz-20kHz的频段内进行频点修改以改变其音频曲线。例如,音频处理算法首先将采集到的音频信号从8kHz带宽扩充为16kHz,弥补损失的那部分人声,然后对其中低采样率的频段进行频段补偿,即对扩充后的音频信号进行修复,使得弥补的那部分人声更加符合实际人声特点。
由上述可知,本实施例实质上是通过纯算法处理音频信号,对硬件的依赖程度较低,相比较于现有技术采用性能高的语音采集器件,本实施例能够在确保语音命令识别率的同时降低硬件要求,成本低,而且无需为了实现兼容对整个硬件***进行重新设计,通用性强。
在前述基础上,终端可基于语音识别(Automatic Speech Recognition,ASR)技术将算法处理后的音频信号转换为字符指令。语音识别技术即是将语音信号转换为文字等字符的技术,其主要依赖于声学模型、发音字库和语言类型库。其中,声学模型是经过训练有素的统计模型,其通过识别算法处理后的音频信号的音素而得到对应的音素序列,然后本发明将这些音素在发音字库中进行比对,列出候选字以及这些候选字可能的发音,基于匹配的音素序列,从这些候选字中选出最有可能的文字,再结合语言模型所包括的语法为参照,得出字符指令。
当然,终端也可以将算法处理后的音频信号上传至云端。
应该理解到,上述功能如果以软件功能的形式实现并作为独立产品销售或使用时,可存储在一个电子设备可读取存储介质中,即,本发明还提供一种存储有程序数据的存储装置,所述程序数据能够被执行以实现上述实施例的方法,该存储装置可以为如U盘、光盘、服务器等。也就是说,上述实施例可以以软件产品的形式体现出来,其包括若干指令用以使得一台终端执行所述方法的全部或部分步骤。
在实际应用场景中,鉴于终端的结构设计不同,执行上述各个步骤的结构器件也不相同。下面以图3所示的终端30为例进行描述。
请参阅图3,终端30可以包括拾音器31、音频解码器32、DSP(Digital SignalProcessing,数字信号处理器)33、处理器34、存储器35以及无线通信器36,拾音器31与DSP33连接,DSP 33、存储器35以及无线通信器36与处理器34连接。当然,终端30还可以包括电源管理单元,该电源管理单元与拾音器31、音频解码器32、DSP 33、处理器34以及无线通信器36连接,并用于管理对各个结构元件的供电。
处理器34用于运行终端30的操作***,并对各个结构元件进行任务管理,例如结构元件的上电、硬件初始化之后、以及在适当时间启动播放线程、解码线程、创造音轨、混音等操作。
音频解码器32用于提供至少一个接口以支持输入/输出设备的接入,并保证所接入的输入/输出设备的正常工作,例如音频解码器32的接口包括喇叭功放、数字/模拟麦克风的接口。拾音器31作为一个输入/输出设备,用于从当前环境中采集音频信号。该拾音器31可以为模拟麦克风,此时音频信号是模拟音频信号,音频解码器32内置有模数转换器(Analog-to-Digital Converter,ADC),模拟音频信号通过模数转换器的模数转换后变为数字音频信号,并继续传输给DSP 33。当然,该拾音器31还可以为数字麦克风,其直接输出数字音频信号。
DSP 33对模拟音频信号进行模数转换后会将数字音频信号发送给处理器34,处理器34用于解析所述数字音频信号并获取其文件头信息,以及根据所述文件头信息从存储器35中选取合适的音频处理算法。其中,文件头信息包括但不限于采样率、比特率、带宽以及数据字节位数中的至少一种。处理器34将选取的音频处理算法的消息通过I2C(Inter-Integrated Circuit,两线式串行总线)烧录入DSP 33中。
DSP 33通过音频处理算法对音频信号的带宽进行扩充,并对扩充后的音频信号的频段进行频段补偿。该DSP 33具有内存缓冲池,用来避免在音频处理算法处理音频信号的过程中出现资源抢占的问题。此音频处理算法的主要作用是将采集到的音频信号从8kHz带宽扩充为16kHz,弥补损失的那部分人声,然后对其中低采样率的频段进行频段补偿,即对扩充后的音频信号进行修复,使得弥补的那部分人声更加符合实际人声特点。在本实施例中,鉴于该DSP 33处理后的音频信号为PCM(脉冲编码调制,Pulse Code Modulation)格式数据,因此处理器34无需对算法处理后的音频信号进行编码处理。
存储器35用于保存各种类型的音频处理算法以及音频信号,以及作为缓存将各步骤处理完成的数据进行临时存放,以便于处理器34的调用。例如,处理器34可调用处理完成后的音频信号,并将其转换为字符指令,继而通过无线通信器36上传至云端,或者处理器34调用处理完成后的音频信号并将其直接上传至云端。
无线通信器36用于发送和接收从本地传送至云端的数据,或者接收由于本地发送的命令而从云端反馈回来的音频数据。例如,该无线通信器36可以自身的蓝牙、Wi-Fi以及网络等模块接入网络及云端下载,或者与其他设备建立连接关系,并由此获取音频信号,此时获取的音频信号为数字音频信号。为了保证数据的完整以及高效率的本地处理,无线通信器36先将接收的数据缓存至存储器35中。
请参阅图4,为终端30执行优化语音命令的方法一具体应用例。该实施例用以实现本发明前述实施例的整个过程,在此不作赘述。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,例如各实施例之间技术特征的相互结合,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种终端优化语音命令的方法,其特征在于,所述方法包括:
终端接收或者从当前环境中采集音频信号;
所述终端解析所述音频信号并获取所述音频信号的文件头信息;
所述终端根据所述文件头信息选取音频处理算法;
所述终端通过选取的音频处理算法对所述音频信号的带宽进行扩充,并对扩充后的音频信号的频段进行频段补偿。
2.根据权利要求1所述的方法,其特征在于,所述文件头信息包括采样率、比特率、带宽、以及数据字节位数中的至少一种。
3.根据权利要求1所述的方法,其特征在于,所述对扩充后的音频信号的频段进行频段补偿之后,所述方法还包括:
所述终端将经过频段补偿后的音频信号上传至云端,或者基于语音识别技术将经过频段补偿后的音频信号转换为字符指令。
4.根据权利要求1所述的方法,其特征在于,所述终端通过拾音器采集音频信号,所述拾音器包括模拟麦克风和数字麦克风中的一个,所述模拟麦克风从当前环境中采集模拟音频信号,所述终端对所述模拟音频信号进行模数转换并得到所述音频信号。
5.根据权利要求1所述的方法,其特征在于,所述终端通过选取的音频处理算法将所述音频信号的带宽从8kHz扩充为16kHz。
6.一种具有音频处理功能的终端,其特征在于,所述终端包括处理器,与所述处理器连接的数字信号处理器DSP、无线通信器和存储器,以及与所述DSP连接的拾音器,其中,
所述无线通信器和所述拾音器分别用于接收或者从当前环境中采集音频信号;
所述处理器用于解析所述音频信号并获取其文件头信息,以及根据所述文件头信息从所述存储器中选取音频处理算法;
所述DSP用于通过选取的音频处理算法对所述音频信号的带宽进行扩充,并对扩充后的音频信号的频段进行频段补偿。
7.根据权利要求6所述的终端,其特征在于,所述文件头信息包括采样率、比特率、带宽、以及数据字节位数中的至少一种。
8.根据权利要求6所述的终端,其特征在于,所述处理器还用于将经过频段补偿后的音频信号上传至云端,或者基于语音识别技术将经过频段补偿后的音频信号转换为字符指令。
9.根据权利要求6所述的终端,其特征在于,所述拾音器包括模拟麦克风和数字麦克风中的一个,所述模拟麦克风用于从当前环境中采集模拟音频信号,所述终端还包括模数转换器,所述模数转换器用于对所述模拟音频信号进行模数转换并得到所述音频信号。
10.一种存储装置,其特征在于,所述存储装置存储有程序数据,所述程序数据能够被执行以实现权利要求1-5任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711038813.XA CN107886966A (zh) | 2017-10-30 | 2017-10-30 | 终端及其优化语音命令的方法、存储装置 |
PCT/CN2018/112804 WO2019085914A1 (zh) | 2017-10-30 | 2018-10-30 | 终端及其优化语音命令的方法、存储装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711038813.XA CN107886966A (zh) | 2017-10-30 | 2017-10-30 | 终端及其优化语音命令的方法、存储装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107886966A true CN107886966A (zh) | 2018-04-06 |
Family
ID=61782987
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711038813.XA Pending CN107886966A (zh) | 2017-10-30 | 2017-10-30 | 终端及其优化语音命令的方法、存储装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN107886966A (zh) |
WO (1) | WO2019085914A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019085914A1 (zh) * | 2017-10-30 | 2019-05-09 | 捷开通讯(深圳)有限公司 | 终端及其优化语音命令的方法、存储装置 |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1736127A (zh) * | 2003-01-09 | 2006-02-15 | 诺基亚公司 | 音频信号处理 |
CN1849647A (zh) * | 2003-09-30 | 2006-10-18 | 松下电器产业株式会社 | 采样速率转换装置、编码装置、解码装置及它们的方法 |
US20080300866A1 (en) * | 2006-05-31 | 2008-12-04 | Motorola, Inc. | Method and system for creation and use of a wideband vocoder database for bandwidth extension of voice |
CN101751925A (zh) * | 2008-12-10 | 2010-06-23 | 华为技术有限公司 | 一种语音解码方法及装置 |
CN101763859A (zh) * | 2009-12-16 | 2010-06-30 | 深圳华为通信技术有限公司 | 音频数据处理方法、装置和多点控制单元 |
CN102610231A (zh) * | 2011-01-24 | 2012-07-25 | 华为技术有限公司 | 一种带宽扩展方法及装置 |
US20130151255A1 (en) * | 2011-12-07 | 2013-06-13 | Gwangju Institute Of Science And Technology | Method and device for extending bandwidth of speech signal |
CN103262409A (zh) * | 2010-09-10 | 2013-08-21 | Dts(英属维尔京群岛)有限公司 | 用于改进的感觉的频谱不平衡的音频信号的动态补偿 |
CN103413557A (zh) * | 2013-07-08 | 2013-11-27 | 深圳Tcl新技术有限公司 | 语音信号带宽扩展的方法和装置 |
CN103915104A (zh) * | 2012-12-31 | 2014-07-09 | 华为技术有限公司 | 信号带宽扩展方法和用户设备 |
CN105118514A (zh) * | 2015-08-17 | 2015-12-02 | 惠州Tcl移动通信有限公司 | 一种播放无损音质声音的方法及耳机 |
CN105188075A (zh) * | 2014-06-17 | 2015-12-23 | ***通信集团公司 | 语音质量优化方法及装置、终端 |
CN105324814A (zh) * | 2013-06-25 | 2016-02-10 | 奥林奇公司 | 音频信号解码器中的改进的频带扩展 |
JP2016038409A (ja) * | 2014-08-05 | 2016-03-22 | 沖電気工業株式会社 | 音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム |
CN105637583A (zh) * | 2013-09-10 | 2016-06-01 | 华为技术有限公司 | 自适应带宽扩展方法及其装置 |
CN107087069A (zh) * | 2017-04-19 | 2017-08-22 | 维沃移动通信有限公司 | 一种语音通话方法及移动终端 |
CN107221334A (zh) * | 2016-11-01 | 2017-09-29 | 武汉大学深圳研究院 | 一种音频带宽扩展的方法及扩展装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070109977A1 (en) * | 2005-11-14 | 2007-05-17 | Udar Mittal | Method and apparatus for improving listener differentiation of talkers during a conference call |
CO6440537A2 (es) * | 2009-04-09 | 2012-05-15 | Fraunhofer Ges Forschung | Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio |
CN103971694B (zh) * | 2013-01-29 | 2016-12-28 | 华为技术有限公司 | 带宽扩展频带信号的预测方法、解码设备 |
US9319510B2 (en) * | 2013-02-15 | 2016-04-19 | Qualcomm Incorporated | Personalized bandwidth extension |
CN105847497A (zh) * | 2016-03-28 | 2016-08-10 | 乐视控股(北京)有限公司 | 一种语音信号处理方法及装置 |
CN106960672B (zh) * | 2017-03-30 | 2020-08-21 | 国家计算机网络与信息安全管理中心 | 一种立体声音频的带宽扩展方法与装置 |
CN107886966A (zh) * | 2017-10-30 | 2018-04-06 | 捷开通讯(深圳)有限公司 | 终端及其优化语音命令的方法、存储装置 |
-
2017
- 2017-10-30 CN CN201711038813.XA patent/CN107886966A/zh active Pending
-
2018
- 2018-10-30 WO PCT/CN2018/112804 patent/WO2019085914A1/zh active Application Filing
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1736127A (zh) * | 2003-01-09 | 2006-02-15 | 诺基亚公司 | 音频信号处理 |
CN1849647A (zh) * | 2003-09-30 | 2006-10-18 | 松下电器产业株式会社 | 采样速率转换装置、编码装置、解码装置及它们的方法 |
US20080300866A1 (en) * | 2006-05-31 | 2008-12-04 | Motorola, Inc. | Method and system for creation and use of a wideband vocoder database for bandwidth extension of voice |
CN101751925A (zh) * | 2008-12-10 | 2010-06-23 | 华为技术有限公司 | 一种语音解码方法及装置 |
CN101763859A (zh) * | 2009-12-16 | 2010-06-30 | 深圳华为通信技术有限公司 | 音频数据处理方法、装置和多点控制单元 |
CN103262409A (zh) * | 2010-09-10 | 2013-08-21 | Dts(英属维尔京群岛)有限公司 | 用于改进的感觉的频谱不平衡的音频信号的动态补偿 |
EP2660812A1 (en) * | 2011-01-24 | 2013-11-06 | Huawei Technologies Co., Ltd. | Bandwidth expansion method and apparatus |
CN102610231A (zh) * | 2011-01-24 | 2012-07-25 | 华为技术有限公司 | 一种带宽扩展方法及装置 |
US20130151255A1 (en) * | 2011-12-07 | 2013-06-13 | Gwangju Institute Of Science And Technology | Method and device for extending bandwidth of speech signal |
CN103915104A (zh) * | 2012-12-31 | 2014-07-09 | 华为技术有限公司 | 信号带宽扩展方法和用户设备 |
CN105324814A (zh) * | 2013-06-25 | 2016-02-10 | 奥林奇公司 | 音频信号解码器中的改进的频带扩展 |
CN103413557A (zh) * | 2013-07-08 | 2013-11-27 | 深圳Tcl新技术有限公司 | 语音信号带宽扩展的方法和装置 |
CN105637583A (zh) * | 2013-09-10 | 2016-06-01 | 华为技术有限公司 | 自适应带宽扩展方法及其装置 |
CN105188075A (zh) * | 2014-06-17 | 2015-12-23 | ***通信集团公司 | 语音质量优化方法及装置、终端 |
JP2016038409A (ja) * | 2014-08-05 | 2016-03-22 | 沖電気工業株式会社 | 音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム |
CN105118514A (zh) * | 2015-08-17 | 2015-12-02 | 惠州Tcl移动通信有限公司 | 一种播放无损音质声音的方法及耳机 |
CN107221334A (zh) * | 2016-11-01 | 2017-09-29 | 武汉大学深圳研究院 | 一种音频带宽扩展的方法及扩展装置 |
CN107087069A (zh) * | 2017-04-19 | 2017-08-22 | 维沃移动通信有限公司 | 一种语音通话方法及移动终端 |
Non-Patent Citations (4)
Title |
---|
中国铁路总公司: "《高速铁路通信技术——业务网》", 30 April 2016, 中国铁道出版社 * |
何勇军 等: "语音识别中带宽失配的补偿研究", 《计算机学报》 * |
张勇 等: "窄带语音带宽扩展算法研究", 《声学学报》 * |
李念芦 等: "《影视技术基础》", 28 February 2016, 北京联合出版公司 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019085914A1 (zh) * | 2017-10-30 | 2019-05-09 | 捷开通讯(深圳)有限公司 | 终端及其优化语音命令的方法、存储装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2019085914A1 (zh) | 2019-05-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN208507180U (zh) | 一种便携式智能语音交互控制设备 | |
US9542938B2 (en) | Scene recognition method, device and mobile terminal based on ambient sound | |
US20190355354A1 (en) | Method, apparatus and system for speech interaction | |
CN108549206A (zh) | 一种带具有语音交互功能耳机的智能手表 | |
CN109087660A (zh) | 用于回声消除的方法、装置、设备以及计算机可读存储介质 | |
CN104883437A (zh) | 基于环境的语音分析调整提示音量的方法及*** | |
CN104092801A (zh) | 智能终端通话降噪方法及智能终端 | |
CN108922528A (zh) | 用于处理语音的方法和装置 | |
CN111276135B (zh) | 网络语音识别方法、网络业务交互方法及智能耳机 | |
CN109712623A (zh) | 语音控制方法、装置及计算机可读存储介质 | |
CN109545216A (zh) | 一种语音识别方法和语音识别*** | |
CN107680594A (zh) | 一种分布式智能语音采集识别***及其采集识别方法 | |
CN207010925U (zh) | 一种自带语音唤醒识别的耳机装置 | |
CN111276150A (zh) | 一种基于麦克风阵列的智能语音转文字及同声翻译*** | |
CN107886966A (zh) | 终端及其优化语音命令的方法、存储装置 | |
CN110600045A (zh) | 声音转换方法及相关产品 | |
CN107357174A (zh) | 一种分布式智能音箱语音控制*** | |
CN207181990U (zh) | 一种分布式智能音箱语音控制*** | |
CN110971968A (zh) | 一种智能机顶盒*** | |
CN104348436B (zh) | 一种参数调整方法及电子设备 | |
CN104933642A (zh) | 一种基于单片机的导游机服务*** | |
CN208691520U (zh) | Wifi音箱 | |
CN107544769B (zh) | 基于振动电机采集语音命令的方法及音频组件、音频终端 | |
CN107450499A (zh) | 一种智能家居控制*** | |
WO2020102979A1 (zh) | 语音信息的处理方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180406 |