CN108172242A - 一种改进的蓝牙智能云音箱语音交互端点检测方法 - Google Patents

一种改进的蓝牙智能云音箱语音交互端点检测方法 Download PDF

Info

Publication number
CN108172242A
CN108172242A CN201810014999.3A CN201810014999A CN108172242A CN 108172242 A CN108172242 A CN 108172242A CN 201810014999 A CN201810014999 A CN 201810014999A CN 108172242 A CN108172242 A CN 108172242A
Authority
CN
China
Prior art keywords
processing software
software app
data analyzing
smart machine
tooth intelligence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810014999.3A
Other languages
English (en)
Other versions
CN108172242B (zh
Inventor
鲁霖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Xinzhongxin Technology Co Ltd
Original Assignee
Shenzhen Xinzhongxin Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Xinzhongxin Technology Co Ltd filed Critical Shenzhen Xinzhongxin Technology Co Ltd
Priority to CN201810014999.3A priority Critical patent/CN108172242B/zh
Publication of CN108172242A publication Critical patent/CN108172242A/zh
Application granted granted Critical
Publication of CN108172242B publication Critical patent/CN108172242B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B5/00Near-field transmission systems, e.g. inductive or capacitive transmission systems
    • H04B5/70Near-field transmission systems, e.g. inductive or capacitive transmission systems specially adapted for specific purposes
    • H04B5/72Near-field transmission systems, e.g. inductive or capacitive transmission systems specially adapted for specific purposes for local intradevice communication
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • G10L2025/786Adaptive threshold

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明涉及一种改进的蓝牙智能云音箱语音交互端点检测方法,包括智能云音箱、智能设备、数据分析处理软件APP和蓝牙模块。其中智能设备为手机、平板电脑等;其中智能设备包括蓝牙模块和数据分析处理软件APP;其中智能云音箱包括云端服务器;数据分析处理软件APP是安装在智能设备上的;蓝牙模块与蓝牙智能云音箱建立音频道的连接;智能设备的数据分析处理软件APP通过蓝牙模块与蓝牙智能云音箱建立控制指令的连接,实现数据分析处理软件APP与蓝牙智能云音箱的控制数据交互;本发明的有益效果是:解决现有相关技术中的因环境差异导致识别率差、端点误判等问题,提高了人机语音交互效率和体验。提高了效率,改善了用户体验。

Description

一种改进的蓝牙智能云音箱语音交互端点检测方法
技术领域
本发明涉及蓝牙低能耗技术应用领域,特别涉及一种改进的蓝牙智能云音箱语音交互端点检测方法。
背景技术
在人机交互领域中,语音活动检测(Voice Activity Detection,VAD)是一项非常关键的工作,其算法的优劣在某种程度上也直接决定了整个语音交互***的成败,作为一个完整的语音交互***, 其最终实现及使用的效果不仅仅取决于识别的算法, 许多相关因素都直接影响着应用***的成功与否,端点检测的目的就是在复杂的应用环境下的信号流中分辨出语音信号和非语音信号, 并确定语音信号的开始及结束,好的端点检测方法能改变语音识别软件存在的检测效果不理想、识别率低等问题,端点检测的高精度能确保输入的信号是有效完整的语音信号, 使识别效果更准确快速。
传统的端点检测方法是使用短时能量和过零率的双门限检测,首先在音频的短时能量上进行第一次判别,这个会选取一个高门限进行一次粗判决;然后使用平均过零率上进行第二次判别。虽然使用双门限端点检测计算量小,且在安静的环境啃较好的识别率,但是它也有很多不足,例如,门限值需要由经验来设置,是一个固定的参数;在时时语音交互中,涉及上下文停顿的场景也容易误判,导致人机交互效果不理想。
因此,在日常生活中,涉及人机交领域,如何准确检测出音频信号的端点位置是技术人员亟待需要解决的问题。
发明内容
本发明所要解决的技术问题是:提供一种改进的蓝牙智能云音箱语音交互端点检测方法,克服现有相关技术中的因环境差异导致识别率差、端点误判等问题,提高了人机语音交互效率和体验。
为解决上述技术问题,本发明提供一种改进的蓝牙智能云音箱语音交互端点检测方法,包括智能云音箱、智能设备、数据分析处理软件APP和蓝牙模块。其中智能设备为手机、平板电脑等;其中智能设备包括蓝牙模块和数据分析处理软件APP;其中智能云音箱包括云端服务器;
所述数据分析处理软件APP是安装在智能设备上的;
所述蓝牙模块与蓝牙智能云音箱建立音频道的连接;
进一步优化,智能设备的数据分析处理软件APP通过蓝牙模块与蓝牙智能云音箱建立控制指令的连接,实现数据分析处理软件APP与蓝牙智能云音箱的控制数据交互;
进一步优化,正常数据分析处理软件APP处于待机状态,当智能设备端唤醒语音交互时,数据分析处理软件APP启动蓝牙模块连接,并开始录音,采集音频信号,同时与蓝牙智能云音箱的云端服务器建立数据传输通道。
进一步优化,数据分析处理软件APP设置一个静音保护时间,所述保护时间长由数据分析处理软件APP与云服务器一起协定;当唤醒语音交互时,即使不说话,也会有3秒的静音采集时间,避免在唤醒语音交互时,用户来不及说话,整个***就判停;另外,蓝牙模块的面向连接方式SCO在极短时间内太频繁操作,会引起***级的异常,所述的静音保护时间控制蓝牙模块的面向连接方式SCO在极短时间内太频繁操作。
进一步优化,智能设备的数据分析处理软件APP时时提取每一帧音频信号;数据分析处理软件APP将每一帧的音频信号的持续时间设置为10ms。
进一步优化,智能手机的数据分析处理软件APP计算每帧音频信号的短时能量,短时能量信号的计算公式为:
进一步优化,智能设备的数据分析处理软件APP动态判断每帧音频信号是否为语音帧;其中短时能量直接反应语音信号能量及幅度大小,根据短时能量对有声段和无声段进行判断,数据分析处理软件APP动态寻找每个帧与之前的音频帧中的最大能量值,后面的音频帧只要小于最大能量帧*门限值(M),当前短时能量小时,就动态调小门限值,当音量衰减的幅值太大,就定义为非语音帧,启动非语音计数,非语音帧连续计数达200,相当于停顿2秒,则表示讲话结束,若中间有语音帧数据,则计数器复位,重新计数。
自适应门限值的公式为:
进一步优化,智能设备的数据分析处理软件APP进行有效端点判断;
进一步优化,智能设备的数据分析处理软件APP向云端服务器发送采集结束,启动语音识别;数据分析处理软件APP根据结束语音采集的结果后,停止录音,并向云端服务器发送采集完成指令,开始语音识别,通过蓝牙智能云音箱中大量语音交互测试中,准确地判断出语音的端点。
进一步优化,一种改进的蓝牙智能云音箱语音交互端点检测方法的工作步骤:
a、智能设备的数据分析处理软件APP与蓝牙智能云音箱建立连接;
b、智能设备端唤醒语音交互;
c、智能设备的数据分析处理软件APP启动静音保护时间计数器;
d、智能设备的数据分析处理软件APP时时提取每一帧音频信号;
e、智能设备的数据分析处理软件APP计算每帧音频信号的短时能量;
f、智能设备的数据分析处理软件APP动态判断每帧音频信号是否为语音帧;
h、智能设备的数据分析处理软件APP进行有效端点判断;
i、智能设备的数据分析处理软件APP向云端服务器发送采集结束,启动语音识别。
采用了上述技术方案后,本发明的有益效果是:
相对于现有的技术方案,提供一种改进的蓝牙智能云音箱语音交互端点检测方法,解决现有相关技术中的因环境差异导致识别率差、端点误判等问题,提高了人机语音交互效率和体验。提高了效率,改善了用户体验。
附图说明
图1是一种改进的蓝牙智能云音箱语音交互端点检测方法工作模块图
图2是一种改进的蓝牙智能云音箱语音交互端点检测方法工作流程图
具体实施方式
下面结合附图1至附图2和具体实施例对本发明进行详细描述,但不作为对本发明的限定。
如附图1至附图2所示,一种改进的蓝牙智能云音箱语音交互端点检测方法,包括智能云音箱、智能设备、数据分析处理软件APP和蓝牙模块。其中智能设备为手机、平板电脑等;其中智能设备包括蓝牙模块和数据分析处理软件APP;其中智能云音箱包括云端服务器;数据分析处理软件APP是安装在智能设备上的;蓝牙模块与蓝牙智能云音箱建立音频道的连接; 智能设备的数据分析处理软件APP通过蓝牙模块与蓝牙智能云音箱建立控制指令的连接,实现数据分析处理软件APP与蓝牙智能云音箱的控制数据交互;正常数据分析处理软件APP处于待机状态,当智能设备端唤醒语音交互时,数据分析处理软件APP启动蓝牙模块连接,并开始录音,采集音频信号,同时与蓝牙智能云音箱的云端服务器建立数据传输通道。数据分析处理软件APP设置一个静音保护时间,所述保护时间长由数据分析处理软件APP与云服务器一起协定;当唤醒语音交互时,即使不说话,也会有3秒的静音采集时间,避免在唤醒语音交互时,用户来不及说话,整个***就判停;另外,蓝牙模块的面向连接方式SCO在极短时间内太频繁操作,会引起***级的异常,所述的静音保护时间控制蓝牙模块的面向连接方式SCO在极短时间内太频繁操作。智能设备的数据分析处理软件APP时时提取每一帧音频信号;数据分析处理软件APP将每一帧的音频信号的持续时间设置为10ms。智能手机的数据分析处理软件APP计算每帧音频信号的短时能量,短时能量信号的计算公式为: ;智能设备的数据分析处理软件APP动态判断每帧音频信号是否为语音帧;其中短时能量直接反应语音信号能量及幅度大小,根据短时能量对有声段和无声段进行判断,数据分析处理软件APP动态寻找每个帧与之前的音频帧中的最大能量值,后面的音频帧只要小于最大能量帧*门限值(M),当前短时能量小时,就动态调小门限值,当音量衰减的幅值太大,就定义为非语音帧,启动非语音计数,非语音帧连续计数达200,相当于停顿2秒,则表示讲话结束,若中间有语音帧数据,则计数器复位,重新计数。
自适应门限值的公式为:
智能设备的数据分析处理软件APP进行有效端点判断;智能设备的数据分析处理软件APP向云端服务器发送采集结束,启动语音识别;数据分析处理软件APP根据结束语音采集的结果后,停止录音,并向云端服务器发送采集完成指令,开始语音识别,通过蓝牙智能云音箱中大量语音交互测试中,准确地判断出语音的端点。
一种改进的蓝牙智能云音箱语音交互端点检测方法的工作步骤:
a、智能设备的数据分析处理软件APP与蓝牙智能云音箱建立连接;
b、智能设备端唤醒语音交互;
c、智能设备的数据分析处理软件APP启动静音保护时间计数器;
d、智能设备的数据分析处理软件APP时时提取每一帧音频信号;
e、智能设备的数据分析处理软件APP计算每帧音频信号的短时能量;
f、智能设备的数据分析处理软件APP动态判断每帧音频信号是否为语音帧;
h、智能设备的数据分析处理软件APP进行有效端点判断;
i、智能设备的数据分析处理软件APP向云端服务器发送采集结束,启动语音识别。
在本发明实施例中:
S101 智能设备的数据分析处理软件APP与蓝牙智能云音箱设备建立连接;
首先,通过手机***中的蓝牙模块与蓝牙智能云音箱建立音频道的连接;然后再通过智能设备的数据分析处理软件APP与蓝牙智能云音箱建立控制指令的连接,为了保证有良好的兼容性,Android版本与设备建立SPP通道连接,而IOS版则建立的是BLE通道连接,可实现APP与蓝牙智能云音箱设备的控制数据交互。
S102智能设备端唤醒语音交互;
正常数据分析处理软件APP处理待机状态,只有当设备端唤醒语音交互时,启动蓝牙SCO连接,并开始录音,采集音频信号,同时与云端服务器建立数据传输通道。
S103智能设备的数据分析处理软件APP启动静音保护时间计数器;
智能设备的数据分析处理软件APP启动静音保护时间计数器,为了用户有更好的体验,及***的稳定性,设置一个静音保护时间,当唤醒语音交互时,即使不说话,具体时长与云服务器一起协定,也会有3秒的静音采集时间,避免唤醒语音交互时,用户来不及说话,整个***就判停;另一方面,蓝牙的SCO极短时间内太频繁操作,会引起***级的异常。
S104智能设备的数据分析处理软件APP时时提取每一帧音频信号;
音频信号是一个非稳态、时变的信号,为了取得更准确的计算结果,我们认为其在“短时间”范围内是稳态、时不变的,这个时间, 一般数据分析处理软件APP将每一帧的音频信号的持续时间设置为10ms。
S105智能设备的数据分析处理软件APP计算每帧音频信号的短时能量;
短时能量信号的计算公式为:
其中, 为第i帧中第m个采样点的能量值。
依短时能量计算公式,APP代码示例如下:
private long getRms(int end, int span) { int begin = end - span;if (begin< 0) { begin = 0; } if (begin % 2 != 0) {begin++; } long sum = 0; for (int i= begin; i < end; i += 2) { short curSample = getShort(this.mRecording[i],this.mRecording[i + 1]); sum += (long) (curSample * curSample); } return sum;}
S106 智能设备的数据分析处理软件APP动态判断每帧音频信号是否为语音帧;
短时能量可以直接反应出语音信号能量及幅度大小,进而可以对有声段和无声段进行判断,数据分析处理软件APP动态寻找每个帧与之前的音频帧中的最大能量值,后面的音频帧只要小于最大能量帧*门限值(M),当前短时能量小时,就动态调小门限值,当音量衰减的幅值太大,就定义为非语音帧,启动非语音计数,非语音帧连续计数达200,相当于停顿2秒,则表示讲话结束,若中间有语音帧数据,则计数器复位,重新计数。
自适应门限值:
APP示例代码如下:
private static final int RMS_COUNT_MAX = 200; // 2s
public boolean isPausing() {
long rms = getRms(this.mRecordedLength, this.mOneSec);
if (rms > this.highestRMS) {
this.highestRMS = rms;
this.rmsCount = 0;
return false;
} else if (((double) rms) < M * ((double) this.highestRMS)) {
if(this.rmsCount < RMS_COUNT_MAX){
this.rmsCount++;
return false;
}else{
this.rmsCount = 0;
return true;
}
} else {
this.rmsCount = 0;
return false;
}
}
S107 智能设备的数据分析处理软件APP进行有效端点判断;
人机交互中的语音端点判断是受多方面限制的,如3秒的静音保护时间,本地改进的短时能量检测语音端点,云端下发的停止采集指令。
APP示例代码如下:
while (recorder != null && recorder.getState() == AudioRecorder.State.RECORDING) {
boolean pausing = recorder.isPausing();
if (pausing && mRecordDurationReached) {
if (mBtDeviceSpeechType == BT_DEVICE_SPEECH_RECOGNITION) {
mBtDeviceSpeechType = BT_DEVICE_SPEECH_RECOGNITION_NONE;
stopBluetoothSCO();
}
stopListening(true);
break;
}
try {
Thread.sleep(10);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
S108智能设备的数据分析处理软件APP向云端发送采集结束,启动语音识别;
数据分析处理软件APP根据结束语音采集的结果后,停止录音,并向云端发送采集完成指令,可以开始语音识别,能过蓝牙智能云音箱中大量语音交互测试中,基本上可以准确地判断出语音的端点。大大的减少非语音帧的传输和处理,提高了效率,改善了用户体验。
由技术常识可知,本技术方案可以通过其它的不脱离其精神实质或必要特征的实施方案来实现。因此,上述公开的实施方案,就各方面而言,都只是举例说明,并不是仅有的。所有在本发明范围内或在等同于本发明的范围内的改变均被本发明包含。

Claims (9)

1.一种改进的蓝牙智能云音箱语音交互端点检测方法,包括智能云音箱、智能设备、数据分析处理软件APP和蓝牙模块;其特征在于:其中智能设备为手机、平板电脑等;其中智能设备包括蓝牙模块和数据分析处理软件APP;其中智能云音箱包括云端服务器;所述数据分析处理软件APP是安装在智能设备上的;所述蓝牙模块与蓝牙智能云音箱建立音频道的连接; 所述智能设备的数据分析处理软件APP通过蓝牙模块与蓝牙智能云音箱建立控制指令的连接,实现数据分析处理软件APP与蓝牙智能云音箱的控制数据交互。
2.根据权利要求1所述的一种改进的蓝牙智能云音箱语音交互端点检测方法,其特征在于:一种改进的蓝牙智能云音箱语音交互端点检测方法的工作步骤:
a、智能设备的数据分析处理软件APP与蓝牙智能云音箱建立连接;
b、智能设备端唤醒语音交互;
c、智能设备的数据分析处理软件APP启动静音保护时间计数器;
d、智能设备的数据分析处理软件APP时时提取每一帧音频信号;
e、智能设备的数据分析处理软件APP计算每帧音频信号的短时能量;
f、智能设备的数据分析处理软件APP动态判断每帧音频信号是否为语音帧;
h、智能设备的数据分析处理软件APP进行有效端点判断;
i、智能设备的数据分析处理软件APP向云端服务器发送采集结束,启动语音识别。
3.根据权利要求2所述的一种改进的蓝牙智能云音箱语音交互端点检测方法,其特征在于:正常数据分析处理软件APP处于待机状态,当智能设备端唤醒语音交互时,数据分析处理软件APP启动蓝牙模块连接,并开始录音,采集音频信号,同时与蓝牙智能云音箱的云端服务器建立数据传输通道。
4.根据权利要求2所述的一种改进的蓝牙智能云音箱语音交互端点检测方法,其特征在于:数据分析处理软件APP设置一个静音保护时间,所述保护时间长由数据分析处理软件APP与云服务器一起协定;当唤醒语音交互时,即使不说话,也会有3秒的静音采集时间,避免在唤醒语音交互时,用户来不及说话,整个***就判停;另外,蓝牙模块的面向连接方式SCO在极短时间内太频繁操作,会引起***级的异常,所述的静音保护时间控制蓝牙模块的面向连接方式SCO在极短时间内太频繁操作。
5.根据权利要求2所述的一种改进的蓝牙智能云音箱语音交互端点检测方法,其特征在于:智能设备的数据分析处理软件APP时时提取每一帧音频信号;数据分析处理软件APP将每一帧的音频信号的持续时间设置为10ms。
6.根据权利要求2所述的一种改进的蓝牙智能云音箱语音交互端点检测方法,其特征在于:智能手机的数据分析处理软件APP计算每帧音频信号的短时能量,短时能量信号的计算公式为:
7.根据权利要求2所述的一种改进的蓝牙智能云音箱语音交互端点检测方法,其特征在于:智能设备的数据分析处理软件APP动态判断每帧音频信号是否为语音帧;其中短时能量直接反应语音信号能量及幅度大小,根据短时能量对有声段和无声段进行判断,数据分析处理软件APP动态寻找每个帧与之前的音频帧中的最大能量值,后面的音频帧只要小于最大能量帧*门限值(M),当前短时能量小时,就动态调小门限值,当音量衰减的幅值太大,就定义为非语音帧,启动非语音计数,非语音帧连续计数达200,相当于停顿2秒,则表示讲话结束,若中间有语音帧数据,则计数器复位,重新计数,自适应门限值的公式为:
8.根据权利要求2所述的一种改进的蓝牙智能云音箱语音交互端点检测方法,其特征在于:智能设备的数据分析处理软件APP进行有效端点判断。
9.根据权利要求2所述的一种改进的蓝牙智能云音箱语音交互端点检测方法,其特征在于:智能设备的数据分析处理软件APP进行有效端点判断;智能设备的数据分析处理软件APP向云端服务器发送采集结束,启动语音识别;数据分析处理软件APP根据结束语音采集的结果后,停止录音,并向云端服务器发送采集完成指令,开始语音识别,通过蓝牙智能云音箱中大量语音交互测试中,准确地判断出语音的端点。
CN201810014999.3A 2018-01-08 2018-01-08 一种改进的蓝牙智能云音箱语音交互端点检测方法 Active CN108172242B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810014999.3A CN108172242B (zh) 2018-01-08 2018-01-08 一种改进的蓝牙智能云音箱语音交互端点检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810014999.3A CN108172242B (zh) 2018-01-08 2018-01-08 一种改进的蓝牙智能云音箱语音交互端点检测方法

Publications (2)

Publication Number Publication Date
CN108172242A true CN108172242A (zh) 2018-06-15
CN108172242B CN108172242B (zh) 2021-06-01

Family

ID=62517740

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810014999.3A Active CN108172242B (zh) 2018-01-08 2018-01-08 一种改进的蓝牙智能云音箱语音交互端点检测方法

Country Status (1)

Country Link
CN (1) CN108172242B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110097884A (zh) * 2019-06-11 2019-08-06 大众问问(北京)信息科技有限公司 一种语音交互方法和装置
CN110958348A (zh) * 2018-09-25 2020-04-03 阿里巴巴集团控股有限公司 语音处理方法、装置、用户设备及智能音箱
CN110971744A (zh) * 2018-09-28 2020-04-07 深圳市冠旭电子股份有限公司 一种蓝牙音箱语音播放控制的方法及装置
CN111083678A (zh) * 2018-10-22 2020-04-28 深圳市冠旭电子股份有限公司 蓝牙音箱的播放控制方法、***及智能设备
CN111554287A (zh) * 2020-04-27 2020-08-18 佛山市顺德区美的洗涤电器制造有限公司 语音处理方法及装置、家电设备和可读存储介质
CN111968680A (zh) * 2020-08-14 2020-11-20 北京小米松果电子有限公司 一种语音处理方法、装置及存储介质
CN112420079A (zh) * 2020-11-18 2021-02-26 青岛海尔科技有限公司 语音端点检测方法和装置、存储介质及电子设备
CN112449050A (zh) * 2019-08-29 2021-03-05 阿里巴巴集团控股有限公司 语音交互方法、语音交互设备、计算设备和存储介质
CN112863542A (zh) * 2021-01-29 2021-05-28 青岛海尔科技有限公司 语音检测方法和装置、存储介质及电子设备

Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0690436A2 (de) * 1994-06-28 1996-01-03 Alcatel SEL Aktiengesellschaft Start-/Endpunkt-Detektion zur Worterkennung
CN1264887A (zh) * 2000-03-31 2000-08-30 清华大学 基于语音识别专用芯片的非特定人语音识别、语音提示方法
CN2745116Y (zh) * 2004-11-12 2005-12-07 联想(北京)有限公司 一种具有无线连接功能的计算机输入输出外部设备
CN1773605A (zh) * 2004-11-12 2006-05-17 中国科学院声学研究所 一种应用于语音识别***的语音端点检测方法
CN101107824A (zh) * 2004-12-31 2008-01-16 英国电讯有限公司 针对无连接通信流量的面向连接的通信方案
US20080125044A1 (en) * 2006-11-28 2008-05-29 Samsung Electronics Co.; Ltd Audio output system and method for mobile phone
US20090282298A1 (en) * 2008-05-08 2009-11-12 Broadcom Corporation Bit error management methods for wireless audio communication channels
CN101984725A (zh) * 2010-11-17 2011-03-09 广州杰赛科技股份有限公司 一种无线接入装置及方法
CN101625857B (zh) * 2008-07-10 2012-05-09 新奥特(北京)视频技术有限公司 一种自适应的语音端点检测方法
CN202679358U (zh) * 2012-05-09 2013-01-16 深圳市芯中芯科技有限公司 一种立体声蓝牙音频模块
CN102891408A (zh) * 2012-10-12 2013-01-23 歌尔声学股份有限公司 蓝牙可控电源插座和蓝牙可控电源插座的实现方法
CN103065629A (zh) * 2012-11-20 2013-04-24 广东工业大学 一种仿人机器人的语音识别***
CN103369677A (zh) * 2012-04-02 2013-10-23 英特尔移动通信有限责任公司 无线电通信装置和用于操作无线电通信装置的方法
US20140163984A1 (en) * 2012-12-10 2014-06-12 Lenovo (Beijing) Co., Ltd. Method Of Voice Recognition And Electronic Apparatus
CN104184496A (zh) * 2013-05-24 2014-12-03 凌通科技股份有限公司 蓝牙数据/控制信息传输模块、互动式***及其方法
CN204517806U (zh) * 2015-01-09 2015-07-29 深圳市芯中芯科技有限公司 一种基于5.8GHz频段的音频发射及接收装置
CN105338645A (zh) * 2012-05-30 2016-02-17 英特尔移动通信有限责任公司 无线电通信装置
CN106653021A (zh) * 2016-12-27 2017-05-10 上海智臻智能网络科技股份有限公司 语音唤醒的控制方法、装置及终端
CN107277272A (zh) * 2017-07-25 2017-10-20 深圳市芯中芯科技有限公司 一种基于软件app的蓝牙设备语音交互方法及***

Patent Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0690436A2 (de) * 1994-06-28 1996-01-03 Alcatel SEL Aktiengesellschaft Start-/Endpunkt-Detektion zur Worterkennung
CN1264887A (zh) * 2000-03-31 2000-08-30 清华大学 基于语音识别专用芯片的非特定人语音识别、语音提示方法
CN2745116Y (zh) * 2004-11-12 2005-12-07 联想(北京)有限公司 一种具有无线连接功能的计算机输入输出外部设备
CN1773605A (zh) * 2004-11-12 2006-05-17 中国科学院声学研究所 一种应用于语音识别***的语音端点检测方法
CN101107824A (zh) * 2004-12-31 2008-01-16 英国电讯有限公司 针对无连接通信流量的面向连接的通信方案
US20080125044A1 (en) * 2006-11-28 2008-05-29 Samsung Electronics Co.; Ltd Audio output system and method for mobile phone
US20090282298A1 (en) * 2008-05-08 2009-11-12 Broadcom Corporation Bit error management methods for wireless audio communication channels
CN101625857B (zh) * 2008-07-10 2012-05-09 新奥特(北京)视频技术有限公司 一种自适应的语音端点检测方法
CN101984725A (zh) * 2010-11-17 2011-03-09 广州杰赛科技股份有限公司 一种无线接入装置及方法
CN103369677A (zh) * 2012-04-02 2013-10-23 英特尔移动通信有限责任公司 无线电通信装置和用于操作无线电通信装置的方法
CN202679358U (zh) * 2012-05-09 2013-01-16 深圳市芯中芯科技有限公司 一种立体声蓝牙音频模块
CN105338645A (zh) * 2012-05-30 2016-02-17 英特尔移动通信有限责任公司 无线电通信装置
CN102891408A (zh) * 2012-10-12 2013-01-23 歌尔声学股份有限公司 蓝牙可控电源插座和蓝牙可控电源插座的实现方法
CN103065629A (zh) * 2012-11-20 2013-04-24 广东工业大学 一种仿人机器人的语音识别***
US20140163984A1 (en) * 2012-12-10 2014-06-12 Lenovo (Beijing) Co., Ltd. Method Of Voice Recognition And Electronic Apparatus
CN104184496A (zh) * 2013-05-24 2014-12-03 凌通科技股份有限公司 蓝牙数据/控制信息传输模块、互动式***及其方法
CN204517806U (zh) * 2015-01-09 2015-07-29 深圳市芯中芯科技有限公司 一种基于5.8GHz频段的音频发射及接收装置
CN106653021A (zh) * 2016-12-27 2017-05-10 上海智臻智能网络科技股份有限公司 语音唤醒的控制方法、装置及终端
CN107277272A (zh) * 2017-07-25 2017-10-20 深圳市芯中芯科技有限公司 一种基于软件app的蓝牙设备语音交互方法及***

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110958348A (zh) * 2018-09-25 2020-04-03 阿里巴巴集团控股有限公司 语音处理方法、装置、用户设备及智能音箱
CN110971744A (zh) * 2018-09-28 2020-04-07 深圳市冠旭电子股份有限公司 一种蓝牙音箱语音播放控制的方法及装置
CN110971744B (zh) * 2018-09-28 2022-09-23 深圳市冠旭电子股份有限公司 一种蓝牙音箱语音播放控制的方法及装置
CN111083678A (zh) * 2018-10-22 2020-04-28 深圳市冠旭电子股份有限公司 蓝牙音箱的播放控制方法、***及智能设备
CN110097884A (zh) * 2019-06-11 2019-08-06 大众问问(北京)信息科技有限公司 一种语音交互方法和装置
CN110097884B (zh) * 2019-06-11 2022-05-17 大众问问(北京)信息科技有限公司 一种语音交互方法和装置
CN112449050A (zh) * 2019-08-29 2021-03-05 阿里巴巴集团控股有限公司 语音交互方法、语音交互设备、计算设备和存储介质
CN111554287A (zh) * 2020-04-27 2020-08-18 佛山市顺德区美的洗涤电器制造有限公司 语音处理方法及装置、家电设备和可读存储介质
CN111554287B (zh) * 2020-04-27 2023-09-05 佛山市顺德区美的洗涤电器制造有限公司 语音处理方法及装置、家电设备和可读存储介质
CN111968680A (zh) * 2020-08-14 2020-11-20 北京小米松果电子有限公司 一种语音处理方法、装置及存储介质
CN112420079A (zh) * 2020-11-18 2021-02-26 青岛海尔科技有限公司 语音端点检测方法和装置、存储介质及电子设备
CN112863542A (zh) * 2021-01-29 2021-05-28 青岛海尔科技有限公司 语音检测方法和装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN108172242B (zh) 2021-06-01

Similar Documents

Publication Publication Date Title
CN108172242A (zh) 一种改进的蓝牙智能云音箱语音交互端点检测方法
CN108573701B (zh) 基于唇部检测的查询端点化
Li et al. Robust endpoint detection and energy normalization for real-time speech and speaker recognition
US9299344B2 (en) Apparatus and method to classify sound to detect speech
US11830479B2 (en) Voice recognition method and apparatus, and air conditioner
Lu et al. Speakersense: Energy efficient unobtrusive speaker identification on mobile phones
US20190139547A1 (en) Interactive Method and Device
CN103745723A (zh) 一种音频信号识别方法及装置
CN108346425A (zh) 一种语音活动检测的方法和装置、语音识别的方法和装置
CN106686223A (zh) 聋哑人与正常人的辅助对话***、方法及智能手机
JP2015004928A (ja) 応答対象音声判定装置、応答対象音声判定方法および応答対象音声判定プログラム
CN104123939A (zh) 基于变电站巡检机器人的语音交互控制方法
CN110364178B (zh) 一种语音处理方法、装置、存储介质和电子设备
CN111798850B (zh) 用语音操作设备的方法和***及服务器
CN1708782A (zh) 用于操作语音识别***的方法
CN110097875A (zh) 基于麦克风信号的语音交互唤醒电子设备、方法和介质
CN107221324A (zh) 语音处理方法及装置
KR20110059248A (ko) 시스템과 다수 사용자 간의 대화 인터페이스 장치
CN114299953B (zh) 一种结合嘴部运动分析的话者角色区分方法与***
CN109994129A (zh) 语音处理***、方法和设备
CN109285544A (zh) 语音监测***
CN113129904B (zh) 声纹判定方法、装置、***、设备和存储介质
CN205451769U (zh) 头戴智能设备的语音识别***及头戴智能设备
WO2021146857A1 (zh) 音频处理方法及装置
CN103761064A (zh) 自动语音输入***及其方法

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant