CN108665894A - 一种家电设备的语音交互方法 - Google Patents
一种家电设备的语音交互方法 Download PDFInfo
- Publication number
- CN108665894A CN108665894A CN201810302825.7A CN201810302825A CN108665894A CN 108665894 A CN108665894 A CN 108665894A CN 201810302825 A CN201810302825 A CN 201810302825A CN 108665894 A CN108665894 A CN 108665894A
- Authority
- CN
- China
- Prior art keywords
- audio signal
- household appliance
- signal
- spectrum
- angle value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 14
- 230000005236 sound signal Effects 0.000 claims abstract description 71
- 238000001228 spectrum Methods 0.000 claims abstract description 42
- 238000004458 analytical method Methods 0.000 claims description 10
- 239000000284 extract Substances 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract description 6
- 238000004364 calculation method Methods 0.000 abstract description 4
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W76/00—Connection management
- H04W76/10—Connection setup
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Selective Calling Equipment (AREA)
Abstract
本发明一种家电设备的语音交互方法,所述家电设备上设有音频检测装置以及对语音信号处理的处理装置,所述处理装置对交互的语音信号进行判断确定,并根据语音信号指令控制家电设备工作,其特征在于,所述判断确定包括:获取音频信号;对所述音频信号进行快速傅里叶变换得到频域信号;根据所述频域信号计算谱幅度值;根据所述谱幅度值计算概率密度;根据所述概率密度计算所述音频信号的谱熵;根据所述谱熵确定所述音频信号是否为语音信号。减少了计算量,提高了语音检测的效率,以及准确性,提升了家电设备的语音交互的用户体验感。
Description
技术领域
本发明属于家电设备领域,,尤其涉及一种家电设备的语音交互方法。
技术领域
随着科学技术的不断发展,家电智能化越来越成熟并被广泛应用,而其中作为直接与用户接触的人机交互模块,更是被各种智能化所替代,如人体感应、触控等等,而作为对人手操作的解放,语音交互控制则是更重要的一大模块。
现有技术中,家电设备可以识别用户发出的声音,并根据该声音执行相应的指令。
但是,如果用户距离家电设备较远,则家电设备可能无法有效的识别到用户发出的声音,所以影响了用户体验。
发明内容
本发明提供了一种家电设备的语音交互方法,能够减少计算量、提升语音检测的效率以及准确性。
为解决上述技术问题,本发明采用如下技术方案:
家电设备接收用户终端通过无线网络发送的绑定指令;
所述家电设备根据所述绑定指令与所述用户终端建立无线连接;
所述家电设备通过所述无线连接接收所述用户终端发送的音频信号;
所述家电设备判断所述音频信号是否为语音信号;
若是语音信号,则所述家电设备对所述语音信号进行语义分析得到分析结果;
所述家电设备根据所述分析结果获取对应的操作指令;
所述家电设备按照所述操作指令进行相应的操作。
本发明中,家电设备可以与用户终端建立无线连接,并且通过该无线连接接收音频信号,所以即使用户距离家电设备较远,也可以通过用户终端向家电设备发送语音指令,因此提高了用户体验。
附图说明
下面结合附图对本发明做进一步的说明:
图1为本发明一种家电设备语音交互方法的实施例的流程框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
实施例:
如图1所示,一种家电设备的语音交互方法,所述家电设备上设有音频检测装置以及对语音信号处理的处理装置,所述处理装置对交互的语音信号进行判断确定,并根据语音信号指令控制家电设备工作,其中,所述判断确定包括:获取音频信号;对所述音频信号进行快速傅里叶变换得到频域信号;根据所述频域信号计算谱幅度值;根据所述谱幅度值计算概率密度;根据所述概率密度计算所述音频信号的谱熵;根据所述谱熵确定所述音频信号是否为语音信号。
具体的家电设备的语音交互方法,包括:
家电设备接收用户终端通过无线网络发送的绑定指令;
所述家电设备根据所述绑定指令与所述用户终端建立无线连接;
所述家电设备通过所述无线连接接收所述用户终端发送的音频信号;
所述家电设备判断所述音频信号是否为语音信号;
若是语音信号,则所述家电设备对所述语音信号进行语义分析得到分析结果;
所述家电设备根据所述分析结果获取对应的操作指令;
所述家电设备按照所述操作指令进行相应的操作。
其中,家电设备根据所述绑定指令与所述用户终端建立无线连接之前,还可以包括:
所述家电设备从所述绑定指令中提取校验信息;
所述家电设备判断所述校验信息是否对应合法用户;
若是,则家电设备触发建立无线连接的步骤。
家电设备可以通过多种无线连接接收所述用户终端发送的音频信号,若所述无线连接是WIFI连接,则所述家电设备以第一接收功率接收所述音频信号;若所述无线连接是蓝牙连接,则所述家电设备以第二接收功率接收所述音频信号;
由于蓝牙连接一般是短距离连接,WIFI连接一般是长距离连接,为了能够提升传输质量,所以第二接收功率需要大于第一接收功率。
家电设备判断所述音频信号是否为语音信号的过程具体可以包括:
所述家电设备对所述音频信号进行快速傅里叶变换得到频域信号;
所述家电设备根据所述频域信号计算谱幅度值;
所述家电设备根据所述谱幅度值计算概率密度;
所述家电设备根据所述概率密度计算所述音频信号的谱熵;
所述家电设备根据所述谱熵确定所述音频信号是否为语音信号。
在本实施例中,根据所述谱幅度值计算概率密度的具体过程:根据所述谱幅度值计算第y个音频信号所在帧的带噪语音功率谱总能量;根据所述总能量以及所述谱幅度值计算概率密度。
具体的,在本实施例中,根据所述频域信号计算谱幅度值的具体过程:
其中,X(k,y)表示第y个音频信号所在帧的第k个频段的谱幅度值,z(n,y)表示第y个音频信号所在帧的音频中的第n个点的幅度,N表示快速傅里叶变换的变化长度,k小于或等于N,exp(-j2πkn/N)表示幅角为2π的kn/N倍的复数。
具体的,在本实施例中,计算总能量的具体过程:
其中,Esum(y)表示第y个音频信号所在帧的带噪语音功率谱总能量,X(k,y)表示第y个音频信号所在帧的第k个频段的谱幅度值,N表示快速傅里叶变换的变化长度。
具体的,在本实施例中,概率密度的计算过程:
D(k,y)=|X(k,y)|2/Esum(y),D(k,y)表示第y个音频信号所在帧的第k个频段所对应的概率密度。
具体的,在本实施例中,根据所述概率密度计算所述音频信号的谱熵的具体过程:
其中,H(y)表示第y个音频信号的谱熵。
在本实施例中,根据所述谱熵确定所述音频信号是否为语音信号的具体过程:计算所述音频信号的能量;根据所述音频信号的能量以及所述谱熵确定所述音频信号是否为语音信号。
具体的,在本实施例中,计算所述音频信号的能量的具体过程:
其中,E(y)表示第y个音频信号的能量,M表示音频信号所在帧的帧长,z(n,y)表示第y个音频信号所在帧的音频中的第n个点的幅度。根据所述音频信号的能量以及所述谱熵确定所述音频信号是否为语音信号的具体过程:判断P(y)是否大于预置门限值,若是,则确定音频信号是语音信号,若否,则确定音频信号不是语音信号,其中,
本发明中,可以根据音频信号的谱熵来进行语音检测,谱熵的计算过程主要涉及时频变换、幅度计算和能量计算等,这些计算过程所针对的都是语音信号本身的属性,而不必进行语义分析这种需要涉及到人工智能和神经网络的计算方式,从而减少了计算量,提高了语音检测的效率,以及准确性,提升了家电设备的语音交互的用户体验感。
虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。
Claims (9)
1.一种家电设备的语音交互方法,其特征在于,包括:
家电设备接收用户终端通过无线网络发送的绑定指令;
所述家电设备根据所述绑定指令与所述用户终端建立无线连接;
所述家电设备通过所述无线连接接收所述用户终端发送的音频信号;
所述家电设备判断所述音频信号是否为语音信号;
若是语音信号,则所述家电设备对所述语音信号进行语义分析得到分析结果;
所述家电设备根据所述分析结果获取对应的操作指令;
所述家电设备按照所述操作指令进行相应的操作。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
所述家电设备从所述绑定指令中提取校验信息;
所述家电设备判断所述校验信息是否对应合法用户;
若是,则家电设备触发建立无线连接的步骤。
3.根据权利要求2所述的方法,其特征在于,所述家电设备通过所述无线连接接收所述用户终端发送的音频信号包括:
若所述无线连接是WIFI连接,则所述家电设备以第一接收功率接收所述音频信号;
若所述无线连接是蓝牙连接,则所述家电设备以第二接收功率接收所述音频信号;
所述第一接收功率小于所述第二接收功率。
4.根据权利要求3所述的方法,其特征在于,所述家电设备判断所述音频信号是否为语音信号包括:
所述家电设备对所述音频信号进行快速傅里叶变换得到频域信号;
所述家电设备根据所述频域信号计算谱幅度值;
所述家电设备根据所述谱幅度值计算概率密度;
所述家电设备根据所述概率密度计算所述音频信号的谱熵;
所述家电设备根据所述谱熵确定所述音频信号是否为语音信号。
5.根据权利要求4所述的方法,其特征在于,根据所述谱幅度值计算概率密度的具体过程:
根据所述谱幅度值计算第y个音频信号所在帧的带噪语音功率谱总能量;
根据所述总能量以及所述谱幅度值计算概率密度。
6.根据权利要求5所述的方法,其特征在于,
根据所述频域信号计算谱幅度值的具体过程:
其中,X(k,y)表示第y个音频信号所在帧的第k个频段的谱幅度值,z(n,y)表示第y个音频信号所在帧的音频中的第n个点的幅度,N表示快速傅里叶变换的变化长度,k小于或等于N,exp(-j2πkn/N)表示幅角为2π的kn/N倍的复数;
计算总能量的具体过程:
其中,Esum(y)表示第y个音频信号所在帧的带噪语音功率谱总能量,X(k,y)表示第y个音频信号所在帧的第k个频段的谱幅度值,N表示快速傅里叶变换的变化长度;
概率密度的计算过程:
D(k,y)=|X(k,y)|2/Esum(y),D(k,y)表示第y个音频信号所在帧的第k个频段所对应的概率密度;
根据所述概率密度计算所述音频信号的谱熵的具体过程:
其中,H(y)表示第y个音频信号的谱熵。
7.根据权利要求6所述的方法,其特征在于,根据所述谱熵确定所述音频信号是否为语音信号的具体过程:
计算所述音频信号的能量;
根据所述音频信号的能量以及所述谱熵确定所述音频信号是否为语音信号。
8.根据权利要求7所述的方法,其特征在于,计算所述音频信号的能量的具体过程:
其中,E(y)表示第y个音频信号的能量,M表示音频信号所在帧的帧长,z(n,y)表示第y个音频信号所在帧的音频中的第n个点的幅度。
9.根据权利要求8所述的方法,其特征在于,根据所述音频信号的能量以及所述谱熵确定所述音频信号是否为语音信号的具体过程:
判断P(y)是否大于预置门限值,若是,则确定音频信号是语音信号,若否,则确定音频信号不是语音信号,其中,
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810302825.7A CN108665894A (zh) | 2018-04-06 | 2018-04-06 | 一种家电设备的语音交互方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810302825.7A CN108665894A (zh) | 2018-04-06 | 2018-04-06 | 一种家电设备的语音交互方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108665894A true CN108665894A (zh) | 2018-10-16 |
Family
ID=63782940
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810302825.7A Pending CN108665894A (zh) | 2018-04-06 | 2018-04-06 | 一种家电设备的语音交互方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108665894A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101599269A (zh) * | 2009-07-02 | 2009-12-09 | 中国农业大学 | 语音端点检测方法及装置 |
CN102074236A (zh) * | 2010-11-29 | 2011-05-25 | 清华大学 | 一种分布式麦克风的说话人聚类方法 |
CN103051734A (zh) * | 2013-01-23 | 2013-04-17 | 广东志高空调有限公司 | 家电远程语音控制方法、***及通信终端 |
CN103941667A (zh) * | 2013-12-31 | 2014-07-23 | 海尔集团公司 | 家电控制方法、***及设备 |
CN104021789A (zh) * | 2014-06-25 | 2014-09-03 | 厦门大学 | 一种利用短时时频值的自适应端点检测方法 |
CN105897531A (zh) * | 2016-06-21 | 2016-08-24 | 美的智慧家居科技有限公司 | 移动终端、家电的语音控制***及其语音控制方法 |
CN106385352A (zh) * | 2016-10-20 | 2017-02-08 | 北京小米移动软件有限公司 | 设备绑定方法及装置 |
CN107731223A (zh) * | 2017-11-22 | 2018-02-23 | 腾讯科技(深圳)有限公司 | 语音活性检测方法、相关装置和设备 |
-
2018
- 2018-04-06 CN CN201810302825.7A patent/CN108665894A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101599269A (zh) * | 2009-07-02 | 2009-12-09 | 中国农业大学 | 语音端点检测方法及装置 |
CN102074236A (zh) * | 2010-11-29 | 2011-05-25 | 清华大学 | 一种分布式麦克风的说话人聚类方法 |
CN103051734A (zh) * | 2013-01-23 | 2013-04-17 | 广东志高空调有限公司 | 家电远程语音控制方法、***及通信终端 |
CN103941667A (zh) * | 2013-12-31 | 2014-07-23 | 海尔集团公司 | 家电控制方法、***及设备 |
CN104021789A (zh) * | 2014-06-25 | 2014-09-03 | 厦门大学 | 一种利用短时时频值的自适应端点检测方法 |
CN105897531A (zh) * | 2016-06-21 | 2016-08-24 | 美的智慧家居科技有限公司 | 移动终端、家电的语音控制***及其语音控制方法 |
CN106385352A (zh) * | 2016-10-20 | 2017-02-08 | 北京小米移动软件有限公司 | 设备绑定方法及装置 |
CN107731223A (zh) * | 2017-11-22 | 2018-02-23 | 腾讯科技(深圳)有限公司 | 语音活性检测方法、相关装置和设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109087669B (zh) | 音频相似度检测方法、装置、存储介质及计算机设备 | |
JP6099556B2 (ja) | 音声識別方法および装置 | |
JP6101196B2 (ja) | 音声識別方法および装置 | |
WO2020181824A1 (zh) | 声纹识别方法、装置、设备以及计算机可读存储介质 | |
CN105744434A (zh) | 一种基于手势识别的智能音箱控制方法及*** | |
CN110992963B (zh) | 网络通话方法、装置、计算机设备及存储介质 | |
CN203882609U (zh) | 基于语音激活检测的唤醒装置 | |
WO2020155490A1 (zh) | 基于语音分析的管理音乐的方法、装置和计算机设备 | |
CN105096946B (zh) | 基于语音激活检测的唤醒装置及方法 | |
CN110335593B (zh) | 语音端点检测方法、装置、设备及存储介质 | |
CN103325379A (zh) | 用于声学回声控制的方法与装置 | |
CN108665895A (zh) | 用于处理信息的方法、装置和*** | |
US11282514B2 (en) | Method and apparatus for recognizing voice | |
CN105405441B (zh) | 一种语音信息的反馈方法及装置 | |
CN105529038A (zh) | 对用户语音信号进行处理的方法及其*** | |
KR20150123579A (ko) | 사용자 음성으로부터 감정정보를 확인하는 방법 및 장치 | |
CN110097895B (zh) | 一种纯音乐检测方法、装置及存储介质 | |
CN114338623B (zh) | 音频的处理方法、装置、设备及介质 | |
CN108538290A (zh) | 一种基于音频信号检测的智能家居控制方法 | |
CN117746905B (zh) | 基于时频持续性分析的人类活动影响评估方法及*** | |
US11915718B2 (en) | Position detection method, apparatus, electronic device and computer readable storage medium | |
US20210375111A1 (en) | Notification device, wearable device and notification method | |
CN104274209A (zh) | 一种基于移动智能终端的新型胎心仪 | |
CN108665894A (zh) | 一种家电设备的语音交互方法 | |
CN106340310A (zh) | 语音检测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20181016 |