CN114863925A - 多设备语音控制的判断方法、计算机设备和可读存储介质 - Google Patents

多设备语音控制的判断方法、计算机设备和可读存储介质 Download PDF

Info

Publication number
CN114863925A
CN114863925A CN202110362964.0A CN202110362964A CN114863925A CN 114863925 A CN114863925 A CN 114863925A CN 202110362964 A CN202110362964 A CN 202110362964A CN 114863925 A CN114863925 A CN 114863925A
Authority
CN
China
Prior art keywords
information
value
audio information
volume
energy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110362964.0A
Other languages
English (en)
Inventor
王广武
孔令磊
张景瑞
李桂玺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Haier Refrigerator Co Ltd
Haier Smart Home Co Ltd
Original Assignee
Qingdao Haier Refrigerator Co Ltd
Haier Smart Home Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Haier Refrigerator Co Ltd, Haier Smart Home Co Ltd filed Critical Qingdao Haier Refrigerator Co Ltd
Priority to CN202110362964.0A priority Critical patent/CN114863925A/zh
Publication of CN114863925A publication Critical patent/CN114863925A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2816Controlling appliance services of a home automation network by calling their functionalities
    • H04L12/282Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/22Arrangements for obtaining desired frequency or directional characteristics for obtaining desired frequency characteristic only 
    • H04R1/222Arrangements for obtaining desired frequency or directional characteristics for obtaining desired frequency characteristic only  for microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Otolaryngology (AREA)
  • Computational Linguistics (AREA)
  • Automation & Control Theory (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Selective Calling Equipment (AREA)

Abstract

本发明揭示了一种多设备语音控制的判断方法、计算机设备和可读存储介质,方法包括步骤:获取多个设备的音频信息和运行信息,确定出每个设备的能量信息和匹配信息,计算每个音频信息的响应值;判断由最高的响应值对应的设备获得交互权。该方法通过对多个麦克风拾取的音频信息的处理和计算,以及针对设备当前的运行状态,判断出用户希望控制的智能家电,在多个智能家电中找出最符合用户预期控制的设备,解决了判断针对用户语音指令由哪个设备进行响应的问题,便于语音控制功能在多个智能家电上的推广,使智能家电的智能化进一步提高,且提升了用户的使用体验。

Description

多设备语音控制的判断方法、计算机设备和可读存储介质
技术领域
本发明涉及家庭设备智能控制领域,尤其涉及一种多设备语音控制的判断方法、计算机设备和可读存储介质。
背景技术
智能家居常常出现语音交互的场景,用户在家中发出语音控制指令,智能家电根据该控制指令执行工作。语音交互涉及麦克风对语音指令的捕捉,当家中有多个智能家电时,存在具体由哪个设备执行语音指令的问题。
更具体的场景是,用户在家中的位置一般不会是固定的,用户会在家中移动时,有的设备距离用户更近,能接收到语音的音量更大,但用户希望语音控制的智能家电不一定是距离更近的设备,当用户说出语音指令后,可能被距离用户更近的设备抢占该指令信号,其他设备做出非客户预期的唤醒;或者用户走到希望控制的设备前,发出的语音指令却被上一个设备接收,影响了对目标设备的控制。即在多个智能家电中,判断针对用户语音指令由哪个设备进行响应是困难的,限制了语音控制功能在智能家电中的应用,降低了用户的使用体验。
发明内容
为解决上述的现有技术问题中的至少其一,本发明的目的在于提供一种多设备语音控制的判断方法、计算机设备和可读存储介质。
为实现上述发明目的,本发明一实施方式提供一种多设备语音控制的判断方法,包括如下步骤:
获取多个设备的音频信息;
获取与所述音频信息对应设备的运行信息;
根据所述音频信息确定与其对应的能量信息和能量权重值;
根据所述运行信息确定与其对应的匹配信息和匹配权重值;
根据所述能量信息和所述能量权重值、以及匹配信息和匹配权重值,计算每个所述音频信息的响应值;
判断由最高的响应值对应的设备获得交互权。
作为本发明的进一步改进,所述步骤“根据所述音频信息确定与其对应的能量信息和能量权重值”包括:
所述音频信息包括振幅值信息;
根据所述振幅值信息计算所述能量信息。
作为本发明的进一步改进,还包括步骤:
所述音频信息包括获取所述音频信息的麦克风的麦克风信息;
根据所述麦克风信息确定与其对应的麦克风系数;
根据所述麦克风系数确定所述能量权重值。
作为本发明的进一步改进,所述响应值包括所述能量信息与所述能量权重值的乘积。
作为本发明的进一步改进,还包括步骤:
当最高的响应值对应的能量信息低于预设值时,控制最高的响应值对应的设备根据所述能量信息最高的音频信息运行。
作为本发明的进一步改进,所述运行信息包括与所述音频信息对应设备的场景信息,所述场景信息为所述设备获取音频信息前的交互场景;
所述匹配信息包括与所述场景信息对应的场景系数;
所述匹配权重值包括场景权重值;
所述响应值包括所述场景系数与所述场景权重值的乘积。
作为本发明的进一步改进,所述匹配信息包括与所述音频信息对应设备的音量信息;
所述匹配权重值包括音量权重值;
所述响应值包括所述音量信息与所述音量权重值的乘积。
作为本发明的进一步改进,所述音量信息设置为与所述音频信息对应设备的当前音量值与该设备的最大音量值的比值。
作为本发明的进一步改进,所述音量信息设置为与所述音频信息对应设备的当前音量的绝对音量值。
作为本发明的进一步改进,还包括步骤:
控制不是最高的响应值对应的设备停止获取音频信息。
为实现上述发明目的之一,本发明一实施例提供了一种计算机设备,包括:
存储模块,所述存储模块存储有可在处理模块上运行的计算机程序;
处理模块,所述处理模块执行所述计算机程序时可实现上述的多设备语音控制的判断方法中的步骤。
为实现上述发明目的之一,本发明一实施例提供了一种可读存储介质,其存储有计算机程序,该计算机程序被处理模块执行时可实现上述的多设备语音控制的判断方法中的步骤。
与现有技术相比,本发明具有以下有益效果:通过对多个麦克风拾取的音频信息的处理和计算,以及针对设备当前的运行状态,判断出用户希望控制的智能家电,该方法在多个智能家电中找出最符合用户预期控制的设备,解决了判断针对用户语音指令由哪个设备进行响应的问题,便于语音控制功能在多个智能家电上的推广,使智能家电的智能化进一步提高,且提升了用户的使用体验。
附图说明
图1是本发明一实施例的多设备语音控制的判断方法的流程示意图;
图2是本发明一实施例的智能家电的结构框图;
图3是本发明一实施例的服务器和智能家电的结构框图;
其中,1、拾音模块;2、发声模块;3、显示模块;4、处理模块;5、存储模块;6、信号输入/输出模块;7、通信总线。
具体实施方式
以下将结合附图所示的具体实施方式对本发明进行详细描述。但这些实施方式并不限制本发明,本领域的普通技术人员根据这些实施方式所做出的结构、方法、或功能上的变换均包含在本发明的保护范围内。
本发明一实施例提供一种多设备语音控制的判断方法、计算机设备和可读存储介质,通过该方法,可以在多个智能家电中找出最符合用户预期控制的设备,解决了判断针对用户语音指令由哪个设备进行响应的问题,便于语音控制功能在多个智能家电上的推广。
本实施例的多设备,以家庭环境、或家电展示厅、或家电卖场为例,指的是多个可以智能语音控制的设备,例如多个智能冰箱,或者多个智能冰箱、冷柜、酒柜,或者智能冰箱、智能电视、智能音箱等多个智能家电,可以通过用户发出的语音指令信息进行对应的操作。
下述的方法步骤的执行主体,是一计算机设备,该计算机设备可以存在于家庭的某个智能终端中,可以是用户的手机,可以是云端的服务器等等。
具体地,多设备语音控制的判断方法包括如下步骤:
步骤101:获取多个设备的音频信息;
音频信息通过麦克风获取,智能家电一般地均具有麦克风,也可以是外置的某个绑定的麦克风,麦克风将模拟的声音信号转化成数字电信号进行传输,得到音频信息。
在智能家电获取音频信息之前,可以先由用户发出唤醒指令进行唤醒,在唤醒之前,持续低功耗地监听音频信息,直到匹配出唤醒的关键指令时,才唤醒设备,准备对接下来的用户的语音指令进行响应,获取音频信息。例如用户需要唤醒5台冰箱,5台冰箱的唤醒关键词均为“小优小优”,当用户说出该唤醒指令后,5台冰箱均被唤醒,所有冰箱的麦克风都准备监听用户接下来的语音制冷,即获取音频信息,在5台冰箱均被唤醒时,如果冰箱之前正在发出声音,例如播放音乐,可以先降低冰箱的音量甚至静音,做好获取接下来的获取音频信息的准备,然后将获取到的音频信息上传至执行该方法的计算机设备中。
步骤102:获取与所述音频信息对应设备的运行信息;
运行信息体现了该设备当前的交互状态,例如该设备具有发声模块或显示模块,运行信息可以包括显示模块显示的内容、发声模块发出的声音等信息,这些信息体现了该设备当前的运行状态。
步骤103:根据所述音频信息确定与其对应的能量信息和能量权重值;
能量信息主要取决于用户唤醒时到达设备的音频的能量大小,该能量值也能反映出设备距离发声位置距离的远近,用户在某一位置发出唤醒声音,该声音理论上到达具体发声点位置不同的设备时,麦克风收集到的音频强度会随着距离的不同而产生差异,不同类型的设备对其能量权重值进行匹配。
步骤104:根据所述运行信息确定与其对应的匹配信息和匹配权重值;
匹配信息体现了该设备的运行状态与用户的匹配关系,当设备处于不同的状态时,可以判断其需要进行交互的可能性是存在差异的,通过该匹配信息即可反应设备需要进行交互的可能值,以及不同类型的设备对其匹配权重值进行匹配。
步骤105:根据所述能量信息和所述能量权重值、以及匹配信息和匹配权重值,计算每个所述音频信息的响应值;
响应值综合了上述的能量信息、能量权重值、匹配信息和匹配权重值,对这些参数进行计算,响应值反应出对每个音频信息的打分,通过分数反应需要匹配的程度,该响应值可以是越高越适合与用户交互,也可以是越低越适合,具体值根据参数设计制定即可。
步骤106:判断由最高的响应值对应的设备获得交互权。
交互权指的是接下来语音交互由这个响应值最高的设备进行,该智能家电接下来可以根据当前的音频信息、或用户的下一句的音频信息中包含的指令信息进行响应。其他的未获取到交互权的设备不执行用户的语音指令,直到用户下一次再次唤醒所有设备,继续通过上述的方法判断由哪个设备参与下一轮的交互。
对用户发出的语音指令由哪个设备进行匹配,是上述的方法所要解决的问题,通过响应值判断需要执行语音指令的设备,客观地反应了不同设备距离用户的远近,以及设备的当前状态,若设备距离用户更近,则能量信息更高,若该设备参与了上一轮的交互,体现在匹配信息上会更高,另外不同的能量权重值和匹配权重值,也体现了各个设备本身的性能差别,基于上述的判断方法比较不同设备的距离和活跃状态,得到响应值。例如,当一设备距离用户更近,且用户唤醒前正在执行相关的操作,则用户有更大的可能这一轮仍需要唤醒该设备。反之,当一设备距离用户更远,且用户唤醒前处于休眠状态,则用户这一轮需要唤醒该设备的可能性更小。
虽然本申请提供了如下述实施方式或流程图所述的方法操作步骤,但是基于常规或者无需创造性的劳动,在所述方法中可以包括更多或者更少的操作步骤。此外,所述方法在逻辑性上不存在必要因果关系的步骤中,这些步骤的执行顺序不限于本申请实施方式中所提供的执行顺序。例如步骤101和102之间、步骤102和步骤103之间、步骤103和步骤104之间没有逻辑上的先后关系,可以根据需要调整其步骤顺序。
进一步地,所述步骤“根据所述音频信息确定与其对应的能量信息和能量权重值”包括:
所述音频信息包括振幅值信息;
根据所述振幅值信息计算所述能量信息。
振幅值信息体现了该麦克风设备接收到的音频信息的波形,也体现了麦克风获取的音频信息的能量情况,用户发出的语音指令一般是有限长度,非周期性的信号,不同时间点的振幅描述了信号的能量随着频率分布情况,通过计算其谱密度,反应了语音信号的能量在各频率点的分布情况,幅值越大则反应了该音频信号在一些频率上接收到的声音信号的强度越高。对所有的音频信息的振幅值进行计算,可以得到各个音频信息对应的能量信息。
以及还包括步骤:
所述音频信息包括获取所述音频信息的麦克风的麦克风信息;
根据所述麦克风信息确定与其对应的麦克风系数;
根据所述麦克风系数确定所述能量权重值。
不同设备的麦克风获取音频的能力是不同的,有的设备距离用户近,但麦克风的性能相对于距离较远的设备不好,其获取到的音频信息不能客观地体现该设备距离用户更近,反之,有的设备距离用户更远,但麦克风性能好,若仅从麦克风获取到的音频信息来看,反而可能误认为该设备距离用户更近,所以通过获取到的麦克风信息,对不同设备的麦克风匹配不同的麦克风系数,该麦克风系数与其性能的强弱呈相反的关系,进一步体现在能力权重值与麦克风的性能呈相反的关系,即麦克风的性能越好,其能力权重值越低。并且,有的设备具有多个麦克风,其获取音频的能力区别于麦克风数量更少的设备,对其麦克风系数进行调整。从麦克风系数到能量权重值之间,可以根据最终要获取的响应值的数量级和其他参数的匹配关系,辅加以一定系数的调整,生成能量权重值。通过调整不同的设备的麦克风系数,平衡能量权重值,进一步平衡不同的能量信息。
在获取上述信息后,将所述响应值包括所述能量信息与所述能量权重值的乘积。
另外,还包括步骤:
当最高的响应值对应的能量信息低于预设值时,控制最高的响应值对应的设备根据所述能量信息最高的音频信息运行。
有的设备距离用户更近,但结合匹配信息和匹配权重值后得出不是需要操作的设备,但有的设备距离更远,最终判断是需要运作的设备,更远位置的设备,由于其获取的音频信息不如近距离设备的清晰,尤其是能量信息较一参考的预设值还要低时,可以判断为该设备可能不足以很好的执行用户的语音指令,所以对更远的设备,执行距离更近的设备的音频信息的内容,以使得远距离设备能准确的执行用户需要的操作。
以及,还包括步骤:
控制不是最高的响应值对应的设备停止获取音频信息。
当多个智能家电判断由哪个设备执行语音指令后,其余设备可以停止监听下一句语音信息,恢复到各自之前的状态,结合上述的步骤,也可以存在一种场景,当判断更远距离的设备需要执行语音指令后,将其按最近距离的设备获取到的音频信息进行运作,将两个设备以外的其余设备停止监听。
进一步地,所述运行信息包括与所述音频信息对应设备的场景信息,所述场景信息为所述设备获取音频信息前的交互场景;
所述匹配信息包括与所述场景信息对应的场景系数;
所述匹配权重值包括场景权重值;
所述响应值包括所述场景系数与所述场景权重值的乘积。
场景信息体现了当前的交互场景对于该设备的重要性,或者说体现了与其自身需要被进行控制的相关性,不同的使用场景下,场景信息存在差别,对不同的场景匹配出不同的场景系数,并根据数量级和其他参数的匹配关系,辅加以一定系数的调整,生成场景权重值,最终将场景系数与所述场景权重值相乘,得出的结果反映除了匹配信息中场景对于设备交互的重要性。例外地,当一设备在唤醒之前,不存在使用的场景,其场景系数可以很低,该项也拉低了语音信息对应的响应值。
进一步地,所述匹配信息包括与所述音频信息对应设备的音量信息;
所述匹配权重值包括音量权重值;
所述响应值包括所述音量信息与所述音量权重值的乘积。
更具体地,该方法可以包括以下两种实施例:
在其一实施例中,所述音量信息设置为与所述音频信息对应设备的当前音量值与该设备的最大音量值的比值。
所述响应值即包括所述当前音量信息与所述最大音量信息的比值与所述音量权重值的乘积。
当前音量信息,是该设备的发声模块所发出的音量,当某一设备的音量很大,客观体现了用户当前可能正在操作该设备,或者该设备对于用户的重要性很大,反之,当一设备的音量很小,也体现了用户当前不想操作该设备,极端地,例如智能电视处于静音状态,说明用户此时不希望电视参与其语音指令的控制,其当前音量信息为0,最终得到的当前音量信息与所述最大音量信息的比值与所述音量权重值的乘积也为0,该项也拉低了语音信息对应的响应值。这样,其中B=y(当前)/y(上限),其中B为音量信息,y(当前)为当前音量值,即用户控制的音量数值,y(上限)为最大音量值,即该设备能发出的最大音量数值。
本实施例的音量信息是一种相对音量。虽然不同设备的能发出声音的能力是不同的,但是通过当前音量信息与所述最大音量信息的比值,反映出该设备发出声音相对于自身所能发出声音的比值判断。当所有智能家电均为智能冰箱时,该值可以横向比较不同冰箱的发声情况,当智能家电包括多种类型的设备时,由于家用设备的发声能力不是任意设定,其最大音量信息是根据用户的使用环境进行设计,当能够发出很大声音的设备却发出声音很小时,也体现了该设备当前的不活跃性,而相对的最大音量信息不大,但当前音量信息很大时,也体现了用户需要更多的操作该设备。
在另一实施例中,所述音量信息设置为与所述音频信息对应设备的当前音量的绝对音量值。
这里,喇叭发出的声音,是通电导体在磁场中的运动产生声音,计算公式为F=BIL,其中I=U/R,所以F=BUL/R,其中B、L为硬件常量,U为喇叭电压,R为喇叭电阻,这些都可以作为可确认计算的参数,再根据当前喇叭的spl确定当前喇叭的音量大小,其中spl指声压级灵敏度,BUL/R*spl即为该设备能发出的最大的绝对音量,对应到音量数值上就是B=y(当前)/y(上限)*BUL/R*spl,其中与上述实施例相同的B为音量信息,y(当前)为当前音量值,即用户控制的音量数值,y(上限)为最大音量值,即该设备能发出的最大音量数值,即音量信息代表当前音量的标准值。
本实施例的音量信息是一种绝对音量,每个设备的音量信息,是相互之间可以横向对比的值,是基于统一的现实环境的标准音量的换算值,也就是说,将不同的发声能力的喇叭的音量换算到统一的音量中进行计算。这里认为,当前设备的绝对音量高,体现用户正在更多的关注该设备,绝对音量低,用户使用该设备的可能性更小。
具体需要根据哪种音量信息进行计算,可以根据实验参数模拟,判断针对用户的环境哪种方式更能匹配出用户实际需要唤醒的设备,指定合适的音量信息。
例外地,当某一设备不具有发声模块时,可以给该设备对应的当前音量信息、最大音量信息和音量权重值配一恒定值,方便与其他设备进行比较。
具体的使用场景如下:
通过上述说明,可生成计算公式:响应值=A*a+B*b+C*c
其中A为能量信息,a为能量权重值,B为场景系数,b为场景权重值,C为当前音量信息与所述最大音量信息的比值,c为音量权重值;
当家电设备为2个智能冰箱和2个智能电视时,智能冰箱和智能电视均具有很多种使用场景,例如待机、放音乐、食材管理、介绍菜谱、网上商城、放电影、点外卖、放新闻等等多种操作场景,
对于冰箱而言,其场景系数可以分配如下:
食材管理1.8=菜谱1.8>音乐播放1.7>商城1.6>外卖1.5>待机1
对于电视而言,其场景系数可以分配如下:
电影1.8=音乐播放1.8>电台1.7>商城1.6>放新闻1.5>待机1
当冰箱A正处于食材管理的页面,正在发出的当前音量信息是30,冰箱B正处于商城的页面,正在发出的当前音量信息是40,电视A正处于放新闻的页面时,正在发出的当前音量信息是40,电视B正处于待机状态时,正在发出的当前音量信息是0,四个设备的最大音量信息都是100。四个设备同时接收到了唤醒指令,例如“小优小优”,假设用户站在四个设备的中间位置,且电视和冰箱的能量权重值相等,场景权重值为10000,音量权重值为10000,音量信息以上述的相对音量为例:
冰箱A的响应值=A*a+1.8*b+30/100*c=A*a+18000+3000
冰箱B的响应值=A*a+1.6*b+40/100*c=A*a+16000+4000
电视A的响应值=A*a+1.5*b+40/100*c=A*a+15000+4000
电视B的响应值=A*a+1*b+0/100*c=A*a+10000+0,
通过计算,可知当前冰箱A的响应值最高,获得该唤醒指令的交互权,计算机设备判断由冰箱A对该语音信息进行响应,其他三个设备不参与当前语音信息的交互。由上述举例可知,响应值的计算综合了设备当前所处的场景、设备自身的音量、设备能接收到的音频能量,对各参数加权判断交互权的分发,使多设备的智能家电能够指定符合用户需求的设备进行响应。
上述的具体场景系数、场景权重值、音量权重值、以及能量信息和能量权重值计算和赋值,可以根据实验室数据得出。
本发明一实施例提供了一种计算机设备,如上文所述,上述的对多设备语音控制的判断方法可以都在某一智能家电上完成,由某智能家电进行控制,或者将这些信息上传至服务器,或者某一云端,例如用户的手机、电脑,在服务器进行上述的分析,即计算机设备可以是某一智能家电,也可以是服务器,包括存储模块5和处理模块4,所述存储模块5存储有可在处理模块4上运行的计算机程序,处理模块4执行所述计算机程序时可实现上述的多设备语音控制的判断方法中的步骤,也就是说,实现上述多设备语音控制的判断方法中的任意一个技术方案中的步骤。
运行上述方法的设备以智能家电为例,如图2所示,除了处理模块4和存储模块5,还包括拾音模块1、信号输入\输出模块6和通信总线7,另外还可以选择性的配有发声模块2和/或显示模块3,拾音模块1包括上述的麦克风,用于获取外界的音频的指令信息;当该智能家电具有发出声音的功能时,发声模块2包括喇叭,用于播放声音,当该智能家电具有显示图像的功能时,显示模块3包括显示屏,呈现图像,信号输入\输出模块6将智能家电的信息上传服务器,该通信总线7用于在拾音模块1、发声模块2、显示模块3、信号输入\输出模块6、处理模块4与存储模块5之间建立连接,通信总线7可包括一通路,在上述的多个模块之间传送信息。
运行上述方法的计算机设备可以是服务器,如图3所示,其具有信号接收模块、处理模块4和存储模块5,对智能家电传输来的信息进行分析和计算,例如接收两个智能冰箱和两个智能电视的信息,分别为智能冰箱A和B、智能电视A和B,所述计算机设备接收所述智能家电的音频信息和运行信息,计算用户语音的交互权交给哪个设备。
另外,本发明一实施例提供了一种可读存储介质,其存储有计算机程序,该计算机程序被处理模块4执行时可实现上述的多设备语音控制的判断方法中的步骤。也就是说,实现上述多设备语音控制的判断方法中的任意一个技术方案中的步骤。
在上述的说明中,应该理解到,所揭露的***,***和方法,可以通过其它的方式实现。例如,以上所描述的***实施方式仅仅是示意性的,例如,设备模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,***或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
例如,在本申请的处理模块4可以集中在一个处理模块中,也可以是各个模块单独物理存在,也可以2个或2个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机***(可以是个人计算机,服务器,或者网络***等)或处理模块(processor)执行本申请各个实施方式所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
与现有技术相比,本实施例具有以下有益效果:
通过对多个麦克风拾取的音频信息的处理和计算,以及针对设备当前的运行状态,判断出用户希望控制的智能家电,该方法在多个智能家电中找出最符合用户预期控制的设备,解决了判断针对用户语音指令由哪个设备进行响应的问题,便于语音控制功能在多个智能家电上的推广,使智能家电的智能化进一步提高,且提升了用户的使用体验。
应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施方式中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。

Claims (12)

1.一种多设备语音控制的判断方法,其特征在于,包括如下步骤:
获取多个设备的音频信息;
获取与所述音频信息对应设备的运行信息;
根据所述音频信息确定与其对应的能量信息和能量权重值;
根据所述运行信息确定与其对应的匹配信息和匹配权重值;
根据所述能量信息和所述能量权重值、以及所述匹配信息和所述匹配权重值,计算每个所述音频信息的响应值;
判断由最高的响应值对应的设备获得交互权。
2.根据权利要求1所述的多设备语音控制的判断方法,其特征在于,所述步骤“根据所述音频信息确定与其对应的能量信息和能量权重值”包括:
所述音频信息包括振幅值信息;
根据所述振幅值信息计算所述能量信息。
3.根据权利要求2所述的多设备语音控制的判断方法,其特征在于,还包括步骤:
所述音频信息包括获取所述音频信息的麦克风的麦克风信息;
根据所述麦克风信息确定与其对应的麦克风系数;
根据所述麦克风系数确定所述能量权重值。
4.根据权利要求3所述的多设备语音控制的判断方法,其特征在于,所述响应值包括所述能量信息与所述能量权重值的乘积。
5.根据权利要求2所述的多设备语音控制的判断方法,其特征在于,还包括步骤:
当最高的响应值对应的能量信息低于预设值时,控制最高的响应值对应的设备根据所述能量信息最高的音频信息运行。
6.根据权利要求1所述的多设备语音控制的判断方法,其特征在于,
所述运行信息包括与所述音频信息对应设备的场景信息,所述场景信息为所述设备获取音频信息前的交互场景;
所述匹配信息包括与所述场景信息对应的场景系数;
所述匹配权重值包括场景权重值;
所述响应值包括所述场景系数与所述场景权重值的乘积。
7.根据权利要求1所述的多设备语音控制的判断方法,其特征在于,
所述匹配信息包括与所述音频信息对应设备的音量信息;
所述匹配权重值包括音量权重值;
所述响应值包括所述音量信息与所述音量权重值的乘积。
8.根据权利要求7所述的多设备语音控制的判断方法,其特征在于,所述音量信息设置为与所述音频信息对应设备的当前音量值与该设备的最大音量值的比值。
9.根据权利要求7所述的多设备语音控制的判断方法,其特征在于,所述音量信息设置为与所述音频信息对应设备的当前音量的绝对音量值。
10.根据权利要求1所述的多设备语音控制的判断方法,其特征在于,还包括步骤:
控制不是最高的响应值对应的设备停止获取音频信息。
11.一种计算机设备,包括:
存储模块,所述存储模块存储有可在处理模块上运行的计算机程序;
处理模块,其特征在于,所述处理模块执行所述计算机程序时可实现权利要求1至10中任意一项所述的多设备语音控制的判断方法中的步骤。
12.一种可读存储介质,其存储有计算机程序,其特征在于,该计算机程序被处理模块执行时可实现权利要求1至10中任意一项所述的多设备语音控制的判断方法中的步骤。
CN202110362964.0A 2021-04-02 2021-04-02 多设备语音控制的判断方法、计算机设备和可读存储介质 Pending CN114863925A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110362964.0A CN114863925A (zh) 2021-04-02 2021-04-02 多设备语音控制的判断方法、计算机设备和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110362964.0A CN114863925A (zh) 2021-04-02 2021-04-02 多设备语音控制的判断方法、计算机设备和可读存储介质

Publications (1)

Publication Number Publication Date
CN114863925A true CN114863925A (zh) 2022-08-05

Family

ID=82627245

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110362964.0A Pending CN114863925A (zh) 2021-04-02 2021-04-02 多设备语音控制的判断方法、计算机设备和可读存储介质

Country Status (1)

Country Link
CN (1) CN114863925A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108320742A (zh) * 2018-01-31 2018-07-24 广东美的制冷设备有限公司 语音交互方法、智能设备及存储介质
CN108470568A (zh) * 2018-01-22 2018-08-31 科大讯飞股份有限公司 智能设备控制方法及装置、存储介质、电子设备
CN109215663A (zh) * 2018-10-11 2019-01-15 北京小米移动软件有限公司 设备唤醒方法及装置
US20190206396A1 (en) * 2017-12-29 2019-07-04 Comcast Cable Communications. LLC Localizing and Verifying Utterances by Audio Fingerprinting
CN112558567A (zh) * 2020-12-09 2021-03-26 创维集团有限公司 一种基于智能家居智能控制***的博物馆设备控制方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190206396A1 (en) * 2017-12-29 2019-07-04 Comcast Cable Communications. LLC Localizing and Verifying Utterances by Audio Fingerprinting
CN108470568A (zh) * 2018-01-22 2018-08-31 科大讯飞股份有限公司 智能设备控制方法及装置、存储介质、电子设备
CN108320742A (zh) * 2018-01-31 2018-07-24 广东美的制冷设备有限公司 语音交互方法、智能设备及存储介质
CN109215663A (zh) * 2018-10-11 2019-01-15 北京小米移动软件有限公司 设备唤醒方法及装置
CN112558567A (zh) * 2020-12-09 2021-03-26 创维集团有限公司 一种基于智能家居智能控制***的博物馆设备控制方法

Similar Documents

Publication Publication Date Title
JP7239544B2 (ja) 音声ウェイクアップ方法及び装置
CN106154860B (zh) 一种智能开关及应用该智能开关的智能家居***
CN110265006B (zh) 唤醒方法、主节点、从节点和存储介质
CN109089156B (zh) 一种音效调节方法、装置及终端
US20190229945A1 (en) Device control system, device control method, and non-transitory computer readable storage medium
US20220044685A1 (en) Voice Recognition Device, Waking-Up and Responding Method of the Same, and Computer Storage Medium
CN114172757A (zh) 服务器、智能家居***及多设备语音唤醒方法
CN110738994A (zh) 一种智能家居的控制方法、装置、机器人及***
CN111787461B (zh) 一种智能音响及其控制方法、装置及计算机可读存储介质
CN114067798A (zh) 一种服务器、智能设备及智能语音控制方法
CN111462746A (zh) 基于tws耳机的控制方法、***、装置和设备
WO2024103926A1 (zh) 语音控制方法、装置、存储介质以及电子设备
CN103873919A (zh) 一种信息处理方法及电子设备
CN112331195B (zh) 语音交互方法、装置以及***
CN106375809B (zh) 一种音量调节方法、装置及存储介质
CN114327332A (zh) 一种物联网设备设置方法、装置、电子设备和存储介质
CN113596100A (zh) 一种通信转移方法、计算机设备和存储介质
CN113518297A (zh) 音箱交互方法、装置、***和音箱
CN114863925A (zh) 多设备语音控制的判断方法、计算机设备和可读存储介质
CN109905803B (zh) 麦克风阵列的切换方法、装置、存储介质及计算机设备
CN108925014B (zh) 一种光源亮度控制方法、***以及设备
CN114863924A (zh) 多设备语音控制的判断方法、智能家电和可读存储介质
WO2022268136A1 (zh) 一种进行语音控制的终端设备及服务器
CN113132782A (zh) 一种流媒体传输的方法、流媒体播放设备及电子设备
CN112822509B (zh) 一种数据处理方法、装置、电子设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination