CN110473555A

CN110473555A - 一种基于分布式语音设备的交互方法及装置

Info

Publication number: CN110473555A
Application number: CN201910854904.3A
Authority: CN
Inventors: 葛有功
Original assignee: Shanghai Green Building Polytron Technologies Inc
Current assignee: Shanghai Green Building Polytron Technologies Inc
Priority date: 2019-09-10
Filing date: 2019-09-10
Publication date: 2019-11-19
Anticipated expiration: 2039-09-10
Also published as: CN110473555B

Abstract

本发明属于智能家居领域，公开了一种基于分布式语音设备的交互方法及装置，其方法包括：接收第一语音设备采集并发送的第一语音信息；获取第一语音信息对应的语义；根据语义判断第一语音信息是否包含交互意图；若是，则根据第一语音信息，在第二语音设备中确定目标语音设备；建立第一语音设备与目标语音设备之间的通信通道。本发明通过设置在不同位置的语音设备可实现家庭成员之间的交流，不仅可提高交流效果，而且，当家庭成员双手被占用，无法方便地拨打电话时，可通过语音唤醒语音设备，实现与不同房间的目标用户进行交流，不仅可提高交流的便捷性，而且不存在手机因静音或无电而导致手机无法接通的情况，进而提高交流的可靠性。

Description

一种基于分布式语音设备的交互方法及装置

技术领域

本发明属于智能家居技术领域，特别涉及一种基于分布式语音设备的交互方法及装置。

背景技术

随着生活水平的不断提高，人们的居住空间也越来越大。当人们居住在大户型或上下层的别墅里时，若位于不同房间的家庭成员之间需要交流时，则需要成员从一个房间走到另一个房间以进行面对面交流，或者需要成员加大说话声音以克服声音的穿墙损耗，再或者需要通过手机来进行交流，使得处于不同空间的家庭成员之间的交流很不便利，并且，可能存在听不清或听不到的情况，影响交流效果。

发明内容

本发明的目的是提供一种基于分布式语音设备的交互方法及装置，不仅可提高交流效果，而且可提高交流的便捷性。

本发明提供的技术方案如下：

一方面，提供一种基于分布式语音设备的交互方法，应用于控制终端，所述控制终端与设置于不同区域的多个语音设备通信连接；

所述基于分布式语音设备的交互方法包括：

接收第一语音设备采集并发送的第一语音信息；所述第一语音设备为所述多个语音设备中的任意一个；

获取所述第一语音信息对应的语义；

根据所述语义判断所述第一语音信息是否包含交互意图；

若是，则根据所述第一语音信息，在第二语音设备中确定目标语音设备；所述第二语音设备为所述多个语音设备中除所述第一语音设备以外的其它语音设备；

建立所述第一语音设备与所述目标语音设备之间的通信通道。

进一步优选地，所述根据所述第一语音信息，在第二语音设备中确定目标语音设备具体包括：

当所述第一语音信息中包括语音设备的标识信息时，获取所述标识信息；

根据所述标识信息，在所述第二语音设备中确定目标语音设备。

当所述第一语音信息中不包括语音设备的标识信息时，将所述第一语音信息发送至第二语音设备，并控制所述第二语音设备广播所述第一语音信息；

接收第三语音设备采集并发送的第二语音信息；所述第三语音设备为所述第二语音设备中的任意一个或多个；

根据所述第二语音信息，在所述第二语音设备中确定目标语音设备。

进一步优选地，所述接收第一语音设备采集并发送的语音信息之前还包括：

获取不同用户的声纹特征库；

所述根据所述第一语音信息，在第二语音设备中确定目标语音设备还包括：

提取所述第二语音信息对应的声纹特征；

根据所述声纹特征和所述声纹特征库，识别所述第二语音信息对应的用户身份；

根据所述用户身份和所述第一语音信息，从所述第三语音设备中确定目标语音设备。

进一步优选地，还包括：

当接收到多个语音设备采集并发送的所述第一语音信息时，获取每个语音设备发送的所述第一语音信息的分贝信息；

根据所述分贝信息，从发送所述第一语音信息的多个语音设备中确定第一语音设备。

另一方面，还提供一种基于分布式语音设备的交互装置，包括：

信息收发模块，用于与设置于不同区域的多个语音设备通信连接，还用于接收第一语音设备采集并发送的第一语音信息；所述第一语音设备为所述多个语音设备中的任意一个；

获取模块，用于获取所述第一语音信息对应的语义；

判断模块，用于根据所述语义判断所述第一语音信息是否包含交互意图；

分析模块，用于当所述第一语音信息包含交互意图时，根据所述第一语音信息，在第二语音设备中确定目标语音设备；所述第二语音设备为所述多个语音设备中除所述第一语音设备以外的其它语音设备；

通道建立模块，用于建立所述第一语音设备与所述目标语音设备之间的通信通道。

进一步优选地，所述分析模块包括：

标识获取单元，用于当所述第一语音信息中包括语音设备的标识信息时，获取所述标识信息；

分析单元，用于根据所述标识信息，在所述第二语音设备中确定目标语音设备。

进一步优选地，所述分析模块包括控制单元和分析单元；

所述控制单元，用于当所述第一语音信息中不包括语音设备的标识信息时，将所述第一语音信息发送至第二语音设备，并控制所述第二语音设备广播所述第一语音信息；

所述信息收发模块，用于接收第三语音设备采集并发送的第二语音信息；所述第三语音设备为所述第二语音设备中的任意一个或多个；

所述分析单元，用于根据所述第二语音信息，在所述第二语音设备中确定目标语音设备。

进一步优选地，还包括：

特征库获取模块，用于获取不同用户的声纹特征库；

所述分析模块还包括：

提取单元，用于提取所述第二语音信息对应的声纹特征；

识别单元，用于根据所述声纹特征和所述声纹特征库，识别所述第二语音信息对应的用户身份；

所述分析单元，还用于根据所述用户身份和所述第一语音信息，从所述第三语音设备中确定目标语音设备。

进一步优选地，所述获取模块，还用于当接收到多个语音设备采集并发送的所述第一语音信息时，获取每个语音设备发送的所述第一语音信息的分贝信息；

所述分析模块，还用于根据所述分贝信息，从发送所述第一语音信息的多个语音设备中确定第一语音设备。

与现有技术相比，本发明提供的一种基于分布式语音设备的交互方法及装置具有以下有益效果：本发明通过设置在不同位置的语音设备可实现家庭成员之间的交流，不仅可提高交流效果，而且，当家庭成员双手被占用，无法方便地拨打电话时，可通过语音唤醒语音设备，并通过设置在不同位置的语音设备实现与不同房间的目标用户进行交流，不仅可提高交流的便捷性，而且不存在手机因静音或无电而导致手机无法接通的情况，进而提高交流的可靠性。

附图说明

下面将以明确易懂的方式，结合附图说明优选实施方式，对一种基于分布式语音设备的交互方法及装置的上述特性、技术特征、优点及其实现方式予以进一步说明。

图1是本发明一种基于分布式语音设备的交互方法的第一实施例的流程示意图；

图2是本发明一种基于分布式语音设备的交互方法的第二实施例的流程示意图；

图3是本发明一种基于分布式语音设备的交互装置的一个实施例的结构示意框图。

附图标号说明

10、信息收发模块；20、获取模块；30、判断模块；40、分析模块；41、标识获取单元；42、分析单元；43、控制单元；44、提取单元；45、识别单元；50、通道建立模块；60、特征库获取模块。

具体实施方式

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对照附图说明本发明的具体实施方式。显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图，并获得其他的实施方式。

应当理解，当在本说明书中使用时，术语“包括”指示所述描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其他特征、整体、步骤、操作、元素、组件和/或集合的存在或添加。

为使图面简洁，各图中只示意性地表示出了与本发明相关的部分，它们并不代表其作为产品的实际结构。另外，以使图面简洁便于理解，在有些图中具有相同结构或功能的部件，仅示意性地绘示了其中的一个，或仅标出了其中的一个。在本文中，“一个”不仅表示“仅此一个”，也可以表示“多于一个”的情形。

图1是本发明提供的第一实施例，一种基于分布式语音设备的交互方法，应用于控制终端，控制终端可为本地网关，控制终端与设置于不同区域的多个语音设备通信连接；

该基于分布式语音设备的交互方法包括：

S100接收第一语音设备采集并发送的第一语音信息；所述第一语音设备为所述多个语音设备中的任意一个；

S200获取所述第一语音信息对应的语义；

S300根据所述语义判断所述第一语音信息是否包含交互意图；

S400若是，则根据所述第一语音信息，在第二语音设备中确定目标语音设备；所述第二语音设备为所述多个语音设备中除所述第一语音设备以外的其它语音设备；

S500建立所述第一语音设备与所述第二语音设备之间的通信通道。

具体地，随着智能家居的不断普及，语音音箱的作用越发明显。在家居场景下，为了更好地进行语音指令控制，可在家庭的各个房间设置语音面板或语音音箱来采集语音，并给出指令对应的响应。语音面板可为86型语音面板，以增加房间的整体美观性。在各个房间设置的语音面板或语音音箱即为本发明的语音设备，设置在各个房间的语音设备与控制终端通信连接，语音设备可采集用户的语音和播放语音。

一般情况下，各语音设备内的用于实现语音采集功能的模块处于未唤醒状态，当某一房间内的A用户需要与其他房间的B用户进行语音交互(语音交流)时，A用户可语音输入预设的唤醒词，以将距离A用户最近的语音设备唤醒，为方便后续描述，将该被A用户唤醒的语音设备定义为第一语音设备。第一语音设备被唤醒后可采集A用户输入的第一语音信息，第一语音设备将采集的第一语音信息发送给控制终端。

控制终端接收到第一语音信息后，可通过本地的语义解析模块对该第一语音信息进行语义解析。此外，还可将该第一语音信息发送至与控制终端通信连接的服务器，由服务器对该第一语音信息进行语义解析后，将语义解析结果返回至控制终端。

控制终端获取第一语音信息对应的语义后，可根据该语义判断第一语音信息是否包含交互意图，若是，则根据第一语音信息，在第二语音设备中确定目标语音设备。目标语音设备为A用户希望交互的对象所在房间的语音设备，即B用户所在房间的语音设备。目标语音设备可为一个或多个，其具体数量可根据用户希望交流的对象的数量来确定，进而实现家庭中的多人交谈方式。

可选的，S400根据第一语音信息，在第二语音设备中确定目标语音设备具体包括：

S410当所述第一语音信息中包括语音设备的标识信息时，获取所述标识信息；

S420根据所述标识信息，在所述第二语音设备中确定目标语音设备。

具体地，当确定第一语音信息包含交互意图时，进一步判断第一语音信息中是否包括语音设备的标识信息，如果包括，则获取该标识信息，并根据该标识信息，在第二语音设备中确定目标语音设备。例如，第一语音信息为“帮我连接C房间的语音设备”，则标识信息为“C房间”，目标语音设备即为设置在C房间的语音设备。

控制终端确定目标语音设备后，建立第一语音设备与目标语音设备之间的通信通道，即在后续A用户与B用户交互的过程中，将第一语音设备采集的语音信息透传至目标语音设备，并将目标语音设备采集的语音信息透传至第一语音设备，以实现A用户与B用户之间的交互。

示例性的，假设妈妈在A房间，孩子小明在B房间，妈妈现在需要和小明进行沟通交流。妈妈可通过语音指令唤醒A房间的语音设备(第一语音设备)，然后输入第一语音信息，如帮我连接B房间的语音设备，控制终端根据该第一语音信息，可判断出该第一语音信息包括交互意图，然后从第一语音信息中获取标识信息“B房间的语音设备”，控制终端根据该标识信息，即可确定目标语音设备为B房间的语音设备，然后建立第一语音设备与目标语音设备之间的通信通道，并将该第一语音信息透传至目标语音设备，目标语音设备被唤醒，语音输出该第一语音信息，等待小明通过B房间的语音设备回复对应的语音信息，控制终端将小明回复的语音信息透传至A房间的语音设备，A房间的语音设备输出该回复信息。控制终端通过将第一语音设备采集的语音信息透传至目标语音设备，并将目标语音设备采集的语音信息透传至第一语音设备，可实现在A房间的妈妈与在B房间的小明的交流。

本发明的交互方法，主要用于在家中各家庭成员之间的交流，通过设置在不同位置的语音设备可实现家庭成员之间的交流，不仅可提高交流效果，而且，当家庭成员双手被占用，无法方便地拨打电话时，可通过语音唤醒语音设备，并通过设置在不同位置的语音设备实现与不同房间的目标用户进行交流，不仅可提高交流的便捷性，而且不存在手机因静音或无电而导致手机无法接通的情况，进而提高交流的可靠性。

本发明提供的第二实施例，如图2所示，一种基于分布式语音设备的交互方法，应用于控制终端，控制终端可为本地网关，控制终端与设置于不同区域的多个语音设备通信连接；

该基于分布式语音设备的交互方法包括：

S200获取所述第一语音信息对应的语义；

S300根据所述语义判断所述第一语音信息是否包含交互意图；

S500建立所述第一语音设备与所述第二语音设备之间的通信通道；

其中，S400根据所述第一语音信息，在第二语音设备中确定目标语音设备具体包括：

S430当所述第一语音信息中不包括语音设备的标识信息时，将所述第一语音信息发送至第二语音设备，并控制所述第二语音设备广播所述第一语音信息；

S440接收第三语音设备采集并发送的第二语音信息；所述第三语音设备为所述第二语音设备中的任意一个或多个；

S450根据所述第二语音信息，在所述第二语音设备中确定目标语音设备。

具体地，当控制终端判断出第一语音信息中不包括语音设备的标识信息时，将该第一语音信息发送至第二语音设备，即将该第一语音信息发送至除第一语音信息以外的所有语音设备。第二语音设备被唤醒，第二语音设备广播该第一语音信息，第二语音设备所处房间内的用户听到该第一语音信息后，可根据该第一语音信息进行相应的回复。

例如，妈妈想找小明，但是不知道现在小明在哪个房间，此时，可对第一语音设备输入第一语音信息“小明，你在哪”，其他房间内的第二语音设备广播“小明，你在哪”，小明听到后，可对所处房间的语音设备输入回复信息“我在B房间”，该所处房间的语音设备即为第三语音设备，回复信息即为第二语音信息。

第三语音设备将采集到的第二语音信息发送至控制终端，控制终端根据该第二语音信息从第二语音设备中确定目标语音设备。例如，根据第二语音信息“我在B房间”即可确定目标语音设备为B房间的语音设备。

第二语音信息还可以是他人(非小明本人)的回复信息，如他人回复的“小明在B房间”，此时，仍可根据第二语音信息“小明在B房间”确定出目标语音设备为B房间的语音设备。若第二语音信息是小明本人回答的，则目标语音设备为第三语音设备，若第二语音信息是非小明本人回答的，则目标语音设备不是第三语音设备。

可选的，在接收第一语音设备采集并发送的语音信息之前还包括：

S010获取不同用户的声纹特征库；

S400所述根据所述第一语音信息，在第二语音设备中确定目标语音设备还包括：

S460提取所述第二语音信息对应的声纹特征；

S470根据所述声纹特征和所述声纹特征库，识别所述第二语音信息对应的用户身份；

S480根据所述用户身份和所述第一语音信息，从所述第三语音设备中确定目标语音设备。

具体地，控制终端还可获取各家庭成员的语音，以建立家庭成员的声纹特征库。控制终端与服务器通信连接，服务器与各家庭成员的智能终端通信连接，各家庭成员可通过智能终端上的APP完成语音录入，智能终端将录入的语音发送至服务器，服务器对各家庭成员录入的语音进行处理，提取出各家庭成员对应的声纹特征，然后建立家庭成员的声纹特征库。声纹特征可包括声调、频率等特征。各家庭成员的语音录入还可直接通过语音设备来完成，然后语音设备将各家庭成员录入的语音发送至控制终端，控制终端再发送服务器，由服务器生成声纹特征库。

控制终端接收服务器发送的声纹特征库后，将该声纹特征库存储在本地。

当控制终端无法根据第二语音信息，在第二语音设备中确定出目标语音设备时，即第二语音信息中并未包含任何语音设备的标识信息时，可提取第二语音信息对应的声纹特征，然后根据该声纹特征以及存储的声纹特征库，确定第三语音设备对应的用户身份，然后根据识别出的用户身份，从第三语音设备中确定目标语音设备。

第三语音设备可为一个或多个，当第三语音设备为一个时，则第二语音信息也为一个，若该第二语音信息对应的声纹特征与第一语音信息中包含的用户信息相匹配时，则说明采集该第二语音信息的第三语音设备即为目标语音设备。若该第二语音信息对应的声纹特征与第一语音信息中包含的用户信息不匹配时，则说明采集该第二语音信息的第三语音设备不是目标语音设备，此时，控制终端可控制第一语音设备输出提示信息，提示用户(妈妈)未找到目标用户(小明)。

当第三语音设备为多个时，每个第三语音设备接收一条第二语音信息，即第二语音信息有多条。若某条第二语音信息对应的声纹特征与第一语音信息中包含的用户信息相匹配时，则说明该条第二语音信息对应的第三语音设备即为目标语音设备。若所有的第二语音信息对应的声纹特征与第一语音信息中包含的用户信息都不匹配时，则说明所有的第三语音设备都不是目标语音设备，此时，控制终端可控制第一语音设备输出提示信息，提示用户未找到目标对象。

可选的，还包括：

S110当接收到多个语音设备采集并发送的所述第一语音信息时，获取每个语音设备发送的所述第一语音信息的分贝信息；

S120根据所述分贝信息，从发送所述第一语音信息的多个语音设备中确定第一语音设备。

具体地，当多个语音设备被用户唤醒并采集该用户输入的第一语音信息时，可根据每个语音设备采集的第一语音信息的分贝信息来确定唯一的第一语音设备，即选取分贝最大的第一语音信息对应的语音设备作为第一语音设备。

当多个语音设备采集的第一语音信息的分贝相同时，还可根据用户与语音设备之间的距离来确定第一语音设备；即选取距离用户最近的语音设备作为第一语音设备。

应理解，在上述各实施例中，各步骤序号的大小并不意味着执行顺序的先后，各步骤的执行顺序应以功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

根据本发明提供的第三实施例，如图3所示，一种基于分布式语音设备的交互装置，包括：

信息收发模块10，用于与设置于不同区域的多个语音设备通信连接，还用于接收第一语音设备采集并发送的第一语音信息；所述第一语音设备为所述多个语音设备中的任意一个；

获取模块20，用于获取所述第一语音信息对应的语义；

判断模块30，用于根据所述语义判断所述第一语音信息是否包含交互意图；

分析模块40，用于当所述第一语音信息包含交互意图时，根据所述第一语音信息，在第二语音设备中确定目标语音设备；所述第二语音设备为所述多个语音设备中除所述第一语音设备以外的其它语音设备；

通道建立模块50，用于建立所述第一语音设备与所述目标语音设备之间的通信通道。

优选地，分析模块40包括：

标识获取单元41，用于当所述第一语音信息中包括语音设备的标识信息时，获取所述标识信息；

分析单元42，用于根据所述标识信息，在所述第二语音设备中确定目标语音设备。

优选地，分析模块40包括控制单元43和分析单元42；

控制单元43，用于当所述第一语音信息中不包括语音设备的标识信息时，将所述第一语音信息发送至第二语音设备，并控制所述第二语音设备广播所述第一语音信息；

信息收发模块10，用于接收第三语音设备采集并发送的第二语音信息；所述第三语音设备为所述第二语音设备中的任意一个或多个；

分析单元42，用于根据所述第二语音信息，在所述第二语音设备中确定目标语音设备。

优选地，还包括：

特征库获取模块60，用于获取不同用户的声纹特征库；

分析模块40还包括：

提取单元44，用于提取所述第二语音信息对应的声纹特征；

识别单元45，用于根据所述声纹特征和所述声纹特征库，识别所述第二语音信息对应的用户身份；

分析单元42，还用于根据所述用户身份和所述第一语音信息，从所述第三语音设备中确定目标语音设备。

优选地，获取模块20，还用于当接收到多个语音设备采集并发送的所述第一语音信息时，获取每个语音设备发送的所述第一语音信息的分贝信息；

分析模块40，还用于根据所述分贝信息，从发送所述第一语音信息的多个语音设备中确定第一语音设备。

本实施例中的各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

应当说明的是，上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于分布式语音设备的交互方法，其特征在于，应用于控制终端，所述控制终端与设置于不同区域的多个语音设备通信连接；

所述基于分布式语音设备的交互方法包括：

获取所述第一语音信息对应的语义；

根据所述语义判断所述第一语音信息是否包含交互意图；

2.根据权利要求1所述的一种基于分布式语音设备的交互方法，其特征在于，所述根据所述第一语音信息，在第二语音设备中确定目标语音设备具体包括：

3.根据权利要求1或2所述的一种基于分布式语音设备的交互方法，其特征在于，所述根据所述第一语音信息，在第二语音设备中确定目标语音设备具体包括：

4.根据权利要求3所述的一种基于分布式语音设备的交互方法，其特征在于，所述接收第一语音设备采集并发送的语音信息之前还包括：

获取不同用户的声纹特征库；

提取所述第二语音信息对应的声纹特征；

5.根据权利要求1所述的一种基于分布式语音设备的交互方法，其特征在于，还包括：

6.一种基于分布式语音设备的交互装置，其特征在于，包括：

获取模块，用于获取所述第一语音信息对应的语义；

7.根据权利要求6所述的一种基于分布式语音设备的交互装置，其特征在于，所述分析模块包括：

8.根据权利要求6或7所述的一种基于分布式语音设备的交互装置，其特征在于，所述分析模块包括控制单元和分析单元；

9.根据权利要求8所述的一种基于分布式语音设备的交互装置，其特征在于，还包括：

特征库获取模块，用于获取不同用户的声纹特征库；

所述分析模块还包括：

提取单元，用于提取所述第二语音信息对应的声纹特征；

10.根据权利要求6所述的一种基于分布式语音设备的交互装置，其特征在于，

所述获取模块，还用于当接收到多个语音设备采集并发送的所述第一语音信息时，获取每个语音设备发送的所述第一语音信息的分贝信息；