CN110136707A

CN110136707A - 一种用于进行多设备自主决策的人机交互***

Info

Publication number: CN110136707A
Application number: CN201910323610.8A
Authority: CN
Inventors: 李霄寒
Original assignee: Beijing Yunzhisheng Information Technology Co Ltd
Current assignee: Beijing Yunzhisheng Information Technology Co Ltd
Priority date: 2019-04-22
Filing date: 2019-04-22
Publication date: 2019-08-16
Anticipated expiration: 2039-04-22
Also published as: CN110136707B

Abstract

本发明提供了一种用于进行多设备自主决策的人机交互***，该用于进行多设备自主决策的人机交互***是若干设备中介模块获取其对应的每个终端设备关于来自外界的语音信号的置信度数据，并根据该置信度数据和知识库模块中关于该终端设备的第一必要信息生成关于该置信度数据的置信度综合信息，最后再通过决策中心模块根据该置信度综合信息和该知识库模块中关于该终端设备的第二必要信息生成用于控制该终端设备的控制反馈信号，并按照预设规则向其中一个终端设备发送该控制反馈信号，以此控制该终端设备作出适应性的响应操作。

Description

一种用于进行多设备自主决策的人机交互***

技术领域

本发明涉及人机交互的技术领域，特别涉及一种用于进行多设备自主决策的人机交互***。

背景技术

随着人工智能技术的发展，人工智能技术已经逐渐进入到人们的生活和工作中。用户可依靠人工智能技术对不同的终端设备实施不同的控制操作，这种控制操作明显不同于传统的控制操作手段。一般而言，传统的控制操作手段都是基于用户对终端设备实施按键控制等直接接触控制方式来实现的，而目前依靠人工智能技术对终端设备实施控制操作则需要用户对终端设备发出语音控制命令即可驱动终端设备作出适应性的工作状态切换。而终端设备能够依据来自用户的语音控制命令进行工作状态切换主要是通过人工智能技术对该语音控制命令进行语音释义，从而得到该语音控制命令实际包含的关于用户的语音意图含义。这种基于对应语音控制命令进行语音释义的语音交互模式是现有人机交互***采用的主要交互模式，这种语音交互模式能够最大限度地提高用户对不同终端设备的控制便捷性和准确性。

由于语音交互模式广泛应用于不同终端设备的控制操作中，用户与某一空间的单一终端设备进行语音交互的过程中，需要用户通过呼喊终端设备的名字来唤醒该终端设备，再与该终端设备进行一系列的后续交互，从而实现对该终端设备的语音控制操作。但是在实际应用场景中，同一空间并不可能只存在一个具有语音控制功能的终端设备，当同一空间同时存在多个具有语音交互控制功能的终端设备，此时用户需要对每个终端设备设定不同的名字，否则会存在用户呼喊一个名字时，多个不同终端设备同时进行响应的情况发生。为了克服这一问题，用户需要对不同的终端设备设定不同的名字，但是这种方式需要用户同时记忆不同终端设备及其设定名字的匹配关系，这对于用户而言是极不方便的；此外，当不同终端设备分别存在于不同空间时，现有的语音交互方式无法使得用户能够在其中一个空间内对另一个空间的终端设备进行语音控制操作。

发明内容

针对现有技术存在的缺陷，本发明提供一种用于进行多设备自主决策的人机交互***，该用于进行多设备自主决策的人机交互***是若干设备中介模块获取其对应的每个终端设备关于来自外界的语音信号的置信度数据，并根据该置信度数据和知识库模块中关于该终端设备的第一必要信息生成关于该置信度数据的置信度综合信息，最后再通过决策中心模块根据该置信度综合信息和该知识库模块中关于该终端设备的第二必要信息生成用于控制该终端设备的控制反馈信号，并按照预设规则向其中一个终端设备发送该控制反馈信号，以此控制该终端设备作出适应性的响应操作。可见，该用于进行多设备自主决策的人机交互***通过其中的置信度分析模块，对不同终端设备提供的信息进行综合分析与判断，使得该不同终端设备都存在被语音信号唤醒的情况下，确定其中一个最合适的终端设备被该语音信号唤醒，并赋予该被唤醒的终端设备相应的反馈响应角色，从而大大地提高用户的语音控制体验；此外，该用于进行多设备自主决策的人机交互***还通过该决策中心模块结合该知识库模块中关于语音信号中的用户语音意图和终端设备各自的运作功能信息，确定其中的终端设备执行相应的工作模式，从而完成现有语音交互模式无法实现的语音控制功能。

本发明提供一种用于进行多设备自主决策的人机交互***，其特征在于：

所述用于进行多设备自主决策的人机交互***包括若干设备中介模块、置信度分析模块、决策中心模块和知识库模块；其中，

若干所述设备中介模块用于与若干终端设备进行一一对应连接，每一所述设备中介模块用于获取来自外界的语音信号，以此计算出其对应连接的终端设备关于所述语音信号的置信度数据；

所述置信度分析模块用于根据所述知识库模块存储的第一必要信息，生成关于所有所述置信度数据的置信度综合信息；

所述决策中心模块用于根据所述知识库模块存储的第二必要信息和所述置信度综合信息，按照预设规则向所述若干设备中介模块的其中一个发送控制反馈信号，以此控制与所述其中一个设备中介模块对应的终端设备做出适应性响应操作；

进一步，所述若干设备中介模块中的每一个均包括语音信号接收子模块、语音信号唤醒子模块和语音信号分析子模块；其中

所述语音信号接收子模块包括麦克风阵列，所述麦克风阵列用于接收来自外界的语音信号；

所述语音信号唤醒子模块用于根据所述来自外界的语音信号，对其相应的终端设备进行唤醒操作；

所述语音信号分析子模块用于对所述来自外界的语音信号进行分析，以此获取关于所述来自外界的语音信号的语音释义信息；

进一步，所述语音信号唤醒子模块对其相应的终端设备进行唤醒操作具体包括，

所述语音信号唤醒子模块从所述来自外界的语音信号中提取特征关键词，并将所述特征关键词与其对应的终端设备所属的唤醒词进行匹配处理；其中，

若所述特征关键词与所述唤醒词相匹配，则所述语音信号唤醒子模块对其相应的终端设备执行唤醒操作；

若所述特征关键词与所述唤醒词不匹配，则所述语音信号唤醒子模块不对其相应的终端设备执行唤醒操作；

进一步，所述若干设备中介模块中的每一个均包括唤醒词检测引擎子模块和置信度计算子模块；

所述唤醒词检测引擎子模块用于生成所述来自外界的语音信号中关于所述终端设备的唤醒词检测信息；

所述置信度计算子模块用于根据所述语音释义信息、若干所述终端设备中每一个对应的设备功能信息与所述唤醒词检测信息，生成关于所有所述终端设备中每一个对应的所述置信度数据；

进一步，所述若干设备中介模块中的每一个均包括设备功能信息获取子模块；其中，

所述设备功能信息获取子模块用于获取每一个终端设备对应的所述设备功能信息；

所述设备功能信息获取子模块至少包括音频播放功能确定单元、视频播放功能确定单元、照明功能确定单元、温控功能确定单元、运动功能确定单元或者清洗功能确定单元；

所述音频播放功能确定单元用于确定所述终端设备是否具备音频播放功能，以此形成所述设备功能信息的一部分信息；

所述视频播放功能确定单元用于确定所述终端设备是否具备视频播放功能，以此形成所述设备功能信息的一部分信息；

所述照明功能确定单元用于确定所述终端设备是否具备照明功能，以此形成所述设备功能信息的一部分信息；

所述温控功能确定单元用于确定所述终端设备是否具备温控功能，以此形成所述设备功能信息的一部分信息；

所述运动功能确定单元用于确定所述终端设备是否具备运动位移功能，以此形成所述设备功能信息的一部分信息；

所述清洗功能确定单元用于确定所述终端设备是否具备清洗能，以此形成所述设备功能信息的一部分信息；

进一步，所述置信度分析模块包括第一时钟信号生成子模块、置信度数据接收子模块、第一必要信息获取子模块和置信度综合计算子模块；其中，

所述第一时钟信号生成子模块用于生成第一时钟信号；

所述置信度数据接收子模块用于根据所述第一时钟信号，从所有所述设备中介模块中接收所述置信度数据；

所述第一必要信息获取子模块用于从所述知识库模块中获取关于所有所述终端设备对应的所述第一必要信息，其中，所述第一必要信息至少包括关于所述终端设备自身运作功能和工作状态的信息；

所述置信度综合计算子模块用于根据所述第一必要信息和所述置信度数据，计算得到所述置信度综合信息；

进一步，所述决策中心模块包括第二必要信息获取子模块和反馈信号生成子模块；其中

所述第二必要信息获取子模块用于从所述知识库模块中获取关于所有所述终端设备对应的所述第二必要信息，其中，所述第二必要信息至少包括所述语音信号的内容信息、所述语音信号中包含的外界用户意图信息、所述终端设备的类型信息、所述终端设备的名称信息或者所述终端设备的运作功能信息；

所述反馈信号生成子模块用于根据所述第二必要信息和所述置信度综合信息，生成所述控制反馈信号；

进一步，所述决策中心模块包括第二必要信息获取子模块、反馈信号生成子模块和终端设备指定子模块；其中，

所述第二必要信息获取子模块用于从所述知识库模块中获取关于所有终端设备中的每一个与外界用户之间的距离信息，以作为所述第二必要信息；

所述终端设备指定子模块用于将所述控制反馈信号发送至于所述外界用户距离最小的终端设备对应的设备中介模块中，以使所述设备中介模块能够根据所述控制反馈信号实施适应性的反馈操作；

所述第二必要信息获取子模块用于从所述知识库模块中获取所述第二必要信息；

所述终端设备指定子模块用于根据预设选择规则确定若干终端设备中的一个作为目标终端设备，并将所述控制反馈信号发送至所述目标终端设备对应的设备中介模块中，以使所述设备中介模块能够根据所述控制反馈信号实施适应性的反馈操作；

进一步，所述设备中介模块能够根据所述控制反馈信号实施适应性的反馈操作具体包括，

所述设备中介模块能够根据所述控制反馈信号指示其对应的终端设备执行与所述来自外界的语音信号相匹配的语音交互反馈操作；或者，

所述设备中介模块能够根据所述控制反馈信号指示器对应的终端设备执行与所述来自外界的语音信号相匹配的工作状态切换操作。

相比于现有技术，该用于进行多设备自主决策的人机交互***是若干设备中介模块获取其对应的每个终端设备关于来自外界的语音信号的置信度数据，并根据该置信度数据和知识库模块中关于该终端设备的第一必要信息生成关于该置信度数据的置信度综合信息，最后再通过决策中心模块根据该置信度综合信息和该知识库模块中关于该终端设备的第二必要信息生成用于控制该终端设备的控制反馈信号，并按照预设规则向其中一个终端设备发送该控制反馈信号，以此控制该终端设备作出适应性的响应操作。可见，该用于进行多设备自主决策的人机交互***通过其中的置信度分析模块，对不同终端设备提供的信息进行综合分析与判断，使得该不同终端设备都存在被语音信号唤醒的情况下，确定其中一个最合适的终端设备被该语音信号唤醒，并赋予该被唤醒的终端设备相应的反馈响应角色，从而大大地提高用户的语音控制体验；此外，该用于进行多设备自主决策的人机交互***还通过该决策中心模块结合该知识库模块中关于语音信号中的用户语音意图和终端设备各自的运作功能信息，确定其中的终端设备执行相应的工作模式，从而完成现有语音交互模式无法实现的语音控制功能。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提供的一种用于进行多设备自主决策的人机交互***的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参阅图1，为本发明实施例提供的一种用于进行多设备自主决策的人机交互***的结构示意图。该用于进行多设备自主决策的人机交互***可包括但不限于若干设备中介模块、置信度分析模块、决策中心模块和知识库模块。

优选地，若干该设备中介模块用于与若干终端设备进行一一对应连接，每一该设备中介模块用于获取来自外界的语音信号，以此计算出其对应连接的终端设备关于该语音信号的置信度数据；

优选地，该置信度分析模块用于根据该知识库模块存储的第一必要信息，生成关于所有该置信度数据的置信度综合信息；

优选地，该决策中心模块用于根据该知识库模块存储的第二必要信息和该置信度综合信息，按照预设规则向该若干设备中介模块的其中一个发送控制反馈信号，以此控制与该其中一个设备中介模块对应的终端设备做出适应性响应操作；

优选地，该若干设备中介模块中的每一个均可包括但不限于语音信号接收子模块、语音信号唤醒子模块和语音信号分析子模块。

优选地，该语音信号接收子模块包括麦克风阵列，该麦克风阵列用于接收来自外界的语音信号；

优选地，该语音信号唤醒子模块用于根据该来自外界的语音信号，对其相应的终端设备进行唤醒操作；

优选地，该语音信号分析子模块用于对该来自外界的语音信号进行分析，以此获取关于该来自外界的语音信号的语音释义信息。

优选地，该语音信号唤醒子模块对其相应的终端设备进行唤醒操作具体包括，

该语音信号唤醒子模块从该来自外界的语音信号中提取特征关键词，并将该特征关键词与其对应的终端设备所属的唤醒词进行匹配处理；其中，

若该特征关键词与该唤醒词相匹配，则该语音信号唤醒子模块对其相应的终端设备执行唤醒操作；

若该特征关键词与该唤醒词不匹配，则该语音信号唤醒子模块不对其相应的终端设备执行唤醒操作。

优选地，该若干设备中介模块中的每一个均可包括但不限于唤醒词检测引擎子模块和置信度计算子模块；

优选地，该唤醒词检测引擎子模块用于生成该来自外界的语音信号中关于该终端设备的唤醒词检测信息；

优选地，该置信度计算子模块用于根据该语音释义信息、若干该终端设备中每一个对应的设备功能信息与该唤醒词检测信息，生成关于所有该终端设备中每一个对应的该置信度数据。

优选地，该若干设备中介模块中的每一个均可包括但不限于设备功能信息获取子模块；

优选地，该设备功能信息获取子模块用于获取每一个终端设备对应的该设备功能信息；

优选地，该设备功能信息获取子模块至少包括音频播放功能确定单元、视频播放功能确定单元、照明功能确定单元、温控功能确定单元、运动功能确定单元或者清洗功能确定单元；

优选地，该音频播放功能确定单元用于确定该终端设备是否具备音频播放功能，以此形成该设备功能信息的一部分信息；

优选地，该视频播放功能确定单元用于确定该终端设备是否具备视频播放功能，以此形成该设备功能信息的一部分信息；

优选地，该照明功能确定单元用于确定该终端设备是否具备照明功能，以此形成该设备功能信息的一部分信息；

优选地，该温控功能确定单元用于确定该终端设备是否具备温控功能，以此形成该设备功能信息的一部分信息；

优选地，该运动功能确定单元用于确定该终端设备是否具备运动位移功能，以此形成该设备功能信息的一部分信息；

优选地，该清洗功能确定单元用于确定该终端设备是否具备清洗能，以此形成该设备功能信息的一部分信息。

优选地，该置信度分析模块可包括但不限于第一时钟信号生成子模块、置信度数据接收子模块、第一必要信息获取子模块和置信度综合计算子模块；

优选地，该第一时钟信号生成子模块用于生成第一时钟信号；

优选地，该置信度数据接收子模块用于根据该第一时钟信号，从所有该设备中介模块中接收该置信度数据；

优选地，该第一必要信息获取子模块用于从该知识库模块中获取关于所有该终端设备对应的该第一必要信息，其中，该第一必要信息至少包括关于该终端设备自身运作功能和工作状态的信息；

优选地，该置信度综合计算子模块用于根据该第一必要信息和该置信度数据，计算得到该置信度综合信息。

优选地，决策中心模块包括但不限于第二必要信息获取子模块和反馈信号生成子模块；

优选地，该第二必要信息获取子模块用于从该知识库模块中获取关于所有该终端设备对应的该第二必要信息，其中，该第二必要信息至少包括该语音信号的内容信息、该语音信号中包含的外界用户意图信息、该终端设备的类型信息、该终端设备的名称信息或者该终端设备的运作功能信息；

优选地，该反馈信号生成子模块用于根据该第二必要信息和该置信度综合信息，生成该控制反馈信号。

优选地，该决策中心模块可包括但不限于第二必要信息获取子模块、反馈信号生成子模块和终端设备指定子模块；

优选地，该第二必要信息获取子模块用于从该知识库模块中获取关于所有终端设备中的每一个与外界用户之间的距离信息，以作为该第二必要信息；

优选地，该反馈信号生成子模块用于根据该第二必要信息和该置信度综合信息，生成该控制反馈信号；

优选地，该终端设备指定子模块用于将该控制反馈信号发送至于该外界用户距离最小的终端设备对应的设备中介模块中，以使该设备中介模块能够根据该控制反馈信号实施适应性的反馈操作。

优选地，该第二必要信息获取子模块用于从该知识库模块中获取该第二必要信息；

优选地，该终端设备指定子模块用于根据预设选择规则确定若干终端设备中的一个作为目标终端设备，并将该控制反馈信号发送至该目标终端设备对应的设备中介模块中，以使该设备中介模块能够根据该控制反馈信号实施适应性的反馈操作。

优选地，该设备中介模块能够根据该控制反馈信号实施适应性的反馈操作具体包括，

该设备中介模块能够根据该控制反馈信号指示其对应的终端设备执行与该来自外界的语音信号相匹配的语音交互反馈操作；或者，

该设备中介模块能够根据该控制反馈信号指示器对应的终端设备执行与该来自外界的语音信号相匹配的工作状态切换操作。

从上述实施例可以看出，该用于进行多设备自主决策的人机交互***是若干设备中介模块获取其对应的每个终端设备关于来自外界的语音信号的置信度数据，并根据该置信度数据和知识库模块中关于该终端设备的第一必要信息生成关于该置信度数据的置信度综合信息，最后再通过决策中心模块根据该置信度综合信息和该知识库模块中关于该终端设备的第二必要信息生成用于控制该终端设备的控制反馈信号，并按照预设规则向其中一个终端设备发送该控制反馈信号，以此控制该终端设备作出适应性的响应操作。可见，该用于进行多设备自主决策的人机交互***通过其中的置信度分析模块，对不同终端设备提供的信息进行综合分析与判断，使得该不同终端设备都存在被语音信号唤醒的情况下，确定其中一个最合适的终端设备被该语音信号唤醒，并赋予该被唤醒的终端设备相应的反馈响应角色，从而大大地提高用户的语音控制体验；此外，该用于进行多设备自主决策的人机交互***还通过该决策中心模块结合该知识库模块中关于语音信号中的用户语音意图和终端设备各自的运作功能信息，确定其中的终端设备执行相应的工作模式，从而完成现有语音交互模式无法实现的语音控制功能。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种用于进行多设备自主决策的人机交互***，其特征在于：

所述决策中心模块用于根据所述知识库模块存储的第二必要信息和所述置信度综合信息，按照预设规则向所述若干设备中介模块的其中一个发送控制反馈信号，以此控制与所述其中一个设备中介模块对应的终端设备做出适应性响应操作。

2.如权利要求1所述的用于进行多设备自主决策的人机交互***，其特征在于：所述若干设备中介模块中的每一个均包括语音信号接收子模块、语音信号唤醒子模块和语音信号分析子模块；其中

所述语音信号分析子模块用于对所述来自外界的语音信号进行分析，以此获取关于所述来自外界的语音信号的语音释义信息。

3.如权利要求2所述的用于进行多设备自主决策的人机交互***，其特征在于：

所述语音信号唤醒子模块对其相应的终端设备进行唤醒操作具体包括，所述语音信号唤醒子模块从所述来自外界的语音信号中提取特征关键词，并将所述特征关键词与其对应的终端设备所属的唤醒词进行匹配处理；其中，

若所述特征关键词与所述唤醒词不匹配，则所述语音信号唤醒子模块不对其相应的终端设备执行唤醒操作。

4.如权利要求2所述的用于进行多设备自主决策的人机交互***，其特征在于：所述若干设备中介模块中的每一个均包括唤醒词检测引擎子模块和置信度计算子模块；

所述置信度计算子模块用于根据所述语音释义信息、若干所述终端设备中每一个对应的设备功能信息与所述唤醒词检测信息，生成关于所有所述终端设备中每一个对应的所述置信度数据。

5.如权利要求4所述的用于进行多设备自主决策的人机交互***，其特征在于：所述若干设备中介模块中的每一个均包括设备功能信息获取子模块；其中，

所述清洗功能确定单元用于确定所述终端设备是否具备清洗能，以此形成所述设备功能信息的一部分信息。

6.如权利要求1所述的用于进行多设备自主决策的人机交互***，其特征在于：所述置信度分析模块包括第一时钟信号生成子模块、置信度数据接收子模块、第一必要信息获取子模块和置信度综合计算子模块；其中，

所述第一时钟信号生成子模块用于生成第一时钟信号；

所述置信度综合计算子模块用于根据所述第一必要信息和所述置信度数据，计算得到所述置信度综合信息。

7.如权利要求1所述的用于进行多设备自主决策的人机交互***，其特征在于：所述决策中心模块包括第二必要信息获取子模块和反馈信号生成子模块；其中

所述反馈信号生成子模块用于根据所述第二必要信息和所述置信度综合信息，生成所述控制反馈信号。

8.如权利要求1所述的用于进行多设备自主决策的人机交互***，其特征在于：所述决策中心模块包括第二必要信息获取子模块、反馈信号生成子模块和终端设备指定子模块；其中，

所述终端设备指定子模块用于将所述控制反馈信号发送至于所述外界用户距离最小的终端设备对应的设备中介模块中，以使所述设备中介模块能够根据所述控制反馈信号实施适应性的反馈操作。

9.如权利要求1所述的用于进行多设备自主决策的人机交互***，其特征在于：所述决策中心模块包括第二必要信息获取子模块、反馈信号生成子模块和终端设备指定子模块；其中，

所述终端设备指定子模块用于根据预设选择规则确定若干终端设备中的一个作为目标终端设备，并将所述控制反馈信号发送至所述目标终端设备对应的设备中介模块中，以使所述设备中介模块能够根据所述控制反馈信号实施适应性的反馈操作。

10.如权利要求8或9所述的用于进行多设备自主决策的人机交互***，其特征在于：所述设备中介模块能够根据所述控制反馈信号实施适应性的反馈操作具体包括，