CN113711307A

CN113711307A - 设备控制装置及设备控制方法

Info

Publication number: CN113711307A
Application number: CN201980095539.0A
Authority: CN
Inventors: 平井正人; 饭泽大介
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2019-04-23
Filing date: 2019-04-23
Publication date: 2021-11-26
Anticipated expiration: 2039-04-23
Also published as: JP6956921B2; CN113711307B; JPWO2020217318A1; US20230326456A1; WO2020217318A1

Abstract

具备：设备功能信息取得部(101)，其取得将对象设备和使该对象设备执行的对象功能对应起来的设备功能信息，该对象设备和该对象功能是基于声音识别结果而判定出的；时间判定部(103)，其判定从说话到执行对象功能为止的时间是否长；应答文决定部(104)，其在时间判定部(103)判定为从说话到执行对象功能为止的时间长的情况下，基于设备功能信息取得部(101)取得的设备功能信息，决定与对象设备关联的第1应答文；以及输出控制部(105)，其输出表示应答文决定部(104)决定的第1应答文的信息。

Description

设备控制装置及设备控制方法

技术领域

本发明涉及基于针对说话声音的声音识别结果来控制设备的设备控制装置及设备控制方法。

背景技术

以往，已知有基于针对用户的说话声音的声音识别结果来控制各种设备的技术。在这样的技术中，从说话到由设备执行功能为止的时间有时空置长。

这里，在专利文献1中公开了一种声音对话***，该声音对话***为了填补直至得到针对用户的说话的声音识别结果为止的应答延迟时间而输出作为暂定性应答的“连接词”。在专利文献1的声音对话***中，“连接词”为“是”或“嗯”这样的简单的回应或附和。

现有技术文献

专利文献

专利文献1：日本特开2018-45202号公报

发明内容

发明要解决的问题

在基于针对用户的说话声音的声音识别结果来控制设备的技术中，在从说话到由设备执行功能为止的时间长的情况下，用户会等待较长时间，直至执行该功能为止。在以往的该技术中，存在在此期间用户无法识别是否将要通过设备执行预期功能这样的问题。

对于这样的问题，在专利文献1所公开的技术中，用于填补直至得到针对说话的声音识别结果为止的应答延迟时间，没有对从说话到由设备执行功能为止的时间作出考虑。此外，在该技术中输出的连接词仅仅是简单的回应或附和。因此，在专利文献1所公开的技术中，依然没有解决上述问题。

本发明是为了解决上述问题而完成的，其目的在于，在基于针对用户的说话声音的声音识别结果来控制设备的技术中，即便在从说话到由设备执行功能为止的时间长的情况下，在此期间，用户也能够识别是否将要通过设备执行预期功能。

用于解决问题的手段

本发明的设备控制装置是基于针对说话声音的声音识别结果来控制设备的设备控制装置，具备：设备功能信息取得部，其取得将对象设备和使该对象设备执行的对象功能对应起来的设备功能信息，该对象设备和该对象功能是基于声音识别结果而判定出的；时间判定部，其判定从说话到执行对象功能为止的时间是否长；应答文决定部，其在时间判定部判定为从说话到执行对象功能为止的时间长的情况下，基于设备功能信息取得部取得的设备功能信息，决定与对象设备关联的第1应答文；以及输出控制部，其输出表示应答文决定部决定的第1应答文的信息。

发明的效果

根据本发明，在基于针对用户的说话声音的声音识别结果来控制设备的技术中，即便在从说话到由设备执行功能为止的时间长的情况下，在此期间，用户也能够识别是否将要通过设备执行预期功能。

附图说明

图1是说明具备实施方式1的设备控制装置的设备控制***的结构的一例的图。

图2是示出实施方式1的设备控制装置、该设备控制装置所具备的声音操作装置、以及家电设备的概要结构例的图。

图3是示出实施方式1的设备控制装置所具备的声音操作装置的结构例的图。

图4是示出实施方式1的设备控制装置所具备的应答输出部及命令控制部的结构例的图。

图5是用于说明在实施方式1中应答文决定部在决定第1应答文时参照的应答文信息的内容的一例的图。

图6是用于说明在实施方式1中存储于存储部的执行应答信息的内容的一例的图。

图7是用于说明实施方式1的设备控制装置的动作的流程图。

图8是用于对实施方式1的设备控制装置的应答输出部的动作详细进行说明的流程图。

图9是用于对实施方式1的设备控制装置的命令控制部的动作详细进行说明的流程图。

图10是示出在实施方式1的设备控制装置进行图8及图9中说明的动作并且判定为执行所需时间长的情况下使第1应答文从声音输出装置声音输出为止的时间流的图像的图。

图11是示出实施方式2的设备控制装置的结构例的图。

图12是用于对实施方式2的设备控制装置的命令控制部的动作详细进行说明的流程图。

图13是示出实施方式2的设备控制装置进行图11中说明的动作并且保留了功能命令的输出直至第1应答文的声音输出完成为止的情况下的时间流的图像的图。

图14是示出实施方式3的设备控制装置的结构例的图。

图15是用于对实施方式3的设备控制装置的应答输出部的动作详细进行说明的流程图。

图16是示出在实施方式3的设备控制装置进行图15及图9中说明的动作并且判定为执行所需时间长的情况下使第1应答文从声音输出装置进行声音输出为止的时间流的图像的图。

图17是示出实施方式4的设备控制装置的结构例的图。

图18是用于说明在实施方式1中应答文决定部在决定第2应答文时参照的第2应答文信息的内容的一例的图。

图19是用于说明实施方式4的设备控制装置的应答输出部的详细动作的流程图。

图20是示出在实施方式4的设备控制装置进行图19及图9中说明的动作并且判定为从输出表示第1应答文的信息起的时间长的情况下使第2应答文从声音输出装置声音输出为止的时间流的图像的图。

图21是示出实施方式5的设备控制装置结构例的图。

图22是用于说明在实施方式5中应答文决定部在决定第1应答文时参照的第1应答文信息的内容的一例的图。

图23是用于说明实施方式5的设备控制装置的应答输出部的详细动作的流程图。

图24是示出在实施方式5的设备控制装置进行图23中说明的动作并且判定为执行所需时间长的情况下使声音输出装置声音输出与第1预测经过时间相应的长度的第1应答文为止的时间流的图像的图。

图25是示出实施方式6的设备控制装置的结构例的图。

图26是用于说明实施方式6的设备控制装置的应答输出部的详细动作的流程图。

图27是示出在实施方式6的设备控制装置进行图26中说明的动作并且判定为执行所需时间长的情况下使声音输出装置以与第1预测经过时间相应的速度声音输出第1应答文为止的时间流的图像的图。

图28是示出实施方式7的设备控制装置的结构例的图。

图29是用于说明实施方式7的设备控制装置的应答输出部的详细动作的流程图。

图30是示出在实施方式7的设备控制装置进行图28中说明的动作并且判定为使对象设备执行的对象功能的紧急度较高的情况下、使促使手动地操作对象设备的消息从声音输出装置声音输出的情况下的时间流的图像的图。

图31是示出实施方式8的设备控制装置的结构例的图。

图32A、图32B是示出实施方式1～实施方式8的设备控制装置的硬件结构的一例的图。

图33是示出在实施方式1的设备控制***中声音输入装置及声音输出装置搭载于家电设备的情况下的设备控制***的结构例的图。

图34是示出在实施方式1的设备控制***中设备控制装置搭载于家电设备的情况下的设备控制***的结构例的图。

图35示出在实施方式1的设备控制***中设备控制装置、声音输入装置及声音输出装置搭载于家电设备的情况下的设备控制***的结构例。

具体实施方式

以下，参照附图对本发明的实施方式详细进行说明。

实施方式1.

实施方式1的设备控制装置1基于针对用户的说话声音的声音识别结果来控制各种设备，使该设备具有的功能被执行。此外，实施方式1的设备控制装置1在从用户说话到由设备执行功能为止的时间长的情况下，能够声音输出与该设备关联的应答文。

另外，在以下的说明中，作为一例，将由实施方式1的设备控制装置1控制的设备设为在住宅中使用的家电设备。

图1是说明具备实施方式1的设备控制装置1的设备控制***1000的结构的一例的图。

设备控制***1000具备设备控制装置1、声音输入装置41、声音输出装置42及家电设备5。设备控制装置1具备声音操作装置300。

设备控制装置1例如配备在设置于住宅外的场所的服务器中，经由网络而与声音输入装置41、声音输出装置42及家电设备5连接。

家电设备5包含微波炉、IH烹饪加热器、电饭锅、电视或空调等在住宅中使用的所有电器产品。

另外，在图1中，仅示出1个配备在设备控制***1000中的家电设备5，但在设备控制***1000中可以连接2个以上的家电设备5。

设备控制装置1所具备的声音操作装置300针对从声音输入装置41取得的用户的说话声音执行声音识别处理，得到声音识别结果。声音操作装置300基于声音识别结果，判定成为控制对象的家电设备5，并且判定该家电设备5所具有的功能中的使该家电设备5执行的功能。

在实施方式1中，将基于针对用户的说话声音的声音识别结果而判定的成为控制对象的家电设备5称为“对象设备”。此外，也将“对象设备”所具有的功能中的基于针对用户的说话声音的声音识别结果而执行的功能称为“对象功能”。

声音操作装置300向设备控制装置1输出将判定出的对象设备与对象功能对应起来的信息(以下称为“设备功能信息”。)和用户的说话声音。声音操作装置300也可以使设备功能信息进一步包含声音识别结果。

设备控制装置1在从声音操作装置300取得说话声音时，判定从说话到执行对象功能为止的时间(以下称为“执行所需时间”。)是否长。设备控制装置1在判定为执行所需时间长的情况下，基于从声音操作装置300取得的设备功能信息，决定与对象功能关联的应答文。设备控制装置1在决定出与对象功能关联的应答文的情况下，将表示该应答文的信息向声音输出装置42输出。

此外，设备控制装置1基于从声音操作装置300输出的设备功能信息，生成用于使对象功能被执行的功能命令，向对象设备输出该功能命令。

设备控制装置1在从对象设备输出了通知基于功能命令的对象功能的执行完成的执行完成通知时，使声音输出装置42输出用于通知对象设备完成了对象功能的执行的执行应答。

家电设备5基于从设备控制装置1输出的功能命令，执行自身具有的功能。

家电设备5在基于从设备控制装置1输出的功能命令而完成自身具有的功能的执行时，向设备控制装置1发送执行完成通知。

声音输入装置41是能够受理用户的说话声音并向声音操作装置300输入声音信号的麦克风等。

声音输出装置42是能够向外部输出声音的扬声器等。

声音输入装置41和声音输出装置42也可以配备在所谓的智能扬声器中。

图2是示出实施方式1的设备控制装置1、该设备控制装置1所具备的声音操作装置300及家电设备5的概要结构例的图。

另外，在图2中，声音输入装置41及声音输出装置42配备在智能扬声器4中。

如图2所示，设备控制装置1除了具备声音操作装置300之外，还具备应答输出部100及命令控制部200。应答输出部100在从声音操作装置300取得说话声音时，判定执行所需时间是否长。应答输出部100在判定为执行所需时间长的情况下，基于设备功能信息，决定与对象功能关联的应答文。应答输出部100在决定了与对象功能关联的应答文的情况下，将表示该应答文的信息向声音输出装置42输出。命令控制部200基于从声音操作装置300输出的设备功能信息，生成用于使对象功能被执行的功能命令，向对象设备输出该功能命令。

家电设备5的功能命令取得部51取得从设备控制装置1的命令控制部200输出的功能命令。

家电设备5的功能命令执行部52基于功能命令取得部51取得的功能命令，执行家电设备5所具有的对象功能。

在功能命令执行部52执行对象功能时，家电设备5的执行通知部53向设备控制装置1的应答输出部100输出执行完成通知。具体而言，执行通知部53经由网络向应答输出部100发送执行完成通知。

图3及图4是示出实施方式1的设备控制装置1的结构例的图，图3是示出实施方式1的设备控制装置1所具备的声音操作装置300的结构例的图，图4是示出实施方式1的设备控制装置1所具备的应答输出部100及命令控制部200的结构例的图。另外，为了简单说明，在图3中省略声音输出装置42及家电设备5的图示，在图4中省略声音输入装置41的图示。

针对设备控制装置1的结构，首先，使用图3从设备控制装置1所具备的声音操作装置300的结构例进行说明。

如图3所示，声音操作装置300具备声音取得部301、声音识别部302、声音识别词典DB(DataBase)303、设备功能判定部304及设备功能DB305。

声音取得部301从声音输入装置41取得说话声音。

用户向声音输入装置41说出用于使家电设备5所具有的功能被执行的指示。例如，在家电设备5包含IH烹饪加热器的情况下，用户向声音输入装置41说出“用IH烹饪加热器烤鲑鱼切块”，由此，能够指示IH烹饪加热器执行以切块模式烤鱼的功能。此外，例如，在家电设备5包含光波炉的情况下，用户说出“用光波炉加热烫酒”，由此，能够指示光波炉执行以烫酒模式进行加热的功能。

声音取得部301取得由声音输入装置41受理到的用户的说话声音。

声音取得部301将取得的说话声音向声音识别部302输出。此外，声音取得部301将取得的说话声音向应答输出部100输出。

声音识别部302执行声音识别处理。声音识别部302使用现有的声音识别技术执行声音识别处理即可。在实施方式1的设备控制装置1中，例如，声音识别部302将声音取得部301取得的说话声音与声音识别词典DB303进行对照，执行确定说话声音所包含的1个以上的单词的声音识别处理。在声音识别部302执行确定说话声音所包含的1个以上的单词的声音识别处理的情况下，声音识别结果例如是该1个以上的单词。

声音识别词典DB303是存储有用于进行声音识别的声音识别词典的数据库。

声音识别部302将声音取得部301取得的说话声音与存储在声音识别词典DB303中的声音识别词典进行对照，由此确定说话声音所包含的单词。

例如，使用上述例子说明的话，针对说话声音“IH烹饪加热器烤鲑鱼切块”，声音识别部302确定“IH烹饪加热器”、“鲑鱼”、“切块”及“烤”这样的单词。此外，例如，针对说话声音“用光波炉加热烫酒”，声音识别部302确定“光波炉”、“烫酒”及“加热”这样的单词。

声音识别部302将声音识别结果向设备功能判定部304输出。

设备功能判定部304将从声音识别部302输出的声音识别结果与设备功能DB305进行对照，判定对象设备及对象功能。

在设备功能DB305中存储有设备关联信息。设备关联信息是指将声音识别结果与家电设备5对应起来并且将声音识别结果与家电设备5所具有的功能对应起来的信息。针对能够通过说话声音进行控制的1个以上的家电设备5预先生成设备关联信息，并将设备关联信息存储在设备功能DB305中。

例如，在从声音识别部302输出的声音识别结果中包含“IH烹饪加热器”、“鲑鱼”、“切块”及“烤”的情况下，设备功能判定部304基于设备关联信息，判定为对象设备是“IH烹饪加热器”。此外，设备功能判定部304判定为对象功能例如是“IH烹饪加热器”所具有的“烤鱼炉”、“切块模式”及“火力4”。

此外，例如在从声音识别部302输出的声音识别结果中包含“光波炉”、“烫酒”及“加热”的情况下，设备功能判定部304基于设备关联信息，判定为对象设备是“光波炉”。此外，设备功能判定部304判定为对象功能例如是“光波炉”所具有的“饮品模式”及“设定温度50℃”。

设备功能判定部304生成将对象设备与对象功能对应起来的设备功能信息，将生成的设备功能信息向设备控制装置1的应答输出部100及命令控制部200输出。

按照上述的例子来说，设备功能判定部304生成将“IH烹饪加热器”的信息与“烤鱼炉”、“切块模式”及“火力4”的信息对应起来的设备功能信息并发送到设备控制装置1。或者，设备功能判定部304生成将“光波炉”的信息与“饮品模式”及“设定温度50℃”的信息对应起来的设备功能信息并发送到设备控制装置1。

另外，在上述的例子中，在声音识别结果中包含设备名称。但是，这只不过是一例，声音识别结果也可以不包含设备名称。即便声音识别结果不包含设备名称，设备功能判定部304也能够根据声音识别结果所包含的可确定对象设备的单词来判定对象设备。例如，用户向声音输入装置41说出“烤鲑鱼切块”。在该情况下，声音识别部302针对说话声音“烤鲑鱼切块”，确定“鲑鱼”、“切块”及“烤”这样的单词。设备功能判定部304例如根据“切块”、“烤”这样的单词，判定为对象设备是“IH烹饪加热器”。设备功能判定部304生成将根据声音识别结果判定出的对象设备与基于设备关联信息判定出的对象功能对应起来的设备功能信息。

此外，例如如果用户通过说话来指示执行对象功能的对象设备为1个，则有时在说话内容中也可以不包含能够确定对象设备的信息。但是，在该情况下，由于对象设备是确定的，因此，设备功能判定部304生成将该确定的对象设备与基于设备关联信息判定出的对象功能对应起来的设备功能信息。

在实施方式1中，如图3所示，声音识别词典DB303及设备功能DB305配备在声音操作装置300中，但这只不过是一例。声音识别词典DB303及设备功能DB305也可以配备在声音操作装置300的外部的声音操作装置300能够参照的场所。

接着，使用图4对设备控制装置1所具备的应答输出部100及命令控制部200的结构进行说明。

应答输出部100具备设备功能信息取得部101、时间计测部102、时间判定部103、应答文决定部104、输出控制部105、应答DB106及执行通知受理部107。

命令控制部200具备功能命令生成部201及功能命令输出部202。

应答输出部100的设备功能信息取得部101取得从声音操作装置300的设备功能判定部304输出的设备功能信息。

设备功能信息取得部101将取得的设备功能信息向应答文决定部104及命令控制部200输出。

应答输出部100的时间计测部102计测从取得了说话声音的时刻(以下称为“声音取得时刻”。)开始的经过时间(以下称为“第1经过时间”。)。在实施方式1中，例如，声音取得时刻是指声音取得部301取得了说话声音的时刻。时间计测部102能够从声音取得部301取得声音取得时刻。例如，声音取得部301对说话声音附加表示声音取得时刻的信息并向时间计测部102输出该说话声音即可。

此外，在实施方式1中，声音取得时刻也可以设为时间计测部102从声音取得部301取得了说话声音的时刻。

在实施方式1中，时间计测部102持续计测第1经过时间，直至功能命令输出部202向对象设备输出功能命令为止。时间计测部102能够从功能命令输出部202取得功能命令输出部202向对象设备输出了功能命令这一旨意的信息。时间计测部102在从功能命令输出部202取得向对象设备输出了功能命令这一旨意的信息后，结束第1经过时间的计测。

时间计测部102持续向时间判定部103输出第1经过时间。时间计测部102在从功能命令输出部202取得向对象设备输出了功能命令这一旨意的信息后，停止第1经过时间的输出。

时间判定部103判定执行所需时间是否长。具体而言，时间判定部103判定从时间计测部102取得的第1经过时间是否超过预先设定的时间(以下称为“第1目标时间”。)。对于第1目标时间，预先设定有在某种程度上比如下时间短的时间，该时间为，例如在从说话到执行对象功能为止的期间内没有从对象设备等作出任何应答的情况下推测为用户感觉到“等待”的时间。时间判定部103例如在每次从时间计测部102输出第1经过时间时进行上述判定。

在第1经过时间超过第1目标时间的情况下，时间判定部103判定为执行所需时间长。如上所述，时间计测部102在从功能命令输出部202取得向对象设备输出了功能命令这一旨意的信息后，结束第1经过时间的计测。第1经过时间超过第1目标时间的状态是指，在从取得说话声音到功能命令输出部202向对象设备输出功能命令为止的期间内已经经过了第1目标时间的状态。例如，为了不使用户感觉到“等待”，在判定出该状态之后，需要及时从声音输出装置42等输出后述的应答文。

另一方面，在第1经过时间未超过第1目标时间的情况下，时间判定部103判定为执行所需时间不长。第1经过时间未超过第1目标时间的状态是指，在从取得说话声音到功能命令输出部202向对象设备输出功能命令为止的期间内尚未经过第1目标时间的状态。

时间判定部103在判定为执行所需时间长的情况下，将判定为执行所需时间长这一旨意的信息(以下称为“功能执行延迟信息”。)向应答文决定部104输出。

应答文决定部104在时间判定部103判定为执行所需时间长的情况下，基于设备功能信息取得部101取得的设备功能信息，决定与对象设备关联的应答文(以下称为“第1应答文”。)。

应答文决定部104基于预先生成并存储在应答DB106中的应答文信息来决定第1应答文。

这里，图5是用于说明在实施方式1中应答文决定部104在决定第1应答文时参照的应答文信息的内容的一例的图。在以下的说明中，将应答文决定部104在决定第1应答文时参照的应答文信息称为“第1应答文信息”。

第1应答文信息是将设备功能信息与可以成为第1应答文的第1应答文候选对应起来而定义的信息。另外，在图5中，为了容易理解，将用户说出的内容(参照图5的“说话内容”的栏)与设备功能信息对应起来表示。如图5所示，在第1应答文信息中，例如，可以将与说出的内容相关的应答文、与执行的功能相关的应答文、与操作方法相关的应答文、或者与小知识相关的应答文作为第1应答文候选而与1个设备功能信息对应起来。

应答文决定部104从在第1应答文信息中与设备功能信息取得部101取得的设备功能信息对应起来的第1应答文候选中决定第1应答文。应答文决定部104通过适当的方法决定第1应答文即可。

例如，在设备功能信息取得部101取得的设备功能信息是将“IH烹饪加热器”的信息与“烤鱼炉”、“切块模式”及“火力4”的信息对应起来的信息的情况下，应答文决定部104将“现在正在准备切块模式”决定为第1应答文。

应答文决定部104将决定出的第1应答文的信息向输出控制部105输出。

另外，图5所示的第1应答文信息的内容只不过是一例。在第1应答文信息中，与1个设备功能信息对应起来的第1应答文候选也可以仅为1个，第1应答文候选还可以为与说出的内容相关的应答文、与执行的功能相关的应答文、与操作方法相关的应答文、或者与小知识相关的应答文以外的与对象设备关联的应答文。在第1应答文信息中，作为针对1个设备功能信息的第1应答文候选，定义与对象设备关联的1个以上的第1应答文即可。此外，在设备功能信息包含声音识别结果的情况下，存储在应答DB106中的第1应答文信息也可以包含将声音识别结果与可以成为第1应答文的第1应答文候选对应起来而定义的信息。在该情况下，应答文决定部104也能够从与声音识别结果对应起来的第1应答文候选中决定第1应答文。

输出控制部105将应答文决定部104决定出的表示第1应答文的信息向声音输出装置42输出。

声音输出装置42在从应答文决定部104输出表示第1应答文的信息时，按照表示该第1应答文的信息，声音输出第1应答文。

此外，输出控制部105在从执行通知受理部107输出受理到执行完成通知这一旨意的信息时，输出表示执行应答的信息。具体而言，输出控制部105在被输出受理到执行完成通知这一旨意的信息时，基于执行应答信息来决定执行应答，将表示该执行应答的信息向声音输出装置42输出。执行应答信息被预先生成并存储在存储部中(省略图示)。另外，之后叙述执行完成通知。

这里，图6是用于说明在实施方式1中存储于存储部的执行应答信息的内容的一例的图。

在执行应答信息中，将功能命令与执行应答的内容对应起来定义。另外，在图6中，为了容易理解，将用户说出的内容(参照图6的“说话内容”的栏)及设备功能信息与功能命令对应起来表示。

输出控制部105基于图6所示的执行应答信息，向声音输出装置42输出表示与对受理到执行完成通知这一旨意的信息赋予的功能命令对应的执行应答的信息。另外，在从执行通知受理部107输出的受理到执行完成通知这一旨意的信息中，例如，附加有成为在对象设备中执行对象功能的基础的功能命令的信息。对象设备在向执行通知受理部107输出执行完成通知时，将功能命令的信息附加于该执行完成通知而输出。

例如，从设备控制装置1向作为对象设备的IH烹饪加热器输出基于将“IH烹饪加热器”的信息与“烤鱼炉”、“切块模式”及“火力4”的信息对应起来的设备功能信息而生成的功能命令，对象设备按照该功能命令执行对象功能。在该情况下，从IH烹饪加热器输出执行了该对象功能这一旨意的执行完成通知，执行通知受理部107受理该执行完成通知。在该情况下，输出控制部105将表示“以切块模式开始了加热”这样的执行应答的信息向声音输出装置42输出。声音输出装置42声音输出“以切块模式开始了加热”这样的执行应答。

应答DB106存储图5所示的第1应答文信息。

另外，在实施方式1中，如图4所示，应答DB106配备在设备控制装置1中，但这只不过是一例。应答DB106也可以配备在设备控制装置1的外部的、能够由设备控制装置1的应答文决定部104参照的场所。

执行通知受理部107受理从对象设备输出的执行完成通知。

执行通知受理部107将受理到执行完成通知这一旨意的信息向输出控制部105输出。

命令控制部200的功能命令生成部201基于设备功能信息取得部101取得的设备功能信息，生成用于使对象设备执行对象功能的功能命令。

例如，在设备功能信息取得部101取得的设备功能信息是将“IH烹饪加热器”的信息与“烤鱼炉”、“切块模式”及“火力4”的信息对应起来的信息的情况下，命令控制部200生成用于使IH烹饪加热器执行在烤鱼炉中通过切块模式以火力4烤鱼的功能的功能命令。

功能命令生成部201将生成的功能命令向功能命令输出部202输出。

命令控制部200的功能命令输出部202将功能命令生成部201生成的功能命令向对象设备输出。具体而言，功能命令输出部202经由网络向对象设备发送功能命令。

这里，功能命令生成部201在从取得设备功能信息到生成功能命令为止有时需要时间。这是因为功能命令生成部201有时在功能命令的生成处理中需要时间等。

功能命令输出部202进行等待至功能命令生成部201完成功能命令的生成为止，当功能命令生成部201完成功能命令的生成时，功能命令输出部202输出所生成的功能命令。

对设备控制装置1的动作进行说明。

图7是用于说明实施方式1的设备控制装置1的动作的流程图。

在设备控制装置1中，设备功能信息取得部101取得从声音操作装置300的设备功能判定部304输出的设备功能信息(步骤ST701)。

设备功能信息取得部101将取得的设备功能信息向应答文决定部104及功能命令生成部201输出。

时间判定部103判定执行所需时间是否长(步骤ST702)。

在步骤ST702中由时间判定部103判定为执行所需时间长的情况下，应答文决定部104基于在步骤ST701中由设备功能信息取得部101取得的设备功能信息，来决定第1应答文(步骤ST703)。

输出控制部105输出表示在步骤ST703中由应答文决定部104决定的第1应答文的信息(步骤ST704)。

声音输出装置42在从应答文决定部104输出表示第1应答文的信息时，声音输出第1应答文。

对实施方式1的设备控制装置1的应答输出部100及命令控制部200的动作详细进行说明。

在设备控制装置1中，并行地实施应答输出部100的动作和命令控制部200的动作。

首先，对应答输出部100的动作详细进行说明。

图8是用于对实施方式1的设备控制装置1的应答输出部100的动作详细进行说明的流程图。

另外，在使用了图8的以下的动作说明中，作为一例，时间判定部103在与第1经过时间的比较中使用的第1目标时间为“n1秒”。

时间计测部102开始第1经过时间的计测(步骤ST801)。

时间计测部102将第1经过时间持续向时间判定部103输出。

设备功能信息取得部101取得从声音操作装置300的设备功能判定部304输出的设备功能信息(步骤ST802)。

时间计测部102判定是否输出了功能命令(步骤ST803)。具体而言，时间计测部102判定是否从功能命令输出部202取得了向对象设备输出了功能命令这一旨意的信息。

在步骤ST803中，在时间计测部102判定为输出了功能命令的情况下(步骤ST803的“是”的情况)，时间计测部102结束第1经过时间的计测，应答输出部100结束处理。另外，应答输出部100在执行通知受理部107受理到从对象设备发送的执行完成通知并且输出控制部105输出表示执行应答的信息之后，结束处理。

在步骤ST803中，在时间计测部102判定为尚未输出功能命令的情况下(步骤ST803的“否”的情况)，时间判定部103判定第1经过时间是否超过n1秒(步骤ST804)。

在步骤ST804中，在时间判定部103判定为第1经过时间未超过n1秒的情况下(步骤ST804的“否”的情况)，时间判定部103判定为执行所需时间不长，返回步骤ST803。

在步骤ST804中，在时间判定部103判定为第1经过时间超过n1秒的情况下(步骤ST804的“是”的情况)，时间判定部103判定为执行所需时间长，将功能执行延迟信息向应答文决定部104输出。

在步骤ST804中从时间判定部103输出功能执行延迟信息时，应答文决定部104基于在步骤ST802中由设备功能信息取得部101取得的设备功能信息，决定第1应答文(步骤ST805)。

输出控制部105将表示在步骤ST805中由应答文决定部104决定出的第1应答文的信息向声音输出装置42输出(步骤ST806)。

接着，对命令控制部200的动作详细进行说明。

图9是用于对实施方式1的设备控制装置1的命令控制部200的动作详细进行说明的流程图。

功能命令生成部201从设备功能信息取得部101取得设备功能信息，开始生成功能命令(步骤ST901)。

功能命令输出部202判定是否准备好功能命令(步骤ST902)。具体而言，功能命令输出部202判定是否从功能命令生成部201输出了由该功能命令生成部201生成的功能命令。

在步骤ST902中，在未准备好功能命令的情况下(步骤ST902的“否”的情况)，功能命令输出部202等待至准备好功能命令为止。

在步骤ST902中，在准备好功能命令的情况下(步骤ST902的“是”的情况)，功能命令输出部202将功能命令生成部201生成的功能命令向对象设备输出(步骤ST903)。

图10是示出在实施方式1的设备控制装置1进行图8及图9中说明的动作并且判定为执行所需时间长的情况下使第1应答文从声音输出装置42声音输出为止的时间流的图像的图。

如以上那样，设备控制装置1在第1经过时间超过第1目标时间的情况下，输出表示第1应答文的信息。即，在设备控制装置1中，在从取得说话声音到功能命令输出部202输出功能命令之前经过了第1目标时间的情况下，时间判定部103判定为执行所需时间长，输出控制部105将表示由应答文决定部104决定的第1应答文的信息向声音输出装置42输出。

在设备控制装置1中，如上所述，由于在功能命令的生成处理中有时需要时间等，因此功能命令生成部201有时在生成功能命令之前需要时间。因此，有时执行所需时间变长。这样，用户可能感觉到直至通过说话而指示的基于对象设备的对象功能被执行为止的等待时间长。

与此相对，如上所述，在设备控制装置1中，在从取得说话声音到功能命令输出部202输出功能命令为止的期间内经过了第1目标时间的情况下，时间判定部103判定为执行所需时间长，输出控制部105将由应答文决定部104决定的第1应答文向声音输出装置42输出。

其结果是，在用户通过说话指示了基于对象设备的对象功能的执行时，即便在执行所需时间长的情况下，在此期间，用户也能够识别是否将要通过设备执行预期功能。

如以上那样，根据实施方式1，设备控制装置1构成为具备：设备功能信息取得部101，其取得将对象设备和使该对象设备执行的对象功能对应起来的设备功能信息，所述对象设备和所述对象功能是基于声音识别结果而判定出的；时间判定部103，其判定从说话到对象功能的执行为止的时间是否长；应答文决定部104，其在时间判定部103判定为从说话到对象功能的执行为止的时间长的情况下，基于设备功能信息取得部101所取得的设备功能信息，决定与对象设备关联的第1应答文；以及输出控制部105，其输出表示由应答文决定部104决定的第1应答文的信息。因此，在基于针对用户的说话声音的声音识别结果来控制设备的技术中，即便在从说话到由设备执行功能为止的时间长的情况下，在此期间，用户也能够识别是否将要通过设备执行预期功能。

实施方式2.

在实施方式1中，在设备控制装置1中，功能命令输出部202等待该功能命令的输出，直至功能命令生成部201完成功能命令的生成为止。

在实施方式2中，说明如下实施方式：即便功能命令生成部201完成功能命令的生成，如果在声音输出装置42中未完成基于输出控制部105输出的表示第1应答文的信息而进行的第1应答文的声音输出，则功能命令输出部202保留该功能命令的输出。

具备实施方式2的设备控制装置1的设备控制***1000的结构与在实施方式1中使用图1说明的设备控制***1000的结构相同，因此，省略重复的说明。

此外，实施方式2的设备控制装置1的结构与在实施方式1中使用图2～图4说明的结构相同，因此，省略重复的说明。

但是，实施方式2的设备控制装置1的输出控制部105及功能命令输出部202的动作与实施方式1的设备控制装置1的输出控制部105及功能命令输出部202的动作不同。

图11是示出实施方式2的设备控制装置1的结构例的图。

如图11所示，输出控制部105将表示第1应答文的信息及表示执行应答的信息向声音输出装置42输出，并且在输出了表示第1应答文的信息的情况下，将输出了表示第1应答文的信息这一旨意的信息向功能命令输出部202输出。此外，输出控制部105将由声音输出装置42完成了第1应答文的声音输出这一旨意的第1应答文输出完成通知向功能命令输出部202输出。

输出控制部105例如基于表示输出到声音输出装置42的第1应答文的信息来判断由声音输出装置42完成了第1应答文的声音输出即可。具体而言，输出控制部105例如根据第1应答文的长度，来计算该第1应答文的声音输出所需的时间。输出控制部105将向声音输出装置42输出了表示第1应答文的信息的时刻与计算出的第1应答文的声音输出所需的时间相加而得到的时刻设为由声音输出装置42完成了第1应答文的声音输出的时刻。然后，输出控制部105在成为该时刻时，向功能命令输出部202输出第1应答文输出完成通知。

此外，例如，在声音输出装置42具有在完成了第1应答文的声音输出时向设备控制装置1通知这一旨意的功能的情况下，输出控制部105也可以将通过设备控制装置1从声音输出装置42取得了该通知的时刻判断为通过声音输出装置42完成了第1应答文的声音输出的时刻。输出控制部105在设备控制装置1从声音输出装置42取得上述通知时，向功能命令输出部202输出第1应答文输出完成通知。

功能命令输出部202在输出由功能命令生成部201生成的功能命令时，在输出该功能命令之前输出控制部105向声音输出装置42输出了表示第1应答文的信息、且声音输出装置42未完成基于表示该第1应答文的信息而进行的第1应答文的声音输出的情况下，功能命令输出部202保留功能命令的发送直至该第1应答文的声音输出完成为止。

功能命令输出部202根据是否从输出控制部105取得了已输出表示第1应答文的信息这一旨意的信息来判定输出控制部105是否输出了表示第1应答文的信息即可。

此外，功能命令输出部202基于从输出控制部105输出的第1应答文输出完成通知，来判定在声音输出装置42中是否完成了基于输出控制部105输出的表示第1应答文的信息而进行的该第1应答文的声音输出即可。具体而言，如果从输出控制部105输出了第1应答文输出完成通知，则功能命令输出部202判定为第1应答文的声音输出完成，如果未从输出控制部105输出第1应答文输出完成通知，则功能命令输出部202判定为第1应答文的声音输出未完成。

对实施方式2的设备控制装置1的命令控制部200的动作详细进行说明。

另外，实施方式2的设备控制装置1的基本动作与在实施方式1中使用图7的流程图说明的设备控制装置1的基本动作相同，因此，省略重复的说明。此外，实施方式2的设备控制装置1的应答输出部100的详细动作与在实施方式1中使用图8说明的应答输出部100的详细动作相同，因此，省略重复的说明。

图12是用于对实施方式2的设备控制装置1的命令控制部200的动作详细进行说明的流程图。

图12的步骤ST1201～步骤ST1202、步骤ST1205的具体动作分别与在实施方式1中说明的图9的步骤ST901～步骤ST902、步骤ST905的具体动作相同，因此，省略重复的说明。

在步骤ST1202中，在由功能命令生成部201准备好功能命令的情况下(步骤ST1202的“是”的情况)，功能命令生成部201判定输出控制部105是否已经向声音输出装置42输出表示第1应答文的信息(步骤ST1203)。

在步骤ST1203中，在功能命令生成部201判定为输出控制部105尚未输出表示第1应答文的信息的情况下(步骤1203的“否”的情况)，设备控制装置1进入步骤ST1205的处理。

在步骤ST1203中，在功能命令生成部201判定为输出控制部105已经输出表示第1应答文的信息的情况下(步骤ST1203的“是”的情况)，输出控制部105判定在声音输出装置42中是否完成了基于表示该第1应答文的信息而进行的第1应答文的声音输出(步骤ST1204)。

在步骤ST1204中，在判定为第1应答文的声音输出未完成的情况下(步骤ST1204的“否”的情况)，功能命令生成部201在第1应答文的声音输出完成之前进行等待，保留功能命令的输出。

在步骤ST1204中，在判定为第1应答文的声音输出完成的情况下(步骤ST1204的“是”的情况)，功能命令生成部201输出功能命令(步骤ST1205)。

图13是示出实施方式2的设备控制装置1进行图8及图12中说明的动作并且保留了功能命令的输出直至第1应答文的声音输出完成为止的情况下的时间流的图像的图。

在设备控制装置1输出了表示第1应答文的信息的情况下，在声音输出装置42中声音输出第1应答文。此时，如果在第1应答文的声音输出完成之前在对象设备中执行对象功能且从设备控制装置1输出执行应答，则在声音输出装置42中，例如第1应答文的声音输出可能被中断。

对此，实施方式2的设备控制装置1在输出功能命令时，在输出该功能命令之前向声音输出装置42输出了表示第1应答文的信息并且在声音输出装置42中未完成基于表示该第1应答文的信息而进行的第1应答文的声音输出的情况下，保留功能命令的输出，直至该第1应答文的声音输出完成为止。由此，设备控制装置1在使声音输出装置42声音输出第1应答文的情况下，能够不中断该第1应答文的声音输出。

如以上那样，根据实施方式2，设备控制装置1构成为，在输出控制部105输出表示第1应答文的信息之后由功能命令生成部201完成了功能命令的生成的情况下，如果基于输出控制部105输出的表示第1应答文的信息而进行的该第1应答文的声音输出未完成，则功能命令输出部202保留功能命令的输出，直至完成该第1应答文的声音输出为止。因此，设备控制装置1能够不中断在从说话到由设备执行功能为止的时间长的情况下输出的第1应答文的声音输出。

实施方式3.

在实施方式1中，在设备控制装置1中，计测第1经过时间，直至将功能命令输出到对象设备为止，在该第1经过时间超过第1目标时间的情况下，输出表示第1应答文的信息。

在实施方式3中，对如下实施方式进行说明：设备控制装置1计测从声音取得时刻开始的经过时间，直至对象设备基于功能命令而完成对象功能的执行为止，在该经过时间超过预先设定的时间的情况下，输出表示第1应答文的信息。

具备实施方式3的设备控制装置1的设备控制***1000的结构与在实施方式1中使用图1说明的设备控制***1000的结构相同，因此，省略重复的说明。

此外，实施方式3的设备控制装置1的结构与在实施方式1中使用图2～图4说明的结构相同，因此，省略重复的说明。

但是，实施方式3的设备控制装置1的时间计测部102、时间判定部103、执行通知受理部107及功能命令输出部202的动作与实施方式1的设备控制装置1的时间计测部102、时间判定部103、执行通知受理部107及功能命令输出部202的动作不同。

图14是示出实施方式3的设备控制装置1的结构例的图。

如图14所示，执行通知受理部107在从作为对象设备的家电设备5受理到执行完成通知时，将受理到执行完成通知这一旨意的信息向输出控制部105输出，并且也向时间计测部102输出。

功能命令输出部202无需将向对象设备输出了功能命令这一旨意的信息输出到时间计测部102。

时间计测部102计测从声音取得时刻开始的经过时间(以下称为“第2经过时间”。)。关于声音取得时刻，在实施方式1中已经进行了说明，因此，省略详细说明。

在实施方式3中，时间计测部102持续计测第2经过时间，直至执行通知受理部107从对象设备受理到执行完成通知为止。时间计测部102能够从执行通知受理部107取得如下信息，该信息是执行通知受理部107从对象设备受理到执行完成通知这一旨意的信息。时间计测部102在从执行通知受理部107取得受理到执行完成通知这一旨意的信息时，结束第2经过时间的计测。

时间计测部102持续向时间判定部103输出第2经过时间。时间计测部102在从执行通知受理部107取得了受理到执行完成通知这一旨意的信息时，停止第2经过时间的输出。

时间判定部103判定执行所需时间是否长。具体而言，时间判定部103判定从时间计测部102取得的第2经过时间是否超过预先设定的时间(以下称为“第2目标时间”。)。对于第2目标时间，预先设定有在某种程度上比如下时间短的时间，该时间为，例如在从说话到执行对象功能为止的期间内没有从对象设备等作出任何应答的情况下推测为用户感觉到“等待”的时间。在实施方式3中，设想第2目标时间是比第1目标时间长的时间，但第2目标时间也可以是与第1目标时间相同长度的时间。

时间判定部103例如在每次从时间计测部102输出第2经过时间时进行上述判定。

在第2经过时间超过第2目标时间的情况下，时间判定部103判定为执行所需时间长。如上所述，时间计测部102在从执行通知受理部107取得了受理到执行完成通知这一旨意的信息时，结束第2经过时间的计测。第2经过时间超过第2目标时间的状态是指，在从取得说话声音到执行通知受理部107从对象设备受理到执行完成通知为止的期间内已经经过了第2目标时间的状态。例如，为了不使用户感觉到“等待”，在判定该状态之后，需要及时从声音输出装置42等输出第1应答文。

另一方面，在第2经过时间未超过第2目标时间的情况下，时间判定部103判定为执行所需时间不长。第2经过时间未超过第2目标时间的状态是指，在从取得说话声音到执行通知受理部107从对象设备受理到执行完成通知为止的期间内尚未经过第2目标时间的状态。

对实施方式3的设备控制装置1的应答输出部100的动作详细进行说明。

另外，实施方式3的设备控制装置1的基本动作与在实施方式1中使用图7的流程图说明的设备控制装置1的基本动作相同，因此，省略重复的说明。此外，实施方式3的设备控制装置1的命令控制部200的详细动作与在实施方式1中使用图9说明的命令控制部200的详细动作相同，因此，省略重复的说明。

图15是用于对实施方式3的设备控制装置1的应答输出部100的动作详细进行说明的流程图。另外，在使用了图15的以下的动作说明中，作为一例，时间判定部103在与第2经过时间的比较中使用的第2目标时间为“n2秒”。

图15的步骤ST1501～步骤ST1502、步骤ST1505～步骤ST1506的具体动作分别与在实施方式1中说明的图8的步骤ST801～步骤ST802、步骤ST805～步骤ST806的具体动作相同，因此，省略重复的说明。

时间计测部102判定在对象设备中是否完成了对象功能的执行(步骤ST1503)。具体而言，时间计测部102判定是否从执行通知受理部107取得了受理到执行完成通知这一旨意的信息。

在步骤ST1503中，在时间计测部102判定为在对象设备中完成了对象功能的执行的情况下(步骤ST1503的“是”的情况)，时间计测部102结束第2经过时间的计测，应答输出部100结束处理。另外，应答输出部100在执行通知受理部107受理到从对象设备发送的执行完成通知且输出控制部105输出了表示执行应答的信息之后，结束处理。

在步骤ST1503中，在时间计测部102判定为在对象设备中尚未完成对象功能的执行的情况下(步骤ST1503的“否”的情况)，时间判定部103判定第2经过时间是否超过n2秒(步骤ST1504)。

在步骤ST1504中，在时间判定部103判定为第2经过时间未超过n2秒的情况下(步骤ST1504的“否”的情况)，时间判定部103判定为执行所需时间不长，返回步骤ST1503。

在步骤ST1504中，在时间判定部103判定为第2经过时间超过n2秒的情况下(步骤ST1504的“是”的情况)，时间判定部103判定为执行所需时间长，将功能执行延迟信息向应答文决定部104输出。

图16是示出在实施方式3的设备控制装置1进行图15及图9中说明的动作并且判定为执行所需时间长的情况下使第1应答文从声音输出装置42声音输出为止的时间流的图像的图。

如以上那样，设备控制装置1在第2经过时间超过第2目标时间的情况下，输出表示第1应答文的信息。即，在设备控制装置1中，在取得说话声音到执行通知受理部107受理到执行完成通知为止经过了第2目标时间的情况下，时间判定部103判定为执行所需时间长，输出控制部105将表示由应答文决定部104决定的第1应答文的信息向声音输出装置42输出。

在设备控制装置1中，除了在功能命令生成部201生成功能命令之前需要时间之外，例如，由于网络环境或对象设备的处理能力等，在设备控制装置1输出功能命令之后到从对象设备受理到执行完成通知之前，有时需要时间。由此，有时执行所需时间也长。这样，用户可能感觉到直至通过说话而指示的基于对象设备的对象功能的执行为止的等待时间长。

对此，如上所述，在设备控制装置1中，在从取得说话声音到执行通知受理部107从对象设备受理到执行完成通知为止的期间内经过了第2目标时间的情况下，时间判定部103判定为执行所需时间长，输出控制部105将由应答文决定部104决定的第1应答文向声音输出装置42输出。

其结果是，在用户通过说话而指示了由对象设备执行对象功能时，即便在执行所需时间长的情况下，在此期间，用户也能够识别是否通过将要设备执行预期功能。

如以上那样，根据实施方式3，在设备控制装置1中，时间判定部103在时间计测部102计测到的第2经过时间超过第2目标时间的情况下，判定为从说话到执行对象功能为止的时间长。因此，与实施方式1同样，在基于针对用户的说话声音的声音识别结果来控制设备的技术中，即便在从说话到由设备执行功能为止的时间长的情况下，在此期间，用户也能够识别是否将要通过设备执行预期功能。

实施方式4.

在实施方式1中，在设备控制装置1中，在判定为执行所需时间长的情况下输出的表示与对象功能关联的应答文的信息仅为表示第1应答文的信息。

在实施方式4中，对如下实施方式进行说明：在设备控制装置1中判定为执行所需时间长的情况下输出表示第1应答文的信息，并且，在从输出表示该第1应答文的信息起的经过时间长的情况下输出表示新的应答文(以下称为“第2应答文”。)的信息。

具备实施方式4的设备控制装置1的设备控制***1000的结构与在实施方式1中使用图1说明的设备控制***1000的结构相同，因此，省略重复的说明。

图17是示出实施方式4的设备控制装置1a的结构例的图。另外，设备控制装置1a的概要结构例及设备控制装置1a的声音操作装置300的结构例与在实施方式1中使用图2及图3说明的设备控制装置1的概要结构例及设备控制装置1的声音操作装置300的结构例相同，因此，省略重复的说明。

在图17中，针对与在实施方式1中使用图4说明的实施方式1的设备控制装置1相同的结构标注相同的标号，省略重复的说明。

实施方式4的设备控制装置1a与实施方式1的设备控制装置1的不同之处在于，应答输出部100a具备第1应答文输出后时间计测部108和第1应答文输出后时间判定部109。

第1应答文输出后时间计测部108计测从输出控制部105输出表示第1应答文的信息之后到目前为止的经过时间(以下称为“第1应答文输出后时间”。)。

第1应答文输出后时间计测部108将计测到的第1应答文输出后时间的信息向第1应答文输出后时间判定部109输出。另外，第1应答文输出后时间计测部108将第1应答文输出后时间持续向第1应答文输出后时间判定部109输出。

第1应答文输出后时间判定部109判定从时间计测部102取得的第1应答文输出后时间是否超过预先设定的时间(以下称为“第3目标时间”。)。

第1应答文输出后时间判定部109根据从第1应答文输出后时间计测部108取得的第1应答文输出后时间是否超过第3目标时间，来判定从输出表示第1应答文的信息开始的时间是否长。对于第3目标时间，预先设定有在某种程度上比如下时间短的时间，在用户从第1应答文被输出之后经过了该时间的情况下推测为用户感觉到“等待”。第3目标时间也可以是与第1目标时间或第2目标时间相同长度的时间。

第1应答文输出后时间判定部109例如在每次从第1应答文输出后时间计测部108输出第1应答文输出后时间时进行上述判定。

第1应答文输出后时间超过第3目标时间的状态是指，从输出控制部105输出表示第1应答文的信息起经过了第3目标时间的状态。例如，为了不使用户感觉到“等待”，在判定出该状态之后，需要及时从声音输出装置42等输出第2应答文。

时间判定部103在判定为从输出表示第1应答文的信息开始的时间长的情况下，将判定为从输出表示第1应答文的信息开始的时间长这一旨意的信息(以下称为“功能执行延迟信息”。)向应答文决定部104输出。

另外，第1应答文输出后时间判定部109在判定为第1应答文输出后时间未超过第3目标时间的情况下，认为从输出表示第1应答文的信息开始的时间不长，不输出应答后时间超过信息。

应答文决定部104在时间判定部103判定为执行所需时间长的情况下决定第1应答文，并且，在第1应答文输出后时间判定部109判定为第1应答文输出后时间超过第3目标时间的情况下决定第2应答文。应答文决定部104决定第1应答文的方法在实施方式1中已经进行了说明，因此，省略重复的说明。

应答文决定部104基于被预先生成并存储在应答DB106中的第2应答文信息，决定第2应答文。在实施方式4中，将应答文决定部104在决定第2应答文时参照的应答文信息称为“第2应答文信息”。

这里，图18是用于说明在实施方式1中应答文决定部104在决定第2应答文时参照的第2应答文信息的内容的一例的图。

第2应答文信息是将设备功能信息与可以成为第2应答文的第2应答文候选对应起来而定义的信息。另外，在图18中，为了容易理解，将用户说出的内容(参照图18的“说话内容”的栏)与设备功能信息对应起来表示。如图18所示，在第2应答文信息中，例如，可以将与说出的内容相关的应答文、与执行的功能相关的应答文、与操作方法相关的应答文，与小知识相关的应答文、或者道歉消息作为第2应答文候选而与1个设备功能信息对应起来。

应答文决定部104从在第2应答文信息中与设备功能信息取得部101取得的设备功能信息对应起来的第2应答文候选中决定第2应答文。应答文决定部104通过适当的方法来决定第2应答文即可。但是，应答文决定部104在不将第2应答文设为“对不起，耗费了您的时间”这样的道歉消息的情况下，优选将与输出完的第1应答文对应的内容的第2应答文候选决定为第2应答文。这里所说的输出完的第1应答文是第1应答文输出后时间判定部109判定为第1应答文输出后时间超过第3目标时间的通过表示第1应答文的信息而确定的第1应答文。应答文决定部104例如从输出控制部105经由第1应答文输出后时间计测部108及第1应答文输出后时间判定部109取得输出完的第1应答文的信息即可。此外，应答文决定部104通过对照第2应答文信息与使用图5说明的第1应答文信息来确定与第1应答文对应的第2应答文候选即可。

举出具体例的话，例如，应答文决定部104基于图5所示的应答文信息，将“现在正在准备切块模式”决定为第1应答文，输出控制部105输出表示该“现在正在准备切块模式”的信息。之后，在输出控制部105输出表示“现在正在准备切块模式”的信息之后经过了第3目标时间。在该情况下，应答文决定部104基于图18所示的第2应答文信息，将与“现在准备切块模式”同样的、作为与说出的内容相关的应答文的“烧烤颜色设定为与上次相同标准”决定为第2应答文。

另外，这里在应答DB106中分别存储有图5所示的第1应答文信息和图18所示的第2应答文信息，但这只不过是一例，也可以在第1应答文信息中包含第2应答文信息的内容，作为1个应答文信息而存储在应答DB106中。在该情况下，应答文决定部104基于该1个应答文信息来决定第2应答文即可。

此外，图18所示的第2应答文信息的内容只不过是一例。在第2应答文信息中，与1个设备功能信息对应起来的第2应答文候选也可以仅为1个，第2应答文候选还可以是与说出的内容相关的应答文、与执行的功能相关的应答文、与操作方法相关的应答文、与小知识相关的应答文或者道歉消息以外的应答文。在第2应答文信息中，作为针对1个设备功能信息的第2应答文候选，定义与对象设备关联的1个以上的第2应答文或者道歉消息即可。此外，在设备功能信息中包含声音识别结果的情况下，存储于应答DB106的第2应答文信息也可以包含将声音识别结果与可以成为第2应答文的第2应答文候选对应起来而定义的信息。在该情况下，应答文决定部104也能够从与声音识别结果对应起来的第2应答文候选中决定第2应答文。

应答文决定部104将决定出的第2应答文的信息向输出控制部105输出。

输出控制部105在从应答文决定部104输出了第2应答文的信息时，将表示该第2应答文的信息向声音输出装置42输出。

声音输出装置42在从输出控制部105输出表示第2应答文的信息时，按照表示该第2应答文的信息，声音输出第2应答文。

另外，上述的输出控制部105除了上述的输出表示第2应答文的信息以外，还进行在实施方式1中已经说明的表示第1输出部的信息的输出及表示执行应答的信息的输出。

对实施方式4的设备控制装置1a的应答输出部100a的动作详细进行说明。

另外，实施方式4的设备控制装置1a的基本动作与在实施方式1中使用图7的流程图说明的设备控制装置1的基本动作相同，因此，省略重复的说明。此外，实施方式4的设备控制装置1a的命令控制部200的详细动作与在实施方式1中使用图9说明的命令控制部200的详细动作相同，因此，省略重复的说明。

图19是用于说明实施方式4的设备控制装置1a的应答输出部100a的详细动作的流程图。另外，在使用了图19的以下的动作说明中，作为一例，第1应答文输出后时间判定部109在与第1应答文输出后时间的比较中使用的第3目标时间为“n3秒”。

图19的步骤ST1901～步骤ST1906的具体动作分别与在实施方式1中说明的图8的步骤ST801～步骤ST806的具体动作相同，因此，省略重复的说明。

在步骤ST1906中输出控制部105输出表示第1应答文的信息时，第1应答文输出后时间计测部108开始第1应答文输出后时间的计测(步骤ST1907)。

第1应答文输出后时间判定部109判定第1应答文输出后时间是否超过n3秒(步骤ST1908)。

在步骤ST1908中，在第1应答文输出后时间判定部109判定为第1应答文输出后时间未超过n3秒的情况下(步骤ST1908的“否”的情况)，第1应答文输出后时间判定部109重复进行步骤ST1908的处理。

在步骤ST1908中，在第1应答文输出后时间判定部109判定为第1应答文输出后时间超过n3秒的情况下(步骤ST1908的“是”的情况)，第1应答文输出后时间判定部109判定为从输出表示第1应答文的信息开始的时间长，将应答后时间超过信息向应答文决定部104输出。

在步骤ST1908中从第1应答文输出后时间判定部109输出应答后时间超过信息时，应答文决定部104决定第2应答文(步骤ST1909)。

输出控制部105将表示在步骤ST1909中由应答文决定部104决定的第2应答文的信息向声音输出装置42输出(步骤ST1910)。

声音输出装置42按照从输出控制部105输出的表示第2应答文的信息，声音输出第2应答文。

图20是示出在实施方式4的设备控制装置1a进行图19及图9中说明的动作并且判定为从输出表示第1应答文的信息开始的时间的情况下使第2应答文从声音输出装置42声音输出为止的时间流的图像的图。

如以上那样，设备控制装置1a在第1应答文输出后时间超过第3目标时间的情况下，输出表示第2应答文的信息。即，在设备控制装置1a中，在输出表示第1应答文的信息之后经过了第3目标时间的情况下，第1应答文输出后时间判定部109判定为从输出表示第1应答文的信息开始的时间长，输出控制部105将表示由应答文决定部104决定的第2应答文的信息向声音输出装置42输出。

由此，在即便输出第1应答文、仍推测为用户感觉到“等待”的情况下，从声音输出装置42声音输出第2应答文，与仅声音输出第1应答文的情况相比，设备控制装置1a能够更加降低用户感觉到“等待”的可能性。

如以上那样，根据实施方式4，设备控制装置1a构成为，具备：第1应答文输出后时间计测部108，其计测从输出控制部105输出表示第1应答文的信息起的第1应答文输出后时间；以及第1应答文输出后时间判定部109，其判定由第1应答文输出后时间计测部108计测的第1应答文输出后时间是否超过第3目标时间，应答文决定部104在第1应答文输出后时间判定部109判定为第1应答文输出后时间超过第3目标时间的情况下，决定第2应答文，输出控制部105除了输出表示第1应答文的信息之外，还输出表示由应答文决定部104决定的第2应答文的信息。因此，与仅输出表示第1应答文的信息的情况相比，设备控制装置1a能够进一步降低用户感觉到“等待”的可能性。

实施方式5.

在实施方式1中，具备计测第1经过时间的功能，根据该第1经过时间是否超过第1目标时间来判定执行所需时间是否长。

在实施方式5中，对如下实施方式进行说明：具备预测从声音取得时刻到向对象设备输出功能命令为止的经过时间的功能，基于预测出的经过时间来判定执行所需时间是否长。

具备实施方式5的设备控制装置1b的设备控制***1000的结构与在实施方式1中使用图1说明的设备控制***1000的结构相同，因此，省略重复的说明。

图21是示出实施方式5的设备控制装置1b的结构例的图。另外，设备控制装置1b的概要结构例及设备控制装置1b的声音操作装置300的结构例与在实施方式1中使用图2及图3说明的设备控制装置1的概要结构例及设备控制装置1的声音操作装置300的结构例相同，因此，省略重复的说明。

在图21中，针对与实施方式1的设备控制装置1同样的结构标注相同的标号，省略重复的说明。

实施方式5的设备控制装置1b与实施方式1的设备控制装置1的不同之处在于，应答输出部100b具备预测部110而取代时间计测部102。

另外，在实施方式5中，声音操作装置300的声音取得部301将取得的说话声音向预测部110输出。

预测部110预测从声音取得时刻到执行对象功能为止的经过时间。具体而言，预测部110预测从声音取得时刻到功能命令输出部202输出功能命令为止的经过时间(以下称为“第1预测经过时间”。)。关于声音取得时刻，在实施方式1中已经进行了说明，因此，省略重复的说明。

预测部110能够从声音取得部301取得声音取得时刻。例如，声音取得部301对说话声音附加表示声音取得时刻的信息并将该说话声音向预测部110输出即可。

此外，在实施方式5中，声音取得时刻也可以为预测部110从声音取得部301取得了说话声音的时刻。

例如，在存储部中按照每个说话声音而存储有在过去从声音取得时刻到功能命令输出部202输出功能命令为止所需的时间的实绩作为历史。

预测部110基于从声音取得部301取得的说话声音、声音取得时刻、以及存储在存储部中的历史，预测第1预测经过时间。

预测部110将预测到的第1预测经过时间的信息向时间判定部103输出。

时间判定部103判定执行所需时间是否长。具体而言，时间判定部103判定从预测部110取得的第1预测经过时间的信息是否超过预先设定的时间(以下称为“第4目标时间”。)。对于第4目标时间，预先设定有在某种程度上比如下时间短的时间，该时间为，例如在从说话到执行对象功能为止的期间内没有从对象设备等作出任何应答的情况下推测为用户感觉到“等待”的时间。

在第1预测经过时间超过第4目标时间的情况下，时间判定部103判定为执行所需时间长。第1预测经过时间超过第4目标时间的状态是指，预测为从取得说话声音到功能命令输出部202向对象设备输出功能命令之前经过了第4目标时间的状态。例如，为了不使用户感觉到“等待”，在判定出该状态之后，需要及时从声音输出装置42等输出第1应答文。

另一方面，在第1预测经过时间未超过第4目标时间的情况下，时间判定部103判定为执行所需时间不长。第1预测经过时间未超过第4目标时间的状态是指，预测为从取得说话声音到功能命令输出部202向对象设备输出功能命令为止未经过第4目标时间的状态。

时间判定部103在判定为执行所需时间长的情况下，将功能执行延迟信息向应答文决定部104输出。

应答文决定部104在时间判定部103判定为执行所需时间长的情况下，基于设备功能信息取得部101所取得的设备功能信息，决定与预测部110预测到的第1预测经过时间相应的长度的第1应答文。

应答文决定部104基于预先生成且存储在应答DB106中的第1应答文信息来决定第1应答文。在实施方式5中，存储于应答DB106的第1应答文信息的内容与在实施方式1中存储于应答DB106的第1应答文信息的内容(参照图5)不同。

这里，图22是用于说明在实施方式5中应答文决定部104在决定第1应答文时参照的第1应答文信息的内容的一例的图。

在实施方式5中，第1应答文信息是将设备功能信息与可以成为第1应答文的第1应答文候选对应起来而定义的信息，该第1应答文候选是根据第1预测经过时间来定义的。另外，在图22中，为了容易理解，将用户说出的内容(参照图22的“说话内容”的栏)与设备功能信息对应起来表示。如图22所示，在第1应答文信息中，例如，可以将与说出的内容相关的应答文、与执行的功能相关的应答文、与操作方法相关的应答文、或者与小知识相关的应答文作为第1应答文候选而与1个设备功能信息对应起来。

应答文决定部104从在第1应答文信息中与设备功能信息取得部101取得的设备功能信息对应起来的第1应答文候选中决定与第1预测经过时间相应的第1应答文。如果是与设备功能信息对应且与第1预测经过时间相应的第1应答文候选，则应答文决定部104通过适当的方法来决定将哪个第1应答文候选设为第1应答文即可。

例如，在设备功能信息取得部101取得的设备功能信息是将“IH烹饪加热器”的信息与“烤鱼炉”、“切块模式”及“火力4”的信息对应起来的信息并且预测部110预测到的第1预测经过时间为5秒的情况下，应答文决定部104将“烧烤颜色设定为与上次相同标准的烧烤颜色”决定为第1应答文。

另外，这里如上述的例子那样，应答文决定部104例如在第1预测经过时间为5秒的情况下，将在第1应答文信息中与第1预想时间“3～7秒”对应的第1应答文候选决定为第1应答文。但是，这只不过是一例，应答文决定部104例如也可以在第1预测经过时间为5秒的情况下，将在第1应答文信息中与第1预想时间“～3秒”对应的第1应答文候选和与“3～7秒”对应的第1应答文候选一起设为第1应答文候选。即，在上述的例子中，应答文决定部104也可以将“现在正在准备切块模式。烧烤颜色设定为与上次相同标准的烧烤颜色”决定为第1应答文。

此外，图22所示的第1应答文信息的内容只不过是一例。在第1应答文信息中与1个设备功能信息对应起来的第1应答文候选也可以仅为1个，第1应答文候选还可以为与说出的内容相关的应答文、与执行的功能相关的应答文、与操作方法相关的应答文、或者与小知识相关的应答文以外的应答文。在第1应答文信息中，作为针对1个设备功能信息的第1应答文候选，定义与对象设备关联的1个以上的第1应答文即可。此外，在设备功能信息中包含声音识别结果的情况下，存储在应答DB106中的第1应答文信息也可以包含将声音识别结果与可以成为第1应答文的第1应答文候选对应起来而定义的信息。在该情况下，应答文决定部104也能够从与声音识别结果对应起来的第1应答文候选中决定第1应答文。

对实施方式5的设备控制装置1b的应答输出部100b的动作详细进行说明。

图23是用于说明实施方式5的设备控制装置1b的应答输出部100a的详细动作的流程图。另外，在使用了图23的以下的动作说明中，作为一例，时间判定部103在与第1预测经过时间的比较中使用的第4目标时间为“n4秒”。

图23的步骤ST2302、步骤ST2305的具体动作分别与在实施方式1中说明的图8的步骤ST802、步骤ST806的具体动作相同，因此，省略重复的说明。

预测部110预测第1预测经过时间(步骤ST2301)。

时间判定部103判定第1预测经过时间是否超过n4秒(步骤ST2303)。

在步骤ST2303中，在时间判定部103判定为第1预测经过时间未超过n4秒的情况下(步骤ST2303的“否”的情况)，时间判定部103判定为执行所需时间不长，应答输出部100b结束处理。另外，输出控制部105，在执行通知受理部107受理到从对象设备输出的执行完成通知、且输出控制部105输出表示执行应答的信息之后，应答输出部100b结束处理。

在步骤ST2303中，在时间判定部103判定为第1预测经过时间超过n4秒的情况下(步骤ST2303的“是”的情况)，时间判定部103判定为执行所需时间长，将功能执行延迟信息向应答文决定部104输出。

在步骤ST2303中从时间判定部103输出功能执行延迟信息时，应答文决定部104基于在步骤ST2302中由设备功能信息取得部101取得的设备功能信息，决定与在步骤ST2301中由预测部110预测到的第1预测经过时间相应的第1应答文(步骤ST2304)。

图24是示出在实施方式5的设备控制装置1b进行图23中说明的动作并且判定为执行所需时间长的情况下使声音输出装置42声音输出与第1预测经过时间相应的长度的第1应答文为止的时间流的图像的图。

如以上那样，设备控制装置1b在第1预测经过时间超过第4目标时间的情况下，输出表示与第1预测经过时间相应的长度的第1应答文的信息。即，在设备控制装置1中，在预测为在从取得说话声音到功能命令输出部202输出功能命令为止的期间内会经过第4目标时间的情况下，时间判定部103判定为执行所需时间长，输出控制部105将由应答文决定部104决定的表示与第1预测经过时间相应的长度的第1应答文的信息向声音输出装置42输出。此时，设备控制装置1b根据预测到的第1预测经过时间的长度来变更所决定的第1应答文的长度，因此，在用户通过说话指示了由对象设备执行对象功能时，即便在执行所需时间长的情况下，在此期间，用户也能够识别是否将要通过设备执行预期功能，并且，相比于使声音输出装置42声音输出与执行所需时间的长度无关的固定长度的第1应答文的情况，设备控制装置1b能够进一步降低用户感觉到等待的可能性。

在以上的实施方式5中，预测部110预测的第1预测经过时间为从声音取得时刻到功能命令输出部202输出功能命令为止的经过时间，但这只不过是一例。

例如，第1预测经过时间也可以为从声音取得时刻到功能命令输出部202输出的功能命令到达对象设备为止。此外，例如，第1预测经过时间也可以为从声音取得时刻到执行通知受理部107受理了针对功能命令输出部202输出的功能命令而从对象设备发送的执行完成通知为止。

预测部110能够使用现有的技术，基于与因特网环境相关的信息来计算预测为功能命令到达对象设备为止所需的时间、以及预测为从对象设备发送的执行完成通知到达执行通知受理部107为止所需的时间。此外，预测部110能够基于被预先存储的与对象设备中的对象功能的处理时间的实绩相关的信息，来计算预测为对象设备执行对象功能所需的时间。预测部110基于能够计算的上述的各时间来预测第1预测经过时间即可。

此外，例如，预测部110也可以基于从声音操作装置300输出的设备功能信息、换言之为判定出对象设备及对象功能之后的信息，预测从判定出对象设备及对象功能的时刻(以下称为“对象功能判定时刻”。)到功能命令输出部202输出功能命令为止的经过时间作为第1预测经过时间。

在实施方式5中，例如，对象功能判定时刻是指设备功能判定部304取得了设备功能信息的时刻。预测部110能够从设备功能判定部304取得对象功能判定时刻。例如，设备功能判定部304在设备功能信息中附加表示对象功能判定时刻的信息并将该设备功能信息向预测部110输出即可。

此外，在实施方式1中，对象功能判定时刻也可以为预测部110从设备功能判定部304取得了设备功能信息的时刻。

如果预测部110将从对象功能判定时刻到功能命令输出部202输出功能命令为止的经过时间设为第1预测经过时间，并基于设备功能信息来预测该第1预测经过时间，则预测部110能够在确定了对象功能的基础上预测该第1预测经过时间。预测部110如果在确定了对象功能的基础上预测第1预测经过时间，则相比于将从声音取得时刻到功能命令输出部202输出功能命令为止的经过时间设为第1预测经过时间来预测该第1预测经过时间的情况，能够更加准确地预测该第1预测经过时间。

这样，预测部110也可以将第1预测经过时间设为从声音取得时刻到功能命令输出部202输出功能命令为止的经过时间，还可以设为从对象功能判定时刻到功能命令输出部202输出功能命令为止的经过时间。

如以上那样，根据实施方式5，设备控制装置1b构成为，具备预测从说话到执行对象功能为止的第1预测经过时间的预测部110，时间判定部103基于预测部110预测到的第1预测经过时间，判定从说话到执行对象功能为止的时间是否长，应答文决定部104在时间判定部103判定为从说话到执行对象功能为止的时间长的情况下，基于设备功能信息取得部101取得的设备功能信息，决定与预测部110预测到的第1预测经过时间相应的长度的第1应答文。因此，在基于针对用户的说话声音的声音识别结果来控制设备的技术中，即便在从说话到由设备执行功能为止的时间长的情况下，在此期间，用户也能够识别是否将要通过设备执行预期功能，并且，相比于使声音输出装置42声音输出与执行所需时间的长度无关的固定长度的第1应答文的情况，设备控制装置1b能够进一步降低用户感觉到等待的可能性。

实施方式6.

在实施方式5中，预测第1预测经过时间，在基于预测到的第1预测经过时间而判定为执行所需时间长的情况下，决定与该第1预测经过时间相应的长度的第1应答文。

在实施方式6中，对如下实施方式进行说明：输出使声音输出装置42以与第1预测经过时间相应的速度声音输出第1应答文的表示第1应答文的信息。

具备实施方式6的设备控制装置1b的设备控制***1000的结构与在实施方式1中使用图1说明的设备控制***1000的结构相同，因此，省略重复的说明。

此外，实施方式6的设备控制装置1b的结构与在实施方式1中使用图2～图3说明的结构以及在实施方式5中使用图21说明的结构相同，因此，省略重复的说明。

但是，实施方式6的设备控制装置1b的预测部110、应答文决定部104及输出控制部105的动作与实施方式5的设备控制装置1b的预测部110、应答文决定部104及输出控制部105的动作不同。

图25是示出实施方式6的设备控制装置1b的结构例的图。

如图25所示，预测部110将预测到的第1预测经过时间的信息向时间判定部103输出，并且向输出控制部105输出。

输出控制部105在输出表示第1应答文的信息时，基于从预测部110输出的第1预测经过时间的信息，对表示该第1应答文的信息赋予根据第1预测经过时间而调整的、声音输出第1应答文的速度的信息(以下称为“应答文输出速度信息”。)并输出。

输出控制部105例如将在第1预测经过时间内完成输出第1应答文的速度调整为声音输出第1应答文的速度。另外，在声音输出装置42中，预先决定了在声音输出何种长度的第1应答文时需要何种长度的时间。

声音输出装置42按照从输出控制部105输出的表示第1应答文的信息，以与对表示该第1应答文的信息赋予的应答文输出速度信息相应的再现速度将第1应答文声音输出。

应答文决定部104在时间判定部103判定为执行所需时间长的情况下，基于设备功能信息取得部101取得的设备功能信息，并基于在实施方式1中使用图5示出的第1应答文信息来决定第1应答文。具体的第1应答文决定的动作在实施方式1中已经进行了说明，因此，省略重复的说明。

对实施方式6的设备控制装置1b的应答输出部100b的动作进行说明。

另外，实施方式6的设备控制装置1b的基本动作与在实施方式1中使用图7的流程图说明的设备控制装置1的基本动作相同，因此，省略重复的说明。此外，实施方式6的设备控制装置1b的命令控制部200的详细动作与在实施方式1中使用图9说明的命令控制部200的详细动作相同，因此，省略重复的说明。

图26是用于说明实施方式6的设备控制装置1b的应答输出部100b的详细动作的流程图。

图26的步骤ST2601～步骤ST2604的具体动作分别与在实施方式5中说明的图23的步骤ST2301～步骤ST2303以及在实施方式1中说明的图8的步骤ST805的具体动作相同，因此，省略重复的说明。

输出控制部105将表示在步骤ST2604中由应答文决定部104决定的第1应答文的信息向声音输出装置42输出。此时，输出控制部105根据预测部110在步骤ST2601中预测到的第1预测经过时间来调整声音输出第1应答文的速度，将应答文输出速度信息赋予给表示第1应答文的信息并向声音输出装置42输出(步骤ST2605)。

图27是示出在实施方式6的设备控制装置1b进行图26中说明的动作并且判定为执行所需时间长的情况下使声音输出装置42以与第1预测经过时间相应的速度声音输出第1应答文为止的时间流的图像的图。

如图27的例1所示，例如，当预测部110预测出第1预测经过时间A时，输出控制部105将赋予了与第1预测经过时间A相应的应答文输出速度信息的表示第1应答文A的信息向声音输出装置42输出。声音输出装置42按照表示第1预测经过时间A的信息，以与第1预测经过时间A相应的速度声音输出第1应答文A。

如以上那样，在设备控制装置1b中，预测部110预测第1预测经过时间，在该第1预测经过时间超过第4目标时间的情况下，时间判定部103判定为执行所需时间长。然后，输出控制部105在输出表示第1应答文的信息时，基于预测部110预测到的第1预测经过时间，对表示该第1应答文的信息赋予应答文输出速度信息并输出。

设备控制装置1b根据预测到的第1预测经过时间的长度，来变更从声音输出装置42声音输出的第1应答文的再现速度，因此，在用户通过说话指示了由对象设备执行对象功能时，即便在执行所需时间长的情况下，在此期间，用户也能够识别是否将要通过设备执行预期功能，并且，相比于使声音输出装置42声音输出与执行所需时间的长度相关的固定长度的第1应答文的情况，设备控制装置1b能够进一步降低用户感觉到等待的可能性。

如以上那样，根据实施方式6，设备控制装置1b构成为，具备预测从说话到执行对象功能为止的第1预测经过时间的预测部110，时间判定部103基于预测部110预测到的第1预测经过时间，判定从说话到执行对象功能为止的时间是否长，输出控制部105在时间判定部103判定为从说话到执行对象功能为止的时间长的情况下，向表示第1应答文的信息赋予根据预测部110预测到的第1预测经过时间而调整的声音输出第1应答文的速度的信息并输出。因此，在基于针对用户的说话声音的声音识别结果来控制设备的技术，即便在从说话到由设备执行功能为止的时间长的情况下，在此期间，用户也能够识别是否将要通过设备执行预期功能，并且，相比于使声音输出装置42声音输出与执行所需时间的长度无关的固定长度的第1应答文的情况，设备控制装置1b能够进一步降低用户感觉到等待的可能性。

实施方式7.

在实施方式1中，在设备控制装置1中判定为执行所需时间长的情况下，与用户说出的内容无关，从声音输出装置42声音输出第1应答文。

在实施方式7中，对如下实施方式进行说明：在用户通过说话而指示了执行的对象设备的对象功能是需要紧急的功能的情况下，从声音输出装置42声音输出促使用户进行手动操作的消息。

具备实施方式7的设备控制装置1c的设备控制***1000的结构与在实施方式1中使用图1说明的设备控制***1000的结构相同，因此，省略重复的说明。

图28是示出实施方式7的设备控制装置1c的结构例的图。

在图28中，针对与实施方式1的设备控制装置1同样的结构标注相同的标号并省略重复的说明。此外，设备控制装置1c的概要结构例及设备控制装置1c的声音操作装置300的结构例与在实施方式1中使用图2及图3说明的设备控制装置1的概要结构例及设备控制装置1的声音操作装置300的结构例相同，因此，省略重复的说明

实施方式7的设备控制装置1c与实施方式1的设备控制装置1的不同之处在于，应答输出部100c具备紧急度判定部111。

紧急度判定部111基于设备功能信息取得部101取得的设备功能信息，判定使对象设备执行的对象功能的紧急度。另外，在实施方式7中，设备功能信息取得部101将从设备功能判定部304取得的设备功能信息向应答文决定部104、功能命令生成部201及紧急度判定部111输出。

举出具体例的话，在设备功能信息中作为对象功能而将“立即停止”或“立即关火”等对应起来的情况下，紧急度判定部111认为对象功能是需要紧急的功能，判定为紧急度高。

例如，在存储部中预先存储有“立即停止”或“立即关火”这样的定义了需要紧急的功能的紧急功能信息，紧急度判定部111基于紧急功能信息，判定使对象设备执行的对象功能的紧急度。在紧急功能信息中定义了设备功能信息所包含的对象功能的情况下，紧急度判定部111判定为使对象设备执行的对象功能的紧急度高。

此外，在设备功能信息中包含声音识别结果的情况下，紧急度判定部111也可以基于该声音识别结果，判定使对象设备执行的对象功能的紧急度。举出具体例的话，例如，紧急度判定部111也可以在声音识别结果中包含表示感情的单词的情况下，判定为使对象设备执行的对象功能的紧急度高。紧急度判定部111使用现有的感情估计技术，来估计在声音识别结果中是否包含表示感情的单词。

另外，在实施方式7中，如上所述，紧急度判定部111从设备功能判定部304取得声音识别结果，但紧急度判定部111也可以从声音识别部302取得声音识别结果。

紧急度判定部111在判定为使对象设备执行的对象功能的紧急度高的情况下，将该紧急度高这一旨意的信息(以下称为“有紧急功能指示信息”。)向输出控制部105输出。

输出控制部105在从紧急度判定部111输出了有紧急功能指示信息的情况下，输出表示促使手动地操作对象设备的消息的信息。促使手动地操作对象设备的消息例如是“请手动地进行操作”。

声音输出装置42按照从输出控制部105输出的表示“请手动地进行操作”的信息，声音输出为“请手动地进行操作”。

对实施方式7的设备控制装置1c的应答输出部100c的动作详细进行说明。

另外，实施方式7的设备控制装置1c的基本动作与在实施方式1中使用图7的流程图说明的设备控制装置1的基本动作相同，因此，省略重复的说明。此外，实施方式7的设备控制装置1c的命令控制部200的详细动作与在实施方式1中使用图9说明的命令控制部200的详细动作相同，因此，省略重复的说明。

图29是用于说明实施方式7的设备控制装置1c的应答输出部100c的详细动作的流程图。

图29的步骤ST2901～步骤ST2902、步骤ST2905～步骤ST2908的具体动作分别与在实施方式1中说明的图8的步骤ST801～步骤ST806的具体动作相同，因此，省略重复的说明。

在步骤ST2902中从设备功能信息取得部101输出设备功能信息时，紧急度判定部111基于设备功能信息取得部101取得的设备功能信息，判定使对象设备执行的对象功能的紧急度(步骤ST2903)。

在步骤ST2903中，在紧急度判定部111判定为使对象设备执行的对象功能的紧急度低的情况下(步骤ST2903的“否”的情况)，设备控制装置1c进入步骤ST2905的处理。

在步骤ST2903中，在紧急度判定部111判定为使对象设备执行的对象功能的紧急度高的情况下(步骤ST2903的“是”的情况)，紧急度判定部111将有紧急功能指示信息向输出控制部105输出。

在步骤ST2903中从紧急度判定部111输出了有紧急功能指示信息的情况下，输出控制部105输出表示促使手动地操作对象设备的消息的信息(步骤ST2904)。

图30是示出在实施方式7的设备控制装置1c进行图29中说明的动作并且判定为使对象设备执行的对象功能的紧急度高的情况下使促使手动地操作对象设备的消息从声音输出装置42声音输出的情况下的时间流的图像的图。

另外，为了比较，在图30中，一并图示出在设备控制装置1c中判定为使对象设备执行的对象功能的紧急度低且判定为执行所需时间长的情况下，使第1应答文从声音输出装置42声音输出为止的时间流的图像(参照图30的3001)。

如以上那样，设备控制装置1c在用户通过说话指示了执行的基于对象设备的对象功能是需要紧急的功能的情况下，从声音输出装置42声音输出促使用户进行手动操作的消息。

即，在设备控制装置1c中，在紧急度判定部111判定为使对象设备执行的对象功能的紧急度高的情况下，输出控制部105将表示促使手动地操作对象设备的消息的信息向声音输出装置42输出。

设备控制装置1c在用户通过说话指示了执行的基于对象设备的对象功能是需要紧急的功能的情况下，能够不使用户等待至由对象设备执行对象功能为止，而是促使用户迅速地执行该对象功能。

另外，在以上的说明中，对实施方式1的设备控制装置1应用了实施方式7，实施方式1的设备控制装置1具备紧急度判定部111，但这只不过是一例。也能够对实施方式2～实施方式6的设备控制装置1、1b应用实施方式7，实施方式2～实施方式6的设备控制装置1、1b具备紧急度判定部111。

如以上那样，根据实施方式7，设备控制装置1c构成为，具备判定使对象设备执行的对象功能的紧急度的紧急度判定部111，输出控制部105在紧急度判定部111判定为使对象设备执行的对象功能的紧急度高的情况下，输出表示促使手动地操作对象设备的消息的信息。因此，设备控制装置1c在用户通过说话指示了执行的基于对象设备的对象功能是需要紧急的功能的情况下，能够不使用户等待至由对象设备执行对象功能为止，而是促使用户迅速地执行该对象功能。

实施方式8.

在实施方式1中，设备控制装置1输出用于声音输出第1应答文的表示第1应答文的信息。

在实施方式8中，对输出用于显示第1应答文的、表示第1应答文的信息的实施方式进行说明。

具备实施方式8的设备控制装置1的设备控制***1000的结构与在实施方式1中使用图1说明的设备控制***1000的结构相同，因此，省略重复的说明。

此外，实施方式8的设备控制装置1的结构与在实施方式1中使用图2～图4说明的结构相同，因此，省略重复的说明。

但是，实施方式8的设备控制装置1的输出控制部105的动作与实施方式1的设备控制装置1的输出控制部105的动作不同。

图31是示出实施方式8的设备控制装置1的结构例的图。

如图31所示，输出控制部105将表示第1应答文的信息向声音输出装置42输出，并且向显示装置54输出。另外，输出控制部105向声音输出装置42输出的表示第1应答文的信息是用于声音输出第1应答文的信息，输出控制部105向显示装置54输出的表示第1应答文的信息是用于显示第1应答文的信息。

在实施方式8中，如图31所示，显示装置54设想配备在作为对象设备的家电设备5中。

输出控制部105将表示用于显示第1应答文的第1应答文的信息向显示装置54输出。输出控制部105使显示装置54显示的第1应答文可以是字符串，也可以是插图或图标。

实施方式8的设备控制装置1的基本动作与在实施方式1中使用图7的流程图说明的设备控制装置1的基本动作相同，因此，省略重复的说明。此外，实施方式8的设备控制装置1的命令控制部200的详细动作与在实施方式1中使用图9说明的命令控制部200的详细动作相同，因此，省略重复的说明。

表示实施方式8的设备控制装置1的应答输出部100的详细动作的流程图与在实施方式1中示出的图8的流程图相同，因此，使用图8的流程图对实施方式8的设备控制装置1的应答输出部100的详细动作进行说明。

另外，实施方式8的设备控制装置1中的步骤ST801～步骤ST805的具体动作与已经说明的实施方式1的设备控制装置1中的步骤ST801～步骤ST805的具体动作相同，因此，省略重复的说明。

在步骤ST806中，输出控制部105将表示第1应答文的信息向声音输出装置42输出，并且将表示第1应答文的信息向显示装置54输出。

如以上那样，设备控制装置1除了输出用于声音输出第1应答文的表示第1应答文的信息之外，还输出用于显示第1应答文的表示第1应答文的信息。

由此，因此，在基于针对用户的说话声音的声音识别结果来控制设备的技术中，即便在从说话到由设备执行功能为止的时间长的情况下，在此期间，用户也能够通过视觉来识别是否将要通过设备执行预期功能。

另外，在以上的说明中，输出控制部105将表示第1应答文的信息向声音输出装置42及显示装置54输出，但这只不过是一例。输出控制部105也可以将表示第1应答文的信息仅向显示装置54输出。

此外，在以上的说明中，对实施方式1的设备控制装置1应用了实施方式8，但这只不过是一例。也能够对实施方式2～实施方式7的设备控制装置1～1c应用实施方式8，实施方式2～实施方式7的设备控制装置1～1c输出第1应答文、第2应答文、或者用于显示促使手动地操作对象设备的消息的表示第1应答文的信息、表示第2应答文的信息、或者表示促使手动地操作对象设备的消息的信息。在将实施方式8应用于实施方式7的情况下，设备控制装置1c也能够输出表示促使手动地操作对象设备的消息的信息，例如，在显示装置54中使该消息以红色闪烁显示。

如以上那样，根据实施方式8，在设备控制装置1中构成为，输出控制部105输出用于显示第1应答文的信息。因此，在基于针对用户的说话声音的声音识别结果来控制设备的技术中，即便在从说话到由设备执行功能为止的时间长的情况下，在此期间，用户也能够通过视觉来识别是否将要通过设备执行预期功能。

图32A、图32B是示出实施方式1～实施方式8的设备控制装置1～1c的硬件结构的一例的图。

在实施方式1～实施方式8中，声音取得部301、声音识别部302、设备功能判定部304、应答输出部100及命令控制部200的功能由处理电路3201实现。即，设备控制装置1～1c具备处理电路3201，该处理电路3201用于在判定为从用户的说话到执行对象功能为止的时间长的情况下，进行输出表示与对象功能关联的第1应答文的信息的控制。

处理电路3201可以如图32A所示那样是专用的硬件，也可以如图32B所示那样是执行存储在存储器3206中的程序的CPU(Central Processing Unit：中央处理单元)3105。

在处理电路3201是专用的硬件的情况下，处理电路3201例如对应于单一电路、复合电路、程序化的处理器、并行程序化的处理器、ASIC(Application Specific IntegratedCircuit：专用集成电路)、FPGA(Field-Programmable Gate Array：现场可编程门阵列)、或者它们的组合。

在处理电路3201为CPU3205的情况下，声音取得部301、声音识别部302、设备功能判定部304、应答输出部100及命令控制部200的功能通过软件、固件、或者软件与固件的组合来实现。即，声音取得部301、声音识别部302、设备功能判定部304、应答输出部100及命令控制部200通过执行存储在HDD(Hard Disk Drive：硬盘驱动器)3202、存储器3206等中的程序的CPU3205或***LSI(Large-Scale Integration)等处理电路来实现。此外，存储在HDD3202或存储器3206等中的程序也可以说是使计算机执行声音取得部301、声音识别部302、设备功能判定部304、应答输出部100及命令控制部200的步骤或方法。这里，存储器3106例如对应于RAM(Random Access Memory：随机存取存储器)、ROM(Read Only Memory：只读存储器)、闪存、EPROM(Erasable Programmable Read Only Memory：可擦可编程只读存储器)、EEPROM(Electrically Erasable Programmable Read-Only Memory：电可擦可编程只读存储器)等非易失性或易失性的半导体存储器、磁盘、软盘、光盘、高密度盘、迷你盘或DVD(Digital Versatile Disc：数字通用光盘)等。

另外，关于声音取得部301、声音识别部302、设备功能判定部304、应答输出部100及命令控制部200的功能，也可以由专用的硬件实现一部分，由软件或固件实现一部分。例如，能够由作为专用的硬件的处理电路3201实现应答输出部100的功能，通过处理电路读出并执行存储在存储器3206中的程序来实现声音取得部301、声音识别部302、设备功能判定部304及命令控制部200的功能。

此外，声音识别词典DB303、设备功能DB305、应答DB106及未图示的存储部使用存储器3206。另外，作为一例，声音识别词典DB303、设备功能DB305、应答DB106、未图示的存储部也可以由HDD3202、SSD(Solid State Drive：固态盘)或DVD等构成。

此外，设备控制装置1～1c具有声音输入装置41、声音输出装置42或者与家电设备5等进行通信的输入接口装置3203及输出接口装置3204。

另外，在以上的实施方式1～实施方式8中，声音操作装置300配备在设备控制装置1～1c中，但这只不过是一例。声音操作装置300也可以配备在设备控制装置1～1c的外部，经由网络而与设备控制装置1～1c连接。

此外，在以上的实施方式1～实施方式8中，将对象设备设为了家电设备5，但对象设备不限于家电设备5。例如，也能够将设置于工厂的设备、智能手机或车载设备等能够根据基于说话声音的声音识别结果来执行自身具有的功能的所有设备设为对象设备。

此外，在以上的实施方式1～实施方式8中，如图1所示，在设备控制***1000中，将设备控制装置1～1c、声音输入装置41、声音输出装置42及家电设备5分别设为独立的装置进行了说明，但这只不过是一例。

例如，声音输入装置41及声音输出装置42也可以搭载于家电设备5。

图33示出在实施方式1的设备控制***1000中声音输入装置41及声音输出装置42搭载于家电设备5的情况下的设备控制***1000的结构例。另外，在图33中，省略记载设备控制装置1及家电设备5的详细结构。

此外，例如，设备控制装置1～1c也可以搭载于家电设备5。

图34示出在实施方式1的设备控制***1000中设备控制装置1搭载于家电设备5的情况下的设备控制***1000的结构例。另外，在图34中，省略记载设备控制装置1及家电设备5的详细结构。

此外，例如，设备控制装置1～1c、声音输入装置41及声音输出装置42也可以搭载于家电设备5。

图35示出在实施方式1的设备控制***1000中设备控制装置1、声音输入装置41及声音输出装置42搭载于家电设备5的情况下的设备控制***1000的结构例。另外，在图35中，省略记载设备控制装置1及家电设备5的详细结构。

此外，在以上的说明中，设想设备控制装置1～1c配备在室外的服务器中，并与室内的家电设备5进行通信，但不限于此，设备控制装置1～1c也可以与室内的网络连接。

此外，本申请发明在该发明的范围内，能够进行各实施方式的自由组合或各实施方式的任意的结构要素的变形、或者在各实施方式中能够省略任意的结构要素。

产业利用性

本发明的设备控制装置构成为，在基于针对用户的说话声音的声音识别结果来控制设备的技术中，即便在从说话到由设备执行功能为止的时间长的情况下，在此期间，用户也能够识别是否将要通过设备执行预期功能，因此，例如能够应用于基于针对说话声音的声音识别结果来控制设备的设备控制装置。

标号说明

1～1c设备控制装置，4智能扬声器，41声音输入装置，42声音输出装置，5家电设备，51功能命令取得部，52功能命令执行部，53执行通知部，54显示装置，100、100a～100c应答输出部，101设备功能信息取得部，102时间计测部，103时间判定部，104应答文决定部，105输出控制部，106应答DB，107执行通知受理部，108第1应答文输出后时间计测部，109第1应答文输出后时间判定部，110预测部，111紧急度判定部，200命令控制部，201功能命令生成部，202功能命令输出部，300声音操作装置，301声音取得部，302声音识别部，303声音识别词典DB，304设备功能判定部，305设备功能DB，1000设备控制***，3201处理电路，3202HDD，3203输入接口装置，3204输出接口装置，3205CPU，3206存储器。

Claims

1.一种设备控制装置，其基于针对说话声音的声音识别结果来控制设备，其中，

所述设备控制装置具备：

设备功能信息取得部，其取得将对象设备和使该对象设备执行的对象功能对应起来的设备功能信息，所述对象设备和所述对象功能是基于所述声音识别结果而判定出的；

时间判定部，其判定从说话到执行所述对象功能为止的时间是否长；

应答文决定部，其在所述时间判定部判定为从所述说话到执行所述对象功能为止的时间长的情况下，基于所述设备功能信息取得部取得的设备功能信息，决定与所述对象设备关联的第1应答文；以及

输出控制部，其输出表示所述应答文决定部决定的第1应答文的信息。

2.根据权利要求1所述的设备控制装置，其特征在于，

所述设备控制装置具备时间计测部，该时间计测部计测从取得所述说话声音开始的第1经过时间，

所述时间判定部在所述时间计测部计测出的所述第1经过时间超过第1目标时间的情况下，判定为从所述说话到执行所述对象功能为止的时间长。

3.根据权利要求2所述的设备控制装置，其特征在于，

所述设备控制装置具备：

功能命令生成部，其基于所述设备功能信息取得部取得的设备功能信息，生成用于执行所述对象功能的功能命令；以及

功能命令输出部，其将所述功能命令生成部生成的功能命令向所述对象设备输出，

所述时间计测部在所述功能命令输出部输出所述功能命令时，结束所述第1经过时间的计测。

4.根据权利要求3所述的设备控制装置，其特征在于，

在所述输出控制部输出表示所述第1应答文的信息之后所述功能命令生成部完成了所述功能命令的生成的情况下，

如果基于所述输出控制部输出的表示第1应答文的信息而进行的该第1应答文的输出未完成，则所述功能命令输出部保留所述功能命令的输出，直至完成该第1应答文的输出为止。

5.根据权利要求1所述的设备控制装置，其特征在于，

所述设备控制装置具备：

功能命令生成部，其基于所述设备功能信息取得部取得的设备功能信息，生成用于执行所述对象功能的功能命令；

功能命令输出部，其将所述功能命令生成部生成的功能命令向所述对象设备输出；以及

时间计测部，其计测从取得所述说话声音开始的第2经过时间，当所述对象设备基于所述功能命令输出部输出的功能命令而完成所述对象功能的执行时，结束所述第2经过时间的计测，

所述时间判定部在所述时间计测部计测出的所述第2经过时间超过第2目标时间的情况下，判定为从所述说话到执行所述对象功能为止的时间长。

6.根据权利要求1所述的设备控制装置，其特征在于，

所述设备控制装置具备：

第1应答文输出后时间计测部，其计测从所述输出控制部输出表示所述第1应答文的信息开始的第1应答文输出后时间；以及

第1应答文输出后时间判定部，其判定所述第1应答文输出后时间计测部计测出的第1应答文输出后时间是否超过第3目标时间，

所述应答文决定部在所述第1应答文输出后时间判定部判定为所述第1应答文输出后时间超过所述第3目标时间的情况下，决定第2应答文，

所述输出控制部除了输出表示所述第1应答文的信息之外，还输出表示所述应答文决定部决定的第2应答文的信息。

7.根据权利要求6所述的设备控制装置，其特征在于，

所述第2应答文是基于所述设备功能信息取得部取得的设备功能信息的、与所述对象设备关联的应答文，或者所述第2应答文是道歉消息。

8.根据权利要求1所述的设备控制装置，其特征在于，

所述设备控制装置具备预测部，该预测部预测从所述说话到执行所述对象功能为止的第1预测经过时间，

所述时间判定部基于所述预测部预测出的所述第1预测经过时间，判定从所述说话到执行所述对象功能为止的时间是否长，

所述应答文决定部在所述时间判定部判定为从所述说话到执行所述对象功能为止的时间长的情况下，基于所述设备功能信息取得部取得的设备功能信息，决定与所述预测部预测出的第1预测经过时间相应的长度的所述第1应答文。

9.根据权利要求1所述的设备控制装置，其特征在于，

所述输出控制部在所述时间判定部判定为从所述说话到执行所述对象功能为止的时间长的情况下，向表示所述第1应答文的信息赋予根据所述预测部预测出的第1预测经过时间而调整的输出所述第1应答文的速度的信息并进行输出。

10.根据权利要求1至9中的任意一项所述的设备控制装置，其特征在于，

所述设备控制装置具备紧急度判定部，该紧急度判定部判定使所述对象设备执行的所述对象功能的紧急度，

所述输出控制部在所述紧急度判定部判定为使所述对象设备执行的所述对象功能的紧急度高的情况下，输出表示促使手动地操作所述对象设备的消息的信息。

11.根据权利要求1所述的设备控制装置，其特征在于，

表示所述第1应答文的信息是用于声音输出所述第1应答文的信息。

12.根据权利要求1所述的设备控制装置，其特征在于，

表示所述第1应答文的信息是用于显示所述第1应答文的信息。

13.一种设备控制方法，是基于针对说话声音的声音识别结果来控制设备的设备控制方法，其中，

所述设备控制方法具备如下步骤：

设备功能信息取得部取得将对象设备和使该对象设备执行的对象功能对应起来的设备功能信息，所述对象设备和所述对象功能是基于所述声音识别结果而判定出的；

时间判定部判定从说话到执行所述对象功能为止的时间是否长；

应答文决定部在所述时间判定部判定为从所述说话到执行所述对象功能为止的时间长的情况下，基于所述设备功能信息取得部取得的设备功能信息，决定与所述对象设备关联的第1应答文；以及

输出控制部输出表示所述应答文决定部决定的第1应答文的信息。