WO2021103788A1

WO2021103788A1 - 智能音箱设置方法和装置、控制方法和装置、智能音箱

Info

Publication number: WO2021103788A1
Application number: PCT/CN2020/117180
Authority: WO
Inventors: 吴晓洋
Original assignee: 北京沃东天骏信息技术有限公司; 北京京东世纪贸易有限公司
Priority date: 2019-11-26
Filing date: 2020-09-23
Publication date: 2021-06-03
Also published as: CN111785265A

Abstract

一种智能音箱设置方法和装置、控制方法和装置、智能音箱，涉及控制领域。智能音箱设置方法包括：采集第一用户语音信息，以便从第一用户语音信息中提取出指示内容(101)；若指示内容是预设的启动设置引导词，则进入自定义设置模式(102)；采集第二用户语音信息，并将从第二用户语音信息中提取出的内容作为自定义设置引导词(103)；采集第三用户语音信息以作为自定义设置内容(104)；将自定义设置引导词和自定义设置内容进行关联存储(105)。可根据用户语音将与自定义设置引导词相关联的自定义设置内容进行播放，从而有效提升了用户体验。

Description

智能音箱设置方法和装置、控制方法和装置、智能音箱

相关申请的交叉引用

本申请是以CN申请号为201911171447.4，申请日为2019年11月26日的申请为基础，并主张其优先权，该CN申请的公开内容在此作为整体引入本申请中。

技术领域

本公开涉及控制领域，特别涉及一种智能音箱设置方法和装置、控制方法和装置、智能音箱。

背景技术

目前，在智能音箱领域中，用户通过向智能音箱发出语音指示，智能音箱通过对语音指示进行解析，并根据解析结果从预先设置的知识库中查询相应内容并播放给用户。

发明内容

根据本公开实施例的第一方面，提供一种智能音箱控制方法，包括：从采集的第一用户语音信息中提取出指示内容；若指示内容是预设的启动设置引导词，则进入自定义设置模式；采集第二用户语音信息；将从第二用户语音信息中提取出的内容作为自定义设置引导词；采集第三用户语音信息以作为自定义设置内容；将自定义设置引导词和自定义设置内容进行关联存储。

在一些实施例中，智能音箱控制方法还包括：在将从第二用户语音信息中提取出的内容作为自定义设置引导词后，检测自定义设置引导词是否与已有引导词发生冲突；并且，在自定义设置引导词不与已有引导词发生冲突的情况下，采集第三用户语音信息以作为自定义设置内容。

在一些实施例中，智能音箱控制方法还包括：在自定义设置引导词与已有引导词发生冲突的情况下，再次采集第二用户语音信息，以便将从再次采集的第二用户语音信息中提取出的内容作为自定义设置引导词。

在一些实施例中，智能音箱控制方法还包括：在进入自定义设置模式后，采集第四用户语音信息；将从第四用户语音信息中提取出的内容作为场景指令，并根据场景指令进入相应场景，其中，在进入相应场景后，采集第二用户语音信息。

在一些实施例中，将自定义设置引导词和自定义设置内容进行关联存储包括：将自定义设置引导词和自定义设置内容在云服务器中进行关联存储。

在一些实施例中，智能音箱控制方法还包括：从采集的第五用户语音信息中提取出查询信息；利用查询信息中的引导词，查询引导词关联的自定义设置内容；播放查询出的自定义设置内容。

在一些实施例中，查询信息还包括场景信息，并且查询出的自定义设置内容还与场景信息相关联。

根据本公开实施例的第二方面，提供一种智能音箱控制装置，包括：指示提取模块，被配置为从采集的第一用户语音信息中提取出指示内容；模式控制模块，被配置为若指示内容是预设的启动设置引导词，则进入自定义设置模式；引导词采集模块，被配置为采集第二用户语音信息，并将从第二用户语音信息中提取出的内容作为自定义设置引导词；内容采集模块，被配置为采集第三用户语音信息以作为自定义设置内容；存储模块，被配置为将自定义设置引导词和自定义设置内容进行关联存储。

在一些实施例中，智能音箱控制装置还包括：信息提取模块，被配置为从采集的第五用户语音信息中提取出查询信息；查询模块，被配置为利用查询信息中的引导词查询引导词关联的自定义设置内容；播放模块，被配置为播放查询出的自定义设置内容。

根据本公开实施例的第三方面，提供一种智能音箱控制装置，包括：存储器，被配置为存储指令；处理器，耦合到存储器，处理器被配置为基于存储器存储的指令执行实现如上述任一实施例所述的方法。

根据本公开实施例的第四方面，提供一种智能音箱，包括如上述任一实施例所述的智能音箱控制装置。

根据本公开实施例的第五方面，提供一种计算机可读存储介质，其中，计算机可读存储介质存储有计算机指令，指令被处理器执行时实现如上述任一实施例涉及的方法。

通过以下参照附图对本公开的示例性实施例的详细描述，本公开的其它特征及其优点将会变得清楚。

附图说明

构成说明书的一部分的附图描述了本公开的实施例，并且连同说明书一起用于解释本公开的原理。

参照附图，根据下面的详细描述，可以更加清楚地理解本公开，其中：

图1是根据本公开一些实施例的智能音箱设置方法的流程示意图；

图2是根据本公开另一些实施例的智能音箱设置方法的流程示意图；

图3根据本公开一些实施例的智能音箱设置装置的结构示意图；

图4根据本公开另一些实施例的智能音箱设置装置的结构示意图；

图5是根据本公开一些实施例的智能音箱控制方法的流程示意图；

图6是根据本公开一些实施例的智能音箱控制装置的结构示意图；

图7是根据本公开另一些实施例的智能音箱控制装置的结构示意图。

应当明白，附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。此外，相同或类似的参考标号表示相同或类似的构件。

具体实施方式

现在将参照附图来详细描述本公开的各种示例性实施例。对示例性实施例的描述仅仅是说明性的，决不作为对本公开及其应用或使用的任何限制。本公开可以以许多不同的形式实现，不限于这里所述的实施例。提供这些实施例是为了使本公开透彻且完整，并且向本领域技术人员充分表达本公开的范围。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、材料的组分和数值应被解释为仅仅是示例性的，而不是作为限制。

本公开中使用的“包括”或者“包含”等类似的词语意指在该词前的要素涵盖在该词后列举的要素，并不排除也涵盖其他要素的可能。

本公开使用的所有术语(包括技术术语或者科学术语)与本公开所属领域的普通技术人员理解的含义相同，除非另外特别定义。还应当理解，在诸如通用字典中定义的术语应当被解释为具有与它们在相关技术的上下文中的含义相一致的含义，而不应用理想化或极度形式化的意义来解释，除非这里明确地这样定义。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。

发明人通过研究发现，在相关技术中，智能音箱使用的知识库通常是预先设置的知识库，例如百科网站、音乐网站等公共的知识库。智能音箱并不会使用与用户相对应的私有知识库为用户提供个性化服务。

据此，本公开提供一种智能音箱使用私有知识库为用户提供个性化服务的方案。

图1是根据本公开一些实施例的智能音箱设置方法的流程示意图。在一些实施例中，下面的智能音箱设置方法步骤由智能音箱设置装置执行。

在步骤101，采集用户语音信息，以便从所采集的用户语音信息中提取出指示内容。

在步骤102，若指示内容是预设的启动设置引导词，则进入自定义设置模式。在一些实施例中，用于提取启动设置引导词的语音信息为第一用户语音信息。

例如，若用户说“设计自定义技能”，其中启动设置引导词为“自定义技能”，则智能音箱进入自定义设置模式。

在步骤103，采集用户语音信息，以便将从所采集的用户语音信息中提取出的内容作为自定义设置引导词。在一些实施例中，用于提取自定义设置引导词的语音信息为第二用户语音信息。

例如，在智能音箱进入自定义设置模式后，若用户说“白雪公主”，则将“白雪公主”作为用户自定义的技能引导词。

在步骤104，采集用户语音信息以作为自定义设置内容。在一些实施例中，作为自定义设置内容的语音信息为第三用户语音信息。

例如，在用户说出自定义设置引导词后，可根据智能音箱的提示录入童话故事、儿童歌曲等内容。如在用户说“白雪公主”后，可根据智能音箱的提示开始讲白雪公主的故事。在讲的过程中可以暂停，将故事讲完后可进行相应操作以结束录入。例如点击智能音箱的结束按钮等，或者对智能音箱说“故事讲完了”等预设的语音结束指令，以便智能音箱结束语音录入。

在步骤105，将自定义设置引导词和自定义设置内容进行关联存储。

在一些实施例中，将自定义设置引导词和自定义设置内容在云服务器中进行关联存储。

在本公开上述实施例提供的智能音箱设置方法中，用户通过自定义设置模式录入自定义设置引导词和自定义设置内容，以便构建个性化的知识库，从而能够为用户提供个性化的服务。

图2是根据本公开一些实施例的智能音箱设置方法的流程示意图。在一些实施例中，下面的智能音箱设置方法步骤由智能音箱设置装置执行。

在步骤201，采集用户语音信息，以便从所采集的用户语音信息中提取出指示内容。

在步骤202，若指示内容是预设的启动设置引导词，则进入自定义设置模式。

例如，若用户说“设计自定义技能”，则智能音箱进入自定义设置模式。

在步骤203，采集用户语音信息，以便将从所采集的用户语音信息中提取出的内容作为场景指令，并根据场景指令进入相应场景。在一些实施例中，用于提取场景指令的语音信息为第四用户语音信息。

在一些实施例中，场景包括分享领域的场景和私人领域的场景。例如，若用户说“进入分享领域”，则智能音箱进入分享领域。位于分享领域中的内容可用于通过网络分享，从而有助于积累粉丝。若用户说“进入私人领域”，则智能音箱进入私人领域。位于私人领域中的内容用于个人、家庭或特定人群使用。

在步骤204，采集用户语音信息，以便将从所采集的用户语音信息中提取出的内容作为自定义设置引导词。

在一些实施例中，检测用户的自定义设置引导词是否与已有引导词发生冲突，例如通过步骤S205实现。

在步骤205，检测自定义设置引导词是否与已有引导词发生冲突。

若自定义设置引导词不与已有引导词发生冲突，则执行步骤206；若自定义设置引导词与已有引导词发生冲突，则重复执行步骤204。

例如，若用户说“白雪公主”，但之前已使用“白雪公主”作为引导词了，为了避免冲突，用户可将说出的内容调整为“宝宝爱听的白雪公主”。

在步骤206，采集用户语音信息以作为自定义设置内容。

在步骤207，将自定义设置引导词和自定义设置内容进行关联存储。

图3根据本公开一些实施例的智能音箱设置装置的结构示意图。如图3所示，智能音箱设置装置包括指示提取模块31、模式控制模块32、引导词采集模块33、内容采集模块34和存储模块35。

指示提取模块31被配置为采集用户语音信息，以便从所采集的用户语音信息中提取出指示内容。

模式控制模块32被配置为若指示内容是预设的启动设置引导词，则进入自定义设置模式。在一些实施例中，用于提取启动设置引导词的语音信息为第一用户语音信息。

引导词采集模块33被配置为采集用户语音信息，以便将从所采集的用户语音信息中提取出的内容作为自定义设置引导词。在一些实施例中，用于提取自定义设置引导词的语音信息为第二用户语音信息。

内容采集模块34被配置为采集用户语音信息以作为自定义设置内容。在一些实施例中，作为自定义设置内容的语音信息为第三用户语音信息。

例如，在用户说出自定义设置引导词后，可根据智能音箱的提示录入童话故事、儿童歌曲等内容。如在用户说“白雪公主”后，可根据智能音箱的提示开始讲白雪公主的故事。在讲的过程中可以暂停，将故事讲完后可进行相应操作以结束录入。例如点击智能音箱的结束按钮，或者对智能音箱说“故事讲完了”等预设的语音结束指令，以便智能音箱结束语音录入。

存储模块35被配置为将自定义设置引导词和自定义设置内容进行关联存储。

在一些实施例中，存储模块35被配置为将自定义设置引导词和自定义设置内容在云服务器中进行关联存储。

在一些实施例中，引导词采集模块33被配置为在将从所采集的用户语音信息(例如第二用户语音信息)中提取出的内容作为自定义设置引导词后，检测自定义设置引导词是否与已有引导词发生冲突。若自定义设置引导词不与已有引导词发生冲突，则引导词采集模块33指示内容采集模块34执行采集用户语音信息(例如第三用户语音信息)以作为自定义设置内容的操作。若自定义设置引导词与已有引导词发生冲突，则引导词采集模块33再次采集用户语音信息，以便将从所采集的用户语音信息中提取出的内容作为自定义设置引导词。

在一些实施例中，引导词采集模块33被配置为在进入自定义设置模式后，采集用户语音信息，例如第四用户语音信息，以便将从所采集的用户语音信息中提取出的内容作为场景指令，并根据场景指令进入相应场景，然后执行采集用户语音信息，以便将从所采集的用户语音信息中提取出的内容作为自定义设置引导词的操作。

图4根据本公开一些实施例的智能音箱设置装置的结构示意图。如图4所示，该装置包括存储器41和处理器42。

存储器41用于存储指令。处理器42耦合到存储器41。处理器42被设置为基于存储器存储的指令执行实现如图1或图2中任一实施例涉及的方法。

如图4所示，该装置还包括通信接口43，用于与其它设备进行信息交互。同时，该装置还包括总线44，处理器42、通信接口43、以及存储器41通过总线44完成相互间的通信。

存储器41可以包含高速RAM(Random Access Memory，随机存取存储器)，也可还包括NVM(Non-Volatile Memory，非易失性存储器)。例如至少一个磁盘存储器。存储器41也可以是存储器阵列。存储器41还可能被分块，并且块可按一定的规则组合成虚拟卷。

此外，处理器42可以是一个中央处理器，或者可以是ASIC(Application Specific Integrated Circuit，专用集成电路)，或者是被设置成实施本公开实施例的一个或多个集成电路。

本公开还提供一种计算机可读存储介质。计算机可读存储介质存储有计算机指令，指令被处理器执行时实现如图1或图2中任一实施例涉及的方法。

图5是根据本公开一些实施例的智能音箱控制方法的流程示意图。智能音箱利用图1或图2中任一实施例涉及的方法进行设置。在一些实施例中，下面的智能音箱控制方法步骤由智能音箱控制装置执行。

在步骤501，采集用户语音信息，以便从所采集的用户语音信息中提取出查询信息。在一些实施例中，用于提取查询信息的语音信息为第五语音信息。

在步骤502，利用查询信息中的引导词，查询引导词关联的自定义设置内容。

在步骤503，播放查询出的自定义设置内容。

在一些实施例中，查询信息还包括场景信息。查询出的自定义设置内容还与场景信息相关联。

例如，孩子父母预先录入了白雪公主的故事。某天因父母出差，无法在孩子睡觉前给孩子将故事。孩子奶奶就可以给智能音箱说“私人场景，白雪公主”，则智能音箱在私人场景下查询与引导词“白雪公主”相关联的音频内容并进行播放。从而在父母不在孩子身边的情况下，也能给孩子讲故事。

图6是根据本公开一些实施例的智能音箱控制装置的结构示意图。智能音箱利用图1或图2中任一实施例涉及的方法进行设置。控制装置包括信息提取模块61、查询模块62和播放模块63。

信息提取模块61被配置为采集用户语音信息，以便从所采集的用户语音信息中提取出查询信息。在一些实施例中，用于提取查询信息的语音信息为第五语音信息。

查询模块62被配置为利用查询信息中的引导词，查询引导词关联的自定义设置内容。

播放模块63被配置为播放查询出的自定义设置内容。

图7是根据本公开另一些实施例的智能音箱控制装置的结构示意图。该装置包括存储器71、处理器72、通信接口73和总线74。图7与图4的不同之处在于，在图7所示实施例中，处理器72基于存储器71存储的指令执行实现如图6中任一实施例涉及的方法。

本公开还提供一种智能音箱。智能音箱包括如图3或图4中任一实施例涉及的智能音箱设置装置，和如图6或图7中任一实施例涉及的智能音箱控制装置中的至少一种。

本公开还提供一种计算机可读存储介质。计算机可读存储介质存储有计算机指令，指令被处理器执行时实现如图5中任一实施例涉及的方法。

在一些实施例中，上述功能模块可以实现为用于执行本公开所描述功能的通用处理器、可编程逻辑控制器(Programmable Logic Controller，简称：PLC)、数字信号处理器(Digital Signal Processor，简称：DSP)、专用集成电路(Application Specific Integrated Circuit，简称：ASIC)、现场可编程门阵列(Field-Programmable Gate Array，简称：FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件或者其任意适当组合。

至此，已经详细描述了本公开的实施例。为了避免遮蔽本公开的构思，没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述，完全可以明白如何实施这里公开的技术方案。

虽然已经通过示例对本公开的一些特定实施例进行了详细说明，但是本领域的技术人员应该理解，以上示例仅是为了进行说明，而不是为了限制本公开的范围。本领域的技术人员应该理解，可在不脱离本公开的范围和精神的情况下，对以上实施例进行修改或者对部分技术特征进行等同替换。本公开的范围由所附权利要求来限定。

Claims

一种智能音箱控制方法，包括：

从采集的第一用户语音信息中提取出指示内容；

若所述指示内容是预设的启动设置引导词，则进入自定义设置模式；

采集第二用户语音信息；

将从所述第二用户语音信息中提取出的内容作为自定义设置引导词；

采集第三用户语音信息以作为自定义设置内容；以及

将所述自定义设置引导词和所述自定义设置内容进行关联存储。
根据权利要求1所述的方法，其中：

所述智能音箱控制方法还包括：在将从所述第二用户语音信息中提取出的内容作为自定义设置引导词后，检测所述自定义设置引导词是否与已有引导词发生冲突；并且，

在所述自定义设置引导词不与已有引导词发生冲突的情况下，采集所述第三用户语音信息以作为自定义设置内容。
根据权利要求2所述的方法，还包括：

在所述自定义设置引导词与已有引导词发生冲突的情况下，再次采集第二用户语音信息，以便将从再次采集的第二用户语音信息中提取出的内容作为自定义设置引导词。
根据权利要求1所述的方法，还包括：

在进入自定义设置模式后，采集第四用户语音信息；以及

将从所述第四用户语音信息中提取出的内容作为场景指令，并根据场景指令进入相应场景，其中，在进入相应场景后，采集所述第二用户语音信息。
根据权利要求1所述的方法，其中，将所述自定义设置引导词和所述自定义设置内容进行关联存储包括：

将所述自定义设置引导词和所述自定义设置内容在云服务器中进行关联存储。
根据权利要求1-5中任一项所述的方法，还包括：

从采集的第五用户语音信息中提取出查询信息；

利用所述查询信息中的引导词，查询所述引导词关联的自定义设置内容；以及

播放查询出的自定义设置内容。
根据权利要求6所述的方法，其中，所述查询信息还包括场景信息，并且所述查询出的自定义设置内容还与所述场景信息相关联。
一种智能音箱控制装置，包括：

指示提取模块，被配置为从采集的第一用户语音信息中提取出指示内容；

模式控制模块，被配置为若所述指示内容是预设的启动设置引导词，则进入自定义设置模式；

引导词采集模块，被配置为采集第二用户语音信息，并将从所述第二用户语音信息中提取出的内容作为自定义设置引导词；

内容采集模块，被配置为采集第三用户语音信息以作为自定义设置内容；以及

存储模块，被配置为将所述自定义设置引导词和所述自定义设置内容进行关联存储。
根据权利要求8所述的智能音箱控制装置，还包括：

信息提取模块，被配置为从采集的第五用户语音信息中提取出查询信息；

查询模块，被配置为利用所述查询信息中的引导词查询所述引导词关联的自定义设置内容；

播放模块，被配置为播放查询出的自定义设置内容。
一种智能音箱控制装置，包括：

存储器，被配置为存储指令；

处理器，耦合到存储器，处理器被配置为基于存储器存储的指令执行实现如权利要求1-7中任一项所述的智能音箱控制方法。
一种智能音箱，包括如权利要求8-10中任一项所述的智能音箱控制装置。
一种非瞬时性计算机可读存储介质，其中，计算机可读存储介质存储有计算机指令，指令被处理器执行时实现如权利要求1-7中任一项所述的方法。