CN112188253A

CN112188253A - 语音控制方法、装置、智能电视和可读存储介质

Info

Publication number: CN112188253A
Application number: CN202011041222.XA
Authority: CN
Inventors: 付华东; 许福
Original assignee: Shenzhen Skyworth RGB Electronics Co Ltd
Current assignee: Shenzhen Skyworth RGB Electronics Co Ltd
Priority date: 2020-09-28
Filing date: 2020-09-28
Publication date: 2021-01-05
Anticipated expiration: 2040-09-28
Also published as: CN112188253B

Abstract

本发明实施例公开了语音控制方法、装置、智能电视和可读存储介质，该方法包括，在接收到语音控制指令时，根据所述语音控制指令确定对应的标准语音信息；若根据所述标准语音信息不能确定对应的操作指令，则根据所述标准语音信息和上一条完整语音信息确定对应的当前完整语音信息；根据所述当前完整语音信息确定对应的操作指令；响应所述操作指令并进入对应的工作模式。本发明通过上一条完整语音信息确定对应的当前完整语音信息，以使智能电视可以了解用户的意图。用户如果说一些简单的语句或者说一些省略关键信息的语句，智能电视同样会根据上下文了解用户深层次的含义，并执行相应的动作为用户提供更人性化的服务，提升了用户体验。

Description

语音控制方法、装置、智能电视和可读存储介质

技术领域

本发明涉及智能电视领域，尤其涉及一种语音控制方法、装置、智能电视和可读存储介质。

背景技术

普通智能电视的语音交互方法都停留在一问一答的形式上，用户问什么，智能电视就回答什么，略显呆板。目前，智能电视不能根据上下文语义环境分析当前用户输入的语句的意思，因而不能根据当前对话环境给用户必要的提示和引导。这样就会导致人机对话的体验感较差，使得交互欠缺人性化。

发明内容

鉴于上述问题，本发明提出一种语音控制方法、装置、智能电视和可读存储介质。

本发明的一个实施例提出一种语音控制方法，该方法包括：

在接收到语音控制指令时，根据所述语音控制指令确定对应的标准语音信息；

若根据所述标准语音信息不能确定对应的操作指令，则根据所述标准语音信息和上一条完整语音信息确定对应的当前完整语音信息；

根据所述当前完整语音信息确定对应的操作指令；

响应所述操作指令并进入对应的工作模式。

本发明的另一个实施例所述的语音控制方法，根据所述标准语音信息和上一条完整语音信息确定对应的当前完整语音信息，包括：

根据预设的相似度计算公式和预设的匹配规则确定所述标准语音信息和所述上一条完整语音信息之间的匹配相似度；

若所述匹配相似度大于预设的相似度阈值，根据所述上一条完整语音信息确定所述语音控制指令对应的当前完整语音信息。

上述根据预设的相似度计算公式和匹配权重计算所述标准语音信息和所述上一条完整语音信息之间的匹配相似度，包括：

利用所述相似度计算公式计算所述标准语音信息和所述上一条完整语音信息之间的初始相似度；

利用所述匹配规则确定所述标准语音信息和所述上一条完整语音信息之间的匹配权重；

将所述匹配权重乘以初始相似度以确定所述匹配相似度。

上述匹配规则包括精确匹配、中心匹配和广泛匹配，所述精确匹配的匹配权重大于所述中心匹配的匹配权重，所述中心匹配的匹配权重大于所述广泛匹配的匹配权重。

上述实施例所述的语音控制方法，还包括：

若所述匹配相似度小于等于预设的相似度阈值，则发送语音提醒，以提醒用户当前的语音控制指令无法识别。

上述操作指令包括第一类操作指令和第二类操作指令，在响应所述第一类操作指令时，点亮显示屏幕；在响应所述第二类操作指令时，保持所述显示屏幕息屏。

上述工作模式包括：聊天模式、天气模式、地图模式、电影模式、音乐模式、菜谱模式、股票模式、笑话模式和日期模式中的至少一种。

本发明的又一个是实施例提出一种语音控制装置，该装置包括：

标准语音确定模块，用于在接收到语音控制指令时，根据所述语音控制指令确定对应的标准语音信息；

完整语音确定模块，用于若根据所述标准语音信息不能确定对应的操作指令，则根据所述标准语音信息和上一条完整语音信息确定对应的当前完整语音信息；

操作指令确定模块，用于根据所述当前完整语音信息确定对应的操作指令；

操作指令响应模块，用于响应所述操作指令并进入对应的工作模式。

本发明实施例涉及一种智能电视，包括存储器和处理器，所述存储器用于存储计算机程序，所述计算机程序在所述处理器上运行时执行上述的语音控制方法。

本发明实施例涉及一种可读存储介质，其存储有计算机程序，所述计算机程序在处理器上运行时执行上述的语音控制方法。

本发明公开的语音控制方法包括在接收到语音控制指令时，根据所述语音控制指令确定对应的标准语音信息；若根据所述标准语音信息不能确定对应的操作指令，则根据所述标准语音信息和上一条完整语音信息确定对应的当前完整语音信息；根据所述当前完整语音信息确定对应的操作指令；响应所述操作指令并进入对应的工作模式。本发明通过上一条完整语音信息确定对应的当前完整语音信息，以使智能电视可以了解用户的意图。用户如果说一些简单的语句或者说一些省略关键信息的语句，智能电视同样会根据上下文了解用户深层次的含义，并执行相应的动作为用户提供更人性化的服务，提升了用户体验。

附图说明

为了更清楚地说明本发明的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对本发明保护范围的限定。在各个附图中，类似的构成部分采用类似的编号。

图1示出了本发明实施例提供的一种语音控制方法的流程示意图；

图2示出了本发明实施例提供的一种匹配相似度计算方法的流程示意图；

图3示出了本发明实施例提供的一种语音控制装置的结构示意图。

主要元件符号说明：

1-语音控制装置；100-标准语音确定模块；200-完整语音确定模块；300-操作指令确定模块；400-操作指令响应模块。

具体实施方式

下面将结合本发明实施例中附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。

通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

在下文中，可在本发明的各种实施例中使用的术语“包括”、“具有”及其同源词仅意在表示特定特征、数字、步骤、操作、元件、组件或前述项的组合，并且不应被理解为首先排除一个或更多个其它特征、数字、步骤、操作、元件、组件或前述项的组合的存在或增加一个或更多个特征、数字、步骤、操作、元件、组件或前述项的组合的可能性。

此外，术语“第一”、“第二”、“第三”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

除非另有限定，否则在这里使用的所有术语(包括技术术语和科学术语)具有与本发明的各种实施例所属领域普通技术人员通常理解的含义相同的含义。所述术语(诸如在一般使用的词典中限定的术语)将被解释为具有与在相关技术领域中的语境含义相同的含义并且将不被解释为具有理想化的含义或过于正式的含义，除非在本发明的各种实施例中被清楚地限定。

本发明公开的语音控制方法，通过上下文语义解析技术可以让用户与智能电视进行更深层次的交流，通过上一条完整语音信息确定对应的当前完整语音信息，以使智能电视可以了解用户的意图。用户如果说一些简单的语句或者说一些省略关键信息的语句，智能电视同样会根据上下文了解用户深层次的含义，并执行相应的动作为用户提供更人性化的服务，提升了用户体验。

实施例1

本实施例，参见图1，示出了一种语音控制方法包括以下步骤：

S100：在接收到语音控制指令时，根据所述语音控制指令确定对应的标准语音信息。

考虑到不同用户发送同样的语音控制指令，可能在发音、音调、重音和语速上存在差异，或者对于习惯使用方言的用户，发送的语音控制指令可能明显区别于使用普通话发送的语音控制指令。本实施例公开的技术方案可以对不同的用户发送的语音控制指令进行标准化处理。即智能电视在接收到用户的语音控制指令时，会根据语音控制指令确定对应的标准语音信息。

进一步的，可以预先对语料库中的语料数据进行标注，然后以此为基础，通过分析语音数据，统计出带有方言口音和普通话的发音规律，然后把这个规律编码到标准普通话字典里，构造出体现方言发音特征的新字典。最后把新字典整合于搜索框架，用于识别带有方言口音的语音控制指令，以确定对应的标准语音信息。

可以理解，语料库中的数据均与智能电视的各个场景的操作指令相关，可以定期更新和优化。

进一步的，判断标准语音信息是否可以确定对应的操作指令。可以理解，智能电视若根据标准语音信息可以确定对应的操作指令，则响应操作指令并进入对应的工作模式。

S200：若根据所述标准语音信息不能确定对应的操作指令，则根据所述标准语音信息和上一条完整语音信息确定对应的当前完整语音信息。

智能电视若根据标准语音信息不能确定对应的操作指令，则根据上一条完整语音信息和标准语音信息确定对应的当前完整语音信息。例如，在智能电视待机的情况下，若智能电视确定标准语音信息是“刘德华的”，此时，根据标准语音信息：“刘德华的”，无法确定对应的操作指令是点亮屏幕播放刘德华的电影，还是保持屏幕关闭，播放刘德华的歌曲。此时，智能电视可以根据上一条完整语音信息对标准语音信息进行补充。例如，若智能电视获取的上一条完整语音信息是“播放张惠妹的歌曲”，则智能电视可以根据上一条完整语音信息对标准语音信息进行补充的结果是获得当前完整语音信息：“播放刘德华的歌曲”。

S300：根据所述当前完整语音信息确定对应的操作指令。

操作指令包括第一类操作指令和第二类操作指令，在响应所述第一类操作指令时，点亮显示屏幕；在响应所述第二类操作指令时，保持所述显示屏幕息屏。智能电视在待机情况下，可以根据获取到的当前完整语音信息确定是否点亮屏幕。根据当前完整语音信息智能地点亮屏幕，不仅可以节省能源，而且可以增加智能电视的智能性，提高用户体验。

S400：响应所述操作指令并进入对应的工作模式。

工作模式包括聊天模式、天气模式、地图模式、电影模式、音乐模式、菜谱模式、股票模式、笑话模式和日期模式中的至少一种。用户可以根据个人习惯设置智能电视在进入各个模式后是否点亮屏幕。考虑到能源的节约，可以设置在进入地图模式或电影模式或菜谱模式或股票模式时点亮屏幕，可以设置在进入聊天模式或天气模式或音乐模式或笑话模式或日期模式设置时，显示屏幕保持关闭，仅仅通过音响装置为用户提供服务，例如语音聊天、语音播报天气、日期等。可以理解，在显示屏幕保持关闭，通过音响装置为用户提供服务时，智能电视可以进一步响应用户的语音指令，例如，“显示未来一周的天气情况”、“显示7月份的日历”等。

进一步的，在聊天模式下，智能电视会根据用户输入语句的不同词性和句子结构提取关键信息词，并保存到本地，当用户再提到相关问题时，智能电视会根据本地保存的关键信息词给出相应回答。可以在和电视聊天的过程中给智能电视取名字，还可以让智能电视记录一下重要电话，日期和事件等信息，智能电视会在恰当的时候提示相应的信息。

进一步的，在天气模式下，智能电视可以根据用户输入语句保存时间、地点和天气情况等信息。下次要再查询天气的时候只要说省略语句或者缺失关键信息的语句就可以查询相应的天气情况。

进一步的，在地图模式下，涉及到公交路线、地铁路线、火车路线、飞机航班和自驾路线的查询。所地图模式还包括了公交模块、地铁模块、火车模块、飞机模块和自驾模块等。

进一步的，在电影模式下，智能电视可以根据用户输入语句保存演员名和影视名。当用户再查询时，智能电视会根据本地保存的信息完善用户当前的输入语句，以确定对应的操作指令。

进一步的，在音乐模式下，智能电视可以根据用户输入语句保存歌手名和音乐名。当用户再查询时，智能电视会根据本地保存的信息完善用户当前的输入语句，以确定对应的操作指令。

进一步的，在菜谱模式下，用户只要报出菜名就可以查看该菜的详细制作方法。

进一步的，在股票模式下，用户只要说出股票名称就可以查看该股票的详细信息。

进一步的，在笑话模式下，用户只要说出含有想要继续听笑话意思的任何语句时，智能电视都可以理解，继续讲笑话给用户听。

进一步的，在日期模式下，用户可以查询某天是多少号或者星期几，还有几天到某个节日等。

本实施例公开的语音控制方法，在接收到语音控制指令时，根据所述语音控制指令确定对应的标准语音信息；若根据所述标准语音信息不能确定对应的操作指令，则根据所述标准语音信息和上一条完整语音信息确定对应的当前完整语音信息；根据所述当前完整语音信息确定对应的操作指令；响应所述操作指令并进入对应的工作模式。本实施例利用上下文语义解析技术可以让用户与智能电视进行更深层次的交流，通过上一条完整语音信息确定对应的当前完整语音信息，以使智能电视可以了解用户的意图。用户如果说一些简单的语句或者说一些省略关键信息的语句，智能电视同样会根据上下文了解用户深层次的含义，并执行相应的动作为用户提供更人性化的服务，提升了用户体验。

实施例2

进一步的，根据所述标准语音信息和上一条完整语音信息确定对应的当前完整语音信息，包括：

可以根据预设的相似度计算公式和预设的匹配规则确定所述标准语音信息和所述上一条完整语音信息之间的匹配相似度。

相似度计算公式包括余弦相似度(Cosine)公式、欧式距离公式、曼哈顿距离(Manhattan Distance)公式、明可夫斯基距离(Minkowski distance)公式、Jaccard相似系数(Jaccard Coefficient)计算公式以及皮尔森相关系数(Pearson CorrelationCoefficient)计算公式等。

进一步的，参见图2，匹配相似度的确定包括以下步骤：

S210：利用所述相似度计算公式计算所述标准语音信息和所述上一条完整语音信息之间的初始相似度。

S220：利用所述匹配规则确定所述标准语音信息和所述上一条完整语音信息之间的匹配权重。

S230：将所述匹配权重乘以初始相似度以确定所述匹配相似度。

示范性的，可以利用余弦相似度(Cosine)公式标准语音信息和所述上一条完整语音信息之间的初始相似度，然后，根据匹配规则确定标准语音信息和所述上一条完整语音信息之间的匹配权重，将所述匹配权重乘以初始相似度以确定所述匹配相似度。

进一步的，余弦相似度(Cosine)公式如下：

x_i表示上一条完整语音信息的语句向量，y_i表示标准语音信息的语句向量。sim表示上一条完整语音信息与标准语音信息的初始相似度。

进一步的，匹配规则包括精确匹配、中心匹配和广泛匹配，所述精确匹配的匹配权重大于所述中心匹配的匹配权重，所述中心匹配的匹配权重大于所述广泛匹配的匹配权重。

示范性的，精确匹配表示标准语音信息和上一条完整语音信息中与工作模式相关的词、与是否点亮屏幕相关的词以及与内容相关的词的全部匹配。例如，标准语音信息是：“显示深圳天气”，上一条完整语音信息是“显示深圳未来一周的天气”，其中，“显示”是与是否点亮屏幕相关的词，“天气”是与工作模式相关的词，“深圳”是与内容相关的词。当标准语音信息和上一条完整语音信息中与工作模式相关的词、与是否点亮屏幕相关的词以及与内容相关的词的全部匹配时，标准语音信息和上一条完整语音信息精确匹配，可以确定精确匹配的权重为0.8，可以理解，精确匹配的权重的设置范围在0.8～1之间，包括0.8和1。

示范性的，中心匹配表示标准语音信息和上一条完整语音信息中与工作模式相关的词、与是否点亮屏幕相关的词以及与内容相关的词中任意两个相匹配。例如，标准语音信息是：“显示天气”，上一条完整语音信息是“显示深圳未来一周的天气”，其中，“显示”是与是否点亮屏幕相关的词，“天气”是与工作模式相关的词。标准语音信息和上一条完整语音信息中与工作模式相关的词以及与是否点亮屏幕相关的词匹配，即标准语音信息和上一条完整语音信息中心匹配。可以确定中心匹配的权重为0.6，可以理解，精确匹配的权重的设置范围在0.6～0.8之间，包括0.6，不包括0.8。

示范性的，中心匹配表示标准语音信息和上一条完整语音信息中与内容相关的词相匹配。例如，标准语音信息是：“深圳的”，上一条完整语音信息是“显示深圳未来一周的天气”，其中，“深圳”是与内容相关的词。当标准语音信息和上一条完整语音信息中仅与内相关的词匹配时，标准语音信息和上一条完整语音信息广泛匹配。可以确定中心匹配的权重为0.4，可以理解，精确匹配的权重的设置范围在0.4～0.6之间，包括0.4，不包括0.6。

可以理解，在不同模式下，与内容相关词的匹配法则不同，例如，在天气模式下，“深圳”与“广州”在内容上是相匹配的；在音乐模式下，“张惠妹”与“刘德华”在内容上是匹配的。

可以理解，与同一工作模式相关的词可以包括多个，例如，“音乐”，“歌曲”等都是可以确定音乐模式的词语。

可以理解，与是否点亮屏幕相关的词可以包括多个，例如，“显示”，“我要看”，“我要浏览”等都可以确定点亮屏幕。

进一步的，将匹配权重乘以初始相似度可以确定匹配相似度。若所述匹配相似度大于预设的相似度阈值，根据所述上一条完整语音信息确定所述语音控制指令对应的当前完整语音信息。若所述匹配相似度小于等于预设的相似度阈值，则发送语音提醒，以提醒用户当前的语音控制指令无法识别。

本实施例，以智能电视的应用场景为基础，增加匹配权重，可以克服现有相似度公式确定的初始相似度的局限性，以应用场景为基础，增强智能电视的智能性，可以使智能电视更快速准确的理解用户的语音指令。

实施例3

本实施例，参见图3，示出了一种语音控制装置1包括：标准语音确定模块100、完整语音确定模块200、操作指令确定模块300和操作指令响应模块400。

标准语音确定模块100，用于在接收到语音控制指令时，根据所述语音控制指令确定对应的标准语音信息；完整语音确定模块200，用于若根据所述标准语音信息不能确定对应的操作指令，则根据所述标准语音信息和对应的上一条完整语音信息确定对应的当前完整语音信息；操作指令确定模块300，用于根据所述当前完整语音信息确定对应的操作指令；操作指令响应模块400，用于响应所述操作指令并进入对应的工作模式。

本实施例公开的语音控制装置1通过标准语音确定模块100、完整语音确定模块200、操作指令确定模块300和操作指令响应模块400的配合使用，用于执行上述实施例所述的语音控制方法，上述实施例所涉及的实施方案以及有益效果在本实施例中同样适用，在此不再赘述。

可以理解，本发明实施例涉及一种智能电视，包括存储器和处理器，所述存储器用于存储计算机程序，所述计算机程序在所述处理器上运行时执行本发明实施例所述的语音控制方法。

可以理解，本发明实施例涉及一种可读存储介质，其存储有计算机程序，所述计算机程序在处理器上运行时执行本发明实施例所述的语音控制方法。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，附图中的流程图和结构图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，结构图和/或流程图中的每个方框、以及结构图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本发明各个实施例中的各功能模块或单元可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或更多个模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是智能手机、个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。

Claims

1.一种语音控制方法，其特征在于，该方法包括：

根据所述当前完整语音信息确定对应的操作指令；

响应所述操作指令并进入对应的工作模式。

2.根据权利要求1所述的语音控制方法，其特征在于，根据所述标准语音信息和上一条完整语音信息确定对应的当前完整语音信息，包括：

3.根据权利要求2所述的语音控制方法，其特征在于，根据预设的相似度计算公式和匹配权重计算所述标准语音信息和所述上一条完整语音信息之间的匹配相似度，包括：

将所述匹配权重乘以初始相似度以确定所述匹配相似度。

4.根据权利要求3所述的语音控制方法，其特征在于，所述匹配规则包括精确匹配、中心匹配和广泛匹配，所述精确匹配的匹配权重大于所述中心匹配的匹配权重，所述中心匹配的匹配权重大于所述广泛匹配的匹配权重。

5.根据权利要求2所述的语音控制方法，其特征在于，还包括：

6.根据权利要求1所述的语音控制方法，其特征在于，所述操作指令包括第一类操作指令和第二类操作指令，在响应所述第一类操作指令时，点亮显示屏幕；在响应所述第二类操作指令时，保持所述显示屏幕息屏。

7.根据权利要求1至6中任一项所述的语音控制方法，其特征在于，所述工作模式包括：聊天模式、天气模式、地图模式、电影模式、音乐模式、菜谱模式、股票模式、笑话模式和日期模式中的至少一种。

8.一种语音控制装置，其特征在于，该装置包括：

9.一种智能电视，其特征在于，包括存储器和处理器，所述存储器用于存储计算机程序，所述计算机程序在所述处理器上运行时执行权利要求1至7任一项所述的语音控制方法。

10.一种可读存储介质，其特征在于，其存储有计算机程序，所述计算机程序在处理器上运行时执行权利要求1至7任一项所述的语音控制方法。