CN112581959A - 智能设备控制方法、***和语音服务器 - Google Patents

智能设备控制方法、***和语音服务器 Download PDF

Info

Publication number
CN112581959A
CN112581959A CN202011472759.1A CN202011472759A CN112581959A CN 112581959 A CN112581959 A CN 112581959A CN 202011472759 A CN202011472759 A CN 202011472759A CN 112581959 A CN112581959 A CN 112581959A
Authority
CN
China
Prior art keywords
text
voice
recognized
information
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011472759.1A
Other languages
English (en)
Other versions
CN112581959B (zh
Inventor
张奇
文俊
刘皓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changhong Meiling Xinhua Technology Co ltd
Original Assignee
Sichuan Hongmei Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Hongmei Intelligent Technology Co Ltd filed Critical Sichuan Hongmei Intelligent Technology Co Ltd
Priority to CN202011472759.1A priority Critical patent/CN112581959B/zh
Publication of CN112581959A publication Critical patent/CN112581959A/zh
Application granted granted Critical
Publication of CN112581959B publication Critical patent/CN112581959B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Selective Calling Equipment (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供了智能设备控制方法、***和语音服务器,该方法应用于语音服务器,包括:预先构建用于表征至少一个关键词集合和至少一个语音模型之间的映射关系,其中,每一个关键词集合对应一个不同的语音指令类型;接收外部的智能设备发来的语音信号;对语音信号进行处理,获取文本信息;根据文本信息中的至少一个关键词,确定至少一个待识别文本;根据至少一个关键词集合和映射关系,分别确定每一个待识别文本的语音模型;根据每一个待识别文本和每一个待识别文本的语音模型,确定文本信息的控制信息;将控制信息发送给智能设备,以使智能设备根据控制信息执行控制动作。本方案能够提高语音控制的准确性。

Description

智能设备控制方法、***和语音服务器
技术领域
本发明涉及智能设备技术领域,特别涉及智能设备控制方法、***和语音服务器。
背景技术
随着物联网的发展,智能家电逐渐向更加便捷、智能和人性化的方向发展,越来越多的智能家电引入了语音交互功能,从而可以通过语音交互的方式控制智能家电。
如,申请号为201610384412.9的中国发明专利申请公开了一种语音控制***,其发明的主要特征是智能冰箱的主控模块根据语音模块传来的语音信号和预存的口令集合来确定控制指令,实现对智能冰箱的语音控制。
目前,在现有技术中,将语音识别和合成的语音模型存储在本地,即基于一种离线语音识别的方法对智能家电进行语音控制,由于语音模型数量有限,使得语音识别和合成的精度低,从而导致语音控制的准确率较低。
发明内容
本发明提供了智能设备控制方法、***和语音服务器,能够提高语音控制的准确性。
第一方面,本发明实施例提供了智能设备控制方法,应用于语音服务器,包括:
预先构建用于表征至少一个关键词集合和至少一个语音模型之间的映射关系,其中,每一个所述关键词集合对应一个不同的语音指令类型;
还包括:
接收外部的智能设备发来的语音信号;
对所述语音信号进行处理,获取文本信息;
根据所述文本信息中的至少一个关键词,确定至少一个待识别文本,其中,所述关键词用于描述该待识别文本中的指令信息,每一个所述待识别文本对应一个不同的语音指令类型;
根据所述至少一个关键词集合和所述映射关系,分别确定每一个所述待识别文本的语音模型;
根据每一个所述待识别文本和每一个所述待识别文本的语音模型,确定所述文本信息的控制信息;
将所述控制信息发送给所述智能设备,以使所述智能设备根据所述控制信息执行控制动作。
在一种可能的设计中,所述根据所述文本信息中的至少一个关键词,确定至少一个待识别文本,包括:
根据预设的关键词辞典,获取所述文本信息中的至少一个关键词;
从所述至少一个关键词集合中,确定每一个所述关键词对应的至少一个目标关键词集合;
根据所述至少一个目标关键词集合,将所述文本信息分割成所述至少一个待识别文本。
在一种可能的设计中,所述语音指令类型包括:语音交互、控制命令和设备管理中的至少一个;
当所述待识别文本对应的语音指令类型包括语音交互或控制命令时,
所述根据每一个所述待识别文本和每一个所述待识别文本的语音模型,确定所述文本信息的控制信息,包括:
针对每一个所述待识别文本,均执行:
从所述至少一个关键词中确定与当前待识别文本相对应的至少一个目标关键词;
从所述映射关系中确定与所述至少一个目标关键词对应的至少一个目标语音模型;
根据所述至少一个目标语音模型,确定所述当前待识别文本的目标控制信息;
将各个所述待识别文本的目标控制信息作为所述文本信息的控制信息。
在一种可能的设计中,当所述待识别文本对应的语音指令类型包括设备管理时,
在所述从所述映射关系中确定与所述至少一个目标关键词对应的至少一个目标语音模型之后,和在所述根据所述至少一个目标语音模型,确定所述当前待识别文本的控制信息之前,进一步包括:
向外部的接口服务器发送携带有所述至少一个目标关键词的查询请求;
接收由所述接口服务器根据所述查询请求中的所述至少一个目标关键词返回的查询信息;
所述根据所述至少一个目标语音模型,确定所述当前待识别文本的控制信息,包括:
根据所述查询信息和所述至少一个目标语音模型,生成所述当前待识别文本的目标控制信息。
在一种可能的设计中,在所述将所述控制信息发送给所述智能设备,以使所述智能设备根据所述控制信息执行控制动作之后,进一步包括:
接收由所述智能设备根据所述控制信息执行控制动作后返回的反馈文本;
根据预设的语音反馈模型,生成所述反馈文本对应的反馈语音信息;
将所述反馈语音信息发送给所述智能设备,以使所述智能设备播放所述反馈语音信息。
第二方面,本发明实施例还提供了基于上述第一方面或者第一方面的任一可能实现的智能设备控制方法的语音服务器,包括:构建模块、接收模块、获取模块、第一确定模块、第二确定模块、第三确定模块和发送模块;
所述构建模块,用于预先构建用于表征至少一个关键词集合和至少一个语音模型之间的映射关系,其中,每一个所述关键词集合对应一个不同的语音指令类型;
所述接收模块,用于接收外部的智能设备发来的语音信号;
所述获取模块,用于对所述接收模块接收到的所述语音信号进行处理,获取文本信息;
所述第一确定模块,用于根据所述获取模块获取到的所述文本信息中的至少一个关键词,确定至少一个待识别文本,其中,所述关键词用于描述该待识别文本中的指令信息,每一个所述待识别文本对应一个不同的语音指令类型;
所述第二确定模块,用于根据所述构建模块构建的所述至少一个关键词集合和所述映射关系,分别确定所述第一确定模块确定的每一个所述待识别文本的目标语音模型;
所述第三确定模块,用于根据所述第一确定模块确定的每一个所述待识别文本和所述第二确定单元确定的每一个所述待识别文本的目标语音模型,确定所述文本信息的控制信息;
所述发送模块,用于将所述第三确定模块确定的所述控制信息发送给所述智能设备,以使所述智能设备根据所述控制信息执行控制动作。
在一种可能的设计中,
所述第一确定模块,具体用于执行如下处理:
根据预设的关键词辞典,获取所述文本信息中的至少一个关键词;
从所述至少一个关键词集合中,确定每一个所述关键词对应的至少一个目标关键词集合;
根据所述至少一个目标关键词集合,将所述文本信息分割成所述至少一个待识别文本。
在一种可能的设计中,当所述语音指令类型包括:语音交互、控制命令和设备管理中的至少一个时,所述第三确定模块,具体用于在所述第一确定模块确定的所述待识别文本对应的语音指令类型包括语音交互或控制命令时,执行如下处理:
针对每一个所述待识别文本,均执行:
从所述至少一个关键词中确定与当前待识别文本相对应的至少一个目标关键词;
从所述映射关系中确定与所述至少一个目标关键词对应的至少一个目标语音模型;
根据所述至少一个目标语音模型,确定所述当前待识别文本的目标控制信息;
将各个所述待识别文本的目标控制信息作为所述文本信息的控制信息。
在一种可能的设计中,
所述发送模块,还用于在所述第一确定模块确定的所述待识别文本对应的语音指令类型包括设备管理时,向外部的接口服务器发送携带有所述第三确定模块确定的所述至少一个目标关键词的查询请求;
所述接收模块,还用于接收由所述接口服务器根据所述发送模块发送的所述查询请求中的所述至少一个目标关键词返回的查询信息;
所述第三确定模块,进一步用于根据所述接收模块接收的所述查询信息和所述至少一个目标语音模型,生成所述当前待识别文本的目标控制信息。
第三方面,本发明实施例还提供了智能设备控制***,包括:上述第二方面或第二方面的任一可能的实现方式所提供的语音服务器和至少一个智能设备;
所述智能设备,用于采集语音信号,将所述语音信号发送给所述语音服务器,接收来自所述语音服务器的控制信息,根据所述控制信息执行控制动作。
由上述技术方案可知,预先构建多个关键词集合与多个语音模型之间的映射关系,在接收到智能设备采集到的语音信号后,获取文本信息并根据多个关键词将文本信息划分为至少一个待识别文本,其中,每一个待识别文本对应一个语音指令类型,然后确定多个待识别文本的语音模型,进而确定文本信息对应的控制信息,最后将控制信息发送给智能设备,从而实现对智能设备的语音控制。由上述可知,根据预先构建的多个语音模型和映射关系,语音服务器可以将智能设备采集到的语音信号转换成相应的控制信息对智能设备进行语音控制,智能设备不需要对采集到的语音信号进行离线语音识别来实现语音控制,从而提高语音控制的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的一种智能设备控制方法的流程图;
图2是本发明一个实施例提供的另一种智能设备控制方法的流程图;
图3是本发明一个实施例提供的一种语音服务器的示意图;
图4是本发明一个实施例提供的一种智能设备控制***的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了智能设备控制方法,应用于语音服务器,该方法可以包括以下步骤:
步骤101:预先构建用于表征至少一个关键词集合和至少一个语音模型之间的映射关系,其中,每一个关键词集合对应一个不同的语音指令类型;
步骤102:接收外部的智能设备发来的语音信号;
步骤103:对语音信号进行处理,获取文本信息;
步骤104:根据文本信息中的至少一个关键词,确定至少一个待识别文本,其中,关键词用于描述该待识别文本中的指令信息,每一个待识别文本对应一个不同的语音指令类型;
步骤105:根据至少一个关键词集合和映射关系,分别确定每一个待识别文本的语音模型;
步骤106:根据每一个待识别文本和每一个待识别文本的语音模型,确定文本信息的控制信息;
步骤107:将控制信息发送给智能设备,以使智能设备根据控制信息执行控制动作。
在本发明实施例中,预先构建多个关键词集合与多个语音模型之间的映射关系,在接收到智能设备采集到的语音信号后,获取文本信息并根据多个关键词将文本信息划分为至少一个待识别文本,其中,每一个待识别文本对应一个语音指令类型,然后确定多个待识别文本的语音模型,进而确定文本信息对应的控制信息,最后将控制信息发送给智能设备,从而实现对智能设备的语音控制。由上述可知,根据预先构建的多个语音模型和映射关系,语音服务器可以将智能设备采集到的语音信号转换成相应的控制信息对智能设备进行语音控制,智能设备不需要对采集到的语音信号进行离线语音识别来实现语音控制,从而提高语音控制的准确性。
应理解,基于离线语音识别进行语音控制的方法,通常依赖于智能设备的本地处理单元对语音信号进行采集和对语音信号的识别等处理,语音控制成本较高。并且离线语音识别使用的语音模型存储在本地,受本地资源的限制,预设的语音模型有限,一方面导致识别精度较差,进而导致语音控制指令的准确性较低,因此语音控制的准确性较差,另一方面,功能单一,可扩展性差,使得用户的使用体验较差。
在本发明实施例中,智能设备用于采集用户输入的语音信号,语音服务器对智能设备采集到的语音信号进行语音识别生成相应的控制信息,降低了对智能设备的本地处理芯片的性能要求,从而降低了对智能设备的语音控制的成本成。并且后续更新时只需要更新语音服务器上的内容即可,不需要对智能冰箱的本地进行改动,从而有利于后续更新。
在本发明的一种实施例中,基于图1所示的智能设备控制方法,步骤104具体可以包括如下步骤:
根据预设的关键词辞典,获取文本信息中的至少一个关键词;
从至少一个关键词集合中,确定每一个关键词对应的至少一个目标关键词集合;
根据至少一个目标关键词集合,将文本信息分割成至少一个待识别文本。
在本发明实施例中,获取文本信息中的一个或者多个关键词,从预设的多个关键词集合中确定每一个关键词对应的目标关键词集合,并根据目标关键词集合将文本信息划分为至少一个待识别文本,如此使得每一个待识别文本对应一个不同的语音指令类型。由上述可知,根据不同的语音指令类型将文本信息划分成一个或者多个待识别文本,可以更准确、高效地针对每一个待识别文本进行语音识别,从而提高语音控制指令的精确度,进而提高语音控制的准确性,同时有助于提高后续控制信息的生成效率。
在本发明的一种实施例中,基于图1所示的智能设备控制方法,当语音指令类型包括:语音交互、控制命令和设备管理中的至少一个,且待识别文本对应的语音指令类型包括语音交互或控制命令时,步骤106具体可以包括如下步骤:
针对每一个待识别文本,均执行:
步骤S1:从至少一个关键词中确定与当前待识别文本相对应的至少一个目标关键词;
步骤S2:从映射关系中确定与至少一个目标关键词对应的至少一个目标语音模型;
步骤S3:根据至少一个目标语音模型,确定当前待识别文本的目标控制信息;
将各个待识别文本的目标控制信息作为文本信息的控制信息。
在本发明实施例中,当待识别文本对应的语音指令类型包括语音交互或者控制命令时,根据预先构建的映射关系,确定当前待识别文本中每一个关键词对应的目标语音模型,进而确定当前待识别文本的目标控制信息,并将多个目标控制信息作为文本信息的控制信息。由上述可知,根据映射关系和每一个待识别文本的关键词可以准确、快速地锁定相匹配的目标语音模型,从而可以提高生成控制信息的准确性和效率,进而提高用户的体验感。
在本发明的一种实施例中,当待识别文本对应的语音指令类型包括设备管理时,在步骤S2之后和在步骤S3之前,还可以包括如下步骤:
向外部的接口服务器发送携带有至少一个目标关键词的查询请求;
接收由接口服务器根据查询请求中的至少一个目标关键词返回的查询信息;
步骤S3具体包括:根据查询信息和至少一个目标语音模型,生成当前待识别文本的目标控制信息。
在本发明实施例中,当待识别文本对应的语音指令类型包括设备管理时,在确定当前待识别文本中每一个关键词对应的目标语音模型后,向外部的接口服务器发送查询请求,并接收由接口服务器根据查询请求中的至少一个目标关键词返回的查询信息,然后根据查询信息和目标语音模型,确定当前待识别文本的目标控制信息,进而确定文本信息的控制信息。由上述可知,利用外部的接口服务器还可以实现复杂的语音交互,提供更加丰富的语音交互内容,从而进一步提升了用户的体验感。
在本发明的一种实施例中,基于图1所示的智能设备控制方法,在步骤107之后,还可以包括如下步骤:
接收由智能设备根据控制信息执行控制动作后返回的反馈文本;
根据预设的语音反馈模型,生成反馈文本对应的反馈语音信息;
将反馈语音信息发送给智能设备,以使智能设备播放反馈语音信息。
在本发明实施例中,接收到智能设备的反馈文本后,根据预设的语音反馈模型生成相对应的反馈语音信息并发送给智能设备进行播放,如此,可以提供更丰富的语音交互内容,使得语音交互的灵活性提高,进而提高用户的使用体验。
为了更清楚地说明本发明的技术方案,下面对本发明实施例提供的智能设备控制方法进行详细说明,如图2所示,该方法可以包括如下步骤:
步骤201:预先构建用于表征至少一个关键词集合和至少一个语音模型之间的映射关系,其中,每一个关键词集合对应一个不同的语音指令类型。
在本步骤中,语音指令类型可以包括但不限于语音交互,控制命令和设备管理,其中,语音交互例如可以是查询天气、收听听歌和收听电台等;控制命令例如可以是用于控制智能设备运行状态的信息;设备管理例如可以是智能设备的售后管理以及智能设备的运行状态参数等。
步骤202:接收外部的智能设备发来的语音信号。
具体地,智能设备会根据预设的语音唤醒命令词开启语音采集功能,并采集唤醒后的用户输入的语音信号。在本发明的一个实施例中,智能设备还可以对采集到的语音信号进行简单的处理(例如,语音降噪等)。
步骤203:对语音信号进行处理,获取文本信息。
步骤204:根据文本信息中的至少一个关键词,确定至少一个待识别文本,其中,关键词用于描述该待识别文本中的指令信息,每一个待识别文本对应一个不同的语音指令类型。
具体地,根据预设的关键词辞典,获取文本信息中的至少一个关键词,从至少一个关键词集合中,确定每一个关键词对应的至少一个目标关键词集合,根据至少一个目标关键词集合,将文本信息分割成至少一个待识别文本。
举例来说,语音交互类型对应的关键词集合A中包括“查询”和“天气”,控制命令类型对应的关键词集合B中包括“设置”、“温度”和“冰箱”,设备管理类型对应的关键词集合C中包括“温度”、“冰箱”和“查询”。
当文本信息为“查询天气和查询冰箱的当前温度”时,关键词分别为“查询”、“天气”、“冰箱”和“温度”,根据关键词可以确定目标关键词集合为关键词集合A和关键词集合C,并将文本信息分割成两个待识别文本,分别为“查询天气”和“查询冰箱的当前温度”。
当文本信息为“设置冰箱温度为5℃”时,关键词为“设置”“冰箱”和“温度”,确定目标关键词集合为关键词集合B,待识别文本为“设置冰箱温度为5℃”。
步骤205:根据至少一个关键词集合和映射关系,分别确定每一个待识别文本的语音模型。
步骤206:确定每一个待识别文本的目标语音模型。
在本步骤中,针对每一个待识别文本均执行:从至少一个关键词中确定与当前待识别文本相对应的目标关键词,根据映射关系和目标关键词,从当前语音模型对应的语音模型中确定每一个目标关键词对应的目标语音模型。
在本步骤中,接前述例,待识别文本“查询天气”中的“查询”和“天气”均为目标关键词。
再例如,待识别文本“查询冰箱的当前温度”中的“查询”“冰箱”和“温度”均为目标关键词。
步骤207:确定每一个待识别文本的目标控制信息。
在本步骤中,当待识别文本对应的语音控制类型包括语音交互或控制命令时,根据多个目标语音模型,确定当前待识别文本的目标控制信息;当待识别文本对应的语音控制类型包括设备管理时,向外部的接口服务器发送携带有至少一个目标关键词的查询请求,接收由接口服务器根据查询请求中的至少一个目标关键词返回的查询信息,根据查询信息和多个目标语音模型,生成当前待识别文本的目标控制信息。
举例来说,当待识别文本为“查询天气”时,根据目标关键词对应的语音模型,输出该待识别文本的目标控制信息。
再例如,当待识别文本为“查询冰箱的当前温度”时,向外部的接口服务器发送查询请求,其中该查询请求中包括目标关键词“查询”“冰箱”和“温度”,并接收该接口服务器返回的查询信息,并根据查询信息和多个目标语音模型,生成该待识别文本的目标控制信息。
步骤208:确定文本信息的控制信息,并发送给智能设备,以使智能设备根据控制信息执行控制动作。
在本步骤中,将各个待识别文本的目标控制信息作为文本信息的控制信息。
步骤209:接收由智能设备根据控制信息执行控制动作后返回的反馈文本。
举例来说,当发送给智能冰箱的控制信息是将温度调至5℃,则接收智能冰箱根据控制信息将温度调至5℃后返回的反馈文本。
步骤210:根据预设的语音反馈模型,生成反馈文本对应的反馈语音信息。
步骤211:将反馈语音信息发送给智能设备,以使智能设备播放反馈语音信息。
如图3所示,本发明一个实施例提供了基于上述任一实施例所提供的智能设备控制方法的语音服务器,包括:构建模块301、接收模块302、获取模块303、第一确定模块304、第二确定模块305、第三确定模块306和发送模块307;
构建模块301,用于预先构建用于表征至少一个关键词集合和至少一个语音模型之间的映射关系,其中,每一个关键词集合对应一个不同的语音指令类型;
接收模块302,用于接收外部的智能设备发来的语音信号;
获取模块303,用于对接收模块302接收到的语音信号进行处理,获取文本信息;
第一确定模块304,用于根据获取模块303获取到的文本信息中的至少一个关键词,确定至少一个待识别文本,其中,关键词用于描述该待识别文本中的指令信息,每一个待识别文本对应一个不同的语音指令类型;
第二确定模块305,用于根据构建模块301构建的至少一个关键词集合和映射关系,分别确定第一确定模块304确定的每一个待识别文本的目标语音模型;
第三确定模块306,用于根据第一确定模块304确定的每一个待识别文本和第二确定单元305确定的每一个待识别文本的目标语音模型,确定文本信息的控制信息;
发送模块307,用于将第三确定模块306确定的控制信息发送给智能设备,以使智能设备根据控制信息执行控制动作。
在本发明的一种实施例中,
第一确定模块304,具体用于执行如下处理:
根据预设的关键词辞典,获取文本信息中的至少一个关键词;
从至少一个关键词集合中,确定每一个关键词对应的至少一个目标关键词集合;
根据至少一个目标关键词集合,将文本信息分割成至少一个待识别文本。
在本发明的一种实施例中,当语音指令类型包括:语音交互、控制命令和设备管理中的至少一个时,第三确定模块306,具体用于在所述第一确定模块确定的所述待识别文本对应的语音指令类型包括语音交互或控制命令时,执行如下处理:
针对每一个待识别文本,均执行:
从至少一个关键词中确定与当前待识别文本相对应的至少一个目标关键词;
从映射关系中确定与至少一个目标关键词对应的至少一个目标语音模型;
根据至少一个目标语音模型,确定当前待识别文本的目标控制信息;
将各个待识别文本的目标控制信息作为文本信息的控制信息。
在本发明的一种实施例中,
发送模块307,还用于在第一确定模块304确定的待识别文本对应的语音指令类型包括设备管理时,向外部的接口服务器发送携带有第三确定模块306确定的至少一个目标关键词的查询请求;
接收模块302,还用于接收由接口服务器根据发送模块307发送的查询请求中的至少一个目标关键词返回的查询信息;
第三确定模块306,进一步用于根据接收模块302接收的查询信息和至少一个目标语音模型,生成当前待识别文本的目标控制信息。
在本发明的一种实施例中,
接收模块302,还用于接收由智能设备根据发送模块307发送的控制信息执行控制动作后返回的反馈文本,根据预设的语音反馈模型,生成反馈文本对应的反馈语音信息;
发送模块307,还用于将接收模块302接收到的反馈语音信息发送给智能设备,以使智能设备播放反馈语音信息。
如图4所示,本发明实施例提供了智能设备控制***,包括:上述任一实施例所提供的语音服务器401和至少一个智能设备402;
智能设备402,用于采集语音信号,将语音信号发送给语音服务器401,接收来自语音服务器401的控制信息,根据控制信息执行控制动作。
在本发明的一种实施例中,
智能设备402,还用于将根据控制信息执行控制动作后的反馈文本发送给语音服务器401;
语音服务器401,还用于在接收到反馈文本后,根据预设的语音反馈模型,生成反馈文本对应的反馈语音信息,并将反馈语音信息发送给智能设备402;
智能设备402,还用于接收并播放反馈语音信息。
在本发明的一种实施例中,基于图4所示的智能设备控制***,该智能设备控制***进一步包括:接口服务器;
接口服务器,用于接收语音服务器401发来的携带有至少一个目标关键词的查询请求,根据查询请求中的至少一个目标关键词获取查询信息并将查询信息发送给语音服务器401。
在本发明的一种实施例中,
智能设备402,还用于在运行状态发生改变时,将自身的状态参数发送给接口服务器;
接口服务器,还用于接收并存储来自智能设备402的状态参数。
以智能冰箱为例,智能冰箱402包括语音模块、WiFi模块和控制模块。语音模块用于在接收到预设的语音唤醒命令词后开启语音采集功能,采集唤醒词后的语音信号,并发送给WiFi模块;WiFi模块用于通过自定义的网络通信协议将接收到的语音信号发送给语音服务器401,接收来自语音服务器401的控制信息,当控制信息中包括控制命令时,将该控制命令发送给控制模块,当控制信息中包括音频时,将该音频发送给语音模块;控制模块用于接收到控制命令时执行相应控制动作;语音模块还用于接收并播放接收到的音频。
在一种可能实现的方式中,WiFi模块还用于将控制模块格局控制信息执行控制动作后的需要语音播报的播报文本发送给语音服务器401,接收来自语音服务器401的播报信息并发送给语音模块;语音模块还用于播放接收到的播报信息。
在一种可能实现的方式中,通过外部的接口服务器还可以通过语音控制的方式查询冰箱食材管理及冰箱售后服务,如食材添加、删除、申请售后、售后进度查询以及保修政策查询等。
需要说明的是,本发明实施例示意的结构并不构成对语音服务器的具体限定。在本发明的另一些实施例中,该语音服务器可以包括比图示更多或者更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件、软件或者软件和硬件的组合来实现。
上述装置内的各模块之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
本发明实施例还提供了一种语音服务器,包括:至少一个存储器和至少一个处理器;
所述至少一个存储器,用于存储机器可读程序;
所述至少一个处理器,用于调用所述机器可读程序,执行本发明任一实施例中的智能设备控制方法。
本发明实施例还提供了一种计算机可读介质,存储用于使一计算机执行如本文所述的智能设备控制方法的指令。具体地,可以提供配有存储介质的方法或者装置,在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该方法或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。
在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此程序代码和存储程序代码的存储介质构成了本发明的一部分。
用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上下载程序代码。
此外,应该清楚的是,不仅可以通过执行计算机所读出的程序代码,而且可以通过基于程序代码的指令使计算机上操作的操作***等来完成部分或者全部的实际操作,从而实现上述实施例中任意一项实施例的功能。
此外,可以理解的是,将由存储介质读出的程序代码写到***计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展模块中设置的存储器中,随后基于程序代码的指令使安装在扩展板或者扩展模块上的CPU等来执行部分和全部实际操作,从而实现上述实施例中任一实施例的功能。
需要说明的是,上述各流程和各***结构图中不是所有的步骤和模块都是必须的,可以根据实际的需要忽略某些步骤或模块。各步骤的执行顺序不是固定的,可以根据需要进行调整。上述各实施例中描述的***结构可以是物理结构,也可以是逻辑结构,即,有些模块可能由同一物理实体实现,或者,有些模块可能分由多个物理实体实现,或者,可以由多个独立设备中的某些部件共同实现。
以上各实施例中,硬件模块可以通过机械方式或电气方式实现。例如,一个硬件模块可以包括永久性专用的电路或逻辑(如专门的处理器,FPGA或ASIC)来完成相应操作。硬件模块还可以包括可编程逻辑或电路(如通用处理器或其它可编程处理器),可以由软件进行临时的设置以完成相应操作。具体的实现方式(机械方式、或专用的永久性电路、或者临时设置的电路)可以基于成本和时间上的考虑来确定。
上文通过附图和优选实施例对本发明进行了详细展示和说明,然而本发明不限于这些已揭示的实施例,基与上述多个实施例本领域技术人员可以知晓,可以组合上述不同实施例中的代码审核手段得到本发明更多的实施例,这些实施例也在本发明的保护范围之内。

Claims (10)

1.智能设备控制方法,其特征在于,应用于语音服务器,预先构建用于表征至少一个关键词集合和至少一个语音模型之间的映射关系,其中,每一个所述关键词集合对应一个不同的语音指令类型;
还包括:
接收外部的智能设备发来的语音信号;
对所述语音信号进行处理,获取文本信息;
根据所述文本信息中的至少一个关键词,确定至少一个待识别文本,其中,所述关键词用于描述该待识别文本中的指令信息,每一个所述待识别文本对应一个不同的语音指令类型;
根据所述至少一个关键词集合和所述映射关系,分别确定每一个所述待识别文本的语音模型;
根据每一个所述待识别文本和每一个所述待识别文本的语音模型,确定所述文本信息的控制信息;
将所述控制信息发送给所述智能设备,以使所述智能设备根据所述控制信息执行控制动作。
2.根据权利要求1所述的方法,其特征在于,所述根据所述文本信息中的至少一个关键词,确定至少一个待识别文本,包括:
根据预设的关键词辞典,获取所述文本信息中的至少一个关键词;
从所述至少一个关键词集合中,确定每一个所述关键词对应的至少一个目标关键词集合;
根据所述至少一个目标关键词集合,将所述文本信息分割成所述至少一个待识别文本。
3.根据权利要求1所述的方法,其特征在于,
所述语音指令类型包括:语音交互、控制命令和设备管理中的至少一个;
当所述待识别文本对应的语音指令类型包括语音交互或控制命令中的时,
所述根据每一个所述待识别文本和每一个所述待识别文本的语音模型,确定所述文本信息的控制信息,包括:
针对每一个所述待识别文本,均执行:
从所述至少一个关键词中确定与当前待识别文本相对应的至少一个目标关键词;
从所述映射关系中确定与所述至少一个目标关键词对应的至少一个目标语音模型;
根据所述至少一个目标语音模型,确定所述当前待识别文本的目标控制信息;
将各个所述待识别文本的目标控制信息作为所述文本信息的控制信息。
4.根据权利要求3所述的方法,其特征在于,
当所述待识别文本对应的语音指令类型包括设备管理时,
在所述从所述映射关系中确定与所述至少一个目标关键词对应的至少一个目标语音模型之后,和在所述根据所述至少一个目标语音模型,确定所述当前待识别文本的控制信息之前,进一步包括:
向外部的接口服务器发送携带有所述至少一个目标关键词的查询请求;
接收由所述接口服务器根据所述查询请求中的所述至少一个目标关键词返回的查询信息;
所述根据所述至少一个目标语音模型,确定所述当前待识别文本的控制信息,包括:
根据所述查询信息和所述至少一个目标语音模型,生成所述当前待识别文本的目标控制信息。
5.根据权利要求1-4中任一所述的方法,其特征在于,在所述将所述控制信息发送给所述智能设备,以使所述智能设备根据所述控制信息执行控制动作之后,进一步包括:
接收由所述智能设备根据所述控制信息执行控制动作后返回的反馈文本;
根据预设的语音反馈模型,生成所述反馈文本对应的反馈语音信息;
将所述反馈语音信息发送给所述智能设备,以使所述智能设备播放所述反馈语音信息。
6.基于权利要求1至5中任一所述智能设备控制方法的语音服务器,其特征在于,包括:构建模块、接收模块、获取模块、第一确定模块、第二确定模块、第三确定模块和发送模块;
所述构建模块,用于预先构建用于表征至少一个关键词集合和至少一个语音模型之间的映射关系,其中,每一个所述关键词集合对应一个不同的语音指令类型;
所述接收模块,用于接收外部的智能设备发来的语音信号;
所述获取模块,用于对所述接收模块接收到的所述语音信号进行处理,获取文本信息;
所述第一确定模块,用于根据所述获取模块获取到的所述文本信息中的至少一个关键词,确定至少一个待识别文本,其中,所述关键词用于描述该待识别文本中的指令信息,每一个所述待识别文本对应一个不同的语音指令类型;
所述第二确定模块,用于根据所述构建模块构建的所述至少一个关键词集合和所述映射关系,分别确定所述第一确定模块确定的每一个所述待识别文本的目标语音模型;
所述第三确定模块,用于根据所述第一确定模块确定的每一个所述待识别文本和所述第二确定单元确定的每一个所述待识别文本的目标语音模型,确定所述文本信息的控制信息;
所述发送模块,用于将所述第三确定模块确定的所述控制信息发送给所述智能设备,以使所述智能设备根据所述控制信息执行控制动作。
7.根据权利要求6所述的语音服务器,其特征在于,
所述第一确定模块,具体用于执行如下处理:
根据预设的关键词辞典,获取所述文本信息中的至少一个关键词;
从所述至少一个关键词集合中,确定每一个所述关键词对应的至少一个目标关键词集合;
根据所述至少一个目标关键词集合,将所述文本信息分割成所述至少一个待识别文本。
8.根据权利要求6所述的语音服务器,其特征在于,
当所述语音指令类型包括:语音交互、控制命令和设备管理中的至少一个时,所述第三确定模块,具体用于在所述第一确定模块确定的所述待识别文本对应的语音指令类型包括语音交互或控制命令时,执行如下处理:
针对每一个所述待识别文本,均执行:
从所述至少一个关键词中确定与当前待识别文本相对应的至少一个目标关键词;
从所述映射关系中确定与所述至少一个目标关键词对应的至少一个目标语音模型;
根据所述至少一个目标语音模型,确定所述当前待识别文本的目标控制信息;
将各个所述待识别文本的目标控制信息作为所述文本信息的控制信息。
9.根据权利要求8所述的语音服务器,其特征在于,
所述发送模块,还用于在所述第一确定模块确定的所述待识别文本对应的语音指令类型包括设备管理时,向外部的接口服务器发送携带有所述第三确定模块确定的所述至少一个目标关键词的查询请求;
所述接收模块,还用于接收由所述接口服务器根据所述发送模块发送的所述查询请求中的所述至少一个目标关键词返回的查询信息;
所述第三确定模块,进一步用于根据所述接收模块接收的所述查询信息和所述至少一个目标语音模型,生成所述当前待识别文本的目标控制信息。
10.智能设备控制***,其特征在于,包括:权利要求6至9中任一所述语音服务器和至少一个智能设备;
所述智能设备,用于采集语音信号,将所述语音信号发送给所述语音服务器,接收来自所述语音服务器的控制信息,根据所述控制信息执行控制动作。
CN202011472759.1A 2020-12-15 2020-12-15 智能设备控制方法、***和语音服务器 Active CN112581959B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011472759.1A CN112581959B (zh) 2020-12-15 2020-12-15 智能设备控制方法、***和语音服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011472759.1A CN112581959B (zh) 2020-12-15 2020-12-15 智能设备控制方法、***和语音服务器

Publications (2)

Publication Number Publication Date
CN112581959A true CN112581959A (zh) 2021-03-30
CN112581959B CN112581959B (zh) 2023-05-09

Family

ID=75135287

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011472759.1A Active CN112581959B (zh) 2020-12-15 2020-12-15 智能设备控制方法、***和语音服务器

Country Status (1)

Country Link
CN (1) CN112581959B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113377904A (zh) * 2021-06-04 2021-09-10 百度在线网络技术(北京)有限公司 行业动作识别方法、装置、电子设备及存储介质
CN113721770A (zh) * 2021-09-03 2021-11-30 四川虹美智能科技有限公司 在智能家居设备中提供语音帮助的方法和智能家居设备
CN114244879A (zh) * 2021-12-15 2022-03-25 北京声智科技有限公司 一种工业控制***、工业控制方法和电子设备

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101599270A (zh) * 2008-06-02 2009-12-09 海尔集团公司 语音服务器及语音控制的方法
CN106228974A (zh) * 2016-08-19 2016-12-14 镇江惠通电子有限公司 基于语音识别的控制方法、装置及***
CN106297801A (zh) * 2016-08-16 2017-01-04 北京云知声信息技术有限公司 语音处理方法及装置
CN107146622A (zh) * 2017-06-16 2017-09-08 合肥美的智能科技有限公司 冰箱、语音交互***、方法、计算机设备、可读存储介质
CN108183844A (zh) * 2018-02-06 2018-06-19 四川虹美智能科技有限公司 一种智能家电语音控制方法、装置及***
EP3382698A1 (en) * 2017-03-30 2018-10-03 LG Electronics Inc. Voice server, voice recognition server system, and method of operating the same
CN109584876A (zh) * 2018-12-26 2019-04-05 珠海格力电器股份有限公司 语音数据的处理方法、装置和语音空调
US20190372794A1 (en) * 2018-06-05 2019-12-05 Sap Se Intelligent personal assistant controller
CN110875036A (zh) * 2019-11-11 2020-03-10 广州国音智能科技有限公司 语音分类方法、装置、设备及计算机可读存储介质
CN111161704A (zh) * 2018-10-22 2020-05-15 联想图像(天津)科技有限公司 一种电子设备的控制方法及电子设备
CN111179928A (zh) * 2019-12-30 2020-05-19 上海欣能信息科技发展有限公司 一种基于语音交互的变配电站智能控制方法
CN111292731A (zh) * 2018-11-21 2020-06-16 深圳绿米联创科技有限公司 语音信息处理方法、装置、电子设备及存储介质
CN111353292A (zh) * 2020-02-26 2020-06-30 支付宝(杭州)信息技术有限公司 针对用户操作指令的解析方法及装置
CN111640435A (zh) * 2020-06-09 2020-09-08 合肥飞尔智能科技有限公司 基于智能音箱控制红外家电的方法及装置
CN112350908A (zh) * 2020-11-10 2021-02-09 珠海格力电器股份有限公司 智能家居设备的控制方法和装置
CN112786040A (zh) * 2020-10-22 2021-05-11 青岛经济技术开发区海尔热水器有限公司 应用于智能家电设备的语音控制方法、装置及设备
CN112905149A (zh) * 2021-04-06 2021-06-04 Vidaa美国公司 显示设备上语音指令的处理方法、显示设备及服务器

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101599270A (zh) * 2008-06-02 2009-12-09 海尔集团公司 语音服务器及语音控制的方法
CN106297801A (zh) * 2016-08-16 2017-01-04 北京云知声信息技术有限公司 语音处理方法及装置
CN106228974A (zh) * 2016-08-19 2016-12-14 镇江惠通电子有限公司 基于语音识别的控制方法、装置及***
EP3382698A1 (en) * 2017-03-30 2018-10-03 LG Electronics Inc. Voice server, voice recognition server system, and method of operating the same
CN107146622A (zh) * 2017-06-16 2017-09-08 合肥美的智能科技有限公司 冰箱、语音交互***、方法、计算机设备、可读存储介质
CN108183844A (zh) * 2018-02-06 2018-06-19 四川虹美智能科技有限公司 一种智能家电语音控制方法、装置及***
US20190372794A1 (en) * 2018-06-05 2019-12-05 Sap Se Intelligent personal assistant controller
CN111161704A (zh) * 2018-10-22 2020-05-15 联想图像(天津)科技有限公司 一种电子设备的控制方法及电子设备
CN111292731A (zh) * 2018-11-21 2020-06-16 深圳绿米联创科技有限公司 语音信息处理方法、装置、电子设备及存储介质
CN109584876A (zh) * 2018-12-26 2019-04-05 珠海格力电器股份有限公司 语音数据的处理方法、装置和语音空调
CN110875036A (zh) * 2019-11-11 2020-03-10 广州国音智能科技有限公司 语音分类方法、装置、设备及计算机可读存储介质
CN111179928A (zh) * 2019-12-30 2020-05-19 上海欣能信息科技发展有限公司 一种基于语音交互的变配电站智能控制方法
CN111353292A (zh) * 2020-02-26 2020-06-30 支付宝(杭州)信息技术有限公司 针对用户操作指令的解析方法及装置
CN111640435A (zh) * 2020-06-09 2020-09-08 合肥飞尔智能科技有限公司 基于智能音箱控制红外家电的方法及装置
CN112786040A (zh) * 2020-10-22 2021-05-11 青岛经济技术开发区海尔热水器有限公司 应用于智能家电设备的语音控制方法、装置及设备
CN112350908A (zh) * 2020-11-10 2021-02-09 珠海格力电器股份有限公司 智能家居设备的控制方法和装置
CN112905149A (zh) * 2021-04-06 2021-06-04 Vidaa美国公司 显示设备上语音指令的处理方法、显示设备及服务器

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113377904A (zh) * 2021-06-04 2021-09-10 百度在线网络技术(北京)有限公司 行业动作识别方法、装置、电子设备及存储介质
CN113377904B (zh) * 2021-06-04 2024-05-10 百度在线网络技术(北京)有限公司 行业动作识别方法、装置、电子设备及存储介质
CN113721770A (zh) * 2021-09-03 2021-11-30 四川虹美智能科技有限公司 在智能家居设备中提供语音帮助的方法和智能家居设备
CN113721770B (zh) * 2021-09-03 2023-10-27 四川虹美智能科技有限公司 在智能家居设备中提供语音帮助的方法和智能家居设备
CN114244879A (zh) * 2021-12-15 2022-03-25 北京声智科技有限公司 一种工业控制***、工业控制方法和电子设备

Also Published As

Publication number Publication date
CN112581959B (zh) 2023-05-09

Similar Documents

Publication Publication Date Title
CN112581959B (zh) 智能设备控制方法、***和语音服务器
US10818151B2 (en) Vibration method, electronic device and computer readable storage medium
US20230053765A1 (en) Speech Control Method and Apparatus, Server, Terminal Device, and Storage Medium
KR101914708B1 (ko) 서버 및 서버의 제어 방법
CN110956963A (zh) 一种基于可穿戴设备实现的交互方法及可穿戴设备
CN104159269A (zh) 接入无线路由器的方法、相关设备及***
CN104978957A (zh) 基于声纹识别的语音控制方法和***
CN110932953A (zh) 智能家居控制方法、装置、计算机设备及存储介质
CN106227821B (zh) 一种命令行命令的处理方法和装置
CN107545892B (zh) 设备的控制方法、装置及***
WO2020119437A1 (zh) 语音控制方法、云端服务器及终端设备
CN112767936B (zh) 语音对话方法、装置、存储介质及电子设备
JP6934076B2 (ja) スマートサービス方法、装置及び機器
CN111312253A (zh) 语音控制方法、云端服务器及终端设备
CN112151013A (zh) 智能设备交互方法
CN113672748A (zh) 多媒体信息播放方法及装置
CN111862975A (zh) 智能终端控制方法、装置、设备、存储介质和***
CN111833857B (zh) 语音处理方法、装置和分布式***
CN112735406B (zh) 设备的控制方法及装置、存储介质及电子装置
CN110493120B (zh) 一种用于发送设备操作指令的方法与设备
CN111817930A (zh) 设备控制方法、智能家电、智能终端及智能电子设备
CN114550719A (zh) 语音控制指令的识别方法和装置、存储介质
CN112614490B (zh) 生成语音指令的方法、装置、介质、设备、***及车辆
CN110061893A (zh) 一种故障信息采集方法、服务器及存储介质
CN114121005A (zh) 语音控制方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240428

Address after: No.2 Tongji West Road, Nantou Town, Zhongshan City, Guangdong Province

Patentee after: Changhong Meiling Xinhua Technology Co.,Ltd.

Country or region after: China

Address before: 621050 No. 303 Jiuzhou Road, Fucheng District, Mianyang, Sichuan.

Patentee before: SICHUAN HONGMEI INTELLIGENT TECHNOLOGY Co.,Ltd.

Country or region before: China

TR01 Transfer of patent right