CN112700780A - 基于多设备的语音处理方法及*** - Google Patents

基于多设备的语音处理方法及*** Download PDF

Info

Publication number
CN112700780A
CN112700780A CN202011501007.3A CN202011501007A CN112700780A CN 112700780 A CN112700780 A CN 112700780A CN 202011501007 A CN202011501007 A CN 202011501007A CN 112700780 A CN112700780 A CN 112700780A
Authority
CN
China
Prior art keywords
voice recognition
state information
voice
recognition result
modulation data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011501007.3A
Other languages
English (en)
Inventor
王云华
王妍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen TCL New Technology Co Ltd
Original Assignee
Shenzhen TCL New Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen TCL New Technology Co Ltd filed Critical Shenzhen TCL New Technology Co Ltd
Priority to CN202011501007.3A priority Critical patent/CN112700780A/zh
Publication of CN112700780A publication Critical patent/CN112700780A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/34Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明涉及语音处理技术领域,公开了一种基于多设备的语音处理方法及***,所述方法包括:获取语音指令信息,并从语音指令信息中提取对应的脉冲编码调制数据;获取预先关联的多个智能设备的设备标识,并根据设备标识获取各智能设备的运行状态信息;根据运行状态信息通过云端服务器对脉冲调制数据进行语音识别处理,获得语音识别结果;根据语音识别结果从多个智能设备选取一目标智能设备对语音识别结果进行响应。通过根据多个智能设备的运行状态信息结合云端服务器对语音指令信息进行语音识别处理,再根据语音识别结果选取对应的目标智能设备进行响应,实现了智能设备和云端协同工作,提高了在线语音处理的响应速度和用户的语音交互体验。

Description

基于多设备的语音处理方法及***
技术领域
本发明涉及语音处理技术领域,尤其涉及一种基于多设备的语音处理方法及***。
背景技术
物联网(Internet of Things,IoT)设备的智能化,需要众多技术的支持,其中,作为人机对话的接口的在线语音处理技术,更是起到了举足轻重的作用。而现有技术多是通过智能设备在本地识别语音指令信息,然后基于识别后的文本生成对应的控制指令,再基于控制指令执行对应的操作以响应语音指令信息,由于本地存储空间的有限性,本地存储的语音识别数据库无法像云端解析一样实现对各类语音指令信息的识别,导致语音交互的准确性和响应速度堪忧,拖慢了语音处理速度,也影响了用户的语音交互体验。因此,如何提高在线语音处理的响应速度,以提高用户的语音交互体验,成为一个亟待解决的问题。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供了一种基于多设备的语音处理方法及***,旨在解决如何提高在线语音处理的响应速度,以提高用户的语音交互体验的技术问题。
为实现上述目的,本发明提供了一种基于多设备的语音处理方法,所述方法包括以下步骤:
获取语音指令信息,并从所述语音指令信息中提取对应的脉冲编码调制数据;
获取预先关联的多个智能设备的设备标识,并根据所述设备标识获取各智能设备的运行状态信息;
根据所述运行状态信息通过云端服务器对所述脉冲调制数据进行语音识别处理,获得语音识别结果;
根据所述语音识别结果从所述多个智能设备选取一目标智能设备对所述语音识别结果进行响应。
优选地,所述根据所述运行状态信息通过云端服务器对所述脉冲调制数据进行语音识别处理,获得语音识别结果的步骤,具体包括:
判断所述运行状态信息是否符合工作状态条件;
在所述运行状态信息不符合所述工作状态条件时,将所述脉冲调制数据上传至云端服务器,以使所述云端服务器对所述脉冲调制数据进行语音识别处理,获得语音识别结果。
优选地,所述运行状态信息包括处理器占用率和/或处理器空闲率;
相应地,所述判断所述运行状态信息是否符合工作状态条件的步骤,具体包括:
从所述运行状态信息中提取所述处理器占用率;
检测所述处理器占用率是否大于预设占用率,并根据检测结果判断所述运行状态信息是否符合工作状态条件;
和/或;
从所述运行状态信息中提取所述处理器空闲率;
检测所述处理器空闲率是否小于预设空闲率,并根据检测结果判断所述运行状态信息是否符合工作状态条件。
优选地,所述在所述运行状态信息不符合所述工作状态条件时,将所述脉冲调制数据上传至云端服务器,以使所述云端服务器对所述脉冲调制数据进行语音识别处理,获得语音识别结果的步骤,具体包括:
在所述运行状态信息不符合所述工作状态条件时,将所述脉冲调制数据上传至云端服务器,以使所述云端服务器获取对应的云端空间特征值,并在检测到所述云端空间特征值符合预设存储条件时,对所述脉冲调制数据进行语音识别处理,获得语音识别结果。
优选地,所述根据所述语音识别结果从所述多个智能设备选取一目标智能设备对所述语音识别结果进行响应的步骤,具体包括:
根据所述语音识别结果从所述多个智能设备选取对应的目标智能设备;
将所述语音识别结果存储至所述目标智能设备的存储器中,以使所述目标智能设备对所述语音识别结果进行响应。
此外,为实现上述目的,本发明还提出一种基于多设备的语音处理***,其特征在于,所述***包括:
数据获取模块,用于获取语音指令信息,并从所述语音指令信息中提取对应的脉冲编码调制数据;
状态获取模块,用于获取预先关联的多个智能设备的设备标识,并根据所述设备标识获取各智能设备的运行状态信息;
语音识别模块,用于根据所述运行状态信息通过云端服务器对所述脉冲调制数据进行语音识别处理,获得语音识别结果;
语音响应模块,用于根据所述语音识别结果从所述多个智能设备选取一目标智能设备对所述语音识别结果进行响应。
优选地,所述语音识别模块,还用于判断所述运行状态信息是否符合工作状态条件;
所述语音识别模块,还用于在所述运行状态信息不符合所述工作状态条件时,将所述脉冲调制数据上传至云端服务器,以使所述云端服务器对所述脉冲调制数据进行语音识别处理,获得语音识别结果。
优选地,所述运行状态信息包括处理器占用率和/或处理器空闲率;
所述语音识别模块,还用于从所述运行状态信息中提取所述处理器占用率;
所述语音识别模块,还用于检测所述处理器占用率是否大于预设占用率,并根据检测结果判断所述运行状态信息是否符合工作状态条件;
所述语音识别模块,还用于从所述运行状态信息中提取所述处理器空闲率;
所述语音识别模块,还用于检测所述处理器空闲率是否小于预设空闲率,并根据检测结果判断所述运行状态信息是否符合工作状态条件。
优选地,所述语音识别模块,还用于在所述运行状态信息不符合所述工作状态条件时,将所述脉冲调制数据上传至云端服务器,以使所述云端服务器获取对应的云端空间特征值,并在检测到所述云端空间特征值符合预设存储条件时,对所述脉冲调制数据进行语音识别处理,获得语音识别结果。
优选地,所述语音响应模块,还用于根据所述语音识别结果从所述多个智能设备选取对应的目标智能设备;
所述语音响应模块,还用于将所述语音识别结果存储至所述目标智能设备的存储器中,以使所述目标智能设备对所述语音识别结果进行响应。
本发明中,获取语音指令信息,并从所述语音指令信息中提取对应的脉冲编码调制数据,获取预先关联的多个智能设备的设备标识,并根据所述设备标识获取各智能设备的运行状态信息,根据所述运行状态信息通过云端服务器对所述脉冲调制数据进行语音识别处理,获得语音识别结果,根据所述语音识别结果从所述多个智能设备选取一目标智能设备对语音识别结果进行响应。有别于现有技术通过智能设备在本地识别语音指令信息,然后基于识别后的文本生成对应的控制指令,再基于控制指令执行对应的操作以响应语音指令信息而导致语音交互的准确性和响应速度堪忧,拖慢了语音处理速度,也影响了用户的语音交互体验,本发明获取语音指令信息对应的脉冲编码调制数据和预先关联的多个智能设备的运行状态信息,然后根据运行状态信息通过云端服务器对脉冲调制数据进行语音识别处理,获得语音识别结果,再根据语音识别结果从多个智能设备选取对应的目标智能设备对语音识别结果进行响应,以实现智能设备和云端协同工作,提高在线语音处理的响应速度,进一步地,也提高了用户的语音交互体验。
附图说明
图1为本发明基于多设备的语音处理方法第一实施例的流程示意图;
图2是本发明实施例方案涉及的硬件运行环境的智能设备的结构示意图;
图3为本发明基于多设备的语音处理方法第二实施例的流程示意图;
图4为本发明基于多设备的语音处理***第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明实施例提供了一种基于多设备的语音处理方法,参照图1,图1为本发明基于多设备的语音处理方法第一实施例的流程示意图。
本实施例中,所述基于多设备的语音处理方法包括以下步骤:
步骤S10:获取语音指令信息,并从所述语音指令信息中提取对应的脉冲编码调制数据;
易于理解的是,本实施例的执行主体为智能控制端,智能控制端可理解为用户与多个智能设备之间的交互媒介,参照图2,图2为本发明实施例方案涉及的硬件运行环境的智能设备的结构示意图。如图2所示,该智能设备可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU)、微控制单元(Microcontroller Unit,MCU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏、输入单元比如键盘,可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(WIreless-FIdelity,WI-FI)接口)。存储器1005可以是高速的随机存取存储器(Random Access Memory,RAM)存储器,也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图2中示出的结构并不构成对智能设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图2所示,作为一种存储介质的存储器1005中可以包括操作***、数据存储模块、网络通信模块、用户接口模块以及基于多设备的语音处理程序。
在图2所示的智能设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明智能设备中的处理器1001、存储器1005可以设置在智能设备中,也可以设置在智能控制端中,在将处理器1001、存储器1005设置在智能设备中时,智能控制端通过智能设备中的处理器1001调用存储器1005中存储的基于多设备的语音处理程序,并执行本发明实施例提供的基于多设备的语音处理方法;在将处理器1001、存储器1005设置在智能控制端中时,智能控制端直接通过处理器1001调用存储器1005中存储的基于多设备的语音处理程序,并执行本发明实施例提供的基于多设备的语音处理方法。
需要说明的是,智能控制端在获取语音指令信息时,可从所述语音指令信息中提取对应的脉冲编码调制(Pulse Code Modulation,PCM)数据,语音指令信息可以是用户发出的语音指令信息,也可以是通过输入单元(如键盘)生成的语音指令信息,在具体实现中,可先将语音指令信息转换为一个时间连续,取值连续的模拟信号,然后将模拟信号变换成时间离散,取值离散的数字信号,再在信道中进行传输,可理解为先对语音指令信息所对应的模拟信号进行抽样,再对模拟信号所对应的样值幅度进行量化及编码,获得脉冲编码调制数据,然后将脉冲编码调制数据保存至存储器00中,存储器00用以存储脉冲编码调制数据。
步骤S20:获取预先关联的多个智能设备的设备标识,并根据所述设备标识获取各智能设备的运行状态信息;
易于理解的是,智能控制端在获取语音指令信息所对应的脉冲编码调制数据时,还可获取预先关联的正在运行的多个智能设备的设备标识,然后控制智能设备启动状态侦测功能,以获取自身的运行状态信息。设备标识可用以表示设备的种类,如电视机、加湿器、空调等。运行状态信息可用以表示智能设备的处理器(如微控制单元)的状态,包括但不限于处理器占用率和处理器空闲率。
在具体实现中,在控制智能设备启动状态侦测功能时,可设置对应的接口标识为1,并将标识结果保存至存储器01中,然后智能控制端访问存储器01获取标识结果为1,并获取多个智能设备的设备标识,分别保存至存储器11、存储器22、存储器33……,并设置对应的接口标识为1,然后将标识结果保存至存储器02中,智能控制端访问存储器02获取标识结果为1,并访问存储有设备标识的存储器,获取存储有设备标识的存储器中的设备标识,并根据设备标识查询对应的智能设备的运行状态信息。
步骤S30:根据所述运行状态信息通过云端服务器对所述脉冲调制数据进行语音识别处理,获得语音识别结果;
易于理解的是,在获取智能设备的运行状态信息后,为了提高用户的语音交互体验,可将脉冲调制数据上传至云端服务器时,并控制云端服务器根据运行状态信息对脉冲调制数据进行语音识别处理,获取语音识别结果。语音识别结果包括但不限于声纹特征、语速、频率、时长、情绪等与声音相关的特征信息,以及通过语音识别处理中的语义识别所获得的文本信息,文本信息可理解为与文本相关的特征信息,包括但不限于文本长度、特定字符、语义解析难易度等。
在具体实现中,为了提高在线语音处理的响应速度,可只对脉冲调制数据进行语音识别处理中的语义识别,获得只包含文本信息的语音识别结果,然后根据文本信息从多个智能设备选取一目标智能设备,并将文本信息存储至目标智能设备的存储器中,以使所述目标智能设备对所述语音识别结果进行响应。
步骤S40:根据所述语音识别结果从所述多个智能设备选取一目标智能设备对所述语音识别结果进行响应。
需要说明的是,在获得语音识别结果后,可从语音识别结果中的文本信息中提取设备标识(如设备名称),然后,根据设备标识从多个智能设备选取对应的目标智能设备,并将语音识别结果存储至目标智能设备的存储器中,以使所述目标智能设备对所述语音识别结果进行响应。
在具体实现中,为了提高用户的语音交互体验,还可从语音识别结果中提取声纹特征等特征信息来确定语音指令信息的发起对象,然后根据发起对象的身份获取对应的设备偏好设置,再根据设备偏好设置来对响应结果做进一步的优化,设备偏好设置为根据发起对象的身份在预设指令数据库中获取的发起对象对各智能设备的惯用设置,如根据语音识别结果确定目标智能设备为空调,发起对象对空调的惯用设置为26℃,则在收到该发起对象发出的语音指令信息为“打开空调”时,会根据该发起对象的身份启动空调并将空调的开启温度设置为26℃。
应当理解的是,以上仅为举例说明,对本发明的技术方案并不构成任何限定,在具体应用中,本领域的技术人员可以根据需要进行设置,本发明对此不做限制。
本实施例中,获取语音指令信息,并从所述语音指令信息中提取对应的脉冲编码调制数据,获取预先关联的多个智能设备的设备标识,并根据所述设备标识获取各智能设备的运行状态信息,根据所述运行状态信息通过云端服务器对所述脉冲调制数据进行语音识别处理,获得语音识别结果,根据所述语音识别结果从所述多个智能设备选取一目标智能设备对语音识别结果进行响应。有别于现有技术通过智能设备在本地识别语音指令信息,然后基于识别后的文本生成对应的控制指令,再基于控制指令执行对应的操作以响应语音指令信息而导致语音交互的准确性和响应速度堪忧,拖慢了语音处理速度,也影响了用户的语音交互体验,本实施例获取语音指令信息对应的脉冲编码调制数据和预先关联的多个智能设备的运行状态信息,然后根据运行状态信息通过云端服务器对脉冲调制数据进行语音识别处理,获得语音识别结果,再根据语音识别结果从多个智能设备选取对应的目标智能设备对语音识别结果进行响应,以实现智能设备和云端协同工作,提高在线语音处理的响应速度,进一步地,也提高了用户的语音交互体验。
参考图3,图3为本发明基于多设备的语音处理方法第二实施例的流程示意图。
基于上述第一实施例,在本实施例中,所述步骤S30包括:
步骤S301:判断所述运行状态信息是否符合工作状态条件;
需要说明的是,运行状态信息可用以表示智能设备的处理器(如微控制单元)的状态,包括但不限于处理器占用率和处理器空闲率。在具体实现中,可从运行状态信息中提取处理器占用率,然后根据处理器占用率是否大于预设占用率来判断运行状态信息是否符合工作状态条件,预设占用率可根据实际需求进行设置,如80%,本实施例对此不加以限制。和/或;从运行状态信息中提取处理器空闲率,根据处理器空闲率是否小于预设空闲率来判断运行状态信息是否符合工作状态条件,预设空闲率可根据实际需求进行设置,如10%,本实施例对此不加以限制。
在具体实现中,在查询智能设备(如电视机)的运行状态信息时,若电视机的处理器占用率大于80%,和/或;处理器空闲率小于10%(即电视机对应的处理器处于忙碌状态),则设置对应的接口标识为1,并将标识结果保存至存储器02中,否则,设置对应的接口标识为2,并将标识结果保存至存储器03中。智能控制端访问存储器03,获取标识结果为2,然后访问存储器00,获取PCM数据,控制电视机将PCM数据上传至云端服务器,设置对应的接口标识1,并将标识结果保存至存储器04中。
在另一种实现方式中,在查询智能设备(如加湿器)的运行状态信息时,若加湿器的处理器占用率大于80%,和/或;处理器空闲率小于10%(即加湿器对应的处理器处于忙碌状态),则设置则对应的接口标识为1,并将标识结果保存至存储器05中,否则,设置对应的接口标识为2,并将标识结果保存至存储器05中。智能控制端访问存储器05,获取标识结果为2,然后访问存储器00,获取PCM数据,控制加湿器将PCM数据上传至云端服务器,设置对应的接口标识1,并将标识结果保存至存储器06中。
在另一种实现方式中,在查询智能设备(如空调)的运行状态信息时,若空调的处理器占用率大于80%,和/或;处理器空闲率小于10%(即空调对应的处理器处于忙碌状态),则设置则对应的接口标识为1,并将标识结果保存至存储器07中,否则,设置对应的接口标识为2,并将标识结果保存至存储器07中。智能控制端访问存储器07,获取标识结果为2,然后访问存储器00,获取PCM数据,控制空调将PCM数据上传至云端服务器,设置对应的接口标识1,并将标识结果保存至存储器08中。
重复上述操作,以遍历其他智能设备,获得各智能设备的运行状态信息,并以此判断各智能设备的运行状态信息是否符合工作状态条件。
步骤S302:在所述运行状态信息不符合所述工作状态条件时,将所述脉冲调制数据上传至云端服务器,以使所述云端服务器对所述脉冲调制数据进行语音识别处理,获得语音识别结果。
易于理解的是,在运行状态信息不符合所述工作状态条件时(如处理器占用率小于等于80%,且处理器空闲率大于等于10%,即处理器不处于忙碌状态),可将脉冲调制数据上传至云端服务器,以使云端服务器获取对应的云端空间特征值,并在检测到云端空间特征值符合预设存储条件时,对所述脉冲调制数据进行语音识别处理,获得语音识别结果,根据所述语音识别结果从所述多个智能设备选取对应的目标智能设备对所述语音识别结果进行响应。云端空间特征值可理解为表示云端服务器中各智能设备所对应的存储空间的使用情况的特征值,包括但不限于云端空间占用率和云端空间空闲率。相应地,预设存储条件可设置为判断云端空间空闲率是否大于预设云端空闲率,预设云端空闲率可根据实际需求进行设置,如60%,本实施例对此不加以限制;或,判断云端空间占用率是否小于预设云端占用率,预设云端占用率可根据实际需求进行设置,如40%,本实施例对此不加以限制。
在具体实现中,在处理智能设备(如电视机)的运行状态信息时,智能控制端访问存储器04,获取识别结果为1,控制云端服务器获取电视机对应的PCM数据,以使云端服务器获取电视机对应的云端空间特征值,如云端空间空闲率,若电视机对应的云端空闲率大于60%,控制云端服务器对电视机对应的PCM数据进行语义识别,将获得的文本信息保存到存储器44中,以使电视机执行对应的操作对文本信息进行响应;若电视机对应的云端空闲率小于40%,设置则对应的接口标识为1,并将标识结果保存至存储器08中。
在另一种实现方式中,在处理智能设备(如加湿器)的运行状态信息时,智能控制端访问存储器06,获取识别结果为1,控制云端服务器获取加湿器对应的PCM数据,以使云端服务器获取加湿器对应的云端空间特征值,如云端空间空闲率,若加湿器对应的云端空闲率大于60%,控制云端服务器对加湿器对应的PCM数据进行语义识别,将获得的文本信息保存到存储器55中,以使加湿器执行对应的操作对文本信息进行响应;若加湿器对应的云端空闲率小于40%,设置则对应的接口标识为1,并将标识结果保存至存储器09中。
在另一种实现方式中,在处理智能设备(如空调)的运行状态信息时,智能控制端访问存储器08,获取识别结果为1,控制云端服务器获取空调对应的PCM数据,以使云端服务器获取空调对应的云端空间特征值,如云端空间空闲率,若空调对应的云端空闲率大于60%,控制云端服务器对空调对应的PCM数据进行语义识别,将获得的文本信息保存到存储器66中,以使加湿器执行对应的操作对文本信息进行响应;若加湿器对应的云端空闲率小于40%,设置则对应的接口标识为1,并将标识结果保存至存储器10中。
基于上述实现方式,智能控制端访问存储器44、存储器55或存储器66,则可获取语音识别结果,进一步地,还可重复上述操作,以遍历其他智能设备,获得各智能设备的语音识别结果。
应当理解的是,以上仅为举例说明,对本发明的技术方案并不构成任何限定,在具体应用中,本领域的技术人员可以根据需要进行设置,本发明对此不做限制。
本实施例中,判断所述运行状态信息是否符合工作状态条件,在所述运行状态信息不符合所述工作状态条件时,将所述脉冲调制数据上传至云端服务器,以使所述云端服务器对所述脉冲调制数据进行语音识别处理,获得语音识别结果。有别于现有技术仅通过本地存储的语音识别数据库进行语音识别处理,本实施例通过控制云端服务器根据各智能设备的运行状态信息,如处理器占用率和处理器空闲率,对各智能设备的脉冲调制数据进行语音识别处理,以提高语音识别效率和语音识别的准确性,进一步地,也提高了在线语音处理的响应速度和用户的语音交互体验。
参照图4,图4为本发明基于多设备的语音处理***第一实施例的结构框图。
如图4所示,本发明实施例提出的基于多设备的语音处理***包括:
数据获取模块10,用于获取语音指令信息,并从所述语音指令信息中提取对应的脉冲编码调制数据;
状态获取模块20,用于获取预先关联的多个智能设备的设备标识,并根据所述设备标识获取各智能设备的运行状态信息;
语音识别模块30,用于根据所述运行状态信息通过云端服务器对所述脉冲调制数据进行语音识别处理,获得语音识别结果;
语音响应模块40,用于根据所述语音识别结果从所述多个智能设备选取一目标智能设备对所述语音识别结果进行响应。
本实施例中,获取语音指令信息,并从所述语音指令信息中提取对应的脉冲编码调制数据,获取预先关联的多个智能设备的设备标识,并根据所述设备标识获取各智能设备的运行状态信息,根据所述运行状态信息通过云端服务器对所述脉冲调制数据进行语音识别处理,获得语音识别结果,根据所述语音识别结果从所述多个智能设备选取一目标智能设备对语音识别结果进行响应。有别于现有技术通过智能设备在本地识别语音指令信息,然后基于识别后的文本生成对应的控制指令,再基于控制指令执行对应的操作以响应语音指令信息而导致语音交互的准确性和响应速度堪忧,拖慢了语音处理速度,也影响了用户的语音交互体验,本实施例获取语音指令信息对应的脉冲编码调制数据和预先关联的多个智能设备的运行状态信息,然后根据运行状态信息通过云端服务器对脉冲调制数据进行语音识别处理,获得语音识别结果,再根据语音识别结果从多个智能设备选取对应的目标智能设备对语音识别结果进行响应,以实现智能设备和云端协同工作,提高在线语音处理的响应速度,进一步地,也提高了用户的语音交互体验。
基于本发明上述基于多设备的语音处理***第一实施例,提出本发明基于多设备的语音处理***的第二实施例。
在本实施例中,所述语音识别模块30,还用于判断所述运行状态信息是否符合工作状态条件;
所述语音识别模块30,还用于在所述运行状态信息不符合所述工作状态条件时,将所述脉冲调制数据上传至云端服务器,以使所述云端服务器对所述脉冲调制数据进行语音识别处理,获得语音识别结果。
所述运行状态信息包括处理器占用率和/或处理器空闲率;
所述语音识别模块30,还用于从所述运行状态信息中提取所述处理器占用率;
所述语音识别模块30,还用于检测所述处理器占用率是否大于预设占用率,并根据检测结果判断所述运行状态信息是否符合工作状态条件;
所述语音识别模块30,还用于从所述运行状态信息中提取所述处理器空闲率;
所述语音识别模块30,还用于检测所述处理器空闲率是否小于预设空闲率,并根据检测结果判断所述运行状态信息是否符合工作状态条件。
所述语音识别模块30,还用于在所述运行状态信息不符合所述工作状态条件时,将所述脉冲调制数据上传至云端服务器,以使所述云端服务器获取对应的云端空间特征值,并在检测到所述云端空间特征值符合预设存储条件时,对所述脉冲调制数据进行语音识别处理,获得语音识别结果。
所述语音响应模块40,还用于根据所述语音识别结果从所述多个智能设备选取对应的目标智能设备;
所述语音响应模块40,还用于将所述语音识别结果存储至所述目标智能设备的存储器中,以使所述目标智能设备对所述语音识别结果进行响应。
本发明基于多设备的语音处理***的其他实施例或具体实现方式可参照上述各方法实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者***不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者***所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者***中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器/随机存取存储器、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于多设备的语音处理方法,其特征在于,所述方法包括以下步骤:
获取语音指令信息,并从所述语音指令信息中提取对应的脉冲编码调制数据;
获取预先关联的多个智能设备的设备标识,并根据所述设备标识获取各智能设备的运行状态信息;
根据所述运行状态信息通过云端服务器对所述脉冲调制数据进行语音识别处理,获得语音识别结果;
根据所述语音识别结果从所述多个智能设备选取一目标智能设备对所述语音识别结果进行响应。
2.如权利要求1所述的方法,其特征在于,所述根据所述运行状态信息通过云端服务器对所述脉冲调制数据进行语音识别处理,获得语音识别结果的步骤,具体包括:
判断所述运行状态信息是否符合工作状态条件;
在所述运行状态信息不符合所述工作状态条件时,将所述脉冲调制数据上传至云端服务器,以使所述云端服务器对所述脉冲调制数据进行语音识别处理,获得语音识别结果。
3.如权利要求2所述的方法,其特征在于,所述运行状态信息包括处理器占用率和/或处理器空闲率;
相应地,所述判断所述运行状态信息是否符合工作状态条件的步骤,具体包括:
从所述运行状态信息中提取所述处理器占用率;
检测所述处理器占用率是否大于预设占用率,并根据检测结果判断所述运行状态信息是否符合工作状态条件;
和/或;
从所述运行状态信息中提取所述处理器空闲率;
检测所述处理器空闲率是否小于预设空闲率,并根据检测结果判断所述运行状态信息是否符合工作状态条件。
4.如权利要求2所述的方法,其特征在于,所述在所述运行状态信息不符合所述工作状态条件时,将所述脉冲调制数据上传至云端服务器,以使所述云端服务器对所述脉冲调制数据进行语音识别处理,获得语音识别结果的步骤,具体包括:
在所述运行状态信息不符合所述工作状态条件时,将所述脉冲调制数据上传至云端服务器,以使所述云端服务器获取对应的云端空间特征值,并在检测到所述云端空间特征值符合预设存储条件时,对所述脉冲调制数据进行语音识别处理,获得语音识别结果。
5.如权利要求1所述的方法,其特征在于,所述根据所述语音识别结果从所述多个智能设备选取一目标智能设备对所述语音识别结果进行响应的步骤,具体包括:
根据所述语音识别结果从所述多个智能设备选取对应的目标智能设备;
将所述语音识别结果存储至所述目标智能设备的存储器中,以使所述目标智能设备对所述语音识别结果进行响应。
6.一种基于多设备的语音处理***,其特征在于,所述***包括:
数据获取模块,用于获取语音指令信息,并从所述语音指令信息中提取对应的脉冲编码调制数据;
状态获取模块,用于获取预先关联的多个智能设备的设备标识,并根据所述设备标识获取各智能设备的运行状态信息;
语音识别模块,用于根据所述运行状态信息通过云端服务器对所述脉冲调制数据进行语音识别处理,获得语音识别结果;
语音响应模块,用于根据所述语音识别结果从所述多个智能设备选取一目标智能设备对所述语音识别结果进行响应。
7.如权利要求6所述的***,其特征在于,所述语音识别模块,还用于判断所述运行状态信息是否符合工作状态条件;
所述语音识别模块,还用于在所述运行状态信息不符合所述工作状态条件时,将所述脉冲调制数据上传至云端服务器,以使所述云端服务器对所述脉冲调制数据进行语音识别处理,获得语音识别结果。
8.如权利要求7所述的***,其特征在于,所述运行状态信息包括处理器占用率和/或处理器空闲率;
所述语音识别模块,还用于从所述运行状态信息中提取所述处理器占用率;
所述语音识别模块,还用于检测所述处理器占用率是否大于预设占用率,并根据检测结果判断所述运行状态信息是否符合工作状态条件;
所述语音识别模块,还用于从所述运行状态信息中提取所述处理器空闲率;
所述语音识别模块,还用于检测所述处理器空闲率是否小于预设空闲率,并根据检测结果判断所述运行状态信息是否符合工作状态条件。
9.如权利要求7所述的***,其特征在于,所述语音识别模块,还用于在所述运行状态信息不符合所述工作状态条件时,将所述脉冲调制数据上传至云端服务器,以使所述云端服务器获取对应的云端空间特征值,并在检测到所述云端空间特征值符合预设存储条件时,对所述脉冲调制数据进行语音识别处理,获得语音识别结果。
10.如权利要求6所述的***,其特征在于,所述语音响应模块,还用于根据所述语音识别结果从所述多个智能设备选取对应的目标智能设备;
所述语音响应模块,还用于将所述语音识别结果存储至所述目标智能设备的存储器中,以使所述目标智能设备对所述语音识别结果进行响应。
CN202011501007.3A 2020-12-17 2020-12-17 基于多设备的语音处理方法及*** Pending CN112700780A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011501007.3A CN112700780A (zh) 2020-12-17 2020-12-17 基于多设备的语音处理方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011501007.3A CN112700780A (zh) 2020-12-17 2020-12-17 基于多设备的语音处理方法及***

Publications (1)

Publication Number Publication Date
CN112700780A true CN112700780A (zh) 2021-04-23

Family

ID=75508897

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011501007.3A Pending CN112700780A (zh) 2020-12-17 2020-12-17 基于多设备的语音处理方法及***

Country Status (1)

Country Link
CN (1) CN112700780A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113759869A (zh) * 2021-08-16 2021-12-07 深圳Tcl新技术有限公司 智能家电测试方法及装置
CN114244879A (zh) * 2021-12-15 2022-03-25 北京声智科技有限公司 一种工业控制***、工业控制方法和电子设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113759869A (zh) * 2021-08-16 2021-12-07 深圳Tcl新技术有限公司 智能家电测试方法及装置
CN113759869B (zh) * 2021-08-16 2024-04-02 深圳Tcl新技术有限公司 智能家电测试方法及装置
CN114244879A (zh) * 2021-12-15 2022-03-25 北京声智科技有限公司 一种工业控制***、工业控制方法和电子设备

Similar Documents

Publication Publication Date Title
CN112700780A (zh) 基于多设备的语音处理方法及***
CN104346127B (zh) 语音输入的实现方法、装置及终端
EP0961263B1 (en) A method and a device for recognising speech
KR102004872B1 (ko) 전자장치, 서버 및 그 제어방법
US20150310864A1 (en) Method, interaction device, server, and system for speech recognition
CN107544272B (zh) 终端控制方法、装置及存储介质
CN105791931A (zh) 智能电视及其语音控制方法
CN112545373B (zh) 扫地机器人的控制方法、扫地机器人及介质
CN108320748B (zh) 烹饪器声控方法、烹饪器及计算机可读存储介质
CN108039173B (zh) 语音信息输入方法、移动终端、***以及可读存储介质
CN109308898B (zh) 一种方言语音识别方法、装置、终端及其存储介质
CN111081005B (zh) 定向遥控方法、装置、设备及存储介质
CN105529025B (zh) 一种语音操作输入方法及电子设备
CN113938733B (zh) 遥控设备快捷键控制方法、设备、存储介质及装置
CN106531168B (zh) 一种语音识别方法及装置
CN111341310A (zh) 基于智能音箱控制手机的***、方法、装置和存储介质
EP3059731A1 (en) Method and apparatus for automatically sending multimedia file, mobile terminal, and storage medium
JP2007041089A (ja) 情報端末および音声認識プログラム
CN110780625A (zh) 预装线自动控制方法、装置、设备及存储介质
CN106210002B (zh) 控制方法、装置及电子设备
CN104809753A (zh) 一种文件处理方法
CN112265879B (zh) 电梯控制***及其调试方法、调试设备及可读存储介质
CN108632957B (zh) 一种基于语音控制的网络连接方法、设备及存储介质
CN113779086A (zh) 发电站设备数据采集方法、装置、设备及存储介质
CN111884911A (zh) 移动终端的控制方法、移动终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination