CN109347708A - 一种语音识别方法、装置、家电设备、云服务器及介质 - Google Patents
一种语音识别方法、装置、家电设备、云服务器及介质 Download PDFInfo
- Publication number
- CN109347708A CN109347708A CN201811194962.XA CN201811194962A CN109347708A CN 109347708 A CN109347708 A CN 109347708A CN 201811194962 A CN201811194962 A CN 201811194962A CN 109347708 A CN109347708 A CN 109347708A
- Authority
- CN
- China
- Prior art keywords
- voice
- household appliance
- voice messaging
- control instruction
- instruction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 82
- 238000012549 training Methods 0.000 claims abstract description 20
- 238000004891 communication Methods 0.000 claims description 44
- 230000006870 function Effects 0.000 claims description 32
- 230000005540 biological transmission Effects 0.000 claims description 29
- 230000008569 process Effects 0.000 claims description 23
- 238000012545 processing Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 15
- 238000004458 analytical method Methods 0.000 claims description 14
- GOLXNESZZPUPJE-UHFFFAOYSA-N spiromesifen Chemical compound CC1=CC(C)=CC(C)=C1C(C(O1)=O)=C(OC(=O)CC(C)(C)C)C11CCCC1 GOLXNESZZPUPJE-UHFFFAOYSA-N 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 11
- 230000000737 periodic effect Effects 0.000 description 7
- 230000002123 temporal effect Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 238000002224 dissection Methods 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000002618 waking effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Automation & Control Theory (AREA)
- Telephonic Communication Services (AREA)
- Selective Calling Equipment (AREA)
Abstract
本发明公开了一种语音识别方法、装置、家电设备、云服务器及介质,用以解决现有技术中家电设备只要采集到语音信息就执行语义解析操作的问题。所述方法包括:云服务器接收家电设备发送的所述家电设备采集的语音信息;根据预先训练完成的语音匹配模型,判断所述语音信息是否为包含用户语音信息的语音类别;如果是,向所述家电设备发送根据所述语音信息进行处理的指令,使所述家电设备根据所述语音信息进行相应操作。
Description
技术领域
本发明主要涉及智能家居技术领域,尤其涉及一种语音识别方法、装置、家电设备、云服务器及介质。
背景技术
目前语音识别产品越来越多,随着技术的进步和普及率的提高,用户对这种交互方式亦逐渐接受和认可。随着语音交互技术及人工智能的不断提高,应用场景从语音助手、智能音箱等方面加速扩围。语音识别产品在使用过程中,通过采集周围环境的声音来进行语义解析并执行用户语音指令操作。噪声却给语音识别带来了挑战,噪声对语音控制易造成误识别或者无法识别的情况。而周围环境中很可能会存在其他非用户语音类的声音信息,比如其他电器类噪声、具有周期性的白噪声等,当语音识别产品采集到此类声音信息并进行语义解析时,不仅增加了工作量而且是没有意义的,影响了语音识别产品的使用效果及使用寿命。
因此,如何使语音识别产品能够仅在采集到用户语音的时候才进行语义解析并执行用户语音指令操作是一个亟需解决的问题。
发明内容
本发明实施例提供了一种语音识别方法、装置、家电设备、云服务器及介质,用以解决现有技术中家电设备只要采集到语音信息就执行语义解析操作的问题。
本发明实施例提供了一种语音识别方法,应用于云服务器,所述方法包括:
云服务器接收家电设备发送的所述家电设备采集的语音信息;
根据预先训练完成的语音匹配模型,判断所述语音信息是否为包含用户语音信息的语音类别;
如果是,向所述家电设备发送根据所述语音信息进行处理的指令,使所述家电设备根据所述语音信息进行相应操作。
进一步地,所述向所述家电设备发送根据所述语音信息进行处理的指令之前,所述方法还包括:
解析所述语音信息中包含的用户语音信息;
判断所述用户语音信息是否为对所述家电设备进行控制的第一控制指令;
所述向所述家电设备发送根据所述语音信息进行处理的指令包括:
如果所述用户语音信息为对所述家电设备进行控制的第一控制指令,向所述家电设备发送所述第一控制指令。
进一步地,如果所述语音信息非包含用户语音信息的语音类别,或如果不存在与所述用户语音信息匹配的第一控制指令,所述方法还包括:
确定对所述语音信息处理结束;或
向所述家电设备发送禁止解析所述语音信息的第三控制指令。
进一步地,所述向所述家电设备发送根据所述语音信息进行处理的指令包括:
向所述家电设备发送对所述语音信息进行解析的第二控制指令,使家电设备解析所述语音信息。
进一步地,所述语音匹配模型的训练过程包括:
获取样本语音信息,所述样本语音信息中携带有其所属语音类别的标注信息,其中不同语音类别对应的标注信息不同,所述所属语音类别包括包含用户语音信息的语音类别;
将每个样本语音信息输入到语音匹配模型中;
根据每个样本语音信息所属语音类别的标注信息及所述语音匹配模型的输出,对所述语音匹配模型进行训练。
本发明实施例提供了一种语音识别方法,应用于家电设备,所述方法包括:
家电设备将采集的语音信息发送给云服务器;
接收云服务器发送的根据所述语音信息进行处理的指令;
根据所述指令对所述语音信息执行相应的操作。
进一步地,所述根据所述指令对所述语音信息执行相应的操作包括:
如果所述指令为第一控制指令,根据所述第一控制指令,执行对应功能,其中,所述第一控制指令为云服务器在解析所述语音信息中包含的用户语音信息并判断所述用户语音信息为对所述家电设备进行控制的第一控制指令时发送的。
进一步地,所述根据所述指令对所述语音信息执行相应的操作还包括:
如果所述指令为第二控制指令,解析所述语音信息中包含的用户语音信息,其中,所述第二控制指令为对所述语音信息进行解析的指令;
判断所述用户语音信息是否为对自身进行控制的目标控制指令;
如果是,根据所述目标控制指令执行对应功能。
进一步地,所述方法还包括:
接收到云服务器发送的第三控制指令,不对所述语音信息进行解析,其中所述第三控制指令为云服务器禁止所述家电设备解析所述语音信息时发送的。
本发明实施例提供了一种语音识别装置,应用于云服务器,所述装置包括:
第一接收模块,用于接收家电设备发送的所述家电设备采集的语音信息;
第一判断模块,用于根据预先训练完成的语音匹配模型,判断所述语音信息是否为包含用户语音信息的语音类别,如果是,触发第一发送模块;
第一发送模块,用于向所述家电设备发送根据所述语音信息进行处理的指令,使所述家电设备根据所述语音信息进行相应操作。
进一步地,所述装置还包括:
解析模块,用于解析所述语音信息中包含的用户语音信息;判断所述用户语音信息是否为对所述家电设备进行控制的第一控制指令;
所述第一发送模块,具体用于如果所述用户语音信息为对所述家电设备进行控制的第一控制指令,向所述家电设备发送所述第一控制指令。
进一步地,所述装置还包括:
确定模块,用于确定对所述语音信息处理结束;或向所述家电设备发送禁止解析所述语音信息的第三控制指令。
进一步地,所述第一发送模块,具体还用于向所述家电设备发送对所述语音信息进行解析的第二控制指令,使家电设备解析所述语音信息。
进一步地,所述装置还包括:
模型训练模块,用于获取样本语音信息,所述样本语音信息中携带有其所属语音类别的标注信息,其中不同语音类别对应的标注信息不同,所述所属语音类别包括包含用户语音信息的语音类别;将每个样本语音信息输入到语音匹配模型中;根据每个样本语音信息所属语音类别的标注信息及所述语音匹配模型的输出,对所述语音匹配模型进行训练。
本发明实施例提供了一种语音识别装置,应用于家电设备,所述装置包括:
第二发送模块,用于将采集的语音信息发送给云服务器;
第二接收模块,用于接收云服务器发送的根据所述语音信息进行处理的指令;
执行模块,用于根据所述指令对所述语音信息执行相应的操作。
进一步地,所述执行模块,具体用于如果所述指令为第一控制指令,根据所述第一控制指令,执行对应功能,其中,所述第一控制指令为云服务器在解析所述语音信息中包含的用户语音信息并判断所述用户语音信息为对所述家电设备进行控制的第一控制指令时发送的。
进一步地,所述执行模块,具体用于如果所述指令为第二控制指令,解析所述语音信息中包含的用户语音信息,其中,所述第二控制指令为对所述语音信息进行解析的指令;判断所述用户语音信息是否为对自身进行控制的目标控制指令;如果是,根据所述目标控制指令执行对应功能。
进一步地,所述装置还包括:
第三接收模块,用于接收到云服务器发送的第三控制指令,不对所述语音信息进行解析,其中所述第三控制指令为云服务器禁止所述家电设备解析所述语音信息时发送的。
本发明实施例提供了一种云服务器,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
所述存储器中存储有计算机程序,当所述程序被所述处理器执行时,使得所述处理器执行上述任一项应用于云服务器的方法的步骤。
本发明实施例提供了一种计算机可读存储介质,其存储有可由云服务器执行的计算机程序,当所述程序在所述云服务器上运行时,使得所述云服务器执行权利要求上述任一项应用于云服务器的方法的步骤。
本发明实施例提供了一种家电设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
所述存储器中存储有计算机程序,当所述程序被所述处理器执行时,使得所述处理器执行上述任一项应用于家电设备的方法的步骤。
本发明实施例提供了一种计算机可读存储介质,其存储有可由家电设备执行的计算机程序,当所述程序在所述家电设备上运行时,使得所述家电设备执行上述任一项应用于家电设备的方法的步骤。
本发明实施例提供了一种语音识别方法、装置、家电设备、云服务器及介质,所述方法包括:云服务器接收家电设备发送的所述家电设备采集的语音信息;根据预先训练完成的语音匹配模型,判断所述语音信息是否为包含用户语音信息的语音类别;如果是,向所述家电设备发送根据所述语音信息进行处理的指令,使所述家电设备根据所述语音信息进行相应操作。该方法中,通过云服务器判断家电设备采集的语音信息是否为包含用户语音信息的语音类别,如果是,向家电设备发送指令,使家电设备根据该语音信息进行相应操作,解决了现有技术中家电设备只要采集到语音信息就执行语义解析操作的问题。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1提供的一种语音识别方法的过程示意图;
图2为本发明实施例提供的一种语音匹配模型的示例图;
图3为本发明实施例6提供的一种语音识别方法的过程示意图;
图4为本发明实施例8提供的一种语音识别方法的过程示意图;
图5为本发明实施例提供的一种语音匹配模型构建的过程示意图;
图6为本发明实施例9提供的一种语音识别装置的结构示意图;
图7为本发明实施例10提供的一种语音识别装置的结构示意图;
图8为本发明实施例提供的一种云服务器的结构示意图;
图9为本发明实施例提供的一种家电设备的结构示意图。
具体实施方式
下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例1:
图1为本发明实施例提供的一种语音识别方法的过程示意图,该过程包括以下步骤:
S101:云服务器接收家电设备发送的所述家电设备采集的语音信息。
本发明实施例提供的语音识别方法应用于云服务器。
现有技术中,具有语音识别功能的家电设备在进行语音识别处理的时候,只要采集到语音信息就会执行语义解析的操作,而周围环境中很可能会存在其他非用户类语音信息,比如其他电器类噪音、具有周期性的白噪声等,而家电设备如果也针对这类语音进行处理,无疑加大了其工作强度,减少使用寿命等,而且还有可能造成误识别的情况,降低了用户体验效果。
为了解决现有技术存在的问题,本发明实施例提供的方案中家电设备将采集到的语音信息发送给云服务器,通过云服务器来判断家电设备采集的语音信息是否包含用户语音信息,并根据判断结果向家电设备发送指令使家电设备根据指令来完成操作。
具体地,家电设备中设置有语音识别模块,可以识别语音信息并进行语音信息采集,另外,家电设备中设置有通信模块,例如WIFI无线通讯模块等,使得该家电设备能够与云服务器连接,可以将采集到的语音信息发送给云服务器。
S102:根据预先训练完成的语音匹配模型,判断所述语音信息是否为包含用户语音信息的语音类别。
为了有效地减低家电设备的工作量,提高工作效率,云服务器中保存有语音匹配模型,该语音匹配模型可以识别出语音信息的类别,具体的是识别是否为包含用户语音信息的语音类别,当然该语音匹配模型可以识别其他语音类别,例如电器类噪音、具有周期性的白噪声等语音类别。
该语音匹配模型在进行语音类别的识别时,输出的是语音信息归属类别的标识信息,例如包含用户语音信息的语音类别的标识信息为01、电器类语音的语音类别的标识信息为02、具有周期性的白噪声的语音类别的标识信息为03等。
云服务器在接收到家电设备发送的语音信息后,根据语音匹配模型输出的语音信息归属类别的标识信息,查找该标识信息中是否包含用户语音信息的语音类别的标识信息。具体地,将该语音信息输入语音匹配模型,如果语音匹配模型输出的结果中包含用户语音的语音类别的标识信息01,则认为该语音信息中包含用户语音信息的语音类别的标识信息,需要执行后续处理。
S103:如果是,向所述家电设备发送根据所述语音信息进行处理的指令,使所述家电设备根据所述语音信息进行相应操作。
如果云服务器判断该语音信息为包含用户语音信息的语音类别,说明家电设备有必要根据该语音信息进行相应操作。此时需要向家电设备发送根据所述语音信息进行处理的指令。
具体地在进行指令发送时,可以在该指令中携带语音信息的标识信息,以便家电设备知道对哪个语音信息进行处理,该标识信息可以是语音信息采集的时间信息,或者该语音信息对应的编号等唯一标识语音信息的信息。
因为家电设备中设置有通信模块,所有可以接收云服务器发送的根据所述语音信息进行处理的指令,并根据该指令进行相应处理。
本发明实施例中,通过云服务器判断家电设备采集的语音信息是否为包含用户语音信息的语音类别,如果是,向家电设备发送指令,使家电设备根据该语音信息进行相应操作,解决了现有技术中家电设备只要采集到语音信息就执行语义解析操作的问题。
实施例2:
为了进一步减少家电设备进行语音信息处理的工作量,在上述实施例的基础上,在本发明实施例中,所述向所述家电设备发送根据所述语音信息进行处理的指令之前,所述方法还包括:
解析所述语音信息中包含的用户语音信息;
判断所述用户语音信息是否为对所述家电设备进行控制的第一控制指令;
所述向所述家电设备发送根据所述语音信息进行处理的指令包括:
如果所述用户语音信息为对所述家电设备进行控制的第一控制指令,向所述家电设备发送所述第一控制指令。
云服务器中保存有大量的语音数据,具有强大的语义解析功能,在云服务器判断接收到的语音信息为包含用户语音信息的语音类别时,利用自身的语义解析功能对该语音信息进行解析处理,确定该语音信息中包含的用户语音信息。识别用户语音信息的语义,判断该用户语音信息的语义是否为对家电设备进行控制的第一控制指令,具体地,对用户语音信息的语义中是否包含针对家电设备设置的目标控制指令进行判断,如果是,则将该第一控制指令发送给该家电设备。
具体地进行语义解析的过程为现有技术,在本发明实施例中不再赘述。
或者云服务器中保存有能够对家电设备进行语音控制的目标语音指令,将用户语音信息与该目标语音指令进行匹配,如果匹配成功,将成功匹配的对应的目标语音指令发送给家电设备。为了与后续其他指令进行区分,将该目标语音指令确定为第一控制指令,即向家电设备发送该第一控制指令。
本发明实施例中,通过在云服务器对用户语音信息进行解析,并判断该用户语音信息是否为对该家电设备进行控制的第一控制指令,如果是才会向家电设备发送第一控制指令,不仅进一步减少了家电设备的工作量,还避免了向家电设备发送错误的指令,提升了用户体验效果。
实施例3:
为了使家电设备不对其他非包含用户语音信息的语音类别进行处理,在上述各实施例的基础上,在本发明实施例中,如果所述语音信息非包含用户语音信息的语音类别,或如果不存在与所述用户语音信息匹配的第一控制指令,所述方法还包括:
确定对所述语音信息处理结束;或
向所述家电设备发送禁止解析所述语音信息的第三控制指令。
如果云服务器判断接收的语音信息中不包含用户语音信息的语音类别,或者云服务器经过语义解析后发现不存在与用户语音信息匹配的第一控制指令,即认为该语音信息没有进行处理的必要,此时可以认为该处理过程结束,即不向家电设备发送任何消息。而家电设备因为没有接收到任何信息,则针对该语音信息也不进行其他后续操作。
如果云服务器判断接收的语音信息中不包含用户语音信息的语音类别,或者云服务器经过语义解析后发现不存在与用户语音信息匹配的第一控制指令,也可以向家电设备发送第三控制指令,该第三控制指令为禁止家电设备对采集的语音信息进行语义解析的指令,该指令中携带有语音信息的标识信息,从而使家电设备对该标识信息对应的语音信息不进行解析。而家电设备接收到第三控制指令,会根据第三控制指令,也不会对该语音信息进行后续处理。
本发明实施例中,通过向家电设备发送禁止其执行语义解析功能的第三控制指令或者确定对所述语音信息处理结束,来达到使家电设备对非用户类语音不执行语义解析功能的效果。
实施例4:
为了保证家电设备仅对用户语音信息进行解析处理,在上述各实施例的基础上,在本发明实施例中,所述向所述家电设备发送根据所述语音信息进行处理的指令包括:
向所述家电设备发送对所述语音信息进行解析的第二控制指令,使家电设备解析所述语音信息。
因为包含用户语音信息的语音信息较少,所以当云服务器判断该语音信息为包含用户语音信息的语音类别时,为了降低服务器的压力,可以向家电设备发送对所述语音信息进行解析的第二控制指令,该第二控制指令中携带语音信息的标识信息,或者可以携带该语音信息,从而使家电设备对该标识信息的语音信息进行解析。
家电设备对该语音信息进行解析包括:家电设备利用自身配置的语义解析功能对该语音信息进行解析处理,确定该语音信息中包含的用户语音信息,识别用户语音信息的语义,判断该用户语音信息的语义中是否包含对自身进行控制的目标控制指令,如果是,则根据该目标控制指令执行相应的操作,完成用户想要进行的语音控制。
或者家电设备中也保存有能够对其进行语音控制的目标语音指令,经用户语音信息与目标语音指令进行匹配,如果匹配成功的话,则根据该目标语音指令进行相应的操作。
本发明实施例中,通过向家电设备发送允许其对采集的用户语音信息执行语义解析处理的指令,达到了使家电设备仅对用户语音信息进行处理的目的。
实施例5:
为了判断采集的语音信息是否为包含用户语音信息的语音类别,在上述各实施例的基础上,在本发明实施例中,所述语音匹配模型的训练过程包括:
获取样本语音信息,所述样本语音信息中携带有其所属语音类别的标注信息,其中不同语音类别对应的标注信息不同,所述所属语音类别包括包含用户语音信息的语音类别;
将每个样本语音信息输入到语音匹配模型中;
根据每个样本语音信息所属语音类别的标注信息及所述语音匹配模型的输出,对所述语音匹配模型进行训练。
为了方便语音匹配模型的训练,可以收集大量的样本语音信息,该样本语音信息为家电设备采集的,针对样本语音信息,人为识别该样本语音信息的语音类别,具体的语音类别为包括用户语音信息的语音类别,还可以包括非用户语音信息的语音类别,非用户语音信息的语音类别可以包括:电器类声音的语音类别、周期性噪声的语音类别等。
具体地,每个样本语音信息包含其所属语音类别的标识信息,例如用户语音信息的语音类别的标识信息为01、电器类声音的语音类别的标识信息为02、周期性噪声的语音类别的标识信息为03等。
将携带了标识信息的样本语音信息输入到该语音匹配模型中,对该语音匹配模型进行训练,该模型可以为卷积神经网络模型。将每个携带了标识信息的样本语音信息输入到该卷积神经网络模型中,根据每个样本语音信息所属语音类别的标识信息及语音匹配模型的输出结果,对该语音匹配模型进行训练。
如图2所示的语音匹配模型可以对用户语音信息的语音类别及语音类别的标识信息、电器类声音的语音类别及语音类别的标识信息、周期性噪声的语音类别及语音类别标识信息等类别的语音信息进行识别,具体地将采集到的语音信息输入该语音匹配模型,通过语音匹配模型输出该语音信息所属语音类别的标识信息,如果输出结果中包含用户语音信息的语音类别的标识信息,则该语音信息为包含用户语音信息的语音类别。
本发明实施例中,通过对大量样本语音信息进行训练得到语音匹配模型,并通过该语音匹配模型可以对采集的语音信息进行识别。
实施例6:
图3为本发明实施例提供的一种语音识别方法的过程示意图,该过程包括以下步骤:
S301:家电设备将采集的语音信息发送给云服务器。
本发明实施例提供的语音识别方法应用于具有语音识别功能的家电设备。
目前具有语音识别功能的家电设备越来越多,而当前的家电设备只要采集到语音信息都会执行语义解析功能,而部分语音信息中并不包含用户语音信息,而针对非用户语音信息进行操作是没有意义的,影响了家电设备的工作效率,并且浪费了家电设备的处理资源。
为了解决现有技术中的问题,本发明实施例中,在家电设备采集到语音信息后,将该语音信息发送给云服务器,由云服务器判断该语音信息中是否包含用户语音信息,是否需要执行语义解析操作。
具体地,家电设备中配置有语音识别模块,该语音识别模块可以识别语音信息并采集,另外为了和云服务器进行连接,该家电设备还设有通信模块,例如可以是WIFI无线通讯模块等,家电设备通过该通信模块将采集的语音信息发送给云服务器。
S302:接收云服务器发送的根据所述语音信息进行处理的指令。
家电设备将采集的语音信息发送给云服务器,云服务器判断该语音信息是否为包含用户语音信息的语音类别,如果云服务器判断该语音信息中为包含用户语音信息的语音类别,会向家电设备发送根据所述语音信息进行处理的指令,家电设备通过其配置的通信模块接收该指令,并根据该指令对该语音信息执行相应的操作。
该指令中携带有语音信息的标识信息,家电设备接收到该指令后可以判断出需要针对哪个语音信息进行处理,例如,该标识信息是语音信息采集的时间信息,家电设备在接收到该指令后,识别该指令中包含的标识信息,即采集该语音信息的时间信息,并查找该时间信息对应的语音信息,对该语音信息进行处理。
S303:根据所述指令对所述语音信息执行相应的操作。
家电设备接收到云服务器发送的指令后,因为该指令中携带有语音信息的标识信息,因此可以根据该指令对该标识信息的语音信息执行相应的操作,从而决定是否触发相应的动作。
本发明实施例中,家电设备通过将采集的语音信息发送给云服务器,由云服务器判断家电设备采集的语音信息是否为包含用户语音信息的语音类别,如果是,向家电设备发送指令,家电设备接收该指令,并根据该指令对该语音信息执行相应的操作,解决了现有技术中家电设备只要采集到语音信息就执行解析操作的问题。
实施例7:
为了保证家电设备仅对用户语音信息进行处理,在上述各实施例的基础上,在本发明实施例中,所述根据所述指令对所述语音信息执行相应的操作包括:
如果所述指令为第一控制指令,根据所述第一控制指令,执行对应功能,其中,所述第一控制指令为云服务器在解析所述语音信息中包含的用户语音信息并判断所述用户语音信息为对所述家电设备进行控制的第一控制指令时发送的。
如果所述指令为第二控制指令,解析所述语音信息中包含的用户语音信息,其中,所述第二控制指令为对所述语音信息进行解析的指令;
判断所述用户语音信息是否为对自身进行控制的目标控制指令;
如果是,根据所述目标控制指令执行对应功能。
为了进一步减少家电设备进行语音信息处理的工作量,而且云服务器中保存有大量的语音数据,具有强大的语义解析功能,在云服务器判断接收到的语音信息为包含用户语音信息的语音类别时,利用自身的语义解析功能对该语音信息进行解析处理,确定该语音信息中包含的用户语音信息。识别用户语音信息的语义,判断该用户语音信息的语义是否为对家电设备进行控制的第一控制指令,具体地,对用户语音信息的语义中是否包含针对家电设备设置的目标控制指令进行判断,如果是,则将该第一控制指令发送给该家电设备。
如果家电设备接收到云服务器发送的第一控制指令,由于该第一控制指令为云服务器在判断该用户语音信息是对该家电设备进行控制的第一控制指令时发送的,因此家电设备会根据该第一控制指令执行相应的操作,完成用户语音信息的命令。
因为包含用户语音信息的语音信息较少,所以当云服务器判断该语音信息为包含用户语音信息的语音类别时,为了降低服务器的压力,可以向家电设备发送对所述语音信息进行解析的第二控制指令,该第二控制指令中携带语音信息的标识信息,或者可以携带该语音信息,从而使家电设备对该标识信息的语音信息进行解析。
如果家电设备接收的是云服务器发送的第二控制指令,而该第二控制指令是云服务器允许家电设备执行语义解析功能的指令,并且携带有需要进行处理的语音信息的标识信息,所以家电设备根据该第二控制指令,根据其中携带的语音信息的标识信息,确定出对应的语音信息,对该语音信息进行解析。例如,该标识信息是语音信息采集的时间信息,家电设备在接收到该第二控制指令后,识别该第二控制指令中包含的标识信息,即采集该语音信息的时间信息,并查找该时间信息对应的语音信息,对该语音信息进行处理。
但是,该用户语音信息有可能为用户正常说话的信息,并不包含针对家电设备的控制指令。因此,家电设备在对用户语音信息进行语义解析之后,判断该用户语音信息的语义是否为对自身进行控制的目标控制指令,如果是,则根据该目标控制指令执行相应的操作。或者家电设备中保存有能够对其进行语音控制的目标语音指令,将该用户语音信息与目标语音指令进行匹配,如果匹配成功,则根据该目标语音指令执行相应的操作。如果不包含或没有匹配成功,则认为该用户语音信息为无关的,不执行任何操作。
本发明实施例中,通过根据云服务器发送的指令信息执行相应的操作,避免了对所有语音信息都进行处理,增加工作量及降低用户体验效果的问题。
实施例8:
为了保证不对其他非用户类语音执行语义解析功能,在上述各实施例的基础上,在本发明实施例中,所述方法还包括:
接收到云服务器发送的第三控制指令,不对所述语音信息进行解析,其中所述第三控制指令为禁止解析所述语音信息的指令。
由于第三控制指令是云服务器在判断语音信息中不包含用户语音信息或者云服务器判断不存在与用户语音信息匹配的第一控制指令时发送的,并且该第三控制指令携带有语音信息的标识信息,所以如果家电设备接收到云服务器发送的第三控制指令,则不对该标识信息对应的语音信息执行语义解析的操作。
下面以一个具体的实施例对语音识别方法的过程进行详细说明,该详细过程如图4所示,包括以下步骤:
S401:上电唤醒家电设备的语音识别模块。
S402:采集周围环境声音及用户语音。
S403:家电设备将采集的语音信息上传到云服务器。
S404:云服务器根据语音匹配模型智能分析。
下面结合图5对构建语音匹配模型的过程进行描述。
家电设备通过其配置的语音识别模块采集大量的样本语音信息,该样本语音信息可以包含用户语音、电器类语音、周期性噪音等,人为识别所以样本语音信息的语音类别,并为每种语音类别标注不同的标识信息。
将每个样本语音信息输入语音匹配模型,该语音匹配模型可以是卷积神经网络模型,该语音匹配模型通过自身的智能分析分类,输出每个样本语音信息所属语音类别的标识信息。
根据每次语音匹配模型的输出结果,确定针对该语音匹配模型的最优模型参数,对该语音匹配模型训练结束,建立起一个最优的语音匹配模型。
S405:判断语音信息是否为包含用户语音信息的语音类别。
如果不包含,则结束对该语音信息的处理或者向家电设备发送第三控制指令,该第三控制指令为禁止家电设备对该语音信息进行解析的指令,因此,当家电设备没有接收到任何指令或者接收到第三控制指令,均不对该语音信息进行处理。
如果包含,向家电设备发送根据该语音信息进行处理的指令,使该家电设备根据该语音信息进行相应操作。如果云服务器对该用户语音信息进行了解析,并且该用户语音信息为该家电设备进行控制的第一控制指令,则将该第一控制指令发送给家电设备。家电设备接收该第一控制指令,根据该第一控制指令执行相应的操作。
当然云服务器为了减轻自身的工作量,也可以使家电设备完成对该用户语音信息解析的操作,此时可以向家电设备发送第二控制指令,该第二控制指令为允许家电设备执行解析操作的指令,并且该指令携带有语音信息的标识信息。该家电设备接收第二控制指令,根据其中携带的语音信息的标识信息,确定出对应的语音信息,对该语音信息进行语义解析。如果该语音信息的语义为对该家电设备进行控制的目标控制指令,则根据该目标控制指令执行相应的操作。
上述各步骤的具体实施过程在上述实施例中均有详细描述,在此不再赘述。
实施例9:
基于相同的技术构思,本发明实施例提供一种语音识别装置,应用于云服务器。本发明实施例提供的装置如图6所示,该装置包括:
第一接收模块601,用于接收家电设备发送的所述家电设备采集的语音信息;
第一判断模块602,用于根据预先训练完成的语音匹配模型,判断所述语音信息是否为包含用户语音信息的语音类别,如果是,触发第一发送模块;
第一发送模块603,用于如果是,向所述家电设备发送根据所述语音信息进行处理的指令,使所述家电设备根据所述语音信息进行相应操作。
进一步地,所述装置还包括:解析模块604,用于解析所述语音信息中包含的用户语音信息;判断所述用户语音信息是否为对所述家电设备进行控制的第一控制指令;所述第一发送模块603,具体用于如果所述用户语音信息为对所述家电设备进行控制的第一控制指令,向所述家电设备发送所述第一控制指令。
进一步地,所述装置还包括:确定模块605,用于确定对所述语音信息处理结束;或向所述家电设备发送禁止解析所述语音信息的第三控制指令。
进一步地,所述第一发送模块603,具体还用于向所述家电设备发送对所述语音信息进行解析的第二控制指令,使家电设备解析所述语音信息。
进一步地,所述装置还包括:模型训练模块606,用于获取样本语音信息,所述样本语音信息中携带有其所属语音类别的标注信息,其中不同语音类别对应的标注信息不同,所述所属语音类别包括包含用户语音信息的语音类别;将每个样本语音信息输入到语音匹配模型中;根据每个样本语音信息所属语音类别的标注信息及所述语音匹配模型的输出,对所述语音匹配模型进行训练。
实施例10:
基于相同的技术构思,本发明实施例提供一种语音识别装置,应用于家电设备。本发明实施例提供的装置如图7所示,该装置包括:
第二发送模块701,用于将采集的语音信息发送给云服务器;
第二接收模块702,用于接收云服务器发送的根据所述语音信息进行处理的指令;
执行模块703,用于根据所述指令对所述语音信息执行相应的操作。
进一步地,所述执行模块703,具体用于如果所述指令为第一控制指令,根据所述第一控制指令,执行对应功能,其中,所述第一控制指令为云服务器在解析所述语音信息中包含的用户语音信息并判断所述用户语音信息为对所述家电设备进行控制的第一控制指令时发送的。
进一步地,所述执行模块703,具体用于如果所述指令为第二控制指令,解析所述语音信息中包含的用户语音信息,其中,所述第二控制指令为对所述语音信息进行解析的指令;判断所述用户语音信息是否为对自身进行控制的目标控制指令;如果是,根据所述目标控制指令执行对应功能。
进一步地,所述装置还包括:第三接收模块704,用于接收到云服务器发送的第三控制指令,不对所述语音信息进行解析,其中所述第三控制指令为禁止解析所述语音信息。
实施例11:
在上述各实施例的基础上,本发明实施例还提供了一种云服务器800,如图8所示,包括:处理器801、通信接口802、存储器803和通信总线804,其中,处理器801,通信接口802,存储器803通过通信总线804完成相互间的通信;
所述存储器803中存储有计算机程序,当所述程序被所述处理器801执行时,使得所述处理器801执行如下步骤:
云服务器接收家电设备发送的所述家电设备采集的语音信息;
根据预先训练完成的语音匹配模型,判断所述语音信息是否为包含用户语音信息的语音类别;
如果是,向所述家电设备发送根据所述语音信息进行处理的指令,使所述家电设备根据所述语音信息进行相应操作。
进一步地,所述向所述家电设备发送根据所述语音信息进行处理的指令之前,所述方法还包括:
解析所述语音信息中包含的用户语音信息;
判断所述用户语音信息是否为对所述家电设备进行控制的第一控制指令;
所述向所述家电设备发送根据所述语音信息进行处理的指令包括:
如果所述用户语音信息为对所述家电设备进行控制的第一控制指令,向所述家电设备发送所述第一控制指令。
进一步地,如果所述语音信息非包含用户语音信息的语音类别,或如果不存在与所述用户语音信息匹配的第一控制指令,所述方法还包括:
确定对所述语音信息处理结束;或
向所述家电设备发送禁止解析所述语音信息的第三控制指令。
进一步地,所述向所述家电设备发送根据所述语音信息进行处理的指令包括:
向所述家电设备发送对所述语音信息进行解析的第二控制指令,使家电设备解析所述语音信息。
进一步地,所述语音匹配模型的训练过程包括:
获取样本语音信息,所述样本语音信息中携带有其所属语音类别的标注信息,其中不同语音类别对应的标注信息不同,所述所属语音类别包括包含用户语音信息的语音类别;
将每个样本语音信息输入到语音匹配模型中;
根据每个样本语音信息所属语音类别的标注信息及所述语音匹配模型的输出,对所述语音匹配模型进行训练。
上述服务器提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口802用于上述云服务器与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述处理器可以是通用处理器,包括中央处理器、网络处理器(NetworkProcessor,NP)等;还可以是数字指令处理器(Digital Signal Processing,DSP)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
实施例12:
在上述各实施例的基础上,本发明实施例还提供了一种计算机存储可读存储介质,所述计算机可读存储介质内存储有可由云服务器执行的计算机程序,当所述程序在所述云服务器上运行时,使得所述云服务器执行时实现如下步骤:
云服务器接收家电设备发送的所述家电设备采集的语音信息;
根据预先训练完成的语音匹配模型,判断所述语音信息是否为包含用户语音信息的语音类别;
如果是,向所述家电设备发送根据所述语音信息进行处理的指令,使所述家电设备根据所述语音信息进行相应操作。
进一步地,所述向所述家电设备发送根据所述语音信息进行处理的指令之前,所述方法还包括:
解析所述语音信息中包含的用户语音信息;
判断所述用户语音信息是否为对所述家电设备进行控制的第一控制指令;
所述向所述家电设备发送根据所述语音信息进行处理的指令包括:
如果所述用户语音信息为对所述家电设备进行控制的第一控制指令,向所述家电设备发送所述第一控制指令。
进一步地,如果所述语音信息非包含用户语音信息的语音类别,或如果不存在与所述用户语音信息匹配的第一控制指令,所述方法还包括:
确定对所述语音信息处理结束;或
向所述家电设备发送禁止解析所述语音信息的第三控制指令。
进一步地,所述向所述家电设备发送根据所述语音信息进行处理的指令包括:
向所述家电设备发送对所述语音信息进行解析的第二控制指令,使家电设备解析所述语音信息。
进一步地,所述语音匹配模型的训练过程包括:
获取样本语音信息,所述样本语音信息中携带有其所属语音类别的标注信息,其中不同语音类别对应的标注信息不同,所述所属语音类别包括包含用户语音信息的语音类别;
将每个样本语音信息输入到语音匹配模型中;
根据每个样本语音信息所属语音类别的标注信息及所述语音匹配模型的输出,对所述语音匹配模型进行训练。
上述计算机可读存储介质可以是服务器中的处理器能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器如软盘、硬盘、磁带、磁光盘(MO)等、光学存储器如CD、DVD、BD、HVD等、以及半导体存储器如ROM、EPROM、EEPROM、非易失性存储器(NANDFLASH)、固态硬盘(SSD)等。
实施例13:
在上述各实施例的基础上,本发明实施例还提供了一种家电设备900,如图9所示,包括:处理器901、通信接口902、存储器903和通信总线904,其中,处理器901,通信接口902,存储器903通过通信总线904完成相互间的通信;
所述存储器903中存储有计算机程序,当所述程序被所述处理器901执行时,使得所述处理器901执行如下步骤:
家电设备将采集的语音信息发送给云服务器;
接收云服务器发送的根据所述语音信息进行处理的指令;
根据所述指令对所述语音信息执行相应的操作。
进一步地,所述根据所述指令对所述语音信息执行相应的操作包括:
如果所述指令为第一控制指令,根据所述第一控制指令,执行对应功能,其中,所述第一控制指令为云服务器在解析所述语音信息中包含的用户语音信息并判断所述用户语音信息为对所述家电设备进行控制的第一控制指令时发送的。
进一步地,所述根据所述指令对所述语音信息执行相应的操作还包括:
如果所述指令为第二控制指令,解析所述语音信息中包含的用户语音信息,其中,所述第二控制指令为对所述语音信息进行解析的指令;
判断所述用户语音信息是否为对自身进行控制的目标控制指令;
如果是,根据所述目标控制指令执行对应功能。
进一步地,其特征在于,所述方法还包括:
接收到云服务器发送的第三控制指令,不对所述语音信息进行解析,其中所述第三控制指令为禁止解析所述语音信息。
上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口902用于上述终端与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述处理器可以是通用处理器,包括中央处理器、网络处理器(NetworkProcessor,NP)等;还可以是数字指令处理器(Digital Signal Processing,DSP)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
实施例14:
在上述各实施例的基础上,本发明实施例还提供了一种计算机存储可读存储介质,所述计算机可读存储介质内存储有可由家电设备执行的计算机程序,当所述程序在所述家电设备上运行时,使得所述家电设备执行时实现如下步骤:
家电设备将采集的语音信息发送给云服务器;
接收云服务器发送的根据所述语音信息进行处理的指令;
根据所述指令对所述语音信息执行相应的操作。
进一步地,所述根据所述指令对所述语音信息执行相应的操作包括:
如果所述指令为第一控制指令,根据所述第一控制指令,执行对应功能,其中,所述第一控制指令为云服务器在解析所述语音信息中包含的用户语音信息并判断所述用户语音信息为对所述家电设备进行控制的第一控制指令时发送的。
进一步地,所述根据所述指令对所述语音信息执行相应的操作还包括:
如果所述指令为第二控制指令,解析所述语音信息中包含的用户语音信息,其中,所述第二控制指令为对所述语音信息进行解析的指令;
判断所述用户语音信息是否为对自身进行控制的目标控制指令;
如果是,根据所述目标控制指令执行对应功能。
进一步地,其特征在于,所述方法还包括:
接收到云服务器发送的第三控制指令,不对所述语音信息进行解析,其中所述第三控制指令为禁止解析所述语音信息。
上述计算机可读存储介质可以是家电设备中的处理器能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器如软盘、硬盘、磁带、磁光盘(MO)等、光学存储器如CD、DVD、BD、HVD等、以及半导体存储器如ROM、EPROM、EEPROM、非易失性存储器(NANDFLASH)、固态硬盘(SSD)等。
综上所述,本发明提供一种语音识别方法、装置、家电设备、云服务器及介质,用以解决现有技术中家电设备针对所有采集到的语音信息都执行语义解析操作的问题。所述方法包括:云服务器接收家电设备发送的所述家电设备采集的语音信息;根据预先训练完成的语音匹配模型,判断所述语音信息是否为包含用户语音信息的语音类别;如果是,向所述家电设备发送根据所述语音信息进行处理的指令,使所述家电设备根据所述语音信息进行相应操作。
对于***/装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者一个操作与另一个实体或者另一个操作区分开来,而不一定要求或者暗示这些实体或者操作之间存在任何这种实际的关系或者顺序。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全应用实施例、或结合应用和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (22)
1.一种语音识别方法,其特征在于,应用于云服务器,所述方法包括:
云服务器接收家电设备发送的所述家电设备采集的语音信息;
根据预先训练完成的语音匹配模型,判断所述语音信息是否为包含用户语音信息的语音类别;
如果是,向所述家电设备发送根据所述语音信息进行处理的指令,使所述家电设备根据所述语音信息进行相应操作。
2.如权利要求1所述的方法,其特征在于,所述向所述家电设备发送根据所述语音信息进行处理的指令之前,所述方法还包括:
解析所述语音信息中包含的用户语音信息;
判断所述用户语音信息是否为对所述家电设备进行控制的第一控制指令;
所述向所述家电设备发送根据所述语音信息进行处理的指令包括:
如果所述用户语音信息为对所述家电设备进行控制的第一控制指令,向所述家电设备发送所述第一控制指令。
3.如权利要求1或2所述的方法,其特征在于,如果所述语音信息非包含用户语音信息的语音类别,或如果不存在与所述用户语音信息匹配的第一控制指令,所述方法还包括:
确定对所述语音信息处理结束;或
向所述家电设备发送禁止解析所述语音信息的第三控制指令。
4.如权利要求1所述的方法,其特征在于,所述向所述家电设备发送根据所述语音信息进行处理的指令包括:
向所述家电设备发送对所述语音信息进行解析的第二控制指令,使家电设备解析所述语音信息。
5.如权利要求1所述的方法,其特征在于,所述语音匹配模型的训练过程包括:
获取样本语音信息,所述样本语音信息中携带有其所属语音类别的标注信息,其中不同语音类别对应的标注信息不同,所述所属语音类别包括包含用户语音信息的语音类别;
将每个样本语音信息输入到语音匹配模型中;
根据每个样本语音信息所属语音类别的标注信息及所述语音匹配模型的输出,对所述语音匹配模型进行训练。
6.一种语音识别方法,其特征在于,应用于家电设备,所述方法包括;
家电设备将采集的语音信息发送给云服务器;
接收云服务器发送的根据所述语音信息进行处理的指令;
根据所述指令对所述语音信息执行相应的操作。
7.如权利要求6所述的方法,其特征在于,所述根据所述指令对所述语音信息执行相应的操作包括:
如果所述指令为第一控制指令,根据所述第一控制指令,执行对应功能,其中,所述第一控制指令为云服务器在解析所述语音信息中包含的用户语音信息并判断所述用户语音信息为对所述家电设备进行控制的第一控制指令时发送的。
8.如权利要求6所述的方法,其特征在于,所述根据所述指令对所述语音信息执行相应的操作还包括:
如果所述指令为第二控制指令,解析所述语音信息中包含的用户语音信息,其中,所述第二控制指令为对所述语音信息进行解析的指令;
判断所述用户语音信息是否为对自身进行控制的目标控制指令;
如果是,根据所述目标控制指令执行对应功能。
9.如权利要求6所述的方法,其特征在于,所述方法还包括:
接收到云服务器发送的第三控制指令,不对所述语音信息进行解析,其中所述第三控制指令为云服务器禁止所述家电设备解析所述语音信息时发送的。
10.一种语音识别装置,其特征在于,应用于云服务器,所述装置包括:
第一接收模块,用于接收家电设备发送的所述家电设备采集的语音信息;
第一判断模块,用于根据预先训练完成的语音匹配模型,判断所述语音信息是否为包含用户语音信息的语音类别,如果是,触发第一发送模块;
第一发送模块,用于向所述家电设备发送根据所述语音信息进行处理的指令,使所述家电设备根据所述语音信息进行相应操作。
11.如权利要求10所述的装置,其特征在于,所述装置还包括:
解析模块,用于解析所述语音信息中包含的用户语音信息;判断所述用户语音信息是否为对所述家电设备进行控制的第一控制指令;
所述第一发送模块,具体用于如果所述用户语音信息为对所述家电设备进行控制的第一控制指令,向所述家电设备发送所述第一控制指令。
12.如权利要求10或11所述的装置,其特征在于,所述装置还包括:
确定模块,用于确定对所述语音信息处理结束;或向所述家电设备发送禁止解析所述语音信息的第三控制指令。
13.如权利要求10所述的装置,其特征在于,所述第一发送模块,具体还用于向所述家电设备发送对所述语音信息进行解析的第二控制指令,使家电设备解析所述语音信息。
14.如权利要求10所述的装置,其特征在于,所述装置还包括:
模型训练模块,用于获取样本语音信息,所述样本语音信息中携带有其所属语音类别的标注信息,其中不同语音类别对应的标注信息不同,所述所属语音类别包括包含用户语音信息的语音类别;将每个样本语音信息输入到语音匹配模型中;根据每个样本语音信息所属语音类别的标注信息及所述语音匹配模型的输出,对所述语音匹配模型进行训练。
15.一种语音识别装置,其特征在于,所述装置包括:
第二发送模块,用于将采集的语音信息发送给云服务器;
第二接收模块,用于接收云服务器发送的根据所述语音信息进行处理的指令;
执行模块,用于根据所述指令对所述语音信息执行相应的操作。
16.如权利要求15所述的装置,其特征在于,所述执行模块,具体用于如果所述指令为第一控制指令,根据所述第一控制指令,执行对应功能,其中,所述第一控制指令为云服务器在解析所述语音信息中包含的用户语音信息并判断所述用户语音信息为对所述家电设备进行控制的第一控制指令时发送的。
17.如权利要求15所述的装置,其特征在于,所述执行模块,具体用于如果所述指令为第二控制指令,解析所述语音信息中包含的用户语音信息,其中,所述第二控制指令为对所述语音信息进行解析的指令;判断所述用户语音信息是否为对自身进行控制的目标控制指令;如果是,根据所述目标控制指令执行对应功能。
18.如权利要求15所述的装置,其特征在于,所述装置还包括:
第三接收模块,用于接收到云服务器发送的第三控制指令,不对所述语音信息进行解析,其中所述第三控制指令为云服务器禁止所述家电设备解析所述语音信息时发送的。
19.一种云服务器,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
所述存储器中存储有计算机程序,当所述程序被所述处理器执行时,使得所述处理器执行权利要求1-5任一项所述方法的步骤。
20.一种计算机可读存储介质,其特征在于,其存储有可由云服务器执行的计算机程序,当所述程序在所述云服务器上运行时,使得所述云服务器执行权利要求1-5任一项所述方法的步骤。
21.一种家电设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
所述存储器中存储有计算机程序,当所述程序被所述处理器执行时,使得所述处理器执行权利要求6-9任一项所述方法的步骤。
22.一种计算机可读存储介质,其特征在于,其存储有可由家电设备执行的计算机程序,当所述程序在所述家电设备上运行时,使得所述家电设备执行权利要求6-9任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811194962.XA CN109347708B (zh) | 2018-10-15 | 2018-10-15 | 一种语音识别方法、装置、家电设备、云服务器及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811194962.XA CN109347708B (zh) | 2018-10-15 | 2018-10-15 | 一种语音识别方法、装置、家电设备、云服务器及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109347708A true CN109347708A (zh) | 2019-02-15 |
CN109347708B CN109347708B (zh) | 2020-08-04 |
Family
ID=65310047
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811194962.XA Active CN109347708B (zh) | 2018-10-15 | 2018-10-15 | 一种语音识别方法、装置、家电设备、云服务器及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109347708B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110021296A (zh) * | 2019-04-11 | 2019-07-16 | 广东晾霸智能科技有限公司 | 一种晾衣设备智能人机交互方法及*** |
CN111048083A (zh) * | 2019-12-12 | 2020-04-21 | 深圳康佳电子科技有限公司 | 一种语音控制方法、装置及存储介质 |
CN112735406A (zh) * | 2020-12-23 | 2021-04-30 | 青岛海尔科技有限公司 | 设备的控制方法及装置、存储介质及电子装置 |
CN114594923A (zh) * | 2022-02-16 | 2022-06-07 | 北京梧桐车联科技有限责任公司 | 车载终端的控制方法、装置、设备及存储介质 |
WO2023093074A1 (zh) * | 2021-11-24 | 2023-06-01 | 青岛海尔科技有限公司 | 语音数据处理方法、装置及电子设备、存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102404522A (zh) * | 2011-12-26 | 2012-04-04 | Tcl王牌电器(惠州)有限公司 | 电视机语音遥控方法和电视机 |
CN103645690A (zh) * | 2013-11-27 | 2014-03-19 | 中山大学深圳研究院 | 一种语音控制数字家庭智能盒的方法 |
CN104464729A (zh) * | 2014-12-16 | 2015-03-25 | 佛山市顺德区美的电热电器制造有限公司 | 语音控制电器及其语音控制方法 |
EP2930886A1 (de) * | 2014-04-09 | 2015-10-14 | Miele & Cie. KG | Verfahren und system zum bedienen von haushaltsgeräten mittels sprachsteuerung |
CN107390532A (zh) * | 2016-05-17 | 2017-11-24 | 上海后界信息科技发展有限公司 | 一种基于云计算的语音识别智能家居*** |
CN107481722A (zh) * | 2017-08-21 | 2017-12-15 | 无锡小天鹅股份有限公司 | 语音控制方法、衣物处理装置及服务器 |
KR20180052876A (ko) * | 2016-11-11 | 2018-05-21 | 윤홍식 | 음성인식을 이용한 홈네트워크 시스템 및 그 제어방법 |
-
2018
- 2018-10-15 CN CN201811194962.XA patent/CN109347708B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102404522A (zh) * | 2011-12-26 | 2012-04-04 | Tcl王牌电器(惠州)有限公司 | 电视机语音遥控方法和电视机 |
CN103645690A (zh) * | 2013-11-27 | 2014-03-19 | 中山大学深圳研究院 | 一种语音控制数字家庭智能盒的方法 |
EP2930886A1 (de) * | 2014-04-09 | 2015-10-14 | Miele & Cie. KG | Verfahren und system zum bedienen von haushaltsgeräten mittels sprachsteuerung |
CN104464729A (zh) * | 2014-12-16 | 2015-03-25 | 佛山市顺德区美的电热电器制造有限公司 | 语音控制电器及其语音控制方法 |
CN107390532A (zh) * | 2016-05-17 | 2017-11-24 | 上海后界信息科技发展有限公司 | 一种基于云计算的语音识别智能家居*** |
KR20180052876A (ko) * | 2016-11-11 | 2018-05-21 | 윤홍식 | 음성인식을 이용한 홈네트워크 시스템 및 그 제어방법 |
CN107481722A (zh) * | 2017-08-21 | 2017-12-15 | 无锡小天鹅股份有限公司 | 语音控制方法、衣物处理装置及服务器 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110021296A (zh) * | 2019-04-11 | 2019-07-16 | 广东晾霸智能科技有限公司 | 一种晾衣设备智能人机交互方法及*** |
CN111048083A (zh) * | 2019-12-12 | 2020-04-21 | 深圳康佳电子科技有限公司 | 一种语音控制方法、装置及存储介质 |
CN112735406A (zh) * | 2020-12-23 | 2021-04-30 | 青岛海尔科技有限公司 | 设备的控制方法及装置、存储介质及电子装置 |
WO2023093074A1 (zh) * | 2021-11-24 | 2023-06-01 | 青岛海尔科技有限公司 | 语音数据处理方法、装置及电子设备、存储介质 |
CN114594923A (zh) * | 2022-02-16 | 2022-06-07 | 北京梧桐车联科技有限责任公司 | 车载终端的控制方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109347708B (zh) | 2020-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109347708A (zh) | 一种语音识别方法、装置、家电设备、云服务器及介质 | |
CN109584876B (zh) | 语音数据的处理方法、装置和语音空调 | |
CN107578769B (zh) | 语音数据标注方法和装置 | |
JP2019139211A (ja) | 音声ウェイクアップ方法及び装置 | |
CN106407178A (zh) | 一种会话摘要生成方法及装置 | |
CN107733762B (zh) | 一种智能家居的语音控制方法及装置、*** | |
CN105702253A (zh) | 一种语音唤醒方法及装置 | |
CN110288995B (zh) | 基于语音识别的交互方法、装置、存储介质和电子设备 | |
CN105336342A (zh) | 语音识别结果评价方法及*** | |
CN110377908A (zh) | 语义理解方法、装置、设备及可读存储介质 | |
CN109376363A (zh) | 一种基于耳机的实时语音翻译方法及装置 | |
CN111178081B (zh) | 语义识别的方法、服务器、电子设备及计算机存储介质 | |
CN108922522B (zh) | 设备的控制方法、装置、存储介质及电子装置 | |
CN104615358A (zh) | 一种应用程序启动方法和电子设备 | |
CN112116910A (zh) | 语音指令的识别方法和装置、存储介质、电子装置 | |
CN110570855A (zh) | 通过对话机制控制智能家居设备的***、方法及装置 | |
CN108965081A (zh) | 语音控制设备的方法及装置 | |
CN107742516B (zh) | 智能识别方法、机器人及计算机可读存储介质 | |
CN111816216A (zh) | 语音活性检测方法和装置 | |
CN107767860B (zh) | 一种语音信息处理方法和装置 | |
CN114694644A (zh) | 语音意图识别方法、装置及电子设备 | |
EP3059731A1 (en) | Method and apparatus for automatically sending multimedia file, mobile terminal, and storage medium | |
CN111402899B (zh) | 跨信道声纹识别方法及装置 | |
CN108231074A (zh) | 一种数据处理方法、语音助手设备及计算机可读存储介质 | |
CN111049684B (zh) | 数据分析方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |