CN108536414B - 语音处理方法、装置和***、移动终端 - Google Patents
语音处理方法、装置和***、移动终端 Download PDFInfo
- Publication number
- CN108536414B CN108536414B CN201710133965.1A CN201710133965A CN108536414B CN 108536414 B CN108536414 B CN 108536414B CN 201710133965 A CN201710133965 A CN 201710133965A CN 108536414 B CN108536414 B CN 108536414B
- Authority
- CN
- China
- Prior art keywords
- search result
- resource data
- keyword
- voice instruction
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title abstract description 15
- 238000012545 processing Methods 0.000 claims abstract description 31
- 238000000034 method Methods 0.000 claims abstract description 29
- 230000000875 corresponding effect Effects 0.000 claims description 67
- 230000011218 segmentation Effects 0.000 claims description 27
- 238000012216 screening Methods 0.000 claims description 22
- 238000000605 extraction Methods 0.000 claims description 12
- 239000000284 extract Substances 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000002596 correlated effect Effects 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 9
- 230000002452 interceptive effect Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Artificial Intelligence (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种语音处理方法、装置和***、移动终端。其中,该方法包括:提取第一语音指令中的多个关键词,多个关键词至少包括第一关键词和第二关键词,其中,第一关键词与第一集合中的任意词语匹配成功,第二关键词与第二集合中的任意词语匹配成功;在预设数据库中同时搜索与第一关键词和第二关键词均相对应的资源数据,得到第一搜索结果,或者,在预设数据库中依次搜索与第一关键词、第二关键词均相对应的资源数据,得到第一搜索结果;向目标播放终端发送用于指示第一搜索结果的第一搜索结果指示信息,其中,在目标播放终端接收到第一搜索结果指示信息后,展示第一搜索结果。本发明解决了现有技术无法识别复杂语音指令的技术问题。
Description
技术领域
本发明涉及语音领域,具体而言,涉及一种语音处理方法、装置和***、移动终端。
背景技术
现有的智能播放终端(例如智能电视)已经能够实现通过对简单的语音指令进行识别来进行控制。以智能电视为例,如果用户发出语音“开机”,则智能电视打开;如果用户发出语音“关机”,则智能电视关机;如果用户发出语音“音量加”,则智能电视音量调高。
但是对于复杂语音指令,例如“有没有刘德华的喜剧电影”、“有没有赵丽颖的电视剧”,现有技术中无法识别。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种语音处理方法、装置和***、移动终端,以至少解决现有技术无法识别复杂语音指令的技术问题。
根据本发明实施例的一个方面,提供了一种语音处理方法,包括:提取第一语音指令中的多个关键词,所述多个关键词至少包括第一关键词和第二关键词,其中,所述第一关键词与第一集合中的任意词语匹配成功,所述第二关键词与第二集合中的任意词语匹配成功,所述第一集合中的词语用于指示资源数据的第一属性,所述第二集合中的词语用于指示所述资源数据的第二属性;在预设数据库中同时搜索与所述第一关键词和所述第二关键词均相对应的资源数据,得到第一搜索结果,或者,在所述预设数据库中依次搜索与所述第一关键词、所述第二关键词均相对应的资源数据,得到所述第一搜索结果;向目标播放终端发送用于指示所述第一搜索结果的第一搜索结果指示信息,其中,在所述目标播放终端接收到所述第一搜索结果指示信息后,展示所述第一搜索结果。
根据本发明实施例的另一方面,还提供了一种语音处理方法,包括:移动终端接收第一语音指令,其中,所述第一语音指令至少包括第一关键词和第二关键词,所述第一关键词与第一集合中的任意词语匹配成功,所述第二关键词与第二集合中的任意词语匹配成功,所述第一集合中的词语用于指示资源数据的第一属性,所述第二集合中的词语用于指示所述资源数据的第二属性;所述移动终端向第一服务器发送所述第一语音指令,其中,所述第一服务器根据所述第一语音指令获取第一搜索结果,并向第二服务器发送用于指示所述第一搜索结果的第一搜索结果指示信息以及目标播放终端的标识信息,所述第二服务器接收所述第一搜索结果指示信息和所述目标播放终端的标识信息之后,向所述目标播放终端发送所述第一搜索结果指示信息,以使所述目标播放终端根据所述第一搜索结果指示信息显示所述第一搜索结果。
根据本发明实施例的另一方面,还提供了一种语音处理装置,包括:第一提取单元,用于提取第一语音指令中的多个关键词,所述多个关键词至少包括第一关键词和第二关键词,其中,所述第一关键词与第一集合中的任意词语匹配成功,所述第二关键词与第二集合中的任意词语匹配成功,所述第一集合中的词语用于指示资源数据的第一属性,所述第二集合中的词语用于指示所述资源数据的第二属性;第一搜索单元,用于在预设数据库中同时搜索与所述第一关键词和所述第二关键词均相对应的资源数据,得到第一搜索结果,或者,在所述预设数据库中依次搜索与所述第一关键词、所述第二关键词均相对应的资源数据,得到所述第一搜索结果;第一发送单元,用于向目标播放终端发送用于指示所述第一搜索结果的第一搜索结果指示信息,其中,在所述目标播放终端接收到所述第一搜索结果指示信息后,展示所述第一搜索结果。
根据本发明实施例的另一方面,还提供了一种移动终端,包括:移动终端第一接收单元,用于接收第一语音指令,其中,所述第一语音指令至少包括第一关键词和第二关键词,所述第一关键词与第一集合中的任意词语匹配成功,所述第二关键词与第二集合中的任意词语匹配成功,所述第一集合中的词语用于指示资源数据的第一属性,所述第二集合中的词语用于指示所述资源数据的第二属性;移动终端第一发送单元,用于向第一服务器发送所述第一语音指令,其中,所述第一服务器根据所述第一语音指令获取第一搜索结果,并向第二服务器发送用于指示所述第一搜索结果的第一搜索结果指示信息以及目标播放终端的标识信息,所述第二服务器接收所述第一搜索结果指示信息和所述目标播放终端的标识信息之后,向所述目标播放终端发送所述第一搜索结果指示信息,以使所述目标播放终端根据所述第一搜索结果指示信息显示所述第一搜索结果。
根据本发明实施例的另一方面,还提供了一种语音处理***,包括:移动终端;第一服务器,包括语音处理装置,在所述语音处理装置得到所述第一搜索结果之后,所述第一服务器向第二服务器发送用于指示所述第一搜索结果的第一搜索结果指示信息和目标播放终端的标识信息;第二服务器,用于接收所述第一搜索结果指示信息和所述目标播放终端的标识信息,并向所述目标播放终端发送所述第一搜索结果指示信息;目标播放终端,用于接收所述第一搜索结果指示信息,并根据所述第一搜索结果指示信息显示所述第一搜索结果。
在本发明实施例中,用户通过移动终端发出第一语音指令,第一语音指令为复杂的语音指令,移动终端接收到第一语音指令之后,将第一语音指令发送给服务器,服务器将第一语音指令转换为文字序列,对文字序列进行语义识别,提取出文字序列中的多个关键词,多个关键词至少包括第一关键词和第二关键词,其中,第一关键词和第二关键词用于指示第一语音指令的不同语言成分,在预设数据库中搜索与第一关键词和第二关键词均对应的资源数据,向目标播放终端发送搜索结果的指示信息,其中,在目标播放终端接收到搜索结果的指示信息后,展示搜索结果,达到了识别复杂语音指令的技术效果,进而解决了现有技术无法识别复杂语音指令的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例中一种语音处理***的架构图;
图2是根据本发明实施例中一种语音处理方法的流程图;
图3-1是根据本发明实施例中目标播放终端的一种显示界面的示意图;
图3-2是根据本发明实施例中目标播放终端的又一种显示界面的示意图;
图3-3是根据本发明实施例中目标播放终端的又一种显示界面的示意图;
图3-4是根据本发明实施例中目标播放终端的又一种显示界面的示意图;
图4是根据本发明实施例中一种语音处理装置的示意图;
图5是根据本发明实施例中一种移动终端的示意图;
图6是根据本发明实施例中一种服务器的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例,提供了一种语音处理***的实施例。本发明实施例提供的语音处理***包括:移动终端、第一服务器、第二服务器、目标播放终端。
移动终端,用于接收第一语音指令,并向第一服务器发送第一语音指令,其中,第一语音指令用于指示搜索资源数据。
第一服务器,包括下述的语音处理装置,在语音处理装置得到搜索结果之后,第一服务器向第二服务器发送控制指令,控制指令携带搜索结果信息和目标播放终端的标识信息。
第二服务器,用于接收控制指令,从控制指令中提取出搜索结果信息和目标播放终端信息,向目标播放终端发送搜索结果信息。
目标播放终端,用于接收第二服务器发送的搜索结果信息,并根据搜索结果信息显示搜索结果。
图1是根据本发明实施例中一种语音处理***的架构图。图1中,服务器100即为上述第一服务器,服务器102即为上述第二服务器,终端104即为上述移动终端,智能电视106即为上述目标播放终端。
如图1所示,服务器100通过网络与服务器102、终端104、智能电视106进行连接,服务器102通过网络与服务器100、智能电视106进行连接,上述网络包括但不限于:广域网、城域网或局域网,终端104并不限定于PC、手机、平板电脑等。本发明实施例提供的语音处理方法可以由服务器100来执行。服务器102可以是电视厂商的云服务器。
智能电视106向服务器100发送绑定请求,服务器100向智能电视106返回带参数的二维码URL。用户通过终端104的公众号或者APP扫描二维码,终端104的公众号或者APP将绑定命令(即图1中的接入命令)发送到服务器100。
如果用户通过终端104的公众号扫描二维码,则终端104的公众号将绑定命令发送到服务器100,绑定命令中携带了终端104的公众号的账号信息和智能电视106的标识信息。服务器100接收到绑定命令后,记录终端104的公众号的账号信息和智能电视106的标识信息,并将二者进行关联存储。
如果用户通过终端104的APP扫描二维码,则终端104的APP将绑定命令发送到服务器100,绑定命令中携带了终端104的APP的账号信息和智能电视106的标识信息。服务器100接收到绑定命令后,记录终端104的APP的账号信息和智能电视106的标识信息,并将二者进行关联存储。
在绑定完成后,用户即可通过终端104的公众号/APP来控制智能电视106显示和播放视频。
下面以用户通过终端104的公众号来控制智能电视106为例进行详细说明。
用户通过终端104的公众号输入第一语音指令(即图1中的控制命令),终端104的公众号将第一语音指令发送给服务器100。服务器100将第一语音指令转换为文字序列,将文字序列进行分词,至少得到第一关键词和第二关键词,在预设数据库中搜索与第一关键词和第二关键词均对应的资源数据,得到搜索结果,根据搜索结果生成控制指令,控制指令携带搜索结果信息和目标智能电视的标识信息。服务器100向服务器102发送控制指令。服务器102接收控制指令,从控制指令中提取出搜索结果信息和智能电视106的标识信息,并向智能电视106发送搜索结果信息。智能电视106接收搜索结果信息并根据搜索结果信息显示搜索结果。
根据本发明实施例,提供了一种语音处理方法。
该方法是由上述第一服务器执行的,例如,该方法可以由图1中的服务器100执行。
如图2所示,该语音处理方法包括以下步骤:
步骤S202,提取第一语音指令中的多个关键词,多个关键词至少包括第一关键词和第二关键词,其中,第一关键词与第一集合中的任意词语匹配成功,第二关键词与第二集合中的任意词语匹配成功,第一集合中的词语用于指示资源数据的第一属性,第二集合中的词语用于指示资源数据的第二属性。
步骤S204,在预设数据库中同时搜索与第一关键词和第二关键词均相对应的资源数据,得到第一搜索结果,或者,在预设数据库中依次搜索与第一关键词、第二关键词均相对应的资源数据,得到第一搜索结果。
步骤S206,向目标播放终端发送用于指示第一搜索结果的第一搜索结果指示信息,其中,在目标播放终端接收到第一搜索结果指示信息后,展示第一搜索结果。
第一语音指令是用户通过移动终端发出的,例如,移动终端可以是手机、电脑、平板等。
用户可以通过移动终端安装的APP或者公众号发出第一语音指令。
资源数据可以是电视剧、电影、综艺节目、视频片段等。
服务器向目标播放终端发送搜索结果的指示信息,可以是经由其他服务器转发,例如,如图1中所示出的,第一服务器(服务器100)先将搜索结果的指示信息发送给第二服务器(服务器102),再由第二服务器将搜索结果的指示信息转发给目标播放终端。
在本发明实施例中,用户通过移动终端发出第一语音指令,第一语音指令为复杂的语音指令,移动终端接收到第一语音指令之后,将第一语音指令发送给服务器,服务器将第一语音指令转换为文字序列,对文字序列进行语义识别,提取出文字序列中的多个关键词,多个关键词至少包括第一关键词和第二关键词,其中,第一关键词和第二关键词用于指示第一语音指令的不同语言成分,在预设数据库中搜索与第一关键词和第二关键词均对应的资源数据,向目标播放终端发送搜索结果的指示信息,其中,在目标播放终端接收到搜索结果的指示信息后,展示搜索结果,解决了无法识别复杂语音指令的技术问题,达到了识别复杂语音指令的技术效果。
在预设数据库中搜索与第一关键词和第二关键词均对应的资源数据,具体的实现方法可以有多种,下面对其中的两种方法进行详细说明。
在预设数据库中搜索与第一关键词和第二关键词均对应的资源数据的第一种方法:
在预设数据库中搜索与第一关键词对应的资源数据,得到第一资源数据;在预设数据库中搜索与第二关键词对应的资源数据,得到第二资源数据;将第一资源数据和第二资源数据的交集作为第一搜索结果。
例如,第一语音指令为“有没有刘德华的喜剧片”,则第一关键词为“刘德华”,第二关键词为“喜剧片”。在预设数据库中检索“刘德华”,得到100个电影(第一资源数据)。在预设数据库中检索“喜剧片”,得到3000个电影(第二资源数据)。将前100个电影与后3000个电影取交集,假设交集是15个电影,则这15个电影即为第一关键词和第二关键词均对应的资源数据。
在预设数据库中搜索与第一关键词和第二关键词均对应的资源数据的第二种方法:
从预设数据库中搜索与第一关键词对应的资源数据,得到第三资源数据;从第三资源数据中筛选与第二关键词对应的资源数据,得到第四资源数据;将第四资源数据作为第一关键词和第二关键词均对应的资源数据。
例如,第一语音指令为“有没有刘德华的喜剧片”,则第一关键词为“刘德华”,第二关键词为“喜剧片”。在预设数据库中检索“刘德华”,得到100个电影(第三资源数据)。这100个电影中,每个电影都有类别标签,例如“喜剧片”、“悲剧片”、“动画片”等。将这100个电影类别标签分别与第二关键词“喜剧片”进行匹配,假设匹配成功的有15个电影(第四资源数据),则这15个电影即为第一关键词和第二关键词均对应的资源数据。
再例如,第一语音指令为“有没有最新一集青云志”,则第一关键词为“青云志”,第二关键词为“最新”。在预设数据库中检索“青云志”,得到40个视频片段(第三资源数据)。这40个视频片段中,每个视频片段都有时间标签。根据时间标签从这40个视频片段中筛选出最新的一集(第四资源数据),假设第5个视频片段是最新的一集,则将第5个视频片段作为第一关键词和第二关键词均对应的资源数据。
对于包含时间信息的第一语音指令,第二种方法更好。
有时候,用户没有使用完整的句子来进行表达,例如,用户先输入了语音指令“有没有梁朝伟的电影”,当目标播放终端显示梁朝伟的电影之后,用户又改变了想法,输入另一个语音指令“赵丽颖的呢”,此时,如果仅对后一个语音指令进行语义分析,只能识别出关键词“赵丽颖”,无法知道用户是想看赵丽颖的电影、电视剧、还是综艺节目。
为了解决以上问题,本发明实施例提供的语音处理方法利用上文结构补全语音指令。具体地,在向目标播放终端发送用于指示第一搜索结果的第一搜索结果指示信息之后,语音处理方法还包括:提取第二语音指令中的第三关键词,其中,第一语音指令先于第二语音指令被接收到,接收第一语音指令的时间与接收第二语音指令的时间之间的时间间隔小于等于预设时间间隔,第三关键词与第一集合中的任意词语匹配成功;在预设数据库中搜索与第二关键词和第三关键词均对应的资源数据,得到第二搜索结果;向目标播放终端发送用于指示第二搜索结果的第二搜索结果指示信息,其中,在目标播放终端接收到第二搜索结果指示信息后,展示第二搜索结果。
例如,用户先输入了语音指令“有没有梁朝伟的电影”,当目标播放终端显示梁朝伟的电影之后,用户又改变了想法,输入另一个语音指令“赵丽颖的呢”。语音指令“有没有梁朝伟的电影”为第一语音指令。语音指令“赵丽颖的呢”为第二语音指令。提取第一语音指令中的第一关键词,得到“梁朝伟”。提取第一语音指令中的第二关键词,得到“电影”。提取第二语音指令中的第三关键词,得到“赵丽颖”。在预设数据库中搜索与第二关键词“电影”和第三关键词“赵丽颖”均对应的资源数据,得到赵丽颖的电影。于是,在目标播放终端显示赵丽颖的电影,而不是赵丽颖的电视剧、或者综艺节目等。
通过在上文中提取关键词,补全当前的语音指令,使得用户输入很口语化、缺少必要语言成分的句子时也能识别出来。
当目标播放终端接收到搜索结果的指示信息之后,目标播放终端展示搜索结果。搜索结果可能是一个资源数据,也可能是多个资源数据。
在搜索结果是一个资源数据的情况下,目标播放终端直接播放该资源数据。
在搜索结果是多个资源数据的情况下,目标播放终端展示搜索这多个资源数据,用户可能需要选取其中一个进行播放。
用户通过移动终端的APP或者公众号发出第三语音指令,第三语音指令用于指示从搜索结果中筛选待播放的资源数据。移动终端的APP或者公众号将第三语音指令发送给服务器。服务器接收第三语音指令;从第三语音指令中提取出第四关键词;从第一搜索结果中筛选出与第四关键词对应的资源数据;将筛选出的资源数据作为目标资源数据;向目标播放终端发送目标资源数据的指示信息,其中,在目标播放终端接收到目标资源数据的指示信息之后,播放目标资源数据。
例如,目标播放终端显示了哈利波特的一至八集,用户通过手机的APP或者公众号发出第三语音指令“第六集”。手机的APP或者公众号将第三语音指令发送给服务器。服务器接收第三语音指令;从第三语音指令中提取出第四关键词“六”;从搜索结果中筛选出第四关键词对应的资源数据;将筛选出的资源数据作为目标资源数据(哈利波特的第六集);向目标播放终端发送目标资源数据的指示信息。在目标播放终端接收到目标资源数据的指示信息之后,播放哈利波特的第六集。
可选地,从第三语音指令中提取出第四关键词包括:将第三语音指令转换为文字序列;对文字序列进行分词,得到多个分词词语;将多个分词词语中的每个分词词语依次与第三集合中的每个词语进行匹配,得到匹配成功的分词词语,其中,第三集合为预设集合;如果有且只有一个分词词语匹配成功,则将匹配成功的分词词语作为第四关键词;如果没有分词词语匹配成功或者多于一个分词词语匹配成功,则发出用于提示重新获取第三语音指令的提示信息。
第三集合可以是用于指示先后顺序的词语的集合,例如,第三集合可以是{一、二、三、四、……};第三集合还可以是{1、2、3、4、……},预设集合还可以是{第一、第二、第三、第四、……},第三集合还可以是{A、B、C、D、……},等。
本发明实施例中对目标播放终端的显示界面做了改进,如图3-1、图3-2、图3-3、图3-4所示,将资源数据与指示先后顺序的词语或标识进行关联显示。例如,如图3-1所示,目标播放终端显示了8个电影,假设电影《无间道》是用户想要播放的,用户通过手机的APP或者公众号发出第三语音指令“第五个”。手机的APP或者公众号将第三语音指令发送给服务器。服务器接收第三语音指令;从第三语音指令中提取出第四关键词“五”;从搜索结果中筛选出第四关键词对应的资源数据;将筛选出的资源数据作为目标资源数据(电影《无间道》);向目标播放终端发送目标资源数据的指示信息。在目标播放终端接收到目标资源数据的指示信息之后,播放电影《无间道》。
通过将交互方案更改为单一列,序号点播模式,到达了全语音闭环操控的效果。
有可能用户发出了相互矛盾的语音指令,例如,用户发出语音指令“第二集、第三集”,在这种情况下,会有不只一个匹配成功的分词词语,即,第四关键词不只一个,那么,需要发出提示信息,其中,提示信息用于提示重新获取第三语音指令。
现有技术方案缺乏对正常人的自然语言做分析和处理;部分操控不能完全用语音替代,用户使用成本高。如搜索电视剧以后,进入电视剧详情页面中,即无法继续用语音选集播放。
在本发明实施例中,语音操控电视的场景中,从基础操控(简单替代遥控)、***内操作、到内容综合搜索、点播、播放进度操控,实现电视场景的自然语言完全闭环操控,完全脱离遥控器解放双手。基于语音,电视操控完全闭环,摆脱遥控器的限制。通过单一需求表达的语音指令,实现遥控器的简单替代,如“关机”“确认”“退出”“音量加”等。进一步对用户自然表达分析,实现组合指令实现,如“看刘德华的动作片”(“搜索刘德华”,“搜索动作片”两个指令组合)、“我要看看最近高分的喜剧片”(“最近影片”“高分影片”“喜剧片”三个指令组合),同时对电视现有交互界面做改造,使之更适合语音操控点选播放。在此基础上,增加自然语言表达内容,如上下文理解“有没有王宝强的电影?徐峥的呢?”由此实现对电视的全语音化、自然语言表达操控。通过改变电视使用的交互方式,用户使用电视时可完全解放双手。
本发明实施例中,通过自然语言分析及提取有效命令,多指令操控电视返回结果,实现了组合指令及自然语言操控;通过对现有不能通过语音操控的界面做交互改造,及操控表达引导-解析,实现语音操控零门槛,实现了全语音闭环操控。
闭环case举例:
Case1:开机-播放最新一集青云志-暂停-继续播放-播放蜡笔小新第5集-返回上一个节目-接着看昨天的电视剧-关机
Case2:开机-有没有王家卫的电影-梁朝伟的呢-赵丽颖的呢-看看赵丽颖的电视剧-播放第一行第二个-下一集-不对再往后两集--关机
Case3:开机-最近有什么电影更新-看看评分最高的电影-播放第三个吧-有没有搞笑的美剧-播放第一个-关机
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
根据本发明实施例,还提供了一种用于实施上述语音处理方法的语音处理装置,如图4所示,该装置包括:第一提取单元10、第一搜索单元20、第一发送单元30。
第一提取单元10,用于提取第一语音指令中的多个关键词,多个关键词至少包括第一关键词和第二关键词,其中,第一关键词与第一集合中的任意词语匹配成功,第二关键词与第二集合中的任意词语匹配成功,第一集合中的词语用于指示资源数据的第一属性,第二集合中的词语用于指示资源数据的第二属性。
第一搜索单元20,用于在预设数据库中同时搜索与第一关键词和第二关键词均相对应的资源数据,得到第一搜索结果,或者,在预设数据库中依次搜索与第一关键词、第二关键词均相对应的资源数据,得到第一搜索结果。
第一发送单元30,用于向目标播放终端发送用于指示第一搜索结果的第一搜索结果指示信息,其中,在目标播放终端接收到第一搜索结果指示信息后,展示第一搜索结果。
可选地,第一搜索单元20包括:第一搜索子单元、第二搜索子单元、第一确定子单元。第一搜索子单元,用于在预设数据库中搜索与第一关键词对应的资源数据,得到第一资源数据。第二搜索子单元,用于在预设数据库中搜索与第二关键词对应的资源数据,得到第二资源数据。第一确定子单元,用于将第一资源数据和第二资源数据的交集作为第一搜索结果。
可选地,第一搜索单元20包括:第三搜索子单元、筛选子单元、第二确定子单元。第三搜索子单元,用于从预设数据库中搜索与第一关键词对应的资源数据,得到第三资源数据。筛选子单元,用于从第三资源数据中筛选与第二关键词对应的资源数据,得到第四资源数据。第二确定子单元,用于将第四资源数据作为第一搜索结果。
可选地,装置还包括:第二提取单元、第二搜索单元、第二发送单元。第二提取单元,用于在第一发送单元30向目标播放终端发送用于指示第一搜索结果的第一搜索结果指示信息之后,提取第二语音指令中的第三关键词,其中,第一语音指令先于第二语音指令被接收到,接收第一语音指令的时间与接收第二语音指令的时间之间的时间间隔小于等于预设时间间隔,第三关键词与第一集合中的任意词语匹配成功。第二搜索单元,用于在预设数据库中搜索与第二关键词和第三关键词均对应的资源数据,得到第二搜索结果。第二发送单元,用于向目标播放终端发送用于指示第二搜索结果的第二搜索结果指示信息,其中,在目标播放终端接收到第二搜索结果指示信息后,展示第二搜索结果。
可选地,装置还包括:接收单元、第三提取单元、筛选单元、确定单元、第三发送单元。接收单元,用于在第一发送单元30向目标播放终端发送用于指示第一搜索结果的第一搜索结果指示信息之后,接收第三语音指令,其中,第三语音指令用于指示从第一搜索结果中筛选待播放的资源数据。第三提取单元,用于从第三语音指令中提取出第四关键词。筛选单元,用于从第一搜索结果中筛选出与第四关键词对应的资源数据。确定单元,用于将筛选出的资源数据作为目标资源数据。第三发送单元,用于向目标播放终端发送目标资源数据的指示信息,其中,在目标播放终端接收到目标资源数据的指示信息之后,播放目标资源数据。
可选地,第三提取单元包括:转换子单元、分词子单元、匹配子单元、第三确定子单元、提示子单元。转换子单元,用于将第三语音指令转换为文字序列。分词子单元,用于对文字序列进行分词,得到多个分词词语。匹配子单元,用于将多个分词词语中的每个分词词语依次与第三集合中的每个词语进行匹配,得到匹配成功的分词词语,其中,第三集合为预设集合。第三确定子单元,用于如果有且只有一个分词词语匹配成功,则将匹配成功的分词词语作为第四关键词。提示子单元,用于如果没有分词词语匹配成功或者多于一个分词词语匹配成功,则发出用于提示重新获取第三语音指令的提示信息。
根据本发明实施例,还提供了一种移动终端。如图5所示,该移动终端包括:移动终端第一接收单元50、移动终端第一发送单元60。
移动终端第一接收单元50,用于接收第一语音指令,其中,第一语音指令至少包括第一关键词和第二关键词,第一关键词与第一集合中的任意词语匹配成功,第二关键词与第二集合中的任意词语匹配成功,第一集合中的词语用于指示资源数据的第一属性,第二集合中的词语用于指示资源数据的第二属性。
移动终端第一发送单元60,用于向第一服务器发送第一语音指令,其中,第一服务器根据第一语音指令获取第一搜索结果,并向第二服务器发送用于指示第一搜索结果的第一搜索结果指示信息以及目标播放终端的标识信息,第二服务器接收第一搜索结果指示信息和目标播放终端的标识信息之后,向目标播放终端发送第一搜索结果指示信息,以使目标播放终端根据第一搜索结果指示信息显示第一搜索结果。
可选地,移动终端还包括:移动终端第二接收单元、移动终端第二发送单元。
移动终端第二接收单元,用于在移动终端第一发送单元60向第一服务器发送第一语音指令之后,接收第二语音指令,第二语音指令至少包括第三关键词,其中,第一语音指令先于第二语音指令被移动终端接收到,接收第一语音指令的时间与接收第二语音指令的时间之间的时间间隔小于等于预设时间间隔,第三关键词与第一集合中的任意词语匹配成功。
移动终端第二发送单元,用于向第一服务器发送第二语音指令,其中,第一服务器根据第二语音指令获取第二搜索结果,并向第二服务器发送用于指示第二搜索结果的第二搜索结果指示信息以及目标播放终端的标识信息,第二服务器接收第二搜索结果指示信息和目标播放终端的标识信息之后,向目标播放终端发送第二搜索结果指示信息,以使目标播放终端根据第二搜索结果指示信息显示第二搜索结果。
可选地,移动终端还包括:移动终端第三接收单元、移动终端第三发送单元。
移动终端第三接收单元,用于在移动终端第一发送单元60向第一服务器发送第一语音指令之后,接收第三语音指令。
移动终端第三发送单元,用于向第一服务器发送第三语音指令,其中,第一服务器根据第三语音指令获取目标资源数据,并向第二服务器发送目标资源数据的指示信息和目标播放终端的标识信息,第二服务器接收目标资源数据的指示信息和目标播放终端的标识信息之后,向目标播放终端发送目标资源数据的指示信息,以使目标播放终端播放目标资源数据,目标资源数据是第一搜索结果中的一个资源数据。
根据本发明实施例,还提供了一种语音处理***。该语音处理***,包括:上述移动终端、第一服务器、第二服务器、上述目标播放终端。
第一服务器,包括上述的语音处理装置,在语音处理装置得到第一搜索结果之后,第一服务器向第二服务器发送用于指示第一搜索结果的第一搜索结果指示信息和目标播放终端的标识信息。
第二服务器,用于接收第一搜索结果指示信息和目标播放终端的标识信息,并向目标播放终端发送第一搜索结果指示信息。
目标播放终端,用于接收第一搜索结果指示信息,并根据第一搜索结果指示信息显示第一搜索结果。
根据本发明实施例,还提供了一种用于实施上述语音处理方法的服务器(第一服务器),该服务器可以是图1中的服务器100。如图6所示,该服务器主要包括处理器601、显示器603、数据接口604、存储器605和网络接口606,其中:
数据接口604则主要通过数据传输的方式将语音指令传输给处理器601。
存储器605主要用于存储语音指令、文字序列、第一关键词、第二关键词。
网络接口606主要用于与终端和其他服务器进行网络通信。
显示器603主要用于显示文字序列、第一关键词、第二关键词。
处理器601主要用于执行如下操作:提取第一语音指令中的多个关键词,多个关键词至少包括第一关键词和第二关键词,其中,第一关键词与第一集合中的任意词语匹配成功,第二关键词与第二集合中的任意词语匹配成功,第一集合中的词语用于指示资源数据的第一属性,第二集合中的词语用于指示资源数据的第二属性;在预设数据库中同时搜索与第一关键词和第二关键词均相对应的资源数据,得到第一搜索结果,或者,在预设数据库中依次搜索与第一关键词、第二关键词均相对应的资源数据,得到第一搜索结果;向目标播放终端发送用于指示第一搜索结果的第一搜索结果指示信息,其中,在目标播放终端接收到第一搜索结果指示信息后,展示第一搜索结果。
处理器601还用于执行:在预设数据库中搜索与第一关键词对应的资源数据,得到第一资源数据;在预设数据库中搜索与第二关键词对应的资源数据,得到第二资源数据;将第一资源数据和第二资源数据的交集作为第一搜索结果。
处理器601还用于执行:从预设数据库中搜索与第一关键词对应的资源数据,得到第三资源数据;从第三资源数据中筛选与第二关键词对应的资源数据,得到第四资源数据;将第四资源数据作为第一搜索结果。
处理器601还用于执行:提取第二语音指令中的第三关键词,其中,第一语音指令先于第二语音指令被接收到,接收第一语音指令的时间与接收第二语音指令的时间之间的时间间隔小于等于预设时间间隔,第三关键词与第一集合中的任意词语匹配成功;在预设数据库中搜索与第二关键词和第三关键词均对应的资源数据,得到第二搜索结果;向目标播放终端发送用于指示第二搜索结果的第二搜索结果指示信息,其中,在目标播放终端接收到第二搜索结果指示信息后,展示第二搜索结果。
处理器601还用于执行:接收第三语音指令,其中,第三语音指令用于指示从第一搜索结果中筛选待播放的资源数据;从第三语音指令中提取出第四关键词;从第一搜索结果中筛选出与第四关键词对应的资源数据;将筛选出的资源数据作为目标资源数据;向目标播放终端发送目标资源数据的指示信息,其中,在目标播放终端接收到目标资源数据的指示信息之后,播放目标资源数据。
处理器601还用于执行:将第三语音指令转换为文字序列;对文字序列进行分词,得到多个分词词语;将多个分词词语中的每个分词词语依次与第三集合中的每个词语进行匹配,得到匹配成功的分词词语,其中,第三集合为预设集合;如果有且只有一个分词词语匹配成功,则将匹配成功的分词词语作为第四关键词;如果没有分词词语匹配成功或者多于一个分词词语匹配成功,则发出用于提示重新获取第三语音指令的提示信息。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于存储本发明实施例的语音处理方法的程序代码。
可选地,在本实施例中,上述存储介质可以位于移动通信网络、广域网、城域网或局域网的网络中的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:
S1,提取第一语音指令中的多个关键词,多个关键词至少包括第一关键词和第二关键词,其中,第一关键词与第一集合中的任意词语匹配成功,第二关键词与第二集合中的任意词语匹配成功,第一集合中的词语用于指示资源数据的第一属性,第二集合中的词语用于指示资源数据的第二属性。
S2,在预设数据库中同时搜索与第一关键词和第二关键词均相对应的资源数据,得到第一搜索结果,或者,在预设数据库中依次搜索与第一关键词、第二关键词均相对应的资源数据,得到第一搜索结果。
S3,向目标播放终端发送用于指示第一搜索结果的第一搜索结果指示信息,其中,在目标播放终端接收到第一搜索结果指示信息后,展示第一搜索结果。
可选地,在本实施例中,处理器根据存储介质中已存储的程序代码执行:在预设数据库中搜索与第一关键词对应的资源数据,得到第一资源数据;在预设数据库中搜索与第二关键词对应的资源数据,得到第二资源数据;将第一资源数据和第二资源数据的交集作为第一搜索结果。
可选地,在本实施例中,处理器根据存储介质中已存储的程序代码执行:从预设数据库中搜索与第一关键词对应的资源数据,得到第三资源数据;从第三资源数据中筛选与第二关键词对应的资源数据,得到第四资源数据;将第四资源数据作为第一搜索结果。
可选地,在本实施例中,处理器根据存储介质中已存储的程序代码执行:提取第二语音指令中的第三关键词,其中,第一语音指令先于第二语音指令被接收到,接收第一语音指令的时间与接收第二语音指令的时间之间的时间间隔小于等于预设时间间隔,第三关键词与第一集合中的任意词语匹配成功;在预设数据库中搜索与第二关键词和第三关键词均对应的资源数据,得到第二搜索结果;向目标播放终端发送用于指示第二搜索结果的第二搜索结果指示信息,其中,在目标播放终端接收到第二搜索结果指示信息后,展示第二搜索结果。
可选地,在本实施例中,处理器根据存储介质中已存储的程序代码执行:接收第三语音指令,其中,第三语音指令用于指示从第一搜索结果中筛选待播放的资源数据;从第三语音指令中提取出第四关键词;从第一搜索结果中筛选出与第四关键词对应的资源数据;将筛选出的资源数据作为目标资源数据;向目标播放终端发送目标资源数据的指示信息,其中,在目标播放终端接收到目标资源数据的指示信息之后,播放目标资源数据。可选地,在本实施例中,处理器根据存储介质中已存储的程序代码执行:将第三语音指令转换为文字序列;对文字序列进行分词,得到多个分词词语;将多个分词词语中的每个分词词语依次与第三集合中的每个词语进行匹配,得到匹配成功的分词词语,其中,第三集合为预设集合;如果有且只有一个分词词语匹配成功,则将匹配成功的分词词语作为第四关键词;如果没有分词词语匹配成功或者多于一个分词词语匹配成功,则发出用于提示重新获取第三语音指令的提示信息。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (13)
1.一种语音处理方法,其特征在于,包括:
基于第一集合中的词语和第二集合中的词语,提取第一语音指令中的多个关键词,所述多个关键词至少包括第一关键词和第二关键词,其中,所述第一关键词与第一集合中的任意词语匹配成功,所述第二关键词与第二集合中的任意词语匹配成功,所述第一集合中的词语用于指示资源数据的第一属性,所述第二集合中的词语用于指示所述资源数据的第二属性,所述第二属性为所述资源数据的标签;
在预设数据库中依次搜索与所述第一关键词、所述第二关键词均相对应的资源数据,得到第一搜索结果;
向目标播放终端发送用于指示所述第一搜索结果的第一搜索结果指示信息,其中,在所述目标播放终端接收到所述第一搜索结果指示信息后,展示所述第一搜索结果;
其中,展示所述第一搜索结果,包括:将所述第一搜索结果与指示先后顺序的词语或标识进行关联显示;
接收第三语音指令,其中,所述第三语音指令用于指示从所述第一搜索结果中筛选待播放的资源数据;
从所述第三语音指令中提取出第四关键词;所述第四关键词是用于指示先后顺序的词语;
从所述第一搜索结果中筛选出与所述第四关键词对应的资源数据;
将筛选出的资源数据作为目标资源数据;
向所述目标播放终端发送所述目标资源数据的指示信息,其中,在所述目标播放终端接收到所述目标资源数据的指示信息之后,播放所述目标资源数据;所述目标播放终端为电视;
在向目标播放终端发送用于指示所述第一搜索结果的第一搜索结果指示信息之后,所述方法还包括:
提取第二语音指令中的第三关键词,其中,所述第一语音指令先于所述第二语音指令被接收到,接收所述第一语音指令的时间与接收所述第二语音指令的时间之间的时间间隔小于等于预设时间间隔,所述第三关键词与所述第一集合中的任意词语匹配成功;
在所述预设数据库中搜索与所述第二关键词和所述第三关键词均对应的资源数据,得到第二搜索结果;
向所述目标播放终端发送用于指示所述第二搜索结果的第二搜索结果指示信息,其中,在所述目标播放终端接收到所述第二搜索结果指示信息后,展示所述第二搜索结果。
2.根据权利要求1所述的方法,其特征在于,在预设数据库中依次搜索与所述第一关键词、所述第二关键词均相对应的资源数据,得到第一搜索结果,包括:
在所述预设数据库中搜索与所述第一关键词对应的资源数据,得到第一资源数据;
在所述预设数据库中搜索与所述第二关键词对应的资源数据,得到第二资源数据;
将所述第一资源数据和所述第二资源数据的交集作为所述第一搜索结果。
3.根据权利要求1所述的方法,其特征在于,在预设数据库中依次搜索与所述第一关键词、所述第二关键词均相对应的资源数据,得到第一搜索结果,包括:
从所述预设数据库中搜索与所述第一关键词对应的资源数据,得到第三资源数据;
从所述第三资源数据中筛选与所述第二关键词对应的资源数据,得到第四资源数据;
将所述第四资源数据作为所述第一搜索结果。
4.根据权利要求1所述的方法,其特征在于,从所述第三语音指令中提取出第四关键词包括:
将所述第三语音指令转换为文字序列;
对所述文字序列进行分词,得到多个分词词语;
将所述多个分词词语中的每个分词词语依次与第三集合中的每个词语进行匹配,得到匹配成功的分词词语,其中,所述第三集合为预设集合;
如果有且只有一个分词词语匹配成功,则将匹配成功的分词词语作为所述第四关键词;
如果没有分词词语匹配成功或者多于一个分词词语匹配成功,则发出用于提示重新获取所述第三语音指令的提示信息。
5.一种语音处理方法,其特征在于,包括:
移动终端接收第一语音指令,其中,所述第一语音指令至少包括第一关键词和第二关键词,所述第一关键词与第一集合中的任意词语匹配成功,所述第二关键词与第二集合中的任意词语匹配成功,所述第一集合中的词语用于指示资源数据的第一属性,所述第二集合中的词语用于指示所述资源数据的第二属性,所述第二属性为所述资源数据的标签;
所述移动终端向第一服务器发送所述第一语音指令,其中,所述第一服务器根据所述第一语音指令、所述第一集合中的词语和所述第二集合中的词语,获取第一搜索结果,并向第二服务器发送用于指示所述第一搜索结果的第一搜索结果指示信息以及目标播放终端的标识信息,所述第二服务器接收所述第一搜索结果指示信息和所述目标播放终端的标识信息之后,向所述目标播放终端发送所述第一搜索结果指示信息,以使所述目标播放终端根据所述第一搜索结果指示信息将所述第一搜索结果与指示先后顺序的词语或标识进行关联显示;所述目标播放终端为电视;
所述移动终端接收第三语音指令;
所述移动终端向所述第一服务器发送所述第三语音指令,其中,所述第一服务器从所述第三语音指令中提取出第四关键词;所述第四关键词是用于指示先后顺序的词语;
从所述第一搜索结果中筛选出与所述第四关键词对应的资源数据;将筛选出的资源数据作为目标资源数据;
在所述移动终端向第一服务器发送所述第一语音指令之后,所述方法还包括:
所述移动终端接收第二语音指令,所述第二语音指令至少包括第三关键词,其中,所述第一语音指令先于所述第二语音指令被所述移动终端接收到,接收所述第一语音指令的时间与接收所述第二语音指令的时间之间的时间间隔小于等于预设时间间隔,所述第三关键词与所述第一集合中的任意词语匹配成功;
所述移动终端向所述第一服务器发送所述第二语音指令,其中,所述第一服务器根据所述第二语音指令获取第二搜索结果,并向第二服务器发送用于指示所述第二搜索结果的第二搜索结果指示信息以及目标播放终端的标识信息,所述第二服务器接收所述第二搜索结果指示信息和所述目标播放终端的标识信息之后,向所述目标播放终端发送所述第二搜索结果指示信息,以使所述目标播放终端根据所述第二搜索结果指示信息显示所述第二搜索结果。
6.根据权利要求5所述的方法,其特征在于,在所述移动终端向第一服务器发送所述第三语音指令之后,所述方法还包括:
所述第一服务器向所述第二服务器发送所述目标资源数据的指示信息和所述目标播放终端的标识信息,所述第二服务器接收所述目标资源数据的指示信息和所述目标播放终端的标识信息之后,向所述目标播放终端发送所述目标资源数据的指示信息,以使所述目标播放终端播放所述目标资源数据,所述目标资源数据是所述第一搜索结果中的一个资源数据。
7.一种语音处理装置,其特征在于,包括:
第一提取单元,用于基于第一集合中的词语和第二集合中的词语,提取第一语音指令中的多个关键词,所述多个关键词至少包括第一关键词和第二关键词,其中,所述第一关键词与第一集合中的任意词语匹配成功,所述第二关键词与第二集合中的任意词语匹配成功,所述第一集合中的词语用于指示资源数据的第一属性,所述第二集合中的词语用于指示所述资源数据的第二属性,所述第二属性为所述资源数据的标签;
第一搜索单元,用于在预设数据库中依次搜索与所述第一关键词、所述第二关键词均相对应的资源数据,得到第一搜索结果;
第一发送单元,用于向目标播放终端发送用于指示所述第一搜索结果的第一搜索结果指示信息,其中,在所述目标播放终端接收到所述第一搜索结果指示信息后,展示所述第一搜索结果;
其中,展示所述第一搜索结果,包括:将所述第一搜索结果与指示先后顺序的词语或标识进行关联显示;
所述装置还包括:
接收单元,用于在所述第一发送单元向目标播放终端发送用于指示所述第一搜索结果的第一搜索结果指示信息之后,接收第三语音指令,其中,所述第三语音指令用于指示从所述第一搜索结果中筛选待播放的资源数据;
第三提取单元,用于从所述第三语音指令中提取出第四关键词;
筛选单元,用于从所述第一搜索结果中筛选出与所述第四关键词对应的资源数据;所述第四关键词是用于指示先后顺序的词语;
确定单元,用于将筛选出的资源数据作为目标资源数据;
第三发送单元,用于向所述目标播放终端发送所述目标资源数据的指示信息,其中,在所述目标播放终端接收到所述目标资源数据的指示信息之后,播放所述目标资源数据;所述目标播放终端为电视;
第二提取单元,用于在所述第一发送单元向目标播放终端发送用于指示所述第一搜索结果的第一搜索结果指示信息之后,提取第二语音指令中的第三关键词,其中,所述第一语音指令先于所述第二语音指令被接收到,接收所述第一语音指令的时间与接收所述第二语音指令的时间之间的时间间隔小于等于预设时间间隔,所述第三关键词与所述第一集合中的任意词语匹配成功;
第二搜索单元,用于在所述预设数据库中搜索与所述第二关键词和所述第三关键词均对应的资源数据,得到第二搜索结果;
第二发送单元,用于向所述目标播放终端发送用于指示所述第二搜索结果的第二搜索结果指示信息,其中,在所述目标播放终端接收到所述第二搜索结果指示信息后,展示所述第二搜索结果。
8.根据权利要求7所述的装置,其特征在于,所述第一搜索单元包括:
第一搜索子单元,用于在所述预设数据库中搜索与所述第一关键词对应的资源数据,得到第一资源数据;
第二搜索子单元,用于在所述预设数据库中搜索与所述第二关键词对应的资源数据,得到第二资源数据;
第一确定子单元,用于将所述第一资源数据和所述第二资源数据的交集作为所述第一搜索结果。
9.根据权利要求7所述的装置,其特征在于,所述第一搜索单元包括:
第三搜索子单元,用于从所述预设数据库中搜索与所述第一关键词对应的资源数据,得到第三资源数据;
筛选子单元,用于从所述第三资源数据中筛选与所述第二关键词对应的资源数据,得到第四资源数据;
第二确定子单元,用于将所述第四资源数据作为所述第一搜索结果。
10.根据权利要求7所述的装置,其特征在于,所述第三提取单元包括:
转换子单元,用于将所述第三语音指令转换为文字序列;
分词子单元,用于对所述文字序列进行分词,得到多个分词词语;
匹配子单元,用于将所述多个分词词语中的每个分词词语依次与第三集合中的每个词语进行匹配,得到匹配成功的分词词语,其中,所述第三集合为预设集合;
第三确定子单元,用于如果有且只有一个分词词语匹配成功,则将匹配成功的分词词语作为所述第四关键词;
提示子单元,用于如果没有分词词语匹配成功或者多于一个分词词语匹配成功,则发出用于提示重新获取所述第三语音指令的提示信息。
11.一种移动终端,其特征在于,包括:
移动终端第一接收单元,用于接收第一语音指令,其中,所述第一语音指令至少包括第一关键词和第二关键词,所述第一关键词与第一集合中的任意词语匹配成功,所述第二关键词与第二集合中的任意词语匹配成功,所述第一集合中的词语用于指示资源数据的第一属性,所述第二集合中的词语用于指示所述资源数据的第二属性,所述第二属性为所述资源数据的标签;
移动终端第一发送单元,用于向第一服务器发送所述第一语音指令,其中,所述第一服务器根据所述第一语音指令、所述第一集合中的词语和所述第二集合中的词语,获取第一搜索结果,并向第二服务器发送用于指示所述第一搜索结果的第一搜索结果指示信息以及目标播放终端的标识信息,所述第二服务器接收所述第一搜索结果指示信息和所述目标播放终端的标识信息之后,向所述目标播放终端发送所述第一搜索结果指示信息,以使所述目标播放终端根据所述第一搜索结果指示信息将所述第一搜索结果与指示先后顺序的词语或标识进行关联显示;所述目标播放终端为电视;
所述移动终端还包括:
移动终端第三接收单元,用于在所述移动终端第一发送单元向第一服务器发送所述第一语音指令之后,接收第三语音指令;
移动终端第三发送单元,用于向所述第一服务器发送所述第三语音指令,其中,所述第一服务器从所述第三语音指令中提取出第四关键词;所述第四关键词是用于指示先后顺序的词语;从所述第一搜索结果中筛选出与所述第四关键词对应的资源数据;将筛选出的资源数据作为目标资源数据;
移动终端第二接收单元,用于在所述移动终端第一发送单元向第一服务器发送所述第一语音指令之后,接收第二语音指令,所述第二语音指令至少包括第三关键词,其中,所述第一语音指令先于所述第二语音指令被所述移动终端接收到,接收所述第一语音指令的时间与接收所述第二语音指令的时间之间的时间间隔小于等于预设时间间隔,所述第三关键词与所述第一集合中的任意词语匹配成功;
移动终端第二发送单元,用于向所述第一服务器发送所述第二语音指令,其中,所述第一服务器根据所述第二语音指令获取第二搜索结果,并向第二服务器发送用于指示所述第二搜索结果的第二搜索结果指示信息以及目标播放终端的标识信息,所述第二服务器接收所述第二搜索结果指示信息和所述目标播放终端的标识信息之后,向所述目标播放终端发送所述第二搜索结果指示信息,以使所述目标播放终端根据所述第二搜索结果指示信息显示所述第二搜索结果。
12.一种语音处理***,其特征在于,包括:
权利要求11所述的移动终端;
第一服务器,包括权利要求7至10任一项所述的语音处理装置,在所述语音处理装置得到所述第一搜索结果之后,所述第一服务器向第二服务器发送用于指示所述第一搜索结果的第一搜索结果指示信息和目标播放终端的标识信息;
第二服务器,用于接收所述第一搜索结果指示信息和所述目标播放终端的标识信息,并向所述目标播放终端发送所述第一搜索结果指示信息;
目标播放终端,用于接收所述第一搜索结果指示信息,并根据所述第一搜索结果指示信息显示所述第一搜索结果。
13.一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至6中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710133965.1A CN108536414B (zh) | 2017-03-06 | 2017-03-06 | 语音处理方法、装置和***、移动终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710133965.1A CN108536414B (zh) | 2017-03-06 | 2017-03-06 | 语音处理方法、装置和***、移动终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108536414A CN108536414A (zh) | 2018-09-14 |
CN108536414B true CN108536414B (zh) | 2021-10-22 |
Family
ID=63489758
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710133965.1A Active CN108536414B (zh) | 2017-03-06 | 2017-03-06 | 语音处理方法、装置和***、移动终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108536414B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109471953A (zh) * | 2018-10-11 | 2019-03-15 | 平安科技(深圳)有限公司 | 一种语音数据检索方法及终端设备 |
CN110597954A (zh) * | 2019-08-29 | 2019-12-20 | 深圳创维-Rgb电子有限公司 | 垃圾分类方法、装置、***及计算机可读存储介质 |
CN110602325B (zh) * | 2019-09-18 | 2021-07-27 | 青岛海信移动通信技术股份有限公司 | 一种终端的语音推荐方法和装置 |
CN110853621B (zh) * | 2019-10-09 | 2024-02-13 | 科大讯飞股份有限公司 | 语音顺滑方法、装置、电子设备及计算机存储介质 |
CN111147905A (zh) * | 2019-12-31 | 2020-05-12 | 深圳Tcl数字技术有限公司 | 媒体资源查找方法、电视机、存储介质及装置 |
CN110781402A (zh) * | 2020-01-02 | 2020-02-11 | 南京创维信息技术研究院有限公司 | 基于天猫精灵实现电视上的多轮深度检索***及方法 |
CN111866568B (zh) * | 2020-07-23 | 2023-03-31 | 聚好看科技股份有限公司 | 一种显示设备、服务器及基于语音的视频集锦获取方法 |
CN112562856B (zh) * | 2020-12-25 | 2022-06-14 | 北京博瑞彤芸科技股份有限公司 | 一种通过语音搜索健康知识的方法和*** |
CN112992139A (zh) * | 2021-02-07 | 2021-06-18 | 北京紫光展锐通信技术有限公司 | 设备控制方法、装置和设备 |
CN113177117B (zh) * | 2021-03-18 | 2022-03-08 | 深圳市北科瑞讯信息技术有限公司 | 新闻素材的采集方法及装置、存储介质、电子装置 |
CN113129891A (zh) * | 2021-04-29 | 2021-07-16 | 平顶山聚新网络科技有限公司 | 一种汽车使用指导***及方法 |
CN113781854B (zh) * | 2021-09-06 | 2023-03-28 | 浙江工商大学 | 一种用于自动远程教学的小组讨论方法和*** |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101404035A (zh) * | 2008-11-21 | 2009-04-08 | 北京得意音通技术有限责任公司 | 一种基于文本或语音的信息搜索方法 |
CN102591932A (zh) * | 2011-12-23 | 2012-07-18 | 优视科技有限公司 | 语音搜索方法及***、移动终端、中转服务器 |
CN102833610A (zh) * | 2012-09-24 | 2012-12-19 | 北京多看科技有限公司 | 一种节目选择的方法、装置及数字电视终端 |
CN103369398A (zh) * | 2013-07-01 | 2013-10-23 | 安徽广电信息网络股份有限公司 | 一种基于电视epg信息的语音搜索方法和*** |
CN103838724A (zh) * | 2012-11-20 | 2014-06-04 | 百度在线网络技术(北京)有限公司 | 图像搜索方法及装置 |
CN104182473A (zh) * | 2014-07-29 | 2014-12-03 | 小米科技有限责任公司 | 设置选项的显示方法及装置 |
CN104618780A (zh) * | 2014-10-23 | 2015-05-13 | 腾讯科技(深圳)有限公司 | 电器设备控制方法及*** |
CN105488032A (zh) * | 2015-12-31 | 2016-04-13 | 杭州智蚁科技有限公司 | 一种语音识别输入的控制方法及*** |
CN105893351A (zh) * | 2016-03-31 | 2016-08-24 | 海信集团有限公司 | 语音识别方法及装置 |
CN105959806A (zh) * | 2016-05-25 | 2016-09-21 | 乐视控股(北京)有限公司 | 节目推荐方法及装置 |
CN106250474A (zh) * | 2016-07-29 | 2016-12-21 | Tcl集团股份有限公司 | 一种语音控制的处理方法及*** |
CN106570100A (zh) * | 2016-10-31 | 2017-04-19 | 腾讯科技(深圳)有限公司 | 信息搜索方法和装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5142769B2 (ja) * | 2008-03-11 | 2013-02-13 | 株式会社日立製作所 | 音声データ検索システム及び音声データの検索方法 |
CN104573099B (zh) * | 2015-01-29 | 2018-05-22 | 作业帮教育科技(北京)有限公司 | 题目的搜索方法及装置 |
-
2017
- 2017-03-06 CN CN201710133965.1A patent/CN108536414B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101404035A (zh) * | 2008-11-21 | 2009-04-08 | 北京得意音通技术有限责任公司 | 一种基于文本或语音的信息搜索方法 |
CN102591932A (zh) * | 2011-12-23 | 2012-07-18 | 优视科技有限公司 | 语音搜索方法及***、移动终端、中转服务器 |
CN102833610A (zh) * | 2012-09-24 | 2012-12-19 | 北京多看科技有限公司 | 一种节目选择的方法、装置及数字电视终端 |
CN103838724A (zh) * | 2012-11-20 | 2014-06-04 | 百度在线网络技术(北京)有限公司 | 图像搜索方法及装置 |
CN103369398A (zh) * | 2013-07-01 | 2013-10-23 | 安徽广电信息网络股份有限公司 | 一种基于电视epg信息的语音搜索方法和*** |
CN104182473A (zh) * | 2014-07-29 | 2014-12-03 | 小米科技有限责任公司 | 设置选项的显示方法及装置 |
CN104618780A (zh) * | 2014-10-23 | 2015-05-13 | 腾讯科技(深圳)有限公司 | 电器设备控制方法及*** |
CN105488032A (zh) * | 2015-12-31 | 2016-04-13 | 杭州智蚁科技有限公司 | 一种语音识别输入的控制方法及*** |
CN105893351A (zh) * | 2016-03-31 | 2016-08-24 | 海信集团有限公司 | 语音识别方法及装置 |
CN105959806A (zh) * | 2016-05-25 | 2016-09-21 | 乐视控股(北京)有限公司 | 节目推荐方法及装置 |
CN106250474A (zh) * | 2016-07-29 | 2016-12-21 | Tcl集团股份有限公司 | 一种语音控制的处理方法及*** |
CN106570100A (zh) * | 2016-10-31 | 2017-04-19 | 腾讯科技(深圳)有限公司 | 信息搜索方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN108536414A (zh) | 2018-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108536414B (zh) | 语音处理方法、装置和***、移动终端 | |
CN111143610B (zh) | 一种内容推荐方法、装置、电子设备和存储介质 | |
WO2021068558A1 (zh) | 一种同声字幕翻译方法、智能电视及存储介质 | |
CN105957530B (zh) | 一种语音控制方法、装置和终端设备 | |
CN109688475B (zh) | 视频播放跳转方法、***及计算机可读存储介质 | |
EP3579140A1 (en) | Method and apparatus for processing video | |
WO2018102283A1 (en) | Providing related objects during playback of video data | |
CN112015949A (zh) | 视频生成方法和装置、存储介质及电子设备 | |
CN103686344A (zh) | 增强视频***及方法 | |
CN103428525A (zh) | 网络视频和电视节目的在线查询和播放控制方法及*** | |
CN108304368B (zh) | 文本信息的类型识别方法和装置及存储介质和处理器 | |
CN111510762B (zh) | 一种电视小视频的发布方法、***及存储介质 | |
CN105893404A (zh) | 基于自然信息识别的推送***和方法及一种客户端 | |
CN105489072A (zh) | 用于确定电子设备中增补内容的方法 | |
CN107547922B (zh) | 信息处理方法、装置、***及计算机可读存储介质 | |
CN109600646B (zh) | 语音定位的方法及装置、智能电视、存储介质 | |
CN111182359A (zh) | 视频预览方法、视频抽帧方法、视频处理装置及存储介质 | |
CN105631461A (zh) | 一种图像识别***及方法 | |
CN104699676A (zh) | 基于语音识别的信息搜索方法和*** | |
CN112204942B (zh) | 一种拍照方法和终端设备 | |
CN111491209A (zh) | 视频封面确定方法、装置、电子设备和存储介质 | |
CN104980807B (zh) | 一种用于多媒体互动的方法及终端 | |
CN109727597A (zh) | 语音信息的交互辅助方法和装置 | |
CN112752134A (zh) | 视频处理方法和装置、存储介质及电子装置 | |
CN109151599B (zh) | 视频处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |