CN103839549A - 一种语音指令控制方法及*** - Google Patents

一种语音指令控制方法及*** Download PDF

Info

Publication number
CN103839549A
CN103839549A CN201210478777.XA CN201210478777A CN103839549A CN 103839549 A CN103839549 A CN 103839549A CN 201210478777 A CN201210478777 A CN 201210478777A CN 103839549 A CN103839549 A CN 103839549A
Authority
CN
China
Prior art keywords
speech
data
mobile terminal
server
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210478777.XA
Other languages
English (en)
Inventor
曾亮
陈磊
薄川川
邓朔
郝宏伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201210478777.XA priority Critical patent/CN103839549A/zh
Publication of CN103839549A publication Critical patent/CN103839549A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种语音指令控制方法及***,所述语音指令控制方法包括:将移动终端接收的语音数据打包发送到服务器;将语音数据与服务器中的训练样本进行匹配,确定合适的识别语音文本,并将识别语音文本返回移动终端;根据服务器返回的识别语音文本内容命令移动终端执行对应的操作。本发明提供的语音指令控制方法及***将移动终端接收的语音数据发送到服务器,服务器通过将语音数据与服务器中的训练样本进行匹配,确定合适的识别语音文本,使得语音识别更加准确,提高语音指令的精确度,改善用户使用体验。

Description

一种语音指令控制方法及***
【技术领域】
本发明涉及语音控制技术领域,特别涉及一种语音指令控制方法及***。
【背景技术】
Siri是iphone4S搭载的一项重要功能,用户可以直接通过语音与智能手机进行简单的交流并对手机发出指令,随着Siri中文版的发布,人们对语音等智能人机交互技术(HCI)的讨论从未终止。而Android***的 Voice Actions(语音指令)也提供了非常坚实可靠的声音识别引擎,它的高识别度令人称奇,但要求用户输入的语言具备严格的语法结构和格式,否则***将无法识别。无论iphone的Siri还是Android***的 Voice Actions,都只是基于在移动终端本地进行语音识别,但由于受使用环境或用户发音及语法结构和格式等因素的影响,移动终端会出现语音识别错误或无法识别的情况,影响用户使用体验。
故,有必要提出一种新的技术方案,以解决现有语音识别技术存在语音识别错误或无法识别的技术问题。
【发明内容】
本发明的一个目的在于提供一种语音指令控制方法及***,旨在解决现有语音识别技术存在语音识别错误或无法识别的技术问题。
为达到上述目的,本发明提供了一种语音指令控制方法,包括:
将移动终端接收的语音数据打包发送到服务器;
将语音数据与服务器中的训练样本进行匹配,确定合适的识别语音文本,并将识别语音文本返回移动终端;
根据服务器返回的识别语音文本内容命令移动终端执行对应的操作。
在上述语音指令控制方法中,在所述将移动终端接收的语音数据打包发送到服务器步骤前还包括:通过智能语音入口进入智能语音识别界面,等待用户语音输入,并判断在有效时间内是否检测到有效语音输入,如果在有效时间内没有检测到有效语音输入,结束本次语音输入;如果在有效时间内检测到有效语音输入,则接收用户语音。
在上述语音指令控制方法中,在所述接收用户语音步骤中还包括:判断是否识别到用户语音输入端点或输入超时,如果没有识别到用户语音输入端点或输入没有超时,对接收的语音数据进行编码,并继续接收下一段用户语音;如果识别到用户语音输入端点或输入超时,则停止接收语音数据,完成所有语音数据编码。
在上述语音指令控制方法中,在所述将语音数据与服务器中的训练样本进行匹配,确定合适的识别语音文本,并将识别语音文本返回移动终端步骤前还包括:云端服务器接收语音数据编码,将语音数据编码进行解码并去噪处理。
在上述语音指令控制方法中,在所述将语音数据与服务器中的训练样本进行匹配,确定合适的识别语音文本,并将识别语音文本返回移动终端步骤中还包括:根据语音文本内容附加控制指令。
在上述语音指令控制方法中,在所述根据服务器返回的识别语音文本内容命令移动终端执行对应的操作步骤前还包括:接收识别语音文本并解析控制指令,根据控制指令类型命令移动终端执行语音文本内容对应的操作,其中,所述控制指令类型包括插件应用类型、本地功能类型、热门站点类型及搜索类型。
本发明还提供了一种语音指令控制***,包括移动终端和服务器,所述移动终端包括数据发送模块和命令执行模块,所述服务器包括数据匹配模块和数据返回模块,
数据发送模块:用于将接收的语音数据打包发送到服务器;
命令执行模块:用于根据服务器返回的识别语音文本内容命令移动终端执行对应的操作;
数据匹配模块:用于将移动终端发送的语音数据与服务器中的训练样本进行匹配,确定合适的识别语音文本;
数据返回模块:用于将识别语音文本返回移动终端。
在上述语音指令控制***中,所述移动终端还包括
界面进入模块:用于通过智能语音入口进入智能语音识别界面;
语音检测模块:用于等待用户语音输入,并判断在有效时间内是否检测到有效语音输入,如果在有效时间内没有检测到有效语音输入,则结束本次语音输入;如果在有效时间内检测到有效语音输入,则通过语音接收模块接收语音数据。
在上述语音指令控制***中,所述移动终端还包括
语音接收模块:用于接收用户语音,并判断是否识别到用户语音输入端点或输入超时,如果没有识别到用户语音输入端点或输入没有超时,则通过数据编码模块对接收的语音数据进行编码,同时语音接收模块继续接收下一段用户语音;如果识别到用户语音输入端点或输入超时,则停止接收语音数据,并通过数据编码模块完成所有语音数据编码;
数据编码模块:用于对接收的所有语音数据进行编码,并通过数据发送模块发送语音数据编码。
在上述语音指令控制***中,所述服务器还包括数据接收模块:用于接收移动终端发送的语音数据编码,将语音数据编码进行解码并去噪处理。
在上述语音指令控制***中,所述数据匹配模块还用于在确定合适的识别语音文本后根据语音文本内容附加控制指令。
在上述语音指令控制***中,所述移动终端还包括数据解析模块:用于接收服务器返回的识别语音文本并解析控制指令,所述命令执行模块根据控制指令类型命令移动终端执行语音文本内容对应的操作。
在上述语音指令控制***中,所述控制指令类型包括插件应用类型、本地功能类型、热门站点类型及搜索类型。
本发明提供的语音指令控制方法及***将移动终端接收的语音数据发送到服务器,服务器通过将语音数据与服务器中的训练样本进行匹配,确定合适的识别语音文本,使得语音识别更加准确,提高语音指令的精确度,可大大避免移动终端语音识别错误或无法识别的情况,改善用户使用体验;另外,本发明通过识别语音文本内容附加控制指令对移动终端的操作功能进行分类,提高语音指令的精确度。
为让本发明的上述内容能更明显易懂,下文特举优选实施例,并配合所附图式,作详细说明如下:
【附图说明】
图1为本发明第一实施例的语音指令控制方法的流程图;
图2为本发明第二实施例的语音指令控制方法的流程图;
图3为本发明第一实施例的语音指令控制***的结构示意图;
图4为本发明第二实施例的语音指令控制***的结构示意图。
【具体实施方式】
以下各实施例的说明是参考附加的图式,用以例示本发明可用以实施的特定实施例。
请参考图1,为本发明第一实施例的语音指令控制方法的流程图。本发明第一实施例的语音指令控制方法包括下列步骤:
步骤S100:将移动终端接收的语音数据打包发送到服务器;
步骤S110:将语音数据与服务器中的训练样本进行匹配,确定合适的识别语音文本,并将识别语音文本返回移动终端;
在步骤S110中,本发明通过将用户输入的语音数据上传到服务器与服务器中的训练样本进行匹配,使得语音识别更加准确,可大大避免移动终端语音识别错误或无法识别的情况;
步骤S120:根据服务器返回的识别语音文本内容命令移动终端执行对应的操作。
请参考图2,为本发明第二实施例的语音指令控制方法的流程图。本发明第二实施例的语音指令控制方法包括下列步骤:
步骤S200:通过智能语音入口进入智能语音识别界面;
在步骤S200中,用户可通过点击智能语音快速链接图标或长按toolbar(工具条)一定时间等方式弹出智能语音识别界面,具体请一并参阅图3,是本发明移动终端智能语音识别界面效果图。在本发明实施例中,长按toolbar的时间为大于0.5s,具体可根据不同需求进行设置。
步骤S210:等待用户语音输入,并判断在有效时间内是否检测到有效语音输入,如果在有效时间内没有检测到有效语音输入,执行步骤220;如果在有效时间内检测到有效语音输入,执行步骤230;
在步骤210中,有效时间是指语音输入的等待时间,可根据不同需求进行设置,在本发明实施例中的有效时间设置为5s;如果用户在有效时间内输入语音,则为有效语音输入,反之,如果语音输入等待超时,则结束本次输入。
步骤S220:结束本次语音输入;
步骤S230:接收用户语音,并判断是否识别到用户语音输入端点或输入超时,如果没有识别到用户语音输入端点或输入没有超时,执行步骤S240;如果识别到用户语音输入端点或输入超时,执行步骤250;
在步骤S230中,识别到用户语音输入端点是指用户输入一个完整的词语或句子后的停顿时间满足端点识别条件,端点识别条件可根据不同情况进行设定,例如5s、10s等;如果识别到用户语音输入端点或输入超时,则默认为本次语音输入完毕,反之,用户可以继续进行语音输入。
步骤S240:对接收的语音数据进行编码,并重新执行步骤S230继续接收下一段用户语音;
步骤S250:停止接收语音数据,完成所有语音数据编码;
步骤S260:将编码后的所有语音数据打包并通过HTTP请求发送到服务器;
步骤S270:云端服务器接收语音数据编码,将语音数据编码进行解码并去噪处理;
步骤S280:将解码后的语音数据与服务器中的训练样本进行匹配,确定合适的识别语音文本,根据语音文本内容附加控制指令;
在步骤S280中,本发明通过将用户输入的语音数据上传到服务器与服务器中的训练样本进行匹配,使得语音识别更加准确,可大大避免移动终端语音识别错误或无法识别的情况;控制指令即云端服务器在确定识别语音文本的同时,根据语音文本的具体内容,将其映射到客户端支持的常用操作上的指令,用户端会根据语音文本的控制指令类型命令移动终端进行对应的操作,例如,播放音乐、发送短信、打电话、打开网页等等,会有一点误识别的情况,但是随着大量用户的使用结果不断修正,该指令也会趋于精确。
步骤S290:将语音文本及控制指令返回移动终端;
步骤S300:接收语音文本并解析控制指令,根据控制指令类型命令移动终端执行语音文本内容对应的操作;
在步骤S300中,控制指令类型包括插件应用类型、本地功能类型、热门站点类型及搜索类型等,其中,如果控制指令类型为插件应用类型,则根据语音文本内容打开对应的应用,如“音乐插件”、“二维码”等;如果控制指令类型为本地功能类型,则根据语音文本内容调用对应的本地功能,如 “打开书签”、“清空所有数据” 等;如果控制指令类型为热门站点类型,则根据语音文本内容打开对应的网页,如 “腾讯主页”、“新浪网”;不属于上述三种类型的其他语音文本,本发明均认为是搜索类型,直接使用移动终端当前搜索引擎搜索语音文本对应的结果;具体关键数据结构为
typedef enum {
VoiceControlCmdUnkonwn = 0x0,
VoiceControlCmdSerach,
VoiceControlCmdPlugin,
VoiceControlCmdLocalApp,
VoiceControlCmdWebSite
} VoiceControlCmd; //语音控制类型
typedef struct {
char *text;// 语音识别文本
VoiceControlCmd controlCmd;// 控制类型
请参考图3,为本发明第一实施例的语音指令控制***的结构示意图。本发明第一实施例的语音指令控制***包括移动终端和服务器,移动终端包括数据发送模块和命令执行模块,服务器包括数据匹配模块和数据返回模块,其中
数据发送模块:用于将接收的语音数据打包发送到服务器;
命令执行模块:用于根据服务器返回的识别语音文本内容命令移动终端执行对应的操作;
数据匹配模块:用于将移动终端发送的语音数据与服务器中的训练样本进行匹配,确定合适的识别语音文本;其中,本发明通过将用户输入的语音数据上传到服务器与服务器中的训练样本进行匹配,使得语音识别更加准确,可大大避免移动终端语音识别错误或无法识别的情况;
数据返回模块:用于将识别语音文本返回移动终端;
请参考图4,为本发明第二实施例的语音指令控制***的结构示意图。本发明第二实施例的语音指令控制***包括移动终端和服务器,移动终端包括界面进入模块、语音检测模块、语音接收模块、数据编码模块、数据发送模块、数据解析模块和命令执行模块,服务器包括数据接收模块、数据匹配模块和数据返回模块,其中
界面进入模块:用于通过智能语音入口进入智能语音识别界面;其中,用户可通过点击智能语音快速链接图标或长按toolbar(工具条)一定时间等方式弹出智能语音识别界面,具体请一并参阅图3,是本发明移动终端智能语音识别界面效果图。在本发明实施例中,长按toolbar的时间为大于0.5s,具体可根据不同需求进行设置。
语音检测模块:用于等待用户语音输入,并判断在有效时间内是否检测到有效语音输入,如果在有效时间内没有检测到有效语音输入,则结束本次语音输入;如果在有效时间内检测到有效语音输入,则通过语音接收模块接收语音数据;其中,有效时间是指语音输入的等待时间,可根据不同需求进行设置,在本发明实施例中的有效时间设置为5s;如果用户在有效时间内输入语音,则为有效语音输入,反之,如果语音输入等待超时,则结束本次输入。
语音接收模块:用于接收用户语音,并判断是否识别到用户语音输入端点或输入超时,如果没有识别到用户语音输入端点或输入没有超时,则通过数据编码模块对接收的语音数据进行编码,同时语音接收模块继续接收下一段用户语音;如果识别到用户语音输入端点或输入超时,则停止接收语音数据,并通过数据编码模块完成所有语音数据编码;其中,识别到用户语音输入端点是指用户输入一个完整的词语或句子后的停顿时间满足端点识别条件,端点识别条件可根据不同情况进行设定,例如5s、10s等;如果识别到用户语音输入端点或输入超时,则默认为本次语音输入完毕,反之,用户可以继续进行语音输入。
数据编码模块:用于对接收的所有语音数据进行编码,并通过数据发送模块发送语音数据编码;
数据发送模块:用于将编码后的所有语音数据打包并通过HTTP请求发送到服务器;
数据解析模块:用于接收服务器返回的识别语音文本并解析控制指令;
命令执行模块:用于根据控制指令类型命令移动终端执行语音文本内容对应的操作;其中,控制指令类型包括插件应用类型、本地功能类型、热门站点类型及搜索类型等,其中,如果控制指令类型为插件应用类型,则根据语音文本内容打开对应的应用,如“音乐插件”、“二维码”等;如果控制指令类型为本地功能类型,则根据语音文本内容调用对应的本地功能,如 “打开书签”、“清空所有数据” 等;如果控制指令类型为热门站点类型,则根据语音文本内容打开对应的网页,如 “腾讯主页”、“新浪网”;不属于上述三种类型的其他语音文本,本发明均认为是搜索类型,直接使用移动终端当前搜索引擎搜索语音文本对应的结果;具体关键数据结构为
typedef enum {
VoiceControlCmdUnkonwn = 0x0,
VoiceControlCmdSerach,
VoiceControlCmdPlugin,
VoiceControlCmdLocalApp,
VoiceControlCmdWebSite
} VoiceControlCmd; //语音控制类型
typedef struct {
char *text;// 语音识别文本
VoiceControlCmd controlCmd;// 控制类型
数据接收模块:用于接收移动终端发送的语音数据编码,将语音数据编码进行解码并去噪处理;
数据匹配模块:用于将解码后的语音数据与服务器中的训练样本结果进行匹配,确定合适的识别语音文本,根据语音文本内容附加控制指令;其中,本发明通过将用户输入的语音数据上传到服务器与服务器中的训练样本进行匹配,使得语音识别更加准确,可大大避免移动终端语音识别错误或无法识别的情况;控制指令即云端服务器在确定识别语音文本的同时,根据语音文本的具体内容,将其映射到客户端支持的常用操作上的指令,用户端会根据语音文本的控制指令类型命令移动终端进行对应的操作,例如,播放音乐、发送短信、打电话、打开网页等等,会有一点误识别的情况,但是随着大量用户的使用结果不断修正,该指令也会趋于精确。
数据返回模块:用于将语音文本及控制指令返回移动终端;
本发明提供的语音指令控制方法及***将移动终端接收的语音数据发送到服务器,服务器通过将语音数据与服务器中的训练样本进行匹配,确定合适的识别语音文本后再返回移动终端执行对应的操作,使得语音识别更加准确,可大大避免移动终端语音识别错误或无法识别的情况,改善用户使用体验;另外,本发明通过识别语音文本内容附加控制指令对移动终端的操作功能进行分类,提高语音指令的精确度。
综上所述,虽然本发明已以优选实施例揭露如上,但上述优选实施例并非用以限制本发明,本领域的普通技术人员,在不脱离本发明的精神和范围内,均可作各种更动与润饰,因此本发明的保护范围以权利要求界定的范围为准。

Claims (13)

1.一种语音指令控制方法,包括:
将移动终端接收的语音数据打包发送到服务器;
将语音数据与服务器中的训练样本进行匹配,确定合适的识别语音文本,并将识别语音文本返回移动终端;
根据服务器返回的识别语音文本内容命令移动终端执行对应的操作。
2.根据权利要求1所述的语音指令控制方法,其特征在于,在所述将移动终端接收的语音数据打包发送到服务器步骤前还包括:通过智能语音入口进入智能语音识别界面,等待用户语音输入,并判断在有效时间内是否检测到有效语音输入,如果在有效时间内没有检测到有效语音输入,结束本次语音输入;如果在有效时间内检测到有效语音输入,则接收用户语音。
3.根据权利要求2所述的语音指令控制方法,其特征在于,在所述接收用户语音步骤中还包括:判断是否识别到用户语音输入端点或输入超时,如果没有识别到用户语音输入端点或输入没有超时,对接收的语音数据进行编码,并继续接收下一段用户语音;如果识别到用户语音输入端点或输入超时,则停止接收语音数据,完成所有语音数据编码。
4.根据权利要求3所述的语音指令控制方法,其特征在于,在所述将语音数据与服务器中的训练样本进行匹配,确定合适的识别语音文本,并将识别语音文本返回移动终端步骤前还包括:云端服务器接收语音数据编码,将语音数据编码进行解码并去噪处理。
5.根据权利要求1所述的语音指令控制方法,其特征在于,在所述将语音数据与服务器中的训练样本进行匹配,确定合适的识别语音文本,并将识别语音文本返回移动终端步骤中还包括:根据语音文本内容附加控制指令。
6.根据权利要求1或5所述的语音指令控制方法,其特征在于,在所述根据服务器返回的识别语音文本内容命令移动终端执行对应的操作步骤前还包括:接收识别语音文本并解析控制指令,根据控制指令类型命令移动终端执行语音文本内容对应的操作,其中,所述控制指令类型包括插件应用类型、本地功能类型、热门站点类型及搜索类型。
7.一种语音指令控制***,其特征在于,包括移动终端和服务器,所述移动终端包括数据发送模块和命令执行模块,所述服务器包括数据匹配模块和数据返回模块,
数据发送模块:用于将接收的语音数据打包发送到服务器;
命令执行模块:用于根据服务器返回的识别语音文本内容命令移动终端执行对应的操作;
数据匹配模块:用于将移动终端发送的语音数据与服务器中的训练样本进行匹配,确定合适的识别语音文本;
数据返回模块:用于将识别语音文本返回移动终端。
8.根据权利要求7所述的语音指令控制***,其特征在于,所述移动终端还包括
界面进入模块:用于通过智能语音入口进入智能语音识别界面;
语音检测模块:用于等待用户语音输入,并判断在有效时间内是否检测到有效语音输入,如果在有效时间内没有检测到有效语音输入,则结束本次语音输入;如果在有效时间内检测到有效语音输入,则通过语音接收模块接收语音数据。
9.根据权利要求8所述的语音指令控制***,其特征在于,所述移动终端还包括
语音接收模块:用于接收用户语音,并判断是否识别到用户语音输入端点或输入超时,如果没有识别到用户语音输入端点或输入没有超时,则通过数据编码模块对接收的语音数据进行编码,同时语音接收模块继续接收下一段用户语音;如果识别到用户语音输入端点或输入超时,则停止接收语音数据,并通过数据编码模块完成所有语音数据编码;
数据编码模块:用于对接收的所有语音数据进行编码,并通过数据发送模块发送语音数据编码。
10.根据权利要求9所述的语音指令控制***,其特征在于,所述服务器还包括数据接收模块:用于接收移动终端发送的语音数据编码,将语音数据编码进行解码并去噪处理。
11.根据权利要求7所述的语音指令控制***,其特征在于,所述数据匹配模块还用于在确定合适的识别语音文本后根据语音文本内容附加控制指令。
12.根据权利要求7或11所述的语音指令控制***,其特征在于,所述移动终端还包括数据解析模块:用于接收服务器返回的识别语音文本并解析控制指令,所述命令执行模块根据控制指令类型命令移动终端执行语音文本内容对应的操作。
13.根据权利要求12所述的语音指令控制***,其特征在于,所述控制指令类型包括插件应用类型、本地功能类型、热门站点类型及搜索类型。
CN201210478777.XA 2012-11-22 2012-11-22 一种语音指令控制方法及*** Pending CN103839549A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210478777.XA CN103839549A (zh) 2012-11-22 2012-11-22 一种语音指令控制方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210478777.XA CN103839549A (zh) 2012-11-22 2012-11-22 一种语音指令控制方法及***

Publications (1)

Publication Number Publication Date
CN103839549A true CN103839549A (zh) 2014-06-04

Family

ID=50802981

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210478777.XA Pending CN103839549A (zh) 2012-11-22 2012-11-22 一种语音指令控制方法及***

Country Status (1)

Country Link
CN (1) CN103839549A (zh)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104183237A (zh) * 2014-09-04 2014-12-03 百度在线网络技术(北京)有限公司 用于便携式终端的语音处理方法及装置
CN104268195A (zh) * 2014-09-19 2015-01-07 三星电子(中国)研发中心 终端中的本地资源的处理方法和装置
CN105094807A (zh) * 2015-06-25 2015-11-25 三星电子(中国)研发中心 一种实现语音控制的方法及装置
CN105609118A (zh) * 2015-12-30 2016-05-25 生迪智慧科技有限公司 语音检测方法及装置
CN105788594A (zh) * 2016-03-01 2016-07-20 江西掌中无限网络科技股份有限公司 免流量app的语音语义识别的方法及***
WO2016112634A1 (zh) * 2015-01-12 2016-07-21 芋头科技(杭州)有限公司 一种机器人***的声音识别***及方法
CN105827878A (zh) * 2015-01-04 2016-08-03 ***通信集团公司 语音信息转换方法及语音转换网关
CN106504753A (zh) * 2015-09-07 2017-03-15 上海隆通网络***有限公司 一种在it运维管理***中的语音识别方法及***
CN106847284A (zh) * 2017-03-09 2017-06-13 深圳市八圈科技有限公司 电子设备、计算机可读存储介质及语音交互方法
CN107086037A (zh) * 2017-03-17 2017-08-22 上海庆科信息技术有限公司 一种嵌入式设备的语音交互方法、装置及嵌入式设备
CN107146618A (zh) * 2017-06-16 2017-09-08 北京云知声信息技术有限公司 语音处理方法及装置
CN107153499A (zh) * 2016-03-04 2017-09-12 株式会社理光 交互式白板设备的语音控制
CN107919130A (zh) * 2017-11-06 2018-04-17 百度在线网络技术(北京)有限公司 基于云端的语音处理方法和装置
CN108111696A (zh) * 2017-12-29 2018-06-01 深圳市酷达通讯有限公司 一种无线座机
CN108986811A (zh) * 2018-08-31 2018-12-11 北京新能源汽车股份有限公司 一种语音识别的检测方法、装置和设备
CN109036430A (zh) * 2018-09-29 2018-12-18 芜湖星途机器人科技有限公司 语音控制终端
CN109118747A (zh) * 2017-06-23 2019-01-01 中兴通讯股份有限公司 红外设备控制方法、***、存储介质和计算机设备
CN109120774A (zh) * 2018-06-29 2019-01-01 深圳市九洲电器有限公司 终端应用语音操控方法及***
CN109474843A (zh) * 2017-09-08 2019-03-15 腾讯科技(深圳)有限公司 语音操控终端的方法、客户端、服务器
CN111225261A (zh) * 2018-11-27 2020-06-02 Lg电子株式会社 用于处理语音命令的多媒体装置及其控制方法
CN111261153A (zh) * 2018-12-03 2020-06-09 现代自动车株式会社 车辆语音命令处理装置和方法
CN111462738A (zh) * 2019-01-18 2020-07-28 阿里巴巴集团控股有限公司 语音识别方法及装置
CN112565849A (zh) * 2019-09-26 2021-03-26 深圳市茁壮网络股份有限公司 一种数字电视的语音控制方法、电视控制***及存储介质
CN112789561A (zh) * 2018-10-15 2021-05-11 美的集团股份有限公司 用于为电器定制便携式自然语言处理接口的***和方法
CN113851134A (zh) * 2021-10-20 2021-12-28 国泰君安证券股份有限公司 基于语音识别的移动设备与Web客户端智能联动的***、方法、装置、处理器及存储介质

Citations (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1356688A (zh) * 2000-11-27 2002-07-03 佳能株式会社 语音识别***、语音识别服务器、语音识别客户机及其控制方法
US20020193998A1 (en) * 2001-05-31 2002-12-19 Dvorak Joseph L. Virtual speech interface system and method of using same
CN1627672A (zh) * 2003-05-02 2005-06-15 索尼株式会社 网络***,电子设备终端,服务器装置及分配和再现方法
CN1735027A (zh) * 2004-08-13 2006-02-15 上海赢思软件技术有限公司 一种聊天机器人***
KR20060034337A (ko) * 2004-10-18 2006-04-24 주식회사 팬택 음성으로 홈네트워크를 운용하기 위한 이동통신 단말기 및홈네트워크 서버, 그리고 그들을 이용한 홈네트워크 관리시스템 및 방법
CN101030994A (zh) * 2007-04-11 2007-09-05 华为技术有限公司 语音识别方法、***、语音识别服务器
CN101360118A (zh) * 2007-08-02 2009-02-04 广东新支点技术服务有限公司 一种适合移动终端多媒体文件共享与搜索的方法和协议
CN101420543A (zh) * 2008-12-05 2009-04-29 天津三星电子显示器有限公司 一种语音控制电视机的方法及其电视机
CN101437039A (zh) * 2007-11-15 2009-05-20 华为技术有限公司 一种移动搜索的方法、***和设备
CN101599270A (zh) * 2008-06-02 2009-12-09 海尔集团公司 语音服务器及语音控制的方法
US20100088100A1 (en) * 2008-10-02 2010-04-08 Lindahl Aram M Electronic devices with voice command and contextual data processing capabilities
CN101715018A (zh) * 2009-11-03 2010-05-26 沈阳晨讯希姆通科技有限公司 手机功能的语音控制方法
CN102270213A (zh) * 2011-04-20 2011-12-07 深圳市凯立德科技股份有限公司 一种导航***兴趣点的搜索方法、装置及位置服务终端
CN102316162A (zh) * 2011-09-01 2012-01-11 深圳市子栋科技有限公司 基于语音命令的车辆远程控制方法、装置及***
CN102316361A (zh) * 2011-07-04 2012-01-11 深圳市子栋科技有限公司 基于自然语音识别的音频/视频点播方法和***
US20120030712A1 (en) * 2010-08-02 2012-02-02 At&T Intellectual Property I, L.P. Network-integrated remote control with voice activation
CN102497391A (zh) * 2011-11-21 2012-06-13 宇龙计算机通信科技(深圳)有限公司 服务器、移动终端和提示方法
CN102497481A (zh) * 2011-12-02 2012-06-13 深圳市车音网科技有限公司 语音拨号方法、装置及***
CN102541574A (zh) * 2010-12-13 2012-07-04 鸿富锦精密工业(深圳)有限公司 应用程序开启***及方法
CN102541505A (zh) * 2011-01-04 2012-07-04 ***通信集团公司 语音输入方法及其***
CN102571882A (zh) * 2010-12-31 2012-07-11 上海博泰悦臻电子设备制造有限公司 基于网络的语音提醒的方法和***
CN102591932A (zh) * 2011-12-23 2012-07-18 优视科技有限公司 语音搜索方法及***、移动终端、中转服务器
CN102629246A (zh) * 2012-02-10 2012-08-08 北京百纳信息技术有限公司 识别浏览器语音命令的服务器及浏览器语音命令识别方法
CN102650960A (zh) * 2012-03-31 2012-08-29 奇智软件(北京)有限公司 一种消除终端设备故障的方法及装置
CN102724309A (zh) * 2012-06-14 2012-10-10 广东好帮手电子科技股份有限公司 一种车载语音网络音乐***及其控制方法
CN102741146A (zh) * 2010-02-23 2012-10-17 三菱电机株式会社 电梯装置
CN102760431A (zh) * 2012-07-12 2012-10-31 上海语联信息技术有限公司 智能化的语音识别***
CN102792320A (zh) * 2010-01-18 2012-11-21 苹果公司 智能自动化助理

Patent Citations (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1356688A (zh) * 2000-11-27 2002-07-03 佳能株式会社 语音识别***、语音识别服务器、语音识别客户机及其控制方法
US20020193998A1 (en) * 2001-05-31 2002-12-19 Dvorak Joseph L. Virtual speech interface system and method of using same
CN1627672A (zh) * 2003-05-02 2005-06-15 索尼株式会社 网络***,电子设备终端,服务器装置及分配和再现方法
CN1735027A (zh) * 2004-08-13 2006-02-15 上海赢思软件技术有限公司 一种聊天机器人***
KR20060034337A (ko) * 2004-10-18 2006-04-24 주식회사 팬택 음성으로 홈네트워크를 운용하기 위한 이동통신 단말기 및홈네트워크 서버, 그리고 그들을 이용한 홈네트워크 관리시스템 및 방법
CN101030994A (zh) * 2007-04-11 2007-09-05 华为技术有限公司 语音识别方法、***、语音识别服务器
CN101360118A (zh) * 2007-08-02 2009-02-04 广东新支点技术服务有限公司 一种适合移动终端多媒体文件共享与搜索的方法和协议
CN101437039A (zh) * 2007-11-15 2009-05-20 华为技术有限公司 一种移动搜索的方法、***和设备
CN101599270A (zh) * 2008-06-02 2009-12-09 海尔集团公司 语音服务器及语音控制的方法
US20100088100A1 (en) * 2008-10-02 2010-04-08 Lindahl Aram M Electronic devices with voice command and contextual data processing capabilities
CN101420543A (zh) * 2008-12-05 2009-04-29 天津三星电子显示器有限公司 一种语音控制电视机的方法及其电视机
CN101715018A (zh) * 2009-11-03 2010-05-26 沈阳晨讯希姆通科技有限公司 手机功能的语音控制方法
CN102792320A (zh) * 2010-01-18 2012-11-21 苹果公司 智能自动化助理
CN102741146A (zh) * 2010-02-23 2012-10-17 三菱电机株式会社 电梯装置
US20120030712A1 (en) * 2010-08-02 2012-02-02 At&T Intellectual Property I, L.P. Network-integrated remote control with voice activation
CN102541574A (zh) * 2010-12-13 2012-07-04 鸿富锦精密工业(深圳)有限公司 应用程序开启***及方法
CN102571882A (zh) * 2010-12-31 2012-07-11 上海博泰悦臻电子设备制造有限公司 基于网络的语音提醒的方法和***
CN102541505A (zh) * 2011-01-04 2012-07-04 ***通信集团公司 语音输入方法及其***
CN102270213A (zh) * 2011-04-20 2011-12-07 深圳市凯立德科技股份有限公司 一种导航***兴趣点的搜索方法、装置及位置服务终端
CN102316361A (zh) * 2011-07-04 2012-01-11 深圳市子栋科技有限公司 基于自然语音识别的音频/视频点播方法和***
CN102316162A (zh) * 2011-09-01 2012-01-11 深圳市子栋科技有限公司 基于语音命令的车辆远程控制方法、装置及***
CN102497391A (zh) * 2011-11-21 2012-06-13 宇龙计算机通信科技(深圳)有限公司 服务器、移动终端和提示方法
CN102497481A (zh) * 2011-12-02 2012-06-13 深圳市车音网科技有限公司 语音拨号方法、装置及***
CN102591932A (zh) * 2011-12-23 2012-07-18 优视科技有限公司 语音搜索方法及***、移动终端、中转服务器
CN102629246A (zh) * 2012-02-10 2012-08-08 北京百纳信息技术有限公司 识别浏览器语音命令的服务器及浏览器语音命令识别方法
CN102650960A (zh) * 2012-03-31 2012-08-29 奇智软件(北京)有限公司 一种消除终端设备故障的方法及装置
CN102724309A (zh) * 2012-06-14 2012-10-10 广东好帮手电子科技股份有限公司 一种车载语音网络音乐***及其控制方法
CN102760431A (zh) * 2012-07-12 2012-10-31 上海语联信息技术有限公司 智能化的语音识别***

Cited By (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104183237B (zh) * 2014-09-04 2017-10-31 百度在线网络技术(北京)有限公司 用于便携式终端的语音处理方法及装置
CN104183237A (zh) * 2014-09-04 2014-12-03 百度在线网络技术(北京)有限公司 用于便携式终端的语音处理方法及装置
CN104268195A (zh) * 2014-09-19 2015-01-07 三星电子(中国)研发中心 终端中的本地资源的处理方法和装置
CN105827878A (zh) * 2015-01-04 2016-08-03 ***通信集团公司 语音信息转换方法及语音转换网关
CN105827878B (zh) * 2015-01-04 2019-06-25 ***通信集团公司 语音信息转换方法及语音转换网关
JP2018507434A (ja) * 2015-01-12 2018-03-15 ユウトウ・テクノロジー(ハンジョウ)・カンパニー・リミテッド ロボットシステムの音声識別システム及び方法
WO2016112634A1 (zh) * 2015-01-12 2016-07-21 芋头科技(杭州)有限公司 一种机器人***的声音识别***及方法
CN105845135A (zh) * 2015-01-12 2016-08-10 芋头科技(杭州)有限公司 一种机器人***的声音识别***及方法
CN105094807A (zh) * 2015-06-25 2015-11-25 三星电子(中国)研发中心 一种实现语音控制的方法及装置
CN106504753A (zh) * 2015-09-07 2017-03-15 上海隆通网络***有限公司 一种在it运维管理***中的语音识别方法及***
CN105609118B (zh) * 2015-12-30 2020-02-07 生迪智慧科技有限公司 语音检测方法及装置
CN105609118A (zh) * 2015-12-30 2016-05-25 生迪智慧科技有限公司 语音检测方法及装置
CN105788594A (zh) * 2016-03-01 2016-07-20 江西掌中无限网络科技股份有限公司 免流量app的语音语义识别的方法及***
CN107153499A (zh) * 2016-03-04 2017-09-12 株式会社理光 交互式白板设备的语音控制
CN106847284A (zh) * 2017-03-09 2017-06-13 深圳市八圈科技有限公司 电子设备、计算机可读存储介质及语音交互方法
CN107086037A (zh) * 2017-03-17 2017-08-22 上海庆科信息技术有限公司 一种嵌入式设备的语音交互方法、装置及嵌入式设备
CN107146618A (zh) * 2017-06-16 2017-09-08 北京云知声信息技术有限公司 语音处理方法及装置
CN109118747A (zh) * 2017-06-23 2019-01-01 中兴通讯股份有限公司 红外设备控制方法、***、存储介质和计算机设备
CN109474843A (zh) * 2017-09-08 2019-03-15 腾讯科技(深圳)有限公司 语音操控终端的方法、客户端、服务器
CN107919130A (zh) * 2017-11-06 2018-04-17 百度在线网络技术(北京)有限公司 基于云端的语音处理方法和装置
US11024332B2 (en) 2017-11-06 2021-06-01 Baidu Online Network Technology (Beijing) Co., Ltd. Cloud-based speech processing method and apparatus
CN107919130B (zh) * 2017-11-06 2021-12-17 百度在线网络技术(北京)有限公司 基于云端的语音处理方法和装置
CN108111696A (zh) * 2017-12-29 2018-06-01 深圳市酷达通讯有限公司 一种无线座机
CN109120774A (zh) * 2018-06-29 2019-01-01 深圳市九洲电器有限公司 终端应用语音操控方法及***
CN108986811A (zh) * 2018-08-31 2018-12-11 北京新能源汽车股份有限公司 一种语音识别的检测方法、装置和设备
CN109036430A (zh) * 2018-09-29 2018-12-18 芜湖星途机器人科技有限公司 语音控制终端
CN112789561A (zh) * 2018-10-15 2021-05-11 美的集团股份有限公司 用于为电器定制便携式自然语言处理接口的***和方法
CN112789561B (zh) * 2018-10-15 2022-04-05 美的集团股份有限公司 用于为电器定制便携式自然语言处理接口的***和方法
CN111225261B (zh) * 2018-11-27 2021-11-26 Lg电子株式会社 用于处理语音命令的多媒体装置及其控制方法
CN111225261A (zh) * 2018-11-27 2020-06-02 Lg电子株式会社 用于处理语音命令的多媒体装置及其控制方法
CN111261153A (zh) * 2018-12-03 2020-06-09 现代自动车株式会社 车辆语音命令处理装置和方法
CN111261153B (zh) * 2018-12-03 2023-12-19 现代自动车株式会社 车辆语音命令处理装置和方法
CN111462738A (zh) * 2019-01-18 2020-07-28 阿里巴巴集团控股有限公司 语音识别方法及装置
CN111462738B (zh) * 2019-01-18 2024-05-03 阿里巴巴集团控股有限公司 语音识别方法及装置
CN112565849A (zh) * 2019-09-26 2021-03-26 深圳市茁壮网络股份有限公司 一种数字电视的语音控制方法、电视控制***及存储介质
CN113851134A (zh) * 2021-10-20 2021-12-28 国泰君安证券股份有限公司 基于语音识别的移动设备与Web客户端智能联动的***、方法、装置、处理器及存储介质

Similar Documents

Publication Publication Date Title
CN103839549A (zh) 一种语音指令控制方法及***
KR102046486B1 (ko) 정보 입력 방법
US20140379334A1 (en) Natural language understanding automatic speech recognition post processing
CN108710704B (zh) 对话状态的确定方法、装置、电子设备及存储介质
CN101221576B (zh) 一种能够实现自动翻译的输入方法及装置
KR20190021338A (ko) 후속 음성 쿼리 예측
WO2020024620A1 (zh) 语音信息的处理方法以及装置、设备和存储介质
CN106372054B (zh) 一种多语言语义解析的方法和装置
CN111402861A (zh) 一种语音识别方法、装置、设备及存储介质
CN112286485B (zh) 通过语音控制应用的方法、装置、电子设备与存储介质
CN104575499B (zh) 移动终端的声控方法及移动终端
CN109785829B (zh) 一种基于语音控制的客服辅助方法和***
RU2011130550A (ru) Основанные на языке разметки выбор и использование распознавателей для обработки произнесения
CN109559748A (zh) 一种语义识别方法、装置、智能设备及存储介质
CN105512182A (zh) 语音控制方法及智能电视
CN110991179A (zh) 基于电力专业术语的语义分析方法
CN112669842A (zh) 人机对话控制方法、装置、计算机设备及存储介质
CN103514882A (zh) 一种语音识别方法及***
CN110808031A (zh) 一种语音识别方法、装置和计算机设备
CN111933149A (zh) 语音交互方法、穿戴式设备、终端及语音交互***
CN110956958A (zh) 搜索方法、装置、终端设备及存储介质
CN114299955B (zh) 语音交互的方法、装置、电子设备及存储介质
CN112035648B (zh) 一种用户数据的处理方法、装置及电子设备
CN112002325B (zh) 多语种语音交互方法和装置
CN114781359A (zh) 文本纠错方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140604