CN104516709A - 基于软件运行场景及语音助手的语音辅助方法及*** - Google Patents

基于软件运行场景及语音助手的语音辅助方法及*** Download PDF

Info

Publication number
CN104516709A
CN104516709A CN201410634118.XA CN201410634118A CN104516709A CN 104516709 A CN104516709 A CN 104516709A CN 201410634118 A CN201410634118 A CN 201410634118A CN 104516709 A CN104516709 A CN 104516709A
Authority
CN
China
Prior art keywords
information
software
voice
scene
voice assistant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410634118.XA
Other languages
English (en)
Other versions
CN104516709B (zh
Inventor
黄海兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Technological University Xunfei Hebei Technology Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN201410634118.XA priority Critical patent/CN104516709B/zh
Publication of CN104516709A publication Critical patent/CN104516709A/zh
Application granted granted Critical
Publication of CN104516709B publication Critical patent/CN104516709B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephonic Communication Services (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及基于软件运行场景及语音助手的语音辅助方法及***,所述软件与所述语音助手独立运行,所述语音助手获取所述软件运行的场景信息,所述语音助手将语音识别转换结果与获取的场景信息进行匹配,然后对于匹配的场景信息,根据场景元素信息和场景状态信息和语音信息,由软件进行操作执行。本发明基于软件运行场景及语音助手的语音辅助方法及***,根据软件的实时场景信息进行对其进行操作和使用,使语音软件真正迈向智能化,同时,与软件分开独立运行,可以一个语音助手与多个软件配合使用,大大节约***资源。另外,方便对语音引擎进行更新和创新,促进语音技术在智能化方面的发展。

Description

基于软件运行场景及语音助手的语音辅助方法及***
技术领域
 本发明涉及一种语音交互辅助方法及***,尤其涉及一种基于软件运行场景及语音助手的语音辅助方法及***。
背景技术
尽管智能手机、网络等新兴科技大大改变了人们的生产和生活,但在生产生活中,软件使用具有不可取代的信息传输地位。随着科技的发展,软件技术也得到了长足的发展。随着语音技术的发展,电脑、智能终端也越来越走近人们的生活。目前在软件语音服务通常采用在软件中内嵌语音软件进行语音控制操作,多数只能进行具体操作项目进行操作,这种方法大多将软件的操作语音预先固定在所述软件中,只能根据预先固定的语音信息进行操作。而一些软件用于网络信息服务,软件运行会根据网络信息的变化而变化,由于固设的语音信息不可能随之变化,导致对于变化的信息的语音操作面临技术障碍,因此,现有内嵌操作不能针对软件的实时场景信息进行对其进行操作和使用。另外,对于在***中通常装载多个软件,则每个软件均进行复杂的语音内嵌开发才能进行使用,同时,在软件进行加载时,会占用大量的内存,特别是同时加载几个软件时,需要大量的内存资源,影响***的运行效果。随着语音识别的程度越来越高,语音引擎也越来越庞大,语音控制也越来越智能化,这需要语音引擎本身不断的更新和发展,语音内嵌显然大大限制了语音控制的发展。
发明内容
本发明解决的技术问题是:构建一种基于软件运行场景及语音助手的语音辅助方法及***,克服现有技术不能针对软件的实时场景信息进行对其进行操作和使用以及影响***的运行效果,限制语音控制在软件上的发展的技术问题。
本发明的技术方案是:提供一种基于软件运行场景及语音助手的语音辅助方法,包括软件、语音助手,所述软件与所述语音助手独立运行,语音交互辅助方法包括如下步骤:
获取场景信息:所述语音助手获取所述软件运行的场景信息,所述场景信息包括场景元素信息或场景状态信息;
输入语音:所述语音助手采集语音信息,所述语音助手对所述语音信息进行语音识别转换;
匹配执行:所述语音助手将语音识别转换结果与获取的场景信息进行匹配;若所述软件运行的场景元素信息与所述语音识别结果在相关信息上相同或相似,则所述语音助手将匹配的场景元素信息传送到所述软件,由所述软件根据所述场景元素信息执行;若所述软件运行的场景状态信息与所述语音识别结果匹配结果在相关信息上相同或相似,则所述语音助手调用预先构建的该项目信息的场景状态模板,则所述语音助手根据语音信息将相应场景状态模板的信息传送到所述软件,由所述软件根据所述场景状态模板的信息执行。
本发明的进一步技术方案是:所述软件和所述语音助手通过所述软件的预留接口建立通信连接或者所述软件和所述语音助手通过专有协议建立通信连接。
本发明的进一步技术方案是:所述软件包括多种独立运行的软件,所述语音助手与当前活动的所述软件配合工作。
本发明的进一步技术方案是:还包括网络服务器,所述语音助手将采集的场景信息上传到所述网络服务器,所述网络服务器将所述场景信息与预先存储的信息进行匹配,将匹配的信息传送到所述语音助手。
本发明的进一步技术方案是:所述相关信息上相同或相似包括在相关信息在发音、文字、文字含义、所属类型或操作信息上相同或相似,或者匹配双方各自部分信息在发音、文字、文字含义、所属类型或操作信息上相同或相似。
本发明的技术方案是:构建一种基于软件运行场景及语音助手的语音辅助***,包括软件、语音助手,所述软件与所述语音助手独立运行,所述软件包括采集场景信息的采集模块、与所述语音助手进行通信的通信模块、执行模块,所述语音助手包括获取所述软件运行的场景信息的信息获取模块、采集语音信息的语音采集模块、进行语音识别转换的语音识别模块、匹配模块、传输模块,所述信息获取模块获取所述软件运行的场景信息,所述场景信息包括场景元素信息或场景状态信息;所述语音采集模块采集语音信息,所述语音识别模块对所述语音信息进行语音识别转换;所述匹配模块将语音识别转换结果与获取的场景信息进行匹配;若所述软件运行的场景元素信息与所述语音识别结果在相关信息上相同或相似,所述传输模块将匹配的场景元素信息传送到所述软件,所述执行模块执行所述场景元素信息对应的项目;若所述软件运行的场景状态信息与所述语音识别结果在相关信息上相同或相似,所述语音助手调用预先构建的该项目信息的场景状态模板,由所述传输模块根据语音信息将相应场景状态模板的信息传送到所述软件,所述执行模块执行所述场景状态模板的信息对应的项目。
本发明的进一步技术方案是:所述软件包括多种独立运行的软件,所述语音助手与当前活动的所述软件配合工作。
本发明的进一步技术方案是:还包括网络服务器,所述语音助手将采集的场景信息上传到所述网络服务器,所述网络服务器将所述场景信息与预先存储的信息进行匹配,将匹配的信息传送到所述语音助手。
本发明的进一步技术方案是:所述软件包括第一信息输出模块或者所述语音助手包括第二信息输出模块。
本发明的技术效果是:构建一种基于软件运行场景及语音助手的语音辅助方法及***,包括软件、语音助手,所述软件与所述语音助手独立运行,所述语音助手获取所述软件运行的场景信息,所述场景信息包括场景元素信息或场景状态信息;所述语音助手采集语音信息,所述语音助手对所述语音信息进行语音识别转换;所述语音助手将语音识别转换结果与获取的场景信息进行匹配;若所述软件运行的场景元素信息与所述语音识别结果在相关信息上相同或相似,则所述语音助手将匹配的场景元素信息传送到所述软件,由所述软件根据所述场景元素信息执行;若所述软件运行的场景状态信息与所述语音识别结果匹配结果在相关信息上相同或相似,则所述语音助手调用预先构建的该项目信息的场景状态模板,则所述语音助手根据语音信息将相应场景状态模板的信息传送到所述软件,由所述软件根据所述场景状态模板的信息执行。本发明基于软件运行场景及语音助手的语音辅助方法及***,所述软件与所述语音助手独立运行,所述语音助手获取所述软件运行的场景信息,所述语音助手将语音识别转换结果与获取的场景信息进行匹配,然后对于匹配的场景信息,根据场景元素信息和场景状态信息和语音信息,由软件进行操作执行。本发明基于软件运行场景及语音助手的语音辅助方法及***,根据软件的实时场景信息进行对其进行操作和使用,使语音软件真正迈向智能化,同时,与软件分开独立运行,可以一个语音助手与多个软件配合使用,大大节约***资源。另外,方便对语音引擎进行更新和创新,促进语音技术在智能化方面的发展。
附图说明
图1为本发明的结构示意图。
图2为本发明的优选实施方式结构示意图。
具体实施方式
下面结合具体实施例,对本发明技术方案进一步说明。
如图1所示,本发明的具体实施方式是:提供一种基于软件运行场景及语音助手的语音辅助方法,包括软件1、语音助手2,所述软件1与所述语音助手2独立运行,语音交互辅助方法包括如下步骤:
获取场景信息:所述语音助手2获取所述软件1运行的场景信息,所述场景信息包括场景元素信息或场景状态信息。
具体实施过程如下:所述语音助手2获取所述软件1运行的场景信息方式包括两种方式:一种方式是所述软件1后台采集自身运行的场景信息,这种信息采集方式全面、准确、快速,为首选方式。另外一种方式是:所述语音助手2通过所述软件1的预留接口采集所述软件1运行的场景信息,这种方式要根据预留接口的功能决定采集信息的程度。针对所述软件1采集的场景信息,由所述软件1传送到所述语音助手2完成场景信息的获取。针对所述语音助手2通过所述软件1的预留接口采集所述软件1运行的场景信息,其本身即是场景信息获取的过程。所述场景信息包括场景元素信息或场景状态信息。所述场景元素信息包括运行详情界面呈现的可视信息,具体包括运行界面的文字信息、图片信息、视频信息名称等,运行详情界面的文字信息为最主要的信息。所述场景状态信息主要包括运行界面涉及的操作信息,比如:播放视频、播放音乐、操作游戏等相关运行信息。具体实施例中,根据这些信息,通常将采集的元素信息多转换为文字信息。
输入语音:所述语音助手2采集语音信息,所述语音助手2对所述语音信息进行语音识别转换。
具体实施过程如下:通过外部语音输入设备输入语音信息,所述语音助手2采集所述语音信息,然后对所述语音信息进行语音识别转换。具体实施例中,语音识别转换结果包括文字信息,也可以涉及操作信息。比如:打开快乐大本营,则语音识别转换结果涉及操作信息,也包括文字信息。
匹配执行:所述语音助手2将语音识别转换结果与获取的场景信息进行匹配;若所述软件1运行的场景元素信息与所述语音识别结果在相关信息上相同或相似,则所述语音助手2将匹配的场景元素信息传送到所述软件1,由所述软件1根据所述场景元素信息执行;若所述软件运行的场景状态信息与所述语音识别结果匹配结果在相关信息上相同或相似,则所述语音助手2调用预先构建的该项目信息的场景状态模板,则所述语音助手2根据语音信息将相应场景状态模板的信息传送到所述软件1,由所述软件1根据所述场景状态模板的信息执行。
具体实施过程如下:所述语音助手2将语音识别转换结果与获取的场景信息进行匹配,主要从各自己相关信息的发音、文字、文字含义或者操作信息进行匹配,所述场景元素信息包括场景元素信息的名称、场景元素信息所在的类型、场景元素信息所涉及的制作人员、场景元素信息涉及的内容信息中的一种或多种。所述相关信息上相同或相似包括在相关信息在发音、文字、文字含义、所属类型或操作信息上相同或相似,比如:以视频播放软件为例,当前场景元素信息为“快乐大本营”,从“快乐大本营”的发音、文字进行相同或相似匹配,也可以从其所属类型上进行匹配,如:“快乐大本营”为综艺节目,还可以从其主持人上进行信息的匹配,还可以从其所属软件台上进行信息匹配等。另一种方式是:匹配双方各自部分信息在发音、文字、文字含义、所属类型或操作信息上相同或相似。比如:当前场景元素信息为“快乐大本营”,可以取其部分信息“快乐”和“大本营”进行匹配,若语音识别结果中包括“快乐”或者“大本营”,则也可以将“快乐大本营”匹配为相关。匹配相关后,所述语音助手2将匹配的场景元素信息传送到所述软件1,由所述软件1根据所述场景元素信息执行。比如场景元素信息中有显示“快乐大本营”的节目,匹配相关后,所述语音助手2将“快乐大本营”信息传输到所述软件1,所述软件1执行该“快乐大本营”的节目,执行结果包括选择、点击等操作。
所述软件1运行的场景状态信息与所述语音识别结果匹配结果在相关信息上相同或相似,则所述语音助手2调用预先构建的该项目信息的场景状态模板,则所述语音助手2根据语音信息将相应场景状态模板的信息传送到所述软件1,由所述软件1根据所述场景状态模板的信息执行。举例如下:若当前采集的场景状态信息为“播放非诚勿扰”,则所述语音助手2调用预先构建的视频播放器模块,视频播放器模块包括“播放”、“快进”、“快退”、“音量加大”、“音量减小”、“对比度增大”、“对比度减小”等相关视频播放涉及到的操作信息,若语音识别结果的信息包括“增大音量”,从其含义理解,应为“音量加大”,则所述语音助手2将“音量加大”发送到所述软件1,然后所述软件1执行音量加大的操作。
如图1所示,本发明的优选实施方式是:所述软件1和所述语音助手2进行信息传输过程中,所述软件1和所述语音助手2通过以下两种方式建立通信连接。所述软件1和所述语音助手2通过所述软件1的预留接口建立通信连接或者所述软件1和所述语音助手2通过专有协议建立通信连接。所述语音助手2获取采集运行的场景信息包括两种方式:所述软件1向所述语音助手2传输或者所述语音助手2直接向所述软件1采集。针对所述软件1采集运行的场景信息,所述软件1与所述语音助手2建立通信连接,然后由所述软件1将采集的运行场景信息传输到所述语音助手2。所述语音助手2也可以通过所述软件1预留的接口与所述软件1建立通信连接,所述语音助手2直接向所述软件1采集获取所述软件1的运行场景信息。所述语音助手2根据所述软件1的预留接口与所述软件1建立通信连接。目前,大多数软件为一些特殊功能,均预留一些通信接口,比如:一些软件为老人看不清楚而预留进行语音朗读的接口,或者,一些软件为盲人预留的辅助操作接口等。所述语音助手2通过所述软件1的这些功能接口与所述软件1建立通信连接。所述语音助手2与所述软件1通过专有协议建立通信连接。通过构建所述语音助手2与所述软件1通信的专有协议,实现所述语音助手2与所述软件1的通信连接。
如图1所示,本发明的优选实施方式是:所述软件包括多种独立运行的软件,所述语音助手与当前活动的所述软件配合工作。具体实施过程如下:所述软件1为多种独立运行的软件,所述语音助手2与当前活动的所述软件1配合工作。若当前环境只有一个所述软件1运行,则所述语音助手2与当前的所述软件1配合工作,若当前***环境有多个所述软件1运行,则所述语音助手2通过当前***,比如安卓***,获取***环境中的当前的所述软件1,然后所述语音助手2与当前的所述软件1建立通信连接,进行相关工作。
如图2所示,本发明的优选实施方式是:还包括网络服务器3,所述语音助手2将采集的场景信息上传到所述网络服务器3,所述网络服务器3将所述场景信息与预先存储的信息进行匹配,将匹配的信息传送到所述语音助手2。若场景信息为“非诚勿扰”,所述网络服务器3预先存储有“非诚勿扰”的相关信息,比如,“非诚勿扰”的介绍信息、“非诚勿扰”的主持人相关信息,“非诚勿扰”的歌曲链接信息等信息,所述网络服务器3将“非诚勿扰”相关的这些信息传输到所述语音助手2,所述语音助手2将这些信息组织成信息列表,可以直接显示输出,供用户使用,包括查看、播放等操作;也可以传输到所述软件1,由所述软件1显示输出,供使用;还可以传输到移动终端,由移动终端显示输出,供使用。
如图1所示,本发明的具体实施方式是:构建一种基于软件运行场景及语音助手的语音辅助***,包括软件1、语音助手2,所述软件1与所述语音助手2独立运行,所述软件1包括采集场景信息的采集模块11、与所述语音助手进行通信的通信模块12、执行模块13,所述语音助手2包括获取所述软件1运行的场景信息的信息获取模块21、采集语音信息的语音采集模块22、进行语音识别转换的语音识别模块23、匹配模块24、传输模块25,所述信息获取模块21获取所述软件1运行的场景信息,所述场景信息包括场景元素信息或场景状态信息;所述语音采集模块22采集语音信息,所述语音识别模块23对所述语音信息进行语音识别转换;所述匹配模块24将语音识别转换结果与获取的场景信息进行匹配;若所述软件1运行的场景元素信息与所述语音识别结果在发音、文字、文字含义或者操作信息上相关,所述传输模块25将匹配的场景元素信息传送到所述软件1,所述执行模块13执行所述场景元素信息对应的项目;若所述软件1运行的场景状态信息与所述语音识别结果在发音、文字、文字含义或者操作信息上相关,所述语音助手2调用预先构建的该项目信息的场景状态模板,由所述传输模块25根据语音信息将相应场景状态模板的信息传送到所述软件1,所述执行模块13执行所述场景状态模板的信息对应的项目。
如图1所示,本发明的具体实施过程是:所述信息获取模块21获取所述软件1运行的场景信息方式包括两种方式:一种方式是所述软件1后台采集自身运行的场景信息,这种信息采集方式全面、准确、快速,为首选方式。另外一种方式是:所述语音助手2通过所述软件1的预留接口采集所述软件1运行的场景信息,这种方式要根据预留接口的功能决定采集信息的程度。针对所述软件1采集的场景信息,由所述软件1传送到所述语音助手2完成场景信息的获取。针对所述语音助手2通过所述软件1的预留接口采集所述软件1运行的场景信息,其本身即是场景信息获取的过程。所述场景信息包括场景元素信息或场景状态信息。所述场景元素信息包括运行详情界面呈现的可视信息,具体包括运行界面的文字信息、图片信息、视频信息名称等,运行详情界面的文字信息为最主要的信息。所述场景状态信息主要包括运行界面涉及的操作信息,比如:播放视频、播放音乐、操作游戏等相关运行信息。具体实施例中,根据这些信息,通常将采集的元素信息多转换为文字信息。
通过外部语音输入设备输入语音信息,所述语音采集模块22采集所述语音信息,然后语音识别模块23对所述语音信息进行语音识别转换。具体实施例中,语音识别转换结果包括文字信息,也可以涉及操作信息。比如:打开快乐大本营,则语音识别转换结果涉及操作信息,也包括文字信息。
所述匹配模块24将语音识别转换结果与获取的场景信息进行匹配,主要从各自己相关信息的发音、文字、文字含义或者操作信息进行匹配,所述场景元素信息包括场景元素信息的名称、场景元素信息所在的类型、场景元素信息所涉及的制作人员、场景元素信息涉及的内容信息中的一种或多种。所述相关信息上相同或相似包括在相关信息在发音、文字、文字含义、所属类型或操作信息上相同或相似,比如:当前场景元素信息为“快乐大本营”,从“快乐大本营”的发音、文字进行相同或相似匹配,也可以从其所属类型上进行匹配,如:“快乐大本营”为综艺节目,还可以从其主持人上进行信息的匹配,还可以从其所属电视台上进行信息匹配等。另一种方式是:匹配双方各自部分信息在发音、文字、文字含义、所属类型或操作信息上相同或相似。比如:当前场景元素信息为“快乐大本营”,可以取其部分信息“快乐”和“大本营”进行匹配,若语音识别结果中包括“快乐”或者“大本营”,则也可以将“快乐大本营”匹配为相关。匹配相关后,所述传输模块25将匹配的场景元素信息传送到所述软件1,由所述执行模块13执行所述场景元素信息对应的项目。比如场景元素信息中有显示“快乐大本营”的节目,匹配相关后,所述语音助手2将“快乐大本营”信息传输到所述软件1,所述执行模块13执行该“快乐大本营”的节目,执行结果包括选择、点击等操作。
所述软件1运行的场景状态信息与所述语音识别结果匹配结果在相关信息上相同或相似,则所述语音助手2调用预先构建的该项目信息的场景状态模板,则所述传输模块25根据语音信息将相应场景状态模板的信息传送到所述软件1,由所述执行模块13执行所述场景状态模板的信息对应的项目。举例如下:若当前采集的场景状态信息为“播放非诚勿扰”,则所述语音助手2调用预先构建的视频播放器模块,视频播放器模块包括“播放”、“快进”、“快退”、“音量加大”、“音量减小”、“对比度增大”、“对比度减小”等相关视频播放涉及到的操作信息,若语音识别结果的信息包括“增大音量”,从其含义理解,应为“音量加大”,则所述传输模块25将“音量加大”发送到所述软件1,然后所述执行模块13执行音量加大的操作。
如图1所示,本发明的优选实施方式是:所述软件1包括多种独立运行的软件,所述语音助手与当前活动的所述软件配合工作。具体实施过程如下:所述软件1为多种独立运行的软件,所述语音助手2与当前活动的所述软件1配合工作。若当前环境只有一个所述软件1运行,则所述语音助手2与当前的所述软件1配合工作,若当前***环境有多个所述软件1运行,则所述语音助手2通过当前***,比如安卓***,获取***环境中的当前的所述软件1,然后所述语音助手2与当前的所述软件1建立通信连接,进行相关工作。
如图2所示,本发明的优选实施方式是:还包括网络服务器3,所述语音助手2将采集的场景信息上传到所述网络服务器3,所述网络服务器3将所述场景信息与预先存储的信息进行匹配,将匹配的信息传送到所述语音助手2。若场景信息为“非诚勿扰”,所述网络服务器3预先存储有“非诚勿扰”的相关信息,比如,“非诚勿扰”的介绍信息、“非诚勿扰”的主持人相关信息,“非诚勿扰”的歌曲链接信息等信息,所述网络服务器3将“非诚勿扰”相关的这些信息传输到所述语音助手2,所述语音助手2将这些信息组织成信息列表,由第二信息输出模块26直接显示输出,供用户使用,包括查看、播放等操作;也可以传输到所述软件1,由所述第一信息输出模块14显示输出,供使用;还可以传输到移动终端,由移动终端显示输出,供使用。
本发明的技术效果是:构建一种基于软件运行场景及语音助手的语音辅助方法及***,包括软件1、语音助手2,所述软件1与所述语音助手2独立运行,所述语音助手2获取所述软件1运行的场景信息,所述场景信息包括场景元素信息或场景状态信息;所述语音助手2采集语音信息,所述语音助手2对所述语音信息进行语音识别转换;所述语音助手2将语音识别转换结果与获取的场景信息进行匹配;若所述软件1运行的场景元素信息与所述语音识别结果在发音、文字、文字含义或者操作信息上相关,由所述语音助手2将匹配的场景元素信息传送到所述软件1,由所述软件1根据所述场景元素信息执行;若所述软件运行的场景状态信息与所述语音识别结果在发音、文字、文字含义或者操作信息上相关,所述语音助手2调用预先构建的该项目信息的场景状态模板,由所述语音助手2根据语音信息将相应场景状态模板的信息传送到所述软件1,由所述软件1根据所述场景状态模板的信息执行。本发明基于软件场景及语音助手2的语音交互辅助方法及***,所述软件1与所述语音助手2独立运行,所述语音助手2获取所述软件1运行的场景信息,所述语音助手2将语音识别转换结果与获取的场景信息进行匹配,然后对于匹配的场景信息,根据场景元素信息和场景状态信息和语音信息,由软件1进行操作执行。本发明基于软件场景及语音助手2的语音交互辅助方法及***,根据软件的实时场景信息进行对其进行操作和使用,使语音软件真正迈向智能化,同时,与软件1分开独立运行,可以一个语音助手2与多个软件1配合使用,大大节约***资源。另外,方便对语音引擎进行更新和创新,促进语音技术在智能化方面的发展。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (10)

1.一种基于软件运行场景及语音助手的语音辅助方法,包括软件、语音助手,所述软件与所述语音助手独立运行,其特征在于,语音交互辅助方法包括如下步骤:
获取场景信息:所述语音助手获取所述软件运行的场景信息,所述场景信息包括场景元素信息或场景状态信息;
输入语音:所述语音助手采集语音信息,所述语音助手对所述语音信息进行语音识别转换;
匹配执行:所述语音助手将语音识别转换结果与获取的场景信息进行匹配;若所述软件运行的场景元素信息与所述语音识别结果在相关信息上相同或相似,则所述语音助手将匹配的场景元素信息传送到所述软件,由所述软件根据所述场景元素信息执行;若所述软件运行的场景状态信息与所述语音识别结果匹配结果在相关信息上相同或相似,则所述语音助手调用预先构建的该项目信息的场景状态模板,则所述语音助手根据语音信息将相应场景状态模板的信息传送到所述软件,由所述软件根据所述场景状态模板的信息执行。
2.根据权利要求1所述基于软件运行场景及语音助手的语音辅助方法,其特征在于,所述软件和所述语音助手通过所述软件的预留接口建立通信连接。
3.根据权利要求1所述基于软件运行场景及语音助手的语音辅助方法,其特征在于,所述软件和所述语音助手通过专有协议建立通信连接。
4.根据权利要求1所述基于软件运行场景及语音助手的语音辅助方法,其特征在于,所述软件包括多种独立运行的软件,所述语音助手与当前活动的所述软件配合工作。
5.根据权利要求1所述基于软件运行场景及语音助手的语音辅助方法,其特征在于,还包括网络服务器,所述语音助手将采集的场景信息上传到所述网络服务器,所述网络服务器将所述场景信息与预先存储的信息进行匹配,将匹配的信息传送到所述语音助手。
6.根据权利要求1所述基于软件运行场景及语音助手的语音辅助方法,其特征在于,所述相关信息上相同或相似包括在相关信息在发音、文字、文字含义、所属类型或操作信息上相同或相似,或者匹配双方各自部分信息在发音、文字、文字含义、所属类型或操作信息上相同或相似。
7.一种基于软件运行场景及语音助手的语音辅助***,其特征在于,包括软件、语音助手,所述软件与所述语音助手独立运行,所述软件包括采集场景信息的采集模块、与所述语音助手进行通信的通信模块、执行模块,所述语音助手包括获取所述软件运行的场景信息的信息获取模块、采集语音信息的语音采集模块、进行语音识别转换的语音识别模块、匹配模块、传输模块,所述信息获取模块获取所述软件运行的场景信息,所述场景信息包括场景元素信息或场景状态信息;所述语音采集模块采集语音信息,所述语音识别模块对所述语音信息进行语音识别转换;所述匹配模块将语音识别转换结果与获取的场景信息进行匹配;若所述软件运行的场景元素信息与所述语音识别结果在相关信息上相同或相似,所述传输模块将匹配的场景元素信息传送到所述软件,所述执行模块执行所述场景元素信息对应的项目;若所述软件运行的场景状态信息与所述语音识别结果在相关信息上相同或相似,所述语音助手调用预先构建的该项目信息的场景状态模板,由所述传输模块根据语音信息将相应场景状态模板的信息传送到所述软件,所述执行模块执行所述场景状态模板的信息对应的项目。
8.根据权利要求7基于软件运行场景及语音助手的语音辅助***,其特征在于,所述软件包括多种独立运行的软件,所述语音助手与当前活动的所述软件配合工作。
9.根据权利要求7基于软件运行场景及语音助手的语音辅助***,其特征在于,还包括网络服务器,所述语音助手将采集的场景信息上传到所述网络服务器,所述网络服务器将所述场景信息与预先存储的信息进行匹配,将匹配的信息传送到所述语音助手。
10.根据权利要求9基于软件运行场景及语音助手的语音辅助***,其特征在于,所述软件包括第一信息输出模块或者所述语音助手包括第二信息输出模块。
CN201410634118.XA 2014-11-12 2014-11-12 基于软件运行场景及语音助手的语音辅助方法及*** Active CN104516709B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410634118.XA CN104516709B (zh) 2014-11-12 2014-11-12 基于软件运行场景及语音助手的语音辅助方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410634118.XA CN104516709B (zh) 2014-11-12 2014-11-12 基于软件运行场景及语音助手的语音辅助方法及***

Publications (2)

Publication Number Publication Date
CN104516709A true CN104516709A (zh) 2015-04-15
CN104516709B CN104516709B (zh) 2018-08-14

Family

ID=52792082

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410634118.XA Active CN104516709B (zh) 2014-11-12 2014-11-12 基于软件运行场景及语音助手的语音辅助方法及***

Country Status (1)

Country Link
CN (1) CN104516709B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105426062A (zh) * 2015-12-18 2016-03-23 合肥寰景信息技术有限公司 一种智能语音互交式的网络社区语音服务装置
CN106406867A (zh) * 2016-09-05 2017-02-15 深圳市联谛信息无障碍有限责任公司 一种基于android***的读屏方法及装置
CN107463700A (zh) * 2017-08-15 2017-12-12 北京百度网讯科技有限公司 用于获取信息的方法、装置及设备
CN107507615A (zh) * 2017-08-29 2017-12-22 百度在线网络技术(北京)有限公司 界面智能交互控制方法、装置、***及存储介质
CN108062212A (zh) * 2016-11-08 2018-05-22 沈阳美行科技有限公司 一种基于场景的语音操作方法及装置
CN110021299A (zh) * 2018-01-08 2019-07-16 佛山市顺德区美的电热电器制造有限公司 语音交互方法、装置、***及存储介质
WO2019175896A1 (en) * 2018-03-13 2019-09-19 Renuka Bodla System and method for interacting with digitalscreensusing voice input and image processing technique
WO2020062862A1 (zh) * 2018-09-28 2020-04-02 深圳市冠旭电子股份有限公司 一种音箱语音交互控制的方法及装置
CN112306352A (zh) * 2020-02-24 2021-02-02 北京字节跳动网络技术有限公司 用于处理信息的***、方法和装置
CN114363449A (zh) * 2020-09-30 2022-04-15 北京字跳网络技术有限公司 业务状态的切换方法、装置、电子设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102395013A (zh) * 2011-11-07 2012-03-28 康佳集团股份有限公司 一种对智能电视机的语音控制方法和***
US20120134507A1 (en) * 2010-11-30 2012-05-31 Dimitriadis Dimitrios B Methods, Systems, and Products for Voice Control
CN102802031A (zh) * 2012-07-13 2012-11-28 李映红 针对电视节目的交互***和方法
CN103472990A (zh) * 2013-08-27 2013-12-25 小米科技有限责任公司 设备控制方法、装置和设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120134507A1 (en) * 2010-11-30 2012-05-31 Dimitriadis Dimitrios B Methods, Systems, and Products for Voice Control
CN102395013A (zh) * 2011-11-07 2012-03-28 康佳集团股份有限公司 一种对智能电视机的语音控制方法和***
CN102802031A (zh) * 2012-07-13 2012-11-28 李映红 针对电视节目的交互***和方法
CN103472990A (zh) * 2013-08-27 2013-12-25 小米科技有限责任公司 设备控制方法、装置和设备

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105426062A (zh) * 2015-12-18 2016-03-23 合肥寰景信息技术有限公司 一种智能语音互交式的网络社区语音服务装置
CN106406867B (zh) * 2016-09-05 2020-02-14 深圳市联谛信息无障碍有限责任公司 一种基于android***的读屏方法及装置
CN106406867A (zh) * 2016-09-05 2017-02-15 深圳市联谛信息无障碍有限责任公司 一种基于android***的读屏方法及装置
CN108062212A (zh) * 2016-11-08 2018-05-22 沈阳美行科技有限公司 一种基于场景的语音操作方法及装置
CN107463700A (zh) * 2017-08-15 2017-12-12 北京百度网讯科技有限公司 用于获取信息的方法、装置及设备
CN107463700B (zh) * 2017-08-15 2020-09-08 北京百度网讯科技有限公司 用于获取信息的方法、装置及设备
CN107507615A (zh) * 2017-08-29 2017-12-22 百度在线网络技术(北京)有限公司 界面智能交互控制方法、装置、***及存储介质
CN110021299A (zh) * 2018-01-08 2019-07-16 佛山市顺德区美的电热电器制造有限公司 语音交互方法、装置、***及存储介质
CN110021299B (zh) * 2018-01-08 2021-07-20 佛山市顺德区美的电热电器制造有限公司 语音交互方法、装置、***及存储介质
WO2019175896A1 (en) * 2018-03-13 2019-09-19 Renuka Bodla System and method for interacting with digitalscreensusing voice input and image processing technique
WO2020062862A1 (zh) * 2018-09-28 2020-04-02 深圳市冠旭电子股份有限公司 一种音箱语音交互控制的方法及装置
CN112306352A (zh) * 2020-02-24 2021-02-02 北京字节跳动网络技术有限公司 用于处理信息的***、方法和装置
CN114363449A (zh) * 2020-09-30 2022-04-15 北京字跳网络技术有限公司 业务状态的切换方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN104516709B (zh) 2018-08-14

Similar Documents

Publication Publication Date Title
CN104516709A (zh) 基于软件运行场景及语音助手的语音辅助方法及***
CN104461446A (zh) 基于语音交互的软件运行方法及***
CN104506944A (zh) 基于电视场景及语音助手的语音交互辅助方法及***
WO2021063343A1 (zh) 语音交互方法及装置
US9743226B2 (en) Method for short-range wireless communication and electronic device using the same
TWI497311B (zh) 跨裝置通訊傳輸系統及其方法
CN108121490A (zh) 用于处理多模式输入的电子装置、方法和服务器
CN104506906A (zh) 基于电视场景元素及语音助手的语音交互辅助方法及***
CN104506901A (zh) 基于电视场景状态及语音助手的语音辅助方法及***
CN103338311A (zh) 一种智能手机锁屏界面启动app的方法
CN104363517A (zh) 基于电视场景及语音助手的语音切换方法及***
KR102256291B1 (ko) 번역 상황을 인지하고 번역 기능을 수행하는 방법 및 이를 구현하는 전자장치
CN104598443A (zh) 语言服务提供方法、装置及***
CN102929385A (zh) 语音控制应用程序的方法
CN105100208A (zh) 一种移动终端与穿戴设备的通信方法
CN105446302A (zh) 一种基于智能终端的智能家居设备指令交互方法及***
CN103631800A (zh) 信息处理方法及装置
KR20180108321A (ko) 파셜 랜딩 후 사용자 입력에 따른 동작을 수행하는 전자 장치
KR102380717B1 (ko) 사용자 발화를 처리하는 전자 장치 및 이 전자 장치의 제어 방법
CN112650498B (zh) 静态库集成方法、装置、电子设备及存储介质
KR102330576B1 (ko) 노래방 시스템 및 그의 제어 방법
CN102984568A (zh) 一种遥控器控制移动终端的方法和***
CN107483993A (zh) 电视的语音输入方法、电视和计算机可读存储介质
CN104991769A (zh) 一种无主机的电脑
CN108334339A (zh) 一种蓝牙设备驱动方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190523

Address after: 065000 Xinya R&D Building 610-612, 106 No. 1 Road, Langfang Economic and Technological Development Zone, Hebei Province

Patentee after: Technological University Xunfei Hebei Technology Co., Ltd.

Address before: 230000 666 Wangjiang West Road, Hefei hi tech Development Zone, Anhui

Patentee before: Iflytek Co., Ltd.