CN112397068B - 一种语音指令执行方法及存储设备 - Google Patents
一种语音指令执行方法及存储设备 Download PDFInfo
- Publication number
- CN112397068B CN112397068B CN202011277363.1A CN202011277363A CN112397068B CN 112397068 B CN112397068 B CN 112397068B CN 202011277363 A CN202011277363 A CN 202011277363A CN 112397068 B CN112397068 B CN 112397068B
- Authority
- CN
- China
- Prior art keywords
- voice
- information
- voice operation
- text information
- intelligent terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000012545 processing Methods 0.000 claims description 31
- 230000006399 behavior Effects 0.000 claims description 11
- 230000005540 biological transmission Effects 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 6
- 230000004044 response Effects 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000004891 communication Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000003710 cerebral cortex Anatomy 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种语音指令执行方法及存储设备,方法包括:获取基于语音指令生成的文本信息;通过无线网络模块将文本信息发送到智能终端,并控制智能终端执行与文本信息对应的语音操作指令;获取智能终端执行语音操作指令时生成的语音操作数据,并将语音操作数据存储;本发明实施例通过上述方法可以方便对一些音频类数据进行后续离线播放,给用户带来方便,所述存储设备轻便携带。
Description
技术领域
本发明涉及通信技术领域,尤其涉及的是一种语音指令执行方法及存储设备。
背景技术
智能语音是实现人与机器以语言为纽带的通信。人类大脑皮层每天处理的信息中,声音信息占20%,它是沟通最重要的纽带,人机对话将方便人们的工作与生活。完整的人机对话包括声音信号的前端处理、将声音转为文字供机器处理、在机器生成语言之后,用语音合成技术将文本语言转化为声波,从而形成完整的人机语音交互。消费级智能硬件是最早显示出市场潜力的赛道,市场各方都在瞄准消费级智能交互终端。但现有技术中没有一种轻便携带的小型设备能通过智能语音的方式从云端下载数据并保存下来,方便后续在离线状态下复用的,如有些用户喜欢的音视频资源无法保存下来,在没有网络的情况下实现离线播放。
因此,现有技术还有待改进和发展。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种语音指令执行方法,旨在解决现有技术中没有一种轻便携带的小型存储设备能通过智能语音的方式从云端下载数据并保存下来,方便后续在离线状态下复用的问题。
本发明解决问题所采用的技术方案如下:
第一方面,本发明实施例提供一种语音指令执行方法,其中,所述方法包括:
获取基于语音指令生成的文本信息;
通过无线网络模块将所述文本信息发送到智能终端,并控制所述智能终端执行与所述文本信息对应的语音操作指令;
获取所述智能终端执行所述语音操作指令时生成的语音操作数据,并将所述语音操作数据存储。
在一种实现方式中,其中,所述所述文本信息的生成方式为:
获取用户的语音指令;
将所述语音指令转换成文本信息。
在一种实现方式中,其中,所述将所述语音指令转换成文本信息包括:
对所述语音指令进行声音预处理、特征提取、语音解码,得到声音处理信息;
根据声音处理信息与文本信息的映射关系,得到与所述声音处理信息匹配的文本信息。
在一种实现方式中,其中,所述智能终端执行与所述文本信息对应的语音操作指令的具体步骤为:
解析所述文本信息,得到与所述文本信息对应的行为信息和名称信息;
根据所述名称信息,确定云端应用是否具有所述名称信息;
若所述云端应用具有所述名称信息,则执行与所述行为信息对应的语音操作指令。
在一种实现方式中,其中,所述根据所述名称信息,确定云端应用是否具有所述名称信息包括:
根据所述名称信息,确定所述名称信息是否存在于所述云端应用的词条信息中,其中,所述词条信息为云端应用根据所述名称信息生成的名称关联信息;
若所述名称信息存在于所述云端应用的词条信息中,则确定所述云端应用具有所述名称信息。
在一种实现方式中,其中,所述获取所述智能终端执行所述语音操作指令时生成的语音操作数据,并将所述语音操作数据存储包括:
获取所述智能终端执行所述语音操作指令时生成的语音操作数据,
解析所述语音操作数据,得到所述语音操作数据的类型,其中,所述类型包括音频、视频和文本文件;
将所述语音操作数据存储在存储模块中与所述语音操作数据的类型对应的存储区域中。
在一种实现方式中,其中,所述获取所述智能终端执行所述语音操作指令时生成的语音操作数据,并将所述语音操作数据存储还包括:
根据所述存储区域的优先级,对所述存储区域进行不同的加密处理。
第二方面,本发明实施例还提供一种语音指令执行装置,其中,所述装置包括:
文本信息发送单元,用于通过无线网络模块将所述文本信息发送到智能终端,并通过主控微控制模块控制所述智能终端执行与所述文本信息对应的语音操作指令;
语音操作指令响应单元,用于获取所述智能终端执行所述语音操作指令时生成的语音操作数据,并将所述语音操作数据存储;
数据传输单元,用于根据USB接口实现存储设备中的存储模块和功能模块之间数据传输;
数据处理控制单元,用于通过主控微控制模块控制智能终端将执行所述语音操作指令时生成的语音操作数据发送到所述存储设备。
第三方面,本发明实施例还提供一种智能终端,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于执行如上述任意一项所述的语音指令执行方法。
第四方面,本发明实施例还提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如上述中任意一项所述的语音指令执行方法。
本发明的有益效果:本发明实施例首先获取基于语音指令生成的文本信息;然后通过无线网络模块将所述文本信息发送到智能终端,并控制所述智能终端执行与所述文本信息对应的语音操作指令;最后获取所述智能终端执行所述语音操作指令时生成的语音操作数据,并将所述语音操作数据存储;可见,本发明实施例中通过存储设备识别语音,然后控制智能终端执行与语音相对应的语音操作指令,最后将智能终端在执行完语音操作指令后的数据存储来实现存储设备通过智能语音方式从云端下载数据并保存,可以方便对一些音频类数据进行后续离线播放,给用户带来方便,所述存储设备轻便携带。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1本发明实施例提供语音指令执行方法流程示意图。
图2本发明实施例提供的语音指令执行***结构示意图。
图3本发明实施例提供的语音指令执行设备的原理框图。
图4本发明实施例提供的智能终端的内部结构原理框图。
具体实施方式
本发明公开了一种语音指令执行方法,为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
由于现有技术中,没有一种轻便携带的小型存储设备能通过智能语音的方式从云端下载数据并保存下来,方便后续在离线状态下复用的,如有些用户喜欢的音视频资源无法保存下来,在没有网络的情况下实现离线播放。
为了解决现有技术的问题,本实施例提供了一种语音指令执行方法,通过存储设备中的智能语音模块接收用户发出的语音信号,在本发明实施中,存储设备为语音智能U盘。智能语音模块将语音信号转化为机器可识别的文本信息;然后再将文本信息通过无线网络模块发送到智能终端,控制智能终端执行和返回执行结果,最后将智能终端在执行完语音操作指令后的数据存储来实现存储设备通过智能语音方式从云端下载数据并保存,可以方便对一些音频类数据进行后续离线播放,给用户带来方便,所述存储设备轻便携带。在本实施例中,首先获取基于指令生成的文本信息,也即用户会对着存储设备发语音,存储设备中的智能语音模块会接收用户的语音,然后将语音转换生成文本信息,然后通过存储设备中的无线网络模块将文本信息发送到智能终端,在本实施例中,智能终端为手机,并控制智能终端执行与存储设备发送的文本信息匹配的语音操作指令,当智能终端执行完语音操作指令后,会生成语音操作数据,此时智能终端将语音操作数据返回至存储设备中,存储设备接收语音操作数据,并将语音操作数据存储在存储设备,在本实施例中也即存储在语音智能U盘中。本实施例中通过智能语音的方式从云端下载数据并保存下来,方便后续在离线状态下复用。
举例说明
当用户在开车时,突然想听一首歌,现有技术中,比如后装车载***,一般是通过蓝牙连接或者USB连接的方式,将手机和后装车装***通过有线或无线方式连接起来,然后车载***就可以读取手机上下载或在线播放的歌曲信息,并通过车载***播放,但是如果用户听到一首歌很喜欢,但是这首歌是在线方式获取并收听的,当用户处在一个没有网络连接的环境时,如果用户想听那首很好听的歌,则无法实现。本发明实施例方法就可以解决实际中用户的这方面需求,当用户在车载***上插上语音智能U盘,然后当用户想听一首歌,不用停止驾驶来手动搜索,只需说出自己的需求,“下载传奇这首歌”,然后,语音智能U盘中的智能语音模块就将用户的语音指令:“下载传奇这首歌”转成文本信息,即***可以识别的文字类信息,然后存储设备中主控微控制模块(主控MCU)将文本信息发送到智能终端,并控制智能终端执行与文本信息对应的语音操作指令,如智能终端识别到文本信息:“下载《传奇》这首歌”,然后在智能终端将《传奇》下载下来,然后智能终端在云端应用中将《传奇》下载下来,然后将下载的《传奇》发送到语音智能U盘,语音智能U盘通过主控微控制模块接收语音操作数据《传奇》,并将该语音操作数据《传奇》存储在语音智能U盘中,此时,用户的语音智能U盘插在车载设备中,也即语音智能U盘是与车载设备通过USB接口连接的,此时,车载设备不但可以给语音智能U盘充电,还可以读取语音智能U盘中的语音操作数据,也即播放语音智能U盘中的《传奇》,当用户在一个没有网络的环境时,还可以循环播放自己喜爱的歌曲《传奇》,提高了用户的体验。
示例性方法
本实施例提供一种语音指令执行方法,该方法可以应用于通信智能终端。具体如图1所示,所述方法包括:
步骤S100、获取基于语音指令生成的文本信息;
具体地,当用户发出语音后,存储设备中智能语音模块通过语音识别将接收的用户语音转换成文本信息,语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。在本实施例中,存储设备为语音智能U盘,如图2所示,语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术,通过上述方式生成的文本信息可以为后续智能终端执行与之相应的操作做准备。
为了得到文本信息,所述文本信息的生成方式为:
步骤S101、获取用户的语音指令;
步骤S102、将所述语音指令转换成文本信息。
具体地,人与人之间是可以通过相互沟通来实现交流的,但是机器是没法直接像人一样直接进行口语交流的,因此,需要将人的语言转化成机器能识别的语言。在本实施例中,存储设备为语音智能U盘,当用户对着语音智能U盘发出语音时,存储设备中的智能语音模块先获取用户的语音指令,然后识别输入的语音指令,然后将语音指令通过语音识别转换为文本信息。
为了得到准确的文本信息,所述将所述语音指令转换成文本信息包括:
对所述语音指令进行声音预处理、特征提取、语音解码,得到声音处理信息;根据声音处理信息与文本信息的映射关系,得到与所述声音处理信息匹配的文本信息。
具体地,当存储设备中的智能语音模块接收到语音指令后,将语音指令进行预处理,例如对语音指令进行预加重、分帧、加窗等预处理操作,目的是消除因为人类发声器官本身和由于采集语音信号的存储设备所带来的混叠、高次谐波失真、高频等等因素,对语音信号质量的影响。尽可能保证后续语音处理得到的信号更均匀、平滑,为信号参数提取提供优质的参数,提高语音处理质量。在语音信号中,包含着非常丰富的特征参数,不同的特征向量表征着不同的物理和声学意义,因此,对语音指令进行预处理之后还需要进行特征提取,特征提取就是要尽量取出或削减语音信号中与识别无关的信息影响因素,减少后续识别阶段需处理的数据量,生成表征语音信号中携带的说话人信息的特征参数。根据语音特征的不同用途,需要提取不同的特征参数,从而保证识别的准确率,可以采用LPCC和MFCC特征参数。由于硬件接收的语音是模拟信号,需要把它转化成数字脉冲,故要接着对语音进行解码,就是通过声学模型,对提取特征后的音频数据进行重建压缩,得到声音处理信息。然后根据声音处理信息与文本信息的映射关系,将声音处理信息映射到文本信息,实际中,***有字典,字典中含有丰富的文本信息和发音对应的拼音信息,也即将声音处理信息与文本信息进行了很好的映射,实际使用时,就可以根据声音处理信息得到与之匹配的文本信息。
本实施例提供一种语音指令执行方法,该方法可以应用于通信智能终端。具体如图1所示,所述方法包括:
步骤S200、通过无线网络模块将所述文本信息发送到智能终端,并控制所述智能终端执行与所述文本信息对应的语音操作指令。
具体地,存储设备中包含智能语音模块和无线网络模块,而语音操作指令的执行是在智能终端执行的,因此,通过无线网络模块将所述文本信息发送到智能终端,并通过主控微控制模块控制智能终端执行与文本信息对应的语音操作指令。例如,当智能语音模块识别出文本信息为:“我要下载《传奇》这首歌”,便将其发送到智能终端,通过主控微控制模块控制智能终端如手机执行下载任务,将《传奇》下载下来,为后续将数据回传到存储设备做准备。在一种实现方式中,在存储设备中设置有指示灯,当智能终端执行下载任务时,通过主控微控制模块控制指示灯亮,当智能终端执行下载任务结束时,通过主控微控制模块控制指示灯灭;通过上述方式提醒用户,让用户能及时了解存储设备的工作状态。
为了得到语音操作指令,所述智能终端执行与所述文本信息对应的语音操作指令的具体步骤为:
步骤S201、解析所述文本信息,得到与所述文本信息对应的行为信息和名称信息;
步骤S202、根据所述名称信息,确定云端应用是否具有所述名称信息;
步骤S203、若所述云端应用具有所述名称信息,则执行与所述行为信息对应的语音操作指令。
具体地,文本信息由多个部分组成,而每部分信息都代表着不同的内容,所起作用不同。当智能终端接收到文本信息后,就对文本信息进行解析,得到与文本信息对应的行为信息和名称信息。而智能终端执行语音操作指令是执行行为信息所代表的操作,其操作对象是名称信息,智能终端根据名称信息到云端应用中查找,故需要根据名称信息确定云端应用是否具有名称信息,只有当云端应用中具有该名称信息时,则执行与对应的行为信息的语音操作指令。例如,当文本信息解析出来行为信息为下载,名称信息为《传奇》时,在云端应用查询《传奇》,查询到后执行下载。
为了确定云端应用是否有名称信息,所述根据所述名称信息,确定云端应用是否具有所述名称信息包括如下步骤:根据所述名称信息,确定所述名称信息是否存在于所述云端应用的词条信息中,其中,所述词条信息为云端应用根据所述名称信息生成的名称关联信息;若所述名称信息存在于所述云端应用的词条信息中,则确定所述云端应用具有所述名称信息。
在本实施例中,当智能终端获取的名称信息后,在云端应用查询时,云端应用获取名称信息,然后云端应用会生成系列词条信息,其中,所述词条信息为云端应用根据所述名称信息生成的名称关联信息;当名称信息存在于云端应用的词条信息中时,则确定云端应用具有所述名称信息。例如,当智能终端获取到名称信息为:“《传奇》”,云端会出现《传奇》,还有传奇人生,传奇故事等等词条也即名称关联信息,当《传奇》存在于词条信息中,则确定所述云端应用具有所述名称信息《传奇》。
本实施例提供一种语音指令执行方法,该方法可以应用于通信智能终端。具体如图1所示,所述方法包括:
步骤S300、获取所述智能终端执行所述语音操作指令时生成的语音操作数据,并将所述语音操作数据存储。
实际中,当智能终端执行语音操作指令后,智能终端会将语音操作指令生成的语音操作数据发送到存储设备,存储设备的主控微控制模块可以接收语音操作数据,并将语音操作数据存储起来,存储后的数据可以进一步为后续循环复用做准备。
为了得到语音操作数据,所述获取所述智能终端执行所述语音操作指令时生成的语音操作数据,并将所述语音操作数据存储包括:
步骤S301、获取所述智能终端执行所述语音操作指令时生成的语音操作数据,
步骤S302、解析所述语音操作数据,得到所述语音操作数据的类型,其中,所述类型包括音频、视频和文本文件;
步骤S303、将所述语音操作数据存储在存储模块中与所述语音操作数据的类型对应的存储区域中。
具体地,智能终端执行语音操作指令会生成语音操作数据,存储设备先获取语音操作数据,由于语音操作数据有多种类型,如音频、视频和文本文件等,接着对语音操作数据进行解析,得到语音操作数据的类型,最后将语音操作数据存储在存储模块中与语音操作数据的类型对应的存储区域中。例如,在存储设备的存储模块中存储有音频存储区域,视频存储区域,文本存储区域,下载到视频后就将视频存储在视频存储区域,下载到音频后就将音频存储到音频存储区域,下载到文本文件后就将文本文件存储在文本文件存储区域,这样可以方便用户快速查找所需要的内容。
除此之外,根据所述存储区域的优先级,对所述存储区域进行不同的加密处理。实际中,对于用户而言,每个存储区域的重要程度是不同的,每个存储区域对不同的用户的权限也有可能不同,根据存储区域的重要程度进行不同级别的保护可以使拥有不同权限的用户操作不同的存储区域,获取不同的文件内容,故对存储模块中的音频存储区域,视频存储区域和文本存储区域采用不同的加密方法。在一种实现方式中,例如,对音频存储区域采用EFS(File Encryption Key,文件文件加密钥匙)算法加密,对视频存储区域采用AES(Advanced Encryption Standard高级加密标准)算法加密,对文本存储区域采用Rijndael(分组密码算法)对称算法加密。实际中,语音智能U盘可以是公司的共用资料,保存着公司不同业务的重要资料,公司中只有几个工作人员拥有对语音智能U盘的操作权,并且对于每个工作人员而言,其操作权对应的区域是不同的,只需对工作人员A公开拥有音频存储区域操作权的密码;对工作人员B公开拥有视频存储区域操作权的密码,对工作人员C公开拥有文本存储区域操作权的密码,这样就可以使不同的工作人员同时使用一个语音智能U盘并且使得没有操作权限的工作人员无法获取重要文件,避免泄露,保证了公司资料的安全性,同时节省资源。在另一种实施方式中,对语音存储U盘进行防复制处理,防复制处理通过码率的方式控制,可以更好的提高用户资料的安全性。
示例性设备
如图3中所示,本发明实施例提供一种语音指令执行存储,该存储设备包括文本信息生成单元401,文本信息发送单元402,语音操作指令响应单元403,数据传输单元404,数据处理控制单元405;其中:
文本信息生成单元401,用于获取基于智能语音模块的语音指令生成的文本信息;
文本信息发送单元402,用于通过无线网络模块将所述文本信息发送到智能终端,并通过主控微控制模块控制所述智能终端执行与所述文本信息对应的语音操作指令;
语音操作指令响应单元403,用于获取所述智能终端执行所述语音操作指令时生成的语音操作数据,并将所述语音操作数据存储;
数据传输单元404,用于根据USB接口实现存储设备中的存储模块和功能模块之间数据传输;
数据处理控制单元405,用于通过主控微控制模块控制智能终端将执行所述语音操作指令时生成的语音操作数据发送到所述存储设备。
本实施例还提供一种语音指令执行存储设备,包含文本信息生成单元401,其作用是存储设备中的文本信息生成单元通过存储设备上的智能语音模块接收语音指令,然后将语音指令生成文本信息,存储设备还包含与文本信息生成单元连接的文本信息发送单元402,文本信息发送单元402发送文本信息,通过无线网络模块将所述文本信息发送到智能终端,由于只有智能终端才能执行语音操作指令,因此,通过主控微控制模块控制所述智能终端执行与所述文本信息对应的语音操作指令;文本信息发送单元402连接语音操作指令响应单元403,语音操作指令响应单元403作用是在智能终端执行所述语音操作指令生成语音操作数据,然后存储设备就可以获取语音操作数据,并将语音操作数据存储起来;存储设备还包括数据传输单元404,用于根据USB接口实现存储设备中的存储模块和其他功能模块或者智能终端之间的数据传输;在一种实现方式中,存储设备也即语音智能U盘通过USB接口连接供电模块,通过供电模块给语音智能U盘充电。在另一种实现方式中,存储设备也即语音智能U盘通过USB接口连接播放设备,实现播放语音智能U盘中的文件。为了实现控制,一种语音指令执行存储设备还包括数据处理控制单元405,其作用是通过主控微控制模块控制智能终端将执行所述语音操作指令时生成的语音操作数据发送到所述存储设备。
基于上述实施例,本发明还提供了一种智能终端,其原理框图可以如图4所示。该智能终端包括通过***总线连接的处理器、存储器、网络接口、显示屏、温度传感器。其中,该智能终端的处理器用于提供计算和控制能力。该智能终端的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该智能终端的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种语音指令执行方法。该智能终端的显示屏可以是液晶显示屏或者电子墨水显示屏,该智能终端的温度传感器是预先在智能终端内部设置,用于检测内部设备的运行温度。
本领域技术人员可以理解,图4中的原理图,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的智能终端的限定,具体的智能终端可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种智能终端,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取基于语音指令生成的文本信息;
通过无线网络模块将所述文本信息发送到智能终端,并控制所述智能终端执行与所述文本信息对应的语音操作指令;
获取所述智能终端执行所述语音操作指令时生成的语音操作数据,并将所述语音操作数据存储。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
综上所述,本发明公开了一种语音指令执行方法、智能终端、存储介质,所述方法包括:
本发明实施例首先获取基于语音指令生成的文本信息;然后通过无线网络模块将所述文本信息发送到智能终端,并控制所述智能终端执行与所述文本信息对应的语音操作指令;最后获取所述智能终端执行所述语音操作指令时生成的语音操作数据,并将所述语音操作数据存储;可见,本发明实施例中通过存储设备识别语音,然后控制智能终端执行与语音相对应的语音操作指令,最后将智能终端在执行完语音操作指令后的数据存储来实现存储设备通过智能语音方式从云端下载数据并保存,方便后续离线播放给用户带来方便。
应当理解的是,本发明公开了一种语音指令执行方法,应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。
Claims (6)
1.一种语音指令执行方法,其特征在于,应用于存储设备,所述方法包括:
获取通过所述存储设备基于语音指令生成的文本信息;
通过无线网络模块将所述文本信息发送到智能终端,并控制所述智能终端执行与所述文本信息对应的语音操作指令;
获取所述智能终端执行所述语音操作指令时生成的语音操作数据,并将所述语音操作数据存储至所述存储设备,以在离线状态下复用所述语音操作数据;
所述文本信息的生成方式为:
获取用户的语音指令;将所述语音指令转换成文本信息;
所述将所述语音指令转换成文本信息包括:
对所述语音指令进行声音预处理、特征提取、语音解码,得到声音处理信息;根据声音处理信息与文本信息的映射关系,得到与所述声音处理信息匹配的文本信息;
所述智能终端执行与所述文本信息对应的语音操作指令的具体步骤为:
解析所述文本信息,得到与所述文本信息对应的行为信息和名称信息;根据所述名称信息,确定云端应用是否具有所述名称信息;若所述云端应用具有所述名称信息,则执行与所述行为信息对应的语音操作指令;
所述根据所述名称信息,确定云端应用是否具有所述名称信息包括:
根据所述名称信息,确定所述名称信息是否存在于所述云端应用的词条信息中,其中,所述词条信息为云端应用根据所述名称信息生成的名称关联信息;若所述名称信息存在于所述云端应用的词条信息中,则确定所述云端应用具有所述名称信息。
2.根据权利要求1所述的语音指令执行方法,其特征在于,所述获取所述智能终端执行所述语音操作指令时生成的语音操作数据,并将所述语音操作数据存储包括:
获取所述智能终端执行所述语音操作指令时生成的语音操作数据,
解析所述语音操作数据,得到所述语音操作数据的类型,其中,所述类型包括音频、视频和文本文件;
将所述语音操作数据存储在存储模块中与所述语音操作数据的类型对应的存储区域中。
3.根据权利要求2所述的语音指令执行方法,其特征在于,所述获取所述智能终端执行所述语音操作指令时生成的语音操作数据,并将所述语音操作数据存储还包括:
根据所述存储区域的优先级,对所述存储区域进行不同的加密处理。
4.一种语音指令执行存储设备,其特征在于,所述存储设备包括:
文本信息生成单元,用于获取基于智能语音模块的语音指令生成的文本信息;所述文本信息的生成方式为:获取用户的语音指令;将所述语音指令转换成文本信息;所述将所述语音指令转换成文本信息包括:对所述语音指令进行声音预处理、特征提取、语音解码,得到声音处理信息;根据声音处理信息与文本信息的映射关系,得到与所述声音处理信息匹配的文本信息;
文本信息发送单元,用于通过无线网络模块将所述文本信息发送到智能终端,并通过主控微控制模块控制所述智能终端执行与所述文本信息对应的语音操作指令;所述智能终端执行与所述文本信息对应的语音操作指令的具体步骤为:解析所述文本信息,得到与所述文本信息对应的行为信息和名称信息;根据所述名称信息,确定云端应用是否具有所述名称信息;若所述云端应用具有所述名称信息,则执行与所述行为信息对应的语音操作指令;所述根据所述名称信息,确定云端应用是否具有所述名称信息包括:根据所述名称信息,确定所述名称信息是否存在于所述云端应用的词条信息中,其中,所述词条信息为云端应用根据所述名称信息生成的名称关联信息;若所述名称信息存在于所述云端应用的词条信息中,则确定所述云端应用具有所述名称信息;
语音操作指令响应单元,用于获取所述智能终端执行所述语音操作指令时生成的语音操作数据,并将所述语音操作数据存储;
数据传输单元,用于根据USB接口实现存储设备中的存储模块和功能模块之间数据传输;
数据处理控制单元,用于通过主控微控制模块控制智能终端将执行所述语音操作指令时生成的语音操作数据发送到所述存储设备。
5.一种智能终端,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于执行如权利要求1-3中任意一项所述的方法。
6.一种非临时性计算机可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1-3中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011277363.1A CN112397068B (zh) | 2020-11-16 | 2020-11-16 | 一种语音指令执行方法及存储设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011277363.1A CN112397068B (zh) | 2020-11-16 | 2020-11-16 | 一种语音指令执行方法及存储设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112397068A CN112397068A (zh) | 2021-02-23 |
CN112397068B true CN112397068B (zh) | 2024-03-26 |
Family
ID=74599885
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011277363.1A Active CN112397068B (zh) | 2020-11-16 | 2020-11-16 | 一种语音指令执行方法及存储设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112397068B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103187076A (zh) * | 2011-12-28 | 2013-07-03 | 上海博泰悦臻电子设备制造有限公司 | 语音式音乐控制装置 |
CN103685393A (zh) * | 2012-09-13 | 2014-03-26 | 大陆汽车投资(上海)有限公司 | 车载语音操控终端和语音操控***及数据处理*** |
CN108366319A (zh) * | 2018-03-30 | 2018-08-03 | 京东方科技集团股份有限公司 | 智能音箱及其语音控制方法 |
CN108495160A (zh) * | 2018-02-08 | 2018-09-04 | 百度在线网络技术(北京)有限公司 | 智能控制方法、***、设备及存储介质 |
CN109979036A (zh) * | 2019-04-03 | 2019-07-05 | 深圳市海圳汽车技术有限公司 | 具有记录仪控制和语音识别控制的***及控制方法、记录仪 |
CN110992955A (zh) * | 2019-12-25 | 2020-04-10 | 苏州思必驰信息科技有限公司 | 一种智能设备的语音操作方法、装置、设备及存储介质 |
WO2020133946A1 (zh) * | 2018-12-24 | 2020-07-02 | 深圳创维-Rgb电子有限公司 | 设备控制方法、装置、设备及介质 |
CN111681658A (zh) * | 2020-06-05 | 2020-09-18 | 苏州思必驰信息科技有限公司 | 车载app的语音控制方法和装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107943405A (zh) * | 2016-10-13 | 2018-04-20 | 广州市动景计算机科技有限公司 | 语音播报装置、方法、浏览器及用户终端 |
CN109474843B (zh) * | 2017-09-08 | 2021-09-03 | 腾讯科技(深圳)有限公司 | 语音操控终端的方法、客户端、服务器 |
-
2020
- 2020-11-16 CN CN202011277363.1A patent/CN112397068B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103187076A (zh) * | 2011-12-28 | 2013-07-03 | 上海博泰悦臻电子设备制造有限公司 | 语音式音乐控制装置 |
CN103685393A (zh) * | 2012-09-13 | 2014-03-26 | 大陆汽车投资(上海)有限公司 | 车载语音操控终端和语音操控***及数据处理*** |
CN108495160A (zh) * | 2018-02-08 | 2018-09-04 | 百度在线网络技术(北京)有限公司 | 智能控制方法、***、设备及存储介质 |
CN108366319A (zh) * | 2018-03-30 | 2018-08-03 | 京东方科技集团股份有限公司 | 智能音箱及其语音控制方法 |
WO2020133946A1 (zh) * | 2018-12-24 | 2020-07-02 | 深圳创维-Rgb电子有限公司 | 设备控制方法、装置、设备及介质 |
CN109979036A (zh) * | 2019-04-03 | 2019-07-05 | 深圳市海圳汽车技术有限公司 | 具有记录仪控制和语音识别控制的***及控制方法、记录仪 |
CN110992955A (zh) * | 2019-12-25 | 2020-04-10 | 苏州思必驰信息科技有限公司 | 一种智能设备的语音操作方法、装置、设备及存储介质 |
CN111681658A (zh) * | 2020-06-05 | 2020-09-18 | 苏州思必驰信息科技有限公司 | 车载app的语音控制方法和装置 |
Non-Patent Citations (2)
Title |
---|
一种基于云平台的智能机器人语音交互***设计;林枫亭等;电子测试;20180305(第Z1期);40-42 * |
基于USB多路语音信号实时采集***的设计与实现;吕钊;吴小培;李密;;电子测量技术;20080215(第02期);17-19 * |
Also Published As
Publication number | Publication date |
---|---|
CN112397068A (zh) | 2021-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111667814B (zh) | 一种多语种的语音合成方法及装置 | |
CN110661927B (zh) | 语音交互方法、装置、计算机设备及存储介质 | |
CN110970014B (zh) | 语音转换、文件生成、播音、语音处理方法、设备及介质 | |
CN108831437B (zh) | 一种歌声生成方法、装置、终端和存储介质 | |
CN109599092B (zh) | 一种音频合成方法及装置 | |
CN111261151B (zh) | 一种语音处理方法、装置、电子设备及存储介质 | |
CN107463636B (zh) | 语音交互的数据配置方法、装置及计算机可读存储介质 | |
US9009050B2 (en) | System and method for cloud-based text-to-speech web services | |
CN109376363A (zh) | 一种基于耳机的实时语音翻译方法及装置 | |
CN111683317B (zh) | 一种应用于耳机的提示方法、装置、终端及存储介质 | |
CN109346057A (zh) | 一种智能儿童玩具的语音处理*** | |
CN110992955A (zh) | 一种智能设备的语音操作方法、装置、设备及存储介质 | |
CN111640434A (zh) | 用于控制语音设备的方法和装置 | |
CN111696520A (zh) | 智能配音方法、装置、介质及电子设备 | |
CN110503960A (zh) | 语音识别结果的实时上载方法、装置、设备及存储介质 | |
CN114945110B (zh) | 说话头视频合成方法、装置、终端设备及可读存储介质 | |
CN110808028B (zh) | 嵌入式语音合成方法、装置以及控制器和介质 | |
CN112163084B (zh) | 问题反馈方法、装置、介质以及电子设备 | |
CN112397068B (zh) | 一种语音指令执行方法及存储设备 | |
CN112712793A (zh) | 语音交互下基于预训练模型的asr纠错方法及相关设备 | |
CN112185341A (zh) | 基于语音合成的配音方法、装置、设备和存储介质 | |
CN113314096A (zh) | 语音合成方法、装置、设备和存储介质 | |
CN113421571B (zh) | 一种语音转换方法、装置、电子设备和存储介质 | |
CN113256133B (zh) | 会议纪要管理方法、装置、计算机设备及存储介质 | |
CN116129852A (zh) | 语音合成模型的训练方法、语音合成方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |