CN108874797A - 语音处理方法和装置 - Google Patents
语音处理方法和装置 Download PDFInfo
- Publication number
- CN108874797A CN108874797A CN201710317737.XA CN201710317737A CN108874797A CN 108874797 A CN108874797 A CN 108874797A CN 201710317737 A CN201710317737 A CN 201710317737A CN 108874797 A CN108874797 A CN 108874797A
- Authority
- CN
- China
- Prior art keywords
- text
- frame
- maninulation
- terminal
- application
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000012545 processing Methods 0.000 title claims abstract description 39
- 230000009471 action Effects 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 150000001875 compounds Chemical class 0.000 claims description 3
- 230000005236 sound signal Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 14
- 238000012360 testing method Methods 0.000 description 12
- 230000006399 behavior Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000006854 communication Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000011712 cell development Effects 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/04817—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance using icons
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/0482—Interaction with lists of selectable items, e.g. menus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
- G06F3/0486—Drag-and-drop
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- User Interface Of Digital Computer (AREA)
- Telephone Function (AREA)
Abstract
本申请提供了一种语音处理方法和装置,该方法包括:检测到对终端中设置的指定按键的操作满足预设条件时,采集终端的音频采集区域内的语音信号,该指定按键为在所述终端的任意界面均可以调用的按键;将采集到的语音信号转换为文本;在显示界面上展现文本操作框,并在该文本操作框的文本展现区域中显示所述文本。本申请的方案有利于提高信息记录的及时性和便捷性。
Description
技术领域
本申请涉及终端数据处理技术领域,更具体的说是涉及一种语音处理方法和装置。
背景技术
在日常生活以及工作过程中,用户经常会有一些想法或者重要信息需要及时记录下来。目前在需要用户记录这些想法以及重要信息时,都需要用户用笔记录到纸质文档中,或者是,通过手动输入到终端中记事本或者其他应用中文本输入区域内。然而,很多情况下,突然出现需要记录的信息时,用户可能无法及时找到纸、笔,而且手动用笔记录的速度较慢,会影响到信息记录的及时性,导致由于信息无法及时记录而出现遗忘等情况。而如果采用向终端的记事本或者其他应用的文本输入区域内输入所需记录的信息,则需要用户从终端中找到相应的应用,并启动并进入应用中相应的界面之后,才可以进行输入,复杂度较高,不利于信息的计时记录;而且用户手动输入的速度有限,也会影响到信息记录的及时性,导致一些信息的遗忘,进而影响到信息记录的完整性。
发明内容
有鉴于此,本申请提供了一种语音处理方法和装置,以提高信息记录的及时性和便捷性。
为实现上述目的,一方面,本申请提供了一种语音处理的方法,用于具有显示界面的终端,包括:
检测到对所述终端中设置的指定按键的操作满足预设条件时,采集所述终端的音频采集区域内的语音信号,所述指定按键为在所述终端的任意界面均可以调用的按键;
将采集到的所述语音信号转换为文本;
在所述显示界面上展现文本操作框,并在所述文本操作框的文本展现区域中显示所述文本。
优选的,在所述在显示界面上展现文本操作框之前,还包括:
搜索所述文本;
在所述在显示界面上展现文本操作框,并在所述文本操作框的文本展现区域中显示所述文本的同时,还包括:
将对所述文本的搜索结果显示在所述显示界面上。
优选的,所述搜索所述文本包括:
调用所述终端中至少一款指定应用搜索所述文本。
优选的,所述调用至少一个指定应用搜索所述文本包括以下一种或多种:
调用所述终端中的搜索引擎搜索所述文本;
调用所述终端中的通讯录应用从通讯录中搜索所述文本。
优选的,所述搜索所述文本,包括:
从所述终端已安装的应用中,搜索是否存在应用名称与所述文本相匹配的目标应用;
所述将对所述文本的搜索结果显示在所述显示界面上,包括:
当搜索到所述目标应用,在所述显示界面中展现出所述目标应用的图标。
优选的,在所述显示界面中展现出所述目标应用的图标之后,还包括:
当检测到点击所述显示界面中展现的所述目标应用的图标之后,启动所述目标应用。
优选的,所述文本操作框中还显示有用于触发分享所述文本的分享操作项;
在所述文本操作框的文本展现区域中显示所述文本之后,还包括:
在检测到对所述分享操作项的触发操作的情况下,展现可分享列表,所述可分享列表包括多个分享方式选项;
当检测到对所述可分享列表中的所述分享方式选项的选择操作时,确定所述选择操作所选择的目标分享方式,并向所述目标分享方式所关联的目标应用发送包含所述文本的分享指令,所述分享指令用于指示所述目标应用按照所述目标分享方式,将所述文本粘贴到所述目标分享方式所指定的区域。
优选的,在所述文本操作框的文本展现区域中显示所述文本之后,还包括:
在检测到启动用于编辑文本的文本编辑应用的操作指令时,展现所述文本编辑应用的文本编辑界面,所述文本编辑界面包括至少一个文本编辑区;
当检测到对所述文本操作框的指定拖拽操作时,从所述文本编辑界面的至少一个文本编辑区中,确定出所述指定拖拽操作的终止点所在的目标文本编辑区,并将所述文本操作框内的文本复制到所述目标文本编辑区内,所述指定拖拽操作用于将所述文本操作框或者文本操作框内的文本拖拽到文本编辑区。
优选的,所述文本操作框中还显示有用于触发收缩所述文本操作框的收缩操作项;
在所述文本操作框的文本展现区域中显示所述文本之后,还包括:
在检测到对所述收缩操作项的触发操作的情况下,隐藏所述文本操作框;
在文本操作框处于隐藏状态下,检测到对用于触发展现该文本操作框的扩展操作项时,在所述显示界面中展现所述文本操作框。
优选的,所述在显示界面上展现文本操作框,包括:
在所述显示界面顶层展现所述文本操作框。
优选的,所述指定按键为指定物理按键;
在所述采集所述终端的音频采集区域内的语音信号之前,还包括:
确定所述终端当前所处的状态;
在所述终端处于运行状态的情况下,则执行所述采集所述终端的音频采集区域内的语音信号的操作;
在所述终端处于锁屏或者待机状态下,则解锁或者唤醒所述终端,并执行所述采集所述终端的音频采集区域内的语音信号的操作。
另一方面,本申请提供了一种语音处理装置,包括:
语音采集单元,用于检测到对所述终端中设置的指定按键的操作满足预设条件时,采集所述终端的音频采集区域内的语音信号,所述指定按键为在所述终端的任意界面均可以调用的按键;
文本转换单元,用于将采集到的所述语音信号转换为文本;
文本显示单元,用于在显示界面上展现文本操作框,并在所述文本操作框的文本展现区域中显示所述文本。
优选的,还包括:
文本搜索单元,用于在所述文本显示单元在显示界面上展现文本操作框之前,搜索所述文本;
搜索结果展现单元,用于在所述文本显示单元在所述在显示界面上展现文本操作框的同时,将对所述文本的搜索结果显示在所述显示界面上。
优选的,所述文本搜索单元包括:
第一文本搜索单元,用于调用所述终端中至少一款指定应用搜索所述文本。
优选的,所述文本搜索单元,包括:
第二本文搜索单元,用于从所述终端已安装的应用中,搜索是否存在应用名称与所述文本相匹配的目标应用;
所述搜索结果展现单元具体为,用于在所述文本显示单元在所述在显示界面上展现文本操作框的同时,当搜索到所述目标应用,在所述显示界面中展现出所述目标应用的图标。
优选的,所述文本显示单元显示出的所述文本操作框中还显示有用于触发分享所述文本的分享操作项;
所述装置还包括:
列表展现单元,用于在所述文本显示大院在所述文本操作框的文本展现区域中显示所述文本之后,在检测到对所述分享操作项的触发操作的情况下,展现可分享列表,所述可分享列表包括多个分享方式选项;
文本分享单元,用于当检测到对所述可分享列表中的所述分享方式选项的选择操作时,确定所述选择操作所选择的目标分享方式,并向所述目标分享方式所关联的目标应用发送包含所述文本的分享指令,所述分享指令用于指示所述目标应用按照所述目标分享方式,将所述文本粘贴到所述目标分享方式所指定的区域。
优选的,还包括:
编辑界面展现单元,用于在所述文本显示单元在所述文本操作框的文本展现区域中显示所述文本之后,在检测到启动用于编辑文本的文本编辑应用的操作指令时,展现所述文本编辑应用的文本编辑界面,所述文本编辑界面包括至少一个文本编辑区;
文本粘贴单元,用于当检测到对所述文本操作框的指定拖拽操作时,从所述文本编辑界面的至少一个文本编辑区中,确定出所述指定拖拽操作的终止点所在的目标文本编辑区,并将所述文本操作框内的文本复制到所述目标文本编辑区内,所述指定拖拽操作用于将所述文本操作框或者文本操作框内的文本拖拽到文本编辑区。
经由上述的技术方案可知,由于该指定按键为在终端的任意界面均可以调用的通用按键,因此,无论终端处于任何界面状态下,均通过对该指定按键进行满足预设条件的操作,来触发终端将输入的语音信号转换为文本,并将文本显示在显示界面的文本操作框内。这样,如果用户希望记录某些想法或者重要信息,只需要对该终端中该指定按键的操作,并将想法或者重要信息的语音输入到终端,便可以完成对这些想法以及重要信息的及时记录,避免了复杂的输入以及应用查找等操作,提高了信息记录的及时性和便捷性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1示出了本申请的语音处理方法所适用的一种终端的组成结构示意图;
图2示出了本申请一种语音处理方法一个实施例的流程示意图;
图3示出了本申请的一种文本操作栏的一种示意图;
图4示出了本申请一种语音处理方法又一个实施例的流程示意图;
图5示出了本申请将语音信号转换为文本的一个结果页面的示意图;
图6示出了本申请一种语音处理方法又一个实施例的流程示意图;
图7示出了展现出的与文本操作栏相关的分享方式列表的一种示意图;
图8示出了显示界面中同时显示包含收缩后的文本操作栏与正常显示状态下的文本操作栏的示意图;
图9a以及图9b分别示出了在便签上拖拽文本操作栏,以及将文本操作栏中的文本粘贴到便签内的效果示意图;
图10示出了本申请一种语音处理装置一个实施例的组成结构示意图。
具体实施方式
本申请实施例提供了一种语音处理方法和装置,该方法和装置可以适用于任意的终端,手机、平板电脑等移动终端,也可以适用于台式电脑等。考虑到移动终端的灵活性以及便捷移动性,本申请以应用于移动终端为一种优选实施方式。
以终端为手机为例,如图1,为本申请实施例相关的手机100的部分组成结构示意图。
参考图1,手机100包括:射频(Radio Frequency,RF)电路110、存储器120、输入单元130、显示单元140、传感器150、音频电路160以及处理器170等部件。其中,RF电路110、存储器120、输入单元130、显示单元140、传感器150、音频电路160以及处理器170通过通信总线180相连。
本领域技术人员可以理解,图1中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图1对手机100的各个构成部件进行具体的介绍:
RF电路110可用于收发信息,或通话过程中,信号的接收和发送。如,基于该RF电路可以实现与其他手机或者终端的语音通话或者通信。
存储器120可用于存储软件程序以及模块。如,存储器可以存储本申请所涉及到的语音转换程序等软件程序数据,以及语音信号、由语音信号所转换出的文本等数据。该存储器120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元130可用于接收输入的数字或字符信息,以及产生与手机100的用户设置以及功能控制有关的键信号输入。具体地,输入单元130可包括触控面板以及其他输入设备。触控面板也称为触摸屏,可收集用户在其上或附近的触摸操作,并根据预先设定的程序驱动相应的连接装置。除了触控面板,输入单元130还可以包括其他输入设备。具体地,其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键、返回键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元140可用于显示由用户输入的信息或输出的图像、文本等等信息。显示单元140可包括显示面板。进一步的,触控面板可覆盖显示面板,当触控面板检测到在其上或附近的触摸操作后,传送给处理器180以确定触摸事件的类型,随后处理器180根据触摸事件的类型在显示面板上提供相应的视觉输出。虽然在图1中,触控面板与显示面板是作为两个独立的部件来实现手机100的输入和输入功能,但是在某些实施例中,可以将触控面板与显示面板集成,而实现手机100的输入和输出功能。
手机100还可包括至少一种传感器150,比如光传感器、运动传感器以及其他传感器。
音频电路160可以连接有扬声器和麦克风,从而提供用户与手机100之间的音频接口。音频电路160可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,麦克风将收集的声音信号转换为电信号,由音频电路160接收后转换为音频数据,再将音频数据输出至RF电路110以发送给比如另一手机,或者将音频数据输出至存储器120以便进一步处理。
处理器170是手机100的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器120内的软件程序和/或模块,以及调用存储在存储器120内的数据,执行手机100的各种功能和处理数据,从而对手机进行整体监控。
在本申请实施例中,该处理器至少可以用于:检测到对所述终端中设置的指定按键的操作满足预设条件时,控制音频电路采集所述终端的音频采集区域内的语音信号,所述指定按键为在所述终端的任意界面均可以调用的按键;将采集到的所述语音信号转换为文本;控制显示单元在显示界面上展现文本操作框,并在所述文本操作框的文本展现区域中显示所述文本。
尽管未示出,手机100还可以包括GPS芯片等定位模块,摄像头、蓝牙模块等,在此不再赘述。
需要说明的是,以上仅仅是以终端为手机为例进行介绍,但是可以理解的是,当终端为其他移动终端或者智能设备时,终端的组成可以与手机的组成相似,在此不再赘述。
结合以上共性,下面对本申请一种语音处理方法进行介绍。
如,参见图2,其示出了本申请一种语音处理方法一个实施例的流程示意图,本实施例的方法由终端的操作***来执行,该终端具有显示界面,本实施例可以包括:
S201,检测到对终端中设置的指定按键的操作满足预设条件时,采集该终端的音频采集区域内的语音信号;
其中,指定按键为在终端的任意界面均可以调用的按键。该指定按键可以理解为终端的通用按键,其不同于终端中应用内所设置的功能按键,因此,可以在终端在运行任意应用的过程中,在任意应用的界面中或者在终端的主界面中均可以调用并操作该指定按键。如,该指定按键可以为终端中的桌面键(俗称的home键)、返回键(back键)、菜单键(menu键)等通用按键。
可以理解的是,为了能够在终端处于任意状态下,均能够便捷的触发启动语音信号的采集,该指定按键可以为终端上设置的物理按键,如,终端中设置的home键为物理按键时,则可以将该home键作为该指定按键。在该种情况下,在采集该终端周围的语音信号之前,还可以确定下终端当前所处的状态,如果终端处于运行状态,则可以直接启动音频电路,以采集终端周围的语音信号;如果终端处于锁屏或者待机状态,则终端可以自动执行解锁或者唤醒屏幕(唤醒终端,以使得终端处于运行状态),从而跳过用户手动解锁以及唤醒屏幕的操作,进而自动启动音频电路,采集该音频采集区域内的语音信号。
可见,在指定按键为物理按键的情况下,即使终端处于锁屏或者待机状态时,用户仍可以通过对该指定按键进行满足预设条件的操作,来触发终端启动语音采集功能,并及时采集输入到该终端的语音信号。
其中,该预设条件可以根据需要设定,只要能够与目前终端中常规的按键操作相区分即可。
如,该预设条件可以为触按该指定按键的时长超过预设时长,例如,触按该home键的时长超过预设时长。在该种情况下,只要满足该预设条件,便可以启动终端的音频电路采集向该终端输入的语音信号,直至指定时长内采集不到语音信号为止。
又如,该预设条件可以为触按该指定按键的时长超过预设时长,且该指定按键处于被触按状态,也就是说,只有按压该指定按键的时长超过预设时长,且该指定按键仍处于被按压的状态,则音频采集电路才会采集终端周围的语音信号。在该种情况下,当用户停止对该指定按键进行按压,则终端会终止采集该终端周围的语音信号,并最终完成一次语音转文本的操作。
其中,该终端的音频采集区域可以理解为该终端中周围可以采集到语音信号的区域,该音频采集区域的范围与该终端中音频电路采集语音信号的范围有关。
需要说明的是,在本申请实施例中该语音信号可以为终端的使用者向终端输入的语音信号。如,用户突然想到一些重要事情或者重要信息,则可以将自己的想法或者信息通过语音形式录入给终端,以便通过终端及时记录下用户所想到的想法或者重要信息所对应的语音,并后续及时以文本形式记录,进而可以进行相关的处理等等。该语音信号也可以是终端输出的语音信号,如,用户在利用该终端与其他终端进行语音通话过程中,接收并输出的语音信号;又如,用户利用终端收听节目过程中,播出的一些语音信号等等。
S202,将采集到的该语音信号转换为文本;
其中,该文本可以包括至少一个字符,如该字符可以为汉字、英文字母、数字等等。
可以理解的是,在步骤S201采集语音信号并完成所有语音信号的采集之后,可以再执行将该语音信号转换为文本。为了提高文本转换的及时性,在采集语音信号的过程中,可以同步执行将当前采集到的语音信号转换为文本的操作。
S203,在显示界面上展现文本操作框,并在该文本操作框的文本展现区域中显示该文本。
其中,该文本操作框内包括文本展现区域,在该文本展现区域可以展现由采集到的语音信号所转换出的文本。
可选的,该文本操作框中可以设置一些标注选项,如,可以设置为选中状态的方框等,这样,在终端生成多个文本操作框的情况下,用户可以根据需要标注比较关注的文本所在的文本操作框,或者是,标注已经处理或者需要处理的文本操作框等等。
如图3所示,其示出了在显示界面中展现出的文本操作框的示意图,由图3可以看出,该文本操作框301中包括文本展现区域302,在该文本展现区域显示有文本“测试一下,测试一下”。同时,该文本操作框上的底边上还设置有多个操作选项,其中,包括该标注选项303,在该图3中,该文本操作框的标注选项处于选中状态。
可以理解的是,为了能够使得用户可以及时、直观到了解到输入到终端的语音信号所转化出的文本信息,可以将该文本操作框展现在显示界面的顶层,从而使得文本操作框不被其他应用界面所遮挡。
可见,在本申请实施例中,由于该指定按键为在终端的任意界面均可以调用的通用按键,因此,无论终端处于任何界面状态下,均通过对该指定按键进行满足预设条件的操作,来触发终端将输入的语音信号转换为文本,并将文本显示在显示界面的文本操作框内。这样,如果用户希望记录某些想法或者重要信息,只需要对该终端中该指定按键的操作,并将想法或者重要信息的语音输入到终端,便可以完成对这些想法以及重要信息的及时记录,避免了复杂的输入以及应用查找等操作,提高了信息记录的及时性和便捷性。
同时,终端将用户关注的一些信息的语音信号转换为文本之后,也有利于用户基于这些文本,便捷的进行一些相关操作,如,基于该文本进行搜索查找,以便进一步详细了解该用户所关注的信息,例如,通过复制这些文本到搜索引擎中,实现对该文本相关信息的搜索;又如,将文本内容作为备忘进行存储、或者实现分享等等操作,从而避免了用户手动输入这些文本之后,再进行相关操作的复杂度。
为了进一步提高用户基于文本输入框内的文本进行关联操作的便捷性,下面以基于文本进行几种关联操作的情况进行介绍。
如,参见图4,其示出了本申请一种语音信号处理方法又一个实施例的流程示意图,本实施例的方法可以包括:
S401,检测到触按该终端中指定按键的时长超过预设时长,且该指定按键仍处于触按状态时,采集该终端的音频采集区域内的语音信号;
其中,指定按键为在终端的任意界面均可以调用的按键。
S402,将采集到的该语音信号转换为文本;
需要说明的是,为了便于理解本申请的方案,本实施例以一种预设条件为例进行介绍,但是对于其他预设条件,也同样适用于本实施例;相应的,以在显示界面顶层上展现文本操作框为例,但是对于其他情况同样适用于本实施例,在此不加以限制。
另外,以上步骤的具体实现可以参见前面实施例的相关介绍,在此不再赘述。
S403,检测该文本中包含的字符数量是否小于第一预设数量,如果是,则执行步骤S404;如果否,则执行步骤S406;
其中,该第一预设数量可以根据需要设定,如该第一预设数量可以为5个或者10个。
可以理解的是,语音信号所转换出的文本中所包含的字符数量可以为用户所需进行的关联操作提供依据,如,文本中包含的字符较少的情况下,用户可能会在终端本地搜索与文本相关的内容,例如,终端是否存在与该文本相关的应用;通讯录中是否存在与该文本相对应联系人,以便后续有些重要事情与联系人进行相关短消息或者通信交互等。又如,用户可能希望通过搜索引擎搜索该文本相关的介绍信息,以便及时了解该文本相关的信息等。
考虑到文本所包含的字符数量与采集到的语音信号的输入时长存在关联,如,一般情况下输入的语音信号的时长越长,语音信号中所包含的信息越多,所转换出的文本中字符数量也就越多,因此,也可以判断采集到的语音信号的总输入时长是否小于第一预设时长,如,预设时长可以为5秒,如果小于第一预设时长,则执行步骤S405,否则执行步骤S407。
其中,该步骤S403可以在将输入的所有语音信号均转换为文本之后执行。
S404,调用终端的通讯录应用从通讯录中搜索该文本,并调用终端中的搜索引擎搜索该文本;
如果通讯录的联系人中存在与该文本匹配的联系人信息,则可以搜索到该联系人的信息,并将该联系人的信息作为搜索结果。例如,文本为“张三”,如果通讯录中存在联系人“张三丰”“张三”等,就可以得到相应的联系人的搜索结果。
其中,该搜索引擎可以为终端指定的搜索引擎,也可以是任意的一个搜索引擎,如,该搜索引擎可以为终端中已安装的搜索引擎应用,也可以是通过终端的浏览器所访问的搜索引擎。
S405,在显示界面顶层上展现通讯录应用的搜索结果、该搜索引擎的搜索结果以及文本操作框,并在该文本操作框的文本展现区域中显示该文本。
其中,将通讯录应用搜索到的与该文本相关的联系人信息即为该通讯录应用的搜索结果。而通过搜索引擎对该文本进行搜索,可以得到相应的搜索结果页面,将该搜索结果页面或者对该搜索结果页面的截图作为搜索结果。这样,显示界面顶层可以同时显示该通讯录应用以及该搜索引擎应用对文本的搜索结果,以及该文本操作框。
如,在文本操作框的同时,可以分别采用不同的显示框分别显示该搜索引擎的搜索结果以及该通讯录应用的搜索结果。
例如,可以参见图5,其示出了本申请将语音信号转换为文本的一个结果页面的示意图,由图5可以看出,在显示界面中不仅显示有包含有文本“注销”的文本操作框501,还可以有通讯录应用对“注销”搜索得到的联系人的搜索结果502,如图5中联系人“朱销*”,同时,还包括搜索引擎搜索“注销”所得到的搜索结果503。在图5中采用不同的显示窗口或者说显示框分别显示搜索出的联系人以及搜索引擎的搜索结果。
S406,检测该文本操作框内文本中包含的字符数量是否小于第二预设数量,如果是,则执行步骤S407,如果否,则执行步骤S409;
其中,该第二预设数量大于该第一预设数量。如,该第二预设数量可以为20个。
与步骤S403相似,该步骤也可以是检测或者判断采集到的语音信号的总输入时长是否小于第二预设时长,其中,该第二预设时长大于第一预设时长,如,第二预设时长为15秒,如果生成该文本操作框所对应的语音信号的总输入时长小于该第二预设时长,则执行步骤S407,否则,仅仅展现该文本操作框,并在文本操作框内显示该文本。
可以理解的是,在文本中包含的字符数量大于第一预设数量时,则说明该文本中字符的数量会大于通讯录中联系人所对应的字符数量,在该种情况下,用户基于该文本搜索联系人的可能性较小,因此,可以仅仅执行步骤S407中调用搜索引擎对文本进行搜索即可。相应的,如果文本中包含的字符数量较多,则用户利用搜索引擎搜索这些文本的可能性也较小,在该种情况下可以不进行对文本的搜索,则仅仅展现出该文本操作框。
S407,调用终端中的搜索引擎搜索该文本操作框中的文本;
S408,在显示界面顶层上展现该搜索引擎的搜索结果以及文本操作框,并在该文本操作框的文本展现区域中显示该文本。
该步骤S408与步骤S405相似,不同之处仅在于该显示界面顶层不包含通讯录应用的搜索结果,假设以图5为例,则显示界面中可以仅仅包括文本操作框501以及搜索引擎的搜索结果503,而不包含通讯录的搜索结果502。
S409,在显示界面上展现文本操作框,并在该文本操作框的文本展现区域中显示该文本。
需要说明的是,在本实施例中,该步骤S403和步骤S406的检测字符数量仅仅是一种实施方式,其目的是为了根据字符数量来判断所需启动的搜索方式,但是可以理解的是,无论文本中包含的字符数量的多少,均可以根据需要触发对该文本的搜索,并将对文本的搜索结果与文本操作框同时显示在显示界面中,因此,在实际应用中,终端的操作***触发搜索该文本之前,也可以不执行检测字符数量与预设数量的大小关系,则直接根据需要调用一个或多个指定应用来分别搜索该文本,并在显示界面中分别展现每个应用对该文本的搜索结果。
可以理解的是,本实施例是以调用终端中指定应用搜索文本为例进行说明,但是可以理解的是,终端所调用的指定应用并不限于以上所描述的通讯录以及搜索引擎,在实际应用中,还可以有调用其他应用来实现对文本的搜索。
另外,除了调用应用对文本搜索之外,终端搜索该文本的方式可以为:该终端的操作***基于该文本进行搜索。如,操作***从该终端已安装的应用中,搜索是否存在应用名称与该文本相匹配的目标应用;当搜索到该目标应用,在显示界面中展现出该目标应用的图标,从而使得显示界面中同时显示文本操作框以及搜索出的该目标应用的图标。相应的,当检测到点击该显示界面中展现的该目标应用的图标之后,启动该目标应用。
例如,假设搜索到的目标应用为一款即时通讯应用,则显示界面中可以显示出该即时通讯应用的图标,如果用户点击该即时通讯应用的图标,则操作***会启动该即时通讯应用。
当然,操作***基于该文本进行搜索并不限于搜索终端中是否存在与该文本相匹配的应用,还可以有基于该文本进行其他搜索,在此不加以限制。
可以理解的是,文本操作框中也可以存在一些用于触发对该文本操作框或者文本操作框内的文本进行一些关联操作的操作项,如,前面提到的标注选项。
下面以基于文本操作框中设置的操作项,来实现对文本操作框或者文本操作框内的文本进行关联操作为例进行介绍。
考虑到用户很可能希望将文本操作框内的文本保存或者分享到其他应用中,在该文本操作框中可以设置有用于触发对该文本操作框内的文本进行分享的分享操作项。用户通过对该分享操作项进行点击或者触摸等选择操作,便可以触发执行分享操作。如,参见图6,其示出了本申请一种语音处理方法又一个实施例的流程示意图,本实施例的方法可以包括:
S601,检测到触按该终端中指定按键的时长超过预设时长,且该指定按键仍处于触按状态时,采集该终端的音频采集区域内的语音信号;
其中,指定按键为在终端的任意界面均可以调用的按键。
S602,将采集到的该语音信号转换为文本;
S603,调用至少一款指定应用对语音信号转换出的文本进行搜索;
其中,在本实施例中,该步骤S603为可选步骤,可以根据需要执行或者不执行。另外,步骤S603仅仅是以对文本搜索的一种方式为例进行说明,对于其他搜索方式也同样适用于本实施例,具体可以参见前面图4实施例的相关介绍,在此不再赘述。
S604,在显示界面顶层分别显示文本操作框以及该至少一款指定应用对该文本的搜索结果,并在该文本操作框的文本展现区域中显示该文本。
其中,该文本操作框显示有用于触发对该文本操作框内的文本进行分享的分享操作项。
S605,在检测到对该文本操作框中该分享操作项的触发操作的情况下,展现可分享列表;
其中,该可分享列表包括多种分享方式的选项。每种分享方式的选项用于触发一种分享方式,如,分享方式可以包括以下任意一种多种:
用于将该文本复制到预设的文本编辑界面的分享方式,如预设的文本编辑界面可以为文本文档的编辑页面,短消息的编辑页面等等;
用于将文本对应的语音信号保存到录音应用对应的存储区域的分享方式;
用于将文本备份到便签中,以将文本作为便签中备忘信息的分享方式;
用将文本发送给即时通讯好友的分享方式;
用于将文本分享到即时通讯应用的分享空间的分享方式。
当然,以上仅仅是以集中分享方式所对应的选项为例进行介绍,在实际应用中可以根据需要设置更多或更少的分享方式。
为了便于理解,可以参见图7,其示出了点击文本操作框中的分享操作项之后,在显示界面中弹出的可分享列表的一种示意图。由图7可以看出,该可分享列表701中可以包括多种分享方式的选项702,如,该可分享列表中第一行第一个图标表示用于将文本复制到文本文档的分享方式。又如,该分享列表中第二行第二个分享方式,表示用于将文本发送给即时通讯好友。
S606,当检测到对该可分享列表中的分享方式的选择操作时,确定该选择操作所选择的目标分享方式,并向该目标分享方式所关联的目标应用发送包含该文本的分享指令。
其中,该选择操作的具体方式可以根据需要设定,如,可以为点击、按压或者触摸该分享方式选项。
为了便于区分,本申请实施例将该选择操作所选择出分享方式称为目标分享方式。可以理解的是,每种分享方式关联有一个应用,以通过该应用实现该分享方式,如,分享方式为用于将文本分享到即时通讯应用的分享空间的分享方式,那么该分享方式所关联的应用为即时通讯应用。在本申请实施例中将该目标分享方式所关联的应用称为目标应用。
其中,该分享指令用于指示该目标应用按照该目标分享方式,将该文本粘贴到该目标分享方式所指定的区域。如,以用于将文本分享到即时通讯应用的分享空间的分享方式为例进行说明,终端的操作***可以向该即时通讯应用发送分享指令,以指示即时通讯应用将该文本粘贴到该终端的用户所对应的分享空间中发布消息的编辑窗口中。又如,以用于将文本发送给即时通讯好友为例,则即时通讯应用响应于该分享指令,展现出可供用户选择的好友,从而在用户选择了一个需要分享该文本的好友之后,即时通讯应用将该文本粘贴到与该好友交互的消息编辑窗口。
在实际应用中,在显示界面展现该文本操作框,特别是,文本操作框处于显示界面顶层的情况下,就可能会影响到用户操作终端的其他应用,或者观看终端中的其他展现内容等,为了能够使得用户可以对文本操作框之外的内容进行处理,在该文本操作框中还可以设置有:用于触发收缩该文本操作框的收缩操作项。如图3中文本操作框下方展现出的收缩操作项304。相应的,终端的操作***在检测到对该收缩操作项的触发操作的情况下,隐藏该文本操作框。其中,触发操作可以为点击或触摸该收缩操作项。其中,隐藏该文本操作框是使得该文本操作框不对遮挡显示界面中的其他内容,如,隐藏该文本操作框可以是将该文本操作框设置为处于后台运行状态;或者是将文本操作框设置为最小化状态。
如,在对图3中文本操作框内的收缩操作框304进行触按之后,该文本操作框处于最小化状态,从而呈现出图8中文本操作框对应的最小化状态的显示状态802。可以理解的是,在图8中是为了对比正常显示状态的文本操作框与收缩后的文本操作框,以在该显示界面中展现了多个文本操作框为例进行介绍,由图8可知,在显示界面最上面的一个文本操作框处于最小化状态,从而使得文本操作框只显示出一个条框802,而正常显示状态的文本操作框801则占据较大的显示面积。
可以理解的是,每次检测到对指定按键满足预设条件的操作时,都会采集语音信号,并将语音信号转换为文本,而不同次转换出的文本展现在不同的文本操作框内,因此,在显示界面中可以同时展现多个文本操作框。
需要说明的是,在展现文本操作框的同时,如果同时展现出于该文本操作框对应的指定应用的搜索结果,那么在检测到对该文本操作框内的收缩操作项的触发操作时,在将文本操作设置为隐藏状态的同时,还可以将该文本操作框对应的指定应用的搜索结果也设置为处于隐藏状态,或者直接删除该指定应用的搜索结果。
相应的,在文本操作框处于隐藏状态下,检测到对用于触发展现该文本操作框的扩展操作项时,在显示界面或者显示界面顶层中展现该文本操作框。如图8中,处于最小化后的文本操作框中的“>”可以表示扩展操作项,当点击该图标时,可以恢复该文本操作框在显示界面的正常展现状态。
可以理解的是,在文本操作框中还可以用于触发删除该文本操作框的删除选项,以及用于触发对该文本操作框进行相关设置的设置选项等等,在此不加以限制。
可以理解的是,除了通过文本操作框上的操作项来触发对文本操作框或者文本操作框内的文本进行一些相关处理之外,在本申请实施例中,还可以直接通过拖拽该文本操作框来实现将文本操作框内的文本复制到其他可以编辑文本的文本编辑应用。
具体的,在以上任意一个实施例中,在展现出文本操作框之后,如果检测到启动用于编辑文本的文本编辑应用的操作指令时,可以展现该文本编辑应用的文本编辑界面,该文本编辑界面包括至少一个文本编辑区。如,该文本编辑应用可以为短信应用,则该文本编辑界面可以为短信编辑界面,在该短信编辑界面中有短信息编辑区以及接收人填写区等组成。又如,文本编辑应用可以为一个用于记录信息的便签(也可以称为备忘录),则该文本编辑界面可以为便签生成界面,在该便签生成界面可以至少一个待生成的空白便签,在空白便签中进行信息输入就可以生成便签。
特别的,在显示界面展现该文本操作框的情况下,可以先将文本操作框设置为处于最小化状态,然后再启动该文本操作界面。
可以理解的是,在实际应用中,如果在生成文本操作框之前,已经启动并打开该文本编辑应用,且在显示界面上展现了该文本编辑应用的文本编辑界面,则无需在重复打开该文本编辑界面。
相应的,当检测到对该文本操作框的指定拖拽操作时,可以从该文本编辑界面的至少一个文本编辑区中,确定该指定拖拽操作的终止点所在的目标文本编辑区,并将该文本操作框内的文本复制到目标文本编辑区内,从而无需用户手动向该目标文本编辑区内输入所需记录的文本。
其中,该指定拖拽操作用于将文本操作框或者文本操作框内的文本拖拽到文本编辑区。
为了便于理解,假设需要将文本操作框内的文本复制并粘贴到便签中,以生成用户记录该文本的便签为例进行说明。
假设需要将前面图3中所生成的包含“测试一下,测试一下”的文本操作框中的文本“测试一下,测试一下”生成一条便签,那么在展现出该文本操作框之后,用户可以打开便签,以展现出便签的应用,如先将便签设置为最小化状态,然后再启动并打开便签的便签编辑界面。在便签编辑界面中,通过将该文本操作框(处于最小化状态下或者正常显示状态的文本操作框)进行拖拽,并将该文本操作框拖拽到该便签中的空白便签处,在该种情况下,操作***会将文本操作框所包含的文本发送给便签,并由便签将该文本粘贴到该空白便签处,从而生成一条包含该“测试一下,测试一下”的便签,从而使得用户只需要保存该便签便可以生成相应的备忘,而无需用户手动输入便签中的文本。
如,参见图9a所示,在便签编辑页面中拖拽“测试一下,测试一下”这个文本操作框901之后,在文本编辑页面的空白便签902中会出现“拖拽至此,生成便签”的提示信息,这样,将该文本操作框拖到该空白便签所在维持处,则可以触发生成一条内容为“测试一下,测试一下”的待保存的便签,如图9b所示。
对应本申请的一种语音处理方法,本申请实施例还提供了一种语音处理装置。
如,参见图10,其示出了本申请一种语音处理方法又一个实施例的组成结构示意图,本实施例的装置可以包括:
语音采集单元1001,用于检测到对所述终端中设置的指定按键的操作满足预设条件时,采集所述终端的音频采集区域内的语音信号,所述指定按键为在所述终端的任意界面均可以调用的按键;
文本转换单元1002,用于将采集到的所述语音信号转换为文本;
文本显示单元1003,用于在显示界面上展现文本操作框,并在所述文本操作框的文本展现区域中显示所述文本。
在一种可能的设计中,所述装置还可以包括:
文本搜索单元,用于在所述文本显示单元在显示界面上展现文本操作框之前,搜索所述文本;
搜索结果展现单元,用于在所述文本显示单元在所述在显示界面上展现文本操作框的同时,将对所述文本的搜索结果显示在所述显示界面上。
在一种可能的实现方式中,所述文本搜索单元包括:
第一文本搜索单元,用于调用所述终端中至少一款指定应用搜索所述文本。
可选的,所述第一文本搜索单元具体包括以下一种或多种情况:
调用所述终端中的搜索引擎搜索所述文本;
调用所述终端中的通讯录应用从通讯录中搜索所述文本。
在又一种可能的实现方式中,所述文本搜索单元,包括:
第二本文搜索单元,用于从所述终端已安装的应用中,搜索是否存在应用名称与所述文本相匹配的目标应用;
相应的,所述搜索结果展现单元具体为,用于在所述文本显示单元在所述在显示界面上展现文本操作框的同时,当搜索到所述目标应用,在所述显示界面中展现出所述目标应用的图标。
可选的,所述装置还可以包括:应用启动响应单元,用于在文本显示单元在所述显示界面中展现出所述目标应用的图标之后,当检测到点击所述显示界面中展现的所述目标应用的图标之后,启动所述目标应用。
在又一种可能的设计中,所述文本显示单元显示出的所述文本操作框中还显示有用于触发分享所述文本的分享操作项;
相应的,所述装置还包括:
列表展现单元,用于在所述文本显示大院在所述文本操作框的文本展现区域中显示所述文本之后,在检测到对所述分享操作项的触发操作的情况下,展现可分享列表,所述可分享列表包括多个分享方式选项;
文本分享单元,用于当检测到对所述可分享列表中的所述分享方式选项的选择操作时,确定所述选择操作所选择的目标分享方式,并向所述目标分享方式所关联的目标应用发送包含所述文本的分享指令,所述分享指令用于指示所述目标应用按照所述目标分享方式,将所述文本粘贴到所述目标分享方式所指定的区域。
在又一种可能的设计中,所述装置还可以包括:
编辑界面展现单元,用于在所述文本显示单元在所述文本操作框的文本展现区域中显示所述文本之后,在检测到启动用于编辑文本的文本编辑应用的操作指令时,展现所述文本编辑应用的文本编辑界面,所述文本编辑界面包括至少一个文本编辑区;
文本粘贴单元,用于当检测到对所述文本操作框的指定拖拽操作时,从所述文本编辑界面的至少一个文本编辑区中,确定出所述指定拖拽操作的终止点所在的目标文本编辑区,并将所述文本操作框内的文本复制到所述目标文本编辑区内,所述指定拖拽操作用于将所述文本操作框或者文本操作框内的文本拖拽到文本编辑区。
在又一种可能的设计中,所述文本操作框中还显示有用于触发收缩所述文本操作框的收缩操作项;
所述装置还可以包括:
文本隐藏单元,用于在所述文本显示单元在所述文本操作框的文本展现区域中显示所述文本之后,在检测到对所述收缩操作项的触发操作的情况下,隐藏所述文本操作框;
文本恢复单元,用于在文本操作框处于隐藏状态下,检测到对用于触发展现该文本操作框的扩展操作项时,在所述显示界面中展现所述文本操作框。
可选的,在以上实施例中,所述文本显示单元在显示界面上展现文本操作框,具体为:在所述显示界面顶层展现所述文本操作框。
可选的,所述指定按键为指定物理按键;
所述装置还包括:
状态确定单元,用于在所述语音采集单元采集所述终端的音频采集区域内的语音信号之前,确定所述终端当前所处的状态;且,在所述终端处于运行状态的情况下,执行所述采集所述终端的音频采集区域内的语音信号的操作;在所述终端处于锁屏或者待机状态下,则解锁或者唤醒所述终端,并执行所述采集所述终端的音频采集区域内的语音信号的操作。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (17)
1.一种语音处理方法,用于具有显示界面的终端,其特征在于,包括:
检测到对所述终端中设置的指定按键的操作满足预设条件时,采集所述终端的音频采集区域内的语音信号,所述指定按键为在所述终端的任意界面均可以调用的按键;
将采集到的所述语音信号转换为文本;
在所述显示界面上展现文本操作框,并在所述文本操作框的文本展现区域中显示所述文本。
2.根据权利要求1所述的语音处理方法,其特征在于,在所述在显示界面上展现文本操作框之前,还包括:
搜索所述文本;
在所述在显示界面上展现文本操作框,并在所述文本操作框的文本展现区域中显示所述文本的同时,还包括:
将对所述文本的搜索结果显示在所述显示界面上。
3.根据权利要求2所述的语音处理方法,其特征在于,所述搜索所述文本包括:
调用所述终端中至少一款指定应用搜索所述文本。
4.根据权利要求3所述的语音处理方法,其特征在于,所述调用至少一个指定应用搜索所述文本包括以下一种或多种:
调用所述终端中的搜索引擎搜索所述文本;
调用所述终端中的通讯录应用从通讯录中搜索所述文本。
5.根据权利要求2所述的语音处理方法,其特征在于,所述搜索所述文本,包括:
从所述终端已安装的应用中,搜索是否存在应用名称与所述文本相匹配的目标应用;
所述将对所述文本的搜索结果显示在所述显示界面上,包括:
当搜索到所述目标应用,在所述显示界面中展现出所述目标应用的图标。
6.根据权利要求5所述的语音处理方法,其特征在于,在所述显示界面中展现出所述目标应用的图标之后,还包括:
当检测到点击所述显示界面中展现的所述目标应用的图标之后,启动所述目标应用。
7.根据权利要求1至6任一项所述的语音处理方法,其特征在于,所述文本操作框中还显示有用于触发分享所述文本的分享操作项;
在所述文本操作框的文本展现区域中显示所述文本之后,还包括:
在检测到对所述分享操作项的触发操作的情况下,展现可分享列表,所述可分享列表包括多个分享方式选项;
当检测到对所述可分享列表中的所述分享方式选项的选择操作时,确定所述选择操作所选择的目标分享方式,并向所述目标分享方式所关联的目标应用发送包含所述文本的分享指令,所述分享指令用于指示所述目标应用按照所述目标分享方式,将所述文本粘贴到所述目标分享方式所指定的区域。
8.根据权利要求1至6任一项所述的语音处理方法,其特征在于,在所述文本操作框的文本展现区域中显示所述文本之后,还包括:
在检测到启动用于编辑文本的文本编辑应用的操作指令时,展现所述文本编辑应用的文本编辑界面,所述文本编辑界面包括至少一个文本编辑区;
当检测到对所述文本操作框的指定拖拽操作时,从所述文本编辑界面的至少一个文本编辑区中,确定出所述指定拖拽操作的终止点所在的目标文本编辑区,并将所述文本操作框内的文本复制到所述目标文本编辑区内,所述指定拖拽操作用于将所述文本操作框或者文本操作框内的文本拖拽到文本编辑区。
9.根据权利要求1至6任一项所述的语音处理方法,其特征在于,所述文本操作框中还显示有用于触发收缩所述文本操作框的收缩操作项;
在所述文本操作框的文本展现区域中显示所述文本之后,还包括:
在检测到对所述收缩操作项的触发操作的情况下,隐藏所述文本操作框;
在文本操作框处于隐藏状态下,检测到对用于触发展现该文本操作框的扩展操作项时,在所述显示界面中展现所述文本操作框。
10.根据权利要求1至6任一项所述的语音处理方法,其特征在于,所述在显示界面上展现文本操作框,包括:
在所述显示界面顶层展现所述文本操作框。
11.根据权利要求1至6任一项所述的语音处理方法,其特征在于,所述指定按键为指定物理按键;
在所述采集所述终端的音频采集区域内的语音信号之前,还包括:
确定所述终端当前所处的状态;
在所述终端处于运行状态的情况下,则执行所述采集所述终端的音频采集区域内的语音信号的操作;
在所述终端处于锁屏或者待机状态下,则解锁或者唤醒所述终端,并执行所述采集所述终端的音频采集区域内的语音信号的操作。
12.一种语音处理装置,其特征在于,包括:
语音采集单元,用于检测到对所述终端中设置的指定按键的操作满足预设条件时,采集所述终端的音频采集区域内的语音信号,所述指定按键为在所述终端的任意界面均可以调用的按键;
文本转换单元,用于将采集到的所述语音信号转换为文本;
文本显示单元,用于在显示界面上展现文本操作框,并在所述文本操作框的文本展现区域中显示所述文本。
13.根据权利要求12所述的语音处理装置,其特征在于,还包括:
文本搜索单元,用于在所述文本显示单元在显示界面上展现文本操作框之前,搜索所述文本;
搜索结果展现单元,用于在所述文本显示单元在所述在显示界面上展现文本操作框的同时,将对所述文本的搜索结果显示在所述显示界面上。
14.根据权利要求13所述的语音处理装置,其特征在于,所述文本搜索单元包括:
第一文本搜索单元,用于调用所述终端中至少一款指定应用搜索所述文本。
15.根据权利要求13所述的语音处理装置,其特征在于,所述文本搜索单元,包括:
第二本文搜索单元,用于从所述终端已安装的应用中,搜索是否存在应用名称与所述文本相匹配的目标应用;
所述搜索结果展现单元具体为,用于在所述文本显示单元在所述在显示界面上展现文本操作框的同时,当搜索到所述目标应用,在所述显示界面中展现出所述目标应用的图标。
16.根据权利要求12至15任一项所述的语音处理装置,其特征在于,所述文本显示单元显示出的所述文本操作框中还显示有用于触发分享所述文本的分享操作项;
所述装置还包括:
列表展现单元,用于在所述文本显示大院在所述文本操作框的文本展现区域中显示所述文本之后,在检测到对所述分享操作项的触发操作的情况下,展现可分享列表,所述可分享列表包括多个分享方式选项;
文本分享单元,用于当检测到对所述可分享列表中的所述分享方式选项的选择操作时,确定所述选择操作所选择的目标分享方式,并向所述目标分享方式所关联的目标应用发送包含所述文本的分享指令,所述分享指令用于指示所述目标应用按照所述目标分享方式,将所述文本粘贴到所述目标分享方式所指定的区域。
17.根据权利要求12至15任一项所述的语音处理装置,其特征在于,还包括:
编辑界面展现单元,用于在所述文本显示单元在所述文本操作框的文本展现区域中显示所述文本之后,在检测到启动用于编辑文本的文本编辑应用的操作指令时,展现所述文本编辑应用的文本编辑界面,所述文本编辑界面包括至少一个文本编辑区;
文本粘贴单元,用于当检测到对所述文本操作框的指定拖拽操作时,从所述文本编辑界面的至少一个文本编辑区中,确定出所述指定拖拽操作的终止点所在的目标文本编辑区,并将所述文本操作框内的文本复制到所述目标文本编辑区内,所述指定拖拽操作用于将所述文本操作框或者文本操作框内的文本拖拽到文本编辑区。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710317737.XA CN108874797B (zh) | 2017-05-08 | 2017-05-08 | 语音处理方法和装置 |
US15/971,347 US20180322873A1 (en) | 2017-05-08 | 2018-05-04 | Speech processing method and speech processing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710317737.XA CN108874797B (zh) | 2017-05-08 | 2017-05-08 | 语音处理方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108874797A true CN108874797A (zh) | 2018-11-23 |
CN108874797B CN108874797B (zh) | 2020-07-03 |
Family
ID=64014890
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710317737.XA Active CN108874797B (zh) | 2017-05-08 | 2017-05-08 | 语音处理方法和装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20180322873A1 (zh) |
CN (1) | CN108874797B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109699010A (zh) * | 2019-01-31 | 2019-04-30 | 秒针信息技术有限公司 | 语音信息的处理方法、装置、存储介质及电子装置 |
CN112732139A (zh) * | 2021-01-12 | 2021-04-30 | Oppo广东移动通信有限公司 | 录音处理方法、装置、移动终端及存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101605171A (zh) * | 2008-06-09 | 2009-12-16 | Lg电子株式会社 | 移动终端及其中的文本校正方法 |
CN101963966A (zh) * | 2009-07-24 | 2011-02-02 | 李占胜 | 一种为搜索结果添加标签的搜索结果分类方法 |
CN102915733A (zh) * | 2011-11-17 | 2013-02-06 | 微软公司 | 交互式语音识别 |
CN102984666A (zh) * | 2012-11-19 | 2013-03-20 | 东软集团股份有限公司 | 一种通话过程中的通讯录语音信息处理方法及*** |
US20130111338A1 (en) * | 2011-10-31 | 2013-05-02 | International Business Machines Corporation | Inputting in a Textbox |
CN103269395A (zh) * | 2013-04-22 | 2013-08-28 | 聚熵信息技术(上海)有限公司 | 基于锁屏状态下的语音控制方法及其装置 |
CN103280217A (zh) * | 2013-05-02 | 2013-09-04 | 锤子科技(北京)有限公司 | 一种移动终端的语音识别方法及其装置 |
WO2015036817A1 (en) * | 2013-09-15 | 2015-03-19 | Yogesh Chunilal Rathod | Structured updated status, requests, user data & programming based presenting & accessing of connections |
CN105988581A (zh) * | 2015-06-16 | 2016-10-05 | 乐卡汽车智能科技(北京)有限公司 | 一种语音输入方法及装置 |
CN106489129A (zh) * | 2016-09-29 | 2017-03-08 | 北京小米移动软件有限公司 | 一种内容分享的方法及装置 |
-
2017
- 2017-05-08 CN CN201710317737.XA patent/CN108874797B/zh active Active
-
2018
- 2018-05-04 US US15/971,347 patent/US20180322873A1/en not_active Abandoned
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101605171A (zh) * | 2008-06-09 | 2009-12-16 | Lg电子株式会社 | 移动终端及其中的文本校正方法 |
CN101963966A (zh) * | 2009-07-24 | 2011-02-02 | 李占胜 | 一种为搜索结果添加标签的搜索结果分类方法 |
US20130111338A1 (en) * | 2011-10-31 | 2013-05-02 | International Business Machines Corporation | Inputting in a Textbox |
CN102915733A (zh) * | 2011-11-17 | 2013-02-06 | 微软公司 | 交互式语音识别 |
CN102984666A (zh) * | 2012-11-19 | 2013-03-20 | 东软集团股份有限公司 | 一种通话过程中的通讯录语音信息处理方法及*** |
CN103269395A (zh) * | 2013-04-22 | 2013-08-28 | 聚熵信息技术(上海)有限公司 | 基于锁屏状态下的语音控制方法及其装置 |
CN103280217A (zh) * | 2013-05-02 | 2013-09-04 | 锤子科技(北京)有限公司 | 一种移动终端的语音识别方法及其装置 |
WO2015036817A1 (en) * | 2013-09-15 | 2015-03-19 | Yogesh Chunilal Rathod | Structured updated status, requests, user data & programming based presenting & accessing of connections |
CN105988581A (zh) * | 2015-06-16 | 2016-10-05 | 乐卡汽车智能科技(北京)有限公司 | 一种语音输入方法及装置 |
CN106489129A (zh) * | 2016-09-29 | 2017-03-08 | 北京小米移动软件有限公司 | 一种内容分享的方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109699010A (zh) * | 2019-01-31 | 2019-04-30 | 秒针信息技术有限公司 | 语音信息的处理方法、装置、存储介质及电子装置 |
CN112732139A (zh) * | 2021-01-12 | 2021-04-30 | Oppo广东移动通信有限公司 | 录音处理方法、装置、移动终端及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US20180322873A1 (en) | 2018-11-08 |
CN108874797B (zh) | 2020-07-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10275295B2 (en) | Method and apparatus for presenting clipboard contents on a mobile terminal | |
US9003283B2 (en) | Copying text using parameters displayed on a clipboard | |
CN109683761B (zh) | 内容收藏方法、装置及存储介质 | |
CN103811005B (zh) | 移动终端及其控制方法 | |
CN109981878A (zh) | 一种图标管理的方法及装置 | |
CN106780685B (zh) | 一种动态图片的生成方法及终端 | |
WO2019062910A1 (zh) | 一种复制和粘贴的方法、数据处理装置和用户设备 | |
CN107329743A (zh) | 应用页面的展示方法、装置及存储介质 | |
CN107637055A (zh) | 用于提供通知并与通知进行交互的设备、方法和图形用户界面 | |
US8966399B2 (en) | Graphical menu interface, implementing method thereof, and operating method thereof | |
EP2811388A2 (en) | Portable terminal and user interface method in portable terminal | |
CN109960446A (zh) | 一种控制被选中对象在应用界面中显示的方法及终端设备 | |
DE202008000268U1 (de) | Tragbare Multifunktionsvorrichtung | |
CN106878543A (zh) | 一种终端操作管理方法、装置及终端 | |
WO2021135578A1 (zh) | 页面处理方法、装置、存储介质及终端设备 | |
CN109190076B (zh) | 页面收藏方法、装置、存储介质和电子设备 | |
CN105045504A (zh) | 图像内容提取方法及装置 | |
CN104503690A (zh) | 一种应用图标的排列方法及装置 | |
CN106547676A (zh) | 一种用户操作录制方法及终端 | |
CN109871358A (zh) | 一种管理方法及终端设备 | |
CN109240785A (zh) | 一种设置语言的方法、终端及存储介质 | |
CN104636170A (zh) | 应用程序的获取方法及装置、电子设备 | |
CN111274564A (zh) | 通信终端及分屏模式下的应用解锁方法 | |
CN114020197A (zh) | 跨应用的消息的处理方法、电子设备及可读存储介质 | |
CN103294351B (zh) | 一种显示方法和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20190122 Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing. Applicant after: BEIJING ZIJIE TIAODONG NETWORK TECHNOLOGY CO., LTD. Address before: Room 309 and 310, Building 3, 33 D, 99 Kechuang 14th Street, Beijing Economic and Technological Development Zone, 100176 Applicant before: Beijing hammer numeral science and technology company limited |
|
GR01 | Patent grant | ||
GR01 | Patent grant |