CN108965584A - 一种语音信息的处理方法、装置、终端和存储介质 - Google Patents

一种语音信息的处理方法、装置、终端和存储介质 Download PDF

Info

Publication number
CN108965584A
CN108965584A CN201810643703.4A CN201810643703A CN108965584A CN 108965584 A CN108965584 A CN 108965584A CN 201810643703 A CN201810643703 A CN 201810643703A CN 108965584 A CN108965584 A CN 108965584A
Authority
CN
China
Prior art keywords
voice messaging
terminal equipment
user
voice
present terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810643703.4A
Other languages
English (en)
Inventor
门文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201810643703.4A priority Critical patent/CN108965584A/zh
Publication of CN108965584A publication Critical patent/CN108965584A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72433User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • H04M1/72454User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to context-related or environment-related conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72484User interfaces specially adapted for cordless or mobile telephones wherein functions are triggered by incoming communication events
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/12Details of telephonic subscriber devices including a sensor for measuring a physical value, e.g. temperature or motion

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Environmental & Geological Engineering (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例公开了一种语音信息的处理方法、装置、终端和存储介质。该方法包括:检测输入法面板是否被激活;在检测到输入法面板被激活后,获取当前终端设备的传感器数据;根据传感器数据确定是否检测到语音触发事件发生;在确定检测到语音触发事件发生时,开启当前终端设备的语音录音功能。通过采用上述技术方案,避免了使用输入法的语音功能时对用户手动操作的依赖性,简化了输入法语音功能的使用流程,提升了语音功能的使用体验。

Description

一种语音信息的处理方法、装置、终端和存储介质
技术领域
本发明实施例涉及电子技术领域,尤其涉及一种语音信息的处理方法、装置、终端和存储介质。
背景技术
随着科技的进步,智能手机已经成为现代人们日常生活中必备的通讯工具,人们常用智能手机发送短信、聊天、上网或者编辑文档等,在此过程中,各种输入法软件成为了用户通信和交流必不可少的工具。
现有输入法软件的使用一般都是通过用户手动操作键盘或触摸屏的方式进行输入,或者也可通过语音识别技术进行语音输入。而目前输入法的语音功能都是输入法的语音浮层或语音面板,用户在使用语音功能时,需要接触点击输入法面板中的某个区域触发语音功能,例如需要执行点击、滑动或长按等操作触发语音录音按键开始录音过程。在用户完成语音输入后,还需主动点击发送才能将录入的语音信息发出。
因此,在现有输入法软件的使用过程中,无论是手动输入方式还是语音输入方式,都需要依靠用户点击或其他操作来完成,对用户操作的依赖性较大。除使用流程复杂外,对于处于驾驶状态的用户或者视力残障人士的可用性较差。
发明内容
本发明实施例提供一种语音信息的处理方法、装置、终端和存储介质,以提升输入法中语音功能的使用率,改善语音功能的使用体验。
第一方面,本发明实施例提供了一种语音信息的处理方法,该方法包括:
检测输入法面板是否被激活;
在检测到所述输入法面板被激活后,获取当前终端设备的传感器数据;
根据所述传感器数据确定是否检测到语音触发事件发生;
在确定检测到语音触发事件发生时,开启当前终端设备的语音录音功能。
第二方面,本发明实施例还提供了一种语音信息的处理装置,该装置包括:
激活状态检测模块,用于检测输入法面板是否被激活;
传感器数据获取模块,用于在检测到所述输入法面板被激活后,获取当前终端设备的传感器数据;
语音触发事件检测模块,用于根据所述传感器数据确定是否检测到语音触发事件发生;
录音功能开启模块,用于在确定检测到语音触发事件发生时,开启当前终端设备的语音录音功能。
第三方面,本发明实施例还提供了一种终端,该终端包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
传感器,与所述处理器相连,用于将采集到的传感器数据发送到所述处理器;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所提供的语音信息的处理方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所提供的语音信息的处理方法。
本发明实施例的技术方案,通过检测输入法面板是否被激活,在检测到输入法面板被激活后,获取当前终端设备的传感器数据,根据传感器数据确定是否检测到语音触发事件发生,在确定检测到语音触发事件发生时,开启当前终端设备的语音录音功能,即发明本实施例的技术方案采用了软件和硬件相结合的方式去开启当前终端设备的语音录音功能。相对于现有技术提供的通过用户手动操作来开启语音录音功能的方式,本发明实施例的技术方案避免了语音录音功能使用时对用户手动操作的依赖性,简化了输入法语音功能的使用流程,提升了语音功能的使用体验。
附图说明
图1为本发明实施例一提供的一种语音信息的处理方法的流程图;
图2a为本发明实施例一提供的当前移动终端已开启语音录音功能的示意图;
图2b为本发明实施例一提供的当前移动终端未开启语音录音功能的示意图;
图3为本发明实施例二提供的一种语音信息的处理方法的流程图;
图4a为本发明实施例二提供的一种当前终端设备的俯仰动作示意图;
图4b为本发明实施例二提供的一种当前终端设备的偏航动作示意图;
图5为本发明实施例三提供的一种语音信息的处理方法的流程图;
图6为本发明实施例四提供的一种语音信息的处理装置的结构框图;
图7为本发明实施例五提供的一种终端的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种语音信息的处理方法的流程图,该方法可以由语音信息的处理装置来执行,该装置可以通过软件和/或硬件的方式实现,典型的是可以集成在智能手机、智能手表或平板电脑等移动终端中。本实施例的执行主体可以为移动终端中所安装的应用程序,还可以为位于该移动终端的应用中的插件或软件开发工作包等,本实施例对此不作特别限定。参见图1,本实施例的方法具体包括:
S110、检测输入法面板是否被激活。
其中,输入法面板的状态包括激活状态和非激活状态两种。在用户需要使用输入法进行通信或交流时,用户一般通过点击输入框来激活输入法面板。示例性的,可为输入法面板的状态设置对应的标识符,在激活状态下,可以设置该标识符的标志位为1;在非激活状态下,可以设置该标识符的标志位为0。本实施例中,在检测输入法面板是否被激活时,可通过读取该标志位所对应的数值来确定输入法面板是否处于激活状态。
S120、在检测到输入法面板被激活后,获取当前终端设备的传感器数据。
示例性的,在检测到输入法面板被激活后,表明用户存在想要开启语音录音功能的意愿,此时可通过获取当前终端设备的传感器数据来判断是否检测到语音触发事件。
示例性的,本实施例的终端设备中配置有各类传感器,例如距离传感器、图像传感器和速度传感器等。只要检测到输入法面板被激活,则当前终端设备中与语音触发事件相关的各类传感器均可被触发,以用于采集对应的传感器数据。本实施例中,传感器数据可以包括:距离传感器输出的距离数据,或图像传感器输出的图像数据,或二者距离数据和图像数据均存在。此外,本实施例中的传感器数据还可以包括速度传感器输出的当前终端设备在不同方向所偏转的角度和速度等。
具体的,距离传感器,例如红外传感器,可用于采集用户距离当前终端设备的距离。图像传感器,例如摄像头中的CCD(Charge-CoupledDevice,电荷耦合元件)图像采集传感器或CMOS(Complementary Metal Oxide Semiconductor,互补金属氧化物半导体)传感器,可用于采集用户的手势或表情等信息。角速度传感器,例如陀螺仪,可用于检测当前移动终端在不同方向所偏转的角度。通过上述任意一项或多项传感器所采集到的传感器数据,均可判断出语音触发事件是否发生。
S130、根据传感器数据确定是否检测到语音触发事件发生。
示例性的,S130具体可以包括:
根据距离数据判断当前终端设备与用户之间的距离是否小于预设距离阈值;或者,根据图像数据判断用户当前手势是否与第一预设手势相匹配;或者,判断上述两种情况是否同时存在。在判断结果为是时,确定检测到语音触发事件发生,即确定出用户有想要进行语音录音的意愿。
其中,预设距离阈值为经验值,可根据实际情况进行设置,本实施例中优选设置为10厘米,即当前终端设备与用户之间的距离处于0-10厘米的范围时,可确定语音触发事件发生。图2a为本发明实施例一提供的当前移动终端已开启语音录音功能的示意图;图2b为本发明实施例一提供的当前移动终端未开启语音录音功能的示意图。图2a示出了距离传感器检测到当前终端设备与用户之间的距离小于10厘米时,自动开启录音功能,从图2a中底部的声波信号处于高低起伏的密集状态可看出此时用户正在输入语音信息。图2b中示出了距离传感器检测到当前终端设备与用户之间的距离大于10厘米时,自动关闭录音功能,从图2b底部的声波信号为一条虚直线可看出当前不存在语音信息的输入。
示例性的,用户手势与预设手势的匹配结果也可以作为判断语音触发事件是否发生的条件。具体的,第一预设手势可以为用户从左向右滑动的手势,还可以为其他手势,本实施例在此不做限定。其中,该第一预设手势可在当前终端设备出厂前进行设置。用户在后期的使用过程中可通过执行终端默认设置的该手势动作来触发语音触发事件;或者用户也可根据自身操作习惯对第一预设手势自行设置,当用户想要开启语音录音功能时,可按照其预先设置的第一预设手势执行相应的手势动作即可触发语音触发事件。
S140、在确定检测到语音触发事件发生时,开启当前终端设备的语音录音功能。
示例性的,在确定语音触发事件发生,则将触发当前终端设备的麦克风开启,以接收用户输入的语音信息。
本实施例的技术方案,通过采用软件判断以及采用如传感器等硬件采集数据相结合的方式,在确定检测到语音触发事件发生时,开启当前终端设备的语音录音功能。相对于现有技术提供的用户手动操作来开启语音录音功能的方式,本实施例的技术方案避免了使用语音录音功能时对用户手动操作的依赖性,简化了输入法语音功能的使用流程,改善了语音功能的使用体验,可达到提升输入法中语音功能使用率的效果。
进一步的,在开启当前终端设备的语音录音功能之后,本发明实施例的技术方案还可以包括检测用户在录制语音信息的过程中是否达到了录音结束的条件,如果达到了下述条件中的任意一项或多项,则停止录音。
示例性的,如果检测出录制语音信息的时长达到预设时长阈值,则停止录音,并提示用户录音结束。一般的,在用户录制语音信息的过程中,语音信息录制的时长需符合输入法软件预先设置的预设时长阈值。输入法软件只要检测出语音录音功能开启并有用户输入语音信息时,则将自动开始计时。如果检测出录制语音信息的时长达到预设时长阈值,则停止录音,并提示用户录音结束。此时,如果用户想要录制的语音信息并未全部录制完成,则用户可继续按照上述语音录音功能的开启方式继续进行录音。
示例性的,如果识别出录制的语音信息中包含有标识语音结束的预设语音数据,则停止录音。具体的,在用户录制语音信息的过程中,输入法软件可自动识别用户的语音信息,如果检测到录制的语音信息中包含有标识语音结束的预设语音数据,例如“结束”、“停止”等预设语音数据,则停止录音。
示例性的,由于语音录音功能开启的条件中包含有根据距离数据判断出当前终端设备与用户之间的距离小于预设距离阈值,相应的,如果根据距离数据判断出当前终端设备与用户之间的距离大于预设距离阈值,则停止录音。
可选的,也可以为停止录音这一动作设置对应的第二预设手势,例如从右向左移动的手势。基于与第一预设手势相同的实现原理,第二预设手势的设置可以为当前终端设备出厂前所设置的手势,也可以为用户根据自身实际需求和操作习惯自行设置的手势,本实施例在此不做限定。只要根据图像数据判断出用户当前手势与第二预设手势相匹配,则停止录音。
通过上述设置,可自动停止语音信息的录制,代替了用户手动触发录制按钮的操作,使得整个语音录音功能的开启和结束处于智能状态,提升了使用语音功能的用户体验。
实施例二
图3为本发明实施例二提供的一种语音信息的处理方法的流程图,本实施例在上述实施例的基础上,增加了在开启语音录音功能之后将录制的语音信息转换为文字信息并对该文字信息进行处理的过程,其中与上述实施例相同或相应的术语的解释在此不再赘述。参见图3,本实施例提供方法包括:
S210、检测输入法面板是否被激活,在检测到输入法面板被激活后,获取当前终端设备的传感器数据。
S220、根据传感器数据确定是否检测到语音触发事件发生,在确定检测到语音触发事件发生时,开启当前终端设备的语音录音功能。
S230、获取录制的语音信息。
S240、将语音信息转换为文字信息,并将文字信息在输入法面板上进行展示。
其中,语音信息转换文字信息可采用语音识别、语义解析和语音合成等技术自动将用户输入的语音信息转换为文字信息,这样设置的好处在于,用户可根据输入法面板上所展示的文字信息确定待发送的语音信息与自己最开始想要表达的内容是否一致,即是否符合自己的初衷。或者如果用户在录入语音之后仍有需要添加或修改的地方,此时,用户也可以及时进行修正,以避免将还未完善的语音信息发出。例如,用户在通过微信聊天的过程中,在录制语音信息后,可将语音信息转换为文字信息展示在输入法面板上,以供用户确认。如果用户通过该文字信息确认出想要发送的语音信息无误后再进行发送,以避免将不完整或者不适合发送给对方的语音信息发出。
进一步的,本实施例中,在将文字信息在输入法面板上进行展示之后,如果再次录制到新的语音信息,并识别出再次录制到的语音信息与预设文字编辑指令相匹配,则对展示的文字信息执行文字编辑指令,并展示文字编辑指令后的新的文字信息;
示例性的,预设文字编辑指令可以为文字添加、文字删除和文字替换等指令。在将语音信息转换为文字信息后,输入法软件再次录制到的新的语音信息可能是用户对文字信息的编辑信息,即如果用户通过输入法中的文字框发现文字信息有问题需要修改时,则可通过再次发送新的语音信息以代替用户手动操作对文字信息进行修正,从而简化了用户操作流程,达到提升用户使用体验的效果。
示例性的,如果用户想要修改文字信息,用户可通过发出将待修改的文字信息A修改为B的语音指示。输入法软件获取到“将A修改为B”的新的语音信息后,通过识别该语音信息,例如识别关键字“A”、“修改”和“B”后,可将该信息与文字修改指令匹配成功,然后可自动将输入法面板中“A”的替换为“B”。
示例性的,如果用户再次发出了“删除B”的语音指示,输入法软件在获取到该语音信息后,可识别出该语音信息与预设文字删除指令相匹配,则自动对输入法面板中的文字“B”进行删除。
示例性的,也可结合用户操作对部分文字信息进行删除,具体可以为:确定用户在所有文字信息中所选中的部分文字,通过识别用户发出的删除部分文字的语音信息,可将部分文字进行删除。或者如果用户可以发出了“删除所有文字信息”的语音指示,输入法软件也可将当前显示的所有文字信息自动删除。
示例性的,如果用户想要在当前显示的文字信息中***新的内容,还可将输入框中的光标移动到想要***内容的位置。输入法软件检测输入框中光标停留的目标位置,并开启语音录音功能,将接收到的新的语音信息转化为文字信息并***目标位置处,从而代替了用户手动输入新***的语音信息,节省了用户的操作,为用户提供了极大的便利。
S250、检测当前终端设备的当前动作,如果识别出当前动作与预设动作相匹配,则对展示的文字信息执行与预设动作对应的处理。
示例性的,预设动作可以包括俯仰角满足第一预设角度范围的俯仰动作、偏航角度满足第二预设角度范围的偏航动作和翻滚角度满足第三预设角度范围的翻滚动作。其中,第一预设角度范围、第二预设角度范围和第三预设角度范围可根据实际情况进行设置,三者可以相同也可以不同,例如,本实施例中俯仰动作优选设置为20-80度,偏航动作优选设置为20-90度,翻滚动作优选设置为20-70度。
示例性的,预设动作对应的处理可以包括:发送当前显示的信息,或删除当前显示的信息,或在当前显示的信息中***新的内容等。即不同的预设动作可对应不同的信息处理方式,例如,可以将俯仰动作对应的处理设置为发送处理,偏航动作对应的处理设置为删除处理,翻滚动作对应的处理设置为***处理。具体的,图4a和图4b分别为本发明实施例二提供的一种当前终端设备的俯仰动作和偏航动作的示意图,图4a具体示出的是当前终端的俯仰动作满足20-80度的第一预设角度范围。如果当前终端在该第一预设角度范围内动作,则自动将当前显示的内容发送。图4b具体示出的是当前终端的偏航动作满足0-90度的第二预设角度范围。如果当前终端在该第二预设角度范围内动作,则自动将当前显示的内容删除。当然,本实施例中不同动作所对应的不同处理方式也可进行调整,本实施例对此不做具体限定。
进一步的,如果当前输入法面板中展示的是执行文字编辑指令后的新的文字信息,此时如果识别出当前终端的当前动作与预设动作相匹配,则需对该新的文字信息执行与预设动作对应的处理,例如删除处理、发送处理或添加处理等,具体可参照上述预设动作对应的处理方式。即只要用户按照预设动作控制当前终端动作,输入法软件则可对输入法面板中展示的新的文字信息进行与预设动作对应的处理,即用户在不点击输入法各种功能按键的前提下,能够快速实现发送文字、删除文字等功能,大大提升了语音功能的使用体验。
需要说明的是,在获取录制的语音信息后,用户也可对当前终端设备执行预设动作,从而直接对语音信息进行发送或删除等处理。
本实施例在上述实施例的基础上,可将录制的语音信息转换为文字信息在输入法面板上进行展示,并可通过移动终端的动作对文字信息进行发送、删除或添加等处理。此外,还可通过再次发送语音信息对已在输入法面板上展示的文字信息进行编辑。通过上述设置,用户可以在不点击输入法按键的前提下,快速完成文字编辑、文字发送、文字删除和文字***等功能,大大提升了语音功能的使用体验,有助于提升语音使用率。
实施例三
图5为本发明实施例三提供的一种语音信息的处理方法的流程图,本实施例在上述实施例的基础上,增加了在开启当前终端设备的语音录音功能之后,将录制的语音信息与预设内容获取指令进行匹配成功后,将执行内容获取指令所得到的内容信息推送给用户的内容,其中与上述实施例相同或相应的术语的解释在此不再赘述。参见图5,本实施例提供方法包括:
S310、检测输入法面板是否被激活,在检测到输入法面板被激活后,获取当前终端设备的传感器数据。
S320、根据传感器数据确定是否检测到语音触发事件发生,在确定检测到语音触发事件发生时,开启当前终端设备的语音录音功能。
S330、获取录制的语音信息。
S340、如果识别出语音信息与预设内容获取指令相匹配,则将执行内容获取指令后得到的内容信息推送给用户。
其中,预设内容可以为联系人电话、表情、天气数据和地图数据等。其中,当前输入法软件需存在与上述内容的应用程序相对应的接口。输入法软件如果识别出用户输入的语音信息与预设内容获取指令相匹配,则可通过与预设内容的应用程序相对应的接口调用该预设内容推送给用户。这样设置的好处在于,节省了用户查询上述预设内容的手动操作,通过语音信息即可自动获取到上述预设内容,为用户提供了极大的便利,提升了语音功能的使用体验。
示例性的,如果用户M在用聊天软件与用户N聊天的过程中,用户M发出了“获取张三的电话”的语音信息,此时,输入法软件可将本地存储的张三的电话号码展示到输入法面板上。或者如果用户想要发送一个微笑或沮丧的表情,则可通过发出“微笑表情”或者“沮丧表情”的语音指示。输入法软件可自动从表情包中调取“微笑表情”或者“沮丧表情”对应的表情图像推送给用户。
示例性的,天气数据,例如当前温度以及地图数据,例如乘车路线的获取方式与上述联系人电话号码以及表情的获取方式相似,均可通过用户输出包含有预设内容的获取动作的语音信息,来代替用户的手动操作,实现对天气数据或地图数据的获取,提升用户体验。
S350、检测当前终端设备的当前动作,如果识别出当前动作与预设动作相匹配,则对内容信息执行与预设动作对应的处理。
示例性的,对于将执行内容获取指令后所得到的内容信息,也可按照控制当前终端设备动作的方式,对内容信息执行与预设动作对应的处理,例如发送当前显示的信息,或删除当前显示的信息,或在当前显示的信息中***新的内容。具体对内容信息执行与预设动作对应的处理的实现方式可参照上述实施例提供的内容,本实施例在此不做赘述。
本实施例在上述实施例的基础上,通过识别录制到的语音信息,并将该语音信息与预设内容获取指令匹配成功后,可将执行内容获取指令后得到的内容信息推送给用户,从而替代了用户在通信过程中对预设内容的手动查询操作,实现了利用语音信息进行预设内容的自动推送,为用户提供了极大的便利,提升了语音功能的使用体验。
实施例四
图6为本发明实施例四提供的一种语音信息的处理装置的结构框图,该装置可通过软件和/或硬件的方式来实现,如图6所示,该装置包括:激活状态检测模块410、传感器数据获取模块420、语音触发事件检测模块430和录音功能开启模块440。其中,
激活状态检测模块410,用于检测输入法面板是否被激活;
传感器数据获取模块420,用于在检测到所述输入法面板被激活后,获取当前终端设备的传感器数据;
语音触发事件检测模块430,用于根据所述传感器数据确定是否检测到语音触发事件发生;
录音功能开启模块440,用于在确定检测到语音触发事件发生时,开启当前终端设备的语音录音功能。
本实施例的技术方案,通过采用软件判断以及采用如传感器等硬件采集数据相结合的方式,在确定检测到语音触发事件发生时,开启当前终端设备的语音录音功能。相对于现有技术提供的用户手动操作来开启语音录音功能的方式,本实施例的技术方案避免了使用语音录音功能时对用户手动操作的依赖性,简化了输入法语音功能的使用流程,改善了语音功能的使用体验,可达到提升输入法中语音功能使用率的效果。
在上述实施例的基础上,距离传感器输出的距离数据和/或图像传感器输出的图像数据。
在上述实施例的基础上,所述语音触发事件检测模块430具体用于:
根据所述距离数据判断当前终端设备与用户之间的距离是否小于预设距离阈值;和/或,
根据所述图像数据判断用户当前手势是否与第一预设手势相匹配;
在判断结果为是时,确定检测到语音触发事件发生。
在上述实施例的基础上,所述装置还包括:
录音结束模块,用于如果检测出录制语音信息的时长达到预设时长阈值,则停止录音,并提示用户录音结束;或者,
如果识别出录制的语音信息中包含有标识语音结束的预设语音数据,则停止录音;或者,
如果根据所述距离数据判断出当前终端设备与用户之间的距离大于预设距离阈值,和/或,根据所述图像数据判断出用户当前手势与第二预设手势相匹配,则停止录音。
在上述实施例的基础上,所述装置还包括:
语音信息获取模块,用于在开启当前终端设备的语音录音功能之后,获取录制的语音信息;
文字信息展示模块,用于将所述语音信息转换为文字信息,并将所述文字信息在输入法面板上进行展示;
动作匹配模块,用于检测当前终端设备的当前动作,如果识别出所述当前动作与预设动作相匹配,则对展示的所述文字信息执行与所述预设动作对应的处理。
在上述实施例的基础上,所述装置还包括:
指令执行模块,用于在将所述文字信息在输入法面板上进行展示之后,如果再次录制到新的语音信息,并识别出再次录制到的语音信息与预设文字编辑指令相匹配,则对展示的所述文字信息执行所述文字编辑指令,并展示执行所述文字编辑指令后的新的文字信息;
相应的,动作匹配模块具体用于:
检测当前终端设备的当前动作,如果识别出所述当前动作与预设动作相匹配,则对展示的新的文字信息执行与所述预设动作对应的处理。
在上述实施例的基础上,所述装置还包括:
语音信息录制模块,用于在开启当前终端设备的语音录音功能之后,获取录制的语音信息;
内容推送模块,用于如果识别出所述语音信息与预设内容获取指令相匹配,则将执行所述内容获取指令后得到的内容信息推送给用户;
内容信息处理模块,用于检测当前终端设备的当前动作,如果识别出所述当前动作与预设动作相匹配,则对所述内容信息执行与所述预设动作对应的处理。
在上述实施例的基础上,所述预设动作对应的处理包括:
发送当前显示的信息,或删除当前显示的信息,或在当前显示的信息中***新的内容。
上述语音信息的处理装置可执行本发明任意实施例所提供的语音信息的处理方法,具备执行方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的语音信息的处理方法。
实施例五
图7为本发明实施例五提供的一种终端的结构示意图。图7示出了适于用来实现本发明实施方式的示例性终端12的框图。图7显示的终端12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,终端12以通用计算设备的形式表现。终端12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,***存储器28,连接不同***组件(包括***存储器28和处理单元16)的总线18。本实施例中,终端还包括传感器19,与处理单元16相连,用于将采集到的传感器数据发送到所述处理单元16。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,***总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及***组件互连(PCI)总线。
终端12典型地包括多种计算机***可读介质。这些介质可以是任何能够被终端12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
***存储器28可以包括易失性存储器形式的计算机***可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。终端12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例,存储***34可以用于读写不可移动的、非易失性磁介质(图7未显示,通常称为“硬盘驱动器”)。尽管图7中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
终端12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该终端12交互的设备通信,和/或与使得该终端12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,终端12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与终端12的其它模块通信。应当明白,尽管图中未示出,可以结合终端12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
处理单元16通过运行存储在***存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明任意实施例所提供的语音信息的处理方法,该方法包括:
检测输入法面板是否被激活;
在检测到所述输入法面板被激活后,获取当前终端设备的传感器数据;
根据所述传感器数据确定是否检测到语音触发事件发生;
在确定检测到语音触发事件发生时,开启当前终端设备的语音录音功能。
实施例六
本发明实施例六还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现本发明任意实施例所提供的语音信息的处理方法,该方法包括:
检测输入法面板是否被激活;
在检测到所述输入法面板被激活后,获取当前终端设备的传感器数据;
根据所述传感器数据确定是否检测到语音触发事件发生;
在确定检测到语音触发事件发生时,开启当前终端设备的语音录音功能。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (11)

1.一种语音信息的处理方法,其特征在于,包括:
检测输入法面板是否被激活;
在检测到所述输入法面板被激活后,获取当前终端设备的传感器数据;
根据所述传感器数据确定是否检测到语音触发事件发生;
在确定检测到语音触发事件发生时,开启当前终端设备的语音录音功能。
2.根据权利要求1所述的方法,其特征在于,所述传感器数据包括:
距离传感器输出的距离数据和/或图像传感器输出的图像数据。
3.根据权利要求2所述的方法,其特征在于,所述根据所述传感器数据确定是否检测到语音触发事件发生,包括:
根据所述距离数据判断当前终端设备与用户之间的距离是否小于预设距离阈值;和/或,
根据所述图像数据判断用户当前手势是否与第一预设手势相匹配;
在判断结果为是时,确定检测到语音触发事件发生。
4.根据权利要求2所述的方法,其特征在于,在开启当前终端设备的语音录音功能之后,所述方法还包括:
如果检测出录制语音信息的时长达到预设时长阈值,则停止录音,并提示用户录音结束;或者,
如果识别出录制的语音信息中包含有标识语音结束的预设语音数据,则停止录音;或者,
如果根据所述距离数据判断出当前终端设备与用户之间的距离大于预设距离阈值,和/或,根据所述图像数据判断出用户当前手势与第二预设手势相匹配,则停止录音。
5.根据权利要求1所述的方法,其特征在于,在开启当前终端设备的语音录音功能之后,所述方法还包括:
获取录制的语音信息;
将所述语音信息转换为文字信息,并将所述文字信息在输入法面板上进行展示;
检测当前终端设备的当前动作,如果识别出所述当前动作与预设动作相匹配,则对展示的所述文字信息执行与所述预设动作对应的处理。
6.根据权利要求5所述的方法,其特征在于,在将所述文字信息在输入法面板上进行展示之后,所述方法还包括:
如果再次录制到新的语音信息,并识别出再次录制到的语音信息与预设文字编辑指令相匹配,则对展示的所述文字信息执行所述文字编辑指令,并展示执行所述文字编辑指令后的新的文字信息;
所述检测当前终端设备的当前动作,如果识别出所述当前动作与预设动作相匹配,则对展示的所述文字信息执行与所述预设动作对应的处理,包括:
检测当前终端设备的当前动作,如果识别出所述当前动作与预设动作相匹配,则对展示的新的文字信息执行与所述预设动作对应的处理。
7.根据权利要求1所述的方法,其特征在于,在开启当前终端设备的语音录音功能之后,所述方法还包括:
获取录制的语音信息;
如果识别出所述语音信息与预设内容获取指令相匹配,则将执行所述内容获取指令后得到的内容信息推送给用户;
检测当前终端设备的当前动作,如果识别出所述当前动作与预设动作相匹配,则对所述内容信息执行与所述预设动作对应的处理。
8.根据权利要求5或6或7所述的方法,其特征在于,所述预设动作对应的处理包括:
发送当前显示的信息,或删除当前显示的信息,或在当前显示的信息中***新的内容。
9.一种语音信息的处理装置,其特征在于,包括:
激活状态检测模块,用于检测输入法面板是否被激活;
传感器数据获取模块,用于在检测到所述输入法面板被激活后,获取当前终端设备的传感器数据;
语音触发事件检测模块,用于根据所述传感器数据确定是否检测到语音触发事件发生;
录音功能开启模块,用于在确定检测到语音触发事件发生时,开启当前终端设备的语音录音功能。
10.一种终端,其特征在于,所述终端包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
传感器,与所述处理器相连,用于将采集到的传感器数据发送到所述处理器;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一所述的语音信息的处理方法。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8中任一所述的语音信息的处理方法。
CN201810643703.4A 2018-06-21 2018-06-21 一种语音信息的处理方法、装置、终端和存储介质 Pending CN108965584A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810643703.4A CN108965584A (zh) 2018-06-21 2018-06-21 一种语音信息的处理方法、装置、终端和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810643703.4A CN108965584A (zh) 2018-06-21 2018-06-21 一种语音信息的处理方法、装置、终端和存储介质

Publications (1)

Publication Number Publication Date
CN108965584A true CN108965584A (zh) 2018-12-07

Family

ID=64492038

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810643703.4A Pending CN108965584A (zh) 2018-06-21 2018-06-21 一种语音信息的处理方法、装置、终端和存储介质

Country Status (1)

Country Link
CN (1) CN108965584A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109949723A (zh) * 2019-03-27 2019-06-28 浪潮金融信息技术有限公司 一种通过智能语音对话进行产品推荐的装置及方法
CN111009247A (zh) * 2019-12-24 2020-04-14 深圳Tcl数字技术有限公司 语音识别修正方法、装置和存储介质
CN111538470A (zh) * 2020-04-14 2020-08-14 北京小米移动软件有限公司 信息输入方法、装置及终端设备
CN111913590A (zh) * 2019-05-07 2020-11-10 北京搜狗科技发展有限公司 一种输入方法、装置和设备
CN113544769A (zh) * 2019-04-10 2021-10-22 深圳迈瑞生物医疗电子股份有限公司 临床事件的记录方法、医疗设备和存储介质
CN113742517A (zh) * 2021-08-11 2021-12-03 北京百度网讯科技有限公司 语音包的生成方法、装置、电子设备和存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130325469A1 (en) * 2012-05-31 2013-12-05 Samsung Electronics Co., Ltd. Method for providing voice recognition function and electronic device thereof
CN103765348A (zh) * 2011-08-24 2014-04-30 微软公司 用于移动设备的基于姿势的输入模式选择
CN104298904A (zh) * 2014-09-30 2015-01-21 北京金山安全软件有限公司 移动终端的语音识别功能控制方法、装置和移动终端
CN104346127A (zh) * 2013-08-02 2015-02-11 腾讯科技(深圳)有限公司 语音输入的实现方法、装置及终端
CN104657105A (zh) * 2015-01-30 2015-05-27 腾讯科技(深圳)有限公司 一种开启终端的语音输入功能的方法和装置
CN105282316A (zh) * 2014-06-17 2016-01-27 Lg电子株式会社 移动终端及其控制方法
CN105786438A (zh) * 2014-12-25 2016-07-20 联想(北京)有限公司 一种电子***
CN106878561A (zh) * 2017-03-01 2017-06-20 广东小天才科技有限公司 一种应用于移动终端的语音消息发送方法及移动终端
CN106933561A (zh) * 2015-12-31 2017-07-07 北京搜狗科技发展有限公司 语音输入方法和终端设备
CN106959746A (zh) * 2016-01-12 2017-07-18 百度在线网络技术(北京)有限公司 语音数据的处理方法及装置
CN107864289A (zh) * 2017-11-17 2018-03-30 珠海市魅族科技有限公司 一种语音输入方法和装置、终端、可读存储介质
CN108181992A (zh) * 2018-01-22 2018-06-19 北京百度网讯科技有限公司 基于手势的语音唤醒方法、装置、设备及计算机可读介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103765348A (zh) * 2011-08-24 2014-04-30 微软公司 用于移动设备的基于姿势的输入模式选择
US20130325469A1 (en) * 2012-05-31 2013-12-05 Samsung Electronics Co., Ltd. Method for providing voice recognition function and electronic device thereof
CN104346127A (zh) * 2013-08-02 2015-02-11 腾讯科技(深圳)有限公司 语音输入的实现方法、装置及终端
CN105282316A (zh) * 2014-06-17 2016-01-27 Lg电子株式会社 移动终端及其控制方法
CN104298904A (zh) * 2014-09-30 2015-01-21 北京金山安全软件有限公司 移动终端的语音识别功能控制方法、装置和移动终端
CN105786438A (zh) * 2014-12-25 2016-07-20 联想(北京)有限公司 一种电子***
CN104657105A (zh) * 2015-01-30 2015-05-27 腾讯科技(深圳)有限公司 一种开启终端的语音输入功能的方法和装置
CN106933561A (zh) * 2015-12-31 2017-07-07 北京搜狗科技发展有限公司 语音输入方法和终端设备
CN106959746A (zh) * 2016-01-12 2017-07-18 百度在线网络技术(北京)有限公司 语音数据的处理方法及装置
CN106878561A (zh) * 2017-03-01 2017-06-20 广东小天才科技有限公司 一种应用于移动终端的语音消息发送方法及移动终端
CN107864289A (zh) * 2017-11-17 2018-03-30 珠海市魅族科技有限公司 一种语音输入方法和装置、终端、可读存储介质
CN108181992A (zh) * 2018-01-22 2018-06-19 北京百度网讯科技有限公司 基于手势的语音唤醒方法、装置、设备及计算机可读介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109949723A (zh) * 2019-03-27 2019-06-28 浪潮金融信息技术有限公司 一种通过智能语音对话进行产品推荐的装置及方法
CN113544769A (zh) * 2019-04-10 2021-10-22 深圳迈瑞生物医疗电子股份有限公司 临床事件的记录方法、医疗设备和存储介质
CN111913590A (zh) * 2019-05-07 2020-11-10 北京搜狗科技发展有限公司 一种输入方法、装置和设备
CN111009247A (zh) * 2019-12-24 2020-04-14 深圳Tcl数字技术有限公司 语音识别修正方法、装置和存储介质
CN111009247B (zh) * 2019-12-24 2023-11-14 深圳Tcl数字技术有限公司 语音识别修正方法、装置和存储介质
CN111538470A (zh) * 2020-04-14 2020-08-14 北京小米移动软件有限公司 信息输入方法、装置及终端设备
CN111538470B (zh) * 2020-04-14 2023-09-26 北京小米移动软件有限公司 信息输入方法、装置及终端设备
CN113742517A (zh) * 2021-08-11 2021-12-03 北京百度网讯科技有限公司 语音包的生成方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN108965584A (zh) 一种语音信息的处理方法、装置、终端和存储介质
US11144191B2 (en) Method and apparatus for activating application function based on inputs on an application interface
CN111078655B (zh) 文档内容分享方法、装置、终端及存储介质
EP2709357B1 (en) Conference recording method and conference system
CN103870804B (zh) 具有脸部识别功能的移动装置和控制该移动装置的方法
WO2020151516A1 (zh) 消息发送方法及移动终端
US20140362003A1 (en) Apparatus and method for selecting object by using multi-touch, and computer readable recording medium
CN109597568A (zh) 一种数据存储方法、装置、终端设备及存储介质
KR20140125078A (ko) 전자 장치 및 전자 장치에서 잠금 해제 방법
JP2019161638A (ja) スマートテレビの制御モード切替方法、設備及びコンピュータプログラム
CN103811005A (zh) 移动终端及其控制方法
CN107391063A (zh) 信息显示方法、装置及计算机可读存储介质
US20150025882A1 (en) Method for operating conversation service based on messenger, user interface and electronic device using the same
CN104123093A (zh) 信息处理方法及装置
EP4243427A1 (en) Video generation method and apparatus, device, and storage medium
JP2022542413A (ja) 投影方法および投影システム
CN114500432A (zh) 会话消息收发方法及装置、电子设备、可读存储介质
WO2019228149A1 (zh) 预测样本的采集方法、装置、存储介质及智能终端
CN104954549A (zh) 电子装置以及通信方法
CN108932102A (zh) 数据处理方法、装置以及移动终端
US20210165953A1 (en) Email Translation Method and Electronic Device
CN104866198A (zh) 一种实现快速切换显示界面的方法
CN106873847A (zh) 一种触摸屏失效时的界面操作方法、***和移动终端
WO2023138632A1 (zh) 录音方法、装置和电子设备
CN104104899A (zh) 视频会议中信息传送的方法与装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181207