CN112599131A - 一种语音输入方法、装置和电子设备 - Google Patents
一种语音输入方法、装置和电子设备 Download PDFInfo
- Publication number
- CN112599131A CN112599131A CN202011420481.3A CN202011420481A CN112599131A CN 112599131 A CN112599131 A CN 112599131A CN 202011420481 A CN202011420481 A CN 202011420481A CN 112599131 A CN112599131 A CN 112599131A
- Authority
- CN
- China
- Prior art keywords
- voice
- input
- preset
- target
- punctuation mark
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 76
- 230000000694 effects Effects 0.000 abstract description 13
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请公开了一种语音输入方法、装置及电子设备,属于语音识别技术领域。其中,所述方法包括:在进行语音输入的过程中,在接收到携带有预设语音标识的语音信息的情况下,确定所述语音信息是否满足第一预设条件;其中,所述第一预设条件包括以所述预设语音标识结尾的预设长度语音片段包含有第一标点符号对应的语音,且所述预设长度语音片段前后均存在停顿;在所述语音信息满足所述第一预设条件的情况下,获取所接收的语音信息中的目标标点符号;输入所述目标标点符号。本申请实施例能够有效识别出用于输入标点符号的语音信息,实现利用语音准确输入标点符号的效果。
Description
技术领域
本申请属于语音识别技术领域,具体涉及一种语音输入方法、装置和电子设备。
背景技术
当前,因具有输入快速、便捷的特点,利用语音识别输入文字的方式被在广泛应用于聊天、文章撰写等场景中,极大地提升了用户输入文字的效率。
但是,因无法有效区分用于输入标点符号的语音信息及用于输入标点符号对应文字的语音信息,使得现有技术无法通过语音识别正确输入标点符号,其在进行标点符号输入时,需要配合手动键盘输入标点符号,造成语音输入不便,影响了用户的使用体验。
发明内容
本申请实施例的目的是提供一种语音输入方法,能够解决现有的语音输入方式无法有效输入标点符号的问题。
为了解决上述技术问题,本申请是这样实现的:
第一方面,本申请实施例提供了一种语音输入方法,其中,所述方法包括:
在进行语音输入的过程中,在接收到携带有预设语音标识的语音信息的情况下,确定所述语音信息是否满足第一预设条件;其中,所述第一预设条件包括以所述预设语音标识结尾的预设长度语音片段包含有第一标点符号对应的语音,且所述预设长度语音片段前后均存在停顿;
在所述语音信息满足所述第一预设条件的情况下,获取所接收的语音信息中的目标标点符号;
输入所述目标标点符。
第二方面,本申请实施例提供了一种语音输入装置,其中,该装置包括:
确定模块,用于在进行语音输入的过程中,在接收到携带有预设语音标识的语音信息的情况下,确定所述语音信息是否满足第一预设条件;其中,所述第一预设条件包括以所述预设语音标识结尾的预设长度语音片段包含有第一标点符号对应的语音,且所述预设长度语音片段前后均存在停顿;
获取模块,用于在所述语音信息满足所述第一预设条件的情况下,获取所接收的语音信息中的目标标点符号;
输入模块,用于输入所述目标标点符号。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
在本申请实施例中,通过在进行语音输入的过程中,在接收到携带有预设语音标识的语音信息的情况下,确定语音信息是否满足第一预设条件;其中,第一预设条件包括以所述预设语音标识结尾的预设长度语音片段包含有第一标点符号对应的语音,且预设长度语音片段前后均存在停顿;然后在所述语音信息满足第一预设条件的情况下,获取所接收的语音信息中的目标标点符号;再输入上述目标标点符号。因为仅在接收到携带有预设语音标识的语音信息,且上述语音信息满足第一预设条件的情况下,才会获取所接收的语音信息中的标点符号,从而有效识别出用于输入标点符号的语音信息,实现利用语音准确输入标点符号的效果。
附图说明
图1是本申请实施例提供的语音输入方法的步骤流程图;
图2是本申请实施例提供的语音输入方法的执行流程图;
图3是本申请实施例中标点符号的输入效果图;
图4是本申请实施例中将显示的标点符号转换显示为文字的效果示意图;
图5是本申请实施例中对图4中转换显示的文字的选择示意图;
图6是为将图4中转换显示的文字的输入效果图;
图7是本申请实施例提供的文档显示装置的结构示意图;
图8是本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的文档显示方法进行详细地说明。
请参阅图1,示出了本申请实施例提供的一种语音输入方法的步骤流程图,其中,该方法可以包括步骤S100~S300。
本申请实施例中,上述语音输入方法应用于具有语音接收功能及文字显示功能的终端设备,具体可以是手机、平板电脑、电子阅读器等。
步骤S100、在进行语音输入的过程中,在接收到携带有预设语音标识的语音信息的情况下,确定所述语音信息是否满足第一预设条件;其中,所述第一预设条件包括以所述预设语音标识结尾的预设长度语音片段包含有第一标点符号对应的语音,且所述预设长度语音片段前后均存在停顿。
上述步骤S100中,在用户通过终端设备的语音输入功能进行语音输入文字的过程中,持续监测接收的语音信息是否携带有预设语音标识,判断所接收的语音信息是否满足第一预设条件,并在满足第一预设条件时,进入步骤S200中。
其中,上述预设语音标识为用于指示当前的语音信息为用于输入标点符号的语音信息,因而在用户通过终端设备进行语音输入的过程中,如果监测到用户输入的语音信息中携带有预设语音标识,说明用户很可能需要输入标点符号,因而进一步判断是否当前所接收的语音信息是否满足第一预设条件,以确定是否需要输入标点符号。可选地,在一种具体实施方式中,上述语音语音标识为号字,即以“号”字作为检测关键字,在检测到语音信息中携带有“号”对应的语音时,进一步判断所接收的语音信息是否满足第一预设条件。因为在用户通过语音输入标点符号时,每个标点符号对应的语音文字均以号字结尾,通过先检测“号”关键字,可以降低计算复杂度,提高语音输入效率。
其中,以预设语音标识结尾的预设长度语音片段为所需要输入的标点符号对应的语音片段,因上述预设语音标识出现于每个标点符号对应语音片段尾端,且标点符号对应的文字个数在一固定的文字个数范围内,也即其对应的语音片段长度也在一固定的语音长度范围内,因而在识别所接收的语音信息时,可以在上述语音信息中,先以上述预设语音标识为尾端,向前截取预设长度的语音片段,作为所需要输入的标点符号对应的预设长度语音片段,再对预设长度语音片段进行识别对比,具体时与语音库中的标点符号读音匹配,以判断该预设长度语音片段是否对应标点符号,也即判断是否存在所需要输入的第一标点符号。通过识别以预设语音标识结尾的预设长度语音片段的方式,识别所接收的语音信息中是否包含有第一标点符号,可以有效减少语音信息的识别数据量。
其中,因为在确定了所接收的语音信息包含第一标点符号的情况下,上述预设长度语音片段也可能是用于输入上述第一标点符号对应的文字的语音片段,因而在确定上述预设长度语音片段包含第一标点符号的情况下,还需要进一步检测上述语音信息中的上述预设长度语音片段是否为输入上述第一标点符号的语音片段,也即确定是否需要输入上述第一标点符号,因而还需要判断上述预设长度语音片段前后均存在停顿。
其中,上述停顿为用户通过在语音输入第一标点符号之前、以及在语音输入上述第一标点符号之后进行停顿操作形成的语音空白区,以明确该两端语音空白区之间的语音片段为输入上述第一标点符号的语音片段。因而,在确定所接收的语音信息中,以预设语音标识结尾的预设长度语音片段包含所述第一标点符号的情况下,可以进一步通过片段该预设长度语音片段前后是否均存在停顿的方式,确定用户是否需要输入该第一标点符号。可选地,上述停顿的时间设置为200~300ms。
其中,在上述预设长度语音片段前后均存在停顿的情况下,则说明用户需要输入该第一标点符号,而若上述预设长度语音片段前或上述预设长度语音片段后未存在上述停顿,则判断用户不需要输入第一标点符号,因而可以直接输入该第一标点符号对应的文字。
其中,因为在上述预设长度语音片段前后均存在停顿的情况下,则说明用户需要输入该第一标点符号,因而将上述第一标点符号确定为需要输入的标点符号,即目标标点符号,并从词库中找寻上述目标标点符号,进而可以将该目标标点符号输入终端设备中。
上述步骤S100中,在接收到携带有预设语音标识的语音信息的情况下,先通过识别所接收的语音信息中,以预设语音标识结尾的预设长度语音片段是否包含有第一标点符号,并在上述预设长度语音片段包含第一标点符号时,进一步判断在预设长度语音片段前后均存在停顿的情况下,才将该第一标点符号确定为目标标点符号并提取、输入该目标标点符号,可以有效减少语音信息的识别数据量,并准确判断用户通过语音输入标点符号的需求。
步骤S200、在所述语音信息是否满足第一预设条件的情况下,获取所接收的语音信息中的目标标点符号。
上述步骤S200中,在语音信息是否满足第一预设条件的情况下,说明用户需要通过语音输入的方式输入标点符号,因而通过分析所接收的语音信息,确定其中所包括的标点符号,作为上述目标标点符号。
步骤S300、输入所述目标标点符号。
上述步骤S300中,自动将从所接收的语音信息中所获取的上述目标标点符号输入终端设备的显示界面中,从而在终端设备中显示上述目标标点符号,实现对目标标点符号的输入。
例如在用户需要输入“!”时,需要先向终端设备通过语音输入“感叹号”,则终端设备在接收到“感叹号”的语音信息后,判定其携带有预设语音标识“号”字,且判断“感叹号”的语音片段包括了“!”对应的语音,且判断“感叹号”的语音片段前后存在停顿,则获取“!”,并在终端设备的显示界面中输入“!”,从而实现通过语音向终端设备输入“!”。
本申请实施例提供的语音输入方法,通过在进行语音输入的过程中,在接收到携带有预设语音标识的语音信息的情况下,确定语音信息是否满足第一预设条件;其中,第一预设条件包括以所述预设语音标识结尾的预设长度语音片段包含有第一标点符号对应的语音,且预设长度语音片段前后均存在停顿;然后在所述语音信息满足第一预设条件的情况下,获取所接收的语音信息中的目标标点符号;再输入上述目标标点符号。因为仅在接收到在携带有预设语音标识的语音信息,且上述语音信息满足第一预设条件的情况下,才会获取所接收的语音信息中的标点符号,从而有效识别出用于输入标点符号的语音信息,实现通过语音准确输入标点符号的效果。
在接收到用户对所述目标文字的第三输入的情况下,输入所述目标文字,并隐藏所述目标标点符号
可选地,在一种实施方式中,上述步骤S300包括步骤S301~S302。
步骤S301、显示所述目标标点符号。
上述步骤S301中,先将从所接收的语音信息中所确定的目标标点符号在终端设备的显示界面上显示出来,以供用户进一步确定该输入的标点符号是否为其希望通过语音输入的内容。
可选地,该目标标点符号以高亮显示上述目标标点符号,以便于用户检查、确认上述目标标点符号。
步骤S302、在预设时长内未接收到用户对所述目标标点符号的第二输入的情况下,输入所述目标标点符号。
上述步骤S302中,第二输入为需要对在终端设备上显示的目标标点符号进行修改的触发输入,例如是确定将在终端设备上显示的目标标点符号转换为对应的文字的触发输入,具体可以是对上述目标标点符号所在屏幕区域的点击、触碰等操作。
因为在通过前述步骤确定了所接收的语音信息中的目标标点符号并显示出该目标标点符号后,很可能用户实际需要输入的是该目标标点符号对应的文字,也即上述目标标点符号为用户的误触发出入,或者用户临时改变想法,需要将原本通过语音输入的目标标点符号进行修改,例如转换为输入该目标标点符号对应的文字,此时,用户可以通过对上述目标标点符号进行第二输入,然后终端设备即会在显示界面上显示出该目标标点符号对应的可修改转换的内容,以供用户进一步选择确定,上述第二输入即为进行纠错操作的触发输入。
上述步骤S302中,上述预设时长为供用户确认显示的目标标点符号是否正确的时长。
上述步骤S302中,如果在预设时长内未接收到用户对目标标点符号的第二输入,说明用户确定当前显示的目标标点符号为需要输入的内容,因而输入上述目标标点符号。
上述实施方式,在提取了所接收的语音信息中的目标标点符号后,先显示该目标标点符号,然后通过在预设时长内检测是否接收到用户对该目标标点符号的第二输入,并在接收到上述第二输入的情况下,再输入该目标标点符号,也即仅在目标标点符号确定为用户想到的结果时,才会输入该目标标点符号,而在预设时长内接收到用户对目标标点符号的第二输入时,则可以对输入内容进行修改,从而提供了便捷的纠正方式。
可选地,在一种实施方式中,本申请实施例所提供的语音输入方法,在步骤S301之后,还包括步骤S303~S304:
步骤S303、在预设时长内接收到用户对所述目标标点符号的第二输入的情况下,显示所述目标标点符号对应的目标文字。
上述步骤S303中,在预设时长内接收到上述第二输入的情况下,说明当前显示的目标标点符号并不是用户想要的结果,而考虑到与该目标标点符号关联性最高的输入内容为该目标标点符号对应的文字,因而显示该目标标点符号对应的目标文字。可选地,通过替换上述目标标点符号的方式显示上述目标文字,或者将该目标文字和该目标标点符号一同显示,具体可以将该目标文字显示于上述目标标点符号上方。
步骤S304、在接收到用户对所述目标文字的第三输入的情况下,输入所述目标文字,并隐藏所述目标标点符号。
上述步骤S304中,第三输入为确定输入目标标点符号对应的目标文字的输入,具体可以是对目标文字的点击、触碰等操作。在接收到用户对目标文字的第三输入的情况下,说明用户需要输入该目标文字,因而将该终端设备输入该目标文字,并隐藏上述目标标点符号,完成对输入内容的修改、纠正。
上述实施方式中,在提取了所接收的语音信息中的目标标点符号后,先显示该目标标点符号,用户可以通过在预设时长内对该目标标点符号进行第二输入,实现转换显示该目标标点符号对应的目标文字,并通过对目标文字的第三输入实现对目标文字的输入,从而可以在误触发输入标点符号后,将该标点符号便捷地转换为对应的文字,快速地实现纠错处理。
可选地,在一种实施方式中,本申请实施例所提供的标点符号输入方式中,在上述步骤S100之后,还包括步骤S101:
步骤S101、在所述语音信息不满足所述第一预设条件的情况下,将所述语音信息转化为文字显示。
上述步骤S101中,即若上述预设长度语音片段前,或上述预设长度语音片段后未存在上述停顿,或以预设语音标识结尾的预设长度语音片段不包含第一标点符号的情况下,说明用户所需要输入的是语音信息对应的文字,因而将语音信息转化为文字显示。
可选地,在一种实施方式中,本申请实施例所提供的标点符号输入方式中,在上述步骤S100之后,还包括:在以所述预设语音标识结尾的预设长度语音片段包含有第一标点符号,且上述预设长度语音片段前,或上述预设长度语音片段后未存在上述停顿的情况下,显示该第一标点符号对应的第一文字;在预设时长内未接收到用户对所述第一文字的第四输入的情况下,输入上述第一文字;在预设时长内接收到用户对所述第一文字的第五输入的情况下,显示上述第一标点符号;在接收到用户对上述第一标点符号的第六输入的情况下,输入上述第一标点符号,并隐藏上述第一文字。
上述实施方式可以在本用户本希望通过语音输入第一标点符号时,却因未能有效停顿导致输入了第一标点符号对应的第一文字的情况下,通过对第一文字进行第四输入操作,将第一文字转化显示为第一标点符号,进而可以通过对第一标点符号的第六输入实现对第一标点符号的语音输入。
请参阅图2,示出了本实施例所提供的语音输入方法的执行流程图。
如图2所示,在步骤S211中,在进入语音输入的过程中,先检测语音中是否含有“号”这个关键字,有则进入步骤S211中,否则直接输入语音信息对应的文字;
在步骤S212中,将“号”字及其之前几个字所组成的语音片段,与语音库中已有的标点符号读音进行匹配,以判断上述语音片段是否与语音库中已有的标点符号读音一致;
在步骤S213中,在确定上述语音片段与语音库中已有的标点符号读音一致的情况下,确定命中标点符号,也即所接收的语音信息中携带有标点符号对应的语音,并进入步骤S214中;若确定语音库中已有的标点符号读音中不存在与上述语音片段与一致的情况,则说明所接收的语音信息中未对应标点符号对应的语音,因而直接输入该语音信息对应的文字;
在步骤S214中,进一步判断在语音信息中,上述语音片段前后是否存在停顿,有则进入步骤S215中,否则进入步骤S216中;
在步骤S215中,将语音片段对应的文字转化未对应的标点符号,并高亮显示该标点符号;例如,在用户通过语音输入“今天天气真好啊(停顿)感叹号(停顿)”时,检测到“号”这个关键字,且“感叹号”前后都存在停顿,因而将“感叹号”转换显示为“!”,其具体显示效果如图3所示;
在步骤S216中,直接高亮显示该语音信息对应的文本;
在步骤S217中,通过接收用户对显示的标点符号或文字进行的选择操作,判断输入内容是否命中用户的需求,也即判断当前输入的内容是否为用户想到的结果;如果没有命中用户的需求,则进入步骤S218中,接收用户对高亮显示的标点符号或文字的选择操作,确定最终输入的内容;如果命中了用户需求,则进入步骤S219中;
例如,在用户对图3中高亮显示的“!”进行点击后,呈现图4所示的效果,具体是在“!”上对应显示“感叹号”的文字按钮;如果用户点击该“感叹号”,则将“!”替换输入为“!”,其具体效果如图5所示。
在步骤S219中,用户无需进行其他操作,高亮标记在10秒后消失,完成整个输入过程。
需要说明的是,本申请实施例提供的语音输入方法,执行主体可以为终端设备,或者该终端设备中的用于执行加载语音输入方法的控制模块。本申请实施例中以文终端设备执行加载语音输入方法为例,说明本申请实施例提供的语音输入方法。
请参阅图7,示出了本申请实施例提供的一种语音输入装置的结构示意图,所述语音输入装置,如图7所示,所述装置包括:
确定模块71,用于在进行语音输入的过程中,在接收到携带有预设语音标识的语音信息的情况下,确定所述语音信息是否满足第一预设条件;其中,所述第一预设条件包括以所述预设语音标识结尾的预设长度语音片段包含有第一标点符号对应的语音,且所述预设长度语音片段前后均存在停顿;
获取模块72,用于在所述语音信息满足所述第一预设条件的情况下,获取所接收的语音信息中的目标标点符号;
输入模块73,用于输入所述目标标点符号。
可选地,所述的语音输入装置中,还包括显示模块,用于在所述在进行语音输入的过程中,在接收到携带有预设语音标识的语音信息的情况下,确定所述语音信息是否满足第一预设条件之后,在所述语音信息不满足所述第一预设条件的情况下,将所述语音信息转化为文字显示。
可选地,所述的语音输入装置中,所述输入模块73包括:
第一显示单元,用于显示所述目标标点符号;
第一输入单元,用于在预设时长内未接收到用户对所述目标标点符号的第二输入的情况下,输入所述目标标点符号
可选地,所述的语音输入装置中,所述输入模块73还包括:
第二显示单元,用于在所述显示所述目标标点符号之后,在预设时长内接收到用户对所述目标标点符号的第二输入的情况下,显示所述目标标点符号对应的目标文字;
第二输入单元,用于在接收到用户对所述目标文字的第三输入的情况下,输入所述目标文字,并隐藏所述目标标点符号。
本申请实施例中的语音输入装置可以是装置,也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personaldigital assistant,PDA)等,非移动电子设备可以为服务器、网络附属存储器(NetworkAttached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的语音输入装置可以为具有操作***的装置。该操作***可以为安卓(Android)操作***,可以为ios操作***,还可以为其他可能的操作***,本申请实施例不作具体限定。
本申请实施例提供的语音输入装置能够实现图1至图6的方法实施例中文档显示方法实现的各个过程,为避免重复,这里不再赘述。
本申请实施例中,通过在进行语音输入的过程中,由确定模块71在接收到携带有预设语音标识的语音信息的情况下,确定所述语音信息是否满足第一预设条件;其中,所述第一预设条件包括以所述预设语音标识结尾的预设长度语音片段包含有第一标点符号对应的语音,且所述预设长度语音片段前后均存在停顿;然后由获取模块72获取所接收的语音信息中的目标标点符号;再由输入模块73输入所述目标标点符号。因为仅在接收到携带有预设语音标识的语音信息,且上述语音信息满足第一预设条件的情况下,才会获取所接收的语音信息中的标点符号,从而有效识别出用于输入标点符号的语音信息,实现利用语音准确输入标点符号的效果。
可选的,本申请实施例还提供一种电子设备,包括处理器,存储器,存储在存储器上并可在所述处理器上运行的程序或指令,该程序或指令被处理器执行时实现上述语音输入方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要注意的是,本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。
图8为实现本申请实施例的一种电子设备的硬件结构示意图。
该电子设备80包括但不限于:射频单元801、网络模块802、音频输出单元803、输入单元804、传感器805、显示单元806、用户输入单元807、接口单元808、存储器809、以及处理器810等部件。
本领域技术人员可以理解,电子设备80还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理***与处理器810逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。图8中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
其中,用户输入单元807,在本申请实施例中包括显示界面;
处理器810,用于在进行语音输入的过程中,在接收到携带有预设语音标识的语音信息的情况下,确定所述语音信息是否满足第一预设条件;其中,所述第一预设条件包括以所述预设语音标识结尾的预设长度语音片段包含有第一标点符号对应的语音,且所述预设长度语音片段前后均存在停顿;在所述语音信息满足所述第一预设条件的情况下,获取所接收的语音信息中的目标标点符号;输入所述目标标点符。
本申请实施例提供的电子设备,通过在进行语音输入的过程中,在接收到携带有预设语音标识的语音信息的情况下,确定所述语音信息是否满足第一预设条件;其中,所述第一预设条件包括以所述预设语音标识结尾的预设长度语音片段包含有第一标点符号对应的语音,且所述预设长度语音片段前后均存在停顿;在所述语音信息满足所述第一预设条件的情况下,获取所接收的语音信息中的目标标点符号;再输入所述目标标点符号。因为仅在接收到携带有预设语音标识的语音信息,且上述语音信息满足第一预设条件的情况下,才会获取所接收的语音信息中的标点符号,从而有效识别出用于输入标点符号的语音信息,实现利用语音准确输入标点符号的效果。
可选的,处理器810,还用于在所述在进行语音输入的过程中,在接收到携带有预设语音标识的语音信息的情况下,确定所述语音信息是否满足第一预设条件之后,在所述语音信息不满足所述第一预设条件的情况下,将所述语音信息转化为文字显示。
可选的,处理器810,还用于通过显示界面显示所述目标标点符号;在预设时长内未接收到用户对所述目标标点符号的第二输入的情况下,输入所述目标标点符号。
可选的,处理器810,还用于在所述显示所述目标标点符号步骤之后,在预设时长内接收到用户对所述目标标点符号的第二输入的情况下,显示所述目标标点符号对应的目标文字;在接收到用户对所述目标文字的第三输入的情况下,输入所述目标文字,并隐藏所述目标标点符号。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述语音输入方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述语音输入方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为***级芯片、***芯片、芯片***或片上***芯片等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。
Claims (10)
1.一种语音输入方法,其特征在于,所述方法包括:
在进行语音输入的过程中,在接收到携带有预设语音标识的语音信息的情况下,确定所述语音信息是否满足第一预设条件;其中,所述第一预设条件包括以所述预设语音标识结尾的预设长度语音片段包含有第一标点符号对应的语音,且所述预设长度语音片段前后均存在停顿;
在所述语音信息满足所述第一预设条件的情况下,获取所接收的语音信息中的目标标点符号;
输入所述目标标点符号。
2.根据权利要求1所述的语音输入方法,其特征在于,在所述在进行语音输入的过程中,在接收到携带有预设语音标识的语音信息的情况下,确定所述语音信息是否满足第一预设条件的步骤之后,还包括:
在所述语音信息不满足所述第一预设条件的情况下,将所述语音信息转化为文字显示。
3.根据权利要求1所述的语音输入方法,其特征在于,所述预设语音标识为号字。
4.根据权利要求1所述的语音输入方法,其特征在于,所述输入所述目标标点符号的步骤,包括:
显示所述目标标点符号;
在预设时长内未接收到用户对所述目标标点符号的第二输入的情况下,输入所述目标标点符号。
5.根据权利要求4所述的语音输入方法,其特征在于,在所述显示所述目标标点符号步骤之后,所述方法还包括:
在预设时长内接收到用户对所述目标标点符号的第二输入的情况下,显示所述目标标点符号对应的目标文字;
在接收到用户对所述目标文字的第三输入的情况下,输入所述目标文字,并隐藏所述目标标点符号。
6.一种语音输入装置,其特征在于,所述装置包括:
确定模块,用于在进行语音输入的过程中,在接收到携带有预设语音标识的语音信息的情况下,确定所述语音信息是否满足第一预设条件;其中,所述第一预设条件包括以所述预设语音标识结尾的预设长度语音片段包含有第一标点符号对应的语音,且所述预设长度语音片段前后均存在停顿;
获取模块,用于在所述语音信息满足所述第一预设条件的情况下,获取所接收的语音信息中的目标标点符号;
输入模块,用于输入所述目标标点符号。
7.根据权利要求6所述的语音输入装置,其特征在于,还包括显示模块,用于在所述在进行语音输入的过程中,在接收到携带有预设语音标识的语音信息的情况下,确定所述语音信息是否满足第一预设条件之后,在所述语音信息不满足所述第一预设条件的情况下,将所述语音信息转化为文字显示。
8.根据权利要求6所述的语音输入装置,其特征在于,所述输入模块包括:
第一显示单元,用于显示所述目标标点符号;
第一输入单元,用于在预设时长内未接收到用户对所述目标标点符号的第二输入的情况下,输入所述目标标点符号。
9.根据权利要求8所述的语音输入装置,其特征在于,所述输入模块还包括:
第二显示单元,用于在所述显示所述目标标点符号之后,在预设时长内接收到用户对所述目标标点符号的第二输入的情况下,显示所述目标标点符号对应的目标文字;
第二输入单元,用于在接收到用户对所述目标文字的第三输入的情况下,输入所述目标文字,并隐藏所述目标标点符号。
10.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-5所述的语音输入方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011420481.3A CN112599131A (zh) | 2020-12-07 | 2020-12-07 | 一种语音输入方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011420481.3A CN112599131A (zh) | 2020-12-07 | 2020-12-07 | 一种语音输入方法、装置和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112599131A true CN112599131A (zh) | 2021-04-02 |
Family
ID=75189102
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011420481.3A Pending CN112599131A (zh) | 2020-12-07 | 2020-12-07 | 一种语音输入方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112599131A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106484134A (zh) * | 2016-09-20 | 2017-03-08 | 深圳Tcl数字技术有限公司 | 基于安卓***的语音输入标点符号的方法及装置 |
CN106653030A (zh) * | 2016-12-02 | 2017-05-10 | 北京云知声信息技术有限公司 | 标点添加方法及装置 |
CN106886364A (zh) * | 2017-02-14 | 2017-06-23 | 深圳市金立通信设备有限公司 | 一种基于语音识别的文本处理方法及终端 |
CN111261162A (zh) * | 2020-03-09 | 2020-06-09 | 北京达佳互联信息技术有限公司 | 语音识别方法、语音识别装置及存储介质 |
CN111881655A (zh) * | 2020-08-05 | 2020-11-03 | 深圳乐华高科实业有限公司 | 一种语音输入标点符号快速切换方法 |
-
2020
- 2020-12-07 CN CN202011420481.3A patent/CN112599131A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106484134A (zh) * | 2016-09-20 | 2017-03-08 | 深圳Tcl数字技术有限公司 | 基于安卓***的语音输入标点符号的方法及装置 |
CN106653030A (zh) * | 2016-12-02 | 2017-05-10 | 北京云知声信息技术有限公司 | 标点添加方法及装置 |
CN106886364A (zh) * | 2017-02-14 | 2017-06-23 | 深圳市金立通信设备有限公司 | 一种基于语音识别的文本处理方法及终端 |
CN111261162A (zh) * | 2020-03-09 | 2020-06-09 | 北京达佳互联信息技术有限公司 | 语音识别方法、语音识别装置及存储介质 |
CN111881655A (zh) * | 2020-08-05 | 2020-11-03 | 深圳乐华高科实业有限公司 | 一种语音输入标点符号快速切换方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9396724B2 (en) | Method and apparatus for building a language model | |
CN106251869B (zh) | 语音处理方法及装置 | |
US20080077393A1 (en) | Virtual keyboard adaptation for multilingual input | |
WO2014190732A1 (en) | Method and apparatus for building a language model | |
CN109165292A (zh) | 数据处理方法、装置以及移动终端 | |
CN109032491B (zh) | 数据处理方法、装置以及移动终端 | |
CN109101498B (zh) | 翻译方法、装置及移动终端 | |
CN107784034B (zh) | 页面类别识别方法及装置、用于页面类别识别的装置 | |
CN107155121B (zh) | 语音控制文本的显示方法及装置 | |
CN112562684B (zh) | 一种语音识别方法、装置和电子设备 | |
CN108958576B (zh) | 内容识别方法、装置及移动终端 | |
WO2019233316A1 (zh) | 数据处理方法、装置、移动终端以及存储介质 | |
EP3734472A1 (en) | Method and device for text processing | |
CN108322770B (zh) | 视频节目识别方法、相关装置、设备和*** | |
KR101160543B1 (ko) | 키워드를 이용한 사용자 인터페이스 제공 방법 및 단말기 | |
CN108803961B (zh) | 数据处理方法、装置以及移动终端 | |
CN112381091B (zh) | 视频内容识别方法、装置、电子设备及存储介质 | |
CN109032465B (zh) | 数据处理方法、装置以及移动终端 | |
CN112764734B (zh) | 代码编辑的辅助方法、装置及电子设备 | |
CN108304369B (zh) | 一种文件类型的识别方法和装置 | |
CN113220854A (zh) | 机器阅读理解的智能对话方法及装置 | |
CN112599131A (zh) | 一种语音输入方法、装置和电子设备 | |
CN112149653B (zh) | 信息处理方法、装置、电子设备及存储介质 | |
CN114121042A (zh) | 免唤醒场景下的语音检测方法、装置及电子设备 | |
CN112836026B (zh) | 基于对话的问诊方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210402 |