CN111581462A - 语音输入信息的方法及终端设备 - Google Patents

语音输入信息的方法及终端设备 Download PDF

Info

Publication number
CN111581462A
CN111581462A CN202010278574.0A CN202010278574A CN111581462A CN 111581462 A CN111581462 A CN 111581462A CN 202010278574 A CN202010278574 A CN 202010278574A CN 111581462 A CN111581462 A CN 111581462A
Authority
CN
China
Prior art keywords
search
information
instruction
voice
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010278574.0A
Other languages
English (en)
Inventor
王细勇
符谋政
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Device Co Ltd
Original Assignee
Huawei Device Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Device Co Ltd filed Critical Huawei Device Co Ltd
Priority to CN202010278574.0A priority Critical patent/CN111581462A/zh
Publication of CN111581462A publication Critical patent/CN111581462A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)
  • Telephone Function (AREA)

Abstract

本发明实施例公开了语音输入信息的方法及终端设备,所述方法包括:当终端设备呈现编辑信息的图形用户界面时,接收向正在编辑的文本中***第一信息的语音指令;将所述语音指令转化为搜索指令;根据所述搜索指令搜索所述第一信息;将搜索到的所述第一信息***所述文本。应用本发明实施例,用户在通过终端设备编辑文本的过程中,无需手动打开多个应用,而是通过语音指令即可在编辑文本中***电话号码或图片等信息,因此简化了***信息的操作过程,增强了用户体验。

Description

语音输入信息的方法及终端设备
技术领域
本发明涉及数据处理技术领域,尤其涉及语音输入信息的方法及终端设备。
背景技术
在手机等具有文本编辑功能的智能终端设备上,用户在文本编辑过程中可能需要***电话号码或图片等特定信息。以用户在编辑短消息的过程中***电话号码为例,当用户打开短消息编辑软件后,如果要***通讯录中某个联系人的电话号码,则需要手动打开通讯录软件,并找到该联系人的电话号码,将该电话号码复制到内存中,然后返回短消息编辑软件,通过粘贴操作将内存中的电话号码***到短消息内容中。
发明人在对现有技术的研究过程中发现,用户在通过终端设备编辑文本过程中,需要手动操作打开多个应用,才能***电话号码或图片等信息,因此操作过程繁琐。
发明内容
本发明实施例中提供了语音输入信息的方法及终端设备,以简化***信息时的操作过程。
为了解决上述技术问题,本发明实施例公开了如下技术方案:
第一方面,提供一种语音输入信息的方法,所述方法包括:
当终端设备呈现编辑信息的图形用户界面时,接收向正在编辑的文本中***第一信息的语音指令,所述语音指令为通过声纹信息表征的命令,所述第一信息包括电话号码或图片;
所述终端设备将所述语音指令转化为搜索指令,所述搜索指令为能够由所述终端设备直接执行的命令;
所述终端设备根据所述搜索指令搜索所述第一信息;
所述终端设备将搜索到的所述第一信息***所述文本。
结合第一方面,在第一方面的第一种可能的实现方式中,所述终端设备将所述语音指令转化为搜索指令,具体包括:
所述终端设备将所述语音指令传输到语音识别引擎,以使所述语音识别引擎对所述语音指令进行语音识别,获得文本识别结果;
所述终端设备获得所述语音识别引擎返回的文本识别结果;
所述终端设备将所述文本识别结果传输到语义识别引擎,以使所述语义识别引擎对所述文本识别结果进行解析,获得语义识别结果;
所述终端设备获得所述语义识别引擎返回的语义识别结果;
所述终端设备对所述语义识别结果进行转换,生成搜索指令。
结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,所述语义识别结果包括:所述语音指令的动作类型、关键字和对象,其中,所述语音指令的动作类型为***;
所述终端设备对所述语义识别结果进行转换,生成搜索指令具体为:所述终端设备将所述语音指令的动作类型、关键字和对象转换为搜索指令,其中,所述搜索指令的动作类型为搜索,所述搜索指令的关键字与所述语音指令的关键字一致,所述搜索指令的对象与所述语音指令的对象一致。
结合第一方面,或第一方面的第一种可能的实现方式,或第一方面的第二种可能的实现方式,在第一方面的第三种可能的实现方式中,所述终端设备根据所述搜索指令搜索所述第一信息,具体包括:
所述终端设备将所述搜索指令传输到搜索引擎,以使所述搜索引擎根据所述搜索指令从搜索对象库中查询所述第一信息;
所述终端设备接收所述搜索引擎查询到的所述第一信息。
结合第一方面,或第一方面的第一种可能的实现方式,或第一方面的第二种可能的实现方式,或第一方面的第三种可能的实现方式,在第一方面的第四种可能的实现方式中,所述终端设备根据所述搜索指令搜索所述第一信息后,所述方法还包括:
当所述终端设备未搜索到所述第一信息时,输出错误信息;或者,
当所述终端设备搜索到多个所述第一信息时,获得用户从所述多个第一信息中选择的第一信息;
所述终端设备将搜索到的所述第一信息***所述文本,具体为:所述终端设备将所述用户选择的第一信息***所述文本。
第二方面,提供一种终端设备,所述终端设备包括:
接收单元,用于当所述终端设备呈现编辑信息的图形用户界面时,接收向正在编辑的文本中***第一信息的语音指令,所述语音指令为通过声纹信息表征的命令,所述第一信息包括电话号码或图片;
转化单元,用于将所述接收单元接收到的语音指令转化为搜索指令,所述搜索指令为能够由所述终端设备直接执行的命令;
搜索单元,用于根据所述转化单元转化的搜索指令搜索所述第一信息;
***单元,用于将所述搜索单元搜索到的所述第一信息***所述文本。
结合第二方面,在第二方面的第一种可能的实现方式中,所述转化单元包括:
语音指令传输子单元,用于将所述语音指令传输到语音识别引擎,以使所述语音识别引擎对所述语音指令进行语音识别,获得文本识别结果;
文本结果接收子单元,用于获得所述语音识别引擎返回的文本识别结果;
文本结果传输子单元,用于将所述文本结果接收子单元获得的文本识别结果传输到语义识别引擎,以使所述语义识别引擎对所述文本识别结果进行解析,获得语义识别结果;
语义结果接收子单元,用于获得所述语义识别引擎返回的语义识别结果;
搜索指令生成子单元,用于对所述语义结果接收子单元获得的语义识别结果进行转换,生成搜索指令。
结合第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中,所述语义结果接收子单元接收到的语义识别结果包括:所述语音指令的动作类型、关键字和对象,其中,所述语音指令的动作类型为***;
所述搜索指令生成子单元,具体用于将所述语音指令的动作类型、关键字和对象转换为搜索指令,其中,所述搜索指令的动作类型为搜索,所述搜索指令的关键字与所述语音指令的关键字一致,所述搜索指令的对象与所述语音指令的对象一致。
结合第二方面,或第二方面的第一种可能的实现方式,或第二方面的第二种可能的实现方式,在第二方面的第三种可能的实现方式中,所述搜索单元包括:
搜索指令传输子单元,用于将所述搜索指令传输到搜索引擎,以使所述搜索引擎根据所述搜索指令从搜索对象库中查询所述第一信息;
信息接收子单元,用于接收所述搜索引擎查询到的所述第一信息。
结合第二方面,或第二方面的第一种可能的实现方式,或第二方面的第二种可能的实现方式,或第二方面的第三种可能的实现方式,在第二方面的第四种可能的实现方式中,所述终端设备还包括:
输出单元,用于当所述搜索单元未搜索到所述第一信息时,输出错误信息;
获得单元,用于当所述搜索单元搜索到多个所述第一信息时,获得用户从所述多个第一信息中选择的第一信息;
所述***单元,还用于将所述获得单元获得的用户选择的第一信息***所述文本。
第三方面,提供一种终端设备,所述终端设备包括:总线,以及通过所述总线连接的显示屏、麦克风及处理器;其中,
所述显示屏,用于呈现编辑信息的图形用户界面;
所述麦克风,用于接收向正在编辑的文本中***第一信息的语音指令,所述语音指令为通过声纹信息表征的命令,所述第一信息包括电话号码或图片;
所述处理器,用于将所述语音指令转化为搜索指令,所述搜索指令为能够由所述终端设备直接执行的命令,根据所述搜索指令搜索所述第一信息,并将搜索到的所述第一信息***所述文本。
结合第三方面,在第三方面的第一种可能的实现方式中,所述处理器,具体用于将所述语音指令传输到语音识别引擎,以使所述语音识别引擎对所述语音指令进行语音识别,获得文本识别结果,将所述文本识别结果传输到语义识别引擎,以使所述语义识别引擎对所述文本识别结果进行解析,获得语义识别结果,获得所述语义识别引擎返回的语义识别结果,并对所述语义识别结果进行转换,生成搜索指令。
结合第三方面的第一种可能的实现方式,在第三方面的第二种可能的实现方式中,所述语义识别结果包括:所述语音指令的动作类型、关键字和对象,其中,所述语音指令的动作类型为***;
所述处理器,具体用于将所述语音指令的动作类型、关键字和对象转换为搜索指令,其中,所述搜索指令的动作类型为搜索,所述搜索指令的关键字与所述语音指令的关键字一致,所述搜索指令的对象与所述语音指令的对象一致。
结合第三方面,或第三方面的第一种可能的实现方式,或第三方面的第二种可能的实现方式,在第三方面的第三种可能的实现方式中,所述处理器,具体用于将所述搜索指令传输到搜索引擎,以使所述搜索引擎根据所述搜索指令从搜索对象库中查询所述第一信息,并接收所述搜索引擎查询到的所述第一信息。
结合第三方面,或第三方面的第一种可能的实现方式,或第三方面的第二种可能的实现方式,或第三方面的第三种可能的实现方式,在第三方面的第四种可能的实现方式中,所述处理器,还用于当未搜索到所述第一信息时,通过所述显示屏输出错误信息,或者当搜索到多个所述第一信息时,获得用户从所述多个第一信息中选择的第一信息,并将所述用户选择的第一信息***所述文本。
本发明实施例中,当终端设备呈现编辑信息的图形用户界面时,接收向正在编辑的文本中***第一信息的语音指令,将语音指令转化为搜索指令,根据搜索指令搜索第一信息,并将搜索到的所述第一信息***所述文本。应用本发明实施例,用户在通过终端设备编辑文本的过程中,无需手动打开多个应用,而是通过语音指令即可在编辑文本中***电话号码或图片等信息,因此简化了***信息的操作过程。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明语音输入信息的方法的一个实施例流程图;
图2A为本发明语音输入信息实施例的应用架构示意图;
图2B为本发明语音输入信息的方法的另一个实施例流程图;
图3为本发明语音输入信息的方法的另一个实施例流程图;
图4为本发明终端设备的一个实施例框图;
图5为本发明终端设备的另一个实施例框图;
图6为本发明终端设备的另一个实施例框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明实施例中的技术方案,并使本发明实施例的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明实施例中技术方案作进一步详细的说明。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本发明实施例中可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
参见图1,为本发明语音输入信息的方法的一个实施例流程图:
步骤101:当终端设备呈现编辑信息的图形用户界面时,接收向正在编辑的文本中***第一信息的语音指令。
本发明实施例中的终端设备上通常设置麦克风,通过麦克风可以获取用户发出的语音指令,语音指令为通过声纹信息表征的命令。其中,终端设备可以具体为智能手机、平板电脑等;编辑文本可以具体指在终端设备上使用编辑短消息,或者编辑记事本等具有文本输入功能的软件;第一信息可以具体为电话号码、或者图片等信息。
步骤102:终端设备将语音指令转化为搜索指令。
本实施例中,终端设备可以将语音指令传输到语音识别引擎,以使语音识别引擎对语音指令进行语音识别,获得文本识别结果,当语音识别引擎返回文本识别结果后,将文本识别结果传输到语义识别引擎,以使语义识别引擎解析该文本识别结果获得语义识别结果,当语义识别引擎返回语义识别结果后,对该语义识别结果进行转换,生成搜索指令,搜索指令为能够由所述终端设备直接执行的命令。
其中,终端设备可以通过内置的语音识别引擎对语音指令进行识别,或者,终端设备也可以通过网络将语音指令传输到语音识别服务器,语音识别服务器通过自身设置的语音识别引擎对该语音指令进行识别。其中,当终端设备内置了语音识别引擎时,终端设备可以在开机后自动运行该语音识别引擎,或者,终端设备也可以根据用户的指令启动语音识别引擎,或者,终端设备也可以在显示屏上输出包括文字、图片等的文本信息时自动启动语音识别引擎。
其中,终端设备可以通过内置的语义识别引擎对文本识别结果进行语义识别,或者,终端设备也可以通过网络将文本识别结果传输到语义识别服务器,语义识别服务器通过自身设置的语义识别引擎对该文本识别结果进行语义识别。
本发明实施例应用语音识别技术,该技术可以将人类语音中的词汇内容转换为终端设备可读的输入,例如按键、二进制编码或者字符序列等。现有的终端设备操作***通常自带语音识别软件(即语音识别引擎)或可以安装由第三方提供的语音识别软件,可以将用户的语音转换为终端设备可读的输入。
步骤103:终端设备根据搜索指令搜索第一信息。
本实施例中,终端设备可以将搜索指令传输到搜索引擎,以使搜索引擎根据搜索指令从搜索对象库中查询第一信息,并接收搜索引擎查询到的第一信息。其中,终端设备可以通过内置的搜索引擎对内置的搜索对象库进行查询,根据查询的第一信息的不同类型,该搜索对象库可以具体为终端设备内的通讯录,或者图片库等,或者,终端设备也可以通过网络将搜索指令传输到搜索服务器,搜索服务器通过自身设置的搜索引擎对网络中的搜索对象库进行查询,根据查询的第一信息的不同类型,该搜索对象库可以具体为网络中的图片,或者用户信息等。
步骤104:终端设备将搜索到的第一信息***文本。
由上述实施例可见,用户在通过终端设备编辑文本的过程中,无需手动打开多个应用,而是通过语音指令即可在编辑文本中***电话号码或图片等信息,因此简化了***信息的操作过程,增强了用户体验。
参见图2A为,本发明语音控制信息***实施例的应用架构示意图:
该架构图中包括:语音服务模块,与语音服务模块对应的语音识别引擎,语义服务模块,与语义服务模块对应的语义识别引擎,与语义服务模块连接的搜索引擎,以及与搜索引擎相连的搜索对象库。其中,语音服务模块和语义服务模块集成在终端设备内,语音识别引擎、语义识别引擎、搜索引擎以及搜索对象库中的任意一个可以集成在终端设备内或者设置在云服务器上。当语音识别引擎、语义识别引擎、搜索引擎设置在云服务器上时,语音服务模块和语义服务模块分别通过网络与云服务器上的语音识别引擎、语义识别引擎和搜索引擎进行交互,该搜索对象库内的信息由网络中的海量信息组成。
参见图2B,为本发明语音输入信息的方法的另一个实施例流程图,该实施例结合图2A示出的应用架构进行描述:
步骤201:当终端设备呈现编辑信息的图形用户界面时,接收向正在编辑的文本中***第一信息的语音指令。
本发明实施例中的终端设备上通常设置麦克风,通过麦克风可以获取用户发出的语音指令。其中,终端设备可以具体为智能手机、平板电脑等;编辑文本可以具体指在终端设备上使用编辑短消息,或者编辑记事本等具有文本输入功能的软件;第一信息可以具体为电话号码、或者图片等信息。
步骤202:终端设备将语音指令传输到语音识别引擎,以使语音识别引擎对语音指令进行语音识别,获得文本识别结果。
本实施例中,终端设备可以通过语音服务模块将语音指令传输到语音识别引擎。其中,终端设备可以通过内置的语音识别引擎对语音指令进行识别,或者,终端设备也可以通过网络将语音指令传输到语音识别服务器,语音识别服务器通过自身设置的语音识别引擎对该语音指令进行识别。其中,当终端设备内置了语音识别引擎时,终端设备可以在开机后自动运行该语音识别引擎,或者,终端设备也可以根据用户的指令启动语音识别引擎,或者,终端设备也可以在显示屏上输出包括文字、图片等的文本信息时自动启动语音识别引擎。
本发明实施例应用语音识别技术,该技术可以将人类语音中的词汇内容转换为终端设备可读的输入,例如按键、二进制编码或者字符序列等。现有的终端设备操作***通常自带语音识别软件(即语音识别引擎)或可以安装由第三方提供的语音识别软件,可以将用户的语音转换为终端设备可读的输入。
步骤203:终端设备获得语音识别引擎返回的文本识别结果。
本实施例中,语音识别引擎可以将文本识别结果返回给语音服务模块,然后由语音服务模块将文本识别结果传输给语义服务模块。
步骤204:终端设备将文本识别结果传输到语义识别引擎,以使语义识别引擎对文本识别结果进行解析,获得语义识别结果。
本实施例中,语义服务模块可以将文本识别结果传输到语义识别引擎,由语义识别引擎解析该文本识别结果,获得语义识别结果,该语义识别结果包括语音指令的动作类型(ActionTpye)、关键字(Name)和对象(Object),其中,语音指令的动作类型为***(Insert)。
步骤205:终端设备获得语义识别引擎返回的语义识别结果。
本实施例中,语义识别引擎可以将包括语音指令的动作类型(ActionTpye)、关键字(Name)和对象(Object)的语义识别结果返回给语义服务模块。
步骤206:终端设备对语义识别结果进行转换,生成搜索指令。
语义服务模块接收到语义识别结果后,根据该语义识别结果,将语音指令的动作类型(ActionTpye)、关键字(Name)和对象(Object)转换为搜索指令,其中,搜索指令的动作类型(ActionTpye)为搜索(Search),搜索指令的关键字(Name)与语音指令的关键字(Name)一致,搜索指令的对象(Object)与语音指令的对象(Object)一致。
例如,当步骤203中获得语音识别引擎返回的文本识别结果为“***Mary的电话号码”,则语义识别引擎可以解析该文本识别结果获得语义识别结果,解析后的格式如下:
<ActionType>Insert</ActionType>
<Name>Mary</Name>
<Object>Phone Number</Object>
语义服务模块接收到语义识别引擎返回的语义识别结果后,将上述格式转换为如下的搜索指令:
<ActionType>Search</ActionType>
<Object>Phone Book</Object>
<Parameter>
<Name>Mary</Name>
</Parameter>
步骤207:终端设备将搜索指令传输到搜索引擎,以使搜索引擎根据搜索指令从搜索对象库中查询第一信息。
本实施例中,语义服务模块可以将搜索指令传输到搜索引擎。其中,终端设备可以通过内置的搜索引擎对内置的搜索对象库进行查询,根据查询的第一信息的不同类型,该搜索对象库可以具体为终端设备内的通讯录,或者图片库等,或者,终端设备也可以通过网络将搜索指令传输到搜索服务器,搜索服务器通过自身设置的搜索引擎对网络中的搜索对象库进行查询,根据查询的第一信息的不同类型,该搜索对象库可以具体为网络中的图片,或者用户信息等。
步骤208:终端设备接收搜索引擎查询到的第一信息。
步骤209:终端设备将搜索到的第一信息***文本。
由上述实施例可见,用户在通过终端设备编辑文本的过程中,无需手动打开多个应用,而是通过语音指令即可在编辑文本中***电话号码或图片等信息,因此简化了***信息的操作过程,增强了用户体验。
参见图3,为本发明语音输入信息的方法的另一个实施例流程图:
步骤301:当终端设备呈现编辑信息的图形用户界面时,接收向正在编辑的文本中***第一信息的语音指令。
本发明实施例中的终端设备上通常设置麦克风,通过麦克风可以获取用户发出的语音指令。其中,终端设备可以具体为智能手机、平板电脑等;编辑文本可以具体指在终端设备上使用编辑短消息,或者编辑记事本等具有文本输入功能的软件;第一信息可以具体为电话号码、或者图片等信息。
步骤302:终端设备将语音指令转化为搜索指令。
本实施例中,终端设备可以将语音指令传输到语音识别引擎,以使语音识别引擎对语音指令进行语音识别,获得文本识别结果,当语音识别引擎返回文本识别结果后,将文本识别结果传输到语义识别引擎,以使语义识别引擎解析该文本识别结果获得语义识别结果,当语义识别引擎返回语义识别结果后,对该语义识别结果进行转换,生成搜索指令。
其中,终端设备可以通过内置的语音识别引擎对语音指令进行识别,或者,终端设备也可以通过网络将语音指令传输到语音识别服务器,语音识别服务器通过自身设置的语音识别引擎对该语音指令进行识别。其中,当终端设备内置了语音识别引擎时,终端设备可以在开机后自动运行该语音识别引擎,或者,终端设备也可以根据用户的指令启动语音识别引擎,或者,终端设备也可以在显示屏上输出包括文字、图片等的文本信息时自动启动语音识别引擎。
其中,终端设备可以通过内置的语义识别引擎对文本识别结果进行语义识别,或者,终端设备也可以通过网络将文本识别结果传输到语义识别服务器,语义识别服务器通过自身设置的语义识别引擎对该文本识别结果进行语义识别。
本发明实施例应用语音识别技术,该技术可以将人类语音中的词汇内容转换为终端设备可读的输入,例如按键、二进制编码或者字符序列等。现有的终端设备操作***通常自带语音识别软件(即语音识别引擎)或可以安装由第三方提供的语音识别软件,可以将用户的语音转换为终端设备可读的输入。
步骤303:终端设备根据搜索指令搜索第一信息。
本实施例中,终端设备可以将搜索指令传输到搜索引擎,以使搜索引擎根据搜索指令从搜索对象库中查询第一信息,并接收搜索引擎查询到的第一信息。其中,终端设备可以通过内置的搜索引擎对内置的搜索对象库进行查询,根据查询的第一信息的不同类型,该搜索对象库可以具体为终端设备内的通讯录,或者图片库等,或者,终端设备也可以通过网络将搜索指令传输到搜索服务器,搜索服务器通过自身设置的搜索引擎对网络中的搜索对象库进行查询,根据查询的第一信息的不同类型,该搜索对象库可以具体为网络中的图片,或者用户信息等。
步骤304:终端设备判断第一信息的搜索结果,当搜索到多个第一信息时,执行步骤305;当搜索到一个第一信息时,执行步骤306;当未搜索到第一信息时,执行步骤307。
步骤305:终端设备获得用户从多个第一信息中选择的第一信息。
当步骤304中的判断结果为搜索到多个第一信息时,则终端设备可以将多个第一信息以选择的形式,通过终端设备显示屏呈现给用户,以便用户从多个第一信息中选择待***文本中的第一信息,终端设备获得用户的选择结果。
步骤306:终端设备将该第一信息***文本,结束当前流程。
当步骤304中的判断结果为搜索到一个第一信息时,则终端设备可以直接将该第一信息***文本中;当步骤305中终端设备获取到用户从多个第一信息中选择的第一信息后,则终端设备可以将选择的第一信息***文本中。
步骤307:终端设备输出错误信息,结束当前流程。
当步骤304中的判断结果为未搜索到第一信息时,则终端设备可以通过显示屏输出错误信息,以提示用户没有适合***的第一信息。
由上述实施例可见,用户在通过终端设备编辑文本的过程中,无需手动打开多个应用,而是通过语音指令即可在编辑文本中***电话号码或图片等信息,因此简化了***信息的操作过程,增强了用户体验;并且,在根据搜索结果获得不同数量的信息时,可以根据用户的选择结果灵活***信息。
与本发明语音输入信息的方法的实施例相对应,本发明还提供了终端设备的实施例。
参见图4,为本发明终端设备的一个实施例框图:
该装置包括:接收单元410、转化单元420、搜索单元430和***单元440。
其中,接收单元410,用于当所述终端设备呈现编辑信息的图形用户界面时,接收向正在编辑的文本中***第一信息的语音指令,所述语音指令为通过声纹信息表征的命令,所述第一信息包括电话号码或图片;
转化单元420,用于将所述接收单元410接收到的语音指令转化为搜索指令,所述搜索指令为能够由所述终端设备直接执行的命令;
搜索单元430,用于根据所述转化单元420转化的搜索指令搜索所述第一信息;
***单元440,用于将所述搜索单元430搜索到的所述第一信息***所述文本。
在一个可选的实现方式中:
所述转化单元420可以包括(图4中未示出):
语音指令传输子单元,用于将所述语音指令传输到语音识别引擎,以使所述语音识别引擎对所述语音指令进行语音识别,获得文本识别结果;
文本结果接收子单元,用于获得所述语音识别引擎返回的文本识别结果;
文本结果传输子单元,用于将所述文本结果接收子单元获得的文本识别结果传输到语义识别引擎,以使所述语义识别引擎对所述文本识别结果进行解析,获得语义识别结果;
语义结果接收子单元,用于获得所述语义识别引擎返回的语义识别结果;
搜索指令生成子单元,用于对所述语义结果接收子单元获得的语义识别结果进行转换,生成搜索指令。
在另一个可选的实现方式中:
所述搜索单元430可以包括(图4中未示出):
搜索指令传输子单元,用于将所述搜索指令传输到搜索引擎,以使所述搜索引擎根据所述搜索指令从搜索对象库中查询所述第一信息;
信息接收子单元,用于接收所述搜索引擎查询到的所述第一信息。
参见图5,为本发明终端设备的另一个实施例框图:
该装置包括:接收单元510、转化单元520、搜索单元530、***单元540、获得单元550和输出单元560。
其中,接收单元510,用于当所述终端设备呈现编辑信息的图形用户界面时,接收向正在编辑的文本中***第一信息的语音指令,所述语音指令为通过声纹信息表征的命令,所述第一信息包括电话号码或图片;
转化单元520,用于将所述接收单元510接收到的语音指令转化为搜索指令,所述搜索指令为能够由所述终端设备直接执行的命令;
搜索单元530,用于根据所述转化单元520转化的搜索指令搜索所述第一信息;
***单元540,用于将所述搜索单元530搜索到的所述第一信息***所述文本;
获得单元550,用于当所述搜索单元530搜索到多个所述第一信息时,获得用户从所述多个第一信息中选择的第一信息;
所述***单元540,还用于将所述获得单元550获得的用户选择的第一信息***所述文本;
输出单元560,用于当所述搜索单元530未搜索到所述第一信息时,输出错误信息。
在一个可选的实现方式中:
所述转化单元520可以包括(图5中未示出):
语音指令传输子单元,用于将所述语音指令传输到语音识别引擎,以使所述语音识别引擎对所述语音指令进行语音识别,获得文本识别结果;
文本结果接收子单元,用于获得所述语音识别引擎返回的文本识别结果;
文本结果传输子单元,用于将所述文本结果接收子单元获得的文本识别结果传输到语义识别引擎,以使所述语义识别引擎对所述文本识别结果进行解析,获得语义识别结果;
语义结果接收子单元,用于获得所述语义识别引擎返回的语义识别结果;
搜索指令生成子单元,用于对所述语义结果接收子单元获得的语义识别结果进行转换,生成搜索指令。
其中,所述语义结果接收子单元接收到的语义识别结果可以包括:所述语音指令的动作类型、关键字和对象,其中,所述语音指令的动作类型为***;所述搜索指令生成子单元,可以具体用于将所述语音指令的动作类型、关键字和对象转换为搜索指令,其中,所述搜索指令的动作类型为搜索,所述搜索指令的关键字与所述语音指令的关键字一致,所述搜索指令的对象与所述语音指令的对象一致。
在另一个可选的实现方式中:
所述搜索单元530可以包括(图5中未示出):
搜索指令传输子单元,用于将所述搜索指令传输到搜索引擎,以使所述搜索引擎根据所述搜索指令从搜索对象库中查询所述第一信息;
信息接收子单元,用于接收所述搜索引擎查询到的所述第一信息。
参见图6,为本发明终端设备的另一个实施例框图:
该终端包括:总线610,以及通过所述总线610连接的显示屏620、麦克风630及处理器640。
其中,所述显示屏620,用于呈现编辑信息的图形用户界面;
所述麦克风630,用于接收向正在编辑的文本中***第一信息的语音指令,所述语音指令为通过声纹信息表征的命令,所述第一信息包括电话号码或图片;
所述处理器640,用于将所述语音指令转化为搜索指令,所述搜索指令为能够由所述终端设备直接执行的命令,根据所述搜索指令搜索所述第一信息,并将搜索到的所述第一信息***所述文本。
在一个可选的实现方式中:
所述处理器640,可以具体用于将所述语音指令传输到语音识别引擎,以使所述语音识别引擎对所述语音指令进行语音识别,获得文本识别结果,将所述文本识别结果传输到语义识别引擎,以使所述语义识别引擎对所述文本识别结果进行解析,获得语义识别结果,获得所述语义识别引擎返回的语义识别结果,并对所述语义识别结果进行转换,生成搜索指令。
在另一个可选的实现方式中:
所述语义识别结果可以包括:所述语音指令的动作类型、关键字和对象,其中,所述语音指令的动作类型为***;所述处理器640,可以具体用于将所述语音指令的动作类型、关键字和对象转换为搜索指令,其中,所述搜索指令的动作类型为搜索,所述搜索指令的关键字与所述语音指令的关键字一致,所述搜索指令的对象与所述语音指令的对象一致。
在另一个可选的实现方式中:
所述处理器640,可以具体用于将所述搜索指令传输到搜索引擎,以使所述搜索引擎根据所述搜索指令从搜索对象库中查询所述第一信息,并接收所述搜索引擎查询到的所述第一信息。
在另一个可选的实现方式中:
所述处理器640,还可以用于当未搜索到所述第一信息时,通过所述显示屏620输出错误信息,或者当搜索到多个所述第一信息时,获得用户从所述多个第一信息中选择的第一信息,并将所述用户选择的第一信息***所述文本。
由上述实施例可见,当终端设备呈现编辑信息的图形用户界面时,接收向正在编辑的文本中***第一信息的语音指令,将语音指令转化为搜索指令,根据搜索指令搜索第一信息,并将搜索到的所述第一信息***所述文本。应用本发明实施例,用户在通过终端设备编辑文本的过程中,无需手动打开多个应用,而是通过语音指令即可在编辑文本中***电话号码或图片等信息,因此简化了***信息的操作过程。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述的本发明实施方式,并不构成对本发明保护范围的限定。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种语音输入信息的方法,其特征在于,所述方法包括:
当终端设备显示编辑短消息的图形用户界面时,所述终端设备接收向正在编辑的文本中***第一信息的语音指令,所述语音指令通过麦克风获取,所述第一信息包括电话号码或图片;
所述终端设备的语音识别引擎对所述语音指令进行语音识别并获得文本识别结果;
所述终端设备的语义识别引擎解析所述文本识别结果并获得语义识别结果,所述语义识别结果包括所述语音指令的动作类型、关键字和对象,其中,所述语音指令的动作类型为***,所述语音指令的关键字为所述文本识别结果中获取的;
所述终端设备的语义服务模块对所述语义识别结果进行转换并生成搜索指令,其中,所述搜索指令的动作类型为搜索,所述搜索指令的关键字与所述语音指令的关键字相同,
所述终端设备通过网络将所述搜索指令发送给搜索服务器;
所述搜索服务器通过自身设置的搜索引擎,根据所述搜索指令在所述网络中的搜索对象库中搜索所述第一信息,所述搜索指令的对象与所述语音指令的对象所对应的搜索对象库相同;
当所述终端设备搜索到多个所述第一信息时,获得用户从所述多个第一信息中选择的第一信息;
所述终端设备将所述用户选择的第一信息***所述图形用户界面中的所述文本中。
2.根据权利要求1所述的方法,其特征在于,所述搜索对象库是所述网络中的通讯录或者图片库。
3.一种通过语音输入信息的***,其特征在于,所述***包括终端设备和搜索服务器;其中:
所述终端设备用于:当所述终端设备显示编辑短消息的图形用户界面时,所述终端设备接收向正在编辑的文本中***第一信息的语音指令,所述语音指令通过麦克风获取,所述第一信息包括电话号码或图片;
所述终端设备的语音识别引擎对所述语音指令进行语音识别并获得文本识别结果;
所述终端设备的语义识别引擎解析所述文本识别结果并获得语义识别结果,所述语义识别结果包括所述语音指令的动作类型、关键字和对象,其中,所述语音指令的动作类型为***,所述语音指令的关键字为所述文本识别结果中获取的;
所述终端设备的语义服务模块对所述语义识别结果进行转换并生成搜索指令,其中,所述搜索指令的动作类型为搜索,所述搜索指令的关键字与所述语音指令的关键字相同,
所述终端设备还用于通过网络将所述搜索指令发送给搜索服务器;
所述搜索服务器用于:通过自身设置的搜索引擎,根据所述搜索指令在所述网络中的搜索对象库中搜索所述第一信息,所述搜索指令的对象与所述语音指令的对象所对应的搜索对象库相同;
所述搜索服务器还用于当搜索到多个第一信息时,将所述多个第一信息通过所述网络发送给所述终端设备;
所述终端设备还用于:获得用户从所述多个第一信息中选择的第一信息;
所述终端设备将所述用户选择的第一信息***所述图形用户界面中的所述文本中。
4.一种终端设备,其特征在于,所述终端设备包括:
接收单元,用于当所述终端设备显示编辑短消息的图形用户界面时,接收向正在编辑的文本中***第一信息的语音指令,所述语音指令通过麦克风获取,所述第一信息包括电话号码或图片;
语音指令传输子单元,用于将所述语音指令传输到语音识别引擎,以使所述语音识别引擎对所述语音指令进行语音识别,获得文本识别结果;
文本结果接收子单元,用于获得所述语音识别引擎返回的文本识别结果;
文本结果传输子单元,用于将所述文本结果接收子单元获得的文本识别结果传输到语义识别引擎,以使所述语义识别引擎对所述文本识别结果进行解析,获得语义识别结果;
语义结果接收子单元,用于获得所述语义识别引擎返回的语义识别结果,所述语义识别结果包括所述语音指令的动作类型、关键字和对象,其中,所述语音指令的动作类型为***,所述语音指令的关键字为所述文本识别结果中获取的;
搜索指令生成子单元,用于对所述语义结果接收子单元获得的语义识别结果进行转换,生成搜索指令;其中,所述搜索指令的动作类型为搜索,所述搜索指令的关键字与所述语音指令的关键字相同,所述搜索指令的对象与所述语音指令的对象所对应的搜索对象库相同;
搜索单元,用于根据所述搜索指令生成子单元生成的搜索指令在所述搜索对象库中搜索所述第一信息;其中,所述搜索对象库是通讯录或者图片库;
获得单元,用于当所述搜索单元搜索到多个所述第一信息时,获得用户从所述多个第一信息中选择的第一信息;
***单元,用于将所述获得单元获得的用户选择的第一信息***所述图形用户界面中的所述文本中。
CN202010278574.0A 2013-10-28 2013-10-28 语音输入信息的方法及终端设备 Pending CN111581462A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010278574.0A CN111581462A (zh) 2013-10-28 2013-10-28 语音输入信息的方法及终端设备

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010278574.0A CN111581462A (zh) 2013-10-28 2013-10-28 语音输入信息的方法及终端设备
CN201310515783.2A CN103559242A (zh) 2013-10-28 2013-10-28 语音输入信息的方法及终端设备

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201310515783.2A Division CN103559242A (zh) 2013-10-28 2013-10-28 语音输入信息的方法及终端设备

Publications (1)

Publication Number Publication Date
CN111581462A true CN111581462A (zh) 2020-08-25

Family

ID=50013489

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202010278574.0A Pending CN111581462A (zh) 2013-10-28 2013-10-28 语音输入信息的方法及终端设备
CN201310515783.2A Pending CN103559242A (zh) 2013-10-28 2013-10-28 语音输入信息的方法及终端设备

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201310515783.2A Pending CN103559242A (zh) 2013-10-28 2013-10-28 语音输入信息的方法及终端设备

Country Status (1)

Country Link
CN (2) CN111581462A (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016017978A1 (en) 2014-07-31 2016-02-04 Samsung Electronics Co., Ltd. Device and method for performing functions
CN104182479B (zh) * 2014-08-04 2018-11-30 宇龙计算机通信科技(深圳)有限公司 一种处理信息的方法及装置
CN106504748A (zh) * 2016-10-08 2017-03-15 珠海格力电器股份有限公司 一种语音控制方法和装置
CN107885432A (zh) * 2017-11-24 2018-04-06 杭州荔宝信息技术有限公司 一种胎儿三维虚拟现实人机交互方法及***
CN113298619A (zh) * 2021-05-24 2021-08-24 成都威爱新经济技术研究院有限公司 一种基于自由视点技术的3d商品直播展示方法及***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1536863A (zh) * 2003-04-11 2004-10-13 乐金电子(中国)研究开发中心有限公司 在通话中传送检索电话号码的方法
CN101442721A (zh) * 2007-11-23 2009-05-27 希姆通信息技术(上海)有限公司 在手机短信中***多媒体签名的实现方法
CN101552844A (zh) * 2008-04-02 2009-10-07 季争鸣 在网络端搜索被叫方电话号码并直接拨打的方法
CN103167120A (zh) * 2012-07-05 2013-06-19 深圳市金立通信设备有限公司 手机通话过程中快速查找联系人的***及方法
CN103177724A (zh) * 2013-03-19 2013-06-26 华为终端有限公司 语音控制文本操作的方法、装置及终端

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101090413A (zh) * 2006-06-14 2007-12-19 华为技术有限公司 一种电话呼叫的方法和***
CN101605165A (zh) * 2009-07-13 2009-12-16 上海联创三信电子研发销售中心 手机发送短信的方法
CN103092823B (zh) * 2013-01-25 2015-08-19 华为终端有限公司 一种操作文本的方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1536863A (zh) * 2003-04-11 2004-10-13 乐金电子(中国)研究开发中心有限公司 在通话中传送检索电话号码的方法
CN101442721A (zh) * 2007-11-23 2009-05-27 希姆通信息技术(上海)有限公司 在手机短信中***多媒体签名的实现方法
CN101552844A (zh) * 2008-04-02 2009-10-07 季争鸣 在网络端搜索被叫方电话号码并直接拨打的方法
CN103167120A (zh) * 2012-07-05 2013-06-19 深圳市金立通信设备有限公司 手机通话过程中快速查找联系人的***及方法
CN103177724A (zh) * 2013-03-19 2013-06-26 华为终端有限公司 语音控制文本操作的方法、装置及终端

Also Published As

Publication number Publication date
CN103559242A (zh) 2014-02-05

Similar Documents

Publication Publication Date Title
JP6647351B2 (ja) 候補応答情報を生成する方法及び装置
CN117056471A (zh) 知识库构建方法及基于生成式大语言模型的问答对话方法和***
US11494376B2 (en) Data query method supporting natural language, open platform, and user terminal
EP2490213A1 (en) Method for converting character text messages to audio files with respective titles for their selection and reading aloud with mobile devices
US20080154604A1 (en) System and method for providing context-based dynamic speech grammar generation for use in search applications
CN102984050A (zh) 即时通信中语音搜索的方法、客户端及***
CN111581462A (zh) 语音输入信息的方法及终端设备
CN101681365A (zh) 用于分布式语音搜索的方法和装置
CN101611403A (zh) 用于移动通信设备中的语音搜索的方法和装置
CN110855555B (zh) 邮件发送方法、装置、设备及计算机可读存储介质
CN104468959A (zh) 移动终端通话过程中显示图像的方法、装置及移动终端
CN101605307A (zh) 文本短信语音播放***及方法
CN114401431B (zh) 一种虚拟人讲解视频生成方法及相关装置
CN114390220B (zh) 一种动画视频生成方法及相关装置
CN103281446A (zh) 语音短信发送***和方法
CN106558311B (zh) 语音内容提示方法和装置
CN103151044A (zh) 基于语音识别的语言转换方法及***
CN103177039A (zh) 一种数据处理方法及装置
CN112600750A (zh) 即时通信中多条对话信息的处理方法和装置
JP6179971B2 (ja) 情報提供装置及び情報提供方法
KR101351264B1 (ko) 음성인식 기반의 메시징 통역서비스 제공 시스템 및 그 방법
CN102014199A (zh) 一种信息显示方法及终端
CN111354350A (zh) 语音处理方法及装置、语音处理设备、电子设备
KR101799327B1 (ko) 광고 플랫폼과 연계되는 키보드 sdk 장치 및 그 광고 방법
CN104243666B (zh) 语言处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200825