CN106558310A - 虚拟现实语音控制方法及装置 - Google Patents

虚拟现实语音控制方法及装置 Download PDF

Info

Publication number
CN106558310A
CN106558310A CN201610900436.5A CN201610900436A CN106558310A CN 106558310 A CN106558310 A CN 106558310A CN 201610900436 A CN201610900436 A CN 201610900436A CN 106558310 A CN106558310 A CN 106558310A
Authority
CN
China
Prior art keywords
virtual reality
applications program
voice messaging
reality applications
speech interface
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610900436.5A
Other languages
English (en)
Other versions
CN106558310B (zh
Inventor
刘晓乾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201610900436.5A priority Critical patent/CN106558310B/zh
Publication of CN106558310A publication Critical patent/CN106558310A/zh
Priority to US15/783,344 priority patent/US10714090B2/en
Application granted granted Critical
Publication of CN106558310B publication Critical patent/CN106558310B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明提出了一种虚拟现实语音控制方法及装置,其中,方法包括:接收虚拟现实应用程序发送的开启语音接口的请求;根据请求开启语音接口,并通过语音接口接收输入的语音信息;将语音信息转换为文本信息,并对文本信息进行规范化,以生成符合预设规范的意图对象;基于预设规范集合识别意图对象,并获取意图对象对应的指令;将指令发送至虚拟现实应用程序,以使虚拟现实应用程序执行指令,并反馈执行结果。通过本发明能够通过语音实现对虚拟现实过程和虚拟现实中场景转换的控制,避免了硬件控制的重复性和不便性,提高交互的真实性。

Description

虚拟现实语音控制方法及装置
技术领域
本发明涉及虚拟现实技术领域,尤其涉及一种虚拟现实语音控制方法及装置。
背景技术
虚拟现实(Virtual Reality,VR)技术是一种实现交互式的三维动态视景和实体行为的计算机仿真***,能够根据用户的行为动作作出实时响应,并反馈给用户,使用户在虚拟世界中获得与现实世界中相同或相似的感官体验。
在虚拟现实过程中,现有的控制方式一般有两种:一种是在虚拟画面中增加一个确认点,通过头部转动控制确认点的移动,将确认点移动至目标位置;另一种是通过手柄、智能手套、臂铠,以及装甲等穿戴式硬件设备追踪用户的手势和动作,并通过振动来反馈操作结果,实现用户与虚拟现实环境的交互。使用现有的虚拟现实控制方式实现交互时,在一些简单的场景中可能需要过度的重复操作,不够灵活便捷,且容易造成用户操作疲劳,真实性和交互体验差。
发明内容
本发明的目的旨在至少在一定程度上解决上述的技术问题之一。
为此,本发明的第一个目的在于提出一种虚拟现实语音控制方法,该方法增加了语音识别技术,能够通过语音实现对虚拟现实过程和虚拟现实中场景转换的控制,提高交互的真实性。
本发明的第二个目的在于提出一种虚拟现实语音控制装置。
本发明的第三个目的在于提出一种终端。
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
本发明的第五个目的在于提出一种计算机程序产品。
为了实现上述目的,本发明第一方面实施例提出了一种虚拟现实语音控制方法,包括:接收虚拟现实应用程序发送的开启语音接口的请求;根据请求开启语音接口,并通过语音接口接收输入的语音信息;将语音信息转换为文本信息,并对文本信息进行规范化,以生成符合预设规范的意图对象;基于预设规范集合识别意图对象,并获取意图对象对应的指令;将指令发送至虚拟现实应用程序,以使虚拟现实应用程序执行指令,并反馈执行结果。
本发明第一方面实施例提出的虚拟现实语音控制方法,通过根据虚拟现实应用程序发送的开启语音接口的请求开启语音接口,并通过语音接口接收语音信息,将语音信息转换为文本信息后对文本信息进行规范化生成意图对象,获取意图对象对应的指令后将指令发送至虚拟现实应用程序,以使虚拟现实应用程序执行指令,并反馈执行结果,能够通过语音实现对虚拟现实过程和虚拟现实中场景转换的控制,避免了硬件控制的重复性和不便性,提高交互的真实性。
为了实现上述目的,本发明第二方面实施例提出了一种虚拟现实语音控制装置,包括:接收模块,用于接收虚拟现实应用程序发送的开启语音接口的请求;控制模块,用于根据请求开启语音接口,并通过语音接口接收输入的语音信息;生成模块,用于将语音信息转换为文本信息,并对文本信息进行规范化,以生成符合预设规范的意图对象;获取模块,用于基于预设规范集合识别意图对象,并获取意图对象对应的指令;发送模块,用于将指令发送至虚拟现实应用程序,以使虚拟现实应用程序执行指令,并反馈执行结果。
本发明第二方面实施例提出的虚拟现实语音控制装置,通过根据虚拟现实应用程序发送的开启语音接口的请求开启语音接口,并通过语音接口接收语音信息,将语音信息转换为文本信息后对文本信息进行规范化生成意图对象,获取意图对象对应的指令后将指令发送至虚拟现实应用程序,以使虚拟现实应用程序执行指令,并反馈执行结果,能够通过语音实现对虚拟现实过程和虚拟现实中场景转换的控制,避免了硬件控制的重复性和不便性,提高交互的真实性。
为了实现上述目的,本发明第三方面实施例提出了一种终端,包括:处理器;用于存储处理器可执行指令的存储器。其中,处理器被配置为执行以下步骤:
接收虚拟现实应用程序发送的开启语音接口的请求;
根据请求开启所述语音接口,并通过语音接口接收输入的语音信息;
将语音信息转换为文本信息,并对文本信息进行规范化,以生成符合预设规范的意图对象;
基于预设规范集合识别意图对象,并获取意图对象对应的指令;
将指令发送至虚拟现实应用程序,以使虚拟现实应用程序执行指令,并反馈执行结果。
本发明第三方面实施例提出的终端,通过根据虚拟现实应用程序发送的开启语音接口的请求开启语音接口,并通过语音接口接收语音信息,将语音信息转换为文本信息后对文本信息进行规范化生成意图对象,获取意图对象对应的指令后将指令发送至虚拟现实应用程序,以使虚拟现实应用程序执行指令,并反馈执行结果,能够通过语音实现对虚拟现实过程和虚拟现实中场景转换的控制,避免了硬件控制的重复性和不便性,提高交互的真实性。
为了实现上述目的,本发明第四方面实施例提出了一种非临时性计算机可读存储介质,用于存储一个或多个程序,当存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种虚拟现实语音控制方法,方法包括;
接收虚拟现实应用程序发送的开启语音接口的请求;
根据请求开启语音接口,并通过语音接口接收输入的语音信息;
将语音信息转换为文本信息,并对文本信息进行规范化,以生成符合预设规范的意图对象;
基于预设规范集合识别意图对象,并获取意图对象对应的指令;
将指令发送至虚拟现实应用程序,以使虚拟现实应用程序执行指令,并反馈执行结果。
本发明第四方面实施例提出的非临时性计算机可读存储介质,通过根据虚拟现实应用程序发送的开启语音接口的请求开启语音接口,并通过语音接口接收语音信息,将语音信息转换为文本信息后对文本信息进行规范化生成意图对象,获取意图对象对应的指令后将指令发送至虚拟现实应用程序,以使虚拟现实应用程序执行指令,并反馈执行结果,能够通过语音实现对虚拟现实过程和虚拟现实中场景转换的控制,避免了硬件控制的重复性和不便性,提高交互的真实性。
为了实现上述目的,本发明第五方面实施例提出了一种计算机程序产品,当计算机程序产品中的指令被处理器执行时,执行一种虚拟现实语音控制方法,方法包括:
接收虚拟现实应用程序发送的开启语音接口的请求;
根据请求开启语音接口,并通过语音接口接收输入的语音信息;
将语音信息转换为文本信息,并对文本信息进行规范化,以生成符合预设规范的意图对象;
基于预设规范集合识别意图对象,并获取意图对象对应的指令;
将指令发送至虚拟现实应用程序,以使虚拟现实应用程序执行指令,并反馈执行结果。
本发明第五方面实施例提出的计算机程序产品,通过根据虚拟现实应用程序发送的开启语音接口的请求开启语音接口,并通过语音接口接收语音信息,将语音信息转换为文本信息后对文本信息进行规范化生成意图对象,获取意图对象对应的指令后将指令发送至虚拟现实应用程序,以使虚拟现实应用程序执行指令,并反馈执行结果,能够通过语音实现对虚拟现实过程和虚拟现实中场景转换的控制,避免了硬件控制的重复性和不便性,提高交互的真实性。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明一实施例提出的虚拟现实语音控制方法的流程示意图;
图2是意图对象对应的长命令为预约事件时的流程示意图;
图3是本发明另一实施例提出的虚拟现实语音控制方法的流程示意图;
图4是本发明一实施例提出的虚拟现实语音控制装置的结构示意图;
图5是本发明另一实施例提出的虚拟现实语音控制装置的结构示意图;
图6是本发明又一实施例提出的虚拟现实语音控制装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
图1是本发明一实施例提出的虚拟现实语音控制方法的流程示意图,本实施例从声控虚拟现实***(Voice control Virtual Reality System,VVRS)侧进行描述。VVRS是安装在VR设备中的应用程序,具有语音识别、语意解析,以及语音合成功能,同时能够与VR设备中的其他虚拟现实应用程序进行通信。例如:可与执行操作指令的虚拟现实应用程序进行通信。
如图1所示,本实施例的虚拟现实语音控制方法包括:
S11:接收虚拟现实应用程序发送的开启语音接口的请求。
本实施例中,当需要输入语音指令时,该虚拟现实应用程序主动向VR设备中安装的VVRS发送开启语音接口的请求。VVRS接收虚拟现实应用程序发送的开启语音接口的请求。
S12:根据请求开启语音接口,并通过语音接口接收输入的语音信息。
本实施例中,当VVRS接收到虚拟现实应用程序发送的开启语音接口的请求之后,可开启语音接口,并通过该语音接口接收输入的语音信息。
具体地,当VVRS根据请求开启语音接口之后,即通过该语音接口向虚拟现实硬件设备发送开启麦克风命令,以使虚拟现实硬件设备在接收到开启麦克风的命令后开启麦克风,并通过麦克风接收输入的语音信息。在用户通过麦克风进行语音信息输入的同时,虚拟现实硬件设备能够实时地通过麦克风接收语音信息并发送给VVRS。VVRS再通过语音接口接收输入的语音信息。
S13:将语音信息转换为文本信息,并对文本信息进行规范化,以生成符合预设规范的意图对象。
如前文所述,VVRS具有语音识别和语意解析功能。VVRS的语音识别功能能够将语音信息转换为文本信息,在语音接口接收语音信息的同时,能够即时地识别语音信息,并将接收到的语音信息转换为文本信息。VVRS的语意解析功能能够将语音识别后生成的文本信息或者其他任意的文本信息进行解析,进而获得意图对象。
本实施例中,在VVRS的语音接口接收用户输入的语音信息的过程中,VVRS即可实时地将接收到的语音信息转换为文本信息,并对获得的文本信息进行规范化,最终生成符合预设规范的意图对象。
需要说明的是,预设规范指的是预先设置好的多个不同类型的意图对象。
S14:基于预设规范集合识别意图对象,并获取意图对象对应的指令。
本实施例中,在生成符合预设规范的意图对象之后,即可根据预设规范集合对生成的意图对象进行识别,进而获取意图对象对应的指令。其中,意图对象对应的指令包括短命令和长命令,长命令又包括通话请求、发送消息、付款、搜索信息、预约事件,以及运动命令。
需要说明的是,预设规范集合是在VR设备中预先设置好的,其中保存的是生成的意图对象能够被识别的事件规范形式,以及意图对象与能够被虚拟现实应用程序识别并执行的指令的对应关系。在预设规范集合中,意图对象与指令是一一对应的,即对于一个意图对象,仅有唯一的一条指令与其对应。
因此,根据预设规范集合中存放的意图对象与指令的一一对应关系,即可获得与生成的意图对象对应的指令,即获得与生成的意图对象对应的短命令或者长命令。其中,长命令可包括通话请求、发送消息、付款、搜索信息、预约事件以及运动命令等。
S15:将指令发送至虚拟现实应用程序,以使虚拟现实应用程序执行指令,并反馈执行结果。
本实施例中,在VVRS获得意图对象对应的指令之后,即将指令发送至虚拟现实应用程序。虚拟现实应用程序接收VVRS发送的指令,并执行该指令,同时反馈执行结果。
应当理解的是,根据不同的指令,反馈的执行结果也不同。举例说明如下:
示例一:获取的指令为通话请求。其中,通话请求可以是语音通话请求,也可以是视频通话请求。
假如用户想要使用VR设备与小明进行视频通话,可以直接输入语音信息“给小明打视频电话”。当VVRS收到该语音信息后,将语音信息转换为文本信息,并对该文本信息进行规范化,获得意图对象,根据预设规范集合识别意图对象后,可获得对应的指令,即长命令中的通话请求,并将该长命令发送至相应的虚拟现实应用程序即视频通话程序。视频通话程序收到该长命令后,即可执行该指令并反馈执行结果,即发起与小明的视频通话连接。
示例二:获取的指令为发送消息。
应当理解的是,发送开启语音接口请求的虚拟现实应用程序不同,发送的消息类型也不同,可以是qq消息、微信消息、旺旺消息,以及短信息等。
假设用户想通过VR设备发送一条短信息给小明,则可以直接输入语音信息“给小明发送一条短信息,内容为‘通知各部门经理下午三点开会’”。当VVRS收到该语音信息后,将语音信息转换为文本信息,并对该文本信息进行规范化,获得意图对象,根据预设规范集合识别意图对象后,可获得对应的指令,即长命令中的发送消息,并将该长命令发送至相应的虚拟现实应用程序即短信程序。短信程序收到该长命令后,即可执行该指令并反馈执行结果,即编辑内容为“通知各部门经理下午三点开会”的短信息,并将其发送给联系人小明。
示例三:获取的指令为付款。其中,付款方式可以是支付宝支付、微信支付、手机银行支付等任意可以付款的支付方式。
假如用户在虚拟现实中玩游戏时需要通过支付宝支付100元购买游戏道具,则可以直接输入语音信息“通过支付宝支付100元购买游戏道具”。当VVRS收到该语音信息后,将语音信息转换为文本信息,并对该文本信息进行规范化,获得意图对象,根据预设规范集合识别意图对象后,可获得对应的指令,即长命令中的付款,并将该长命令发送至相应的虚拟现实应用程序即支付宝。支付宝收到该长命令后,即可执行该指令并反馈执行结果,即完成付款100元。
此外,如图2所示,在获取意图对象对应的指令之后,当获取的长命令为预约事件时,还可以包括以下步骤:
S21:判断当前时间是否达到预约事件的约定时间。
本实施例中,在根据预设规范集合识别意图对象,并获取意图对象对应的指令后,若获得的指令是长命令中的预约事件,则此时需要判断当前时间是否达到预约事件的约定时间。
S22:如果达到约定时间,则将预约事件对应的长命令发送至虚拟现实应用程序,以使虚拟现实应用程序执行长命令。
本实施例中,当判断得知当前时间达到预约事件的约定时间后,则将预约事件对应的长命令发送至虚拟现实应用程序,以使虚拟现实应用程序能够执行该长命令。若当前时间未达到约定时间,则继续等待,直至达到约定时间。
举例而言,对于预约事件这一长命令,可以包含一系列的intent(意图)事件(比如,设置闹钟);而对于每一个intent事件,又可以包含一系列的object(对象),比如,当intent事件为设置闹钟时,object可以是time、repeat和content等。其中,time表示的是预约事件的约定时间;repeat为重复提醒次数,用于设置提醒的次数和提醒的时间间隔;content表示闹钟的内容。用domain(域)表示长命令,以intent事件为设置闹钟为例,具体结构表示如下:
在用户与虚拟现实进行交互的过程中,当用户感到疲劳但又无法立即停止当前的活动时,可以进行休息时间预约提醒,比如,可以输入语音信息“提醒我10分钟后休息一会儿”。VVRS对该语音信息进行解析,获得意图对象“提醒10分钟后休息”。该意图对象符合预设规范集合中预约提醒这一事件的规范,即可获得预约提醒这一事件对应的指令。其中,time的值为当前时间加上10分钟后的时间;content的值为“休息”。当前时间达到约定时间时,则可通过语音或文字等方式提醒用户需要休息。
本发明实施例提出的虚拟现实语音控制方法,通过根据虚拟现实应用程序发送的开启语音接口的请求开启语音接口,并通过语音接口接收语音信息,将语音信息转换为文本信息后对文本信息进行规范化生成意图对象,获取意图对象对应的指令后将指令发送至虚拟现实应用程序,以使虚拟现实应用程序执行指令,并反馈执行结果,能够通过语音实现对虚拟现实过程和虚拟现实中场景转换的控制,避免了硬件控制的重复性和不便性,提高交互的真实性。
一些实施例中,参见图3,图3是本发明另一实施例提出的虚拟现实语音控制方法的流程示意图。
如图3所示,本实施例的虚拟现实语音控制方法,还可以包括以下步骤:
S31:确定当前使用场景。
本实施例中,可以通过确定当前使用场景来选择后续执行的操作。
S32:如果当前使用场景为预设场景,则在接收到语音信息后,将语音信息对应的短命令发送至虚拟现实应用程序,以使虚拟现实应用程序执行短命令。
本实施例中,如果确定当前的使用场景为预设场景,则在接收到语音信息后,将语音信息对应的短命令发送至虚拟现实应用程序,以使虚拟现实应用程序执行收到的短命令。
其中,短命令是一些简单的字和/或词,比如“OK”、“开始”、“停止”,以及“No”等。预设场景可以是虚拟现实环境中通过简单的短命令就能完成所需操作的一些特定场景,比如要求用户确认的场景,或者询问用户是否开始的场景等。本发明实施例中,短命令和预设场景均可以根据实际需要设置,对此均不作限制。
举例而言,用户在与虚拟现实环境交互的过程中,假设用户所处的当前场景是用户坐在飞机的驾驶舱里,需要用户确认是否起飞。此时,如果用户想要驾驶飞机,只需输入简单的语音信息“OK”,即可完成飞机的起飞操作,而不再需要用户操作手柄等硬件设备。
本发明实施例提出的虚拟现实语音控制方法,通过确定当前使用场景,并在当前使用场景为预设场景时,将接收到的语音信息对应的短命令发送至虚拟现实应用程序,以使虚拟现实应用程序执行短命令,能够通过语音方便快捷地实现对虚拟现实环境的操作,提高交互的真实性,提升用户体验。
为了实现上述实施例,本发明还提出了一种虚拟现实语音控制装置,图4是本发明一实施例提出的虚拟现实语音控制装置的结构示意图。
如图4所示,本实施例的虚拟现实语音控制装置包括:接收模块410、控制模块420、生成模块430、获取模块440,以及发送模块450。其中,
接收模块410,用于接收虚拟现实应用程序发送的开启语音接口的请求。
控制模块420,用于根据请求开启语音接口,并通过语音接口接收输入的语音信息。
具体地,控制模块420用于:
通过语音接口向虚拟现实硬件设备发送开启麦克风命令,以使虚拟现实硬件设备开启麦克风,并通过麦克风接收输入的语音信息。
生成模块430,用于将语音信息转换为文本信息,并对文本信息进行规范化,以生成符合预设规范的意图对象。
其中,意图对象对应的指令包括短命令和长命令,长命令又包括通话请求、发送消息、付款、搜索信息、预约事件以及运动命令。
获取模块440,用于基于预设规范集合识别意图对象,并获取意图对象对应的指令。
发送模块450,用于将指令发送至虚拟现实应用程序,以使虚拟现实应用程序执行指令,并反馈执行结果。
可选地,一些实施例中,参见图5,图5是本发明另一实施例提出的虚拟现实语音控制装置的结构示意图。
如图5所示,本实施例的虚拟现实语音控制装置还可以包括:
确定模块460,用于确定当前使用场景。
发送模块450还用于,当当前使用场景为预设场景时,在接收到语音信息后,将语音信息对应的短命令发送至虚拟现实应用程序,以使虚拟现实应用程序执行短命令。
可选地,一些实施例中,参见图6,图6是本发明又一实施例提出的虚拟现实语音控制装置的结构示意图。
如图6所示,本实施例的虚拟现实语音控制装置又可以包括:
判断模块470,用于当长命令为预约事件时,判断当前时间是否达到预约事件的约定时间。
发送模块450还用于,当达到约定时间时,将预约事件对应的长命令发送至虚拟现实应用程序,以使虚拟现实应用程序执行长命令。
需要说明的是,前述实施例中对虚拟现实语音控制方法实施例的解释说明也适用于本实施例的虚拟现实语音控制装置,其实现原理类似,此处不再赘述。
本发明实施例提出的虚拟现实语音控制装置,通过根据虚拟现实应用程序发送的开启语音接口的请求开启语音接口,并通过语音接口接收语音信息,将语音信息转换为文本信息后对文本信息进行规范化生成意图对象,获取意图对象对应的指令后将指令发送至虚拟现实应用程序,以使虚拟现实应用程序执行指令,并反馈执行结果,能够通过语音实现对虚拟现实过程和虚拟现实中场景转换的控制,避免了硬件控制的重复性和不便性,提高交互的真实性。
为了实现上述实施例,本发明还提出了一种终端,包括:处理器,以及用于存储处理器可执行指令的存储器。其中,处理器被配置为执行以下步骤:
S11’:接收虚拟现实应用程序发送的开启语音接口的请求。
S12’:根据请求开启语音接口,并通过语音接口接收输入的语音信息。
S13’:将语音信息转换为文本信息,并对文本信息进行规范化,以生成符合预设规范的意图对象。
S14’:基于预设规范集合识别意图对象,并获取意图对象对应的指令。
S15’:将指令发送至虚拟现实应用程序,以使虚拟现实应用程序执行指令,并反馈执行结果。
需要说明的是,前述实施例中对虚拟现实语音控制方法实施例的解释说明也适用于本实施例的终端,其实现原理类似,此处不再赘述。
本发明实施例提出的终端,通过根据虚拟现实应用程序发送的开启语音接口的请求开启语音接口,并通过语音接口接收语音信息,将语音信息转换为文本信息后对文本信息进行规范化生成意图对象,获取意图对象对应的指令后将指令发送至虚拟现实应用程序,以使虚拟现实应用程序执行指令,并反馈执行结果,能够通过语音实现对虚拟现实过程和虚拟现实中场景转换的控制,避免了硬件控制的重复性和不便性,提高交互的真实性。
为了实现上述实施例,本发明还提出了一种非临时性计算机可读存储介质,用于存储一个或多个程序,当存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行本发明第一方面实施例提出的虚拟现实语音控制方法。
本发明实施例提出的非临时性计算机可读存储介质,通过根据虚拟现实应用程序发送的开启语音接口的请求开启语音接口,并通过语音接口接收语音信息,将语音信息转换为文本信息后对文本信息进行规范化生成意图对象,获取意图对象对应的指令后将指令发送至虚拟现实应用程序,以使虚拟现实应用程序执行指令,并反馈执行结果,能够通过语音实现对虚拟现实过程和虚拟现实中场景转换的控制,避免了硬件控制的重复性和不便性,提高交互的真实性。
为了实现上述实施例,本发明还提出了一种计算机程序产品,当计算机程序产品中的指令被处理器执行时,执行本发明第一方面实施例提出的虚拟现实语音控制方法。
本发明实施例提出的计算机程序产品,通过根据虚拟现实应用程序发送的开启语音接口的请求开启语音接口,并通过语音接口接收语音信息,将语音信息转换为文本信息后对文本信息进行规范化生成意图对象,获取意图对象对应的指令后将指令发送至虚拟现实应用程序,以使虚拟现实应用程序执行指令,并反馈执行结果,能够通过语音实现对虚拟现实过程和虚拟现实中场景转换的控制,避免了硬件控制的重复性和不便性,提高交互的真实性。
需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种虚拟现实语音控制方法,其特征在于,包括:
接收虚拟现实应用程序发送的开启语音接口的请求;
根据所述请求开启所述语音接口,并通过所述语音接口接收输入的语音信息;
将所述语音信息转换为文本信息,并对所述文本信息进行规范化,以生成符合预设规范的意图对象;
基于预设规范集合识别所述意图对象,并获取所述意图对象对应的指令;
将所述指令发送至所述虚拟现实应用程序,以使所述虚拟现实应用程序执行所述指令,并反馈执行结果。
2.如权利要求1所述的方法,其特征在于,通过所述语音接口接收输入的语音信息,包括:
通过所述语音接口向虚拟现实硬件设备发送开启麦克风命令,以使所述虚拟现实硬件设备开启所述麦克风,并通过所述麦克风接收输入的语音信息。
3.如权利要求1所述的方法,其特征在于,所述意图对象对应的指令包括短命令和长命令,其中,所述长命令包括通话请求、发送消息、付款、搜索信息、预约事件以及运动命令。
4.如权利要求1所述的方法,其特征在于,还包括:
确定当前使用场景;
如果所述当前使用场景为预设场景,则在接收到所述语音信息后,将所述语音信息对应的短命令发送至所述虚拟现实应用程序,以使所述虚拟现实应用程序执行所述短命令。
5.如权利要求3所述的方法,其特征在于,还包括:
当所述长命令为预约事件时,判断当前时间是否达到所述预约事件的约定时间;
如果达到所述约定时间,则将所述预约事件对应的长命令发送至所述虚拟现实应用程序,以使所述虚拟现实应用程序执行所述长命令。
6.一种虚拟现实语音控制装置,其特征在于,包括:
接收模块,用于接收虚拟现实应用程序发送的开启语音接口的请求;
控制模块,用于根据所述请求开启所述语音接口,并通过所述语音接口接收输入的语音信息;
生成模块,用于将所述语音信息转换为文本信息,并对所述文本信息进行规范化,以生成符合预设规范的意图对象;
获取模块,用于基于预设规范集合识别所述意图对象,并获取所述意图对象对应的指令;
发送模块,用于将所述指令发送至所述虚拟现实应用程序,以使所述虚拟现实应用程序执行所述指令,并反馈执行结果。
7.如权利要求6所述的装置,其特征在于,所述控制模块,用于:
通过所述语音接口向虚拟现实硬件设备发送开启麦克风命令,以使所述虚拟现实硬件设备开启所述麦克风,并通过所述麦克风接收输入的语音信息。
8.如权利要求6所述的装置,其特征在于,所述意图对象对应的指令包括短命令和长命令,其中,所述长命令包括通话请求、发送消息、付款、搜索信息、预约事件以及运动命令。
9.如权利要求6所述的装置,其特征在于,还包括:
确定模块,用于确定当前使用场景;
所述发送模块,还用于当所述当前使用场景为预设场景时,在接收到所述语音信息后,将所述语音信息对应的短命令发送至所述虚拟现实应用程序,以使所述虚拟现实应用程序执行所述短命令。
10.如权利要求8所述的装置,其特征在于,还包括:
判断模块,用于当所述长命令为预约事件时,判断当前时间是否达到所述预约事件的约定时间;
所述发送模块,还用于当达到所述约定时间时,将所述预约事件对应的长命令发送至所述虚拟现实应用程序,以使所述虚拟现实应用程序执行所述长命令。
CN201610900436.5A 2016-10-14 2016-10-14 虚拟现实语音控制方法及装置 Active CN106558310B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201610900436.5A CN106558310B (zh) 2016-10-14 2016-10-14 虚拟现实语音控制方法及装置
US15/783,344 US10714090B2 (en) 2016-10-14 2017-10-13 Virtual reality speech control method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610900436.5A CN106558310B (zh) 2016-10-14 2016-10-14 虚拟现实语音控制方法及装置

Publications (2)

Publication Number Publication Date
CN106558310A true CN106558310A (zh) 2017-04-05
CN106558310B CN106558310B (zh) 2020-09-25

Family

ID=58443268

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610900436.5A Active CN106558310B (zh) 2016-10-14 2016-10-14 虚拟现实语音控制方法及装置

Country Status (2)

Country Link
US (1) US10714090B2 (zh)
CN (1) CN106558310B (zh)

Cited By (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107300970A (zh) * 2017-06-05 2017-10-27 百度在线网络技术(北京)有限公司 虚拟现实交互方法和装置
CN107403619A (zh) * 2017-06-30 2017-11-28 武汉泰迪智慧科技有限公司 一种应用于自行车环境的语音控制方法及***
CN107492374A (zh) * 2017-10-11 2017-12-19 深圳市汉普电子技术开发有限公司 一种语音控制方法、智能设备及存储介质
CN107832036A (zh) * 2017-11-22 2018-03-23 北京小米移动软件有限公司 语音控制方法、装置及计算机可读存储介质
CN108363556A (zh) * 2018-01-30 2018-08-03 百度在线网络技术(北京)有限公司 一种基于语音与增强现实环境交互的方法和***
CN108389579A (zh) * 2018-02-09 2018-08-10 北京北行科技有限公司 一种在vr虚拟世界语音控制***以及控制方法
CN108874363A (zh) * 2018-07-03 2018-11-23 百度在线网络技术(北京)有限公司 用于ar场景的对象控制方法、装置、设备及存储介质
CN109558523A (zh) * 2018-11-06 2019-04-02 广东美的制冷设备有限公司 搜索处理方法、装置及终端设备
CN110288989A (zh) * 2019-06-03 2019-09-27 安徽兴博远实信息科技有限公司 语音交互方法及***
CN110517683A (zh) * 2019-09-04 2019-11-29 上海六感科技有限公司 头戴式vr/ar设备及其控制方法
CN110718221A (zh) * 2019-10-08 2020-01-21 百度在线网络技术(北京)有限公司 语音技能控制方法、语音设备、客户端以及服务器
CN110970028A (zh) * 2019-12-26 2020-04-07 杭州中科先进技术研究院有限公司 一种规范语音识别设备的语音识别指令与操作指令的方法
CN111367407A (zh) * 2020-02-24 2020-07-03 Oppo(重庆)智能科技有限公司 智能眼镜交互方法、智能眼镜交互装置及智能眼镜
CN111738797A (zh) * 2020-06-19 2020-10-02 深圳市酷开网络科技有限公司 虚拟现实的购物方法、***、vr设备、服务器及存储介质
CN112136175A (zh) * 2018-06-01 2020-12-25 苹果公司 用于在主设备处访问配套设备的呼叫功能的语音交互
CN112631429A (zh) * 2020-12-28 2021-04-09 天翼阅读文化传播有限公司 一种虚拟现实场景下的注视点语音交互装置及方法
CN113138746A (zh) * 2021-05-07 2021-07-20 口碑(上海)信息技术有限公司 信息交互方法和装置
US11467802B2 (en) 2017-05-11 2022-10-11 Apple Inc. Maintaining privacy of personal information
US11487364B2 (en) 2018-05-07 2022-11-01 Apple Inc. Raise to speak
US11538469B2 (en) 2017-05-12 2022-12-27 Apple Inc. Low-latency intelligent automated assistant
US11550542B2 (en) 2015-09-08 2023-01-10 Apple Inc. Zero latency digital assistant
US11557310B2 (en) 2013-02-07 2023-01-17 Apple Inc. Voice trigger for a digital assistant
US11630525B2 (en) 2018-06-01 2023-04-18 Apple Inc. Attention aware virtual assistant dismissal
US11675491B2 (en) 2019-05-06 2023-06-13 Apple Inc. User configurable task triggers
US11696060B2 (en) 2020-07-21 2023-07-04 Apple Inc. User identification using headphones
US11699448B2 (en) 2014-05-30 2023-07-11 Apple Inc. Intelligent assistant for home automation
US11705130B2 (en) 2019-05-06 2023-07-18 Apple Inc. Spoken notifications
US11749275B2 (en) 2016-06-11 2023-09-05 Apple Inc. Application integration with a digital assistant
US11783815B2 (en) 2019-03-18 2023-10-10 Apple Inc. Multimodality in digital assistant systems
US11790914B2 (en) 2019-06-01 2023-10-17 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11809886B2 (en) 2015-11-06 2023-11-07 Apple Inc. Intelligent automated assistant in a messaging environment
US11810562B2 (en) 2014-05-30 2023-11-07 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11838734B2 (en) 2020-07-20 2023-12-05 Apple Inc. Multi-device audio adjustment coordination
US11838579B2 (en) 2014-06-30 2023-12-05 Apple Inc. Intelligent automated assistant for TV user interactions
US11837237B2 (en) 2017-05-12 2023-12-05 Apple Inc. User-specific acoustic models
US11842734B2 (en) 2015-03-08 2023-12-12 Apple Inc. Virtual assistant activation
US11888791B2 (en) 2019-05-21 2024-01-30 Apple Inc. Providing message response suggestions
US11893992B2 (en) 2018-09-28 2024-02-06 Apple Inc. Multi-modal inputs for voice commands
US11900936B2 (en) 2008-10-02 2024-02-13 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US11900923B2 (en) 2018-05-07 2024-02-13 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11914848B2 (en) 2020-05-11 2024-02-27 Apple Inc. Providing relevant data items based on context
US11979836B2 (en) 2007-04-03 2024-05-07 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US12001933B2 (en) 2015-05-15 2024-06-04 Apple Inc. Virtual assistant in a communication session
US12014118B2 (en) 2017-05-15 2024-06-18 Apple Inc. Multi-modal interfaces having selection disambiguation and text modification capability
US12026197B2 (en) 2017-05-16 2024-07-02 Apple Inc. Intelligent automated assistant for media exploration

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10964318B2 (en) * 2017-08-18 2021-03-30 Blackberry Limited Dialogue management
US10497370B2 (en) 2017-08-18 2019-12-03 2236008 Ontario Inc. Recognition module affinity
US10984788B2 (en) 2017-08-18 2021-04-20 Blackberry Limited User-guided arbitration of speech processing results
US10692493B2 (en) * 2018-05-01 2020-06-23 Dell Products, L.P. Intelligent assistance using voice services
CN111063356B (zh) * 2018-10-17 2023-05-09 北京京东尚科信息技术有限公司 电子设备响应方法及***、音箱和计算机可读存储介质
CN111596761B (zh) * 2020-05-03 2024-06-21 清华大学 一种基于换脸技术及虚拟现实技术模拟演讲的方法和装置
CN112506465B (zh) * 2020-12-01 2023-03-21 建信金融科技有限责任公司 全景漫游中场景切换的方法和装置
CN113359690B (zh) * 2021-06-28 2023-07-11 北京小鹏汽车有限公司 一种车辆地图全览呈现控制方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101265121B1 (ko) * 2012-10-16 2013-05-16 타임디지탈 주식회사 음성엔진과 인터렉티브 3차원 어플리케이션을 실시간으로 연동시키는 3차원 가상현실 컨트롤 미들웨어를 이용하는 3차원 가상현실 컨텐츠의 실시간 제어방법.
CN105009031A (zh) * 2013-02-19 2015-10-28 微软公司 上下文知晓增强现实对象命令
CN105183422A (zh) * 2015-08-31 2015-12-23 百度在线网络技术(北京)有限公司 语音控制应用程序的方法和装置
CN105450736A (zh) * 2015-11-12 2016-03-30 小米科技有限责任公司 与虚拟现实连接的方法和装置
CN205451551U (zh) * 2016-01-05 2016-08-10 肖锦栋 一种语音识别驱动的增强现实人机交互视频语言学习***
CN105931645A (zh) * 2016-04-12 2016-09-07 深圳市京华信息技术有限公司 虚拟现实设备的控制方法、装置及虚拟现实设备、***

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6505158B1 (en) * 2000-07-05 2003-01-07 At&T Corp. Synthesis-based pre-selection of suitable units for concatenative speech
US7174297B2 (en) * 2001-03-09 2007-02-06 Bevocal, Inc. System, method and computer program product for a dynamically configurable voice portal
US8498871B2 (en) * 2001-11-27 2013-07-30 Advanced Voice Recognition Systems, Inc. Dynamic speech recognition and transcription among users having heterogeneous protocols
US8985442B1 (en) * 2011-07-18 2015-03-24 Tiger T G Zhou One-touch payment using haptic control via a messaging and calling multimedia system on mobile device and wearable device, currency token interface, point of sale device, and electronic payment card
CA2476697A1 (en) * 2003-08-19 2005-02-19 Karim Moheb Zaki Remote reminders application system
US9318108B2 (en) * 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8639513B2 (en) * 2009-08-05 2014-01-28 Verizon Patent And Licensing Inc. Automated communication integrator
US9285589B2 (en) * 2010-02-28 2016-03-15 Microsoft Technology Licensing, Llc AR glasses with event and sensor triggered control of AR eyepiece applications
WO2015172021A1 (en) * 2014-05-09 2015-11-12 Nazareth Godfrey Portable surgical methods, systems, and apparatus
KR101643560B1 (ko) * 2014-12-17 2016-08-10 현대자동차주식회사 음성 인식 장치, 그를 가지는 차량 및 그 방법
US10884503B2 (en) * 2015-12-07 2021-01-05 Sri International VPA with integrated object recognition and facial expression recognition
US11416212B2 (en) * 2016-05-17 2022-08-16 Microsoft Technology Licensing, Llc Context-based user agent
US10339934B2 (en) * 2016-06-27 2019-07-02 Google Llc Asynchronous processing of user requests

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101265121B1 (ko) * 2012-10-16 2013-05-16 타임디지탈 주식회사 음성엔진과 인터렉티브 3차원 어플리케이션을 실시간으로 연동시키는 3차원 가상현실 컨트롤 미들웨어를 이용하는 3차원 가상현실 컨텐츠의 실시간 제어방법.
CN105009031A (zh) * 2013-02-19 2015-10-28 微软公司 上下文知晓增强现实对象命令
CN105183422A (zh) * 2015-08-31 2015-12-23 百度在线网络技术(北京)有限公司 语音控制应用程序的方法和装置
CN105450736A (zh) * 2015-11-12 2016-03-30 小米科技有限责任公司 与虚拟现实连接的方法和装置
CN205451551U (zh) * 2016-01-05 2016-08-10 肖锦栋 一种语音识别驱动的增强现实人机交互视频语言学习***
CN105931645A (zh) * 2016-04-12 2016-09-07 深圳市京华信息技术有限公司 虚拟现实设备的控制方法、装置及虚拟现实设备、***

Cited By (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11979836B2 (en) 2007-04-03 2024-05-07 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US11900936B2 (en) 2008-10-02 2024-02-13 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US12009007B2 (en) 2013-02-07 2024-06-11 Apple Inc. Voice trigger for a digital assistant
US11862186B2 (en) 2013-02-07 2024-01-02 Apple Inc. Voice trigger for a digital assistant
US11557310B2 (en) 2013-02-07 2023-01-17 Apple Inc. Voice trigger for a digital assistant
US11699448B2 (en) 2014-05-30 2023-07-11 Apple Inc. Intelligent assistant for home automation
US11810562B2 (en) 2014-05-30 2023-11-07 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11838579B2 (en) 2014-06-30 2023-12-05 Apple Inc. Intelligent automated assistant for TV user interactions
US11842734B2 (en) 2015-03-08 2023-12-12 Apple Inc. Virtual assistant activation
US12001933B2 (en) 2015-05-15 2024-06-04 Apple Inc. Virtual assistant in a communication session
US11954405B2 (en) 2015-09-08 2024-04-09 Apple Inc. Zero latency digital assistant
US11550542B2 (en) 2015-09-08 2023-01-10 Apple Inc. Zero latency digital assistant
US11809886B2 (en) 2015-11-06 2023-11-07 Apple Inc. Intelligent automated assistant in a messaging environment
US11749275B2 (en) 2016-06-11 2023-09-05 Apple Inc. Application integration with a digital assistant
US11467802B2 (en) 2017-05-11 2022-10-11 Apple Inc. Maintaining privacy of personal information
US11837237B2 (en) 2017-05-12 2023-12-05 Apple Inc. User-specific acoustic models
US11538469B2 (en) 2017-05-12 2022-12-27 Apple Inc. Low-latency intelligent automated assistant
US11862151B2 (en) 2017-05-12 2024-01-02 Apple Inc. Low-latency intelligent automated assistant
US12014118B2 (en) 2017-05-15 2024-06-18 Apple Inc. Multi-modal interfaces having selection disambiguation and text modification capability
US12026197B2 (en) 2017-05-16 2024-07-02 Apple Inc. Intelligent automated assistant for media exploration
CN107300970A (zh) * 2017-06-05 2017-10-27 百度在线网络技术(北京)有限公司 虚拟现实交互方法和装置
CN107300970B (zh) * 2017-06-05 2020-12-11 百度在线网络技术(北京)有限公司 虚拟现实交互方法和装置
CN107403619A (zh) * 2017-06-30 2017-11-28 武汉泰迪智慧科技有限公司 一种应用于自行车环境的语音控制方法及***
CN107492374A (zh) * 2017-10-11 2017-12-19 深圳市汉普电子技术开发有限公司 一种语音控制方法、智能设备及存储介质
CN107832036A (zh) * 2017-11-22 2018-03-23 北京小米移动软件有限公司 语音控制方法、装置及计算机可读存储介质
US11397559B2 (en) 2018-01-30 2022-07-26 Baidu Online Network Technology (Beijing) Co., Ltd. Method and system based on speech and augmented reality environment interaction
CN108363556A (zh) * 2018-01-30 2018-08-03 百度在线网络技术(北京)有限公司 一种基于语音与增强现实环境交互的方法和***
CN108389579A (zh) * 2018-02-09 2018-08-10 北京北行科技有限公司 一种在vr虚拟世界语音控制***以及控制方法
US11487364B2 (en) 2018-05-07 2022-11-01 Apple Inc. Raise to speak
US11900923B2 (en) 2018-05-07 2024-02-13 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11907436B2 (en) 2018-05-07 2024-02-20 Apple Inc. Raise to speak
CN112136175A (zh) * 2018-06-01 2020-12-25 苹果公司 用于在主设备处访问配套设备的呼叫功能的语音交互
CN112136175B (zh) * 2018-06-01 2022-04-19 苹果公司 用于在主设备处访问配套设备的呼叫功能的语音交互
US11630525B2 (en) 2018-06-01 2023-04-18 Apple Inc. Attention aware virtual assistant dismissal
CN108874363A (zh) * 2018-07-03 2018-11-23 百度在线网络技术(北京)有限公司 用于ar场景的对象控制方法、装置、设备及存储介质
US11893992B2 (en) 2018-09-28 2024-02-06 Apple Inc. Multi-modal inputs for voice commands
CN109558523A (zh) * 2018-11-06 2019-04-02 广东美的制冷设备有限公司 搜索处理方法、装置及终端设备
US11783815B2 (en) 2019-03-18 2023-10-10 Apple Inc. Multimodality in digital assistant systems
US11705130B2 (en) 2019-05-06 2023-07-18 Apple Inc. Spoken notifications
US11675491B2 (en) 2019-05-06 2023-06-13 Apple Inc. User configurable task triggers
US11888791B2 (en) 2019-05-21 2024-01-30 Apple Inc. Providing message response suggestions
US11790914B2 (en) 2019-06-01 2023-10-17 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
CN110288989A (zh) * 2019-06-03 2019-09-27 安徽兴博远实信息科技有限公司 语音交互方法及***
CN110517683A (zh) * 2019-09-04 2019-11-29 上海六感科技有限公司 头戴式vr/ar设备及其控制方法
CN110718221A (zh) * 2019-10-08 2020-01-21 百度在线网络技术(北京)有限公司 语音技能控制方法、语音设备、客户端以及服务器
CN110970028A (zh) * 2019-12-26 2020-04-07 杭州中科先进技术研究院有限公司 一种规范语音识别设备的语音识别指令与操作指令的方法
CN111367407B (zh) * 2020-02-24 2023-10-10 Oppo(重庆)智能科技有限公司 智能眼镜交互方法、智能眼镜交互装置及智能眼镜
CN111367407A (zh) * 2020-02-24 2020-07-03 Oppo(重庆)智能科技有限公司 智能眼镜交互方法、智能眼镜交互装置及智能眼镜
US11914848B2 (en) 2020-05-11 2024-02-27 Apple Inc. Providing relevant data items based on context
CN111738797A (zh) * 2020-06-19 2020-10-02 深圳市酷开网络科技有限公司 虚拟现实的购物方法、***、vr设备、服务器及存储介质
US11838734B2 (en) 2020-07-20 2023-12-05 Apple Inc. Multi-device audio adjustment coordination
US11750962B2 (en) 2020-07-21 2023-09-05 Apple Inc. User identification using headphones
US11696060B2 (en) 2020-07-21 2023-07-04 Apple Inc. User identification using headphones
CN112631429A (zh) * 2020-12-28 2021-04-09 天翼阅读文化传播有限公司 一种虚拟现实场景下的注视点语音交互装置及方法
CN112631429B (zh) * 2020-12-28 2022-06-21 天翼阅读文化传播有限公司 一种虚拟现实场景下的注视点语音交互装置及方法
CN113138746A (zh) * 2021-05-07 2021-07-20 口碑(上海)信息技术有限公司 信息交互方法和装置
CN113138746B (zh) * 2021-05-07 2023-12-26 口碑(上海)信息技术有限公司 信息交互方法和装置

Also Published As

Publication number Publication date
US10714090B2 (en) 2020-07-14
US20180108357A1 (en) 2018-04-19
CN106558310B (zh) 2020-09-25

Similar Documents

Publication Publication Date Title
CN106558310A (zh) 虚拟现实语音控制方法及装置
US11295221B2 (en) Learning user preferences in a conversational system
CN109994108B (zh) 用于聊天机器人和人之间的会话交谈的全双工通信技术
US10970492B2 (en) IoT-based call assistant device
CN105379234B (zh) 用于提供针对受限的注意力分散情景和非受限的注意力分散情景的不同用户界面的应用网关
KR101821358B1 (ko) 다자간 메신저 서비스를 제공하는 방법 및 시스템
US6384829B1 (en) Streamlined architecture for embodied conversational characters with reduced message traffic
CN112801626A (zh) 自动化助理实现的方法和相关存储介质
WO2016052018A1 (ja) 家電管理システム、家電、リモコン装置、ロボット
WO2021096626A1 (en) Generating a voice model for a user
CN108701454A (zh) 对话***中的参数收集和自动对话生成
CN101867487A (zh) 用图形呼叫连接象征管理联系中心的***和方法
CN108604177A (zh) 在语音激活的计算机网络环境中的序列相关数据消息整合
CN106961376B (zh) 即时通讯信息的处理方法和装置
CN103795607A (zh) 一种消息处理方法、即时通信客户端及即时通信***
CN109803003A (zh) 一种控制方法、***及相关设备
Papaioannou et al. Combining chat and task-based multimodal dialogue for more engaging HRI: A scalable method using reinforcement learning
US20170177298A1 (en) Interacting with a processing stsyem using interactive menu and non-verbal sound inputs
CN103973542B (zh) 一种语音信息处理方法及装置
CN109445879A (zh) 以悬浮窗显示监控视频的方法、存储介质和设备
JP2015526933A (ja) モバイル・デバイスからの開始ディテールの送信
CN109471440A (zh) 机器人控制方法、装置、智能设备和存储介质
CN110389697A (zh) 数据交互方法和装置、存储介质及电子装置
CN110503954A (zh) 语音技能启动方法、装置、设备及存储介质
CN110262867A (zh) 一种基于车载***的远程控制方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant