CN109801625A - 虚拟语音助手的控制方法、装置、用户设备及存储介质 - Google Patents

虚拟语音助手的控制方法、装置、用户设备及存储介质 Download PDF

Info

Publication number
CN109801625A
CN109801625A CN201811642816.9A CN201811642816A CN109801625A CN 109801625 A CN109801625 A CN 109801625A CN 201811642816 A CN201811642816 A CN 201811642816A CN 109801625 A CN109801625 A CN 109801625A
Authority
CN
China
Prior art keywords
virtual speech
speech assistant
icon
user equipment
virtual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811642816.9A
Other languages
English (en)
Inventor
穆杨
刘勍
高建潮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Apollo Zhilian Beijing Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201811642816.9A priority Critical patent/CN109801625A/zh
Publication of CN109801625A publication Critical patent/CN109801625A/zh
Priority to US16/728,355 priority patent/US20200210142A1/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/04817Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance using icons
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04845Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range for image manipulation, e.g. dragging, rotation, expansion or change of colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • G06F3/04883Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明涉及电子信息技术领域,公开了一种虚拟语音助手的控制方法、装置、用户设备及存储介质,解决了现有技术中对于用户设备的输入反馈效果不好的问题。所述方法包括:在用户设备的人机交互界面上悬浮显示虚拟语音助手图标;如果所述用户设备的麦克风开启,接收语音指令;根据所述语音指令执行相应的操作,并语音播放对应的操作结果。本发明实施例适用于虚拟语音助手的交互过程。

Description

虚拟语音助手的控制方法、装置、用户设备及存储介质
技术领域
本发明涉及电子信息技术领域,具体地,涉及一种虚拟语音助手的控制方法、装置、用户设备及存储介质。
背景技术
随着人们生活水平的提高,用户设备的智能化水平越来越高,但是有时候对于用户设备的输入,并没有对输入的执行结果进行有效的反馈,用户还需要对执行结果进行查看,影响用户体验。
发明内容
本发明的目的是为了克服现有技术存在的对于用户设备的输入反馈效果不好的问题,提供一种虚拟语音助手的控制方法、装置、用户设备及存储介质,通过在用户设备的人机交互界面上显示虚拟语音助手图标,提升语音操控的便利性,增加用户使用语音的频率。
为了实现上述目的,本发明实施例第一方面提供一种虚拟语音助手的控制方法,所述方法包括:在用户设备的人机交互界面上悬浮显示虚拟语音助手图标;如果所述用户设备的麦克风开启,接收语音指令;根据所述语音指令执行相应的操作,并语音播放对应的操作结果。
可选的,在所述接收语音指令之后,所述方法还包括:浮窗显示对话框,且在所述对话框中显示与所述语音指令对应的文字。
可选的,所述根据所述语音指令执行相应的操作,并语音播放对应的操作结果包括:根据所述语音指令执行相应的操作;语音播放对应的操作结果,并根据所述操作结果动态显示所述虚拟语音助手图标。
可选的,所述方法还包括:如果所述用户设备被启动,根据预设提醒消息的设置,动态显示所述虚拟语音助手图标,所述预设提醒消息包括节日、节气、新闻或天气信息中的至少一者。
可选的,所述虚拟语音助手图标的显示位置在所述人机交互界面的设定区域。
可选的,所述方法还包括:如果获取到将所述虚拟语音助手图标拖动至所述设定区域之外的指令,将所述虚拟语音助手图标隐藏或半隐藏;如果接收到解除隐藏指令,将所述虚拟语音助手图标显示在所述设定区域。
可选的,所述方法还包括:如果在预定时间内未接收到语音指令,动态显示所述虚拟语音助手图标。
可选的,所述动态显示所述虚拟语音助手图标包括所述虚拟语音助手图标的表情变化、动作变化、服装变化或气泡显示中的至少一者。
相应的,本发明实施例第二方面提供一种虚拟语音助手的控制装置,所述装置用于执行如上所述的虚拟语音助手的控制方法。
相应的,本发明实施例第三方面提供一种用户设备,所述用户设备包括麦克风、语音播放装置、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,其特征在于,所述麦克风用于获取语音指令,所述语音播放装置用于语音播放对应的操作结果,所述处理器执行所述程序时实现如上所述的虚拟语音助手的控制方法。
相应的,本发明实施例第四方面提供一种存储介质,所述存储介质中存储有指令,当其在计算机上运行时,使得计算机执行如上所述的虚拟语音助手的控制方法。
通过上述技术方案,通过在用户设备的人机交互界面上显示虚拟语音助手图标,如果所述用户设备的麦克风开启,接收语音指令,根据所述语音指令执行相应的操作,并语音播放对应的操作结果。本发明实施例解决了现有技术中对于用户设备的输入反馈效果不好的问题,提升语音操控的便利性,增加用户使用语音的频率。
本发明的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本发明的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明,但并不构成对本发明的限制。在附图中:
图1是本发明实施例提供的一种虚拟语音助手的控制方法的流程示意图;
图2是本发明实施例提供的虚拟语音助手图标的显示位置示例;
图3是本发明实施例提供的在显示对话框时,虚拟语音助手图标的显示位置示例;
图4是本发明实施例提供的虚拟语音助手图标的隐藏方式示例;
图5是本发明实施例提供的虚拟语音助手图标的工作状态切换示例;
图6是本发明实施例提供的应用时虚拟语音助手图标的工作状态切换示例。
附图标记说明
20—虚拟语音助手图标 21—人机交互界面的边框
31—语音状态位置
具体实施方式
以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
图1是本发明实施例提供的一种虚拟语音助手的控制方法的流程示意图。如图1所示,所述方法包括如下步骤:
步骤101,在用户设备的人机交互界面上悬浮显示虚拟语音助手图标;
步骤102,如果所述用户设备的麦克风开启,接收语音指令;
步骤103,根据所述语音指令执行相应的操作,并语音播放对应的操作结果。
其中,所述虚拟语音助手图标的显示位置在所述人机交互界面的设定区域,例如,可为所述人机交互界面的某一固定区域,如右下角,或者为了不阻挡所述人机交互界面上的其它信息,可将所述虚拟语音助手图标显示在所述人机交互界面的边框,如图2所示,虚拟语音助手图标20显示在人机交互界面的边框21上。而且对于该图标的触摸交互方式支持点击和拖动,例如,单次点击、多次点击以及全屏拖动。另外,所述虚拟语音助手图标的显示位置具有记忆功能,即如果用户重新打开用户设备,所述虚拟语音助手图标的显示位置还会出现在前一次关闭用户设备时停留的位置。
另外,在人机交互界面上悬浮显示虚拟语音助手图标时,还可参考预先设置的所述虚拟语音助手图标与人机交互界面上运行的其它APP的优先级。若是所述虚拟语音助手图标的优先级高于正在人机交互界面上运行的APP,则所述虚拟语音助手图标悬浮显示在人机交互界面上。若是所述虚拟语音助手图标的优先级低于正在人机交互界面上运行的APP,例如,如果所述用户设备为车载终端,所述车载终端正在运行的APP为倒车影像,其优先级高于所述虚拟语音助手图标的优先级,则倒车影像直接覆盖所述虚拟语音助手图标进行显示。
其中,所述虚拟语音助手图标包括五种基本的工作状态:静止状态、监听状态、解析状态、播报状态和异常状态,所述虚拟语音助手图标在上述每个状态均有独特的动态显示形式。
其中,用户设备上电后,所述虚拟语音助手图标即进入静止状态,所述静止状态为常规普通状态,此时用户设备的麦克风处于关闭状态。另外,如果所述用户设备被启动,根据预设提醒消息的设置,还可以动态显示所述虚拟语音助手图标,所述预设提醒消息包括节日、节气、新闻或天气信息中的至少一者。例如,国家法定节假日,西方热门节日,包括但不限于情人节、母亲节、父亲节、万圣节、圣诞节、感恩节等,二十四节气,用户历史阅览新闻的后续报道、网络热点新闻,以及当前天气信息等等。另外,还可根据所述预设提醒消息的内容,通过不同的服装、动作、表情或道具等形式,动态显示所述虚拟语音助手图标,例如,如果当天是国庆节,则所述虚拟语音助手图标可以身穿红色服装,手持国旗挥舞,并语音提示今天是国庆节;或者,若当天是圣诞节,则所述虚拟语音助手图标可以身穿圣诞老人的服装,并播放圣诞歌曲进行提示;或者,若当天是冬至的节气,则所述虚拟语音助手图标可以手端一盘饺子,并语音提示“冬至记得吃饺子哦”;或者,若当天的新闻中报道有用户之前浏览的新闻的后续结果报道,则所述虚拟语音助手图标可以做出惊讶等表情,并语音提示用户;或者,若当天的天气预报有大雪,则所述虚拟语音助手图标可以身穿棉服,做出很冷的动作和表情,并语音提示“今天有大雪,记得多穿点哦”等等类似的动态显示。如果上述显示形式有几种同时存在,例如,当天即是冬至又有大雪,则可以任选其一进行动态显示,也可以根据预先设置的预设提醒消息的优先级,按照优先级的顺序依次显示。需要说明的是,所述虚拟语音助手图标的动态显示包括但不限于上面的示例,根据预设提醒消息的不同内容,还可有不同的动态显示形式,此处不再一一举例。
如果所述用户设备的麦克风开启,即进入监听状态。此时,所述虚拟语音助手图标的动态显示可以是手放耳后作仔细听的形式,或者其它形式的动态显示表明目前所述虚拟语音助手图标处于监听状态。在该状态下,可接收语音指令,并通过解析状态对所述语音指令进行解析,该解析过程可在用户设备本地进行,也可通过用户设备将该语音指令发送至云端,由云端解析后回传至用户设备本地,并对解析后的结果执行相应的操作,语音播放对应的操作结果。
其中,在所述虚拟语音助手图标处于解析状态和播报状态的时候,可以通过下述三种显示方式实现:浮窗显示;所述虚拟语音助手图标动态显示操作结果;浮窗显示,且所述虚拟语音助手图标动态显示操作结果。
具体的,第一种仅有浮窗显示时,在接收到语音指令之后,即出现对话流,浮窗显示对话框,且在所述对话框中显示与所述语音指令对应的文字,并根据所述语音指令执行相应的操作,然后语音播放对应的操作结果。而如果对话流出现,所述虚拟语音助手图标在原有显示位置消失,进入语音状态位置,而如果对话流结束,即对话框不再显示时,所述虚拟语音助手图标回到对话框显示之前的位置。如图3所示,如果显示对话框,所述虚拟语音助手图标在原有显示位置消失,进入语音状态位置301,此时,所述虚拟语音助手图标在人机交互界面的边框21位置消失,显示在语音状态位置31,即语音栏的旁边,而如果对话框不再显示,所述虚拟语音助手图标回到对话框显示之前的位置302,即所述虚拟语音助手图标从位置31回到位置21。其中,对于所述虚拟语音助手图标的位置变化的位移没有运动轨迹。
第二种,由所述虚拟语音助手图标动态显示操作结果的方式。如果接收到语音指令,根据所述语音指令执行相应的操作,然后语音播放对应的操作结果,并根据所述操作结果动态显示所述虚拟语音助手图标。例如,如果所述用户设备为车载终端,用户语音指示“车里太热了”,根据所述语音指令降低车内的空调温度,并语音播报“已为您调低空调温度”,而所述虚拟语音助手图标则可以显示类似于“好凉快”的动作。或者,也可以处理一些类似于情感回复的语音指令,例如,如果用户说出“好无聊啊”,用户设备根据所述语音指令可回复“需要为您播放歌曲吗”,所述虚拟语音助手图标也可以显示头戴耳机,做出左右摇摆的舞蹈动作,如果用户回复“播放音乐”,根据历史播放频次,可从中选择播放频次较高的音乐,而所述虚拟语音助手图标可根据所播放的音乐的节奏做出舞蹈动作。所述虚拟语音助手图标动态显示的形式包括但不限于上述示例,可根据具体操作结果的内容给予不同动态显示。
第三种,则是上述第一种与第二种的结合,既显示对话框又动态显示所述虚拟语音助手图标。其中,所述虚拟语音助手图标可在如图3所示的位置31处根据操作结果的内容进行动态显示。上述对话框和虚拟语音助手图标的具体显示形式可参见第一种与第二种的描述。
另外,所述虚拟语音助手图标的异常状态为检测到麦克风出现故障,无法获取语音指令,或者***出错等问题。如果出现异常状态,所述虚拟语音助手图标的动作、表情或者服装上会有所显示,以提醒用户出现故障。例如,所述虚拟语音助手图标的嘴上出现了一个“×”,或者所述虚拟语音助手图标旁边出现了惊叹号等等动态显示形式,只要能够提醒用户即可。如果故障解除,则从异常状态恢复为静止状态。
在本发明的一种实施方式中,所述虚拟语音助手图标还可有隐藏状态,包括隐藏和半隐藏。如果获取到将所述虚拟语音助手图标拖动至所述设定区域之外的指令,将所述虚拟语音助手图标隐藏或半隐藏。例如,如果所述设定区域为人机交互界面的一固定区域,如所述人机交互界面的右下角一区域,若将所述虚拟语音助手图标拖动至所述右下角一区域之外时,可直接隐藏所述虚拟语音助手图标,或者将虚拟语音助手图标的一半显示在人机交互界面的边缘,即半隐藏。或者,如果虚拟语音助手图标如图2所示,显示在人机交互界面的边框21上时,用户可通过向屏幕外拖动所述虚拟语音助手图标,进而将所述虚拟语音助手图标隐藏或半隐藏,如图4所示。另外,另一种实现隐藏的方式,也可通过接收用户发出的语音隐藏指令,例如,如果接收到用户发出语音隐藏指令,可直接将所述虚拟语音助手图标隐藏或半隐藏;或者如果接收到用户发出语音半隐藏指令,直接将所述虚拟语音助手图标半隐藏。对于解除虚拟语音助手图标的隐藏,如果接收到解除隐藏指令,将所述虚拟语音助手图标显示在所述设定区域。其中,所述虚拟语音助手图标处于隐藏或半隐藏时,其解除隐藏指令有所不同,例如,如果所述虚拟语音助手图标处于隐藏,可手动解除或语音指示解除虚拟语音助手图标的隐藏;而如果所述虚拟语音助手图标处于半隐藏,可直接将所述虚拟语音助手图标通过点击、向屏幕内拖动或语音方式解除半隐藏。
对于所述虚拟语音助手图标的工作状态之间的切换,可通过图5所示的切换方式来理解。其中,如果异常状态解除,所述虚拟语音助手图标进入静止状态,如果开启所述用户设备的麦克风,通过点击、设备按钮(如果所述用户设备为车载终端,可为方向盘按钮)或语音唤醒所述虚拟语音助手图标,则所述虚拟语音助手图标进入监听状态,再进一步接收到语音指令之后,进入解析状态对所述语音指令进行解析,并对解析结果进行语音播报。其中,在处于解析状态和播报状态时,通过点击所述虚拟语音助手图标可重新进入监听状态。如果所述虚拟语音助手图标处于静止状态、监听状态、解析状态和播报状态中的任意一种状态,均可通过设定操作(拖动或语音控制)将所述虚拟语音助手图标进入隐藏状态(包括半隐藏状态)。在解除隐藏状态(包括半隐藏状态)之后,所述虚拟语音助手图标直接进入监听状态。
另外,在具体应用时,如图6所示,在所述虚拟语音助手图标处于监听状态(或静止状态、解析状态和播报状态)下通过设定操作(拖动或语音控制)将所述虚拟语音助手图标进入半隐藏状态,然后通过用户点击、拖动或语音等方式解除隐藏状态。在所述虚拟语音助手图标处于监听状态下通过点击或语音唤醒可显示对话框,进行语音指令的解析。在用户设备打开APP时,若虚拟语音助手图标的优先级高于该APP时,则所述虚拟语音助手图标悬浮显示在该APP界面上。在所述用户设备显示APP的界面时,支持用户通过设定操作(拖动或语音控制)将所述虚拟语音助手图标进入半隐藏状态,也支持用户通过点击或语音唤醒可显示对话框,进行语音指令的解析。
在本发明的另一种实施方式中,为了引起用户主动语音交互,如果在预定时间内未接收到语音指令,可动态显示所述虚拟语音助手图标。例如,如果在预定时间内未接收到用户的语音指令,若用户在用户设备的界面进行不同APP的页面切换,则所述虚拟语音助手图标可在进行切换时变换出不同的表情。或者如果所述用户设备为车载终端,如果检测到车辆处于怠速状态下(即处于N档或P档),或者如果检测到车辆处于S档或D档,且车速低于预设速度(例如5km/h),所述虚拟语音助手图标可通过变换不同的服装来吸引用户。另外,在对所述虚拟语音助手图标进行点击或拖动时,所述虚拟语音助手图标也可显示不同的表情和动作。
上述实施例中,动态显示所述虚拟语音助手图标包括所述虚拟语音助手图标的表情变化、动作变化、服装变化或气泡显示中的至少一者,可以相互结合显示,也可单独显示。
通过本发明实施例,在用户设备的人机交互界面上显示虚拟语音助手图标,解决了现有技术中存在的对于用户设备的输入反馈效果不好的问题,提升语音操控的便利性,增加用户使用语音的频率。
相应的,本发明实施例还提供一种虚拟语音助手的控制装置,所述装置用于执行上述实施例所述的虚拟语音助手的控制方法。
本装置操作过程,参见上述虚拟语音助手的控制方法的实现过程。
相应的,本发明实施例还提供一种用户设备,所述用户设备包括麦克风、语音播放装置、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述麦克风用于获取语音指令,所述语音播放装置用于语音播放对应的操作结果,所述处理器执行所述程序时实现如上述权利要求1-8任一项所述的虚拟语音助手的控制方法。
相应的,本发明实施例还提供一种存储介质,所述存储介质中存储有指令,当其在计算机上运行时,使得计算机执行如上述实施例所述的虚拟语音助手的控制方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、***或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (11)

1.一种虚拟语音助手的控制方法,其特征在于,所述方法包括:
在用户设备的人机交互界面上悬浮显示虚拟语音助手图标;
如果所述用户设备的麦克风开启,接收语音指令;
根据所述语音指令执行相应的操作,并语音播放对应的操作结果。
2.根据权利要求1所述的方法,其特征在于,在所述接收语音指令之后,所述方法还包括:
浮窗显示对话框,且在所述对话框中显示与所述语音指令对应的文字。
3.根据权利要求1所述的方法,其特征在于,所述根据所述语音指令执行相应的操作,并语音播放对应的操作结果包括:
根据所述语音指令执行相应的操作;
语音播放对应的操作结果,并根据所述操作结果动态显示所述虚拟语音助手图标。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
如果所述用户设备被启动,根据预设提醒消息的设置,动态显示所述虚拟语音助手图标,所述预设提醒消息包括节日、节气、新闻或天气信息中的至少一者。
5.根据权利要求1所述的方法,其特征在于,所述虚拟语音助手图标的显示位置在所述人机交互界面的设定区域。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
如果获取到将所述虚拟语音助手图标拖动至所述设定区域之外的指令,将所述虚拟语音助手图标隐藏或半隐藏;
如果接收到解除隐藏指令,将所述虚拟语音助手图标显示在所述设定区域。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
如果在预定时间内未接收到语音指令,动态显示所述虚拟语音助手图标。
8.根据权利要求3-7任一项所述的方法,其特征在于,所述动态显示所述虚拟语音助手图标包括所述虚拟语音助手图标的表情变化、动作变化、服装变化或气泡显示中的至少一者。
9.一种虚拟语音助手的控制装置,其特征在于,所述装置用于执行上述权利要求1-8任一项所述的虚拟语音助手的控制方法。
10.一种用户设备,所述用户设备包括麦克风、语音播放装置、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,其特征在于,所述麦克风用于获取语音指令,所述语音播放装置用于语音播放对应的操作结果,所述处理器执行所述程序时实现如上述权利要求1-8任一项所述的虚拟语音助手的控制方法。
11.一种存储介质,其特征在于,所述存储介质中存储有指令,当其在计算机上运行时,使得计算机执行如权利要求1-8任一项所述的虚拟语音助手的控制方法。
CN201811642816.9A 2018-12-29 2018-12-29 虚拟语音助手的控制方法、装置、用户设备及存储介质 Pending CN109801625A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811642816.9A CN109801625A (zh) 2018-12-29 2018-12-29 虚拟语音助手的控制方法、装置、用户设备及存储介质
US16/728,355 US20200210142A1 (en) 2018-12-29 2019-12-27 Method and apparatus for controlling virtual speech assistant, user device and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811642816.9A CN109801625A (zh) 2018-12-29 2018-12-29 虚拟语音助手的控制方法、装置、用户设备及存储介质

Publications (1)

Publication Number Publication Date
CN109801625A true CN109801625A (zh) 2019-05-24

Family

ID=66558202

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811642816.9A Pending CN109801625A (zh) 2018-12-29 2018-12-29 虚拟语音助手的控制方法、装置、用户设备及存储介质

Country Status (2)

Country Link
US (1) US20200210142A1 (zh)
CN (1) CN109801625A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110428831A (zh) * 2019-07-26 2019-11-08 北京增强智能科技有限公司 一种语音助手多场景交互方法
CN111078201A (zh) * 2019-11-29 2020-04-28 惠州市德赛西威汽车电子股份有限公司 一种车机桌面的服务***
CN111261156A (zh) * 2019-12-30 2020-06-09 北京梧桐车联科技有限责任公司 语音采集方法、装置及计算机可读存储介质
CN112138410A (zh) * 2020-09-28 2020-12-29 腾讯科技(深圳)有限公司 一种虚拟对象的交互方法以及相关装置
CN112533041A (zh) * 2019-09-19 2021-03-19 百度在线网络技术(北京)有限公司 视频播放方法、装置、电子设备和可读存储介质
CN114639395A (zh) * 2020-12-16 2022-06-17 观致汽车有限公司 车载虚拟人物的语音控制方法、装置及具有其的车辆
CN115145529A (zh) * 2019-08-09 2022-10-04 华为技术有限公司 语音控制设备的方法及电子设备
CN115248644A (zh) * 2021-04-27 2022-10-28 上海博泰悦臻网络技术服务有限公司 基于语音控制的桌面控制方法、介质及电子设备

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
KR102516577B1 (ko) 2013-02-07 2023-04-03 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK201770411A1 (en) 2017-05-15 2018-12-20 Apple Inc. MULTI-MODAL INTERFACES
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11227599B2 (en) 2019-06-01 2022-01-18 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US20210365161A1 (en) * 2020-05-22 2021-11-25 Apple Inc. Digital assistant user interfaces and response modes
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
CN114115620B (zh) * 2021-10-27 2023-10-24 青岛海尔科技有限公司 提示框的响应方法及装置、存储介质及电子装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488384A (zh) * 2013-09-30 2014-01-01 乐视致新电子科技(天津)有限公司 一种语音助手应用界面显示方法和装置
CN105278926A (zh) * 2014-06-10 2016-01-27 维沃移动通信有限公司 一种用于实现移动终端助手的方法及移动终端
CN107491286A (zh) * 2017-07-05 2017-12-19 广东艾檬电子科技有限公司 移动终端的语音输入方法、装置、移动终端及存储介质
CN108459880A (zh) * 2018-01-29 2018-08-28 出门问问信息科技有限公司 语音助手唤醒方法、装置、设备及存储介质
CN108491147A (zh) * 2018-04-16 2018-09-04 青岛海信移动通信技术股份有限公司 一种基于虚拟人物的人机交互方法及移动终端
CN108845736A (zh) * 2018-06-12 2018-11-20 苏州思必驰信息科技有限公司 用于车载语音***的交互方法及***
CN108874450A (zh) * 2018-05-28 2018-11-23 北京小米移动软件有限公司 唤醒语音助手的方法及装置

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5984502A (en) * 1996-06-14 1999-11-16 The Foxboro Company Keypad annunciator graphical user interface
US6021403A (en) * 1996-07-19 2000-02-01 Microsoft Corporation Intelligent user assistance facility
US20040056878A1 (en) * 2001-01-30 2004-03-25 Lau Johnny Sya Chung Digital assistants
US20040179037A1 (en) * 2003-03-03 2004-09-16 Blattner Patrick D. Using avatars to communicate context out-of-band
US8107401B2 (en) * 2004-09-30 2012-01-31 Avaya Inc. Method and apparatus for providing a virtual assistant to a communication participant
US20070043687A1 (en) * 2005-08-19 2007-02-22 Accenture Llp Virtual assistant
US20070169084A1 (en) * 2005-12-12 2007-07-19 Frank Davis W Persistent maintenance of customization data on computing devices
US8381127B2 (en) * 2006-02-02 2013-02-19 Scenera Technologies, Llc Methods, systems, and computer program products for displaying windows on a graphical user interface based on relative priorities associated with the windows
US20080096533A1 (en) * 2006-10-24 2008-04-24 Kallideas Spa Virtual Assistant With Real-Time Emotions
US8595647B2 (en) * 2007-06-14 2013-11-26 Novell, Inc. System and method for providing dynamic prioritization and importance filtering of computer desktop icons and program menu items
US10176827B2 (en) * 2008-01-15 2019-01-08 Verint Americas Inc. Active lab
US10241752B2 (en) * 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10276170B2 (en) * 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US9996211B2 (en) * 2012-01-11 2018-06-12 Ncr Corporation Techniques for transacting via an animated assistant
US20140218372A1 (en) * 2013-02-05 2014-08-07 Apple Inc. Intelligent digital assistant in a desktop environment
US10445115B2 (en) * 2013-04-18 2019-10-15 Verint Americas Inc. Virtual assistant focused user interfaces
KR101922663B1 (ko) * 2013-06-09 2018-11-28 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
US9509799B1 (en) * 2014-06-04 2016-11-29 Grandios Technologies, Llc Providing status updates via a personal assistant
US10747422B2 (en) * 2014-09-18 2020-08-18 Drupe Mobile Ltd. Client terminal user interface for interacting with contacts
US10354256B1 (en) * 2014-12-23 2019-07-16 Amazon Technologies, Inc. Avatar based customer service interface with human support agent
US9632664B2 (en) * 2015-03-08 2017-04-25 Apple Inc. Devices, methods, and graphical user interfaces for manipulating user interface objects with visual and/or haptic feedback
CN107615288B (zh) * 2015-03-28 2021-10-22 英特尔公司 姿态匹配机制
US10586535B2 (en) * 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11221669B2 (en) * 2017-12-20 2022-01-11 Microsoft Technology Licensing, Llc Non-verbal engagement of a virtual assistant

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488384A (zh) * 2013-09-30 2014-01-01 乐视致新电子科技(天津)有限公司 一种语音助手应用界面显示方法和装置
CN105278926A (zh) * 2014-06-10 2016-01-27 维沃移动通信有限公司 一种用于实现移动终端助手的方法及移动终端
CN107491286A (zh) * 2017-07-05 2017-12-19 广东艾檬电子科技有限公司 移动终端的语音输入方法、装置、移动终端及存储介质
CN108459880A (zh) * 2018-01-29 2018-08-28 出门问问信息科技有限公司 语音助手唤醒方法、装置、设备及存储介质
CN108491147A (zh) * 2018-04-16 2018-09-04 青岛海信移动通信技术股份有限公司 一种基于虚拟人物的人机交互方法及移动终端
CN108874450A (zh) * 2018-05-28 2018-11-23 北京小米移动软件有限公司 唤醒语音助手的方法及装置
CN108845736A (zh) * 2018-06-12 2018-11-20 苏州思必驰信息科技有限公司 用于车载语音***的交互方法及***

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110428831A (zh) * 2019-07-26 2019-11-08 北京增强智能科技有限公司 一种语音助手多场景交互方法
CN115145529A (zh) * 2019-08-09 2022-10-04 华为技术有限公司 语音控制设备的方法及电子设备
CN115145529B (zh) * 2019-08-09 2023-05-09 华为技术有限公司 语音控制设备的方法及电子设备
CN112533041A (zh) * 2019-09-19 2021-03-19 百度在线网络技术(北京)有限公司 视频播放方法、装置、电子设备和可读存储介质
CN111078201A (zh) * 2019-11-29 2020-04-28 惠州市德赛西威汽车电子股份有限公司 一种车机桌面的服务***
CN111261156A (zh) * 2019-12-30 2020-06-09 北京梧桐车联科技有限责任公司 语音采集方法、装置及计算机可读存储介质
CN112138410A (zh) * 2020-09-28 2020-12-29 腾讯科技(深圳)有限公司 一种虚拟对象的交互方法以及相关装置
CN114639395A (zh) * 2020-12-16 2022-06-17 观致汽车有限公司 车载虚拟人物的语音控制方法、装置及具有其的车辆
CN115248644A (zh) * 2021-04-27 2022-10-28 上海博泰悦臻网络技术服务有限公司 基于语音控制的桌面控制方法、介质及电子设备

Also Published As

Publication number Publication date
US20200210142A1 (en) 2020-07-02

Similar Documents

Publication Publication Date Title
CN109801625A (zh) 虚拟语音助手的控制方法、装置、用户设备及存储介质
CN108780454B (zh) 音频通告优先级排序***
JP7065740B2 (ja) アプリケーション機能情報表示方法、装置、及び端末装置
US8584033B2 (en) Individualized tab audio controls
CN108337601A (zh) 音箱的控制方法及装置
CN107564510A (zh) 一种语音虚拟角色管理方法、装置、服务器和存储介质
WO2016205338A1 (en) Managing interactions between users and applications
CN106897155B (zh) 一种界面展示方法及装置
CN102543119A (zh) 基于场景的音乐播放处理方法和音乐播放设备
US8873771B2 (en) Automatic volume adjustment
CN104346217A (zh) 推送消息的提示方法和***
CN103426449B (zh) 通过适应性自动快速音频回放减轻音频中断的影响
CN107369462A (zh) 电子书语音播放方法、装置及终端设备
CN108986814A (zh) 一种唤醒应用服务的方法及装置
CN109669754A (zh) 语音交互窗口的动态显示方法、具有伸缩式交互窗口的语音交互方法及装置
TW201621883A (zh) 個人化音訊及/或視訊展示
CN106716356A (zh) 组件特定的应用呈现历史
GB2547744A (en) Facilitation of offline semantic processing in a resource-constrained device
CN110289024A (zh) 一种音频编辑方法、装置、电子设备及存储介质
CN109471440A (zh) 机器人控制方法、装置、智能设备和存储介质
CN109672724A (zh) 信息推送方法、装置及设备
US10901688B2 (en) Natural language command interface for application management
CN108304110A (zh) 一种信息处理的方法及电子设备
CN116802602A (zh) 热词组
CN109065047B (zh) 一种唤醒应用服务的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20211014

Address after: 100176 Room 101, 1st floor, building 1, yard 7, Ruihe West 2nd Road, economic and Technological Development Zone, Daxing District, Beijing

Applicant after: Apollo Zhilian (Beijing) Technology Co.,Ltd.

Address before: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing

Applicant before: BAIDU ONLINE NETWORK TECHNOLOGY (BEIJING) Co.,Ltd.