CN109960537A - 交互方法、装置和电子设备 - Google Patents

交互方法、装置和电子设备 Download PDF

Info

Publication number
CN109960537A
CN109960537A CN201910253222.7A CN201910253222A CN109960537A CN 109960537 A CN109960537 A CN 109960537A CN 201910253222 A CN201910253222 A CN 201910253222A CN 109960537 A CN109960537 A CN 109960537A
Authority
CN
China
Prior art keywords
voice
user
interface
interactive
interactive controls
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910253222.7A
Other languages
English (en)
Inventor
陈琛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Internet Security Software Co Ltd
Original Assignee
Beijing Kingsoft Internet Security Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Internet Security Software Co Ltd filed Critical Beijing Kingsoft Internet Security Software Co Ltd
Priority to CN201910253222.7A priority Critical patent/CN109960537A/zh
Publication of CN109960537A publication Critical patent/CN109960537A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping
    • G06F9/4418Suspend and resume; Hibernate and awake

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请提出一种交互方法、装置和电子设备,其中,方法包括:当前场景满足唤醒条件,控制交互控件显示为初始状态,并将智能设备的待机界面切换到语音交互界面;当检测到用户进行语音输入时控制交互控件显示为语音接收状态,采集用户输入的语音信息;当检测到用户停止语音输入时控制交互控件显示为语音分析状态,对用户输入的语音信息进行语义分析获取语音指令,获取与语音指令对应的事件功能,控制语音交互界面切换到与事件功能对应的功能界面且向用户播放事件引导语音。由此,通过控制交互控件显示不同的状态来用户与智能设备之间交互状态,增加用户与智能设备对话的反馈效果,提升用户体验。

Description

交互方法、装置和电子设备
技术领域
本申请涉及人工智能技术领域,尤其涉及一种交互方法、装置和电子设备。
背景技术
目前,随着人工智能技术的发展,用户需要与智能设备进行交互以满足相关需求。可以理解的是,智能设备处理用户输入指令需要一定的时间,在智能设备处理的过程中,用户无法实时了解到智能设备当前的状态,由此可能造成用户以为智能设备没有反应,从而多次输入指令或者是通过其他方式进行处理等问题。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请提出一种交互方法,解决了现有技术中用户无法实时了解到智能设备当前的处理状态,由此可能造成用户以为智能设备没有反应的技术问题。
本申请提出一种交互装置。
本申请提出一种电子设备。
本申请提出一种计算机可读存储介质。
本申请第一方面实施例提出了一种交互方法,包括:
检测当前场景是否满足唤醒条件,若满足,则控制交互控件显示为初始状态,将待机界面切换到语音交互界面;
当检测到用户进行语音输入时,控制所述交互控件显示为语音接收状态,采集所述用户输入的语音信息;
当检测到所述用户停止语音输入时,控制所述交互控件显示为语音分析状态,对所述用户输入的语音信息进行语义分析获取语音指令,查询预设的指令信息库判断是否能够获取与所述语音指令对应的事件功能;
若能够获取与所述语音指令对应的事件功能,则控制所述语音交互界面。
可选地,作为本申请第一方面的第一种可能的实现方式,所述检测当前场景是否满足唤醒条件,包括:
采集人脸图像;
根据所述人脸图像确定当前场景是否满足唤醒条件。
可选地,作为本申请第一方面的第二种可能的实现方式,所述检测当前场景是否满足唤醒条件,包括:
接收语音唤醒信息;
将所述语音唤醒信息转换文本唤醒信息,判断所述文本唤醒信息是否为预设唤醒词,确定当前场景是否满足唤醒条件。
可选地,作为本申请第一方面的第三种可能的实现方式,在所述将待机界面切换到语音交互界面之后,还包括:
根据预设的显示参数在所述语音交互界面上显示预设的引导语音指令。
可选地,作为本申请第一方面的第四种可能的实现方式,在所述控制交互控件显示为初始状态之前,还包括:
根据预设的图像处理算法对所述待机界面进行图像处理,生成用于反映用户与智能设备之间交互状态的交互控件。
可选地,作为本申请第一方面的第五种可能的实现方式,所述待机界面为脸部表情图像界面,所述根据预设的图像处理算法对所述待机界面进行图像处理,生成用于反映用户与智能设备之间交互状态的交互控件,包括:
对所述脸部表情图像进行切割处理生成目标子图像,对所述目标子图像进行预设操作的变化处理;
在对所述目标子图像进行预设操作的变化处理的过程中,生成所述交互控件。
可选地,作为本申请第一方面的第六种可能的实现方式,所述的方法,还包括:
根据预设的显示参数在所述语音交互界面上显示所述用户输入的语音信息。
可选地,作为本申请第一方面的第七种可能的实现方式,在所述若能够获取与所述语音指令对应的事件功能之后,还包括:
控制所述交互控件显示为所述初始状态并反馈查询结果。
可选地,作为本申请第一方面的第八种可能的实现方式,在所述控制所述语音交互界面切换到与所述事件功能对应的功能界面,向所述用户播放事件引导语音之后,还包括:
控制所述交互控件移动到所述功能界面中的预设位置。
本申请第二方面实施例提出了一种交互装置,该装置包括:
检测模块,用于检测当前场景是否满足唤醒条件;
切换播放模块,用于若满足,则控制交互控件显示为初始状态,将待机界面切换到语音交互界面;
控制采集模块,用于当检测到用户进行语音输入时,控制所述交互控件显示为语音接收状态,采集所述用户输入的语音信息;
控制分析模块,用于当检测到所述用户停止语音输入时,控制所述交互控件显示为语音分析状态,对所述用户输入的语音信息进行语义分析获取语音指令,查询预设的指令信息库判断是否能够获取与所述语音指令对应的事件功能;
处理模块,用于若能够获取与所述语音指令对应的事件功能,则控制所述语音交互界面切换到与所述事件功能对应的功能界面且,向所述用户播放事件引导语音。
可选地,作为本申请第二方面的第一种可能的实现方式,所述检测模块,具体用于:
采集人脸图像;
根据所述人脸图像确定当前场景是否满足唤醒条件。
可选地,作为本申请第二方面的第二种可能的实现方式,所述检测模块,具体还用于:
接收语音唤醒信息;
将所述语音唤醒信息转换文本唤醒信息,判断所述文本唤醒信息是否为预设唤醒词,确定当前场景是否满足唤醒条件。
可选地,作为本申请第二方面的第三种可能的实现方式,所述的装置,还包括:
第一显示模块,用于根据预设的显示参数在所述语音交互界面上显示预设的引导语音指令。
可选地,作为本申请第二方面的第四种可能的实现方式,所述的装置,还包括:
生成模块,用于根据预设的图像处理算法对所述待机界面进行图像处理,生成用于反映用户与智能设备之间交互状态的交互控件。
可选地,作为本申请第二方面的第五种可能的实现方式,所述待机界面为脸部表情图像界面,所述生成模块,具体用于:
对所述脸部表情图像进行切割处理生成目标子图像,对所述目标子图像进行预设操作的变化处理;
在对所述目标子图像进行预设操作的变化处理的过程中,生成所述交互控件。
可选地,作为本申请第二方面的第六种可能的实现方式,所述的装置,还包括:
第二显示模块,用于根据预设的显示参数在所述语音交互界面上显示所述用户输入的语音信息。
可选地,作为本申请第二方面的第七种可能的实现方式,所述的装置,还包括:
反馈模块,用于控制所述交互控件显示为所述初始状态并反馈查询结果。
可选地,作为本申请第二方面的第八种可能的实现方式,所述的装置,还包括:
移动模块,用于控制所述交互控件移动到所述功能界面中的预设位置。
本申请第三方面实施例提出了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现第一方面所述的交互方法。
本申请第四方面实施例提出了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现第二方面所述的交互方法。
本申请实施例所提供的技术方案,可以包含如下的有益效果:
通过检测当前场景是否满足唤醒条件,若满足,则控制交互控件显示为初始状态,并将待机界面切换到语音交互界面;当检测到用户进行语音输入时,控制交互控件显示为语音接收状态,并采集用户输入的语音信息;当检测到用户停止语音输入时,控制交互控件显示为语音分析状态,并对用户输入的语音信息进行语义分析获取语音指令,查询预设的指令信息库判断是否能够获取与语音指令对应的事件功能;若能够获取与语音指令对应的事件功能,则控制语音交互界面切换到与事件功能对应的功能界面且向用户播放事件引导语音。由此,通过控制交互控件显示不同的状态来用户与智能设备之间交互状态,增加用户与智能设备对话的反馈效果,提升用户体验。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例所提供的一种交互方法的流程示意图;
图2为本申请实施例所提供的另一种交互方法的流程示意图;
图3a-图3b为本申请实施例所提供的一种交互方法的示例图;
图4a-图4b为本申请实施例所提供的另一种交互方法的示例图;
图5a-图5b为本申请实施例所提供的又一种交互方法的示例图;
图6为本申请实施例所提供的一种交互装置的结构示意图;
图7为本申请实施例所提供的另一种交互装置的结构示意图;
图8为本申请实施例所提供的又一种交互装置的结构示意图;
图9为本申请实施例所提供的再一种交互装置的结构示意图;
图10为本申请实施例所提供的还一种交互装置的结构示意图;以及
图11为本申请电子设备一个实施例的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的交互方法、装置和电子设备。
图1为本申请实施例所提供的一种交互方法的流程示意图。
如图1所示,该方法包括以下步骤:
步骤101,检测当前场景是否满足唤醒条件,若满足,则控制交互控件显示为初始状态,将待机界面切换到语音交互界面。
在实际应用中,用户可以与智能设备进行语音交互以获取相应的信息,本申请实施例中的智能设备配置有图像采集模块比如摄像头等、语音接收模块比如麦克风等。
可以理解的是,为了节约能耗,智能设备在没有工作的时候处于待机状态,从而检测当前场景是否满足唤醒条件,作为一种示例,通过智能设备的图像采集模块采集到人脸图像确定当前场景是否满足唤醒条件;作为另一种示例,智能设备的语音接收模块接收到语音唤醒信息,将语音唤醒信息转换文本唤醒信息,并判断文本唤醒信息为预设唤醒词,确定当前场景是否满足唤醒条件。
进一步地,在当前场景满足唤醒条件,比如识别到人脸或者是接收到预设唤醒词的语音信息“小豹小豹”,控制交互控件显示为初始状态,并将智能设备的待机界面切换到语音交互界面,且向用户播放唤醒引导语音。
其中,交互控件可以根据实际应用需要进行生成,作为一种示例,根据预设的图像处理算法对待机界面进行图像处理,生成用于反映用户与智能设备之间交互状态的交互控件。也就是说,该交互控件能够反映用户与智能设备之间交互状态,其中,初始状态为交互控件最开始的一种状态,即没有与用户进行交互之前的一种状态显示,比如控制交互控件慢速转动等。
其中,将待机界面切换到语音交互界面表示智能设备已经唤醒,显示语音交互界面表示用户可以输入相关语音,为了进一步提高用户使用体验,同时向用户播放唤醒引导语音,比如播放“你好,请问有什么可以帮你”。
步骤102,当检测到用户进行语音输入时,控制交互控件显示为语音接收状态,采集用户输入的语音信息。
具体地,用户可以根据实际应用需要输入相关语音,在进行语音输入时通过控制交互控件显示为语音接收状态以反映智能设备正在接收用户输入语音信息。
其中,控制交互控件还可以根据音波大小缩放,进一步提升用户体验。
步骤103,当检测到用户停止语音输入时,控制交互控件显示为语音分析状态,对用户输入的语音信息进行语义分析获取语音指令,查询预设的指令信息库判断是否能够获取与语音指令对应的事件功能。
步骤104,若能够获取与语音指令对应的事件功能,则控制语音交互界面切换到与事件功能对应的功能界面,向用户播放事件引导语音。
具体地,可以通过在预设时间内没有在接收用户输入的语音信息或者是用户输入的语音信息中包含预设的结束词等,确定用户停止语音输入,从而智能设备需要对用户输入的语音信息进行分析处理,控制交互控件显示为语音分析状态,以提示用户智能设备正在对输入的语音信息进行分析。
进而,可以对用户输入的语音信息进行语义分析获取语音指令,查询预设的指令信息库判断是否能够获取与语音指令对应的事件功能,其中,预设的指令信息库为预先对大量样本进行分析训练生成,即在预设的指令信息库存储着语音指令与时间功能的对应关系,通过语音指令在预设的指令信息库中国你查找到对应的时间功能。其中,事件功能可以是闲聊功能、任务功能等。
可以理解的是,在能够获取与语音指令对应的事件功能时,控制语音交互界面切换到与事件功能对应的功能界面且向用户播放事件引导语音,比如获取与语音指令对应的事件功能为天气播报功能,控制语音交互界面切换到天气界面,并向用户播放天气情况的语音信息。
本实施例的交互方法中,通过检测当前场景是否满足唤醒条件,若满足,则控制交互控件显示为初始状态,将待机界面切换到语音交互界面;当检测到用户进行语音输入时,控制交互控件显示为语音接收状态,采集用户输入的语音信息;当检测到用户停止语音输入时,控制交互控件显示为语音分析状态,并对用户输入的语音信息进行语义分析获取语音指令,查询预设的指令信息库判断是否能够获取与语音指令对应的事件功能;若能够获取与语音指令对应的事件功能,则控制语音交互界面切换到与事件功能对应的功能界面且向用户播放事件引导语音。由此,通过控制交互控件显示不同的状态来用户与智能设备之间交互状态,增加用户与智能设备对话的反馈效果,提升用户体验。
为了更加全面描述本申请的交互方法,下面结合图2进行详细描述。具体地,如图2所示,包括:
步骤201,采集人脸图像,根据人脸图像确定当前场景是否满足唤醒条件。
具体地,通过智能设备的图像采集模块采集到人脸图像时确定满足唤醒条件。
步骤202,根据预设的图像处理算法对待机界面进行图像处理,生成用于反映用户与智能设备之间交互状态的交互控件。
具体地,作为一种示例,待机界面为脸部表情图像界面,对脸部表情图像进行切割处理生成目标子图像,并对目标子图像进行预设操作的变化处理,在对目标子图像进行预设操作的变化处理的过程中,生成交互控件。
举例而言,如图3a-图3b所示,将图3a中的脸部表情图像中的两只眼睛进行切图,做模糊、尺寸、位置、和不透明度等预设操作的变化处理,在对眼睛进行预设操作的变化处理的过程中,生成交互控件如图3b所示的语音交互球。
步骤203,确定当前场景满足唤醒条件,则控制交互控件显示为初始状态,并将待机界面切换到语音交互界面。
步骤204,根据预设的显示参数在语音交互界面上显示预设的引导语音指令。
具体地,将待机界面切换到语音交互界面表示智能设备已经唤醒,显示语音交互界面表示用户可以输入相关语音,为了进一步提高用户使用体验,同时向用户播放唤醒引导语音,比如播放“你好,请问有什么可以帮你”。
为了进一步增加用户与智能设备对话的反馈效果,根据预设的显示参数在语音交互界面上显示预设的引导语音指令,其中,预设的显示参数可以是语句之间的间隔、奇数行语句的字体、字号、透明和模糊度的变化,以及出现时长等、偶数行语句的字体、字号、透明和模糊度的变化,以及出现时长等,比如图4a所示的“我来面试”、“访客登记”等引导语音指令。
步骤205,当检测到用户进行语音输入时,控制交互控件显示为语音接收状态,采集用户输入的语音信息。
步骤206,根据预设的显示参数在语音交互界面上显示用户输入的语音信息。
具体地,用户可以根据实际应用需要输入相关语音,在进行语音输入时通过控制交互控件显示为语音接收状态以反映智能设备正在接收用户输入语音信息。
为了进一步增加用户与智能设备对话的反馈效果,根据预设的显示参数在语音交互界面上显示用户输入的语音信息,其中,预设的显示参数可以是语句之间的间隔、奇数行语句的字体、字号、透明和模糊度的变化,以及出现时长等、偶数行语句的字体、字号、透明和模糊度的变化,以及出现时长等,比如图4b所示的“带我参观”、“明天天气怎么样”等用户输入的语音信息。
步骤207,当检测到用户停止语音输入时,控制交互控件显示为语音分析状态,对用户输入的语音信息进行语义分析获取语音指令,查询预设的指令信息库判断是否能够获取与语音指令对应的事件功能。
具体地,可以通过在预设时间内没有在接收用户输入的语音信息或者是用户输入的语音信息中包含预设的结束词等,确定用户停止语音输入,从而智能设备需要对用户输入的语音信息进行分析处理,控制交互控件显示为语音分析状态,以提示用户智能设备正在对输入的语音信息进行分析。
进而,可以对用户输入的语音信息进行语义分析获取语音指令,查询预设的指令信息库判断是否能够获取与语音指令对应的事件功能,其中,预设的指令信息库为预先对大量样本进行分析训练生成,即在预设的指令信息库存储着语音指令与时间功能的对应关系,通过语音指令在预设的指令信息库中国你查找到对应的时间功能。其中,事件功能可以是闲聊功能、任务功能等。比如图5a中用户输入“我是来面试的”,控制交互控件显示为语音分析状态“我来想想”。
步骤208,若能够获取与语音指令对应的事件功能,控制交互控件显示为初始状态并反馈查询结果。
步骤209,控制交互控件移动到功能界面中的预设位置,控制语音交互界面切换到与事件功能对应的功能界面,向用户播放事件引导语音。
具体地,在能够获取与语音指令对应的事件功能,控制交互控件显示为初始状态并反馈查询结果,比如图5b中的“好的”。
进一步地,控制交互控件移动到功能界面中的预设位置,并控制语音交互界面切换到与事件功能对应的功能界面且向用户播放事件引导语音。
其中,预设位置可以根据实际应用需要进行选择设置,比如上移缩小到指定位置。
作为一种场景举例,控制交互控件为语音交互球,识别到人脸或者接收到唤醒语音信息“小豹小豹”,将智能设备的待机界面切换到语音交互界面,向用户播放唤醒引导语音“你好,请问有什么可以帮你?”,语音交互球进行慢速转动,用户对智能设备说话,智能设备将接收的语音信息转化为上屏文字,连动语音交互球变为语音接收状态,用户输入的语音信息根据音波缩放,同时粒子背景像圆心内收缩,用户停止说话,智能设备停止收音,语音交互球转变为语音分析状态,并开始分析上屏文字是否能触发闲聊或者任务功能等事件功能,若识别结果为任务或闲聊等事件功能,则语音交互球发光并恢复初始状态,语音播报反馈查询结果“好的”,语音交互球上移缩小到指定位置,任务界面出现,同时向用户播放事件引导语音,若未能识别出任务或闲聊等事件功能,则语音球恢复初始状态,等待下次语音命令。
由此,通过控制交互控件显示不同的状态来用户与智能设备之间交互状态,增加用户与智能设备对话的反馈效果,提升用户体验。。
为了实现上述实施例,本申请还提出一种交互装置。
图6为本申请实施例提供的一种交互装置的结构示意图。
如图6所示,该装置包括:检测模块601、切换播放模块602、控制采集模块603、控制分析模块604和处理模块605。
其中,检测模块601,用于检测当前场景是否满足唤醒条件。
切换播放模块602,用于若满足,则控制交互控件显示为初始状态,将待机界面切换到语音交互界面。
控制采集模块603,用于当检测到用户进行语音输入时,控制交互控件显示为语音接收状态,采集用户输入的语音信息。
控制分析模块604,用于当检测到用户停止语音输入时,控制交互控件显示为语音分析状态,对用户输入的语音信息进行语义分析获取语音指令,查询预设的指令信息库判断是否能够获取与语音指令对应的事件功能。
处理模块605,用于若能够获取与语音指令对应的事件功能,则控制语音交互界面切换到与事件功能对应的功能界面,向用户播放事件引导语音。
在本申请的一个实施例中,检测模块601,具体用于:采集人脸图像,根据人脸图像确定当前场景是否满足唤醒条件。
在本申请的一个实施例中,检测模块601,具体还用于:智能设备的语音接收模块接收到语音唤醒信息,将语音唤醒信息转换文本唤醒信息,并判断文本唤醒信息是否为预设唤醒词,确定当前场景是否满足唤醒条件。
基于上述实施例,本申请实施例还提供了一种交互装置的可能的实现方式,图7为本申请实施例所提供的另一种交互装置的结构示意图,在图6的基础上,所述装置还包括:第一显示模块606。
其中,第一显示模块606,用于根据预设的显示参数在语音交互界面上显示预设的引导语音指令。
基于上述实施例,本申请实施例还提供了一种交互装置的可能的实现方式,图8为本申请实施例所提供的另一种交互装置的结构示意图,在图6的基础上,所述装置还包括:生成模块607。
生成模块607,用于根据预设的图像处理算法对待机界面进行图像处理,生成用于反映用户与智能设备之间交互状态的交互控件。
在本申请的一个实施例中,待机界面为脸部表情图像界面,生成模块607,具体用于:对脸部表情图像进行切割处理生成目标子图像,并对目标子图像进行预设操作的变化处理;在对目标子图像进行预设操作的变化处理的过程中,生成交互控件。
基于上述实施例,本申请实施例还提供了一种交互装置的可能的实现方式,图9为本申请实施例所提供的另一种交互装置的结构示意图,在图6的基础上,所述装置还包括:第二显示模块608。
第二显示模块608,用于根据预设的显示参数在语音交互界面上显示用户输入的语音信息。
基于上述实施例,本申请实施例还提供了一种交互装置的可能的实现方式,图10为本申请实施例所提供的另一种交互装置的结构示意图,在图6的基础上,所述装置还包括:反馈模块609和移动模块610。
反馈模块609,用于控制交互控件显示为初始状态并反馈查询结果。
移动模块610,用于控制交互控件移动到功能界面中的预设位置。
需要说明的是,前述对方法实施例的解释说明也适用于该实施例的装置,此处不再赘述。
本实施例的交互装置中,通过检测当前场景是否满足唤醒条件,若满足,则控制交互控件显示为初始状态,并将待机界面切换到语音交互界面;当检测到用户进行语音输入时,控制交互控件显示为语音接收状态,并采集用户输入的语音信息;当检测到用户停止语音输入时,控制交互控件显示为语音分析状态,并对用户输入的语音信息进行语义分析获取语音指令,查询预设的指令信息库判断是否能够获取与语音指令对应的事件功能;若能够获取与语音指令对应的事件功能,则控制语音交互界面切换到与事件功能对应的功能界面且向用户播放事件引导语音。由此,通过控制交互控件显示不同的状态来用户与智能设备之间交互状态,增加用户与智能设备对话的反馈效果,提升用户体验。
为了实现上述实施例,本申请还提出一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行该程序时,实现如前述方法实施例所述的交互方法。
本申请实施例还提供一种电子设备,电子设备包含前述任一实施例所述的装置。
图11为本申请电子设备一个实施例的结构示意图,可以实现本申请图1-5所示方法实施例的流程,如图11所示,上述电子设备可以包括:壳体91、处理器92、存储器93、电路板94和电源电路95,其中,电路板94安置在壳体91围成的空间内部,处理器92和存储器93设置在电路板94上;电源电路95,用于为上述电子设备的各个电路或器件供电;存储器93用于存储可执行程序代码;处理器92通过读取存储器93中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行前述任一实施例所述的视频生成方法。
处理器92对上述步骤的具体执行过程以及处理器92通过运行可执行程序代码来进一步执行的步骤,可以参见本申请图1-5所示方法实施例的描述,在此不再赘述。
该电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、***总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子设备。
为了实现上述实施例,本申请还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,实现如前述方法实施例所述的交互方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种交互方法,其特征在于,包括:
检测当前场景是否满足唤醒条件,若满足,则控制交互控件显示为初始状态,将待机界面切换到语音交互界面;
当检测到用户进行语音输入时,控制所述交互控件显示为语音接收状态,采集所述用户输入的语音信息;
当检测到所述用户停止语音输入时,控制所述交互控件显示为语音分析状态,对所述用户输入的语音信息进行语义分析获取语音指令,查询预设的指令信息库判断是否能够获取与所述语音指令对应的事件功能;
若能够获取与所述语音指令对应的事件功能,则控制所述语音交互界面切换到与所述事件功能对应的功能界面,向所述用户播放事件引导语音。
2.如权利要求1所述的方法,其特征在于,所述检测当前场景是否满足唤醒条件,包括:
采集人脸图像;
根据所述人脸图像确定当前场景是否满足唤醒条件。
3.如权利要求1所述的方法,其特征在于,所述检测当前场景是否满足唤醒条件,包括:
接收语音唤醒信息;
将所述语音唤醒信息转换文本唤醒信息,判断所述文本唤醒信息是否为预设唤醒词,确定当前场景是否满足唤醒条件。
4.如权利要求1所述的方法,其特征在于,在所述将待机界面切换到语音交互界面之后,还包括:
根据预设的显示参数在所述语音交互界面上显示预设的引导语音指令。
5.如权利要求1所述的方法,其特征在于,在所述控制交互控件显示为初始状态之前,还包括:
根据预设的图像处理算法对所述待机界面进行图像处理,生成用于反映用户与智能设备之间交互状态的交互控件。
6.如权利要求5所述的方法,其特征在于,所述待机界面为脸部表情图像界面,所述根据预设的图像处理算法对所述待机界面进行图像处理,生成用于反映用户与智能设备之间交互状态的交互控件,包括:
对所述脸部表情图像进行切割处理生成目标子图像,对所述目标子图像进行预设操作的变化处理;
在对所述目标子图像进行预设操作的变化处理的过程中,生成所述交互控件。
7.如权利要求1所述的方法,其特征在于,还包括:
根据预设的显示参数在所述语音交互界面上显示所述用户输入的语音信息。
8.如权利要求1所述的方法,其特征在于,在所述若能够获取与所述语音指令对应的事件功能之后,还包括:
控制所述交互控件显示为所述初始状态并反馈查询结果。
9.如权利要求8所述的方法,其特征在于,在所述控制所述语音交互界面切换到与所述事件功能对应的功能界面,向所述用户播放事件引导语音之后,还包括:
控制所述交互控件移动到所述功能界面中的预设位置。
10.一种交互装置,其特征在于,包括:
检测模块,用于检测当前场景是否满足唤醒条件;
切换播放模块,用于若满足,则控制交互控件显示为初始状态,将待机界面切换到语音交互界面;
控制采集模块,用于当检测到用户进行语音输入时,控制所述交互控件显示为语音接收状态,采集所述用户输入的语音信息;
控制分析模块,用于当检测到所述用户停止语音输入时,控制所述交互控件显示为语音分析状态,对所述用户输入的语音信息进行语义分析获取语音指令,查询预设的指令信息库判断是否能够获取与所述语音指令对应的事件功能;
处理模块,用于若能够获取与所述语音指令对应的事件功能,则控制所述语音交互界面切换到与所述事件功能对应的功能界面且,向所述用户播放事件引导语音。
CN201910253222.7A 2019-03-29 2019-03-29 交互方法、装置和电子设备 Pending CN109960537A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910253222.7A CN109960537A (zh) 2019-03-29 2019-03-29 交互方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910253222.7A CN109960537A (zh) 2019-03-29 2019-03-29 交互方法、装置和电子设备

Publications (1)

Publication Number Publication Date
CN109960537A true CN109960537A (zh) 2019-07-02

Family

ID=67025418

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910253222.7A Pending CN109960537A (zh) 2019-03-29 2019-03-29 交互方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN109960537A (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110931003A (zh) * 2019-10-22 2020-03-27 安信通科技(澳门)有限公司 一种语音功能的控制交互方法及***
CN110941198A (zh) * 2019-12-05 2020-03-31 星络智能科技有限公司 存储介质、智能面板及其节电引导方法
CN111045636A (zh) * 2019-10-22 2020-04-21 安信通科技(澳门)有限公司 一种车辆功能的展示方法及***
CN111081242A (zh) * 2019-12-18 2020-04-28 中国建设银行股份有限公司 人机语音交互方法、装置、电子设备及存储介质
CN111273990A (zh) * 2020-01-21 2020-06-12 腾讯科技(深圳)有限公司 信息交互方法、装置、计算机设备和存储介质
CN111309283A (zh) * 2020-03-25 2020-06-19 北京百度网讯科技有限公司 用户界面的语音控制方法、装置、电子设备及存储介质
CN111367491A (zh) * 2020-03-02 2020-07-03 成都极米科技股份有限公司 语音交互方法、装置、电子设备及存储介质
CN111367407A (zh) * 2020-02-24 2020-07-03 Oppo(重庆)智能科技有限公司 智能眼镜交互方法、智能眼镜交互装置及智能眼镜
CN112037783A (zh) * 2020-08-12 2020-12-04 广东志尚智能科技有限公司 一种语音控制***及控制方法
CN112037779A (zh) * 2020-07-01 2020-12-04 海信(山东)空调有限公司 智能家电及语音交互方法、装置及存储介质
CN112102823A (zh) * 2020-07-21 2020-12-18 深圳市创维软件有限公司 一种智能终端的语音交互方法、智能终端及存储介质
CN112164401A (zh) * 2020-09-18 2021-01-01 广州小鹏汽车科技有限公司 语音交互方法、服务器和计算机可读存储介质
CN112788422A (zh) * 2019-11-04 2021-05-11 海信视像科技股份有限公司 显示设备
CN112786036A (zh) * 2019-11-04 2021-05-11 海信视像科技股份有限公司 显示设备与内容显示方法
CN112908323A (zh) * 2021-01-19 2021-06-04 三星电子(中国)研发中心 一种应用界面的语音控制方法、装置和智能设备
CN113535112A (zh) * 2021-07-09 2021-10-22 广州小鹏汽车科技有限公司 异常反馈方法、异常反馈装置、车载终端和车辆
CN113838464A (zh) * 2021-09-24 2021-12-24 浪潮金融信息技术有限公司 一种智能语音交互***、方法及介质
CN114047900A (zh) * 2021-10-12 2022-02-15 中电金信软件有限公司 业务处理方法、装置、电子设备及计算机可读存储介质
CN114298026A (zh) * 2021-12-03 2022-04-08 阿里健康科技(杭州)有限公司 一种语义分析方法、转诊处理方法和装置
CN117198291A (zh) * 2023-11-08 2023-12-08 四川蜀天信息技术有限公司 一种语音控制终端界面的方法、装置及***
WO2024139173A1 (zh) * 2022-12-31 2024-07-04 科大讯飞股份有限公司 基于语音交互的界面提示方法、装置、设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107180631A (zh) * 2017-05-24 2017-09-19 刘平舟 一种语音交互方法及装置
CN108733420A (zh) * 2018-03-21 2018-11-02 北京猎户星空科技有限公司 智能设备的唤醒方法、装置、智能设备和存储介质
CN109471537A (zh) * 2017-09-08 2019-03-15 腾讯科技(深圳)有限公司 语音输入方法、装置、计算机设备和存储介质
CN109521932A (zh) * 2018-11-06 2019-03-26 斑马网络技术有限公司 语音控件显示处理方法、装置、车辆、存储介质及设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107180631A (zh) * 2017-05-24 2017-09-19 刘平舟 一种语音交互方法及装置
CN109471537A (zh) * 2017-09-08 2019-03-15 腾讯科技(深圳)有限公司 语音输入方法、装置、计算机设备和存储介质
CN108733420A (zh) * 2018-03-21 2018-11-02 北京猎户星空科技有限公司 智能设备的唤醒方法、装置、智能设备和存储介质
CN109521932A (zh) * 2018-11-06 2019-03-26 斑马网络技术有限公司 语音控件显示处理方法、装置、车辆、存储介质及设备

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111045636A (zh) * 2019-10-22 2020-04-21 安信通科技(澳门)有限公司 一种车辆功能的展示方法及***
CN110931003B (zh) * 2019-10-22 2023-07-07 安信通科技(澳门)有限公司 一种语音功能的控制交互方法及***
CN110931003A (zh) * 2019-10-22 2020-03-27 安信通科技(澳门)有限公司 一种语音功能的控制交互方法及***
CN112788422A (zh) * 2019-11-04 2021-05-11 海信视像科技股份有限公司 显示设备
CN112786036B (zh) * 2019-11-04 2023-08-08 海信视像科技股份有限公司 显示设备与内容显示方法
CN112786036A (zh) * 2019-11-04 2021-05-11 海信视像科技股份有限公司 显示设备与内容显示方法
CN110941198A (zh) * 2019-12-05 2020-03-31 星络智能科技有限公司 存储介质、智能面板及其节电引导方法
CN111081242A (zh) * 2019-12-18 2020-04-28 中国建设银行股份有限公司 人机语音交互方法、装置、电子设备及存储介质
CN111273990A (zh) * 2020-01-21 2020-06-12 腾讯科技(深圳)有限公司 信息交互方法、装置、计算机设备和存储介质
CN111367407A (zh) * 2020-02-24 2020-07-03 Oppo(重庆)智能科技有限公司 智能眼镜交互方法、智能眼镜交互装置及智能眼镜
CN111367407B (zh) * 2020-02-24 2023-10-10 Oppo(重庆)智能科技有限公司 智能眼镜交互方法、智能眼镜交互装置及智能眼镜
CN111367491A (zh) * 2020-03-02 2020-07-03 成都极米科技股份有限公司 语音交互方法、装置、电子设备及存储介质
CN111309283A (zh) * 2020-03-25 2020-06-19 北京百度网讯科技有限公司 用户界面的语音控制方法、装置、电子设备及存储介质
CN111309283B (zh) * 2020-03-25 2023-12-05 北京百度网讯科技有限公司 用户界面的语音控制方法、装置、电子设备及存储介质
CN112037779A (zh) * 2020-07-01 2020-12-04 海信(山东)空调有限公司 智能家电及语音交互方法、装置及存储介质
CN112102823A (zh) * 2020-07-21 2020-12-18 深圳市创维软件有限公司 一种智能终端的语音交互方法、智能终端及存储介质
CN112037783A (zh) * 2020-08-12 2020-12-04 广东志尚智能科技有限公司 一种语音控制***及控制方法
CN112164401A (zh) * 2020-09-18 2021-01-01 广州小鹏汽车科技有限公司 语音交互方法、服务器和计算机可读存储介质
CN112164401B (zh) * 2020-09-18 2022-03-18 广州小鹏汽车科技有限公司 语音交互方法、服务器和计算机可读存储介质
CN112908323A (zh) * 2021-01-19 2021-06-04 三星电子(中国)研发中心 一种应用界面的语音控制方法、装置和智能设备
CN112908323B (zh) * 2021-01-19 2024-03-08 三星电子(中国)研发中心 一种应用界面的语音控制方法、装置和智能设备
CN113535112A (zh) * 2021-07-09 2021-10-22 广州小鹏汽车科技有限公司 异常反馈方法、异常反馈装置、车载终端和车辆
CN113535112B (zh) * 2021-07-09 2023-09-12 广州小鹏汽车科技有限公司 异常反馈方法、异常反馈装置、车载终端和车辆
CN113838464A (zh) * 2021-09-24 2021-12-24 浪潮金融信息技术有限公司 一种智能语音交互***、方法及介质
CN113838464B (zh) * 2021-09-24 2024-07-19 浪潮金融信息技术有限公司 一种智能语音交互***、方法及介质
CN114047900A (zh) * 2021-10-12 2022-02-15 中电金信软件有限公司 业务处理方法、装置、电子设备及计算机可读存储介质
CN114298026A (zh) * 2021-12-03 2022-04-08 阿里健康科技(杭州)有限公司 一种语义分析方法、转诊处理方法和装置
WO2024139173A1 (zh) * 2022-12-31 2024-07-04 科大讯飞股份有限公司 基于语音交互的界面提示方法、装置、设备和存储介质
CN117198291A (zh) * 2023-11-08 2023-12-08 四川蜀天信息技术有限公司 一种语音控制终端界面的方法、装置及***
CN117198291B (zh) * 2023-11-08 2024-01-23 四川蜀天信息技术有限公司 一种语音控制终端界面的方法、装置及***

Similar Documents

Publication Publication Date Title
CN109960537A (zh) 交互方法、装置和电子设备
CN110288077B (zh) 一种基于人工智能的合成说话表情的方法和相关装置
CN110634483B (zh) 人机交互方法、装置、电子设备及存储介质
CN105283836B (zh) 用于设备唤醒的设备、方法、装置及计算机可读存储介质
US20140036022A1 (en) Providing a conversational video experience
CN109656512A (zh) 基于语音助手的交互方法、装置、存储介质及终端
CN106971723A (zh) 语音处理方法和装置、用于语音处理的装置
CN108509107A (zh) 应用功能信息显示方法、装置及终端设备
CN107040452B (zh) 一种信息处理方法、装置和计算机可读存储介质
CN109192208A (zh) 一种电器设备的控制方法、***、装置、设备及介质
CN108922525B (zh) 语音处理方法、装置、存储介质及电子设备
CN110602516A (zh) 基于视频直播的信息交互方法、装置及电子设备
CN106297801A (zh) 语音处理方法及装置
US20140028780A1 (en) Producing content to provide a conversational video experience
EP3593346B1 (en) Graphical data selection and presentation of digital content
CN110209778A (zh) 一种对话生成的方法以及相关装置
CN112017650B (zh) 电子设备的语音控制方法、装置、计算机设备和存储介质
CN110427454A (zh) 文本情绪分析方法及装置、电子设备和非暂态存储介质
CN109215642A (zh) 人机会话的处理方法、装置及电子设备
CN110503954A (zh) 语音技能启动方法、装置、设备及存储介质
CN113129867A (zh) 语音识别模型的训练方法、语音识别方法、装置和设备
CN117253478A (zh) 一种语音交互方法和相关装置
CN113763925B (zh) 语音识别方法、装置、计算机设备及存储介质
CN101013571A (zh) 一种使用语音命令的互动方法及其***
CN109542430A (zh) 用于实现界面交互效果的方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190702