CN108733341B - 一种语音交互方法及装置 - Google Patents

一种语音交互方法及装置 Download PDF

Info

Publication number
CN108733341B
CN108733341B CN201810479491.0A CN201810479491A CN108733341B CN 108733341 B CN108733341 B CN 108733341B CN 201810479491 A CN201810479491 A CN 201810479491A CN 108733341 B CN108733341 B CN 108733341B
Authority
CN
China
Prior art keywords
volume
feedback
voice
environment
time interval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810479491.0A
Other languages
English (en)
Other versions
CN108733341A (zh
Inventor
付忠鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mobvoi Information Technology Co Ltd
Original Assignee
Mobvoi Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mobvoi Information Technology Co Ltd filed Critical Mobvoi Information Technology Co Ltd
Priority to CN201810479491.0A priority Critical patent/CN108733341B/zh
Publication of CN108733341A publication Critical patent/CN108733341A/zh
Application granted granted Critical
Publication of CN108733341B publication Critical patent/CN108733341B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Telephone Function (AREA)

Abstract

本发明实施例提供了一种语音交互方法及装置,该方法包括:在检测到用户输入的语音信息时,采集环境音量信息;根据所述环境音量信息确定出反馈时间间隔以及反馈音量;根据所述反馈时间间隔以及所述反馈音量对所述语音信息进行语音反馈。因此,本发明提供的方案可以提高语音交互随着所处环境变化进行自适应调整的能力。

Description

一种语音交互方法及装置
技术领域
本发明涉及计算机技术领域,特别是涉及一种语音交互方法及装置。
背景技术
智能设备(比如智能玩具、智能电视、智能音箱等)由于可以与用户进行语音交互,科技感较强,因此在人们的日常生活中应用的越来越广泛。
目前,智能设备在与用户进行语音交互时,通常在接收到用户的语音之后,按照预设的反馈方式(设定的反馈音量或反馈时长)对语音进行反馈。但是由于智能设备在应用时,所处的环境中可能会存在音乐播放,用户话语交谈等噪音的存在。在以预设的反馈方式对语音进行反馈时,由于环境中噪音的存在可能导致用户可能听取到反馈的效果较差。
发明内容
有鉴于此,本发明提出了一种语音交互方法及装置,主要目的在于可以提高语音交互随着所处环境变化进行自适应调整的能力。
第一方面,本发明提供了一种语音交互方法,该语音交互方法包括:
在检测到用户输入的语音信息时,采集环境音量信息;
根据所述环境音量信息确定出反馈时间间隔以及反馈音量;
根据所述反馈时间间隔以及所述反馈音量对所述语音信息进行语音反馈。
可选的,
所述环境音量信息包括第一环境音量;
在所述在检测到用户输入的语音信息时采集环境音量信息之前,进一步包括:
设置至少一个音量区间,其中,每一个所述音量区间分别对应一个样本音量以及一个样本时间间隔;
所述根据所述环境音量信息确定出反馈时间间隔以及反馈音量,包括:
在所述至少一个音量区间中选择出包括所述第一环境音量的目标音量区间;
将所述目标音量区间对应的样本音量确定为所述反馈音量;
将所述目标音量区间对应的样本时间间隔确定为所述反馈时间间隔。
可选的,
所述根据所述反馈时间间隔以及所述反馈音量对所述语音信息进行语音反馈,包括:
从检测到所述语音信息起,记录所述语音信息的持续时长;
确定出所述语音信息对应的反馈语音;
判断所述持续时长是否等于所述反馈时间间隔,如果是,播放所述反馈语音,且播放所述反馈语音的音量为所述反馈音量。
可选的,
所述采集环境音量信息,包括:
A1:在获取到所述语音信息时,采集环境中的当前第二环境音量;
A2:判断所述当前第二环境音量是否大于预设的音量阈值,如果是,执行A3;否则,执行A4;
A3:在预设时间间隔之后,继续采集下一个第二环境音量,并判断累计采集的次数是否达到预设的次数阈值,如果是,执行A4;否则,将当前采集到的第二环境音量作为当前第二环境音量,执行A2;
A4:将当前采集到的第二环境音量确定为所述环境音量信息。
可选的,
所述根据所述反馈时间间隔以及所述反馈音量对所述语音信息进行语音反馈,包括:
从确定出所述环境音量信息起,记录所述环境音量信息的累计持续时长;
确定出所述语音信息对应的反馈语音;
判断所述累计持续时长是否等于所述反馈时间间隔,如果是,播放所述反馈语音,且播放所述反馈语音的音量为所述反馈音量。
第二方面,本发明提供了一种语音交互装置,该语音交互装置包括:
采集模块,用于在检测到用户输入的语音信息时,采集环境音量信息;
确定模块,用于根据所述采集模块采集的所述环境音量信息确定出反馈时间间隔以及反馈音量;
反馈模块,用于根据所述确定模块确定的所述反馈时间间隔以及所述反馈音量对所述获取模块获取的所述语音信息进行语音反馈。
可选的,
所述环境音量信息包括第一环境音量;
进一步包括:设置模块;
所述设置模块,用于设置至少一个音量区间,其中,每一个所述音量区间分别对应一个样本音量以及一个样本时间间隔;
所述确定模块,用于在所述设置模块设置的所述至少一个音量区间中选择出包括所述第一环境音量的目标音量区间;所述目标音量区间对应的样本音量确定为所述反馈音量;将所述目标音量区间对应的样本时间间隔确定为所述反馈时间间隔。
可选的,
所述反馈模块,包括:第一记录子模块以及第一反馈子模块;
所述第一记录子模块,用于从检测到所述语音信息起,记录所述语音信息的持续时长;
所述第一反馈子模块,用于确定出所述语音信息对应的反馈语音;判断所述第一记录子模块记录的所述持续时长是否等于所述反馈时间间隔,如果是,播放所述反馈语音,且播放所述反馈语音的音量为所述反馈音量。
第三方面,本发明提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述中任意一项所述的语音交互方法。
第四方面,本发明提供了一种电子设备,所述电子设备中包括处理器、存储器和总线;所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行上述中任意一项所述的语音交互方法。
本发明实施例提供了一种语音交互方法及装置,在检测到用户输入的语音信息时采集所处环境中的环境音量信息(该环境音量信息可以包括环境音量)。然后根据采集到的环境音量信息确定出反馈时间间隔以及反馈音量。最后根据确定出的反馈时间间隔以及反馈音量针对用户输入的语音信息进行语音反馈。通过上述可知,在本发明实施例中对用户语音信息进行语音反馈时所需的反馈时间间隔以及反馈音量是随着环境音量信息变化的,并不是固定的。因此,本发明实施例提供的方案可以提高语音交互随着所处环境变化进行自适应调整的能力。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明一个实施例提供的一种语音交互方法的流程图;
图2示出了本发明另一个实施例提供的一种语音交互方法的流程图;
图3示出了本发明一个实施例提供的一种语音交互装置的结构示意图;
图4示出了本发明一个实施例提供的一种包括设置模块的语音交互装置的结构示意图;
图5示出了本发明一个实施例提供的一种包括第一记录子模块以及第一反馈子模块的语音交互装置的结构示意图;
图6示出了本发明一个实施例提供的一种包括第二记录子模块以及第二反馈子模块的语音交互装置的结构示意图;
图7示出了本发明一个实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更加详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
如图1所示,本发明实施例提供了一种语音交互方法,该方法可以包括如下步骤:
步骤101:在检测到用户输入的语音信息时,采集环境音量信息;
步骤102:根据所述环境音量信息确定出反馈时间间隔以及反馈音量;
步骤103:根据所述反馈时间间隔以及所述反馈音量对所述语音信息进行语音反馈。
根据图1所示的实施例,在检测到用户输入的语音信息时采集所处环境中的环境音量信息(该环境音量信息可以包括环境音量)。然后根据采集到的环境音量信息确定出反馈时间间隔以及反馈音量。最后根据确定出的反馈时间间隔以及反馈音量针对用户输入的语音信息进行语音反馈。通过上述可知,在本发明实施例中对用户语音信息进行语音反馈时所需的反馈时间间隔以及反馈音量是随着环境音量信息变化的,并不是固定的。因此,本发明实施例提供的方案可以提高语音交互随着所处环境变化进行自适应调整的能力。
在本发明一个实施例中,在用户需要与智能设备进行语音交互时,可以对智能设备输入语音信息。该语音信息的输入方法可以包括但不限于:用户在智能设备的语音识别的范围内提供语音信号(比如,说话),然后智能设备对语音信号进行语音识别(该语音识别的过程可以为将语音识别转换为文本,然后在文本中确定出有效的关键字),从而获取到用户输入的语音信息。
在本发明一个实施例中,上述图1所示流程图中步骤101中所涉及的环境音量信息可以包括但不限于环境音量。该环境音量可以反映出环境中噪音的大小。
在本发明一个实施例中,可以通过声音采集器来采集环境中的环境音量信息。
在本发明一个实施例中,在上述图1所示流程图中步骤101中所涉及的环境音量信息包括第一环境音量时,在上述图1所示流程图中步骤101检测到用户输入的语音信息时采集环境音量信息之前,可以进一步包括如下步骤:
设置至少一个音量区间,其中,每一个所述音量区间分别对应一个样本音量以及一个样本时间间隔;
则,上述图1所示流程图中的步骤102根据所述环境音量信息确定出反馈时间间隔以及反馈音量,可以包括:
在所述至少一个音量区间中选择出包括所述第一环境音量的目标音量区间;
将所述目标音量区间对应的样本音量确定为所述反馈音量;
将所述目标音量区间对应的样本时间间隔确定为所述反馈时间间隔。
在本实施例中,音量区间的数量以及每一个音量区间的范围均可以根据业务要求确定。且,每一个音量区间对应的样本音量以及样本时间间隔可以根据如下规则确定:音量区间对应的音量越高,其对应的样本音量越高,其对应的样本时间间隔越长。
具体地,在第一环境音量较高时,说明环境较为嘈杂,则需要较高的反馈音量以及较长的反馈时间间隔。其中,较高的反馈音量是为了用户可以在噪音较大的环境中也可以清楚的听到语音反馈。较长的反馈时间间隔是为考虑环境中噪音可能在反馈时间间隔之后可能存在噪音变小的概率,以使用户可能在噪音较小的环境中听到语音反馈。
具体地,在第一环境音量较低时,说明环境较为安静,则需要较低的反馈音量以及较短的反馈时间间隔。其中,较低的反馈音量是为了用户可以在噪音较小的环境中清楚的听到语音反馈,且同时可以避免由于声音大导致耳朵不适的情况发生。较短的反馈时间间隔是为了使用户可以快速的得到语音反馈,减少用户等待语音反馈的时间。
在本实施例中,举例说明:设置音量区间1[0,40]、音量区间2[41,60]、音量区间3[61,90]。其中,各个音量区间内各个数值的单位均为分贝。且,音量区间1对应的样本时间间隔为2S以及样本音量为30分贝、音量区间2对应的样本时间间隔为3S以及样本音量为50分贝、音量区间3对应的样本时间间隔为4S以及样本音量为70分贝。比如,确定出的环境音量为45分贝,由于音量区间2中包括有45分贝,则将音量区间2对应的样本时间间隔3S确定为反馈音量以及将样本音量50分贝确定为反馈时间间隔。
根据上述实施例,由于设置一个或多个音量区间,因此在确定出环境音量之后,可以快速的选择出包括环境音量的音量区间,并将所选择出的音量对应的样本音量以及样本时间间隔分别确定为反馈音量以及反馈时间间隔。因此,在接收到语音信息时可以快速的确定出与环境音量对应的反馈音量以及反馈时间间隔。
在本发明一个实施例中,上述图1所示流程图中的步骤103根据所述反馈时间间隔以及所述反馈音量对所述语音信息进行语音反馈,可以包括:
从检测到所述语音信息起,记录所述语音信息的持续时长;
确定出所述语音信息对应的反馈语音;
判断所述持续时长是否等于所述反馈时间间隔,如果是,播放所述反馈语音,且播放所述反馈语音的音量为所述反馈音量。
在本实施例中,在获取到用户输入的语音信息时,就开始记录获取到语音信息的持续时长。记录语音信息的持续时长可以判断是否播放反馈反应。在判断出持续时长没有等于反馈时间间隔时,说明当前时间还未到反馈语音的播放时间。在判断出持续时长等于反馈时间间隔时,则说明当前时间已达到反馈语音的播放时间,则对反馈语音进行播放。需要注意的是播放反馈语音的音量应为反馈音量,以使用户可以清楚的听到反馈语音。
在本实施例中,确定出语音信息对应的反馈语音的方法至少可以包括如下两种:
第一种,在语音重复模式时,直接将语音信息中包括的语音确定为反馈语音。比如,语音信息为你好,由于是语音重复模式则将你好作为反馈语音。
第二种,在语音对话模式时,分析语音信息中的关键字,根据确定出关键字在预先设定的样本语音库中确定出关键字对应的样本语音,根据样本语音确定出反馈语音。比如,语音信息为现在剩余电量是多少,则确定出的关键字为剩余电量。对应的样本语音为剩余电量为。然后获取当前电量剩余百分比为80%,则根据样本语音确定出的反馈语音为剩余电量为80%。
在本实施例中,举例说明:反馈时间间隔为2S、反馈音量为30分贝、反馈语音为你好。则在判断出获取到语音信息的持续时长等于反馈时间间隔2S,则播放反馈语音“你好”,且播放“你好”的音量为30分贝。
根据上述实施例,在获取到语音信息时便记录获取到语音信息的持续时长。并在判断出持续时长等于反馈时间间隔时,以反馈音量播放语音信息对应的反馈语音。因此可以保证反馈语音根据反馈时间间隔进行精确播放。
在本发明一个实施例中,上述图1所示流程图中的步骤101所涉及的采集环境音量信息,可以包括:
A1:在获取到所述语音信息时,采集环境中的当前第二环境音量;
A2:判断所述当前第二环境音量是否大于预设的音量阈值,如果是,执行A3;否则,执行A4;
A3:在预设时间间隔之后,继续采集下一个第二环境音量,并判断累计采集的次数是否达到预设的次数阈值,如果是,执行A4;否则,将当前采集到的第二环境音量作为当前第二环境音量,执行A2;
A4:将当前采集到的第二环境音量确定为所述环境音量信息。
在本实施例中,音量阈值可以根据业务要求确定。比如,该音量阈值可以为界定环境吵闹的一个音量值(比如60分贝)。
在本实施例中,次数阈值可以根据业务要求确定。比如,该次数阈值可以根据语音反馈速度进行确定。在要求语音反馈速度较快时,该次数阈值较小。在要求语音反馈速度较慢时,该次数阈值可以设置的较大。
在本实施例中,在获取到所述语音信息时,采集环境中的当前环境音量,判断该当前环境音量是否大于音量阈值。
在判断出不大于音量阈值时则说明环境较为安静,在此时进行反馈语音的相关操作时用户也可以清楚的接收到反馈语音。
在判断出大于音量阈值时则说明环境较为嘈杂,如果在此时进行反馈语音的相关操作,那么用户接收反馈语音的效果欠佳。则此时应在预设时间间隔后继续采集环境中的环境音量,并判断当前采集到的环境音量是否达到次数阈值。如果达到次数阈值,则说明时间太长,为了保证反馈速度则直接将其作为环境音量信息。如果未达到次数阈值,则循环执行上述判断该当前环境音量是否大于音量阈值的相关过程。
在本实施例中,举例说明:音量阈值为60分贝、次数阈值为2、时间间隔0.5S。在获取到语音信息时,采集环境中的当前环境音量为70分贝。则判断出当前环境音量70分贝大于音量阈值60分贝,则在0.5S之后继续采集下一个环境音量59分贝。并判断出累计采集的次数2已经达到了次数阈值2,则将59分贝确定为环境音量信息。
根据上述实施例,由于利用音量阈值以及次数阈值等条件对采集到的各个环境音量进行初步筛选,因此,确定出的环境音量信息更能满足语音反馈的需求。
在本发明一个实施例中,上述图1所示流程图中的步骤103根据所述反馈时间间隔以及所述反馈音量对所述语音信息进行语音反馈,可以包括:
从确定出所述环境音量信息起,记录所述环境音量信息的累计持续时长;
确定出所述语音信息对应的反馈语音;
判断所述累计持续时长是否等于所述反馈时间间隔,如果是,播放所述反馈语音,且播放所述反馈语音的音量为所述反馈音量。
在本实施例中,确定出所述语音信息对应的反馈语音的方法与上述实施例中所表述的基本一致,这里将不再赘述。
在本实施例中,在确定出环境音量信息时,记录确定出环境音量信息的累计持续时长。
在本实施例中,举例说明:反馈时间间隔为2S、反馈音量为30分贝、反馈语音为你好。则在判断出确定出环境音量信息的累计持续时长等于反馈时间间隔2S时,则播放反馈语音“你好”,且播放“你好”的音量为30分贝。
根据上述实施例,在确定出环境音量信息时,记录确定出环境音量信息的累计持续时长,并在判断出累计持续时长等于反馈时间间隔时,以反馈音量播放语音信息对应的反馈语音。因此可以保证反馈语音根据反馈时间间隔进行精确播放。
在本发明一个实施例中,从上述的实施例中可以看出该语音交互方法可以应用在各种智能设备中。智能设备可以不包括但不限于智能电视、智能冰箱、智能机器人、智能手表、智能音箱、智能空调、智能玩具。
下面以智能设备为音箱为例,对语音交互方法进行说明。如图2所示,该语音交互方法可以包括如下步骤:
步骤201:设置至少一个音量区间,其中,每一个音量区间分别对应一个样本音量以及一个样本时间间隔。
在本步骤中,设置音量区间1[0,40]、音量区间2[41,60]、音量区间3[61,90]。其中,各个音量区间内各个数值的单位均为分贝。且,音量区间1对应的样本时间间隔为2S以及样本音量为30分贝、音量区间2对应的样本时间间隔为3S以及样本音量为50分贝、音量区间3对应的样本时间间隔为4S以及样本音量为70分贝。
步骤202:检测是否存在用户输入的语音信息,如果是,执行步骤203;否则,继续执行本步骤。
在本步骤中,获取用户输入的语音信息为“现在剩余电量是多少”。
步骤203:在检测到语音信息时,采集环境中的当前环境音量。
在本步骤中,在获取到语音信息时,采集音箱所处环境中的当前环境音量为70分贝。
步骤204:判断当前环境音量是否大于预设的音量阈值,如果是,执行步骤205;否则,执行步骤206。
在本步骤中,音量阈值为60分贝,则判断出当前环境音量70分贝是大于音量阈值60分贝的,执行步骤205。
步骤205:在预设时间间隔之后,继续采集下一个环境音量,并判断累计采集的次数是否达到预设的次数阈值,如果是,执行步骤206;否则,将当前采集到的环境音量作为当前环境音量,执行步骤204。
在本步骤中,次数阈值为2以及时间间隔0.5S。
在本步骤中,在0.5S之后继续采集下一个环境音量59分贝,并判断出累计采集的次数2已经达到了次数阈值2,执行步骤206。
步骤206:将当前采集到的环境音量确定为环境音量信息。
在本步骤中,将59分贝确定为环境音量信息。
步骤207:在各个音量区间中选择出包括环境音量的目标音量区间。
在本步骤中,在各个音量区间中选择出包括环境音量59分贝的目标音量区间为音量区间2。
步骤208:将目标音量区间对应的样本音量确定为反馈音量。
在本步骤中,将音量区间2对应的样本音量50分贝确定为反馈音量。
步骤209:将目标音量区间对应的样本时间间隔确定为反馈时间间隔。
在本步骤中,将音量区间2对应的样本时间间隔3S确定为反馈时间间隔。
步骤210:从确定出所述环境音量信息起,记录环境音量信息的累计持续时长。
在本步骤中,记录确定出环境音量信息50分贝的累计持续时长。
步骤211:确定出语音信息对应的反馈语音。
在本步骤中,确定出语音信息对应的反馈语音为“剩余电量为80%”。
步骤212:判断累计持续时长是否等于反馈时间间隔,如果是,执行步骤213;否则,继续执行步骤210。
在本步骤中,判断出累计持续时长等于反馈时间间隔3S时,执行步骤213。
步骤213:播放反馈语音,且播放反馈语音的音量为反馈音量。
在本步骤中,播放反馈语音“剩余电量为80%”,且播放时的音量为反馈音量50分贝。
如图3所示,本发明实施例提供了一种语音交互装置,该装置包括:
采集模块301,用于在检测到用户输入的语音信息时,采集环境音量信息;
确定模块302,用于根据所述采集模块301采集的所述环境音量信息确定出反馈时间间隔以及反馈音量;
反馈模块303,用于根据所述确定模块302确定的所述反馈时间间隔以及所述反馈音量对所述采集模块301获取的所述语音信息进行语音反馈。
根据图3所示的实施例,在采集模块在检测到用户输入的语音信息时开始采集所处环境中的环境音量信息(该环境音量信息可以包括环境音量)。然后确定模块根据采集到的环境音量信息确定出反馈时间间隔以及反馈音量。最后反馈模块根据确定出的反馈时间间隔以及反馈音量针对用户输入的语音信息进行语音反馈。通过上述可知,在本发明实施例中反馈模块对用户语音信息进行语音反馈时所需的反馈时间间隔以及反馈音量是随着环境音量信息变化,并不是固定的。因此,本发明实施例提供的方案可以提高语音交互随着所处环境变化进行自适应调整的能力。
在本发明一个实施例中,采集模块301的具体型式可以根据业务要求确定,比如,可以声音采集器。
在本发明一个实施例中,如图4所示,在所述环境音量信息包括第一环境音量时,语音交互装置可以进一步包括设置模块304;
所述设置模块304,用于设置至少一个音量区间,其中,每一个所述音量区间分别对应一个样本音量以及一个样本时间间隔;
所述确定模块302,用于在所述设置模块304设置的所述至少一个音量区间中选择出包括所述第一环境音量的目标音量区间;所述目标音量区间对应的样本音量确定为所述反馈音量;将所述目标音量区间对应的样本时间间隔确定为所述反馈时间间隔。
在本发明一个实施例中,如图5所示,所述反馈模块303可以包括:第一记录子模块3031以及第一反馈子模块3032;
所述第一记录子模块3031,用于从检测到所述语音信息起,记录所述语音信息的持续时长;
所述第一反馈子模块3032,用于确定出所述语音信息对应的反馈语音;判断所述第一记录子模块3031记录的所述持续时长是否等于所述反馈时间间隔,如果是,播放所述反馈语音,且播放所述反馈语音的音量为所述反馈音量。
在本发明一个实施例中,所述采集模块301,用于执行A1至A4:
A1:在获取到所述语音信息时,采集环境中的当前第二环境音量;
A2:判断所述当前第二环境音量是否大于预设的音量阈值,如果是,执行A3;否则,执行A4;
A3:在预设时间间隔之后,继续采集下一个第二环境音量,并判断累计采集的次数是否达到预设的次数阈值,如果是,执行A4;否则,将当前采集到的第二环境音量作为当前第二环境音量,执行A2;
A4:将当前采集到的第二环境音量确定为所述环境音量信息。
在本发明一个实施例中,如图6所示,所述反馈模块303可以包括:第二记录子模块3033以及第二反馈子模块3034;
所述第二记录子模块3033,用于从确定出所述环境音量信息起,记录所述环境音量信息的累计持续时长;
所述第二反馈子模块3034,用于确定出所述语音信息对应的反馈语音;判断所述第二记录子模块3033记录的所述累计持续时长是否等于所述反馈时间间隔,如果是,播放所述反馈语音,且播放所述反馈语音的音量为所述反馈音量。
在本发明一个实施例提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述中任意一项所述的语音交互方法。
在本发明一个实施例提供了一种电子设备,如图7所示,所述电子设备中包括处理器401、存储器402和总线403;所述处理器401和所述存储器402通过所述总线403完成相互间的通信;所述处理器401用于调用所述存储器403中的程序指令,以执行上述中任意一项所述的语音交互方法。
上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
本发明各个实施例至少具有如下有益效果:
1、在本发明实施例中,在检测到用户输入的语音信息时采集所处环境中的环境音量信息(该环境音量信息可以包括环境音量)。然后根据采集到的环境音量信息确定出反馈时间间隔以及反馈音量。最后根据确定出的反馈时间间隔以及反馈音量针对用户输入的语音信息进行语音反馈。通过上述可知,在本发明实施例中对用户语音信息进行语音反馈时所需的反馈时间间隔以及反馈音量是随着环境音量信息变化的,并不是固定的。因此,本发明实施例提供的方案可以提高语音交互随着所处环境变化进行自适应调整的能力。
2、在本发明实施例中,由于设置一个或多个音量区间,因此在确定出环境音量之后,可以快速的选择出包括环境音量的音量区间,并将所选择出的音量对应的样本音量以及样本时间间隔分别确定为反馈音量以及反馈时间间隔。因此,在接收到语音信息时可以快速的确定出与环境音量对应的反馈音量以及反馈时间间隔。
3、在本发明实施例中,在获取到语音信息时便记录获取到语音信息的持续时长。并在判断出持续时长等于反馈时间间隔时,以反馈音量播放语音信息对应的反馈语音。因此可以保证反馈语音根据反馈时间间隔进行精确播放。
4、在本发明实施例中,由于利用音量阈值以及次数阈值等条件对采集到的各个环境音量进行初步筛选,因此,确定出的环境音量信息更能满足语音反馈的需求。
5、在本发明实施例中,在确定出环境音量信息时,记录确定出环境音量信息的累计持续时长,并在判断出累计持续时长等于反馈时间间隔时,以反馈音量播放语音信息对应的反馈语音。因此可以保证反馈语音根据反馈时间间隔进行精确播放。
6、在本发明实施例中,在获取模块获取到用户输入的语音信息时,采集模块开始采集所处环境中的环境音量信息(该环境音量信息可以包括环境音量)。然后确定模块根据采集到的环境音量信息确定出反馈时间间隔以及反馈音量。最后反馈模块根据确定出的反馈时间间隔以及反馈音量针对用户输入的语音信息进行语音反馈。通过上述可知,在本方案中反馈模块对用户语音信息进行语音反馈时所需的反馈时间间隔以及反馈音量是随着环境音量信息变化,并不是固定的。因此,本发明提供的方案可以提高语音交互随着所处环境变化进行自适应调整的能力。
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个······”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (8)

1.一种语音交互方法,其特征在于,包括:
在检测到用户输入的语音信息时,采集环境音量信息;
根据所述环境音量信息确定出反馈时间间隔以及反馈音量;
根据所述反馈时间间隔以及所述反馈音量对所述语音信息进行语音反馈;
所述环境音量信息包括第一环境音量;
在所述在检测到用户输入的语音信息时采集环境音量信息之前,进一步包括:
设置至少一个音量区间,其中,每一个所述音量区间分别对应一个样本音量以及一个样本时间间隔,其中,音量区间对应的音量越高,音量区间对应的样本音量越高,对应的样本时间间隔越长;
所述根据所述环境音量信息确定出反馈时间间隔以及反馈音量,包括:
在所述至少一个音量区间中选择出包括所述第一环境音量的目标音量区间;
将所述目标音量区间对应的样本音量确定为所述反馈音量;
将所述目标音量区间对应的样本时间间隔确定为所述反馈时间间隔。
2.根据权利要求1所述的方法,其特征在于,
所述根据所述反馈时间间隔以及所述反馈音量对所述语音信息进行语音反馈,包括:
从检测到所述语音信息起,记录所述语音信息的持续时长;
确定出所述语音信息对应的反馈语音;
判断所述持续时长是否等于所述反馈时间间隔,如果是,播放所述反馈语音,且播放所述反馈语音的音量为所述反馈音量。
3.根据权利要求1所述的方法,其特征在于,
所述采集环境音量信息,包括:
A1:在获取到所述语音信息时,采集环境中的当前第二环境音量;
A2:判断所述当前第二环境音量是否大于预设的音量阈值,如果是,执行A3;否则,执行A4;
A3:在预设时间间隔之后,继续采集下一个第二环境音量,并判断累计采集的次数是否达到预设的次数阈值,如果是,执行A4;否则,将当前采集到的第二环境音量作为当前第二环境音量,执行A2;
A4:将当前采集到的第二环境音量确定为所述环境音量信息。
4.根据权利要求3所述的方法,其特征在于,
所述根据所述反馈时间间隔以及所述反馈音量对所述语音信息进行语音反馈,包括:
从确定出所述环境音量信息起,记录所述环境音量信息的累计持续时长;
确定出所述语音信息对应的反馈语音;
判断所述累计持续时长是否等于所述反馈时间间隔,如果是,播放所述反馈语音,且播放所述反馈语音的音量为所述反馈音量。
5.一种语音交互装置,其特征在于,包括:
采集模块,用于在检测到用户输入的语音信息时,采集环境音量信息;
确定模块,用于根据所述采集模块采集的所述环境音量信息确定出反馈时间间隔以及反馈音量;
反馈模块,用于根据所述确定模块确定的所述反馈时间间隔以及所述反馈音量对获取模块获取的所述语音信息进行语音反馈;
所述环境音量信息包括第一环境音量;
进一步包括:设置模块;
所述设置模块,用于设置至少一个音量区间,其中,每一个所述音量区间分别对应一个样本音量以及一个样本时间间隔,其中,音量区间对应的音量越高,音量区间对应的样本音量越高,对应的样本时间间隔越长;
所述确定模块,用于在所述设置模块设置的所述至少一个音量区间中选择出包括所述第一环境音量的目标音量区间;所述目标音量区间对应的样本音量确定为所述反馈音量;将所述目标音量区间对应的样本时间间隔确定为所述反馈时间间隔。
6.根据权利要求5所述的装置,其特征在于,
所述反馈模块,包括:第一记录子模块以及第一反馈子模块;
所述第一记录子模块,用于从检测到所述语音信息起,记录所述语音信息的持续时长;
所述第一反馈子模块,用于确定出所述语音信息对应的反馈语音;判断所述第一记录子模块记录的所述持续时长是否等于所述反馈时间间隔,如果是,播放所述反馈语音,且播放所述反馈语音的音量为所述反馈音量。
7.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至权利要求4中任意一项所述的语音交互方法。
8.一种电子设备,其特征在于,所述电子设备中包括处理器、存储器和总线;所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行权利要求1至权利要求4中任意一项所述的语音交互方法。
CN201810479491.0A 2018-05-18 2018-05-18 一种语音交互方法及装置 Active CN108733341B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810479491.0A CN108733341B (zh) 2018-05-18 2018-05-18 一种语音交互方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810479491.0A CN108733341B (zh) 2018-05-18 2018-05-18 一种语音交互方法及装置

Publications (2)

Publication Number Publication Date
CN108733341A CN108733341A (zh) 2018-11-02
CN108733341B true CN108733341B (zh) 2021-09-14

Family

ID=63937655

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810479491.0A Active CN108733341B (zh) 2018-05-18 2018-05-18 一种语音交互方法及装置

Country Status (1)

Country Link
CN (1) CN108733341B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110113497B (zh) * 2019-04-12 2022-01-11 深圳壹账通智能科技有限公司 基于语音交互的语音外呼方法、装置、终端及存储介质
CN110224904B (zh) * 2019-06-06 2022-10-21 腾讯科技(深圳)有限公司 语音处理方法、装置、计算机可读存储介质和计算机设备
CN112162639B (zh) * 2020-10-12 2021-11-30 上海大学 一种电子战装备模拟训练人机交互协作***
CN112447181A (zh) * 2020-11-16 2021-03-05 珠海格力电器股份有限公司 语音的交互方法和装置、存储介质、电子装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105227741A (zh) * 2015-08-19 2016-01-06 上海海漾软件技术有限公司 一种智能设备进行音量提醒的方法以及装置
CN106970774A (zh) * 2017-03-29 2017-07-21 广州阿里巴巴文学信息技术有限公司 一种音量调节装置及方法、一种终端
CN107301030A (zh) * 2017-06-21 2017-10-27 深圳天珑无线科技有限公司 一种音量控制方法、装置以及一种终端
CN107766030A (zh) * 2017-11-13 2018-03-06 百度在线网络技术(北京)有限公司 音量调节方法、装置、设备及计算机可读介质
CN107908388A (zh) * 2017-11-17 2018-04-13 珠海市魅族科技有限公司 音量控制方法及装置、计算机装置及计算机可读存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102075606A (zh) * 2010-12-09 2011-05-25 深圳桑菲消费通信有限公司 根据周围环境噪音大小自动改变***音量的方法
CN102761721A (zh) * 2011-04-27 2012-10-31 海尔集团公司 电视机音量的控制方法及控制***
KR101978209B1 (ko) * 2012-09-24 2019-05-14 엘지전자 주식회사 이동 단말기 및 이의 제어 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105227741A (zh) * 2015-08-19 2016-01-06 上海海漾软件技术有限公司 一种智能设备进行音量提醒的方法以及装置
CN106970774A (zh) * 2017-03-29 2017-07-21 广州阿里巴巴文学信息技术有限公司 一种音量调节装置及方法、一种终端
CN107301030A (zh) * 2017-06-21 2017-10-27 深圳天珑无线科技有限公司 一种音量控制方法、装置以及一种终端
CN107766030A (zh) * 2017-11-13 2018-03-06 百度在线网络技术(北京)有限公司 音量调节方法、装置、设备及计算机可读介质
CN107908388A (zh) * 2017-11-17 2018-04-13 珠海市魅族科技有限公司 音量控制方法及装置、计算机装置及计算机可读存储介质

Also Published As

Publication number Publication date
CN108733341A (zh) 2018-11-02

Similar Documents

Publication Publication Date Title
CN108733341B (zh) 一种语音交互方法及装置
CN106898348B (zh) 一种出声设备的去混响控制方法和装置
US10522164B2 (en) Method and device for improving audio processing performance
CN111883156B (zh) 音频处理方法、装置、电子设备及存储介质
CN110347367B (zh) 音量调节方法、终端设备、存储介质及电子设备
JP2019117623A (ja) 音声対話方法、装置、デバイス及び記憶媒体
CN103871408B (zh) 一种语音识别方法及装置、电子设备
JP6844608B2 (ja) 音声処理装置および音声処理方法
CN103886731A (zh) 一种噪声控制方法及设备
CN104954555A (zh) 一种音量调节方法及***
CN110970057A (zh) 一种声音处理方法、装置与设备
CN111554317B (zh) 一种语音播报方法、设备、计算机存储介质及***
CN106356070A (zh) 一种音频信号处理方法,及装置
CN103886857A (zh) 一种噪声控制方法及设备
CN109903758B (zh) 音频处理方法、装置及终端设备
CN109166571B (zh) 家电设备的唤醒词训练方法、装置及家电设备
CN110875045A (zh) 一种语音识别方法、智能设备和智能电视
CN103903606A (zh) 一种噪声控制方法及设备
CN112687286A (zh) 音频设备的降噪模型的调整方法和装置
CN105872205A (zh) 一种信息处理方法及装置
CN105719672A (zh) 一种录音情景模式切换方法及装置
CN109686372B (zh) 资源播放控制方法和装置
CN111028838A (zh) 一种语音唤醒方法、设备及计算机可读存储介质
CN109584877B (zh) 语音交互控制方法和装置
CN114979921A (zh) 一种耳机声音外泄的检测方法、装置及蓝牙耳机

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant