CN113420115B

CN113420115B - 基于人机语音对话的信息处理方法及装置

Info

Publication number: CN113420115B
Application number: CN202110694109.XA
Authority: CN
Inventors: 陈林; 李文龙; 何浩峰
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2021-06-22
Filing date: 2021-06-22
Publication date: 2024-03-22
Anticipated expiration: 2041-06-22
Also published as: CN113420115A

Abstract

本发明公开了一种基于人机语音对话的信息处理方法及装置，涉及自然语言处理技术领域，主要目的在于解决现有对话信息的智能问答准确性较差的问题。包括：解析用户录入的第一对话信息，并在第一对话信息录入完成后的第一间隔时长结束后，输出进行反馈的第二对话信息；当输出第二对话信息的过程中检测到用户录入的第三对话信息时，确定第二对话信息为竞抢状态，并执行第二对话信息输出的暂停操作；调整第一间隔时长为第二间隔时长，并在第三对话信息录入完成后，判断在第二间隔时长内是否存在用户录入的第四对话信息；若存在，则合并第三对话信息、第四对话信息，并确定合并后作为语音对话输出的第五对话信息输出。

Description

基于人机语音对话的信息处理方法及装置

技术领域

本发明涉及一种自然语言处理技术领域，特别是涉及一种基于人机语音对话的信息信息处理方法及装置。

背景技术

随着语音智能化的快速发展，电话智能问答技术逐步应用到各个领域中。作为智能问答的机器人在与客户进行通话过程中，需要有流畅的对话节奏，不仅仅为了实现良好对话的目的，也可以确保对话完整性。其中，机器人在与客户进行对话过程中，由于人为对话会存在间歇性、断句等情况，使得机器人在智能处理时对对话信息的出现产生错误判断，会出现答案对话信息的提前输出，产生抢话的情况。

目前，现有语句输出过程中，机器问答对话信息的输出，仅仅通过一个预先设定的时间间隔来判断用户是否停止对话信息的输入，但是，当时间间隔达到后进行下一段对话信息的播报后，用户又再次录入对话信息，造成了大量的抢话情况的出现，即对话信息输出时间错误，使得对话信息的智能问答准确性较差，大大影响问答对话的处理效率。

发明内容

有鉴于此，本发明提供一种基于人机语音对话的信息处理方法及装置，主要目的在于解决现有对话信息的智能问答准确性较差，大大影响问答对话的处理效率的问题。

依据本发明一个方面，提供了一种基于人机语音对话的信息处理方法，包括：

在人机语音对话过程中，解析用户录入的第一对话信息，并在所述第一对话信息录入完成后的第一间隔时长结束后，输出对所述第一对话信息进行反馈的第二对话信息；

当输出所述第二对话信息的过程中检测到所述用户录入的第三对话信息时，确定所述第二对话信息为竞抢状态，并执行所述第二对话信息输出的暂停操作；

基于预置竞抢时长关系和所述竞抢状态，调整所述第一间隔时长为第二间隔时长，并在所述第三对话信息录入完成后，判断在所述第二间隔时长内是否存在所述用户录入的第四对话信息；

若存在，则合并所述第三对话信息、所述第四对话信息，并解析合并后的合并对话信息，确定作为语音对话输出的第五对话信息，进行输出。

进一步地，所述预置竞抢时长关系用于表征不同竞抢状态与不同对话间隔时长之间所对应调整间隔时长的长短的关系，所述基于预置竞抢时长关系和所述竞抢状态，调整所述第一间隔时长为第二间隔时长包括：

根据已确定的所述第二对话信息的竞抢状态从所述预置竞抢时长关系列表中查找待调整的目标时长，其中，所述竞抢状态包括一个或多个，所述竞抢状态根据所述第二对话信息已经播放的时长确定的；

根据所述目标时长延长调整所述第一间隔时长为第二间隔时长。

进一步地，在所述解析用户录入的第一对话信息之前，还包括：

解析首次录入对话信息的语速时长，并根据所述语速时长配置首次执行人机语音对话间隔检测的第一间隔时长；

根据所述第一间隔时长分别确定各个竞抢状态需调整的目标时长并进行关联映射，得到预置竞抢时长关系列表。

进一步地，当用户选取人机对话需求后，获取与所述人机对话需求匹配的至少两个历史人机对话信息，所述历史人机对话信息为被历史用户标记为满意对话模式的对话信息；

计算所述至少两个历史人机对话信息的人机对话间隔时长的平均间隔时长，将所述平均间隔时长配置为首次执行人机语音对话间隔检测的第一间隔时长；

进一步地，所述确定所述第二对话信息的竞抢状态，并执行所述第二对话信息输出的暂停操作之前，所述方法还包括：

通过预设意图模型分别识别所述第一对话信息的第一意图信息，以及所述第三对话信息的第二意图信息；

判断所述第一意图信息与第二意图信息相似度是否在预设意图阈值范围内；

若是，则确定所述第二对话信息为竞抢对话，以确定所述第二对话信息的竞抢状态。

进一步地，所述合并所述第三对话信息、所述第四对话信息之前，所述方法还包括：

解析所述第三对话信息以及所述第四对话信息的语义；

判断所述第三对话信息与所述第四对话信息的语义相似度是否超过预设相似度阈值；

若是，则将所述第三对话信息与所述第四对话信息判定为具有合并关系，以将所述第三对话信息与所述第四对话信息合并。

进一步地，所述方法还包括：

在对所述第二间隔时长调整后的预设人机语音对话时长内，识别是否存在所述用户再次录入的第六对话信息确定为竞抢状态；

若不存在，则根据预设缩短规则缩短所述第二间隔时长。

依据本发明另一个方面，提供了一种基于人机语音对话的信息处理装置，包括：

第一输出模块，用于在人机语音对话过程中，解析用户录入的第一对话信息，并在所述第一对话信息录入完成后的第一间隔时长结束后，输出对所述第一对话信息进行反馈的第二对话信息；

确定模块，用于当输出所述第二对话信息的过程中检测到所述用户录入的第三对话信息时，确定所述第二对话信息为竞抢状态，并执行所述第二对话信息输出的暂停操作；

判断模块，用于基于预置竞抢时长关系和所述竞抢状态，调整所述第一间隔时长为第二间隔时长，并在所述第三对话信息录入完成后，判断在所述第二间隔时长内是否存在所述用户录入的第四对话信息；

第二输出模块，用于若判断模块判断在所述第二间隔时长内存在所述用户录入的第四对话信息，则合并所述第三对话信息、所述第四对话信息，并解析合并后的合并对话信息，确定作为语音对话输出的第五对话信息，进行输出。

进一步地，所述预置竞抢时长关系用于表征不同竞抢状态与不同对话间隔时长之间所对应调整间隔时长的长短的关系，所述判断模块包括：

查找单元，用于根据已确定的所述第二对话信息的竞抢状态从所述预置竞抢时长关系列表中查找待调整的目标时长，其中，所述竞抢状态包括一个或多个，所述竞抢状态根据所述第二对话信息已经播放的时长确定的；

调整单元，用于根据所述目标时长延长调整所述第一间隔时长为第二间隔时长。

进一步地，所述装置还包括：解析模块，

所述解析模块，用于解析首次录入对话信息的语速时长，并根据所述语速时长配置首次执行人机语音对话间隔检测的第一间隔时长；

所述确定模块，还用于根据所述第一间隔时长分别确定各个竞抢状态需调整的目标时长并进行关联映射，得到预置竞抢时长关系列表。

进一步地，所述装置还包括：获取模块，计算模块，

所述获取模块，用于当用户选取人机对话需求后，获取与所述人机对话需求匹配的至少两个历史人机对话信息，所述历史人机对话信息为被历史用户标记为满意对话模式的对话信息；

所述计算模块，用于计算所述至少两个历史人机对话信息的人机对话间隔时长的平均间隔时长，将所述平均间隔时长配置为首次执行人机语音对话间隔检测的第一间隔时长；

进一步地，所述装置还包括：识别模块，

所述识别模块，用于通过预设意图模型分别识别所述第一对话信息的第一意图信息，以及所述第三对话信息的第二意图信息；

所述判断模块，还用于判断所述第一意图信息与第二意图信息相似度是否在预设意图阈值范围内；

所述确定模块，还用于所述判断模块判断所述第一意图信息与第二意图信息相似度在预设意图阈值范围内，则确定所述第二对话信息为竞抢对话，以确定所述第二对话信息的竞抢状态。

进一步地，

所述解析模块，还用于解析所述第三对话信息以及所述第四对话信息的语义；

所述判断模块，还用于判断所述第三对话信息与所述第四对话信息的语义相似度是否超过预设相似度阈值；

所述确定模块，还用于所述判断模块若判断所述第三对话信息与所述第四对话信息的语义相似度超过预设相似度阈值，则将所述第三对话信息与所述第四对话信息判定为具有合并关系，以将所述第三对话信息与所述第四对话信息合并。

进一步地，所述装置还包括：调整模块，

所述识别模块，还用于在对所述第二间隔时长调整后的预设人机语音对话时长内，识别是否存在所述用户再次录入的第六对话信息确定为竞抢状态；

所述调整模块，用于若不存在，则根据预设缩短规则缩短所述第二间隔时长。

根据本发明的又一方面，提供了一种存储介质，所述存储介质中存储有至少一可执行指令，所述可执行指令使处理器执行如上述基于人机语音对话的信息处理方法对应的操作。

根据本发明的再一方面，提供了一种计算机设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行上述基于人机语音对话的信息处理方法对应的操作。

借由上述技术方案，本发明实施例提供的技术方案至少具有下列优点：

本发明提供了一种基于人机语音对话的信息处理方法及装置，与现有技术相比，本发明实施例在人机语音对话过程中，解析用户录入的第一对话信息，并在所述第一对话信息录入完成后的第一间隔时长结束后，输出对所述第一对话信息进行反馈的第二对话信息；当输出所述第二对话信息的过程中检测到所述用户录入的第三对话信息时，确定所述第二对话信息为竞抢状态，并执行所述第二对话信息输出的暂停操作；基于预置竞抢时长关系和所述竞抢状态，调整所述第一间隔时长为第二间隔时长，并在所述第三对话信息录入完成后，判断在所述第二间隔时长内是否存在所述用户录入的第四对话信息；若存在，则合并所述第三对话信息、所述第四对话信息，并解析合并后的合并对话信息，确定作为语音对话输出的第五对话信息，进行输出，实现对话信息的自适应性处理，满足对话信息处理的智能性需求，大大减少了对话信息输出不适时的情况，提高对话信息的智能问答准确性，从而提高基于人机语音对话的信息处理效率。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了本发明实施例提供的一种基于人机语音对话的信息处理方法流程图；

图2示出了本发明实施例提供的一种基于人机语音对话的信息处理装置组成框图；

图3示出了本发明实施例提供的一种调整所述第一间隔时长为第二间隔时长方法的流程图；

图4示出了本发明实施例提供的一种缩短第二间隔时长方法的流程图；

图5示出了本发明实施例提供的一种得到预置竞抢时长关系列表方法的流程图；

图6示出了本发明实施例提供的一种基于人机语音对话的信息处理装置组成框图；

图7示出了本发明实施例提供的一种计算机设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明实施例提供了一种基于人机语音对话的信息处理方法，如图1所示，该方法包括：

101、在人机语音对话过程中，解析用户录入的第一对话信息，并在所述第一对话信息录入完成后的第一间隔时长结束后，输出对所述第一对话信息进行反馈的第二对话信息。

本发明实施例中，基于人机语音对话的信息处理方法应用于智能对话场景，即非人工对话场景，包括但不限于智能机器人电话对话，智能机器人社交平台对话等。其中，第一对话信息为用户录入的对话内容，可以为当前执行端输出特定对话内容(机器人智能提问或陈述)后，用户基于特定对话内容进行录入的对话内容，还可以为用户首先自主录入的对话内容，第二对话信息为当前执行端根据用户录入的第一对话信息进行解析匹配后确定进行回答或者陈述而输出的对话内容。另外，第一间隔时长为当前执行端预先配置接收第一对话信息完成后至输出第二对话信息之间的时间间隔，以作为人机对话的对话间隔时长，因此，在第一对话信息录入完成后，且第一间隔时长结束后，当前执行端输出与第一对话信息匹配且用于反馈的第二对话信息。

需要说明的是，在智能对话场景中，为了使对话的输出效果与实际的人工对话效果相同，在录入或输出对话信息后，通常基于一个预先设定的对话间隔时长进行计时，作为对话的停顿时间，在此对话间隔时长内，若出现对话录入，则重新进行解析匹配，若未出现录入的对话，则按照最近一次录入的对话信息进行解析匹配，从而实现对话内容输出的准确性。若到达对话间隔时长，则说明完成对话的录入，可以基于录入的对话内容进行解析匹配而输出相应的回答对话，当前执行端配置第一间隔时长作为对话间隔时长进行计时。

102、当输出所述第二对话信息的过程中检测到所述用户录入的第三对话信息时，确定所述第二对话信息为竞抢状态，并执行所述第二对话信息输出的暂停操作。

其中，在第二对话信息输出过程中，当前执行端实时检测用户是否再次录入对话内容，作为第三对话信息。若检测到用户录入的第三对话信息，此时第二对话信息并未完成输出，说明用户在录入第一对话信息时，未完全完成对话内容的录入，即第二对话信息属于在第三对话信息录入前竞抢输出，则确定第二对话信息为竞抢对话，进而确定为竞抢状态，以暂停第二对话信息的输出。竞抢状态用于表示第二对话信息出现竞抢的程度，可以包括第一级别竞抢状态、第二级别竞抢状态、第三级别竞抢状态，竞抢状态的三个级别为按照预先设的时间间隔来确定，例如，竞抢的对话输出2秒后用户反映过来录入对话，则对应第一级别竞抢状态，竞抢的对话输出5秒后用户反映过来录入对话，则对应第二级别竞抢状态，竞抢的对话输出8秒后用户反映过来录入对话，则对应第三级别竞抢状态，依次说明用户反映的速度越来越慢。

103、基于预置竞抢时长关系和所述竞抢状态，调整所述第一间隔时长为第二间隔时长，并在所述第三对话信息录入完成后，判断在所述第二间隔时长内是否存在所述用户录入的第四对话信息。

本发明实施例中，由于第二对话信息确定为竞抢对话，说明录入对话信息的用户的对话习惯与当前执行端预先设定的对话处理步骤不匹配，或者匹配准确性较差，因此，通过对第一间隔时长进行调整来适应性的提高对话的智能性。其中，预置竞抢时长关系用于表征不同竞抢状态与不同对话间隔时长之间所对应调整目标时长的关系，即可以根据对第二对话信息确定的竞抢状态从预置竞抢时长关系中查找出对不同对话间隔时长进行调整的调整目标时长，以对第一间隔时长进行调整，调整为第二间隔时长，例如，第一级别竞抢状态所对应20秒的对话间隔时长的调整目标时长为10秒，对应30秒的对话间隔时长的调整目标时长为15秒等，第二级别竞抢状态所对应20秒的对话间隔时长的调整目标时长为5秒，对应30秒的对话间隔时长的调整目标时长为10秒，本发明实施例不做具体限定。

需要说明的是，当基于预置竞抢时长关系确定对对话间隔时长的调整目标时长后进行延长调整第一间隔时长，基于调整后的第二间隔时长判断此间隔时长的时间段内是否存在用户录入的第四对话信息，即由于第三对话信息为用户录入的对话内容，第四对话信息为与第三对话信息可以作为一个对话语句进行解析匹配到对话答案的对话内容，说明在第三对话信息录入完成后且一个第二间隔时长的时间段中，用户又再次录入第四对话信息，因此，说明第四对话信息为用户在录入第三对话信息后，未完成录入的对话内容。

104、若存在，则合并所述第三对话信息、所述第四对话信息，并解析合并后的合并对话信息，确定作为语音对话输出的第五对话信息，进行输出。

本发明实施例中，若在第二隔时长的时间段内，存在用户录入的第四对话信息，则说明用户在完成第三对话信息后的对话间隔时长内，又再次录入了一句可以与第三对话信息可以进行合并的对话内容，例如，用户录入“我在2021年购买平安福”后，在调整后的对话间隔时长20秒内，又再次录入了“给我的妻子买的平安福”，说明第三对话信息与第四对话信息可以合并，即可以作为一个“我在2021年购买平安福，给我的妻子买的平安福”对话内容，进行解析匹配，输出第五对话信息。若不存在，则说明没有进行合并的第三对话信息、第三对话信息，按照正常录入的最后一个对话信息进行解析匹配即可。

需要说明的是，本发明实施例中对于解析匹配对话内容的方法，可以根据对对话内容中的意图进行提取，并结合自然语言处理技术提取出与意图匹配的关键词语，然后按照预设的匹配表达式与关键词语进行匹配，确定对应的输出对话内容，本发明实施例不做具体限定。另外，由于对话内容的识别手段适用于合并后的对话内容的解析，因此，可以利用当前执行端中对对话内容进行识别选取匹配的自动回答的对话内容作为第五对话信息，当前的当前执行端可以为智能对话***。具体的包括：通过自然语言处理技术抽取第三对话信息与第四对话信息中作为主语、谓语、宾语的词语信息，根据词语信息查找合并后第三对话信息与第四对话信息的意图信息，从问答对话列表中查找与意图信息匹配的对话内容作为第五对话信息。在此过程中，当前执行端中预先存储有不同主语、谓语、宾语的词语信息所对应的意图信息，即为问答对话列表，问答对话列表中按照不同的和/或逻辑关系组合不同主语、谓语、宾语所对应词语信息与意图信息之间的映射关系，从而使得在确定第三对话信息、第四对话信息可以合并，确定对话内容的意图信息后解析到第五对话信息，本发明实施例不做具体限定。

与步骤104并列的，若在所述第二间隔时长内不存在所述用户录入的第四对话信息，则当前执行端根据第三对话信息进行解析匹配进行输出的对话内容即可。

本发明实施例提供了一种基于人机语音对话的信息处理方法，与现有技术相比，本发明实施例在人机语音对话过程中，解析用户录入的第一对话信息，并在所述第一对话信息录入完成后的第一间隔时长结束后，输出对所述第一对话信息进行反馈的第二对话信息；当输出所述第二对话信息的过程中检测到所述用户录入的第三对话信息时，确定所述第二对话信息为竞抢状态，并执行所述第二对话信息输出的暂停操作；基于预置竞抢时长关系和所述竞抢状态，调整所述第一间隔时长为第二间隔时长，并在所述第三对话信息录入完成后，判断在所述第二间隔时长内是否存在所述用户录入的第四对话信息；若存在，则合并所述第三对话信息、所述第四对话信息，并解析合并后的合并对话信息，确定作为语音对话输出的第五对话信息，进行输出，实现对话信息的自适应性处理，满足对话信息处理的智能性需求，大大减少了对话信息输出不适时的情况，提高对话信息的智能问答准确性，从而提高基于人机语音对话的信息处理效率。

本发明实施例提供了另一种基于人机语音对话的信息处理方法，如图2所示，该方法包括：

201、解析首次录入对话信息的语速时长，并根据所述语速时长配置首次执行人机语音对话间隔检测的第一间隔时长。

为了使进行人机对话的对话输出智能地符合人对话的时间间隔效果，自适应地满足不同用户的对话需求，实现对话信息的输出、录入匹配真实人工对话的处理效果，从而提高对话信息处理的智能性，根据首次录入对话信息的语速时长配置首次执行对话信息录入检测的第一间隔时长，从而根据对第一隔时长分别确定第一级别竞抢状态、第二级别竞抢状态、第三级别竞抢状态所分别对应的目标时长，配置映射关系，更新至预置竞抢时长关系中。具体的，首次录入的对话信息可以为用户主动录入的，也可以为用户基于当前执行端，如智能对话***提示的对话内容进行答复的，然后基于语音文字转换技术以及自然语言处理技术解析各个词语出现的时间差，确定为语速时长。另外，配置第一间隔时长为根据语速时长的3倍进行配置，从而使得等待用户录入对话信息的时间较为合适。

202、根据所述第一间隔时长分别确定各个竞抢状态需调整的目标时长并进行关联映射，得到预置竞抢时长关系列表。

为了实现目标时长的准确确定，由于目标时长是对对话间隔时长进行延长调整的时长，因此，在根据第一间隔时长分别确定第一级别竞抢状态、第二级别竞抢状态、第三级别竞抢状态所分别对应的目标时长时，可以按照对话间隔时长的0.1倍、0.5倍、0.8倍分别配置第一级别竞抢状态、第二级别竞抢状态、第三级别竞抢状态所分别对应的目标时长。并且按照第一级别竞抢状态、第二级别竞抢状态、第三级别竞抢状态与目标时长之间建立映射关系，更新至预置竞抢时长关系列表中，以便进行目标时长的查找。

203、在人机语音对话过程中，解析用户录入的第一对话信息，并在所述第一对话信息录入完成后的第一间隔时长结束后，输出对所述第一对话信息进行反馈的第二对话信息。

204、通过预设意图模型分别识别所述第一对话信息的第一意图信息，以及所述第三对话信息的第二意图信息。

为了提高对对话信息确定为竞抢的准确性，实现竞抢对话的处理有效性，判断第一对话信息的意图信息与第三对话信息的意图信息是否属于一样意图范围，即通过预设意图模型分别识别所述第一对话信息的第一意图信息，以及所述第三对话信息的第二意图信息。若属于，则确定第二对话信息为竞抢对话，若不属于，则说明第一对话信息与第三对话信息可能不属于一个对话内容，第三对话信息为用户针对第二对话信息进行录入的对话内容，即用户出现竞抢对话录入，此时，当前执行端可以停止输出第二对话信息，并以对三对话信息进行解析匹配到新的对话内容进行输出。

需要说明的是，预设意图模型为预先建立的语言处理分类模型，可以基于神经网络模型等机器学习算法进行训练得到，也可以按照自然语言处理技术筛选出定义为意图词语的语义内容，确定意图信息，例如，意图正则表达包括：##疾病名##、(##保险名##|##保险类名##)、(投保|承保|买保险|····)，若对话信息中符合此正则表达式判断，则可以确定此正则表达是所对应的意图，如疾病投保此对话信息的意图。另外，不同正则表达式所对应的意图信息按照不同业务需求进行划分范围，包括但不限于医疗保险范围意图、车辆保险范围意图、基金产品范围意图等本发明实施例不做具体限定。

205、判断所述第一意图信息与第二意图信息相似度是否在预设意图阈值范围内。

具体的，对第一意图信息与第二意图信息的判断，具体为首先计算第一图像信息与第二意图信息的相似度值，通过判断计算出的相似度值是否在预设意图相似度值范围内来确定。其中，相似度的计算可以包括但不限于曼哈顿距离、欧氏距离等计算方法，当前执行端预先配置属于一个意图范围的预设意图阈值范围，从而将第二对话信息确定为竞抢对话。

206、若是，则确定所述第二对话信息为竞抢对话，以确定所述第二对话信息的竞抢状态。

与步骤206并列的，若判断所述第一意图信息与第二意图信息相似度不在预设意图阈值范围内，则说明第一对话信息与第三对话信息之间出现的第二对话信息不属于竞抢对话，则等待第三对话信息录入后，进行解析匹配输出的对话内容即可。

207、当输出所述第二对话信息的过程中检测到所述用户录入的第三对话信息时，确定所述第二对话信息为竞抢状态，并执行所述第二对话信息输出的暂停操作。

208、基于预置竞抢时长关系和所述竞抢状态，调整所述第一间隔时长为第二间隔时长，并在所述第三对话信息录入完成后，判断在所述第二间隔时长内是否存在所述用户录入的第四对话信息。

本发明实施例中，如图3所示的一种调整所述第一间隔时长为第二间隔时长的流程图，为了进一步限定及说明，所述预置竞抢时长关系用于表征不同竞抢状态与不同对话间隔时长之间所对应调整间隔时长的长短的关系，步骤208中所述基于预置竞抢时长关系和所述竞抢状态，调整所述第一间隔时长为第二间隔时长包括：2081、根据已确定的所述第二对话信息的竞抢状态从所述预置竞抢时长关系列表中查找待调整的目标时长，其中，所述竞抢状态包括一个或多个，所述竞抢状态根据所述第二对话信息已经播放的时长确定的；2082、根据所述目标时长延长调整所述第一间隔时长为第二间隔时长。

为了提高对基于人机语音对话的信息处理准确性，满足用户对对话信息的不同自适应调整的需求，根据预置竞抢时长关系用于表征不同竞抢状态与不同对话间隔时长之间所对应调整目标时长的关系，通过确定第二对话信息的竞抢状态从预置竞抢时长关系中查找到待调整目标时长，从而按照目标时长延长调整对话间隔时长。其中，不同竞抢状态为按照第二对话信息的对话信息播放时长进行三等份划分得到的，即按照第二对话时长的对话信息播放时长进行三等份划分，三个时间段一次叠加作为依据进行第一级别竞抢状态、第二级别竞抢状态、第三级别竞抢状态的确定。另外，由于预置竞抢时长关系用于表征不同竞抢状态与不同第一间隔时长之间所对应调整目标时长的关系，当前执行端中预先存储有第一级别竞抢状态、第二级别竞抢状态、第三级别竞抢状态对应不同对话间隔时长的调整目标时长，以列表形式进行存储，以便在确定第二对话信息的竞抢状态后，按照预置竞抢时长关系中映射关系查找到不同级别竞抢状态对应第一间隔时长的调整目标时长，按照延长调整的方式调整对话间隔时长，即在原有的对话间隔时长的基础上叠加调整目标时长，得到延长的第二间隔时长。

需要说明的是，确定所述第二对话信息为竞抢状态具体根据所述第二对话信息的已输出时长与所述第二对话信息的完整输出时长之差，与所述对话信息播放时长的时间段长度进行匹配，确定竞抢状态，所述时间段长度为基于对所述对话信息播放时长划分三等份时间长度确定的。其中，第二对话信息的已输出时长为第二对话信息进行输出时间点到第三对话信息录入的时间点的长度，当前执行端在输出第二对话信息时会进行计时，以确定已输出时长，第二对话信息的完整输出时长为若第二对话信息完整输出的全部时长，一般的，第二对话信息为当前执行端进行匹配的，因此，当前执行端中预先存储有第二对话信息的完整输出时长。具体的，可以通过确定已输出时长、完整输出时长，以及对话信息播放时长的三等份时间段后，计算已输出时长与完整输出时长之差，此差值限定为正值，判断此差值处于三等份时间段中的哪一段，即三等份时间段后，形成3个时间长度，第一等分的第一时间段，第二等分的第二时间段，第三等分的第三时间段，因此，当差值处于第一时间段，则确定为第一级别竞抢状态，若差值处于第二时间段，则确定为第二级别竞抢状态，若差值处于第三时间段，则确定为第三级别竞抢状态。

例如，确定第二对话信息为第二级别竞抢状态，第一间隔时长为5秒，竞抢时长关系中预置第二级别竞抢状态所对应5秒的对话间隔时长的调整目标时长为5秒，则调整后的第二间隔时长为10秒。

209、若存在，则合并所述第三对话信息、所述第四对话信息，并解析合并后的合并对话信息，确定作为语音对话输出的第五对话信息，进行输出。

一个本发明实施例中，为了进一步限定及说明，步骤209所述合并所述第三对话信息、所述第四对话信息之前，所述方法还包括：解析所述第三对话信息以及所述第四对话信息的语义；判断所述第三对话信息与所述第四对话信息的语义相似度是否超过预设相似度阈值；若是，则将所述第三对话信息与所述第四对话信息判定为具有合并关系，以将所述第三对话信息与所述第四对话信息合并。

为了实现对话信息输出的自适应处理效果，从而提高基于人机语音对话的信息处理准确性，并且由于第四对话信息为按照调整后的对话间隔时长内所录入的对话内容，则对第三对话信息与第四对话信息的合并关系的判断，具体通过解析第三对话信息中的词语信息与第四对话信息中的词语信息是否为关联词，关联词为根据词语信息的相似度超过预设相似阈值进行确定。其中，对于第三对话信息、第四对话信息中的各个词语信息可以利用字典树方式对对话信息中的词语进行拆分，具体的，确定当前执行端中的全部对话语句所需的熟词表，建立起字典树，又称单词查找树，具体为一种哈希树的变种，然后分别将第三对话信息、第四对话信息进行字典树的依层级查询，完成单个词语的拆分。然后，利用相似度算法计算第三对话信息与第四对话信息中各个词语之间的相似度值，若词语相似度值超过预设相似度阈值，则确定第三对话信息与第四对话信息存在关联词，确定第三对话信息与第四对话信息具有合并关系，可以合并为一个对话信息，其中，预设相似度为预先设定的，可以针对不同关联需求进行设定，本发明实施例不做具体限定。

在另一个本发明实施例中，如图4所示的缩短第二间隔时长方法的流程图，为了进一步限定及说明，所述方法还包括：301、在对所述第二间隔时长调整后的预设人机语音对话时长内，识别是否存在所述用户再次录入的第六对话信息确定为竞抢状态；302、若不存在，则根据预设缩短规则缩短所述第二间隔时长。

为了提高基于人机语音对话的信息处理效率，满足不同用户的对话智能性需求，在出现对话竞抢现象后，根据预设人机语音对话时长，判断是否存在第六对话信息为竞抢状态，即在对第二间隔时长调整后的预设人机语音对话时长内，识别是否存在用户再次录入的第六对话信息，以确定为竞抢状态。其中，预设人机语音对话时长为预先配置用于限定对话输出、录入所预期是否重新调整对话间隔时长的时间长度，在这段时间内，若不存在第六对话信息为竞抢状态，则说明经过调整后的对话间隔时长不在出现对话竞抢，即不会再次出现被确定为竞抢对话的第六对话信息，可以重新调整第二间隔时长。具体的，重新调整的第二间隔时长可以按照原有的第二间隔时长进行缩短调整，也可以按照特定的时间长度进行缩短，即为按照预设缩短规则进行，本发明实施例不做具体限定。

在另一个本发明实施例中，如图5所示的一种得到预置竞抢时长关系列表方法的流程图，为了进一步限定及说明，在所述解析用户录入的第一对话信息之前，还包括：401、当用户选取人机对话需求后，获取与所述人机对话需求匹配的至少两个历史人机对话信息，所述历史人机对话信息为被历史用户标记为满意对话模式的对话信息；402、计算所述至少两个历史人机对话信息的人机对话间隔时长的平均间隔时长，将所述平均间隔时长配置为首次执行人机语音对话间隔检测的第一间隔时长；403、根据所述第一间隔时长分别确定各个竞抢状态需调整的目标时长并进行关联映射，得到预置竞抢时长关系列表。

在本发明实施例中，为了使进行人机对话的对话输出智能地符合人对话的时间间隔效果，自适应地满足不同用户的对话需求，实现对话信息的输出、录入匹配真实人工对话的处理效果，从而提高对话信息处理的智能性，根据历史人机对话信息中被历史用户确定为优秀对话模模式的对话信息计算出第一间隔时长，从而配置竞抢时长关系列表。在进行人机对话的初始，智能人机对话***会向用户输出提示语言，以进行不同业务类型人机对话的分类，例如，核保人机对话分类、产品介绍人机对话分类等，因此，当用户选取人机对话需求后，获取与人机对话需求匹配的历史人机对话信息。其中，人机对话需求即为匹配不同业务类型的对话需求，并且，在用户完成人机对话后，智能人机对话***会记录并反馈用户是否对人机对话内容的满意性标记，从而使用户对此次人机对话的满意程度进行反馈，若反馈为满意，则智能对话***将此次的全部对话内容标记为满意对话模式，以便作为其他人机对话生成第一间隔时长的依据。例如，用户选取核保人机对话分类的对话需求，则获取2个以上的被历史用户标记为满意对话模式的历史核保人机对话信息，并计算2个以上的历史核保人机对话信息中的人机对话间隔时长，即包含历史核保人机对话信息中调整前的人机对话间隔时长，也包括调整后的人机对话间隔时长，计算全部人机对话间隔的平均间隔时长，配置为当前首次进行人机语音对话间隔检测的第一间隔时长。另外，对于根据所述第一间隔时长分别确定各个竞抢状态需调整的目标时长并进行关联映射，得到预置竞抢时长关系列表的具体步骤，与步骤202的方法相同，本发明实施例不在赘述。

进一步的，作为对上述图1所示方法的实现，本发明实施例提供了一种基于人机语音对话的信息处理装置，如图6所示，该装置包括：

第一输出模块51，用于在人机语音对话过程中，解析用户录入的第一对话信息，并在所述第一对话信息录入完成后的第一间隔时长结束后，输出对所述第一对话信息进行反馈的第二对话信息；

确定模块52，用于当输出所述第二对话信息的过程中检测到所述用户录入的第三对话信息时，确定所述第二对话信息为竞抢状态，并执行所述第二对话信息输出的暂停操作；

判断模块53，用于基于预置竞抢时长关系和所述竞抢状态，调整所述第一间隔时长为第二间隔时长，并在所述第三对话信息录入完成后，判断在所述第二间隔时长内是否存在所述用户录入的第四对话信息；

第二输出模块54，用于若判断模块判断在所述第二间隔时长内存在所述用户录入的第四对话信息，则合并所述第三对话信息、所述第四对话信息，并解析合并后的合并对话信息，确定作为语音对话输出的第五对话信息，进行输出。

进一步地，所述装置还包括：解析模块，

进一步地，所述装置还包括：获取模块，计算模块，

进一步地，所述装置还包括：识别模块，

进一步地，

进一步地，所述装置还包括：调整模块，

本发明实施例提供了一种基于人机语音对话的信息处理装置，与现有技术相比，本发明实施例在人机语音对话过程中，解析用户录入的第一对话信息，并在所述第一对话信息录入完成后的第一间隔时长结束后，输出对所述第一对话信息进行反馈的第二对话信息；当输出所述第二对话信息的过程中检测到所述用户录入的第三对话信息时，确定所述第二对话信息为竞抢状态，并执行所述第二对话信息输出的暂停操作；基于预置竞抢时长关系和所述竞抢状态，调整所述第一间隔时长为第二间隔时长，并在所述第三对话信息录入完成后，判断在所述第二间隔时长内是否存在所述用户录入的第四对话信息；若存在，则合并所述第三对话信息、所述第四对话信息，并解析合并后的合并对话信息，确定作为语音对话输出的第五对话信息，进行输出，实现对话信息的自适应性处理，满足对话信息处理的智能性需求，大大减少了对话信息输出不适时的情况，提高对话信息的智能问答准确性，从而提高基于人机语音对话的信息处理效率。

根据本发明一个实施例提供了一种存储介质，所述存储介质存储有至少一可执行指令，该计算机可执行指令可执行上述任意方法实施例中的基于人机语音对话的信息处理方法。

图7示出了根据本发明一个实施例提供的一种计算机设备的结构示意图，本发明具体实施例并不对计算机设备的具体实现做限定。

如图7所示，该计算机设备可以包括：处理器(processor)602、通信接口(Communications Interface)604、存储器(memory)606、以及通信总线608。

其中：处理器602、通信接口604、以及存储器606通过通信总线608完成相互间的通信。

通信接口604，用于与其它设备比如客户端或其它服务器等的网元通信。

处理器602，用于执行程序610，具体可以执行上述基于人机语音对话的信息处理方法实施例中的相关步骤。

具体地，程序610可以包括程序代码，该程序代码包括计算机操作指令。

处理器602可能是中央处理器CPU，或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit)，或者是被配置成实施本发明实施例的一个或多个集成电路。计算机设备包括的一个或多个处理器，可以是同一类型的处理器，如一个或多个CPU；也可以是不同类型的处理器，如一个或多个CPU以及一个或多个ASIC。

存储器606，用于存放程序610。存储器606可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

程序610具体可以用于使得处理器602执行以下操作：

显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包括在本发明的保护范围之内。

Claims

1.一种基于人机语音对话的信息处理方法，其特征在于，包括：

基于预置竞抢时长关系和所述竞抢状态，调整所述第一间隔时长为第二间隔时长，并在所述第三对话信息录入完成后，判断在所述第二间隔时长内是否存在所述用户录入的第四对话信息，所述预置竞抢时长关系用于表征不同竞抢状态与不同对话间隔时长之间所对应调整间隔时长的长短的关系；

若存在，则合并所述第三对话信息、所述第四对话信息，并解析合并后的合并对话信息，确定作为语音对话输出的第五对话信息，进行输出；

其中，在所述解析用户录入的第一对话信息之前，还包括：

根据所述第一间隔时长分别确定各个竞抢状态需调整的目标时长并进行关联映射，得到预置竞抢时长关系列表；

所述基于预置竞抢时长关系和所述竞抢状态，调整所述第一间隔时长为第二间隔时长包括：

2.根据权利要求1所述的方法，其特征在于，在所述解析用户录入的第一对话信息之前，还包括：

当用户选取人机对话需求后，获取与所述人机对话需求匹配的至少两个历史人机对话信息，所述历史人机对话信息为被历史用户标记为满意对话模式的对话信息；

3.根据权利要求1所述的方法，其特征在于，所述确定所述第二对话信息为竞抢状态，并执行所述第二对话信息输出的暂停操作之前，所述方法还包括：

4.根据权利要求1所述的方法，其特征在于，所述合并所述第三对话信息、所述第四对话信息之前，所述方法还包括：

解析所述第三对话信息以及所述第四对话信息的语义；

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

若不存在，则根据预设缩短规则缩短所述第二间隔时长。

6.一种基于人机语音对话的信息处理装置，其特征在于，包括：

判断模块，用于基于预置竞抢时长关系和所述竞抢状态，调整所述第一间隔时长为第二间隔时长，并在所述第三对话信息录入完成后，判断在所述第二间隔时长内是否存在所述用户录入的第四对话信息，所述预置竞抢时长关系用于表征不同竞抢状态与不同对话间隔时长之间所对应调整间隔时长的长短的关系；

第二输出模块，用于若判断模块判断在所述第二间隔时长内存在所述用户录入的第四对话信息，则合并所述第三对话信息、所述第四对话信息，并解析合并后的合并对话信息，确定作为语音对话输出的第五对话信息，进行输出；

其中，所述装置还包括：解析模块，

所述确定模块，还用于根据所述第一间隔时长分别确定各个竞抢状态需调整的目标时长并进行关联映射，得到预置竞抢时长关系列表；

所述判断模块包括：

7.一种存储介质，所述存储介质中存储有至少一可执行指令，所述可执行指令使处理器执行如权利要求1-5中任一项所述的基于人机语音对话的信息处理方法对应的操作。

8.一种计算机设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如权利要求1-5中任一项所述的基于人机语音对话的信息处理方法对应的操作。