CN111191034A

CN111191034A - 人机交互方法、相关设备及可读存储介质

Info

Publication number: CN111191034A
Application number: CN201911392035.3A
Authority: CN
Inventors: 毛晨思
Original assignee: iFlytek Co Ltd
Current assignee: iFlytek Co Ltd
Priority date: 2019-12-30
Filing date: 2019-12-30
Publication date: 2020-05-22
Anticipated expiration: 2039-12-30
Also published as: CN111191034B

Abstract

本申请公开了一种人机交互方法、相关设备及可读存储介质，在人机交互***中配置了与每个主题对应的主题表征，由于每个主题中包含多个问题，主题的数量远远小于问题的数量，当需要进行人机交互时，确定用户输入问题与各个主题的相似度所花费的时间，远远小于确定用户输入问题与各个问题的相似度所花费的时间，因此，能够提高人机交互***的响应效率。

Description

人机交互方法、相关设备及可读存储介质

技术领域

本申请涉及自然语言处理技术领域，更具体的说，是涉及一种人机交互方法、相关设备及可读存储介质。

背景技术

随着人机交互技术的迅速发展，越来越多的人机交互***得到了广泛应用。目前常用的人机交互***是基于检索式对用户请求进行响应的，在这类人机交互***中，通常存储了问题库，问题库中存储有所有问题的特征向量。当基于该类人机交互***进行人机交互时，用户输入一个问题之后，该类人机交互***将确定该问题的特征向量，并将该问题的特征向量与问题库中所有问题的特征向量进行相似度计算，将相似度高的问题对应的答案作为对该问题的响应。

但是，问题库中问题的数量庞大，将该问题的特征向量与问题库中所有问题的特征向量进行相似度计算，会导致响应效率低下。

因此，需要一种优化的人机交互方法，以提升基于检索式的人机交互***的响应效率。

发明内容

鉴于上述问题，提出了本申请以便提供一种人机交互方法、相关设备及可读存储介质。具体方案如下：

一种人机交互方法，包括：

获取用户输入问题；

基于配置的与每个主题对应的主题表征，确定与所述用户输入问题匹配的目标主题；任一主题对应的主题表征由该主题下的问题集的句子层次的表征和词语层次的表征所确定；

基于所述目标主题的答案对所述用户输入问题进行响应。

优选地，基于配置的与每个主题对应的主题表征，确定与所述用户输入问题匹配的目标主题，包括：

基于配置的与每个主题对应的主题表征，确定所述用户输入问题与每个主题的相似度；

根据所述用户输入问题与每个主题的相似度，从各个主题中确定与所述用户输入问题匹配的目标主题。

优选地，所述基于配置的与每个主题对应的主题表征，确定所述用户输入问题与每个主题的相似度，包括：

确定所述用户输入问题的问题表征；

针对每一主题，计算所述问题表征与该主题对应的主题表征的相似度，作为所述用户输入问题与该主题的相似度。

优选地，还包括：

在确定需要对待更新主题对应的主题表征进行更新时，获取所述待更新主题的新增问题；

将所述新增问题存储至待更新主题下的问题集中，得到待更新主题下的新问题集；

确定所述新问题集的句子层次的表征和词语层次的表征，并据此确定所述待更新主题的更新后的主题表征。

优选地，任一主题的主题表征是采用如下方式确定的：

确定该主题下的问题集及所述问题集的关键词；

确定所述问题集的句子层次的表征；

基于所述关键词，确定所述问题集的词语层次的表征；

基于所述句子层次的表征和所述词语层次的表征，确定该主题的主题表征。

优选地，确定主题下的问题集，包括：

获取所述主题下的所有问题；

基于所述主题下的所有问题，确定所述主题下的问题集。

优选地，确定问题集的句子层次和词语层次的表征，并基于此确定主题的主题表征的过程，包括：

利用主题表征模型处理所述主题下的问题集及所述问题集的关键词，得到主题表征模型输出的所述主题的主题表征；

所述主题表征模型具备，确定所述问题集的句子层次的表征；基于所述关键词，确定所述问题集的词语层次的表征；基于所述句子层次的表征和所述词语层次的表征，确定所述主题的主题表征的能力。

优选地，所述利用主题表征模型处理所述主题下的问题集及所述问题集的关键词，得到主题表征模型输出的所述主题的主题表征，包括：

利用主题表征模型的句子层次处理模块，对所述主题下的问题集中问题的表征基于注意力机制进行筛选，得到所述问题集的句子层次的表征；

利用主题表征模型的词语层次处理模块，基于所述问题集的各关键词及每一关键词为所述主题贡献信息的权重，确定所述问题集的词语层次的表征；

利用主题表征模型的融合模块，将所述问题集的句子层次的表征和所述问题集的词语层次的表征进行融合，得到所述主题的主题表征。

优选地，主题表征模型的句子层次处理模块处理所述主题下的问题集，得到所述问题集的句子层次的表征的方式如下：

获取所述问题集的初始向量；

基于注意力机制，确定筛选后的每个问题的向量在初始向量上的权值；

基于确定的筛选后的每个问题的向量在初始向量上的权值，对所述初始向量进行加权相加，得到筛选后每个问题的向量表征，作为问题集的句子层次的表征。

优选地，主题表征模型的词语层次处理模块处理所述问题集的关键词，得到所述问题集的词语层次的表征的方式如下：

获取所述关键词的初始向量；

确定所述关键词的权重；

基于所述关键词的权重，对所述关键词的初始向量进行加权处理，得到所述问题集的词语层次的表征。

优选地，利用主题表征模型的融合模块，将所述问题集的句子层次的表征和所述问题集的词语层次的表征进行融合，得到所述主题的主题表征的方式如下：

将所述问题集的词语层次的表征转换为目标向量，所述目标向量与所述问题集的句子层次的表征维度相同；

将所述目标向量与所述问题集的句子层次的表征进行拼接，得到所述主题的主题表征。

一种人机交互装置，包括：

输入问题获取单元，用于获取用户输入问题；

目标主题确定单元，用于基于配置的与每个主题对应的主题表征，确定与所述用户输入问题匹配的目标主题；任一主题对应的主题表征由该主题下的问题集的句子层次的表征和词语层次的表征所确定；

问题响应单元，用于基于所述目标主题的答案对所述用户输入问题进行响应。

优选地，所述目标主题确定单元包括：

相似度确定单元，用于基于配置的与每个主题对应的主题表征，确定所述用户输入问题与每个主题的相似度；

相似度使用单元，用于根据所述用户输入问题与每个主题的相似度，从各个主题中确定与所述用户输入问题匹配的目标主题。

优选地，所述相似度确定单元包括：

输入问题表征确定单元，用于确定所述用户输入问题的问题表征；

问题表征计算单元，用于针对每一主题，计算所述问题表征与该主题对应的主题表征的相似度，作为所述用户输入问题与该主题的相似度。

优选地，还包括：

第一更新单元，用于在确定需要对待更新主题对应的主题表征进行更新时，获取所述待更新主题的新增问题；

第二更新单元，用于将所述新增问题存储至待更新主题下的问题集中，得到待更新主题下的新问题集；

第三更新单元，用于确定所述新问题集的句子层次的表征和词语层次的表征，并据此确定所述待更新主题的更新后的主题表征。

优选地，还包括：主题表征确定单元，用于确定与每个主题对应的主题表征，其中，任一主题的主题表征是采用如下方式确定的：

确定该主题下的问题集及所述问题集的关键词；

确定所述问题集的句子层次的表征；

基于所述关键词，确定所述问题集的词语层次的表征；

优选地，所述主题表征确定单元确定问题集的句子层次和词语层次的表征，并基于此确定主题的主题表征的过程，包括：

优选地，所述主题表征确定单元利用主题表征模型处理所述主题下的问题集及所述问题集的关键词，得到主题表征模型输出的所述主题的主题表征的过程，包括：

优选地，所述主题表征确定单元利用主题表征模型的句子层次处理模块，对所述主题下的问题集中问题的表征基于注意力机制进行筛选，得到所述问题集的句子层次的表征的过程，包括：

获取所述问题集的初始向量；

优选地，所述主题表征确定单元利用主题表征模型的词语层次处理模块，基于所述问题集的各关键词及每一关键词为所述主题贡献信息的权重，确定所述问题集的词语层次的表征的过程，包括：

获取所述关键词的初始向量；

确定所述关键词的权重；

优选地，所述主题表征确定单元利用主题表征模型的融合模块，将所述问题集的句子层次的表征和所述问题集的词语层次的表征进行融合，得到所述主题的主题表征的方式如下：

基于所述问题集的句子层次的表征的维度，将所述问题集的词语层次的表征转换相同维度的向量表示；

将转换后的词语层次的表征与所述问题集的句子层次的表征进行拼接，得到所述主题的主题表征。

一种人机交互设备，包括：存储器和处理器；

所述存储器，用于存储程序；

所述处理器，用于执行所述程序，实现如上所述的人机交互方法的各个步骤。

一种可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时，实现如上所述的人机交互方法的各个步骤。

借由上述技术方案，本申请公开了一种人机交互方法、相关设备及可读存储介质，在人机交互***中配置了与每个主题对应的主题表征，由于每个主题中包含多个问题，主题的数量远远小于问题的数量，当需要进行人机交互时，确定用户输入问题与各个主题的相似度所花费的时间，远远小于确定用户输入问题与各个问题的相似度所花费的时间，因此，能够提高人机交互***的响应效率。

进一步的，问题集的句子层次的表征，能够从句子层次对问题集中的各问题进行表征。而问题集的词语层次的表征，能够从词语层次对问题集中的各问题进行表征。也即，本案同时考虑了句子层次和词语层次的表征，基于此所确定的主题表征能够更加准确的对主题下的问题集进行表征，进而据此确定的与用户输入问题匹配的目标主题更加准确，向用户输出的响应也更加准确。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本申请的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1为本申请实施例提供的人机交互方法的一流程示意图；

图2为本申请实施例示例的一种“肯德基甜筒”主题下的若干问题示意图；

图3为本申请实施例示例的一种主题表征模型训练目标示意图；

图4为本申请实施例的示例的一种主题表征模型架构示意图；

图5为本申请实施例提供的一种人机交互装置结构示意图；

图6为本申请实施例提供的人机交互设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请提供了一种人机交互的方案，该方案可以应用于人机交互设备中，人机交互设备能够接收用户的输入操作，并给出响应。一般性的，该人机交互设备可以是常见的具备输入能力及输出能力的电子设备，如手机、电脑、IPAD以及用于实现与用户互动娱乐的其它电子设备等。

一种可选的适用场景如，用户通过语音、键盘或其它输入方式，向人机交互设备输入问题：“肯德基甜筒味道怎么样”，人机交互设备可以基于本申请提供的方案确定出对该输入问题的响应信息，如确定的响应信息为：“甜筒有草莓，巧克力，香草口味，供您选择”，进而可以通过语音播报、或文字显示等方式输出该响应信息，从而实现人机间的交互。

可以理解的是，人机交互中机器对用户输入问题的响应速率及准确性，是影响人机交互的重要因素，本申请即从提高机器的响应速率及准确性的方向，提供了一种人机交互的方案，接下来通过下述实施例对本申请提供的人机交互方法进行介绍。

结合图1所述，本申请的人机交互方法可以包括如下步骤：

步骤S100、获取用户输入问题。

具体的，根据人机交互设备对用户输入方式的不同支持，本申请可以获取用户不同输入方式下所输入的问题。常见的输入方式如，语音形式、键盘输入、手写输入等。

步骤S110、基于配置的与每个主题对应的主题表征，确定与所述用户输入问题匹配的目标主题。

具体的，对于问题库中存储的大量的问题，本申请可以按照问题所属的主题进行划分，进而可以得到每个主题下的问题集。

可以理解的是，每个主题下的问题集中各问题的主题相同，虽然问题集中各种问题可能会出现表述方式相近或截然不同的情况，但是问题集中各问题的意思却都是相同，都与问题集的主题相对应。

基于此，本申请可以确定每个问题集对应主题的主题表征。该主题表征能够表示对应主题的含义，并且主题表征可以表征问题集中各问题。在此情况下，***可以仅存储每个问题集的主题对应的主题表征，而问题集的数量显然也远远小于问题的数量，也即存储的主题表征的数量，也会远远小于现有技术中存储的各个问题的问题表征的数量，从而大大减小了存储压力。

进一步的，在确定了每个主题对应的主题表征之后，可以基于主题表征从各个主题中确定与用户输入问题匹配的目标主题。显然，本申请仅需要将每个主题的主题表征与用户输入问题进行匹配计算，避免了现有技术需要对用户输入问题与问题库中每个问题进行匹配计算，从而大大降低了计算量，使得机器对用户的响应速率也大大提高。

进一步需要说明的是，本申请中针对任一主题对应的主题表征，可以基于该主题下的问题集的句子层次的表征和词语层次的表征确定。

其中，问题集的句子层次的表征，能够从句子层次对问题集中的各问题进行表征。而问题集的词语层次的表征，能够从词语层次对问题集中的各问题进行表征。也即，本案同时考虑了句子层次和词语层次的表征，基于此所确定的主题表征能够更加准确的对主题下的问题集进行表征，也即主题表征能够包含问题集的多层次的含义。

在此情况下，基于多层次表征所确定的主题表征更加准确，进而据此确定的与用户输入问题匹配的目标主题更加准确。

步骤S120、基于所述目标主题的答案对所述用户输入问题进行响应。

具体的，每个主题对应的响应答案可以是配置好的，在此基础上，本申请可以将目标主题的答案输出，从而完成对用户输入问题的响应。

本申请公开的人机交互方法，在人机交互***中配置了与每个主题对应的主题表征，由于每个主题中包含多个问题，主题的数量远远小于问题的数量，当需要进行人机交互时，确定用户输入问题与各个主题的相似度所花费的时间，远远小于确定用户输入问题与各个问题的相似度所花费的时间，因此，能够提高人机交互***的响应效率。

在本申请的另一个实施例中，对上述步骤S110基于配置的与每个主题对应的主题表征，确定与所述用户输入问题匹配的目标主题的过程进行介绍。

一种可选的实施方式下，确定目标主题的过程可以包括：

S1、基于配置的与每个主题对应的主题表征，确定所述用户输入问题与每个主题的相似度。

具体地，每个主题对应的主题表征能够对主题进行表征，进而可以基于主题表征来确定每个主题与用户输入问题间的相似度，该相似度表示用户输入问题与每一主题的语义相近程度。

可以理解的是，相似度越高，表示用户输入问题与对应的主题的语义越相近。

在进行相似度计算时，可以首先确定用户输入问题的问题表征，进而针对每一主题，计算所述问题表征与该主题对应的主题表征的相似度，作为所述用户输入问题与该主题的相似度。

相似度可以数值形式，则可以通过数值大小来确定相似度大小。此外，相似度还可以是类别形式，如预先将相似度划分为高中低三类，则可以按照相似度类别来确定相似度的大小。

其中，用户输入问题的问题表征可以通过多种方式来确定，如通过对句子语义进行建模的句子语义模型，来确定用户输入问题的问题表征。

S2、根据所述用户输入问题与每个主题的相似度，从各个主题中确定与所述用户输入问题匹配的目标主题。

具体的，上述已经确定了用户输入问题与每个主题的相似度，可以按照相似度大小，选择相似度最高的主题作为用户输入问题匹配的目标主题。或者，可以配置相似度阈值，再相似度超过该阈值的各主题中选择相似度最高的主题作为用户输入问题匹配的目标主题。当然，若不存在相似度超过阈值的主题，则可以认为不存在与用户输入问题相匹配的主题，无法给出用户响应，可以输出提示。

可以理解的是，随着时间的推移，问题是逐步在增加的，显然问题库中不可能覆盖全部的问题，即存在向问题库中添加新问题的情况。

现有技术中，问题库中每个问题对应的问题表征是通过一个统一的句子表征模型来确定的。当有新增问题加入问题库时，需要针对新增问题对句子表征模型进行重新训练更新，并重新确定问题库中每一个问题的问题表征，这会影响人机交互的正确响应，产生不可预知的风险。

而本申请中，对于新增问题，仅需要对该新增问题所属主题下的问题集进行更新，并重新确定该问题集对应的主题表征，该操作的影响范围限制在一个主题对应的问题集下，不会对其它主题的问题集产生影响，从而提高了人机交互的鲁棒性。

接下来，对上述更新过程进行介绍，具体可以包括：

S1、在确定需要对待更新主题对应的主题表征进行更新时，获取所述待更新主题的新增问题。

具体的，在获取到新增问题时，可以先确定新增问题所属的主题，进而将该主题作为待更新主题。

S2、将所述新增问题存储至待更新主题下的问题集中，得到待更新主题下的新问题集。

对于新增问题，可以将其存储至待更新主题下的问题集中，完成对问题集的扩充。

S3、确定所述新问题集的句子层次的表征和词语层次的表征，并据此确定所述待更新主题的更新后的主题表征。

对于完成更新后的新问题集，可以确定该新问题集的句子层次的表征和词语层次的表征，并根据新问题集的句子层次的表征和词语层次的表征来确定待更新主题的更新后的主题表征。

至此，完成对待更新主题的问题集的更新，以及主题表征的更新。

在本申请的又一个实施例中，对上述方案中介绍的主题的主题表征的确定过程进行介绍。

对于任一主题的主题表征，可以通过如下方式来确定：

S1、确定该主题下的问题集及所述问题集的关键词。

其中，主题下的问题集可以是问题库中该主题下的所有问题。除此之外，还可以是从问题库中该主题下的所有问题中选出若干问题组成问题集。

可以理解的是，问题库中属于该主题的问题有多种，这些问题的意思相同但表述可能相近，也可能截然不同。如图2所示，其示例了属于“肯德基甜筒”这一主题的若干条问题。其中，问题“甜筒味道怎么样”和“甜筒味道咋样”二者的表述相近，但和问题“你们家甜筒的味道是不是还不错呀”是两种差别很大的表述。

本申请可以采用随机采样或其它方式，从问题库中该主题下的所有问题中选取M个问题，组成该主题下的问题集。

进一步的，需要确定出该主题下的问题集的关键词，关键词是为当前主题贡献程度较大的一类词，关键词作为一种重要的区分不同主题的信息。

本申请可以采用多种方式来确定问题集的关键词，如通过词频-逆文档频率TF-IDF来表示问题集中各个词的重要程度，选取TF-IDF值最大的topK个词，组成该主题下的问题集的关键词集合。

仍参照图2所示，“肯德基甜筒”这一主题下的关键词可能包含有：“甜筒”、“味道”、“口感”等。

S2、确定所述问题集的句子层次的表征。

具体的，问题集的句子层次的表征，能够从句子层次对问题集中的各问题进行表征。

本步骤中，可以基于问题集包含的各问题，从句子层次确定该问题集的表征，作为问题集的句子层次的表征。

S3、基于所述关键词，确定所述问题集的词语层次的表征。

具体的，问题集的词语层次的表征，能够从词语层次对问题集中的各问题进行表征。

本步骤中，可以基于问题集对应的各关键词，从词语层次确定该问题集的表征，作为问题集的词语层次的表征。

S4、基于所述句子层次的表征和所述词语层次的表征，确定该主题的主题表征。

本案同时考虑了句子层次和词语层次的表征，基于此所确定的主题表征能够更加准确的对主题下的问题集进行表征，也即主题表征能够包含问题集的多层次的含义。

本申请的另一个实施例中，介绍了上述S2-S4：确定问题集的句子层次和词语层次的表征，并据此确定主题表征的过程的一种可选实现方案。

具体的，本实施例中，可以通过神经网络模型的方式来实现上述过程。本申请可以预先训练主题表征模型，该训练后的主题表征模型具备对输入的主题下的问题集及问题集的关键词进行处理，以确定所述问题集的句子层次的表征；并基于所述关键词，确定所述问题集的词语层次的表征；基于所述句子层次的表征和所述词语层次的表征，确定所述主题的主题表征的能力。

主题表征模型训练过程可以使用主题库中每一主题下的问题集及问题集的关键词作为训练数据，训练目标可以包括如下：

模型输出的主题t的主题表征r_t与主题t下的问题集中各问题的问题表征趋近，以及模型输出的主题t的主题表征r_t与非主题t的其它主题下的问题集中各问题的问题表征趋远。

具体的，参照图3示例的主题表征模型的训练目标示意图：

图3中包含每个主题topic_t下(t∈(1，x)，x为主题总个数)有相应的问题q(每个主题下的问题个数总共有M个)。

图3中q_t表示主题t下的各个问题，

表示非主题t下的各个问题。

训练目标即为，主题t的主题表征与主题t下的各个问题的表征相近，与非主题t的其它主题下的各个问题相远。

按照上述训练方式对主题表征模型进行训练参数更新，最终得到训练后的主题表征模型。

进一步的，本申请实施例示例了一种可选的主题表征模型的架构。

参加图4，其示例了一种主题表征模型的架构。

主题表征模型可以包括：句子层次处理模块、词语层次处理模块和融合模块。接下来分别介绍各个模块。

第一、

句子层次处理模块，用于对主题下的问题集中问题的表征基于注意力机制进行筛选，得到问题集的句子层次的表征。

具体的，由于主题下的问题集中包含相同意思但不同表达方式的多种问题，为了获取主题下一些具有代表性的问题，本申请可以通过注意力机制将问题集中各问题的表征通过N组注意力表示，从而得到N个视角的问题表示，即实现对主题下的问题集中的问题的表征基于注意力机制进行筛选，得到问题集的句子层次的表征。

具体实现过程可以包括如下步骤：

S1、获取所述问题集的初始向量。

具体的，定义问题集中包含的问题数量为M，则对于问题集中M个问题确定其问题表征，该问题表征可以是向量形式，则可以得到

其中，h_m表示地m个问题的问题表征向量，d₀为向量的维度。

可以将上述

作为问题集的初始向量。

S2、基于注意力机制，确定筛选后的每个问题的向量在初始向量上的权值。

具体的，可以配置好注意力机制的定值参数N，表示基于注意力机制将M个问题抽取成N个具有代表性的问题，该实现通过将问题集中M个问题的初始向量做N次自注意力变换，即通过如下公式(1)进行映射得到一组未归一化的权值[e_jk]，其中e_jk表示的是经筛选后的第j(1≤j≤N)个问题的向量在原初始向量h_k(1≤k≤M)上未归一化的权值，U_j、W_j、b_j均为模型训练参数。

进一步由如下公式(2)进行权值归一化，得到一组权值向量，表示为[α_jk]_N×M，其中α_jk表示的是经筛选的第j(1≤j≤N)个问题的向量在原初始向量h_k(1≤k≤M)上归一化的权值。

[e_jk]＝U_j*tanh(W_j*H+b_j) (1)

S3、基于确定的筛选后的每个问题的向量在初始向量上的权值，对所述初始向量进行加权相加，得到筛选后每个问题的向量表征，作为问题集的句子层次的表征。

具体的，通过向量的加权获取得到在N个视角的问题表征Q：[q₁,q₂...q_j...,q_N],q_j∈R^1*d，其中q_j表示的为第j个由原问题集中问题的初始向量加权得到的新问题的问题向量，公式如下：

第二、

词语层次处理模块，用于基于问题集的各关键词及每一关键词为主题贡献信息的权重，确定问题集的词语层次的表征。

具体的，词语层次处理模块可以按照如下方式来得到词语层次的表征：

S1、获取所述关键词的初始向量。

关键词的初始向量可以通过随机初始化得到，可表示为[w₁,w₂...w_k...,w_K],w_k∈R^1*l，其中w_k表示关键词k的初始词向量，维度为l维。

S2、确定所述关键词的权重。

前文已经介绍过，在模型训练阶段本申请可以采用多种方式来确定问题集的关键词，如通过词频-逆文档频率TF-IDF来表示问题集中各个词的重要程度，选取TF-IDF值最大的topK个词，组成该主题下的问题集的关键词集合。因此，可以以关键词的TF-IDF值作为关键词的初始权重。也即，在训练阶段利用关键词的TF-IDF值作为权重向量[β_t1,β_t2,...,β_tK]的初始化，用于表示每个关键词为主题t贡献信息的权重。该权重向量[β_t1,β_t2,...,β_tK]在主题表征模型训练阶段不断优化更新，模型训练完毕后确定下最终的权重向量[β_t1,β_t2,...,β_tK]，作为关键词的权重。

S3、基于所述关键词的权重，对所述关键词的初始向量进行加权处理，得到所述问题集的词语层次的表征。

具体的，关键词最终的词向量为初始向量与权重向量[β_t1,β_t2,...,β_tK]的对应相乘，即v_k＝β_tk*w_k。最终得到该主题下问题集的词语层次的表征V：[v₁,v₂...v_k...,v_K],v_k∈R^1*l。

第三、

融合模块，用于将问题集的句子层次的表征和问题集的词语层次的表征进行融合，得到主题的主题表征。

具体的，融合模块可以按照如下方式来得到主题的主题表征：

S1、基于所述问题集的句子层次的表征的维度，将所述问题集的词语层次的表征转换成相同维度的向量表示。

具体的，通过句子层次处理模块可以得到问题集的句子层次的表征Q＝[q₁,q₂,...,q_N]，通过词语层次处理模块可以得到问题集的词语层次的表征V＝[v₁,v₂,...,v_K]。

结合图4所示，为了实现词语层次的表征与句子层次的表征的融合，本申请可以引入一个特征映射层f(V)，即通过矩阵变换将词语层次表征映射成与句子层次表征同纬度的向量。

S2、将转换后的词语层次的表征与所述问题集的句子层次的表征进行拼接，得到所述主题的主题表征。

具体的，经过维度转换，句子层次的表征和词语层次的表征已经在同一维度，因此可以直接将二者进行拼接，得到拼接后的主题表征。

结合图4所示，将Q和f(V)拼接后，可以通过一个全连接层g(·)输出得到主题表征r_t，公式表示如下：

r_t＝g([Q,f(V)]) (4)

需要说明的是，上述S1、基于所述问题集的句子层次的表征的维度，将所述问题集的词语层次的表征转换相同维度的向量表示的过程，可以由融合模块来实现。除此之外，还可以由词语层次处理模块来实现，即词语层次处理模块在得到词语层次的表征之后，可以对其进行维度转换，以转换到与问题集的句子层次的表征相同的维度。在此基础上，融合模块可以直接进行融合，而无需进行维度转换。基于此可知，图4示例的主题表征模型的模块划分方式仅仅是一种可选的方式。

下面对本申请实施例提供的人机交互装置进行描述，下文描述的人机交互装置与上文描述的人机交互方法可相互对应参照。

参见图5，图5为本申请实施例公开的一种人机交互装置结构示意图。

如图5所示，该装置可以包括：

输入问题获取单元11，用于获取用户输入问题；

目标主题确定单元12，用于基于配置的与每个主题对应的主题表征，确定与所述用户输入问题匹配的目标主题；任一主题对应的主题表征由该主题下的问题集的句子层次的表征和词语层次的表征所确定；

问题响应单元13，用于基于所述目标主题的答案对所述用户输入问题进行响应。

进一步的，上述目标主题确定单元可以包括：

进一步的，上述相似度确定单元可以包括：

进一步的，本申请的装置还可以包括：

进一步的，本申请的装置还可以包括：主题表征确定单元，用于确定与每个主题对应的主题表征，其中，任一主题的主题表征是采用如下方式确定的：

确定该主题下的问题集及所述问题集的关键词；

确定所述问题集的句子层次的表征；

基于所述关键词，确定所述问题集的词语层次的表征；

进一步的，上述主题表征确定单元确定问题集的句子层次和词语层次的表征，并基于此确定主题的主题表征的过程，可以包括：

进一步的，上述主题表征确定单元利用主题表征模型处理所述主题下的问题集及所述问题集的关键词，得到主题表征模型输出的所述主题的主题表征的过程，可以包括：

进一步的，上述主题表征确定单元利用主题表征模型的句子层次处理模块，对所述主题下的问题集中问题的表征基于注意力机制进行筛选，得到所述问题集的句子层次的表征的过程，可以包括：

获取所述问题集的初始向量；

进一步的，上述主题表征确定单元利用主题表征模型的词语层次处理模块，基于所述问题集的各关键词及每一关键词为所述主题贡献信息的权重，确定所述问题集的词语层次的表征的过程，可以包括：

获取所述关键词的初始向量；

确定所述关键词的权重；

进一步的，上述主题表征确定单元利用主题表征模型的融合模块，将所述问题集的句子层次的表征和所述问题集的词语层次的表征进行融合，得到所述主题的主题表征的方式可以如下：

本申请实施例提供的人机交互装置可应用于人机交互设备，如手机、电脑等。可选的，图6示出了人机交互设备的硬件结构框图，参照图6，人机交互设备的硬件结构可以包括：至少一个处理器1，至少一个通信接口2，至少一个存储器3和至少一个通信总线4；

在本申请实施例中，处理器1、通信接口2、存储器3、通信总线4的数量为至少一个，且处理器1、通信接口2、存储器3通过通信总线4完成相互间的通信；

处理器1可能是一个中央处理器CPU，或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit)，或者是被配置成实施本发明实施例的一个或多个集成电路等；

存储器3可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatilememory)等，例如至少一个磁盘存储器；

其中，存储器存储有程序，处理器可调用存储器存储的程序，所述程序用于：

获取用户输入问题；

基于所述目标主题的答案对所述用户输入问题进行响应。

可选的，所述程序的细化功能和扩展功能可参照上文描述。

本申请实施例还提供一种可读存储介质，该可读存储介质可存储有适于处理器执行的程序，所述程序用于：

获取用户输入问题；

基于所述目标主题的答案对所述用户输入问题进行响应。

可选的，所述程序的细化功能和扩展功能可参照上文描述。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种人机交互方法，其特征在于，包括：

获取用户输入问题；

基于所述目标主题的答案对所述用户输入问题进行响应。

2.根据权利要求1所述的方法，其特征在于，基于配置的与每个主题对应的主题表征，确定与所述用户输入问题匹配的目标主题，包括：

3.根据权利要求2所述的方法，其特征在于，所述基于配置的与每个主题对应的主题表征，确定所述用户输入问题与每个主题的相似度，包括：

确定所述用户输入问题的问题表征；

4.根据权利要求1所述的方法，其特征在于，还包括：

5.根据权利要求1所述的方法，其特征在于，任一主题的主题表征是采用如下方式确定的：

确定该主题下的问题集及所述问题集的关键词；

确定所述问题集的句子层次的表征；

基于所述关键词，确定所述问题集的词语层次的表征；

6.根据权利要求5所述的方法，其特征在于，确定问题集的句子层次和词语层次的表征，并基于此确定主题的主题表征的过程，包括：

7.根据权利要求6所述的方法，其特征在于，所述利用主题表征模型处理所述主题下的问题集及所述问题集的关键词，得到主题表征模型输出的所述主题的主题表征，包括：

8.根据权利要求6所述的方法，其特征在于，利用主题表征模型的融合模块，将所述问题集的句子层次的表征和所述问题集的词语层次的表征进行融合，得到所述主题的主题表征的方式如下：

基于所述问题集的句子层次的表征的维度，将所述问题集的词语层次的表征转换成相同维度的向量表示；

9.一种人机交互装置，其特征在于，包括：

输入问题获取单元，用于获取用户输入问题；

10.根据权利要求9所述的装置，其特征在于，所述目标主题确定单元包括：

11.根据权利要求9所述的装置，其特征在于，还包括：

12.一种人机交互设备，其特征在于，包括：存储器和处理器；

所述存储器，用于存储程序；

所述处理器，用于执行所述程序，实现如权利要求1～8中任一项所述的人机交互方法的各个步骤。

13.一种可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，实现如权利要求1～8中任一项所述的人机交互方法的各个步骤。