CN114999610A

CN114999610A - 基于深度学习的情绪感知与支持的对话***构建方法

Info

Publication number: CN114999610A
Application number: CN202210332004.4A
Authority: CN
Inventors: 杨燕; 谭振东; 孙宇翔; 张雨时; 陈妍; 贺樑
Original assignee: East China Normal University
Current assignee: East China Normal University
Priority date: 2022-03-31
Filing date: 2022-03-31
Publication date: 2022-09-02

Abstract

本发明公开了一种基于深度学习的情绪感知与支持的对话***构建方法，该方法包括构建对话策略选择模块、对话生成模块、心理状态认知模块和建议推荐模块。对话策略选择模块控制对话的过程，根据用户对话历史实时的选择对话策略；对话生成模块将用户对话历史、当前对话策略信息输入到解码器中，通过解码器生成回复语句；心理状态认知模块通过用户对话历史，对用户当前的心理认知状态进行分类；建议推荐模块根据用户心理认知状态以及对话历史，对知识库进行检索生成建议回复。该***通过引入自适应对话策略选择模块，构建了多种对话策略，并能够根据上下文选择对话策略，引导模型生成更具有同理心的回复内容，给予用户更加有效的情感支持。

Description

基于深度学习的情绪感知与支持的对话***构建方法

技术领域

本发明涉及对话推荐***技术领域，具体来说是通过对话历史，确定用户的心理认知情况并选择合适的对话策略，来生成更富有同理心的回复，以及从问答建议知识库中推荐最为合适的答案反馈给用户的一种基于深度学习的情绪感知与支持的对话***构建方法。

背景技术

对话***因其较高的商业价值而收到商业届以及学术届的广泛关注，近年来得益于网络数据的海量增长以及深度学习的发展，对话***也得到了更进一步的发展。

在疫情全球蔓延的背景下，近年来出现焦虑或抑郁等心理疾病的人数，远高于19年之前。但是心理咨询的昂贵收费、专业的心理咨询师紧缺等原因，导致很多人不能及时的治疗心理疾病。通过人工智能与心理结合，可以在一定程度上缓解心理健康资源的有限性与心理疾病患者需求的无限性之间的矛盾。人工智能研究至今，在深度学习、自然语言处理、情绪识别、计算机视觉等方面都有极大的进展，在对话***领域，尤其是智能问答和智能客服方面，已有广泛的应用。与此同时，以人工智能为核心技术的心理咨询***逐渐进入人们的视野，实验证明，结合了人工智能的心理咨询机器人能够在交互过程中感知用户的心理状态，一定程度上纾解用户的心理压力。

发明内容

本发明的目的是针对现有的对话***情感支持过程固定的问题，提出了一种基于深度学习的情绪感知与支持的对话***构建方法，该方法在助人技术理论指导下，构建了多种对话策略，并能够根据上下文、用户画像与当前情绪自适应选择对话策略，引导***生成更具有同理心的回复内容，给予用户更加有效的情感支持。

实现本发明目的的具体技术方案是：

一种基于深度学习的情绪感知与支持的对话***构建方法，该方法包括如下步骤：

该方法包括如下步骤：

1)建立对话策略选择模块

对话策略选择模块通过对话上下文历史动态的选择对话策略，训练对话策略选择模块的对话策略选择模型，需要应用到对话数据集，数据集中要求有多轮的对话历史，标注出用户心理认知状态类型,如是“拖延症”、“职业烦恼”、“学校霸凌”、“酗酒”、“抑郁症”、“学业压力”、“外表焦虑”、“睡眠问题”、“家庭冲突”、“友谊烦恼”、“爱情烦恼”、“家庭烦恼”、“成长烦恼”13种心理认知状态类型，并且每轮对话中都需标注出该轮对话中回复时所使用的对话策略；在该对话***中共设定“提问”、“情感反映”、“自我表露”、“肯定与安慰”、“给予建议”及“其他”6种对话策略；

对所述的对话数据集，设给定的对话上下文历史为{u₁,r₁,u₂,r₂,...,u_m,r_m}，其中i表示对话轮次，u_i表示第i轮对话中的用户的语句，r_i表示第i轮对话对中***回复的语句，给定对话策略{S₁,S₂,...,,S_m}，给定用户心理认知状态O，给定当前的对话轮次i的条件下，选择最近的两轮对话作为用户当前对话历史，设为U＝{u_i-2,r_i-2,u_i-1,r_i-1,u_i}，不足两轮时则选择第1轮对话到当前轮次用户语句；

对当前对话历史U，按照对话历史顺序依次进行拼接，并通过独立标签[SEP]将不同的对话进行分隔，并在拼接的序列前添加标签[CLS]，序列最后添加标签[SEP]，得到拼接序列U_cat＝[CLS]u_i-2[SEP]r_i-2[SEP]u_i-1[SEP]r_i-1[SEP]u_i[SEP]；将拼接序列U_cat作为输入，通过预训练好的TransformerEncoder模型对拼接序列U_cat进行编码，得到TransformerEncoder模型输出的编码序列

具体过程如下：

U_E＝Embedding(U_cat)

Encoder(U_E)＝Add&Norm(MultiHead(U_E,U_E,U_E))

Add&Norm(x)＝LayerNorm[FFN(x)+x]

FFN(x)＝Relu(xW₁+b₁)W₂+b₂

MultiHead(Q,K,V)＝LayerNorm(Concat(head₁,…head_h)W^O+Q)

Embedding函数的功能是将输入序列转换成连续的嵌入矩阵，其中K^T表示矩阵K的转置矩阵，d_k是一个常数，大小取决于计算时矩阵Q的列数；W_i ^Q、

是Attention 模块可学习的参数矩阵，每种共有h个，h为Attention模块数量，W_i ^Q、

的下标i表示第i个Attention模块，上标Q、K、V表示分别对应矩阵是Q、K、V，W^O是MultiHead 模块中一个可学习的参数矩阵，LayerNorm表示层归一化函数；W₁、b₁，W₂、b₂则分别表示两层前馈神经网络(Feed Forward Neural Networks，FFN)的可学习参数矩阵，选择 Relu作为激活函数；

得到编码序列

后，根据拼接序列U_cat中标签[CLS]的位置P_CLS，取编码序列

的第P_CLS位置的向量表示，作为当前历史对话的特征表示，记为

再将

输入到两层FFN和Softmax 层进行分类，得到对话策略为

i表示当前的对话轮次：

最后训练对话策略选择模块的损失计算函数为多分类的交叉熵损失函数：

其中i表示当前对话轮次，

表示对话策略的总数量，

表示第i轮对话中，预测第j种策略的得分，

是第i轮对话的第j种策略的真实标签，正样本标签为1，负样本标签为0；

在所述的对话数据集中共定义6种对话策略为，分别是“提问”、“情感反映”、“自我表露”、“肯定与安慰”、“给予建议”及“其他”；在对话策略

预测为“提问”、“情感反映”、“自我表露”、“肯定与安慰”或“其他”时，转入对话生成模块给予回复，若对话策略

预测为“给予建议”，则转入心理状态认知模块预测用户心理认知类型，并通过用户心理认知类型引导建议推荐模块进行回复；

2)建立对话生成模块

对话生成模块通过对话上下文历史和对话策略

引导生成回复。将最近的两轮对话作为对话历史与对话策略

进行拼接，设为

输入到预训练好的 Transformer Decoder中，将Decoder每一步结果进行输出，得到完整的回复Response；

US_E＝Embedding(U_cat)

Response＝Decoder(US_E)

Decoder(US_E)＝Add&Norm(MaskedMultiHead(US_E,US_E,US_E))

MaskedMultiHead(Q,K,V)＝LayerNorm(Concat(head₁,…head_h)W^o+Q)

MaskedMultiHead和MultiHead区别在于，计算Attention时，为确保对位置i的预测只能依赖于小于i位置的已知输出，所以把大于等于i位置的序列进行Mask操作，其中运算符⊙表示矩阵的对应位置相乘，Mask是一个幂零矩阵，主对角线上全为1；最后训练对话生成模块的损失计算函数为：

其中T_r表示真实回复r_i的长度，i表示当前对话轮次，

表示第i轮对话中，真实回复r_i的第j个回复字符，r_i ^1:j-1表示第i轮对话中，真实回复r_i的第1个字符到第j-1个回复字符序列； 3)建立心理状态认知模块

心理状态认知模块通过用户对话历史帮助预测用户的心理认知情况，以引导建议推荐模块选择建议，并能减少知识库的检索范围，提高检索速度。对当前所有用户对话历史进行拼接，设为U_cur＝[CLS]u_i[SEP]r_i-1[SEP]u_i-1[SEP]...[SEP]u₁[SEP]r₁[SEP]，其中i表示当前对话轮次，若拼接某对话轮次j的对话u_j和回复r_j后会导致序列U_cur长度超过512，则省略该轮次j的对话历史，且轮次j前的对话历史也都省略不做拼接，将U_cur输入到预训练好的Transformer Encoder中得到句级别特征表示，并通过FFN和Softmax层进行分类：

得到编码序列

后，根据拼接序列U_cur中标签[CLS]的位置P_CLS，取编码序列

的第P_CLS位置的向量表示，作为当前所有用户对话历史的特征表示，记为

再将

输入到两层FFN 和Softmax层中分类，预测得到用户当前的心理认知类型

最后训练心理状态认知模块的损失计算函数为多分类的交叉熵损失函数：

其中

表示心理认知状态类型的总数量，

表示预测第j种心理认知状态类型的得分，O_j表示第j种心理认知状态类型的真实标签，正样本标签为1，负样本标签为0；

4)建立建议推荐模块

建议推荐模块通过预测得到的用户心理认知状态

对心理问答建议知识库进行筛选，选择相关的候选建议，并通过对话上下文历史对候选建议进行打分，选择最高得分的建议进行回复。

建立建议推荐模块，需要使用问答建议知识库，问答建议知识库要求满足：问答建议知识库要求对于每一个问题，要求有多个回复，并且针对每个回复有一个得分，每一个问答对要标注该问题的用户心理认知状态类型。

将当前轮次对话中用户的语句作为关键句，即当前对话轮次j下的u_j，并通过预训练语言模型转化为句向量，设为U_key，同样也将问答建议知识库中的所有问题，通过预训练语言模型转化为向量表示；知识库为心理问答建议知识库，知识库中的原始数据来自于患者和心理咨询师的问答数据，并通过心理团队筛选，构成的一个心理问答建议知识库，知识库要求对于患者提出的一个问题，要求有多个回复；

在获取到用户的对话向量U_key和在心理认知模块预测得到的心理认知类型

后，首先通过心理认知类型

对问答建议知识库的中问题进行筛选，选择相同心理认知类型的问题，并通过 Annoy工具对筛选问题的向量表示进行相似度匹配，选取最相似的10个问题，并将这些问题下的所有回复，记为候选回复集A，将候选回复集A中所有的候选回复A_i分别与关键句u_j进行拼接，即[u_j；A_i]＝[CLS]u_j[SEP]A_i[SEP]，最后将所有拼接后的句子分别输入到由Transformer Encoder和Sigmoid函数构成的打分模型Score中进行打分评判，并回复用户得分最高的候选回复A_i；

Score_i＝Score(A_i)

Score(A_i)＝Sigmoid(Encoder[u_j；A_i])

其中

表示问答建议知识库，A表示利用Annoy工具检索出在问答建议知识库

中与关键句U_key最相关的10个问题下的所有推荐回复；Score_i表示候选回复A_i与U_key的得分，A_best表示得分最高的候选回复；

训练由Transformer Encoder和Sigmoid函数构成的打分模型Score，要对问答建议知识库的数据做预处理：首先对于问答建议知识库中的每一个问题语句Query的所有N条回复记为推荐回复R_pos，同时从其他问题的回复中随机不重复的选取N条回复记为不推荐回复R_neg，推荐回复R_pos和不推荐回复R_neg组成回复集记为R，然后再分别将问题语句和回复集R中所有的回复进行拼接，记为UR_i＝[CLS]Query [SEP]R_i [SEP]，R_i表示R中的第i条回复，当拼接的R_i属于推荐回复R_pos，设为正样本，记标签y＝1，当拼接为不推荐回复R_neg，设为负样本，记标签y＝0；

Score_i＝Score(UR_i)

Score(UR_i)＝Sigmoid(Encoder[Query；UR_i])

最后训练打分模型的损失计算函数为二分类交叉熵损失：

当前全球共同面临着大量精神健康问题人群与稀缺的心理咨询专业人士之间的矛盾，因此，积极推进人工智能参与帮助缓解心理问题是国内外共同关注的热点。相比于心理咨询师，心理咨询***具有以下特点：其一，它收费低，甚至是免费的；其二，咨询者更容易对“机器”放下心防，便于建立信任；其三，它能够以app的形式存在，真正做到随时随地一对一交互，能够在一定时间内，为大量的用户提供可以接触到有效的心理咨询。

心理咨询***可以在多种场景下发挥作用。比如教育场景中，可以在课外帮助学生疏导情绪，缓解学习和考试压力；面对职场，可以定期帮助职工缓解工作压力；在老年照护中心，可以进行情绪支持、提供陪伴；还可以在医院帮助病人减轻对疾病的焦虑。心理咨询***的应用场景多样，不仅能丰富使用者的日常生活，治愈心灵，有效改善心理健康，还能节省护理资源，减轻照顾者负担，且不受照顾者文化差异影响。未来，心理咨询***将致力于将高新的人工智能技术与权威的心理学者联合，探索创新服务模式和工作方式，让心理学理论知识与实践相结合，健全社会心理服务网络。这样能够有利于社会心理服务体系的建设，有利于民众日常心理测试和心理疏导，有利于社会民众健康心态意识的建立。

本发明旨在缓解心理咨询需求巨大与心理医生稀缺的矛盾，在情感计算理论、助人技术理论的指导下，研发出基于深度学习的情绪感知与支持对话***，利用人工智能来提供心理咨询，为需要的用户推荐相适应的心理问题解决方案，提供有效、便捷、费用低廉的情感支持。本发明的具体特色如下：

1)针对现有对话***情感支持过程固定的问题，该项目在助人技术理论指导下，构建了多种对话策略，并能够根据对话上下文自适应选择对话策略，引导对话生成模块生成更具有同理心的回复内容，给予用户更加有效的情感支持。

2)针对现有的心理咨询***在进行建议回复时回复质量往往存在问题，通过检索问答建议知识库，提供高质量的回复。

通过构建上述的***，可以为用户提供富有同理心的情绪感知与支持，有效缓解人们负面情绪的积累，一定程度上使得人们更加重视心理健康。

附图说明

图1为本发明流程图。

具体实施方式

以下结合具体实施例和附图，对本发明做进一步的详细说明。实施本发明的过程、条件、实验方法等，除以下专门提及的内容之外，均为本领域的普遍知识和公知常识，本发明没有特别限制的内容。

参阅图1，本发明主要包括以下步骤：

步骤一：根据用户对话历史，预测当前轮次的对话策略。

基于对话历史的自适应的选择对话策略以引导对话生成模块进行回复生成；

在对话策略选择模块共设定了“提问”、“情感反映”、“自我表露”、“肯定与安慰”、“给予建议”、“其他”6种对话策略。

对当前对话历史U，按照对话历史顺序依次进行拼接，并通过独立标签[SEP]将不同的对话进行分隔，并在拼接的序列前添加标签[CLS]，序列最后添加标签[SEP]，得到拼接序列U_cat＝[CLS]u_i-2[SEP]r_i-2[SEP]u_i-1[SEP]r_i-1[SEP]u_i[SEP]；若拼接序列U_cat长度超过512，则对拼接序列进行截断，截断方式为整句的截断，依次考虑截断最先发生的对话，直到凭借序列长度不超过512；

其中对话策略选择模块中的Transformer Encoder通过中文的ERNIE预训练模型进行初始化。采用预训练加微调的方式训练，对Encoder初始化后，在对话数据集的全量数据上有监督的进行训练；

步骤二：根据步骤一预测的对话策略确定转入对话生成模块还是转入心理状态认知模块：

在对话策略预测为“提问”、“情感反映”、“自我表露”、“肯定与安慰”、“其他”情况下，通过对话生成模块给予用户回复，若对话策略预测为“给予建议”，则转入心理状态认知模块预测用户的心理认知状态。

1)对话生成模块通过用户对话历史和当前对话策略来生成回复内容。将最近的两轮对话作为对话历史与对话策略

进行拼接，设为

其中，采用中文预训练模型Robetra对TransformerDecoder进行初始化；在训练阶段为了提高训练效果，拼接的对话策略为真实的对话策略S_i，在测试阶段则拼接预测的对话策略

同对话策略模块的对拼接序列的截断方式一样，若拼接序列US_cat长度超过512，则对拼接序列进行截断，截断方式为整句的截断，依次考虑截断最先发生的对话，直到凭借序列长度不超过512；

在对话生成模块采用中文预训练模型Robetra对TransformerDecoder初始化后，Decoder的输入中的注意力的mask矩阵，要采用causal mask矩阵，即限定只可看当前点前面的数据，不可看该点之后的数据，从矩阵上看，causalmask类似一个倒三角，下半部分为1，上半部分为0；同时Deocder的输出需要完成生成回复，所以需要在Deocder 后连接一个语言模型头，来完成生成工作。采用预训练加微调的方式训练，对Deocder 初始化后，在对话数据集的全量数据上有监督的进行训练；

2)心理状态认知模块，对当前所有用户对话历史进行拼接，设为 U_cur＝[CLS]u_i[SEP]r_i-1[SEP]u_i-1[SEP]...[SEP]u₁[SEP]r₁[SEP]，i表示当前轮次，若拼接某对话轮次j的对话u_j和回复r_j后会导致序列U_cur长度超过512，则省略该轮次j的对话历史，且轮次j前的对话历史也都省略不做拼接，将U_cur输入到预训练好的Transformer Encoder中得到句级别特征表示，并通过FFN和Softmax层进行分类：

其中，在心理状态认知模块采用中文预训练模型BERT-Large对TransformerEncoder 进行初始化；采用预训练加微调的方式训练，对Encoder初始化后，在对话数据集的全量数据上有监督的进行训练；

3)对用户的心理认知情况进行分类后，进入到建议推荐模块，该模块通过预用户心理认知状态，对问答建议知识库进行筛选选择相关的候选回复，并通过用户的对话历史对候选建议进行打分，以回复得分最高的候选回复。

将当前轮次对话中用户的语句作为关键句，即当前对话轮次j下的u_j，并通过预训练语言模型转化为句向量，设为U_key，同样也将问答建议知识库中的所有问题，通过预训练语言模型转化为向量表示；

后，首先通过心理认知类型

Score_i＝Score(A_i)

Score(A_i)＝Sigmoid(Encoder[u_j；A_i])

其中，

中与关键句U_key最相关的10个问题下的所有推荐回复；Score_i表示候选回复A_i与U_key的得分，A_best表示得分最高的候选回复。

训练由Transformer Encoder和Sigmoid函数构成的打分模型Score，需要对问答建议知识库的数据做预处理：首先对于问答建议知识库中的每一个问题语句Query的所有N条回复记为推荐回复R_pos，同时从其他问题的回复中随机不重复的选取N条回复记为不推荐回复 R_neg，推荐回复R_pos和不推荐回复R_neg组成回复集记为R，然后再分别将问题语句和回复集R 中所有的回复进行拼接，记为UR_i＝[CLS]Query[SEP]R_i[SEP]，R_i表示R中的第i条回复，当拼接的R_i属于推荐回复R_pos，设为正样本，记标签y＝1，当拼接为不推荐回复R_neg，设为负样本，记标签y＝0；采用预训练模型BERT-Large对Transformer Encoder进行初始化，通过预训练加微调的方式训练，对Encoder初始化后，在对话数据集的全量数据上有监督的进行训练；

Score_i＝Score(UR_i)

Score(UR_i)＝Sigmoid(Encoder[Query；UR_i])

最后训练打分模型的损失计算函数为二分类交叉熵损失：

Claims

1.一种基于深度学习的情绪感知与支持的对话***构建方法，其特征在于，该方法包括如下步骤：

1)建立对话策略选择模块

使用对话数据集，对话数据集要满足：每条数据要有多轮的对话历史，且在每轮对话中要标注出该轮对话中回复时所使用的对话策略，并且要标注出用户心理认知状态类型；

对所述的对话数据集，设给定的对话上下文历史为{u₁，r₁，u₂，r₂，...，u_m，r_m}，其中i表示对话轮次，u_i表示第i轮对话中的用户的语句，r_i表示第i轮对话对中***回复的语句，给定对话策略{S₁，S₂，...，S_m}，给定用户心理认知状态O，给定当前的对话轮次i的条件下，选择最近的两轮对话作为用户当前对话历史，设为U＝{u_i-2，r_i-2，u_i-1，r_i-1，u_i}，不足两轮时则选择第1轮对话到当前轮次对话语句；

具体过程如下：

U_E＝Embedding(U_cat)

Encoder(U_E)＝Add&Norm(MultiHead(U_E，U_E，U_E))

Add&Norm(x)＝LayerNorm[FFN(x)+x]

FFN(x)＝Relu(xW₁+b₁)W₂+b₂

MultiHead(Q，K，V)＝LayerNorm(Concat(head₁，...head_h)W^O+Q)

head_i＝Attention(QW_i ^Q，KW_i ^K，VW_i ^V)

Embedding函数的功能是将输入序列转换成连续的嵌入矩阵，其中K^T表示矩阵K的转置矩阵，d_k是一个常数，大小取决于计算时矩阵Q的列数；W_i ^Q、W_i ^K、W_i ^V是Attention模块可学习的参数矩阵，每种共有h个，h为Attention模块数量，W_i ^Q、W_i ^K、W_i ^V的下标i表示第i个Attention模块，上标Q、K、V表示分别对应矩阵是Q、K、V，W^O是MultiHead模块中一个可学习的参数矩阵，LayerNorm表示层归一化函数；W₁、b₁，W₂、b₂则分别表示两层前馈神经网络(Feed Forward Neural Networks，FFN)的可学习参数矩阵，选择Relu作为激活函数；

得到编码序列

后，根据拼接序列U_cat中标签[CLS]的位置P_CLS，取编码序列

再将

输入到两层FFN和Softmax层进行分类，得到对话策略为

i表示当前的对话轮次：

其中i表示当前对话轮次，

表示对话策略的总数量，

表示第i轮对话中，预测第j种策略的得分，

在所述的对话数据集中共定义6种对话策略，分别是“提问”、“情感反映”、“自我表露”、“肯定与安慰”、“给予建议”及“其他”；在对话策略

2)建立对话生成模块

将最近的两轮对话作为对话历史与对话策略

进行拼接，设为

输入到预训练好的Transformer Decoder中，将Decoder每一步结果进行输出，得到完整的回复Response；

US_E＝Embedding(U_cat)

Response＝Decoder(US_E)

Decoder(US_E)＝Add&Norm(MaskedMultiHead(US_E，US_E，US_E))

MaskedMultiHead(Q，K，V)＝LayerNorm(Concat(head₁，，...head_h)W^O+Q)

head_i＝MaskedAttention(QW_i ^Q，KW_i ^K，VW_i ^V)

MaskedMultiHead和MultiHead区别在于，计算Attention时，为确保对位置i的预测只能依赖于小于i位置的已知输出，所以把大于等于i位置的序列进行Mask操作，其中运算符⊙表示矩阵的对应位置相乘，Mask是一个幂零矩阵，主对角线上全为1；

最后训练对话生成模块的损失计算函数为：

其中T_r表示真实回复r_i的长度，i表示当前对话轮次，r_i ^j表示第i轮对话中，真实回复r_i的第j个回复字符，r_i ^1：j-1表示第i轮对话中，真实回复r_i的第1个字符到第j-1个回复字符序列；

3)建立心理状态认知模块

对当前所有用户对话历史进行拼接，设为U_cur＝[CLS]u_i[SEP]r_i-1[SEP]u_i-1[SEP]...[SEP]u₁[SEP]r₁[SEP]，i表示当前轮次，若拼接某对话轮次j的对话u_j和回复r_j后会导致序列U_cur长度超过512，则省略该轮次j的对话历史，且轮次j前的对话历史也都省略不做拼接，将U_cur输入到预训练好的Transformer Encoder中得到句级别特征表示，并通过FFN和Softmax层进行分类：

得到编码序列

后，根据拼接序列U_cur中标签[CLS]的位置P_CLS，取编码序列

再将

输入到两层FFN和Softmax层中分类，预测得到用户当前的心理认知类型

其中

表示心理认知状态类型的总数量，

4)建立建议推荐模块

使用问答建议知识库，问答建议知识库要满足：问答建议知识库中每一个问题，有多个回复，每一个问答对要标注该问题的用户心理认知状态类型；

后，首先通过心理认知类型

对问答建议知识库中的问题进行筛选，选择相同心理认知类型的问题，并通过Annoy工具对筛选问题的向量表示进行相似度匹配，选取最相似的10个问题，并将这些问题下的所有回复，记为候选回复集A，将候选回复集A中所有的候选回复A_i分别与关键句u_j进行拼接，即[u_j；A_i]＝[CLS]u_j[SEP]A_i[SEP]，最后将所有拼接后的句子分别输入到由Transformer Encoder和Sigmoid函数构成的打分模型Score中进行打分评判，并回复用户得分最高的候选回复A_i；

Score_i＝Score(A_i)

Score(A_i)＝Sigmoid(Encoder[u_j；A_i])

其中

训练由Transformer Encoder和Sigmoid函数构成的打分模型Score，要对问答建议知识库的数据做预处理：首先对于问答建议知识库中的每一个问题语句Query的所有N条回复记为推荐回复R_pos，同时从其他问题的回复中随机不重复的选取N条回复记为不推荐回复R_neg，推荐回复R_pos和不推荐回复R_neg组成回复集记为R，然后再分别将问题语句和回复集R中所有的回复进行拼接，记为UR_i＝[CLS]Query[SEP]R_i[SEP]，R_i表示R中的第i条回复，当拼接的R_i属于推荐回复R_pos，设为正样本，记标签y＝1，当拼接为不推荐回复R_neg，设为负样本，记标签y＝0；

Score_i＝Score(UR_i)

Score(UR_i)＝Sigmoid(Encoder[Query；UR_i])

最后训练打分模型的损失计算函数为二分类交叉熵损失：