CN117312514A

CN117312514A - 咨询答复方法、装置及计算机可读取存储介质

Info

Publication number: CN117312514A
Application number: CN202311260389.9A
Authority: CN
Inventors: 高宇翔; 高楠
Original assignee: Shanghai Tanshi Health Technology Co ltd
Current assignee: Shanghai Tanshi Health Technology Co ltd
Priority date: 2023-09-26
Filing date: 2023-09-26
Publication date: 2023-12-29

Abstract

本申请提供一种咨询答复方法、装置及计算机可读取存储介质，涉及人工智能技术领域。该方法包括：通过语言模型基于用户提出的问题信息进行答复，得到初始答复信息；通过对齐检测模型提取问题信息中的问题特征和初始答复信息中的初始答复特征；对问题特征和初始答复特征进行对齐检测，得到对齐结果；基于对齐结果对初始答复信息进行调整，得到目标答复信息。本申请通过对用户的问题和语言模型的答复进行对齐检测和调整处理，能够更全面地理解用户的实际情况和需求，有效地提高了答复信息的准确性和有效性，从而提高医疗咨询的准确性和效率，为用户提供相应的建议和帮助，提升用户使用时的满意度。

Description

咨询答复方法、装置及计算机可读取存储介质

技术领域

本申请涉及人工智能技术领域，具体而言，涉及一种咨询答复方法、装置及计算机可读取存储介质。

背景技术

在多种咨询领域中，人工智能***已被广泛应用，如基于规则的***、基于知识图谱的***，或者基于深度学习的***。例如，在医疗咨询领域中，这些***通过对医学知识的学习和模拟医生的判断，以回答病人的咨询问题。

在实际的对话过程中，涉及的问题通常包括病人的主诉、既往病史、情绪状态、生活环境等多个方面。但是，目前的咨询答复方式中，无法进行理解与回复过程的对齐，并且，无法利用分散的信息进行有效整合，导致处理时无法理解病人的真实需求，从而无法提供符合病人需求的答案以供参考，从而导致医疗咨询的效果较差，无法为病人提供有效帮助。

发明内容

有鉴于此，本申请实施例的目的在于提供一种咨询答复方法、装置及计算机可读取存储介质，以改善现有技术中存在的医疗咨询效果较差的问题。

为了解决上述问题，第一方面，本申请实施例提供了一种咨询答复方法，所述方法包括：

通过语言模型基于用户提出的问题信息进行答复，得到初始答复信息；

通过对齐检测模型提取所述问题信息中的问题特征和所述初始答复信息中的初始答复特征；

对所述问题特征和所述初始答复特征进行对齐检测，得到对齐结果；

基于所述对齐结果对所述初始答复信息进行调整，得到目标答复信息。

在上述实现过程中，通过语言模型基于用户提出的问题信息进行作答，以得到相应的初始答复信息，通过对齐检测模型提取问题信息和初始答复信息中的特征信息以进行对齐检测，能够根据对齐结果对初始答复信息进行调整，得到对齐后的目标答复信息。能够更全面地理解用户的实际情况和需求，有效地提高了答复信息的准确性和有效性，从而提高医疗咨询的准确性和效率，为用户提供相应的建议和帮助，提升用户使用时的满意度。

可选地，其中，所述对齐检测模型中包括情绪识别模型和意图分析模型；所述问题特征中包括用户情绪特征和用户意图特征；所述初始答复特征中包括答复情绪特征和答复意图特征；

所述通过对齐检测模型提取所述问题信息中的问题特征和所述初始答复信息中的初始答复特征，包括：

通过所述情绪识别模型提取所述问题信息中的所述用户情绪特征和所述初始答复信息中的所述答复情绪特征；

通过所述意图分析模型提取所述问题信息中的所述用户意图特征和所述初始答复信息中的所述答复意图特征。

在上述实现过程中，在进行对齐检测时，可以设置情绪识别模型和意图分析模型，以从情绪和意图两个方面对问题和答复中的情绪特征和意图特征进行提取。能够通过识别和分析，抽取问题信息和初始答复信息中的关键信息，帮助理解用户的情绪和需求，以从情绪和意图两个方面对用户的问题信息和提供的初始答复信息进行对齐检测处理，有效地提高了对齐检测的全面性和有效性。

可选地，其中，所述情绪识别模型通过以下方式构建：

采集具有情绪标签的第一对话数据集；其中，所述第一对话数据集包括多组历史问题信息和历史答复信息；

基于初始检测模型对所述第一对话数据集进行特征提取和编码处理，得到编码数据；

对所述初始检测模型进行分类层结合处理，得到初始识别模型；

通过所述初始识别模型对所述编码数据进行分类，得到分类结果；

基于所述第一对话数据集和所述分类结果对所述初始识别模型进行迭代训练，得到所述情绪识别模型。

在上述实现过程中，为了提取信息中的特征信息，可以预先构建并训练相应的初始检测模型。为了对情绪进行识别，可以预先采集具有情绪标签的第一对话数据集以作为初始检测模型的数据集进行特征提取和编码处理，得到相应的编码数据，从而在初始检测模型的基础上进行分类层结合处理，构建对应的初始识别模型，并基于初始识别模型对编码数据进行分类，以将编码映射到对应的情绪标签空间中，得到对应的分类结果，并基于第一对话集和分类结果初始识别模型进行迭代训练，得到情绪识别准确性较高的情绪识别模型。能够基于历史数据构建并训练对应的情绪识别模型以提取情绪特征，有效地提高了提取的效率以及情绪特征的准确性和有效性。

可选地，其中，所述意图分析模型通过以下方式构建：

采集具有意图标注的第二对话数据集；其中，所述第二对话数据集包括多组历史问题信息、历史答复信息以及关联的目标知识图谱中的节点；

对所述第二对话数据集进行预处理，得到输入向量；

对初始检测模型进行分类层结合处理，得到初始分析模型；

通过所述初始分析模型对所述输入向量进行分析，得到分析结果；

基于所述第二对话数据集、所述分析结果和构建的目标知识图谱对所述初始分析模型进行训练，得到所述意图分析模型。

在上述实现过程中，为了对情绪进行识别，可以预先采集具有意图标注和知识图谱的第二对话数据集，并对第二对话数据集进行预处理，得到相应的输入向量。为了提取信息中的特征信息，可以预先构建并训练相应的初始检测模型，并对初始检测模型进行分类层结合处理以构建对应的初始分析模型。以输入向量作为初始分析模型的输入数据进行分析处理，得到相应的目标知识图谱中的节点作为对应的分析结果，结合对应的第二对话集、分析结果和构建的目标知识图谱对初始分析模型进行进一步地训练，以得到意图分析相关性较高的意图分析模型。能够基于历史数据构建并训练对应的意图分析模型以提取意图特征，有效地提高了提取的效率以及意图特征的准确性和有效性。

可选地，其中，所述对齐结果包括情绪对齐结果和意图对齐结果；

所述对所述问题特征和所述初始答复特征进行对齐检测，得到对齐结果，包括：

对所述用户情绪特征和所述答复情绪特征进行对齐检测，得到所述情绪对齐结果；

对所述用户意图特征和所述答复意图特征进行对齐检测，得到所述意图对齐结果。

在上述实现过程中，在进行对齐检测时，可以分别针对情绪和意图两种特征进行对齐检测，以分别得到相应的情绪对齐结果和意图对齐结果，有效地提高了对齐检测的全面性和有效性。

可选地，其中，所述目标答复信息包括：更新情绪信息和/或更新意图信息；所述基于所述对齐结果对所述初始答复信息进行调整，得到所述目标答复信息，包括：

若所述用户情绪特征或所述答复情绪特征呈负面趋势，则判定所述情绪对齐结果为不对齐，基于预设的感情提示控制所述语言模型生成所述更新情绪信息；

若所述用户意图特征或所述答复意图特征的相关度超过设定阈值节点，则判定所述意图对齐结果为不对齐，将超出节点添加至所述语言模型中生成所述更新意图信息。

在上述实现过程中，对初始答复信息进行调整时，可以根据情绪对齐结果和/或意图对齐结果的实际情况，对初始答复信息中的情绪内容和/或意图内容进行相应地更新，以得到对应的更新情绪信息和/或更新意图信息，并结合其他内容生成对应的目标答复信息。能够在情绪对齐结果和/或意图对齐结果不对齐的情况下，对初始答复信息进行调整以重新生成情感一致且关联性较强的目标答复信息以满足用户的咨询需求，优化了医疗咨询的效果，有效地提升了用户的满意度。

可选地，所述方法还包括：

若所述用户意图特征、所述答复意图特征或所述更新意图信息包含预先标记的危险标签，则生成人工审核提示信息。

在上述实现过程中，可以对用户意图特征、答复意图特征或更新意图信息中这是否具有预先设置的危险标签进行检测，以在具有表征潜在风险或危害的危险标签情况下，生成对应的人工审核提示信息通知人工进行审核，以提高咨询回复的安全性和合规性。

可选地，所述方法还包括：

对所述问题特征和所述目标答复信息中的更新答复特征进行对齐检测，得到更新对齐结果；

若判定所述更新对齐结果为不对齐，则生成人工答复提示信息。

在上述实现过程中，在获取目标答复信息后，可以继续对目标答复信息中的更新答复特性进行提取，并与问题特征进行对齐检测，得到相应的更新对齐结果，在多次对齐检测和对齐调整后，若更新对齐结果仍为不对齐，则表征自动答复功能不适用目前的用户咨询，能够生成相应的人工答复提示信息，以通知人工针对用户的问题进行答复处理，以针对用户需求提供更加准确、专业的人工回复。

可选地，其中，所述语言模型通过以下方式构建：

基于多种语言任务预训练初始语言模型，得到训练语言模型；

基于咨询场景的咨询需求对所述训练语言模型进行调整，得到所述语言模型。

在上述实现过程中，为了针对用户提出的问题信息进行相应地答复，可以基于多种语言任务预训练初始语言模型，得到训练语言模型，并且，考虑到不同咨询场景中各种术语、知识等特征的差异，可以根据咨询场景确定对应的咨询需求，并基于咨询需求对训练语言模型进行相应地调整，以得到具备理解场景术语和场景对话能力的语言模型。能够对初始语言模型进行预训练，并根据场景对模型进行调整，有效地优化了语言模型的答复效果，从而提高了初始答复信息的有效性和准确性。

第二方面，本申请实施例还提供了一种咨询答复装置，所述装置包括：答复模块、特征提取模块、对齐模块和调整模块；

所述答复模块用于通过语言模型基于用户提出的问题信息进行答复，得到初始答复信息；

所述特征提取模块用于通过对齐检测模型提取所述问题信息中的问题特征和所述初始答复信息中的初始答复特征；

所述对齐模块用于对所述问题特征和所述初始答复特征进行对齐检测，得到对齐结果；

所述调整模块用于基于所述对齐结果对所述初始答复信息进行调整，得到目标答复信息。

在上述实现过程中，通过答复模块使用语言模型基于用户提出的问题信息进行作答，以得到相应的初始答复信息，通过特征提取模型使用对齐检测模型提取问题信息和初始答复信息中的特征信息，通过对齐模块基于二者的特征信息进行对齐检测，以得到相应的对齐结果，通过调整模块基于对齐结果的实际情况对初始答复信息进行调整，得到对齐后的目标答复信息。

第三方面，本申请实施例还提供了一种计算机可读取存储介质，所述可读取存储介质中存储有计算机程序指令，所述计算机程序指令被一处理器读取并运行时，执行上述咨询答复方法中任一实现方式中的步骤。

综上所述，本申请实施例提供了一种咨询答复方法、装置及计算机可读取存储介质，通过对用户的问题和语言模型的答复进行对齐检测和调整处理，能够更全面地理解用户的实际情况和需求，有效地提高了答复信息的准确性和有效性，从而提高医疗咨询的准确性和效率，为用户提供相应的建议和帮助，提升用户使用时的满意度。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的一种电子设备的方框示意图；

图2为本申请实施例提供的一种咨询答复方法的流程示意图；

图3为本申请实施例提供的一种步骤S300的详细流程示意图；

图4为本申请实施例提供的一种步骤S400的详细流程示意图；

图5为本申请实施例提供的一种步骤S500的详细流程示意图；

图6为本申请实施例提供的一种咨询答复装置的结构示意图。

图标：100-电子设备；111-存储器；112-存储控制器；113-处理器；114-外设接口；115-输入输出单元；116-显示单元；600-咨询答复装置；610-答复模块；620-特征提取模块；630-对齐模块；640-调整模块。

具体实施方式

下面将结合本申请实施例中附图，对本申请实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例仅仅是本申请实施例的一部分实施例，而不是全部的实施例。基于本申请实施例的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请实施例保护的范围。

在医疗咨询领域中，通常会使用人工智能***与用户进行对话，以回答用户的咨询问题。在实际的对话过程中，涉及的问题通常包括病人的主诉、既往病史、情绪状态、生活环境等多个方面的内容。但是，目前的咨询答复方式中，无法进行理解与回复过程的对齐，例如，当病人情绪激动时，人工智能***可能仍然给出冷冰冰的医学回复，或者当病人表述含混时，人工智能可能没有能力准确理解其真实需求，从而导致回复的失误；并且，通常只能基于单次对话进行处理，无法利用分散的信息进行有效整合，例如，病人在对话中可能会逐步提供自己的病史信息，但目前的人工智能***无法对这些分散的信息进行有效整合，导致处理时无法理解病人的真实需求，从而无法提供符合病人需求的答案以供参考，从而导致医疗咨询的效果较差，无法为病人提供有效帮助。

为了解决上述问题，本申请实施例提供了一种咨询答复方法，应用于电子设备，电子设备可以为服务器、个人电脑(Personal Computer，PC)、平板电脑、智能手机、个人数字助理(Personal Digital Assistant，PDA)等具有逻辑计算功能的电子设备，能够与用户交互获取用户的问题信息，并基于问题信息提供准确、有效的答复信息以供用户参考。

可选地，请参阅图1，图1为本申请实施例提供的一种电子设备的方框示意图。电子设备100可以包括存储器111、存储控制器112、处理器113、外设接口114、输入输出单元115、显示单元116。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对电子设备100的结构造成限定。例如，电子设备100还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

上述的存储器111、存储控制器112、处理器113、外设接口114、输入输出单元115及显示单元116各元件相互之间直接或间接地电性连接，以实现数据的传输或交互。例如，这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。上述的处理器113用于执行存储器中存储的可执行模块。

其中，存储器111可以是，但不限于，随机存取存储器(Random Access Memory，简称RAM)，只读存储器(Read Only Memory，简称ROM)，可编程只读存储器(ProgrammableRead-Only Memory，简称PROM)，可擦除只读存储器(Erasable Programmable Read-OnlyMemory，简称EPROM)，电可擦除只读存储器(Electric Erasable Programmable Read-OnlyMemory，简称EEPROM)等。其中，存储器111用于存储程序，处理器113在接收到执行指令后，执行程序，本申请实施例任一实施例揭示的过程定义的电子设备100所执行的方法可以应用于处理器113中，或者由处理器113实现。

上述的处理器113可能是一种集成电路芯片，具有信号的处理能力。上述的处理器113可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(digital signalprocessor，简称DSP)、专用集成电路(Application Specific Integrated Circuit，简称ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器，也可以是任何常规的处理器等。

上述的外设接口114将各种输入/输出装置耦合至处理器113以及存储器111。在一些实施例中，外设接口114，处理器113以及存储控制器112可以在单个芯片中实现。在其他一些实例中，他们可以分别由独立的芯片实现。

上述的输入输出单元115用于提供给用户输入数据。输入输出单元115可以是，但不限于，鼠标和键盘等。

上述的显示单元116在电子设备100与用户之间提供一个交互界面(例如用户操作界面)或用于显示图像数据给用户参考。在本实施例中，显示单元可以是液晶显示器或触控显示器。若为触控显示器，其可为支持单点和多点触控操作的电容式触控屏或电阻式触控屏等。支持单点和多点触控操作是指触控显示器能感应到来自该触控显示器上一个或多个位置处同时产生的触控操作，并将该感应到的触控操作交由处理器进行计算和处理。在本申请实施例中，显示单元116可以显示提供给用户的初始答复信息以及调整后的目标答复信息等多种信息。

本实施例中的电子设备可以用于执行本申请实施例提供的各个咨询答复方法中的各个步骤。下面通过几个实施例详细描述咨询答复方法的实现过程。

请参阅图2，图2为本申请实施例提供的一种咨询答复方法的流程示意图，该方法可以包括步骤S200-S500。

步骤S200，通过语言模型基于用户提出的问题信息进行答复，得到初始答复信息。

其中，用户可以为多种不同类型的咨询场景下对应的不同类型的用户，例如，法律咨询场景下的用户可以为法律咨询者，医疗咨询场景下的用户可以为病人或病人家属等，相应的，用户提出的问题信息也可以为对应咨询场景下的相关问题，例如，医疗咨询场景下用户提出的问题可以为“咳嗽、流鼻涕、发烧是什么症状”这一类的症状咨询问题，或“高血压应该挂什么科”这一类的病情咨询问题等多种不同类型的问题信息。

可选地，电子设备可以通过语音、打字等方式获取用户的输入信息，并对输入信息进行相应地识别和整理，以得到文字形式的问题信息。语言模型可以基于识别得到的问题信息进行处理，以得到初始答复信息。初始答复信息中可以包括针对用户提出的问题信息进行答复的相关答案，例如：高血压可以挂心血管内科内等。

需要说明的是，进行答复的语言模型可以通过以下方式构建：基于多种语言任务预训练初始语言模型，得到训练语言模型；基于咨询场景的咨询需求对训练语言模型进行调整，得到语言模型。初始语言模型可以为多种大型的语言对话模型，例如GPT或BERT等，通过多种语言任务对初始语言模型进行大量数据预训练，能够得到具备丰富的语言理解和生成能力的训练语言模型。并且，考虑到不同咨询场景中各种术语、知识等特征的差异，例如，法律咨询场景和医疗咨询场景涉及的术语和知识图谱差异较高，因此，可以根据咨询场景确定对应的咨询需求，例如，在咨询场景为医疗咨询场景时，则对应的咨询需求为医疗咨询需求，可以根据医疗咨询需求确定多种微调数据，微调数据可以包括医学文献，临床案例、医患对话等多种数据，以基于微调数据对训练语言模型进行相应地调整，以得到具备理解医疗术语和医疗对话能力的语言模型。能够对初始语言模型进行预训练，并根据场景对模型进行调整，有效地优化了语言模型的答复效果，从而提高了初始答复信息的有效性和准确性。

步骤S300，通过对齐检测模型提取问题信息中的问题特征和初始答复信息中的初始答复特征。

其中，考虑到问题与答案之前的对齐问题，本申请设置了自学习的对齐检测模型，通过对齐检测模型提取问题信息和初始答复信息中的特征信息，以从多方面判断问题与答案之间的对齐情况。

步骤S400，对问题特征和初始答复特征进行对齐检测，得到对齐结果。

其中，可以根据提取的多种特征信息进行对齐检测，以评估答复设备在与用户进行咨询时的对齐程度，得到相应的对齐结果。

可选地，对齐结果可以为百分比形式，在对齐结果大于95％时，则表征对齐，在对齐结果小于或等于95％时，则表征不对齐。

步骤S500，基于对齐结果对初始答复信息进行调整，得到目标答复信息。

其中，可以根据对齐结果的实际情况，在初始答复信息与问题信息不对齐时对初始答复信息进行相应地对齐调整处理，以得到相应的目标答复信息。

可选地，若对齐结果表征初始答复特征与问题特征对齐，则无需进行调整处理，可以直接将初始答复信息作为进行答复的目标答复信息。

需要说明的是，对齐检测模型具有自我学习的能力。当工作人员选择或编写新的回复，或进行对齐检测和调整后，更新的信息可以用来更新对齐检测模型，以强化学习过程，使对齐检测模型通过不断的试错和反馈，学习如何更准确地进行对齐检测和对齐调整。

在图2所示的实施例中，能够更全面地理解用户的实际情况和需求，有效地提高了答复信息的准确性和有效性，从而提高医疗咨询的准确性和效率，为用户提供相应的建议和帮助，提升用户使用时的满意度。

可选地，为了实现多方面地对齐检测和调整，对齐检测模型中可以包括情绪识别模型和意图分析模型，相应地，问题特征中可以包括用户情绪特征和用户意图特征，初始答复特征中可以包括答复情绪特征和答复意图特征。因此，本申请中的对齐检测模型具有上下文敏感性，能从一定窗口内的连续对话中抽取和分析用户的用户情绪特征和用户意图特征，以及初始答复信息中的答复情绪特征和答复意图特征，以更全面地理解用户的需求和情况。

请参阅图3，图3为本申请实施例提供的一种步骤S300的详细流程示意图，步骤S300中可以包括步骤S310-S320。

步骤S310，通过情绪识别模型提取问题信息中的用户情绪特征和初始答复信息中的答复情绪特征。

其中，可以基于情绪识别模型分别提取问题信息中的用户情绪特征，以及初始答复中的答复情绪特征以待处理。

需要说明的是，情绪识别模型可以通过以下方式构建：采集具有情绪标签的第一对话数据集；其中，第一对话数据集包括多组历史问题信息和历史答复信息；基于初始检测模型对第一对话数据集进行特征提取和编码处理，得到编码数据；对初始检测模型进行分类层结合处理，得到初始识别模型；通过初始识别模型对编码数据进行分类，得到分类结果；基于第一对话数据集和分类结果对初始识别模型进行迭代训练，得到情绪识别模型。能够基于历史数据构建并训练对应的情绪识别模型以提取情绪特征，有效地提高了提取的效率以及情绪特征的准确性和有效性。

可选地，为了提取信息中的特征信息，可以预先构建并训练相应的初始检测模型。为了有效地捕获并处理对话元素的上下文信息，可以基于DistilBERT的小型Transformer网络作为初始检测模型。DistilBERT是一种被压缩过的Transformer模型，相比原始的BERT，DistilBERT在保持大部分性能的同时将模型大小和运算量减少了40％，能够在资源受限的环境中有效地处理长距离依赖问题并执行大规模并行运算。在DistilBERT模型的基础上分别训练训练两个独立的网络，以分别用于情绪识别和意图分析。

可选地，为了对情绪进行识别，可以预先采集具有情绪标签的第一对话数据集，确保第一对话数据集包含对话文本以及每个对话的情绪标签(如积极、消极或中性等)。还可以对第一对话数据集进行数据预处理，如清洗、分词和标记化等，以减少无关信息对情绪识别造成的不利影响。

可选地，DistilBERT模型已经在预训练阶段学习了丰富的语义信息，因此可以直接使用DistilBERT模型对第一对话数据集进行特征提取和编码处理，得到相应的编码数据。通过将第一对话数据集中的对话文本输入到DistilBERT模型中，可以获得对应的上下文感知的词嵌入表示。

可选地，可以将DistilBERT模型进行适当的分类层结合处理，以构建得到对应的初始识别模型。可以在DistilBERT模型之上添加一个全连接层或其他分类器作为初始识别模型，并基于初始识别模型对编码数据进行分类，将对话的编码数据表示映射到情绪标签空间，再通过多类别分类器输出对应的分类结果。

可选地，还可以使用标注好情绪的第一对话数据集和分类结果对初始识别模型进行迭代训练，得到情绪识别准确性较高的情绪识别模型。例如，将对话的DistilBERT编码表示作为输入，将情绪标签作为目标，使用反向传播和优化算法(例如使用的AdamW)来调整模型参数。通过多次迭代训练，使最终得到的情绪识别模型能够准确地预测对话的情绪。AdamW(Adam with Weight Decay)是一种优化算法，能够对Adam优化算法进行改进，它在原始Adam算法的基础上引入了权重衰减(Weight Decay)机制，用于正则化模型参数。

需要说明的是，通过引入权重衰减机制，AdamW可以更好地控制模型的正则化效果，防止模型过拟合，有利于优化模型的训练效果。在进行模型训练的过程中，可以使用F1度量和准确率作为评估指标来衡量模型在验证集上的性能。例如，可以根据评估指标的变化来调整模型的超参数、优化策略或模型架构，以获得更好的分类性能。其中，准确率(Accuracy)是一种常用的分类模型评估指标，用于衡量模型在整个数据集上的分类准确性。为了更全面地评估模型性能，可以结合F1度量和准确率来进行模型评估。F1度量主要关注模型的精确率和召回率之间的平衡，而准确率则更侧重于整体分类准确性。这两个指标的综合使用可以提供更全面、准确的模型评估结果，帮助选择最佳的fine-tuning策略。F1度量(F1 metric)是一种常用的二分类评估指标，用于衡量分类模型在精确率(Precision)和召回率(Recall)之间的平衡。在二分类问题中，可以将正例(Positive)和负例(Negative)作为分类的两个类别。精确率表示被模型正确预测为正例的样本占所有被模型预测为正例的样本的比例。召回率表示被模型正确预测为正例的样本占所有真实正例的样本的比例。F1度量是精确率和召回率的调和平均值，它综合考虑了分类模型的准确性和全面性。在进行模型的fine-tuning过程中，可以使用F1度量作为评估指标来衡量模型在验证集上的性能。通过计算验证集上的精确率和召回率，可以得到相应的F1值。在fine-tuning过程中，可以根据F1值的变化来调整模型的超参数、优化策略或模型架构，以获得更好的分类性能。使用F1度量作为评估指标可以帮助在分类任务中平衡精确率和召回率，尤其在样本不平衡的情况下更为重要。在fine-tuning过程中，选择适当的优化目标和调整策略，以最大化F1值，可以提高模型的分类能力和性能。

示例地，可以使用独立的测试数据集评估情绪识别模型的性能。计算预测结果与实际情绪标签之间的差异，评估模型的准确率、精确率、召回率等指标。根据评估结果进行模型调优和改进。训练完毕的DistilBERT的情绪识别模型可以应用于对齐检测模型中，通过将对话文本输入DistilBERT模型，获取对话的编码数据，然后通过情绪识别模型进行情绪分类。根据识别结果，对齐检测模型可以采取相应的对齐操作，生成更符合情感需求的回复。DistilBERT模型通过多层的自注意力机制，能够对输入文本进行全局上下文建模，可以为每个对话回合生成相应的上下文感知的表示，这些表示可以融合对话历史的语境信息，并为情绪识别提供更准确的输入。使用DistilBERT模型构建情绪识别模型进行情绪识别时，能够利用DistilBERT的上下文感知能力和语义表示能力，可以更准确地识别对话中的情绪状态，提高对话***的情感智能和交互效益。

步骤S320，通过意图分析模型提取问题信息中的用户意图特征和初始答复信息中的答复意图特征。

其中，可以基于意图识别模型分别提取问题信息中的用户意图特征，以及初始答复中的答复意图特征以待处理。

需要说明的是，意图分析模型可以通过以下方式构建：采集具有意图标注的第二对话数据集；其中，第二对话数据集包括多组历史问题信息、历史答复信息以及关联的目标知识图谱中的节点；对第二对话数据集进行预处理，得到输入向量；对初始检测模型进行分类层结合处理，得到初始分析模型；通过初始分析模型对输入向量进行分析，得到分析结果；基于第二对话数据集、分析结果和构建的目标知识图谱对初始分析模型进行训练，得到意图分析模型。能够基于历史数据构建并训练对应的意图分析模型以提取意图特征，有效地提高了提取的效率以及意图特征的准确性和有效性。

可选地，为了对情绪进行识别，可以预先采集具有意图标注和知识图谱的第二对话数据集，第二对话数据集可以包含对话内容以及与之关联的康复医学知识图谱中的节点，并建立对应的目标知识图谱，目标知识图谱可以根据咨询场景进行选择和构建，例如，在咨询场景为医疗咨询时，则对应的目标知识图谱可以为康复医学知识图谱，其中包括康复医学领域的实体、关系和语义信息等相关信息，可以通过整合专家知识、研究文献和整理数据库等方式构建。还可以对第二对话数据集进行预处理，预处理可以包括分词、去除停用词、将文本转换为向量表示等操作，得到相应的输入向量，以便将其作为模型的输入。

可选地，可以对初始检测模型进行分类层结合处理以构建对应的初始分析模型。以输入向量作为初始分析模型的输入数据进行分析处理，得到相应的目标知识图谱中的节点作为对应的分析结果，示例地，在医疗咨询场景中，输出的分析结果可以为输出为康复医学知识图谱中的节点，能够根据对话内容推断用户可能感兴趣的康复医学知识图谱节点，以满足用户需求并提供相关学术信息。将康复医学知识图谱中的节点与初始分析模型的输出进行映射，可以通过将网络输出与知识图谱节点进行向量空间的相似度匹配实现。

可选地，可以结合对应的第二对话集、分析结果和构建的目标知识图谱对初始分析模型进行进一步地训练，以得到意图分析相关性较高的意图分析模型。在训练过程中，意图分析模型将学习将对话内容映射到相关的知识图谱节点，且意图分析模型的训练方式与情绪识别网络类似，不再进行赘述。可以根据意图分析模型的输出和知识图谱节点映射，预测用户可能感兴趣的康复医学知识图谱节点，并将其作为输出返回给用户。这些节点可以是康复治疗方法、康复设备、康复疾病等相关学术信息。通过将意图识别网络与康复医学知识图谱相结合，可以更好地理解用户的意图，并提供与康复医学领域相关的学术知识和信息，能够帮助用户获取准确且学术化的康复医学建议，提高康复治疗的效果和学术体验。

在图3所示的实施例中，能够通过识别和分析，抽取问题信息和初始答复信息中的关键信息，帮助理解用户的情绪和需求，以从情绪和意图两个方面对用户的问题信息和提供的初始答复信息进行对齐检测处理，有效地提高了对齐检测的全面性和有效性。

请参阅图4，图4为本申请实施例提供的一种步骤S400的详细流程示意图，步骤S400中可以包括步骤S410-S420。

步骤S410，对用户情绪特征和答复情绪特征进行对齐检测，得到情绪对齐结果。

步骤S420，对用户意图特征和答复意图特征进行对齐检测，得到意图对齐结果。

其中，在进行对齐检测时，可以分别针对情绪和意图两种特征进行对齐检测，因此，对齐结果可以包括情绪对齐结果和意图对齐结果。

需要说明的是，不对步骤S410和步骤S420的执行顺序进行限制，二者可以根据实际情况选择对应的顺序先后执行，也可以同步执行。

在图4所述的实施例中，能够分别得到相应的情绪对齐结果和意图对齐结果，有效地提高了对齐检测的全面性和有效性。

可选地，对初始答复信息进行调整时，可以根据情绪对齐结果和/或意图对齐结果的实际情况，由决策树选择对应的对齐操作对初始答复信息中的情绪内容和/或意图内容进行相应地更新，因此，目标答复信息中可以包括：更新情绪信息和/或更新意图信息。

请参阅图5，图5为本申请实施例提供的一种步骤S500的详细流程示意图，步骤S500中可以包括步骤S510-S520。

步骤S510，若用户情绪特征或答复情绪特征呈负面趋势，则判定情绪对齐结果为不对齐，基于预设的感情提示控制语言模型生成更新情绪信息。

其中，在用户情绪特征或答复情绪特征呈负面趋势时，则表征用户情绪特征与答复情绪特征差异性较大，判定情绪对齐结果为不对齐，可以基于预先注入的感情提示，控制语言模型重新生成与用户情绪特征相应的更新情绪信息。

步骤S520，若用户意图特征或答复意图特征的相关度超过设定阈值节点，则判定意图对齐结果为不对齐，将超出节点添加至语言模型中生成更新意图信息。

其中，在用户意图特征或答复意图特征的相关度超过设定阈值节点时，例如意图分析模型的输出结果中包含与当前对话相关度超过设定阈值节点的情况下，设定阈值为根据目标知识图谱的实际情况和需求设置的节点数量，可以根据实际情况和需求的变化而产生的相应的变化，能够将超出的节点作为额外信息添加到语言模型的上下文在，以生成满足用户意图的更新意图信息。

需要说明的是，若用户意图特征、答复意图特征或更新意图信息包含预先标记的危险标签，则生成人工审核提示信息。危险标签可以为对具有潜在危险或风险的话题进行标识的标签，例如，可以包括对违禁药品的查询等，危险标签可以预先设置在对应的对话中，通过对用户意图特征、答复意图特征或更新意图信息中这是否具有危险标签进行检测，以在具有危险标签的情况下，生成对应的人工审核提示信息通知人工对危险话题进行审核，以提高咨询回复的安全性和合规性。

需要说明的是，在获取目标答复信息后，可以继续对问题特征和目标答复信息中的更新答复特征进行对齐检测，得到更新对齐结果；若判定更新对齐结果为不对齐，则生成人工答复提示信息。在多次对齐检测和对齐调整后，若更新对齐结果仍为不对齐，则表征自动答复功能不适用目前的用户咨询，无法准确对齐用户的需求，能够生成相应的人工答复提示信息，以通知人工针对用户的问题进行答复处理，以针对用户需求提供更加准确、专业的人工回复。工作人员可以根据对齐检测模型生成的选项，选择或编写最佳回复，人工答复过程还能够为对齐检测模型提供了新的训练样本，助力其持续学习和改善。

在图5所示的实施例中，能够在情绪对齐结果和/或意图对齐结果不对齐的情况下，对初始答复信息进行调整以重新生成情感一致且关联性较强的目标答复信息以满足用户的咨询需求，优化了医疗咨询的效果，有效地提升了用户的满意度。

请参阅图6，图6为本申请实施例提供的一种咨询答复装置的结构示意图，咨询答复装置600可以包括答复模块610、特征提取模块620、对齐模块630和调整模块640；

答复模块610用于通过语言模型基于用户提出的问题信息进行答复，得到初始答复信息；

特征提取模块620用于通过对齐检测模型提取问题信息中的问题特征和初始答复信息中的初始答复特征；

对齐模块630用于对问题特征和初始答复特征进行对齐检测，得到对齐结果；

调整模块640用于基于对齐结果对初始答复信息进行调整，得到目标答复信息。

在一可选的实施方式中，其中，对齐检测模型中包括情绪识别模型和意图分析模型；问题特征中包括用户情绪特征和用户意图特征；初始答复特征中包括答复情绪特征和答复意图特征；特征提取模块620具体用于：通过情绪识别模型提取问题信息中的用户情绪特征和初始答复信息中的答复情绪特征；通过意图分析模型提取问题信息中的用户意图特征和初始答复信息中的答复意图特征。

在一可选的实施方式中，咨询答复装置600还可以包括构建模块，用于采集具有情绪标签的第一对话数据集；其中，第一对话数据集包括多组历史问题信息和历史答复信息；基于初始检测模型对第一对话数据集进行特征提取和编码处理，得到编码数据；对初始检测模型进行分类层结合处理，得到初始识别模型；通过初始识别模型对编码数据进行分类，得到分类结果；基于第一对话数据集和分类结果对初始识别模型进行迭代训练，得到情绪识别模型。

在一可选的实施方式中，构建模块还用于：采集具有意图标注的第二对话数据集；其中，第二对话数据集包括多组历史问题信息、历史答复信息以及关联的目标知识图谱中的节点；对第二对话数据集进行预处理，得到输入向量；对初始检测模型进行分类层结合处理，得到初始分析模型；通过初始分析模型对输入向量进行分析，得到分析结果；基于第二对话数据集、分析结果和构建的目标知识图谱对初始分析模型进行训练，得到意图分析模型。

在一可选的实施方式中，其中，对齐结果包括情绪对齐结果和意图对齐结果；对齐模块630具体用于：对用户情绪特征和答复情绪特征进行对齐检测，得到情绪对齐结果；对用户意图特征和答复意图特征进行对齐检测，得到意图对齐结果。

在一可选的实施方式中，其中，目标答复信息包括：更新情绪信息和/或更新意图信息；调整模块640具体用于：若用户情绪特征或答复情绪特征呈负面趋势，则判定情绪对齐结果为不对齐，基于预设的感情提示控制语言模型生成更新情绪信息；若用户意图特征或答复意图特征的相关度超过设定阈值节点，则判定意图对齐结果为不对齐，将超出节点添加至语言模型中生成更新意图信息。

在一可选的实施方式中，咨询答复装置600还可以包括提示模块，用于若用户意图特征、答复意图特征或更新意图信息包含预先标记的危险标签，则生成人工审核提示信息。

在一可选的实施方式中，对齐模块630还用于对问题特征和目标答复信息中的更新答复特征进行对齐检测，得到更新对齐结果；提示模块还用于若判定更新对齐结果为不对齐，则生成人工答复提示信息。

在一可选的实施方式中，构建模块还用于：基于多种语言任务预训练初始语言模型，得到训练语言模型；基于咨询场景的咨询需求对训练语言模型进行调整，得到语言模型。

由于本申请实施例中的咨询答复装置600解决问题的原理与前述的咨询答复方法的实施例相似，因此本实施例中的咨询答复装置600的实施可以参见上述咨询答复方法的实施例中的描述，重复之处不再赘述。

本申请实施例还提供了一种计算机可读取存储介质，可读取存储介质中存储有计算机程序指令，计算机程序指令被一处理器读取并运行时，执行本实施例提供的咨询答复方法中任一项方法中的步骤。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备，也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，附图中的框图显示了根据本申请的多个实施例的设备的可能实现的体系架构、功能和操作。在这点上，框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图中的每个方框、以及框图的组合，可以用执行规定的功能或动作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本申请的实施例而已，并不用于限制本申请的保护范围，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims

1.一种咨询答复方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，其中，所述对齐检测模型中包括情绪识别模型和意图分析模型；所述问题特征中包括用户情绪特征和用户意图特征；所述初始答复特征中包括答复情绪特征和答复意图特征；

3.根据权利要求2所述的方法，其特征在于，其中，所述情绪识别模型通过以下方式构建：

4.根据权利要求2所述的方法，其特征在于，其中，所述意图分析模型通过以下方式构建：

对所述第二对话数据集进行预处理，得到输入向量；

对初始检测模型进行分类层结合处理，得到初始分析模型；

5.根据权利要求2所述的方法，其特征在于，其中，所述对齐结果包括情绪对齐结果和意图对齐结果；

6.根据权利要求5所述的方法，其特征在于，其中，所述目标答复信息包括：更新情绪信息和/或更新意图信息；

所述基于所述对齐结果对所述初始答复信息进行调整，得到所述目标答复信息，包括：

7.根据权利要求6所述的方法，其特征在于，所述方法还包括：

8.根据权利要求1所述的方法，其特征在于，所述方法还包括：

9.根据权利要求1所述的方法，其特征在于，其中，所述语言模型通过以下方式构建：

10.一种咨询答复装置，其特征在于，所述装置包括：答复模块、特征提取模块、对齐模块和调整模块；

11.一种计算机可读取存储介质，其特征在于，所述可读取存储介质中存储有计算机程序指令，所述计算机程序指令被一处理器运行时，执行权利要求1-9任一项所述方法中的步骤。