CN114882993B

CN114882993B - 问题的解释要素生成方法、装置、介质及电子设备

Info

Publication number: CN114882993B
Application number: CN202210548072.4A
Authority: CN
Inventors: 胡意仪; 阮晓雯; 陈远旭
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2022-05-19
Filing date: 2022-05-19
Publication date: 2024-05-31
Anticipated expiration: 2042-05-19
Also published as: CN114882993A

Abstract

本公开涉及知识推理领域，揭示了一种问题的解释要素生成方法、装置、介质及电子设备。该方法包括：基于问题解释样本集构建解释要素多分类模型；将目标问题信息输入至解释要素多分类模型，得到多个解释要素；根据相关性模型确定各解释要素与目标问题信息的相关度；生成与多个解释要素对应的所有解释要素组合，并根据各解释要素组合及相关度构建与各解释要素组合对应的图结构；利用切线对各图结构进行切图操作，并确定与每次切图操作对应的解释要素组和切图损失；根据各次切图操作对应的切图损失确定目标切图损失，并将目标切图损失对应的解释要素组中的解释要素作为目标解释要素。此方法可以高效准确地为目标问题信息生成相应的解释要素。

Description

问题的解释要素生成方法、装置、介质及电子设备

技术领域

本公开涉及知识推理技术领域，特别涉及一种问题的解释要素生成方法、装置、介质及电子设备。

背景技术

在很多领域中，人们都会面临一些问题。为了解决这些问题，相关专业人员都需要提供一定的决策。例如，患者在找中医医师问诊时，中医医师需要对患者进行问诊来确定病因。

目前，人们都需要通过大脑思考来进行决策，这不仅依赖于人类经验，而且决策过程的效率十分低下，成本高，决策的准确性也难以保证。

发明内容

在知识推理技术领域，为了解决现有技术中问题无法得到高效解答的技术问题，本公开的目的在于提供一种问题的解释要素生成方法、装置、介质及电子设备。

根据本公开的一方面，提供了一种问题的解释要素生成方法，所述方法包括：

基于问题解释样本集构建解释要素多分类模型，所述问题解释样本集包括多个问题解释样本，所述问题解释样本包括问题信息、答案信息和与所述答案信息对应的解释要素集合；

将目标问题信息输入至所述解释要素多分类模型，得到所述解释要素多分类模型输出的与所述目标问题信息对应的多个解释要素；

根据预先构建的相关性模型确定各解释要素与所述目标问题信息的相关度；

生成与所述多个解释要素对应的所有解释要素组合，并根据各解释要素组合及各解释要素组合中解释要素对应的相关度构建与各解释要素组合对应的图结构，其中，所述解释要素组合包括至少两个解释要素，所述图结构包括0节点、1节点以及与所述解释要素组合中解释要素对应的解释要素节点，各所述解释要素节点分别与所述0节点和所述1节点相连，与所述解释要素节点相连的边的权重是根据与所述解释要素节点对应的所述相关度确定的；

利用切线对每个图结构进行至少一次切图操作，并确定与每次切图操作对应的解释要素组和切图损失；

根据各次切图操作对应的切图损失，确定目标切图损失，并将所述目标切图损失对应的解释要素组中的解释要素作为与所述目标问题信息对应的目标解释要素。

根据本公开的另一方面，提供了一种问题的解释要素生成装置，所述装置包括：

模型构建模块，被配置为基于问题解释样本集构建解释要素多分类模型，所述问题解释样本集包括多个问题解释样本，所述问题解释样本包括问题信息、答案信息和与所述答案信息对应的解释要素集合；

输入模块，被配置为将目标问题信息输入至所述解释要素多分类模型，得到所述解释要素多分类模型输出的与所述目标问题信息对应的多个解释要素；

确定模块，被配置为根据预先构建的相关性模型确定各解释要素与所述目标问题信息的相关度；

图结构构建模块，被配置为生成与所述多个解释要素对应的所有解释要素组合，并根据各解释要素组合及各解释要素组合中解释要素对应的相关度构建与各解释要素组合对应的图结构，其中，所述解释要素组合包括至少两个解释要素，所述图结构包括0节点、1节点以及与所述解释要素组合中解释要素对应的解释要素节点，各所述解释要素节点分别与所述0节点和所述1节点相连，与所述解释要素节点相连的边的权重是根据与所述解释要素节点对应的所述相关度确定的；

切图模块，被配置为利用切线对每个图结构进行至少一次切图操作，并确定与每次切图操作对应的解释要素组和切图损失；

确定模块，被配置为根据各次切图操作对应的切图损失，确定目标切图损失，并将所述目标切图损失对应的解释要素组中的解释要素作为与所述目标问题信息对应的目标解释要素。

在本公开的一个实施例中，基于前述方案，所述问题信息包括患者基本画像信息和患者问诊信息，所述答案信息为疾病诊断结论，所述解释要素为诊断要素。

在本公开的一个实施例中，基于前述方案，所述疾病诊断结论包括疾病名称和证型，所述诊断要素为证素，在基于问题解释样本集构建解释要素多分类模型之前，所述模型构建模块还用于：根据线上业务诊断数据构建包括多个原始问题解释样本的原始问题解释样本集，所述原始问题解释样本包括患者基本画像信息、患者问诊信息、疾病名称和证型；根据各原始问题解释样本中的疾病名称和证型，确定各原始问题解释样本对应的解释要素集合；将各解释要素集合添加至与各解释要素集合对应的原始问题解释样本中，得到多个问题解释样本。

在本公开的一个实施例中，基于前述方案，所述模型构建模块被配置为：构建包括多个证素的证素词典；确定与各原始问题解释样本中的疾病名称和证型对应的病机信息；通过将所述病机信息与所述证素词典中的证素相匹配，得到各原始问题解释样本对应的证素集合。

在本公开的一个实施例中，基于前述方案，在构建包括多个证素的证素词典之后，所述模型构建模块还被配置为：通过预先构建的语义分类模型从所述证素词典中获取与证型对应的病机信息的语义相同的证素，以得到各原始问题解释样本对应的证素集合。

在本公开的一个实施例中，基于前述方案，在根据预先构建的相关性模型确定各解释要素与所述目标问题信息的相关度之前，所述确定模块还被配置为：基于问题解释样本集构建相关度样本集，其中，所述相关度样本集包括多个相关度样本，所述相关度样本包括目标患者问诊信息、目标证素以及所述目标患者问诊信息与所述目标证素的相关度，所述目标患者问诊信息和所述目标证素属于所述问题解释样本集中相同或者不同的问题解释样本；根据所述相关度样本集训练得到相关性模型。

在本公开的一个实施例中，基于前述方案，所述相关度与相关性的大小负相关，所述图结构构建模块被配置为：分别生成0节点、1节点以及与所述解释要素组合中解释要素对应的解释要素节点；将各所述解释要素节点分别与所述0节点和所述1节点相连；将所述解释要素组合中各解释要素与所述目标问题信息的相关度映射至目标相关度区间内，得到各解释要素对应的相关度映射值；将所述相关度映射值作为相应解释要素节点与0节点之间的边的权重，并将所述目标相关度区间的长度与所述相关度映射值之差作为相应解释要素节点与1节点之间的边的权重。

根据本公开的另一方面，提供了一种计算机可读程序介质，其存储有计算机程序指令，当所述计算机程序指令被计算机执行时，使计算机执行如前所述的方法。

根据本公开的另一方面，提供了一种电子设备，所述电子设备包括：

处理器；

存储器，所述存储器上存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，实现如前所述的方法。

本公开的实施例提供的技术方案可以包括以下有益效果：

对于本公开所提供的问题的解释要素生成方法、装置、介质及电子设备，该方法包括如下步骤：基于问题解释样本集构建解释要素多分类模型，所述问题解释样本集包括多个问题解释样本，所述问题解释样本包括问题信息、答案信息和与所述答案信息对应的解释要素集合；将目标问题信息输入至所述解释要素多分类模型，得到所述解释要素多分类模型输出的与所述目标问题信息对应的多个解释要素；根据预先构建的相关性模型确定各解释要素与所述目标问题信息的相关度；生成与所述多个解释要素对应的所有解释要素组合，并根据各解释要素组合及各解释要素组合中解释要素对应的相关度构建与各解释要素组合对应的图结构，其中，所述解释要素组合包括至少两个解释要素，所述图结构包括0节点、1节点以及与所述解释要素组合中解释要素对应的解释要素节点，各所述解释要素节点分别与所述0节点和所述1节点相连，与所述解释要素节点相连的边的权重是根据与所述解释要素节点对应的所述相关度确定的；利用切线对每个图结构进行至少一次切图操作，并确定与每次切图操作对应的解释要素组和切图损失；根据各次切图操作对应的切图损失，确定目标切图损失，并将所述目标切图损失对应的解释要素组中的解释要素作为与所述目标问题信息对应的目标解释要素。

此方法下，通过先构建解释要素多分类模型，再利用解释要素多分类模型得到与目标问题信息对应的多个解释要素，在此基础上，通过相关度的计算和图结构的构建来对多个解释要素进行进一步筛选，得到目标解释要素。因此，可以高效准确地为目标问题信息生成相应的解释要素，这些解释要素可以起到对目标问题信息的解释作用，可以辅助相关人员对目标问题进行解析和处理，提高了问题解答的效率，降低了问题解答的成本。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性的，并不能限制本发明。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的一种问题的解释要素生成方法的***架构示意图；

图2是根据一示例性实施例示出的一种问题的解释要素生成方法的流程图；

图3是根据一示例性实施例示出的实现本申请实施例方案的整体过程示意图；

图4是根据一示例性实施例示出的语义分类模型的结构示意图；

图5是根据一示例性实施例示出的对图结构进行切图操作的示意图；

图6是根据一示例性实施例示出的火节点与0节点及1节点之间的边的权重的示意图；

图7是根据一示例性实施例示出的一种问题的解释要素生成装置的框图；

图8是根据一示例性实施例示出的一种实现上述问题的解释要素生成方法的电子设备示例框图；

图9是根据一示例性实施例示出的一种实现上述问题的解释要素生成方法的程序产品。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

此外，附图仅为本公开的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。

正如本公开的背景技术部分所述的那样，目前人们在各个领域都会遇到一定的问题。为解决这些问题，需要依赖于相应领域内具备一定经验的专家。比如，在医疗领域，为了解决患者的疾病问题，需要依赖于医生；在教育领域，为了解决学生的学习问题，需要依赖于教师；在电器维修领域，为了解决电器的故障问题，需要依赖于维修人员。

在相关技术中，虽然已经提出了一些智能临床决策***，但这些智能临床决策***通常从患者的症状以及各项检验检查指标出发而构建的疾病分类***。这种方法的缺点在于，症状和检验指标在很多情况下对于诊断某种疾病不具有特异性，导致诊断精度不佳。

申请人发现，基于症状和指标信息进一步引申出的诊断要素，才是诊断结论推理的关键。以中医为例，出现“心烦易怒”的症状表现，首先怀疑肝脏功能方面的失调，“肝”是关于病位的诊断要素。其次，除病位外，还有寒热虚实的诊断要素，“心烦易怒”属于“热”。基于诊断要素的鉴别诊断方法可以大幅缩减由症状(或指标)出发进行疾病推理鉴别的搜索空间，体现了专业医师的经验。

相关技术中的智能诊断***之所以诊断精度不佳，就是因为未能很好地将细粒度化的诊断要素加以利用，使得医师经验无法与数据预测模型结合。即便将诊断要素纳入建模过程，由于诊断要素的识别和提取本身存在一定的误差和噪声，同样无法显著提升诊断效果。

申请人还发现，即使将诊断要素纳入建模过程，由于诊断要素的识别和提取本身存在一定的误差和噪声，同样无法显著提升诊断效果。

为此，本公开首先提供了一种问题的解释要素生成方法。通过该方法可以克服以上缺陷，能够实现解释要素的组合优化；以智能中医诊断为例，该方法可以帮助智能化诊断决策***在问诊场景中，自动筛选出具有重要决策意义，或起到显著决定作用的诊断要素，从而提升精度。

本公开的实施终端可以是任何具有运算、处理功能的设备，该设备可以与外部设备相连，用于接收或者发送数据，具体可以是便携移动设备，例如智能手机、平板电脑、笔记本电脑、PDA(Personal Digital Assistant)等，也可以是固定式设备，例如，计算机设备、现场终端、台式电脑、服务器、工作站等。

可选地，本公开的实施终端可以为计算机设备或服务器。

图1是根据一示例性实施例示出的一种问题的解释要素生成方法的***架构示意图。如图1所示，该***架构包括云端120以及与云端120通信连接的多个用户终端，多个用户终端具体包括第一用户终端110、第二用户终端120以及第三用户终端130。各用户终端均可以作为本申请实施例方案的实施终端，云端120存储有问题解释样本集。以第一用户终端110为本申请实施例方案的实施终端为例，第一用户终端110上部署有预先构建的相关性模型，当本公开提供的问题的解释要素生成方法应用于图1所示的***架构中时，一个过程可以是这样的：首先，第一用户终端110从云端120获取得到问题解释样本集；然后，第一用户终端110利用问题解释样本集训练得到解释要素多分类模型；当第一用户终端110的用户在第一用户终端110中输入目标问题信息之后，第一用户终端110会将目标问题信息输入至解释要素多分类模型，从而得到解释要素多分类模型输出的多个解释要素；接着，第一用户终端110会利用相关性模型确定出各解释要素与目标问题信息的相关度，将多个解释要素划分为多个解释要素组合，并根据相关度构建与各解释要素组合对应的图结构；接下来，第一用户终端110会通过对每个图结构进行一次或多次切图操作，并根据各切图操作所产生的切图损失来确定出与目标问题信息对应的目标解释要素；最后，第一用户终端110会将目标解释要素输出，从而将目标解释要素显示在第一用户终端110屏幕上，使得第一用户终端110的用户可以看到目标解释要素。

在本公开的一个实施例中，解释要素为诊断要素。

在本公开的一个实施例中，在云端120存储的问题解释样本集是由云端120根据各用户终端提交至云端120的线上业务诊断数据生成的。

在本公开的一个实施例中，目标解释要素为多组，各组目标解释要素按照切图损失的大小在屏幕上排列显示。

值得一提的是，图1仅为本公开的一个实施例，虽然在图1实施例中，问题的解释要素生成方法的实施终端为台式计算机，但在本公开的其他实施例中，该问题的解释要素生成方法还可以实施在云端、服务器、智能手机等其他各种类型的用户终端上；虽然在图1实施例中，问题解释样本集的存储位置与解释要素多分类模型的构建终端是不同的，但在本公开的其他实施例中，问题解释样本集还可以预先存储在训练解释要素多分类模型的终端设备上；虽然在图1实施例中，目标问题信息的接收终端与问题的解释要素生成方法的实施终端是相同的，但在本公开的其他实施例中，目标问题信息的接收终端与问题的解释要素生成方法的实施终端可以是不同的，比如，用户在某一个用户终端输入目标问题信息之后，可以利用该用户终端将目标问题信息提交至云端，然后由云端来执行本公开实施例的方案。本公开对此不作任何限定，本公开的保护范围也不应因此而受到任何限制。

图2是根据一示例性实施例示出的一种问题的解释要素生成方法的流程图。图2所示实施例提供的方法可以由各种具备计算和处理功能的终端设备执行，比如可以由图1实施例中的用户终端或者云端来执行，如图2所示，具体可以包括以下步骤：

步骤210，基于问题解释样本集构建解释要素多分类模型。

所述问题解释样本集包括多个问题解释样本，所述问题解释样本包括问题信息、答案信息和与所述答案信息对应的解释要素集合。

解释要素集合可以包括至少一个解释要素。问题信息是需要解决的问题所能够提供的信息。比如，在学习领域，问题信息可以是一个题目，答案信息可以是题目的答案，而解释要素则是答案解析信息；在电器维修领域，问题信息可以是电器故障的情况说明信息，答案信息可以是电器故障原因，而解释要素则是对电器故障原因的分析。

在本公开的一个实施例中，问题信息包括患者基本画像信息和患者问诊信息，答案信息为疾病诊断结论，解释要素为诊断要素。

上述实施例将方案应用于医疗领域中。患者基本画像信息可以包括患者的年龄、性别等信息。患者问诊信息可以只包括患者描述的主要不适和伴随症状等症状信息，也可以进一步包括医师对于患者疾病的解读信息，当患者问诊信息同时包括症状信息和解读信息时，可以将两者以对话的方式来存储。诊断要素即与疾病诊断结论对应的病理解析元素。

利用问题解释样本集可以训练得到解释要素多分类模型，解释要素多分类模型可以以多分类的方式输出一个或多个解释要素。解释要素多分类模型可以采用各种机器学习或者深度学习算法来构建。

在本公开的一个实施例中，所述疾病诊断结论包括疾病名称和证型，所述诊断要素为证素，在基于问题解释样本集构建解释要素多分类模型之前，所述方法还包括：

根据线上业务诊断数据构建包括多个原始问题解释样本的原始问题解释样本集，所述原始问题解释样本包括患者基本画像信息、患者问诊信息、疾病名称和证型；根据各原始问题解释样本中的疾病名称和证型，确定各原始问题解释样本对应的解释要素集合；将各解释要素集合添加至与各解释要素集合对应的原始问题解释样本中，得到多个问题解释样本。

下面结合图3来进一步介绍本申请实施例的方案。图3是根据一示例性实施例示出的实现本申请实施例方案的整体过程示意图。该整体过程的第一个步骤是诊断要素提炼，该步骤是通过上述实施例中确定各原始问题解释样本对应的解释要素集合来实现的。

线上业务诊断数据可以是医师诊病时保存至医院信息***中的数据。原始问题解释样本的格式可以为S＝(I,T,D,N)，其中，S为一个原始问题解释样本，I为患者基本画像信息，T为患者问诊信息，D为疾病名称，N为与疾病名称对应的证型。问题解释样本可以表示为S′＝(I,T,D,N,E)，其中，E代表根据疾病名称D和证型N得到的解释要素集合。

证型和证素是中医领域的概念。证型即诊断分型，证素即证候元素，其由病性和病位两大部分构成，是构成病机和病名的组成部分。

由于诊断要素为证素，解释要素集合即证素集合。

对于中医的疾病对应的每一种证型，可获取相关的证素，组成证素集合。

“肺燥伤阴”是中医对咳嗽病划分的一种证型，是由于阴液亏虚，肺燥失润所致。该证型在临床上以午后潮热，干咳、痰少，喉痒、鼻燥、少涕，咽干、烦渴，消瘦，舌质红，舌苔少，脉细数，伴见盗汗浸衣，心烦、失眠等为特征。可以获取与该证型对应的证素集合。

在本公开的一个实施例中，所述根据各原始问题解释样本中的疾病名称和证型，确定各原始问题解释样本对应的解释要素集合，包括：

构建包括多个证素的证素词典；

确定与各原始问题解释样本中的疾病名称和证型对应的病机信息；

通过将所述病机信息与所述证素词典中的证素相匹配，得到各原始问题解释样本对应的证素集合。

具体地，证素信息通常包含于与一种证型对应的病因、病机信息中。例如，与咳嗽病的“肺燥伤阴”这一证型对应的病机信息可以为“阴液亏虚，肺燥失润”。可从中提取的证素为：肺、燥、阴虚。病机信息与证素的对应关系为：“阴液亏虚”与阴虚对应，“肺”与肺对应，“燥”与燥对应。

通过构建包括肺、燥等证素的证素词典，从病机信息中提取与证素词典中的证素一致的词作为得到的证素。

在本公开的一个实施例中，在构建包括多个证素的证素词典之后，所述根据各原始问题解释样本中的疾病名称和证型，确定各原始问题解释样本对应的解释要素集合，还包括：

通过预先构建的语义分类模型从所述证素词典中获取与证型对应的病机信息的语义相同的证素，以得到各原始问题解释样本对应的证素集合。

具体地，对于每一原始问题解释样本中的证型，找到与该证型对应的病机信息，将该病机信息分为多个词，然后从证素词典中确定出与每个词的语义一致的证素。

图4是根据一示例性实施例示出的语义分类模型的结构示意图。请参见图4所示，该语义分类模型是一种有监督、交互式的语义表示和分类模型，该语义分类模型包括一对嵌入层，与一对嵌入层连接的交互层以及与交互层相连的特征层，其中，一个嵌入层用于接收将病机信息分为的词，并将词转换为嵌入向量，例如，接收阴液亏虚并将其转换为嵌入向量，另一个嵌入层用于接收证素词典中的词素，并将词素转换为嵌入向量，例如接收阴虚并将其转换为嵌入向量，交互层用于对两个嵌入向量进行融合，特征层用于对交互层输出的融合结果进行进一步处理，并输出分类结果，分类结果可以是0或1，其中，若输出的分类结果为1，代表词和词素的语义相同；若输出的分类结果为0，代表词和词素的语义不同。

嵌入层、交互层以及特征层均可以通过神经网络构建，特征层可以包括激活函数层、全连接层、输出层等。

如果病机信息中包含阴液亏虚，而词典中包含阴虚，两者的语义是相同的，但若采用前面实施例中匹配的方式便无法命中字典，即无法直接找到相匹配的词素；本申请实施例中，通过语义分类模型实现了语义信息与词典中词素的匹配，保证了提炼得到的词素的全面性。

步骤220，将目标问题信息输入至所述解释要素多分类模型，得到所述解释要素多分类模型输出的与所述目标问题信息对应的多个解释要素。

构建得到解释要素多分类模型，便可以利用其来输出与每一问题信息对应的解释要素。对于任意一组输入(I,T)，利用解释要素多分类模型可以预测出可能与该组输入对应的解释要素集合E_pred。

步骤230，根据预先构建的相关性模型确定各解释要素与所述目标问题信息的相关度。

在本公开的一个实施例中，在根据预先构建的相关性模型确定各解释要素与所述目标问题信息的相关度之前，所述方法还包括：

基于问题解释样本集构建相关度样本集，其中，所述相关度样本集包括多个相关度样本，所述相关度样本包括目标患者问诊信息、目标证素以及所述目标患者问诊信息与所述目标证素的相关度，所述目标患者问诊信息和所述目标证素属于所述问题解释样本集中相同或者不同的问题解释样本；

根据所述相关度样本集训练得到相关性模型。

可以利用包括多个相关度样本的相关度样本集训练得到相关性模型，相关性模型可以为各种能够输出信息之间的相关度的模型，比如可以采用排序学习模型LRM(learningto rank model)。

在本公开的一个实施例中，当患者问诊信息和证素属于同一问题解释样本时所述患者问诊信息和所述证素的相关度小于当患者问诊信息和证素属于不同问题解释样本时所述患者问诊信息和所述证素的相关度；当患者问诊信息和证素属于疾病名称相同但证型不同的问题解释样本时所述患者问诊信息和所述证素的相关度小于患者问诊信息和证素属于疾病名称不同的问题解释样本时所述患者问诊信息和所述证素的相关度。

具体地，可以用R(T，E)＝0表示T与E同属于某一条样本S′下时相关度最小，代表T与E最相关；可以用R(T，E_N′∈D/N)＝1表示T与E_N′∈D/N的相关度为1，E_N′∈D/N表示与T属于不同的样本，E_N′∈D/N所属的样本与T所属样本具有相同疾病名称D但E_N′∈D/N所属的样本中的证型为N′，这与T所属样本中的证型N不同，E_N′∈D/N和E之间可以存在交集；可以用R(T，E_{N′∈D′，D′∈Δ/D})＝2表示T与E_{N′∈D′，D′∈Δ/D}的相关度为2，E_{N′∈D′，D′∈Δ/D}表示与T属于不同的样本，且E_{N′∈D′，D′∈Δ/D}所属样本与T所属的样本具有不同的疾病名称。

对于任意一组由患者基本画像信息I、患者问诊信息T以及证素集合E组成的输入数据：x＝(I，T，E)，通过排序学习模型LRM，可以得到模型输出的相关度r＝LRM(x)。

图3所示的整体过程的第二个步骤是相关性排顺序，该步骤可以是通过上述实施例中的排序学习模型来实现的。

步骤240，生成与所述多个解释要素对应的所有解释要素组合，并根据各解释要素组合及各解释要素组合中解释要素对应的相关度构建与各解释要素组合对应的图结构。

其中，所述解释要素组合包括至少两个解释要素，所述图结构包括0节点、1节点以及与所述解释要素组合中解释要素对应的解释要素节点，各所述解释要素节点分别与所述0节点和所述1节点相连，与所述解释要素节点相连的边的权重是根据与所述解释要素节点对应的所述相关度确定的。

生成E_pred中各解释要素的全部组合，每一个解释要素组合至少包括两个解释要素。

在本公开的一个实施例中，所述相关度与相关性的大小负相关，所述根据各解释要素组合及各解释要素组合中解释要素对应的相关度构建与各解释要素组合对应的图结构，包括：

分别生成0节点、1节点以及与所述解释要素组合中解释要素对应的解释要素节点；

将各所述解释要素节点分别与所述0节点和所述1节点相连；

将所述解释要素组合中各解释要素与所述目标问题信息的相关度映射至目标相关度区间内，得到各解释要素对应的相关度映射值；

将所述相关度映射值作为相应解释要素节点与0节点之间的边的权重，并将所述目标相关度区间的长度与所述相关度映射值之差作为相应解释要素节点与1节点之间的边的权重。

图5是根据一示例性实施例示出的对图结构进行切图操作的示意图。请参见图5所示，该图结构包括火、阴虚、气虚、痰共四个解释要素节点，以及位于左右两侧的1节点和0节点，各解释要素节点分别通过左右两侧的两条边与1节点和0节点连接，1节点代表证素成立，0节点则代表证素不成立。每一解释要素节点左右两侧的两条边均设置有相应的权重。比如，阴虚节点与1节点连接的边的权重为0.6，与0节点连接的边的权重为0.4。每一解释要素节点左右两侧的两条边的权重之和为1。

图6是根据一示例性实施例示出的火节点与0节点及1节点之间的边的权重的示意图。下面结合图6介绍边的权重的计算方式。首先，对于通过对E_pred划分得到的任一解释要素组合X，通过排序学习模型LRM得到分数r＝LRM(I,T,X)，由于LRM输出的得分在[0,2]区间内，可以对所有分数进行Min-Max归一化到(0,1)区间内，得到r′，可以将r′作为相应解释要素节点与0节点所连接的边的权重，并将1-r′作为相应解释要素节点与1节点所连接的边的权重。在图6中，火节点与1节点连接的边的权重为1-r′，与0节点连接的边的权重为r′，1-r′越小，代表相应的相关度越大。

步骤250，利用切线对每个图结构进行至少一次切图操作，并确定与每次切图操作对应的解释要素组和切图损失。

对每个图结构可以进行一次或多次切图操作。具体地，利用切线对图结构进行切图操作是指使用一条切线对图结构进行切割，且使切线经过从每个解释要素节点延伸出的与0节点或1节点连接的边上。切图操作对应的解释要素组是与通过边与1节点相连接且与1节点相连接的边未被切线经过的解释要素节点对应的解释要素。

在本公开的一个实施例中，切图操作对应的切图损失为切线所经过的边的权重之和。

步骤260，根据各次切图操作对应的切图损失，确定目标切图损失，并将所述目标切图损失对应的解释要素组中的解释要素作为与所述目标问题信息对应的目标解释要素。

图3所示的整体过程的第三个步骤是组合优化，该步骤可以是通过执行步骤240-步骤260来实现的。

在本公开的一个实施例中，根据各次切图操作对应的切图损失，确定目标切图损失，包括：获取最小的切图损失，作为目标切图损失。

当然，还可以将切图损失定义为切线未经过的边的权重之和，此时可以将最大的切图损失，作为目标切图损失。

请继续参见图5所示，通过利用切线C进行切图操作，得到的解释要素组为{火，阴虚}；在经过切图操作之后，该解释要素组对应的节点与1节点相连接，代表可以火和阴虚这两个证素可以被选中，但因此而带来的切图损失为L＝0.5+0.1+0.4+0.2＝1.2。在图5中将切线C移动至其他位置进行切图操作，也可以得到相应的切图损失。

综上所述，根据本公开实施例提供的问题的解释要素生成方法，能够实现解释要素的细粒度拆分，从而辅助相关人员对目标问题进行解析和处理，在医疗领域中能够提升诊断精度；通过将相关度的计算和对图结构的切分相结合，大大减少了生成解释要素时可能存在的噪声问题；通过将医师经验性的证素信息与解释要素多分类模型相结合来辅助医师生成相应的证素，保证了证素的生成效率和准确性。

本公开还提供了一种问题的解释要素生成装置，以下是本公开的装置实施例。

图7是根据一示例性实施例示出的一种问题的解释要素生成装置的框图。

如图7所示，装置700包括：

模型构建模块710，被配置为基于问题解释样本集构建解释要素多分类模型，所述问题解释样本集包括多个问题解释样本，所述问题解释样本包括问题信息、答案信息和与所述答案信息对应的解释要素集合；

输入模块720，被配置为将目标问题信息输入至所述解释要素多分类模型，得到所述解释要素多分类模型输出的与所述目标问题信息对应的多个解释要素；

确定模块730，被配置为根据预先构建的相关性模型确定各解释要素与所述目标问题信息的相关度；

图结构构建模块740，被配置为生成与所述多个解释要素对应的所有解释要素组合，并根据各解释要素组合及各解释要素组合中解释要素对应的相关度构建与各解释要素组合对应的图结构，其中，所述解释要素组合包括至少两个解释要素，所述图结构包括0节点、1节点以及与所述解释要素组合中解释要素对应的解释要素节点，各所述解释要素节点分别与所述0节点和所述1节点相连，与所述解释要素节点相连的边的权重是根据与所述解释要素节点对应的所述相关度确定的；

切图模块750，被配置为利用切线对每个图结构进行至少一次切图操作，并确定与每次切图操作对应的解释要素组和切图损失；

确定模块760，被配置为根据各次切图操作对应的切图损失，确定目标切图损失，并将所述目标切图损失对应的解释要素组中的解释要素作为与所述目标问题信息对应的目标解释要素。

在本公开的一个实施例中，基于前述方案，所述疾病诊断结论包括疾病名称和证型，所述诊断要素为证素，在基于问题解释样本集构建解释要素多分类模型之前，模型构建模块710还用于：根据线上业务诊断数据构建包括多个原始问题解释样本的原始问题解释样本集，所述原始问题解释样本包括患者基本画像信息、患者问诊信息、疾病名称和证型；根据各原始问题解释样本中的疾病名称和证型，确定各原始问题解释样本对应的解释要素集合；将各解释要素集合添加至与各解释要素集合对应的原始问题解释样本中，得到多个问题解释样本。

在本公开的一个实施例中，基于前述方案，模型构建模块710被配置为：构建包括多个证素的证素词典；确定与各原始问题解释样本中的疾病名称和证型对应的病机信息；通过将所述病机信息与所述证素词典中的证素相匹配，得到各原始问题解释样本对应的证素集合。

在本公开的一个实施例中，基于前述方案，在构建包括多个证素的证素词典之后，模型构建模块710还被配置为：通过预先构建的语义分类模型从所述证素词典中获取与证型对应的病机信息的语义相同的证素，以得到各原始问题解释样本对应的证素集合。

在本公开的一个实施例中，基于前述方案，在根据预先构建的相关性模型确定各解释要素与所述目标问题信息的相关度之前，确定模块760还被配置为：基于问题解释样本集构建相关度样本集，其中，所述相关度样本集包括多个相关度样本，所述相关度样本包括目标患者问诊信息、目标证素以及所述目标患者问诊信息与所述目标证素的相关度，所述目标患者问诊信息和所述目标证素属于所述问题解释样本集中相同或者不同的问题解释样本；根据所述相关度样本集训练得到相关性模型。

在本公开的一个实施例中，基于前述方案，所述相关度与相关性的大小负相关，图结构构建模块740被配置为：分别生成0节点、1节点以及与所述解释要素组合中解释要素对应的解释要素节点；将各所述解释要素节点分别与所述0节点和所述1节点相连；将所述解释要素组合中各解释要素与所述目标问题信息的相关度映射至目标相关度区间内，得到各解释要素对应的相关度映射值；将所述相关度映射值作为相应解释要素节点与0节点之间的边的权重，并将所述目标相关度区间的长度与所述相关度映射值之差作为相应解释要素节点与1节点之间的边的权重。

根据本公开的第三方面，还提供了一种能够实现上述方法的电子设备。

所属技术领域的技术人员能够理解，本发明的各个方面可以实现为***、方法或程序产品。因此，本发明的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“***”。

下面参照图8来描述根据本发明的这种实施方式的电子设备800。图8显示的电子设备800仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图8所示，电子设备800以通用计算设备的形式表现。电子设备800的组件可以包括但不限于：上述至少一个处理单元810、上述至少一个存储单元820、连接不同***组件(包括存储单元820和处理单元810)的总线830。

其中，所述存储单元存储有程序代码，所述程序代码可以被所述处理单元810执行，使得所述处理单元810执行本说明书上述“实施例方法”部分中描述的根据本发明各种示例性实施方式的步骤。

存储单元820可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(RAM)821和/或高速缓存存储单元822，还可以进一步包括只读存储单元(ROM)823。

存储单元820还可以包括具有一组(至少一个)程序模块825的程序/实用工具824，这样的程序模块825包括但不限于：操作***、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线830可以为表示几类总线结构中的一种或多种，包括存储单元总线或者存储单元控制器、***总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备800也可以与一个或多个外部设备1000(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与该电子设备800交互的设备通信，和/或与使得该电子设备800能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口850进行，比如与显示单元840通信。并且，电子设备800还可以通过网络适配器860与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器860通过总线830与电子设备800的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备800使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。

通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本公开实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。

根据本公开的第四方面，还提供了一种计算机可读存储介质，其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中，本发明的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在终端设备上运行时，所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。

参考图9所示，描述了根据本发明的实施方式的用于实现上述方法的程序产品900，其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本发明的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

此外，上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明，而不是限制目的。易于理解，上述附图所示的处理并不表明或限制这些处理的时间顺序。另外，也易于理解，这些处理可以是例如在多个模块中同步或异步执行的。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围执行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims

1.一种问题的解释要素生成方法，其特征在于，所述方法包括：

2.根据权利要求1所述的问题的解释要素生成方法，其特征在于，所述问题信息包括患者基本画像信息和患者问诊信息，所述答案信息为疾病诊断结论，所述解释要素为诊断要素。

3.根据权利要求2所述的问题的解释要素生成方法，其特征在于，所述疾病诊断结论包括疾病名称和证型，所述诊断要素为证素，在基于问题解释样本集构建解释要素多分类模型之前，所述方法还包括：

根据线上业务诊断数据构建包括多个原始问题解释样本的原始问题解释样本集，所述原始问题解释样本包括患者基本画像信息、患者问诊信息、疾病名称和证型；

根据各原始问题解释样本中的疾病名称和证型，确定各原始问题解释样本对应的解释要素集合；

将各解释要素集合添加至与各解释要素集合对应的原始问题解释样本中，得到多个问题解释样本。

4.根据权利要求3所述的问题的解释要素生成方法，其特征在于，所述根据各原始问题解释样本中的疾病名称和证型，确定各原始问题解释样本对应的解释要素集合，包括：

构建包括多个证素的证素词典；

5.根据权利要求4所述的问题的解释要素生成方法，其特征在于，在构建包括多个证素的证素词典之后，所述根据各原始问题解释样本中的疾病名称和证型，确定各原始问题解释样本对应的解释要素集合，还包括：

6.根据权利要求3所述的问题的解释要素生成方法，其特征在于，在根据预先构建的相关性模型确定各解释要素与所述目标问题信息的相关度之前，所述方法还包括：

根据所述相关度样本集训练得到相关性模型。

7.根据权利要求1-6任意一项所述的问题的解释要素生成方法，其特征在于，所述相关度与相关性的大小负相关，所述根据各解释要素组合及各解释要素组合中解释要素对应的相关度构建与各解释要素组合对应的图结构，包括：

将各所述解释要素节点分别与所述0节点和所述1节点相连；

8.一种问题的解释要素生成装置，其特征在于，所述装置包括：

9.一种计算机可读程序介质，其特征在于，其存储有计算机程序指令，当所述计算机程序指令被计算机执行时，使计算机执行根据权利要求1至7中任一项所述的方法。

10.一种电子设备，其特征在于，所述电子设备包括：

处理器；

存储器，所述存储器上存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，实现如权利要求1至7任一项所述的方法。