CN116776872A

CN116776872A - 医疗数据结构化归档***

Info

Publication number: CN116776872A
Application number: CN202310322352.8A
Authority: CN
Inventors: 高力; 张路; 陆晓筱; 席娉慧; 俞富裕
Original assignee: Hangzhou Meitong Technology Co ltd; Zhejiang University ZJU
Current assignee: Hangzhou Meitong Technology Co ltd; Zhejiang University ZJU
Priority date: 2023-03-29
Filing date: 2023-03-29
Publication date: 2023-09-19

Abstract

本申请涉及智能归档技术领域，其具体地公开了一种医疗数据结构化归档***，其采用基于深度学习的人工智能检测技术，以通过从医疗影像资料中分别提取医疗影像图像的高维隐含特征信息和文本描述的文本上下文语义特征，并挖掘两者在高维空间中的多模态关联性特征分布信息，进而来进行所属主题标签的匹配。这样，充分且准确地对于医疗影像资料中的信息进行深度特征挖掘，从而更为准确地基于医疗影像资料所属的主题标签来进行医疗影像资料的归档，以提高医疗影像资料的归档效率和准确率。

Description

医疗数据结构化归档***

技术领域

本申请涉及智能归档技术领域，且更为具体地，涉及一种医疗数据结构化归档***。

背景技术

医疗影像资料数量巨大，需要对医疗影像资料进行数字化且及时归档，以避免医生无法及时获取医疗影像资料进行诊断，进而影响临床诊断的及时性。现有的医疗影像资料的归档工作由人工来进行，不仅效率低下，且会因人为疏忽而导致错误归档。

因此，期待一种优化的医疗数据结构化归档***。

发明内容

为了解决上述技术问题，提出了本申请。本申请的实施例提供了一种医疗数据结构化归档***，其采用基于深度学习的人工智能检测技术，以通过从医疗影像资料中分别提取医疗影像图像的高维隐含特征信息和文本描述的文本上下文语义特征，并挖掘两者在高维空间中的多模态关联性特征分布信息，进而来进行所属主题标签的匹配。这样，充分且准确地对于医疗影像资料中的信息进行深度特征挖掘，从而更为准确地基于医疗影像资料所属的主题标签来进行医疗影像资料的归档，以提高医疗影像资料的归档效率和准确率。

相应地，根据本申请的一个方面，提供了一种医疗数据结构化归档***，其包括：资料采集模块，用于在云端获取待归档医疗影像资料；数据提取模块，用于从所述医疗影像资料中提取医疗影像图像和文本描述；医疗影像图像特征提取模块，用于将所述医疗影像图像通过作为过滤器的卷积神经网络模型以得到医疗影像特征向量；医疗影像文本理解模块，用于将所述文本描述通过包含词嵌入层的上下文编码器以得到语义理解特征向量；多模态特征关联模块，用于对所述医疗影像特征向量和所述语义理解特征向量进行关联编码以得到多模态关联语义特征矩阵；匹配结果生成模块，用于将所述多模态关联语义特征矩阵通过分类器以得到分类结果，所述分类结果用于表示待归档医疗影像资料所属的主题标签；以及结果响应模块，用于基于所述分类结果，将所述待归档医疗影像资料归档于所述主题标签对应的文件夹中。

在上述医疗数据结构化归档***中，所述医疗影像图像特征提取模块，进一步用于：使用所述卷积神经网络模型的各层在层的正向传递中分别进行：对输入数据进行卷积处理以得到卷积特征图；对所述卷积特征图进行基于局部特征矩阵的均值池化以得到池化特征图；以及，对所述池化特征图进行非线性激活以得到激活特征图；其中，所述卷积神经网络模型的最后一层的输出为所述医疗影像特征向量，所述卷积神经网络模型的第一层的输入为所述医疗影像图像。

在上述医疗数据结构化归档***中，所述作为过滤器的卷积神经网络模型为深度残差网络模型。

在上述医疗数据结构化归档***中，所述医疗影像文本理解模块，包括：分词单元，用于对所述文本描述进行分词处理以获得多个词；词嵌入单元，用于将所述多个词通过词嵌入层以将所述多个词中各个词转化为词嵌入向量以得到词嵌入向量的序列，其中，所述嵌入层使用可学习的嵌入矩阵对所述各个词进行嵌入编码；上下文编码单元，用于将所述词嵌入向量的序列输入所述上下文编码器以得到所述多个上下文语义特征向量；以及，级联单元，用于将所述多个上下文语义特征向量进行级联以得到所述语义理解特征向量。

在上述医疗数据结构化归档***中，所述上下文编码单元，进一步用于：将所述词嵌入向量的序列排列为输入向量；将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量；计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵；对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵；将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵；以及，将所述自注意力特征矩阵与以所述词嵌入向量的序列中各个词嵌入向量作为值向量分别进行相乘以得到所述多个上下文语义特征向量。

在上述医疗数据结构化归档***中，所述多模态特征关联模块，进一步用于：对所述医疗影像特征向量和所述语义理解特征向量进行向量模基的希尔伯特空间约束以对所述医疗影像特征向量和所述语义理解特征向量进行关联编码以得到所述多模态关联语义特征矩阵。

在上述医疗数据结构化归档***中，所述多模态特征关联模块，进一步用于：以如下公式对所述医疗影像特征向量和所述语义理解特征向量进行向量模基的希尔伯特空间约束以对所述医疗影像特征向量和所述语义理解特征向量进行关联编码以得到所述多模态关联语义特征矩阵；其中，所述公式为：其中/>和/>分别表示所述医疗影像特征向量和所述语义理解特征向量，/>表示向量的二范数，/>表示以卷积算子/>对矩阵/>进行一维卷积，其中/>和/>是权重超参数，且/>和/> 均为列向量，/>表示所述多模态关联语义特征矩阵，/>表示向量相乘。

在上述医疗数据结构化归档***中，所述匹配结果生成模块，包括：展开单元，用于将所述多模态关联语义特征矩阵按照行向量或者列向量展开为分类特征向量；标签概率化单元，用于将所述分类特征向量输入所述分类器的 Softmax分类函数以得到所述分类特征向量归属于各个分类标签的概率值；以及，分类结果生成单元，用于将最大概率值对应的分类标签确定为所述分类结果。

根据本申请的另一方面，还提供了一种医疗数据结构化归档方法，其包括：在云端获取待归档医疗影像资料；从所述医疗影像资料中提取医疗影像图像和文本描述；将所述医疗影像图像通过作为过滤器的卷积神经网络模型以得到医疗影像特征向量；将所述文本描述通过包含词嵌入层的上下文编码器以得到语义理解特征向量；对所述医疗影像特征向量和所述语义理解特征向量进行关联编码以得到多模态关联语义特征矩阵；将所述多模态关联语义特征矩阵通过分类器以得到分类结果，所述分类结果用于表示待归档医疗影像资料所属的主题标签；以及基于所述分类结果，将所述待归档医疗影像资料归档于所述主题标签对应的文件夹中。

在上述医疗数据结构化归档方法中，所述将所述医疗影像图像通过作为过滤器的卷积神经网络模型以得到医疗影像特征向量，包括：使用所述卷积神经网络模型的各层在层的正向传递中分别进行：对输入数据进行卷积处理以得到卷积特征图；对所述卷积特征图进行基于局部特征矩阵的均值池化以得到池化特征图；以及，对所述池化特征图进行非线性激活以得到激活特征图；其中，所述卷积神经网络模型的最后一层的输出为所述医疗影像特征向量，所述卷积神经网络模型的第一层的输入为所述医疗影像图像。

在上述医疗数据结构化归档方法中，所述作为过滤器的卷积神经网络模型为深度残差网络模型。

在上述医疗数据结构化归档方法中，所述将所述文本描述通过包含词嵌入层的上下文编码器以得到语义理解特征向量，包括：对所述文本描述进行分词处理以获得多个词；将所述多个词通过词嵌入层以将所述多个词中各个词转化为词嵌入向量以得到词嵌入向量的序列，其中，所述嵌入层使用可学习的嵌入矩阵对所述各个词进行嵌入编码；将所述词嵌入向量的序列输入所述上下文编码器以得到所述多个上下文语义特征向量；以及，将所述多个上下文语义特征向量进行级联以得到所述语义理解特征向量。

在上述医疗数据结构化归档方法中，所述将所述词嵌入向量的序列输入所述上下文编码器以得到所述多个上下文语义特征向量，包括：将所述词嵌入向量的序列排列为输入向量；将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量；计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵；对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵；将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵；以及，将所述自注意力特征矩阵与以所述词嵌入向量的序列中各个词嵌入向量作为值向量分别进行相乘以得到所述多个上下文语义特征向量。

在上述医疗数据结构化归档方法中，所述对所述医疗影像特征向量和所述语义理解特征向量进行关联编码以得到多模态关联语义特征矩阵，包括：对所述医疗影像特征向量和所述语义理解特征向量进行向量模基的希尔伯特空间约束以对所述医疗影像特征向量和所述语义理解特征向量进行关联编码以得到所述多模态关联语义特征矩阵。

在上述医疗数据结构化归档方法中，所述对所述医疗影像特征向量和所述语义理解特征向量进行关联编码以得到多模态关联语义特征矩阵，包括：以如下公式对所述医疗影像特征向量和所述语义理解特征向量进行向量模基的希尔伯特空间约束以对所述医疗影像特征向量和所述语义理解特征向量进行关联编码以得到所述多模态关联语义特征矩阵；其中，所述公式为：其中/>和/>分别表示所述医疗影像特征向量和所述语义理解特征向量，/>表示向量的二范数，/>表示以卷积算子/>对矩阵/>进行一维卷积，其中/>和/>是权重超参数，且/>和/> 均为列向量，/>表示所述多模态关联语义特征矩阵，/>表示向量相乘。在上述医疗数据结构化归档方法中，所述将所述多模态关联语义特征矩阵通过分类器以得到分类结果，所述分类结果用于表示待归档医疗影像资料所属的主题标签，包括：将所述多模态关联语义特征矩阵按照行向量或者列向量展开为分类特征向量；将所述分类特征向量输入所述分类器的 Softmax分类函数以得到所述分类特征向量归属于各个分类标签的概率值；以及，将最大概率值对应的分类标签确定为所述分类结果。

根据本申请的再一方面，提供了一种电子设备，包括：处理器；以及，存储器，在所述存储器中存储有计算机程序指令，所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的医疗数据结构化归档方法。

根据本申请的又一方面，提供了一种计算机可读介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的医疗数据结构化归档方法。

与现有技术相比，本申请提供的医疗数据结构化归档***，其采用基于深度学习的人工智能检测技术，以通过从医疗影像资料中分别提取医疗影像图像的高维隐含特征信息和文本描述的文本上下文语义特征，并挖掘两者在高维空间中的多模态关联性特征分布信息，进而来进行所属主题标签的匹配。这样，充分且准确地对于医疗影像资料中的信息进行深度特征挖掘，从而更为准确地基于医疗影像资料所属的主题标签来进行医疗影像资料的归档，以提高医疗影像资料的归档效率和准确率。

附图说明

通过结合附图对本申请实施例进行更详细的描述，本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解，并且构成说明书的一部分，与本申请实施例一起用于解释本申请，并不构成对本申请的限制。在附图中，相同的参考标号通常代表相同部件或步骤。

图1为根据本申请实施例的医疗数据结构化归档***的框图。

图2为根据本申请实施例的医疗数据结构化归档***的架构示意图。

图3为根据本申请实施例的医疗数据结构化归档***中医疗影像文本理解模块的框图。

图4为根据本申请实施例的医疗数据结构化归档方法的流程图。

图5为根据本申请实施例的电子设备的框图。

具体实施方式

下面，将参考附图详细地描述根据本申请的示例实施例。显然，所描述的实施例仅仅是本申请的一部分实施例，而不是本申请的全部实施例，应理解，本申请不受这里描述的示例实施例的限制。

申请概述：如上所述，现有的医疗影像资料的归档工作由人工来进行，不仅效率低下，且会因人为疏忽而导致错误归档。因此，期待一种优化的医疗数据结构化归档***。

相应地，考虑到为了能够对于医疗影像资料进行及时且准确地归档，需要对于医疗影像资料的特征信息进行充分且准确地特征挖掘，进而以所述医疗影像资料的隐含特征来进行所属主题标签的匹配，进而完成归档。但是，考虑到由于医疗影像资料包括有医疗影像图像和文本描述，这两者为不同的数据类型，因此，难点在于如何挖掘出所述医疗影像资料中的影像图像的高维隐含特征信息和文本描述的文本上下文语义特征信息的多模态关联性特征分布信息，以此来充分且准确地对于医疗影像资料中的信息进行深度特征挖掘，从而更为准确地基于医疗影像资料所属的主题标签来进行医疗影像资料的归档，以提高医疗影像资料的归档效率和准确率。

近年来，深度学***。

深度学习以及神经网络的发展为挖掘所述医疗影像资料中的影像图像的高维隐含特征信息和文本描述的文本上下文语义特征信息的多模态关联性特征分布信息提供了新的解决思路和方案。本领域普通技术人员应知晓，基于深度学习的深度神经网络模型可以通过适当的训练策略，例如通过梯度下降的反向传播算法来调整所述深度神经网络模型的参数以使之能够模拟事物之间的复杂的非线性关联，而这显然适合于模拟并挖掘所述医疗影像资料中的影像图像的高维隐含特征信息和文本描述的文本上下文语义特征信息的多模态关联性特征分布信息。

具体地，在本申请的技术方案中，首先，通过云端获取待归档医疗影像资料。接着，考虑到在所述医疗影像资料中存在有医疗影像图像数据和文本数据，这两个数据为不同的类型，因此，为了能够充分地对于所述医疗影像资料进行深度特征挖掘，需要分别对于这两部分的数据特征进行提取。具体地，首先，从所述医疗影像资料中提取医疗影像图像和文本描述。

然后，考虑到由于所述医疗影像资料中的医疗影像图像为图像数据类型，因此，在本申请的技术方案中，使用在图像的隐含特征提取方面具有优异表现的作为过滤器的卷积神经网络模型来进行所述医疗影像图像的特征挖掘，以提取出所述医疗影像图像中关于所述患者医疗影像的高维隐含特征分布信息，从而得到医疗影像特征向量。

进一步地，对于所述医疗影像资料的文本描述来说，由于所述文本描述是由多个词组成的，并且所述文本描述中的各个词之间具有着不同程度的上下文的语义关联关系，也就是说，所述各个词可以组成词组或语句，同时所述各个词或语句之间并不是独立存在的，其也具有着上下文的语义特征信息。因此，在本申请的技术方案中，为了能够充分且准确地对于所述文本描述进行语义理解，以提高对于所述医疗影像资料归档的准确性，进一步将所述文本描述进行分词处理以避免词序混乱后，将其通过包含词嵌入层的上下文编码器中进行语义编码，以提取出所述文本描述中关于所述医疗影像资料的基于全局的上下文语义理解特征，从而得到语义理解特征向量。也就是，基于transformer思想，利用转换器能够捕捉长距离上下文依赖的特性，对所述文本描述中的各个词进行基于全局的上下文语义编码以得到具有所述文本描述整体的上下文语义特征信息的所述语义理解特征向量。

然后，考虑到由于所述医疗影像资料中的医疗影像图像和文本描述为不同类型的数据，为了能够以这两者的关联性特征信息来提高对于所述医疗影像资料归档的准确度，在本申请的技术方案中，进一步在高维空间中对所述医疗影像特征向量和所述语义理解特征向量进行关联编码，以此来得到具有所述医疗影像图像特征和所述文本描述语义理解特征的多模态关联语义特征矩阵。相应地，在本申请的一个具体示例中，可以通过计算所述医疗影像特征向量的转置向量和所述语义理解特征向量的向量乘法来得到所述多模态关联语义特征矩阵。

接着，进一步以所述多模态关联语义特征矩阵作为分类特征矩阵通过分类器中进行分类处理，以得到用于表示待归档医疗影像资料所属的主题标签分类结果。也就是，在本申请的技术方案中，所述分类器的标签为所述待归档医疗影像资料所属的主题标签，因此，在对于具有所述医疗影像资料的图像特征和文本语义特征的融合特征的所述多模态关联语义特征矩阵进行分类处理，以此来对于所述待归档医疗影像资料所属的主题标签进行匹配以得到所述分类结果后，基于所述分类结果，将所述待归档医疗影像资料归档于所述主题标签对应的文件夹中。这样，能够准确地对于所述待归档医疗影像资料所属的主题标签进行匹配，进而完成医疗影像资料的归档。

特别地，在本申请的技术方案中，在医疗影像特征向量和所述语义理解特征向量进行关联编码以得到多模态关联语义特征矩阵时，由于所述医疗影像特征向量是对所述医疗影像图像进行卷积编码得到而所述语义理解特征向量是对所述待归档医疗影像资料中的文本描述进行上下文语义理解得到，即，所述医疗影像特征向量和所述语义理解特征向量分别通过以不同的编码方式对不同模态的数据进行编码得到，因此，所述医疗影像特征向量和所述语义理解特征向量在高维特征空间中会存在语义错配，甚至病态对齐等数据问题，导致在进行关联编码后，所述多模态关联语义特征矩阵的特征分布在高维特征空间中的收敛性差，从而影响通过分类器的拟合效果。

基于此，对所述医疗影像特征向量和所述语义理解特征向量/>进行向量模基的希尔伯特空间约束以得到多模态关联语义特征矩阵，例如记为/>，表示为：表示一维卷积运算，即以卷积算子/>对矩阵/>进行一维卷积，其中/>和/>是权重超参数，且和/>均为列向量。

这里，通过以定义了向量和模与向量内积的希尔伯特空间内的卷积算子对多模态关联语义特征矩阵进行约束，可以将多模态关联语义特征矩阵/>的特征分布限定在以向量的模为基的希尔伯特空间内的有限闭域中，并提升了多模态关联语义特征矩阵/>的特征分布的高维流形的各个基维度之间的正交性，从而在维持特征分布整体的收敛性的同时实现了特征值之间的稀疏相关。这样，提升所述多模态关联语义特征矩阵经由分类器的拟合效果和分类结果的准确性。这样，能够准确地进行医疗影像资料的归档，以提高医疗影像资料的归档效率和准确率。

在介绍了本申请的基本原理之后，下面将参考附图来具体介绍本申请的各种非限制性实施例。

示例性***：图1为根据本申请实施例的医疗数据结构化归档***的框图。如图1所示，根据本申请实施例的医疗数据结构化归档***100，包括：资料采集模块110，用于在云端获取待归档医疗影像资料；数据提取模块120，用于从所述医疗影像资料中提取医疗影像图像和文本描述；医疗影像图像特征提取模块130，用于将所述医疗影像图像通过作为过滤器的卷积神经网络模型以得到医疗影像特征向量；医疗影像文本理解模块140，用于将所述文本描述通过包含词嵌入层的上下文编码器以得到语义理解特征向量；多模态特征关联模块150，用于对所述医疗影像特征向量和所述语义理解特征向量进行关联编码以得到多模态关联语义特征矩阵；匹配结果生成模块160，用于将所述多模态关联语义特征矩阵通过分类器以得到分类结果，所述分类结果用于表示待归档医疗影像资料所属的主题标签；以及，结果响应模块170，用于基于所述分类结果，将所述待归档医疗影像资料归档于所述主题标签对应的文件夹中。

图2为根据本申请实施例的医疗数据结构化归档***的架构示意图。如图2所示，首先，在云端获取待归档医疗影像资料；接着，从所述医疗影像资料中提取医疗影像图像和文本描述；然后，将所述医疗影像图像通过作为过滤器的卷积神经网络模型以得到医疗影像特征向量，同时，将所述文本描述通过包含词嵌入层的上下文编码器以得到语义理解特征向量；继而，对所述医疗影像特征向量和所述语义理解特征向量进行关联编码以得到多模态关联语义特征矩阵；再将所述多模态关联语义特征矩阵通过分类器以得到分类结果，所述分类结果用于表示待归档医疗影像资料所属的主题标签；最后，基于所述分类结果，将所述待归档医疗影像资料归档于所述主题标签对应的文件夹中。

如上所述，现有的医疗影像资料的归档工作由人工来进行，不仅效率低下，且会因人为疏忽而导致错误归档。因此，期待一种优化的医疗数据结构化归档***。

相应地，考虑到为了能够对于医疗影像资料进行及时且准确地归档，需要对于医疗影像资料的特征信息进行充分且准确地特征挖掘，进而以所述医疗影像资料的隐含特征来进行所述主题标签的匹配，进而完成归档。但是，考虑到由于医疗影像资料包括有医疗影像图像和文本描述，这两者为不同的数据类型，因此，难点在于如何挖掘出所述医疗影像资料中的影像图像的高维隐含特征信息和文本描述的文本上下文语义特征信息的多模态关联性特征分布信息，以此来充分且准确地对于医疗影像资料中的信息进行深度特征挖掘，从而更为准确地基于医疗影像资料所属的主题标签来进行医疗影像资料的归档，以提高医疗影像资料的归档效率和准确率。

近年来，深度学***。

在上述医疗数据结构化归档***100中，所述资料采集模块110和所述数据提取模块120，用于在云端获取待归档医疗影像资料，并从所述医疗影像资料中提取医疗影像图像和文本描述。考虑到在所述医疗影像资料中存在有医疗影像图像数据和文本数据，这两个数据为不同的类型，因此，为了能够充分地对于所述医疗影像资料进行深度特征挖掘，需要分别对于这两部分的数据特征进行提取。具体地，首先，从所述医疗影像资料中提取医疗影像图像和文本描述。

在上述医疗数据结构化归档***100中，所述医疗影像图像特征提取模块130，用于将所述医疗影像图像通过作为过滤器的卷积神经网络模型以得到医疗影像特征向量。考虑到由于所述医疗影像资料中的医疗影像图像为图像数据类型，因此，在本申请的技术方案中，在从所述医疗影像资料中提取医疗影像图像之后，使用在图像的隐含特征提取方面具有优异表现的作为过滤器的卷积神经网络模型来进行所述医疗影像图像的特征挖掘，以提取出所述医疗影像图像中关于所述患者医疗影像的高维隐含特征分布信息，从而得到医疗影像特征向量。在本申请的一个具体示例中，所述作为过滤器的卷积神经网络模型为深度残差网络模型。

应可以理解，AlexNet、VGG、GoogLeNet 等网络模型的出现将神经网络的发展带入了几十层的阶段，网络的层数越深，越有可能获得更好的泛化能力。但是当模型加深以后，网络变得越来越难训练，这主要是由于梯度弥散和梯度***现象造成的。在较深层数的神经网络中，梯度信息由网络的末层逐层传向网络的首层时，传递的过程中会出现梯度接近于 0 或梯度值非常大的现象。既然浅层神经网络不容易出现梯度现象，那么可以尝试给深层神经网络添加一种回退到浅层神经网络的机制。当深层神经网络可以轻松地回退到浅层神经网络时，深层神经网络可以获得与浅层神经网络相当的模型性能。由此，提出了深度残差网络(Residual Neural Network，简称ResNet)模型，其通过在输入和输出之间添加一条直接连接的 Skip Connection 可以让神经网络具有回退的能力。

具体地，在本申请实施例中，所述医疗影像图像特征提取模块130使用所述作为过滤器的卷积神经网络模型的各层在层的正向传递中分别进行：对输入数据进行卷积处理以得到卷积特征图；对所述卷积特征图进行基于局部特征矩阵的均值池化以得到池化特征图；以及，对所述池化特征图进行非线性激活以得到激活特征图；其中，所述卷积神经网络模型的最后一层的输出为所述医疗影像特征向量，所述卷积神经网络模型的第一层的输入为所述医疗影像图像。

在上述医疗数据结构化归档***100中，所述医疗影像文本理解模块140，用于将所述文本描述通过包含词嵌入层的上下文编码器以得到语义理解特征向量。对于所述医疗影像资料的文本描述来说，由于所述文本描述是由多个词组成的，并且所述文本描述中的各个词之间具有着不同程度的上下文的语义关联关系，也就是说，所述各个词可以组成词组或语句，同时所述各个词或语句之间并不是独立存在的，其也具有着上下文的语义特征信息。因此，在本申请的技术方案中，为了能够充分且准确地对于所述文本描述进行语义理解，以提高对于所述医疗影像资料归档的准确性，进一步将所述文本描述进行分词处理以避免词序混乱后，将其通过包含词嵌入层的上下文编码器中进行语义编码，以提取出所述文本描述中关于所述医疗影像资料的基于全局的上下文语义理解特征，从而得到语义理解特征向量。也就是，基于transformer思想，利用转换器能够捕捉长距离上下文依赖的特性，对所述文本描述中的各个词进行基于全局的上下文语义编码以得到具有所述文本描述整体的上下文语义特征信息的所述语义理解特征向量。

图3为根据本申请实施例的医疗数据结构化归档***中医疗影像文本理解模块的框图。如图3所示，所述医疗影像文本理解模块140，包括：分词单元141，用于对所述文本描述进行分词处理以获得多个词；词嵌入单元142，用于将所述多个词通过词嵌入层以将所述多个词中各个词转化为词嵌入向量以得到词嵌入向量的序列，其中，所述嵌入层使用可学习的嵌入矩阵对所述各个词进行嵌入编码；上下文编码单元143，用于将所述词嵌入向量的序列输入所述上下文编码器以得到所述多个上下文语义特征向量；以及，级联单元144，用于将所述多个上下文语义特征向量进行级联以得到所述语义理解特征向量。

更具体地，在本申请实施例中，所述上下文编码单元143的编码过程为：首先，将所述词嵌入向量的序列排列为输入向量；接着，将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量；然后，计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵；继而，对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵；随后，将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵；最后，将所述自注意力特征矩阵与以所述词嵌入向量的序列中各个词嵌入向量作为值向量分别进行相乘以得到所述多个上下文语义特征向量。

在上述医疗数据结构化归档***100中，所述多模态特征关联模块150，用于对所述医疗影像特征向量和所述语义理解特征向量进行关联编码以得到多模态关联语义特征矩阵。考虑到由于所述医疗影像资料中的医疗影像图像和文本描述为不同类型的数据，为了能够以这两者的关联性特征信息来提高对于所述医疗影像资料归档的准确度，在本申请的技术方案中，进一步在高维空间中对所述医疗影像特征向量和所述语义理解特征向量进行关联编码，以此来得到具有所述医疗影像图像特征和所述文本描述语义理解特征的多模态关联语义特征矩阵。相应地，在本申请的一个具体示例中，可以通过计算所述医疗影像特征向量的转置向量和所述语义理解特征向量的向量乘法来得到所述多模态关联语义特征矩阵。

在本申请的另一个具体示例中，可以对所述医疗影像特征向量和所述语义理解特征向量进行向量模基的希尔伯特空间约束以对所述医疗影像特征向量和所述语义理解特征向量进行关联编码以得到所述多模态关联语义特征矩阵。在本申请的技术方案中，在医疗影像特征向量和所述语义理解特征向量进行关联编码以得到多模态关联语义特征矩阵时，由于所述医疗影像特征向量是对所述医疗影像图像进行卷积编码得到而所述语义理解特征向量是对所述待归档医疗影像资料中的文本描述进行上下文语义理解得到，即，所述医疗影像特征向量和所述语义理解特征向量分别通过以不同的编码方式对不同模态的数据进行编码得到，因此，所述医疗影像特征向量和所述语义理解特征向量在高维特征空间中会存在语义错配，甚至病态对齐等数据问题，导致在进行关联编码后，所述多模态关联语义特征矩阵的特征分布在高维特征空间中的收敛性差，从而影响通过分类器的拟合效果。

基于此，对所述医疗影像特征向量和所述语义理解特征向量/>进行向量模基的希尔伯特空间约束以得到多模态关联语义特征矩阵，例如记为/>表示为：其中/>和/>分别表示所述医疗影像特征向量和所述语义理解特征向量，/>表示向量的二范数，/>表示以卷积算子对矩阵/>进行一维卷积，其中/>和/>是权重超参数，且/>和/> 均为列向量，/>表示所述多模态关联语义特征矩阵，/>表示向量相乘。

在上述医疗数据结构化归档***100中，所述匹配结果生成模块160，用于将所述多模态关联语义特征矩阵通过分类器以得到分类结果，所述分类结果用于表示待归档医疗影像资料所属的主题标签。也就是，在本申请的技术方案中，所述分类器的标签为所述待归档医疗影像资料所属的主题标签。

具体地，在本申请实施例中，所述匹配结果生成模块160的编码过程包括：首先，通过展开单元将所述多模态关联语义特征矩阵按照行向量或者列向量展开为分类特征向量；接着，通过标签概率化单元将所述分类特征向量输入所述分类器的Softmax分类函数以得到所述分类特征向量归属于各个分类标签的概率值；最后，通过分类结果生成单元将最大概率值对应的分类标签确定为所述分类结果。

在上述医疗数据结构化归档***100中，所述结果响应模块170，用于基于所述分类结果，将所述待归档医疗影像资料归档于所述主题标签对应的文件夹中。也就是，在对于具有所述医疗影像资料的图像特征和文本语义特征的融合特征的所述多模态关联语义特征矩阵进行分类处理，以此来对于所述待归档医疗影像资料所属的主题标签进行匹配以得到所述分类结果后，基于所述分类结果，将所述待归档医疗影像资料归档于所述主题标签对应的文件夹中。这样，能够准确地对于所述待归档医疗影像资料所属的主题标签进行匹配，进而完成医疗影像资料的归档。

综上，基于本申请实施例的医疗数据结构化归档***100被阐明，其采用基于深度学习的人工智能检测技术，以通过从医疗影像资料中分别提取医疗影像图像的高维隐含特征信息和文本描述的文本上下文语义特征，并挖掘两者在高维空间中的多模态关联性特征分布信息，进而来进行所属主题标签的匹配。这样，充分且准确地对于医疗影像资料中的信息进行深度特征挖掘，从而更为准确地基于医疗影像资料所属的主题标签来进行医疗影像资料的归档，以提高医疗影像资料的归档效率和准确率。

如上所述，根据本申请实施例的医疗数据结构化归档***100可以实现在各种终端设备中，例如用于医疗数据结构化归档的服务器等。在一个示例中，根据本申请实施例的医疗数据结构化归档***100可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如，该医疗数据结构化归档***100可以是该终端设备的操作***中的一个软件模块，或者可以是针对于该终端设备所开发的一个应用程序；当然，该医疗数据结构化归档***100同样可以是该终端设备的众多硬件模块之一。

替换地，在另一示例中，该医疗数据结构化归档***100与该终端设备也可以是分立的设备，并且该医疗数据结构化归档***100可以通过有线和/或无线网络连接到该终端设备，并且按照约定的数据格式来传输交互信息。

示例性方法：图4为根据本申请实施例的医疗数据结构化归档方法的流程图。如图4所示，根据本申请实施例的医疗数据结构化归档方法，包括：S110，在云端获取待归档医疗影像资料；S120，从所述医疗影像资料中提取医疗影像图像和文本描述；S130，将所述医疗影像图像通过作为过滤器的卷积神经网络模型以得到医疗影像特征向量；S140，将所述文本描述通过包含词嵌入层的上下文编码器以得到语义理解特征向量；S150，对所述医疗影像特征向量和所述语义理解特征向量进行关联编码以得到多模态关联语义特征矩阵；S160，将所述多模态关联语义特征矩阵通过分类器以得到分类结果，所述分类结果用于表示待归档医疗影像资料所属的主题标签；以及，S170，基于所述分类结果，将所述待归档医疗影像资料归档于所述主题标签对应的文件夹中。

这里，本领域技术人员可以理解，上述医疗数据结构化归档方法中的各个步骤和操作已经在上面参考图1到图3的医疗数据结构化归档***100的描述中得到了详细介绍，并因此，将省略其重复描述。

示例性电子设备：下面，参考图5来描述根据本申请实施例的电子设备。图5为根据本申请实施例的电子设备的框图。如图5所示，电子设备10包括一个或多个处理器11和存储器12。

处理器11可以是中央处理单元（CPU）或者具有数据处理能力和/或指令执行能力的其他形式的处理单元，并且可以控制电子设备10中的其他组件以执行期望的功能。

存储器12可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器（RAM）和/或高速缓冲存储器（cache）等。所述非易失性存储器例如可以包括只读存储器（ROM）、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器11可以运行所述程序指令，以实现上文所述的本申请的各个实施例的医疗数据结构化归档方法中的功能以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如待归档医疗影像资料等各种内容。

在一个示例中，电子设备10还可以包括：输入装置13和输出装置14，这些组件通过总线***和/或其他形式的连接机构（未示出）互连。

该输入装置13可以包括例如键盘、鼠标等等。

该输出装置14可以向外部输出各种信息，包括分类结果等。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然，为了简化，图5中仅示出了该电子设备10中与本申请有关的组件中的一些，省略了诸如总线、输入/输出接口等等的组件。除此之外，根据具体应用情况，电子设备10还可以包括任何其他适当的组件。

示例性计算机程序产品和计算机可读存储介质：除了上述方法和设备以外，本申请的实施例还可以是计算机程序产品，其包括计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的医疗数据结构化归档方法中的功能中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码，所述程序设计语言包括面向对象的程序设计语言，诸如Java、C++等，还包括常规的过程式程序设计语言，诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外，本申请的实施例还可以是计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的医疗数据结构化归档方法中的功能中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子（非穷举的列表）包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器（RAM）、只读存储器（ROM）、可擦式可编程只读存储器（EPROM或闪存）、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本申请的基本原理，但是，需要指出的是，在本申请中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本申请为必须采用上述具体的细节来实现。

本申请中涉及的器件、装置、设备、***的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的，可以按任意方式连接、布置、配置这些器件、装置、设备、***。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”，且可与其互换使用。

还需要指出的是，在本申请的装置、设备和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的，并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此，本申请不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例，但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims

1.一种医疗数据结构化归档***，其特征在于，包括：资料采集模块，用于在云端获取待归档医疗影像资料；数据提取模块，用于从所述医疗影像资料中提取医疗影像图像和文本描述；医疗影像图像特征提取模块，用于将所述医疗影像图像通过作为过滤器的卷积神经网络模型以得到医疗影像特征向量；医疗影像文本理解模块，用于将所述文本描述通过包含词嵌入层的上下文编码器以得到语义理解特征向量；多模态特征关联模块，用于对所述医疗影像特征向量和所述语义理解特征向量进行关联编码以得到多模态关联语义特征矩阵；匹配结果生成模块，用于将所述多模态关联语义特征矩阵通过分类器以得到分类结果，所述分类结果用于表示待归档医疗影像资料所属的主题标签；以及结果响应模块，用于基于所述分类结果，将所述待归档医疗影像资料归档于所述主题标签对应的文件夹中。

2.根据权利要求1所述的医疗数据结构化归档***，其特征在于，所述医疗影像图像特征提取模块，进一步用于：使用所述卷积神经网络模型的各层在层的正向传递中分别进行：对输入数据进行卷积处理以得到卷积特征图；对所述卷积特征图进行基于局部特征矩阵的均值池化以得到池化特征图；以及对所述池化特征图进行非线性激活以得到激活特征图；其中，所述卷积神经网络模型的最后一层的输出为所述医疗影像特征向量，所述卷积神经网络模型的第一层的输入为所述医疗影像图像。

3.根据权利要求2所述的医疗数据结构化归档***，其特征在于，所述作为过滤器的卷积神经网络模型为深度残差网络模型。

4.根据权利要求3所述的医疗数据结构化归档***，其特征在于，所述医疗影像文本理解模块，包括：分词单元，用于对所述文本描述进行分词处理以获得多个词；词嵌入单元，用于将所述多个词通过词嵌入层以将所述多个词中各个词转化为词嵌入向量以得到词嵌入向量的序列，其中，所述嵌入层使用可学习的嵌入矩阵对所述各个词进行嵌入编码；上下文编码单元，用于将所述词嵌入向量的序列输入所述上下文编码器以得到所述多个上下文语义特征向量；以及级联单元，用于将所述多个上下文语义特征向量进行级联以得到所述语义理解特征向量。

5.根据权利要求4所述的医疗数据结构化归档***，其特征在于，所述上下文编码单元，进一步用于：将所述词嵌入向量的序列排列为输入向量；将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量；计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵；对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵；将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵；以及将所述自注意力特征矩阵与以所述词嵌入向量的序列中各个词嵌入向量作为值向量分别进行相乘以得到所述多个上下文语义特征向量。

6.根据权利要求5所述的医疗数据结构化归档***，其特征在于，所述多模态特征关联模块，进一步用于：对所述医疗影像特征向量和所述语义理解特征向量进行向量模基的希尔伯特空间约束以对所述医疗影像特征向量和所述语义理解特征向量进行关联编码以得到所述多模态关联语义特征矩阵。

7.根据权利要求6所述的医疗数据结构化归档***，其特征在于，所述多模态特征关联模块，进一步用于：以如下公式对所述医疗影像特征向量和所述语义理解特征向量进行向量模基的希尔伯特空间约束以对所述医疗影像特征向量和所述语义理解特征向量进行关联编码以得到所述多模态关联语义特征矩阵；其中，所述公式为：其中/>和/>分别表示所述医疗影像特征向量和所述语义理解特征向量，/>表示向量的二范数，/>表示以卷积算子对矩阵/>进行一维卷积，其中/>和/>是权重超参数，且/>和/>均为列向量，/>表示所述多模态关联语义特征矩阵，/>表示向量相乘。

8.根据权利要求7所述的医疗数据结构化归档***，其特征在于，所述匹配结果生成模块，包括：展开单元，用于将所述多模态关联语义特征矩阵按照行向量或者列向量展开为分类特征向量；标签概率化单元，用于将所述分类特征向量输入所述分类器的 Softmax分类函数以得到所述分类特征向量归属于各个分类标签的概率值；以及分类结果生成单元，用于将最大概率值对应的分类标签确定为所述分类结果。