WO2021179688A1

WO2021179688A1 - 医学文献检索方法、装置、电子设备及存储介质

Info

Publication number: WO2021179688A1
Application number: PCT/CN2020/131810
Authority: WO
Inventors: 曹立宇
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-10-23
Filing date: 2020-11-26
Publication date: 2021-09-16
Also published as: CN112287217B; CN112287217A

Abstract

一种医学文献检索方法、装置、电子设备及存储介质，应用于医疗科技技术领域，该方法包括：获取第一查询语句；对所述第一查询语句进行翻译，得到第二查询语句；根据所述第一查询语句以及每篇第一医学文献的标题和摘要，确定所述第一查询语句与所述每篇第一医学文献对应的第一目标相似度；根据所述第二查询语句以及每篇第二医学文献的标题和摘要，确定所述第二查询语句与所述每篇第二医学文献对应的第二目标相似度；根据所述第一目标相似度以及所述第二目标相似度，确定与所述第一查询语句对应的目标医学文献。该方法有利于提高医学文献的检索效率。

Description

医学文献检索方法、装置、电子设备及存储介质

本申请要求于2020年10月23日提交中国专利局、申请号为202011152153.X，发明名称为“医学文献检索方法、装置、电子设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及信息推荐技术领域，具体涉及一种医学文献检索方法、装置、电子设备及存储介质。

背景技术

公共医学(public medicine，PUBMED)数据库包含了大量的医学文献，海量医学文献中往往包含着某一医学领域的研究方向的发展趋势，通过对医学领域的医学文献进行阅读，可提高相关领域研究者们和相关公共卫生政策制定者们制定决策的效率和精度。然而，随着医学领域的文献发表数量飞速增长，PUBMED医学数据库也搜集了越来越多的医学文献。

发明人意识到，目前，为了提高从PUBMED医学数据库中检索效率，一般需要经验丰富的医学工作者为PUBMED医学数据库中的每篇医学文献标注一个相关主题，得到医学主题词表(Medical Subject Headings，MeSH)，这样后续检索的过程中可以将查询语句与MeSH进行关键词匹配，检索出相关的医学文献。

然而，由于PUBMED数据库中的医学文献数量较多，通过人工标注需要投入大量的人工成本，且检索结果依赖人工标注结果，导致检索效率和检索精度较低。

发明内容

本申请实施例提供了一种医学文献检索方法、装置、电子设备及存储介质，提高医学文献的检索效率和检索精度。

第一方面，本申请实施例提供一种医学文献检索方法，包括：

获取第一查询语句；

对所述第一查询语句进行翻译，得到第二查询语句，其中，所述第一查询语句和所述第二查询语句的语言类型不同；

根据所述第一查询语句以及每篇第一医学文献的标题和摘要，确定所述第一查询语句与所述每篇第一医学文献对应的第一目标相似度，其中，所述每篇第一医学文献的语言类型与所述第一查询语句相同；

根据所述第二查询语句以及每篇第二医学文献的标题和摘要，确定所述第二查询语句与所述每篇第二医学文献对应的第二目标相似度，其中，所述每篇第二医学文献的语言类型与所述第二查询语句相同；

根据所述第一目标相似度以及所述第二目标相似度，确定与所述第一查询语句对应的目标医学文献。

第二方面，本申请实施例提供一种医学文献检索装置，包括：

收发单元，用于获取第一查询语句；

处理单元，用于对所述第一查询语句进行翻译，得到第二查询语句，其中，所述第一查询语句和所述第二查询语句的语言类型不同；

所述处理单元，还用于根据所述第一查询语句以及每篇第一医学文献的标题和摘要，确定所述第一查询语句与所述每篇第一医学文献对应的第一目标相似度，其中，所述每篇第一医学文献的语言类型与所述第一查询语句相同；

所述处理单元，还用于根据所述第二查询语句以及每篇第二医学文献的标题和摘要，确定所述第二查询语句与所述每篇第二医学文献对应的第二目标相似度，其中，所述每篇第二医学文献的语言类型与所述第二查询语句相同；

所述处理单元，还用于根据所述第一目标相似度以及所述第二目标相似度，确定与所述第一查询语句对应的目标医学文献。

第三方面，本申请实施例提供一种电子设备，包括：处理器，所述处理器与存储器相连，所述存储器用于存储计算机程序，所述处理器用于执行所述存储器中存储的计算机程序，以使得所述电子设备执行以下方法：

获取第一查询语句；

第四方面，本申请实施例提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序使得计算机执行以下方法：

获取第一查询语句；

第五方面，本申请实施例提供一种计算机程序产品，所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，所述计算机可操作来使计算机执行如第一方面所述的方法。

实施本申请实施例，在检索医学文献的过程中无需提前对医学数据库中的医学文献进行标注，减少了人力成本的投入，提高了检索效率；此外，在检索医学文献的过程中，可同时检索出不同语言类型的医学文献，而且，提高了对医学文献检索的精度。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种医学文献检索方法的流程示意图；

图2为本申请实施例提供的一种网络模型的结构示意图；

图3为本申请实施例提供的一种医学文献检索装置的功能单元组成框图；

图4为本申请实施例提供的一种医学文献检索装置的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结果或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

本申请的技术方案可应用于人工智能、智慧城市、数字医疗、区块链和/或大数据技术领域，以实现文献检索。可选的，本申请涉及的数据如医学文献和/或向量等可存储于数据库中，或者可以存储于区块链中，本申请不做限定。

参阅图1，图1为本申请提供的一种医学文献检索方法的流程示意图。该医学文献排序方法应用于医学文献检索装置，该方法包括以下步骤：

101：医学文献检索装置获取第一查询语句。

其中，该第一查询语句可以是用户在该医学文献检索装置的信息输入框输入的，也可以是对用户语音进行语音识别得到的，比如，用户通过语音助手输入用户语音。本申请对获取第一查询语句的获取方式不做限定。

102：医学文献检索装置对所述第一查询语句进行翻译，得到第二查询语句。

其中，该第一查询语句和该第二查询语句的语言类型不同。

示例性的，该第一查询语句和所述第二的语言类型为中文或者英文。因此，在该第一查询语句的为中文的情况下，则可将该第一查询语句翻译为英文，得到第二查询语句；在该第一查询语句为英文的情况下，可将该第一查询语句翻译为中文，得到该第二查询语句。

应理解，本申请中主要以中文和英文两种语言类型为例进行说明，在实际应用中，还可以将第一查询语句翻译为其他类型的语言，比如，韩文、日文，等等。

示例性的，在本申请中对第一查询语句进行翻译的过程中，可以结合医学知识图谱对该第一查询语句进行翻译。具体的，可先从医学知识图谱库中获取与该第一查询语句对应的第一医学知识图谱，比如，可以通过关键词匹配的方式，得到该第一医学知识图谱，然后，结合该第一医学知识图谱，对该第一查询语句进行翻译，得到与该第一查询语句对应的第二查询语句。示例性的，可对该第一医学知识图谱进行向量化，得到该第一医学知识图谱对应的第一特征向量；对该第一查询语句中的每个单词进行词嵌入处理，得到每个单词对应的词向量；然后，对每个单词对应的词向量进行语义特征提取，得到该第一查询语句对应的第二特征向量；最后，将该第一查询语句对应的第二特征向量与该第一医学知识图谱对应的第一特征向量进行拼接，得到第一目标特征向量；根据该第一目标特征向量进行翻译，得到第二查询语句。

其中，基于第一目标特征向量进行翻译，可以使用现有的编码网络，通过依次迭代的方式翻译出该第二查询语句，不再详细描述。

可以看出，在对第一查询语句进行翻译的过程中，可以结合医学知识图谱，即结合了先验知识，进而提高了对第一查询语句翻译的精度。

103：医学文献检索装置根据所述第一查询语句以及每篇第一医学文献的标题和摘要，确定所述第一查询语句与所述每篇第一医学文献对应的第一目标相似度。

其中，每篇第一医学文献的语言类型与该第一查询语句相同。

其中，该第一文医学文献可以是医学数据库中语言类型与该第一查询语句相同的医学文献，比如，第一查询语句为英文，则将该医学数据库中的英文医学文献作为该第一医学文献，其中，该医学数据库可以为PUBMED数据库。

示例性的，可分别确定该第一查询语句与每篇第一医学文献的标题和摘要之间的第一相似度和第二相似度。比如，可通过BM25算法，确定该第一查询语句与每篇第一医学文献的标题和摘要之间的第一相似度和第二相似度。

以确定第一相似度举例来说，确定该第一查询语句中每个单词与每篇第一医学文献的标题之间的第一相关性、以及每个单词与该第一查询语句的第二相关性，并确定每个单词的权重；最后，根据每个单词与每篇第一医学文献之间的第一相关性、每个单词与该第一查询语句的第二相关性以及每个单词的权重，确定该第一相似度。

进一步地，对该第一查询语句进行实体识别，得到该第一查询语句中的实体；以及分别对每个第一医学文献的标题和摘要进行识别，得到每篇第一医学文献的标题中的实体以及摘要中的实体；然后，确定该第一查询语句中的实体与每篇第一医学文献中的标题中的实体之间的第三相似度，以及确定该第一查询语句中的实体与每篇第一医学文献的摘要中的实体之间的第四相似度。

示例性的，该第三相似度和该第四相似度可以通过杰卡德系数表征。因此，该第三相似度可以通过公式(1)表示：

应理解的是，确定第四相似度与确定第三相似度的方式类似，不再叙述。

其中，S3为第三相似度，A为第一查询语句中的实体组成的集合，B为每篇第一医学文献中的标题中的实体组成集合，丨A∩B丨可以为集合A和集合B的交集中的元素的个数，丨A∪B丨可以为集合A和集合B的并集中的元素的个数，丨A丨、丨B丨可以为集合A和集合B中元素的个数。

示例性的，确定第一查询语句中的实体、以及每篇第一医学文献的标题以及摘要中的实体均可以通过完成训练的bert模型实现。

下面以识别第一查询语句中的实体为例说明实体识别过程，后续涉及的实体识别均与此类似，不再叙述。

通过该完成训练的bert模型对该第一查询语句进行分词；通过bert模型对该第一查询语句中的每个单词进行词嵌入处理，得到每个单词对应的词向量；对每个单词对应的词向量进行语义特征提取，得到每个单词的目标词向量；根据每个单词的目标词向量，确定每个单词的类型，得到第一查询语句中的实体。

此外，在对第一查询语句中的进行实体识别的过程中，可以结合第一医学知识图谱确定第一查询语句中的实体，可以排除该第一查询语句中不是该第一医学知识图谱所对应的医学领域中的实体，得到更有利于医学文献检索的实体。具体的，首先对第一医学知识图谱中的各个实体进行向量化，得到各个实体对应的特征向量；然后，基于注意力机制，确定每个单词与各个实体之间的权重系数，即分别确定每个单词对应的词向量与各个实体的特征向量之间的相似度，然后，将各个实体对应的相似度进行归一化，得到每个单词与各个实体之间的权重系数；根据各个实体对应的权重系数对各个实体的特征向量进行加权，得到与每个单词对应的目标词向量；最后，根据每个单词对应的目标词向量，确定每个单词的类型，得到该第一查询语句中的实体。

可以看出，结合医学知识图谱，可以排除一些该第一查询语句中不是该第一医学知识图谱所对应的医学领域的实体，比如，一些、人名实体、物名实体，等等。由于排除了这些对于医学文献检索帮助不大的实体，可提高第三相似度和第四相似度的准确度，进而可以提高医学文献的检索效率和精度。

在一些可能的实施方式中，在确定第一查询语句中的实体之前，可使用bert模型分别对该医学数据库中的每篇第一医学文献的主题和摘要进行识别，得到每篇第一医学文献的主题和摘要中的实体。也就是说，可以提前识别出医学文献的主题以及摘要中的实体，这样就进行医学文献检索的过程中，就无需再对每篇医学第一医学文献的标题和摘要中的实体进行识别，提高医学文献的检索效率。

应理解的是，本申请实施例中涉及的实体(比如，医学文献的摘要和标题中的实体，或者，第一查询语句中的实体)可以包括疾病、药品、手术、基因、检验检查，等等。

最后，对该第一相似度、第二相似度、第三相似度以及第四相似度进行加权处理，得到该第一目标相似度。示例性的，该第一目标相似度可以通过公式(2)表示：

S _m1＝α ₁*S ₁+α ₂*S ₂+α ₃*S ₃+α ₄*S ₄ (公式2)；

其中，S _m1为第一目标相似度，S ₁、S ₂、S ₃以及S ₄分别与第一查询语句对应的第一相似度第一相似度、第二相似度、第三相似度以及第四相似度，α ₁、α ₂、α ₃和α ₄为预设的权重系数，且α ₁+α ₂+α ₃+α ₄＝1。

104：医学文献检索装置根据所述第二查询语句以及每篇第二医学文献的标题和摘要，确定所述第二查询语句与所述每篇第二医学文献对应的第二目标相似度。

其中，每篇第二医学文献的语言类型与所述第二查询语句相同。

同样，可将公共医学数据库中语言类型与该第二查询语句相同的医学文献作为该第二医学文献。

示例性的，与确定第一查询语句对应的第一目标相似度的方法类似，分别确定出第二查询语句与第二医学文献的标题和摘要之间的第一相似度、第二相似度；然后，再分别确定该第二查询语句中的实体与该第二医学文献的标题和摘要中的实体之间的第三相似度、第四相似度；最后，将与该第二查询语句对应的第一相似度、第二相似度、第三相似度以及第四相似度进行加权，得到与该第二查询向量对应的第二目标相似度。

105：医学文献检索装置根据所述第一查询语句与所述每篇第一医学文献对应的第一目标相似度以及所述第二查询语句与所述每篇第二医学文献对应的第二目标相似度，确定与所述第一查询语句对应的目标医学文献。

示例性的，根据该第一查询语句与每篇第一医学文献对应的第一目标相似度，将最大第一目标相似度对应的第一医学文献作为一篇目标医学文献；根据该第一查询语句与每篇第二医学文献对应的第二目标相似度，将最大第二目标相似度对应的第二医学文献作为另外一篇目标医学文献；然后，将这两篇目标医学文献作为与该第一查询语句对应的目标医学文献。

示例性，还可以这两篇目标医学文献中相似度最大的医学文献作为与该第一查询语句对应的目标医学文献。

可以看出，在本申请实施方案中，可同时检索出不同语言类型的医学文献，而且，在检索过程中无需提前对医学数据库中的医学文献进行标注，减少了人力成本的投入；而且，通过实体匹配的方式，确定查询语句中的实体与每篇医学文献的摘要以及标题中的实体之间的相似度，进一步提高对医学文献检索的精度。

在本申请的一个实施方式中，本申请的医学文献检索方法还可应用于智慧医疗场景，比如，医生可以通过本申请的医学文献检索方法快速的检索出医生想要获取的医学文献，进而可以快速找到历史病例或者文献，从而为医生的诊断提高数据参考，提高医生的诊断效率和精度，推送医疗科技的发展。

在一些可能的实施方式中，上述确定第一目标相似度以及第二目标相似度可以通过完成训练的网络模型实现。下面结合网络模型的结构，并以确定第一目标相似度为例，说明本申请的医学文献检索方法的实现过程。其中，确定第二目标相似度的方式与确定第一目标相似度的方式类似，不再叙述。

参阅图2，该网络模型包括嵌入层1、嵌入层2、特征提取网络1、特征提取网络2、特征提取网络3、特征提取网络4、解码网络以及图谱转换网络。其中，嵌入层1、嵌入层2、嵌入层3以及图谱转换网络可以为基于bert模型的网络，用于词嵌入；特征提取网络1、特征提取网络2、特征提取网络3以及特征提取网络4可以为通用的特征提取网络，用于语义特征提取，比如，可以为长短期记忆网络LSTM、循环神经网络RNN，等等；解码网络(Decoder)，可以包括多个堆栈层。

示例性的，嵌入层1用于对第一查询语句中的每个单词进行词嵌入，得到每个单词对应的词向量，特征提取网络1用于对每个单词的词向量进行语义特征提取，得到该第一查询语句对应的第二特征向量；然后，从医学知识图谱库中获取与该第一查询语句匹配的第一医学知识图谱；嵌入层2用于分别对该第一医学知识图谱中的医学知识(比如，疾病名称、注意事项、实体，等等)进行词嵌入，得到以医学知识对应的特征向量；特征提取网络2用于对医学知识对应的特征向量进行特征提取，得到第一医学知识图谱对应的第一特征向量；

然后，对该第一特征向量和第二特征向量进行拼接，得到与该第一查询语句对应的第一目标特征向量；解码网络用于根据该第一目标特征向量进行翻译，得到与该第一查询语句对应的第二查询语句；

然后，根据自注意力机制，确定每个单词的词向量与第一医学知识图谱中各个实体的特征向量之间的相似度，得到每个单词与各个实体之间的权重系数；使用每个单词与各个实体之间的权重系数，对各个实体对应的特征向量进行加权，得到每个单词对应的目标词向量；

进一步的，特征提取网络3用于对每个单词的目标词向量进行特征提取，得到与该第一查询语句对应的目标特征向量，并根据该第一查询语句对应的目标特征向量对该第一查询语句中的单词进行分类，得到该第一查询语句中的实体3；

示例性的，基于BM25算法，分别计算出第一查询语句与该第一医学文献的标题和摘要之间的第一相似度以及第二相似度；

示例性的，嵌入层2用于分别对第一医学文献的标题和摘要进行词嵌入，得到标题以及摘要对应的词向量；然后，特征提取网络4用于对标题以及摘要对应的词向量进行特征提取，并进行分类，分别得到标题中的实体1以及摘要中的实体2；然后，确定实体1与实体3之间的第三相似度，以及实体2与实体3之间的第四相似度；

最后，对该第一相似度、第二相似度、第三相似度以及第四相似度进行加权，得到与每篇第一医学文献对应的第一目标相似度。

参阅图3，图3为本申请实施例提供的一种医学文献检索装置的功能单元组成框图。医学文献检索装置300包括：收发单元301和处理单元302，其中：

收发单元301，用于获取第一查询语句；

处理单元302，用于对所述第一查询语句进行翻译，得到第二查询语句，其中，所述第一查询语句和所述第二查询语句的语言类型不同；

处理单元302，还用于根据所述第一查询语句以及每篇第一医学文献的标题和摘要，确定所述第一查询语句与所述每篇第一医学文献对应的第一目标相似度，其中，所述每篇第一医学文献的语言类型与所述第一查询语句相同；

处理单元302，还用于根据所述第二查询语句以及每篇第二医学文献的标题和摘要，确定所述第二查询语句与所述每篇第二医学文献对应的第二目标相似度，其中，所述每篇第二医学文献的语言类型与所述第二查询语句相同；

处理单元302，还用于根据所述第一目标相似度以及所述第二目标相似度，确定与所述第一查询语句对应的目标医学文献。

在一些可能的实施方式中，在对所述第一查询语句进行翻译，得到第二查询语句方面，处理单元302，具体用于：

获取医学知识图谱库中与所述第一查询语句对应的第一医学知识图谱；

根据所述第一医学知识图谱，对所述第一查询语句进行翻译，得到所述第二查询语句。

在一些可能的实施方式中，在根据所述第一医学知识图谱，对所述第一查询语句进行翻译，得到所述第二查询语句方面，处理单元302，具体用于：

对所述第一医学知识图谱进行向量化，得到所述第一医学知识图谱对应的第一特征向量；

对所述第一查询语句中的每个单词进行词嵌入处理，得到所述每个单词对应的词向量；

对所述每个单词对应的词向量进行语义特征提取，得到所述第一查询语句对应的第二特征向量；

将所述第一查询语句对应的第二特征向量与所述第一特征向量进行拼接，得到第一目标特征向量；

根据所述第一目标特征向量进行翻译，得到所述第二查询语句。

在一些可能的实施方式中，在根据所述第一查询语句以及每篇第一医学文献的标题和摘要，确定所述第一查询语句与所述每篇第一医学文献对应的第一目标相似度方面，处理单元302，具体用于：

分别确定所述第一查询语句与每篇第一医学文献的标题和摘要之间的第一相似度和第二相似度

对所述第一查询语句进行实体识别，得到所述第一查询语句中的实体；

分别对所述每篇第一医学文献的标题和摘要进行识别，得到所述每篇第一医学文献的标题中的实体以及摘要中的实体；

确定所述第一查询语句中的实体与所述每篇第一医学文献中的标题中的实体之间的第三相似度，以及与所述每篇第一医学文献的摘要中的实体之间的第四相似度；

根据所述第一相似度、所述第二相似度、所述第三相似度以及所述第四相似度，确定所述第一查询语句与所述每篇第一医学文献对应的第一目标相似度。

在一些可能的实施方式中，在确定所述第一查询语句中的实体与所述每篇第一医学文献中的标题中的实体之间的第三相似度，以及与所述每篇第一医学文献的摘要中的实体之间的第四相似度方面，处理单元302，具体用于：

确定所述第一查询语句中的实体与所述每篇第一医学文献中的标题中的实体之间的第一杰卡德系数，并将所述第一杰卡德系数作为所述第三相似度；

确定所述第一查询语句中的实体与所述每篇第一医学文献的摘要中的实体之间的第二杰卡德系数，并将所述第二杰卡德系数作为所述第四相似度。

在一些可能的实施方式中，在对所述第一查询语句进行实体识别，得到所述第一查询语句中的实体方面，处理单元302，具体用于：

对所述第一查询语句中的每个单词进行词嵌入，得到与所述每个单词对应的词向量；

对所述第一医学知识图谱中的各个实体进行向量化，得到所述第一医学知识图谱中的各个实体的特征向量；

确定所述每个单词对应的词向量与所述第一医学知识图谱中的各个实体的特征向量之间的权重系数；

根据所述权重系数对所述第一医学知识图谱中的各个实体的特征向量进行加权，得到所述每个单词对应的目标词向量；

根据所述每个单词对应的目标词向量对所述每个单词进行分类，得到所述第一查询语句中的实体。

在一些可能的实施方式中，在根据所述第一目标相似度以及所述第二目标相似度，确定与所述第一查询语句对应的目标医学文献方面，处理单元302，具体用于：

将最大第一目标相似度对应的第一医学文献作为一篇目标医学文献；

将最大第二目标相似度对应的第二医学文献作为另外一篇目标医学文献；

将两篇目标医学文献作为与所述第一查询语句对应的目标医学文献。

参阅图4，图4为本申请实施例提供的一种电子设备的结构示意图。该电子设备包括：处理器，所述处理器与存储器相连，所述存储器用于存储计算机程序，所述处理器用于执行所述存储器中存储的计算机程序，以使得所述电子设备执行上述方法。例如，如图4所示，电子设备400包括收发器401、处理器402和存储器403。它们之间通过总线404连接。存储器403用于存储计算机程序和数据，并可以将存储403存储的数据传输给处理器402。

处理器402用于读取存储器403中的计算机程序执行以下操作：

获取第一查询语句；

在一些可能的实施方式中，在对所述第一查询语句进行翻译，得到第二查询语句方面，处理器402具体用于执行以下操作：

在一些可能的实施方式中，在根据所述第一医学知识图谱，对所述第一查询语句进行翻译，得到所述第二查询语句方面，处理器402具体用于执行以下操作：

在一些可能的实施方式中，在根据所述第一查询语句以及每篇第一医学文献的标题和摘要，确定所述第一查询语句与所述每篇第一医学文献对应的第一目标相似度方面，处理器402具体用于执行以下操作：

在一些可能的实施方式中，在确定所述第一查询语句中的实体与所述每篇第一医学文献中的标题中的实体之间的第三相似度，以及与所述每篇第一医学文献的摘要中的实体之间的第四相似度方面，处理器402具体用于执行以下操作：

在一些可能的实施方式中，在对所述第一查询语句进行实体识别，得到所述第一查询语句中的实体方面，处理器402具体用于执行以下操作：

在一些可能的实施方式中，在根据所述第一目标相似度以及所述第二目标相似度，确定与所述第一查询语句对应的目标医学文献方面，处理器402具体用于执行以下操作：

具体地，上述收发器401可为图3所述的实施例的医学文献检索装置300的收发单元301，上述处理器402可以为图3所述的实施例的医学文献检索装置300的处理单元302。

应理解，本申请中的医学文献检索装置可以包括智能手机(如Android手机、iOS手机、Windows Phone手机等)、平板电脑、掌上电脑、笔记本电脑、移动互联网设备MID(Mobile Internet Devices，简称：MID)或穿戴式设备等。上述医学文献检索装置仅是举例，而非穷举，包含但不限于上述医学文献检索装置。在实际应用中，上述医学文献检索装置还可以包括：智能车载终端、计算机设备，等等。

本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现如上述方法实施例中记载的任何一种医学文献检索方法的部分或全部步骤。

可选的，本申请涉及的存储介质如计算机可读存储介质可以是非易失性的，也可以是易失性的。

本申请实施例还提供一种计算机程序产品，所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，所述计算机程序可操作来使计算机执行如上述方法实施例中记载的任何一种医学文献检索方法的部分或全部步骤。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于可选实施例，所涉及的动作和模块并不一定是本申请所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置，可通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件程序模块的形式实现。

所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储器中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储器中，存储器可以包括：闪存盘、只读存储器(英文：Read-Only Memory，简称：ROM)、随机存取器(英文：Random Access Memory，简称：RAM)、磁盘或光盘等。

以上对本申请实施例进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

一种医学文献检索方法，包括：

获取第一查询语句；

对所述第一查询语句进行翻译，得到第二查询语句，其中，所述第一查询语句和所述第二查询语句的语言类型不同；

根据所述第一查询语句以及每篇第一医学文献的标题和摘要，确定所述第一查询语句与所述每篇第一医学文献对应的第一目标相似度，其中，所述每篇第一医学文献的语言类型与所述第一查询语句相同；

根据所述第二查询语句以及每篇第二医学文献的标题和摘要，确定所述第二查询语句与所述每篇第二医学文献对应的第二目标相似度，其中，所述每篇第二医学文献的语言类型与所述第二查询语句相同；

根据所述第一目标相似度以及所述第二目标相似度，确定与所述第一查询语句对应的目标医学文献。
根据权利要求1所述的方法，其中，所述对所述第一查询语句进行翻译，得到第二查询语句，包括：

获取医学知识图谱库中与所述第一查询语句对应的第一医学知识图谱；

根据所述第一医学知识图谱，对所述第一查询语句进行翻译，得到所述第二查询语句。
根据权利要求2所述的方法，其中，所述根据所述第一医学知识图谱，对所述第一查询语句进行翻译，得到所述第二查询语句，包括：

对所述第一医学知识图谱进行向量化，得到所述第一医学知识图谱对应的第一特征向量；

对所述第一查询语句中的每个单词进行词嵌入处理，得到所述每个单词对应的词向量；

对所述每个单词对应的词向量进行语义特征提取，得到所述第一查询语句对应的第二特征向量；

将所述第一查询语句对应的第二特征向量与所述第一特征向量进行拼接，得到第一目标特征向量；

根据所述第一目标特征向量进行翻译，得到所述第二查询语句。
根据权利要求1-3中任一项所述的方法，其中，所述根据所述第一查询语句以及每篇第一医学文献的标题和摘要，确定所述第一查询语句与所述每篇第一医学文献对应的第一目标相似度，包括：

分别确定所述第一查询语句与每篇第一医学文献的标题和摘要之间的第一相似度和第二相似度

对所述第一查询语句进行实体识别，得到所述第一查询语句中的实体；

分别对所述每篇第一医学文献的标题和摘要进行识别，得到所述每篇第一医学文献的标题中的实体以及摘要中的实体；

确定所述第一查询语句中的实体与所述每篇第一医学文献中的标题中的实体之间的第三相似度，以及与所述每篇第一医学文献的摘要中的实体之间的第四相似度；

根据所述第一相似度、所述第二相似度、所述第三相似度以及所述第四相似度，确定所述第一查询语句与所述每篇第一医学文献对应的第一目标相似度。
根据权利要求4所述的方法，其中，所述确定所述第一查询语句中的实体与所述每篇第一医学文献中的标题中的实体之间的第三相似度，以及与所述每篇第一医学文献的摘要中的实体之间的第四相似度，包括：

确定所述第一查询语句中的实体与所述每篇第一医学文献中的标题中的实体之间的第一杰卡德系数，并将所述第一杰卡德系数作为所述第三相似度；

确定所述第一查询语句中的实体与所述每篇第一医学文献的摘要中的实体之间的第二杰卡德系数，并将所述第二杰卡德系数作为所述第四相似度。
根据权利要求4所述的方法，其中，所述对所述第一查询语句进行实体识别，得到所述第一查询语句中的实体，包括：

对所述第一查询语句中的每个单词进行词嵌入，得到与所述每个单词对应的词向量；

对所述第一医学知识图谱中的各个实体进行向量化，得到所述第一医学知识图谱中的各个实体的特征向量；

确定所述每个单词对应的词向量与所述第一医学知识图谱中的各个实体的特征向量之间的权重系数；

根据所述权重系数对所述第一医学知识图谱中的各个实体的特征向量进行加权，得到所述每个单词对应的目标词向量；

根据所述每个单词对应的目标词向量对所述每个单词进行分类，得到所述第一查询语句中的实体。
根据权利要求1-3中任一项所述的方法，其中，所述根据所述第一目标相似度以及所述第二目标相似度，确定与所述第一查询语句对应的目标医学文献，包括：

将最大第一目标相似度对应的第一医学文献作为一篇目标医学文献；

将最大第二目标相似度对应的第二医学文献作为另外一篇目标医学文献；

将两篇目标医学文献作为与所述第一查询语句对应的目标医学文献。
一种医学文献检索装置，包括：

收发单元，用于获取第一查询语句；

处理单元，用于对所述第一查询语句进行翻译，得到第二查询语句，其中，所述第一查询语句和所述第二查询语句的语言类型不同；

所述处理单元，还用于根据所述第一查询语句以及每篇第一医学文献的标题和摘要，确定所述第一查询语句与所述每篇第一医学文献对应的第一目标相似度，其中，所述每篇第一医学文献的语言类型与所述第一查询语句相同；

所述处理单元，还用于根据所述第二查询语句以及每篇第二医学文献的标题和摘要，确定所述第二查询语句与所述每篇第二医学文献对应的第二目标相似度，其中，所述每篇第二医学文献的语言类型与所述第二查询语句相同；

所述处理单元，还用于根据所述第一目标相似度以及所述第二目标相似度，确定与所述第一查询语句对应的目标医学文献。
一种电子设备，包括：处理器，所述处理器与存储器相连，所述存储器用于存储计算机程序，所述处理器用于执行所述存储器中存储的计算机程序，以使得所述电子设备执行以下方法：

获取第一查询语句；

对所述第一查询语句进行翻译，得到第二查询语句，其中，所述第一查询语句和所述第二查询语句的语言类型不同；

根据所述第一查询语句以及每篇第一医学文献的标题和摘要，确定所述第一查询语句与所述每篇第一医学文献对应的第一目标相似度，其中，所述每篇第一医学文献的语言类型与所述第一查询语句相同；

根据所述第二查询语句以及每篇第二医学文献的标题和摘要，确定所述第二查询语句与所述每篇第二医学文献对应的第二目标相似度，其中，所述每篇第二医学文献的语言类型与所述第二查询语句相同；

根据所述第一目标相似度以及所述第二目标相似度，确定与所述第一查询语句对应的目标医学文献。
根据权利要求9所述的电子设备，其中，所述对所述第一查询语句进行翻译，得到第二查询语句时，具体执行：

获取医学知识图谱库中与所述第一查询语句对应的第一医学知识图谱；

根据所述第一医学知识图谱，对所述第一查询语句进行翻译，得到所述第二查询语句。
根据权利要求10所述的电子设备，其中，所述根据所述第一医学知识图谱，对所述第一查询语句进行翻译，得到所述第二查询语句时，具体执行：

对所述第一医学知识图谱进行向量化，得到所述第一医学知识图谱对应的第一特征向量；

对所述第一查询语句中的每个单词进行词嵌入处理，得到所述每个单词对应的词向量；

对所述每个单词对应的词向量进行语义特征提取，得到所述第一查询语句对应的第二特征向量；

将所述第一查询语句对应的第二特征向量与所述第一特征向量进行拼接，得到第一目标特征向量；

根据所述第一目标特征向量进行翻译，得到所述第二查询语句。
根据权利要求9-11中任一项所述的电子设备，其中，所述根据所述第一查询语句以及每篇第一医学文献的标题和摘要，确定所述第一查询语句与所述每篇第一医学文献对应的第一目标相似度时，具体执行：

分别确定所述第一查询语句与每篇第一医学文献的标题和摘要之间的第一相似度和第二相似度

对所述第一查询语句进行实体识别，得到所述第一查询语句中的实体；

分别对所述每篇第一医学文献的标题和摘要进行识别，得到所述每篇第一医学文献的标题中的实体以及摘要中的实体；

确定所述第一查询语句中的实体与所述每篇第一医学文献中的标题中的实体之间的第三相似度，以及与所述每篇第一医学文献的摘要中的实体之间的第四相似度；

根据所述第一相似度、所述第二相似度、所述第三相似度以及所述第四相似度，确定所述第一查询语句与所述每篇第一医学文献对应的第一目标相似度。
根据权利要求12所述的电子设备，其中，所述确定所述第一查询语句中的实体与所述每篇第一医学文献中的标题中的实体之间的第三相似度，以及与所述每篇第一医学文献的摘要中的实体之间的第四相似度时，具体执行：

确定所述第一查询语句中的实体与所述每篇第一医学文献中的标题中的实体之间的第一杰卡德系数，并将所述第一杰卡德系数作为所述第三相似度；

确定所述第一查询语句中的实体与所述每篇第一医学文献的摘要中的实体之间的第二杰卡德系数，并将所述第二杰卡德系数作为所述第四相似度。
根据权利要求12所述的电子设备，其中，所述对所述第一查询语句进行实体识别，得到所述第一查询语句中的实体时，具体执行：

对所述第一查询语句中的每个单词进行词嵌入，得到与所述每个单词对应的词向量；

对所述第一医学知识图谱中的各个实体进行向量化，得到所述第一医学知识图谱中的各个实体的特征向量；

确定所述每个单词对应的词向量与所述第一医学知识图谱中的各个实体的特征向量之间的权重系数；

根据所述权重系数对所述第一医学知识图谱中的各个实体的特征向量进行加权，得到所述每个单词对应的目标词向量；

根据所述每个单词对应的目标词向量对所述每个单词进行分类，得到所述第一查询语句中的实体。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现以下方法：

获取第一查询语句；

对所述第一查询语句进行翻译，得到第二查询语句，其中，所述第一查询语句和所述第二查询语句的语言类型不同；

根据所述第一查询语句以及每篇第一医学文献的标题和摘要，确定所述第一查询语句与所述每篇第一医学文献对应的第一目标相似度，其中，所述每篇第一医学文献的语言类型与所述第一查询语句相同；

根据所述第二查询语句以及每篇第二医学文献的标题和摘要，确定所述第二查询语句与所述每篇第二医学文献对应的第二目标相似度，其中，所述每篇第二医学文献的语言类型与所述第二查询语句相同；

根据所述第一目标相似度以及所述第二目标相似度，确定与所述第一查询语句对应的目标医学文献。
根据权利要求15所述的计算机可读存储介质，其中，所述对所述第一查询语句进行翻译，得到第二查询语句时，具体实现：

获取医学知识图谱库中与所述第一查询语句对应的第一医学知识图谱；

根据所述第一医学知识图谱，对所述第一查询语句进行翻译，得到所述第二查询语句。
根据权利要求16所述的计算机可读存储介质，其中，所述根据所述第一医学知识图谱，对所述第一查询语句进行翻译，得到所述第二查询语句时，具体实现：

对所述第一医学知识图谱进行向量化，得到所述第一医学知识图谱对应的第一特征向量；

对所述第一查询语句中的每个单词进行词嵌入处理，得到所述每个单词对应的词向量；

对所述每个单词对应的词向量进行语义特征提取，得到所述第一查询语句对应的第二特征向量；

将所述第一查询语句对应的第二特征向量与所述第一特征向量进行拼接，得到第一目标特征向量；

根据所述第一目标特征向量进行翻译，得到所述第二查询语句。
根据权利要求15-17中任一项所述的计算机可读存储介质，其中，所述根据所述第一查询语句以及每篇第一医学文献的标题和摘要，确定所述第一查询语句与所述每篇第一医学文献对应的第一目标相似度时，具体实现：

分别确定所述第一查询语句与每篇第一医学文献的标题和摘要之间的第一相似度和第二相似度

对所述第一查询语句进行实体识别，得到所述第一查询语句中的实体；

分别对所述每篇第一医学文献的标题和摘要进行识别，得到所述每篇第一医学文献的标题中的实体以及摘要中的实体；

确定所述第一查询语句中的实体与所述每篇第一医学文献中的标题中的实体之间的第三相似度，以及与所述每篇第一医学文献的摘要中的实体之间的第四相似度；

根据所述第一相似度、所述第二相似度、所述第三相似度以及所述第四相似度，确定所述第一查询语句与所述每篇第一医学文献对应的第一目标相似度。
根据权利要求18所述的计算机可读存储介质，其中，所述确定所述第一查询语句中的实体与所述每篇第一医学文献中的标题中的实体之间的第三相似度，以及与所述每篇第一医学文献的摘要中的实体之间的第四相似度时，具体实现：

确定所述第一查询语句中的实体与所述每篇第一医学文献中的标题中的实体之间的第一杰卡德系数，并将所述第一杰卡德系数作为所述第三相似度；

确定所述第一查询语句中的实体与所述每篇第一医学文献的摘要中的实体之间的第二杰卡德系数，并将所述第二杰卡德系数作为所述第四相似度。
根据权利要求18所述的计算机可读存储介质，其中，所述对所述第一查询语句进行实体识别，得到所述第一查询语句中的实体时，具体实现：

对所述第一查询语句中的每个单词进行词嵌入，得到与所述每个单词对应的词向量；

对所述第一医学知识图谱中的各个实体进行向量化，得到所述第一医学知识图谱中的各个实体的特征向量；

确定所述每个单词对应的词向量与所述第一医学知识图谱中的各个实体的特征向量之间的权重系数；

根据所述权重系数对所述第一医学知识图谱中的各个实体的特征向量进行加权，得到所述每个单词对应的目标词向量；

根据所述每个单词对应的目标词向量对所述每个单词进行分类，得到所述第一查询语句中的实体。