CN110134796A - 基于知识图谱的临床试验检索方法、装置、计算机设备及存储介质 - Google Patents
基于知识图谱的临床试验检索方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN110134796A CN110134796A CN201910315985.XA CN201910315985A CN110134796A CN 110134796 A CN110134796 A CN 110134796A CN 201910315985 A CN201910315985 A CN 201910315985A CN 110134796 A CN110134796 A CN 110134796A
- Authority
- CN
- China
- Prior art keywords
- label
- entity
- keyword
- search
- knowledge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开了基于知识图谱的临床试验检索方法、装置、计算机设备及存储介质,可支持中文搜索也可支持英文搜索,对获取的待检索信息进行解析从而获取相应的关键词及逻辑关系式;通过对关键词进行分析基于知识图谱查询拓展获取相应的搜索实体,采用知识图谱的查询方式可获取与关键词相近的相应搜索实体,从而在关键词的基础上扩大了搜索对象的数量,并且提高了搜索的召回率及准确性,并提高了检索的性能;依据逻辑关系式及搜索实体在存储单元中进行搜索获取相应的临床试验数据并生成图表,从而直观准确的展示搜索结果。
Description
技术领域
本发明涉及信息技术领域,尤其涉及基于知识图谱的临床试验检索方法、装置、计算机设备及存储介质。
背景技术
信息检索研究是伴随着科学技术的发展和各种形式信息量的剧增而兴起的研究领域。随着网络的普及,医学研究工作者和医生们经常通过搜索引擎来获取所需的医学信息,目前常用的临床试验检索工具主要有:只能用英文搜索的美国的ClinicalTrials.gov、只能用中文搜索的中国临床试验注册中心和医药魔方的PharmaGO。
美国的ClinicalTrials.gov应用的是模糊的关键字匹配技术,采用这种匹配技术容易导致准确率低,例如:搜索“Diabetes Type 2”(2型糖尿病),只涉及“Diabetes”(糖尿病)的试验也会被返回,且只能用英文搜索,语言和数据来源存在局限性;
中国的中国临床试验注册中心只能用中文,语言和数据来源存在局限性;
医药魔方的PharmaGO采用精确的关键字匹配技术。例如:搜索“2型糖尿病”由于匹配技术过于精确,会把一些同义词也排除掉,因此搜索结果也会将单纯的糖尿病的相关内容排除掉,只会显示与“2型糖尿病”相关的搜索结果;同理,搜索“hand,foot and mouthdisease”(手足口病),也不会输出与“handfoot-mouth disease”(手足口病的另一种说法)相关的搜索结果,输出的结果不够全面召回率低。医药魔方的PharmaGO虽然英文临床试验数据和中文临床试验数据都有,但这两种数据是两个分离的模块,分别支持英文搜索和中文搜索;无法支持一个搜索请求同时查询中英文内容,因此在一个工具中无法合并不同语言的数据源,语言和数据来源存在局限性。
综上所述,现有的临床试验检索工具主要存在:语言和数据来源存在局限性,搜索精度不够的问题。
发明内容
针对现有的临床试验检索工具存在搜索精度不够、语言和数据来源存在局限性的问题,现提供一种旨在可提高搜索的有效精度、召回率,同时支持中文、英文的数据源的基于知识图谱的临床试验检索方法、装置、计算机设备及存储介质。
为实现上述目的,本发明提供一种基于知识图谱的临床试验检索方法,提供一知识图谱和一存储单元,所述存储单元用于存储临床试验数据,所述临床试验数据包括多个临床试验信息;所述方法包括下述步骤:
S1.获取待检索信息;
S2.解析所述待检索信息获取至少一个关键词,基于所述至少一个关键词生成逻辑关系式;
S3.对所述至少一个关键词进行分析基于所述知识图谱查询拓展获取至少一个搜索实体;
S4.根据所述逻辑关系式及所述至少一个搜索实体在所述存储单元中进行搜索获取相应的临床试验数据并生成图表。
优选的,所述步骤S2中解析所述待检索信息获取至少一个关键词,基于所述至少一个关键词生成逻辑关系式,包括:
S21.将所述待检索信息转换为预设数据格式的待检索数据;
S22.对所述待检索数据进行语义分析获取至少一个关键词;
S23.根据所述待检索数据及所述至少一个关键词生成逻辑关系式。
优选的,预设数据格式为中文数据格式。
优选的,所述知识图谱中的每一实体对应一第一标签,统一医学语言***中的每一实体对应一第二标签,所述知识图谱中实体的第一标签与所述统一医学语言***中相应实体的第二标签关联;
所述步骤S3中对所述至少一个关键词进行分析基于所述知识图谱查询拓展获取至少一个搜索实体,包括:
S31.将所述至少一个关键词与所述统一医学语言***中的实体进行匹配,获取与所述至少一个关键词匹配的至少一个目标实体及相应的第二标签;
S32.将所述至少一个目标实体的第二标签映射到所述知识图谱中,查询拓展提取与所述至少一个目标实体的第二标签关联的至少一个第一标签对应的搜索实体。
优选的,在所述步骤S32中将所述至少一个目标实体的第二标签映射到所述知识图谱中,查询拓展提取与所述至少一个目标实体的第二标签关联的至少一个第一标签对应的搜索实体,包括:
S321.将所述至少一个目标实体的第二标签映射到所述知识图谱中,获取与至少一个第二标签关联的至少一个第一标签及相应的目标实体;
S322.基于所述知识图谱中的至少一个目标实体查询拓展获取所述至少一个目标实体的同义词实体和所述至少一个目标实体的下位词实体;
所述搜索实体包括所述目标实体、所述目标实体的同义词实体和所述目标实体的下位词实体。
优选的,所述存储单元中的每一临床试验信息对应一第三标签,所述知识图谱中实体的第一标签与相应的临床试验信息的第三标签关联;
所述步骤S4中根据所述逻辑关系式及所述至少一个搜索实体在所述存储单元中进行搜索获取相应的临床试验数据并生成图表,包括:
S41.根据所述逻辑关系式及所述至少一个搜索实体生成检索表达式;
S42.基于所述检索表达式在所述存储单元中搜索,获取与所述至少一个搜索实体的第一标签关联的至少一个第三标签对应的目标临床试验信息;
S43.对所述目标临床试验信息中的数据进行统计生成图表。
优选的,所述图表包括折线图、面积图、拼图、散点图、柱状图、条形图、圆环图。
为实现上述目的,本发明还提供了一种基于知识图谱的临床试验检索装置,包括:
存储单元,用于存储临床试验数据,所述临床试验数据包括多个临床试验信息;
获取单元,用于获取待检索信息;
解析单元,用于解析所述待检索信息获取至少一个关键词,基于所述至少一个关键词生成逻辑关系式;
查询单元,用于对所述至少一个关键词进行分析基于知识图谱查询拓展获取至少一个搜索实体;
搜索单元,用于根据所述逻辑关系式及所述至少一个搜索实体在所述存储单元中进行搜索获取相应的临床试验数据并生成图表。
为实现上述目的,本发明还提供了一种计算机设备,所述计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
为实现上述目的,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
本发明提供的基于知识图谱的临床试验检索方法、装置、计算机设备及存储介质,可支持中文搜索也可支持英文搜索,对获取的待检索信息进行解析从而获取相应的关键词及逻辑关系式;通过对关键词进行分析基于知识图谱查询拓展获取相应的搜索实体,采用知识图谱的查询方式可获取与关键词相近的相应搜索实体,从而在关键词的基础上扩大了搜索对象的数量,并且提高了搜索的召回率及准确性,并提高了检索的性能;依据逻辑关系式及搜索实体在存储单元中进行搜索获取相应的临床试验数据并生成图表,从而直观准确的展示搜索结果。
需要说明的是:知识图谱,英文为Knowledge Graph,又称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系;
临床试验是按照国家食品药品监督管理局颁布的《药物临床试验质量管理规范》中临床试验的定义,临床试验数据是指任何在人体(病人或健康志愿者)进行药物的***性研究,以证实或揭示试验药物的作用、不良反应及/或试验药物的吸收、分布、代谢和***的数据,临床试验目的是确定试验药物的疗效与安全性。
附图说明
图1为本发明所述的基于知识图谱的临床试验检索方法的一种实施例的流程图;
图2为本发明解析待检索信息获取关键词的一种实施例的方法流程图;
图3为本发明对关键词进行分析基于知识图谱查询拓展获取搜索实体的一种实施例的方法流程图;
图4为本发明对关键词进行分析基于知识图谱查询拓展获取搜索实体的另一种实施例的方法流程图;
图5为本发明根据逻辑关系式及搜索实体在存储单元中进行搜索获取相应的临床试验数据并生成图表的一种实施例的方法流程图;
图6为本发明所述的基于知识图谱的临床试验检索装置的一种实施例的模块图;
图7为本发明所述的计算机设备一实施例的硬件架构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
本发明提供的基于知识图谱的临床试验检索方法、装置、计算机设备及存储介质,适用于保险业务领域。本发明可支持中文搜索也可支持英文搜索,对获取的待检索信息进行解析从而获取相应的关键词及逻辑关系式;通过对关键词进行分析基于知识图谱查询拓展获取相应的搜索实体,采用知识图谱的查询方式可获取与关键词相近的相应搜索实体,从而在关键词的基础上扩大了搜索对象的数量,并且提高了搜索的召回率及准确性,并提高了检索的性能;依据逻辑关系式及搜索实体在存储单元中进行搜索获取相应的临床试验数据并生成图表,从而直观准确的展示搜索结果。
实施例一
请参阅图1,本实施例的一种基于知识图谱的临床试验检索方法,提供一知识图谱和一存储单元,所述存储单元用于存储临床试验数据,所述临床试验数据包括多个临床试验信息;所述方法包括下述步骤:
S1.获取待检索信息;
在本步骤中,待检索信息可以是一句话也可以是一个词汇,待检索信息可以是中文也可以是英文。
需要说明的是:本实施例主要应用于医学、医疗信息的检索。
S2.解析所述待检索信息获取至少一个关键词,基于所述至少一个关键词生成逻辑关系式;
在本步骤中,通过对待检索信息进行解析获取待检索信息中的关键词,若待检索信息是英文时,可通过翻译先将英文转换为中文,再根据翻译后的中文进行解析提取关键词,以便于根据该关键词进行进一步的查找,获取与其关联的搜索实体。
进一步地,在所述步骤S2中解析所述待检索信息获取至少一个关键词,基于所述至少一个关键词生成逻辑关系式具体过程包括(参考图2所示):
S21.将所述待检索信息转换为预设数据格式的待检索数据;
其中,预设数据格式为中文数据格式。
在本步骤中,当待检索信息为英文时,需将英文翻译为中文,以便于进行后续的检索;当待检索信息为中文时,可直接执行步骤S22。
S22.对所述待检索数据进行语义分析获取至少一个关键词;
在本步骤中,可通过语义分析的方式对待检索数据进行分析,提取待检索数据中的关键词,若待检索数据是一句话,则需要从该句话中提取与医学、医疗相关的所有关键词。以待检索数据是“采用胰岛素治疗2型糖尿病”为例,其中,涉及到的关键词有“胰岛素”和“2型糖尿病”。
S23.根据所述待检索数据及所述至少一个关键词生成逻辑关系式。
在本步骤中,对于待检索数据是一句话而言,逻辑关系式中各个关键词之间的关系是并的关系;以“采用胰岛素治疗2型糖尿病”为例,相应的逻辑关系式为(“胰岛素”并“2型糖尿病”)。若待检索数据中只有一个关键词,则相应的逻辑关系式为(“关键词”)。
S3.对所述至少一个关键词进行分析基于所述知识图谱查询拓展获取至少一个搜索实体;
在本步骤中,应用了知识图谱中实体间的联系结构,可从一个实体节点找到与其关联的其他实体节点,从而组成搜索实体,根据该搜索实体进行搜索,提高搜索的准确性及召回率,避免了仅仅根据关键词造成的查全率低的问题。
所述知识图谱中的每一实体对应一第一标签,统一医学语言***((英文:UnifiedMedical Language System,简称UMLS)是美国国立医学图书馆持续开发了20多年的巨型医学术语***,涵盖了临床、基础、药学、生物学、医学管理等医学及与医学相关学科,收录了约200万个医学概念,医学词汇更是空前,达到了500多万个)中的每一实体对应一第二标签,所述知识图谱中实体的第一标签与所述统一医学语言***中相应实体的第二标签关联;
预先将统一医学语言***中的每个医学词汇分别采用第二标签进行标识,并将知识图谱中的每个实体分别采用第一标签进行标识,并根据关联关系建立了一个第二标签与第一标签关联的表单。
进一步地,所述步骤S3中对所述至少一个关键词进行分析基于所述知识图谱查询拓展获取至少一个搜索实体具体过程包括(参考图3所示):
S31.将所述至少一个关键词与所述统一医学语言***中的实体进行匹配,获取与所述至少一个关键词匹配的至少一个目标实体及相应的第二标签;
在本步骤中,当关键词有多个时,可分别将每一个关键词与统一医学语言***中的实体进行匹配,从而获取与该关键词对应的第二标签。
S32.将所述至少一个目标实体的第二标签映射到所述知识图谱中,查询拓展提取与所述至少一个目标实体的第二标签关联的至少一个第一标签对应的搜索实体。
作为举例而非限定,以关键词为“Diabetes”(糖尿病)为例,可采用MetaMap工具(一款由美国国立医学图书馆开发的医学信息抽取工具),得到Diabetes对应的UMLS中的标签ID,假设是“C347”。在知识图谱(图谱中有大量的医学术语信息)中可以通过UMLS中的标签ID对应到一个实体,如“C347”对应的搜索实体为“B”。
进一步地,在所述步骤S32中将所述至少一个目标实体的第二标签映射到所述知识图谱中,查询拓展提取与所述至少一个目标实体的第二标签关联的至少一个第一标签对应的搜索实体具体过程包括(参考图4所示):
S321.将所述至少一个目标实体的第二标签映射到所述知识图谱中,获取与至少一个第二标签关联的至少一个第一标签及相应的目标实体;
S322.基于所述知识图谱中的至少一个目标实体查询拓展获取所述至少一个目标实体的同义词实体和所述至少一个目标实体的下位词实体;
所述搜索实体包括所述目标实体、所述目标实体的同义词实体和所述目标实体的下位词实体。
一般而言,一个实体有一个标准名称和一些常用名称,就目标实体“糖尿病”而言,它的标准名称是“糖尿病”,它的常用名称有“消渴”、“DM-糖尿病”等等。在本步骤中,当目标实体为“糖尿病”时,在知识图谱查询拓展后可查找到“糖尿病”的同义词实体如“消渴”、“DM-糖尿病”等;同时还可查找到“糖尿病”的下位词实体如“1型糖尿病”、“2型糖尿病”。因此,与“糖尿病”对应的搜索实体包括了“消渴”、“DM-糖尿病”“1型糖尿病”和“2型糖尿病”,采用该搜索实体进行搜索可保证搜索的查准率和查全率,大大的提升搜索的性能。
S4.根据所述逻辑关系式及所述至少一个搜索实体在所述存储单元中进行搜索获取相应的临床试验数据并生成图表。
在本实施例中,在将获取的搜索实体添加到逻辑关系式中与所述搜索实体对应的关键词并列的位置,生成检索表达式作为最终的搜索对象进行搜索,可大大提高搜索的准确率。
所述存储单元中的每一临床试验信息对应一第三标签,所述知识图谱中实体的第一标签与相应的临床试验的第三标签关联;
预先将存储单元中的每个临床试验信息分别采用第三标签进行标识,并根据关联关系建立了一个第三标签与第一标签关联的表单。
需要说明的是:存储单元中存储的临床试验信息可包括中文的临床试验信息和英文的临床试验信息,第三标签采用中文标签,该中文标签用于标识临床试验的内容,以保证数据源的全面性。
进一步地,所述步骤S4中根据所述逻辑关系式及所述至少一个搜索实体在所述存储单元中进行搜索获取相应的临床试验数据并生成图表具体过程包括(参考图5所示):
S41.根据所述逻辑关系式及所述至少一个搜索实体生成检索表达式;
在本步骤中,可将获取的搜索实体填入逻辑关系式的相应位置,从而形成检索表达式,根据该检索表达式在存储单元中进行搜索。
S42.基于所述检索表达式在所述存储单元中搜索,获取与所述至少一个搜索实体的第一标签关联的至少一个第三标签对应的目标临床试验信息;
S43.对所述目标临床试验信息中的数据进行统计生成图表。
其中,所述图表可包括折线图、面积图、拼图、散点图、柱状图、条形图、圆环图。
在本步骤中,可将临床试验的一些关键信息的分布以统计图表的方式展示出来。如搜索到了100个搜索结果,可根据这些试验中所有患者的年龄分布、性别分布、临床试验阶段分布等,制作成统计图表,供用户直观的查看搜索的信息。
本发明基于知识图谱的临床试验检索方法可支持中文搜索也可支持英文搜索,对获取的待检索信息进行解析从而获取相应的关键词及逻辑关系式;通过对关键词进行分析基于知识图谱查询拓展获取相应的搜索实体,采用知识图谱的查询方式可获取与关键词相近的相应搜索实体,从而在关键词的基础上扩大了搜索对象的数量,并且提高了搜索的召回率及准确性,并提高了检索的性能;依据逻辑关系式及搜索实体在存储单元中进行搜索获取相应的临床试验数据并生成图表,从而直观准确的展示搜索结果。
实施例二
请参阅图6,本实施例的一种基于知识图谱的临床试验检索装置1,包括:存储单元11、获取单元12、解析单元13、查询单元14和搜索单元15,其中:
存储单元11,用于存储临床试验数据,所述临床试验数据包括多个临床试验信息;
获取单元12,用于获取待检索信息;
待检索信息可以是一句话也可以是一个词汇,待检索信息可以是中文也可以是英文。
需要说明的是:本实施例主要应用于医学、医疗信息的检索。
解析单元13,用于解析所述待检索信息获取至少一个关键词,基于所述至少一个关键词生成逻辑关系式;
通过对待检索信息进行解析获取待检索信息中的关键词,若待检索信息是英文时,可先将英文转换为中文,再根据翻译后的中文进行解析提取关键词,以便于根据该关键词进行进一步的查找,获取与其关联的搜索实体。
查询单元14,用于对所述至少一个关键词进行分析基于知识图谱查询拓展获取至少一个搜索实体;
应用了知识图谱中实体间的联系结构,可从一个实体节点找到与其关联的其他实体节点,从而组成搜索实体,根据该搜索实体进行搜索,提高搜索的准确性及召回率,避免了仅仅根据关键词造成的查全率低的问题。
搜索单元15,用于根据所述逻辑关系式及所述至少一个搜索实体在所述存储单元11中进行搜索获取相应的临床试验数据并生成图表。
将获取的搜索实体填入逻辑关系式的相应位置,作为最终的搜索对象进行搜索,可大大提高搜索的准确率。
在本实施例中,对获取的待检索信息进行解析从而获取相应的关键词及逻辑关系式;通过对关键词进行分析基于知识图谱查询拓展获取相应的搜索实体,采用知识图谱的查询方式可获取与关键词相近的相应搜索实体,从而在关键词的基础上扩大了搜索对象的数量,并且提高了搜索的召回率及准确性,并提高了检索的性能;依据逻辑关系式及搜索实体在存储单元11中进行搜索获取相应的临床试验数据并生成图表,从而直观准确的展示搜索结果。
实施例三:
为实现上述目的,本发明还提供一种计算机设备2,该计算机设备2包括多个计算机设备2,实施例二的基于知识图谱的临床试验检索装置1的组成部分可分散于不同的计算机设备2中,计算机设备2可以是执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。本实施例的计算机设备2至少包括但不限于:可通过***总线相互通信连接的存储器21、处理器23、网络接口22以及基于知识图谱的临床试验检索装置1(参考图7)。需要指出的是,图7仅示出了具有组件-的计算机设备2,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
本实施例中,所述存储器21至少包括一种类型的计算机可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器21可以是计算机设备2的内部存储单元,例如该计算机设备2的硬盘或内存。在另一些实施例中,存储器21也可以是计算机设备2的外部存储设备,例如该计算机设备2上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器21还可以既包括计算机设备2的内部存储单元也包括其外部存储设备。本实施例中,存储器21通常用于存储安装于计算机设备2的操作***和各类应用软件,例如实施例一的基于知识图谱的临床试验检索方法的程序代码等。此外,存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器23在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器23通常用于控制计算机设备2的总体操作例如执行与所述计算机设备2进行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器23用于运行所述存储器21中存储的程序代码或者处理数据,例如运行所述的基于知识图谱的临床试验检索装置1等。
所述网络接口22可包括无线网络接口或有线网络接口,该网络接口22通常用于在所述计算机设备2与其他计算机设备2之间建立通信连接。例如,所述网络接口22用于通过网络将所述计算机设备2与外部终端相连,在所述计算机设备2与外部终端之间的建立数据传输通道和通信连接等。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯***(Global System of Mobile communication,GSM)、宽带码分多址(WidebandCode Division Multiple Access,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。
需要指出的是,图7仅示出了具有部件21-23的计算机设备2,但是应理解的是,并不要求实施所有示出的部件,可以替代的实施更多或者更少的部件。
在本实施例中,存储于存储器21中的所述基于知识图谱的临床试验检索装置1还可以被分割为一个或者多个程序模块,所述一个或者多个程序模块被存储于存储器21中,并由一个或多个处理器(本实施例为处理器23)所执行,以完成本发明。
实施例四:
为实现上述目的,本发明还提供一种计算机可读存储介质,其包括多个存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,程序被处理器23执行时实现相应功能。本实施例的计算机可读存储介质用于存储基于知识图谱的临床试验检索装置1,被处理器23执行时实现实施例一的基于知识图谱的临床试验检索方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种基于知识图谱的临床试验检索方法,其特征在于:提供一知识图谱和一存储单元,所述存储单元用于存储临床试验数据,所述临床试验数据包括多个临床试验信息;所述方法包括下述步骤:
S1.获取待检索信息;
S2.解析所述待检索信息获取至少一个关键词,基于所述至少一个关键词生成逻辑关系式;
S3.对所述至少一个关键词进行分析,基于所述知识图谱查询拓展获取至少一个搜索实体;
S4.根据所述逻辑关系式及所述至少一个搜索实体在所述存储单元中进行搜索获取相应的临床试验数据并生成图表。
2.根据权利要求1所述的基于知识图谱的临床试验检索方法,其特征在于:所述步骤S2中解析所述待检索信息获取至少一个关键词,基于所述至少一个关键词生成逻辑关系式,包括:
S21.将所述待检索信息转换为预设数据格式的待检索数据;
S22.对所述待检索数据进行语义分析获取至少一个关键词;
S23.根据所述待检索数据及所述至少一个关键词生成逻辑关系式。
3.根据权利要求2所述的基于知识图谱的临床试验检索方法,其特征在于:预设数据格式为中文数据格式。
4.根据权利要求1所述的基于知识图谱的临床试验检索方法,其特征在于:所述知识图谱中的每一实体对应一第一标签,统一医学语言***中的每一实体对应一第二标签,所述知识图谱中实体的第一标签与所述统一医学语言***中相应实体的第二标签关联;
所述步骤S3中对所述至少一个关键词进行分析基于所述知识图谱查询拓展获取至少一个搜索实体,包括:
S31.将所述至少一个关键词与所述统一医学语言***中的实体进行匹配,获取与所述至少一个关键词匹配的至少一个目标实体及相应的第二标签;
S32.将所述至少一个目标实体的第二标签映射到所述知识图谱中,查询拓展提取与所述至少一个目标实体的第二标签关联的至少一个第一标签对应的搜索实体。
5.根据权利要求4所述的基于知识图谱的临床试验检索方法,其特征在于:在所述步骤S32中将所述至少一个目标实体的第二标签映射到所述知识图谱中,查询拓展提取与所述至少一个目标实体的第二标签关联的至少一个第一标签对应的搜索实体,包括:
S321.将所述至少一个目标实体的第二标签映射到所述知识图谱中,获取与至少一个第二标签关联的至少一个第一标签及相应的目标实体;
S322.基于所述知识图谱中的至少一个目标实体查询拓展获取所述至少一个目标实体的同义词实体和所述至少一个目标实体的下位词实体;
所述搜索实体包括所述目标实体、所述目标实体的同义词实体和所述目标实体的下位词实体。
6.根据权利要求4所述的基于知识图谱的临床试验检索方法,其特征在于:所述存储单元中的每一临床试验信息对应一第三标签,所述知识图谱中实体的第一标签与相应的临床试验信息的第三标签关联;
所述步骤S4中根据所述逻辑关系式及所述至少一个搜索实体在所述存储单元中进行搜索获取相应的临床试验数据并生成图表,包括:
S41.根据所述逻辑关系式及所述至少一个搜索实体生成检索表达式;
S42.基于所述检索表达式在所述存储单元中搜索,获取与所述至少一个搜索实体的第一标签关联的至少一个第三标签对应的目标临床试验信息;
S43.对所述目标临床试验信息中的数据进行统计生成图表。
7.根据权利要求1所述的基于知识图谱的临床试验检索方法,其特征在于:所述图表包括折线图、面积图、拼图、散点图、柱状图、条形图、圆环图。
8.一种基于知识图谱的临床试验检索装置,其特征在于,包括:
存储单元,用于存储临床试验数据,所述临床试验数据包括多个临床试验信息;
获取单元,用于获取待检索信息;
解析单元,用于解析所述待检索信息获取至少一个关键词,基于所述至少一个关键词生成逻辑关系式;
查询单元,用于对所述至少一个关键词进行分析基于知识图谱查询拓展获取至少一个搜索实体;
搜索单元,用于根据所述逻辑关系式及所述至少一个搜索实体在所述存储单元中进行搜索获取相应的临床试验数据并生成图表。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910315985.XA CN110134796B (zh) | 2019-04-19 | 2019-04-19 | 基于知识图谱的临床试验检索方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910315985.XA CN110134796B (zh) | 2019-04-19 | 2019-04-19 | 基于知识图谱的临床试验检索方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110134796A true CN110134796A (zh) | 2019-08-16 |
CN110134796B CN110134796B (zh) | 2023-06-02 |
Family
ID=67570479
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910315985.XA Active CN110134796B (zh) | 2019-04-19 | 2019-04-19 | 基于知识图谱的临床试验检索方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110134796B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110472019A (zh) * | 2019-08-22 | 2019-11-19 | 北京明略软件***有限公司 | 舆情搜索方法及装置 |
CN110968717A (zh) * | 2019-11-19 | 2020-04-07 | 迪姆软件(北京)有限公司 | 动态心电数据的检索方法和装置、存储介质、处理器 |
CN111009309A (zh) * | 2019-12-06 | 2020-04-14 | 广州柏视医疗科技有限公司 | 一种头颈部***可视化展示方法、装置及存储介质 |
CN111177405A (zh) * | 2019-12-18 | 2020-05-19 | 深圳壹账通智能科技有限公司 | 数据搜索匹配方法、装置、计算机设备和存储介质 |
CN111475624A (zh) * | 2020-04-13 | 2020-07-31 | 杭州海康威视***技术有限公司 | 一种监控数据检索方法、装置及设备 |
CN111597162A (zh) * | 2020-05-19 | 2020-08-28 | 北京明略软件***有限公司 | 信息确定方法和装置、存储介质及电子装置 |
CN111930891A (zh) * | 2020-07-31 | 2020-11-13 | 中国平安人寿保险股份有限公司 | 基于知识图谱的检索文本扩展方法及相关装置 |
CN112035511A (zh) * | 2020-08-31 | 2020-12-04 | 康键信息技术(深圳)有限公司 | 基于医学知识图谱的目标数据搜索方法及相关设备 |
CN112612905A (zh) * | 2020-12-28 | 2021-04-06 | 北京明略软件***有限公司 | 基于Elasticsearch的数据处理方法、***、计算机及可读存储介质 |
CN112925883A (zh) * | 2021-02-19 | 2021-06-08 | 北京百度网讯科技有限公司 | 搜索请求处理方法、装置、电子设备及可读存储介质 |
CN114691821A (zh) * | 2020-12-29 | 2022-07-01 | 上海森亿医疗科技有限公司 | 基于医疗术语构建知识图谱的智能检索方法、***、终端以及介质 |
CN116028597A (zh) * | 2023-03-27 | 2023-04-28 | 南京燧坤智能科技有限公司 | 对象检索方法、装置、非易失性存储介质及计算机设备 |
CN117033934A (zh) * | 2023-08-02 | 2023-11-10 | 中信联合云科技有限责任公司 | 一种基于人工智能的内容生成方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107545000A (zh) * | 2016-06-28 | 2018-01-05 | 百度在线网络技术(北京)有限公司 | 基于知识图谱的信息推送方法及装置 |
CN107609152A (zh) * | 2017-09-22 | 2018-01-19 | 百度在线网络技术(北京)有限公司 | 用于扩展查询式的方法和装置 |
CN108090167A (zh) * | 2017-12-14 | 2018-05-29 | 畅捷通信息技术股份有限公司 | 数据检索的方法、***、计算设备及存储介质 |
WO2018157790A1 (zh) * | 2017-03-02 | 2018-09-07 | 腾讯科技(深圳)有限公司 | 一种相关实体确定方法、装置、计算设备及存储介质 |
CN109522465A (zh) * | 2018-10-22 | 2019-03-26 | 国家电网公司 | 基于知识图谱的语义搜索方法及装置 |
WO2019057191A1 (zh) * | 2017-09-25 | 2019-03-28 | 腾讯科技(深圳)有限公司 | 内容检索方法、终端、服务器、电子设备及存储介质 |
-
2019
- 2019-04-19 CN CN201910315985.XA patent/CN110134796B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107545000A (zh) * | 2016-06-28 | 2018-01-05 | 百度在线网络技术(北京)有限公司 | 基于知识图谱的信息推送方法及装置 |
WO2018157790A1 (zh) * | 2017-03-02 | 2018-09-07 | 腾讯科技(深圳)有限公司 | 一种相关实体确定方法、装置、计算设备及存储介质 |
CN107609152A (zh) * | 2017-09-22 | 2018-01-19 | 百度在线网络技术(北京)有限公司 | 用于扩展查询式的方法和装置 |
WO2019057191A1 (zh) * | 2017-09-25 | 2019-03-28 | 腾讯科技(深圳)有限公司 | 内容检索方法、终端、服务器、电子设备及存储介质 |
CN108090167A (zh) * | 2017-12-14 | 2018-05-29 | 畅捷通信息技术股份有限公司 | 数据检索的方法、***、计算设备及存储介质 |
CN109522465A (zh) * | 2018-10-22 | 2019-03-26 | 国家电网公司 | 基于知识图谱的语义搜索方法及装置 |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110472019A (zh) * | 2019-08-22 | 2019-11-19 | 北京明略软件***有限公司 | 舆情搜索方法及装置 |
CN110968717A (zh) * | 2019-11-19 | 2020-04-07 | 迪姆软件(北京)有限公司 | 动态心电数据的检索方法和装置、存储介质、处理器 |
CN111009309B (zh) * | 2019-12-06 | 2023-06-20 | 广州柏视医疗科技有限公司 | 一种头颈部***可视化展示方法、装置及存储介质 |
CN111009309A (zh) * | 2019-12-06 | 2020-04-14 | 广州柏视医疗科技有限公司 | 一种头颈部***可视化展示方法、装置及存储介质 |
CN111177405A (zh) * | 2019-12-18 | 2020-05-19 | 深圳壹账通智能科技有限公司 | 数据搜索匹配方法、装置、计算机设备和存储介质 |
CN111475624A (zh) * | 2020-04-13 | 2020-07-31 | 杭州海康威视***技术有限公司 | 一种监控数据检索方法、装置及设备 |
CN111475624B (zh) * | 2020-04-13 | 2023-08-04 | 杭州海康威视***技术有限公司 | 一种监控数据检索方法、装置及设备 |
CN111597162A (zh) * | 2020-05-19 | 2020-08-28 | 北京明略软件***有限公司 | 信息确定方法和装置、存储介质及电子装置 |
CN111930891A (zh) * | 2020-07-31 | 2020-11-13 | 中国平安人寿保险股份有限公司 | 基于知识图谱的检索文本扩展方法及相关装置 |
CN111930891B (zh) * | 2020-07-31 | 2024-02-02 | 中国平安人寿保险股份有限公司 | 基于知识图谱的检索文本扩展方法及相关装置 |
CN112035511A (zh) * | 2020-08-31 | 2020-12-04 | 康键信息技术(深圳)有限公司 | 基于医学知识图谱的目标数据搜索方法及相关设备 |
CN112612905A (zh) * | 2020-12-28 | 2021-04-06 | 北京明略软件***有限公司 | 基于Elasticsearch的数据处理方法、***、计算机及可读存储介质 |
CN114691821A (zh) * | 2020-12-29 | 2022-07-01 | 上海森亿医疗科技有限公司 | 基于医疗术语构建知识图谱的智能检索方法、***、终端以及介质 |
CN112925883A (zh) * | 2021-02-19 | 2021-06-08 | 北京百度网讯科技有限公司 | 搜索请求处理方法、装置、电子设备及可读存储介质 |
CN112925883B (zh) * | 2021-02-19 | 2024-01-19 | 北京百度网讯科技有限公司 | 搜索请求处理方法、装置、电子设备及可读存储介质 |
CN116028597B (zh) * | 2023-03-27 | 2023-07-21 | 南京燧坤智能科技有限公司 | 对象检索方法、装置、非易失性存储介质及计算机设备 |
CN116028597A (zh) * | 2023-03-27 | 2023-04-28 | 南京燧坤智能科技有限公司 | 对象检索方法、装置、非易失性存储介质及计算机设备 |
CN117033934A (zh) * | 2023-08-02 | 2023-11-10 | 中信联合云科技有限责任公司 | 一种基于人工智能的内容生成方法及装置 |
CN117033934B (zh) * | 2023-08-02 | 2024-04-19 | 中信联合云科技有限责任公司 | 一种基于人工智能的内容生成方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110134796B (zh) | 2023-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110134796A (zh) | 基于知识图谱的临床试验检索方法、装置、计算机设备及存储介质 | |
US9569506B2 (en) | Uniform search, navigation and combination of heterogeneous data | |
CN111026671B (zh) | 测试用例集构建方法和基于测试用例集的测试方法 | |
CN110837550A (zh) | 基于知识图谱的问答方法、装置、电子设备及存储介质 | |
CN110555153A (zh) | 一种基于领域知识图谱的问答***及其构建方法 | |
CN104978310B (zh) | 基于各种意思类别的翻译结果的提供方法及*** | |
WO2019153685A1 (zh) | 文本处理方法、装置、计算机设备和存储介质 | |
US9824088B2 (en) | Active knowledge guidance based on deep document analysis | |
JPH11110416A (ja) | データベースからドキュメントを検索するための方法および装置 | |
CN111158795A (zh) | 报表生成方法、装置、介质及电子设备 | |
CN116011400A (zh) | 一种项目标准测试文档自动化生成方法及装置 | |
CN112035614B (zh) | 测试集生成方法、装置、计算机设备和存储介质 | |
CN116737879A (zh) | 知识库查询方法、装置、电子设备及存储介质 | |
CN112966053A (zh) | 一种基于知识图谱的海洋领域专家库构建方法及装置 | |
US20140006376A1 (en) | Automated subject annotator creation using subject expansion, ontological mining, and natural language processing techniques | |
US20230185835A1 (en) | A system and method for examining relevancy of documents | |
CN111126034A (zh) | 医学变量关系的处理方法及装置、计算机介质和电子设备 | |
AU2022201117B2 (en) | Frameworks and methodologies for enabling searching and/or categorisation of digitised information, including clinical report data | |
US9652359B1 (en) | Annotation natural keys for source code analysis | |
Jay | Pathology report data extraction from relational database using R, with extraction from reports on melanoma of skin as an example | |
KR101700327B1 (ko) | 빅데이터의 분석 결과를 제공하기 위한 방법, 서버 및 컴퓨터 판독 가능한 기록 매체 | |
Cuff et al. | Statistical analysis of surgical pathology data using the R program | |
Fontes et al. | An ontology-based reasoning approach for document annotation | |
Seher | Query Expansion in personal queries | |
CN114154502B (zh) | 医学文本的分词方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |