一种医学知识管理和查询***
技术领域
本发明涉及一种管理和查询***,特别是涉及一种医学知识管理和查询***, 属于知识管理及知识查询技术领域。
背景技术
医学知识通常以专业书籍为载体。但是由于医学知识体系及其复杂和庞大, 单一书籍难以将相关医学知识全面、详尽的加以描述。这导致医疗人员在查阅医 学知识时,往往需要查阅多本书籍才能获取所需知识。另外,书籍以非结构化或 半结构化的方式承载知识,知识查询效率低、准确性差。因此,如何整合和管理 复杂庞大的医学知识体系并提供便捷准确的医学知识查询是亟待解决的问题。
已有的医学知识库形式有百科知识库形式、问答对知识库形式。该类知识库 没有对知识进行结构化,未能解决多源知识融合、知识点关联问题。虽然在使用 过程中除了可以进行关键词匹配查询,但返回结果与用户查询意图关联性差,仍 需要用户花费较多时间查找真正需要的知识内容,未能解决知识查询效率低、准 确性差的问题。
因此需要一种医学知识管理和查询***,能够实现对医学知识的精准查询、 关联查询。
发明内容
本发明的主要目的是为了提供一种医学知识管理和查询***,对来源于专业 医学书籍中的医学知识进行结构化处理、使用自然语言查询结构化医学知识、对 结构化医学知识可视化展现,以达到便于用户了解所查询知识体系的全貌,并便 于进行细分知识和关联知识查找的目的。
本发明的目的可以通过采用如下技术方案达到:
一种医学知识管理和查询***,包括如下步骤:
步骤(1)、构建数据库,预先设计知识表示体系,确定目标三元组生成规范, 建立三元组与知识内容的对应关系,对医学知识进行结构化处理;
步骤(2)、通过若干种方式识别用户自然语言查询结构化医学知识,返回查 询结果;
步骤(3)、对结构化医学知识可视化展现。
优选的,所述步骤(1)中数据库包括电子版专业医学书籍数据,然后通过自 然语言处理技术提取医学术语,整理为分类词表,所述分类词表包括疾病、症状、 检查、药物和手术。
优选的,所述步骤(1)中设计知识表示体系包括如下步骤:
步骤(1.1)、提取书籍中目录标题及文本中显性标题;
步骤(1.2)、将提取的标题按照层级排列,形成标题层级;
步骤(1.3)、将标题层级与知识内容相对应;
步骤(1.4)、使用整理的分类词表对标题中短文本进行命名实体识别以及语 法分析;
步骤(1.5)、提取标题层级中的上下位关系及结论性关系;
步骤(1.6)、提取标题层级中的核心层级以及其所有下级标题;
优选的,所述步骤(1)中目标三元组生成规范由预先设计的知识表示体系确 定,通过一种自动***将核心层级及其下级标题转化符合规范,该***以标题层 级中标题的类别、标题的语法特征、标题间的上下级关系为特征,通过算法分析 特征进行聚类,辅助人工建立处理规则;该处理规则由标题层级模式识别部分及 目标三元组生成部分构成。
优选的,所述步骤(2)中识别用户自然语言查询结构化医学知识的方法包括:
通过模板匹配用户自然语言查询,通过预先设定的与该模板相对应的数据库 查询表达式访问数据库,返回查询结果;
或,使用自然语言处理技术识别用户自然语言查询意图,自动生成数据库查 询表达式,访问数据库并返回结果;
或,将用户自然语言查询中关键词与三元组进行关键词匹配,返回查询结果。
优选的,所述步骤(2)中识别用户自然语言查询结构化医学知识时同时查询 用户查询主题词及其下位主题词。
优选的,所述步骤(2)中识别用户自然语言查询结构化医学知识的结果为一 组三元组及对应知识内容。
优选的,所述步骤(3)对结构化医学知识可视化展现的步骤包括,以查询结 果中三元组中主题为节点,主题间关系为边,将查询结果以图的形式展现;
优选的,对所述图中的节点和边进行简化处理,优化可视化展现效果;在可 视化展现界面中,当用户选中一个节点时,显示其下位节点;在可视化展现界面 中,当用户选中一个三元组时,显示其对应的知识内容。
本发明的有益技术效果:
1、本发明提供的医学知识管理和查询***,通过对医学知识进行结构化,使 得不同来源的知识内容可以整合,可实现对医学知识的精准查询、关联查询;可 识别用户自然语言查询意图,查询结果更符合用户需要,使用户查询知识过程更 高效;使用可视化展现查询结果,便于用户了解所查询知识体系的全貌,并便于 进行细分知识和关联知识查找。
2、本发明提供的医学知识管理和查询***,利用现有成熟IT技术即可实现, 技术风险低,医疗专业人员经过培训后可独立利用该***开展知识管理工作,无 需IT人员参与。
3、本发明提供的医学知识管理和查询***,在医学知识结构化过程中采用了 规则***,首先保证结构化结果的准确性、一致性,同时也具有很好的可维护性。
具体实施方式
为使本领域技术人员更加清楚和明确本发明的技术方案,下面结合实施例对 本发明作进一步详细的描述,但本发明的实施方式不限于此。
本实施例提供的医学知识管理和查询***,包括如下步骤:
步骤(1)、构建数据库,预先设计知识表示体系,确定目标三元组生成规范, 建立三元组与知识内容的对应关系,对医学知识进行结构化处理;
进一步的,在本实施例中优选对医学知识进行结构化处理的过程如下:
获取电子版专业医学书籍;
通过自然语言处理技术提取医学术语,整理为分类词表,包括但不限于以下 几个类别,如疾病、症状、检查、药物和手术;
设计医学领域知识表示体系;
提取书籍中目录标题及文本中显性标题;
将提取的标题按照层级排列,形成标题层级;
将标题层级与知识内容相对应;
使用之前整理的分类词表对标题中短文本进行命名实体识别及语法分析;
提取标题层级中的上下位关系及结论性关系;提取标题层级中的核心层级以 及其所有下级标题;
通过一种自动***将核心层级及其下级标题转化为符合特定规范的三元组: 该***以标题层级中标题的类别、标题的语法特征、标题间的上下级关系为特征, 通过算法分析特征进行聚类,辅助人工建立处理规则;处理规则由标题层级模式 识别部分及目标三元组生成部分构成;
目标三元组生成规范由预先设计的知识表示体系确定;
建立三元组与知识内容的对应关系,并存储到数据库中,通过对医学知识进 行结构化,使得不同来源的知识内容可以整合,可实现对医学知识的精准查询、 关联查询。
步骤(2)、通过若干种方式识别用户自然语言查询结构化医学知识,返回查 询结果;
进一步的,在本实施例中识别用户自然语言查询结构化医学知识的方法包括:
通过模板匹配用户自然语言查询,通过预先设定的与该模板相对应的数据库 查询表达式访问数据库,返回查询结果;
或,使用自然语言处理技术识别用户自然语言查询意图,自动生成数据库查 询表达式,访问数据库并返回结果;
或,将用户自然语言查询中关键词与三元组进行关键词匹配,返回查询结果。
进一步的,在本实施例中步骤(2)中识别用户自然语言查询结构化医学知识 时同时查询用户查询主题词及其下位主题词,返回结果为一组三元组及对应知识 内容,可识别用户自然语言查询意图,查询结果更符合用户需要,使用户查询知 识过程更高效。
步骤(3)、对结构化医学知识可视化展现,以查询结果中三元组中主题为节 点,主题间关系为边,将查询结果以图的形式展现,使用可视化展现查询结果, 便于用户了解所查询知识体系的全貌,并便于进行细分知识和关联知识查找;
对图中的节点和边进行简化处理,优化可视化展现效果;在可视化展现界面 中,当用户选中一个节点时,显示其下位节点;在可视化展现界面中,当用户选 中一个三元组时,显示其对应的知识内容。
综上所述,在本实施例中,本实施例提供的医学知识管理和查询***,通过 对医学知识进行结构化,使得不同来源的知识内容可以整合,可实现对医学知识 的精准查询、关联查询,可识别用户自然语言查询意图,查询结果更符合用户需 要,使用户查询知识过程更高效,使用可视化展现查询结果,便于用户了解所查 询知识体系的全貌,并便于进行细分知识和关联知识查找。
以上所述,仅为本发明进一步的实施例,但本发明的保护范围并不局限于此, 任何熟悉本技术领域的技术人员在本发明所公开的范围内,根据本发明的技术方 案及其构思加以等同替换或改变,都属于本发明的保护范围。