CN107958007B - 病例信息检索方法及装置 - Google Patents
病例信息检索方法及装置 Download PDFInfo
- Publication number
- CN107958007B CN107958007B CN201610905237.3A CN201610905237A CN107958007B CN 107958007 B CN107958007 B CN 107958007B CN 201610905237 A CN201610905237 A CN 201610905237A CN 107958007 B CN107958007 B CN 107958007B
- Authority
- CN
- China
- Prior art keywords
- case information
- attribute
- attribute value
- similarity
- item
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2433—Query languages
- G06F16/2448—Query languages for particular applications; for extensibility, e.g. user defined types
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种病例信息检索方法及装置,其中所述方法包括:获取用户输入,根据所述用户输入生成目标病例信息,所述目标病例信息包括至少一个属性项;获取目标病例信息包括的每个属性项的第一属性值,遍历预设的病例数据库中包含的参考病例信息,获取遍历到的参考病例信息在第一属性值对应的属性项下的第二属性值,计算第一属性值与第二属性值的相似度,得到目标病例信息与遍历到的参考病例信息在每个属性项下的相似度分量;根据相似度分量计算目标病例信息与遍历到的参考病例信息的整体相似度;根据整体相似度在病例数据库中筛选参考病例信息作为检索结果输出。采用本发明,可提高病例信息检索的准确度。
Description
技术领域
本发明涉及互联网技术领域以及医学领域,尤其涉及一种病例信息检索方法及装置。
背景技术
随着互联网技术的不断发展和普及,能对海量的数据进行分析处理的数据处理方法以及检索数据处理方法受到了越来越多的应用。
在生物医疗行业,各个科室每天都会产生大量的诊断报告和检查结果,并且,这些数据很多都是非结构化的数字信息,例如放射科、病理科等各种影像医技科室每天产生的大量的检查图像,或门诊提供给医技检查的临床诊断信息等。这些报告对于病例跟踪、学术研究、医生之间的互相交流学习是很重要的数据。在现有技术中,用户可以在存储了上述诊断报告、病例报告等医学报告的数据库中,通过输入搜索关键词进行纯文本的全文搜索;或者通过在每一份报告中预设的关键字之后来进行关键字的搜索。但是,预先设置每一份报告的关键字的做法存在前期的工作量过大的问题,并且,在前述的搜索方式下,因为病例报告、检查结果等医学报告的特殊性,各个术语表达有多种方式,并且各个术语之间也存在一定的相关性,这就导致了搜索出来的很多报告不是用户需要的,或者很多想要的结果无法搜索出来,也就是说,搜索结果的准确度不足。
发明内容
基于此,为解决传统技术中的基于医学报告的搜索的准确度不足的技术问题,特提出了一种病例信息检索方法。
一种病例信息检索方法,包括:
获取用户输入,根据所述用户输入生成目标病例信息,所述目标病例信息包括至少一个属性项;
获取所述目标病例信息包括的每个属性项的第一属性值,遍历预设的病例数据库中包含的参考病例信息,获取所述遍历到的参考病例信息在所述第一属性值对应的属性项下的第二属性值,计算所述第一属性值与所述第二属性值的相似度,得到所述目标病例信息与所述遍历到的参考病例信息在每个属性项下的相似度分量;
根据所述目标病例信息与所述遍历到的参考病例信息在每个属性项下的相似度分量计算所述目标病例信息与所述遍历到的参考病例信息的整体相似度;
根据所述目标病例信息与所述遍历到的参考病例信息的整体相似度在所述病例数据库中筛选参考病例信息作为检索结果输出。
可选的,在其中一个实施例中,所述用户输入包含至少一个表单项;
所述根据所述用户输入生成目标病例信息的步骤还包括:
根据所述用户输入包含的至少一个表单项以及预设的分层树状结构模型,生成与所述用户输入对应的目标病例信息,所述目标病例信息包括的属性项对应于所述用户输入包含的表单项。
可选的,在其中一个实施例中,所述根据所述目标病例信息与所述遍历到的参考病例信息在每个属性项下的相似度分量计算所述目标病例信息与所述遍历到的参考病例信息的整体相似度的步骤还包括:
获取与所述目标病例信息包括的每一个属性项对应的权重系数;
根据与所述属性项对应的权重系数,对所述每个属性项下的相似度分量进行加权,得到所述目标病例信息与所述遍历到的参考病例信息的整体相似度。
可选的,在其中一个实施例中,所述目标病例信息包含的属性项包括至少2个与该属性项对应的子属性项;
所述计算所述第一属性值与所述第二属性值的相似度的步骤还包括:
获取与所述至少2个子属性项对应的子属性项权重系数;
计算目标病例信息在所述每一个子属性项下的第一子属性值与所述参考病例信息在所述每一个子属性项下的第二子属性值的子相似度;
根据所述子属性项权重系数对所述子相似度进行加权得到所述第一属性值与所述第二属性值的相似度。
可选的,在其中一个实施例中,所述获取所述目标病例信息包括的每个属性项的第一属性值的步骤之后还包括:
对所述目标病例信息包括的每一个属性项的第一属性值进行分词处理,将所述分词处理得到的结果作为与所述第一属性值对应的关键字分词集合;
所述计算所述第一属性值与所述第二属性值的相似度的步骤还包括:
获取所述关键字分词集合中包括的关键字分词在所述第二属性值中出现的位置和/或次数;
根据所述关键字分词在所述第二属性值中出现的位置和/或次数计算所述第一属性值与所述第二属性值之间的相似度分量。
可选的,在其中一个实施例中,所述将所述分词处理得到的结果作为与所述第一属性值对应的关键字分词集合的步骤之后还包括:
根据预设的医学术语库对所述关键字分词集合中包含的关键字分词进行同义词扩展,将所述扩展得到的扩展关键字分词集合作为所述关键字分词集合,执行所述获取所述关键字分词集合中包括的关键字分词在所述第二属性值中出现的位置和/或次数的步骤。
可选的,在其中一个实施例中,根据预设的医学术语库对所述关键字分词集合中包含的关键字分词进行同义词扩展的步骤之前还包括:
确定与所述第一属性值对应的属性项匹配的扩展术语库作为所述预设的医学术语库。
可选的,在其中一个实施例中,所述将所述分词处理得到的结果作为与所述第一属性值对应的关键字分词集合之后还包括:
为所述关键字分词集合中包含的关键字分词分配相应的子权重系数;
所述根据所述关键字分词在所述第二属性值中出现的位置和/或次数计算所述第一属性值与所述第二属性值之间的相似度分量的步骤还包括:
根据所述关键字分词在所述第二属性值中出现的位置和/或次数、以及为所述关键字分词分配的子权重系数,计算所述第一属性值与所述第二属性值之间的相似度分量。
可选的,在其中一个实施例中,所述计算所述第一属性值与所述第二属性值的相似度的步骤还包括:
根据预设的相似度计算函数计算所述第一属性值与所述第二属性值的相似度,所述预设的相似度计算函数为预设的文本相等判断函数、预设的数值范围比较函数、预设的语义相等判断函数、预设的code相等判断函数或预设的语义包含判断函数。
可选的,在其中一个实施例中,所述方法还包括:
检测在病例填写页面填写的表单内容,根据所述表单内容和所述预设的分层树状结构模型生成与所述检测到的表单内容对应的参考病例信息,将所述参考病例信息存储至所述预设的病例数据库。
此外,为解决传统技术中的基于医学报告的搜索的准确度不足的技术问题,特提出了一种病例信息检索装置。
一种病例信息检索装置,包括:
目标病例信息生成模块,用于获取用户输入,根据所述用户输入生成目标病例信息,所述目标病例信息包括至少一个属性项;
相似度分量计算模块,用于获取所述目标病例信息包括的每个属性项的第一属性值,遍历预设的病例数据库中包含的参考病例信息,获取所述遍历到的参考病例信息在所述第一属性值对应的属性项下的第二属性值,计算所述第一属性值与所述第二属性值的相似度,得到所述目标病例信息与所述遍历到的参考病例信息在每个属性项下的相似度分量;
整体相似度计算模块,用于根据所述目标病例信息与所述遍历到的参考病例信息在每个属性项下的相似度分量计算所述目标病例信息与所述遍历到的参考病例信息的整体相似度;
检索结果筛选模块,用于根据所述目标病例信息与所述遍历到的参考病例信息的整体相似度在所述病例数据库中筛选参考病例信息作为检索结果输出。
可选的,在其中一个实施例中,所述用户输入包含至少一个表单项;
所述目标病例信息生成模块还用于根据所述用户输入包含的至少一个表单项以及预设的分层树状结构模型,生成与所述用户输入对应的目标病例信息,所述目标病例信息包括的属性项对应于所述用户输入包含的表单项。
可选的,在其中一个实施例中,所述目标病例信息包括的属性项为分类属性项或描述属性项,所述分类属性项包括至少一个与该分类属性项对应的分类属性项和至多一个描述属性项。
可选的,在其中一个实施例中,所述整体相似度计算模块还用于获取与所述目标病例信息包括的每一个属性项对应的权重系数;根据与所述属性项对应的权重系数,对所述每个属性项下的相似度分量进行加权,得到所述目标病例信息与所述遍历到的参考病例信息的整体相似度。
可选的,在其中一个实施例中,所述目标病例信息包含的属性项包括至少2个与该属性项对应的子属性项;
所述相似度分量计算模块还用于获取与所述至少2个子属性项对应的子属性项权重系数;计算目标病例信息在所述每一个子属性项下的第一子属性值与所述参考病例信息在所述每一个子属性项下的第二子属性值的子相似度;根据所述子属性项权重系数对所述子相似度进行加权得到所述第一属性值与所述第二属性值的相似度。
可选的,在其中一个实施例中,所述相似度分量计算模块还用于对所述目标病例信息包括的每一个属性项的第一属性值进行分词处理,将所述分词处理得到的结果作为与所述第一属性值对应的关键字分词集合;获取所述关键字分词集合中包括的关键字分词在所述第二属性值中出现的位置和/或次数;根据所述关键字分词在所述第二属性值中出现的位置和/或次数计算所述第一属性值与所述第二属性值之间的相似度分量。
可选的,在其中一个实施例中,所述相似度分量计算模块还用于根据预设的医学术语库对所述关键字分词集合中包含的关键字分词进行同义词扩展,将所述扩展得到的扩展关键字分词集合作为所述关键字分词集合。
可选的,在其中一个实施例中,所述相似度分量计算模块还用于确定与所述第一属性值对应的属性项匹配的扩展术语库作为所述预设的医学术语库。
可选的,在其中一个实施例中,所述相似度分量计算模块还用于为所述关键字分词集合中包含的关键字分词分配相应的子权重系数;根据所述关键字分词在所述第二属性值中出现的位置和/或次数、以及为所述关键字分词分配的子权重系数,计算所述第一属性值与所述第二属性值之间的相似度分量。
可选的,在其中一个实施例中,所述装置还包括数据库更新模块,用于检测在病例填写页面填写的表单内容,根据所述表单内容和所述预设的分层树状结构模型生成与所述检测到的表单内容对应的参考病例信息,将所述参考病例信息存储至所述预设的病例数据库。
实施本发明实施例,将具有如下有益效果:
采用了上述病例信息检索方法和装置之后,在针对病例信息进行检索的过程中,将用户输入的需要检索的关键字按照预设的病例模型生成目标病例信息,在病例数据库中查找与目标病例信息对应的检索结果时,通过计算病例数据库中的参考病例信息与目标病例信息在每一个属性项下的相似度而得到二者之间的整体相似度,最后通过整体相似度从病例数据库中筛选出相应的检索结果。也就是说,不需要对病例数据库中的每一个病例信息进行关键字设置之类的预处理,并且在检索的过程中能覆盖病例数据库中所有的数据,提高了检索结果的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1为一个实施例中一种病例模型的属性项节点的结构示意图;
图2为一个实施例中一种病例信息检索方法的流程示意图;
图3为一个实施例中一种病例信息检索装置的结构示意图;
图4为一个实施例中运行前述病例信息检索方法的计算机设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为解决传统技术中的基于医学报告的搜索的准确度不足的技术问题,在本实施例中,特提出了一种病例信息检索方法,该方法的实现可依赖于计算机程序,该计算机程序可运行于基于冯诺依曼体系的计算机***之上,该计算机程序可以是医院或者医学报告***的病例信息检索应用程序,可以作为其他医学软件的组成部分。该计算机***可以是运行上述计算机程序的例如智能手机、平板电脑、个人电脑等终端设备。
需要说明的是,在本实施例中,首先需要建立医学报告的数据库,即预设的病例数据库。包含在病例数据库中的每一个病例信息,均是在病例信息的填写过程中按照预设的病例模型的导引下完成的。例如,在病例信息填写的***中,每一个病例信息都包含了病人信息、检查项目、临床诊断等多个属性项,并且每一个属性项之下,还可以包含多个子属性项,例如,病人信息项下还包括了姓名、性别、出生日期、联系电话、家族病史等多个子属性项。进一步的,对于预设的病例模型,用户还可以根据自己的需要对病例模型进行进一步的扩展,例如增加某一个特定的属性项,从而使得上述病例模型的使用范围更广。需要说明的是,在本实施例中,属性项与属性项之间还可能存在一定的关联关系,例如,次一级的属性项是包含与上一级的属性项的,或者两个同级的属性项之间也可能存在一定的关联关系,例如,临床诊断与病人主诉之间存在一定的关联关系。
在一个实施例中,如图1所示,图1展示了一个放射科检查对应的病例模型的属性项节点示意图,该病例模型包含的多个属性项,即该病例模型包括了病人信息、检查申请、临床诊断、影像所见、影像结论等6个属性项,并且每一个属性项下还包括了若干个子属性项,在子属性项下还包括了与之对应的次一级的子属性项等。
需要说明的是,在本实施例中,每一个病例信息包含了若干个属性项,每一个属性项也可以包含若干个子属性项,子属性项又可以包含若干个次子属性项;对于某一个具体的病例信息而言,其某个属性项或子属性项对应的属性值可以为空。也就是说,病例信息是由属性项、以及属性项对应的子属性项、以及子属性项对应的次子属性项等构成的多层的树状结构,并且,在本实施例中,对病例信息的属性项的树状结构的层数不做限定,用户可以根据需要进行进一步的扩展。
在病例信息的填写以及病例信息的搜索所基于的***中,根据医生或者其他用户在使用的过程中以及病例存储的必要确定每一个病例信息对应的各个属性项以及各个属性项下包含的子属性项等,也即医生等用户在填写病例信息对应的表单时需要填写的表单项。需要说明的是,在本实施例中,上述医生等用户在填写病例信息对应的表单时填写的表单项可以是使用下拉框形式选择的例如性别的属性项,也可以限定了一定的要求或者条件的输入选项,例如,用户输入的是具有结构化或者半结构化的信息,并且输入的信息包含了预设的语义信息,还可以是可以自由输入的输入框,用户可以输入任意的自由文本。
需要说明的是,在本实施例中,病例信息、或者下述的目标病例信息或参考病例信息,均是基于上述病例模型建立的,或者说是基于预设的分层树状结构模型建立的。其中的病例信息、目标病例信息或参考病例信息包含的属性项是根据病例模型或者预设的分层树状结构模型确定的,每一个属性项都可以包含若干个与之对应的子属性项,或者说,每一个节点都包括了若干个与之对应的子节点,但是,需要说明的是,不是每一个属性项都可以包含多个子属性项,例如,在如图1所示的病例模型中,第5层的属性项“数量”包括的属性项只有一个,并且其对应的属性值一定为数量。
具体的,在一个可选的实施例中,病例模型包括的属性项为分类属性项或描述属性项,所述分类属性项包括至少一个与该分类属性项对应的分类属性项和至多一个描述属性项。也就是说,分类属性项可以包含多个次一级的分类属性项以及0个或1个次一级的描述属性项,而描述属性项只能包含一个与之对应的属性项,并且,该属性项下不再包含其他此一次的属性项。例如,在图1所示的病例模型中,“放射科检查”即为一个分类属性项,其下包括了“病人信息”等5个分类属性项,在分类属性项“组织部位”下包含了“病灶”分类属性项,并且包括了“概要描述”描述属性项。进一步的,描述属性项中还包括了两种,一种是以自由文本作为属性值的属性项,例如“概要描述”;一种是以具体的数值或者其他非自由文本来作为属性值的属性项,例如“数量”、“大小”。
具体的,如图2所示,上述病例信息检索方法包括如下步骤S102-步骤S108:
步骤S102:获取用户输入,根据用户输入生成目标病例信息,所述目标病例信息包括至少一个属性项。
具体实施中,在需要进行病例信息的检索的情况下,医生或者其他用户可以在相应的检索页面中输入需要检索的相关信息进行检索,从而触发检索的进行,即执行步骤S102-步骤S108。也就是说,在用户在相应的检索页面中手动输入病例信息检索指令时,终端在检测到用户输入的病例信息检索指令时,根据接收到的病例信息检索指令触发与病例信息检索的相关步骤的执行。
在本实施例中,用户输入可以是用户在病例表单上填写的表单内容,该用户输入作为检索依据的目标对象,是生成目标病历信息的依据。
在一个实施例中,用户在检索界面上填写的表单或者输入框即为一个作为检索依据的目标对象,即用户输入。需要说明的是,在本实施例中,在医生或者其他用户手动触发检索的过程中,为了提高检索的准确度,用来填写用来检索的输入内容的表单可以是根据上述病例模型来确定的,也就是说,用户可以全文查找与某一个输入内容包含的术语(例如“肝癌”)对应的病例,也可以是查找在某一个特定的属性项(例如,属性项名称为医生诊断的属性项)对应的属性值中出现与“肝癌”对应的病例。在用户在相应的用来检索的病例表单中填写了需要进行检索的相关内容之后,即为用户输入,在本实施例中,会根据用户输入以及上述病例模型生成相应的目标病例信息。
在另一个实施例中,在医生填写病例或者开具检查单、药品单等应用场景中,也可能需要参考该病人以往的病例信息或者参考相似病例的相关病例信息,在此种情况下,若医生还需要切换到检索页面中进行检索,势必会增加在此过程中的操作次数;因此,在本实施例中,在医生在填写病例信息的过程中自动触发检索的进行,即在医生在病例表单中进行相关表单内容的填写的过程中自动触发步骤S102-步骤S108的执行。也就是说,终端在检测到需要触发病例信息检索的事件时,自动生成病例信息检索指令,根据所述病例信息检索指令触发上述步骤S102-步骤S108的执行。在此种情况下,用户在病例表单中填写的相关内容即为用户输入,然后在检索触发时,根据上述目标对应以及上述病例模型生成相应的目标病例信息。
具体实施例中,医生在看诊等情况下,需要填写用户的病例,即在相应的***中填写相应的病例表单;或者,医生或其他用户在需要对相关的病例信息进行检索的情况下,首先需要在相应的检索界面,输入需要用来检索的检索依据,即在对应的病例表单中填写需要检索的病例信息对应代表单项。根据当前正在填写的病例表单上已填写的表单内容,生成目标病例信息,也就是说,上述目标病例信息即为病例信息检索的检索关键字。
综上所述,在本实施例中,病例表单不仅仅包含了医生或其他用户在病例***或者医疗***中为病人填写病例时填写的表单,还包括了在相应的病例检索界面中填写的表单。
需要说明的是,在本实施例中,因为正在填写的病例表单是按照***中预设的病例模型进行填写的,也就是说,根据预设的病例模型包含的属性项的树状结构,可以确定根据预设的病例模型生成的病例表单中填写的表单内容生成的目标病例信息也包括了与病例模型对应的属性项,即目标病例信息包括了至少一个属性项。
具体的,在一个实施例中,对应用户输入的所述目标对象包含至少一个表单项;所述根据所述用户输入生成目标病例信息的步骤还包括:根据所述用户输入包含的至少一个表单项以及预设的分层树状结构模型,生成与所述用户输入对应的目标病例信息,所述目标病例信息包括的属性项对应于所述用户输入包含的表单项。
也就是说,在用户输入为用户填写的病例表单的情况下,该病例表单中就包含了多个表单项,在用户输入为用户在输入框中填写的相关内容时,对应的检索关键字也可构成多个表单项。并且,因为由用户输入生成目标病例信息的过程中,是按照上述预设的病例模型生成的,也就是说,是根据上述预设的病例模型对应的分层树状结构模型生成的,也就是说,将用户输入包含的每一个表单项,与预设的病例模型包含的每一个属性项或者预设的分层树状结构模型包含的每一个节点之间建立对应关系,然后按照预设的病例模型包含的每一个属性项与用户输入包含的表单项以及二者之间的对应关系,确定生成的目标病例信息中包含的属性项以及每一个属性项对应的属性值,当然,允许部分属性项对应的属性值为空,或者按照预设的分层树状接口模型包含的每一个节点以及用户输入包含的每一个表单项以及二者之间的对应关系,确定生成的目标病例信息中包含的属性项以及每一个属性项对应的属性值,当然允许部分属性项对应的属性值为空。
步骤S104:获取所述目标病例信息包括的每个属性项的第一属性值,遍历预设的病例数据库中包含的参考病例信息,获取所述遍历到的参考病例信息在所述第一属性值对应的属性项下的第二属性值,计算所述第一属性值与所述第二属性值的相似度,得到所述目标病例信息与所述遍历到的参考病例信息在每个属性项下的相似度分量。
在本实施例中,目标病例信息包括的每一个属性项下均对应了属性项名称和属性值;在检索的数据库(即预设的病例数据库)中包含的所有的参考病例信息也包含了与预设的病例模型对应的属性项,即包含了与目标病例信息相同的属性项,也就是说,目标病例信息包括的每一个属性项,也对应了参考病例信息下的一个属性项。在本步骤中,在进行病例信息的检索过程中,对预设的病例数据库中包含的所有参考病例信息进行遍历,并且针对遍历到的参考病例信息,获取与目标病例信息的某一个属性项下的第一属性值对应的属性项下的第二属性值,然后计算第一属性值与所述第二属性值之间的相似度。
需要说明的是,在本实施例中,预设的病例数据库中包含的参考病例信息是根据用户之前按照预设的病例模型填写的病例信息生成的,例如,在病例表单填写中填写的病例信息并保存的病例信息。具体的步骤为:检测在病例填写页面填写的表单内容,根据所述表单内容和所述预设的分层树状结构模型生成与所述检测到的表单内容对应的参考病例信息,将所述参考病例信息存储至所述预设的病例数据库。
也就是说,在用户在相应的病例填写页面填写的与病人或病例、检索等对对应的表单内容时,根据表单内容和预设的病例模型或预设的分层树状结构模型生成对应的参考病例信息并保存在病例数据库。随着时间的迁移,在同一医院***中填写的所有的病例信息均保存在病例数据库中,其中的每一个病例信息都是参考病例信息。
进一步的,第一属性值与第二属性值之间的相似度即为目标病例信息与参考病例信息在与第一属性值对应的属性项下的相似度分量。
需要说明的是,在本实施例中,第一属性值与第二属性值之间的相似度的具体计算方法,可以根据第一属性值、第二属性值以及对应的属性项来确定的。例如,针对病人信息下的姓名属性项,其对应的相似度的取值只能为1或者0,也就是说,只有在对应的第一属性值与第二属性值完全匹配的情况下其相似度取值才不为0,且为1。
具体的,属性项下的第一属性值与第二属性值之间的相似度的计算方法包括文本相等判断(如姓名)、数值范围比较(如病灶大小为10cm-15cm)、语义相等判断(如同义词判断)、code相等判断(如二维码)、语义包含判断等等。即,所述计算所述第一属性值与所述第二属性值的相似度的步骤还包括:根据预设的相似度计算函数计算所述第一属性值与所述第二属性值的相似度,所述预设的相似度计算函数为预设的文本相等判断函数、预设的数值范围比较函数、预设的语义相等判断函数、预设的code相等判断函数或预设的语义包含判断函数。
文本相等判断指的是第一属性值与第二属性值均为文本信息,并以文本方式直接判断是否相等,相等则输出1,不相等则输出0,例如,“肝脏”与“肝脏”相等,与“肝”不相等。
数值范围比较是指属性项的值是数值或者数值表达式,如10cm,需要说明的是,在本实施例中,数值可以包括单位,在进行第一属性值与第二属性值的相似度的计算的过程中,判断第一属性值与第二属性值对应的数值或者数值范围是否相等或者包含或者是否存在重叠部分,并且针对每一种情况分别定义相应的相似度计算公式。
语义相等判断指的是第一属性值与第二属性值均为文本信息,在对第一属性值与第二属性值进行比较的过程中,通过预设的术语库判断第一属性值与第二属性值对应的语义是否相等,例如,可以判断所有的同义词元素是相等的,并且在此种情况下输出为1。
Code相等判断指的是第一属性值和第二属性值均为编码,例如条形码、二维码或者其他编码形式,在此情况下,直接判断第一属性值对应的编码与第二属性值对应的编码是否相等,相等则输出1。
在另一个实施例中,上述Code相等判断还可以是基于医学的编码体系,例如,在某一个编码体系中,101表示肝脏,则在用上述编码体系中的相关编码来进行描述的情况下,直接判断两个对应的Code是都是完全相等的,若是,则输出1。
语义包含判断是指第一属性值和第二属性值均为文本信息,并且可以识别为语义元素,通过预设的语义包含数据库,判断第一属性值对应的语义元素与第二属性值对应的语义元素之间是否具有包含关系。
上述相似度计算过程中的判断方法均是将属性项对应的属性值当做一个整体来进行判断的,在本实施例中,属性项的属性值还可能是自由文本,例如,诊断结论、医嘱等,在填写或者生成的时候都是可以有医生或者其他用户自由编辑的文本,因此,在此种情况下,依旧将该自由文本形式的属性值作为一个整体直接进行属性值之间的比对,会因为自由文本与自由文本之间的比对不适用于上述判断方法,导致第一属性值与第二属性值之间的相似度的计算的准确度不高,因此,其对应的属性项的属性值之间的相似度的计算就不再使用于上述文本相等等判断方式,而需要选择其他计算方式。
在一个可选的实施例中,上述获取所述目标病例信息包括的每个属性项的第一属性值的步骤之后还包括:对所述目标病例信息包括的每一个属性项的第一属性值进行分词处理,将所述分词处理得到的结果作为与所述第一属性值对应的关键字分词集合;所述计算所述第一属性值与所述第二属性值的相似度的步骤还包括:获取所述关键字分词集合中包括的关键字分词在所述第二属性值中出现的位置和/或次数;根据所述关键字分词在所述第二属性值中出现的位置和/或次数计算所述第一属性值与所述第二属性值之间的相似度分量。
具体的,针对自由文本的属性值,对该属性值对应的自由文本进行分词处理,即将自由文本中包含的所有字符序列分成有意义的词,即将目标病例信息包括的每个属性项对应的第一属性值进行分词处理,并将分词处理得到的结果(即将第一属性值分割成的多个关键词序列或集合)作为与上述第一属性值对应的关键字分词集合。
在本实施例中,对分词的方法不做限制,例如可以采用已有的分词工具,如采用Stanford的Chinese-Segmenter进行所述自由文本的批量分词处理,或者采用任意已有的分词算法进行分词处理,当然还可以采用任意的分词方式。
在本实施例中,将自由文本形式的第一属性值进行分词处理之后,就可以针对分词得到的关键字分词集合进行相似度的计算,也就是说,在第一属性值与第二属性值的相似度的计算过程中,针对第一属性值采用的不是第一属性值对应的原始的自由文本,而是采用的将第一属性值进行分词处理之后得到的关键字分词集合。
具体的,在预设的病例数据库中遍历到的参考病例信息中与第一属性值对应的属性项下的第二属性值中,查找上述关键字分词集合中包含的每一个关键字分词,统计每一个关键字分词在上述第二属性值中出现的次数、位置等信息,根据统计到的每一个关键字分词在上述第二属性值中出现的次数、位置等信息,按照预设的相似度分量计算公式,计算第一属性值与第二属性值之间的相似度分量。
需要说明的是,在本实施例中,在上述根据统计到的每一个关键字分词在上述第二属性值中出现的次数、位置等信息计算第一属性值与第二属性值之间的相似度分量时,用到的相似度分量的计算公式,可以根据第一属性值对应的属性项来确定,或者根据关键字分词集合来进行确定,也就是说,上述相似度分量的计算公式可以是任意的预设的计算公式,***或者用户可以事先对该计算公式进行设定。
需要说明的是,在本实施例中,考虑到在医学行业存在的各种语义相等的词汇以及各个医生在使用的过程中的使用习惯不同,还需要考虑针对自由文本形式的第一属性值进行分词处理得到的每一个关键字分词的同义词,从而提高相似度计算的准确度。
具体的,所述将所述分词处理得到的结果作为与所述第一属性值对应的关键字分词集合的步骤之后还包括:根据预设的医学术语库对所述关键字分词集合中包含的关键字分词进行同义词扩展,将所述扩展得到的扩展关键字分词集合作为所述关键字分词集合,执行所述获取所述关键字分词集合中包括的关键字分词在所述第二属性值中出现的位置和/或次数的步骤。
也就是说,在第二属性值中查找上述与第一属性值对应的关键字分词时,还需要考虑到每一个关键字分词的同义词,即根据预设的医学术语库对关键字分词集合中的关键字分析进行同义词扩展,存在同义词的关键字分词的同义词添加到扩展关键字分词集合中去,并将该同义词作为该关键字分词的替代关键字分词,也就是说,在计算该关键字分词在第二属性值中出现的位置和次数的过程中,将对应的同义词在第二属性值中出现的位置和次数也一并考虑在该关键字分词在第二属性值中出现的位置和次数中。
需要说明的是,在本实施例中,不同的属性项对应的常用词是不一样的,因此,针对不同的属性项,还可以设置不同的用来扩展的数据库,也就是说,在对关键字分词集合中的关键字进行同义词扩展的过程中用到的预设的医学术语库,还可以是根据不同的属性项分别设置的与之对应的医学术语库,在进行同义词扩展的过程中,首先需要根据属性项或者属性项名称确定相应的医学术语库,然后再进行关键字的扩展。
综上所述,根据目标病例信息或者病例模型中包含的所有的属性项,分别设置各个属性项对应的相似度计算方法,即不同的属性项对应不同的相似度计算方法。
步骤S106:根据所述目标病例信息与所述遍历到的参考病例信息在每个属性项下的相似度分量计算所述目标病例信息与所述遍历到的参考病例信息的整体相似度。
具体实施例中,由于目标病例信息以及包含在预设的病例数据库中的参考病例信息均是由多个属性项组成的,因此,目标病例信息与包含在预设的病例数据库中的参考病例信息之间的相似情况可以由上述多个属性项之间的相似情况来进行刻画,即根据上述目标病例信息与所述遍历到的参考病例信息在每个属性项下的相似度分量即可描述目标病例信息与参考病例信息之间的相似度。具体的,在本实施例中,根据目标病例信息与遍历到的参考病例信息在每个属性项下的相似度分量,计算目标病例信息与参考病例信息之间的整体相似度。
需要说明的是,在上述整体相似度的计算过程中,整体相似度可以是目标病例信息与遍历到的参考病例信息在每个属性项下的相似度分量的平均值,也可以是目标病例信息与遍历到的参考病例信息在每个属性项下的相似度分量的和,在另一个实施例中,上述整体相似度还可以是目标病例信息与遍历到的参考病例信息在每个属性项下的相似度分量的加权平均值或加权和,即,每一个属性项下的相似度分量均对应了一个与该属性项对应的权重系数。
具体的,所述根据所述目标病例信息与所述遍历到的参考病例信息在每个属性项下的相似度分量计算所述目标病例信息与所述遍历到的参考病例信息的整体相似度的步骤还包括:获取与所述目标病例信息包括的每一个属性项对应的权重系数;根据与所述属性项项对应的权重系数,对所述每个属性项下的相似度分量进行加权,得到所述目标病例信息与所述遍历到的参考病例信息的整体相似度。
具体的,根据目标病例信息中包含的每一个属性项,预先分配了一个与该属性项对应的权重系数,该权重系数可以是根据属性项具体包含的具体内容来确定的,例如,针对病人信息对应的属性项,其权重系数设置可高于其他属性项。在计算整体相似度的过程中,针对目标病例信息包含的每一个属性项,以及相应的权重系数,对目标病例信息与遍历到的参考病例信息在每个属性项下的相似度分量进行加权,得到的加权和即为目标病例信息与参考病例信息之间的整体相似度。
需要说明的是,在本实施例中,每一个属性项对应的权重系数可以是***预先设置好的,也就是说,针对每一次的病例信息检索,其对应的属性项的权重系数都是固定不变的,在另一个实施例中,上述每一个属性项对应的权重系数还可以是变化的,例如根据病例信息检索的触发事件来确定,在医生填写病人信息时触发的病例信息检索中,病人信息对应的属性项的权重系数要远高于其他属性项对应的权重系数;在医生填写病人主述情况时触发的病例信息检索中,病人主述情况对应的属性项的权重系数要高于其他属性项对应的权重系数。当然,每一个属性项对应的权重系数的设置方法还可以是其他设置方案,具体可以由***或者用户在事先进行设置。
步骤S108:根据所述目标病例信息与所述遍历到的参考病例信息的整体相似度在所述病例数据库中筛选参考病例信息作为检索结果输出。
在本实施例中,病例信息检索的输出结果是病例数据库中的若干个参考病例信息,在本实施例中,作为检索结果的参考病例信息是根据步骤S106中计算得到的参考病例信息与目标病例信息之间的整体相似度决定的。例如,在一个实施例中,将整体相似度大于预设阈值的参考病例信息作为检索结果,在另一个实施例中,还可以根据整体相似度的大小筛选整体相似度靠前的预设数量的参考病例信息作为检索结果。
进一步的,在本实施例中,在输出检索结果之前,还可以根据目标病例信息与所述遍历到的参考病例信息的整体相似度,对检索结果中包含的参考病例信息进行降序排列,并在输出检索结果时,以降序排列的形式展示检索结果中的参考病例信息,以便用户能直观的查找到最大相似度的参考病例信息。
需要说明的是,在上述实施例中,对病例信息的检索都是根据目标病例信息与参考病例信息之间的整体相似度然后根据整体相似度进行检索结果的筛选的,相当于考虑的是两个病例信息之间的整体的相似程度。在另一个实施例中,用户需要着重考虑某一个属性项下对应的相似程度,并且只有在该属性项对应的相似程度满足条件的情况下,才将对应的参考病例信息作为检索结果输出。
具体的,用户着重考虑的属性项可以是其属性值为自由文本的属性项,也可以是其他形式的属性项。
在进行检索结果的筛选之前,首先计算目标病例信息中该属性项下的属性值与病例数据库中的参考病例信息在该属性项下的属性值,只有在二者之间的属性值满足预设的条件的情况下,才将对应的参考病例信息作为最终输出的检索结果的备选病例信息。例如,在一个实施例中,若该属性项对应的属性值为非自由文本,可以设置只有属性值相等的参考病例信息才能作为备选病例信息;在另一个实施例中,若该属性项对应的属性值为自由文本,则可以设置上述预设的条件为属性值之间的相似度超过90%的参考病例信息才能作为备选病例信息。
在备选病例信息确定的情况下,用所有备选病例信息组成的数据库替代本方法中的预设的病例数据库,即在计算相似度的过程中遍历的参考病例信息改为遍历所有备选病例信息组成的数据库中的备选病例信息。
需要说明的是,在本实施例中,在相似度的计算过程中,不仅可以根据属性项分配不同的权重系数,还可以针对某一个属性项下的若干个子属性项也设置相应的权重系数,也就是说,在计算包含了多个子属性项的属性项下的第一属性值与第二属性值之间的相似度分量时,通过计算多个子属性项下的目标病例信息的属性值与该子属性项下参考病例信息的属性值之间的子相似度分量,然后根据子相似度分量来计算对应的相似度分量,并且,在计算相似度分量的过程中,考虑各个子相似度分量与该子属性项对应的权重系数。
具体的,所述目标病例信息包含的属性项包括至少2个与该属性项对应的子属性项;所述计算所述第一属性值与所述第二属性值的相似度的步骤还包括:获取与所述至少2个子属性项对应的子属性项权重系数;计算目标病例信息在所述每一个子属性项下的第一子属性值与所述参考病例信息在所述每一个子属性项下的第二子属性值的子相似度;根据所述子属性项权重系数对所述子相似度进行加权得到所述第一属性值与所述第二属性值的相似度。
需要说明的是,在本实施例中,不仅可以对某一个属性项下的子属性项设置对应的权重系数,只要是某一个属性项或者子属性项节点下的相似度分量的计算,均是由该节点下对应的次一级的属性项对应的次一级的相似度分量来计算,并且,针对次一级的属性项均可以设置相应的权重系数。
进一步的,在另一个实施例中,还可以针对关键字分词集合中包含的关键字分词设置不同的权重系数,也就是说,在根据关键字分词在第二属性值中出现的位置和/或次数计算第一属性值与第二属性值之间的相似度分量时,同样的次数和/或位置下的关键字分词对相似度分量的影响是不同的。
具体的,所述将所述分词处理得到的结果作为与所述第一属性值对应的关键字分词集合之后还包括:为所述关键字分词集合中包含的关键字分词分配相应的子权重系数;所述根据所述关键字分词在所述第二属性值中出现的位置和/或次数计算所述第一属性值与所述第二属性值之间的相似度分量的步骤还包括:根据所述关键字分词在所述第二属性值中出现的位置和/或次数、以及为所述关键字分词分配的子权重系数,计算所述第一属性值与所述第二属性值之间的相似度分量。
也就是说,针对自由文本形式的第一属性值进行分词处理之后得到的关键字分词集合中的每一个关键字分词,并不是每一个关键字分词在当前病例信息的检索中的相似度大小的影响都是一样的,而是,不同的关键字分词的影响都不一样,例如,对于表述病症、临床表现等医学相关的关键字分词对相似度大小的影响较大,而语气词、连接词等关键字分词对相似度大小的影响较小,因此,根据关键字分词的语义,可以为关键字分词集合中包含的关键字分词设置相应的权重系数,并且在计算第一属性值与第二属性值之间的相似度分量时,考虑每一个关键字分词对应的权重系数对相似度分量的影响。
需要说明的是,在本实施例中,并不是每一个关键字分词在相似度的计算过程中对应的权重都是不变的,针对不同的属性项,可以设置不同的权重系数的设置方法,这就使得在不同的属性项中因为常用语的变化也能考虑在关键词分词的相似度计算中去。
此外,为解决传统技术中的基于医学报告的搜索的准确度不足的技术问题,在一个实施例中,如图3所示,还提出了一种病例信息检索装置,该装置包括目标病例信息生成模块102、相似度分量计算模块104、整体相似度计算模块106以及检索结果筛选模块108,其中:
目标病例信息生成模块102,用于获取用户输入,根据所述用户输入生成目标病例信息,所述目标病例信息包括至少一个属性项;
相似度分量计算模块104,用于获取所述目标病例信息包括的每个属性项的第一属性值,遍历预设的病例数据库中包含的参考病例信息,获取所述遍历到的参考病例信息在所述第一属性值对应的属性项下的第二属性值,计算所述第一属性值与所述第二属性值的相似度,得到所述目标病例信息与所述遍历到的参考病例信息在每个属性项下的相似度分量;
整体相似度计算模块106,用于根据所述目标病例信息与所述遍历到的参考病例信息在每个属性项下的相似度分量计算所述目标病例信息与所述遍历到的参考病例信息的整体相似度;
检索结果筛选模块108,用于根据所述目标病例信息与所述遍历到的参考病例信息的整体相似度在所述病例数据库中筛选参考病例信息作为检索结果输出。
可选的,在一个实施例中,所述用户输入包含至少一个表单项;所述目标病例信息生成模块102还用于根据所述用户输入包含的至少一个表单项以及预设的分层树状结构模型,生成与所述用户输入对应的目标病例信息,所述目标病例信息包括的属性项对应于所述用户输入包含的表单项。
可选的,在一个实施例中,所述目标病例信息包括的属性项为分类属性项或描述属性项,所述分类属性项包括至少一个与该分类属性项对应的分类属性项和至多一个描述属性项。
可选的,在一个实施例中,所述整体相似度计算模块106还用于获取与所述目标病例信息包括的每一个属性项对应的权重系数;根据与所述属性项对应的权重系数,对所述每个属性项下的相似度分量进行加权,得到所述目标病例信息与所述遍历到的参考病例信息的整体相似度。
可选的,在一个实施例中,所述目标病例信息包含的属性项包括至少2个与该属性项对应的子属性项;所述相似度分量计算模块104还用于获取与所述至少2个子属性项对应的子属性项权重系数;计算目标病例信息在所述每一个子属性项下的第一子属性值与所述参考病例信息在所述每一个子属性项下的第二子属性值的子相似度;根据所述子属性项权重系数对所述子相似度进行加权得到所述第一属性值与所述第二属性值的相似度。
可选的,在一个实施例中,所述相似度分量计算模块104还用于对所述目标病例信息包括的每一个属性项的第一属性值进行分词处理,将所述分词处理得到的结果作为与所述第一属性值对应的关键字分词集合;获取所述关键字分词集合中包括的关键字分词在所述第二属性值中出现的位置和/或次数;根据所述关键字分词在所述第二属性值中出现的位置和/或次数计算所述第一属性值与所述第二属性值之间的相似度分量。
可选的,在一个实施例中,所述相似度分量计算模块104还用于根据预设的医学术语库对所述关键字分词集合中包含的关键字分词进行同义词扩展,将所述扩展得到的扩展关键字分词集合作为所述关键字分词集合。
可选的,在一个实施例中,所述相似度分量计算模块104还用于确定与所述第一属性值对应的属性项匹配的扩展术语库作为所述预设的医学术语库。
可选的,在一个实施例中,所述相似度分量计算模块104还用于为所述关键字分词集合中包含的关键字分词分配相应的子权重系数;根据所述关键字分词在所述第二属性值中出现的位置和/或次数、以及为所述关键字分词分配的子权重系数,计算所述第一属性值与所述第二属性值之间的相似度分量。
可选的,在一个实施例中,所述相似度分量计算模块104还用于根据预设的相似度计算函数计算所述第一属性值与所述第二属性值的相似度,所述预设的相似度计算函数为预设的文本相等判断函数、预设的数值范围比较函数、预设的语义相等判断函数、预设的code相等判断函数或预设的语义包含判断函数。
可选的,在一个实施例中,如图3所示,上述装置还包括数据库更新模块110,用于检测在病例填写页面填写的表单内容,根据所述表单内容和所述预设的分层树状结构模型生成与所述检测到的表单内容对应的参考病例信息,将所述参考病例信息存储至所述预设的病例数据库。
实施本发明实施例,将具有如下有益效果:
采用了上述病例信息检索方法和装置之后,在针对病例信息进行检索的过程中,将用户输入的需要检索的关键字按照预设的病例模型生成目标病例信息,在病例数据库中查找与目标病例信息对应的检索结果时,通过计算病例数据库中的参考病例信息与目标病例信息在每一个属性项节点下的相似度而得到二者之间的整体相似度,最后通过整体相似度从病例数据库中筛选出相应的检索结果。也就是说,不需要对病例数据库中的每一个病例信息进行关键字设置之类的预处理,并且在检索的过程中能覆盖病例数据库中所有的数据,提高了检索结果的准确度。
在一个实施例中,如图4所示,图4展示了一种运行上述病例信息检索方法的基于冯诺依曼体系的计算机***的终端。该计算机***可以是智能手机、平板电脑、掌上电脑、笔记本电脑或个人电脑等终端设备。具体的,可包括通过***总线连接的外部输入接口1001、处理器1002、存储器1003和输出接口1004。其中,外部输入接口1001可选的可至少包括网络接口10012。存储器1003可包括外存储器10032(例如硬盘、光盘或软盘等)和内存储器10034。输出接口1004可至少包括显示屏10042等设备。
在本实施例中,本方法的运行基于计算机程序,该计算机程序的程序文件存储于前述基于冯诺依曼体系的计算机***的外存储器10032中,在运行时被加载到内存储器10034中,然后被编译为机器码之后传递至处理器1002中执行,从而使得基于冯诺依曼体系的计算机***中形成逻辑上的目标病例信息生成模块102、相似度分量计算模块104、整体相似度计算模块106、检索结果筛选模块108以及数据库更新模块110。且在上述病例信息检索方法执行过程中,输入的参数均通过外部输入接口1001接收,并传递至存储器1003中缓存,然后输入到处理器1002中进行处理,处理的结果数据或缓存于存储器1003中进行后续地处理,或被传递至输出接口1004进行输出。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
Claims (18)
1.一种病例信息检索方法,其特征在于,包括:
获取用户输入,根据所述用户输入生成目标病例信息,所述目标病例信息包括至少一个属性项;
获取所述目标病例信息包括的每个属性项的第一属性值,遍历预设的病例数据库中包含的参考病例信息,获取所述遍历到的参考病例信息在所述第一属性值对应的属性项下的第二属性值,计算所述第一属性值与所述第二属性值的相似度,得到所述目标病例信息与所述遍历到的参考病例信息在每个属性项下的相似度分量;
根据所述目标病例信息与所述遍历到的参考病例信息在每个属性项下的相似度分量计算所述目标病例信息与所述遍历到的参考病例信息的整体相似度;
根据所述目标病例信息与所述遍历到的参考病例信息的整体相似度在所述病例数据库中筛选参考病例信息作为检索结果输出;
其中,所述用户输入包含至少一个表单项,所述用户输入为按照***中预设的病例模型对病例表单进行填写的内容;
所述根据所述用户输入生成目标病例信息的步骤还包括:
根据所述用户输入包含的至少一个表单项以及预设的分层树状结构模型,生成与所述用户输入对应的目标病例信息,所述目标病例信息包括的属性项对应于所述用户输入包含的表单项,其中,所述根据所述用户输入包含的至少一个表单项以及预设的分层树状结构模型,生成与所述用户输入对应的目标病例信息包括:按照预设的分层树状结构模型包含的每一个节点以及用户输入包含的每一个表单项以及节点与表单项之间的对应关系,确定生成的目标病例信息中包含的属性项以及每一个属性项对应的属性值。
2.根据权利要求1所述的病例信息检索方法,其特征在于,所述根据所述目标病例信息与所述遍历到的参考病例信息在每个属性项下的相似度分量计算所述目标病例信息与所述遍历到的参考病例信息的整体相似度的步骤还包括:
获取与所述目标病例信息包括的每一个属性项对应的权重系数;
根据与所述属性项对应的权重系数,对所述每个属性项下的相似度分量进行加权,得到所述目标病例信息与所述遍历到的参考病例信息的整体相似度。
3.根据权利要求1或2所述的病例信息检索方法,其特征在于,所述目标病例信息包含的属性项包括至少2个与该属性项对应的子属性项;
所述计算所述第一属性值与所述第二属性值的相似度的步骤还包括:
获取与所述至少2个子属性项对应的子属性项权重系数;
计算目标病例信息在所述每一个子属性项下的第一子属性值与所述参考病例信息在所述每一个子属性项下的第二子属性值的子相似度;
根据所述子属性项权重系数对所述子相似度进行加权得到所述第一属性值与所述第二属性值的相似度。
4.根据权利要求1所述的病例信息检索方法,其特征在于,所述获取所述目标病例信息包括的每个属性项的第一属性值的步骤之后还包括:
对所述目标病例信息包括的每一个属性项的第一属性值进行分词处理,将所述分词处理得到的结果作为与所述第一属性值对应的关键字分词集合;
所述计算所述第一属性值与所述第二属性值的相似度的步骤还包括:
获取所述关键字分词集合中包括的关键字分词在所述第二属性值中出现的位置和/或次数;
根据所述关键字分词在所述第二属性值中出现的位置和/或次数计算所述第一属性值与所述第二属性值之间的相似度分量。
5.根据权利要求4所述的病例信息检索方法,其特征在于,所述将所述分词处理得到的结果作为与所述第一属性值对应的关键字分词集合的步骤之后还包括:
根据预设的医学术语库对所述关键字分词集合中包含的关键字分词进行同义词扩展,将所述扩展得到的扩展关键字分词集合作为所述关键字分词集合,执行所述获取所述关键字分词集合中包括的关键字分词在所述第二属性值中出现的位置和/或次数的步骤。
6.根据权利要求5所述的病例信息检索方法,其特征在于,所述根据预设的医学术语库对所述关键字分词集合中包含的关键字分词进行同义词扩展的步骤之前还包括:
确定与所述第一属性值对应的属性项匹配的扩展术语库作为所述预设的医学术语库。
7.根据权利要求4至6任一所述的病例信息检索方法,其特征在于,所述将所述分词处理得到的结果作为与所述第一属性值对应的关键字分词集合之后还包括:
为所述关键字分词集合中包含的关键字分词分配相应的子权重系数;
所述根据所述关键字分词在所述第二属性值中出现的位置和/或次数计算所述第一属性值与所述第二属性值之间的相似度分量的步骤还包括:
根据所述关键字分词在所述第二属性值中出现的位置和/或次数、以及为所述关键字分词分配的子权重系数,计算所述第一属性值与所述第二属性值之间的相似度分量。
8.根据权利要求1所述的病例信息检索方法,其特征在于,所述计算所述第一属性值与所述第二属性值的相似度的步骤还包括:
根据预设的相似度计算函数计算所述第一属性值与所述第二属性值的相似度,所述预设的相似度计算函数为预设的文本相等判断函数、预设的数值范围比较函数、预设的语义相等判断函数、预设的code相等判断函数或预设的语义包含判断函数。
9.根据权利要求1所述的病例信息检索方法,其特征在于,所述方法还包括:
检测在病例填写页面填写的表单内容,根据所述表单内容和所述预设的分层树状结构模型生成与所述检测到的表单内容对应的参考病例信息,将所述参考病例信息存储至所述预设的病例数据库。
10.一种病例信息检索装置,其特征在于,包括:
目标病例信息生成模块,用于获取用户输入,根据所述用户输入生成目标病例信息,所述目标病例信息包括至少一个属性项;
相似度分量计算模块,用于获取所述目标病例信息包括的每个属性项的第一属性值,遍历预设的病例数据库中包含的参考病例信息,获取所述遍历到的参考病例信息在所述第一属性值对应的属性项下的第二属性值,计算所述第一属性值与所述第二属性值的相似度,得到所述目标病例信息与所述遍历到的参考病例信息在每个属性项下的相似度分量;
整体相似度计算模块,用于根据所述目标病例信息与所述遍历到的参考病例信息在每个属性项下的相似度分量计算所述目标病例信息与所述遍历到的参考病例信息的整体相似度;
检索结果筛选模块,用于根据所述目标病例信息与所述遍历到的参考病例信息的整体相似度在所述病例数据库中筛选参考病例信息作为检索结果输出;
其中,所述用户输入包含至少一个表单项,所述用户输入为按照***中预设的病例模型对病例表单进行填写的内容;
所述目标病例信息生成模块还用于根据所述用户输入包含的至少一个表单项以及预设的分层树状结构模型,生成与所述用户输入对应的目标病例信息,所述目标病例信息包括的属性项对应于所述用户输入包含的表单项,其中,所述目标病例信息生成模块根据所述用户输入包含的至少一个表单项以及预设的分层树状结构模型,生成与所述用户输入对应的目标病例信息包括:所述目标病例信息生成模块按照预设的分层树状结构模型包含的每一个节点以及用户输入包含的每一个表单项以及节点与表单项之间的对应关系,确定生成的目标病例信息中包含的属性项以及每一个属性项对应的属性值。
11.根据权利要求10所述的病例信息检索装置,其特征在于,所述目标病例信息包括的属性项为分类属性项或描述属性项,所述分类属性项包括至少一个与该分类属性项对应的分类属性项和至多一个描述属性项。
12.根据权利要求10所述的病例信息检索装置,其特征在于,所述整体相似度计算模块还用于获取与所述目标病例信息包括的每一个属性项对应的权重系数;根据与所述属性项对应的权重系数,对所述每个属性项下的相似度分量进行加权,得到所述目标病例信息与所述遍历到的参考病例信息的整体相似度。
13.根据权利要求10或12所述的病例信息检索装置,其特征在于,所述目标病例信息包含的属性项包括至少2个与该属性项对应的子属性项;
所述相似度分量计算模块还用于获取与所述至少2个子属性项对应的子属性项权重系数;计算目标病例信息在所述每一个子属性项下的第一子属性值与所述参考病例信息在所述每一个子属性项下的第二子属性值的子相似度;根据所述子属性项权重系数对所述子相似度进行加权得到所述第一属性值与所述第二属性值的相似度。
14.根据权利要求10所述的病例信息检索装置,其特征在于,所述相似度分量计算模块还用于对所述目标病例信息包括的每一个属性项的第一属性值进行分词处理,将所述分词处理得到的结果作为与所述第一属性值对应的关键字分词集合;获取所述关键字分词集合中包括的关键字分词在所述第二属性值中出现的位置和/或次数;根据所述关键字分词在所述第二属性值中出现的位置和/或次数计算所述第一属性值与所述第二属性值之间的相似度分量。
15.根据权利要求14所述的病例信息检索装置,其特征在于,所述相似度分量计算模块还用于根据预设的医学术语库对所述关键字分词集合中包含的关键字分词进行同义词扩展,将所述扩展得到的扩展关键字分词集合作为所述关键字分词集合。
16.根据权利要求15所述的病例信息检索装置,其特征在于,所述相似度分量计算模块还用于确定与所述第一属性值对应的属性项匹配的扩展术语库作为所述预设的医学术语库。
17.根据权利要求14至16任一所述的病例信息检索装置,其特征在于,所述相似度分量计算模块还用于为所述关键字分词集合中包含的关键字分词分配相应的子权重系数;根据所述关键字分词在所述第二属性值中出现的位置和/或次数、以及为所述关键字分词分配的子权重系数,计算所述第一属性值与所述第二属性值之间的相似度分量。
18.根据权利要求10所述的病例信息检索装置,其特征在于,所述装置还包括数据库更新模块,用于检测在病例填写页面填写的表单内容,根据所述表单内容和所述预设的分层树状结构模型生成与所述检测到的表单内容对应的参考病例信息,将所述参考病例信息存储至所述预设的病例数据库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610905237.3A CN107958007B (zh) | 2016-10-18 | 2016-10-18 | 病例信息检索方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610905237.3A CN107958007B (zh) | 2016-10-18 | 2016-10-18 | 病例信息检索方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107958007A CN107958007A (zh) | 2018-04-24 |
CN107958007B true CN107958007B (zh) | 2022-03-29 |
Family
ID=61953911
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610905237.3A Active CN107958007B (zh) | 2016-10-18 | 2016-10-18 | 病例信息检索方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107958007B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109408787A (zh) * | 2018-09-27 | 2019-03-01 | 用友网络科技股份有限公司 | 一种单据辅助录入方法及录入装置 |
CN109545382A (zh) * | 2018-10-30 | 2019-03-29 | 平安科技(深圳)有限公司 | 一种基于大数据的雷同病例识别方法及计算设备 |
CN109753516B (zh) * | 2019-01-31 | 2021-08-10 | 北京嘉和海森健康科技有限公司 | 一种病历搜索结果的排序方法和相关装置 |
JP6651189B1 (ja) * | 2019-03-29 | 2020-02-19 | 株式会社 情報システムエンジニアリング | 機械学習用のデータ構造、学習方法及び情報提供システム |
CN110491519B (zh) * | 2019-07-17 | 2024-01-02 | 上海明品医学数据科技有限公司 | 一种医学数据的检验方法 |
CN110517785B (zh) * | 2019-08-28 | 2022-05-10 | 北京百度网讯科技有限公司 | 相似病例的查找方法、装置及设备 |
CN110909121A (zh) * | 2019-10-10 | 2020-03-24 | 北京东软望海科技有限公司 | 用于医疗行业数据标准化的方法及*** |
CN111402973B (zh) * | 2020-03-02 | 2023-07-07 | 平安科技(深圳)有限公司 | 信息匹配分析方法、装置、计算机***及可读存储介质 |
CN111599482A (zh) * | 2020-05-14 | 2020-08-28 | 青岛海信医疗设备股份有限公司 | 电子病例推荐方法和服务器 |
CN112287094B (zh) * | 2020-12-30 | 2021-04-13 | 北京伯仲叔季科技有限公司 | 相似病例文本检索*** |
CN112466472B (zh) * | 2021-02-03 | 2021-05-18 | 北京伯仲叔季科技有限公司 | 病例文本信息检索*** |
CN112885460A (zh) * | 2021-02-10 | 2021-06-01 | 暨南大学 | 基于案例推理的感冒证型评判方法、计算机装置及计算机可读存储介质 |
CN113793683B (zh) * | 2021-08-23 | 2024-04-02 | 广州医科大学附属第一医院(广州呼吸中心) | 一种基于psa的***癌辅助决策方法及其*** |
CN115376643A (zh) * | 2022-10-26 | 2022-11-22 | 神州医疗科技股份有限公司 | 病例自定义检索方法、装置、电子设备和计算机可读介质 |
CN115392939B (zh) * | 2022-10-28 | 2023-01-17 | 中国环境科学研究院 | 一种基于检索对比和匹配度计算的危险废物溯源方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103473283A (zh) * | 2013-08-29 | 2013-12-25 | 中国测绘科学研究院 | 一种文本案例匹配方法 |
CN105718597A (zh) * | 2016-03-04 | 2016-06-29 | 北京邮电大学 | 一种数据检索方法及*** |
CN105893597A (zh) * | 2016-04-20 | 2016-08-24 | 上海家好科技有限公司 | 一种相似病历检索方法及*** |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020138470A1 (en) * | 2001-03-21 | 2002-09-26 | Inter China Network Software Company Limited | System and method of personal and business web cards |
JP2003122845A (ja) * | 2001-10-09 | 2003-04-25 | Shinkichi Himeno | 医療情報の検索システム及びそのシステムを実行するためのプログラム |
WO2012111288A1 (ja) * | 2011-02-14 | 2012-08-23 | パナソニック株式会社 | 類似症例検索装置および類似症例検索方法 |
-
2016
- 2016-10-18 CN CN201610905237.3A patent/CN107958007B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103473283A (zh) * | 2013-08-29 | 2013-12-25 | 中国测绘科学研究院 | 一种文本案例匹配方法 |
CN105718597A (zh) * | 2016-03-04 | 2016-06-29 | 北京邮电大学 | 一种数据检索方法及*** |
CN105893597A (zh) * | 2016-04-20 | 2016-08-24 | 上海家好科技有限公司 | 一种相似病历检索方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN107958007A (zh) | 2018-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107958007B (zh) | 病例信息检索方法及装置 | |
AU2016225947B2 (en) | System and method for multimedia document summarization | |
EP2823410B1 (en) | Entity augmentation service from latent relational data | |
US10755179B2 (en) | Methods and apparatus for identifying concepts corresponding to input information | |
KR100859918B1 (ko) | 사용자 피드백을 이용하여 검색된 컨텐츠를 평가하고 평가결과를 이용하여 검색 결과를 제공하는 방법 및 장치 | |
CN110309251B (zh) | 文本数据的处理方法、装置和计算机可读存储介质 | |
US20130339840A1 (en) | System and method for logical chunking and restructuring websites | |
US9251203B2 (en) | User interface for predictive model generation | |
EP3488367B1 (en) | Annotating medical images | |
US20230205796A1 (en) | Method and system for document retrieval and exploration augmented by knowledge graphs | |
CN112507230B (zh) | 基于浏览器的网页推荐方法、装置、电子设备及存储介质 | |
JP2007219929A (ja) | 感性評価システム及び方法 | |
US10212240B2 (en) | Method for tracking content and electronic device using the same | |
Chang et al. | Generating contextual embeddings for emergency department chief complaints | |
CN114201598B (zh) | 文本推荐方法及文本推荐装置 | |
CN114153995B (zh) | 医学术语的处理方法、装置、计算机设备和存储介质 | |
CN110245242B (zh) | 医学知识图谱构建方法、装置以及终端 | |
US10719663B2 (en) | Assisted free form decision definition using rules vocabulary | |
Kumar et al. | PAVE: Lazy-MDP based ensemble to improve recall of product attribute extraction models | |
CN114020867A (zh) | 一种搜索词的扩展方法、装置、设备及介质 | |
JP2018156552A (ja) | 計算機システム及び文章データの検索方法 | |
CN115698980A (zh) | 用于评价文档检索的性能的方法、***以及装置 | |
Phukon et al. | Synonymy expansion using link prediction methods: A case study of assamese WordNet | |
US20200410010A1 (en) | Expert stance classification using computerized text analytics | |
US11960824B2 (en) | Document creation system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder | ||
CP01 | Change in the name or title of a patent holder |
Address after: Room 1209, 12 / F, building 1, 1288 Chunbo Road, Binjiang District, Hangzhou City, Zhejiang Province 310000 Patentee after: Hangzhou Mindray Digital Technology Co.,Ltd. Address before: Room 1209, 12 / F, building 1, 1288 Chunbo Road, Binjiang District, Hangzhou City, Zhejiang Province 310000 Patentee before: ZHEJIANG GREENLANDER INFORMATION TECHNOLOGY Co.,Ltd. |