发明内容
基于此,本发明的目的是提供一种患者信息匹配方法、***、计算机及可读存储介质,以解决现有技术的患者主索引匹配策略只适用于数字类数据元的查询,例如身份证号、手机号等,但对于姓名、家庭地址、联系地址以及公司名称等文字类数据元的查询时,效果较差,从而不利于患者信息查询的问题。
本发明实施例第一方面提出了一种患者信息匹配方法,所述方法包括:
当接收到用户输入的实际患者信息时,在预设数据库中检索出与所述实际患者信息相似的存量患者信息,并识别出所述实际患者信息和所述存量患者信息中分别包含的若干数据元;
对所述实际患者信息中的第一目标数据元和所述存量患者信息中的第二目标数据元依次进行正向最大步长分词以及反向最大步长分词,并分别计算出所述第一目标数据元和所述第二目标数据元在所述正向最大步长分词下产生的第一匹配度值、在所述反向最大步长分词下产生的第二匹配度值,所述第一目标数据元与所述第二目标数据元相对应;
判断所述第一匹配度值与所述第二匹配度值之间的较大值是否大于预设阈值;
若判断到所述第一匹配度值与所述第二匹配度值之间的较大值大于所述预设阈值,则判定所述存量患者信息与所述实际患者信息相匹配。
本发明的有益效果是:通过当接收到用户输入的实际患者信息时,在预设数据库中检索出与实际患者信息相似的存量患者信息,并识别出实际患者信息和存量患者信息中分别包含的若干数据元;进一步的,对实际患者信息中的第一目标数据元和存量患者信息中的第二目标数据元依次进行正向最大步长分词以及反向最大步长分词,并分别计算出第一目标数据元和第二目标数据元在正向最大步长分词下产生的第一匹配度值、在反向最大步长分词下产生的第二匹配度值;在此基础之上,判断第一匹配度值与第二匹配度值之间的较大值是否大于预设阈值;具体的,若是,则判定当前存量患者信息与实际患者信息相匹配。通过上述方式能够准确的通过正向以及反向最大步长分词的匹配结果匹配出与实时接收到的实际患者信息对应的存量患者信息,大幅提升了患者信息的匹配效率,减少了冗余数据的产生,对应提升了患者的就医体验。
优选的,所述对所述实际患者信息中的第一目标数据元和所述存量患者信息中的第二目标数据元依次进行正向最大步长分词以及反向最大步长分词的步骤包括:
当对所述实际患者信息中的第一目标数据元以及所述存量患者信息中的第二目标数据元进行所述正向最大步长分词时,识别出所述第一目标数据元中包含的第一文本串、所述第二目标数据元中包含的第二文本串,并按照第一扫描顺序分别对所述第一文本串以及所述第二文本串进行扫描分词,以将所述第一文本串拆分成若干第一词组、将所述第二文本串拆分成若干第二词组。
优选的,所述分别计算出所述第一目标数据元和所述第二目标数据元在所述正向最大步长分词下产生的第一匹配度值、在所述反向最大步长分词下产生的第二匹配度值的步骤包括:
通过预设同义词库和预设地址库分别对若干所述第一词组以及若干所述第二词组进行修正处理,以分别生成对应的若干第一标准词组以及若干第二标准词组;
识别出若干所述第一标准词组包含的第一字符总数,并检测出所述第一标准词组与所述第二标准词组之间的第一匹配字符数;
根据所述第一字符总数以及所述第一匹配字符数计算出所述第一匹配度值。
优选的,所述对所述实际患者信息中的第一目标数据元和所述存量患者信息中的第二目标数据元依次进行正向最大步长分词以及反向最大步长分词的步骤包括:
当对所述实际患者信息中的第一目标数据元以及所述存量患者信息中的第二目标数据元进行所述反向最大步长分词时,识别出所述第一目标数据元中包含的所述第一文本串、所述第二目标数据元中包含的所述第二文本串,并按照第二扫描顺序分别对所述第一文本串以及所述第二文本串进行扫描分词,以将所述第一文本串拆分成若干第三词组、将所述第二文本串拆分成若干第四词组。
优选的,所述分别计算出所述第一目标数据元和所述第二目标数据元在所述正向最大步长分词下产生的第一匹配度值、在所述反向最大步长分词下产生的第二匹配度值的步骤包括:
通过所述预设同义词库和所述预设地址库分别对若干所述第三词组以及若干所述第四词组进行修正处理,以分别生成对应的若干第三标准词组以及若干第四标准词组;
识别出若干所述第三标准词组包含的第二字符总数,并检测出所述第三标准词组与所述第四标准词组之间的第二匹配字符数;
根据所述第二字符总数以及所述第二匹配字符数计算出所述第二匹配度值。
优选的,当所述第一目标数据元和所述第二目标数据元均为多个时,所述方法还包括:
计算出若干所述第一目标数据元依次在所述正向最大步长分词以及所述反向最大步长分词下产生的第一匹配度均值,并计算出若干所述第二目标数据元依次在所述正向最大步长分词以及所述反向最大步长分词下产生的第二匹配度均值;
判断所述第一匹配度均值是否大于所述第二匹配度均值;
若判断到所述第一匹配度均值大于所述第二匹配度均值,则判断所述第一匹配度均值是否大于所述预设阈值;
若判断到所述第一匹配度均值大于所述预设阈值,则判定所述存量患者信息与所述实际患者信息相匹配。
优选的,所述判定所述存量患者信息与所述实际患者信息相匹配的步骤之后,所述方法还包括:
将所述存量患者信息与所述实际患者信息相比对,并检测出所述存量患者信息与所述实际患者信息之间的区别患者信息;
判断所述存量患者信息中是否保存有所述区别患者信息;
若判断到所述存量患者信息中未保存有所述区别患者信息,则将所述区别患者信息对应更新至所述存量患者信息中,以完成对所述存量患者信息的实时更新。
本发明实施例第二方面提出了一种患者信息匹配***,所述***包括:
接收模块,用于当接收到用户输入的实际患者信息时,在预设数据库中检索出与所述实际患者信息相似的存量患者信息,并识别出所述实际患者信息和所述存量患者信息中分别包含的若干数据元;
计算模块,用于对所述实际患者信息中的第一目标数据元和所述存量患者信息中的第二目标数据元依次进行正向最大步长分词以及反向最大步长分词,并分别计算出所述第一目标数据元和所述第二目标数据元在所述正向最大步长分词下产生的第一匹配度值、在所述反向最大步长分词下产生的第二匹配度值,所述第一目标数据元与所述第二目标数据元相对应;
判断模块,用于判断所述第一匹配度值与所述第二匹配度值之间的较大值是否大于预设阈值;
执行模块,用于若判断到所述第一匹配度值与所述第二匹配度值之间的较大值大于所述预设阈值,则判定所述存量患者信息与所述实际患者信息相匹配。
其中,上述患者信息匹配***中,所述计算模块具体用于:
当对所述实际患者信息中的第一目标数据元以及所述存量患者信息中的第二目标数据元进行所述正向最大步长分词时,识别出所述第一目标数据元中包含的第一文本串、所述第二目标数据元中包含的第二文本串,并按照第一扫描顺序分别对所述第一文本串以及所述第二文本串进行扫描分词,以将所述第一文本串拆分成若干第一词组、将所述第二文本串拆分成若干第二词组。
其中,上述患者信息匹配***中,所述计算模块还具体用于:
通过预设同义词库和预设地址库分别对若干所述第一词组以及若干所述第二词组进行修正处理,以分别生成对应的若干第一标准词组以及若干第二标准词组;
识别出若干所述第一标准词组包含的第一字符总数,并检测出所述第一标准词组与所述第二标准词组之间的第一匹配字符数;
根据所述第一字符总数以及所述第一匹配字符数计算出所述第一匹配度值。
其中,上述患者信息匹配***中,所述计算模块还具体用于:
当对所述实际患者信息中的第一目标数据元以及所述存量患者信息中的第二目标数据元进行所述反向最大步长分词时,识别出所述第一目标数据元中包含的所述第一文本串、所述第二目标数据元中包含的所述第二文本串,并按照第二扫描顺序分别对所述第一文本串以及所述第二文本串进行扫描分词,以将所述第一文本串拆分成若干第三词组、将所述第二文本串拆分成若干第四词组。
其中,上述患者信息匹配***中,所述计算模块还具体用于:
通过所述预设同义词库和所述预设地址库分别对若干所述第三词组以及若干所述第四词组进行修正处理,以分别生成对应的若干第三标准词组以及若干第四标准词组;
识别出若干所述第三标准词组包含的第二字符总数,并检测出所述第三标准词组与所述第四标准词组之间的第二匹配字符数;
根据所述第二字符总数以及所述第二匹配字符数计算出所述第二匹配度值。
其中,上述患者信息匹配***中,当所述第一目标数据元和所述第二目标数据元均为多个时,所述患者信息匹配***还包括处理模块,所述处理模块具体用于:
计算出若干所述第一目标数据元依次在所述正向最大步长分词以及所述反向最大步长分词下产生的第一匹配度均值,并计算出若干所述第二目标数据元依次在所述正向最大步长分词以及所述反向最大步长分词下产生的第二匹配度均值;
判断所述第一匹配度均值是否大于所述第二匹配度均值;
若判断到所述第一匹配度均值大于所述第二匹配度均值,则判断所述第一匹配度均值是否大于所述预设阈值;
若判断到所述第一匹配度均值大于所述预设阈值,则判定所述存量患者信息与所述实际患者信息相匹配。
其中,上述患者信息匹配***中,所述患者信息匹配***还包括更新模块,所述更新模块具体用于:
将所述存量患者信息与所述实际患者信息相比对,并检测出所述存量患者信息与所述实际患者信息之间的区别患者信息;
判断所述存量患者信息中是否保存有所述区别患者信息;
若判断到所述存量患者信息中未保存有所述区别患者信息,则将所述区别患者信息对应更新至所述存量患者信息中,以完成对所述存量患者信息的实时更新。
本发明实施例第三方面提出了一种计算机,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上面所述的患者信息匹配方法。
本发明实施例第四方面提出了一种可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上面所述的患者信息匹配方法。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的若干实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
需要说明的是,当元件被称为“固设于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
现有的患者主索引匹配策略主要使用相等匹配法,即将传入的患者对象的各个数据元与已有的患者信息进行逐一相等比对,如果比对结果达到一定阈值,则认为传入的患者对象与已有的患者信息是属于同一患者,否则,则认为传入的患者对象是新患者,导致现有的患者主索引匹配策略只适用于数字类数据元的查询,例如身份证号、手机号等,但对于姓名、家庭地址、联系地址以及公司名称等文字类数据元的查询时,效果较差,从而不利于患者信息的查询。
请参阅图1,所示为本发明第一实施例提供的患者信息匹配方法,本实施例提供的患者信息匹配方法能够准确的通过正向以及反向最大步长分词的匹配结果匹配出与实时接收到的实际患者信息对应的存量患者信息,大幅提升了患者信息的匹配效率,减少了冗余数据的产生,对应提升了患者的就医体验。
具体的,本实施例提供的患者信息匹配方法具体包括以下步骤:
步骤S10,当接收到用户输入的实际患者信息时,在预设数据库中检索出与所述实际患者信息相似的存量患者信息,并识别出所述实际患者信息和所述存量患者信息中分别包含的若干数据元;
具体的,在本实施例中,首先需要说明的是,本实施例提供的患者信息匹配方法具体应用在各种医疗机构的患者信息查询***中,用于实时简单、快速的匹配出需要的患者信息。
另外,在本实施例中,需要指出的是,各个医疗机构的患者信息查询***中都会预先设置一个数据库,用于存储已就诊的患者的就诊信息,即该数据库中存储有大量的存量患者信息,该存量患者信息就是已有的患者信息。
因此,在本步骤中,需要说明的是,当实时接收到用户输入的实际患者信息时,具体的,该实际患者信息可以为当前用户输入的“姓名”、“家庭住址”以及“电话号码”等中的一个或者多个信息,在此基础之上,本步骤会进一步在上述预设数据库中初步检索出与当前实时接收到的实际患者信息相似的存量患者信息。其中,需要指出的是,该存量患者信息可能是当前用户之前已经记录的信息,也可能是其它用户的患者信息,因此,需要进一步判断当前存量患者信息是否与当前用户实时输入的实际患者信息相匹配。
进一步的,本步骤还会识别出当前实际患者信息与当前存量患者信息中分别包含的若干数据元,具体的,该若干数据元可以为“家庭地址”、“患者姓名”以及“电话号码”等数据。
步骤S20,对所述实际患者信息中的第一目标数据元和所述存量患者信息中的第二目标数据元依次进行正向最大步长分词以及反向最大步长分词,并分别计算出所述第一目标数据元和所述第二目标数据元在所述正向最大步长分词下产生的第一匹配度值、在所述反向最大步长分词下产生的第二匹配度值,所述第一目标数据元与所述第二目标数据元相对应;
进一步的,在本步骤中,需要说明的是,为了能够准确的判断出当前实际患者信息是否与当前存量患者信息相匹配,本步骤会进一步在当前实际患者信息中选取出第一目标数据元,对应的,在当前存量患者信息中选取出第二目标数据元,具体的,该第一目标数据元与该第二目标数据元相对应,即两者是同一类型的数据元,例如都是“家庭地址”数据元或者都是“病情描述”数据元。
更进一步的,本步骤会对当前实际患者信息中的第一目标数据元和当前存量患者信息中的第二目标数据元依次进行正向最大步长分词以及反向最大步长分词,与此同时,计算出当前第一目标数据元和当前第二目标数据元在上述正向最大步长分词下产生的第一匹配度值,对应的,在上述反向最大步长分词下产生的第二匹配度值,其中,第一匹配度值和第二匹配度值均是一个具体的数值。
步骤S30,判断所述第一匹配度值与所述第二匹配度值之间的较大值是否大于预设阈值;
具体的,本步骤会进一步判断当前第一匹配度值与当前第二匹配度值之间的较大值是否大于预先设置好的阈值,例如当第一匹配度值大于第二匹配度值时,则将当前第一匹配度值与上述预设阈值相比对,对应的,当第二匹配度值大于第一匹配度值时,则将当前第二匹配度值与上述预设阈值相比对。
步骤S40,若判断到所述第一匹配度值与所述第二匹配度值之间的较大值大于所述预设阈值,则判定所述存量患者信息与所述实际患者信息相匹配。
最后,在本实施例中,需要说明的是,若本步骤实时判断到当前第一匹配度值与当前第二匹配度值之间的较大值大于上述预设阈值,则判定当前存量患者信息与当前实际患者信息相匹配,对应的,若实时判断到当前第一匹配度值与当前第二匹配度值之间的较大值小于上述预设阈值,则需要重复上述步骤S10至步骤S30,直至判断到第一匹配度值与第二匹配度值之间的较大值大于上述预设阈值。
使用时,通过当接收到用户输入的实际患者信息时,在预设数据库中检索出与实际患者信息相似的存量患者信息,并识别出实际患者信息和存量患者信息中分别包含的若干数据元;进一步的,对实际患者信息中的第一目标数据元和存量患者信息中的第二目标数据元依次进行正向最大步长分词以及反向最大步长分词,并分别计算出第一目标数据元和第二目标数据元在正向最大步长分词下产生的第一匹配度值、在反向最大步长分词下产生的第二匹配度值;在此基础之上,判断第一匹配度值与第二匹配度值之间的较大值是否大于预设阈值;具体的,若是,则判定当前存量患者信息与实际患者信息相匹配。通过上述方式能够准确的通过正向以及反向最大步长分词的匹配结果匹配出与实时接收到的实际患者信息对应的存量患者信息,大幅提升了患者信息的匹配效率,减少了冗余数据的产生,对应提升了患者的就医体验。
需要说明的是,上述的实施过程只是为了说明本申请的可实施性,但这并不代表本申请的患者信息匹配方法只有上述唯一一种实施流程,相反的,只要能够将本申请的患者信息匹配方法实施起来,都可以被纳入本申请的可行实施方案。
综上,本发明上述实施例提供的患者信息匹配方法能够准确的通过正向以及反向最大步长分词的匹配结果匹配出与实时接收到的实际患者信息对应的存量患者信息,大幅提升了患者信息的匹配效率,减少了冗余数据的产生,对应提升了患者的就医体验。
本发明第二实施例也提供了一种患者信息匹配方法,本实施例提供的患者信息匹配方法与上述第一实施例提供的患者信息匹配方法不同之处在于:
具体的,在本实施例中,需要说明的是,上述对所述实际患者信息中的第一目标数据元和所述存量患者信息中的第二目标数据元依次进行正向最大步长分词以及反向最大步长分词的步骤包括:
当对所述实际患者信息中的第一目标数据元以及所述存量患者信息中的第二目标数据元进行所述正向最大步长分词时,识别出所述第一目标数据元中包含的第一文本串、所述第二目标数据元中包含的第二文本串,并按照第一扫描顺序分别对所述第一文本串以及所述第二文本串进行扫描分词,以将所述第一文本串拆分成若干第一词组、将所述第二文本串拆分成若干第二词组。
具体的,在本实施例中,需要说明的是,当需要对当前实际患者信息中的第一目标数据元以及当前存量患者信息中的第二目标数据元进行上述正向最大步长分词时,本实施例会首先识别出当前第一目标数据元中包含的第一文本串,对应的,识别出当前第二目标数据元中包含的第二文本串,并按照从左到右的顺序对当前第一文本串以及第二文本串进行扫描分词,以对应将当前第一文本串拆分成若干个第一词组,将当前第二文本串拆分成若干第二词组。
进一步的,在本实施例中,为了便于理解,需要说明的是,例如本实施例以“家庭地址”数据元为例进行解释说明,具体的,例如本实施例获取到的实际患者信息中包含的第一目标数据元中的第一文本串为“江苏省无锡市新吴区菱湖大道200号F区5号楼”,对应的,本实施例获取到的存量患者信息中包含的第二目标数据元中的第二文本串为“无锡新区菱湖大道200号创新园F区5号楼”,在此基础之上,依次对当前第一文本串以及第二文本串从左到右进行扫描分词,从而获取到第一文本串的正向最大步长分词结果为“江苏省/无锡市/新吴区/菱湖大道/ 200 /号/ F /区/ 5 /号楼”,对应的,获取到第二文本串的正向最大步长分词结果为“无锡/新区/菱湖大道/ 200 /号/创新园/ F /区/ 5 /号楼”。
其中,在本实施例中,需要指出的是,上述分别计算出所述第一目标数据元和所述第二目标数据元在所述正向最大步长分词下产生的第一匹配度值的步骤包括:
通过预设同义词库和预设地址库分别对若干所述第一词组以及若干所述第二词组进行修正处理,以分别生成对应的若干第一标准词组以及若干第二标准词组;
识别出若干所述第一标准词组包含的第一字符总数,并检测出所述第一标准词组与所述第二标准词组之间的第一匹配字符数;
根据所述第一字符总数以及所述第一匹配字符数计算出所述第一匹配度值。
进一步的,在本实施例中,需要说明的是,在通过上述步骤依次获取到第一词组以及第二词组之后,为了能够进一步提升匹配的准确率,本实施例会进一步通过预设设置好的同义词库以及预先设置好的地址库对当前若干第一词组以及若干第二词组分别进行修正处理。以地址数据元为例,原始的地址信息可能会缺失行政级别、道路、居民小区等信息,所以结合同义词库以及地址库对词组进行修正处理后,可以补充缺失的行政级别、道路、居民小区等信息,从而提升数据元的匹配率,进而达到提示患者信息匹配率的目的。
具体的,本实施例会进一步通过上述同义词库以及地址库对当前第一词组以及第二词组中出现的词组进行查漏补缺,例如当获取到上述第二文本串的正向最大步长分词结果为“无锡/新区/菱湖大道/ 200 /号/创新园/ F /区/ 5 /号楼”,在此基础之上,本实施例会通过上述同义词库以及地址库将当前第二文本串的正向最大步长分词结果修正为“江苏省/无锡市 /新区/菱湖大道/ 200 /号/创新园/ F /区/ 5 /号楼”,从而能够生成对应的第一标准词组以及第二标准词组,以提高后续的计算精准度。
更进一步的,本实施例会进一步识别出当前第一标准词组中包含的第一字符总数,与此同时,本实施例会进一步对应检测出当前第一标准词组与当前第二标准词组之间的第一匹配字符数,最后只需根据获取到的第一字符总数与第一匹配字符数就能够计算出需要的第一匹配度值。
具体的,在本实施例中,为了便于理解,需要说明的是,例如修正后的第一标准词组为“江苏省/无锡市/新吴区/菱湖大道/ 200 /号/ F /区/ 5 /号楼”,对应的,修正后的第二标准词组为“江苏省/无锡市 /新区/菱湖大道/ 200 /号/创新园/ F /区/ 5 /号楼”,其中,需要指出的是,一般认为分词的单字作用有限,可能会影响匹配效果,所以本实施例只会统计超过一个字的分词。因此,本实施例计算出的第一字符总数为22个,对应的,本实施例计算出第一标准词组与第二标准词组之间的第一匹配字符数为17个,则本实施例计算出的第一匹配度值的具体数值为77.3%。
需要指出的是,本发明第二实施例所提供的方法,其实现原理及产生的一些技术效果和第一实施例相同,为简要描述,本实施例未提及之处,可参考第一实施例提供的相应内容。
综上,本发明上述实施例提供的患者信息匹配方法能够准确的通过正向以及反向最大步长分词的匹配结果匹配出与实时接收到的实际患者信息对应的存量患者信息,大幅提升了患者信息的匹配效率,减少了冗余数据的产生,对应提升了患者的就医体验。
本发明第三实施例也提供了一种患者信息匹配方法,本实施例提供的患者信息匹配方法与上述第一实施例提供的患者信息匹配方法不同之处在于:
具体的,在本实施例中,需要说明的是,上述对所述实际患者信息中的第一目标数据元和所述存量患者信息中的第二目标数据元依次进行正向最大步长分词以及反向最大步长分词的步骤包括:
当对所述实际患者信息中的第一目标数据元以及所述存量患者信息中的第二目标数据元进行所述反向最大步长分词时,识别出所述第一目标数据元中包含的所述第一文本串、所述第二目标数据元中包含的所述第二文本串,并按照第二扫描顺序分别对所述第一文本串以及所述第二文本串进行扫描分词,以将所述第一文本串拆分成若干第三词组、将所述第二文本串拆分成若干第四词组。
同理,在本实施例中,需要说明的是,当需要对上述实际患者信息中的第一目标数据元以及上述存量患者信息中的第二目标数据元进行反向最大步长分词时,本实施例同样会识别出当前第一目标数据元中包含的第一文本串,以及第二目标数据元中包含的第二文本串,在此基础之上,按照从右至左的方式对第一文本串以及第二文本串进行扫描分词,以对应将当前第一文本串拆分成若干第三词组,将当前第二文本串拆分成若干第四词组。
具体的,例如本实施例获取到的第三词组为“江苏省/无锡市/新吴区/菱湖大道/200号/ F区/ 5号楼”,对应的,获取到的第四词组为“无锡/新区/菱湖大道/ 200号/创新园/ F区/ 5号楼”,以进行后续的计算。
其中,在本实施例中,需要指出的是,上述分别计算出所述第一目标数据元和所述第二目标数据元在所述正向最大步长分词下产生的第一匹配度值、在所述反向最大步长分词下产生的第二匹配度值的步骤包括:
通过所述预设同义词库和所述预设地址库分别对若干所述第三词组以及若干所述第四词组进行修正处理,以分别生成对应的若干第三标准词组以及若干第四标准词组;
识别出若干所述第三标准词组包含的第二字符总数,并检测出所述第三标准词组与所述第四标准词组之间的第二匹配字符数;
根据所述第二字符总数以及所述第二匹配字符数计算出所述第二匹配度值。
进一步的,在本实施例中,需要说明的是,同理,本实施例同样会通过上述同义词库以及上述地址库对当前第三词组以及第四词组进行修正处理,以生成对应的第三标准词组以及第四标准词组。具体的,例如本实施例获取到的第三标准词组为“江苏省/无锡市/新吴区/菱湖大道/ 200号/ F区/ 5号楼”,对应的,获取到的第四标准词组为“江苏省/无锡市/新区/菱湖大道/200号/创新园/ F区/ 5号楼”。
在此基础之上,本实施例进一步识别出当前第三标准词组包含的第二字符总数为22个,对应的,本实施例检测出当前第三标准词组与当前第四标准词组之间的第二匹配字符数为21个,则根据当前第二字符总数以及第二匹配字符数计算出的第二匹配度值为95.5%。
需要指出的是,本发明第三实施例所提供的方法,其实现原理及产生的一些技术效果和第一实施例相同,为简要描述,本实施例未提及之处,可参考第一实施例提供的相应内容。
综上,本发明上述实施例提供的患者信息匹配方法能够准确的通过正向以及反向最大步长分词的匹配结果匹配出与实时接收到的实际患者信息对应的存量患者信息,大幅提升了患者信息的匹配效率,减少了冗余数据的产生,对应提升了患者的就医体验。
本发明第四实施例也提供了一种患者信息匹配方法,本实施例提供的患者信息匹配方法与上述第一实施例提供的患者信息匹配方法不同之处在于:
具体的,在本实施例中,需要说明的是,当所述第一目标数据元和所述第二目标数据元均为多个时,所述方法还包括:
计算出若干所述第一目标数据元依次在所述正向最大步长分词以及所述反向最大步长分词下产生的第一匹配度均值,并计算出若干所述第二目标数据元依次在所述正向最大步长分词以及所述反向最大步长分词下产生的第二匹配度均值;
判断所述第一匹配度均值是否大于所述第二匹配度均值;
若判断到所述第一匹配度均值大于所述第二匹配度均值,则判断所述第一匹配度均值是否大于所述预设阈值;
若判断到所述第一匹配度均值大于所述预设阈值,则判定所述存量患者信息与所述实际患者信息相匹配。
具体的,在本实施例中,需要说明的是,当需要同时对比多个第一目标数据元以及多个第二目标数据元时,本实施例会通过上述方式依次计算出当前若干第一目标数据元依次在上述正向最大步长分词以及上述反向最大步长分词下产生的第一匹配度值均值,与此同时,对应计算出当前若干第二目标数据元在上述正向最大步长分词以及反向最大步长分词下产生的第二匹配度均值,在此基础之上,进一步判断当前第一匹配度均值是否大于当前第二匹配度均值,具体的,若判断到当前第一匹配度均值大于当前第二匹配度均值,则判断当前第一匹配度均值是否大于上述预设阈值;进一步的,若判断到当前第一匹配度均值大于上述预设阈值,则判定上述存量患者信息与上述实际患者信息相匹配。
需要指出的是,本发明第四实施例所提供的方法,其实现原理及产生的一些技术效果和第一实施例相同,为简要描述,本实施例未提及之处,可参考第一实施例提供的相应内容。
综上,本发明上述实施例提供的患者信息匹配方法能够准确的通过正向以及反向最大步长分词的匹配结果匹配出与实时接收到的实际患者信息对应的存量患者信息,大幅提升了患者信息的匹配效率,减少了冗余数据的产生,对应提升了患者的就医体验。
本发明第五实施例也提供了一种患者信息匹配方法,本实施例提供的患者信息匹配方法与上述第一实施例提供的患者信息匹配方法不同之处在于:
具体的,在本实施例中,需要说明的是,上述判定所述存量患者信息与所述实际患者信息相匹配的步骤之后,所述方法还包括:
将所述存量患者信息与所述实际患者信息相比对,并检测出所述存量患者信息与所述实际患者信息之间的区别患者信息;
判断所述存量患者信息中是否保存有所述区别患者信息;
若判断到所述存量患者信息中未保存有所述区别患者信息,则将所述区别患者信息对应更新至所述存量患者信息中,以完成对所述存量患者信息的实时更新。
具体的,在本实施例中,需要说明的是,为了能够对上述数据库中的存量患者信息进行实时更新,本实施例会将实时接收到的实际患者信息与已经存储好的存量患者信息进行比对,与此同时,对应检测出当前存量患者信息与当前实际患者信息之间的区别患者信息,并进一步判断当前存量患者信息中是否保存有当前区别患者信息,具体的,若实时判断到当前存量患者信息中未保存有当前区别患者信息,则需要将当前区别患者信息对应更新至当前存量患者信息中,以完成对当前存量患者信息的实时更新。
对应的,若实时判断到当前存量患者信息中保存有当前区别患者信息,则不需要对当前存量患者信息进行更新。
需要指出的是,本发明第五实施例所提供的方法,其实现原理及产生的一些技术效果和第一实施例相同,为简要描述,本实施例未提及之处,可参考第一实施例提供的相应内容。
综上,本发明上述实施例提供的患者信息匹配方法能够准确的通过正向以及反向最大步长分词的匹配结果匹配出与实时接收到的实际患者信息对应的存量患者信息,大幅提升了患者信息的匹配效率,减少了冗余数据的产生,对应提升了患者的就医体验。
请参阅图2,所示为本发明第六实施例提供的患者信息匹配***,所述***包括:
接收模块12,用于当接收到用户输入的实际患者信息时,在预设数据库中检索出与所述实际患者信息相似的存量患者信息,并识别出所述实际患者信息和所述存量患者信息中分别包含的若干数据元;
计算模块22,用于对所述实际患者信息中的第一目标数据元和所述存量患者信息中的第二目标数据元依次进行正向最大步长分词以及反向最大步长分词,并分别计算出所述第一目标数据元和所述第二目标数据元在所述正向最大步长分词下产生的第一匹配度值、在所述反向最大步长分词下产生的第二匹配度值,所述第一目标数据元与所述第二目标数据元相对应;
判断模块32,用于判断所述第一匹配度值与所述第二匹配度值之间的较大值是否大于预设阈值;
执行模块42,用于若判断到所述第一匹配度值与所述第二匹配度值之间的较大值大于所述预设阈值,则判定所述存量患者信息与所述实际患者信息相匹配。
其中,上述患者信息匹配***中,所述计算模块22具体用于:
当对所述实际患者信息中的第一目标数据元以及所述存量患者信息中的第二目标数据元进行所述正向最大步长分词时,识别出所述第一目标数据元中包含的第一文本串、所述第二目标数据元中包含的第二文本串,并按照第一扫描顺序分别对所述第一文本串以及所述第二文本串进行扫描分词,以将所述第一文本串拆分成若干第一词组、将所述第二文本串拆分成若干第二词组。
其中,上述患者信息匹配***中,所述计算模块22还具体用于:
通过预设同义词库和预设地址库分别对若干所述第一词组以及若干所述第二词组进行修正处理,以分别生成对应的若干第一标准词组以及若干第二标准词组;
识别出若干所述第一标准词组包含的第一字符总数,并检测出所述第一标准词组与所述第二标准词组之间的第一匹配字符数;
根据所述第一字符总数以及所述第一匹配字符数计算出所述第一匹配度值。
其中,上述患者信息匹配***中,所述计算模块22还具体用于:
当对所述实际患者信息中的第一目标数据元以及所述存量患者信息中的第二目标数据元进行所述反向最大步长分词时,识别出所述第一目标数据元中包含的所述第一文本串、所述第二目标数据元中包含的所述第二文本串,并按照第二扫描顺序分别对所述第一文本串以及所述第二文本串进行扫描分词,以将所述第一文本串拆分成若干第三词组、将所述第二文本串拆分成若干第四词组。
其中,上述患者信息匹配***中,所述计算模块22还具体用于:
通过所述预设同义词库和所述预设地址库分别对若干所述第三词组以及若干所述第四词组进行修正处理,以分别生成对应的若干第三标准词组以及若干第四标准词组;
识别出若干所述第三标准词组包含的第二字符总数,并检测出所述第三标准词组与所述第四标准词组之间的第二匹配字符数;
根据所述第二字符总数以及所述第二匹配字符数计算出所述第二匹配度值。
其中,上述患者信息匹配***中,当所述第一目标数据元和所述第二目标数据元均为多个时,所述患者信息匹配***还包括处理模块52,所述处理模块52具体用于:
计算出若干所述第一目标数据元依次在所述正向最大步长分词以及所述反向最大步长分词下产生的第一匹配度均值,并计算出若干所述第二目标数据元依次在所述正向最大步长分词以及所述反向最大步长分词下产生的第二匹配度均值;
判断所述第一匹配度均值是否大于所述第二匹配度均值;
若判断到所述第一匹配度均值大于所述第二匹配度均值,则判断所述第一匹配度均值是否大于所述预设阈值;
若判断到所述第一匹配度均值大于所述预设阈值,则判定所述存量患者信息与所述实际患者信息相匹配。
其中,上述患者信息匹配***中,所述患者信息匹配***还包括更新模块62,所述更新模块62具体用于:
将所述存量患者信息与所述实际患者信息相比对,并检测出所述存量患者信息与所述实际患者信息之间的区别患者信息;
判断所述存量患者信息中是否保存有所述区别患者信息;
若判断到所述存量患者信息中未保存有所述区别患者信息,则将所述区别患者信息对应更新至所述存量患者信息中,以完成对所述存量患者信息的实时更新。
本发明第七实施例提供了一种计算机,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述实施例提供的患者信息匹配方法。
本发明第八实施例提供了一种可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例提供的患者信息匹配方法。
综上所述,本发明上述实施例提供的患者信息匹配方法、***、计算机及可读存储介质能够准确的通过正向以及反向最大步长分词的匹配结果匹配出与实时接收到的实际患者信息对应的存量患者信息,大幅提升了患者信息的匹配效率,减少了冗余数据的产生,对应提升了患者的就医体验。
需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。