基于图片的信息定位方法以及装置
技术领域
本说明书实施例涉及数据处理技术领域,特别涉及基于图片的信息定位方法以及装置。
背景技术
随着互联网的发展,越来越多的业务得以在线上处理,在业务处理的过程中,经常针对上传的业务图片进行业务审核,然而,由于业务图片的多样性以及复杂性,定位业务图片中关键信息的效率较低且容易出错,因此,需要提供更可靠的方案。
发明内容
有鉴于此,本说明书实施例提供了一种基于图片的信息定位方法。本说明书一个或者多个实施例同时涉及一种基于图片的信息定位装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
本说明书实施例的第一方面,提供了一种基于图片的信息定位方法,包括:
获取目标业务的业务图片;
对所述业务图片进行检测,获得所述业务图片包含的业务信息以及所述业务信息中的文字在所述业务图片中的第一位置信息;
基于所述目标业务的业务知识图谱对所述业务信息中的实体进行识别,获得与所述业务知识图谱中目标实体对应的目标业务信息以及所述目标业务信息在所述业务信息中的第二位置信息;
根据所述第一位置信息以及所述第二位置信息,确定所述目标业务信息在所述业务图片中的目标位置信息。
可选的,所述基于所述目标业务的业务知识图谱对所述业务信息中的实体进行识别,获得与所述业务知识图谱中目标实体对应的目标业务信息,包括:
根据预设的实体类型提取所述业务信息中的第一对象;
基于所述业务知识图谱,在所述第一对象对应的第一实体中筛选目标实体;
将所述目标实体对应的目标对象作为所述目标业务信息。
可选的,所述基于所述业务知识图谱,在所述第一对象对应的第一实体中筛选目标实体,包括:
将所述第一对象与所述业务知识图谱中实体进行相似度比对,确定所述第一实体;
根据所述第一实体,在所述业务知识图谱中进行检索,确定触达结论实体的目标实体。
可选的,所述根据预设的实体类型提取所述业务信息中的第一对象,包括:
对所述业务信息进行分句处理;
对分句处理结果进行分词处理,获得词单元组成的词单元集合;
计算所述词单元集合中各个词单元与所述实体类型的匹配度;
根据计算结果,选择满足匹配度阈值的词单元作为所述第一对象。
可选的,所述对所述业务图片进行检测,获得所述业务图片包含的业务信息以及所述业务信息中的文字在所述业务图片中的第一位置信息,包括:
对所述业务图片进行检测,获得所述业务图片中包含的行业务信息以及所述行业务信息在所述业务图片中对应的行位置信息;
将所述行业务信息进行信息拼接,获得所述业务信息,以及对所述行位置信息对应的图片区域进行区域分割,获得所述第一位置信息。
可选的,所述根据所述第一位置信息以及所述第二位置信息,确定所述目标业务信息在所述业务图片中的目标位置信息,包括:
根据所述第二位置信息以及所述行业务信息,计算所述目标业务信息在所述业务图片中对应的行编码以及在所述行编码对应的目标行信息中的起止编码;
根据所述行编码、所述起止编码以及所述第一位置信息,确定所述目标位置信息。
可选的,所述根据所述第一位置信息以及所述第二位置信息,确定所述目标业务信息在所述业务图片中的目标位置信息步骤执行之后,还包括:
根据所述目标位置信息,对所述业务图片的目标区域进行突出显示处理;
将所述突出显示处理后的业务图片在所述目标业务对应的图片库进行存储。
可选的,在所述目标业务信息为多个的情况下,存在多个所述目标位置信息;
相应的,所述根据所述第一位置信息以及所述第二位置信息,确定所述目标业务信息在所述业务图片中的目标位置信息步骤执行之后,且所述根据所述目标位置信息,对所述业务图片的目标区域进行突出显示处理步骤执行之前,还包括:
判断各个目标位置信息在所述业务图片中对应的目标区域是否存在重叠;
若是,将存在重叠的目标区域进行区域融合,获得所述区域融合后的融合位置信息,并根据所述融合位置信息更新所述目标位置信息。
可选的,所述根据所述第一位置信息以及所述第二位置信息,确定所述目标业务信息在所述业务图片中的目标位置信息步骤执行之后,还包括:
接收针对所述业务图片的查看指令;
基于所述查看指令中携带的图片标识,获取所述业务图片以及所述目标位置信息;
根据所述目标位置信息,对所述业务图片的目标区域进行突出显示处理并展示。
可选的,所述获取目标业务的业务图片步骤执行之前,还包括:
接收用户上传的所述业务图片;
将所述业务图片在所述目标业务对应的图片库进行存储。
可选的,所述目标业务,包括互助业务;相应的,所述业务图片,包括互助业务图片。
本说明书实施例的第二方面,提供了一种基于图片的信息定位装置,包括:
获取模块,被配置为获取目标业务的业务图片;
检测模块,被配置为对所述业务图片进行检测,获得所述业务图片包含的业务信息以及所述业务信息中的文字在所述业务图片中的第一位置信息;
实体识别模块,被配置为基于所述目标业务的业务知识图谱对所述业务信息中的实体进行识别,获得与所述业务知识图谱中目标实体对应的目标业务信息以及所述目标业务信息在所述业务信息中的第二位置信息;
确定位置模块,被配置为根据所述第一位置信息以及所述第二位置信息,确定所述目标业务信息在所述业务图片中的目标位置信息。
本说明书实施例的第三方面,提供了一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
获取目标业务的业务图片;
对所述业务图片进行检测,获得所述业务图片包含的业务信息以及所述业务信息中的文字在所述业务图片中的第一位置信息;
基于所述目标业务的业务知识图谱对所述业务信息中的实体进行识别,获得与所述业务知识图谱中目标实体对应的目标业务信息以及所述目标业务信息在所述业务信息中的第二位置信息;
根据所述第一位置信息以及所述第二位置信息,确定所述目标业务信息在所述业务图片中的目标位置信息。
本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现所述基于图片的信息定位方法的步骤。
本说明书提供一种基于图片的信息定位方法,在获取目标业务的业务图片的基础上,对所述业务图片进行检测,获得所述业务图片包含的业务信息以及所述业务信息中的文字在所述业务图片中的第一位置信息,并基于所述目标业务的业务知识图谱对所述业务信息中的实体进行识别,获得与所述业务知识图谱中目标实体对应的目标业务信息以及所述目标业务信息在所述业务信息中的第二位置信息,进一步,根据所述第一位置信息以及所述第二位置信息,确定所述目标业务信息在所述业务图片中的目标位置信息,实现了对业务图片中目标业务信息的定位,并进一步增加了对业务图片的审核效率以及审核准确率。
附图说明
图1是本说明书一个实施例提供的一种基于图片的信息定位方法的处理流程图;
图2是本说明书一个实施例提供的一种基于图片的信息定位方法的业务知识图谱;
图3是本说明书一个实施例提供的一种应用于互助业务的基于图片的信息定位方法的处理流程图;
图4是本说明书一个实施例提供的一种基于图片的信息定位装置的示意图;
图5是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
在本说明书中,提供了一种基于图片的信息定位方法,本说明书一个或者多个实施例同时涉及一种基于图片的信息定位装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
本说明书提供的一种基于图片的信息定位方法实施例如下:
图1示出了根据本说明书一个实施例提供的一种基于图片的信息定位方法的处理流程图,具体包括以下步骤:
步骤S102,获取目标业务的业务图片。
实际应用中,由于业务中处理的业务图片的多样性以及复杂性,定位业务图片中的关键信息耗时较长,并且容易出错,本说明书实施例,通过对业务图片中的关键信息进行识别,并对识别出的关键信息进行定位,以便工作人员对业务图片进行查看的过程中,可以快速定位业务图片中的关键信息,加快对业务图片的审核效率。
具体的,所述目标业务,是指在业务处理过程中需要对业务图片进行查看或审核的业务,比如,健康保障业务、互助业务、借贷业务、申请资源或资质业务等,在此并不做限制。相应的,所述业务图片,是指业务处理的过程中,需要查看或审核的图片,比如,证件图片、就诊图片、证明材料、报告材料、证书图片等,在此并不做限制。
具体实施时,在获取目标业务的业务图片之前,还需要接收用户上传的业务图片,用户上传业务图片和获取业务图片的步骤,可以顺时依次执行,也可以是分不同时段异步执行的,为了保障业务图片被处理前的完整性以及安全性,在获取业务图片并对业务图片进行处理之前,先将业务图片进行存储,本说明书实施例提供的一种可选实施方式中,在获取目标业务的业务图片之前,还包括:
接收用户上传的所述业务图片;
将所述业务图片在所述目标业务对应的图片库进行存储。
具体的,所述图片库,可以是数据库,文件夹、磁盘等,在此不做限制。
以健康保障业务中的医疗保障业务为例,用户U作为该医疗保障业务的被保障方,投保了医疗保障业务,此后,用户U罹患了疾病A,因此,向该医疗保障业务的保障方申请针对疾病A的医疗保障金,在申请针对疾病A的医疗保障金的过程中,上传用户U针对疾病A的出院小结图片,接收到用户U上传的出院小结图片后,将出院小结图片在医疗保障业务的图片库进行存储,并在存储后,获取此出院小结图片。
步骤S104,对所述业务图片进行检测,获得所述业务图片包含的业务信息以及所述业务信息中的文字在所述业务图片中的第一位置信息。
在获取目标业务的业务图片的基础上,对业务图片进行检测,识别业务图片的业务信息,并检测业务信息中每个文字在业务图片中的第一位置信息。
具体的,所述对业务图片进行检测,是指对业务图片中的文字内容进行识别,并检测每个文字在业务图片中的第一位置信息;相应的,所述第一位置信息,可以是文字在业务图片中所处的定位框的坐标信息,比如,以业务图片左上角的顶点为坐标原点(或业务图片的其他顶点作为坐标原点),以业务图片的宽边为X轴,长边为Y轴建立坐标系(或以业务图片的长边为X轴,宽边为Y轴建立坐标系),检测每个文字在前述坐标系中所处的矩形定位框的二维坐标表示,具体的,矩形定位框的二维坐标表示,可以是矩形框的左上角坐标以及右下角坐标,或矩形框的左下角坐标以及右上角坐标,在此不做限制。
实际应用中,所述对业务图片进行检测,可以通过光学字符识别(OpticalCharacter Recognition,OCR)对业务图片进行文字识别,并通过对象检测算法,检测业务图片中文字所处的定位框的坐标表示,此外,还可以通过其他算法或模型对业务图片进行检测,在此不做限制。
为了更精确地确定业务信息包含的每个文字在业务图片中对应的第一位置信息,本说明书实施例提供的一种可选实施方式中,对所述业务图片进行检测,具体通过如下方式实现:
对所述业务图片进行检测,获得所述业务图片中包含的行业务信息以及所述行业务信息在所述业务图片中对应的行位置信息;
将所述行业务信息进行信息拼接,获得所述业务信息,以及对所述行位置信息对应的图片区域进行区域分割,获得所述第一位置信息。
实际应用中,业务图片中可能包含多行业务信息,则对业务图片进行检测的过程中,先检测出业务图片中每一行的业务信息,以及每一行业务信息对应的行位置信息(比如每一行业务信息在业务图片中对应的矩形定位框的坐标表示),再将每一行的业务信息进行信息拼接,拼接形成业务图片中包含的所有文字构成的业务信息;并将每一行业务信息的矩形定位框的坐标表示对应的图片区域进行区域分割,获得每一行中每个文字的位置信息。
具体实施时,由于通常每一行文字的大小相同或相近,则对每一行业务信息对应的图片区域进行区域分割,可以采用等距分割,此外,若区域分割的分割结果存在误差,可以对进行区域分割的区域分割模型进行参数调整,以便准确分割每一行业务信息中每个字对应的图片区域。
沿用上例,在获取用户U上传的出院小结图片的基础上,对出院小结图片进行检测,获得出院小结图片中包含的三行文字,即三行业务信息,第一行的业务信息为“姓名U”,第二行的业务信息为“针对疾病A进行放射治疗”,并第三行的业务信息为“注意休息”,以及这三行业务信息在出院小结图片中对应的矩形定位框的坐标表示分别为:[
,
,
,
],[
,
,
,
],[
,
,
,
],(坐标所在的坐标系以出院小结图片的左上角的顶点为坐标原点,以出院小结图片的宽边为X轴,长边为Y轴),将这三行业务信息进行信息拼接,获得出院小结图片包含的业务信息:“姓名U针对疾病A进行放射治疗注意休息”,并分别对三行业务信息的矩形定位框的坐标表示对应的图片区域进行区域分割,获得业务信息“姓名U针对疾病A进行放射治疗注意休息”中每个文字对应的第一位置信息。
步骤S106,基于所述目标业务的业务知识图谱对所述业务信息中的实体进行识别,获得与所述业务知识图谱中目标实体对应的目标业务信息以及所述目标业务信息在所述业务信息中的第二位置信息。
在对业务图片进行检测,获得业务图片中包含的业务信息的基础上,基于业务知识图谱对检测出的业务信息进行实体识别,识别出业务图片中的关键信息,即目标业务信息,以及目标业务信息在业务信息中的第二位置信息,其中,所述第二位置信息,是指目标业务信息在业务信息中的起始文字编码,或者既包括起始文字编码还包括终止文字编码,比如目标业务信息处于业务信息中第6个文字至第8个文字。
需要说明的是,由于目标业务的多样性以及业务图片的多样性,为了便于识别业务图片中的关键信息,预先构建的业务知识图谱也是多种多样的,以上述健康保障业务为例,健康保障业务中还包含医疗保障业务、互助保障业务、重疾保障业务等保障业务,而由于每一类保障业务的业务处理逻辑是不同的,因此,针对每一类保障业务构建其对应的业务知识图谱。
在检测出业务图片包含的业务信息的基础上,进一步根据业务知识图谱对业务信息中的目标业务信息进行识别,相比关键字匹配识别目标业务信息,提高了目标业务信息的识别准确率,本说明书实施例提供的一种可选实施方式中,所述基于所述目标业务的业务知识图谱对所述业务信息中的实体进行识别,获得与所述业务知识图谱中目标实体对应的目标业务信息,具体采用如下方式实现:
根据预设的实体类型提取所述业务信息中的第一对象;
基于所述业务知识图谱,在所述第一对象对应的第一实体中筛选目标实体;
将所述目标实体对应的目标对象作为所述目标业务信息。
实际应用中,实体是对客观个体的抽象,用户、医院、疾病等都可以看作是一个实体,而实体类型是对具有相同特点或属性的实体集合的抽象,比如,疾病A是一个实体,疾病B是一个实体,疾病C是一个实体,这些疾病都具有病变部位、症状等特征,因此,疾病A、疾病B、疾病C等具有病变部位、症状等特征的实体,可以抽象为实体类型为疾病类型。
需要说明的是,在业务知识图谱中,包含多个实体,以及实体之间的关联关系。
具体的,所述第一对象,是指在业务信息中提取的与预设的实体类型中至少一个实体类型匹配的信息;所述第一实体,是指第一对象在业务知识图谱中对应的实体,由于第一对象在业务信息中存在对应的文字信息,相应的,第一实体在业务信息中也存在对应的文字信息;所述目标实体,是指在第一实体中筛选出的与目标业务关联性大的实体;所述目标业务信息,是指目标实体在业务信息中对应的文字信息。
具体实施时,对所述业务信息中的实体进行识别可以采用NER(Named EntityRecognition,命名实体识别)又称作专名识别,是自然语言处理中常见的一项任务,用于识别业务信息中的特定类型的实体。
在业务信息中提取第一对象的过程中,需要对业务信息进行分句分词处理,并在分句分词的基础上,在分词处理后的词单元中提取与预设的实体类型匹配的第一对象,增加了提取第一对象的准确度,本说明书实施例提供的一种可选实施方式中,所述根据预设的实体类型提取所述业务信息中的第一对象,具体采用如下方式实现:
对所述业务信息进行分句处理;
对分句处理结果进行分词处理,获得词单元组成的词单元集合;
计算所述词单元集合中各个词单元与所述实体类型的匹配度;
根据计算结果,选择满足匹配度阈值的词单元作为所述第一对象。
实际应用中,由于不同目标业务的业务差别很大,因此业务用语的差别也较大,为了提高对业务信息进行分句分词的准确性,可以根据目标业务的业务用语构建相应的语料库,并基于构建的语料库对业务信息进行分句分词处理。
具体实施时,在对业务信息进行分句分词的基础上,对业务信息中包含的各个词单元,分别计算其与预设的实体类型的匹配度,该匹配度可以是百分比数值,在词单元与预设的实体类型中任一实体类型之间的匹配度大于预设的匹配度阈值的情况下,将该词单元作为任一实体类型对应的第一对象。
沿用上例,在获得业务信息“姓名U针对疾病A进行放射治疗注意休息”的基础上,对业务信息进行分句处理以及分词处理,获得词单元集合{姓名U,针对,疾病A,进行,放射治疗,注意,休息},预设的实体类型为时间类型、疾病类型、医院类型、诊疗类型,分别计算词单元集合{姓名U,针对,疾病A,进行,放射治疗,注意,休息}中包含的各个词单元与前述各个实体类型的匹配度,且预设的匹配度阈值为90%,则在前述词单元中并无与时间类型或医院类型的匹配度大于90%词单元,与疾病类型的匹配度大于90%的词单元为疾病A,与诊疗类型的匹配度大于90%的词单元为放射治疗,则将“疾病A”以及“反射治疗”作为第一对象。
进一步,提取业务信息中第一对象的基础上,本说明书实施例提供的一种可选实施方式中,所述基于所述业务知识图谱,在所述第一对象对应的第一实体中筛选目标实体,具体采用如下方式实现:
将所述第一对象与所述业务知识图谱中实体进行相似度比对,确定所述第一实体;
根据所述第一实体,在所述业务知识图谱中进行检索,确定触达结论实体的目标实体。
所述实体信息,是指业务知识图谱中实体,具体如图2所示的业务知识图谱中包含4个实体,这4个实体分别为:“疾病A1”,“医院”,“放射治疗”,“免费医疗”;所述结论实体,是指目标业务中确定某一业务结论的实体,将业务知识图谱中通过检索触达结论实体的目标实体作为业务知识图谱中的与业务密切相关的关键性的实体,则目标实体对应的目标业务信息作为业务信息中的关键业务信息。
具体实施时,将前述获得的第一对象分别与各个实体进行相似度比对,可以根据相似度对比获得的相似度,选取相似度大于相似度阈值的实体,作为第一实体,是将业务信息中提取的第一对象,根据业务知识图谱中的实体进行标准化的过程,将与实体相似的第一对象,标准化为业务知识图谱中的第一实体,并根据第一实体,对业务知识图谱进行检索,确定第一实体中触达结论实体的目标实体。
沿用上例,在业务信息中提取出第一对象:“疾病A”以及“反射治疗”的基础上,分别计算这两个第一对象与图2所示的业务知识图谱中包含的四个实体的相似度,根据计算而得的相似度,确定第一对象:“疾病A”在业务知识图谱中对应的实体为:“疾病A1”,以及第一对象“反射治疗”在业务知识图谱中对应的实体为“反射治疗”,将这两个实体作为第一实体,将第一实体作为检索条件,检索业务知识图谱,在检索结果中得到结论实体“免费医疗”,则将该第一实体“疾病A1”以及“反射治疗”作为目标实体,并进一步确定目标实体对应的目标对象为“疾病A”以及“反射治疗”,将目标对象“疾病A”以及“反射治疗”作为目标业务信息。
步骤S108,根据所述第一位置信息以及所述第二位置信息,确定所述目标业务信息在所述业务图片中的目标位置信息。
具体的,在确定业务信息中的文字在业务图片中的第一位置信息以及确定目标业务信息在业务信息中的第二位置信息的基础上,进一步确定目标业务信息在业务图片中的目标位置信息。
其中,所述目标位置信息于上述第一位置信息类似,是指目标业务信息在业务图片中所处的定位框的坐标信息,在此不再赘述。
具体实施时,本说明书实施例提供的一种可选实施方式中,所述根据所述第一位置信息以及所述第二位置信息,确定所述目标业务信息在所述业务图片中的目标位置信息,具体采用如下方式实现:
根据所述第二位置信息以及所述行业务信息,计算所述目标业务信息在所述业务图片中对应的行编码以及在所述行编码对应的目标行信息中的起止编码;
根据所述行编码、所述起止编码以及所述第一位置信息,确定所述目标位置信息。
所述行编码,是指所述目标业务信息在业务图片中处于第几行;相应的,所述目标行信息,是指目标业务信息在业务图片中所处的行中包含的文字信息;所述起止编码,包括行起始文字编码以及行终止文字编码,具体的,是指目标业务信息在目标行信息中从第几个字开始到第几个字结束。
具体实施时,根据目标业务信息在业务图片中对应的行编码以及在目标业务信息在行编码对应的目标行信息中的起止编码,并业务信息中各个文字在业务图片中的坐标表示,确定各个目标业务信息对应的目标位置信息。
沿用上例,以确定目标业务信息“疾病A”在出院小结图片中目标位置信息进行说明,目标业务信息“疾病A”在业务信息中的起始文字编码为6,即业务信息中第6个文字开始为目标业务信息“疾病A”,而出院小结图片中第一行的偏移量为3,第二行的偏移量为3+11=14,则起始文字编码处于第二行的偏移量范围内,可以确定目标业务信息“疾病A”在出院小结图片中对应的行编码为2;
目标业务信息“疾病A”在出院小结图片中对应的行编码2、前述起始文字编码为6,以及目标业务信息包含的文字数量为3,进一步确定目标业务信息“疾病A”在该行编码2对应的目标行信息“针对疾病A进行放射治疗”中对应的行起始文字编码为3和行终止文字编码为5;
最后根据行起始文字编码3、行终止文字编码5以及第一位置信息,确定第一位置信息中“疾病A”三个字分别在出院小结图片中的矩形定位框的坐标表示,再取这三个字中第一个字的左上角坐标,以及第三个字的右下角坐标,作为目标业务信息“疾病A”在出院小结图片中的矩形定位框的目标位置信息。
实际应用中,在确定目标业务信息在业务图片中的目标位置信息的基础上,将业务图片中目标业务信息对应的图片区域进行突出显示,以便快速定位业务图片中的目标业务信息,提高对业务图片的审核效率,并提高对业务图片的审核准确率,本说明书实施例提供的一种可选实施方式中,在确定所述目标业务信息在所述业务图片中的目标位置信息步骤执行之后,业务图片中的目标业务信息进行突出显示,具体通过如下方式实现:
根据所述目标位置信息,对所述业务图片的目标区域进行突出显示处理;
将所述突出显示处理后的业务图片在所述目标业务对应的图片库进行存储。
所述目标区域,是指业务图片中目标位置信息对应的图片区域,基于此,所述对所述业务图片的目标区域进行突出显示处理,是指对目标区域进行字体颜色、底色或添加定位框等方式进行突出显示处理,并将突出显示处理后的业务图片在图片库进行存储,以便在接收到用户针对业务图片的查看指令时,可以直接在所述图片库中获取突出显示处理后的业务图片并展示。
沿用上例,在确定目标业务信息“疾病A”以及“放射治疗”在出院小结图片中对应的目标位置信息的基础上,将这两个目标位置信息在出院小结图片中对应的目标区域添加黄色底纹的方式进行突出显示,将在目标区域添加黄色底纹的出院小结图片在图片库中进行存储。
实际应用中,目标实体对应的目标业务信息可能是一个,也可能是多个,在目标业务信息为多个的情况下,目标业务信息对应的目标位置信息也有多个,本说明书实施例提供的一种可选实施方式中,则所述根据所述第一位置信息以及所述第二位置信息,确定所述目标业务信息在所述业务图片中的目标位置信息执行之后,且所述根据所述目标位置信息,对所述业务图片的目标区域进行突出显示处理之前,还需要对目标位置信息存在重叠的位置区域进行融合,具体通过如下方式实现:
判断各个目标位置信息在所述业务图片中对应的目标区域是否存在重叠;
若是,将存在重叠的目标区域进行区域融合,获得所述区域融合后的融合位置信息,并根据所述融合位置信息更新所述目标位置信息;
若否,不做操作即可。
实际应用中,在判断各个目标位置信息在所述业务图片中对应的目标区域是否存在重叠的判断结果为是,则将存在重叠的目标区域进行区域融合,避免了将多个目标位置信息进行突出显示的情况下,突出显示的效果相互冲突,影响用户对业务图片的查看体验。
假设,目标业务信息“疾病A”在出院小结图片中的目标位置信息为:[
,
,
,
],目标业务信息“放射治疗”在出院小结图片中的目标位置信息为[
,
,
,
],其中,
处于
和
之间,
大于
,
与
相等,
以及
小于
,则可确定目标业务信息“疾病A”与目标位置信息“放射治疗”在出院小结图片中所处的矩形定位框的坐标表示有重叠部分,则将目标业务信息“疾病A”在出院小结图片中的目标区域,与目标业务信息“放射治疗”在出院小结图片中的目标区域进行区域融合,则区域融合后的融合位置信息为[
,
,
,
],将此融合位置信息,作为目标业务信息“疾病A”以及“放射治疗”在出院小结图片中的目标位置信息。
除上述在确定业务图片中的目标位置信息后,将目标位置信息对应的目标区域进行突出显示处理后的业务图片进行存储之外,还可以在确定业务图片中的目标位置信息后,将目标位置信息进行存储,并在接收针对业务图片的查看指令后,再对业务图片进行突出显示处理,只存储目标位置信息,而无需存储突出显示处理后的业务图片,减少了存储压力,本说明书实施例提供的一种可选实施方式中,所述根据所述第一位置信息以及所述第二位置信息,确定所述目标业务信息在所述业务图片中的目标位置信息执行之后,还包括:
接收针对所述业务图片的查看指令;
基于所述查看指令中携带的图片标识,获取所述业务图片以及所述目标位置信息;
根据所述目标位置信息,对所述业务图片的目标区域进行突出显示处理并展示。
实际应用中,在确定目标业务信息在业务图片中的目标位置信息之后,若对业务图片进行查看,则可以在目标位置信息在业务图片中对应的目标区域进行突出显示处理,并将突出显示后的业务图片进行展示。
综上所述,本说明书提供一种基于图片的信息定位方法,在获取目标业务的业务图片的基础上,对所述业务图片进行检测,获得所述业务图片包含的业务信息以及所述业务信息中的文字在所述业务图片中的第一位置信息,并基于所述目标业务的业务知识图谱对所述业务信息中的实体进行识别,获得与所述业务知识图谱中目标实体对应的目标业务信息以及所述目标业务信息在所述业务信息中的第二位置信息,进一步,根据所述第一位置信息以及所述第二位置信息,确定所述目标业务信息在所述业务图片中的目标位置信息,将目标位置信息在业务图片中对应的目标区域进行突出显示处理,实现了对业务图片中目标业务信息的定位,并进一步增加了对业务图片的审核效率以及审核准确率。
下述结合附图3,以本说明书提供的基于图片的信息定位方法在互助业务中的应用为例,对所述基于图片的信息定位方法进行进一步说明。其中,图3示出了本说明书一个实施例提供的一种应用于互助业务的基于图片的信息定位方法的处理流程图,具体包括以下步骤:
步骤S302,获取互助业务的互助业务图片。
具体的,所述互助业务是由一批具有共同同质保障需求以及愿意共同承担保障风险的业务成员参与的,业务成员在参与互助业务期间,发生的意外、伤残或疾病等达到互助业务约定的条件时,可以以案件形式提交相关材料比如互助业务图片,申领互助救济金。
其中,所述互助业务图片,包括理赔材料图片,比如,就诊图片、出院小结图片等,此外还包括健康告知过程中的健告图片,比如过往病史图片、体检图片等。
步骤S304,对互助业务图片进行检测,获得互助业务图片中包含的行业务信息以及行业务信息在互助业务图片中对应的行位置信息。
步骤S306,将行业务信息进行信息拼接,获得业务信息,以及对行位置信息对应的图片区域进行区域分割,获得业务信息中的文字在互助业务图片中的第一位置信息。
步骤S308,根据预设的实体类型提取业务信息中的第一对象。
具体的,所述根据预设的实体类型提取所述业务信息中的第一对象,具体采用如下方式实现:
对所述业务信息进行分句处理;
对分句处理结果进行分词处理,获得词单元组成的词单元集合;
计算所述词单元集合中各个词单元与所述实体类型的匹配度;
根据计算结果,选择满足匹配度阈值的词单元作为所述第一对象。
步骤S310,将第一对象与互助业务知识图谱中实体进行相似度比对,确定第一实体。
步骤S312,根据第一实体,在互助业务知识图谱中进行检索,确定触达互助结论实体的目标实体。
具体的,若互助业务图片为理赔材料图片,则互助结论实体可以为是否理赔的实体,若互助业务图片为健告图片,则互助结论实体可以为是否违反健告的实体。
步骤S314,将目标实体对应的目标对象作为目标业务信息,并确定目标业务信息在业务信息中的第二位置信息。
步骤S316,根据第二位置信息以及行业务信息,计算目标业务信息在互助业务图片中对应的行编码以及在行编码对应的目标行信息中的起止编码。
步骤S318,根据行编码、起止编码以及第一位置信息,确定目标业务信息在互助业务图片中对应的目标位置信息。
步骤S320,判断各个目标位置信息在互助业务图片中对应的目标区域是否存在重叠;
若是,执行下述步骤S322;
若否,不做处理即可。
步骤S322,将存在重叠的目标区域进行区域融合,获得区域融合后的融合位置信息,并根据融合位置信息更新目标位置信息。
步骤S324,根据目标位置信息,对互助业务图片的目标区域进行突出显示处理。
步骤S326,将所述突出显示处理后的互助业务图片在互助业务对应的图片库进行存储。
具体的,将所述突出显示处理后的互助业务图片在互助业务对应的图片库进行存储之后,还包括:
接收针对所述突出显示处理后的互助业务图片的查看指令;
基于所述查看指令中携带的图片标识,获取突出显示处理后的互助业务图片并展示。
综上所述,本说明书提供一种基于图片的信息定位方法,在获取互助业务的互助业务图片的基础上,对所述互助业务图片进行检测,获得互助业务图片包含的业务信息以及所述业务信息中的文字在互助业务图片中的第一位置信息,并基于所述目标业务的互助业务知识图谱对所述业务信息进行实体识别,获得与互助业务知识图谱中目标实体对应的目标业务信息以及所述目标业务信息在所述业务信息中的第二位置信息;根据所述第一位置信息以及所述第二位置信息,确定所述目标业务信息在互助业务图片中的目标位置信息,实现了对互助业务图片中目标业务信息的定位,并进一步增加了对互助业务图片的审核效率以及审核准确率。
本说明书提供的一种基于图片的信息定位装置实施例如下:
与上述方法实施例相对应,本说明书还提供了基于图片的信息定位装置实施例,图4示出了本说明书一个实施例提供的一种基于图片的信息定位装置的示意图。如图4所示,该装置包括:
获取模块402,被配置为获取目标业务的业务图片;
检测模块404,被配置为对所述业务图片进行检测,获得所述业务图片包含的业务信息以及所述业务信息中的文字在所述业务图片中的第一位置信息;
实体识别模块406,被配置为基于所述目标业务的业务知识图谱对所述业务信息中的实体进行识别,获得与所述业务知识图谱中目标实体对应的目标业务信息以及所述目标业务信息在所述业务信息中的第二位置信息;
确定位置模块408,被配置为根据所述第一位置信息以及所述第二位置信息,确定所述目标业务信息在所述业务图片中的目标位置信息。
可选的,所述实体识别模块406,包括:
提取子模块,被配置为根据预设的实体类型提取所述业务信息中的第一对象;
筛选子模块,被配置为基于所述业务知识图谱,在所述第一对象对应的第一实体中筛选目标实体;
确定信息子模块,被配置为将所述目标实体对应的目标对象作为所述目标业务信息。
可选的,所述筛选子模块,包括:
确定实体单元,被配置为将所述第一对象与所述业务知识图谱中实体进行相似度比对,确定所述第一实体;
确定目标实体单元,被配置为根据所述第一实体,在所述业务知识图谱中进行检索,确定触达结论实体的目标实体。
可选的,所述提取子模块,包括:
分句单元,被配置为对所述业务信息进行分句处理;
分词单元,被配置为对分句处理结果进行分词处理,获得词单元组成的词单元集合;
计算匹配度单元,被配置为计算所述词单元集合中各个词单元与所述实体类型的匹配度;
选择单元,被配置为根据计算结果,选择满足匹配度阈值的词单元作为所述第一对象。
可选的,所述检测模块404,包括:
检测信息子模块,被配置为对所述业务图片进行检测,获得所述业务图片中包含的行业务信息以及所述行业务信息在所述业务图片中对应的行位置信息;
分割子模块,被配置为将所述行业务信息进行信息拼接,获得所述业务信息,以及对所述行位置信息对应的图片区域进行区域分割,获得所述第一位置信息。
可选的,所述确定位置模块408,包括:
计算编码子模块,被配置为根据所述第二位置信息以及所述行业务信息,计算所述目标业务信息在所述业务图片中对应的行编码以及在所述行编码对应的目标行信息中的起止编码;
确定信息子模块,被配置为根据所述行编码、所述起止编码以及所述第一位置信息,确定所述目标位置信息。
可选的,所述基于图片的信息定位装置,还包括:
突出显示模块,被配置为根据所述目标位置信息,对所述业务图片的目标区域进行突出显示处理;
存储模块,被配置为将所述突出显示处理后的业务图片在所述目标业务对应的图片库进行存储。
可选的,在所述目标业务信息为多个的情况下,存在多个所述目标位置信息;
相应的,所述基于图片的信息定位装置,还包括:
判断模块,被配置为判断各个目标位置信息在所述业务图片中对应的目标区域是否存在重叠;
若是,运行融合模块,所述融合模块,被配置为将存在重叠的目标区域进行区域融合,获得所述区域融合后的融合位置信息,并根据所述融合位置信息更新所述目标位置信息。
可选的,所述基于图片的信息定位装置,还包括:
接收指令模块,被配置为接收针对所述业务图片的查看指令;
获取图片模块,被配置为基于所述查看指令中携带的图片标识,获取所述业务图片以及所述目标位置信息;
展示模块,被配置为根据所述目标位置信息,对所述业务图片的目标区域进行突出显示处理并展示。
可选的,所述基于图片的信息定位装置,还包括:
接受图片模块,被配置为接收用户上传的所述业务图片;
图片存储模块,被配置为将所述业务图片在所述目标业务对应的图片库进行存储。
可选的,所述目标业务,包括互助业务;相应的,所述业务图片,包括互助业务图片。
上述为本实施例的一种基于图片的信息定位装置的示意性方案。需要说明的是,该基于图片的信息定位装置的技术方案与上述的基于图片的信息定位方法的技术方案属于同一构思,基于图片的信息定位装置的技术方案未详细描述的细节内容,均可以参见上述基于图片的信息定位方法的技术方案的描述。
本说明书提供的一种计算设备实施例如下:
图5示出了根据本说明书一个实施例提供的一种计算设备500的结构框图。该计算设备500的部件包括但不限于存储器510和处理器520。处理器520与存储器510通过总线530相连接,数据库550用于保存数据。
计算设备500还包括接入设备540,接入设备540使得计算设备500能够经由一个或多个网络560通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备540可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,计算设备500的上述部件以及图5中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图5所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备500可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备500还可以是移动式或静止式的服务器。
本说明书提供一种计算设备,包括存储器510、处理器520及存储在存储器上并可在处理器上运行的计算机指令,所述处理器520用于执行如下计算机可执行指令:
获取目标业务的业务图片;
对所述业务图片进行检测,获得所述业务图片包含的业务信息以及所述业务信息中的文字在所述业务图片中的第一位置信息;
基于所述目标业务的业务知识图谱对所述业务信息中的实体进行识别,获得与所述业务知识图谱中目标实体对应的目标业务信息以及所述目标业务信息在所述业务信息中的第二位置信息;
根据所述第一位置信息以及所述第二位置信息,确定所述目标业务信息在所述业务图片中的目标位置信息。
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的基于图片的信息定位方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述基于图片的信息定位方法的技术方案的描述。
本说明书提供的一种计算机可读存储介质实施例如下:
本说明书提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时以用于:
获取目标业务的业务图片;
对所述业务图片进行检测,获得所述业务图片包含的业务信息以及所述业务信息中的文字在所述业务图片中的第一位置信息;
基于所述目标业务的业务知识图谱对所述业务信息中的实体进行识别,获得与所述业务知识图谱中目标实体对应的目标业务信息以及所述目标业务信息在所述业务信息中的第二位置信息;
根据所述第一位置信息以及所述第二位置信息,确定所述目标业务信息在所述业务图片中的目标位置信息。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的基于图片的信息定位方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述基于图片的信息定位方法的技术方案的描述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。