CN111310762A

CN111310762A - 一种基于物联网的智能医疗票据识别方法

Info

Publication number: CN111310762A
Application number: CN202010183612.4A
Authority: CN
Inventors: 赵富强; 宋文明; 徐雪
Original assignee: Tianjin Demai Technology Co Ltd
Current assignee: Tianjin Demai Technology Co Ltd
Priority date: 2020-03-16
Filing date: 2020-03-16
Publication date: 2020-06-19

Abstract

本发明涉及字符识别，具体涉及一种基于物联网的智能医疗票据识别方法，利用VGG16模型作为基础网络提取特征，通过VGG16模型中前5个卷积得到特征图，在特征图上做滑窗得到特征向量，将滑窗窗口对应的特征向量输入RNN循环层，得到循环层输出结果，将循环层输出结果输入全连接层，通过分类或回归得到密集预测的文本候选区，使用标准Soft非极大值抑制算法对密集预测的文本候选区进行滤除，利用简单文本线构造算法，将滤除后的文本候选区合并成文本框，通过CRNN模型对合并文本框中的文字进行识别；本发明提供的技术方案能够有效克服现有技术所存在的无法准确高效识别医疗票据上票据信息的缺陷。

Description

一种基于物联网的智能医疗票据识别方法

技术领域

本发明涉及字符识别，具体涉及一种基于物联网的智能医疗票据识别方法。

背景技术

随着近些年我国医疗行业的不断发展和进步，其所拥有的体系和制度都已相对较为完善。但是，目前医疗票据的管理较乱，由于各个医院出具的票据格式五花八门，票据在医院和报销单位之间的流转通过递交后，由受理单位以人工录入的方式进行，不利于存档和后期检索，票据信息的采集，还是使用传统人工录入方式。

医疗票据报销***是手动输入参保人信息后，参保人提交票据，前台工作人员手动逐项录入***信息，核对人员对录入信息进行核对后，提交审核人员审核，给出报销比较和报销金额，整个流程工作人员的效率非常低，并且往往还会出现一些难以发现的录入错误。

发明内容

(一)解决的技术问题

针对现有技术所存在的上述缺点，本发明提供了一种基于物联网的智能医疗票据识别方法，能够有效克服现有技术所存在的无法准确高效识别医疗票据上票据信息的缺陷。

(二)技术方案

为实现以上目的，本发明通过以下技术方案予以实现：

一种基于物联网的智能医疗票据识别方法，包括以下步骤：

S1、利用VGG16模型作为基础网络提取特征，通过VGG16模型中前5个卷积得到特征图；

S2、在特征图上做滑窗得到特征向量；

S3、将滑窗窗口对应的特征向量输入RNN循环层，得到循环层输出结果；

S4、将循环层输出结果输入全连接层，通过分类或回归得到密集预测的文本候选区；

S5、使用标准Soft非极大值抑制算法对密集预测的文本候选区进行滤除；

S6、利用简单文本线构造算法，将滤除后的文本候选区合并成文本框；

S7、通过CRNN模型对合并文本框中的文字进行识别。

优选地，所述特征图的大小为W×H×C。

优选地，所述滑窗的窗口大小为3×3，所述滑窗的窗口得到一个长度为3×3×C的特征向量。

优选地，所述特征向量预测10个目标待选区之间的偏移距离，所述滑窗的窗口中心预测出10个文本候选区。

优选地，所述RNN循环层采用BLSTM，所述循环层输出结果为W×256的输出。

优选地，所述全连接层为512维。

优选地，所述将滤除后的文本候选区合并成文本框的判定条件包括：

两个文本候选区的水平距离最小、两个文本候选区之间的距离小于50个像素、两个文本候选区的纵向重叠大于0.7。

优选地，所述CRNN模型由CNN卷积层、RNN循环层、CTC转录层组成。

(三)有益效果

与现有技术相比，本发明所提供的一种基于物联网的智能医疗票据识别方法将已有业务流程整合梳理，利用智能识别技术，识别批量扫描的医疗票据信息，能够对不同格式的文本进行快速识别，把繁重重复的录入工作交由***完成，形成可编辑的结构化信息，助力工作人员高效准确对参保人医疗票据信息进行处理，缩短报销人员等待时间，完善相关业务流程，实现医疗票据的智能化处理，创建一个高效、便捷的医疗票据报销服务环境，缩短服务周期，大大提升医疗票据报销服务的效率和满意度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明通过分类或回归得到密集预测文本候选区的示意图；

图2为本发明使用标准Soft非极大值抑制算法对图1进行滤除后的示意图；

图3为本发明利用简单文本线构造算法，将图2中滤除后的文本候选区合并成文本框的示意图；

图4为本发明将滤除后的文本候选区合并成文本框的判定条件。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

一种基于物联网的智能医疗票据识别方法，如图1至图3所示，包括以下步骤：

S2、在特征图上做滑窗得到特征向量；

S7、通过CRNN模型对合并文本框中的文字进行识别。

特征图的大小为W×H×C。

滑窗的窗口大小为3×3，滑窗的窗口得到一个长度为3×3×C的特征向量。

特征向量预测10个目标待选区之间的偏移距离，滑窗的窗口中心预测出10个文本候选区。

RNN循环层采用BLSTM，循环层输出结果为W×256的输出。

全连接层为512维。

将滤除后的文本候选区合并成文本框的判定条件包括：

CRNN模型由CNN卷积层、RNN循环层、CTC转录层组成。

上述步骤S1-S6依托于CTPN网络结构，CTPN网络预测文本在竖直方向上的位置，宽度固定为16，高度则从11像素到128像素变化，总共10个目标待选区，水平方向的位置不预测。

每两个相近的文本候选区组成一个文本框，合并不同的文本框直到无法再合并为止。而判断两个文本候选区B_i和B_j可以组成一个文本框的条件为B_i—>B_j，同时B_j—>B_i，该符号的判定条件如图4所示。

CRNN模型由CNN卷积层、RNN循环层、CTC转录层组成。其特点为：端到端可训练，把CNN卷积层和RNN循环层联合训练；任意长度的输入(图像宽度任意，单词长度任意)；训练集无需有字符的标定；带字典和不带字典的库(样本)都可以使用。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不会使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种基于物联网的智能医疗票据识别方法，其特征在于：包括以下步骤：

S2、在特征图上做滑窗得到特征向量；

S7、通过CRNN模型对合并文本框中的文字进行识别。

2.根据权利要求1所述的基于物联网的智能医疗票据识别方法，其特征在于：所述特征图的大小为W×H×C。

3.根据权利要求1所述的基于物联网的智能医疗票据识别方法，其特征在于：所述滑窗的窗口大小为3×3，所述滑窗的窗口得到一个长度为3×3×C的特征向量。

4.根据权利要求3所述的基于物联网的智能医疗票据识别方法，其特征在于：所述特征向量预测10个目标待选区之间的偏移距离，所述滑窗的窗口中心预测出10个文本候选区。

5.根据权利要求1所述的基于物联网的智能医疗票据识别方法，其特征在于：所述RNN循环层采用BLSTM，所述循环层输出结果为W×256的输出。

6.根据权利要求1所述的基于物联网的智能医疗票据识别方法，其特征在于：所述全连接层为512维。

7.根据权利要求1所述的基于物联网的智能医疗票据识别方法，其特征在于：所述将滤除后的文本候选区合并成文本框的判定条件包括：

8.根据权利要求1所述的基于物联网的智能医疗票据识别方法，其特征在于：所述CRNN模型由CNN卷积层、RNN循环层、CTC转录层组成。