CN111310762A - 一种基于物联网的智能医疗票据识别方法 - Google Patents
一种基于物联网的智能医疗票据识别方法 Download PDFInfo
- Publication number
- CN111310762A CN111310762A CN202010183612.4A CN202010183612A CN111310762A CN 111310762 A CN111310762 A CN 111310762A CN 202010183612 A CN202010183612 A CN 202010183612A CN 111310762 A CN111310762 A CN 111310762A
- Authority
- CN
- China
- Prior art keywords
- text
- internet
- method based
- layer
- identification method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 239000013598 vector Substances 0.000 claims abstract description 14
- 102100032202 Cornulin Human genes 0.000 claims abstract description 8
- 101000920981 Homo sapiens Cornulin Proteins 0.000 claims abstract description 8
- 238000010276 construction Methods 0.000 claims abstract description 5
- 238000001914 filtration Methods 0.000 claims abstract description 5
- 230000001629 suppression Effects 0.000 claims abstract description 5
- 238000013518 transcription Methods 0.000 claims description 4
- 230000035897 transcription Effects 0.000 claims description 4
- 230000007547 defect Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 3
- 238000012550 audit Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000001520 comb Anatomy 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及字符识别,具体涉及一种基于物联网的智能医疗票据识别方法,利用VGG16模型作为基础网络提取特征,通过VGG16模型中前5个卷积得到特征图,在特征图上做滑窗得到特征向量,将滑窗窗口对应的特征向量输入RNN循环层,得到循环层输出结果,将循环层输出结果输入全连接层,通过分类或回归得到密集预测的文本候选区,使用标准Soft非极大值抑制算法对密集预测的文本候选区进行滤除,利用简单文本线构造算法,将滤除后的文本候选区合并成文本框,通过CRNN模型对合并文本框中的文字进行识别;本发明提供的技术方案能够有效克服现有技术所存在的无法准确高效识别医疗票据上票据信息的缺陷。
Description
技术领域
本发明涉及字符识别,具体涉及一种基于物联网的智能医疗票据识别方法。
背景技术
随着近些年我国医疗行业的不断发展和进步,其所拥有的体系和制度都已相对较为完善。但是,目前医疗票据的管理较乱,由于各个医院出具的票据格式五花八门,票据在医院和报销单位之间的流转通过递交后,由受理单位以人工录入的方式进行,不利于存档和后期检索,票据信息的采集,还是使用传统人工录入方式。
医疗票据报销***是手动输入参保人信息后,参保人提交票据,前台工作人员手动逐项录入***信息,核对人员对录入信息进行核对后,提交审核人员审核,给出报销比较和报销金额,整个流程工作人员的效率非常低,并且往往还会出现一些难以发现的录入错误。
发明内容
(一)解决的技术问题
针对现有技术所存在的上述缺点,本发明提供了一种基于物联网的智能医疗票据识别方法,能够有效克服现有技术所存在的无法准确高效识别医疗票据上票据信息的缺陷。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
一种基于物联网的智能医疗票据识别方法,包括以下步骤:
S1、利用VGG16模型作为基础网络提取特征,通过VGG16模型中前5个卷积得到特征图;
S2、在特征图上做滑窗得到特征向量;
S3、将滑窗窗口对应的特征向量输入RNN循环层,得到循环层输出结果;
S4、将循环层输出结果输入全连接层,通过分类或回归得到密集预测的文本候选区;
S5、使用标准Soft非极大值抑制算法对密集预测的文本候选区进行滤除;
S6、利用简单文本线构造算法,将滤除后的文本候选区合并成文本框;
S7、通过CRNN模型对合并文本框中的文字进行识别。
优选地,所述特征图的大小为W×H×C。
优选地,所述滑窗的窗口大小为3×3,所述滑窗的窗口得到一个长度为3×3×C的特征向量。
优选地,所述特征向量预测10个目标待选区之间的偏移距离,所述滑窗的窗口中心预测出10个文本候选区。
优选地,所述RNN循环层采用BLSTM,所述循环层输出结果为W×256的输出。
优选地,所述全连接层为512维。
优选地,所述将滤除后的文本候选区合并成文本框的判定条件包括:
两个文本候选区的水平距离最小、两个文本候选区之间的距离小于50个像素、两个文本候选区的纵向重叠大于0.7。
优选地,所述CRNN模型由CNN卷积层、RNN循环层、CTC转录层组成。
(三)有益效果
与现有技术相比,本发明所提供的一种基于物联网的智能医疗票据识别方法将已有业务流程整合梳理,利用智能识别技术,识别批量扫描的医疗票据信息,能够对不同格式的文本进行快速识别,把繁重重复的录入工作交由***完成,形成可编辑的结构化信息,助力工作人员高效准确对参保人医疗票据信息进行处理,缩短报销人员等待时间,完善相关业务流程,实现医疗票据的智能化处理,创建一个高效、便捷的医疗票据报销服务环境,缩短服务周期,大大提升医疗票据报销服务的效率和满意度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明通过分类或回归得到密集预测文本候选区的示意图;
图2为本发明使用标准Soft非极大值抑制算法对图1进行滤除后的示意图;
图3为本发明利用简单文本线构造算法,将图2中滤除后的文本候选区合并成文本框的示意图;
图4为本发明将滤除后的文本候选区合并成文本框的判定条件。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种基于物联网的智能医疗票据识别方法,如图1至图3所示,包括以下步骤:
S1、利用VGG16模型作为基础网络提取特征,通过VGG16模型中前5个卷积得到特征图;
S2、在特征图上做滑窗得到特征向量;
S3、将滑窗窗口对应的特征向量输入RNN循环层,得到循环层输出结果;
S4、将循环层输出结果输入全连接层,通过分类或回归得到密集预测的文本候选区;
S5、使用标准Soft非极大值抑制算法对密集预测的文本候选区进行滤除;
S6、利用简单文本线构造算法,将滤除后的文本候选区合并成文本框;
S7、通过CRNN模型对合并文本框中的文字进行识别。
特征图的大小为W×H×C。
滑窗的窗口大小为3×3,滑窗的窗口得到一个长度为3×3×C的特征向量。
特征向量预测10个目标待选区之间的偏移距离,滑窗的窗口中心预测出10个文本候选区。
RNN循环层采用BLSTM,循环层输出结果为W×256的输出。
全连接层为512维。
将滤除后的文本候选区合并成文本框的判定条件包括:
两个文本候选区的水平距离最小、两个文本候选区之间的距离小于50个像素、两个文本候选区的纵向重叠大于0.7。
CRNN模型由CNN卷积层、RNN循环层、CTC转录层组成。
上述步骤S1-S6依托于CTPN网络结构,CTPN网络预测文本在竖直方向上的位置,宽度固定为16,高度则从11像素到128像素变化,总共10个目标待选区,水平方向的位置不预测。
每两个相近的文本候选区组成一个文本框,合并不同的文本框直到无法再合并为止。而判断两个文本候选区Bi和Bj可以组成一个文本框的条件为Bi—>Bj,同时Bj—>Bi,该符号的判定条件如图4所示。
CRNN模型由CNN卷积层、RNN循环层、CTC转录层组成。其特点为:端到端可训练,把CNN卷积层和RNN循环层联合训练;任意长度的输入(图像宽度任意,单词长度任意);训练集无需有字符的标定;带字典和不带字典的库(样本)都可以使用。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不会使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (8)
1.一种基于物联网的智能医疗票据识别方法,其特征在于:包括以下步骤:
S1、利用VGG16模型作为基础网络提取特征,通过VGG16模型中前5个卷积得到特征图;
S2、在特征图上做滑窗得到特征向量;
S3、将滑窗窗口对应的特征向量输入RNN循环层,得到循环层输出结果;
S4、将循环层输出结果输入全连接层,通过分类或回归得到密集预测的文本候选区;
S5、使用标准Soft非极大值抑制算法对密集预测的文本候选区进行滤除;
S6、利用简单文本线构造算法,将滤除后的文本候选区合并成文本框;
S7、通过CRNN模型对合并文本框中的文字进行识别。
2.根据权利要求1所述的基于物联网的智能医疗票据识别方法,其特征在于:所述特征图的大小为W×H×C。
3.根据权利要求1所述的基于物联网的智能医疗票据识别方法,其特征在于:所述滑窗的窗口大小为3×3,所述滑窗的窗口得到一个长度为3×3×C的特征向量。
4.根据权利要求3所述的基于物联网的智能医疗票据识别方法,其特征在于:所述特征向量预测10个目标待选区之间的偏移距离,所述滑窗的窗口中心预测出10个文本候选区。
5.根据权利要求1所述的基于物联网的智能医疗票据识别方法,其特征在于:所述RNN循环层采用BLSTM,所述循环层输出结果为W×256的输出。
6.根据权利要求1所述的基于物联网的智能医疗票据识别方法,其特征在于:所述全连接层为512维。
7.根据权利要求1所述的基于物联网的智能医疗票据识别方法,其特征在于:所述将滤除后的文本候选区合并成文本框的判定条件包括:
两个文本候选区的水平距离最小、两个文本候选区之间的距离小于50个像素、两个文本候选区的纵向重叠大于0.7。
8.根据权利要求1所述的基于物联网的智能医疗票据识别方法,其特征在于:所述CRNN模型由CNN卷积层、RNN循环层、CTC转录层组成。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010183612.4A CN111310762A (zh) | 2020-03-16 | 2020-03-16 | 一种基于物联网的智能医疗票据识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010183612.4A CN111310762A (zh) | 2020-03-16 | 2020-03-16 | 一种基于物联网的智能医疗票据识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111310762A true CN111310762A (zh) | 2020-06-19 |
Family
ID=71147166
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010183612.4A Pending CN111310762A (zh) | 2020-03-16 | 2020-03-16 | 一种基于物联网的智能医疗票据识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111310762A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111967391A (zh) * | 2020-08-18 | 2020-11-20 | 清华大学 | 医学化验单的文本识别方法和计算机可读存储介质 |
CN112364837A (zh) * | 2020-12-09 | 2021-02-12 | 四川长虹电器股份有限公司 | 一种基于目标检测和文本识别的票据信息识别方法 |
CN113255642A (zh) * | 2021-05-07 | 2021-08-13 | 北京精友时代信息技术发展有限公司 | 一种用于人伤理赔的医疗票据信息整合方法 |
WO2022006829A1 (zh) * | 2020-07-09 | 2022-01-13 | 国网电子商务有限公司 | 一种票据图像识别方法、***、电子设备和存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108446621A (zh) * | 2018-03-14 | 2018-08-24 | 平安科技(深圳)有限公司 | 票据识别方法、服务器及计算机可读存储介质 |
CN109886174A (zh) * | 2019-02-13 | 2019-06-14 | 东北大学 | 一种仓库货架标识牌文字识别的自然场景文字识别方法 |
CN110245545A (zh) * | 2018-09-26 | 2019-09-17 | 浙江大华技术股份有限公司 | 一种文字识别方法及装置 |
CN110363199A (zh) * | 2019-07-16 | 2019-10-22 | 济南浪潮高新科技投资发展有限公司 | 基于深度学习的证件图像文本识别方法及*** |
CN110399845A (zh) * | 2019-07-29 | 2019-11-01 | 上海海事大学 | 一种图像中连续成段文本检测与识别方法 |
CN110516676A (zh) * | 2019-08-21 | 2019-11-29 | 河海大学常州校区 | 一种基于图像处理的银行***识别*** |
US20200012876A1 (en) * | 2017-09-25 | 2020-01-09 | Tencent Technology (Shenzhen) Company Limited | Text detection method, storage medium, and computer device |
-
2020
- 2020-03-16 CN CN202010183612.4A patent/CN111310762A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200012876A1 (en) * | 2017-09-25 | 2020-01-09 | Tencent Technology (Shenzhen) Company Limited | Text detection method, storage medium, and computer device |
CN108446621A (zh) * | 2018-03-14 | 2018-08-24 | 平安科技(深圳)有限公司 | 票据识别方法、服务器及计算机可读存储介质 |
CN110245545A (zh) * | 2018-09-26 | 2019-09-17 | 浙江大华技术股份有限公司 | 一种文字识别方法及装置 |
CN109886174A (zh) * | 2019-02-13 | 2019-06-14 | 东北大学 | 一种仓库货架标识牌文字识别的自然场景文字识别方法 |
CN110363199A (zh) * | 2019-07-16 | 2019-10-22 | 济南浪潮高新科技投资发展有限公司 | 基于深度学习的证件图像文本识别方法及*** |
CN110399845A (zh) * | 2019-07-29 | 2019-11-01 | 上海海事大学 | 一种图像中连续成段文本检测与识别方法 |
CN110516676A (zh) * | 2019-08-21 | 2019-11-29 | 河海大学常州校区 | 一种基于图像处理的银行***识别*** |
Non-Patent Citations (1)
Title |
---|
董洪义: "《深度学习之PyTorch物体检测实战》", 31 January 2020 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022006829A1 (zh) * | 2020-07-09 | 2022-01-13 | 国网电子商务有限公司 | 一种票据图像识别方法、***、电子设备和存储介质 |
CN111967391A (zh) * | 2020-08-18 | 2020-11-20 | 清华大学 | 医学化验单的文本识别方法和计算机可读存储介质 |
CN112364837A (zh) * | 2020-12-09 | 2021-02-12 | 四川长虹电器股份有限公司 | 一种基于目标检测和文本识别的票据信息识别方法 |
CN113255642A (zh) * | 2021-05-07 | 2021-08-13 | 北京精友时代信息技术发展有限公司 | 一种用于人伤理赔的医疗票据信息整合方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111310762A (zh) | 一种基于物联网的智能医疗票据识别方法 | |
CN110363252B (zh) | 趋向于端到端的场景文字检测与识别方法以及*** | |
CN111861978A (zh) | 基于Faster R-CNN的桥梁裂缝实例分割方法 | |
CN110969129B (zh) | 一种端到端税务票据文本检测与识别方法 | |
CN110942074B (zh) | 字符切分识别方法、装置、电子设备、存储介质 | |
CN108805076B (zh) | 环境影响评估报告书表格文字的提取方法及*** | |
CN111401353B (zh) | 一种数学公式的识别方法、装置及设备 | |
JP2005182730A (ja) | ドキュメントの自動分離 | |
CN110598698B (zh) | 基于自适应区域建议网络的自然场景文本检测方法和*** | |
CN111460927A (zh) | 对房产证图像进行结构化信息提取的方法 | |
CN110648310A (zh) | 基于注意力机制的弱监督铸件缺陷识别方法 | |
CN112307130B (zh) | 一种文档级远程监督关系抽取方法及*** | |
CN114297987A (zh) | 基于文本分类和阅读理解的文档信息抽取方法及*** | |
CN114694130A (zh) | 基于深度学习的铁路沿线电线杆及杆号检测方法和装置 | |
CN111091090A (zh) | 一种银行报表ocr识别方法、装置、平台和终端 | |
CN114758341A (zh) | 一种智能化合同图像识别与合同要素抽取方法及装置 | |
CN114429542A (zh) | 针对医疗化验单的结构化识别方法 | |
CN114239579A (zh) | 基于正则表达式和crf模型的电力可研文档提取方法及装置 | |
CN113901924A (zh) | 一种文档表格的检测方法及装置 | |
CN111832497B (zh) | 一种基于几何特征的文本检测后处理方法 | |
CN114330247A (zh) | 一种基于图像识别的自动化保险条款解析方法 | |
CN109726754A (zh) | 一种lcd屏缺陷识别方法及装置 | |
CN110163256B (zh) | 基于联合概率矩阵的试卷图像自动核分方法 | |
CN116704512A (zh) | 一种融合语义和视觉信息的仪表识别方法及*** | |
CN116543391A (zh) | 一种结合图像校正的文本数据采集***及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200619 |