CN109784341A - 一种基于lstm神经网络的医疗单据识别方法 - Google Patents
一种基于lstm神经网络的医疗单据识别方法 Download PDFInfo
- Publication number
- CN109784341A CN109784341A CN201811589041.3A CN201811589041A CN109784341A CN 109784341 A CN109784341 A CN 109784341A CN 201811589041 A CN201811589041 A CN 201811589041A CN 109784341 A CN109784341 A CN 109784341A
- Authority
- CN
- China
- Prior art keywords
- character
- layer
- neural network
- output
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于LSTM神经网络的医疗单据识别方法,包括步骤:1)单据图像预处理,将图像信号转化成数字信号;2)分割字符,将单据图像归一化;3)提取字符特征,生成特征向量;4)单据识别与分类。本发明方法创造性地采用LSTM神经网络对图像进行识别和分类,具有识别速度快,容错能力强,识别率高,分类结果好等优点。
Description
技术领域
本发明涉及图像处理的技术领域,尤其是指一种基于LSTM神经网络的医疗单据识别方法。
背景技术
在保险理赔行业中,理赔单据包括医疗***、药物清单、病历、检验单等都是重要的理赔依据。目前对保险公司而言,由于数据积累的需要和监管要求,对于原始单据的信息采集往往要求非常旺盛,但是受限于成本压力,目前大部分保险公司仅仅通过BPO采集了***信息,其他票据信息往往转变为沉默数据,无法支撑保险公司产品设计和自动化□控的要求。传统的BPO方式主要依赖于人工录入,需要对票据进行人工分类,人员投入巨大,而且数据安全管理复杂,整体的效率非常低。
目前,并没有针对保险行业形成一种专门的保险理赔单据识别方法,现如今大多是对金融票据进行识别,采用神经网络模式识别的方式,对票据的金额数字和身份证数码进行了分割、图像处理和特征提取,并在此基础上用改进的BP网络对其进行了识别。
本文采用LSTM神经网络对理赔单据进行识别,LSTM是一种时间递归神经网络,所有的RNN都具有一种重复神经网络模块的链式形式,LSTM区别于RNN的地方,主要就在于它在算法中加入了一个判断信息有用与否的“处理器”,这个处理器作用的结构被称为cell。一个cell当中被放置了三扇门,分别叫做输入门、遗忘门和输出门。一个信息进入LSTM的网络当中,可以根据规则来判断是否有用。只有符合算法认证的信息才会留下,不符的信息则通过遗忘门被遗忘。因此采用LSTM神经网络来识别理赔单据,不仅能够提高识别的准确度,还能将提高分类的准确性。
发明内容
本发明的目的在于克服现有技术的不足,提出了一种基于LSTM神经网络的医疗单据识别方法,可以有效地提取单据的属性特征,识别单据的具体内容,并根据属性特征对票据进行自动分类,并且LSTM神经网络结构复杂性低,计算速度高效,可以有效提高效率和识别精度。
具体地,通过版面分析提取相互独立的图像单元与对单据版面进行识别两个方法。首先由于单据模板种类繁多,盖了常□的医疗单据,如***、药物清单、病例、诊疗卡、检验单等,模版方式的识别是无法满足需求的,需要采取端到端的模式,实现单据类型的自动归类,属性字段的自动提取,提高分类的准确度。
其次,医疗单据本身由于打印精度限制等因素,单据本身往往容易出现错位、错行、表面污渍等,另外医院还会根据管理要求叠加医院***、交费告知等信息,噪音信息量较大,需要对单据进行预处理,包括去噪、倾斜校正和倾斜校正等操作,然后通过LSTM神经网络对单据提取主要特征信息,提高识别精度。
为实现上述目的,本发明所提供的技术方案为:一种基于LSTM神经网络的医疗单据识别方法,包括以下步骤:
1)单据图像预处理,将图像信号转化成数字信号;
2)分割字符,将单据图像归一化;
3)提取字符特征,生成特征向量;
4)单据识别与分类。
在步骤1)中,单据图像预处理,将图像信号转化成数字信号,具体如下:
在采集和获取图像的过程中,由于环境的干扰会产生噪声,影响单据分类的准确性,针对单据存在较多椒盐噪声的特点,采用中值滤波的方法对图像进行滤波。在图像扫描时,图像可能会出现一定的倾斜,增加了后续分类操作的难度,因此需要做倾斜校正。采用基于方向投影的倾斜检测算法,用不同倾角的扫描线对图像进行扫描,计算出扫描线方向的最大投影;在所有的方向最大投影中再寻找最大值,取得该最大方向投影的扫描线方向即为单据图像的倾角方向。识别区域定位和字符识别之前的预处理可以根据需要进行二值化操作,为了能够更好地适应书写质量差或背景情况复杂的图像,本文采用自适应阈值法对图像进行二值化操作:把大于某个临界灰度值的像素灰度设为灰度极大值,把小于这个像素灰度设为灰度极小值。自适应阈值T(x,y)在每个像素点都不同,通过计算像素点周围b*b(b由参数指定)区域加权平均,对区域所有像素进行平均加权,获取临界灰度值,最终得到二值化图像,将图像信号转化成了数字信号。
在步骤2)中,分割字符,将单据图像归一化,具体如下:
在步骤1)中,已经获得单据的二值图像,根据二值化图像进行字符分割。首先,对多字符目标进行水平投影,根据Y轴投影值可将多字符目标分割成不同的行;再对同一行字符做垂直投影,根据X轴投影值,可将其分割成多列;根据行、列值,可分割出单个字符。以垂直投影为例,具体做法是:以一条垂直线从左到右扫描一行字符,根据该垂直线在某位置是否遇到黑像素决定这一位置是否有字符。最后将分割的字符图像归一化为24*24的单一字符图像。
在步骤3)中,提取字符特征,生成特征向量,具体如下:
采用粗网格特征提取方法,把独立的单个二值化字符纵横分割成由n个网格组成的形式,取每个网格中字符像素(设为白色像素)占总字符像素的比例,将所有比例值排成一列就形成n维特征向量。本发明把归一化后的字符图像,纵向上分为20份,横向上分为12份,故20×12=240个1或0构成的列矩阵就作为字符的输入特征,这样对于每一个输入样本就要240个特征,即可确定输入层的节点数为240。
在步骤4)中,单据识别与分类,具体如下:
首先定义一个LSTM模型,需要传入的参数是输入数据的维数为20,输入维数为240,层数为2,输出节点数即分类数目为10(根据具体情况设定),隐藏节点数通过以下两个经验公式来确定,并根据实际情况做出调整;
其中,m为隐层节点数,n为输入层节点数,l为输出层节点数,α为1~10之间的常数;
LSTM神经网络分为输入层、隐含层和输出层。输入层负责接收信息,并传递给隐含层;隐含层负责信息变换,最后一个隐含层负责传递信息到输出层;输出层向外界输出信息处理结果。LSTM神经网络的学习过程包括正向传递和误差反向传播两个过程。数据经正向传递从输入层开始,经隐含层逐层计算,传到输出层,若输出层的实际输出和期望输出不符,则计算输出层的误差值,然后反向传播误差,也就是将输出误差以某种形式通过隐含层反传回输入层,并将误差分摊给各层所有神经元,从而获得各层神经元的误差,此误差作为修正该神经元参数的依据,最终识别出单据中的药品名称、金额等信息;
最后外接一个softmax分类器,取输出的最后一个部分传入分类器求出分类概率,最终得出单据的分类。
本发明与现有技术相比,具有如下优点与有益效果:
1、本发明创造性地采用LSTM神经网络对图像进行识别和分类,识别速度快,容错能力强,识别率高,可以有效避免字符断裂、粗细不均带来的不良影响。
2、本发明采用LSTM神经网络,迭代次数少,训练准确率高,识别率高,分类结果好。
3、本发明采用新的倾斜校正算法,既减少了扫描次数又提高了扫描速度。
4、本发明的网络结构简单,识别和分类过程同时进行,减少计算量,计算高效,从而达到实时性。
附图说明
图1是保险理赔单据识别流程图。
图2是单据识别分类网络结构图。
具体实施方式
下面结合具体实施例对本发明作进一步说明。
本实施案例所提供的基于LSTM神经网络的医疗单据识别方法,输入一张医院收费单据进行识别。单据图像识别的完整流程如图1所示。在预处理图像文件时,使用算法将图像信号转化成数字信号;接下来,分割图像字符,将图像归一化成统一大小;然后,提取图像特征生成特征向量;再使用LSTM神经网络识别图像内容;最后,采用softmax分类器将单据进行分类。其具体包括以下步骤:
1)图像预处理:首先,对输入的单据图像进行中值滤波,滤除椒盐噪声。如果所要进行识别的图像倾斜度比较大,先用一个较大的扫描线角度步长进行扫描,求出最大的方向投影并记下对应的扫描线角度,然后把以该角度为中心的一个邻域作为精求倾斜角时的检测范围,检测出了图像的倾角后,即可实现对图像的倾斜校正。最后,通过自适应阈值法将图像转化成灰度图像,将图像信号转化成数字信号,便于后续的特征提取。
2)分割字符,将单据图像归一化。首先,对多字符目标进行水平投影,根据Y轴投影值可将多字符目标分割成不同的行;再对同一行字符做垂直投影,根据X轴投影值,可将其分割成多列;根据行、列值,可分割出单个字符。以垂直投影为例,具体做法是:以一条垂直线从左到右扫描一行字符,根据该垂直线在某位置是否遇到黑像素决定这一位置是否有字符。最后将分割的字符图像归一化为24*24的单一字符图像。
3)提取字符特征,生成特征向量。把归一化后的字符图像,纵向上分为20份,横向上分为12份,故20×12=240个1或0构成的列矩阵就作为字符的输入特征,这样对于每一个输入样本就要240个特征,即可确定输入层的节点数为240。
4)单据识别与分类网络结构如图2所示,识别与分类的过程如下:
定义一个LSTM模型,需要传入的参数是输入数据的维数为20,输入维数为240,层数为2,输出节点数即分类数目为10,隐藏节点数通过以下两个经验公式来确定,并根据实际情况做出调整:
其中,m为隐层节点数,n为输入层节点数,l为输出层节点数,α为1~10之间的常数。
LSTM神经网络分为输入层、隐含层和输出层;输入层负责接收信息,并传递给隐含层;隐含层负责信息变换,最后一个隐含层负责传递信息到输出层;输出层负责向外界输出信息处理结果。
首先,将240维特征作为输入,输入到LSTM网络的输入层,并传递给隐藏层,隐藏层获取特征中的信息,并交换信息,最后一个隐含层将信息传递到输出层,通过逐层计算,若输出层的实际输出和期望输出不符,则计算输出层的误差值,然后反向传播误差,也就是将输出误差以某种形式通过隐含层反传回输入层,并将误差分摊给各层所有神经元,从而获得各层神经元的误差,此误差作为修正该神经元参数的依据,最终当误差达到最小的时候,即获得识别结果,识别出单据中的药品名称、金额等信息。
最后,将LSTM网络的输出特征融合,输入到Softmax分类器,根据预先设定好的分类数,求出每种分类的分类概率,概率越高,说明该单据属于该分类,最终得出分类结果。
以上所述实施例只为本发明之较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。
Claims (5)
1.一种基于LSTM神经网络的医疗单据识别方法,其特征在于,包括以下步骤:
1)单据图像预处理,将图像信号转化成数字信号;
2)分割字符,将单据图像归一化;
3)提取字符特征,生成特征向量;
4)单据识别与分类。
2.根据权利要求1所述的一种基于LSTM神经网络的医疗单据识别方法,其特征在于,在步骤1)中,单据图像预处理,将图像信号转化成数字信号,具体如下:
图像预处理包括滤波、倾斜校正和二值化,首先采用中值滤波的方法对图像进行滤波;然后采用基于方向投影的倾斜检测算法,用不同倾角的扫描线对图像进行扫描,计算出扫描线方向的最大投影;在所有的方向最大投影中再寻找最大值,取得最大方向投影的扫描线方向即为票据图像的倾角方向;最后采用自适应阈值法对图像进行二值化操作:把大于某个临界灰度值的像素灰度设为灰度极大值,把小于这个像素灰度设为灰度极小值,自适应阈值在每个像素点都不同,通过计算像素点周围区域加权平均,对区域所有像素进行平均加权,获取临界灰度值,最终得到二值化图像,将图像信号转化成数字信号。
3.根据权利要求1所述的一种基于LSTM神经网络的医疗单据识别方法,其特征在于,在步骤2)中,分割字符,将单据图像归一化,具体如下:
首先,对多字符目标进行水平投影,根据Y轴投影值将多字符目标分割成不同的行;再对同一行字符做垂直投影,根据X轴投影值,将其分割成多列;根据行、列值,分割出单个字符;对于垂直投影,具体做法是:以一条垂直线从左到右扫描一行字符,根据该垂直线在某位置是否遇到黑像素决定这一位置是否有字符,最后将分割的字符图像归一化为24*24的单一字符图像。
4.根据权利要求1所述的一种基于LSTM神经网络的医疗单据识别方法,其特征在于:在步骤3)中,提取字符特征,生成特征向量,具体如下:
采用粗网格特征提取方法,把独立的单个二值化字符纵横分割成由n个网格组成的形式,取每个网格中字符像素占总字符像素的比例,将所有比例值排成一列就形成n维特征向量;把归一化后的字符图像,纵向上分为20份,横向上分为12份,故20×12=240个1或0构成的列矩阵就作为字符的输入特征,这样对于每一个输入样本就要240个特征,即可确定输入层的节点数为240。
5.根据权利要求1所述的一种基于LSTM神经网络的医疗单据识别方法,其特征在于:在步骤4)中,单据识别与分类,具体如下:
定义一个LSTM模型,需要传入的参数是输入数据的维数为20,输入维数为240,层数为2,输出节点数即分类数目为10,隐藏节点数通过以下两个经验公式来确定,并根据实际情况做出调整:
其中,m为隐层节点数,n为输入层节点数,l为输出层节点数,α为1~10之间的常数;
LSTM神经网络分为输入层、隐含层和输出层;输入层负责接收信息,并传递给隐含层;隐含层负责信息变换,最后一个隐含层负责传递信息到输出层;输出层负责向外界输出信息处理结果;LSTM神经网络的学习过程包括正向传递和误差反向传播两个过程;数据经正向传递从输入层开始,经隐含层逐层计算,传到输出层,若输出层的实际输出和期望输出不符,则计算输出层的误差值,然后反向传播误差,也就是将输出误差以某种形式通过隐含层反传回输入层,并将误差分摊给各层所有神经元,从而获得各层神经元的误差,此误差作为修正该神经元参数的依据,最终识别出单据中的信息,包括药品名称和金额;
最后外接一个softmax分类器,取输出的最后一个部分传入分类器求出分类概率,最终得出单据的分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811589041.3A CN109784341A (zh) | 2018-12-25 | 2018-12-25 | 一种基于lstm神经网络的医疗单据识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811589041.3A CN109784341A (zh) | 2018-12-25 | 2018-12-25 | 一种基于lstm神经网络的医疗单据识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109784341A true CN109784341A (zh) | 2019-05-21 |
Family
ID=66497648
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811589041.3A Pending CN109784341A (zh) | 2018-12-25 | 2018-12-25 | 一种基于lstm神经网络的医疗单据识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109784341A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110298354A (zh) * | 2019-07-08 | 2019-10-01 | 苏州阿基米德网络科技有限公司 | 一种设备信息识别***及其识别方法 |
CN110378351A (zh) * | 2019-07-26 | 2019-10-25 | 中国工商银行股份有限公司 | ***鉴别方法及装置 |
CN110705488A (zh) * | 2019-10-09 | 2020-01-17 | 广州医药信息科技有限公司 | 图像文字识别方法 |
CN110717096A (zh) * | 2019-09-06 | 2020-01-21 | 平安医疗健康管理股份有限公司 | 单据数据提取方法、装置、计算机设备和存储介质 |
CN110751158A (zh) * | 2019-10-24 | 2020-02-04 | 江苏瑞尔医疗科技有限公司 | 一种治疗床显示器中的数字识别方法、装置及存储介质 |
CN111461108A (zh) * | 2020-02-21 | 2020-07-28 | 浙江工业大学 | 一种医疗单据识别方法 |
CN113011407A (zh) * | 2021-02-05 | 2021-06-22 | 国网浙江义乌市供电有限公司 | 一种电费复核单据自动识别、分拣投递的***和方法 |
CN117456532A (zh) * | 2023-11-10 | 2024-01-26 | 广州方舟信息科技有限公司 | 一种药品金额的校正方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103745213A (zh) * | 2014-02-28 | 2014-04-23 | 中国人民解放军63680部队 | 基于lvq神经网络的光学字符识别方法 |
CN107220648A (zh) * | 2017-04-11 | 2017-09-29 | 平安科技(深圳)有限公司 | 理赔单据的字符识别方法及服务器 |
CN107491730A (zh) * | 2017-07-14 | 2017-12-19 | 浙江大学 | 一种基于图像处理的化验单识别方法 |
-
2018
- 2018-12-25 CN CN201811589041.3A patent/CN109784341A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103745213A (zh) * | 2014-02-28 | 2014-04-23 | 中国人民解放军63680部队 | 基于lvq神经网络的光学字符识别方法 |
CN107220648A (zh) * | 2017-04-11 | 2017-09-29 | 平安科技(深圳)有限公司 | 理赔单据的字符识别方法及服务器 |
CN107491730A (zh) * | 2017-07-14 | 2017-12-19 | 浙江大学 | 一种基于图像处理的化验单识别方法 |
Non-Patent Citations (2)
Title |
---|
FALLAK ASAD 等: ""High Performance OCR for Camera-Captured Blurred Documents with LSTM Networks"", 《2016 12TH IAPR WORKSHOP ON DOCUMENT ANALYSIS SYSTEMS (DAS)》 * |
张丘 等: ""基于方向投影的票据图像倾斜检测方法"", 《计算机应用》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110298354A (zh) * | 2019-07-08 | 2019-10-01 | 苏州阿基米德网络科技有限公司 | 一种设备信息识别***及其识别方法 |
CN110378351A (zh) * | 2019-07-26 | 2019-10-25 | 中国工商银行股份有限公司 | ***鉴别方法及装置 |
CN110717096A (zh) * | 2019-09-06 | 2020-01-21 | 平安医疗健康管理股份有限公司 | 单据数据提取方法、装置、计算机设备和存储介质 |
CN110705488A (zh) * | 2019-10-09 | 2020-01-17 | 广州医药信息科技有限公司 | 图像文字识别方法 |
CN110751158A (zh) * | 2019-10-24 | 2020-02-04 | 江苏瑞尔医疗科技有限公司 | 一种治疗床显示器中的数字识别方法、装置及存储介质 |
CN110751158B (zh) * | 2019-10-24 | 2023-05-23 | 江苏瑞尔医疗科技有限公司 | 一种治疗床显示器中的数字识别方法、装置及存储介质 |
CN111461108A (zh) * | 2020-02-21 | 2020-07-28 | 浙江工业大学 | 一种医疗单据识别方法 |
CN113011407A (zh) * | 2021-02-05 | 2021-06-22 | 国网浙江义乌市供电有限公司 | 一种电费复核单据自动识别、分拣投递的***和方法 |
CN117456532A (zh) * | 2023-11-10 | 2024-01-26 | 广州方舟信息科技有限公司 | 一种药品金额的校正方法、装置、设备及存储介质 |
CN117456532B (zh) * | 2023-11-10 | 2024-05-31 | 北京方易行信息科技有限公司 | 一种药品金额的校正方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109784341A (zh) | 一种基于lstm神经网络的医疗单据识别方法 | |
CN109086714B (zh) | 表格识别方法、识别***及计算机装置 | |
RU2708422C1 (ru) | Способ и система управления банкоматами | |
CN107545239B (zh) | 一种基于车牌识别与车辆特征匹配的套牌检测方法 | |
CN107194400B (zh) | 一种财务报销全票据图片识别处理方法 | |
CN108596166A (zh) | 一种基于卷积神经网络分类的集装箱箱号识别方法 | |
CN112686812B (zh) | 银行卡倾斜矫正检测方法、装置、可读存储介质和终端 | |
CN107103317A (zh) | 基于图像融合和盲反卷积的模糊车牌图像识别算法 | |
CN115018828A (zh) | 一种电子元器件的缺陷检测方法 | |
CN112651289B (zh) | 一种增值税普通***智能识别与校验***及其方法 | |
Saif et al. | Automatic license plate recognition system for bangla license plates using convolutional neural network | |
CN110766016B (zh) | 一种基于概率神经网络的喷码字符识别方法 | |
CN103034848B (zh) | 一种表单类型的识别方法 | |
Ahranjany et al. | A very high accuracy handwritten character recognition system for Farsi/Arabic digits using convolutional neural networks | |
CN102629322B (zh) | 一种基于边界点笔画形状的字符特征提取方法及应用 | |
US11194997B1 (en) | Method and system for thermal infrared facial recognition | |
CN106529532A (zh) | 一种基于积分特征通道与灰度投影的车牌识别*** | |
CN109784342A (zh) | 一种基于深度学习模型的ocr识别方法及终端 | |
CN110298376A (zh) | 一种基于改进b-cnn的银行票据图像分类方法 | |
CN110598566A (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
CN106529461A (zh) | 一种基于积分特征通道和svm训练器的车型识别算法 | |
CN112507782A (zh) | 文本图像的识别方法及装置 | |
CN112052845A (zh) | 图像识别方法、装置、设备及存储介质 | |
CN112686248B (zh) | 证件增减类别检测方法、装置、可读存储介质和终端 | |
CN106503748A (zh) | 一种基于s‑sift特征和svm训练器的车型识别算法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190521 |