CN103488999A - 一种***数据记录方法 - Google Patents

一种***数据记录方法 Download PDF

Info

Publication number
CN103488999A
CN103488999A CN201310413333.2A CN201310413333A CN103488999A CN 103488999 A CN103488999 A CN 103488999A CN 201310413333 A CN201310413333 A CN 201310413333A CN 103488999 A CN103488999 A CN 103488999A
Authority
CN
China
Prior art keywords
invoice
image information
recording method
data recording
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310413333.2A
Other languages
English (en)
Inventor
安俊峰
龚涛
卢萌萌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Donghua University
Original Assignee
Donghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Donghua University filed Critical Donghua University
Priority to CN201310413333.2A priority Critical patent/CN103488999A/zh
Publication of CN103488999A publication Critical patent/CN103488999A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

本发明涉及一种***数据记录方法,包括以下步骤:获取***图像信息,将***图像信息采集到计算机中;利用matlab软件对***图像信息进行处理,并且存储数据。本发明节约成本,方便快捷,省时省力。

Description

一种***数据记录方法
技术领域
本发明涉及票据记录技术领域,特别是涉及一种***数据记录和分类统计预测方法。
背景技术
***是指一切单位和个人在购销商品、提供劳务或接受劳务、服务以及从事其他经营活动,所提供给对方的收付款的书面证明,是财务收支的法定凭证,是会计核算的原始依据,也是审计机关、税务机关执法检查的重要依据。现在各行各业用到对的***需要报销,但是对于大型的单位***进行录入操作非常麻烦,亟需一种方便的***数据记录方法。
发明内容
本发明所要解决的技术问题是提供一种***数据记录方法,节约成本,方便快捷,省时省力。
本发明解决其技术问题所采用的技术方案是:提供一种***数据记录方法,包括以下步骤:
(1)获取***图像信息,将***图像信息采集到计算机中;
(2)利用matlab软件对***图像信息进行处理,并且存储数据。
所述步骤(2)包括以下子步骤:
(21)对得到的***图像信息进行预处理;
(22)采用边缘提取的方式提取***图像信息,并对***进行定位;
(23)对定位后的***进行字符分割和识别;
(24)对识别后的内容进行保存。
所述步骤(23)包括以下子步骤:
(231)将采集的***图像定位到一定的区域,将***图像信息的文字图像区域进行分割;
(232)应用边缘分割的方法将***上的有用字体进行分割出来,从而分离文字区域中的单个字符;
(233)通过比对识别样本库的方法对单个字符进行识别。
所述步骤(2)后还包括对部分数据进行求和,当求和的结果大于预设值时通知指定人员的步骤。
所述步骤(2)后还包括对存储的数据进行svm分类预测的步骤。
有益效果
由于采用了上述的技术方案,本发明与现有技术相比,具有以下的优点和积极效果:本发明节约成本,方便快捷,省时省力,可以应用到需要大量统一***信息的单位,具有很好的效果,减轻工作人员的负担。
附图说明
图1是本发明的流程图;
图2是本发明中步骤(2)的流程图;
图3是本发明中步骤(23)的流程图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本发明的实施方式涉及一种***数据记录方法,如图1所示,包括以下步骤:
步骤(1),获取***图像信息,将***图像信息采集到计算机中;
步骤(2),利用matlab软件对***图像信息进行处理,并且存储数据。其中,如图2所示,该步骤还包括以下子步骤:
(21)对得到的***图像信息进行预处理;
(22)采用边缘提取的方式提取***图像信息,并对***进行定位;
(23)对定位后的***进行字符分割和识别;其中,如图3所示,该步骤还包括以下子步骤:
(231)将采集的***图像定位到一定的区域,方便后期对这个固定的区域提取有用的信息,将***图像信息的文字图像区域进行分割;
(232)分离文字区域中的单个字符:应用边缘分割的方法将***上的有用字体进行分割出来,即检测灰度级或者结构具有突变的地方,表明一个区域的终结,也是另一个区域开始的地方。这种不连续性称为边缘,不同的图像灰度不同,边界处一般有明显的边缘,利用此特征可以分割图像。
(233)对单个字符进行识别:字符的识别的主要应用技术是比对识别样本库,即将所有的字符建立样本库,字符提取后通过比对样本库实现字符的判断,识别过程中可以将产生可信度等中间结果值,给***录入的人员作为是否应该将识别值作为录入结果的参考依据。
(24)对识别后的内容进行保存。
其中,步骤(2)后可以对部分数据进行求和,当求和的结果大于预设值时通知指定人员,还可以对存储的数据进行svm分类预测。
下面以高校的***录入和分析工作为例阐述本发明,应该理解为,应用到其他行业或者有着类似的观点的操作视为同一个发明。
首先对***手动添加一些内容,以高校为例,在***面值的同一行上添加学院,比如信息,材料,人文,等等,还有***的用处,比如资料,科研,交通等,这些文字要预先设定在matlab的图像处理识别信息库里面,供在后期识别过程中应用。然后用摄像机或者电脑上带有的摄像头拍摄***,并且拍摄时需要将学院信息,***用处等信息全部获取,将拍摄的图片保存为图片格式。启动matlab下设定好的GUI界面,对存贮的图像进行相应的处理,包括预处理、边缘提取、***定位、字符分割、字符识别,其中字符识别包括正确地分割文字图像区域;正确的分离单个文字;正确识别单个字符。此刻识别出了***的面值,学院,和用处。通过软件的程序调用识别的内容并且将其保存到指定的EXCEL或者文本文档或者.mat文件中。存储完数据后可以用软件按照学院对***的面值求和,当某个学院的额度达到了预定值时候,可以利用matlab的通信工具箱进行发送邮件的处理操作,将发送警告到制定实现设置好的邮件。存储完数据后还可以对***的用处进行分类操作,并且可以用svm的方法进行分类预测,并且相应的分析哪些用处占据相应多少比例,对以后制定***的预定值具有一定的参考价值。

Claims (5)

1.一种***数据记录方法,其特征在于,包括以下步骤:
(1)获取***图像信息,将***图像信息采集到计算机中;
(2)利用matlab软件对***图像信息进行处理,并且存储数据。
2.根据权利要求1所述的***数据记录方法,其特征在于,所述步骤(2)包括以下子步骤:
(21)对得到的***图像信息进行预处理;
(22)采用边缘提取的方式提取***图像信息,并对***进行定位;
(23)对定位后的***进行字符分割和识别;
(24)对识别后的内容进行保存。
3.根据权利要求2所述的***数据记录方法,其特征在于,所述步骤(23)包括以下子步骤:
(231)将采集的***图像定位到一定的区域,将***图像信息的文字图像区域进行分割;
(232)应用边缘分割的方法将***上的有用字体进行分割出来,从而分离文字区域中的单个字符;
(233)通过比对识别样本库的方法对单个字符进行识别。
4.根据权利要求1所述的***数据记录方法,其特征在于,所述步骤(2)后还包括对部分数据进行求和,当求和的结果大于预设值时通知指定人员的步骤。
5.根据权利要求1所述的***数据记录方法,其特征在于,所述步骤(2)后还包括对存储的数据进行svm分类预测的步骤。
CN201310413333.2A 2013-09-11 2013-09-11 一种***数据记录方法 Pending CN103488999A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310413333.2A CN103488999A (zh) 2013-09-11 2013-09-11 一种***数据记录方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310413333.2A CN103488999A (zh) 2013-09-11 2013-09-11 一种***数据记录方法

Publications (1)

Publication Number Publication Date
CN103488999A true CN103488999A (zh) 2014-01-01

Family

ID=49829206

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310413333.2A Pending CN103488999A (zh) 2013-09-11 2013-09-11 一种***数据记录方法

Country Status (1)

Country Link
CN (1) CN103488999A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105243365A (zh) * 2015-09-28 2016-01-13 四川长虹电器股份有限公司 一种数据处理方法及数据处理***
CN105279525A (zh) * 2015-11-19 2016-01-27 浪潮软件集团有限公司 一种图像处理的方法及装置
CN105574522A (zh) * 2014-11-06 2016-05-11 金蝶软件(中国)有限公司 单据录入方法及装置
CN105630817A (zh) * 2014-11-03 2016-06-01 航天信息股份有限公司 一种电子***内容解析的方法及***
CN105678612A (zh) * 2015-12-30 2016-06-15 远光软件股份有限公司 移动端原始凭证电子化智能填单***及方法
CN105718928A (zh) * 2016-01-20 2016-06-29 淄博职业学院 一种会计票据处理方法
CN108446621A (zh) * 2018-03-14 2018-08-24 平安科技(深圳)有限公司 票据识别方法、服务器及计算机可读存储介质
CN109426814A (zh) * 2017-08-22 2019-03-05 顺丰科技有限公司 一种***图片特定板块的定位、识别方法、***、设备
CN109492641A (zh) * 2018-09-18 2019-03-19 上海延华智能科技(集团)股份有限公司 基于图像识别的能源账单输入方法及***、存储介质、服务器
CN110109907A (zh) * 2017-12-27 2019-08-09 航天信息股份有限公司 一种税务数据的存储、查询方法及装置
CN110188714A (zh) * 2019-06-04 2019-08-30 言图科技有限公司 一种在聊天场景下实现财务管理的方法、***及存储介质
CN110648211A (zh) * 2018-06-07 2020-01-03 埃森哲环球解决方案有限公司 数据验证

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030031366A1 (en) * 2001-07-31 2003-02-13 Yulin Li Image processing method and apparatus using self-adaptive binarization
CN102831244A (zh) * 2012-09-13 2012-12-19 重庆立鼎科技有限公司 一种房产文档图像的分类检索方法
CN202694374U (zh) * 2012-05-15 2013-01-23 深圳长城开发科技股份有限公司 一种用于***识别的便携式装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030031366A1 (en) * 2001-07-31 2003-02-13 Yulin Li Image processing method and apparatus using self-adaptive binarization
CN202694374U (zh) * 2012-05-15 2013-01-23 深圳长城开发科技股份有限公司 一种用于***识别的便携式装置
CN102831244A (zh) * 2012-09-13 2012-12-19 重庆立鼎科技有限公司 一种房产文档图像的分类检索方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
代小红: "《基于机器视觉的数字图像处理与识别研究》", 31 March 2012, 西南交通大学出版社 *
何文基: "机动车销售统一***识别算法研究", 《中国优秀硕士学位论文全文数据库信息科技辑2011年》 *
张闯 等: "基于字符边缘特征的手写账号切分算法", 《计算机工程》 *
迟国炜: "商业***手写数字识别***的设计与实现", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑2006年》 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105630817A (zh) * 2014-11-03 2016-06-01 航天信息股份有限公司 一种电子***内容解析的方法及***
CN105630817B (zh) * 2014-11-03 2019-06-25 航天信息股份有限公司 一种电子***内容解析的方法及***
CN105574522A (zh) * 2014-11-06 2016-05-11 金蝶软件(中国)有限公司 单据录入方法及装置
CN105243365A (zh) * 2015-09-28 2016-01-13 四川长虹电器股份有限公司 一种数据处理方法及数据处理***
CN105243365B (zh) * 2015-09-28 2019-07-16 四川长虹电器股份有限公司 一种数据处理方法及数据处理***
CN105279525B (zh) * 2015-11-19 2018-11-27 浪潮金融信息技术有限公司 一种图像处理的方法及装置
CN105279525A (zh) * 2015-11-19 2016-01-27 浪潮软件集团有限公司 一种图像处理的方法及装置
CN105678612A (zh) * 2015-12-30 2016-06-15 远光软件股份有限公司 移动端原始凭证电子化智能填单***及方法
CN105718928B (zh) * 2016-01-20 2018-12-18 淄博职业学院 一种会计票据处理方法
CN105718928A (zh) * 2016-01-20 2016-06-29 淄博职业学院 一种会计票据处理方法
CN109426814A (zh) * 2017-08-22 2019-03-05 顺丰科技有限公司 一种***图片特定板块的定位、识别方法、***、设备
CN109426814B (zh) * 2017-08-22 2023-02-24 顺丰科技有限公司 一种***图片特定板块的定位、识别方法、***、设备
CN110109907A (zh) * 2017-12-27 2019-08-09 航天信息股份有限公司 一种税务数据的存储、查询方法及装置
CN108446621A (zh) * 2018-03-14 2018-08-24 平安科技(深圳)有限公司 票据识别方法、服务器及计算机可读存储介质
CN110648211A (zh) * 2018-06-07 2020-01-03 埃森哲环球解决方案有限公司 数据验证
CN110648211B (zh) * 2018-06-07 2023-10-03 埃森哲环球解决方案有限公司 数据验证
CN109492641A (zh) * 2018-09-18 2019-03-19 上海延华智能科技(集团)股份有限公司 基于图像识别的能源账单输入方法及***、存储介质、服务器
CN110188714A (zh) * 2019-06-04 2019-08-30 言图科技有限公司 一种在聊天场景下实现财务管理的方法、***及存储介质

Similar Documents

Publication Publication Date Title
CN103488999A (zh) 一种***数据记录方法
AU2017302250B2 (en) Optical character recognition in structured documents
US10140511B2 (en) Building classification and extraction models based on electronic forms
EP3430567B1 (en) Optical character recognition utilizing hashed templates
CN103177128A (zh) 钞票冠字号信息的处理方法和***
US20170206409A1 (en) Cognitive document reader
CN110909123B (zh) 一种数据提取方法、装置、终端设备及存储介质
CN110516664A (zh) 票据识别方法、装置、电子设备及存储介质
CN104123608A (zh) 一种建立记账记录的方法与装置
CN110895696A (zh) 一种图像信息提取方法和装置
CN112434970A (zh) 一种基于智能数据采集的资质数据验证方法、装置
US10200448B2 (en) Optimizing data exchange between client device and server
US20240212380A1 (en) Systems and methods for automatic context-based annotation
CN111462388A (zh) 一种票据检验方法、装置、终端设备及存储介质
CN104966109A (zh) 医疗化验单图像分类方法及装置
CN115171143A (zh) 一种电子***全票面信息提取方法及***
WO2017069741A1 (en) Digitized document classification
CN111797922B (zh) 文本图像分类方法及装置
Manjula et al. Identification and classification of multilingual document using maximized mutual information
CN113806368A (zh) 一种将文档识别并自动建立数据库的***及方法
CN112991037A (zh) 信用证46域解析方法及装置
CN111046750A (zh) 一种票据分类***及其方法
CN115688716A (zh) 表单处理方法、装置、设备及可读存储介质
CN115034876A (zh) 基于ocr识别技术的贷款信息审核方法、装置及计算机设备
CN113869857A (zh) 基于互联网的盾构机生产智能管理***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140101

RJ01 Rejection of invention patent application after publication