CN106022364A - 一种新的票据分类方法 - Google Patents

一种新的票据分类方法 Download PDF

Info

Publication number
CN106022364A
CN106022364A CN201610320215.0A CN201610320215A CN106022364A CN 106022364 A CN106022364 A CN 106022364A CN 201610320215 A CN201610320215 A CN 201610320215A CN 106022364 A CN106022364 A CN 106022364A
Authority
CN
China
Prior art keywords
bill
comparison
note
user
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610320215.0A
Other languages
English (en)
Other versions
CN106022364B (zh
Inventor
邓昌顺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201610320215.0A priority Critical patent/CN106022364B/zh
Publication of CN106022364A publication Critical patent/CN106022364A/zh
Application granted granted Critical
Publication of CN106022364B publication Critical patent/CN106022364B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/245Classification techniques relating to the decision surface
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及票据的分类方法一种新的票据分类方法,属于计算机应用技术领域。本发明包括:步骤一初始化票据特征库;步骤二对上传票据进行标签处理,实现票据对比;步骤三根据步骤二的票据比对的结果,对于不同的票据比对结果进行加权与逻辑处理,如果无法找到对应的票据分类,则展示已有的票据标签提示用户选择或者自建新的标签,从而完成对票据的分类处理;步骤四完成步骤三后,处理完成后的票据特征存入票据特征库供未来其它票据的比对;进入步骤一。本发明中票据比对的模板或者样本库是逐步自动增加的,而传统的样本库是固定的。在样本库中,增加了用户特征的标签,即同一个客户的票据相对于样本库中的其它样本来说,更具有参考性。

Description

一种新的票据分类方法
技术领域
本发明涉及票据的分类方法一种新的票据分类方法,属于计算机应用技术领域。
背景技术
在现有对于相关票据(涵盖各类***、超市小票等各类票据)的处理中,票据的分类是极其复杂与困难的。常用的方法是根据已有的票据的票面特征,并且对相应的票面特征进行标识后(如票据的大小,尺寸,颜色,甚至票据的内容等),对于比对的票据进行标识的匹配检查。这个过程需要专业的人员来对相应的票据进行技术性的分类与差异标识,同时要求原有的票据质量要非常好,人员要有相应的图形图像处理技能,分类的准确率非常低,同时难度大。对于新的票据需要专业的人员进行人工的干涉,比对的样本数量有限。
发明内容
为了克服上述的不足,本发明提出了一种新的票据分类方法。
本发明的技术方案如下:
一种新的票据分类方法,包括如下步骤,
①初始化票据特征库;
②对上传票据进行标签处理,实现票据对比;
③根据②的票据比对的结果,对于不同的票据比对结果进行加权与逻辑处理,如果无法找到对应的票据分类,则展示已有的票据标签提示用户选择或者自建新的标签,从而完成对票据的分类处理;
④完成③后,处理完成后的票据特征存入票据特征库供未来其它票据的比对;进入①。
一种新的票据分类方法,③中所述的不同的票据比对结果进行加权与逻辑处理步骤包括:
①查找用户是否已经上传过类似的票据;
②比对已有的票据特征库,查找是否有类似票据;
③比对用户的关联人群,查找是否有类似票据;
④比对相关区域其它的用户,查找是否有类似票据;
所述的②-④至少选择一项。
一种新的票据分类方法,②中所述的上传票据进行标签处理的步骤如下:
①查找用户是否已经上传过类似的票据;
②比对已有的票据特征库,查找是否有类似票据;
③比对用户的关联人群,查找是否有类似票据;
④比对相关区域其它的用户,查找是否有类似票据;
所述的②-④至少选择一项。
新的票据分类方法,②中所述的上传票据包括照片、拍照以及电子版的票据。
新的票据分类方法,①中初始化票据特征库包括对于相关的票据进行标签,标签的属性包括用户特征、地域的特征、社交关系的特征;***自动对该票据的标签进行特征提取,包括如颜色和尺寸大小,对票据进行标识处理。相关的票据进行标签处理中同一个票据可以标签为多个种类。
本发明的有益效果如下:
1.本发明中票据比对的模板或者样本库是逐步自动增加的,而传统的样本库是固定的。
2.在样本库中,增加了用户特征的标签,即同一个客户的票据相对于样本库中的其它样本来说,更具有参考性。即考虑了人的因素。
3.在样本库中,增加了社交关系的特征标签,即相识的人员的票据更为相识,作为样本更为有效。
4.在样本库中增加了地域特征,即同一个区域,票据种类相似度更大。
5.***能够自动学习用户在比对过程中产生的新的票据,并将该票据做为样本库而存在,从而可以保证样本库自增长,完善样本特征。自动学习可以保证分类的准确性。
6.在样本分类中,我们采用了标签的技术,即同一个票据,可以标签为多个种类,从而为未来的应用做了准备。举例:如出租车票,在***中可以标记为出租车费,交通费,车船费,差旅费等。
7.对于标签的个性化处理;即***可以自动学习每个用户对于标签的个性化处理,从而保证对于票据的处理更符合用户的需求。比如对于出租车票,A用户标记为交通费、出租车费,B用户标记为差旅费、出租车费,***可以根据用户习惯的不同,自动来完成相应的标签工作。
8.与手机的应用结合,可以用手机拍照快速完成。
9.利用社交关系参与技术分类。
附图说明
图1是本发明的流程图;
图2是本发明提到的不同的票据比对结果进行加权与逻辑处理和上传票据进行标签处理的流程图。
具体实施方式
下面结合附图对本发明做进一步说明.
如图1所示:一种新的票据分类方法,包括如下步骤,
①初始化票据特征库;
②对上传票据进行标签处理,实现票据对比;
③根据②的票据比对的结果,对于不同的票据比对结果进行加权与逻辑处理,如果无法找到对应的票据分类,则展示已有的票据标签提示用户选择或者自建新的标签,从而完成对票据的分类处理;
④完成③后,处理完成后的票据特征存入票据特征库供未来其它票据的比对;进入①。
如图2所示:上述新的票据分类方法,③中所述的不同的票据比对结果进行加权与逻辑处理步骤包括:
①查找用户是否已经上传过类似的票据;
②比对已有的票据特征库,查找是否有类似票据;
③比对用户的关联人群,查找是否有类似票据;
④比对相关区域其它的用户,查找是否有类似票据;
所述的②-④至少选择一项。
上传票据包括照片、拍照以及电子版的票据。
如图2所示:新的票据分类方法②中所述的上传票据进行标签处理的步骤如下:
①查找用户是否已经上传过类似的票据;
②比对已有的票据特征库,查找是否有类似票据;
③比对用户的关联人群,查找是否有类似票据;
④比对相关区域其它的用户,查找是否有类似票据;
所述的②-④至少选择一项。
初始化票据特征库包括对于相关的票据进行标签,***自动对该票据的标签进行特征提取,包括如颜色,尺寸大小,用户特征;对票据进行标识处理;标签的属性包括用户特征、地域的特征、社交关系的特征。
相关的票据进行标签处理中同一个票据可以标签为多个种类。按照现有***的分类:车票、办公用费;或者其他的按照实际需求制定的分类方法。
本发明中票据比对的模板或者样本库是逐步自动增加的,而传统的样本库是固定的。在样本库中,增加了用户特征的标签,即同一个客户的票据相对于样本库中的其它样本来说,更具有参考性。即考虑了人的因素;在样本库中,还增加了社交关系的特征标签,即相识的人员的票据更为相识,作为样本更为有效。在样本库中增加了地域的特征,即同一个区域,票据种类相似度更大。***能够自动学习用户在比对过程中产生的新的票据,并将该票据做为样本库而存在,从而可以保证样本库自增长,完善样本特征。自动学习可以保证分类的准确性。在样本分类中,采用了标签的技术,即同一个票据,可以标签为多个种类,从而为未来的应用做了准备。举例:如出租车票,在***中可以标记为出租车费,交通费,车船费,差旅费等。对于标签的个性化处理,即***可以自动学习每个用户对于标签的个性化处理,从而保证对于票据的处理更符合用户的需求;比如对于出租车票,A用户标记为交通费、出租车费,B用户标记为差旅费、出租车费,***可以根据用户习惯的不同,自动来完成相应的标签工作。本发明还可以与手机的应用结合,可以用手机拍照快速完成。并利用社交关系参与技术的分类。
对于本领域的普通技术人员而言,具体实施例只是对本发明进行了示例性描述,显然本发明具体实现并不受上述方式的限制,只要采用了本发明的方法构思和技术方案进行的各种非实质性的改进,或未经改进将本发明的构思和技术方案直接应用于其它场合的,均在本发明的保护范围之内。

Claims (6)

1.一种新的票据分类方法,其特征在于:包括如下步骤,
①初始化票据特征库;
②对上传票据进行标签处理,实现票据对比;
③根据②的票据比对的结果,对于不同的票据比对结果进行加权与逻辑处理,如果无法找到对应的票据分类,则展示已有的票据标签提示用户选择或者自建新的标签,从而完成对票据的分类处理;
④完成③后,处理完成后的票据特征存入票据特征库供未来其它票据的比对;进入①。
2.根据权利要求1所述的新的票据分类方法,其特征在于:③中所述的不同的票据比对结果进行加权与逻辑处理步骤包括:
①查找用户是否已经上传过类似的票据;
②比对已有的票据特征库,查找是否有类似票据;
③比对用户的关联人群,查找是否有类似票据;
④比对相关区域其它的用户,查找是否有类似票据;
所述的②-④至少选择一项。
3.根据权利要求1所述的新的票据分类方法,其特征在于:②中所述的上传票据进行标签处理的步骤如下:
①查找用户是否已经上传过类似的票据;
②比对已有的票据特征库,查找是否有类似票据;
③比对用户的关联人群,查找是否有类似票据;
④比对相关区域其它的用户,查找是否有类似票据;
所述的②-④至少选择一项。
4.根据权利要求1所述的新的票据分类方法,其特征在于:②中所述的上传票据包括照片、拍照以及电子版的票据。
5.根据权利要求1所述的新的票据分类方法,其特征在于:①中所述初始化票据特征库包括对于相关的票据进行标签,标签的属性包括用户特征、地域的特征、社交关系的特征;***自动对该票据的标签进行特征提取,包括如颜色和尺寸大小。
6.根据权利要求5所述的新的票据分类方法,其特征在于:相关的票据进行标签处理中,同一个票据的标签为多个种类。
CN201610320215.0A 2016-05-13 2016-05-13 一种票据分类方法 Active CN106022364B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610320215.0A CN106022364B (zh) 2016-05-13 2016-05-13 一种票据分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610320215.0A CN106022364B (zh) 2016-05-13 2016-05-13 一种票据分类方法

Publications (2)

Publication Number Publication Date
CN106022364A true CN106022364A (zh) 2016-10-12
CN106022364B CN106022364B (zh) 2019-05-10

Family

ID=57097203

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610320215.0A Active CN106022364B (zh) 2016-05-13 2016-05-13 一种票据分类方法

Country Status (1)

Country Link
CN (1) CN106022364B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108764302A (zh) * 2018-05-08 2018-11-06 中山大学 一种基于颜色特征和词袋特征的票据图像分类方法
CN110070665A (zh) * 2019-04-24 2019-07-30 武汉华创欣网科技有限公司 一种基于深度学习的保险票据分类方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1482572A (zh) * 2003-06-27 2004-03-17 杭州信雅达***工程股份有限公司 票据图象处理装置
US20070202476A1 (en) * 2006-02-03 2007-08-30 Mark Williamson Techniques for inspecting an electronic device
CN102750541A (zh) * 2011-04-22 2012-10-24 北京文通科技有限公司 一种文档图像分类识别方法及装置
CN204576535U (zh) * 2014-12-22 2015-08-19 深圳中兴网信科技有限公司 一种票据识别装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1482572A (zh) * 2003-06-27 2004-03-17 杭州信雅达***工程股份有限公司 票据图象处理装置
US20070202476A1 (en) * 2006-02-03 2007-08-30 Mark Williamson Techniques for inspecting an electronic device
CN102750541A (zh) * 2011-04-22 2012-10-24 北京文通科技有限公司 一种文档图像分类识别方法及装置
CN204576535U (zh) * 2014-12-22 2015-08-19 深圳中兴网信科技有限公司 一种票据识别装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈增照 等: "基于多特征融合的票据分类技术及应用", 《计算机工程与应用》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108764302A (zh) * 2018-05-08 2018-11-06 中山大学 一种基于颜色特征和词袋特征的票据图像分类方法
CN108764302B (zh) * 2018-05-08 2021-09-28 中山大学 一种基于颜色特征和词袋特征的票据图像分类方法
CN110070665A (zh) * 2019-04-24 2019-07-30 武汉华创欣网科技有限公司 一种基于深度学习的保险票据分类方法
CN110070665B (zh) * 2019-04-24 2021-05-28 武汉华创欣网科技有限公司 一种基于深度学习的保险票据分类方法

Also Published As

Publication number Publication date
CN106022364B (zh) 2019-05-10

Similar Documents

Publication Publication Date Title
CN108596277B (zh) 一种车辆身份识别方法、装置和存储介质
JP6503081B2 (ja) 四次元コード及び、四次元コードに基づく画像識別システム及び画像識別方法、四次元コード検索システム及び四次元コード検索方法
US8977047B2 (en) Systems and methods for note content extraction and management using segmented notes
CN104021207B (zh) 一种基于图像的食物信息提供方法
CN109684922B (zh) 一种基于卷积神经网络的多模型对成品菜的识别方法
CN104408449B (zh) 智能移动终端场景文字处理方法
CN106599925A (zh) 一种基于深度学习的植物叶片识别***与方法
CN105677728A (zh) 物体图像识别分类管理方法
CN109948593A (zh) 基于结合全局密度特征的mcnn人群计数方法
CN103578098B (zh) 在商品图片中提取商品主体的方法和装置
CN105913218A (zh) 电子***开具报销方法以及电子***报销信息提取方法
CN110210503B (zh) 一种***识别方法和装置以及设备
CN104268552B (zh) 一种基于部件多边形的精细类别分类方法
CN106920256A (zh) 一种有效的失踪儿童寻找***
CN103793717A (zh) 判断图像主体显著性及训练其分类器的方法和***
CN105320970A (zh) 一种马铃薯病害诊断装置、诊断***及诊断方法
CN108364037A (zh) 识别手写汉字的方法、***及设备
CN103678552A (zh) 基于显著区域特征的遥感影像检索方法及***
CN108984576A (zh) 一种基于卷积神经网络的专利文献获取方法及***
CN110188750A (zh) 一种基于深度学习的自然场景图片文字识别方法
CN104361357A (zh) 基于图片内容分析的相片集分类***及分类方法
CN110084327A (zh) 基于视角自适应深度网络的票据手写数字识别方法及***
CN109213886A (zh) 基于图像分割和模糊模式识别的图像检索方法及***
Gao et al. Remote sensing scene classification with dual attention-aware network
CN106022364A (zh) 一种新的票据分类方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant