CN106489156A - 用于从表征多个文档的图像中提取文档图像的***和方法 - Google Patents

用于从表征多个文档的图像中提取文档图像的***和方法 Download PDF

Info

Publication number
CN106489156A
CN106489156A CN201680001946.7A CN201680001946A CN106489156A CN 106489156 A CN106489156 A CN 106489156A CN 201680001946 A CN201680001946 A CN 201680001946A CN 106489156 A CN106489156 A CN 106489156A
Authority
CN
China
Prior art keywords
file
picture
image
visual identifier
invoice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201680001946.7A
Other languages
English (en)
Inventor
I·萨夫特
N·古兹曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vatbox Ltd
Original Assignee
Vatbox Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vatbox Ltd filed Critical Vatbox Ltd
Publication of CN106489156A publication Critical patent/CN106489156A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/123Tax preparation or submission
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Multimedia (AREA)
  • Development Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Character Input (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Processing Or Creating Images (AREA)

Abstract

提出了一种用于从表征多文档的图像中提取文档图像的***和方法。所述方法包括接收包括多个文档图像的多文档图像,其中每个文档图像与文档相关联;从所述多文档图像中提取多个视觉标识符,其中每个视觉标识符与所述多个文档图像中的一个文档图像相关联;分析所述多个视觉标识符以识别每个文档图像;基于该分析来确定每个文档图像的图像区域;基于它的图像区域提取每个文档图像。

Description

用于从表征多个文档的图像中提取文档图像的***和方法
相关申请的交叉引用
本申请要求2015年2月4日提交的美国临时申请No.62/111,690的权益,该临时申请的内容通过引用并入本文中。
技术领域
本公开总体上涉及分析包含图像的文档,并且更具体地涉及基于包含多文档的图像来生成多个文件。
背景技术
增值税(VAT)或销售税是对商品和服务的附加值进行评估的基础广泛的消费税。特定增值税应用于在给定国家或州内购买或出售的大多数商品和服务。当某人在国外旅行并进行需要支付VAT(或任何适用税)的购买时,该人可能有权获得由于购买而支付的VAT的后续退税。在特定情况下,同样可以退还应用于购买的其他税。进一步地,卖方可以为在某些地点且在特定情况下销售的产品的购买提供回扣。这种购买价格的退税可以按照退税实体制定的程序进行返还。
许多国家的法律和法规允许外国旅客获得某些税收的报销或退税的权利,例如在国外为商品和/或服务支付的VAT。由于这些法律和法规在不同国家有所不同,一个人有资格获得的实际VAT退税的确定通常要求退税的寻求者在国外税法方面拥有大量的知识。此外,旅客可能在无资格获得这样的退税时寻求VAT的退税,从而花费时间和精力在徒劳的努力上。进一步地,VAT退税的可用性可能会因所进行的购买类型和合格的VAT收据的存在而变化。
请求退税的一个程序是在机场身体上接近海关官员,填写表格,并分别记录在访问期间发生的费用的原始收据。该程序应该在检入或登机到下一个目的地之前执行。此外,特别是对于在国外购买的商品,请求退税的程序可能要求付款人向海关官员示出未使用的商品,以核实出口商品与付款人支付VAT的商品相匹配。
由于旅客不熟悉要求退税的特定法律和法规,因此即使旅客不符合资格,他们也可能会提交退税申请。如果旅客最终获知他或她没有资格获得退税,则该程序进一步不必要地浪费时间。因此,有利的是,通过提供一种有效的方式来电子地并且优选地通过因特网来处理VAT退税,以提供一种克服现有技术的缺陷的解决方案。
此外,由于要求退税且特别是VAT退税相关的麻烦,客户可能没有动机去寻求这种退税。特别是对于潜在的大额退税,正确管理的退税平台可能对于节省资金是至关重要的。例如,VAT退税平台对于需要其员工出于商业目的旅行的大型企业可能很重要。由于典型企业产生的大量***,其中许多可能有资格获得VAT退税,企业可能在***的收取和验证时容易出错。
此外,由典型企业产生的大量***最终导致对应于***的多个文件的创建。现有的解决方案通常要求每张***包含在各自的文件中,并且因此需要每张***的单独扫描或其他的捕获方式。这种手动单独扫描浪费时间和资源,并且最终使得过程具有更多的潜在的人为错误。
因此,提供一种克服现有技术的缺陷的解决方案将是有利的。
发明内容
本公开的几个示例实施例的概要如下。提供本概要是为了读者的方便,以提供对这些实施例的基本理解而不是完全地定义本发明的范围。本概要不是所有预期实施例的广泛综述,并且既不旨在标识所有实施例的关键或重要元素,也不旨在描绘任何或所有方面的范围。其唯一目的在于以简化的形式呈现一个或多个实施例的一些概念,作为稍后呈现的更详细描述的前奏。为了方便,在本文中术语“一些实施例”可用于指本公开的单一实施例或者多个实施例。
在本文公开的一些示例性实施例包括用于从表征多个文档的图像中提取文档图像的方法。所述方法包括接收包括多个文档图像的多文档图像,其中每个文档图像与文档相关联;从所述多文档图像中提取多个视觉标识符,其中每个视觉标识符与所述多个文档图像中的一个相关联;分析所述多个视觉标识符以识别每个文档图像;基于所述分析,确定每个文档图像的图像区域;基于其图像区域提取每个文档图像。
在本文公开的一些示例性实施例还包括用于从表征多个文档的图像中提取文档图像的***。所述***包括:处理***;和存储器,所述存储器包含指令,当通过处理单元执行所述指令时,配置所述***以:接收包括多个文档图像的多文档图像,其中每个文档图像与文档相关联;从所述多文档图像中提取多个视觉标识符,其中每个视觉标识符与所述多个文档图像中的一个相关联;分析所述多个视觉标识符以识别每个文档图像;基于所述分析,确定每个文档图像的图像区域;以及基于其图像区域提取每个文档图像。
附图说明
本文所公开的主题会在说明书结束后的权利要求书中特别指出并清楚地声明。结合附图进行以下详细描述,所公开实施例的前述以及其它目标、特征以及优势将变得显而易见。
图1是用于描述各种公开实施例的网络图;
图2是根据一实施例的用于从表征多张***的图像中产生多个***图像的方法流程图;
图3A至3C是根据不同实施例的从表征多张***的图像中提取***图像的方法流程图;
图4A至4E是用于描述不同公开实施例的表征***的图像的示例性屏幕截图。
具体实施方式
重要的是要注意在本文公开的实施例仅是本文的创新教导的许多有利使用的示例。一般而言,本申请说明书中的陈述没有必要对各个要求保护的实施例中的任一个进行限制。此外,一些陈述可能适用于某些发明特征,但不适用其它特征。一般而言,除非另有指明,单数元件可以是以复数形式,反之亦然,这不会失去一般性。在附图中,多个视图中的相同标记指相同部分。
图1示出了用于描述不同公开实施例的示例性和非限制性网络图100。在一实施例中,网络图100包括通信连接到服务器120的网络110、用户设备150、企业设备160、多个web源170-1至170-n(以下分别称为web源170并且共同称为web源170,仅仅出于简化目的)、和数据库180。网络110可以是但不限于无线、蜂窝或有线网络,局域网(LAN)、广域网(WAN)、城域网(MAN)、因特网、万维网(WWW),类似网络及其任何组合。
用户设备150和每个企业设备160可以是但不限于个人电脑(PC)、笔记本电脑、蜂窝电话、智能电话、平板设备、可穿戴计算设备、扫描仪等等。用户设备150可以包括或者通信连接到用来捕获图像的图像传感器155。操作企业设备160的企业可以是但不限制于酒店、商店、服务提供商等等。
在一实施例中,用户设备150捕获包含多张***和/或其他文档的图像(例如,通过图像传感器155)。每张***通常包括潜在可退税购买的付款证明。文档可以是以无组织的形式,即***不需要以特定方式排列、定向或以其它特定方式组织,只要在每个文档的信息(例如,字、符号、数字、字符、形状、矩阵、标签、条形码等等)在多***图像中可见。
用户设备150发送捕获的多***图像到服务器120。服务器120配置为从多***图像提取视觉标识符。视觉标识符可以包括但不限制于文档标识号(例如,***号)、代码(例如,QR码、条形码等)、交易号、商家名称、商家地址、商家标识号、总价格、货币、支付方法(例如,现金、支票、***、借记卡、数字货币等)、日期、产品类型、每个产品的价格等等。
为了此目的,服务器120可以包括或者可以通信连接到识别单元(RU)125。识别单元125配置为执行机器成像处理。识别单元125进一步配置为通过使用一种或多种计算机视觉技术,例如但不限于图像识别、模式识别、信号处理、字符识别和类似的,使得能够识别多***图像中示出的视觉标识符。识别单元125可以包括但不限于光学字符识别单元、图像识别单元以及其组合。
服务器120配置为分析所提取的视觉标识符以识别在多***图像中示出的***图像。所述识别可以基于视觉标识符的阈值,该阈值为基于视觉标识符确定***所需的。视觉标识符阈值可以表示识别多***图像中的***所需的最少视觉标识符。阈值可以包括但不限制于最小数量的视觉标识符、特定视觉标识符、视觉标识符的特定组合等等。例如,用于基于视觉标识符来识别图像中的***的阈值要求可以包括总价格、商家标识符和产品类型。在该例子中,在多***图像中的每张识别的***将包括总价格、商家标识符和产品类型。
在一实施例中,服务器120可以配置为确定是否需要任何视觉标识符,并且如果需要,则检索所需的视觉标识符。所需的视觉标识符可以是预先定义的,使得被识别的每张***将适合于进一步处理。例如,对于增值税(VAT)返还,购买的地点可以是所需的视觉标识符。因此,如果***不包括表明交易地点的视觉标识符,则可以检索与***相关联的地点。
可以从例如企业设备160和/或web源170检索所需的视觉标识符。web源170可以是但不限制于在其中储存关于返还信息的数据的数据库。这样的数据库可以包括,例如VAT信息交换***(VIESs)、税务机关数据库、回扣分享***等等。每个web源170可以由比如但不限于税务机构、VAT退税机构等类似的实体操作。
服务器120配置为基于分析来确定与每个识别的***图像相关联的图像区域。每个图像区域包括其相应***图像的视觉标识符,并且表明多***图像内的***图像的边界。该确定可以包括但不限制于识别***的中心、识别每张***图像的边界等等。在一实施例中,识别每张***图像的边界可以基于多***图像中的干净区域,即捕获的图像中没有文本出现的部分可以识别为***图像的边界。每个图像区域可以是由其边界限定的特定形状,例如矩形(即,典型的***包含矩形区域内的文本)。图像区域可以是通过它们各自的边界限定的相同或不同的形状。
服务器120配置为基于其各自确定的图像区域提取每个识别的***图像。所述提取可以包括为每个***图像创建文件。所述提取还可以包括但不限制于剪切、复制、裁剪每张识别的***图像。通过剪切的提取可以包括从捕获的图像中移除每个***图像,并且为每个移除的***图像生成新文件,使得在提取之后,多***图像不表征任何***。通过复制的提取可以包括为每个***图像生成包括***图像的副本的新文件,使得在提取之后,多***图像仍然包含所有复制的***图像。通过裁剪的提取包括为每个识别的***图像生成包含多***图像副本的文件,并且基于其各自的***图像收缩每个文件,使得每个文件仅包含各自的裁剪的***图像。
服务器120可以配置为将每个提取的***图像单独存储在例如数据库180中。储存在数据库180中的***图像可以随后被访问以用于处理(例如,VAT返还处理)。在一实施例中,服务器120可以进一步配置为自动提交用于任何或所有提取的***图像的VAT返还。VAT返还可以通过例如在转让给共同受让人的美国专利申请No.14/836,230中进一步描述的web源170中的一个提交给退税机构,该申请包含的所有内容通过引用并入本文。
服务器120通常包括耦合到存储器124的处理***122。处理***122可以包括或者是耦合到存储器124的处理器(未示出)或处理器阵列的组件。存储器124包含能够通过处理***122执行的指令。指令在通过处理***122执行时,致使处理***122执行本文所述的各种功能。所述一个或多个处理器可以使用通用微处理器、多核处理器、微控制器、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、可编程逻辑器件(PLD)、控制器、状态机、门控逻辑、离散硬件组件、专用硬件有限状态机或任何可执行信息的计算或其它操纵的其它合适实体的任意组合。
处理***122还可以包括用于储存软件的机器可读介质。软件应被广泛地解释为指任何类型的指令,无论是指软件、固件、中间件、微代码、硬件描述语言还是其他。指令可以包括代码(例如,以源代码格式、二进制代码格式、可执行代码格式或任何其他合适的代码格式)。指令在通过一个或多个处理器执行时,致使处理***执行本文所述的各种功能。
应当注意,上文关于图1所描述的实施例是关于单个用户设备150和单个企业设备160讨论的,这仅出于简化目的而不限制各个公开实施例。在不脱离本公开的范围的情况下,可以使用多个用户设备150和/或企业设备160。
图2是根据一实施例的用于基于多***图像生成多个***图像文件的方法的示例性和非限制性流程图200。在一实施例中,该方法可以通过服务器(例如,服务器120)执行。
在S210中,接收表征多张***的图像。多***图像中的***可能是无组织的,使得它们不适于立即处理。
在图4A中可以看到示例性且非限制性的多***图像,图4A示出示例性且非限制性的屏幕截图400A,屏幕截图400A示出包括多张***的多***图像410。所述***是无组织的,使得一些***倒置、旋转和定位在多***图像410内的随机部分。每张***包括与商品或服务的购买相关的信息。
在S220中,从多***图像提取视觉标识符。每个视觉标识符表明与多***图像中的***相关的信息。视觉标识符可以包括但不限制于文档标识号(例如,***号)、代码(例如,QR码、条形码等)、交易号、商家名称、商家地址、商家标识号、总价格、货币、支付方法(例如,现金、支票、***、借记卡、数字货币等)、日期、产品类型、每个产品的价格等等。可以基于捕获多***图像的实体类型来识别阈值视觉标识符要求(例如,多个视觉标识符或特定组的视觉标识符)。
在S230中,分析所提取的视觉标识符。该分析可以产生与多***图像相关联的元数据的识别。这样的元数据可以包括但不限于多***图像中的多个***图像、表明可经由一个或多个存储单元(例如,企业设备160或web源170)获得的***图像的指针数据、交易的购买者,等等。
在S240中,基于分析来确定多***图像中表征的***图像的图像区域。在一实施例中,所述确定可以包括识别在多***图像中示出的每个***的边界。***的图像区域可以被定义为包含在***边界内的区域。
示例性确定的图像区域可以在图4B中看到,图4B示出了示例性且非限制性屏幕截图400B,所述屏幕截图400B示出了包括多个***的多***图像410,其中每个***的***图像通过在边界420-1直到420-9内的图像区域确定(在下文中单独地称为边界420并且统称为边界420,仅出于简化的目的)。在示例性屏幕截图400B中,每个边界420是矩形的并且占据围绕每个***的无文本边框。
在S250中,从其图像区域的各自多***图像提取***图像。提取可以包括为***图像生成新文件,并且可以进一步包括在捕获的图像中剪切、裁剪和/或复制***图像。用于从多***图像提取***图像的示例性方法在下文中对应于图3A至图3C进一步进行描述。
可以在图4C中看到通过剪切从多***图像提取***图像,图4C示出了示例性且非限制性的屏幕截图400C,屏幕截图400C示出了包括具有多张***的多***图像410,其中***图像通过边界420限定。在示例性屏幕截图400C中,已经从捕获的图像中剪切通过边界420-7包围的***图像425-7。如在图4E所示的,可以从捕获的图像进一步剪切额外的***图像,直到在多***图像中识别的所有***图像已经被移除。
图4D示出示例性且非限制性屏幕截图400D,所述屏幕截图400D示出剪切的***图像425-7。可以基于剪切生成仅包括剪切的***图像425-7的新文件。
在可选的S260中,提取的***图像可以作为文件储存在例如数据库(例如,数据库180)中。储存的***图像可以随后进一步处理。例如,可以分析储存的***图像的增值税(VAT)返还资格和/或发送给退税机构。
在S270中,确定是否要从多***图像提取额外的***图像,并且如果是,则继续执行S210;否则,终止执行。
在图4E中可以看到从多***图像中提取额外的***图像,图4E示出了示例性和非限制性屏幕截图400E,所述示例性和非限制性屏幕截图400E示出了包括具有多张***的多***图像410,其中***图像通过边界420限定。在示例性屏幕截图400E中,除了由边界420-7包围的***图像425-7之外,还从多***图像剪切由边界420-9包围的***图像425-9。因此,额外的剪切将去除由边界420-1至420-6和420-8包围的每个***图像,直到多***图像不包含***图像。
图3A示出根据一实施例的用于通过剪切从多***图像提取***图像的方法的示例性且非限制性流程图S250A。
在S310A中,基于其图像区域识别在多***图像中表征的***图像。在S320A中,从多***图像剪切识别的***图像。从捕获的图像中移除剪切的图像,使得其不再在多***图像中表征。在S330A中,生成包括剪切的***图像的新文件。在S340A中,生成的文件可以储存在例如数据库中。
图3B示出根据一实施例的用于通过裁剪从多***文件提取***图像的方法的示例性且非限制性流程图S250B。
在S310B中,基于其图像区域识别在多***图像中表征的***图像。在S320B中,生成包括多***图像的文件。在S330B中,新文件相应于识别的***图像进行裁剪。所述裁剪可以包括缩小生成的文件的大小,使得裁剪的文件仅包括***图像。在S340B中,裁剪的新文件可以储存在例如数据库中。
图3C示出根据一实施例的用于通过复制从多***文件提取***图像的方法的示例性且非限制性流程图S250C。
在S310C中,基于其图像区域识别在多***图像中表征的***图像。在S320C中,从多***图像复制识别的***图像。在S330C中,生成包括复制的***图像的文件。在S340C中,生成的文件可以储存在例如数据库中。
应当注意,上文描述的实施例针对表征多***的图像进行讨论,仅仅出于简化目的而不限制在所公开的实施例上。在不脱离本公开的范围的情况下,可以使用表征其他文档的图像。还应当注意,根据所公开的实施例,可以利用除了与VAT返还有关的视觉标识符之外的视觉标识符来识别在图像内捕获的文档。还应当注意,在不脱离本公开的范围的情况下,可以捕获分析的图像并发送(例如,发送到服务器120)以进行***图像提取,或者可以从数据库中检索分析的图像。
本文公开的多个实施例,可以通过硬件、固件、软件、或者上述任意组合实现。此外,软件优选在程序存储单元或者计算机可读介质上作为有形实施的应用程序执行,所述计算机可读介质由部件或者某些设备和/或设备组合构成。该应用程序可以上传至包括任意合适架构的机器上,并由其执行。优选地,所述机器在具有比如一个或多个中央处理单元(“CPU”)、存储器和输入/输出接口的硬件的计算机平台上执行。计算机平台还包括操作***和微指令代码。本文描述的多个过程和功能可能是微指令的一部分或者应用程序的一部分、或者是上述组合,不管这些计算机或者处理器是否明确示出,都能够通过CPU执行。此外,各种其它***单元可以连接到计算机平台,例如附加数据存储单元和打印单元。进一步地,非暂时性计算机可读介质是除了暂时传播信号之外的任何计算机可读介质。
本文所述的所有示例和条件语言旨在用于教导目的,以帮助读者理解所公开的实施例的原理和发明人为促进本领域所贡献的概念,并且应当解释为不对此类具体引用的实例和条件做出限制。此外,本文叙述的公开的实施例的原理、方面和实施例以及其具体示例的所有陈述旨在包括其结构和功能等同物。另外,这样的等同物旨在包括当前已知的等同物以及将来开发的等同物,即,开发的执行相同功能的任何元件,而不管结构如何。

Claims (19)

1.一种用于从表征多个文档的图像中提取文档图像的方法,包括:
接收包含多个文档图像的多文档图像,其中每个文档图像与文档相关联;
从所述多文档图像中提取多个视觉标识符,其中每个视觉标识符与所述多个文档图像中的一个文档图像相关联;
分析所述多个视觉标识符以识别每个文档图像;
基于该分析来确定每个文档图像的图像区域;
基于其图像区域提取每个文档图像。
2.根据权利要求1所述的方法,其中,分析所述多个视觉标识符进一步包括:
执行至少一个机器成像过程以识别与每个视觉标识符相关联的元数据。
3.根据权利要求1所述的方法,其中,确定每个图像区域进一步包括:
基于所述分析,为每个文档图像识别边界,所述边界包括所述文档图像的所有视觉标识符,其中所述文档的图像区域由所述边界限定。
4.根据权利要求3所述的方法,其中,基于所述多***图像中没有出现文本的部分来识别每个边界。
5.根据权利要求1所述的方法,进一步包括:
生成多个文件,每个文件包括所提取的文档图像中的一个。
6.根据权利要求1所述的方法,其中,提取每个文档图像进一步包括以下操作中的至少一个:剪切所述文档图像、复制所述文档图像、以及裁剪所述文档图像。
7.根据权利要求1所述的方法,其中,基于视觉标识符阈值来识别每个文档图像,其中,所述视觉标识符阈值是以下中的任一种:多个视觉标识符、特定视觉标识符和视觉标识符的组合。
8.根据权利要求7所述的方法,进一步包括:
为每个文档图像确定是否有尚未提取的任何所需的视觉标识符;和
在确定有至少一个所需视觉标识符尚未提取时,检索所述至少一个所需视觉标识符。
9.根据权利要求8所述的方法,进一步包括:
基于所述视觉标识符为每个文档图像确定潜在增值税(VAT)退税的资格。
10.一种计算机可读介质,在其上储存用于使一个或多个处理单元执行根据权利要求1所述的方法的指令。
11.一种用于从表征多个文档的图像中提取文档图像的***,包括:
处理***;和
存储器,所述存储器包含指令,当通过所述处理单元执行所述指令时,将所述***配置为:
接收包含多个文档图像的多文档图像,其中每个文档图像与文档相关联;
从所述多文档图像中提取多个视觉标识符,其中每个视觉标识符与所述多个文档图像中的一个文档图像相关联;
分析所述多个视觉标识符以识别每个文档图像;
基于该分析来确定每个文档图像的图像区域;并
基于其图像区域提取每个文档图像。
12.根据权利要求11所述的***,其中,所述***进一步配置为:
执行至少一个机器成像过程以识别与每个视觉标识符相关联的元数据。
13.根据权利要求11所述的***,其中,所述***进一步配置为:
基于所述分析,为每个文档图像识别边界,所述边界包括所述文档图像的所有视觉标识符,其中所述文档的图像区域由所述边界限定。
14.根据权利要求13所述的***,其中,基于所述多***图像中没有出现文本的部分来识别每个边界。
15.根据权利要求11所述的***,其中,所述***进一步配置为:
生成多个文件,每个文件包括所提取的文档图像中的一个。
16.根据权利要求11所述的***,其中,所述***进一步配置为执行以下操作中的至少一个:剪切所述文档图像、复制所述文档图像、以及裁剪所述文档图像。
17.根据权利要求11所述的***,其中,基于视觉标识符阈值来识别每个文档图像,其中,所述视觉标识符阈值是以下中的任一种:多个视觉标识符、特定视觉标识符和视觉标识符的组合。
18.根据权利要求17所述的***,其中所述***进一步配置为:
为每个文档图像确定是否有尚未提取的任何所需的视觉标识符;以及
在确定有至少一个所需视觉标识符尚未提取时,检索所述至少一个所需视觉标识符。
19.根据权利要求18所述的***,其中所述***进一步配置为:
基于所述视觉标识符为每个文档图像确定潜在增值税(VAT)退税的资格。
CN201680001946.7A 2015-02-04 2016-02-02 用于从表征多个文档的图像中提取文档图像的***和方法 Pending CN106489156A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562111690P 2015-02-04 2015-02-04
US62/111,690 2015-02-04
PCT/US2016/016104 WO2016126665A1 (en) 2015-02-04 2016-02-02 A system and methods for extracting document images from images featuring multiple documents

Publications (1)

Publication Number Publication Date
CN106489156A true CN106489156A (zh) 2017-03-08

Family

ID=56554532

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680001946.7A Pending CN106489156A (zh) 2015-02-04 2016-02-02 用于从表征多个文档的图像中提取文档图像的***和方法

Country Status (5)

Country Link
US (1) US10621676B2 (zh)
EP (1) EP3149659A4 (zh)
JP (1) JP2018506087A (zh)
CN (1) CN106489156A (zh)
WO (1) WO2016126665A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109146011A (zh) * 2017-06-16 2019-01-04 北京京华印象科技文化发展有限公司 一种信息分类处理方法与装置
CN109146009A (zh) * 2017-06-16 2019-01-04 北京京华印象科技文化发展有限公司 一种基于标记识别的信息处理方法、装置及终端
CN109146010A (zh) * 2017-06-16 2019-01-04 北京京华印象科技文化发展有限公司 一种电子信息自动化处理方法与***
CN109740548A (zh) * 2019-01-08 2019-05-10 北京易道博识科技有限公司 一种报销票据图像分割方法及***
CN111414111A (zh) * 2019-01-04 2020-07-14 珠海金山办公软件有限公司 一种页面裁剪方法及装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3526684A4 (en) * 2017-05-23 2020-07-08 Vatbox, Ltd. SYSTEM AND METHOD FOR IDENTIFYING MISSING DATA ELEMENTS IN ELECTRONIC DOCUMENTS
US11030450B2 (en) * 2018-05-31 2021-06-08 Vatbox, Ltd. System and method for determining originality of computer-generated images
EP4198913A1 (en) * 2021-12-16 2023-06-21 Amadeus S.A.S. Method and device for scanning multiple documents for further processing

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1673995A (zh) * 2004-03-24 2005-09-28 微软公司 从扫描文档填充电子表格的方法和装置
CN101539947A (zh) * 2008-03-17 2009-09-23 株式会社理光 用于存储具有部分图像的文档的信息处理装置
US20090274374A1 (en) * 2008-05-02 2009-11-05 Hitoshi Hirohata Method for matching images, image matching device, image data output apparatus, and recording medium
CN101820489A (zh) * 2009-02-27 2010-09-01 佳能株式会社 图像处理设备及图像处理方法
CN102667764A (zh) * 2009-08-07 2012-09-12 谷歌公司 用于为视觉查询的多个区域展示搜索结果的用户接口
CN102741838A (zh) * 2009-10-02 2012-10-17 A·穆苏卢里 块分割、识别与索引视觉元素及搜索文档的***与方法

Family Cites Families (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5606609A (en) 1994-09-19 1997-02-25 Scientific-Atlanta Electronic document verification system and method
US5903876A (en) 1997-11-21 1999-05-11 Va-T-En, L.L.C., A Limited Method of refunding value added tax
US7215773B1 (en) 1998-10-14 2007-05-08 Certicom.Corp. Key validation scheme
US20020091671A1 (en) 2000-11-23 2002-07-11 Andreas Prokoph Method and system for data retrieval in large collections of data
US20030163778A1 (en) 2002-02-28 2003-08-28 Michelle Shores System and method for improved validation for claims compliance
US7818657B1 (en) 2002-04-01 2010-10-19 Fannie Mae Electronic document for mortgage transactions
EP1359523A1 (en) 2002-05-02 2003-11-05 Accenture Global Services GmbH A tax transaction system
US20040010451A1 (en) 2002-07-12 2004-01-15 Romano Aaron A. Method and system for finalizing specific processes through a dynamic system
US20050004891A1 (en) 2002-08-12 2005-01-06 Mahoney John J. Methods and systems for categorizing and indexing human-readable data
US7519607B2 (en) 2002-08-14 2009-04-14 Anderson Iv Robert Computer-based system and method for generating, classifying, searching, and analyzing standardized text templates and deviations from standardized text templates
US20040068452A1 (en) 2002-10-02 2004-04-08 Ina Ullrich Computer-implemented method and system for determining and reporting VAT information and amounts for business transactions
SE0300692L (sv) 2003-03-12 2004-09-13 Global Refund Holdings Ab System för hantering av återbäring av mervärdesskatt
JP2004280274A (ja) * 2003-03-13 2004-10-07 Toshiba Corp 情報読み取り装置、方法およびプログラム
US20050021410A1 (en) 2003-06-26 2005-01-27 Global Refund Holding Ab System for handling refund of value-added tax
US7827079B2 (en) 2003-06-30 2010-11-02 Ebay Inc. Method and system for assessing and reporting VAT charges for network-based marketplace services
SG111251A1 (en) 2003-10-31 2005-05-30 Global Refund Holdings Ab System for handling refunding of value-added tax
US7894670B2 (en) 2004-04-01 2011-02-22 Exbiblio B.V. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US8065611B1 (en) 2004-06-30 2011-11-22 Google Inc. Method and system for mining image searches to associate images with concepts
US7434058B2 (en) 2004-06-07 2008-10-07 Reconnex Corporation Generating signatures over a document
US8762191B2 (en) 2004-07-02 2014-06-24 Goldman, Sachs & Co. Systems, methods, apparatus, and schema for storing, managing and retrieving information
US8326775B2 (en) 2005-10-26 2012-12-04 Cortica Ltd. Signature generation for multimedia deep-content-classification by a large-scale matching system and method thereof
WO2007117334A2 (en) 2006-01-03 2007-10-18 Kyos Systems Inc. Document analysis system for integration of paper records into a searchable electronic database
US20070217692A1 (en) 2006-03-17 2007-09-20 Data Trace Information Services, Llc Property record document data verification systems and methods
US20080079979A1 (en) 2006-09-29 2008-04-03 David Lowell Holt System and method for securing a document
JP4388545B2 (ja) * 2006-12-27 2009-12-24 キヤノンソフトウェア株式会社 画像処理装置及び方法、並びにプログラム
US8009921B2 (en) * 2008-02-19 2011-08-30 Xerox Corporation Context dependent intelligent thumbnail images
US20100161616A1 (en) 2008-12-16 2010-06-24 Carol Mitchell Systems and methods for coupling structured content with unstructured content
US8774516B2 (en) 2009-02-10 2014-07-08 Kofax, Inc. Systems, methods and computer program products for determining document validity
GB2471072A (en) 2009-06-12 2010-12-22 Provenance Information Assurance Ltd Electronic document verification system
US8200642B2 (en) 2009-06-23 2012-06-12 Maze Gary R System and method for managing electronic documents in a litigation context
US20110016043A1 (en) * 2009-07-20 2011-01-20 Barbara Dornseif Account transaction value added tax reimbursement
US9158833B2 (en) 2009-11-02 2015-10-13 Harry Urbschat System and method for obtaining document information
US8832853B2 (en) 2009-12-07 2014-09-09 Dst Technologies, Inc. Managed virtual point to point communication service having verified directory, secure transmission and controlled delivery
US9002838B2 (en) 2009-12-17 2015-04-07 Wausau Financial Systems, Inc. Distributed capture system for use with a legacy enterprise content management system
US20110258170A1 (en) 2010-01-15 2011-10-20 Duggan Matthew Systems and methods for automatically correcting data extracted from electronic documents using known constraints for semantics of extracted data elements
US20120078768A1 (en) 2010-09-24 2012-03-29 King Technology, Inc. Method and system for managing commodity transactions
US20120078682A1 (en) * 2010-09-29 2012-03-29 The Npd Group, Inc. Consumer receipt information methodologies and systems
US8386394B1 (en) 2011-04-04 2013-02-26 Google Inc. Verifying that a purchasing request is legitimate
US9846902B2 (en) 2011-07-19 2017-12-19 Slice Technologies, Inc. Augmented aggregation of emailed product order and shipping information
US8467606B2 (en) * 2011-08-25 2013-06-18 Eastman Kodak Company Method for segmenting a composite image
US8438089B1 (en) 2012-02-10 2013-05-07 Nice Systems Ltd. Method and apparatus for transaction verification
US8890978B1 (en) 2012-03-27 2014-11-18 Intuit Inc. Accurately extracting information using multiple images
US20140006234A1 (en) 2012-06-28 2014-01-02 Sap Ag Consistent interface for customer project expense list and deviating tax calculation rule
US20140108210A1 (en) * 2012-10-16 2014-04-17 American Express Travel Related Services Company, Inc. Systems and Methods for Expense Management
US20140207634A1 (en) 2013-01-19 2014-07-24 Kevin Edmonds Refund purchase system
GB2530653A (en) * 2013-02-27 2016-03-30 Vatbox Ltd A web-based system and methods thereof for value-added tax reclaim processing
US20150106247A1 (en) 2013-02-27 2015-04-16 Isaac SAFT System and method for pursuing a value-added tax (vat) reclaim through a mobile technology platform
US20150019409A1 (en) 2013-07-11 2015-01-15 Anvesh Yah Vagiri Systems and methods for location-based transaction information capturing
US9495347B2 (en) 2013-07-16 2016-11-15 Recommind, Inc. Systems and methods for extracting table information from documents
US10140257B2 (en) 2013-08-02 2018-11-27 Symbol Technologies, Llc Method and apparatus for capturing and processing content from context sensitive documents on a mobile device
US20170308517A1 (en) 2013-09-11 2017-10-26 Google Inc. Automatic generation of templates for parsing electronic documents
GB2523355A (en) 2014-02-21 2015-08-26 Mastercard International Inc System and method for recovering refundable taxes
GB2523596A (en) 2014-02-28 2015-09-02 Mastercard International Inc System and method for recovering refundable taxes
US10340038B2 (en) 2014-05-13 2019-07-02 Nant Holdings Ip, Llc Healthcare transaction validation via blockchain, systems and methods
US20150356174A1 (en) 2014-06-06 2015-12-10 Wipro Limited System and methods for capturing and analyzing documents to identify ideas in the documents
US9785693B2 (en) 2014-06-30 2017-10-10 Microsoft Technology Licensing, Llc Intelligent conflict detection and semantic expression of document edits
US10019740B2 (en) 2015-10-07 2018-07-10 Way2Vat Ltd. System and methods of an expense management system based upon business document analysis
US10127209B2 (en) 2015-11-24 2018-11-13 Bank Of America Corporation Transforming unstructured documents
US10445659B2 (en) 2016-06-03 2019-10-15 International Business Machines Corporation Machine learning for determining confidence for reclamation of storage volumes
EP3526759A4 (en) 2017-01-12 2020-04-01 Vatbox, Ltd. ELECTRONIC DOCUMENT NOTIFICATION GENERATION SYSTEM AND METHOD
EP3526684A4 (en) 2017-05-23 2020-07-08 Vatbox, Ltd. SYSTEM AND METHOD FOR IDENTIFYING MISSING DATA ELEMENTS IN ELECTRONIC DOCUMENTS
WO2019157029A1 (en) 2018-02-06 2019-08-15 Vatbox, Ltd. System and method for classifying images of an evidence

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1673995A (zh) * 2004-03-24 2005-09-28 微软公司 从扫描文档填充电子表格的方法和装置
CN101539947A (zh) * 2008-03-17 2009-09-23 株式会社理光 用于存储具有部分图像的文档的信息处理装置
US20090274374A1 (en) * 2008-05-02 2009-11-05 Hitoshi Hirohata Method for matching images, image matching device, image data output apparatus, and recording medium
CN101820489A (zh) * 2009-02-27 2010-09-01 佳能株式会社 图像处理设备及图像处理方法
CN102667764A (zh) * 2009-08-07 2012-09-12 谷歌公司 用于为视觉查询的多个区域展示搜索结果的用户接口
CN102741838A (zh) * 2009-10-02 2012-10-17 A·穆苏卢里 块分割、识别与索引视觉元素及搜索文档的***与方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109146011A (zh) * 2017-06-16 2019-01-04 北京京华印象科技文化发展有限公司 一种信息分类处理方法与装置
CN109146009A (zh) * 2017-06-16 2019-01-04 北京京华印象科技文化发展有限公司 一种基于标记识别的信息处理方法、装置及终端
CN109146010A (zh) * 2017-06-16 2019-01-04 北京京华印象科技文化发展有限公司 一种电子信息自动化处理方法与***
CN109146009B (zh) * 2017-06-16 2021-12-10 北京京华印象科技文化发展有限公司 一种基于标记识别的信息处理方法、装置及终端
CN109146011B (zh) * 2017-06-16 2021-12-21 北京京华印象科技文化发展有限公司 一种信息分类处理方法与装置
CN109146010B (zh) * 2017-06-16 2021-12-21 北京京华印象科技文化发展有限公司 一种电子信息自动化处理方法与***
CN111414111A (zh) * 2019-01-04 2020-07-14 珠海金山办公软件有限公司 一种页面裁剪方法及装置
CN109740548A (zh) * 2019-01-08 2019-05-10 北京易道博识科技有限公司 一种报销票据图像分割方法及***

Also Published As

Publication number Publication date
WO2016126665A1 (en) 2016-08-11
EP3149659A4 (en) 2018-01-10
JP2018506087A (ja) 2018-03-01
US10621676B2 (en) 2020-04-14
US20160225101A1 (en) 2016-08-04
EP3149659A1 (en) 2017-04-05

Similar Documents

Publication Publication Date Title
CN106489156A (zh) 用于从表征多个文档的图像中提取文档图像的***和方法
US10296799B2 (en) Extracting card identification data
CN105247541B (zh) 改进的从卡的数字图像中提取金融账户信息
US20170344825A1 (en) Comparing extracted card data using continuous scanning
US9058580B1 (en) Systems and methods for identification document processing and business workflow integration
CN109417547B (zh) 图像验证的自动化
CN105431867A (zh) 使用卡美术来提取卡数据
US10108942B2 (en) Check data lift for online accounts
US20150363893A1 (en) Web-based system and methods thereof for value-added tax reclaim processing
CN105874471A (zh) 卡ocr图像的客户端侧过滤
US11928878B2 (en) System and method for domain aware document classification and information extraction from consumer documents
US9436937B1 (en) Highlight-based bill processing
WO2020173068A1 (zh) 票据识别方法、装置、电子设备和计算机可读存储介质
US10185940B2 (en) Image capture transaction payment
US20170185832A1 (en) System and method for verifying extraction of multiple document images from an electronic document
CN112381702B (zh) 一种图像隐私处理方法、计算设备及存储介质
JP6825312B2 (ja) 免税処理装置、免税処理方法およびプログラム
US20180137578A1 (en) System and method for prediction of deduction claim success based on an analysis of electronic documents
KR102645612B1 (ko) 데이터 가치 산출 방법과 시스템
WO2017131932A1 (en) System and method for verifying extraction of multiple document images from an electronic document
US20160196618A1 (en) System and method for automatically generating reclaim data respective of purchases
TW201911156A (zh) 自動智慧化帳務系統
US20200118122A1 (en) Techniques for completing missing and obscured transaction data items
US20180260622A1 (en) System and method identification of items in electronic documents
Kinnunen et al. Smart cards in public transportation: spatial platforms, diffusion and externality creation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170308