CN103679164A - 一种基于移动终端的标志识别处理方法和*** - Google Patents

一种基于移动终端的标志识别处理方法和*** Download PDF

Info

Publication number
CN103679164A
CN103679164A CN201210360774.6A CN201210360774A CN103679164A CN 103679164 A CN103679164 A CN 103679164A CN 201210360774 A CN201210360774 A CN 201210360774A CN 103679164 A CN103679164 A CN 103679164A
Authority
CN
China
Prior art keywords
sign
image
special marking
black
mark
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210360774.6A
Other languages
English (en)
Inventor
张伦
楚汝峰
张春晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201210360774.6A priority Critical patent/CN103679164A/zh
Priority to TW101146907A priority patent/TWI631514B/zh
Priority to US14/021,564 priority patent/US8971620B2/en
Priority to JP2015533106A priority patent/JP5972468B2/ja
Priority to PCT/US2013/059054 priority patent/WO2014046918A1/en
Publication of CN103679164A publication Critical patent/CN103679164A/zh
Priority to US14/602,021 priority patent/US9811749B2/en
Priority to JP2016137232A priority patent/JP2016201126A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/245Aligning, centring, orientation detection or correction of the image by locating a pattern; Special marks for positioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1448Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/184Extraction of features or characteristics of the image by analysing segments intersecting the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

本方案涉及一种基于移动终端的标志识别处理方法和***。该方法包括:通过移动终端获得待处理图像;在获得的所述待处理图像中检测预设于所述标志的固定位置的特殊标记,若匹配上所述特殊标记表明检测到所述特殊标记则定位所述标志;根据定位的所述标志的位置,分割出标志所在区域;识别分割出的所述标志所在区域中的标志的内容。该***包括对应上述方法组成部分以及相应方法步骤的功能。本方案预设标记与表示目标物的标志绑定,基于移动平台在获取的图片或图像上根据该预设的标记定位该标志、并分割出标志区域,再使用图像处理方法识别出商品代码或标志,能够简单、快速、准确、有效地获取标志,实现在移动终端平台上的广告等图像的标志识别处理。

Description

一种基于移动终端的标志识别处理方法和***
技术领域
本申请专利申请涉及移动终端的字符识别领域,尤其涉及一种基于移动终端的标志识别处理方法和***。
背景技术
光学字符识别(OCR,Optical Character Recognition)技术是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将其形状翻译成计算机文字的过程,即对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。也就是通过扫描和摄像等光学输入方式获取纸上的文字图像信息。其能利用各种模式识别算法分析文字形态特征,判断出汉字的标准编码,并按照通用格式存储在文本文件中:通过扫描仪输入后,将文稿形成图像文件,做图像处理;接着先对版面划分(如进行版面分析:版面理解、字切分、归一化等)以便分开不同部分进行分别按次序处理;再对文字阅读(如图形文字“汉字”),逐一辨认,单字识别,再归一化;对OCR识别后的文字编辑修改。
一个OCR识别***,其目的是要把影像或图像做一个转换,使影像内的图形继续保存、有表格则报个内资料及影像内的文字,一律变成计算机文字,使得影像资料存储量减少、降低存储空间或者对识别的文字可以再使用、分析等,同时节省人力输入和输入时间。
从影像到结果输出,通常必须经过影像输入(影像转入101、影像前处理103、文字特征抽取105)、比对识别107、校正和结果输出109等步骤,参见图1。
影像转入101:需要OCR处理的标的物,通过光学仪器如影像扫描仪、传真机或任何摄影材料,把影像转入计算机。随着科技进步,扫描仪、摄像头等输入装置制作越来越精致、轻薄短小、品质高,便于置入,高分辨率也使得影像更清晰,速度提高促进OCR处理效率提高。
影像前处理103:是OCR***中,必须解决问题最多的一个模块,从得到一个非黑即白的二值化映像,或灰阶、彩色的原始影像,到独立出一个个文字影像的过程。影像前处理103包含:影像正规化、去除噪声、影像矫正等影像处理,及图文分析、文字行与字分离的文件前处理。由于影像处理已经是成熟的技术,但在影像的文件前处理方面,各类方式各有千秋,通常影像要先将图片、表格、文字区域分离出来,甚至可将文章编排方向、文章提纲及内容主体分开,而文字大小及文字字体也如原始文件一样判断出来。
文字特征抽取105:单以识别率而言,特征抽取是OCR的核心,用什么特征、怎么抽取直接影响识别的好坏,“特征”也就是识别的筹码。文字特征抽取105,简易的区分可分为两类:(1)一类为统计的特征,如文字区域内的黑/白点数比,当文字区分成好几个区域时,这一个个区域黑/白点数比之联合,成为空间的一个数值向量,在比对时,基本数学理论就足以应对;(2)另一类特征为结构的特征,如文字影像细线化后,取得字的笔划端点、交叉点之数量及位置,或以笔划段为特征,配合特殊的比对方法,进行比对。
当输入文字计算完特征之后,不论是用统计或结构的特征,都要有一比对数据库或特征数据库来进行对比,数据库的内容应当包含所有欲识别的字集文字,根据与输入文字一样的特征抽取方法所得到的特征群组。
比对(对比)识别107:基于比对比对数据库,将输入文字的特征与比对数据库中的特征,通过数学方式,进行比对识别。比对识别可充分发挥数学运算理论,其能根据不同的特征特性,选用不同的数学距离函数。比较有名的比对方法如:欧式空间的比对方法、松弛比对法(Relaxation)、动态程序比对法(Dynamic Programming,DP)、类似神经网络的数据库建立和对比、HMM(Hidden Markov Model)等。并且为了使得识别结果更稳定,也有所谓的专家***(Experts System)被提出,利用各种特征比对方法的相异互补性,使得识别出的结果信心度特别高。
购买商品时商品上的条形码肉眼无法识别,只有专用读取设备能识别。还有一类情形是,人们通常用一个数字或者文字编码对商品等目标物进行索引并形成目录、序列、编码/编号/代号等标志,如商品有商品代码(或称为商品编码、商品编号等),由数字、文字、图像(如商家LOGO)等编码形成的该商品代码以代表某个商品。常见的网络或手机广告中展示的商品图像,在该商品图像的周围/附近、或者在该商品图像的内部,拍摄或要发送的正销售的实体商品上都可能会出现商品代码。目前的技术还不能直接识别这些数字、汉字(文字)、图像等表示的商品代码,而随着互联网移动技术的发展,对利用手机等移动终端(设备)等移动平台来获取和识别商品代码也提出了需求。通常,对扫描或摄像的这类广告信息(如背景复杂的商品图像),可以利用现有的OCR技术加以识别或获取。但现有的OCR技术中,已有的影像前处理103过程,一般采用版面分析的方法区分图像中的图像部分和文字部分。该方法适用于有一定结构信息的文字版面。但诸如上述广告里出现在商品图像附近或者在商品图像内部的商品代码的这些情况,图像一般比较复杂,较难使用传统的版面分析的方法提取出字符区域。
因而,对商品图片,尤其是在移动平台上对显示的广告商品图像的商品代码或标志(即复杂图像中目标物的标志)进行识别或获取,存在困难。
发明内容
针对上述现有技术的缺陷,本申请的技术方案要解决的技术问题是提供一种基于移动终端的标志识别处理方法和***,预设标记与表示目标物的标志绑定,基于移动平台通过图像识别的方法处理摄像机获取的商品图片/图像,先在摄像机获取的图片或图像上根据该预设的标记定位该标志、并分割出标志(商品代码)的区域,再使用图像处理方法识别出商品代码或标志。
本申请的技术方案,能够实现在一幅复杂背景的图片中,使用一个标记来定位文字或数字部分,并将其应用到商品等目标物的检索。
本申请提供的一种基于移动终端的标志识别处理方法,包括:通过移动终端获得待处理图像;当获取待处理图像后,在所述待处理图像中检测预设于所述标志的固定位置的特殊标记,若匹配上所述特殊标记表明检测到所述特殊标记,则定位所述标志;根据定位的所述标志的位置,分割出标志所在区域;识别分割出的所述标志所在区域中的标志的内容。
对应本申请的方法的一种基于移动终端的标志识别处理***,包括:图像获取模块,用于通过移动终端获取待处理图像;特殊标记匹配模块,用于在获取的待处理图像中检测预设于所述标志的固定位置的特殊标记,以定位所述标志:当获取待处理图像后,在待处理图像中检测所述特殊标记,若匹配上所述特殊标记表明检测到所述特殊标记,则定位所述标志;标志定位模块,用于根据定位的所述标志的位置,分割出标志所在区域;字符识别模块,识别分割出的所述标志所在区域中的标志的内容。
本申请的方案中,其利用特殊符号或称特殊标记,对数字或文字型目标物的标志如商品的商品代码进行标记以定位,再使用图像处理方法来识别标志,能够简单、快速、准确、有效地获取标志,实现在移动终端平台上的广告等图像的标志识别处理。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为OCR***的处理框图。
图2为本申请具体实施方式的标志识别处理***结构图。
图3为本申请具体实施方式的标志识别处理流程图。
图4为本申请具体实施方式的一种利用标记检测商品数字标志的直观图。
图5为本申请具体实施方式的另一种利用标记检测商品数字标志的直观图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请具体实施方式以商品作为目标物为例。在获取的图像位于商品代码前加入一个特殊符号来帮助定位,即通过特殊符号(如特定设计的一种标记、记号)对数字或文字型商品代码(即标志)进行标记以便进行定位,通过图像识别方法处理摄像机获取的图片或图像。在图像处理环节,首先经边缘检测、直线拟合及模板匹配等方式以获得商品代码的位置和尺寸;然后使用光学字符识别出商品代码。
本申请的该具体实施方式的标志识别处理***,如图2所示,以商品为目标物。由图像获模块201、图像的特殊标记匹配模块203、标志定位模块205、图像的字符识别模块207。
图像获取模块201,基于移动设备(终端)或其他移动平台,用扫描、拍摄/摄像、下载等方式获得商品的图像(即准备处理的图片),如用手机的摄像机获取诸如商品图片,或摄取/下载广告中的诸如商品图片等即包含目标物图像的原图。所述移动终端是利用扫描仪、摄像机或网络下载,获取待处理图像;获取的待处理图像可以是诸如商品图片即包含目标物图像的原图。所述标志是目标物的标志如所述商品图片的附近或内部的商品代码。商品代码是数字型或文字型的字符、或图像型等。
图像的特殊标记匹配模块203,在获取的图片中,匹配特殊标记。特殊标记是与目标物的标志如商品代码绑定的,预先设置好的,在商品代码(标志)设计的时候先定义好(之后可以一起印刷等)。对原图直接检测特殊标记,从而利用特殊标记在复杂背景的图像(图片)中定位(检测)要识别的商品图像(图片)上的商品代码。如图4所示的编码示例“1234567”数字型标志,检测到该特殊标记
Figure BDA00002176552800051
则能确定此处有商品代码。二者有固定的关系,如:只要是标志,其旁边、其前或其某个确定的位置处就设计有该特殊标记。
事先设计有带黑框的特殊标记(图4、图5),作为定位商品代码(目标物的标志)的特殊标记。该黑框内也会包括字符、文字、图像(如某商家logo)等。用于定位标志的特殊标记可以定义为黑框结合内容(如黑框+内部图片)的形式(内部图片如各种字符或图形图像符号)。
该特殊标记可以根据但不限于商品图像附近或图像内的商品代码(如:数字型代码、文字型代码、图像型代码(如商家LOGO)等标志)的字符、文字或图像的结构和/或特征(如:长度、宽度、大小、尺寸、方向、位置、色彩、灰度、亮度、等等)来预先设计。例如图4中的根据需要设置有“t”符号在内的黑框这种图形符号,“t”字也可以设计以适应外观的要求。
该特殊标记还可以利用图像处理算法中,会对图像中的像素逐行扫描的原理,设计样式固定的有规则的像素的两组黑白比例关系的区域作为的特殊标记图样。这样,经逐行扫描发现存在按黑白比的规则设定的至少一行像素的图像特征区域,在待处理图像中检测所述特殊标记包括直接检测符合上述黑白比的图像特征区域。
按黑白比的规则设定的至少一行像素的图像特征区域,通常,可以设定两行或两行以上的像素,黑白比分别为1∶1∶3∶1∶1和1∶2∶1∶2∶1。比如:(1)相邻或非相邻两行像素,每行像素的连续或非连续像素出现了黑白比,一行为1∶1∶3∶1∶1、一行为1∶2∶1∶2∶1;相邻或非相邻的多行(两行以上)等,有几行的连续或非连续的像素出现的黑白比为1∶1∶3∶1∶1、另外有几行连续或非连续的像素出现的黑白比为1∶2∶1∶2∶1。也就是说,该黑白比的图像特征区域设定:可以是一行、相邻或非相邻的两行、或者,相邻或非相邻的多行(两行以上)等情况;可能有多行符合1∶1∶3∶1∶1、然后又有多行符合1∶2∶1∶2∶1;另外,黑白比规则的像素,也不一定是该行像素中的连续像素,只要接连有几个像素的黑白比例符合这种定义就可以(只要连续像素的黑白比例符合这种定义即可)。比如说,有五个像素黑,五个像素白,然后十五个像素黑,五个像素白,五个像素黑(这个可以随着标记大小的变化而变化),也是符合1∶1∶3∶1∶1的比例的。而图像特征区域就可以设计为该有该像素黑白比规则的黑框结合内部内容的形式(也随需要标记的大小变化)。
例如图5中的示意的黑框+“T”两组黑白比区域图样,是有两行像素的黑白比固定其图样设计规则为,一行有黑白比1∶1∶3∶1∶1(即该行像素会有:1个黑像素、1个白像素、3个黑像素、1个白像素、1个黑像素)的像素情况,另一行(图5所示下方一行)有黑白比1∶2∶1∶2∶1(即该行像素出现:1个黑像素、2个白像素、1个黑像素、2个白像素、1个黑像素)的像素情况。在图像处理时,只要扫描图像时发现有两行像素所在区域有这样两组黑白比的情况存在,就可以确定此处区域为特殊标记。特殊标记的图样根据该比例设计,不限于图5所示图样
Figure BDA00002176552800071
只是必须满足上述两行像素中的两组黑白比例规则。
图4给出了一种检测(匹配和定位)方式:
在匹配特殊标记前,预设黑框及其内部内容(内部内容是根据情况或需求可设计的,如“t”字符)作为特殊标记;
先检测属于特殊标记的黑框
Figure BDA00002176552800072
是否存在,如果存在,然后匹配黑框中的内容,如“t”符,由此确定特殊标记在此。由于标记和标志绑定,有该特殊标记就有相应的目标物的标志(商品代码),因而此处是商品代码所在区域,由此实现定位目标物的标志(如该商品代码)。如果不存在黑框或内容不匹配可以表示原图上没有目标物的标志。
图5给出了一种检测(匹配和定位)速度和运算速度更快捷、更准确的特殊标记检测方式:
在匹配特殊标记之前,预设至少一行、两行或多行像素的两组黑白比(如上所述数字比例)规则的图样,表示按照该规则设计的图或满足该规则的区域为特殊标记,后面以两行像素为例进行说明;
在原图中寻找(图像处理算法中逐行扫描像素),发现符合预设的固定样式规则的两行像素的两组黑白比例区域。如直接在图片中寻找两行像素的黑白比符合1∶1∶3∶1∶1(上行像素黑白比)以及1∶2∶1∶2∶1(下行像素黑白比)的图像特征区域。从而利用直接在图像上检测具有所述数字比例的图像特征区域,找到所述图像特征区域即实现了特殊标记的匹配,检测到该特殊标记则能够定位所述标志在哪个位置。
图5的方式无需寻找黑框等图形图像,只需要在通常的图像处理扫描过程中寻找符合规定的像素黑白比例定义的图样,就能确定由该比例定义的特殊标记,因而该方式检测速度能更快、检测结果更准确,实现起来更简单,称快速定位法。
在该图像的特殊标记匹配模块203中,基于所述特殊标记,其检测、匹配和定位的算法,可以采用边缘检测、直线拟合以及模板匹配算法,以确定目标物的标志(商品代码)的位置和尺寸。
标志定位模块205,能根据定位的标志位置和尺寸切割(分割)标志即商品代码的区域。分出商品代码区域的图像,并能传送给字符识别模块207
图像的字符识别模块207,接收来自标志定位模块205的分出区域,对分出的区域进行识别,如识别出商品代码的数字“1234567”等。这里可以使用OCR光学字符识别算法,使用OCR识别分割出的区域中的标志的内容,包括识别出数字型、文字型字符,或图像型符号等。
下面将根据图3,以商品的商品代码为例,对本申请的标志识别处理***的流程,即标志识别处理方法,进行描述,方法的步骤中,不再对***的模块功能重复描述。
图像获取步骤301,通过手机等移动设备获得要处理的图像/图片述。所述移动终端是利用扫描仪、摄像机或网络下载,获取待处理图像;获取的待处理图像是商品图片;所述标志是所述商品图片的附近或内部的商品编码。商品编码是数字型或文字型的字符。具体参见模块201的描述。
在特殊标记设置步骤303,预先构造用于在上述获取的、具有复杂背景的图片中使用的特殊标记,绑定商品代码。特殊标记可以是图形符号(如图4所示黑框和其内部),或者是黑白比规则固定样式的至少一行、两行或多行像素的图像特征区域(如图5所示按两组黑白比规则1∶1∶3∶1∶1以及1∶2∶1∶2∶1设计的黑框图区域)。具体参见模块203的描述的标记设计方式(图4、图5)。
在特殊的标记检测和匹配步骤305,通过对特殊标记进行检测(定位和匹配),如对图上的图形符号边框检测(黑框),然后匹配黑框中的“t”字(图4所述方式);或者直接在图片上找符合预设比例的图像特征区域(如图5所述方式)。
方式一:当采用图形符号形式的特殊标记时,特殊标记是带黑框及其内有字符的图形符号;检测黑框并匹配其框内的内容,确定检测到特殊标记;由于特殊标记与所述待处理图像的(目标物)标志如商品代码绑定,则找到特殊标记就能定位到该商品代码(标志)。
方式二,又称快速定位法:当特殊标记特殊标记采用上述特定的数字比设计时,直接在图像上检测(逐行扫描像素时寻找)具有所述数字比的图像特征区域,找到所述图像特征区域即实现了所述标志与特殊标记的匹配,并定位所述标志。
具体参见模块203的两种检测(匹配和定位)方式的描述。
上述步骤305基于所述特殊标记的检测、匹配和定位,是根据边缘检测、直线拟合以及模板匹配算法来确定标志的位置和尺寸。
标志定位步骤307,根据步骤305所定位的标志(如商品代码)的位置,切割商品代码的所在区域。
处理步骤309,实现图像的字符识别和后续处理。根据步骤307获得的商品代码区域的图像(对分出的区域)进行识别,如识别出商品代码的数字等。这里可以使用OCR光学字符识别算法,使用OCR识别分割出的区域中的标志的内容包括识别出数字型、文字型字符,或图像型符号等。
判定全部完成步骤311,判断获取的、要识别的图像已经全部完成,不再识别后面的其他图像或图片等,则结束该流程,否则返回开始继续进行识别。
本申请的***及其方法通过特定的标记符号来确定复杂图像中的特定区域,提供了一种快速简易有效准确的图像内容以识别技术。
本说明书中的各个实施例一般采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块或单元。一般地,程序模块或单元可以包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。一般来说,程序模块或单元可以由软件、硬件或两者的结合来实现。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块或单元可以位于包括存储设备在内的本地和远程计算机存储介质中。
最后,还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其主要思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (14)

1.一种基于移动终端的标志识别处理***,其特征在于,包括:
图像获取模块,用于通过移动终端获取待处理图像;
特殊标记匹配模块,用于在获取的待处理图像中检测预设于所述标志的固定位置的特殊标记,以定位所述标志:
当获取待处理图像后,在所述待处理图像中检测所述特殊标记,若匹配上所述特殊标记表明检测到所述特殊标记,则定位所述标志;
标志定位模块,用于根据定位的所述标志的位置,分割出标志所在区域;
字符识别模块,识别分割出的所述标志所在区域中的标志的内容。
2.如权利要求1所述的***,其特征在于,
所述特殊标记定义为黑框结合内部图片,内部图片在检测所述特殊标记时用于所述匹配;
在待处理图像中检测所述特殊标记包括:先检测到所述黑框,再匹配所述内部图片,如果内部图片匹配上则表明匹配上所述特殊标记。
3.如权利要求1所述的***,其特征在于,
所述特殊标记包括:经逐行扫描发现存在按黑白比的规则设定的至少一行、两行或多行像素的图像特征区域;
在待处理图像中检测所述特殊标记包括:直接检测符合上述黑白比的图像特征区域。
4.如权利要求3所述的***,其特征在于,所述按黑白比的规则设定的至少一行、两行或多行像素的图像特征区域还包括:其中,
设定两行或多行像素,出现像素的黑白比规则分别为1∶1∶3∶1∶1和1∶2∶1∶2∶1;
图像特征区域设计为黑框结合内部内容。
5.如权利要求2或3所述的***,其特征在于,所述标志的固定位置包括:在所述标志前或在所述标志后。
6.如权利要求1所述的***,其特征在于,获取的待处理图像是商品图片;所述标志是所述商品图片的附近或内部的商品代码;商品代码包括字符或数字字符,和/或图像。
7.如权利要求1所述的***,其特征在于,字符识别模块还包括:使用OCR识别分割出的区域中的标志的内容。
8.一种基于移动终端的标志识别处理方法,其特征在于,包括:
通过移动终端获得待处理图像;
当获取待处理图像后,在所述待处理图像中检测预设于所述标志的固定位置的特殊标记,若匹配上所述特殊标记表明检测到所述特殊标记,则定位所述标志;
根据定位的所述标志的位置,分割出标志所在区域;
识别分割出的所述标志所在区域中的标志的内容。
9.如权利要求8所述的方法,其特征在于,
所述特殊标记定义为黑框结合内部图片,内部图片在检测所述特殊标记时用于所述匹配;
在待处理图像中检测所述特殊标记包括:先检测到所述黑框,再匹配所述内部图片,如果内部图片匹配上则表明匹配上所述特殊标记。
10.如权利要求8所述的方法,其特征在于,
所述特殊标记包括:经逐行扫描发现存在按黑白比的规则设定的至少一行、两行或多行像素的图像特征区域;
在待处理图像中检测所述特殊标记包括:直接检测符合上述黑白比的图像特征区域。
11.如权利要求10所述的方法,其特征在于,所述按黑白比的规则设定的至少一行、两行或多行像素的图像特征区域还包括:其中,
设定两行或多行像素,出现像素的黑白比规则分别为1∶1∶3∶1∶1和1∶2∶1∶2∶1;
图像特征区域设计为黑框结合内部内容。
12.如权利要求9或10所述的方法,其特征在于,所述标志的固定位置包括:在所述标志前或在所述标志后。
13.如权利要求8所述的方法,其特征在于,获取的待处理图像是商品图片;所述标志是所述商品图片的附近或内部的商品代码;商品代码包括字符或数字字符,和/或图像。
14.如权利要求8所述的方法,其特征在于,识别步骤还包括:使用OCR识别分割出的区域中的标志的内容。
CN201210360774.6A 2012-09-21 2012-09-21 一种基于移动终端的标志识别处理方法和*** Pending CN103679164A (zh)

Priority Applications (7)

Application Number Priority Date Filing Date Title
CN201210360774.6A CN103679164A (zh) 2012-09-21 2012-09-21 一种基于移动终端的标志识别处理方法和***
TW101146907A TWI631514B (zh) 2012-09-21 2012-12-12 Method and system for marking recognition based on mobile terminal
US14/021,564 US8971620B2 (en) 2012-09-21 2013-09-09 Detecting a label from an image
JP2015533106A JP5972468B2 (ja) 2012-09-21 2013-09-10 画像からのラベルの検出
PCT/US2013/059054 WO2014046918A1 (en) 2012-09-21 2013-09-10 Detecting a label from an image
US14/602,021 US9811749B2 (en) 2012-09-21 2015-01-21 Detecting a label from an image
JP2016137232A JP2016201126A (ja) 2012-09-21 2016-07-12 画像からのラベルの検出

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210360774.6A CN103679164A (zh) 2012-09-21 2012-09-21 一种基于移动终端的标志识别处理方法和***

Publications (1)

Publication Number Publication Date
CN103679164A true CN103679164A (zh) 2014-03-26

Family

ID=50316654

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210360774.6A Pending CN103679164A (zh) 2012-09-21 2012-09-21 一种基于移动终端的标志识别处理方法和***

Country Status (5)

Country Link
US (2) US8971620B2 (zh)
JP (2) JP5972468B2 (zh)
CN (1) CN103679164A (zh)
TW (1) TWI631514B (zh)
WO (1) WO2014046918A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107209862A (zh) * 2015-01-21 2017-09-26 国立大学法人东京农工大学 程序、信息存储介质以及识别装置
CN108345895A (zh) * 2017-01-22 2018-07-31 上海分泽时代软件技术有限公司 广告图像识别方法以及广告图像识别***
CN112926683A (zh) * 2021-03-29 2021-06-08 中国建设银行股份有限公司 一种对象识别方法和装置
CN113033588A (zh) * 2019-12-24 2021-06-25 中移雄安信息通信科技有限公司 一种图像处理方法及电子设备

Families Citing this family (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9613267B2 (en) * 2012-05-31 2017-04-04 Xerox Corporation Method and system of extracting label:value data from a document
US9087272B2 (en) * 2013-07-17 2015-07-21 International Business Machines Corporation Optical match character classification
US9245192B2 (en) * 2013-09-20 2016-01-26 Here Global B.V. Ad collateral detection
KR102209729B1 (ko) * 2014-04-04 2021-01-29 삼성전자주식회사 인식 영역에 기반하여 콘텐트를 검출하는 전자 장치 및 방법
GB2526102B (en) * 2014-05-13 2020-09-23 Grass Valley Ltd Logo detection by edge matching
CN105303189B (zh) * 2014-07-29 2019-08-20 阿里巴巴集团控股有限公司 一种用于检测预定区域中特定标识图像的方法及装置
CN105608459B (zh) * 2014-10-29 2018-09-14 阿里巴巴集团控股有限公司 商品图片的分割方法及其装置
US9892478B2 (en) 2015-03-06 2018-02-13 Digimarc Corporation Digital watermarking applications
US10467284B2 (en) 2015-08-03 2019-11-05 Google Llc Establishment anchoring with geolocated imagery
US9690967B1 (en) 2015-10-29 2017-06-27 Digimarc Corporation Detecting conflicts between multiple different encoded signals within imagery
US10262176B1 (en) 2016-02-23 2019-04-16 Digimarc Corporation Scanner with control logic for resolving package labeling
US10198782B1 (en) * 2016-09-15 2019-02-05 Digimarc Corporation Detecting conflicts between multiple different encoded signals within imagery
US11042161B2 (en) 2016-11-16 2021-06-22 Symbol Technologies, Llc Navigation control method and apparatus in a mobile automation system
US20180314908A1 (en) * 2017-05-01 2018-11-01 Symbol Technologies, Llc Method and apparatus for label detection
US11367092B2 (en) 2017-05-01 2022-06-21 Symbol Technologies, Llc Method and apparatus for extracting and processing price text from an image set
US10726273B2 (en) 2017-05-01 2020-07-28 Symbol Technologies, Llc Method and apparatus for shelf feature and object placement detection from shelf images
WO2018204342A1 (en) 2017-05-01 2018-11-08 Symbol Technologies, Llc Product status detection system
DE112018002314T5 (de) 2017-05-01 2020-01-23 Symbol Technologies, Llc Verfahren und vorrichtung zur erkennung eines objektstatus
US10949798B2 (en) 2017-05-01 2021-03-16 Symbol Technologies, Llc Multimodal localization and mapping for a mobile automation apparatus
US11449059B2 (en) 2017-05-01 2022-09-20 Symbol Technologies, Llc Obstacle detection for a mobile automation apparatus
US10591918B2 (en) 2017-05-01 2020-03-17 Symbol Technologies, Llc Fixed segmented lattice planning for a mobile automation apparatus
US10505057B2 (en) 2017-05-01 2019-12-10 Symbol Technologies, Llc Device and method for operating cameras and light sources wherein parasitic reflections from a paired light source are not reflected into the paired camera
US10663590B2 (en) 2017-05-01 2020-05-26 Symbol Technologies, Llc Device and method for merging lidar data
US11600084B2 (en) 2017-05-05 2023-03-07 Symbol Technologies, Llc Method and apparatus for detecting and interpreting price label text
US10521914B2 (en) 2017-09-07 2019-12-31 Symbol Technologies, Llc Multi-sensor object recognition system and method
US10572763B2 (en) 2017-09-07 2020-02-25 Symbol Technologies, Llc Method and apparatus for support surface edge detection
TWI649698B (zh) 2017-12-21 2019-02-01 財團法人工業技術研究院 物件偵測裝置、物件偵測方法及電腦可讀取媒體
US10823572B2 (en) 2018-04-05 2020-11-03 Symbol Technologies, Llc Method, system and apparatus for generating navigational data
US11327504B2 (en) 2018-04-05 2022-05-10 Symbol Technologies, Llc Method, system and apparatus for mobile automation apparatus localization
US10832436B2 (en) 2018-04-05 2020-11-10 Symbol Technologies, Llc Method, system and apparatus for recovering label positions
US10740911B2 (en) 2018-04-05 2020-08-11 Symbol Technologies, Llc Method, system and apparatus for correcting translucency artifacts in data representing a support structure
US10809078B2 (en) 2018-04-05 2020-10-20 Symbol Technologies, Llc Method, system and apparatus for dynamic path generation
US11506483B2 (en) 2018-10-05 2022-11-22 Zebra Technologies Corporation Method, system and apparatus for support structure depth determination
US11010920B2 (en) 2018-10-05 2021-05-18 Zebra Technologies Corporation Method, system and apparatus for object detection in point clouds
GB201817808D0 (en) * 2018-10-31 2018-12-19 Ishida Europe Ltd Method and apparatus for inspecting a label attached to a food pack
US11003188B2 (en) 2018-11-13 2021-05-11 Zebra Technologies Corporation Method, system and apparatus for obstacle handling in navigational path generation
US11090811B2 (en) 2018-11-13 2021-08-17 Zebra Technologies Corporation Method and apparatus for labeling of support structures
US11079240B2 (en) 2018-12-07 2021-08-03 Zebra Technologies Corporation Method, system and apparatus for adaptive particle filter localization
US11416000B2 (en) 2018-12-07 2022-08-16 Zebra Technologies Corporation Method and apparatus for navigational ray tracing
US11100303B2 (en) 2018-12-10 2021-08-24 Zebra Technologies Corporation Method, system and apparatus for auxiliary label detection and association
US11015938B2 (en) 2018-12-12 2021-05-25 Zebra Technologies Corporation Method, system and apparatus for navigational assistance
US10731970B2 (en) 2018-12-13 2020-08-04 Zebra Technologies Corporation Method, system and apparatus for support structure detection
TWI703508B (zh) * 2018-12-19 2020-09-01 洽吧智能股份有限公司 字元影像識別方法與系統
CA3028708A1 (en) 2018-12-28 2020-06-28 Zih Corp. Method, system and apparatus for dynamic loop closure in mapping trajectories
US11250535B1 (en) 2019-02-08 2022-02-15 Digimarc Corporation Detecting conflicts between multiple different encoded signals within imagery, using only a subset of available image data, and robustness checks
US10789438B1 (en) 2019-02-08 2020-09-29 Digimarc Corporation Detecting conflicts between multiple different encoded signals within imagery, using only a subset of available image data
US11341663B2 (en) 2019-06-03 2022-05-24 Zebra Technologies Corporation Method, system and apparatus for detecting support structure obstructions
US11960286B2 (en) 2019-06-03 2024-04-16 Zebra Technologies Corporation Method, system and apparatus for dynamic task sequencing
US11080566B2 (en) 2019-06-03 2021-08-03 Zebra Technologies Corporation Method, system and apparatus for gap detection in support structures with peg regions
US11662739B2 (en) 2019-06-03 2023-05-30 Zebra Technologies Corporation Method, system and apparatus for adaptive ceiling-based localization
US11200677B2 (en) 2019-06-03 2021-12-14 Zebra Technologies Corporation Method, system and apparatus for shelf edge detection
US11402846B2 (en) 2019-06-03 2022-08-02 Zebra Technologies Corporation Method, system and apparatus for mitigating data capture light leakage
US11151743B2 (en) 2019-06-03 2021-10-19 Zebra Technologies Corporation Method, system and apparatus for end of aisle detection
WO2021054850A1 (ru) * 2019-09-17 2021-03-25 Публичное Акционерное Общество "Сбербанк России" Способ и система интеллектуальной обработки документа
CN111091532B (zh) * 2019-10-30 2023-07-18 中国四维测绘技术有限公司 一种基于多层感知机的遥感影像色彩评价方法和***
US11507103B2 (en) 2019-12-04 2022-11-22 Zebra Technologies Corporation Method, system and apparatus for localization-based historical obstacle handling
US11107238B2 (en) 2019-12-13 2021-08-31 Zebra Technologies Corporation Method, system and apparatus for detecting item facings
US11822333B2 (en) 2020-03-30 2023-11-21 Zebra Technologies Corporation Method, system and apparatus for data capture illumination control
US11450024B2 (en) 2020-07-17 2022-09-20 Zebra Technologies Corporation Mixed depth object detection
US11593915B2 (en) 2020-10-21 2023-02-28 Zebra Technologies Corporation Parallax-tolerant panoramic image generation
US11392891B2 (en) 2020-11-03 2022-07-19 Zebra Technologies Corporation Item placement detection and optimization in material handling systems
US11847832B2 (en) 2020-11-11 2023-12-19 Zebra Technologies Corporation Object classification for autonomous navigation systems
US11954882B2 (en) 2021-06-17 2024-04-09 Zebra Technologies Corporation Feature-based georegistration for mobile computing devices
WO2024049421A1 (en) * 2022-08-31 2024-03-07 Surgibox Inc. Blockchain systems and methods for verifying the certifications and the authenticity of commercial products

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4776464A (en) * 1985-06-17 1988-10-11 Bae Automated Systems, Inc. Automated article handling system and process
US5081685A (en) * 1988-11-29 1992-01-14 Westinghouse Electric Corp. Apparatus and method for reading a license plate
FR2657982B1 (fr) 1990-02-02 1992-11-27 Cga Hbs Procede de localisation d'adresse sur des articles a trier, etiquette d'adressage et dispositif de mise en óoeuvre du procede.
US5060980A (en) 1990-05-30 1991-10-29 Xerox Corporation Form utilizing encoded indications for form field processing
JPH06339026A (ja) * 1993-05-31 1994-12-06 Matsushita Electric Ind Co Ltd 補正データ生成装置
JPH0793473A (ja) * 1993-09-21 1995-04-07 Hitachi Eng Co Ltd 文字領域割り出し方法
JP3726395B2 (ja) 1997-01-30 2005-12-14 株式会社デンソー 2次元コードおよび2次元コードの読取方法
JPH1154407A (ja) * 1997-08-05 1999-02-26 Nikon Corp 位置合わせ方法
JP4054428B2 (ja) * 1998-02-05 2008-02-27 キヤノン株式会社 画像検索装置及びその方法、コンピュータ可読メモリ
US6360001B1 (en) 2000-05-10 2002-03-19 International Business Machines Corporation Automatic location of address information on parcels sent by mass mailers
US7130466B2 (en) * 2000-12-21 2006-10-31 Cobion Ag System and method for compiling images from a database and comparing the compiled images with known images
EP1423833A4 (en) * 2001-07-18 2008-07-02 Hyunjae Tech Co Ltd SYSTEM FOR THE AUTOMATIC RECOGNITION OF IDENTIFICATION OF OTHER VEHICLES ON OBSERVATIVES AND METHOD THEREFOR
CA2375355A1 (en) 2002-03-11 2003-09-11 Neo Systems Inc. Character recognition system and method
US7328847B1 (en) * 2003-07-30 2008-02-12 Hewlett-Packard Development Company, L.P. Barcode data communication methods, barcode embedding methods, and barcode systems
US20050044758A1 (en) * 2003-08-29 2005-03-03 Richard Gary P. More readily identifiable license plate
JP4391839B2 (ja) * 2004-01-30 2009-12-24 富士通株式会社 撮影条件設定プログラム、撮影条件設定方法および撮影条件設定装置
JP2006331322A (ja) 2005-05-30 2006-12-07 Fuji Electric Systems Co Ltd 検索用タグ及びこれを使用した情報検索システム
US7613328B2 (en) * 2005-09-09 2009-11-03 Honeywell International Inc. Label detection
CA2566260C (en) * 2005-10-31 2013-10-01 National Research Council Of Canada Marker and method for detecting said marker
JP4745830B2 (ja) * 2006-01-05 2011-08-10 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP4670657B2 (ja) 2006-01-24 2011-04-13 富士ゼロックス株式会社 画像処理装置、画像処理方法及びプログラム
JP2007304864A (ja) * 2006-05-11 2007-11-22 Fuji Xerox Co Ltd 文字認識処理システムおよび文字認識処理プログラム
US8218821B2 (en) * 2007-01-23 2012-07-10 Pips Technology, Inc. Video preprocessing of image information for character recognition
US8285047B2 (en) * 2007-10-03 2012-10-09 Xerox Corporation Automated method and system for naming documents from a scanned source based on manually marked text
JP4711093B2 (ja) * 2008-08-28 2011-06-29 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP4821869B2 (ja) 2009-03-18 2011-11-24 富士ゼロックス株式会社 文字認識装置、画像読取装置、およびプログラム
EP2415015B1 (en) * 2009-03-30 2015-08-12 Telefonaktiebolaget LM Ericsson (publ) Barcode processing
US8594422B2 (en) 2010-03-11 2013-11-26 Microsoft Corporation Page layout determination of an image undergoing optical character recognition
US9292565B2 (en) 2010-06-30 2016-03-22 International Business Machines Corporation Template-based recognition of food product information
EP2619711A4 (en) * 2010-09-20 2017-06-07 HID Global Corporation Machine-readable symbols
WO2012049795A1 (ja) * 2010-10-12 2012-04-19 パナソニック株式会社 表示処理装置、表示方法およびプログラム
US8528820B2 (en) * 2011-06-29 2013-09-10 Symbol Technologies, Inc. Object identification using barcode reader
US20130279758A1 (en) * 2012-04-23 2013-10-24 Xerox Corporation Method and system for robust tilt adjustment and cropping of license plate images

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107209862A (zh) * 2015-01-21 2017-09-26 国立大学法人东京农工大学 程序、信息存储介质以及识别装置
CN108345895A (zh) * 2017-01-22 2018-07-31 上海分泽时代软件技术有限公司 广告图像识别方法以及广告图像识别***
CN113033588A (zh) * 2019-12-24 2021-06-25 中移雄安信息通信科技有限公司 一种图像处理方法及电子设备
CN112926683A (zh) * 2021-03-29 2021-06-08 中国建设银行股份有限公司 一种对象识别方法和装置

Also Published As

Publication number Publication date
US20140086483A1 (en) 2014-03-27
JP2016201126A (ja) 2016-12-01
JP2015529369A (ja) 2015-10-05
JP5972468B2 (ja) 2016-08-17
TW201413602A (zh) 2014-04-01
TWI631514B (zh) 2018-08-01
US8971620B2 (en) 2015-03-03
US20150199581A1 (en) 2015-07-16
WO2014046918A1 (en) 2014-03-27
US9811749B2 (en) 2017-11-07

Similar Documents

Publication Publication Date Title
CN103679164A (zh) 一种基于移动终端的标志识别处理方法和***
US11380113B2 (en) Methods for mobile image capture of vehicle identification numbers in a non-document
US11036949B2 (en) Scanner with control logic for resolving package labeling conflicts
US9245203B2 (en) Collecting information relating to identity parameters of a vehicle
US20170220886A1 (en) Method and system for reading and validating identity documents
KR101461233B1 (ko) 화상 처리 장치, 화상 처리 방법 및 기록 매체
CN101855640B (zh) 尤其是用于移动无线设备的图像分析方法
EP1870858A2 (en) Method of classifying colors of color based image code
US9171224B2 (en) Method of improving contrast for text extraction and recognition applications
US20090148043A1 (en) Method for extracting text from a compound digital image
KR101552525B1 (ko) 폰트를 인식하고 폰트정보를 제공하는 시스템 및 그 방법
JP2015032087A (ja) ナンバープレート認識装置およびナンバープレート認識方法
KR101842535B1 (ko) 부호의 광학적 검출 방법
US20160371543A1 (en) Classifying document images based on parameters of color layers
Park et al. Binarization of text region based on fuzzy clustering and histogram distribution in signboards
US7920742B2 (en) Image processing apparatus, program and recording medium for document registration
Arai et al. Method for extracting product information from TV commercial
Nor et al. Image segmentation and text extraction: application to the extraction of textual information in scene images
US9292541B2 (en) Method of providing online information using image information
KR20090123523A (ko) 광학 문자 인식 시스템 및 방법
CN113255657B (zh) 票据表面刮痕检测方法、装置、电子设备、机器可读介质
Razali et al. Vision-based verification of authentic JAKIM Halal logo
Manger et al. Filtering local features for logo detection and localization in sports videos
Kasar Recognition of Seven-Segment Displays from Images of Digital Energy Meters
KR20240078529A (ko) 전자도감 관상어 이미지 검색 서비스를 위한 이미지 프로세싱 기반 유사 관상어 이미지 탐색 시스템 및 그 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140326

RJ01 Rejection of invention patent application after publication