CN103679164A - 一种基于移动终端的标志识别处理方法和*** - Google Patents
一种基于移动终端的标志识别处理方法和*** Download PDFInfo
- Publication number
- CN103679164A CN103679164A CN201210360774.6A CN201210360774A CN103679164A CN 103679164 A CN103679164 A CN 103679164A CN 201210360774 A CN201210360774 A CN 201210360774A CN 103679164 A CN103679164 A CN 103679164A
- Authority
- CN
- China
- Prior art keywords
- sign
- image
- special marking
- black
- mark
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/245—Aligning, centring, orientation detection or correction of the image by locating a pattern; Special marks for positioning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
- G06V30/1448—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/184—Extraction of features or characteristics of the image by analysing segments intersecting the pattern
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/224—Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
本方案涉及一种基于移动终端的标志识别处理方法和***。该方法包括:通过移动终端获得待处理图像;在获得的所述待处理图像中检测预设于所述标志的固定位置的特殊标记,若匹配上所述特殊标记表明检测到所述特殊标记则定位所述标志;根据定位的所述标志的位置,分割出标志所在区域;识别分割出的所述标志所在区域中的标志的内容。该***包括对应上述方法组成部分以及相应方法步骤的功能。本方案预设标记与表示目标物的标志绑定,基于移动平台在获取的图片或图像上根据该预设的标记定位该标志、并分割出标志区域,再使用图像处理方法识别出商品代码或标志,能够简单、快速、准确、有效地获取标志,实现在移动终端平台上的广告等图像的标志识别处理。
Description
技术领域
本申请专利申请涉及移动终端的字符识别领域,尤其涉及一种基于移动终端的标志识别处理方法和***。
背景技术
光学字符识别(OCR,Optical Character Recognition)技术是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将其形状翻译成计算机文字的过程,即对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。也就是通过扫描和摄像等光学输入方式获取纸上的文字图像信息。其能利用各种模式识别算法分析文字形态特征,判断出汉字的标准编码,并按照通用格式存储在文本文件中:通过扫描仪输入后,将文稿形成图像文件,做图像处理;接着先对版面划分(如进行版面分析:版面理解、字切分、归一化等)以便分开不同部分进行分别按次序处理;再对文字阅读(如图形文字“汉字”),逐一辨认,单字识别,再归一化;对OCR识别后的文字编辑修改。
一个OCR识别***,其目的是要把影像或图像做一个转换,使影像内的图形继续保存、有表格则报个内资料及影像内的文字,一律变成计算机文字,使得影像资料存储量减少、降低存储空间或者对识别的文字可以再使用、分析等,同时节省人力输入和输入时间。
从影像到结果输出,通常必须经过影像输入(影像转入101、影像前处理103、文字特征抽取105)、比对识别107、校正和结果输出109等步骤,参见图1。
影像转入101:需要OCR处理的标的物,通过光学仪器如影像扫描仪、传真机或任何摄影材料,把影像转入计算机。随着科技进步,扫描仪、摄像头等输入装置制作越来越精致、轻薄短小、品质高,便于置入,高分辨率也使得影像更清晰,速度提高促进OCR处理效率提高。
影像前处理103:是OCR***中,必须解决问题最多的一个模块,从得到一个非黑即白的二值化映像,或灰阶、彩色的原始影像,到独立出一个个文字影像的过程。影像前处理103包含:影像正规化、去除噪声、影像矫正等影像处理,及图文分析、文字行与字分离的文件前处理。由于影像处理已经是成熟的技术,但在影像的文件前处理方面,各类方式各有千秋,通常影像要先将图片、表格、文字区域分离出来,甚至可将文章编排方向、文章提纲及内容主体分开,而文字大小及文字字体也如原始文件一样判断出来。
文字特征抽取105:单以识别率而言,特征抽取是OCR的核心,用什么特征、怎么抽取直接影响识别的好坏,“特征”也就是识别的筹码。文字特征抽取105,简易的区分可分为两类:(1)一类为统计的特征,如文字区域内的黑/白点数比,当文字区分成好几个区域时,这一个个区域黑/白点数比之联合,成为空间的一个数值向量,在比对时,基本数学理论就足以应对;(2)另一类特征为结构的特征,如文字影像细线化后,取得字的笔划端点、交叉点之数量及位置,或以笔划段为特征,配合特殊的比对方法,进行比对。
当输入文字计算完特征之后,不论是用统计或结构的特征,都要有一比对数据库或特征数据库来进行对比,数据库的内容应当包含所有欲识别的字集文字,根据与输入文字一样的特征抽取方法所得到的特征群组。
比对(对比)识别107:基于比对比对数据库,将输入文字的特征与比对数据库中的特征,通过数学方式,进行比对识别。比对识别可充分发挥数学运算理论,其能根据不同的特征特性,选用不同的数学距离函数。比较有名的比对方法如:欧式空间的比对方法、松弛比对法(Relaxation)、动态程序比对法(Dynamic Programming,DP)、类似神经网络的数据库建立和对比、HMM(Hidden Markov Model)等。并且为了使得识别结果更稳定,也有所谓的专家***(Experts System)被提出,利用各种特征比对方法的相异互补性,使得识别出的结果信心度特别高。
购买商品时商品上的条形码肉眼无法识别,只有专用读取设备能识别。还有一类情形是,人们通常用一个数字或者文字编码对商品等目标物进行索引并形成目录、序列、编码/编号/代号等标志,如商品有商品代码(或称为商品编码、商品编号等),由数字、文字、图像(如商家LOGO)等编码形成的该商品代码以代表某个商品。常见的网络或手机广告中展示的商品图像,在该商品图像的周围/附近、或者在该商品图像的内部,拍摄或要发送的正销售的实体商品上都可能会出现商品代码。目前的技术还不能直接识别这些数字、汉字(文字)、图像等表示的商品代码,而随着互联网移动技术的发展,对利用手机等移动终端(设备)等移动平台来获取和识别商品代码也提出了需求。通常,对扫描或摄像的这类广告信息(如背景复杂的商品图像),可以利用现有的OCR技术加以识别或获取。但现有的OCR技术中,已有的影像前处理103过程,一般采用版面分析的方法区分图像中的图像部分和文字部分。该方法适用于有一定结构信息的文字版面。但诸如上述广告里出现在商品图像附近或者在商品图像内部的商品代码的这些情况,图像一般比较复杂,较难使用传统的版面分析的方法提取出字符区域。
因而,对商品图片,尤其是在移动平台上对显示的广告商品图像的商品代码或标志(即复杂图像中目标物的标志)进行识别或获取,存在困难。
发明内容
针对上述现有技术的缺陷,本申请的技术方案要解决的技术问题是提供一种基于移动终端的标志识别处理方法和***,预设标记与表示目标物的标志绑定,基于移动平台通过图像识别的方法处理摄像机获取的商品图片/图像,先在摄像机获取的图片或图像上根据该预设的标记定位该标志、并分割出标志(商品代码)的区域,再使用图像处理方法识别出商品代码或标志。
本申请的技术方案,能够实现在一幅复杂背景的图片中,使用一个标记来定位文字或数字部分,并将其应用到商品等目标物的检索。
本申请提供的一种基于移动终端的标志识别处理方法,包括:通过移动终端获得待处理图像;当获取待处理图像后,在所述待处理图像中检测预设于所述标志的固定位置的特殊标记,若匹配上所述特殊标记表明检测到所述特殊标记,则定位所述标志;根据定位的所述标志的位置,分割出标志所在区域;识别分割出的所述标志所在区域中的标志的内容。
对应本申请的方法的一种基于移动终端的标志识别处理***,包括:图像获取模块,用于通过移动终端获取待处理图像;特殊标记匹配模块,用于在获取的待处理图像中检测预设于所述标志的固定位置的特殊标记,以定位所述标志:当获取待处理图像后,在待处理图像中检测所述特殊标记,若匹配上所述特殊标记表明检测到所述特殊标记,则定位所述标志;标志定位模块,用于根据定位的所述标志的位置,分割出标志所在区域;字符识别模块,识别分割出的所述标志所在区域中的标志的内容。
本申请的方案中,其利用特殊符号或称特殊标记,对数字或文字型目标物的标志如商品的商品代码进行标记以定位,再使用图像处理方法来识别标志,能够简单、快速、准确、有效地获取标志,实现在移动终端平台上的广告等图像的标志识别处理。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为OCR***的处理框图。
图2为本申请具体实施方式的标志识别处理***结构图。
图3为本申请具体实施方式的标志识别处理流程图。
图4为本申请具体实施方式的一种利用标记检测商品数字标志的直观图。
图5为本申请具体实施方式的另一种利用标记检测商品数字标志的直观图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请具体实施方式以商品作为目标物为例。在获取的图像位于商品代码前加入一个特殊符号来帮助定位,即通过特殊符号(如特定设计的一种标记、记号)对数字或文字型商品代码(即标志)进行标记以便进行定位,通过图像识别方法处理摄像机获取的图片或图像。在图像处理环节,首先经边缘检测、直线拟合及模板匹配等方式以获得商品代码的位置和尺寸;然后使用光学字符识别出商品代码。
本申请的该具体实施方式的标志识别处理***,如图2所示,以商品为目标物。由图像获模块201、图像的特殊标记匹配模块203、标志定位模块205、图像的字符识别模块207。
图像获取模块201,基于移动设备(终端)或其他移动平台,用扫描、拍摄/摄像、下载等方式获得商品的图像(即准备处理的图片),如用手机的摄像机获取诸如商品图片,或摄取/下载广告中的诸如商品图片等即包含目标物图像的原图。所述移动终端是利用扫描仪、摄像机或网络下载,获取待处理图像;获取的待处理图像可以是诸如商品图片即包含目标物图像的原图。所述标志是目标物的标志如所述商品图片的附近或内部的商品代码。商品代码是数字型或文字型的字符、或图像型等。
图像的特殊标记匹配模块203,在获取的图片中,匹配特殊标记。特殊标记是与目标物的标志如商品代码绑定的,预先设置好的,在商品代码(标志)设计的时候先定义好(之后可以一起印刷等)。对原图直接检测特殊标记,从而利用特殊标记在复杂背景的图像(图片)中定位(检测)要识别的商品图像(图片)上的商品代码。如图4所示的编码示例“1234567”数字型标志,检测到该特殊标记则能确定此处有商品代码。二者有固定的关系,如:只要是标志,其旁边、其前或其某个确定的位置处就设计有该特殊标记。
事先设计有带黑框的特殊标记(图4、图5),作为定位商品代码(目标物的标志)的特殊标记。该黑框内也会包括字符、文字、图像(如某商家logo)等。用于定位标志的特殊标记可以定义为黑框结合内容(如黑框+内部图片)的形式(内部图片如各种字符或图形图像符号)。
该特殊标记可以根据但不限于商品图像附近或图像内的商品代码(如:数字型代码、文字型代码、图像型代码(如商家LOGO)等标志)的字符、文字或图像的结构和/或特征(如:长度、宽度、大小、尺寸、方向、位置、色彩、灰度、亮度、等等)来预先设计。例如图4中的根据需要设置有“t”符号在内的黑框这种图形符号,“t”字也可以设计以适应外观的要求。
该特殊标记还可以利用图像处理算法中,会对图像中的像素逐行扫描的原理,设计样式固定的有规则的像素的两组黑白比例关系的区域作为的特殊标记图样。这样,经逐行扫描发现存在按黑白比的规则设定的至少一行像素的图像特征区域,在待处理图像中检测所述特殊标记包括直接检测符合上述黑白比的图像特征区域。
按黑白比的规则设定的至少一行像素的图像特征区域,通常,可以设定两行或两行以上的像素,黑白比分别为1∶1∶3∶1∶1和1∶2∶1∶2∶1。比如:(1)相邻或非相邻两行像素,每行像素的连续或非连续像素出现了黑白比,一行为1∶1∶3∶1∶1、一行为1∶2∶1∶2∶1;相邻或非相邻的多行(两行以上)等,有几行的连续或非连续的像素出现的黑白比为1∶1∶3∶1∶1、另外有几行连续或非连续的像素出现的黑白比为1∶2∶1∶2∶1。也就是说,该黑白比的图像特征区域设定:可以是一行、相邻或非相邻的两行、或者,相邻或非相邻的多行(两行以上)等情况;可能有多行符合1∶1∶3∶1∶1、然后又有多行符合1∶2∶1∶2∶1;另外,黑白比规则的像素,也不一定是该行像素中的连续像素,只要接连有几个像素的黑白比例符合这种定义就可以(只要连续像素的黑白比例符合这种定义即可)。比如说,有五个像素黑,五个像素白,然后十五个像素黑,五个像素白,五个像素黑(这个可以随着标记大小的变化而变化),也是符合1∶1∶3∶1∶1的比例的。而图像特征区域就可以设计为该有该像素黑白比规则的黑框结合内部内容的形式(也随需要标记的大小变化)。
例如图5中的示意的黑框+“T”两组黑白比区域图样,是有两行像素的黑白比固定其图样设计规则为,一行有黑白比1∶1∶3∶1∶1(即该行像素会有:1个黑像素、1个白像素、3个黑像素、1个白像素、1个黑像素)的像素情况,另一行(图5所示下方一行)有黑白比1∶2∶1∶2∶1(即该行像素出现:1个黑像素、2个白像素、1个黑像素、2个白像素、1个黑像素)的像素情况。在图像处理时,只要扫描图像时发现有两行像素所在区域有这样两组黑白比的情况存在,就可以确定此处区域为特殊标记。特殊标记的图样根据该比例设计,不限于图5所示图样只是必须满足上述两行像素中的两组黑白比例规则。
图4给出了一种检测(匹配和定位)方式:
在匹配特殊标记前,预设黑框及其内部内容(内部内容是根据情况或需求可设计的,如“t”字符)作为特殊标记;
先检测属于特殊标记的黑框是否存在,如果存在,然后匹配黑框中的内容,如“t”符,由此确定特殊标记在此。由于标记和标志绑定,有该特殊标记就有相应的目标物的标志(商品代码),因而此处是商品代码所在区域,由此实现定位目标物的标志(如该商品代码)。如果不存在黑框或内容不匹配可以表示原图上没有目标物的标志。
图5给出了一种检测(匹配和定位)速度和运算速度更快捷、更准确的特殊标记检测方式:
在匹配特殊标记之前,预设至少一行、两行或多行像素的两组黑白比(如上所述数字比例)规则的图样,表示按照该规则设计的图或满足该规则的区域为特殊标记,后面以两行像素为例进行说明;
在原图中寻找(图像处理算法中逐行扫描像素),发现符合预设的固定样式规则的两行像素的两组黑白比例区域。如直接在图片中寻找两行像素的黑白比符合1∶1∶3∶1∶1(上行像素黑白比)以及1∶2∶1∶2∶1(下行像素黑白比)的图像特征区域。从而利用直接在图像上检测具有所述数字比例的图像特征区域,找到所述图像特征区域即实现了特殊标记的匹配,检测到该特殊标记则能够定位所述标志在哪个位置。
图5的方式无需寻找黑框等图形图像,只需要在通常的图像处理扫描过程中寻找符合规定的像素黑白比例定义的图样,就能确定由该比例定义的特殊标记,因而该方式检测速度能更快、检测结果更准确,实现起来更简单,称快速定位法。
在该图像的特殊标记匹配模块203中,基于所述特殊标记,其检测、匹配和定位的算法,可以采用边缘检测、直线拟合以及模板匹配算法,以确定目标物的标志(商品代码)的位置和尺寸。
标志定位模块205,能根据定位的标志位置和尺寸切割(分割)标志即商品代码的区域。分出商品代码区域的图像,并能传送给字符识别模块207
图像的字符识别模块207,接收来自标志定位模块205的分出区域,对分出的区域进行识别,如识别出商品代码的数字“1234567”等。这里可以使用OCR光学字符识别算法,使用OCR识别分割出的区域中的标志的内容,包括识别出数字型、文字型字符,或图像型符号等。
下面将根据图3,以商品的商品代码为例,对本申请的标志识别处理***的流程,即标志识别处理方法,进行描述,方法的步骤中,不再对***的模块功能重复描述。
图像获取步骤301,通过手机等移动设备获得要处理的图像/图片述。所述移动终端是利用扫描仪、摄像机或网络下载,获取待处理图像;获取的待处理图像是商品图片;所述标志是所述商品图片的附近或内部的商品编码。商品编码是数字型或文字型的字符。具体参见模块201的描述。
在特殊标记设置步骤303,预先构造用于在上述获取的、具有复杂背景的图片中使用的特殊标记,绑定商品代码。特殊标记可以是图形符号(如图4所示黑框和其内部),或者是黑白比规则固定样式的至少一行、两行或多行像素的图像特征区域(如图5所示按两组黑白比规则1∶1∶3∶1∶1以及1∶2∶1∶2∶1设计的黑框图区域)。具体参见模块203的描述的标记设计方式(图4、图5)。
在特殊的标记检测和匹配步骤305,通过对特殊标记进行检测(定位和匹配),如对图上的图形符号边框检测(黑框),然后匹配黑框中的“t”字(图4所述方式);或者直接在图片上找符合预设比例的图像特征区域(如图5所述方式)。
方式一:当采用图形符号形式的特殊标记时,特殊标记是带黑框及其内有字符的图形符号;检测黑框并匹配其框内的内容,确定检测到特殊标记;由于特殊标记与所述待处理图像的(目标物)标志如商品代码绑定,则找到特殊标记就能定位到该商品代码(标志)。
方式二,又称快速定位法:当特殊标记特殊标记采用上述特定的数字比设计时,直接在图像上检测(逐行扫描像素时寻找)具有所述数字比的图像特征区域,找到所述图像特征区域即实现了所述标志与特殊标记的匹配,并定位所述标志。
具体参见模块203的两种检测(匹配和定位)方式的描述。
上述步骤305基于所述特殊标记的检测、匹配和定位,是根据边缘检测、直线拟合以及模板匹配算法来确定标志的位置和尺寸。
标志定位步骤307,根据步骤305所定位的标志(如商品代码)的位置,切割商品代码的所在区域。
处理步骤309,实现图像的字符识别和后续处理。根据步骤307获得的商品代码区域的图像(对分出的区域)进行识别,如识别出商品代码的数字等。这里可以使用OCR光学字符识别算法,使用OCR识别分割出的区域中的标志的内容包括识别出数字型、文字型字符,或图像型符号等。
判定全部完成步骤311,判断获取的、要识别的图像已经全部完成,不再识别后面的其他图像或图片等,则结束该流程,否则返回开始继续进行识别。
本申请的***及其方法通过特定的标记符号来确定复杂图像中的特定区域,提供了一种快速简易有效准确的图像内容以识别技术。
本说明书中的各个实施例一般采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块或单元。一般地,程序模块或单元可以包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。一般来说,程序模块或单元可以由软件、硬件或两者的结合来实现。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块或单元可以位于包括存储设备在内的本地和远程计算机存储介质中。
最后,还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其主要思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (14)
1.一种基于移动终端的标志识别处理***,其特征在于,包括:
图像获取模块,用于通过移动终端获取待处理图像;
特殊标记匹配模块,用于在获取的待处理图像中检测预设于所述标志的固定位置的特殊标记,以定位所述标志:
当获取待处理图像后,在所述待处理图像中检测所述特殊标记,若匹配上所述特殊标记表明检测到所述特殊标记,则定位所述标志;
标志定位模块,用于根据定位的所述标志的位置,分割出标志所在区域;
字符识别模块,识别分割出的所述标志所在区域中的标志的内容。
2.如权利要求1所述的***,其特征在于,
所述特殊标记定义为黑框结合内部图片,内部图片在检测所述特殊标记时用于所述匹配;
在待处理图像中检测所述特殊标记包括:先检测到所述黑框,再匹配所述内部图片,如果内部图片匹配上则表明匹配上所述特殊标记。
3.如权利要求1所述的***,其特征在于,
所述特殊标记包括:经逐行扫描发现存在按黑白比的规则设定的至少一行、两行或多行像素的图像特征区域;
在待处理图像中检测所述特殊标记包括:直接检测符合上述黑白比的图像特征区域。
4.如权利要求3所述的***,其特征在于,所述按黑白比的规则设定的至少一行、两行或多行像素的图像特征区域还包括:其中,
设定两行或多行像素,出现像素的黑白比规则分别为1∶1∶3∶1∶1和1∶2∶1∶2∶1;
图像特征区域设计为黑框结合内部内容。
5.如权利要求2或3所述的***,其特征在于,所述标志的固定位置包括:在所述标志前或在所述标志后。
6.如权利要求1所述的***,其特征在于,获取的待处理图像是商品图片;所述标志是所述商品图片的附近或内部的商品代码;商品代码包括字符或数字字符,和/或图像。
7.如权利要求1所述的***,其特征在于,字符识别模块还包括:使用OCR识别分割出的区域中的标志的内容。
8.一种基于移动终端的标志识别处理方法,其特征在于,包括:
通过移动终端获得待处理图像;
当获取待处理图像后,在所述待处理图像中检测预设于所述标志的固定位置的特殊标记,若匹配上所述特殊标记表明检测到所述特殊标记,则定位所述标志;
根据定位的所述标志的位置,分割出标志所在区域;
识别分割出的所述标志所在区域中的标志的内容。
9.如权利要求8所述的方法,其特征在于,
所述特殊标记定义为黑框结合内部图片,内部图片在检测所述特殊标记时用于所述匹配;
在待处理图像中检测所述特殊标记包括:先检测到所述黑框,再匹配所述内部图片,如果内部图片匹配上则表明匹配上所述特殊标记。
10.如权利要求8所述的方法,其特征在于,
所述特殊标记包括:经逐行扫描发现存在按黑白比的规则设定的至少一行、两行或多行像素的图像特征区域;
在待处理图像中检测所述特殊标记包括:直接检测符合上述黑白比的图像特征区域。
11.如权利要求10所述的方法,其特征在于,所述按黑白比的规则设定的至少一行、两行或多行像素的图像特征区域还包括:其中,
设定两行或多行像素,出现像素的黑白比规则分别为1∶1∶3∶1∶1和1∶2∶1∶2∶1;
图像特征区域设计为黑框结合内部内容。
12.如权利要求9或10所述的方法,其特征在于,所述标志的固定位置包括:在所述标志前或在所述标志后。
13.如权利要求8所述的方法,其特征在于,获取的待处理图像是商品图片;所述标志是所述商品图片的附近或内部的商品代码;商品代码包括字符或数字字符,和/或图像。
14.如权利要求8所述的方法,其特征在于,识别步骤还包括:使用OCR识别分割出的区域中的标志的内容。
Priority Applications (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210360774.6A CN103679164A (zh) | 2012-09-21 | 2012-09-21 | 一种基于移动终端的标志识别处理方法和*** |
TW101146907A TWI631514B (zh) | 2012-09-21 | 2012-12-12 | Method and system for marking recognition based on mobile terminal |
US14/021,564 US8971620B2 (en) | 2012-09-21 | 2013-09-09 | Detecting a label from an image |
JP2015533106A JP5972468B2 (ja) | 2012-09-21 | 2013-09-10 | 画像からのラベルの検出 |
PCT/US2013/059054 WO2014046918A1 (en) | 2012-09-21 | 2013-09-10 | Detecting a label from an image |
US14/602,021 US9811749B2 (en) | 2012-09-21 | 2015-01-21 | Detecting a label from an image |
JP2016137232A JP2016201126A (ja) | 2012-09-21 | 2016-07-12 | 画像からのラベルの検出 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210360774.6A CN103679164A (zh) | 2012-09-21 | 2012-09-21 | 一种基于移动终端的标志识别处理方法和*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103679164A true CN103679164A (zh) | 2014-03-26 |
Family
ID=50316654
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210360774.6A Pending CN103679164A (zh) | 2012-09-21 | 2012-09-21 | 一种基于移动终端的标志识别处理方法和*** |
Country Status (5)
Country | Link |
---|---|
US (2) | US8971620B2 (zh) |
JP (2) | JP5972468B2 (zh) |
CN (1) | CN103679164A (zh) |
TW (1) | TWI631514B (zh) |
WO (1) | WO2014046918A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107209862A (zh) * | 2015-01-21 | 2017-09-26 | 国立大学法人东京农工大学 | 程序、信息存储介质以及识别装置 |
CN108345895A (zh) * | 2017-01-22 | 2018-07-31 | 上海分泽时代软件技术有限公司 | 广告图像识别方法以及广告图像识别*** |
CN112926683A (zh) * | 2021-03-29 | 2021-06-08 | 中国建设银行股份有限公司 | 一种对象识别方法和装置 |
CN113033588A (zh) * | 2019-12-24 | 2021-06-25 | 中移雄安信息通信科技有限公司 | 一种图像处理方法及电子设备 |
Families Citing this family (64)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9613267B2 (en) * | 2012-05-31 | 2017-04-04 | Xerox Corporation | Method and system of extracting label:value data from a document |
US9087272B2 (en) * | 2013-07-17 | 2015-07-21 | International Business Machines Corporation | Optical match character classification |
US9245192B2 (en) * | 2013-09-20 | 2016-01-26 | Here Global B.V. | Ad collateral detection |
KR102209729B1 (ko) * | 2014-04-04 | 2021-01-29 | 삼성전자주식회사 | 인식 영역에 기반하여 콘텐트를 검출하는 전자 장치 및 방법 |
GB2526102B (en) * | 2014-05-13 | 2020-09-23 | Grass Valley Ltd | Logo detection by edge matching |
CN105303189B (zh) * | 2014-07-29 | 2019-08-20 | 阿里巴巴集团控股有限公司 | 一种用于检测预定区域中特定标识图像的方法及装置 |
CN105608459B (zh) * | 2014-10-29 | 2018-09-14 | 阿里巴巴集团控股有限公司 | 商品图片的分割方法及其装置 |
US9892478B2 (en) | 2015-03-06 | 2018-02-13 | Digimarc Corporation | Digital watermarking applications |
US10467284B2 (en) | 2015-08-03 | 2019-11-05 | Google Llc | Establishment anchoring with geolocated imagery |
US9690967B1 (en) | 2015-10-29 | 2017-06-27 | Digimarc Corporation | Detecting conflicts between multiple different encoded signals within imagery |
US10262176B1 (en) | 2016-02-23 | 2019-04-16 | Digimarc Corporation | Scanner with control logic for resolving package labeling |
US10198782B1 (en) * | 2016-09-15 | 2019-02-05 | Digimarc Corporation | Detecting conflicts between multiple different encoded signals within imagery |
US11042161B2 (en) | 2016-11-16 | 2021-06-22 | Symbol Technologies, Llc | Navigation control method and apparatus in a mobile automation system |
US20180314908A1 (en) * | 2017-05-01 | 2018-11-01 | Symbol Technologies, Llc | Method and apparatus for label detection |
US11367092B2 (en) | 2017-05-01 | 2022-06-21 | Symbol Technologies, Llc | Method and apparatus for extracting and processing price text from an image set |
US10726273B2 (en) | 2017-05-01 | 2020-07-28 | Symbol Technologies, Llc | Method and apparatus for shelf feature and object placement detection from shelf images |
WO2018204342A1 (en) | 2017-05-01 | 2018-11-08 | Symbol Technologies, Llc | Product status detection system |
DE112018002314T5 (de) | 2017-05-01 | 2020-01-23 | Symbol Technologies, Llc | Verfahren und vorrichtung zur erkennung eines objektstatus |
US10949798B2 (en) | 2017-05-01 | 2021-03-16 | Symbol Technologies, Llc | Multimodal localization and mapping for a mobile automation apparatus |
US11449059B2 (en) | 2017-05-01 | 2022-09-20 | Symbol Technologies, Llc | Obstacle detection for a mobile automation apparatus |
US10591918B2 (en) | 2017-05-01 | 2020-03-17 | Symbol Technologies, Llc | Fixed segmented lattice planning for a mobile automation apparatus |
US10505057B2 (en) | 2017-05-01 | 2019-12-10 | Symbol Technologies, Llc | Device and method for operating cameras and light sources wherein parasitic reflections from a paired light source are not reflected into the paired camera |
US10663590B2 (en) | 2017-05-01 | 2020-05-26 | Symbol Technologies, Llc | Device and method for merging lidar data |
US11600084B2 (en) | 2017-05-05 | 2023-03-07 | Symbol Technologies, Llc | Method and apparatus for detecting and interpreting price label text |
US10521914B2 (en) | 2017-09-07 | 2019-12-31 | Symbol Technologies, Llc | Multi-sensor object recognition system and method |
US10572763B2 (en) | 2017-09-07 | 2020-02-25 | Symbol Technologies, Llc | Method and apparatus for support surface edge detection |
TWI649698B (zh) | 2017-12-21 | 2019-02-01 | 財團法人工業技術研究院 | 物件偵測裝置、物件偵測方法及電腦可讀取媒體 |
US10823572B2 (en) | 2018-04-05 | 2020-11-03 | Symbol Technologies, Llc | Method, system and apparatus for generating navigational data |
US11327504B2 (en) | 2018-04-05 | 2022-05-10 | Symbol Technologies, Llc | Method, system and apparatus for mobile automation apparatus localization |
US10832436B2 (en) | 2018-04-05 | 2020-11-10 | Symbol Technologies, Llc | Method, system and apparatus for recovering label positions |
US10740911B2 (en) | 2018-04-05 | 2020-08-11 | Symbol Technologies, Llc | Method, system and apparatus for correcting translucency artifacts in data representing a support structure |
US10809078B2 (en) | 2018-04-05 | 2020-10-20 | Symbol Technologies, Llc | Method, system and apparatus for dynamic path generation |
US11506483B2 (en) | 2018-10-05 | 2022-11-22 | Zebra Technologies Corporation | Method, system and apparatus for support structure depth determination |
US11010920B2 (en) | 2018-10-05 | 2021-05-18 | Zebra Technologies Corporation | Method, system and apparatus for object detection in point clouds |
GB201817808D0 (en) * | 2018-10-31 | 2018-12-19 | Ishida Europe Ltd | Method and apparatus for inspecting a label attached to a food pack |
US11003188B2 (en) | 2018-11-13 | 2021-05-11 | Zebra Technologies Corporation | Method, system and apparatus for obstacle handling in navigational path generation |
US11090811B2 (en) | 2018-11-13 | 2021-08-17 | Zebra Technologies Corporation | Method and apparatus for labeling of support structures |
US11079240B2 (en) | 2018-12-07 | 2021-08-03 | Zebra Technologies Corporation | Method, system and apparatus for adaptive particle filter localization |
US11416000B2 (en) | 2018-12-07 | 2022-08-16 | Zebra Technologies Corporation | Method and apparatus for navigational ray tracing |
US11100303B2 (en) | 2018-12-10 | 2021-08-24 | Zebra Technologies Corporation | Method, system and apparatus for auxiliary label detection and association |
US11015938B2 (en) | 2018-12-12 | 2021-05-25 | Zebra Technologies Corporation | Method, system and apparatus for navigational assistance |
US10731970B2 (en) | 2018-12-13 | 2020-08-04 | Zebra Technologies Corporation | Method, system and apparatus for support structure detection |
TWI703508B (zh) * | 2018-12-19 | 2020-09-01 | 洽吧智能股份有限公司 | 字元影像識別方法與系統 |
CA3028708A1 (en) | 2018-12-28 | 2020-06-28 | Zih Corp. | Method, system and apparatus for dynamic loop closure in mapping trajectories |
US11250535B1 (en) | 2019-02-08 | 2022-02-15 | Digimarc Corporation | Detecting conflicts between multiple different encoded signals within imagery, using only a subset of available image data, and robustness checks |
US10789438B1 (en) | 2019-02-08 | 2020-09-29 | Digimarc Corporation | Detecting conflicts between multiple different encoded signals within imagery, using only a subset of available image data |
US11341663B2 (en) | 2019-06-03 | 2022-05-24 | Zebra Technologies Corporation | Method, system and apparatus for detecting support structure obstructions |
US11960286B2 (en) | 2019-06-03 | 2024-04-16 | Zebra Technologies Corporation | Method, system and apparatus for dynamic task sequencing |
US11080566B2 (en) | 2019-06-03 | 2021-08-03 | Zebra Technologies Corporation | Method, system and apparatus for gap detection in support structures with peg regions |
US11662739B2 (en) | 2019-06-03 | 2023-05-30 | Zebra Technologies Corporation | Method, system and apparatus for adaptive ceiling-based localization |
US11200677B2 (en) | 2019-06-03 | 2021-12-14 | Zebra Technologies Corporation | Method, system and apparatus for shelf edge detection |
US11402846B2 (en) | 2019-06-03 | 2022-08-02 | Zebra Technologies Corporation | Method, system and apparatus for mitigating data capture light leakage |
US11151743B2 (en) | 2019-06-03 | 2021-10-19 | Zebra Technologies Corporation | Method, system and apparatus for end of aisle detection |
WO2021054850A1 (ru) * | 2019-09-17 | 2021-03-25 | Публичное Акционерное Общество "Сбербанк России" | Способ и система интеллектуальной обработки документа |
CN111091532B (zh) * | 2019-10-30 | 2023-07-18 | 中国四维测绘技术有限公司 | 一种基于多层感知机的遥感影像色彩评价方法和*** |
US11507103B2 (en) | 2019-12-04 | 2022-11-22 | Zebra Technologies Corporation | Method, system and apparatus for localization-based historical obstacle handling |
US11107238B2 (en) | 2019-12-13 | 2021-08-31 | Zebra Technologies Corporation | Method, system and apparatus for detecting item facings |
US11822333B2 (en) | 2020-03-30 | 2023-11-21 | Zebra Technologies Corporation | Method, system and apparatus for data capture illumination control |
US11450024B2 (en) | 2020-07-17 | 2022-09-20 | Zebra Technologies Corporation | Mixed depth object detection |
US11593915B2 (en) | 2020-10-21 | 2023-02-28 | Zebra Technologies Corporation | Parallax-tolerant panoramic image generation |
US11392891B2 (en) | 2020-11-03 | 2022-07-19 | Zebra Technologies Corporation | Item placement detection and optimization in material handling systems |
US11847832B2 (en) | 2020-11-11 | 2023-12-19 | Zebra Technologies Corporation | Object classification for autonomous navigation systems |
US11954882B2 (en) | 2021-06-17 | 2024-04-09 | Zebra Technologies Corporation | Feature-based georegistration for mobile computing devices |
WO2024049421A1 (en) * | 2022-08-31 | 2024-03-07 | Surgibox Inc. | Blockchain systems and methods for verifying the certifications and the authenticity of commercial products |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4776464A (en) * | 1985-06-17 | 1988-10-11 | Bae Automated Systems, Inc. | Automated article handling system and process |
US5081685A (en) * | 1988-11-29 | 1992-01-14 | Westinghouse Electric Corp. | Apparatus and method for reading a license plate |
FR2657982B1 (fr) | 1990-02-02 | 1992-11-27 | Cga Hbs | Procede de localisation d'adresse sur des articles a trier, etiquette d'adressage et dispositif de mise en óoeuvre du procede. |
US5060980A (en) | 1990-05-30 | 1991-10-29 | Xerox Corporation | Form utilizing encoded indications for form field processing |
JPH06339026A (ja) * | 1993-05-31 | 1994-12-06 | Matsushita Electric Ind Co Ltd | 補正データ生成装置 |
JPH0793473A (ja) * | 1993-09-21 | 1995-04-07 | Hitachi Eng Co Ltd | 文字領域割り出し方法 |
JP3726395B2 (ja) | 1997-01-30 | 2005-12-14 | 株式会社デンソー | 2次元コードおよび2次元コードの読取方法 |
JPH1154407A (ja) * | 1997-08-05 | 1999-02-26 | Nikon Corp | 位置合わせ方法 |
JP4054428B2 (ja) * | 1998-02-05 | 2008-02-27 | キヤノン株式会社 | 画像検索装置及びその方法、コンピュータ可読メモリ |
US6360001B1 (en) | 2000-05-10 | 2002-03-19 | International Business Machines Corporation | Automatic location of address information on parcels sent by mass mailers |
US7130466B2 (en) * | 2000-12-21 | 2006-10-31 | Cobion Ag | System and method for compiling images from a database and comparing the compiled images with known images |
EP1423833A4 (en) * | 2001-07-18 | 2008-07-02 | Hyunjae Tech Co Ltd | SYSTEM FOR THE AUTOMATIC RECOGNITION OF IDENTIFICATION OF OTHER VEHICLES ON OBSERVATIVES AND METHOD THEREFOR |
CA2375355A1 (en) | 2002-03-11 | 2003-09-11 | Neo Systems Inc. | Character recognition system and method |
US7328847B1 (en) * | 2003-07-30 | 2008-02-12 | Hewlett-Packard Development Company, L.P. | Barcode data communication methods, barcode embedding methods, and barcode systems |
US20050044758A1 (en) * | 2003-08-29 | 2005-03-03 | Richard Gary P. | More readily identifiable license plate |
JP4391839B2 (ja) * | 2004-01-30 | 2009-12-24 | 富士通株式会社 | 撮影条件設定プログラム、撮影条件設定方法および撮影条件設定装置 |
JP2006331322A (ja) | 2005-05-30 | 2006-12-07 | Fuji Electric Systems Co Ltd | 検索用タグ及びこれを使用した情報検索システム |
US7613328B2 (en) * | 2005-09-09 | 2009-11-03 | Honeywell International Inc. | Label detection |
CA2566260C (en) * | 2005-10-31 | 2013-10-01 | National Research Council Of Canada | Marker and method for detecting said marker |
JP4745830B2 (ja) * | 2006-01-05 | 2011-08-10 | キヤノン株式会社 | 画像処理装置、画像処理方法、コンピュータプログラム |
JP4670657B2 (ja) | 2006-01-24 | 2011-04-13 | 富士ゼロックス株式会社 | 画像処理装置、画像処理方法及びプログラム |
JP2007304864A (ja) * | 2006-05-11 | 2007-11-22 | Fuji Xerox Co Ltd | 文字認識処理システムおよび文字認識処理プログラム |
US8218821B2 (en) * | 2007-01-23 | 2012-07-10 | Pips Technology, Inc. | Video preprocessing of image information for character recognition |
US8285047B2 (en) * | 2007-10-03 | 2012-10-09 | Xerox Corporation | Automated method and system for naming documents from a scanned source based on manually marked text |
JP4711093B2 (ja) * | 2008-08-28 | 2011-06-29 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
JP4821869B2 (ja) | 2009-03-18 | 2011-11-24 | 富士ゼロックス株式会社 | 文字認識装置、画像読取装置、およびプログラム |
EP2415015B1 (en) * | 2009-03-30 | 2015-08-12 | Telefonaktiebolaget LM Ericsson (publ) | Barcode processing |
US8594422B2 (en) | 2010-03-11 | 2013-11-26 | Microsoft Corporation | Page layout determination of an image undergoing optical character recognition |
US9292565B2 (en) | 2010-06-30 | 2016-03-22 | International Business Machines Corporation | Template-based recognition of food product information |
EP2619711A4 (en) * | 2010-09-20 | 2017-06-07 | HID Global Corporation | Machine-readable symbols |
WO2012049795A1 (ja) * | 2010-10-12 | 2012-04-19 | パナソニック株式会社 | 表示処理装置、表示方法およびプログラム |
US8528820B2 (en) * | 2011-06-29 | 2013-09-10 | Symbol Technologies, Inc. | Object identification using barcode reader |
US20130279758A1 (en) * | 2012-04-23 | 2013-10-24 | Xerox Corporation | Method and system for robust tilt adjustment and cropping of license plate images |
-
2012
- 2012-09-21 CN CN201210360774.6A patent/CN103679164A/zh active Pending
- 2012-12-12 TW TW101146907A patent/TWI631514B/zh not_active IP Right Cessation
-
2013
- 2013-09-09 US US14/021,564 patent/US8971620B2/en active Active
- 2013-09-10 JP JP2015533106A patent/JP5972468B2/ja not_active Expired - Fee Related
- 2013-09-10 WO PCT/US2013/059054 patent/WO2014046918A1/en active Application Filing
-
2015
- 2015-01-21 US US14/602,021 patent/US9811749B2/en active Active
-
2016
- 2016-07-12 JP JP2016137232A patent/JP2016201126A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107209862A (zh) * | 2015-01-21 | 2017-09-26 | 国立大学法人东京农工大学 | 程序、信息存储介质以及识别装置 |
CN108345895A (zh) * | 2017-01-22 | 2018-07-31 | 上海分泽时代软件技术有限公司 | 广告图像识别方法以及广告图像识别*** |
CN113033588A (zh) * | 2019-12-24 | 2021-06-25 | 中移雄安信息通信科技有限公司 | 一种图像处理方法及电子设备 |
CN112926683A (zh) * | 2021-03-29 | 2021-06-08 | 中国建设银行股份有限公司 | 一种对象识别方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
US20140086483A1 (en) | 2014-03-27 |
JP2016201126A (ja) | 2016-12-01 |
JP2015529369A (ja) | 2015-10-05 |
JP5972468B2 (ja) | 2016-08-17 |
TW201413602A (zh) | 2014-04-01 |
TWI631514B (zh) | 2018-08-01 |
US8971620B2 (en) | 2015-03-03 |
US20150199581A1 (en) | 2015-07-16 |
WO2014046918A1 (en) | 2014-03-27 |
US9811749B2 (en) | 2017-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103679164A (zh) | 一种基于移动终端的标志识别处理方法和*** | |
US11380113B2 (en) | Methods for mobile image capture of vehicle identification numbers in a non-document | |
US11036949B2 (en) | Scanner with control logic for resolving package labeling conflicts | |
US9245203B2 (en) | Collecting information relating to identity parameters of a vehicle | |
US20170220886A1 (en) | Method and system for reading and validating identity documents | |
KR101461233B1 (ko) | 화상 처리 장치, 화상 처리 방법 및 기록 매체 | |
CN101855640B (zh) | 尤其是用于移动无线设备的图像分析方法 | |
EP1870858A2 (en) | Method of classifying colors of color based image code | |
US9171224B2 (en) | Method of improving contrast for text extraction and recognition applications | |
US20090148043A1 (en) | Method for extracting text from a compound digital image | |
KR101552525B1 (ko) | 폰트를 인식하고 폰트정보를 제공하는 시스템 및 그 방법 | |
JP2015032087A (ja) | ナンバープレート認識装置およびナンバープレート認識方法 | |
KR101842535B1 (ko) | 부호의 광학적 검출 방법 | |
US20160371543A1 (en) | Classifying document images based on parameters of color layers | |
Park et al. | Binarization of text region based on fuzzy clustering and histogram distribution in signboards | |
US7920742B2 (en) | Image processing apparatus, program and recording medium for document registration | |
Arai et al. | Method for extracting product information from TV commercial | |
Nor et al. | Image segmentation and text extraction: application to the extraction of textual information in scene images | |
US9292541B2 (en) | Method of providing online information using image information | |
KR20090123523A (ko) | 광학 문자 인식 시스템 및 방법 | |
CN113255657B (zh) | 票据表面刮痕检测方法、装置、电子设备、机器可读介质 | |
Razali et al. | Vision-based verification of authentic JAKIM Halal logo | |
Manger et al. | Filtering local features for logo detection and localization in sports videos | |
Kasar | Recognition of Seven-Segment Displays from Images of Digital Energy Meters | |
KR20240078529A (ko) | 전자도감 관상어 이미지 검색 서비스를 위한 이미지 프로세싱 기반 유사 관상어 이미지 탐색 시스템 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20140326 |
|
RJ01 | Rejection of invention patent application after publication |