CN106529609A - 一种基于神经网络结构的图像识别方法及装置 - Google Patents

一种基于神经网络结构的图像识别方法及装置 Download PDF

Info

Publication number
CN106529609A
CN106529609A CN201611122462.6A CN201611122462A CN106529609A CN 106529609 A CN106529609 A CN 106529609A CN 201611122462 A CN201611122462 A CN 201611122462A CN 106529609 A CN106529609 A CN 106529609A
Authority
CN
China
Prior art keywords
look
list item
image
network structure
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611122462.6A
Other languages
English (en)
Other versions
CN106529609B (zh
Inventor
丁岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201611122462.6A priority Critical patent/CN106529609B/zh
Publication of CN106529609A publication Critical patent/CN106529609A/zh
Application granted granted Critical
Publication of CN106529609B publication Critical patent/CN106529609B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于神经网络结构的图像识别方法,该方法包括以下步骤:根据图像识别指令,确定待识别的目标图像;针对预先获得的查找表集合中每个查找表,将目标图像的每个像素与该查找表的每个表项进行匹配,查找表集合包含多个具有不同内容的参考图像对应的查找表,每个查找表基于神经网络结构建立,每个查找表中的表项为神经网络结构的神经元;根据匹配结果,确定目标图像对应的参考图像。应用本发明实施例所提供的技术方案,基于神经网络结构进行图像识别,模拟了人脑的学习能力,使得图像识别更加准确。本发明还公开了一种基于神经网络结构的图像识别装置,具有相应的技术效果。

Description

一种基于神经网络结构的图像识别方法及装置
技术领域
本发明涉及计算机应用技术领域,特别是涉及一种基于神经网络结构的图像识别方法及装置。
背景技术
随着计算机应用技术的快速发展,图像识别技术的应用越来越广泛,对图像识别的需求也越来越多。比如在视频监控中,或者在签名比对中,都需要进行图像识别。
随着对人脑结构和神经网络的眼睛,技术人员已经了解并逐渐探索出人脑对信息的处理及工作方式。但基于神经网络结构如何进行图像的准确识别,是目前本领域技术人员亟需解决的技术问题。
发明内容
本发明的目的是提供一种基于神经网络结构的图像识别方法及装置,以基于神经网络结构对图像进行准确识别。
为解决上述技术问题,本发明提供如下技术方案:
一种基于神经网络结构的图像识别方法,包括:
根据图像识别指令,确定待识别的目标图像;
针对预先获得的查找表集合中每个查找表,将所述目标图像的每个像素与该查找表的每个表项进行匹配,所述查找表集合包含多个具有不同内容的参考图像对应的查找表,每个查找表基于神经网络结构建立,每个查找表中的表项为所述神经网络结构的神经元;
根据匹配结果,确定所述目标图像对应的参考图像。
在本发明的一种具体实施方式中,所述针对预先获得的查找表集合中每个查找表,将所述目标图像的每个像素与该查找表的每个表项进行匹配,包括:
针对预先获得的查找表集合中每个查找表,将所述目标图像的每个像素与该查找表中相应像素位置的表项进行比对;
针对该查找表中每个像素位置的表项,如果该像素位置的表项有过学习记录,则顺延至该查找表的该像素位置后方下一表项处做迭代匹配,直至达到预设深度处。
在本发明的一种具体实施方式中,还包括:
针对所述查找表集合中每个查找表,如果在设定时长内没有任何一个待识别的图像被识别为该查找表对应的参考图像,则在所述查找表集合中删除该查找表。
在本发明的一种具体实施方式中,针对任意一个参考图像,通过以下步骤预先获得该参考图像对应的查找表:
接收针对该参考图像的待学习的图像数据流,所述图像数据流中每个图像样本具有与该参考图像相同的内容;
针对所述图像数据流中的每个图像样本的每个像素,使用一个查找表中的相应像素位置的表项对该像素进行学习;
将学习后的查找表确定为该参考图像对应的查找表。
在本发明的一种具体实施方式中,所述针对所述图像数据流中的每个图像样本的每个像素,使用一个查找表中的相应像素位置的表项对该像素进行学习,包括:
如果在该像素位置的表项首次接受学习,则直接在该像素位置的表项处进行学习记录;
如果在该像素位置的表项非首次接受学习,则对该像素位置后方表项进行迭代学习,直至迭代至首次接受学习的表项。
一种基于神经网络结构的图像识别装置,包括:
目标图像确定模块,用于根据图像识别指令,确定待识别的目标图像;
表项匹配模块,用于针对预先获得的查找表集合中每个查找表,将所述目标图像的每个像素与该查找表的每个表项进行匹配,所述查找表集合包含多个具有不同内容的参考图像对应的查找表,每个查找表基于神经网络结构建立,每个查找表中的表项为所述神经网络结构的神经元;
参考图像确定模块,用于根据匹配结果,确定所述目标图像对应的参考图像。
在本发明的一种具体实施方式中,所述表项匹配模块,具体用于:
针对预先获得的查找表集合中每个查找表,将所述目标图像的每个像素与该查找表中相应像素位置的表项进行比对;
针对该查找表中每个像素位置的表项,如果该像素位置的表项有过学习记录,则顺延至该查找表的该像素位置后方下一表项处做迭代匹配,直至达到预设深度处。
在本发明的一种具体实施方式中,还包括查找表删除模块,用于:
针对所述查找表集合中每个查找表,如果在设定时长内没有任何一个待识别的图像被识别为该查找表对应的参考图像,则在所述查找表集合中删除该查找表。
在本发明的一种具体实施方式中,还包括查找表获得模块,用于针对任意一个参考图像,通过以下步骤预先获得该参考图像对应的查找表:
接收针对该参考图像的待学习的图像数据流,所述图像数据流中每个图像样本具有与该参考图像相同的内容;
针对所述图像数据流中的每个图像样本的每个像素,使用一个查找表中的相应像素位置的表项对该像素进行学习;
将学习后的查找表确定为该参考图像对应的查找表。
在本发明的一种具体实施方式中,所述查找表获得模块,具体用于:
如果在该像素位置的表项首次接受学习,则直接在该像素位置的表项处进行学习记录;
如果在该像素位置的表项非首次接受学习,则对该像素位置后方表项进行迭代学习,直至迭代至首次接受学习的表项。
应用本发明实施例所提供的技术方案,根据图像识别指令,可以确定待识别的目标图像,针对预先获得的查找表集合中每个查找表,将目标图像的每个像素与该查找表的每个表项进行匹配,根据匹配结果,可以确定目标图像对应的参考图像,即目标图像更像哪一个参考图像。查找表集合中的每个查找表基于神经网络结构建立,通过图像学习获得,该集合中包含多个具有不同内容的参考图像对应的查找表,每个查找表的表项为神经网络结构的神经元。基于神经网络结构进行图像识别,模拟了人脑的学习能力,使得图像识别更加准确。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中一种基于神经网络结构的图像识别方法的实施流程图;
图2为本发明实施例中一种图像识别***的结构示意图;
图3为本发明实施例中一种神经网络结构的示意图;
图4为本发明实施例中一个图像样本的示意图;
图5为本发明实施例中样本学习过程示意图;
图6为本发明实施例中图像识别过程示意图;
图7为本发明实施例中查找表读写示意图;
图8为本发明实施例中一种基于神经网络结构的图像识别装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1所示,为本发明实施例所提供的一种基于神经网络结构的图像识别方法的实施流程图,该方法可以包括以下步骤:
S110:根据图像识别指令,确定待识别的目标图像。
在本发明实施例中,控制单元可以通过前端接口单元接收图像识别指令,如图2所示。图像识别指令中可以携带待识别的目标图像。根据图像识别指令,可以确定待识别的目标图像。
前端接口可以解析上层指令,与其交互的可以是通用x86架构下的PCI-E(PCIExpress,新一代总线接口),还可以是ARM架构下AXI(Advancedextensible Interface,一种总线协议)等接口。
在接收到图像识别指令时,可以通过计算单元先对图像识别指令中的目标图像进行预处理,以达到加速识别的目的,如图2所示。比如,可以使用卷积特征提取算法,将高像素图像匹配至后端基于神经网络结构建立的查找表的规格,并使图像的轮廓更加清晰明显,或者,可以设定对识别图像的旋转识别模式,例如,预先获得的基于神经网络结构建立的查找表中学习过一个正立的字符图像“M”,则在接收到“W”时会将其识别为学习过的反转了180°的“M”,或者,可以标记学习和识别内容的颜色,区分识别图像的不同颜色代表的不同意义。
本发明实施例所基于的神经网络结构如图3所示,为一个立方体结构,立方体的三维坐标系分别为XwYhZd,其中每一个节点为一个神经元。在图3中,如果目标图像为64*64像素大小,则其每一个像素可以对应[X0,Y0]至[X63,Y63]相应像素位置的神经元。
确定待识别的目标图像后,可以继续执行步骤S120的操作。
S120:针对预先获得的查找表集合中每个查找表,将目标图像的每个像素与该查找表的每个表项进行匹配。
查找表集合包含多个具有不同内容的参考图像对应的查找表,每个查找表基于神经网络结构建立,每个查找表中的表项为神经网络结构的神经元。
在本发明实施例中,可以通过图像学习获得具有不同内容的参考图像对应的查找表,查找表是基于神经网络结构建立的。即,每个具有神经网络结构的查找表对应于具有不同内容的参考图像。多个查找表构成查找表集合。
在本发明的一种具体实施方式中,针对任意一个参考图像,可以通过以下步骤预先获得该参考图像对应的查找表:
第一个步骤:接收针对该参考图像的待学习的图像数据流,图像数据流中每个图像样本具有与该参考图像相同的内容;
第二个步骤:针对图像数据流中的每个图像样本的每个像素,使用一个查找表中的相应像素位置的表项对该像素进行学习;
第三个步骤:将学习后的查找表确定为该参考图像对应的查找表。
为便于描述,将上述三个步骤结合起来进行说明。
在实际应用中,可以通过前端接口接收针对参考图像的学习指令。学习指令中可以携带针对该参考图像的待学习的图像数据流。图像数据流中每个图像样本具有与该参考图像相同的内容,具体表现形式可能不同。图像数据流中可以包含参考图像的内容信息。
基于神经网络结构的查找表对图像数据流中的每个图像样本进行学习,并在相应表项中记录。针对图像数据流中的每个图像样本的每个像素,使用一个查找表中的相应像素位置的表项对该像素进行学习,获得图像含义、图像特征等信息,在学习过程中可以配置学习加权值。
具体的,如果在该像素位置的表项首次接受学习,则直接在该像素位置的表项处进行学习记录;如果在该像素位置的表项非首次接受学习,则对该像素位置后方表项进行迭代学习,直至迭代至首次接受学习的表项。
比如,图4为一个图像样本的示意图,对该图像样本进行学习,在图3所示的基于神经网络结构建立的查找表的相应像素位置的表项处进行学习记录,得到图3所示的学习记录结果。如果X2Y3Z1处的表项首次接受学习,则可以直接在该表项处进行学习记录,如果该表项非首次接受学习,则可以对Z轴方向表项,即X2Y3Z2处的表项进行迭代学习,直至迭代至首次接受学习的表项。
具体学习过程可以参考图5所示,配置相应学习参数后,进行样本学习,直至学习完成。样本学习时,首先根据索引查询查找表,根据配置写表项,确定表项是否有过记录,如果是,则修改报文准备查后一个表项,如果否,则学习完成。
通过学习记录,可以将学习后的查找表确定为该参考图像对应的查找表。
当要学习的图像样本不多时,可以自定义分布宽度和深度,达到快速学习的目的。
在本发明的一种具体实施方式中,在上述第二个步骤之前,还可以对图像数据流中的每个图像进行加速预处理。
具体的,可以参见识别过程的预处理过程,本发明实施例在此不再赘述。
针对预先获得的查找表集合中每个查找表,将目标图像的每个像素与该查找表的每个表项进行匹配。
在本发明的一种具体实施方式中,步骤S120可以包括以下步骤:
步骤一:针对预先获得的查找表集合中每个查找表,将目标图像的每个像素与该查找表中相应像素位置的表项进行比对;
步骤二:针对该查找表中每个像素位置的表项,如果该像素位置的表项有过学习记录,则顺延至该查找表的该像素位置后方下一表项处做迭代匹配,直至达到预设深度处。
为便于描述,将上述两个步骤结合起来进行说明。
针对预先获得查找表集合中每个查找表,该查找表对应于一个参考图像,其可以通过学习该参考图像的多种具有相同内容的变形图像获得。
将目标图像的每个像素对应至该查找表中相应像素位置的表项,并与相应像素位置的表项进行比对。针对该查找表中每个像素位置的表项,如果该像素位置的表项有过学习记录,则可以顺延至该查找表的该像素位置后方下一表项处做迭代匹配,即顺延至该查找表的Z轴后方下一表项处做迭代匹配,直至达到预设深度处。
针对目标图像的每个像素,通过将该像素与该查找表中相应像素位置的表项的匹配,可以得到该像素与每个相应表项的学习记录的匹配程度,最后可以得到可量化的匹配深度结果。
预设深度可以根据实际情况进行设定和调整,本发明实施例对此不做限制。
S130:根据匹配结果,确定目标图像对应的参考图像。
在步骤S120,针对预先获得的查找表集合中每个查找表,将目标图像的每个像素与该查找表的每个表项进行匹配,可以得到目标图像的每个像素与该查找表的匹配结果,根据匹配结果,可以确定目标图像对应的参考图像。
具体的,可以将匹配程度最大的查找表对应的参考图像确定为目标图像对应的参考图像。
具体的识别过程可以参考图6,输入识别图像后,通过查找表识别,识别完成返回结果。通过查找表识别时,首先根据索引查询查找表,分析表项,确定表项是否有过记录,如果是,则修改报文准备查后一个表项,如果否,则识别完成。
读写查找表示意图如图7所示,表请求模块Tbl_req在一个像素信息输入后发出一个读表项的请求发送给DDR接口Ddr_if,DDR接口Ddr_if会从DDR里读出数据,返回给表确认模块Tbl_act进行匹配或者学习,在返回的时候要把迭代后的数据再写回到DDR的表项里面。
本发明实施例对图像的识别过程,是模拟人脑的学习能力,实现对学习过的图像得到目标图像更“像”哪一个,而不是“是”哪一个,实现一个图像在对学习过的信息中匹配识别得到一个可以量化的学习深度,达到识别图像的目的。
应用本发明实施例所提供的方法,根据图像识别指令,可以确定待识别的目标图像,针对预先获得的查找表集合中每个查找表,将目标图像的每个像素与该查找表的每个表项进行匹配,根据匹配结果,可以确定目标图像对应的参考图像,即目标图像更像哪一个参考图像。查找表集合中的每个查找表基于神经网络结构建立,通过图像学习获得,该集合中包含多个具有不同内容的参考图像对应的查找表,每个查找表的表项为神经网络结构的神经元。基于神经网络结构进行图像识别,模拟了人脑的学习能力,使得图像识别更加准确。
在本发明的一个实施例中,该方法还可以包括以下步骤:
针对查找表集合中每个查找表,如果在设定时长内没有任何一个目标图像被识别为该查找表对应的参考图像,则在查找表集合中删除该查找表。
具体的,可以通过配置记忆遗忘速率参数,模拟对学习图像的遗忘特征,将查找表集合中长期未使用的查找表进行删除操作,以在对图像进行识别时,节省匹配时间,提高识别效率。
相应于上面的方法实施例,本发明实施例还提供了一种基于神经网络结构的图像识别装置,下文描述的一种基于神经网络结构的图像识别装置与上文描述的一种基于神经网络结构的图像识别方法可相互对应参照。
参见图4所示,该装置包括以下模块:
目标图像确定模块210,用于根据图像识别指令,确定待识别的目标图像;
表项匹配模块220,用于针对预先获得的查找表集合中每个查找表,将目标图像的每个像素与该查找表的每个表项进行匹配,查找表集合包含多个具有不同内容的参考图像对应的查找表,每个查找表基于神经网络结构建立,每个查找表中的表项为神经网络结构的神经元;
参考图像确定模块230,用于根据匹配结果,确定目标图像对应的参考图像。
应用本发明实施例所提供的装置,根据图像识别指令,可以确定待识别的目标图像,针对预先获得的查找表集合中每个查找表,将目标图像的每个像素与该查找表的每个表项进行匹配,根据匹配结果,可以确定目标图像对应的参考图像,即目标图像更像哪一个参考图像。查找表集合中的每个查找表基于神经网络结构建立,通过图像学习获得,该集合中包含多个具有不同内容的参考图像对应的查找表,每个查找表的表项为神经网络结构的神经元。基于神经网络结构进行图像识别,模拟了人脑的学习能力,使得图像识别更加准确。
在本发明的一种具体实施方式中,表项匹配模块220,具体用于:
针对预先获得的查找表集合中每个查找表,将目标图像的每个像素与该查找表中相应像素位置的表项进行比对;
针对该查找表中每个像素位置的表项,如果该像素位置的表项有过学习记录,则顺延至该查找表的该像素位置后方下一表项处做迭代匹配,直至达到预设深度处。
在本发明的一种具体实施方式中,还包括查找表删除模块,用于:
针对查找表集合中每个查找表,如果在设定时长内没有任何一个待识别的图像被识别为该查找表对应的参考图像,则在查找表集合中删除该查找表。
在本发明的一种具体实施方式中,还包括查找表获得模块,用于针对任意一个参考图像,通过以下步骤预先获得该参考图像对应的查找表:
接收针对该参考图像的待学习的图像数据流,图像数据流中每个图像样本具有与该参考图像相同的内容;
针对图像数据流中的每个图像样本的每个像素,使用一个查找表中的相应像素位置的表项对该像素进行学习;
将学习后的查找表确定为该参考图像对应的查找表。
在本发明的一种具体实施方式中,查找表获得模块,具体用于:
如果在该像素位置的表项首次接受学习,则直接在该像素位置的表项处进行学习记录;
如果在该像素位置的表项非首次接受学习,则对该像素位置后方表项进行迭代学习,直至迭代至首次接受学习的表项。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的技术方案及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (10)

1.一种基于神经网络结构的图像识别方法,其特征在于,包括:
根据图像识别指令,确定待识别的目标图像;
针对预先获得的查找表集合中每个查找表,将所述目标图像的每个像素与该查找表的每个表项进行匹配,所述查找表集合包含多个具有不同内容的参考图像对应的查找表,每个查找表基于神经网络结构建立,每个查找表中的表项为所述神经网络结构的神经元;
根据匹配结果,确定所述目标图像对应的参考图像。
2.根据权利要求1所述的基于神经网络结构的图像识别方法,其特征在于,所述针对预先获得的查找表集合中每个查找表,将所述目标图像的每个像素与该查找表的每个表项进行匹配,包括:
针对预先获得的查找表集合中每个查找表,将所述目标图像的每个像素与该查找表中相应像素位置的表项进行比对;
针对该查找表中每个像素位置的表项,如果该像素位置的表项有过学习记录,则顺延至该查找表的该像素位置后方下一表项处做迭代匹配,直至达到预设深度处。
3.根据权利要求1所述的基于神经网络结构的图像识别方法,其特征在于,还包括:
针对所述查找表集合中每个查找表,如果在设定时长内没有任何一个待识别的图像被识别为该查找表对应的参考图像,则在所述查找表集合中删除该查找表。
4.根据权利要求1至3任一项所述的基于神经网络结构的图像识别方法,其特征在于,针对任意一个参考图像,通过以下步骤预先获得该参考图像对应的查找表:
接收针对该参考图像的待学习的图像数据流,所述图像数据流中每个图像样本具有与该参考图像相同的内容;
针对所述图像数据流中的每个图像样本的每个像素,使用一个查找表中的相应像素位置的表项对该像素进行学习;
将学习后的查找表确定为该参考图像对应的查找表。
5.根据权利要求4所述的基于神经网络结构的图像识别方法,其特征在于,所述针对所述图像数据流中的每个图像样本的每个像素,使用一个查找表中的相应像素位置的表项对该像素进行学习,包括:
如果在该像素位置的表项首次接受学习,则直接在该像素位置的表项处进行学习记录;
如果在该像素位置的表项非首次接受学习,则对该像素位置后方表项进行迭代学习,直至迭代至首次接受学习的表项。
6.一种基于神经网络结构的图像识别装置,其特征在于,包括:
目标图像确定模块,用于根据图像识别指令,确定待识别的目标图像;
表项匹配模块,用于针对预先获得的查找表集合中每个查找表,将所述目标图像的每个像素与该查找表的每个表项进行匹配,所述查找表集合包含多个具有不同内容的参考图像对应的查找表,每个查找表基于神经网络结构建立,每个查找表中的表项为所述神经网络结构的神经元;
参考图像确定模块,用于根据匹配结果,确定所述目标图像对应的参考图像。
7.根据权利要求6所述的基于神经网络结构的图像识别装置,其特征在于,所述表项匹配模块,具体用于:
针对预先获得的查找表集合中每个查找表,将所述目标图像的每个像素与该查找表中相应像素位置的表项进行比对;
针对该查找表中每个像素位置的表项,如果该像素位置的表项有过学习记录,则顺延至该查找表的该像素位置后方下一表项处做迭代匹配,直至达到预设深度处。
8.根据权利要求6所述的基于神经网络结构的图像识别装置,其特征在于,还包括查找表删除模块,用于:
针对所述查找表集合中每个查找表,如果在设定时长内没有任何一个待识别的图像被识别为该查找表对应的参考图像,则在所述查找表集合中删除该查找表。
9.根据权利要求6至8任一项所述的基于神经网络结构的图像识别装置,其特征在于,还包括查找表获得模块,用于针对任意一个参考图像,通过以下步骤预先获得该参考图像对应的查找表:
接收针对该参考图像的待学习的图像数据流,所述图像数据流中每个图像样本具有与该参考图像相同的内容;
针对所述图像数据流中的每个图像样本的每个像素,使用一个查找表中的相应像素位置的表项对该像素进行学习;
将学习后的查找表确定为该参考图像对应的查找表。
10.根据权利要求9所述的基于神经网络结构的图像识别装置,其特征在于,所述查找表获得模块,具体用于:
如果在该像素位置的表项首次接受学习,则直接在该像素位置的表项处进行学习记录;
如果在该像素位置的表项非首次接受学习,则对该像素位置后方表项进行迭代学习,直至迭代至首次接受学习的表项。
CN201611122462.6A 2016-12-08 2016-12-08 一种基于神经网络结构的图像识别方法及装置 Active CN106529609B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611122462.6A CN106529609B (zh) 2016-12-08 2016-12-08 一种基于神经网络结构的图像识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611122462.6A CN106529609B (zh) 2016-12-08 2016-12-08 一种基于神经网络结构的图像识别方法及装置

Publications (2)

Publication Number Publication Date
CN106529609A true CN106529609A (zh) 2017-03-22
CN106529609B CN106529609B (zh) 2019-11-01

Family

ID=58342338

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611122462.6A Active CN106529609B (zh) 2016-12-08 2016-12-08 一种基于神经网络结构的图像识别方法及装置

Country Status (1)

Country Link
CN (1) CN106529609B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108965687A (zh) * 2017-05-22 2018-12-07 阿里巴巴集团控股有限公司 拍摄方向识别方法、服务器及监控方法、***及摄像设备
CN109285539A (zh) * 2018-11-28 2019-01-29 中国电子科技集团公司第四十七研究所 一种基于神经网络的声音识别方法
WO2019076095A1 (zh) * 2017-10-20 2019-04-25 上海寒武纪信息科技有限公司 处理方法及装置
CN109697507A (zh) * 2017-10-24 2019-04-30 上海寒武纪信息科技有限公司 处理方法及装置
CN110162757A (zh) * 2019-04-29 2019-08-23 北京百度网讯科技有限公司 一种表格结构提取方法及***
KR20190104406A (ko) * 2017-10-20 2019-09-09 상하이 캠브리콘 인포메이션 테크놀로지 컴퍼니 리미티드 처리방법 및 장치
CN112149676A (zh) * 2020-09-11 2020-12-29 中国铁道科学研究院集团有限公司 一种铁路货物装载状态图像的小目标检测处理方法
CN114022357A (zh) * 2021-10-29 2022-02-08 北京百度网讯科技有限公司 图像重建方法、图像重建模型的训练方法、装置和设备
CN114885094A (zh) * 2022-03-25 2022-08-09 北京旷视科技有限公司 一种图像处理方法、图像处理器、图像处理模组及设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU3394193A (en) * 1992-03-13 1993-09-16 Pilkington Micro-Electronics Limited Improved artificial digital neuron, neural network and network training algorithm
BE1011273A4 (fr) * 1997-07-11 1999-07-06 Euresys Sa Procede et dispositif de reconnaissance en ligne des caracteres manuscrits.
CN1313975A (zh) * 1998-06-23 2001-09-19 英泰利克斯公司 基于n元组或随机存取存储器的神经网络分类***和方法
CN1625755A (zh) * 2002-04-12 2005-06-08 科学、技术与研究机构 通过多个面部原型合成的健壮面部注册
US20080204832A1 (en) * 2007-02-27 2008-08-28 Canon Kabushiki Kaisha Constructing a color transform using a neural network for colors outside the spectrum locus
CN101727472A (zh) * 2008-10-21 2010-06-09 联发科技股份有限公司 图像识别***以及图像识别方法
CN101916393A (zh) * 2010-07-14 2010-12-15 中国科学院半导体研究所 具有图像分割功能的脉冲耦合神经网络的实现电路
CN102262728A (zh) * 2011-07-28 2011-11-30 电子科技大学 一种道路交通标志的识别方法
JP5113810B2 (ja) * 2009-08-07 2013-01-09 日本電信電話株式会社 画像処理方法、画像処理装置及びひび割れ検知システム
US20160148078A1 (en) * 2014-11-20 2016-05-26 Adobe Systems Incorporated Convolutional Neural Network Using a Binarized Convolution Layer

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU3394193A (en) * 1992-03-13 1993-09-16 Pilkington Micro-Electronics Limited Improved artificial digital neuron, neural network and network training algorithm
BE1011273A4 (fr) * 1997-07-11 1999-07-06 Euresys Sa Procede et dispositif de reconnaissance en ligne des caracteres manuscrits.
CN1313975A (zh) * 1998-06-23 2001-09-19 英泰利克斯公司 基于n元组或随机存取存储器的神经网络分类***和方法
CN1625755A (zh) * 2002-04-12 2005-06-08 科学、技术与研究机构 通过多个面部原型合成的健壮面部注册
US20080204832A1 (en) * 2007-02-27 2008-08-28 Canon Kabushiki Kaisha Constructing a color transform using a neural network for colors outside the spectrum locus
CN101727472A (zh) * 2008-10-21 2010-06-09 联发科技股份有限公司 图像识别***以及图像识别方法
JP5113810B2 (ja) * 2009-08-07 2013-01-09 日本電信電話株式会社 画像処理方法、画像処理装置及びひび割れ検知システム
CN101916393A (zh) * 2010-07-14 2010-12-15 中国科学院半导体研究所 具有图像分割功能的脉冲耦合神经网络的实现电路
CN102262728A (zh) * 2011-07-28 2011-11-30 电子科技大学 一种道路交通标志的识别方法
US20160148078A1 (en) * 2014-11-20 2016-05-26 Adobe Systems Incorporated Convolutional Neural Network Using a Binarized Convolution Layer

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LUCIANE Y 等: "dynamic zoning selection for handwritten character recognition", 《PROGRESS IN PATTERN RECOGNITION, IMAGE ANALYSIS, COMPUTER VISION, AND APPLICATIONS》 *
孔月萍 等: "查找表与神经网络相结合的图像逆半调算法", 《计算机工程与科学》 *
王巍 等: "基于CNN的红外图像边缘检测算法的FPGA实现", 《光子学报》 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108965687A (zh) * 2017-05-22 2018-12-07 阿里巴巴集团控股有限公司 拍摄方向识别方法、服务器及监控方法、***及摄像设备
CN108965687B (zh) * 2017-05-22 2021-01-29 阿里巴巴集团控股有限公司 拍摄方向识别方法、服务器及监控方法、***及摄像设备
US10949995B2 (en) 2017-05-22 2021-03-16 Alibaba Group Holding Limited Image capture direction recognition method and server, surveillance method and system and image capture device
WO2019076095A1 (zh) * 2017-10-20 2019-04-25 上海寒武纪信息科技有限公司 处理方法及装置
KR20190104406A (ko) * 2017-10-20 2019-09-09 상하이 캠브리콘 인포메이션 테크놀로지 컴퍼니 리미티드 처리방법 및 장치
KR102434726B1 (ko) 2017-10-20 2022-08-19 상하이 캠브리콘 인포메이션 테크놀로지 컴퍼니 리미티드 처리방법 및 장치
CN109697507A (zh) * 2017-10-24 2019-04-30 上海寒武纪信息科技有限公司 处理方法及装置
CN109697507B (zh) * 2017-10-24 2020-12-25 安徽寒武纪信息科技有限公司 处理方法及装置
CN109285539B (zh) * 2018-11-28 2022-07-05 中国电子科技集团公司第四十七研究所 一种基于神经网络的声音识别方法
CN109285539A (zh) * 2018-11-28 2019-01-29 中国电子科技集团公司第四十七研究所 一种基于神经网络的声音识别方法
CN110162757A (zh) * 2019-04-29 2019-08-23 北京百度网讯科技有限公司 一种表格结构提取方法及***
CN110162757B (zh) * 2019-04-29 2023-08-18 北京百度网讯科技有限公司 一种表格结构提取方法及***
CN112149676A (zh) * 2020-09-11 2020-12-29 中国铁道科学研究院集团有限公司 一种铁路货物装载状态图像的小目标检测处理方法
CN112149676B (zh) * 2020-09-11 2024-04-30 中国铁道科学研究院集团有限公司 一种铁路货物装载状态图像的小目标检测处理方法
CN114022357A (zh) * 2021-10-29 2022-02-08 北京百度网讯科技有限公司 图像重建方法、图像重建模型的训练方法、装置和设备
CN114885094A (zh) * 2022-03-25 2022-08-09 北京旷视科技有限公司 一种图像处理方法、图像处理器、图像处理模组及设备
CN114885094B (zh) * 2022-03-25 2024-03-29 北京旷视科技有限公司 一种图像处理方法、图像处理器、图像处理模组及设备

Also Published As

Publication number Publication date
CN106529609B (zh) 2019-11-01

Similar Documents

Publication Publication Date Title
CN106529609A (zh) 一种基于神经网络结构的图像识别方法及装置
CN109359539B (zh) 注意力评估方法、装置、终端设备及计算机可读存储介质
CN110009027B (zh) 图像的比对方法、装置、存储介质及电子装置
US11080553B2 (en) Image search method and apparatus
CN110111248A (zh) 一种基于特征点的图像拼接方法、虚拟现实***、照相机
CN106200960A (zh) 电子互动产品的内容显示方法及装置
CN106202529A (zh) 一种页面渲染方法及装置
CN111309222B (zh) 一种滑块验证码的滑块缺口定位及拖动轨迹生成方法
CN110133443B (zh) 基于平行视觉的输电线路部件检测方法、***、装置
CN112257665A (zh) 图像内容的识别方法、图像识别模型的训练方法及介质
CN111310156B (zh) 一种滑块验证码的自动识别方法及***
CN103679792B (zh) 一种三维模型的渲染方法和***
CN111310155B (zh) 一种用于滑块验证码自动识别的***架构及实现方法
CN110135318A (zh) 过车记录的确定方法、装置、设备及存储介质
CN113505854A (zh) 一种人脸图像质量评价模型构建方法、装置、设备及介质
KR20200136723A (ko) 가상 도시 모델을 이용하여 객체 인식을 위한 학습 데이터 생성 방법 및 장치
CN114972646B (zh) 一种实景三维模型独立地物的提取与修饰方法及***
CN109816001A (zh) 一种基于深度学习的车辆多属性识别方法、装置和设备
CN104900094A (zh) 终端中书写模拟的实现方法和装置
CN110472600A (zh) 眼底图识别及其训练方法、装置、设备和存储介质
WO2022160406A1 (zh) 基于增强现实技术的物联网实训***的实现方法及***
CN108961268A (zh) 一种显著图计算方法及相关装置
CN115953330B (zh) 虚拟场景图像的纹理优化方法、装置、设备和存储介质
US20230206573A1 (en) Method of learning a target object by detecting an edge from a digital model of the target object and setting sample points, and method of augmenting a virtual model on a real object implementing the target object using the learning method
CN110349108A (zh) 处理图像的方法、装置、电子设备、及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant