CN113033588A - 一种图像处理方法及电子设备 - Google Patents
一种图像处理方法及电子设备 Download PDFInfo
- Publication number
- CN113033588A CN113033588A CN201911348882.XA CN201911348882A CN113033588A CN 113033588 A CN113033588 A CN 113033588A CN 201911348882 A CN201911348882 A CN 201911348882A CN 113033588 A CN113033588 A CN 113033588A
- Authority
- CN
- China
- Prior art keywords
- image
- target
- mark
- neural network
- classification model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Development Economics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Accounting & Taxation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Evolutionary Biology (AREA)
- Game Theory and Decision Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及通信技术领域,提供一种图像处理方法及电子设备,以解决现有技术获取张贴小广告所在地点的效率低的问题。其中,图像处理方法包括:将第一图像输入神经网络分类模型,并进行计算;根据所述神经网络分类模型的计算结果,在所述第一图像中添加标记,所述标记用于指示目标对象对应的目标图像在所述第一图像中的位置;在根据所述神经网络分类模型输出的结果,确定所述第一图像中包含所述目标图像的情况下,根据所述标记获取所述目标图像对应的区域。这样,通过获取第一图像中的目标图像的区域,从而可以确定小广告所在的位置,能够提高小广告位置获取的效率。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种图像处理方法及电子设备。
背景技术
街头社区小广告多指一些人员为了达到宣传目的非法张贴或喷涂在街头围墙、电线杆、社区甚至居民楼走道的小广告。现有技术中,管辖区工作人员通常是采用街区巡逻或通过查看城市监控摄像头的方式获取小广告张贴、喷涂的地点,然后对小广告进行清理。然而,这些小广告分布的范围广,地点多而杂,这种通过巡逻或查看监控摄像头来获取广告所在地点的方式效率低。
发明内容
本发明实施例提供一种图像处理方法及电子设备,以解决现有技术获取张贴小广告所在地点的效率低的问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,本发明实施例提供了一种图像处理方法,包括:
将第一图像输入神经网络分类模型,并进行计算;
根据所述神经网络分类模型的计算结果,在所述第一图像中添加标记,所述标记用于指示目标对象对应的目标图像在所述第一图像中的位置;
在根据所述神经网络分类模型输出的结果,确定所述第一图像中包含所述目标图像的情况下,根据所述标记获取所述目标图像对应的区域。
第二方面,本发明实施例还提供一种电子设备,包括:
第一输入模块,用于将第一图像输入神经网络分类模型,并进行计算;
添加模块,用于根据所述神经网络分类模型的计算结果,在所述第一图像中添加标记,所述标记用于指示目标对象对应的目标图像在所述第一图像中的位置;
第一获取模块,用于在根据所述神经网络分类模型输出的结果,确定所述第一图像中包含所述目标图像的情况下,根据所述标记获取所述目标图像对应的区域。
第三方面,本发明实施例还提供一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的图像处理方法中的步骤。
第四方面,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上所述的图像处理方法中的步骤。
本发明实施例中,将第一图像输入神经网络分类模型,并进行计算;根据所述神经网络分类模型的计算结果,在所述第一图像中添加标记,所述标记用于指示目标对象对应的目标图像在所述第一图像中的位置;在根据所述神经网络分类模型输出的结果,确定所述第一图像中包含所述目标图像的情况下,根据所述标记获取所述目标图像对应的区域。这样,通过获取第一图像中的目标图像的区域,从而可以确定小广告所在的位置,能够提高小广告位置获取的效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的图像处理方法的流程图之一;
图2是本发明实施例提供的图像处理方法的流程图之二;
图3是本发明实施例提供的图像处理方法的流程图之三;
图4是本发明实施例提供的电子设备的结构图之一;
图5是本发明实施例提供的电子设备的结构图之二;
图6是本发明实施例提供的电子设备的结构图之三;
图7是本发明实施例提供的电子设备的结构图之四。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,图1是本发明实施例提供的图像处理方法的流程图,如图1所示,包括以下步骤:
步骤101、将第一图像输入神经网络分类模型,并进行计算。
其中,第一图像中可以是一张图像,还可以是多张图像中的任一图像。第一图像中还可以包括多张图像,如将视频图像中包含的多个图像输入神经网络分类模型。
可选的,所述将第一图像输入神经网络分类模型,并进行计算之前,所述方法还包括:
获取第一图像和第二图像,所述第一图像中包含所述目标对象的图像,所述第二图像中不包含所述目标对象的图像;
将所述第一图像和所述第二图像输入所述神经网络分类模型进行训练。
在该实施方式中,可以将包含目标对象图像的第一图像作为正样本,将不包含目标对象图像的第二图像作为负样本,输入神经网络分类模型进行训练。其中,第一图像和第二图像中均可以包括一张或者多张图像。第一图像中的每张图像中均包含目标对象的图像,第二图像中的每张图像中均不包含目标对象的图像。上述目标对象的图像可以是需要查找特定类别的图像,例如,小广告的图像或者是其他场景中需要查找的图像。这样,在应用于查找小广告时,神经网络分类模型能够将包含小广告的图像和不包含小广告的图像进行分类,也就是说,能够识别包含小广告的图像,并输出这些图像。
在通过上述训练后,分类模型可以根据输入的图像识别每张图像中是否包含目标对象的图像,即是否包含目标图像,从而将包含小广告的图像和不包含小广告的图像进行分类。提高对目标图像识别的灵活性和准确性。
步骤102、根据所述神经网络分类模型的计算结果,在所述第一图像中添加标记,所述标记用于指示目标对象对应的目标图像在所述第一图像中的位置。
在此步骤中,将第一图像输入神经网络分类模型后,可以进行计算,并根据计算结果,在第一图像中添加标记。例如,对表示不同类型的图像覆盖不同的颜色,或对不同对象的图像添加不同的标记。还可以仅对需要查找的目标对象的图像添加标记。例如,将包含广告、建筑物、人物的第一图像输入神经网络分类模型后,根据计算结果在广告区域添加红色标记。
具体地,在卷积神经网络(简称CNN)输出层(用于分类softmax的层)之前,最后一个卷积层之后,采用全局平均池化层(简称GAP),把用于小广告分类,但失去空间信息的一维特征向量在类别上的响应,映射回带有空间信息的特征图上去,即把图片中的重要区域,用输出层权重映射回卷积层特征的方式标记出来。将每个单元的特征图加权求和用于最后的输出。
具体的计算方式如下:
用fk(x,y)代表CNN最后一个卷积层在空间坐标(x,y)中通道k的响应值。每个通道k,通过GAP后的结果为
Fk=∑(x,y)fk(x,y)
对于小广告类别c,通过全连接层结果为
最后输入到softmax分类器得到分类概率为
Pc=expSc/∑cexpSc
这里忽略偏差项,对分类表现没有影响,偏差项设置为0。整个图片的分类响应等于特征图各个空间位置特征的响应之和为
接下来,将CNN模型分类出的小广告图片进行处理,从而在图片中筛选小广告所在的区域。基于神经网络的深度学习检测算法是基于大量的数据统计得到的检测模型,模型学习的特征是基于大量标注好的样本图像得到的。深度网络自动根据图像学习特征权值,无需设定。同时,样本图像的标注质量也直接影响着模型的最后的检测结果。因此,小广告样本图像的标注的质量和数量直接影响着小广告深度学习算法的精度。
这样,当第一图像中包括的图像内容较多时,便于根据标记快速查找目标对象的图像在第一图像中的位置,而不需要用户一一查看寻找。
步骤103、在根据所述神经网络分类模型输出的结果,确定所述第一图像中包含所述目标图像的情况下,根据所述标记获取所述目标图像对应的区域。
在此步骤中,在神经网络分类模型输出的结果包括第一图像中包含目标图像的情况下,可以输出包含目标图像的第一图像,并可以对第一图像进行处理,并结合在步骤102中标记的位置,确定目标图像的区域。具体可以根据标记的位置,对相应的区域的图像进行处理。还可以是先对整个图像进行处理后,结合标记的位置确定区域。
可选的,所述根据所述标记获取所述目标图像对应的区域,包括:
确定所述第一图像中的子图像的轮廓;
根据所述子图像的轮廓和所述标记所指示的位置,在所述子图像中确定所述目标图像对应的区域。
在该实施方式中,第一图像中可以包括多个对象对应的多个子图像,可以先确定第一图像中的子图像的轮廓。根据子图像的轮廓再结合标记的位置,可以确定目标对象对应的目标图像的区域。例如,第一图像中包括广告贴纸、建筑物和人物,电子设备分别将广告贴纸、建筑物和人物的轮廓获取,再结合标记的位置,确定广告贴纸的区域。
进一步地,在获取子图像的轮廓时,可以通过如下方式进行获取。首先将CNN模型分类出的小广告图片通过高斯模糊处理,减少图像噪声以及降低细节层次,然后灰度化,以去除颜色信息。再利用边缘检测算子实现图像的边缘检测,然后二值化进行图像的开闭操作后,求取图像中的各子图像的轮廓。然后利用CNN网络的响应值,即标记的区域,确定目标图像所在区域,实现边缘判别并进行筛选。这样筛选出的区域即是小广告的所在的区域。
可选的,所述根据所述标记获取所述目标图像对应的区域之后,所述方法还包括:
在所述区域中包括与预设特征字符匹配的目标字符的情况下,添加用于指示所述区域的范围的标记。
在该实施方式中,在获取目标对象对应的区域后,可以进一步对该区域的字符特征进行识别,即检测该区域内是否包含与预设特征字符匹配的目标字符。例如,检测是否包含“房屋”和“出租”的文字。在上述区域内包含目标字符的情况下,则确定该区域为需要获取的区域,并可以在该区域添加标记,以指示该区域所占用的范围。进一步地,还可以输出提示信息,以提示用户该区域为待获取的区域。
这样,便于用户快速获取需要获取的区域,而不需要人为查看的方式查找,能够提高查找效率。且通过文字检测,能够减少对区域检测的准确性。
可选的,所述在所述区域中包括与预设特征字符匹配的目标字符的情况下,添加用于指示所述区域的范围的标记,包括:
在所述区域中包括与预设特征字符匹配的目标字符,且所述目标字符重复的次数大于或等于预设值的情况下,添加用于指示所述区域的范围的标记。
在该实施方式中,在区域中包含目标字符的情况下,可以进一步检测目标字符出现的频率,即检测目标字符重复的次数是否大于或等于预设值。例如,检测“出租”在区域中出现的次数是否大于2次。
这样,通过对区域中的文字和目标字符出现的频率进行判断,能够提高对目标区域检测的准确性。
本发明实施例中,上述图像处理方法可以应用于电子设备,例如:计算机、手机、车载移动终端、监控设备或可穿戴式设备(Wearable Device)等。
为了便于理解该实施例,以下以该方法应用于对城市小广告的检测为例进行举例。
首先将小广告的训练图像数据划分为包含小广告的正样本和不包含小广告的负样本,将划分好的数据样本训练一个卷积神经网络分类模型。
如图2所示,在对图像进行检测时,电子设备可以获取视频图像中的多张图像,输入卷积神经网络分类模型计算。电子设备可以将小广告在类别上的响应映射回带有空间信息的特征图上,即在特征图添加包含小广告的标记。
在卷积神经网络分类模型输出包含小广告的图像后,可以对图像进行处理,以对图像进行轮廓筛选。具体的图像处理方式可以参见图3所示。先对图像进行高斯模糊处理,然后灰度化去除颜色信息,利用边缘检测算子实现图像的边缘检测,然后二值化进行图像的开闭操作后,求取图像中小广告区域的轮廓。在获取轮廓后,可以结合在特征图中添加的标记可以获取小广告图像的边缘,从而获取每张图像中的小广告所在的区域。进一步地,结合信息判别***对该区域内的文字进行判断,即检测该区域内是否包含预设的关键字或关键词,并检测关键字或关键词在该区域出现的频率。在该区域内关键字或关键词出现的频率处于预设范围时,确定该区域为需要获取的小广告区域。
本发明实施例的图像处理方法,将第一图像输入神经网络分类模型,并进行计算;根据所述神经网络分类模型的计算结果,在所述第一图像中添加标记,所述标记用于指示目标对象对应的目标图像在所述第一图像中的位置;在根据所述神经网络分类模型输出的结果,确定所述第一图像中包含所述目标图像的情况下,根据所述标记获取所述目标图像对应的区域。这样,通过获取第一图像中的目标图像的区域,从而可以确定小广告所在的位置,能够提高小广告位置获取的效率。利用CNN的定位能力,将深度特征进行映射,结合图像边缘信息,实现了小广告区域的检测。同时通过文字信息对小广告区域进行判别,进一步提升***检测的准确性。本***通过摄像头等视频获取设备获取的大量数据,利用深度学习算法实现视频的智能分析,帮助城市管理人员及时发现小广告并及时的进行清理。
参见图4,图4是本发明实施例提供的电子设备的结构图,如图4所示,电子设备400包括:
第一输入模块401,用于将第一图像输入神经网络分类模型,并进行计算;
添加模块402,用于根据所述神经网络分类模型的计算结果,在所述第一图像中添加标记,所述标记用于指示目标对象对应的目标图像在所述第一图像中的位置;
第一获取模块403,用于在根据所述神经网络分类模型输出的结果,确定所述第一图像中包含所述目标图像的情况下,根据所述标记获取所述目标图像对应的区域。
可选的,如图5所示,所述电子设备还包括:
第二获取模块404,用于获取第一图像和第二图像,所述第一图像中包含所述目标对象的图像,所述第二图像中不包含所述目标对象的图像;
第二输入模块405,用于将所述第一图像和所述第二图像输入所述神经网络分类模型进行训练。
可选的,所述第一获取模块具体用于:
确定所述第一图像中的子图像的轮廓;
根据所述子图像的轮廓和所述标记所指示的位置,在所述子图像中确定所述目标图像对应的区域。
可选的,如图6所示,所述电子设备还包括:
确定模块406,用于在所述区域中包括与预设特征字符匹配的目标字符的情况下,添加用于指示所述区域的范围的标记。
可选的,所述确定模块具体用于:
在所述区域中包括与预设特征字符匹配的目标字符,且所述目标字符重复的次数大于或等于预设值的情况下,添加用于指示所述区域的范围的标记。
电子设备400能够实现上述方法实施例中电子设备实现的各个过程,为避免重复,这里不再赘述。
本发明实施例的电子设备400,通过获取第一图像中的目标图像的区域,从而可以确定小广告所在的位置,能够提高小广告位置获取的效率。
图7为实现本发明各个实施例的一种电子设备的硬件结构示意图,该电子设备700包括但不限于:射频单元701、网络模块702、音频输出单元703、输入单元704、传感器705、显示单元706、用户输入单元707、接口单元708、存储器709、处理器710、以及电源711等部件。本领域技术人员可以理解,图7中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,电子设备包括但不限于计算机、手机、监控设备、车载移动终端、可穿戴设备等。
其中,处理器710,用于将第一图像输入神经网络分类模型,并进行计算;根据所述神经网络分类模型的计算结果,在所述第一图像中添加标记,所述标记用于指示目标对象对应的目标图像在所述第一图像中的位置;在根据所述神经网络分类模型输出的结果,确定所述第一图像中包含所述目标图像的情况下,根据所述标记获取所述目标图像对应的区域。
这样,通过获取第一图像中的目标图像的区域,从而可以确定小广告所在的位置,能够提高小广告位置获取的效率。
可选的,处理器710还用于:
获取第一图像和第二图像,所述第一图像中包含所述目标对象的图像,所述第二图像中不包含所述目标对象的图像;
将所述第一图像和所述第二图像输入所述神经网络分类模型进行训练。
可选的,处理器710执行所述根据所述标记获取所述目标图像对应的区域,包括:
确定所述第一图像中的子图像的轮廓;
根据所述子图像的轮廓和所述标记所指示的位置,在所述子图像中确定所述目标图像对应的区域。
可选的,处理器710还用于:
在所述区域中包括与预设特征字符匹配的目标字符的情况下,添加用于指示所述区域的范围的标记。
可选的,处理器710执行所述在所述区域中包括与预设特征字符匹配的目标字符的情况下,添加用于指示所述区域的范围的标记,包括:
在所述区域中包括与预设特征字符匹配的目标字符,且所述目标字符重复的次数大于或等于预设值的情况下,添加用于指示所述区域的范围的标记。
应理解的是,本发明实施例中,射频单元701可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器710处理;另外,将上行的数据发送给基站。通常,射频单元701包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元701还可以通过无线通信***与网络和其他设备通信。
电子设备通过网络模块702为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元703可以将射频单元701或网络模块702接收的或者在存储器709中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元703还可以提供与电子设备700执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元703包括扬声器、蜂鸣器以及受话器等。
输入单元704用于接收音频或视频信号。输入单元704可以包括图形处理器(Graphics Processing Unit,GPU)7041和麦克风7042,图形处理器7041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元706上。经图形处理器7041处理后的图像帧可以存储在存储器709(或其它存储介质)中或者经由射频单元701或网络模块702进行发送。麦克风7042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元701发送到移动通信基站的格式输出。
电子设备700还包括至少一种传感器705,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板7061的亮度,接近传感器可在电子设备700移动到耳边时,关闭显示面板7061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别电子设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器705还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元706用于显示由用户输入的信息或提供给用户的信息。显示单元706可包括显示面板7061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板7061。
用户输入单元707可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元707包括触控面板7071以及其他输入设备7072。触控面板7071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板7071上或在触控面板7071附近的操作)。触控面板7071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器710,接收处理器710发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板7071。除了触控面板7071,用户输入单元707还可以包括其他输入设备7072。具体地,其他输入设备7072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板7071可覆盖在显示面板7061上,当触控面板7071检测到在其上或附近的触摸操作后,传送给处理器710以确定触摸事件的类型,随后处理器710根据触摸事件的类型在显示面板7061上提供相应的视觉输出。虽然在图7中,触控面板7071与显示面板7061是作为两个独立的部件来实现电子设备的输入和输出功能,但是在某些实施例中,可以将触控面板7071与显示面板7061集成而实现电子设备的输入和输出功能,具体此处不做限定。
接口单元708为外部装置与电子设备700连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元708可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到电子设备700内的一个或多个元件或者可以用于在电子设备700和外部装置之间传输数据。
存储器709可用于存储软件程序以及各种数据。存储器709可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器709可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器710是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器709内的软件程序和/或模块,以及调用存储在存储器709内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。处理器710可包括一个或多个处理单元;优选的,处理器710可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器710中。
电子设备700还可以包括给各个部件供电的电源711(比如电池),优选的,电源711可以通过电源管理***与处理器710逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。
另外,电子设备700包括一些未示出的功能模块,在此不再赘述。
优选的,本发明实施例还提供一种电子设备,包括处理器710,存储器709,存储在存储器709上并可在所述处理器710上运行的计算机程序,该计算机程序被处理器710执行时实现上述图像处理方法实施例中的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述图像处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台电子设备(可以是手机,计算机等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。
Claims (12)
1.一种图像处理方法,其特征在于,包括:
将第一图像输入神经网络分类模型,并进行计算;
根据所述神经网络分类模型的计算结果,在所述第一图像中添加标记,所述标记用于指示目标对象对应的目标图像在所述第一图像中的位置;
在根据所述神经网络分类模型输出的结果,确定所述第一图像中包含所述目标图像的情况下,根据所述标记获取所述目标图像对应的区域。
2.根据权利要求1所述的方法,其特征在于,所述将第一图像输入神经网络分类模型,并进行计算之前,所述方法还包括:
获取第一图像和第二图像,所述第一图像中包含所述目标对象的图像,所述第二图像中不包含所述目标对象的图像;
将所述第一图像和所述第二图像输入所述神经网络分类模型进行训练。
3.根据权利要求1所述的方法,其特征在于,所述根据所述标记获取所述目标图像对应的区域,包括:
确定所述第一图像中的子图像的轮廓;
根据所述子图像的轮廓和所述标记所指示的位置,在所述子图像中确定所述目标图像对应的区域。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述根据所述标记获取所述目标图像对应的区域之后,所述方法还包括:
在所述区域中包括与预设特征字符匹配的目标字符的情况下,添加用于指示所述区域的范围的标记。
5.根据权利要求4所述的方法,其特征在于,所述在所述区域中包括与预设特征字符匹配的目标字符的情况下,添加用于指示所述区域的范围的标记,包括:
在所述区域中包括与预设特征字符匹配的目标字符,且所述目标字符重复的次数大于或等于预设值的情况下,添加用于指示所述区域的范围的标记。
6.一种电子设备,其特征在于,包括:
第一输入模块,用于将第一图像输入神经网络分类模型,并进行计算;
添加模块,用于根据所述神经网络分类模型的计算结果,在所述第一图像中添加标记,所述标记用于指示目标对象对应的目标图像在所述第一图像中的位置;
第一获取模块,用于在根据所述神经网络分类模型输出的结果,确定所述第一图像中包含所述目标图像的情况下,根据所述标记获取所述目标图像对应的区域。
7.根据权利要求6所述的电子设备,其特征在于,所述电子设备还包括:
第二获取模块,用于获取第一图像和第二图像,所述第一图像中包含所述目标对象的图像,所述第二图像中不包含所述目标对象的图像;
第二输入模块,用于将所述第一图像和所述第二图像输入所述神经网络分类模型进行训练。
8.根据权利要求6所述的电子设备,其特征在于,所述第一获取模块具体用于:
确定所述第一图像中的子图像的轮廓;
根据所述子图像的轮廓和所述标记所指示的位置,在所述子图像中确定所述目标图像对应的区域。
9.根据权利要求6至8任一项所述的电子设备,其特征在于,所述电子设备还包括:
确定模块,用于在所述区域中包括与预设特征字符匹配的目标字符的情况下,添加用于指示所述区域的范围的标记。
10.根据权利要求9所述的电子设备,其特征在于,所述确定模块具体用于:
在所述区域中包括与预设特征字符匹配的目标字符,且所述目标字符重复的次数大于或等于预设值的情况下,添加用于指示所述区域的范围的标记。
11.一种电子设备,其特征在于,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述的图像处理方法中的步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的图像处理方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911348882.XA CN113033588A (zh) | 2019-12-24 | 2019-12-24 | 一种图像处理方法及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911348882.XA CN113033588A (zh) | 2019-12-24 | 2019-12-24 | 一种图像处理方法及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113033588A true CN113033588A (zh) | 2021-06-25 |
Family
ID=76452049
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911348882.XA Pending CN113033588A (zh) | 2019-12-24 | 2019-12-24 | 一种图像处理方法及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113033588A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103679164A (zh) * | 2012-09-21 | 2014-03-26 | 阿里巴巴集团控股有限公司 | 一种基于移动终端的标志识别处理方法和*** |
CN108564087A (zh) * | 2018-04-13 | 2018-09-21 | 腾讯科技(深圳)有限公司 | 小广告的风险识别方法、装置、终端及存储介质 |
CN109241985A (zh) * | 2017-07-11 | 2019-01-18 | 普天信息技术有限公司 | 一种图像识别方法及装置 |
CN110569754A (zh) * | 2019-08-26 | 2019-12-13 | 江西航天鄱湖云科技有限公司 | 图像目标检测方法、装置、存储介质及设备 |
-
2019
- 2019-12-24 CN CN201911348882.XA patent/CN113033588A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103679164A (zh) * | 2012-09-21 | 2014-03-26 | 阿里巴巴集团控股有限公司 | 一种基于移动终端的标志识别处理方法和*** |
CN109241985A (zh) * | 2017-07-11 | 2019-01-18 | 普天信息技术有限公司 | 一种图像识别方法及装置 |
CN108564087A (zh) * | 2018-04-13 | 2018-09-21 | 腾讯科技(深圳)有限公司 | 小广告的风险识别方法、装置、终端及存储介质 |
CN110569754A (zh) * | 2019-08-26 | 2019-12-13 | 江西航天鄱湖云科技有限公司 | 图像目标检测方法、装置、存储介质及设备 |
Non-Patent Citations (1)
Title |
---|
BOLEI ZHOU ET AL.: ""Learning Deep Features for Discriminative Localization"" * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109558512B (zh) | 一种基于音频的个性化推荐方法、装置和移动终端 | |
CN109684980B (zh) | 自动阅卷方法及装置 | |
CN111222493B (zh) | 一种视频处理方法及装置 | |
CN109495616B (zh) | 一种拍照方法及终端设备 | |
CN112329725B (zh) | 一种道路场景的要素识别方法、装置、设备以及存储介质 | |
CN108460817B (zh) | 一种拼图方法及移动终端 | |
CN109993234B (zh) | 一种无人驾驶训练数据分类方法、装置及电子设备 | |
CN109885490B (zh) | 一种图片对比方法和装置 | |
CN110807405A (zh) | 一种偷拍装置检测方法及电子设备 | |
CN110544287A (zh) | 一种配图处理方法及电子设备 | |
CN110909776A (zh) | 一种图像识别方法及电子设备 | |
CN110942022A (zh) | 投篮数据的输出方法和电子设备 | |
CN111143614A (zh) | 视频显示方法及电子设备 | |
CN112464831B (zh) | 视频分类方法、视频分类模型的训练方法及相关设备 | |
CN114399813A (zh) | 人脸遮挡检测方法、模型训练方法、装置及电子设备 | |
CN110908751B (zh) | 信息显示、收藏的方法、装置、电子设备及介质 | |
CN109670105B (zh) | 搜索方法及移动终端 | |
CN111080305A (zh) | 一种风险识别方法、装置及电子设备 | |
CN108520727B (zh) | 屏幕亮度调节方法及移动终端 | |
CN107844203B (zh) | 一种输入法候选词推荐方法及移动终端 | |
CN110674294A (zh) | 一种相似度确定方法及电子设备 | |
CN113033588A (zh) | 一种图像处理方法及电子设备 | |
CN117541770A (zh) | 数据增强方法、装置及电子设备 | |
CN111126388B (zh) | 图像识别的方法及电子设备 | |
CN113870862A (zh) | 声纹识别模型训练方法、声纹识别方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |