CN102306287A - 一种用于识别敏感图像的方法与设备 - Google Patents

一种用于识别敏感图像的方法与设备 Download PDF

Info

Publication number
CN102306287A
CN102306287A CN201110246789A CN201110246789A CN102306287A CN 102306287 A CN102306287 A CN 102306287A CN 201110246789 A CN201110246789 A CN 201110246789A CN 201110246789 A CN201110246789 A CN 201110246789A CN 102306287 A CN102306287 A CN 102306287A
Authority
CN
China
Prior art keywords
image
sensitive
pending
sensitive image
equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201110246789A
Other languages
English (en)
Other versions
CN102306287B (zh
Inventor
李彦宏
舒迅
袁聃
文林福
方勇
帅帅
李岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201110246789.5A priority Critical patent/CN102306287B/zh
Publication of CN102306287A publication Critical patent/CN102306287A/zh
Application granted granted Critical
Publication of CN102306287B publication Critical patent/CN102306287B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明的目的是提供一种用于识别敏感图像的方法与设备。其中,敏感图像识别设备1获取参考敏感图像;根据所述参考敏感图像,建立或更新参考敏感图库;获取待处理图像,以识别所述待处理图像是否属于敏感图像;根据所述待处理图像,在所述参考敏感图库中进行相似查询,以获得与所述待处理图像相对应的查询结果。与现有技术相比,本发明实现了对网络中的重复敏感图像的有效识别,降低了应用服务器的敏感图像识别压力,同时净化了网络环境,使得网民获得更好的网络遨游体验。进一步地,本发明还可以根据基于参考敏感图库的查询结果,对待处理图像和/或其来源做相应的屏蔽处理。

Description

一种用于识别敏感图像的方法与设备
技术领域
本发明涉及图像处理领域,尤其涉及一种用于识别敏感图像的技术。
背景技术
网络中的敏感图像,如黄色图像、暴力图像、反动图像等,重复率较高,如同一幅敏感图像会被不同的人重复上传,或者被不同的网站重复转帖,并且其资源集中度也较高,有些网站,其中的图像大都是敏感图像。
现有的敏感图像识别,大多由人工完成,或者机器通过对图像描述信息的文本识别来判断图像是否为敏感图像,从而由于缺乏对图像的内容分析,而对很多仅图像内容敏感的敏感图像无能为力。
因此,如何利用敏感图像的高重复率特性识别敏感图像,以提高敏感图像的识别效率,成为目前急需解决的问题之一。
发明内容
本发明的目的是提供一种用于识别敏感图像的方法与设备。
根据本发明的一个方面,提供了一种计算机实现的用于识别敏感图像的方法,其中,该方法包括以下步骤:
a获取参考敏感图像;
b根据所述参考敏感图像,建立或更新参考敏感图库;
其中,该方法还包括:
x获取待处理图像,以识别所述待处理图像是否属于敏感图像;
y根据所述待处理图像,在所述参考敏感图库中进行相似查询,以获得与所述待处理图像相对应的查询结果。
根据本发明的另一个方面,还提供了一种用于识别敏感图像的设备,其中,该设备包括:
参考图像获取装置,用于获取参考敏感图像;
敏感图库建立装置,用于根据所述参考敏感图像,建立或更新参考敏感图库;
其中,该设备还包括:
待处理图像获取装置,用于获取待处理图像,以识别所述待处理图像是否属于敏感图像;
待处理图像查询装置,用于根据所述待处理图像,在所述参考敏感图库中进行相似查询,以获得与所述待处理图像相对应的查询结果。
与现有技术相比,本发明通过获取参考敏感图像,并建立参考敏感图库,并利用该参考敏感图库对待处理图像进行敏感图像识别,实现了对网络中的重复敏感图像的有效识别,降低了应用服务器的敏感图像识别压力,同时净化了网络环境,使得网民获得更好的网络遨游体验。进一步地,本发明还可以根据基于参考敏感图库的查询结果,对待处理图像和/或其来源做相应的屏蔽处理,如当待处理图像属于敏感图像,屏蔽该待处理图像、该待处理图像的提交设备的标识等,并将屏蔽结果提供给相应的提交设备。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个方面的用于识别敏感图像的设备的示意图;
图2示出根据本发明一个优选实施例的用于识别敏感图像的设备的示意图;
图3示出根据本发明另一个优选实施例的用于识别敏感图像的设备的示意图;
图4示出根据本发明另一个方面的用于识别敏感图像的方法流程图;
图5示出根据本发明一个优选实施例的用于识别敏感图像的方法流程图;
图6示出根据本发明另一个优选实施例的用于识别敏感图像的方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1为根据本发明一个方面的设备示意图,示出用于识别敏感图像的设备。其中,敏感图像识别设备1包括参考图像获取装置11、敏感图库建立装置12、待处理图像获取装置13和待处理图像查询装置14。具体地,参考图像获取装置11获取参考敏感图像;敏感图库建立装置12根据所述参考敏感图像,建立或更新参考敏感图库;待处理图像获取装置13获取待处理图像,以识别所述待处理图像是否属于敏感图像;待处理图像查询装置14根据所述待处理图像,在所述参考敏感图库中进行相似查询,以获得与所述待处理图像相对应的查询结果。在此,敏感图像识别设备1包括但不限于各种应用服务器,诸如论坛服务器、博客服务器等,以及与所述应用服务器相连的网络设备,其中,网络设备包括但不限于网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合,在此,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。本领域技术人员应能理解上述敏感图像识别设备以及网络设备仅为举例,其他现有的或今后可能出现的敏感图像识别设备或者网络设备如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
参考图像获取装置11获取参考敏感图像。在此,参考图像获取装置11获取参考敏感图像的方式包括但不限于:1)从其他设备接收所述参考敏感图像,所述其他设备包括但不限于用户设备和网络设备,其中,所述用户设备包括但不限于任何可与用户经由键盘、触摸屏、语音输入设备等进行交换的电子产品,诸如个人计算机、平板电脑、手机、PSP等;2)从所述其他设备获取原始图像,并对所述原始图像进行分类,以获得所述参考敏感图像。例如,参考图像获取装置11根据敏感图像识别设备1向其他设备提供的参考图像提交接口,获取其他设备经由该参考图像提交接口向该敏感图像识别设备1提交的参考敏感图像。本领域技术人员应能理解上述获取参考敏感图像的方式仅为举例,其他现有的或今后可能出现的获取参考敏感图像的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,参考图像获取装置11获取一个或多个原始图像;对所述原始图像进行分类操作,以从所述原始图像中获得所述参考敏感图像。例如,参考图像获取装置11从网络开放图库中获取多个原始图像,根据分类器,诸如SVM分类器、基于决策树的分类器、基于AdaBoost算法的分类器等,对这些原始图像进行分类操作,以获得与前述分类器中的预设敏感图像样本或预设敏感图像参数相符的参考敏感图像。本领域技术人员应能理解上述对原始图像进行分类以获取参考敏感图像的方式以及分类器仅为举例,其他现有的或今后可能出现的对原始图像进行分类以获取参考敏感图像或者分类器如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
更优选地,从所述原始图像中获得所述参考敏感图像的所述分类操作基于但不限于,以下至少任一项:
1)预置的SVM分类器;
2)预置的高斯混合模型;
3)基于AdaBoost算法的强分类器。
具体地,SVM分类器、高斯混合模型经敏感图像样本集训练后,可以获得相应的参数,从而成为本发明中用于从原始图像中获得参考敏感图像的分类操作的预置的SVM分类器和预置的高斯混合模型;AdaBoost算法用于挑选经敏感图像样本集训练后获得的最优的弱分类器,并基于这些弱分类器构成强分类器,从而获得本发明中用于所述分类操作的基于AdaBoost算法的强分类器。参考图像获取装置11根据预置的SVM分类器、预置的高斯混合模型或者基于AdaBoost算法的强分类器,对其获得的原始图像进行分类操作,获得所述原始图像属于敏感图像的概率值,并将概率值超过预定阈值的所述原始图像,作为所述参考敏感图像建立或者更新所述参考敏感图库。
敏感图库建立装置12根据参考图像获取装置11获取的参考敏感图像,建立或更新参考敏感图库。例如,参考图像获取装置11从其他设备接收参考敏感图像,或者从其他设备获取原始图像,并对原始图像分类后获得参考敏感图像;敏感图库建立装置12根据这些参考敏感图像建立参考敏感图库,并在该参考敏感图库建立后,根据参考图像装置11后续获取的参考敏感图像,更新该参考敏感图库。本领域技术人员应能理解上述建立以及更新参考敏感图库的方式仅为举例,其他现有的或今后可能出现的建立或者更新参考敏感图库的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
待处理图像获取装置13获取待处理图像,以供识别所述待处理图像是否属于敏感图像。在此,待处理图像获取装置13获取所述待处理图像的方式包括但不限于:1)从其他设备接收所述待处理图像;2)从其他设备接收指向所述待处理图像的访问地址,并根据所述访问地址,获取所述待处理图像;3)从网络开放图库,诸如搜索引擎提供的图像搜索结果、网页中包括的图像等,获取所述待处理图像。本领域技术人员应能理解上述获取待处理图像的方式仅为举例,其他现有的或今后可能出现的获取待处理图像的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
待处理图像查询装置14根据待处理图像获取装置13获取待处理图像,在敏感图库建立装置12建立的参考敏感图库中进行相似查询,以获得与所述待处理图像相对应的查询结果。在此,待处理图像查询装置14对待处理图像进行相似查询的方式包括但不限于:1)对待处理图像的局部内容或者全部内容,通过诸如hash算法、MD5算法、SHA算法等对该局部内容或者全部内容计算内容签名,并根据该内容签名查询参考敏感图库;2)提取待处理图像的图像特征信息,诸如颜色特征信息、纹理特征信息、形状特征信息、空间特征信息等,并根据这些图像特征信息查询参考敏感图库。优选地,待处理图像查询装置14在对待处理图像进行相似查询时,还可以结合待处理图像所对应的参考敏感图像的重复率设定不同的相似度阈值,并根据该相似度阈值,获得与所述待处理图像相对应的查询结果。在此,所述重复率包括所述参考敏感图像与历史待处理图像的累计相似次数。例如,对重复率超过10次的参考敏感图像,设定其相应的相似度阈值为70%,对重复率超过5次的参考敏感图像,设定其相应的相似度阈值为80%,对重复率低于5次的参考敏感图像,设定其相应的相似度阈值为90%;待处理图像查询装置14根据待处理图像查询参考敏感图库,并结合参考敏感图像的重复率及对应的相似度阈值,获得相应的查询结果,所述查询结果包括与所述待处理图像相对应的参考敏感图像以及其与所述待处理图像的相似度。进一步地,待处理图像查询装置14还可以根据所述相似度,结合相应参考敏感图像的相似度阈值,判断所述待处理图像是否属于敏感图像,并将判断结果作为查询结果。例如,待处理图像与参考敏感图像的相似度为82%,如果该参考敏感图像对应的相似度阈值为80%,则该待处理图像属于敏感图像;如果该参考敏感图像对应的相似度阈值为90%,则该待处理图像不属于敏感图像。本领域技术人员应能理解上述对待处理图像进行相似查询的方式以及查询结果仅为举例,其他现有的或今后可能出现的对待处理图像进行相似查询的方式或者查询结果如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,待处理图像查询装置14根据待处理图像获取装置13获取的待处理图像,提取所述待处理图像的图像特征信息;根据所述图像特征信息,在敏感图库建立装置12建立的参考敏感图库中进行相似查询,以获得所述查询结果。在此,所述图像特征信息包括但不限于任何可适用于本发明的据以对所述待处理图像进行相似查询的图像相关信息,诸如颜色特征信息、纹理特征信息、形状特征信息等。例如,待处理图像获取装置13接收自其他设备提交的待处理图像;待处理图像查询装置14根据HSV颜色直方图、颜色集等提取所述待处理图像的颜色特征信息,根据灰度共生矩阵、小波变换、随机场模型法等提取所述待处理图像的纹理特征信息,根据傅里叶形状描述符法、边界特征法等提取所述待处理图像的形状特征信息,根据图像分割提取所述待处理图像的空间特征信息,并根据这些图像特征信息查询参考敏感图库,以获得相应的查询结果,如与所述待处理图像相对应的参考敏感图像,以及这些参考敏感图像的敏感度。本领域技术人员应能理解上述提取待处理图像的各项图像特征信息的方式以及图像特征信息仅为举例,其他现有的或今后可能出现的提取待处理图像的各项图像特征信息的方式或者图像特征信息如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
更优选地,所述图像特征信息包括但不限于,以下至少任一项:
1)颜色特征信息;
2)SIFT特征信息。
具体地,颜色特征信息包括但不限于待处理图像查询装置14根据HSV颜色直方图、颜色集、颜色矩等方式从待处理图像中提取的用于描述所述待处理图像的颜色特征的相关信息,以及这些颜色特征的相关信息数值化处理后的数值;SIFT特征信息包括待处理图像查询装置14根据SIFT算法从待处理图像中提取的用于描述所述待处理图像的局部特征的相关信息,以及这些局部特征的相关信息数值化处理后的数值。本领域技术人员应能理解,待处理图像查询装置14不仅可以单独根据颜色特征信息或SIFT特征信息进行待处理图像的相似查询,还可以将颜色特征信息和SIFT特征信息相结合,进行待处理图像的相似查询。本领域技术人员还应能理解上述图像特征信息仅为举例,其他现有的或今后可能出现的图像特征信息如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,所述查询结果包括但不限于,以下至少任一项:
1)所述待处理图像是否属于敏感图像的结果信息;
2)所述待处理图像所对应的第一参考敏感图像;
3)所述待处理图像所对应的第一参考敏感图像的敏感度。
具体地,待处理图像查询装置14在根据待处理图像进行相似查询时,可以获得的查询结果包括但不限于:1)所述待处理图像所对应的第一参考敏感图像;2)所述第一参考敏感图像的敏感度,所述敏感度用于表征参考敏感图库中每一参考敏感图像的敏感程度,可以在每一参考敏感图像被添加至所述参考敏感图库预设,和/或在后续过程中更新;3)根据所述敏感度或者所述第一参考敏感图像与所述待处理图像的相似度获得所述待处理图像是否属于敏感图像的结果信息。在此,本领域技术人员应能理解,待处理图像查询装置14获得的查询结果可以是上述任一项或任多项。本领域技术人员还应能理解上述各项查询结果仅为举例,其他现有的或今后可能出现的查询结果如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
需要说明的是,参考图像获取装置11以及敏感图库建立装置12所执行操作的过程,与待处理图像获取装置13以及待处理图像查询装置14所执行操作的过程,既可以是实时连续进行的,也可以分段进行,即先由参考图像获取装置11以及敏感图库建立装置12执行相应操作建立参考敏感图库后,再由待处理图像获取装置13以及待处理图像查询装置14执行相应操作进行待处理图像的获取和基于所述参考敏感图库的查询。在此,参考图像获取装置11以及敏感图库建立装置12所执行操作的过程,与待处理图像获取装置13以及待处理图像查询装置14所执行操作的过程的连续进行和分段进行可以针对不同的应用。例如,在连续进行时,参考图像获取装置11以及敏感图库建立装置12根据第一提交设备提供的参考敏感图像建立或更新敏感图库,随后,待处理图像获取装置13以及待处理图像查询装置14根据该敏感图库对第二提交设备提交的待处理图像进行敏感图像识别;在分段进行时,参考图像获取装置11以及敏感图库建立装置12在线下根据参考敏感图像建立及更新敏感图库,待处理图像获取装置13获取待处理图像,待处理图像查询装置14根据该敏感图库在线上实时对该待处理图像进行敏感图像识别。
图2为根据本发明一个优选实施例的设备示意图,示出用于识别敏感图像的设备。其中,敏感图像识别设备1包括参考图像获取装置11’、敏感图库建立装置12’、待处理图像获取装置13’、待处理图像查询装置14’、更新图像获取装置15’和敏感图库更新装置16’。具体地,参考图像获取装置11’获取参考敏感图像;敏感图库建立装置12’根据所述参考敏感图像,建立或更新参考敏感图库;待处理图像获取装置13’获取待处理图像,以识别所述待处理图像是否属于敏感图像;待处理图像查询装置14’根据所述待处理图像,在所述参考敏感图库中进行相似查询,以获得与所述待处理图像相对应的查询结果;更新图像获取装置15’获取更新图像与所述更新图像的属性标识;敏感图库更新装置16’根据所述更新图像与所述属性标识,更新所述参考敏感图库。
其中,图2中参考图像获取装置11’、敏感图库建立装置12’、待处理图像获取装置13’、待处理图像查询装置14’所执行的操作与图1中参考图像获取装置11、敏感图库建立装置12、待处理图像获取装置13和待处理图像查询装置14所执行的操作相同,为简明起见,以引用方式包括于此,不再赘述。
更新图像获取装置15’获取更新图像与所述更新图像的属性标识。在此,更新图像获取装置15’获取更新图像的方式与图1中参考图像获取装置11获取参考敏感图像的方式和/或待处理图像获取装置13获取待处理图像的方式相同或基本相同,为简明起见,以引用方式包含于此,不再赘述。所述更新图像的属性标识包括但不限于任何可适用于本发明的用于标识所述更新图像的属性的相关信息,包括正常图像标识和敏感图像标识,所述属性标识可以预先设定。
敏感图库更新装置16’根据更新图像获取装置15’获取的更新图像与所述更新图像的属性标识,更新敏感图库建立装置12’建立的参考敏感图库。在此,敏感图库更新装置16’更新所述参考敏感图库的方式包括但不限于:1)若更新图像的属性标识包括正常图像标识,根据所述更新图像查询所述参考敏感图库,获得相应的参考敏感图像,a)降低所述参考敏感图像的敏感度,当所述敏感度低于预定阈值时,删除所述敏感度对应的参考敏感图像;b)直接删除所述参考敏感图像;2)若更新图像的属性标识包括敏感图像标识,根据所述更新图像查询所述参考敏感图库,获得相应的参考敏感图像,a)增加所述参考敏感图像的敏感度,当所述敏感度超过预定阈值时,将所述敏感度对应的参考敏感图像标识为敏感图像;b)直接将所述参考敏感图像标识为敏感图像。例如,更新图像的属性标识包括正常图像标识,敏感图库更新装置16’根据所述更新图像查询参考敏感图库,获得相应的参考敏感图像1、2、3、4,直接删除这些参考敏感图像,以更新所述参考敏感图库。又如,更新图像的属性标识包括敏感图像标识,敏感图库更新装置16’根据所述更新图像查询参考敏感图库,获得相应的参考敏感图像1、2、3、4,并将这些参考敏感图像的敏感度均加1,其中,参考敏感图像1和3的敏感度加1后为6,超过预定阈值5,则将参考敏感图像1和3标识为敏感图像,以更新所述参考敏感图库。本领域技术人员应能理解上述更新参考敏感图库的方式仅为举例,其他现有的或今后可能出现的更新参考敏感图库的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
需要说明的是,本领域技术人员应能理解,上述敏感图库更新装置16’与上述敏感图库建立装置12’可以是两个相互独立的模块,也可以集成在一起。
优选地,所述更新图像的属性标识包括正常图像标识;敏感图库更新装置16’根据所述更新图像,在所述参考敏感图库中进行相似查询,以获得与所述更新图像相对应的第二参考敏感图像;降低所述第二参考敏感图像的敏感度;当所述降低后的第二参考敏感图像的敏感度低于设定阈值时,删除所述第二参考敏感图像。例如,更新图像的属性标识包括正常图像标识;敏感图库更新装置16’根据所述更新图像,在参考敏感图库中进行相似查询,以获得与所述更新图像相对应的第二参考敏感图像1、2、3、4,并将这些第二参考敏感图像的敏感度减1,其中,第二参考敏感图像1和3的敏感度减1后为4,低于设定阈值5,则删除第二参考敏感图像1和3,以更新所述参考敏感图库。
优选地,所述更新图像的属性标识包括敏感图像标识;敏感图库更新装置16’根据所述更新图像,在所述参考敏感图库中进行相似查询,以获得与所述更新图像相对应的第三参考敏感图像;标识所述第三参考敏感图像为敏感图像,以更新所述参考敏感图库。例如,更新图像的属性标识包括敏感图像标识;敏感图库更新装置16’根据所述更新图像,在参考敏感图库中进行相似查询,以获得与所述更新图像相对应的第三参考敏感图像1、2、3、4,并将这些第三参考敏感图像标识为敏感图像,以更新所述参考敏感图库。
图3为根据本发明另一个优选实施例的设备示意图,示出用于识别敏感图像的设备。其中,敏感图像识别设备1包括参考图像获取装置11”、敏感图库建立装置12”、待处理图像获取装置13”、待处理图像查询装置14”、屏蔽处理装置17”和结果提供装置18”。具体地,参考图像获取装置11”获取参考敏感图像;敏感图库建立装置12”根据所述参考敏感图像,建立或更新参考敏感图库;待处理图像获取装置13”获取待处理图像,以识别所述待处理图像是否属于敏感图像;待处理图像查询装置14”根据所述待处理图像,在所述参考敏感图库中进行相似查询,以获得与所述待处理图像相对应的查询结果;屏蔽处理装置17”根据所述查询结果,对所述待处理图像和/或所述待处理图像的来源做相应的屏蔽处理,以获得与所述屏蔽处理相对应的屏蔽结果;结果提供装置18”将所述屏蔽结果提供给所述待处理图像所对应的提交设备。
其中,图3中的参考图像获取装置11”、敏感图库建立装置12”、待处理图像获取装置13”、待处理图像查询装置14”所执行操作的内容和图1中参考图像获取装置11、敏感图库建立装置12、待处理图像获取装置13和待处理图像查询装置14所执行操作的内容相同或基本相同,为简明起见,以引用方式包括于此,不再赘述。
屏蔽处理装置17”根据所述查询结果,对所述待处理图像和/或所述待处理图像的来源做相应的屏蔽处理,以获得与所述屏蔽处理相对应的屏蔽结果。在此,所述屏蔽处理包括但不限于:1)屏蔽所述待处理图像;2)屏蔽包括所述待处理图像的页面;3)屏蔽所述页面所属的站点;4)屏蔽所述待处理图像的提交设备的标识,包括所述提交设备的访问地址和所述提交设备的其他识别信息;5)屏蔽所述提交设备所对应的用户或管理者的ID。本领域技术人员应能理解,屏蔽处理装置17”既可以同时进行上述任一项或任多项的屏蔽处理,也可以按照一定的执行条件逐步进行上述各项屏蔽处理。本领域技术人员还应能理解上述屏蔽处理的方式仅为举例,其他现有的或今后可能出现的屏蔽处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
结果提供装置18”将所述屏蔽结果提供给所述待处理图像所对应的提交设备。例如,屏蔽处理装置17”根据查询结果,屏蔽待处理图像后,获得图像部分不能显示的页面;结果提供装置18”将该图像部分不能显示的页面推送至该待处理图像的提交设备。又如,屏蔽处理装置17”根据查询结果,屏蔽待处理图像所对应的提交设备的IP地址,并生成404错误页面;结果提供装置18”将该404错误页面推送至该提交设备。本领域技术人员应能理解上述提供屏蔽结果的方式仅为举例,其他现有的或今后可能出现的提供屏蔽结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
需要说明的是,本领域技术人员应能理解,在本发明的一个实施例中,配合参阅图1、图2和图3,结果提供装置18”还可以与图1或图2的敏感图像识别设备1相结合,将所述查询结果提供至所述待处理图像所对应的提交设备。在此,结果提供装置18”提供所述查询结果的方式包括但不限于:1)将所述查询结果逐条或一次全部推送至所述提交设备;2)将所述查询结果的部分或全部基于页面技术,诸如ASP、JSP、PHP等,生成查询结果页面,并将所述查询结果页面推送至所述提交设备,或者将所述查询结果页面的URL推送至所述提交设备,所述提交设备通过访问所述URL指向的所述查询结果页面,获取所述查询结果。本领域技术人员应能理解上述提供查询结果的方式仅为举例,其他现有的或今后可能出现的提供查询结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在本发明的一个优选实施例中(参照图3),参考图像获取装置11”获取参考敏感图像;敏感图库建立装置12”根据所述参考敏感图像,建立或更新参考敏感图库;待处理图像获取装置13”还接收自提交设备提交的指向第一页面的页面访问地址,所述第一页面包括所述待处理图像;根据所述页面访问地址,获得所述第一页面;解析所述第一页面,以获得所述待处理图像。待处理图像查询装置14”根据所述待处理图像,在所述参考敏感图库中进行相似查询,以获得与所述待处理图像相对应的查询结果;结果提供装置18”将所述屏蔽结果提供给所述提交设备。
其中,该实施例中的参考图像获取装置11”、敏感图库建立装置12”、待处理图像查询装置14”和结果提供装置18”所执行操作的内容和前述图3中参考图像获取装置11”、敏感图库建立装置12”、待处理图像查询装置14”和结果提供装置18”所执行操作的内容相同或基本相同,为简明起见,以引用方式包括于此,不再赘述。
待处理图像获取装置13”接收自提交设备提交的指向第一页面的页面访问地址,所述第一页面包括所述待处理图像;根据所述页面访问地址,获得所述第一页面;解析所述第一页面,以获得所述待处理图像。在此,所述提交设备包括用户设备和网络设备。例如,提交设备为论坛服务器,该论坛服务器向敏感图像识别设备1发送一指向论坛页面的URL,该论坛页面包括待处理图像,待处理图像获取装置13”通过该敏感图像识别设备1提供的提交接口接收该URL,并根据该URL获得相应的论坛页面,对该论坛页面进行解析,获得该待处理图像。本领域技术人员应能理解上述获得待处理图像的方式仅为举例,其他现有的或今后可能出现的获得待处理图像的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,本实施例中的敏感图像识别设备1还可以包括屏蔽处理装置17”,根据待处理图像查询装置14”获得的查询结果,对所述第一页面中的待处理图像和/或所述待处理图像的来源做相应的屏蔽处理,以获得与所述屏蔽处理相对应的屏蔽结果;结果提供装置18”将所述屏蔽结果提供给所述待处理图像所对应的提交设备。例如,提交设备为用户设备,待处理图像获取装置13”接收该用户设备提交的URL,根据该URL获取相应的页面,并从该页面中提取待处理图像;待处理图像查询装置14”对该待处理图像的查询结果为该待处理图像属于敏感图像;屏蔽处理装置17”根据该查询结果,屏蔽该用户设备的标识;结果提供装置18”将该屏蔽通知发送至该用户设备。本领域技术人员应能理解上述屏蔽处理的方式仅为举例,其他现有的或今后可能出现的屏蔽处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
图4为根据本发明另一个方面的方法流程图,示出计算机实现的用于识别敏感图像的过程。在此,所述计算机包括任何能够按照事先存储的程序,自动、高速地进行大量数值计算和各种信息处理的现代化智能电子设备,其硬件包括微处理器、FPGA、DSP、嵌入式设备等。
具体地,在步骤S1中,敏感图像识别设备1获取参考敏感图像;在步骤S2中,敏感图像识别设备1根据所述参考敏感图像,建立或更新参考敏感图库;在步骤S3中,敏感图像识别设备1获取待处理图像,以识别所述待处理图像是否属于敏感图像;在步骤S4中,敏感图像识别设备1根据所述待处理图像,在所述参考敏感图库中进行相似查询,以获得与所述待处理图像相对应的查询结果。在此,敏感图像识别设备1包括但不限于各种应用服务器,诸如论坛服务器、博客服务器等,以及与所述应用服务器相连的网络设备,其中,网络设备包括但不限于网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合,在此,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。本领域技术人员应能理解上述敏感图像识别设备以及网络设备仅为举例,其他现有的或今后可能出现的敏感图像识别设备或者网络设备如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在步骤S1中,敏感图像识别设备1获取参考敏感图像。在此,敏感图像识别设备1获取参考敏感图像的方式包括但不限于:1)从其他设备接收所述参考敏感图像,所述其他设备包括但不限于用户设备和网络设备,其中,所述用户设备包括但不限于任何可与用户经由键盘、触摸屏、语音输入设备等进行交换的电子产品,诸如个人计算机、平板电脑、手机、PSP等;2)从所述其他设备获取原始图像,并对所述原始图像进行分类,以获得所述参考敏感图像。例如,敏感图像识别设备1根据其向其他设备提供的参考图像提交接口,获取其他设备经由该参考图像提交接口向该敏感图像识别设备1提交的参考敏感图像。本领域技术人员应能理解上述获取参考敏感图像的方式仅为举例,其他现有的或今后可能出现的获取参考敏感图像的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,在步骤S1中,敏感图像识别设备1获取一个或多个原始图像;对所述原始图像进行分类操作,以从所述原始图像中获得所述参考敏感图像。例如,敏感图像识别设备1从网络开放图库中获取多个原始图像,根据分类器,诸如SVM分类器、基于决策树的分类器、基于AdaBoost算法的分类器等,对这些原始图像进行分类操作,以获得与前述分类器中的预设敏感图像样本或预设敏感图像参数相符的参考敏感图像。本领域技术人员应能理解上述对原始图像进行分类以获取参考敏感图像的方式以及分类器仅为举例,其他现有的或今后可能出现的对原始图像进行分类以获取参考敏感图像或者分类器如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
更优选地,从所述原始图像中获得所述参考敏感图像的所述分类操作基于但不限于,以下至少任一项:
1)预置的SVM分类器;
2)预置的高斯混合模型;
3)基于AdaBoost算法的强分类器。
具体地,SVM分类器、高斯混合模型经敏感图像样本集训练后,可以获得相应的参数,从而成为本发明中用于从原始图像中获得参考敏感图像的分类操作的预置的SVM分类器和预置的高斯混合模型;AdaBoost算法用于挑选经敏感图像样本集训练后获得的最优的弱分类器,并基于这些弱分类器构成强分类器,从而获得本发明中用于所述分类操作的基于AdaBoost算法的强分类器。敏感图像识别设备1根据预置的SVM分类器、预置的高斯混合模型或者基于AdaBoost算法的强分类器,对其获得的原始图像进行分类操作,获得所述原始图像属于敏感图像的概率值,并将概率值超过预定阈值的所述原始图像,作为所述参考敏感图像建立或者更新所述参考敏感图库。
在步骤S2中,敏感图像识别设备1根据其在步骤S1中获取的参考敏感图像,建立或更新参考敏感图库。例如,在步骤S1中,敏感图像识别设备1从其他设备接收参考敏感图像,或者从其他设备获取原始图像,并对原始图像分类后获得参考敏感图像;在步骤S2中,敏感图像识别设备1根据这些参考敏感图像建立参考敏感图库,并在该参考敏感图库建立后,根据其后续获取的参考敏感图像,更新该参考敏感图库。本领域技术人员应能理解上述建立以及更新参考敏感图库的方式仅为举例,其他现有的或今后可能出现的建立或者更新参考敏感图库的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在步骤S3中,敏感图像识别设备1获取待处理图像,以供识别所述待处理图像是否属于敏感图像。在此,敏感图像识别设备1获取所述待处理图像的方式包括但不限于:1)从其他设备接收所述待处理图像;2)从其他设备接收指向所述待处理图像的访问地址,并根据所述访问地址,获取所述待处理图像;3)从网络开放图库,诸如搜索引擎提供的图像搜索结果、网页中包括的图像等,获取所述待处理图像。本领域技术人员应能理解上述获取待处理图像的方式仅为举例,其他现有的或今后可能出现的获取待处理图像的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在步骤S4中,敏感图像识别设备1根据其在步骤S3中获取待处理图像,在步骤S2建立的参考敏感图库中进行相似查询,以获得与所述待处理图像相对应的查询结果。在此,敏感图像识别设备1对待处理图像进行相似查询的方式包括但不限于:1)对待处理图像的局部内容或者全部内容,通过诸如hash算法、MD5算法、SHA算法等对该局部内容或者全部内容计算内容签名,并根据该内容签名查询参考敏感图库;2)提取待处理图像的图像特征信息,诸如颜色特征信息、纹理特征信息、形状特征信息、空间特征信息等,并根据这些图像特征信息查询参考敏感图库。优选地,敏感图像识别设备1在对待处理图像进行相似查询时,还可以结合待处理图像所对应的参考敏感图像的重复率设定不同的相似度阈值,并根据该相似度阈值,获得与所述待处理图像相对应的查询结果。在此,所述重复率包括所述参考敏感图像与历史待处理图像的累计相似次数。例如,对重复率超过10次的参考敏感图像,设定其相应的相似度阈值为70%,对重复率超过5次的参考敏感图像,设定其相应的相似度阈值为80%,对重复率低于5次的参考敏感图像,设定其相应的相似度阈值为90%;敏感图像识别设备1根据待处理图像查询参考敏感图库,并结合参考敏感图像的重复率及对应的相似度阈值,获得相应的查询结果,所述查询结果包括与所述待处理图像相对应的参考敏感图像以及其与所述待处理图像的相似度。进一步地,敏感图像识别设备1还可以根据所述相似度,结合相应参考敏感图像的相似度阈值,判断所述待处理图像是否属于敏感图像,并将判断结果作为查询结果。例如,待处理图像与参考敏感图像的相似度为82%,如果该参考敏感图像对应的相似度阈值为80%,则该待处理图像属于敏感图像;如果该参考敏感图像对应的相似度阈值为90%,则该待处理图像不属于敏感图像。本领域技术人员应能理解上述对待处理图像进行相似查询的方式以及查询结果仅为举例,其他现有的或今后可能出现的对待处理图像进行相似查询的方式或者查询结果如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,敏感图像识别设备1根据其在步骤S3中获取的待处理图像,提取所述待处理图像的图像特征信息;根据所述图像特征信息,在其在步骤S2中建立的参考敏感图库中进行相似查询,以获得所述查询结果。在此,所述图像特征信息包括但不限于任何可适用于本发明的据以对所述待处理图像进行相似查询的图像相关信息,诸如颜色特征信息、纹理特征信息、形状特征信息等。例如,在步骤S3中,敏感图像识别设备1接收自其他设备提交的待处理图像;在步骤S4中,敏感图像识别设备1根据HSV颜色直方图、颜色集等提取所述待处理图像的颜色特征信息,根据灰度共生矩阵、小波变换、随机场模型法等提取所述待处理图像的纹理特征信息,根据傅里叶形状描述符法、边界特征法等提取所述待处理图像的形状特征信息,根据图像分割提取所述待处理图像的空间特征信息,并根据这些图像特征信息查询参考敏感图库,以获得相应的查询结果,如与所述待处理图像相对应的参考敏感图像,以及这些参考敏感图像的敏感度。本领域技术人员应能理解上述提取待处理图像的各项图像特征信息的方式以及图像特征信息仅为举例,其他现有的或今后可能出现的提取待处理图像的各项图像特征信息的方式或者图像特征信息如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
更优选地,所述图像特征信息包括但不限于,以下至少任一项:
1)颜色特征信息;
2)SIFT特征信息。
具体地,颜色特征信息包括但不限于敏感图像识别设备1根据HSV颜色直方图、颜色集、颜色矩等方式从待处理图像中提取的用于描述所述待处理图像的颜色特征的相关信息,以及这些颜色特征的相关信息数值化处理后的数值;SIFT特征信息包括敏感图像识别设备1根据SIFT算法从待处理图像中提取的用于描述所述待处理图像的局部特征的相关信息,以及这些局部特征的相关信息数值化处理后的数值。本领域技术人员应能理解,敏感图像识别设备1不仅可以单独根据颜色特征信息或SIFT特征信息进行待处理图像的相似查询,还可以将颜色特征信息和SIFT特征信息相结合,进行待处理图像的相似查询。本领域技术人员还应能理解上述图像特征信息仅为举例,其他现有的或今后可能出现的图像特征信息如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,所述查询结果包括但不限于,以下至少任一项:
1)所述待处理图像是否属于敏感图像的结果信息;
2)所述待处理图像所对应的第一参考敏感图像;
3)所述待处理图像所对应的第一参考敏感图像的敏感度。
具体地,敏感图像识别设备1在根据待处理图像进行相似查询时,可以获得的查询结果包括但不限于:1)所述待处理图像所对应的第一参考敏感图像;2)所述第一参考敏感图像的敏感度,所述敏感度用于表征参考敏感图库中每一参考敏感图像的敏感程度,可以在每一参考敏感图像被添加至所述参考敏感图库预设,和/或在后续过程中更新;3)根据所述敏感度或者所述第一参考敏感图像与所述待处理图像的相似度获得所述待处理图像是否属于敏感图像的结果信息。在此,本领域技术人员应能理解,敏感图像识别设备1获得的查询结果可以是上述任一项或任多项。本领域技术人员还应能理解上述各项查询结果仅为举例,其他现有的或今后可能出现的查询结果如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
需要说明的是,敏感图像识别设备1在步骤S2以及步骤S2所执行操作的过程,与其在步骤S3以及步骤S4所执行操作的过程,既可以是实时连续进行的,也可以分段进行,即先在步骤S1及步骤S2中执行相应操作建立参考敏感图库后,再在步骤S3及步骤S4中执行相应操作进行待处理图像的获取和基于所述参考敏感图库的查询。在此,敏感图像识别设备1在步骤S1及步骤S2所执行操作的过程,与其在步骤S3及步骤S4所执行操作的过程的连续进行和分段进行可以针对不同的应用。例如,在连续进行时,敏感图像识别设备1在步骤S1及步骤S2根据第一提交设备提供的参考敏感图像建立或更新敏感图库,随后,敏感图像识别设备1在步骤S3及步骤S4根据该敏感图库对第二提交设备提交的待处理图像进行敏感图像识别;在分段进行时,敏感图像识别设备1在步骤S1及步骤S2在线下根据参考敏感图像建立及更新敏感图库,敏感图像识别设备1在步骤S3中获取待处理图像,在步骤S4中根据该敏感图库在线上实时对该待处理图像进行敏感图像识别。
图5为根据本发明一个优选实施例的方法流程图,示出用于识别敏感图像的过程。具体地,在步骤S1’中,敏感图像识别设备1获取参考敏感图像;在步骤S2’中,敏感图像识别设备1根据所述参考敏感图像,建立或更新参考敏感图库;在步骤S3’中,敏感图像识别设备1获取待处理图像,以识别所述待处理图像是否属于敏感图像;在步骤S4’中,敏感图像识别设备1根据所述待处理图像,在所述参考敏感图库中进行相似查询,以获得与所述待处理图像相对应的查询结果;在步骤S5’中,敏感图像识别设备1获取更新图像与所述更新图像的属性标识;在步骤S6’中,敏感图像识别设备1根据所述更新图像与所述属性标识,更新所述参考敏感图库。
其中,图5中敏感图像识别设备1在步骤S1’、步骤S2’、步骤S3’和步骤S4’中所执行的操作与图4中敏感图像识别设备1在步骤S1、步骤S2、步骤S3和步骤S4中所执行的操作相同,为简明起见,以引用方式包括于此,不再赘述。
在步骤S5’中,敏感图像识别设备1获取更新图像与所述更新图像的属性标识。在此,敏感图像识别设备1获取更新图像的方式与图4中参敏感图像识别设备1获取参考敏感图像的方式和/或待处理图像获取装置13获取待处理图像的方式相同或基本相同,为简明起见,以引用方式包含于此,不再赘述。所述更新图像的属性标识包括但不限于任何可适用于本发明的用于标识所述更新图像的属性的相关信息,包括正常图像标识和敏感图像标识,所述属性标识可以预先设定。
在步骤S6’中,敏感图像识别设备1根据其在步骤S5’中获取的更新图像与所述更新图像的属性标识,更新其在步骤S2’中建立的参考敏感图库。在此,敏感图像识别设备1更新所述参考敏感图库的方式包括但不限于:1)若更新图像的属性标识包括正常图像标识,根据所述更新图像查询所述参考敏感图库,获得相应的参考敏感图像,a)降低所述参考敏感图像的敏感度,当所述敏感度低于预定阈值时,删除所述敏感度对应的参考敏感图像;b)直接删除所述参考敏感图像;2)若更新图像的属性标识包括敏感图像标识,根据所述更新图像查询所述参考敏感图库,获得相应的参考敏感图像,a)增加所述参考敏感图像的敏感度,当所述敏感度超过预定阈值时,将所述敏感度对应的参考敏感图像标识为敏感图像;b)直接将所述参考敏感图像标识为敏感图像。例如,更新图像的属性标识包括正常图像标识,敏感图像识别设备1根据所述更新图像查询参考敏感图库,获得相应的参考敏感图像1、2、3、4,直接删除这些参考敏感图像,以更新所述参考敏感图库。又如,更新图像的属性标识包括敏感图像标识,敏感图像识别设备1根据所述更新图像查询参考敏感图库,获得相应的参考敏感图像1、2、3、4,并将这些参考敏感图像的敏感度均加1,其中,参考敏感图像1和3的敏感度加1后为6,超过预定阈值5,则将参考敏感图像1和3标识为敏感图像,以更新所述参考敏感图库。本领域技术人员应能理解上述更新参考敏感图库的方式仅为举例,其他现有的或今后可能出现的更新参考敏感图库的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,所述更新图像的属性标识包括正常图像标识;在步骤S6’中,敏感图像识别设备1根据所述更新图像,在所述参考敏感图库中进行相似查询,以获得与所述更新图像相对应的第二参考敏感图像;降低所述第二参考敏感图像的敏感度;当所述降低后的第二参考敏感图像的敏感度低于设定阈值时,删除所述第二参考敏感图像。例如,更新图像的属性标识包括正常图像标识;敏感图像识别设备1根据所述更新图像,在参考敏感图库中进行相似查询,以获得与所述更新图像相对应的第二参考敏感图像1、2、3、4,并将这些第二参考敏感图像的敏感度减1,其中,第二参考敏感图像1和3的敏感度减1后为4,低于设定阈值5,则删除第二参考敏感图像1和3,以更新所述参考敏感图库。
优选地,所述更新图像的属性标识包括敏感图像标识;在步骤S6’中,敏感图像识别设备1根据所述更新图像,在所述参考敏感图库中进行相似查询,以获得与所述更新图像相对应的第三参考敏感图像;标识所述第三参考敏感图像为敏感图像,以更新所述参考敏感图库。例如,更新图像的属性标识包括敏感图像标识;敏感图像识别设备1根据所述更新图像,在参考敏感图库中进行相似查询,以获得与所述更新图像相对应的第三参考敏感图像1、2、3、4,并将这些第三参考敏感图像标识为敏感图像,以更新所述参考敏感图库。
图6为根据本发明另一个优选实施例的方法流程图,示出用于识别敏感图像的过程。具体地,在步骤S1”中,敏感图像识别设备1获取参考敏感图像;在步骤S2”中,敏感图像识别设备1根据所述参考敏感图像,建立或更新参考敏感图库;在步骤S3”中,敏感图像识别设备1获取待处理图像,以识别所述待处理图像是否属于敏感图像;在步骤S4”中,敏感图像识别设备1根据所述待处理图像,在所述参考敏感图库中进行相似查询,以获得与所述待处理图像相对应的查询结果;在步骤S7”中,敏感图像识别设备1根据所述查询结果,对所述待处理图像和/或所述待处理图像的来源做相应的屏蔽处理,以获得与所述屏蔽处理相对应的屏蔽结果;在步骤S8”中,敏感图像识别设备1将所述屏蔽结果提供给所述待处理图像所对应的提交设备。
其中,图6中的敏感图像识别设备1在步骤S1”、步骤S2”、步骤S3”和步骤S4”中所执行操作的内容和图3中敏感图像识别设备1在步骤S1、步骤S2、步骤S3和步骤S4中所执行操作的内容相同或基本相同,为简明起见,以引用方式包括于此,不再赘述。
在步骤S7”中,敏感图像识别设备1根据所述查询结果,对所述待处理图像和/或所述待处理图像的来源做相应的屏蔽处理,以获得与所述屏蔽处理相对应的屏蔽结果。在此,所述屏蔽处理包括但不限于:1)屏蔽所述待处理图像;2)屏蔽包括所述待处理图像的页面;3)屏蔽所述页面所属的站点;4)屏蔽所述待处理图像的提交设备的标识,包括所述提交设备的访问地址和所述提交设备的其他识别信息;5)屏蔽所述提交设备所对应的用户或管理者的ID。本领域技术人员应能理解,敏感图像识别设备1既可以同时进行上述任一项或任多项的屏蔽处理,也可以按照一定的执行条件逐步进行上述各项屏蔽处理。本领域技术人员还应能理解上述屏蔽处理仅为举例,其他现有的或今后可能出现的屏蔽处理如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在步骤S8”中,敏感图像识别设备1将所述屏蔽结果提供给所述待处理图像所对应的提交设备。例如,在步骤S7”中,敏感图像识别设备1根据查询结果,屏蔽待处理图像后,获得图像部分不能显示的页面;在步骤S8”中,敏感图像识别设备1将该图像部分不能显示的页面推送至该待处理图像的提交设备。又如,在步骤S7”中,敏感图像识别设备1根据查询结果,屏蔽待处理图像所对应的提交设备的IP地址,并生成404错误页面;在步骤S8”中,敏感图像识别设备1将该404错误页面推送至该提交设备。本领域技术人员应能理解上述提供屏蔽结果的方式仅为举例,其他现有的或今后可能出现的提供屏蔽结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
需要说明的是,本领域技术人员应能理解,在本发明的一个实施例中,配合参阅图4、图5和图6,步骤S8”还可以与图4或图5中敏感图像识别设备1的操作过程相结合,将所述查询结果提供至所述待处理图像所对应的提交设备。在此,敏感图像识别设备1提供所述查询结果的方式包括但不限于:1)将所述查询结果逐条或一次全部推送至所述提交设备;2)将所述查询结果的部分或全部基于页面技术,诸如ASP、JSP、PHP等,生成查询结果页面,并将所述查询结果页面推送至所述提交设备,或者将所述查询结果页面的URL推送至所述提交设备,所述提交设备通过访问所述URL指向的所述查询结果页面,获取所述查询结果。本领域技术人员应能理解上述提供查询结果的方式仅为举例,其他现有的或今后可能出现的提供查询结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在本发明的一个优选实施例中(参照图6),在步骤S1”中,敏感图像识别设备1获取参考敏感图像;在步骤S2”中,敏感图像识别设备1根据所述参考敏感图像,建立或更新参考敏感图库;在步骤S3”中,敏感图像识别设备1还接收自提交设备提交的指向第一页面的页面访问地址,所述第一页面包括所述待处理图像;根据所述页面访问地址,获得所述第一页面;解析所述第一页面,以获得所述待处理图像。在步骤S4”中,敏感图像识别设备1根据所述待处理图像,在所述参考敏感图库中进行相似查询,以获得与所述待处理图像相对应的查询结果;在步骤S8”中,敏感图像识别设备1将所述屏蔽结果提供给所述提交设备。
其中,该实施例中的敏感图像识别设备1在步骤S1”、步骤S2”、步骤S4”和步骤S8”中所执行操作的内容和前述图6中敏感图像识别设备1在步骤S1”、步骤S2”、步骤S4”和步骤S8”中所执行操作的内容相同或基本相同,为简明起见,以引用方式包括于此,不再赘述。
在步骤S3”中,敏感图像识别设备1接收自提交设备提交的指向第一页面的页面访问地址,所述第一页面包括所述待处理图像;根据所述页面访问地址,获得所述第一页面;解析所述第一页面,以获得所述待处理图像。在此,所述提交设备包括用户设备和网络设备。例如,提交设备为论坛服务器,该论坛服务器向该敏感图像识别设备1发送一指向论坛页面的URL,该论坛页面包括待处理图像,该敏感图像识别设备1通过其提供的提交接口接收该URL,并根据该URL获得相应的论坛页面,对该论坛页面进行解析,获得该待处理图像。本领域技术人员应能理解上述获得待处理图像的方式仅为举例,其他现有的或今后可能出现的获得待处理图像的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,本实施例中还可以包括步骤S7”,在步骤S7”中,敏感图像识别设备1根据其在步骤S4”中获得的查询结果,对所述第一页面中的待处理图像和/或所述待处理图像的来源做相应的屏蔽处理,以获得与所述屏蔽处理相对应的屏蔽结果;在步骤S8”中,敏感图像识别设备1将所述屏蔽结果提供给所述待处理图像所对应的提交设备。例如,提交设备为用户设备,在步骤S3”中,敏感图像识别设备1接收该用户设备提交的URL,根据该URL获取相应的页面,并从该页面中提取待处理图像;在步骤S4”中,敏感图像识别设备1对该待处理图像的查询结果为该待处理图像属于敏感图像;在步骤S7”中,敏感图像识别设备1根据该查询结果,屏蔽该用户设备的标识;在步骤S8”中,敏感图像识别设备1将该屏蔽通知发送至该用户设备。本领域技术人员应能理解上述屏蔽处理的方式仅为举例,其他现有的或今后可能出现的屏蔽处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。***权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (24)

1.一种计算机实现的用于识别敏感图像的方法,其中,该方法包括以下步骤:
a获取参考敏感图像;
b根据所述参考敏感图像,建立或更新参考敏感图库;
其中,该方法还包括:
x获取待处理图像,以供识别所述待处理图像是否属于敏感图像;
y根据所述待处理图像,在所述参考敏感图库中进行相似查询,以获得与所述待处理图像相对应的查询结果。
2.根据权利要求1所述的方法,其中,所述步骤a包括:
-获取一个或多个原始图像;
-对所述原始图像进行分类操作,以从所述原始图像中获得所述参考敏感图像。
3.根据权利要求2所述的方法,其中,所述分类操作基于以下至少任一项,从所述原始图像中获得所述参考敏感图像:
-预置的SVM分类器;
-预置的高斯混合模型;
-基于adaboost算法的强分类器。
4.根据权利要求1至3中任一项所述的方法,其中,所述步骤y包括:
-根据所述待处理图像,提取所述待处理图像的图像特征信息;
-根据所述图像特征信息,在所述参考敏感图库中进行相似查询,以获得所述查询结果。
5.根据权利要求4所述的方法,其中,所述图像特征信息包括以下至少任一项:
-颜色特征信息;
-SIFT特征信息。
6.根据权利要求1至5中任一项所述的方法,其中,所述查询结果包括以下至少任一项:
-所述待处理图像是否属于敏感图像的结果信息;
-所述待处理图像所对应的第一参考敏感图像;
-所述待处理图像所对应的第一参考敏感图像的敏感度。
7.根据权利要求1至6中任一项所述的方法,其中,该方法还包括:
-获取更新图像与所述更新图像的属性标识;
i根据所述更新图像与所述属性标识,更新所述参考敏感图库。
8.根据权利要求7所述的方法,其中,所述属性标识包括正常图像标识;
其中,所述步骤i还包括:
-根据所述更新图像,在所述参考敏感图库中进行相似查询,以获得与所述更新图像相对应的第二参考敏感图像;
-降低所述第二参考敏感图像的敏感度;
-当所述降低后的第二参考敏感图像的敏感度低于设定阈值时,删除所述第二参考敏感图像。
9.根据权利要求7所述的方法,其中,所述属性标识包括敏感图像标识;
其中,所述步骤i还包括:
-根据所述更新图像,在所述参考敏感图库中进行相似查询,以获得与所述更新图像相对应的第三参考敏感图像;
-标识所述第三参考敏感图像为敏感图像,以更新所述参考敏感图库。
10.根据权利要求1至9中任一项所述的方法,其中,该方法还包括:
k将所述查询结果提供至所述待处理图像所对应的提交设备。
11.根据权利要求10所述的方法,其中,所述步骤x还包括:
-接收自所述提交设备提交的指向第一页面的页面访问地址,所述第一页面包括所述待处理图像;
-根据所述页面访问地址,获得所述第一页面;
-解析所述第一页面,以获得所述待处理图像。
12.根据权利要求10或11所述的方法,其中,该方法还包括:
-根据所述查询结果,对所述待处理图像和/或所述待处理图像的来源做相应的屏蔽处理,以获得与所述屏蔽处理相对应的屏蔽结果;
其中,所述步骤k还包括:
-将所述屏蔽结果提供给所述提交设备。
13.一种用于识别敏感图像的设备,其中,该设备包括:
参考图像获取装置,用于获取参考敏感图像;
敏感图库建立装置,用于根据所述参考敏感图像,建立或更新参考敏感图库;
其中,该设备还包括:
待处理图像获取装置,用于获取待处理图像,以供识别所述待处理图像是否属于敏感图像;
待处理图像查询装置,用于根据所述待处理图像,在所述参考敏感图库中进行相似查询,以获得与所述待处理图像相对应的查询结果。
14.根据权利要求13所述的设备,其中,所述参考图像获取装置还用于:
-获取一个或多个原始图像;
-对所述原始图像进行分类操作,以从所述原始图像中获得所述参考敏感图像。
15.根据权利要求14所述的设备,其中,所述分类操作基于以下至少任一项,从所述原始图像中获得所述参考敏感图像:
-预置的SVM分类器;
-预置的高斯混合模型;
-基于adaboost算法的强分类器。
16.根据权利要求13至15中任一项所述的设备,其中,所述待处理图像查询装置还用于:
-根据所述待处理图像,提取所述待处理图像的图像特征信息;
-根据所述图像特征信息,在所述参考敏感图库中进行相似查询,以获得所述查询结果。
17.根据权利要求16所述的设备,其中,所述图像特征信息包括以下至少任一项:
-颜色特征信息;
-SIFT特征信息。
18.根据权利要求13至17中任一项所述的设备,其中,所述查询结果包括以下至少任一项:
-所述待处理图像是否属于敏感图像的结果信息;
-所述待处理图像所对应的第一参考敏感图像;
-所述待处理图像所对应的第一参考敏感图像的敏感度。
19.根据权利要求13至18中任一项所述的设备,其中,该设备还包括:
更新图像获取装置,用于获取更新图像与所述更新图像的属性标识;
敏感图库更新装置,用于根据所述更新图像与所述属性标识,更新所述参考敏感图库。
20.根据权利要求19所述的设备,其中,所述属性标识包括正常图像标识;
其中,所述敏感图库更新装置还用于:
-根据所述更新图像,在所述参考敏感图库中进行相似查询,以获得与所述更新图像相对应的第二参考敏感图像;
-降低所述第二参考敏感图像的敏感度;
-当所述降低后的第二参考敏感图像的敏感度低于设定阈值时,删除所述第二参考敏感图像。
21.根据权利要求19所述的设备,其中,所述属性标识包括敏感图像标识;
其中,所述敏感图库更新装置还用于:
-根据所述更新图像,在所述参考敏感图库中进行相似查询,以获得与所述更新图像相对应的第三参考敏感图像;
-标识所述第三参考敏感图像为敏感图像,以更新所述参考敏感图库。
22.根据权利要求13至21中任一项所述的设备,其中,该设备还包括:
结果提供装置,用于将所述查询结果提供至所述待处理图像所对应的提交设备。
23.根据权利要求22所述的设备,其中,所述待处理图像获取装置还用于:
-接收自所述提交设备提交的指向第一页面的页面访问地址,所述第一页面包括所述待处理图像;
-根据所述页面访问地址,获得所述第一页面;
-解析所述第一页面,以获得所述待处理图像。
24.根据权利要求22或23所述的设备,其中,该设备还包括:
屏蔽处理装置,用于根据所述查询结果,对所述待处理图像和/或所述待处理图像的来源做相应的屏蔽处理,以获得与所述屏蔽处理相对应的屏蔽结果;
其中,所述结果提供装置还用于:
-将所述屏蔽结果提供给所述提交设备。
CN201110246789.5A 2011-08-24 2011-08-24 一种用于识别敏感图像的方法与设备 Active CN102306287B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110246789.5A CN102306287B (zh) 2011-08-24 2011-08-24 一种用于识别敏感图像的方法与设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110246789.5A CN102306287B (zh) 2011-08-24 2011-08-24 一种用于识别敏感图像的方法与设备

Publications (2)

Publication Number Publication Date
CN102306287A true CN102306287A (zh) 2012-01-04
CN102306287B CN102306287B (zh) 2017-10-10

Family

ID=45380147

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110246789.5A Active CN102306287B (zh) 2011-08-24 2011-08-24 一种用于识别敏感图像的方法与设备

Country Status (1)

Country Link
CN (1) CN102306287B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831242A (zh) * 2012-09-10 2012-12-19 东莞宇龙通信科技有限公司 搜索图片信息的方法及装置
CN103377473A (zh) * 2012-04-19 2013-10-30 腾讯科技(深圳)有限公司 一种图像排重方法和装置
CN105404631A (zh) * 2014-09-15 2016-03-16 腾讯科技(深圳)有限公司 图片识别方法和装置
CN106557527A (zh) * 2015-09-30 2017-04-05 中兴通讯股份有限公司 一种色情图像检测和***
CN106682694A (zh) * 2016-12-27 2017-05-17 复旦大学 一种基于深度学习的敏感图像识别方法
CN107403173A (zh) * 2017-08-21 2017-11-28 合肥麟图信息科技有限公司 一种人脸识别***及方法
CN108304481A (zh) * 2017-12-29 2018-07-20 成都三零凯天通信实业有限公司 一种面向多通道互联网新媒体数据的视图像内容布控方法
CN109145940A (zh) * 2018-07-02 2019-01-04 北京陌上花科技有限公司 图像识别方法和装置
CN110971928A (zh) * 2018-09-30 2020-04-07 武汉斗鱼网络科技有限公司 一种图片识别方法及相关装置
CN111259304A (zh) * 2020-02-17 2020-06-09 猎港信息技术(上海)有限公司 基于图像识别的论坛监控***
US11120069B2 (en) 2016-07-21 2021-09-14 International Business Machines Corporation Graph-based online image queries
CN114822781A (zh) * 2022-04-24 2022-07-29 唐山启奥科技股份有限公司 基于检查图像的医疗图像脱敏方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1728161A (zh) * 2005-07-28 2006-02-01 上海交通大学 基于非均匀量化颜色特征矢量的敏感图像过滤方法
CN101281521A (zh) * 2007-04-05 2008-10-08 中国科学院自动化研究所 一种基于多分类器融合的敏感网页过滤方法及***
CN101447020A (zh) * 2008-12-12 2009-06-03 北京理工大学 基于直觉模糊的色情图像识别方法
CN101777064A (zh) * 2009-01-12 2010-07-14 鸿富锦精密工业(深圳)有限公司 图片搜索***及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1728161A (zh) * 2005-07-28 2006-02-01 上海交通大学 基于非均匀量化颜色特征矢量的敏感图像过滤方法
CN101281521A (zh) * 2007-04-05 2008-10-08 中国科学院自动化研究所 一种基于多分类器融合的敏感网页过滤方法及***
CN101447020A (zh) * 2008-12-12 2009-06-03 北京理工大学 基于直觉模糊的色情图像识别方法
CN101777064A (zh) * 2009-01-12 2010-07-14 鸿富锦精密工业(深圳)有限公司 图片搜索***及方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103377473A (zh) * 2012-04-19 2013-10-30 腾讯科技(深圳)有限公司 一种图像排重方法和装置
CN102831242B (zh) * 2012-09-10 2016-08-24 东莞宇龙通信科技有限公司 搜索图片信息的方法及装置
CN102831242A (zh) * 2012-09-10 2012-12-19 东莞宇龙通信科技有限公司 搜索图片信息的方法及装置
CN105404631A (zh) * 2014-09-15 2016-03-16 腾讯科技(深圳)有限公司 图片识别方法和装置
CN106557527A (zh) * 2015-09-30 2017-04-05 中兴通讯股份有限公司 一种色情图像检测和***
US11120069B2 (en) 2016-07-21 2021-09-14 International Business Machines Corporation Graph-based online image queries
CN106682694A (zh) * 2016-12-27 2017-05-17 复旦大学 一种基于深度学习的敏感图像识别方法
CN107403173A (zh) * 2017-08-21 2017-11-28 合肥麟图信息科技有限公司 一种人脸识别***及方法
CN107403173B (zh) * 2017-08-21 2020-10-09 合肥麟图信息科技有限公司 一种人脸识别***及方法
CN108304481A (zh) * 2017-12-29 2018-07-20 成都三零凯天通信实业有限公司 一种面向多通道互联网新媒体数据的视图像内容布控方法
CN109145940A (zh) * 2018-07-02 2019-01-04 北京陌上花科技有限公司 图像识别方法和装置
CN110971928A (zh) * 2018-09-30 2020-04-07 武汉斗鱼网络科技有限公司 一种图片识别方法及相关装置
CN110971928B (zh) * 2018-09-30 2022-03-25 武汉斗鱼网络科技有限公司 一种图片识别方法及相关装置
CN111259304A (zh) * 2020-02-17 2020-06-09 猎港信息技术(上海)有限公司 基于图像识别的论坛监控***
CN114822781A (zh) * 2022-04-24 2022-07-29 唐山启奥科技股份有限公司 基于检查图像的医疗图像脱敏方法

Also Published As

Publication number Publication date
CN102306287B (zh) 2017-10-10

Similar Documents

Publication Publication Date Title
CN102306287A (zh) 一种用于识别敏感图像的方法与设备
CN108629043B (zh) 网页目标信息的提取方法、装置及存储介质
CN109005145B (zh) 一种基于自动特征抽取的恶意url检测***及其方法
US20200004815A1 (en) Text entity detection and recognition from images
CN110738039B (zh) 一种案件辅助信息的提示方法、装置、存储介质和服务器
CN108021806B (zh) 一种恶意安装包的识别方法和装置
CN110647896B (zh) 一种基于logo图像的钓鱼页面识别方法及相关设备
CN110929203B (zh) 异常用户的识别方法、装置、设备及存储介质
CN110795714A (zh) 一种身份验证方法、装置、计算机设备及存储介质
CN109756467B (zh) 一种钓鱼网站的识别方法及装置
CN110287311A (zh) 文本分类方法及装置、存储介质、计算机设备
CN109871749A (zh) 一种基于深度哈希的行人重识别方法和装置、计算机***
CN113486664A (zh) 文本数据可视化分析方法、装置、设备及存储介质
CN108268641A (zh) ***信息识别方法及***信息识别装置、设备和存储介质
CN112926601A (zh) 基于深度学习的图像识别方法、装置、设备及存储介质
CN106844381B (zh) 图像处理装置及方法
CN111783812B (zh) 违禁图像识别方法、装置和计算机可读存储介质
CN112307994A (zh) 基于扫地机的障碍物识别方法、电子装置及存储介质
CN110650108A (zh) 一种基于icon图标的钓鱼页面识别方法及相关设备
CN110647895A (zh) 一种基于登录框图像的钓鱼页面识别方法及相关设备
CN113962199B (zh) 文本识别方法、装置、设备、存储介质及程序产品
CN114448664A (zh) 钓鱼网页的识别方法、装置、计算机设备及存储介质
CN113076961A (zh) 一种图像特征库更新方法、图像检测方法和装置
CN111159588B (zh) 一种基于url成像技术的恶意url检测方法
CN112381458A (zh) 项目评审方法、项目评审装置、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant