CN114913534A - 基于区块链的网络安全异常图像大数据检测方法及*** - Google Patents

基于区块链的网络安全异常图像大数据检测方法及*** Download PDF

Info

Publication number
CN114913534A
CN114913534A CN202210844485.7A CN202210844485A CN114913534A CN 114913534 A CN114913534 A CN 114913534A CN 202210844485 A CN202210844485 A CN 202210844485A CN 114913534 A CN114913534 A CN 114913534A
Authority
CN
China
Prior art keywords
image
target image
similarity
target
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210844485.7A
Other languages
English (en)
Inventor
王军利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiamuan Technology Co ltd
Original Assignee
Beijing Jiamuan Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiamuan Technology Co ltd filed Critical Beijing Jiamuan Technology Co ltd
Priority to CN202210844485.7A priority Critical patent/CN114913534A/zh
Publication of CN114913534A publication Critical patent/CN114913534A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/19007Matching; Proximity measures
    • G06V30/19013Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/19007Matching; Proximity measures
    • G06V30/19093Proximity measures, i.e. similarity or distance measures
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于区块链的网络安全异常图像大数据检测方法及***,涉及图像识别技术领域。该方法包括:获取目标图像,采集对应的观看者记录信息,并上链存储;对目标图像进行文字识别,并进行词汇匹配,若匹配成功,则认定为疑似异常图像;反之,则选定多个异常图像作为模板图像,计算目标图像和各个模板图像的相似度;若相似度大于预置的相似度阈值,则认定为疑似异常图像;反之,则对目标图像进行图像描述处理,并进行词汇匹配,若匹配成功,则认定为疑似异常图像;反之,则认定对应的目标图像为非异常图像。本发明可进行精准的图像比对和文字识别,并结合区块链技术保证了所有数据的真实可靠性,大大提高了异常图像的检测精度。

Description

基于区块链的网络安全异常图像大数据检测方法及***
技术领域
本发明涉及图像识别技术领域,具体而言,涉及一种基于区块链的网络安全异常图像大数据检测方法及***。
背景技术
随着互联网技术的高速发展,网络安全越来越引起大家的重视,网络中经常会出现一些异常图像,给网络安全带来了很大的负面影响。
尽管传统的图像识别、目标检测方法能够识别出部分异常图像,但往往无法全面和精准地检测出危害网络安全的异常图像。区块链作为近几年新兴的技术,可以在网络安全方面发挥出重要的作用;因此,如何结合区块链技术实现对网络安全图像大数据异常的全面且精准的检测成为一个新的问题。
发明内容
为了克服上述问题或者至少部分地解决上述问题,本发明实施例提供一种基于区块链的网络安全异常图像大数据检测方法及***,可进行精准的图像比对和文字识别,并结合区块链技术保证了所有数据的真实可靠性,大大提高了异常图像的检测精度。
本发明的实施例是这样实现的:
第一方面,本发明实施例提供一种基于区块链的网络安全异常图像大数据检测方法,包括以下步骤:
S1、获取网络中新发布的目标图像和对应的图像发布者信息,并采集对应目标图像的观看者的记录信息,将目标图像、图像发布者信息和对应的观看者的记录信息上传至区块链中进行存储;
S2、利用多OCR技术互验方法对目标图像中的文字进行识别,以得到目标文字识别结果;
S3、将目标文字识别结果与预置的异常词汇数据库中的词汇进行匹配,若匹配成功,则将对应的目标图像认定为疑似异常图像,并将对应的目标图像发送给对应的网络管理员进行核查;反之,则进入步骤S4;
S4、选定多个异常图像作为模板图像,并利用基于差异性空洞卷积核的相似度计算方法计算目标图像和各个模板图像的相似度;若目标图像和任意一个模板图像的相似度大于预置的相似度阈值,则将对应的目标图像认定为疑似异常图像,并将对应的目标图像发送给对应的网络管理员进行核查;反之,则进入步骤S5;
S5、利用基于超分辨率重建的图像描述方法对目标图像进行处理,以得到目标图像对应的目标描述语句;
S6、将目标描述语句与预置的异常词汇数据库中的词汇进行匹配,若匹配成功,则将对应的目标图像认定为疑似异常图像,并将对应的目标图像发送给对应的网络管理员进行核查;反之,则认定对应的目标图像为非异常图像。
为了解决现有技术中无法全面和精准地检测出危害网络安全的异常图像的技术问题,本发明利用多OCR技术互验的方法对图像中的文字进行识别,显著地提升了文字识别的精准度,进而有效保证了异常图像识别的精度。同时,本发明还利用基于差异性空洞卷积核的相似度计算方法,显著地提升了新发布的目标图像和模板图像之间的相似度的计算精度,进而精准的识别到疑似异常的图像。本发明还利用了基于超分辨率重建的图像描述方法对图像进行处理,显著地提升了图像描述语句的生成质量。本发明还结合区块链技术,将新发布的图像对应的观看者的记录信息进行上链存储,为后续追责认定提供了真实有效的数据,提升了异常图像检测的可靠性。本发明可进行精准的图像比对和文字识别,并结合区块链技术保证了所有数据的真实可靠性,大大提高了异常图像的检测精度。
基于第一方面,在本发明的一些实施例中,上述利用多OCR技术互验方法对目标图像中的文字进行识别,以得到目标文字识别结果的方法包括以下步骤:
采用多个OCR识别模型分别对目标图像中的文字进行识别,以得到多个文字识别结果;
统计并根据各个文字识别结果确定目标文字识别结果。
基于第一方面,在本发明的一些实施例中,上述利用基于差异性空洞卷积核的相似度计算方法计算目标图像和各个模板图像的相似度的方法包括以下步骤:
利用空洞率为N的卷积核分别对目标图像和模板图像进行过滤,对过滤后的目标图像和模板图像分别进行稀疏编码,并利用欧式距离计算目标图像和模板图像之间的相似度,得到第一相似度结果;N为大于等于1的自然数;
利用空洞率为N+1的卷积核分别对目标图像和模板图像进行过滤,对过滤后的目标图像和模板图像分别进行稀疏编码,并利用欧式距离计算目标图像和模板图像之间的相似度,得到第二相似度结果;
利用空洞率为N+2的卷积核分别对目标图像和模板图像进行过滤,对过滤后的目标图像和模板图像分别进行稀疏编码,并利用欧式距离计算目标图像和模板图像之间的相似度,得到第三相似度结果。
基于第一方面,在本发明的一些实施例中,该基于区块链的网络安全异常图像大数据检测方法还包括以下步骤:
若第一相似度结果、第二相似度结果和第三相似度结果中至少存在一个结果大于预置的相似度阈值,则将对应的目标图像认定为疑似异常图像。
基于第一方面,在本发明的一些实施例中,上述利用基于超分辨率重建的图像描述方法对目标图像进行处理的方法包括以下步骤:
对目标图像进行超分辨率重建;
采用图像描述方法对重建后的目标图像进行图像描述处理。
基于第一方面,在本发明的一些实施例中,上述图像描述方法包括基于CNN+LSTM的图像描述或基于Transformer+LSTM的图像描述。
基于第一方面,在本发明的一些实施例中,该基于区块链的网络安全异常图像大数据检测方法还包括以下步骤:
获取并根据网络管理员的核查结果提取区块链中对应的图像发布者信息。
第二方面,本发明实施例提供一种基于区块链的网络安全异常图像大数据检测***,包括:图像上链模块、文字识别模块、第一词汇匹配模块、相似度判别模块、图像描述模块以及第二词汇匹配模块,其中:
图像上链模块,用于获取网络中新发布的目标图像和对应的图像发布者信息,并采集的对应目标图像的观看者的记录信息,将目标图像、图像发布者信息和对应的观看者的记录信息上传至区块链中进行存储;
文字识别模块,用于利用多OCR技术互验方法对目标图像中的文字进行识别,以得到目标文字识别结果;
第一词汇匹配模块,用于将目标文字识别结果与预置的异常词汇数据库中的词汇进行匹配,若匹配成功,则将对应的目标图像认定为疑似异常图像,并将对应的目标图像发送给对应的网络管理员进行核查;反之,则相似度判别模块工作;
相似度判别模块,用于选定多个异常图像作为模板图像,并利用基于差异性空洞卷积核的相似度计算方法计算目标图像和各个模板图像的相似度;若目标图像和任意一个模板图像的相似度大于预置的相似度阈值,则将对应的目标图像认定为疑似异常图像,并将对应的目标图像发送给对应的网络管理员进行核查;反之,则图像描述模块工作;
图像描述模块,用于利用基于超分辨率重建的图像描述方法对目标图像进行处理,以得到目标图像对应的目标描述语句;
第二词汇匹配模块,用于将目标描述语句与预置的异常词汇数据库中的词汇进行匹配,若匹配成功,则将对应的目标图像认定为疑似异常图像,并将对应的目标图像发送给对应的网络管理员进行核查;反之,则认定对应的目标图像为非异常图像。
为了解决现有技术中无法全面和精准地检测出危害网络安全的异常图像的技术问题,本***通过图像上链模块、文字识别模块、第一词汇匹配模块、相似度判别模块、图像描述模块以及第二词汇匹配模块等多个模块的配合,利用多OCR技术互验的方法对图像中的文字进行识别,显著地提升了文字识别的精准度,进而有效保证了异常图像识别的精度。同时,本发明还利用基于差异性空洞卷积核的相似度计算方法,显著地提升了新发布的目标图像和模板图像之间的相似度的计算精度,进而精准的识别到疑似异常的图像。本发明还利用了基于超分辨率重建的图像描述方法对图像进行处理,显著地提升了图像描述语句的生成质量。本发明还结合区块链技术,将新发布的图像对应的观看者的记录信息进行上链存储,为后续追责认定提供了真实有效的数据,提升了异常图像检测的可靠性。本发明可进行精准的图像比对和文字识别,并结合区块链技术保证了所有数据的真实可靠性,大大提高了异常图像的检测精度。
第三方面,本申请实施例提供一种电子设备,其包括存储器,用于存储一个或多个程序;处理器。当一个或多个程序被处理器执行时,实现如上述第一方面中任一项的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面中任一项的方法。
本发明实施例至少具有如下优点或有益效果:
本发明实施例提供一种基于区块链的网络安全异常图像大数据检测方法及***,解决了现有技术中无法全面和精准地检测出危害网络安全的异常图像的技术问题,本发明利用多OCR技术互验的方法对图像中的文字进行识别,显著地提升了文字识别的精准度,进而有效保证了异常图像识别的精度。同时,本发明还利用基于差异性空洞卷积核的相似度计算方法,显著地提升了新发布的目标图像和模板图像之间的相似度的计算精度,进而精准的识别到疑似异常的图像。本发明还利用了基于超分辨率重建的图像描述方法对图像进行处理,显著地提升了图像描述语句的生成质量。本发明还结合区块链技术,将新发布的图像对应的观看者的记录信息进行上链存储,为后续追责认定提供了真实有效的数据,提升了异常图像检测的可靠性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例一种基于区块链的网络安全异常图像大数据检测方法的流程图;
图2为本发明实施例一种基于区块链的网络安全异常图像大数据检测方法中利用多OCR技术互验方法对目标图像中的文字进行识别的流程图;
图3为本发明实施例一种基于区块链的网络安全异常图像大数据检测方法中利用基于超分辨率重建的图像描述方法对目标图像进行处理的流程图;
图4为本发明实施例一种基于区块链的网络安全异常图像大数据检测***的原理框图;
图5为本发明实施例提供的一种电子设备的结构框图。
附图标记说明:100、图像上链模块;200、文字识别模块;300、第一词汇匹配模块;400、相似度判别模块;500、图像描述模块;600、第二词汇匹配模块;101、存储器;102、处理器;103、通信接口。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括上述要素的过程、方法、物品或者设备中还存在另外的相同要素。
实施例:
如图1-图3所示,第一方面,本发明实施例提供一种基于区块链的网络安全异常图像大数据检测方法,包括以下步骤:
S1、获取网络中新发布的目标图像和对应的图像发布者信息,并采集对应目标图像的观看者的记录信息,将目标图像、图像发布者信息和对应的观看者的记录信息上传至区块链中进行存储;对于网络中新发布的一幅图像,发布时的所有图像观看者记录该图像由张三首次发布(例如,300人同时观看该图像,300人同时记录下该图像由张三首次发布),将观看者的记录信息也同时上传到区块链中进行存证,以便更好的确保图像所有者的真实性。
S2、利用多OCR技术互验方法对目标图像中的文字进行识别,以得到目标文字识别结果;上述OCR识别模型包括EAST模型、CRNN+CTC模型、CNN+LSTM+CTC架构等,上述OCR识别模型均采用现有常规识别模型,在此不做赘述。
进一步地,如图2所示,包括:
S21、采用多个OCR识别模型分别对目标图像中的文字进行识别,以得到多个文字识别结果;
S22、统计并根据各个文字识别结果确定目标文字识别结果。
S3、将目标文字识别结果与预置的异常词汇数据库中的词汇进行匹配,若匹配成功,则将对应的目标图像认定为疑似异常图像,并将对应的目标图像发送给对应的网络管理员进行核查;反之,则进入步骤S4;
在本发明的一些实施例中,利用多OCR技术互验的方法对新发布图像中的文字进行识别,如果识别出异常词汇(例如病毒、暴力等词汇),即与预置的异常词汇数据库中词汇匹配成功,则认定为疑似异常图像,发送给网络管理员核查;否则,继续进行下一步。如果多个OCR技术的识别结果不一致,利用少数服从多数的原则,例如绝大多数的方法将某一文字识别为文字A,少部分方法将某一文字识别为文字B,最后将该文字识别为文字A。如果图像中没有检测到文字,继续进行下一步即可。
S4、选定多个异常图像作为模板图像,并利用基于差异性空洞卷积核的相似度计算方法计算目标图像和各个模板图像的相似度;若目标图像和任意一个模板图像的相似度大于预置的相似度阈值,则将对应的目标图像认定为疑似异常图像,并将对应的目标图像发送给对应的网络管理员进行核查;反之,则进入步骤S5;
进一步地,包括:利用空洞率为N的卷积核分别对目标图像和模板图像进行过滤,对过滤后的目标图像和模板图像分别进行稀疏编码,并利用欧式距离计算目标图像和模板图像之间的相似度,得到第一相似度结果;N为大于等于1的自然数;利用空洞率为N+1的卷积核分别对目标图像和模板图像进行过滤,对过滤后的目标图像和模板图像分别进行稀疏编码,并利用欧式距离计算目标图像和模板图像之间的相似度,得到第二相似度结果;利用空洞率为N+2的卷积核分别对目标图像和模板图像进行过滤,对过滤后的目标图像和模板图像分别进行稀疏编码,并利用欧式距离计算目标图像和模板图像之间的相似度,得到第三相似度结果。
进一步地,包括:若第一相似度结果、第二相似度结果和第三相似度结果中至少存在一个结果大于预置的相似度阈值,则将对应的目标图像认定为疑似异常图像。
在本发明的一些实施例中,人工挑选出一定数量的异常图像作为模板图像,利用基于差异性空洞卷积核的相似度计算方法,计算新发布图像和模板图像的相似度。如果新发布图像和任意一个模板图像相似度较高,认定为疑似异常图像,发送给网络管理员核查;否则,继续进行下一步。
基于差异性空洞卷积核的相似度计算方法步骤如下:
(a)利用空洞率为1的卷积核对新发布图像和某一特定模板图像进行处理,得到过滤后的新发布图像和特定模板图像。对过滤后的新发布图像和特定模板图像分别进行稀疏编码,利用欧式距离计算它们之间的相似度;
(b)利用空洞率为2的卷积核对新发布图像和某一特定模板图像进行处理,得到过滤后的新发布图像和特定模板图像。对过滤后的新发布图像和特定模板图像分别进行稀疏编码,利用欧式距离计算它们之间的相似度;
(b)利用空洞率为3的卷积核对新发布图像和某一特定模板图像进行处理,得到过滤后的新发布图像和特定模板图像。对过滤后的新发布图像和特定模板图像分别进行稀疏编码,利用欧式距离计算它们之间的相似度;
步骤(a)(b)(c)中有任意一个得到相似度很高的结果,则认为新发布图像和某一特定模板图像相似度较高。
S5、利用基于超分辨率重建的图像描述方法对目标图像进行处理,以得到目标图像对应的目标描述语句;
进一步地,如图3所示,包括:
S51、对目标图像进行超分辨率重建;
S52、采用图像描述方法对重建后的目标图像进行图像描述处理。上述图像描述方法包括基于CNN+LSTM的图像描述或基于Transformer+LSTM的图像描述。上述图像描述方法均为现有公开的图像描述方法,在此不做赘述。
S6、将目标描述语句与预置的异常词汇数据库中的词汇进行匹配,若匹配成功,则将对应的目标图像认定为疑似异常图像,并将对应的目标图像发送给对应的网络管理员进行核查;反之,则认定对应的目标图像为非异常图像。
在本发明的一些实施例中,利用基于超分辨率重建的图像描述方法(imagecaptioning)对新发布图像进行处理,得到该新发布图像的对应描述语句。先对图像进行超分辨率重建,在重建的基础上再对图像进行图像描述处理。如果描述语句中含有异常词汇(例如病毒、暴力等词汇),即与预置的异常词汇数据库中词汇匹配成功,认定为疑似异常图像,发送给网络管理员核查;否则,不认定该图像为异常图像。
为了解决现有技术中无法全面和精准地检测出危害网络安全的异常图像的技术问题,本发明利用多OCR技术互验的方法对图像中的文字进行识别,显著地提升了文字识别的精准度,进而有效保证了异常图像识别的精度。同时,本发明还利用基于差异性空洞卷积核的相似度计算方法,显著地提升了新发布的目标图像和模板图像之间的相似度的计算精度,进而精准的识别到疑似异常的图像。本发明还利用了基于超分辨率重建的图像描述方法对图像进行处理,显著地提升了图像描述语句的生成质量。本发明还结合区块链技术,将新发布的图像对应的观看者的记录信息进行上链存储,为后续追责认定提供了真实有效的数据,提升了异常图像检测的可靠性。本发明可进行精准的图像比对和文字识别,并结合区块链技术保证了所有数据的真实可靠性,大大提高了异常图像的检测精度。
基于第一方面,在本发明的一些实施例中,该基于区块链的网络安全异常图像大数据检测方法还包括以下步骤:
获取并根据网络管理员的核查结果提取区块链中对应的图像发布者信息。
为了进一步提高后续追责的有效性,当如果新发布的图像被认定为疑似异常图像,且被网络管理员确认为异常图像,则提取区块链中存储的相关信息,可为追究图像发布人的法律责任提供精准真实的数据参考。
如图4所示,第二方面,本发明实施例提供一种基于区块链的网络安全异常图像大数据检测***,包括:图像上链模块100、文字识别模块200、第一词汇匹配模块300、相似度判别模块400、图像描述模块500以及第二词汇匹配模块600,其中:
图像上链模块100,用于获取网络中新发布的目标图像和对应的图像发布者信息,并采集的对应目标图像的观看者的记录信息,将目标图像、图像发布者信息和对应的观看者的记录信息上传至区块链中进行存储;
文字识别模块200,用于利用多OCR技术互验方法对目标图像中的文字进行识别,以得到目标文字识别结果;
第一词汇匹配模块300,用于将目标文字识别结果与预置的异常词汇数据库中的词汇进行匹配,若匹配成功,则将对应的目标图像认定为疑似异常图像,并将对应的目标图像发送给对应的网络管理员进行核查;反之,则相似度判别模块400工作;
相似度判别模块400,用于选定多个异常图像作为模板图像,并利用基于差异性空洞卷积核的相似度计算方法计算目标图像和各个模板图像的相似度;若目标图像和任意一个模板图像的相似度大于预置的相似度阈值,则将对应的目标图像认定为疑似异常图像,并将对应的目标图像发送给对应的网络管理员进行核查;反之,则图像描述模块500工作;
图像描述模块500,用于利用基于超分辨率重建的图像描述方法对目标图像进行处理,以得到目标图像对应的目标描述语句;
第二词汇匹配模块600,用于将目标描述语句与预置的异常词汇数据库中的词汇进行匹配,若匹配成功,则将对应的目标图像认定为疑似异常图像,并将对应的目标图像发送给对应的网络管理员进行核查;反之,则认定对应的目标图像为非异常图像。
为了解决现有技术中无法全面和精准地检测出危害网络安全的异常图像的技术问题,本***通过图像上链模块100、文字识别模块200、第一词汇匹配模块300、相似度判别模块400、图像描述模块500以及第二词汇匹配模块600等多个模块的配合,利用多OCR技术互验的方法对图像中的文字进行识别,显著地提升了文字识别的精准度,进而有效保证了异常图像识别的精度。同时,本发明还利用基于差异性空洞卷积核的相似度计算方法,显著地提升了新发布的目标图像和模板图像之间的相似度的计算精度,进而精准的识别到疑似异常的图像。本发明还利用了基于超分辨率重建的图像描述方法对图像进行处理,显著地提升了图像描述语句的生成质量。本发明还结合区块链技术,将新发布的图像对应的观看者的记录信息进行上链存储,为后续追责认定提供了真实有效的数据,提升了异常图像检测的可靠性。本发明可进行精准的图像比对和文字识别,并结合区块链技术保证了所有数据的真实可靠性,大大提高了异常图像的检测精度。
如图5所示,第三方面,本申请实施例提供一种电子设备,其包括存储器101,用于存储一个或多个程序;处理器102。当一个或多个程序被处理器102执行时,实现如上述第一方面中任一项的方法。
还包括通信接口103,该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器101可用于存储软件程序及模块,处理器102通过执行存储在存储器101内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口103可用于与其他节点设备进行信令或数据的通信。
其中,存储器101可以是但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
处理器102可以是一种集成电路芯片,具有信号处理能力。该处理器102可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请所提供的实施例中,应该理解到,所揭露的方法及***和方法,也可以通过其它的方式实现。以上所描述的方法及***实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的方法及***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器102执行时实现如上述第一方面中任一项的方法。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims (10)

1.一种基于区块链的网络安全异常图像大数据检测方法,其特征在于,包括以下步骤:
S1、获取网络中新发布的目标图像和对应的图像发布者信息,并采集对应目标图像的观看者的记录信息,将目标图像、图像发布者信息和对应的观看者的记录信息上传至区块链中进行存储;
S2、利用多OCR技术互验方法对目标图像中的文字进行识别,以得到目标文字识别结果;
S3、将目标文字识别结果与预置的异常词汇数据库中的词汇进行匹配,若匹配成功,则将对应的目标图像认定为疑似异常图像,并将对应的目标图像发送给对应的网络管理员进行核查;反之,则进入步骤S4;
S4、选定多个异常图像作为模板图像,并利用基于差异性空洞卷积核的相似度计算方法计算目标图像和各个模板图像的相似度;若目标图像和任意一个模板图像的相似度大于预置的相似度阈值,则将对应的目标图像认定为疑似异常图像,并将对应的目标图像发送给对应的网络管理员进行核查;反之,则进入步骤S5;
S5、利用基于超分辨率重建的图像描述方法对目标图像进行处理,以得到目标图像对应的目标描述语句;
S6、将目标描述语句与预置的异常词汇数据库中的词汇进行匹配,若匹配成功,则将对应的目标图像认定为疑似异常图像,并将对应的目标图像发送给对应的网络管理员进行核查;反之,则认定对应的目标图像为非异常图像。
2.根据权利要求1所述的一种基于区块链的网络安全异常图像大数据检测方法,其特征在于,所述利用多OCR技术互验方法对目标图像中的文字进行识别,以得到目标文字识别结果的方法包括以下步骤:
采用多个OCR识别模型分别对目标图像中的文字进行识别,以得到多个文字识别结果;
统计并根据各个文字识别结果确定目标文字识别结果。
3.根据权利要求1所述的一种基于区块链的网络安全异常图像大数据检测方法,其特征在于,所述利用基于差异性空洞卷积核的相似度计算方法计算目标图像和各个模板图像的相似度的方法包括以下步骤:
利用空洞率为N的卷积核分别对目标图像和模板图像进行过滤,对过滤后的目标图像和模板图像分别进行稀疏编码,并利用欧式距离计算目标图像和模板图像之间的相似度,得到第一相似度结果;N为大于等于1的自然数;
利用空洞率为N+1的卷积核分别对目标图像和模板图像进行过滤,对过滤后的目标图像和模板图像分别进行稀疏编码,并利用欧式距离计算目标图像和模板图像之间的相似度,得到第二相似度结果;
利用空洞率为N+2的卷积核分别对目标图像和模板图像进行过滤,对过滤后的目标图像和模板图像分别进行稀疏编码,并利用欧式距离计算目标图像和模板图像之间的相似度,得到第三相似度结果。
4.根据权利要求3所述的一种基于区块链的网络安全异常图像大数据检测方法,其特征在于,还包括以下步骤:
若第一相似度结果、第二相似度结果和第三相似度结果中至少存在一个结果大于预置的相似度阈值,则将对应的目标图像认定为疑似异常图像。
5.根据权利要求1所述的一种基于区块链的网络安全异常图像大数据检测方法,其特征在于,所述利用基于超分辨率重建的图像描述方法对目标图像进行处理的方法包括以下步骤:
对目标图像进行超分辨率重建;
采用图像描述方法对重建后的目标图像进行图像描述处理。
6.根据权利要求5所述的一种基于区块链的网络安全异常图像大数据检测方法,其特征在于,所述图像描述方法包括基于CNN+LSTM的图像描述或基于Transformer+LSTM的图像描述。
7.根据权利要求1所述的一种基于区块链的网络安全异常图像大数据检测方法,其特征在于,还包括以下步骤:
获取并根据网络管理员的核查结果提取区块链中对应的图像发布者信息。
8.一种基于区块链的网络安全异常图像大数据检测***,其特征在于,包括:图像上链模块、文字识别模块、第一词汇匹配模块、相似度判别模块、图像描述模块以及第二词汇匹配模块,其中:
图像上链模块,用于获取网络中新发布的目标图像和对应的图像发布者信息,并采集的对应目标图像的观看者的记录信息,将目标图像、图像发布者信息和对应的观看者的记录信息上传至区块链中进行存储;
文字识别模块,用于利用多OCR技术互验方法对目标图像中的文字进行识别,以得到目标文字识别结果;
第一词汇匹配模块,用于将目标文字识别结果与预置的异常词汇数据库中的词汇进行匹配,若匹配成功,则将对应的目标图像认定为疑似异常图像,并将对应的目标图像发送给对应的网络管理员进行核查;反之,则相似度判别模块工作;
相似度判别模块,用于选定多个异常图像作为模板图像,并利用基于差异性空洞卷积核的相似度计算方法计算目标图像和各个模板图像的相似度;若目标图像和任意一个模板图像的相似度大于预置的相似度阈值,则将对应的目标图像认定为疑似异常图像,并将对应的目标图像发送给对应的网络管理员进行核查;反之,则图像描述模块工作;
图像描述模块,用于利用基于超分辨率重建的图像描述方法对目标图像进行处理,以得到目标图像对应的目标描述语句;
第二词汇匹配模块,用于将目标描述语句与预置的异常词汇数据库中的词汇进行匹配,若匹配成功,则将对应的目标图像认定为疑似异常图像,并将对应的目标图像发送给对应的网络管理员进行核查;反之,则认定对应的目标图像为非异常图像。
9.一种电子设备,其特征在于,包括:
存储器,用于存储一个或多个程序;
处理器;
当所述一个或多个程序被所述处理器执行时,实现如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-7中任一项所述的方法。
CN202210844485.7A 2022-07-19 2022-07-19 基于区块链的网络安全异常图像大数据检测方法及*** Pending CN114913534A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210844485.7A CN114913534A (zh) 2022-07-19 2022-07-19 基于区块链的网络安全异常图像大数据检测方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210844485.7A CN114913534A (zh) 2022-07-19 2022-07-19 基于区块链的网络安全异常图像大数据检测方法及***

Publications (1)

Publication Number Publication Date
CN114913534A true CN114913534A (zh) 2022-08-16

Family

ID=82772517

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210844485.7A Pending CN114913534A (zh) 2022-07-19 2022-07-19 基于区块链的网络安全异常图像大数据检测方法及***

Country Status (1)

Country Link
CN (1) CN114913534A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115171144A (zh) * 2022-09-05 2022-10-11 北京吉道尔科技有限公司 一种基于区块链的智慧教育试卷大数据评阅方法及***
CN115205866A (zh) * 2022-09-16 2022-10-18 北京吉道尔科技有限公司 一种基于区块链的科技论文大数据抄袭检测方法及***
CN115205766A (zh) * 2022-09-16 2022-10-18 北京吉道尔科技有限公司 基于区块链的网络安全异常视频大数据检测方法及***
CN116204594A (zh) * 2023-05-05 2023-06-02 中国民航信息网络股份有限公司 一种基于区块链的数据处理方法、装置及设备
CN116612476A (zh) * 2023-07-20 2023-08-18 合肥图迅电子科技有限公司 一种芯片字符检测方法、装置、计算机设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111405360A (zh) * 2020-03-25 2020-07-10 腾讯科技(深圳)有限公司 视频处理方法、装置、电子设备和存储介质
CN111709414A (zh) * 2020-06-29 2020-09-25 济南浪潮高新科技投资发展有限公司 Ar设备及其文字识别方法、装置和计算机可读存储介质
CN112036273A (zh) * 2020-08-19 2020-12-04 泰康保险集团股份有限公司 一种图像识别方法及装置
CN112989921A (zh) * 2020-12-31 2021-06-18 上海智臻智能网络科技股份有限公司 一种目标图像信息识别方法及其装置
CN113935774A (zh) * 2021-10-15 2022-01-14 北京百度网讯科技有限公司 图像处理方法、装置、电子设备及计算机存储介质
CN114626024A (zh) * 2022-05-12 2022-06-14 北京吉道尔科技有限公司 一种基于区块链的互联网侵权视频低耗检测方法及***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111405360A (zh) * 2020-03-25 2020-07-10 腾讯科技(深圳)有限公司 视频处理方法、装置、电子设备和存储介质
CN111709414A (zh) * 2020-06-29 2020-09-25 济南浪潮高新科技投资发展有限公司 Ar设备及其文字识别方法、装置和计算机可读存储介质
CN112036273A (zh) * 2020-08-19 2020-12-04 泰康保险集团股份有限公司 一种图像识别方法及装置
CN112989921A (zh) * 2020-12-31 2021-06-18 上海智臻智能网络科技股份有限公司 一种目标图像信息识别方法及其装置
CN113935774A (zh) * 2021-10-15 2022-01-14 北京百度网讯科技有限公司 图像处理方法、装置、电子设备及计算机存储介质
CN114626024A (zh) * 2022-05-12 2022-06-14 北京吉道尔科技有限公司 一种基于区块链的互联网侵权视频低耗检测方法及***

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115171144A (zh) * 2022-09-05 2022-10-11 北京吉道尔科技有限公司 一种基于区块链的智慧教育试卷大数据评阅方法及***
CN115205866A (zh) * 2022-09-16 2022-10-18 北京吉道尔科技有限公司 一种基于区块链的科技论文大数据抄袭检测方法及***
CN115205766A (zh) * 2022-09-16 2022-10-18 北京吉道尔科技有限公司 基于区块链的网络安全异常视频大数据检测方法及***
CN116204594A (zh) * 2023-05-05 2023-06-02 中国民航信息网络股份有限公司 一种基于区块链的数据处理方法、装置及设备
CN116612476A (zh) * 2023-07-20 2023-08-18 合肥图迅电子科技有限公司 一种芯片字符检测方法、装置、计算机设备及存储介质
CN116612476B (zh) * 2023-07-20 2023-09-22 合肥图迅电子科技有限公司 一种芯片字符检测方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN114913534A (zh) 基于区块链的网络安全异常图像大数据检测方法及***
CA2738480C (en) Detection of confidential information
CN115205766A (zh) 基于区块链的网络安全异常视频大数据检测方法及***
CN112257613B (zh) 体检报告信息结构化提取方法、装置及计算机设备
CN111639648B (zh) 证件识别方法、装置、计算设备和存储介质
CN113381962B (zh) 一种数据处理方法、装置和存储介质
CN110968689A (zh) 罪名及法条预测模型的训练方法以及罪名及法条预测方法
CN114626024A (zh) 一种基于区块链的互联网侵权视频低耗检测方法及***
CN113836128A (zh) 一种异常数据识别方法、***、设备及存储介质
CN115205866A (zh) 一种基于区块链的科技论文大数据抄袭检测方法及***
CN114579523A (zh) 双录文件质检方法、装置、计算机设备和存储介质
CN111107074B (zh) 一种防止网络爬虫窃取隐私数据的方法、训练方法及装置
EP3355240B1 (en) A method and a system for generating a multi-level classifier for image processing
CN115862638A (zh) 基于区块链的金融交易操作及大数据安全存储方法和***
CN112597997A (zh) 感兴趣区域确定方法、图像内容识别方法及装置
CN114996707B (zh) 图片木马的静态检测方法、装置、电子设备及存储介质
CN115223022B (zh) 一种图像处理方法、装置、存储介质及设备
CN116127106A (zh) 基于区块链的互联网图像大数据智能存储方法与***
CN115982388A (zh) 案件质控图谱建立、案件文书质检方法、设备及存储介质
CN111277465A (zh) 一种异常数据报文检测方法、装置及电子设备
US20200226162A1 (en) Automated Reporting System
CN115759964A (zh) 一种投标文件通用资格验证的方法、***及设备
CN111612157B (zh) 训练方法、文字识别方法、装置、存储介质及电子设备
CN111899833A (zh) 一种医疗数据处理方法、装置、服务器及存储介质
CN115114588B (zh) 基于区块链的智慧教育学术成果讨论防剽窃方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination