CN106776842B - 多媒体数据检测方法及装置 - Google Patents

多媒体数据检测方法及装置 Download PDF

Info

Publication number
CN106776842B
CN106776842B CN201611064769.5A CN201611064769A CN106776842B CN 106776842 B CN106776842 B CN 106776842B CN 201611064769 A CN201611064769 A CN 201611064769A CN 106776842 B CN106776842 B CN 106776842B
Authority
CN
China
Prior art keywords
convolution kernel
feature matrix
classification model
matrix
multimedia data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611064769.5A
Other languages
English (en)
Other versions
CN106776842A (zh
Inventor
胡易
余宗桥
郭晓威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shanghai Co Ltd
Original Assignee
Tencent Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shanghai Co Ltd filed Critical Tencent Technology Shanghai Co Ltd
Priority to CN201611064769.5A priority Critical patent/CN106776842B/zh
Publication of CN106776842A publication Critical patent/CN106776842A/zh
Application granted granted Critical
Publication of CN106776842B publication Critical patent/CN106776842B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/44Browsing; Visualisation therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种多媒体数据检测方法及装置,属于互联网技术领域。方法包括:获取待检测的多媒体数据;基于第一分类模型对多媒体数据执行敏感数据检测处理,得到多媒体数据为敏感数据的第一敏感概率;若第一敏感概率大于第一预设阈值,则基于模型深度大于第一分类模型且与第一分类模型级联的第二分类模型,对多媒体数据执行敏感数据检测处理,得到多媒体数据为敏感数据的第二敏感概率;若第二敏感概率大于第二预设阈值,则确定多媒体数据为敏感数据。采取两个模型深度不同的分类模型进行多媒体数据检测,可兼顾时间性能与检测效果,这样通过两个级联的分类模型既可满足线上实时检测需求,还可保证检测精准度。

Description

多媒体数据检测方法及装置
技术领域
本发明涉及互联网技术领域,特别涉及一种多媒体数据检测方法及装置。
背景技术
随着互联网技术的快速发展,诸如图片、文字、声音、视频等多媒体数据通过互联网传播到了世界的各个角落。一方面,上述多媒体数据的传播为人们的学习、工作和生活提供了巨大的帮助。另一方面,出于牟取暴利或扩大影响力等目的,上述多媒体数据中也不乏包括淫秽色情、政治敏感、暴力恐怖等内容的敏感数据。由于这些敏感数据的传播会严重影响人们的身心健康,因此为了净化网络,如何进行多媒体数据检测成为了本领域一个亟待解决的问题。
以多媒体数据为图片为例,相关技术在进行图片检测之前,首先还需进行模型训练。其中,模型训练过程为:将人工收集并标注的一定数量正常图片(即非敏感图片)和敏感图片作为训练样本集,之后根据该训练样本集对选取的一个分类模型进行训练,得到训练后的分类模型。这样在进行图片检测时,便可直接基于这个训练后的分类模型对待检测的图片执行敏感图片检测处理,得到该图片为敏感图片的敏感概率;若上述敏感概率超过预设阈值,则确定待检测的图片为敏感图片。
在实现本发明的过程中,发明人发现相关技术至少存在以下问题:
继续以多媒体数据为图片为例,由于采取单一分类模型进行图片检测,且时间性能与检测效果是一对相互矛盾的因素,即当检测效果较好时由于对多媒体数据的检测足够精细那么检测所消耗的时间便会较长,而当检测所消耗的时间较短时由于对多媒体数据的检测不够精细那么检测效果便会较差,因此无法兼顾时间性能与检测效果。比如,若上述分类模型的时间性能较好,如检测一张图片大概仅需100ms左右,则检测效果便会较差,因此在采用上述分类模型进行图片检测后,通常还需要人工再次进行检测或查漏等,会消耗大量的人力物力;若上述分类模型的检测效果较好,则时间性能便会很差,如检测一张图片大概需要的时间会在秒级左右,因此无法满足线上实时进行图片检测的需求,只能离线处理大量图片,智能性欠佳。
发明内容
为了解决相关技术的问题,本发明实施例提供了一种多媒体数据检测方法及装置。所述技术方案如下:
一方面,提供了一种多媒体数据检测方法,所述方法包括:
获取待检测的多媒体数据;
基于第一分类模型对所述多媒体数据执行敏感数据检测处理,得到所述多媒体数据为敏感数据的第一敏感概率;
若所述第一敏感概率大于第一预设阈值,则基于模型深度大于所述第一分类模型且与所述第一分类模型级联的第二分类模型,对所述多媒体数据执行敏感数据检测处理,得到所述多媒体数据为所述敏感数据的第二敏感概率;
若所述第二敏感概率大于第二预设阈值,则确定所述多媒体数据为所述敏感数据。
另一方面,提供了一种多媒体数据检测方法装置,所述装置包括:
第一获取模块,用于获取待检测的多媒体数据;
第一处理模块,用于基于第一分类模型对所述多媒体数据执行敏感数据检测处理,得到所述多媒体数据为敏感数据的第一敏感概率;
第二处理模块,用于若所述第一敏感概率大于第一预设阈值,则基于模型深度大于所述第一分类模型且与所述第一分类模型级联的第二分类模型,对所述多媒体数据执行敏感数据检测处理,得到所述多媒体数据为所述敏感数据的第二敏感概率;
确定模块,用于若所述第二敏感概率大于第二预设阈值,则确定所述多媒体数据为所述敏感数据。
本发明实施例提供的技术方案带来的有益效果是:
采取两个模型深度不同的分类模型进行多媒体数据检测,通过模型深度较浅的第一分类模型,在海量待检测的多媒体数据中查找疑似敏感数据并过滤掉正常数据,之后利用模型深度较深的第二分类模型对疑似敏感数据再次进行检测,以在疑似敏感数据中检测出真正的敏感数据,由于第一分类模型的时间性能较好、第二分类模型的检测效果较好,因此该种多媒体数据检测方式可以兼顾时间性能与检测效果,这样通过两个级联的分类模型既可满足线上实时进行多媒体数据检测的需求,还可保证敏感数据的检测精准度,相比于离线处理使得敏感数据在网上存留的时间大大减少,智能性较佳,网络净化效果较好。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种多媒体数据检测所涉及的***架构图;
图2是本发明实施例提供的一种多媒体数据检测方法的流程图;
图3是本发明实施例提供的一种第一分类模型的结构示意图;
图4是本发明实施例提供的一种特征区域提取的示意图;
图5是本发明实施例提供的一种多媒体数据检测的业务架构示意图;
图6是本发明实施例提供的一种多媒体数据检测装置的结构示意图;
图7是本发明实施例提供的一种服务器的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
在对本发明实施例进行详细地解释说明之前,先对本发明实施例可能涉及到的一些名词进行解释说明。
敏感数据:指代包含淫秽色情、政治敏感、暴利恐怖等内容的多媒体数据。比如,色情图像、暴利恐怖图像、色***、暴利恐怖视频等。
分类模型:采用深度学习技术或者机器学习技术,通过对训练样本数据进行学习训练后得到的数学模型,学习训练过程中会获得该数学模型的参数;在对待检测的多媒体数据进行检测时,加载训练好的分类模型的参数,从而对待检测的多媒体数据进行是否为敏感数据的检测。
在本发明实施例中,分类模型指代CNN(Convolutional Neural Network,卷积神经网络)模型。众所周知,对于一个CNN模型来说,时间性能和检测效果是一对相互矛盾的因素,因此无法兼顾时间性能与检测效果。其中,时间性能用于表征一个CNN模型的运行速度,即进行多媒体数据检测的速度,比如检测一张图片是否为***的速度。检测效果用于表征一个CNN模型在进行多媒体数据检测时检测正确的概率。一般来说,模型深度越深的分类模型其检测效果越好,但是时间性能便会较差,即运行速度较慢,难以做到实时对多媒体数据进行检测。其中,CNN模型的模型深度可用隐含层的层数来衡量,隐含层的层数越多,则模型深度越深;隐含层的层数越少,则模型深度越浅;换句话说,卷积核结构的数量越多,卷积核的数量越多,卷积核的尺寸越大,卷积运算量越大,对多媒体数据的检测越精细,则模型深度越深;卷积核结构的数量越少,卷积核的数量越少,卷积核的尺寸越小,卷积运算量越小,对多媒体数据的检测越不精细,则模型深度越浅。而模型深度越浅的分类模型其时间性能越好,即运行速度较快,但是检测效果便会较差。因此仅采用单个分类模型无法兼顾检测效果和时间性能。为了解决这个问题,本发明实施例提出了下述图1所示的用于进行多媒体数据检测的***架构。
参见图1,其示出了本发明实施例提供的多媒体数据检测方法所涉及的***架构图。在该***架构下一共包括两级分类模型,分别为第一分类模型和第二分类模型。其中,第一分类模型和第二分类模型均为CNN模型,且组成级联结构。第一分类模型的模型深度要小于第二分类模型,即第一分类模型的时间性能较好,但是检测效果稍差,通过第一分类模型来过滤掉非敏感数据(正常数据),筛选出疑似敏感数据;第二分类模型的检测效果较好,但是时间性能稍差,通过第二分类模型对第一分类模型输出的疑似敏感数据再次进行检测处理,在疑似敏感数据中进一步筛选出敏感数据。
简而言之,以多媒体数据为图片、分类模型用于检测***为例,则在大量待检测图片输入第一分类模型后,第一分类模型首先初步计算每一张待检测图片属于***的第一敏感概率;之后将第一敏感概率大于第一预设阈值的待检测图片作为疑似***输入到第二分类模型中,将第一敏感概率小于第一预设阈值的待检测图片作为非***过滤掉。这样通过第一分类模型可以过滤掉大量的非***,使得进入第二分类模型中的图片数量相对于输入至第一分类模型的图片数量大大减少,进而从整体上提升了***的时间性能。
对于进入第二分类模型的疑似***,第二分类模型对其进行再次检测处理,得到每一张疑似***属于***的第二敏感概率,并将第二敏感概率大于第二预设阈值的图片确定为***。其中,第一预设阈值和第二预设阈值的大小既可一致,也可不一致,本发明实施例对此不进行具体限定。需要说明的是,第一预设阈值和第二预设阈值的取值通常以满足业务所需的检测精确度为准。此外,对于第一分类模型来说,还可以通过调节第一预设阈值的大小来快速过滤掉大量的非***,以通过阈值调节减少输入至第二分类模型的图片数量,进而提升第二分类模型的时间性能。
本发明实施例所示的多媒体数据检测方案主要应用在后台识别,即业务逻辑将待检测的多媒体数据传递给上述***架构,上述***架构在对待检测的多媒体数据进行检测后会根据检测结果做出响应,比如对于检测出的***展示“因为违规被封禁”等提示消息。此外,本方案既可适用于面向个人的网络安全审核或未成年人上网保护,也可适用于面向企业/产品的业务多媒体数据审核或违规内容控制,以净化网络环境,还可适用于监管部门的网络安全抽查评估/特定恶意内容朔源等等场景,本发明实施例对此不进行具体限定。
图2是本发明实施例提供的一种多媒体数据检测方法的流程图。参见图2,本发明实施例提供的方法流程包括:
201、获取待检测的多媒体数据,基于第一分类模型对该多媒体数据执行敏感数据检测处理,得到该多媒体数据为敏感数据的第一敏感概率。
其中,多媒体数据既可以为图片形式也可以为视频形式,本发明实施例对此不进行具体限定。本发明实施例仅以多媒体数据为图片进行举例说明。参见图3,第一分类模型包括第一数目个卷积核结构,第一数目的数值大于1。其中,每一个卷积核结构顺次相连,即第一数目个卷积核结构组成级联结构。此外,每一个卷积核结构中均包括第一卷积核和第二卷积核,第一卷积核和第二卷积核形成并联结构,且第一卷积核与第二卷积核的尺寸不同。由于小卷积核可以大大加快卷积的运算速度,因此在本发明实施例中第一卷积核和第二卷积核均为小卷积核,其中第一卷积核的尺寸要小于第二卷积核,比如第一卷积核的尺寸为1*1,第二卷积核的尺寸为3*3。
需要说明的是,对于第一分类模型中的一个卷积核结构来说,其包含的第一卷积核的权值与其他卷积核包含的第一卷积核的权值是不同的,其包含的第二卷积核的权值与其他卷积核包含的第二卷积核的权值也是不同的。换句话说,第一分类模型中的每一个卷积核结构使用卷积核类型不同的1*1大小卷积核、卷积核类型不同的3*3大小卷积核。而之所以这样设置是因为每一个卷积核结构用来提取多媒体数据的不同区域的特征。
以多媒体数据为图片,第一分类模型包括6个卷积核结构,每一个卷积核结构包括一个1*1卷积核和一个3*3卷积核为例,则如图4所示,首个卷积核中的1*1卷积核和3*3卷积核可用来提取该图片的最边缘区域1的特征,与首个卷积核结构相连的下一个卷积核结构则用来提取除了最边缘区域1之外的下一个边缘区域2的特征;依次类推,每一个卷积核结构用来提取该图片中一部分区域的特征,由该图片的边缘依次提取到该图片的中心,完成对该图片的整体特征提取。由于每一个卷积核结构的用处不同,因此每一个卷积核结构中的1*1卷积核和3*3卷积核的权值与其他卷积核结构都是不同的。
在本发明实施例中,在基于第一分类模型对多媒体数据执行敏感数据检测处理时,可采取下述方式实现:
(a)、对于第一分类模型的当前卷积核结构,获取与其相连的上一个卷积核结构输出的第一中间特征矩阵。
若当前卷积核为第一分类模型的首个卷积核结构,则上述第一中间特征矩阵指代多媒体数据的原始特征矩阵。除了首个卷积核结构之外,对于其他卷积核结构来说,第一中间特征矩阵指代与其相连的上一个卷积核输出的对原始特征矩阵的中间处理结果。其中,多媒体数据既可为灰度图片也可为彩色图片,上述原始特征矩阵指代多媒体数据的像素矩阵,可采用matlab等方式提取上述原始特征矩阵,本发明实施例对此不进行具体限定。
(b)、基于当前卷积核结构的第一卷积核,对第一中间特征矩阵进行卷积处理,得到第一特征矩阵;基于当前卷积核结构的第二卷积核,对第一中间特征矩阵进行卷积处理,得到第二特征矩阵。
以第一卷积核为1*1大小,第二卷积核为3*3大小、当前卷积核为第一分类模型中的首个卷积核为例,则在首个卷积核结构接收到上述原始特征矩阵后,会分别采用1*1大小的第一卷积核和3*3大小的第二卷积核与上述原始特征矩阵进行卷积运算。其中,卷积运算即为卷积滑动窗运算,对于原始特征矩阵中的每一个像素点,计算它的邻域像素点和卷积核中对应位置权值的乘积,然后将得到的乘积加起来,将得到的和值作为该像素位置的值。在采取上述卷积运算方式对原始特征矩阵执行卷积处理后,便会得到两个特征矩阵,分别为第一特征矩阵和第二特征矩阵。
需要说明的是,在对原始特征矩阵执行卷积处理后,为了减少数据处理量同时保留有用信息,还可对卷积后得到的矩阵进行下采样处理,比如每邻域一定数目的像素求和变为一个像素,然后通过标量加权,再增加偏置,最终通过一个sigmoid激活函数,得到经过第一卷积核处理后的特征矩阵和经过第二卷积核处理后的特征矩阵。
(c)、将第一特征矩阵和第二特征矩阵进行组合处理,将得到的第二中间特征矩阵输入与当前卷积核结构相连的下一个卷积核结构。
小卷积核可以对图片的局部细节进行更好的描述,不同尺寸的卷积核的局部信息获取能力都不同,在用不同尺寸的小卷积核对图片局部信息进行提取之后,再将这些提取的信息组合到一起,然后通过下一个卷积核结构对这些信息进行再处理,这样通过一层一层的卷积处理,完成对多媒体数据的检测。
其中,在将第一特征矩阵和第二特征矩阵进行组合处理时,可采取下述方式实现:将第一特征矩阵和第二特征矩阵的对应元素进行相加处理,得到新特征矩阵,之后对新特征矩阵的每一个元素均增加一个偏移量,然后将进行偏移处理之后的特征矩阵通过sigmoid激活函数,得到第一中间特征矩阵。
第三步、依次类推,重复执行对输入的中间特征矩阵进行卷积处理的步骤,直至最后一个卷积核结构输出第一目标特征矩阵;根据第一目标特征矩阵,计算第一敏感概率。
在第一分类模型中,除了首个卷积核结构是对多媒体数据的原始特征矩阵进行卷积处理外,其他的卷积核结构均是对与其相连的上一个卷积核结构输出的中间特征矩阵进行卷积处理,之后再将得到的中间特征矩阵输出给与其相连的下一个卷积核结构,当然最后一个卷积核结构除外。也即,上述重复执行对输入的中间特征矩阵进行卷积处理并将得到的中间特征矩阵输入下一个卷积核结构的步骤,直至最后一个卷积核结构输出第一目标特征矩阵。
当最后一个卷积核对倒数第二个卷积核结构输出的中间特征矩阵进行卷积处理,得到第一目标特征矩阵后,再根据第一目标特征矩阵,计算第一敏感概率,详细实现方式如下:
基于第一目标特征矩阵,计算多媒体数据的第一特征向量;获取第一分类模型的第一分类矩阵,将第一特征向量与第一分类矩阵进行乘积运算,得到第一敏感概率。
其中,可利用诸如BoW(词袋)技术汇总第一目标特征矩阵,生成第一特征向量,该第一特征向量可以用来描述整个多媒体数据的特征。其中,第一分类矩阵是预先根据训练样本数据训练好的,第一分类矩阵的行数与第一特征向量的列数相等,第一分类矩阵的列数与第一分类模型的分类类别的数目相等。其中,分类类别指代将图片分类出来的类别,比如分为敏感数据和正常数据两个类别。实质上敏感数据是包括色情数据、暴利恐怖数据、政治敏感数据等多个子类别的。在将第一特征向量与第一分类矩阵进行乘积运算后,便可得到多媒体数据属于敏感数据的第一敏感概率。
在另一个实施例中,以多媒体数据为图片为例,在采用第一分类模型对待检测的多媒体数据进行是否为敏感数据的检测之前,还需对第一分类模型进行模型训练。其中,模型训练过程可简述为下述几个步骤:
首先,获取多个自然图片,将多个自然图片作为训练样本图片。其中,训练样本图片中的自然图片可收集于网络,训练样本图片中每一张图片均被手动标记为正常图片或敏感图片。其中,除了训练样本图片外,还需要一部分测试样本图片,用于对训练得到的分类模型进行测试。
接下来,根据训练样本图片训练第一分类模型。
具体地,首先初始化第一分类模型中的各个参数。在本发明实施例中,初始化各个参数也即初始化每一个卷积核结构中第一卷积核和第二卷积核的权值。其中,卷积神经网络在本质上是一种输入到输出的映射,它能够学习大量的输入与输出之间的映射关系,而不需要任何输入和输出之间的精确的数学表达式,仅用已知的模式对卷积神经网络加以训练,卷积神经网络便具有输入输出对之间的映射能力。在开始训练第一分类模型之前,所有的参数都应该用一些不同的小随机数进行初始化。“小随机数”用来保证卷积神经网络不会因参数值过大而进入饱和状态,从而导致训练失败;“不同”用来保证卷积神经网络可以正常地学习。在第一分类模型训练过程中,可使用随机梯度下降和后向传播方法等来优化第一分类模型中的各个参数,从而尽可能地最小化分类误差。其中,第一分类模型中的各个参数中包括上述每一个卷积核结构中各个卷积核的权值的取值和第一分类矩阵中各个元素的取值。
之后,基于参数初始化后的第一分类模型对训练样本图片进行特征提取,并根据提取到的特征给出对训练样本图片的检测结果。此时,由于第一分类模型还处于训练阶段,所以各个参数还未达到最优,因此可能存在较大的检测误差。所以,根据得到的检测结果和该训练样本图片归属的实际类别,可对第一分类模型进行参数优化,使得第一分类模型逐步优化,达到最优状态。也即,在得到对训练样本图片进行训练的检测结果和该训练样本图片的实际类别后,便可根据该检测结果和实际类别之间的差距对第一分类模型中的各个参数进行优化。也即,第一分类模型的训练过程是一个参数逐步优化的过程,在训练的第一分类模型的分类误差小于预先设置的阈值后,即训练的第一分类模型达到预设的精度要求后,训练结束。
202、若第一敏感概率大于第一预设阈值,则基于模型深度大于第一分类模型且与第一分类模型级联的第二分类模型,对该多媒体数据执行敏感数据检测处理,得到该多媒体数据为敏感数据的第二敏感概率。
对于多媒体数据来说,若第一分类模型判定出其第一敏感概率大于第一预设阈值,则证明多媒体数据为疑似敏感数据,还需将其输入至第二分类模型,进行再一步地检测。其中,第二分类模型可为现有的任何运行速度较慢但是检测效果较好的模型,下面本发明实施例仅给出第二分类模型的一种可能结构,并以该可能结构为例,对第二分类模型执行的检测过程进行说明。
其中,第二分类模型包括第二数目个卷积核结构,由于要求第二分类模型的检测效果优于第一分类模型,因此第二数目大于第一数目;对于第二分类模型来说,每一个卷积核结构也是顺次相连,组成级联结构,每一个卷积核结构中包括至少一个第六卷积核,第六卷积核的尺寸大于第一卷积核和第二卷积核。由于第二分类模型无论从卷积核的数量方面还是卷积核的尺寸方面,均要大于第一分类模型,所以第二分类模型的卷积运算量要大于第二分类模型,对多媒体数据的检测更为精细,这便致使第二分类模型的模型深度要大于第一分类模型,因此第二分类模型的时间性能相对第一分类模型较差,但是检测效果较好。
需要说明的是,对于第二分类模型中不同的卷积核结构来说,本发明实施例仅以第六卷积核对其包含的卷积核进行标识,具体地,对于一个卷积核结构来说,其包含的第六卷积核的尺寸既可以与其他卷积核包含的第六卷积核的尺寸一致,也可不一致,本发明实施例对此不进行具体限定。而对于一个卷积核结构来说,其包括的卷积核的尺寸大小通常是一致的,只不过卷积核之间的权值通常不同,即卷积核的种类不同,本发明实施例对此同样不进行具体限定。
其中,在基于第二分类模型对多媒体数据执行敏感数据检测处理时,可采取下述方式实现:
对于第二分类模型的当前卷积核结构,获取与其相连的上一个卷积核结构输出的第七特征矩阵;基于当前卷积核结构的至少一个第六卷积核,对第七特征矩阵中至少一个特征矩阵进行卷积处理,得到第八特征矩阵;将第八特征矩阵输入与当前卷积核结构相连的下一个卷积核结构,依次类推,重复执行对输入的至少一个特征矩阵进行卷积处理的步骤,直至最后一个卷积核结构输出第二目标特征矩阵;根据第二目标特征矩阵,计算第二敏感概率。
需要说明的是,第二分类模型中的首个卷积核结构也是同样对待检测的媒体数据数据的原始特征矩阵进行卷积处理。其中,一个卷积核中有几个第六卷积核,得到的第七特征矩阵中便包括几个特征矩阵。此外,在与首个卷积核结构相连的下一个卷积核结构对输入的第七特征矩阵进行卷积处理时,进行卷积处理的特征矩阵的数量可以是得到的全部特征矩阵,也可以是得到的部分特征矩阵,即在第七特征矩阵中选取至少一个特征矩阵,并对这至少一个特征矩阵进行卷积处理,得到第八特征矩阵。其中,生成的第八特征矩阵中包括的特征矩阵的数量与当前卷积核结构所包含的第六卷积核的数量一致。之后,将得到的第八特征矩阵输入与当前卷积核结构相连的下一个卷积核结构,继续执行上述类似的卷积处理过程,直至最后一个卷积核结构输出第二目标特征矩阵。
当最后一个卷积核对倒数第二个卷积核结构输出的至少一个特征矩阵进行卷积处理,得到第二目标特征矩阵后,再根据第二目标特征矩阵,计算第二敏感概率,详细实现方式如下:基于第二目标特征矩阵,计算多媒体数据的第二特征向量;获取第二分类模型的第二分类矩阵,将第二特征向量与第二分类矩阵进行乘积运算,得到第二敏感概率。
其中,可利用诸如BoW技术汇总第二目标特征矩阵,生成第二特征向量,该第二特征向量可以用来描述整个多媒体数据的特征。其中,第二分类矩阵也是预先根据训练样本数据训练好的,第二分类矩阵的行数与第二特征向量的列数相等,第二分类矩阵的列数与第二分类模型的分类类别的数目相等。在将第二特征向量与第二分类矩阵进行乘积运算后,便可得到多媒体数据属于敏感数据的第二敏感概率。在另一个实施例中,在采用第二分类模型对待检测的多媒体数据进行是否为敏感数据的检测之前,还可按照与上述对第一分类模型类似的方式对第二分类模型进行模型训练,此处不再赘述。
在另一个实施例中,第一分类模型和第二分类模型除了上述步骤201和步骤202所示的结构外,可扩展的是,还可为下述结构。
由于第一分类模型的目的是保证多媒体数据检测的时间性能,那么在保证第一分类模型有较快检测速度的前提下,第一分类模型还可采取与上述第二分类模型类似的结构。针对这种结构,为了确保第一分类模型的时间性能,第一分类模型中卷积核结构的数量,每一个卷积核结构中卷积核的数量,卷积核的尺寸都要远远小于上述步骤202所示的第二分类模型,以减少第一分类模型的卷积运算量,从而确保级联的两个分类模型中,第一分类模型的模型深度小于第二分类模型。例如,第一分类模型包括第一数目个卷积核结构,其中第一数目小于上述步骤202中提及的第二数目。每一个卷积核结构顺次相连,每一个卷积核结构中包括至少一个第三卷积核。如果在这种结构的第一分类模型基础上级联上述步骤202所示的第二分类模型,那么还需保证第三卷积核的尺寸小于第六卷积核,且第一分类模型中总体的卷积核数量也小于第二分类模型中总体的卷积核数量,从而减少卷积运算量,以确保第一分类模型的时间性能。
在这种结构下,基于第一分类模型对多媒体数据执行敏感数据检测处理,得到多媒体数据为敏感数据的第一敏感概率,包括:对于第一分类模型的当前卷积核结构,获取与其相连的上一个卷积核结构输出的第三特征矩阵;基于当前卷积核结构的至少一个第三卷积核,对第三特征矩阵中至少一个特征矩阵进行卷积处理,得到第四特征矩阵;将第四特征矩阵输入与当前卷积核结构相连的下一个卷积核结构,依次类推,重复执行对输入的特征矩阵进行卷积处理的步骤,直至最后一个卷积核结构输出第一目标特征矩阵;根据第一目标特征矩阵,计算第一敏感概率;其中,若当前卷积核结构为第一分类模型的首个卷积核结构,则第三特征矩阵为多媒体数据的原始特征矩阵。
由于第二分类模型的目的是保证多媒体数据的检测效果,那么在保证第二分类模型有较佳检测效果的前提下,第二分类模型还可采取与上述第一分类模型类似的结构。针对这种结构,为了确保第二分类模型的检测效果,第二分类模型中卷积核结构的数量,卷积核的尺寸都要远远大于上述步骤201所示的第一分类模型的结构,以增加第二分类模型的卷积运算量,从而确保级联的两个分类模型中,第二分类模型的模型深度大于第二分类模型。例如,第二分类模型包括第二数目个卷积核结构,每一个卷积核结构顺次相连,每一个卷积核结构中均包括第四卷积核和第五卷积核,第四卷积核与第五卷积核的尺寸不同,且第四卷积核和第五卷积核的尺寸均大于第一卷积核、第二卷积核和第三卷积核的尺寸。如果在这种结构的第二分类模型基础上级联上述步骤201所示的第一分类模型,那么第二分类模型中总体的卷积核数量远远大于第一分类模型中总体的卷积核数量,从而增加卷积运算量,以确保第二分类模型的检测效果。
在这种结构下,基于模型深度大于第一分类模型且与第一分类模型级联的第二分类模型,对多媒体数据执行敏感数据检测处理,包括:对于当前卷积核结构,获取与其相连的上一个卷积核结构输出的第三中间特征矩阵;基于当前卷积核结构的第四卷积核,对第三中间特征矩阵进行卷积处理,得到第五特征矩阵;基于当前卷积核结构的第五卷积核,对第三中间特征矩阵进行卷积处理,得到第六特征矩阵;将第五特征矩阵和第六特征矩阵进行组合处理,将得到的第四中间特征矩阵输入与当前卷积核结构相连的下一个卷积核结构,依次类推,重复执行对输入的中间特征矩阵进行卷积处理的步骤,直至最后一个卷积核结构输出第二目标特征矩阵;根据第二目标特征矩阵,计算第二敏感概率;其中,若当前卷积核结构为第二分类模型的首个卷积核结构,则第三中间特征矩阵为多媒体数据的原始特征矩阵。
需要说明的是,针对上述第一分类模型和第二分类模型的两种不同结构,在构造本发明实施例所示的***结构时,可选取任一种结构的第一分类模型和第二分类模型进行组合,从而形成四种不同的级联结构。无论对哪一种级联结构来说,第一分类模型的模型深度均要小于第二分类模型,即第一分类模型无论在卷积核结构的数量上、整体卷积核的数量上、还是卷积核的尺寸上均要小于第二分类模型。
203、若第二敏感概率大于第二预设阈值,则确定该多媒体数据为敏感数据。
在本发明实施例中,可按照上述步骤201至步骤203所示的方式对海量的待检测图片中每一个图片进行检测处理,以将敏感图片分类出来。在经过第二分类模型进行检测处理后,若一个图片的敏感概率大于第二预设阈值,则该图片便被确定为敏感图片,直接进行删除或封禁等打击处理。在另一个实施例中,经过第二分类模型进行检测处理的众多图片中,还存在敏感概率处于中间段的一部分图片,以敏感图片为***为例,则在经过第二分类模型处理后,对于色情概率不高的图片还需转入图4所示的人工审核阶段。其中,色情概率不高的图片指代在没有被第二分类模型判定为***的正常图片中色情概率大于第三预设阈值的图片,即色情概率大于第三预设阈值且小于第二预设阈值。其中,第一预设阈值、第二预设阈值和第三预设阈值均为经验值。
对于这部分色情概率不高的图片,由人工对其进行是否为***的标注,并将这些标注后的图片作为新的训练样本数据,基于这些新的训练样本数据和对这些训练样本数据的标注结果,再次优化第一分类模型和第二分类模型。换句话说,在进行图片检测过程中,若当前检测的第一媒体数据的第二敏感概率大于第三预设阈值且小于第二预设阈值,则获取人工对多媒体数据的标注结果,并将多媒体数据确定为训练样本数据;当累积的训练样本数据的数量超出指定门限时,比如达到了几百张或几千张,则根据这些新的训练样本数据和对这些新的训练样本数据的标注结果,优化第一分类模型和第二分类模型。
综上所述,采用本发明实施例所示的多媒体数据检测方式,仅需要人工审核人员对小部分色情概率不高的图片进行审核即可,而对于色情概率较高的图片可以做到直接打击。这样可以解放大量的人力,而对于审核出来的这部分图片也可以作为训练样本数据继续对分类模型进行迭代优化,从而不断提升分类模型的检测效果。
同时,根据不同业务场景对于召回率和准确率要求的不同,可以选择不同的分类模型使用策略。例如,当对召回率要求较高而不用关心准确率时,可以仅采用第一分类模型,快速召回***;当对准确度要求较高时,可以仅用第二分类模型,以适应于不同的业务场景。其中,召回率也称之为查全率,在本发明实施例中指代检测出的敏感数据的数量占敏感数据总量的概率。分类模型使用策略的多样性,可以保证上述多媒体数据检测方法可以用于不同的业务场景中。对于上述分类模型来说,若上述分类模型对敏感数据的检测精确度很高,那么通过上述分类模型输出的检测结果便可自动确定各个待检测的多媒体数据所归属的类别,且误差很小,这样便可实现对多媒体数据的自动标注,可节省大量的人力。此外,若一张图片采用上述***架构确定归属于正常图片或***的概率非常高,则直接使用上述***架构的检测结果对该图片的归属类别进行标注。比如上述***架构对该图片的检测结果为正常概率0.001、色情概率为0.999,那么这张图片就可以被标注为一张***,不需要再通过人工来对其进行标注。这样便可以达到解放人力的目的,取代原来的人工标注。
继续以多媒体数据为图片为例,由于第一分类模型的时间性能较好,这使得线上实时打击***成为可能,即可及时有效地对网络上传播的***进行打击,相比于离线处理具有更佳的效果,使得***在网上留存的时间大大减少。也即,对于网络中传播的图片,上述第一分类模型可快速地在这些图片中检测出第一敏感概率大于第一预设阈值的疑似***,并过滤掉大量的非***,这样进入第二分类模型中的图片数量相对于输入至第一分类模型的图片数量大大减少,进而从整体上提升了***的时间性能,而后再通过第二分类模型进行进一步地判定。
本发明实施例提供的方法,采取两个模型深度不同的分类模型进行多媒体数据检测,通过模型深度较浅的第一分类模型,在海量待检测的多媒体数据中查找疑似敏感数据并过滤掉正常数据,之后利用模型深度较深的第二分类模型对疑似敏感数据再次进行检测,以在疑似敏感数据中检测出真正的敏感数据,由于第一分类模型的时间性能较好、第二分类模型的检测效果较好,因此该种多媒体数据检测方式可以兼顾时间性能与检测效果,这样通过两个级联的分类模型既可满足线上实时进行多媒体数据检测的需求,还可保证敏感数据的检测精准度,相比于离线处理使得敏感数据在网上存留的时间大大减少,智能性较佳,网络净化效果较好。
图6是本发明实施例所示的一种多媒体数据检测装置的结构示意图。参见图6,该装置包括:第一获取模块601、第一处理模块602、第二处理模块603、确定模块604。
第一获取模块601,用于获取待检测的多媒体数据;
第一处理模块602,用于基于第一分类模型对多媒体数据执行敏感数据检测处理,得到多媒体数据为敏感数据的第一敏感概率;
第二处理模块603,用于若第一敏感概率大于第一预设阈值,则基于模型深度大于第一分类模型且与第一分类模型级联的第二分类模型,对多媒体数据执行敏感数据检测处理,得到多媒体数据为敏感数据的第二敏感概率;
确定模块604,用于若第二敏感概率大于第二预设阈值,则确定多媒体数据为敏感数据。
在另一个实施例中,第一分类模型包括第一数目个卷积核结构,每一个卷积核结构顺次相连,每一个卷积核结构中均包括第一卷积核和第二卷积核,第一卷积核与第二卷积核的尺寸不同;
第一处理模块602,用于对于第一分类模型的当前卷积核结构,获取与其相连的上一个卷积核结构输出的第一中间特征矩阵;基于当前卷积核结构的第一卷积核,对第一中间特征矩阵进行卷积处理,得到第一特征矩阵;基于当前卷积核结构的第二卷积核,对第一中间特征矩阵进行卷积处理,得到第二特征矩阵;将第一特征矩阵和第二特征矩阵进行组合处理,得到第二中间特征矩阵,将第二中间特征矩阵输入与当前卷积核结构相连的下一个卷积核结构,依次类推,重复执行对输入的中间特征矩阵进行卷积处理的步骤,直至最后一个卷积核结构输出第一目标特征矩阵;根据第一目标特征矩阵,计算第一敏感概率;
其中,若当前卷积核结构为第一分类模型的首个卷积核结构,则第一中间特征矩阵为多媒体数据的原始特征矩阵。
在另一个实施例中,第一分类模型包括第一数目个卷积核结构,每一个卷积核结构顺次相连,每一个卷积核结构中包括至少一个第三卷积核;
第一处理模块602,用于对于第一分类模型的当前卷积核结构,获取与其相连的上一个卷积核结构输出的第三特征矩阵;基于当前卷积核结构的至少一个第三卷积核,对第三特征矩阵中至少一个特征矩阵进行卷积处理,得到第四特征矩阵;将第四特征矩阵输入与当前卷积核结构相连的下一个卷积核结构,依次类推,重复执行对输入的特征矩阵进行卷积处理的步骤,直至最后一个卷积核结构输出第一目标特征矩阵;根据第一目标特征矩阵,计算第一敏感概率;
其中,若当前卷积核结构为第一分类模型的首个卷积核结构,则第三特征矩阵为多媒体数据的原始特征矩阵。
在另一个实施例中,第一处理模块602,用于基于第一目标特征矩阵,计算多媒体数据的第一特征向量;获取第一分类模型的第一分类矩阵,第一分类矩阵的行数与第一特征向量的列数相等,第一分类矩阵的列数与第一分类模型的分类类别的数目相等;将第一特征向量与第一分类矩阵进行乘积运算,得到第一敏感概率。
在另一个实施例中,第二分类模型包括第二数目个卷积核结构,第二数目大于第一数目,每一个卷积核结构顺次相连,每一个卷积核结构中均包括第四卷积核和第五卷积核,第四卷积核与第五卷积核的尺寸不同,第四卷积核和第五卷积核的尺寸均大于第一卷积核、第二卷积核和第三卷积核的尺寸;
第二处理模块603,用于对于第二分类模型的当前卷积核结构,获取与其相连的上一个卷积核结构输出的第三中间特征矩阵;基于当前卷积核结构的第四卷积核,对第三中间特征矩阵进行卷积处理,得到第五特征矩阵;基于当前卷积核结构的第五卷积核,对第三中间特征矩阵进行卷积处理,得到第六特征矩阵;将第五特征矩阵和第六特征矩阵进行组合处理,将得到的第四中间特征矩阵输入与当前卷积核结构相连的下一个卷积核结构,依次类推,重复执行对输入的中间特征矩阵进行卷积处理的步骤,直至最后一个卷积核结构输出第二目标特征矩阵;根据第二目标特征矩阵,计算第二敏感概率;
其中,若当前卷积核结构为第二分类模型的首个卷积核结构,则第三中间特征矩阵为多媒体数据的原始特征矩阵。
在另一个实施例中,第二分类模型包括第二数目个卷积核结构,第二数目大于第一数目;每一个卷积核结构顺次相连,每一个卷积核结构中包括至少一个第六卷积核,第六卷积核的尺寸大于第一卷积核、第二卷积核和第三卷积核的尺寸;
第二处理模块603,用于对于第二分类模型的当前卷积核结构,获取与其相连的上一个卷积核结构输出的第七特征矩阵;基于当前卷积核结构的至少一个第六卷积核,对第七特征矩阵中至少一个特征矩阵进行卷积处理,得到第八特征矩阵;将第八特征矩阵输入与当前卷积核结构相连的下一个卷积核结构,依次类推,重复执行对输入的特征矩阵进行卷积处理的步骤,直至最后一个卷积核结构输出第二目标特征矩阵;根据第二目标特征矩阵,计算第二敏感概率;
其中,若当前卷积核结构为第二分类模型的首个卷积核结构,则第七特征矩阵为多媒体数据的原始特征矩阵。
在另一个实施例中,第二处理模块603,用于基于第二目标特征矩阵,计算多媒体数据的第二特征向量;获取第二分类模型的第二分类矩阵,第二分类矩阵的行数与第二特征向量的列数相等,第二分类矩阵的列数与第二分类模型的分类类别的数目相等;将第二特征向量与第二分类矩阵进行乘积运算,得到第二敏感概率。
在另一个实施例中,该装置还包括:
第二获取模块,用于若第二敏感概率大于第三预设阈值且小于第二预设阈值,则获取人工对多媒体数据的标注结果,并将多媒体数据确定为训练样本数据;
优化模块,用于当训练样本数据的数量超出指定门限时,根据训练样本数据和对训练样本数据的标注结果,优化第一分类模型和第二分类模型。
本发明实施例提供的装置,采取两个模型深度不同的分类模型进行多媒体数据检测,通过模型深度较浅的第一分类模型,在海量待检测的多媒体数据中查找疑似敏感数据并过滤掉正常数据,之后利用模型深度较深的第二分类模型对疑似敏感数据再次进行检测,以在疑似敏感数据中检测出真正的敏感数据,由于第一分类模型的时间性能较好、第二分类模型的检测效果较好,因此该种多媒体数据检测方式可以兼顾时间性能与检测效果,这样通过两个级联的分类模型既可满足线上实时进行多媒体数据检测的需求,还可保证敏感数据的检测精准度,相比于离线处理使得敏感数据在网上存留的时间大大减少,智能性较佳,网络净化效果较好。
需要说明的是:上述实施例提供的多媒体数据检测装置在进行多媒体数据检测时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的多媒体数据检测装置与多媒体数据检测方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图7是根据一示例性实施例示出的一种服务器,该服务器可以用于实施上述任一示例性实施例示出的多媒体数据检测方法。具体来讲:参见图7,该服务器700可因配置或性能不同而产生比较大的差异,可以包括一个或一个以***处理器(Central ProcessingUnit,CPU)722(例如,一个或一个以上处理器)和存储器732,一个或一个以上存储应用程序742或数据744的存储介质730(例如一个或一个以上海量存储设备)。其中,存储器732和存储介质730可以是短暂存储或持久存储。存储在存储介质730的程序可以包括一个或一个以上模块(图示没标出)。
服务器700还可以包括一个或一个以上电源728,一个或一个以上有线或无线网络接口750,一个或一个以上输入输出接口758,和/或,一个或一个以上操作***741,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行上述一个或者一个以上程序包含用于执行多媒体数据检测的指令。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (18)

1.一种多媒体数据检测方法,其特征在于,所述方法包括:
获取待检测的多媒体数据;
基于第一分类模型对所述多媒体数据执行敏感数据检测处理,得到所述多媒体数据为敏感数据的第一敏感概率;
若所述第一敏感概率大于第一预设阈值,则基于模型深度大于所述第一分类模型且与所述第一分类模型级联的第二分类模型,对所述多媒体数据执行敏感数据检测处理,得到所述多媒体数据为所述敏感数据的第二敏感概率;
若所述第二敏感概率大于第二预设阈值,则确定所述多媒体数据为所述敏感数据,
其中,所述第一分类模型包括第一数目个卷积核结构,每一个卷积核结构顺次相连,每一个卷积核结构用来提取所述多媒体数据的不同区域的特征,所述第一数目个卷积核结构完成对所述多媒体数据的整体特征的提取,每一个卷积核结构中均包括第一卷积核和第二卷积核,所述第一卷积核的尺寸小于所述第二卷积核的尺寸,且每一个卷积核结构中的第一卷积核的权值与其他卷积核结构中的第一卷积核的权值不同,每一个卷积核结构中的第二卷积核的权值和其他卷积核结构中的第二卷积核的权值不同,并且所述第一卷积核和所述第二卷积核形成并联结构,每一个卷积核结构输出到下一级卷积核结构的中间特征矩阵,是通过对所述第一卷积核和所述第二卷积核分别卷积得到的两个特征矩阵进行组合处理得到。
2.根据权利要求1所述的方法,其特征在于,
所述基于第一分类模型对所述多媒体数据执行敏感数据检测处理,得到所述多媒体数据为敏感数据的第一敏感概率,包括:
对于所述第一分类模型的当前卷积核结构,获取与其相连的上一个卷积核结构输出的第一中间特征矩阵;
基于所述当前卷积核结构的第一卷积核,对所述第一中间特征矩阵进行卷积处理,得到第一特征矩阵;
基于所述当前卷积核结构的第二卷积核,对所述第一中间特征矩阵进行卷积处理,得到第二特征矩阵;
将所述第一特征矩阵和所述第二特征矩阵进行组合处理,得到第二中间特征矩阵,将所述第二中间特征矩阵输入与所述当前卷积核结构相连的下一个卷积核结构,依次类推,重复执行对输入的中间特征矩阵进行卷积处理的步骤,直至最后一个卷积核结构输出第一目标特征矩阵;
根据所述第一目标特征矩阵,计算所述第一敏感概率;
其中,若所述当前卷积核结构为所述第一分类模型的首个卷积核结构,则所述第一中间特征矩阵为所述多媒体数据的原始特征矩阵。
3.根据权利要求1所述的方法,其特征在于,所述第一分类模型包括的所述第一数目个卷积核结构中,每一个卷积核结构中包括至少一个第三卷积核;
所述基于第一分类模型对所述多媒体数据执行敏感数据检测处理,得到所述多媒体数据为敏感数据的第一敏感概率,包括:
对于所述第一分类模型的当前卷积核结构,获取与其相连的上一个卷积核结构输出的第三特征矩阵;
基于所述当前卷积核结构的至少一个第三卷积核,对所述第三特征矩阵中至少一个特征矩阵进行卷积处理,得到第四特征矩阵;
将所述第四特征矩阵输入与所述当前卷积核结构相连的下一个卷积核结构,依次类推,重复执行对输入的特征矩阵进行卷积处理的步骤,直至最后一个卷积核结构输出第一目标特征矩阵;
根据所述第一目标特征矩阵,计算所述第一敏感概率;
其中,若所述当前卷积核结构为所述第一分类模型的首个卷积核结构,则所述第三特征矩阵为所述多媒体数据的原始特征矩阵。
4.根据权利要求2或3所述的方法,其特征在于,所述根据所述第一目标特征矩阵,计算所述第一敏感概率,包括:
基于所述第一目标特征矩阵,计算所述多媒体数据的第一特征向量;
获取所述第一分类模型的第一分类矩阵,所述第一分类矩阵的行数与所述第一特征向量的列数相等,所述第一分类矩阵的列数与所述第一分类模型的分类类别的数目相等;
将所述第一特征向量与所述第一分类矩阵进行乘积运算,得到所述第一敏感概率。
5.根据权利要求1所述的方法,其特征在于,所述第二分类模型包括第二数目个卷积核结构,每一个卷积核结构中均包括第四卷积核和第五卷积核,所述第四卷积核与所述第五卷积核的尺寸不同,所述第四卷积核和所述第五卷积核的尺寸均大于第一卷积核、第二卷积核和第三卷积核的尺寸;
所述基于模型深度大于所述第一分类模型且与所述第一分类模型级联的第二分类模型,对所述多媒体数据执行敏感数据检测处理,包括:
对于所述第二分类模型的当前卷积核结构,获取与其相连的上一个卷积核结构输出的第三中间特征矩阵;
基于所述当前卷积核结构的第四卷积核,对所述第三中间特征矩阵进行卷积处理,得到第五特征矩阵;
基于所述当前卷积核结构的第五卷积核,对所述第三中间特征矩阵进行卷积处理,得到第六特征矩阵;
将所述第五特征矩阵和所述第六特征矩阵进行组合处理,将得到的第四中间特征矩阵输入与所述当前卷积核结构相连的下一个卷积核结构,依次类推,重复执行对输入的中间特征矩阵进行卷积处理的步骤,直至最后一个卷积核结构输出第二目标特征矩阵;
根据所述第二目标特征矩阵,计算所述第二敏感概率;
其中,若所述当前卷积核结构为所述第二分类模型的首个卷积核结构,则所述第三中间特征矩阵为所述多媒体数据的原始特征矩阵。
6.根据权利要求1所述的方法,其特征在于,所述第二分类模型包括第二数目个卷积核结构,每一个卷积核结构中包括至少一个第六卷积核,所述第六卷积核的尺寸大于第一卷积核、第二卷积核和第三卷积核的尺寸;
所述基于模型深度大于所述第一分类模型且与所述第一分类模型级联的第二分类模型,对所述多媒体数据执行敏感数据检测处理,得到所述多媒体数据为所述敏感数据的第二敏感概率,包括:
对于所述第二分类模型的当前卷积核结构,获取与其相连的上一个卷积核结构输出的第七特征矩阵;
基于所述当前卷积核结构的至少一个第六卷积核,对所述第七特征矩阵中至少一个特征矩阵进行卷积处理,得到第八特征矩阵;
将所述第八特征矩阵输入与所述当前卷积核结构相连的下一个卷积核结构,依次类推,重复执行对输入的特征矩阵进行卷积处理的步骤,直至最后一个卷积核结构输出第二目标特征矩阵;
根据所述第二目标特征矩阵,计算所述第二敏感概率;
其中,若所述当前卷积核结构为所述第二分类模型的首个卷积核结构,则所述第七特征矩阵为所述多媒体数据的原始特征矩阵。
7.根据权利要求5或6所述的方法,其特征在于,所述根据所述第二目标特征矩阵,计算所述第二敏感概率,包括:
基于所述第二目标特征矩阵,计算所述多媒体数据的第二特征向量;
获取所述第二分类模型的第二分类矩阵,所述第二分类矩阵的行数与所述第二特征向量的列数相等,所述第二分类矩阵的列数与所述第二分类模型的分类类别的数目相等;
将所述第二特征向量与所述第二分类矩阵进行乘积运算,得到所述第二敏感概率。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述第二敏感概率大于第三预设阈值且小于所述第二预设阈值,则获取人工对所述多媒体数据的标注结果,并将所述多媒体数据确定为训练样本数据;
当训练样本数据的数量超出指定门限时,根据所述训练样本数据和对所述训练样本数据的标注结果,优化所述第一分类模型和所述第二分类模型。
9.一种多媒体数据检测装置,其特征在于,所述装置包括:
第一获取模块,用于获取待检测的多媒体数据;
第一处理模块,用于基于第一分类模型对所述多媒体数据执行敏感数据检测处理,得到所述多媒体数据为敏感数据的第一敏感概率;
第二处理模块,用于若所述第一敏感概率大于第一预设阈值,则基于模型深度大于所述第一分类模型且与所述第一分类模型级联的第二分类模型,对所述多媒体数据执行敏感数据检测处理,得到所述多媒体数据为所述敏感数据的第二敏感概率;
确定模块,用于若所述第二敏感概率大于第二预设阈值,则确定所述多媒体数据为所述敏感数据,
其中,所述第一分类模型包括第一数目个卷积核结构,每一个卷积核结构顺次相连,每一个卷积核结构用来提取所述多媒体数据的不同区域的特征,所述第一数目个卷积核结构完成对所述多媒体数据的整体特征的提取,每一个卷积核结构中均包括第一卷积核和第二卷积核,所述第一卷积核的尺寸小于所述第二卷积核的尺寸,且每一个卷积核结构中的第一卷积核的权值与其他卷积核结构中的第一卷积核的权值不同,每一个卷积核结构中的第二卷积核的权值和其他卷积核结构中的第二卷积核的权值不同,并且所述第一卷积核和所述第二卷积核形成并联结构,每一个卷积核结构输出到下一级卷积核结构的中间特征矩阵,是通过对所述第一卷积核和所述第二卷积核分别卷积得到的两个特征矩阵进行组合处理得到。
10.根据权利要求9所述的装置,其特征在于,
所述第一处理模块,用于对于所述第一分类模型的当前卷积核结构,获取与其相连的上一个卷积核结构输出的第一中间特征矩阵;基于所述当前卷积核结构的第一卷积核,对所述第一中间特征矩阵进行卷积处理,得到第一特征矩阵;基于所述当前卷积核结构的第二卷积核,对所述第一中间特征矩阵进行卷积处理,得到第二特征矩阵;将所述第一特征矩阵和所述第二特征矩阵进行组合处理,得到第二中间特征矩阵,将所述第二中间特征矩阵输入与所述当前卷积核结构相连的下一个卷积核结构,依次类推,重复执行对输入的中间特征矩阵进行卷积处理的步骤,直至最后一个卷积核结构输出第一目标特征矩阵;根据所述第一目标特征矩阵,计算所述第一敏感概率;
其中,若所述当前卷积核结构为所述第一分类模型的首个卷积核结构,则所述第一中间特征矩阵为所述多媒体数据的原始特征矩阵。
11.根据权利要求9所述的装置,其特征在于,所述第一分类模型包括的所述第一数目个卷积核结构中,每一个卷积核结构中包括至少一个第三卷积核;
所述第一处理模块,用于对于所述第一分类模型的当前卷积核结构,获取与其相连的上一个卷积核结构输出的第三特征矩阵;基于所述当前卷积核结构的至少一个第三卷积核,对所述第三特征矩阵中至少一个特征矩阵进行卷积处理,得到第四特征矩阵;将所述第四特征矩阵输入与所述当前卷积核结构相连的下一个卷积核结构,依次类推,重复执行对输入的特征矩阵进行卷积处理的步骤,直至最后一个卷积核结构输出第一目标特征矩阵;根据所述第一目标特征矩阵,计算所述第一敏感概率;
其中,若所述当前卷积核结构为所述第一分类模型的首个卷积核结构,则所述第三特征矩阵为所述多媒体数据的原始特征矩阵。
12.根据权利要求10或11所述的装置,其特征在于,所述第一处理模块,用于基于所述第一目标特征矩阵,计算所述多媒体数据的第一特征向量;获取所述第一分类模型的第一分类矩阵,所述第一分类矩阵的行数与所述第一特征向量的列数相等,所述第一分类矩阵的列数与所述第一分类模型的分类类别的数目相等;将所述第一特征向量与所述第一分类矩阵进行乘积运算,得到所述第一敏感概率。
13.根据权利要求9所述的装置,其特征在于,所述第二分类模型包括第二数目个卷积核结构,每一个卷积核结构中均包括第四卷积核和第五卷积核,所述第四卷积核与所述第五卷积核的尺寸不同,所述第四卷积核和所述第五卷积核的尺寸均大于第一卷积核、第二卷积核和第三卷积核的尺寸;
所述第二处理模块,用于对于所述第二分类模型的当前卷积核结构,获取与其相连的上一个卷积核结构输出的第三中间特征矩阵;基于所述当前卷积核结构的第四卷积核,对所述第三中间特征矩阵进行卷积处理,得到第五特征矩阵;基于所述当前卷积核结构的第五卷积核,对所述第三中间特征矩阵进行卷积处理,得到第六特征矩阵;将所述第五特征矩阵和所述第六特征矩阵进行组合处理,将得到的第四中间特征矩阵输入与所述当前卷积核结构相连的下一个卷积核结构,依次类推,重复执行对输入的中间特征矩阵进行卷积处理的步骤,直至最后一个卷积核结构输出第二目标特征矩阵;根据所述第二目标特征矩阵,计算所述第二敏感概率;
其中,若所述当前卷积核结构为所述第二分类模型的首个卷积核结构,则所述第三中间特征矩阵为所述多媒体数据的原始特征矩阵。
14.根据权利要求9所述的装置,其特征在于,所述第二分类模型包括第二数目个卷积核结构,每一个卷积核结构顺次相连,每一个卷积核结构中包括至少一个第六卷积核,所述第六卷积核的尺寸大于第一卷积核、第二卷积核和第三卷积核的尺寸;
所述第二处理模块,用于对于所述第二分类模型的当前卷积核结构,获取与其相连的上一个卷积核结构输出的第七特征矩阵;基于所述当前卷积核结构的至少一个第六卷积核,对所述第七特征矩阵中至少一个特征矩阵进行卷积处理,得到第八特征矩阵;将所述第八特征矩阵输入与所述当前卷积核结构相连的下一个卷积核结构,依次类推,重复执行对输入的特征矩阵进行卷积处理的步骤,直至最后一个卷积核结构输出第二目标特征矩阵;根据所述第二目标特征矩阵,计算所述第二敏感概率;
其中,若所述当前卷积核结构为所述第二分类模型的首个卷积核结构,则所述第七特征矩阵为所述多媒体数据的原始特征矩阵。
15.根据权利要求13或14所述的装置,其特征在于,所述第二处理模块,用于基于所述第二目标特征矩阵,计算所述多媒体数据的第二特征向量;获取所述第二分类模型的第二分类矩阵,所述第二分类矩阵的行数与所述第二特征向量的列数相等,所述第二分类矩阵的列数与所述第二分类模型的分类类别的数目相等;将所述第二特征向量与所述第二分类矩阵进行乘积运算,得到所述第二敏感概率。
16.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于若所述第二敏感概率大于第三预设阈值且小于所述第二预设阈值,则获取人工对所述多媒体数据的标注结果,并将所述多媒体数据确定为训练样本数据;
优化模块,用于当训练样本数据的数量超出指定门限时,根据所述训练样本数据和对所述训练样本数据的标注结果,优化所述第一分类模型和所述第二分类模型。
17.一种服务器,包括一个或一个以上的处理器和一个或一个以上存储有程序的存储器或存储介质,当所述程序被所述一个或一个以上的处理器执行时,实施权利要求1-8任一项所述的多媒体数据检测方法。
18.一种计算机可读存储介质,存储有程序,当所述程序被处理器执行时,实施权利要求1-8任一项所述的多媒体数据检测方法。
CN201611064769.5A 2016-11-28 2016-11-28 多媒体数据检测方法及装置 Active CN106776842B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611064769.5A CN106776842B (zh) 2016-11-28 2016-11-28 多媒体数据检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611064769.5A CN106776842B (zh) 2016-11-28 2016-11-28 多媒体数据检测方法及装置

Publications (2)

Publication Number Publication Date
CN106776842A CN106776842A (zh) 2017-05-31
CN106776842B true CN106776842B (zh) 2021-03-19

Family

ID=58902029

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611064769.5A Active CN106776842B (zh) 2016-11-28 2016-11-28 多媒体数据检测方法及装置

Country Status (1)

Country Link
CN (1) CN106776842B (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107665333A (zh) * 2017-08-28 2018-02-06 平安科技(深圳)有限公司 一种基于卷积神经网络的不雅图片识别方法、终端、设备及计算机可读存储介质
CN107729924B (zh) * 2017-09-25 2019-02-19 平安科技(深圳)有限公司 图片复审概率区间生成方法及图片复审判定方法
CN108124191B (zh) * 2017-12-22 2019-07-12 北京百度网讯科技有限公司 一种视频审核方法、装置及服务器
CN108345832A (zh) * 2017-12-28 2018-07-31 新智数字科技有限公司 一种人脸检测的方法、装置及设备
CN110555488A (zh) * 2018-06-04 2019-12-10 北京京东尚科信息技术有限公司 图像序列的审核方法及***、电子设备和存储介质
CN109033472A (zh) * 2018-09-05 2018-12-18 深圳灵图慧视科技有限公司 图片检索方法及装置、计算机设备及计算机可读介质
CN109491970B (zh) * 2018-10-11 2024-05-10 平安科技(深圳)有限公司 面向云存储的不良图片检测方法、装置及存储介质
CN111382383A (zh) * 2018-12-28 2020-07-07 广州市百果园信息技术有限公司 网页内容敏感类型确定方法、装置、介质和计算机设备
CN109862394A (zh) * 2019-03-27 2019-06-07 北京周同科技有限公司 视频内容的审核方法、装置、设备和存储介质
CN110866108A (zh) * 2019-11-20 2020-03-06 满江(上海)软件科技有限公司 一种敏感数据检测***及其检测方法
CN111143553B (zh) * 2019-12-06 2023-04-07 国家计算机网络与信息安全管理中心 一种实时文本数据流的特定信息识别方法及***
CN111125388B (zh) * 2019-12-30 2023-12-15 北京达佳互联信息技术有限公司 多媒体资源的检测方法、装置及设备和存储介质
CN110826545A (zh) * 2020-01-09 2020-02-21 腾讯科技(深圳)有限公司 一种视频类别识别的方法及相关装置
CN111460930A (zh) * 2020-03-17 2020-07-28 深圳市创维群欣安防科技股份有限公司 一种媒体文件安全审核的方法、存储介质及设备
CN111784044A (zh) * 2020-06-29 2020-10-16 杭州鲁尔物联科技有限公司 一种滑坡的预测方法、装置、设备和存储介质
CN112200361A (zh) * 2020-09-30 2021-01-08 杭州鲁尔物联科技有限公司 一种滑坡的预测方法、装置、设备和存储介质
CN112200363A (zh) * 2020-09-30 2021-01-08 杭州鲁尔物联科技有限公司 一种滑坡的预测方法、装置、设备和存储介质
CN112200359A (zh) * 2020-09-30 2021-01-08 杭州鲁尔物联科技有限公司 一种滑坡的预测方法、装置、设备和存储介质
CN112200364A (zh) * 2020-09-30 2021-01-08 杭州鲁尔物联科技有限公司 一种滑坡的预测方法、装置、设备和存储介质
CN112200362B (zh) * 2020-09-30 2024-03-29 杭州鲁尔物联科技有限公司 一种滑坡的预测方法、装置、设备和存储介质
CN112200356A (zh) * 2020-09-30 2021-01-08 杭州鲁尔物联科技有限公司 一种滑坡的预测方法、装置、设备和存储介质
CN114362982A (zh) * 2020-10-12 2022-04-15 中兴通讯股份有限公司 流量细分识别方法、***、电子设备和存储介质
CN112286440A (zh) * 2020-11-20 2021-01-29 北京小米移动软件有限公司 触摸操作分类、模型训练方法及装置、终端及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7405740B1 (en) * 2000-03-27 2008-07-29 Stmicroelectronics, Inc. Context sensitive scaling device and method
CN104504389A (zh) * 2014-12-18 2015-04-08 南京信息工程大学 一种基于卷积神经网络的卫星云量计算方法
CN105447473A (zh) * 2015-12-14 2016-03-30 江苏大学 一种基于PCANet-CNN的任意姿态人脸表情识别方法
CN105469039A (zh) * 2015-11-19 2016-04-06 天津大学 基于aer图像传感器的目标识别***
CN105528589A (zh) * 2015-12-31 2016-04-27 上海科技大学 基于多列卷积神经网络的单张图像人群计数算法
CN105631426A (zh) * 2015-12-29 2016-06-01 中国科学院深圳先进技术研究院 对图片进行文本检测的方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100565523C (zh) * 2007-04-05 2009-12-02 中国科学院自动化研究所 一种基于多分类器融合的敏感网页过滤方法及***
CN103434484B (zh) * 2013-08-20 2016-04-27 安科智慧城市技术(中国)有限公司 车载识别认证装置、移动终端、智能车钥控制***及方法
CN103473539B (zh) * 2013-09-23 2015-07-15 智慧城市***服务(中国)有限公司 步态识别方法和装置
CN103824054B (zh) * 2014-02-17 2018-08-07 北京旷视科技有限公司 一种基于级联深度神经网络的人脸属性识别方法
CN105069622B (zh) * 2015-08-03 2018-08-31 福州海景科技开发有限公司 一种面向移动终端的人脸识别支付***和方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7405740B1 (en) * 2000-03-27 2008-07-29 Stmicroelectronics, Inc. Context sensitive scaling device and method
CN104504389A (zh) * 2014-12-18 2015-04-08 南京信息工程大学 一种基于卷积神经网络的卫星云量计算方法
CN105469039A (zh) * 2015-11-19 2016-04-06 天津大学 基于aer图像传感器的目标识别***
CN105447473A (zh) * 2015-12-14 2016-03-30 江苏大学 一种基于PCANet-CNN的任意姿态人脸表情识别方法
CN105631426A (zh) * 2015-12-29 2016-06-01 中国科学院深圳先进技术研究院 对图片进行文本检测的方法及装置
CN105528589A (zh) * 2015-12-31 2016-04-27 上海科技大学 基于多列卷积神经网络的单张图像人群计数算法

Also Published As

Publication number Publication date
CN106776842A (zh) 2017-05-31

Similar Documents

Publication Publication Date Title
CN106776842B (zh) 多媒体数据检测方法及装置
CN109858461B (zh) 一种密集人群计数的方法、装置、设备以及存储介质
CN110633745B (zh) 一种基于人工智能的图像分类训练方法、装置及存储介质
CN111401516B (zh) 一种神经网络通道参数的搜索方法及相关设备
CN110572362B (zh) 针对多类不均衡异常流量的网络攻击检测方法及装置
CN112232476B (zh) 更新测试样本集的方法及装置
KR102263397B1 (ko) 뉴럴 네트워크 학습에 이용될 오토 라벨링된 이미지 중에서 라벨 검수를 위한 샘플 이미지를 획득하는 방법 및 이를 이용한 샘플 이미지 획득 장치
CN111462183A (zh) 一种基于注意力机制双流网络的行为识别方法及***
CN109118504B (zh) 一种基于神经网络的图像边缘检测方法、装置及其设备
CN111914924B (zh) 一种快速舰船目标检测方法、存储介质及计算设备
CN109472193A (zh) 人脸检测方法及装置
CN114187311A (zh) 一种图像语义分割方法、装置、设备及存储介质
CN109543760A (zh) 基于图像滤镜算法的对抗样本检测方法
CN114140683A (zh) 一种航拍图像目标检测的方法、设备与介质
CN111126278A (zh) 针对少类别场景的目标检测模型优化与加速的方法
CN111914726B (zh) 基于多通道自适应注意力机制的行人检测方法
CN114783021A (zh) 一种口罩佩戴智能检测方法、装置、设备及介质
CN111259823A (zh) 一种基于卷积神经网络的色情图像识别方法
CN111814820A (zh) 图像处理方法及装置
CN112132867B (zh) 一种遥感影像变化检测方法及装置
CN113962900A (zh) 复杂背景下红外弱小目标检测方法、装置、设备及介质
CN113033371A (zh) 基于csp模型的多级特征融合行人检测方法
CN112465847A (zh) 一种基于预测清晰边界的边缘检测方法、装置及设备
CN113033500B (zh) 动作片段检测方法、模型训练方法及装置
CN115758337A (zh) 基于时序图卷积网络的后门实时监测方法、电子设备、介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant