CN107818337A - 基于深度卷积神经网络的突发事件分级分类方法及装置 - Google Patents

基于深度卷积神经网络的突发事件分级分类方法及装置 Download PDF

Info

Publication number
CN107818337A
CN107818337A CN201710934731.7A CN201710934731A CN107818337A CN 107818337 A CN107818337 A CN 107818337A CN 201710934731 A CN201710934731 A CN 201710934731A CN 107818337 A CN107818337 A CN 107818337A
Authority
CN
China
Prior art keywords
layer
accident
model
image
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710934731.7A
Other languages
English (en)
Inventor
潘维
孙亭
李毅
叶云
沈自然
孙苑
周翠翠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CETC 28 Research Institute
Original Assignee
CETC 28 Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CETC 28 Research Institute filed Critical CETC 28 Research Institute
Priority to CN201710934731.7A priority Critical patent/CN107818337A/zh
Publication of CN107818337A publication Critical patent/CN107818337A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于深度卷积神经网络的突发事件分级分类方法及装置,该方法包括:获取预先分类的每一类突发事件的图像信息,建立突发事件图像库;对图像库中的每张图像进行重要性标记;从标记的突发事件图像库中选取样本集;建立深度卷积神经网络模型,该模型的输入为突发事件原始图像,输出为突发事件分级分类向量;将样本集放入到模型中进行训练,利用S折交叉验证来选择模型;将待分级分类的突发事件图像输入到选择的模型中进行计算,得到待分级分类的突发事件的分类分级结果。本发明的方法,通过历史图像数据训练深度卷积神经网络来自动学习突发事件特征,进而对事件进行分级分类,辅助决策者科学客观地掌握突发事件情况。

Description

基于深度卷积神经网络的突发事件分级分类方法及装置
技术领域
本发明涉及智慧城市技术领域,具体涉及一种基于深度卷积神经网络的突发事件分级分类方法及装置。
背景技术
当前,国内外对突发事件分级分类通常有两种形式:一是纯人工判定,根据历史突发事件情况,人工总结出相关核心特征,形成指标体系,当新的突发事件到来时,依据指标,人工判断事件的类型和级别;二是人工+自动判定,首先通过人工总结出突发事件核心特征,形成指标体系,当新的突发事件到来时,交由机器来计算事件的类型和级别。
现有的处理突发事件分级分类的方法,都是利用传统的机器学习技术,比如贝叶斯网络、SVM支持向量机算法、模糊决策法等。然而,这些方法对突发事件特征的选取部分都是由人工完成,存在一定的主观性和随意性。
发明内容
针对现有技术存在的缺陷,本发明提供了一种基于深度卷积神经网络的突发事件分级分类方法及装置,通过历史图像数据训练深度卷积神经网络来自动学习突发事件特征,进而对事件进行分级分类,辅助决策者科学客观地掌握突发事件情况。
本发明的一个目的是提供了一种基于深度卷积神经网络的突发事件分级分类方法,包括:
S1、获取预先分类的每一类突发事件的图像信息,建立突发事件图像库;
S2、针对每一类的突发事件图像库,对图像库中的每张图像进行重要性标记;
S3、从标记的突发事件图像库中选取样本集;
S4、建立深度卷积神经网络模型,所述模型的输入为突发事件原始图像,输出为突发事件分级分类向量;
S5、将样本集放入到所述深度卷积神经网络模型中进行训练,利用S折交叉验证来选择模型;
S6、将待分级分类的突发事件图像输入到选择的模型中进行计算,得到所述待分级分类的突发事件的分类分级结果。
其中,所述步骤S1之前还包括:
采集突发事件图像信息并进行分类。
其中,所述步骤S3中,按照均匀概率随机地分别从每个突发事件图像库中选取样本集;
其中,所述对图像库中的每张图像进行重要性标记,具体包括:
对每一类突发事件图像数据库,分别将每张图像按照事件的可控性、影响程度以及影响范围进行重要性标记,所述重要性标记包括一般、较大、重大、特别重大四个级别的重要性标记。
其中,所述步骤S4具体包括:
建立17层深度卷积神经网络模型,其中,第一层为输入层,输入为突发事件原始图像,第二、四、七、九、十二、十四层为卷积层,第三、五、八、十、十三、十五层为非线性变换层,第六、十一、十六层为下采样层,第十七层为全连接层,输出为突发事件分级分类向量,所述突发事件分级分类向量表示为[事件类型、事件级别]。
其中,所述第一层和第二层之间包括16个卷积核,第三层和第四层之间包括32个卷积核,第六层和第七层之间包括48个卷积核,第八层和第九层之间包括32个卷积核,第十一层和第十二层之间包括64个卷积核,第十三层和第十四层之间包括48个卷积核。
其中,第三层非线性函数为tanh,第五层非线性函数为Relu函数max(0,x),第八层非线性函数为tanh,第十层非线性函数为sigmoid 函数,第十三层非线性函数为softplus函数,第十五层非线性函数为Relu函数max(0,x)。
其中,第六层为最大值池化,池化核尺寸(2x2),池化核移动幅度为2,第十一层为平均值池化,池化核尺寸(2x2),池化核移动幅度为2,第十六层为最大值池化,池化核尺寸(2x2),池化核移动幅度为2。
进一步地,第十七层为全连接层,维度为(1x1x16),其中16表示突发事件类型和事件级别的组合数,所述第十七层的输出使用 softmax函数进行概率表示:
其中,i为突发事件类型和事件级别的组合序列数,i为1表示第一组突发事件类型和事件级别的组合,k表示大于零的自然数,用于计数,所述第十七层的输出为16维向量,每一维表示突发事件图像属于这一维的概率。
进一步地,所述步骤S5中,通过交叉熵作为目标损失函数来对所述深度卷积神经网络模型进行训练,所述目标损失函数为:
其中,yi表示图片类别的第i维真实概率值,表示经过神经网络计算得到图片类别的第i维的概率值。
其中,所述步骤S5中利用S折交叉验证来选择模型,具体包括:
S51、将所述样本集切分为S个互不相交的大小相同的子集;
S52、选择任意S-1个子集的数据训练模型,使用余下的子集测试模型;
S53、重复步骤S52,选出平均测试误差最小的模型。
本发明的另一个目的,提供一种基于深度卷积神经网络的突发事件分级分类装置,包括:
图像库建立单元,用于获取预先分类的每一类突发事件的图像信息,建立突发事件图像库;
标记单元,用于针对每一类的突发事件图像库,对图像库中的每张图像进行重要性标记;
样本集选取单元,用于从标记的突发事件图像库中选取样本集;
模型建立单元,用于建立深度卷积神经网络模型,所述模型的输入为突发事件原始图像,输出为突发事件分级分类向量;
模型训练单元,用于将样本集放入到所述深度卷积神经网络模型中进行训练,利用S折交叉验证来选择模型;
计算单元,用于将待分级分类的突发事件图像输入到选择的模型中进行计算,得到所述待分级分类的突发事件的分类分级结果。
优选地,所述装置还包括:图像采集单元,用于采集突发事件图像信息并进行分类。
其中,所述样本集选取单元,具体地按照均匀概率随机地分别从每个突发事件图像库中选取样本集;
其中,所述模型建立单元建立模型的具体为:所述深度卷积神经网络模型包括17层,其中,第一层为输入层,输入为突发事件原始图像,第二、四、七、九、十二、十四层为卷积层,第三、五、八、十、十三、十五层为非线性变换层,第六、十一、十六层为下采样层,第十七层为全连接层,输出为突发事件分级分类向量,为[事件类型、事件级别]。
其中,所述模型第一层和第二层之间包括16个卷积核,第三层和第四层之间包括32个卷积核,第六层和第七层之间包括48个卷积核,第八层和第九层之间包括32个卷积核,第十一层和第十二层之间包括64个卷积核,第十三层和第十四层之间包括48个卷积核。
其中,所述模型第三层非线性函数为tanh,第五层非线性函数为 Relu函数max(0,x),第八层非线性函数为tanh,第十层非线性函数为sigmoid函数,第十三层非线性函数为softplus函数,第十五层非线性函数为Relu函数max(0,x)。
其中,所述模型第六层为最大值池化,池化核尺寸(2x2),池化核移动幅度为2,第十一层为平均值池化,池化核尺寸(2x2),池化核移动幅度为2,第十六层为最大值池化,池化核尺寸(2x2),池化核移动幅度为2。
其中,所述模型的第十七层为全连接层,维度为(1x1x16),其中16表示突发事件类型和事件级别的组合数,所述第十七层的输出使用softmax函数进行概率表示:
其中,i为突发事件类型和事件级别的组合序列数,i为1表示第一组突发事件类型和事件级别的组合,k表示大于零的自然数,用于计数,所述第十七层的输出为16维向量,每一维表示突发事件图像属于这一维的概率。
其中,所述模型训练单元,具体地,通过交叉熵作为目标损失函数来对所述深度卷积神经网络模型进行训练,所述目标损失函数为:
其中,yi表示图片类别的第i维真实概率值,表示经过神经网络计算得到图片类别的第i维的概率值。
进一步地,所述模型训练单元还包括:
拆分子单元,用于将所述样本集切分为S个互不相交的大小相同的子集;
训练子单元,用于选择任意S-1个子集的数据训练模型,使用余下的子集测试模型;
选择子单元,用于从多个训练子单元的训练结果中,选出平均测试误差最小的模型。
本发明的基于深度卷积神经网络的突发事件分级分类方法及装置,通过历史图像数据训练深度卷积神经网络来自动学习突发事件特征,进而对事件进行分级分类,辅助决策者科学客观地掌握突发事件情况。由此,此方法能够自动学习突发事件相关核心特征,节省了人力操作,解决了事件分级分类过程中的主观性和随意性。同时该方法能够得到一种通用的模型,适用于所有的突发事件场景。
附图说明
图1示出了本发明的基于深度卷积神经网络的突发事件分级分类方法的流程图。
图2示出了本发明的实施例的深度卷积神经网络结构示意图。
图3示出了本发明的实施例的下采样层示意图。
图4示出了本发明的实施例的下采样操作最大化池示意图。
图5示出了本发明的实施例的下采样操作平均值池化示意图。
图6示出了本发明的基于深度卷积神经网络的突发事件分级分类装置的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明,应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
现在将详细参考本发明的实施例,这些实施例的示例在附图中示出。元件的后缀“模块”和“单元”在此用于方便描述,并且因此可以可交换地被使用,而且没有任何可区别的意义或功能。
虽然构成本发明的实施例的所有元件或单元被描述为结合到单个元件中或***作为单个元件或单元,但是本发明不一定局限于此种实施例。根据实施例,在本发明的目的和范围内所有的元件可以选择性地结合到一个或多个元件并且***作为一个或多个元件。
本发明的一个实施例,提供一种基于深度卷积神经网络的突发事件分级分类方法,如图1所示,该方法具体包括如下步骤:
S1、获取预先分类的每一类突发事件的图像信息,建立突发事件图像库;
具体地,本步骤之前还包括采集突发事件图像信息并进行分类,本实施例中,将突发事件分为将突发事件分为自然灾害、事故灾难、公共卫生、社会安全等四大类,分别对每一类突发事件进行图像采集,形成突发事件图像库。
自然灾害主要包括水旱灾害,气象灾害,地震灾害,地质灾害,海洋灾害,生物灾害和森林火灾;事故灾难主要包括工矿商贸等企业的各类安全生产事故,交通运输事故,危险化学品事故,公共设施和设备事故,核与辐射事故,环境污染和生态破坏事故;公共卫生事件主要包括传染病疫情,群体性不明原因疾病,食品安全和职业危害,动物疫情,以及其他严重影响公众健康和生命安全的事件;社会安全事件主要包括恐怖袭击事件,民族宗教事件,涉外突发事件和***件。
本实施例中,针对四大类型突发事件进行图形信息采集,主要分为三个层次:首先,分别以各类突发事件为主题从海量信息中获取图像,从各个新闻门户网站上获取相关图片信息;其次,通过API读取新浪微博、网易微博等著名微博上的图片信息;再次,根据突发事件类型,从各主管部门处获取相关图片信息。最后将三类图像数据进行统一格式,存入数据库中。
S2、针对每一类的突发事件图像库,对图像库中的每张图像进行重要性标记。
本实施例中,针对每类突发事件形成的图像库,对图像库中每张图像进行人工或者自动标记,在已知突发事件类别的基础上,再将各张图片按事件的可控性、严重程度和影响范围分为一般、较大、重大、特别重大四级,其用向量形式表示则为{事件类型,事件级别}。
S3、从标记的突发事件图像库中选取样本集。本实施例中,按均匀概率随机地从已经标记过的突发事件图像库中选取相应的样本集,以保证各类突发事件有充足的图像数据。
S4、建立深度卷积神经网络模型,所述模型的输入为突发事件原始图像,输出为突发事件分级分类向量。
本实施例中,通过TensorFlow平台构建17层深度卷积神经网络。第一层为输入层,输入为突发事件原始图像,图像尺寸为[宽高3],第二、四、七、九、十二、十四层为卷积层,第三、五、八、十、十三、十五层为非线性变换层,第六、十一、十六层为下采样层,第十七层为全连接层,输出为突发事件分级分类向量,表现为[事件类型、事件级别]。
具体地,在一个实施例中,如图2所示,【1】为输入层,输入数据为原始图像,尺寸为(256x320x3),256表示的是图像的宽,320 表示的是图像的高,3表示的是图像的颜色通道数;
【2】表示的是卷积层,层内每一切片上神经元都与【1】层神经元局部连接,并且共享权值,本实施例中使用16个卷积核用于与【1】层进行卷积,每个卷积核尺寸为(7x7x3),卷积核移动幅度(stride) 为1,并且卷积时,对【1】层图像补3个0(zeropadding),使得卷积后的图像尺寸不变,公式表示为:
Convi(x,y)=Filteri*PreLayer(x,y)[filterarea]i=1,2....16
其中,Convi(x,y)表示的是卷积层内第i个切片上(x,y)处神经元经过卷积后的值,Filteri表示的是卷积核,同一个切片i上的神经元共享一个卷积核,并依顺序与上一层神经元进行卷积;
【3】表示的是非线性层,对卷积层数值进行非线性变换,增强神经网络的普适性,Outputi(x,y)=nonlinear(Convi(x,y)+biasi),其中nonlinear表示的是非线性函数,比如tanh、max(0,x)等,此处使用tanh函数,Convi(x,y)表示的是上一层(x,y)处神经元的值,表示的是偏置值,上一层第i切片上的所有神经元共享此值。
【4】层为卷积层,原理与【2】层相同,但是此层使用32个卷积核,卷积核尺寸(5x5x16)、移动幅度为1、补0个数为2。
【5】非线性层使用Relu函数max(0,x)。
【6】层为下采样层,用于对上一层的输出向量进行降维,使得结果不出现过拟合的情况,此处的下采样操作有最大值池化、平均值池化等方式,本实施例中采用最大值池化,如图3和图4所示,池化核尺寸(2x2),池化核移动幅度为2,所以维度变为(128x160x32)。
【7】卷积层,使用48个卷积核,卷积核尺寸为(7x7x32)、移动幅度为1,、补0个数为3。
【8】非线性层使用tanh函数;【9】卷积层,使用32个卷积核,卷积核尺寸为(5X5x48)、移动幅度为1、补0个数为2;【10】非线性层使用sigmoid函数;【11】下采样层使用平均值池化,如图5所示,池化核尺寸(2x2),池化核移动幅度为2,维度变为(64x80x32), 具体操作如图4所示;【12】卷积层,使用64个卷积核,卷积核尺寸为(5x5x32)、移动幅度为1、补0个数为2;【13】非线性层使用softplus 函数;【14】卷积层,使用48个卷积核,卷积核尺寸为(7x7x64)、移动幅度为1、补0个数为3;【15】非线性层使用Relu函数max(0,x);【16】下采样层使用最大值池化,池化核尺寸(2x2),池化核移动幅度为2,维度变为(32x40x48)。
【17】层为全连接层,维度为(1x1x16),其中,16表示的是突发事件类型和事件级别的组合数,比如一般自然灾害、较大事故灾难、重大公共卫生、特别重大社会安全等,最后使用softmax函数对【17】层输出进行概率表示,
最后输出16维向量,其中每一维表示的是突发事件图像属于这一维的概率,比如输出为[0.01,0.02,0.3,0.04,…….,0.10],对应于[一般自然灾害,较大自然灾害,重大自然灾害,特别重大自然灾害,……,特别重大社会安全],最后从16个分类中选取概率值前三的分类,用于辅助决策者判断。
S5、将样本集放入到所述深度卷积神经网络模型中进行训练,利用S折交叉验证来选择模型。
本实施例中,训练上述的深度卷积神经网络模型时,目标损失函数为交叉熵,即其中,y表示图片类别的真实概率分布,y~表示经过神经网络计算得到的概率分布,在本发明中 y与y~的维度都是16,yi均表示16维向量中的第i维的概率值。
然后,将样本集放入到17层深度卷积神经网络中学习,利用S 折交叉验证来选择模型。具体过程包括:
S51、将样本集切分为S个互不相交的大小相同的子集;
S52、选择任意S-1个子集的数据训练模型,使用余下的子集测试模型;
S53、重复步骤S52,选出平均测试误差最小的模型。
上述实施例中,S可设为10;在训练过程中,需要不断地优化目标损失函数,此处使用Adam optimizer,这是一种随机优化方法,仅需要求一阶梯度,内存占用少,对于解决具有大量参数的模型有良好的效果,Adam优化方法的关键步骤如下:
t←t+1
mt←β1·mt-1+(1-β1)·gt
其中,α表示算法学习率,β1、β2、m、v是算法中的参数,f(p) 表示目标损失函数,t表示算法迭代次数。
S6、将待分级分类的突发事件图像输入到所述深度卷积神经网络模型中进行计算,得到所述待分级分类的突发事件的分类分级结果。
本实施例中,通过步骤S5中训练好的深度卷积神经网络模型,得到该模型的各类参数,将待待分级分类的突发事件图像以[宽高3] 的形式输入到已经训练好的深度卷积神经网络当中,得到该新图像的前三位最可能的分类与分级,向量表示即为{事件类型,事件级别}。本发明的又一个实施例中,公开一种基于深度卷积神经网络的突发事件分级分类装置,如图6所示,该装置具体包括:图像库建立单元 10,用于获取预先分类的每一类突发事件的图像信息,建立突发事件图像库;
标记单元20,用于针对每一类的突发事件图像库,对图像库中的每张图像进行重要性标记;
样本集选取单元30,用于从标记的突发事件图像库中选取样本集;
模型建立单元40,用于建立深度卷积神经网络模型,所述模型的输入为突发事件原始图像,输出为突发事件分级分类向量;
模型训练单元50,用于将样本集放入到所述深度卷积神经网络模型中进行训练,利用S折交叉验证来选择模型;
计算单元60,用于将待分级分类的突发事件图像输入到选择的模型中进行计算,得到所述待分级分类的突发事件的分类分级结果。
在进一步的实施例中,上述装置还包括:图像采集单元,用于采集突发事件图像信息并进行分类。
在又一个实施例中,样本集选取单元30,具体地按照均匀概率随机地分别从每个突发事件图像库中选取样本集。
进一步地,模型建立单元40建立的模型具体为:深度卷积神经网络模型包括17层,其中,第一层为输入层,输入为突发事件原始图像,第二、四、七、九、十二、十四层为卷积层,第三、五、八、十、十三、十五层为非线性变换层,第六、十一、十六层为下采样层,第十七层为全连接层,输出为突发事件分级分类向量,为[事件类型及事件级别]。
上述模型中,第一层和第二层之间包括16个卷积核,第三层和第四层之间包括32个卷积核,第六层和第七层之间包括48个卷积核,第八层和第九层之间包括32个卷积核,第十一层和第十二层之间包括64个卷积核,第十三层和第十四层之间包括48个卷积核。
进一步地,模型第三层非线性函数为tanh,第五层非线性函数为 Relu函数max(0,x),第八层非线性函数为tanh,第十层非线性函数为 sigmoid函数,第十三层非线性函数为softplus函数,第十五层非线性函数为Relu函数max(0,x)。
此外,模型第六层为最大值池化,池化核尺寸(2x2),池化核移动幅度为2,第十一层为平均值池化,池化核尺寸(2x2),池化核移动幅度为2,第十六层为最大值池化,池化核尺寸(2x2),池化核移动幅度为2。
最后,模型的第十七层为全连接层,维度为(1x1x16),其中16 表示突发事件类型和事件级别的组合数,所述第十七层的输出使用 softmax函数进行概率表示:
其中,i为突发事件类型和事件级别的组合序列数,i为1表示第一组突发事件类型和事件级别的组合,k表示大于零的自然数,用于计数,所述第十七层的输出为16维向量,每一维表示突发事件图像属于这一维的概率。
进一步地,基于模型训练单元50利用S折交叉验证来选择模型,该模型训练单元50还包括:
拆分子单元51,用于将所述样本集切分为S个互不相交的大小相同的子集;
训练子单元52,用于选择任意S-1个子集的数据训练模型,使用余下的子集测试模型;
选择子单元53,用于从多个训练子单元的训练结果中,选出平均测试误差最小的模型。
需要说明的是,本发明装置实施例具有与方法实施例相同的技术效果,在此不再重复赘述。
本发明的基于深度卷积神经网络的突发事件分级分类方法及装置,通过历史图像数据训练深度卷积神经网络来自动学习突发事件特征,进而对事件进行分级分类,辅助决策者科学客观地掌握突发事件情况。由此,此方法能够自动学习突发事件相关核心特征,节省了人力操作,解决了事件分级分类过程中的主观性和随意性。同时该方法能够得到一种通用的模型,适用于所有的突发事件场景。
应当理解,在本说明书中描述的功能单元或能力可被称为或标示为组件、模块或***,以便更具体地强调它们的实现独立。例如,组件、模块或***可被实现为硬件电路,其包括定制超大规模集成 (VLSI)电路或门阵列、现成的半导体,诸如逻辑芯片、晶体管,或其他分立组件。组件或模块还可在可编程硬件设备中实现,诸如场可编程门阵列、可编程阵列逻辑、可编程逻辑设备等。组件或模块还可以在用于由各种类型的处理器执行的软件中实现。例如,可执行代码的识别的组件或模块可以包括一个或多个物理或逻辑的计算机指令,其可以,例如,被组织为对象、程序或功能。然而,所识别的组件或模块不必在物理上定位在一起,而是可以包含存储在不同位置的全异指令,其当逻辑上接合在一起时,包含组件或模块并实现对于组件或模块的规定目的。
应该理解由本领域技术人员通过本发明能够实现的效果并不局限于在上文已特别描述的内容,并且本发明的其它优点从上面的详细描述中将更清楚地理解。
对于本领域技术人员,显然可以在不脱离本发明的精神或范围的情况下在本发明中做出各种修改和变型。因此,本发明旨在如果本发明的修改和变型落入附随权利要求和它们的等同形式的范围内,那么本发明覆盖这些修改和变型。

Claims (20)

1.一种基于深度卷积神经网络的突发事件分级分类方法,其特征在于,包括:
S1、获取预先分类的每一类突发事件的图像信息,建立突发事件图像库;
S2、针对每一类的突发事件图像库,对图像库中的每张图像进行重要性标记;
S3、从标记的突发事件图像库中选取样本集;
S4、建立深度卷积神经网络模型,所述模型的输入为突发事件原始图像,输出为突发事件分级分类向量;
S5、将样本集放入到所述深度卷积神经网络模型中进行训练,利用S折交叉验证来选择模型;
S6、将待分级分类的突发事件图像输入到选择的模型中进行计算,得到所述待分级分类的突发事件的分类分级结果。
2.根据权利要求1所述的方法,其特征在于,所述步骤S1之前还包括:
采集突发事件图像信息并进行分类。
3.根据权利要求1所述的方法,其特征在于,所述步骤S3中,按照均匀概率随机地分别从每个突发事件图像库中选取样本集。
4.根据权利要求1所述的方法,其特征在于,所述对图像库中的每张图像进行重要性标记,具体包括:
对每一类突发事件图像数据库,分别将每张图像按照事件的可控性、影响程度以及影响范围进行重要性标记,所述重要性标记包括一般、较大、重大、特别重大四个级别的重要性标记。
5.根据权利要求1所述的方法,其特征在于,所述步骤S4具体包括:
建立17层深度卷积神经网络模型,其中,第一层为输入层,输入为突发事件原始图像,第二、四、七、九、十二、十四层为卷积层,第三、五、八、十、十三、十五层为非线性变换层,第六、十一、十六层为下采样层,第十七层为全连接层,输出为突发事件分级分类向量,所述突发事件分级分类向量表示为[事件类型、事件级别]。
6.根据权利要求5所述的方法,其特征在于,所述第一层和第二层之间包括16个卷积核,第三层和第四层之间包括32个卷积核,第六层和第七层之间包括48个卷积核,第八层和第九层之间包括32个卷积核,第十一层和第十二层之间包括64个卷积核,第十三层和第十四层之间包括48个卷积核。
7.根据权利要求5所述的方法,其特征在于,第三层非线性函数为tanh,第五层非线性函数为Relu函数max(0,x),第八层非线性函数为tanh,第十层非线性函数为sigmoid函数,第十三层非线性函数为softplus函数,第十五层非线性函数为Relu函数max(0,x)。
8.根据权利要求5所述的方法,其特征在于,第六层为最大值池化,池化核尺寸(2x2),池化核移动幅度为2,第十一层为平均值池化,池化核尺寸(2x2),池化核移动幅度为2,第十六层为最大值池化,池化核尺寸(2x2),池化核移动幅度为2。
9.根据权利要求5所述的方法,其特征在于,第十七层为全连接层,维度为(1x1x16),其中16表示突发事件类型和事件级别的组合数,所述第十七层的输出使用softmax函数进行概率表示:
其中,i为突发事件类型和事件级别的组合序列数,i为1表示第一组突发事件类型和事件级别的组合,k表示大于零的自然数,用于计数,所述第十七层的输出为16维向量,每一维表示突发事件图像属于这一维的概率。
10.根据权利要求1所述的方法,其特征在于,所述步骤S5中,通过交叉熵作为目标损失函数来对所述深度卷积神经网络模型进行训练,所述目标损失函数为:
其中,yi表示图片类别的第i维真实概率值,表示经过神经网络计算得到图片类别的第i维的概率值。
11.根据权利要求1所述的方法,其特征在于,所述步骤S5中利用S折交叉验证来选择模型,具体包括:
S51、将所述样本集切分为S个互不相交的大小相同的子集;
S52、选择任意S-1个子集的数据训练模型,使用余下的子集测试模型;
S53、重复步骤S52,选出平均测试误差最小的模型。
12.一种基于深度卷积神经网络的突发事件分级分类装置,其特征在于,包括:
图像库建立单元,用于获取预先分类的每一类突发事件的图像信息,建立突发事件图像库;
标记单元,用于针对每一类的突发事件图像库,对图像库中的每张图像进行重要性标记;
样本集选取单元,用于从标记的突发事件图像库中选取样本集;
模型建立单元,用于建立深度卷积神经网络模型,所述模型的输入为突发事件原始图像,输出为突发事件分级分类向量;
模型训练单元,用于将样本集放入到所述深度卷积神经网络模型中进行训练,利用S折交叉验证来选择模型;
计算单元,用于将待分级分类的突发事件图像输入到选择的模型中进行计算,得到所述待分级分类的突发事件的分类分级结果。
13.根据权利要求12所述的装置,其特征在于,所述装置还包括:
图像采集单元,用于采集突发事件图像信息并进行分类。
14.根据权利要求12所述的装置,其特征在于,所述样本集选取单元,具体地按照均匀概率随机地分别从每个突发事件图像库中选取样本集。
15.根据权利要求12所述的装置,其特征在于,所述模型建立单元建立模型的具体为:所述深度卷积神经网络模型包括17层,其中,第一层为输入层,输入为突发事件原始图像,第二、四、七、九、十二、十四层为卷积层,第三、五、八、十、十三、十五层为非线性变换层,第六、十一、十六层为下采样层,第十七层为全连接层,输出为突发事件分级分类向量,为[事件类型、事件级别]。
16.根据权利要求15所述的装置,其特征在于,所述模型第一层和第二层之间包括16个卷积核,第三层和第四层之间包括32个卷积核,第六层和第七层之间包括48个卷积核,第八层和第九层之间包括32个卷积核,第十一层和第十二层之间包括64个卷积核,第十三层和第十四层之间包括48个卷积核。
17.根据权利要求15所述的装置,其特征在于,所述模型第三层非线性函数为tanh,第五层非线性函数为Relu函数max(0,x),第八层非线性函数为tanh,第十层非线性函数为sigmoid函数,第十三层非线性函数为softplus函数,第十五层非线性函数为Relu函数max(0,x)。
18.根据权利要求15所述的装置,其特征在于,所述模型第六层为最大值池化,池化核尺寸(2x2),池化核移动幅度为2,第十一层为平均值池化,池化核尺寸(2x2),池化核移动幅度为2,第十六层为最大值池化,池化核尺寸(2x2),池化核移动幅度为2。
19.根据权利要求15所述的装置,其特征在于,所述模型的第十七层为全连接层,维度为(1x1x16),其中16表示突发事件类型和事件级别的组合数,所述第十七层的输出使用softmax函数进行概率表示:
其中,i为突发事件类型和事件级别的组合序列数,i为1表示第一组突发事件类型和事件级别的组合,k表示大于零的自然数,用于计数,所述第十七层的输出为16维向量,每一维表示突发事件图像属于这一维的概率。
20.根据权利要求15所述的装置,其特征在于,所述模型训练单元还包括:
拆分子单元,用于将所述样本集切分为S个互不相交的大小相同的子集;
训练子单元,用于选择任意S-1个子集的数据训练模型,使用余下的子集测试模型;
选择子单元,用于从多个训练子单元的训练结果中,选出平均测试误差最小的模型。
CN201710934731.7A 2017-10-09 2017-10-09 基于深度卷积神经网络的突发事件分级分类方法及装置 Pending CN107818337A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710934731.7A CN107818337A (zh) 2017-10-09 2017-10-09 基于深度卷积神经网络的突发事件分级分类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710934731.7A CN107818337A (zh) 2017-10-09 2017-10-09 基于深度卷积神经网络的突发事件分级分类方法及装置

Publications (1)

Publication Number Publication Date
CN107818337A true CN107818337A (zh) 2018-03-20

Family

ID=61607914

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710934731.7A Pending CN107818337A (zh) 2017-10-09 2017-10-09 基于深度卷积神经网络的突发事件分级分类方法及装置

Country Status (1)

Country Link
CN (1) CN107818337A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108537792A (zh) * 2018-04-17 2018-09-14 成都思晗科技股份有限公司 一种基于卷积神经网络的电力缺陷图像识别方法
CN108566537A (zh) * 2018-05-16 2018-09-21 中国科学院计算技术研究所 用于对视频帧进行神经网络运算的图像处理装置
CN108647660A (zh) * 2018-05-16 2018-10-12 中国科学院计算技术研究所 一种使用神经网络芯片处理图像的方法
CN108921012A (zh) * 2018-05-16 2018-11-30 中国科学院计算技术研究所 一种利用人工智能芯片处理图像视频帧的方法
CN109359829A (zh) * 2018-09-26 2019-02-19 全球能源互联网研究院有限公司 基于历史大数据的电力突发事件辅助决策方法及***
CN111881303A (zh) * 2020-07-28 2020-11-03 内蒙古众城信息科技有限公司 一种城市异构节点分类的图网络结构方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106778657A (zh) * 2016-12-28 2017-05-31 南京邮电大学 基于卷积神经网络的新生儿疼痛表情分类方法
CN106803069A (zh) * 2016-12-29 2017-06-06 南京邮电大学 基于深度学习的人群高兴程度识别方法
CN106874928A (zh) * 2016-12-28 2017-06-20 中国科学院长春光学精密机械与物理研究所 跟踪目标突发关键事件自动判决方法及***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106778657A (zh) * 2016-12-28 2017-05-31 南京邮电大学 基于卷积神经网络的新生儿疼痛表情分类方法
CN106874928A (zh) * 2016-12-28 2017-06-20 中国科学院长春光学精密机械与物理研究所 跟踪目标突发关键事件自动判决方法及***
CN106803069A (zh) * 2016-12-29 2017-06-06 南京邮电大学 基于深度学习的人群高兴程度识别方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108537792A (zh) * 2018-04-17 2018-09-14 成都思晗科技股份有限公司 一种基于卷积神经网络的电力缺陷图像识别方法
CN108537792B (zh) * 2018-04-17 2021-09-17 成都思晗科技股份有限公司 一种基于卷积神经网络的电力缺陷图像识别方法
CN108566537A (zh) * 2018-05-16 2018-09-21 中国科学院计算技术研究所 用于对视频帧进行神经网络运算的图像处理装置
CN108647660A (zh) * 2018-05-16 2018-10-12 中国科学院计算技术研究所 一种使用神经网络芯片处理图像的方法
CN108921012A (zh) * 2018-05-16 2018-11-30 中国科学院计算技术研究所 一种利用人工智能芯片处理图像视频帧的方法
CN109359829A (zh) * 2018-09-26 2019-02-19 全球能源互联网研究院有限公司 基于历史大数据的电力突发事件辅助决策方法及***
CN111881303A (zh) * 2020-07-28 2020-11-03 内蒙古众城信息科技有限公司 一种城市异构节点分类的图网络结构方法

Similar Documents

Publication Publication Date Title
CN107818337A (zh) 基于深度卷积神经网络的突发事件分级分类方法及装置
CN104850890B (zh) 基于实例学习和Sadowsky分布的卷积神经网络参数调整方法
Asadi et al. A new hybrid artificial neural networks for rainfall–runoff process modeling
Anisseh et al. Fuzzy extension of TOPSIS model for group decision making under multiple criteria
CN107742107A (zh) 人脸图像分类方法、装置及服务器
CN106991374A (zh) 基于卷积神经网络和随机森林的手写数字识别方法
CN106326984A (zh) 用户意图识别方法和装置、自动应答***
CN112231562A (zh) 一种网络谣言识别方法及***
CN107909421A (zh) 一种基于用户空间的多gru层神经网络的隐含反馈推荐方法及***
CN106934352A (zh) 一种基于双路分形网络和lstm的视频描述方法
CN107066759A (zh) 一种汽轮机转子振动故障诊断方法及装置
CN107067182A (zh) 面向多维意象的产品设计方案评估方法
CN108492290A (zh) 图像评价方法及***
Karande et al. A facility layout selection model using MACBETH method
CN113538125A (zh) 一种基于萤火虫算法优化Hopfield神经网络的风险评级方法
CN106408120B (zh) 一种局部区域滑坡预测装置及方法
CN103324758B (zh) 一种新闻分类方法和***
CN107633293A (zh) 一种领域自适应方法及装置
CN112487291A (zh) 一种基于大数据的个性化新闻推荐方法及装置
CN106777359A (zh) 一种基于受限玻尔兹曼机的文本业务推荐方法
Sheikhian et al. A GIS‐based multi‐criteria seismic vulnerability assessment using the integration of granular computing rule extraction and artificial neural networks
CN113849613A (zh) 一种食品安全问答推理方法、***及电子设备
CN111949894B (zh) 一种基于多空间交互的协同过滤个性化推荐方法
CN115861306B (zh) 一种基于自监督拼图模块的工业品异常检测方法
CN111967949A (zh) 基于Leaky-Conv & Cross安全课程推荐引擎排序算法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180320