CN113743605A - 基于进化方法搜索烟、火检测网络架构的方法 - Google Patents
基于进化方法搜索烟、火检测网络架构的方法 Download PDFInfo
- Publication number
- CN113743605A CN113743605A CN202111016458.2A CN202111016458A CN113743605A CN 113743605 A CN113743605 A CN 113743605A CN 202111016458 A CN202111016458 A CN 202111016458A CN 113743605 A CN113743605 A CN 113743605A
- Authority
- CN
- China
- Prior art keywords
- network
- layers
- smoke
- expressed
- options
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 18
- 239000000779 smoke Substances 0.000 title claims abstract description 13
- 238000001514 detection method Methods 0.000 title claims abstract description 10
- 238000011156 evaluation Methods 0.000 claims abstract description 21
- 230000009471 action Effects 0.000 claims abstract description 12
- 238000005457 optimization Methods 0.000 claims abstract description 6
- 238000012795 verification Methods 0.000 claims abstract description 5
- 230000035772 mutation Effects 0.000 claims description 9
- 230000000694 effects Effects 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 206010027175 memory impairment Diseases 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/086—Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Physiology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于进化方法搜索烟、火检测网络架构的方法,包括actor和critic两部分。actor根据奖惩信息调节不同状态下采取各种动作的概率。首先用计算图表达网络结构,并进一步将层、层的连接及层内的操作用编码表示。然后将颜色、纹理和轮廓子网络做为初始种群,开始按选择、繁殖、变异、更新、优化步骤迭代进化。使用critic评估网络来做准确率预测器,输入为网络结构的变长字符串描述,输出预测的验证精度。这个方法探索烟、火检测的网络结构,同时采用进化算法限制探索空间,提高优化效率。
Description
技术领域
本发明涉及烟雾识别技术领域,具体涉及一种搜索火灾烟雾检测深度网络架构的方法。
背景技术
火灾预警一直是消防安全领域的重要课题。火灾发生前期通常会产生大量烟雾。如果能够及时地检测到烟雾,就可以提供更早的火灾预警,减少人员伤亡和财产损失。传统的烟雾检测方法通常基于颜色、纹理、形状、运动等特征,取得了一定的成果,但在实际应用中仍然存在问题,往往在某些场合有效,而换了应用场景效果欠佳。这主要在于烟雾的静态特征如颜色、纹理等受天气、光照、时间等影响变化范围太大,而动态特征如背景建模或者帧间差分通常基于阈值,阈值对检测结果影响较大。
近些年来,深度神经网络在人脸识别、图像分类等方面取得了突破性进展。深度神经网络以原始图像作为输入,通过组合浅层特征形成更加抽象的高层特征,可以发现数据深层次的分布式特征,避免人工提取特征工作的繁复冗杂。但是网络架构设计中,需要消耗大量的人力和时间,而且由于人在探索时缺乏明确的理论指导,以及人的健忘、易疲倦和情绪化等因素,因此尝试将网络架构搜索的任务转移给机器来自动完成。
发明内容
为解决上述问题,本发明提供了针对烟、火检测的卷积网络,采用强化学习探索优化结构,同时采用进化算法限制探索空间,提高优化效率。
本发明通过以下技术方案予以实现:
建立一个智能代理,可以往初始架构中添加层、连接和修改参数,生成新的网络架构状态,并评价网络架构。这其实是个强化学习过程,包括actor和critic两部分。actor根据奖惩信息调节不同状态下采取各种动作的概率,如下式
πθ(s,a)=P(a|s,θ)≈π(a|s) (1)
式中π是策略,s是网络状态,θ是策略网络的参数。critic是以损失函数为基础的评估网络,包括状态s价值和动作a价值,如下式
其中w为目标网络的参数。
首先actor根据策略选择动作ai与环境进行交互,当前状态st执行动作ai后反馈一个奖励值rt并移动到下个状态st+1。actor将环境的状态转换存储到经验回放池,然后小批量采样。critic会根据动作值函数进行评估,将评估结果反馈给当前评价网络,并计算评价网络梯度更新。另一方面,critic将评估结果传到actor中用于更新策略网络参数。最后更新actor和critic生成的目标网络。
目标网络的进化步骤主要包括网络编码、搜索策略和性能评估。搜索策略由actor网络负责,性能评估由critic网络负责。
(1)网络编码
采用计算图表达网络结构,并进一步将层、层的连接及层内的操作用编码表示。暂定网络最多35层;每层可能是卷积、批正则化、激活、池化、dropout、连接等操作中的一种;由于每层的类型不同,其操作、选项和连接不同。因此把每层表达为3个属性,连接和操作,因此105位的编码可以表示网络。操作用6个选项的编码表示,操作选项用9个选项的编码表示,连接用34个选项的编码表示。
(2)搜索策略
将颜色、纹理和轮廓子网络做为初始种群,开始按以下步骤迭代进化。
选择:从种群中随机选择k个个体,然后按性能对k个个体进行排序,并以概率p选择最佳个体,而次优个体的概率为p×(1-p)。
繁殖:每两个个体繁殖出一个新的后代。父母网络可以通过一个点或多点交叉进行组合。
变异:预定义一组突变运算符,包括更改操作、选项和连接。突变可能探索更多新颖的结构并确保种群的多样性。
更新:在种群中随机选择两个个体,将较差的个体从种群中剔除。
优化:建立目标函数的概率模型,然后使用该模型选择最优的超参数,最后对真实的目标函数评估所选的超参数。
(3)性能评估
使用critic评估网络来做准确率预测器,输入为网络结构的变长字符串描述,输出预测的验证精度。也正是有个这个利器,使得它里边提出方法即使用看起来并不复杂的启发式搜索,也能达到很好的效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中的处理流程示意图;
图2网络进化流程。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
建立一个智能代理,可以往初始架构中添加层、连接和修改参数,生成新的网络架构状态,并评价网络架构。这包括actor和critic两部分。actor根据奖惩信息调节不同状态下采取各种动作的概率,如下式
πθ(s,a)=P(a|s,θ)≈π(a|s) (1)
式中π是策略,s是网络状态,θ是策略网络的参数。critic是以损失函数为基础的评估网络,包括状态s价值和动作a价值,如下式
其中w为目标网络的参数。
搜索策略如图1所示。首先actor根据策略选择动作ai与环境进行交互,当前状态st执行动作ai后反馈一个奖励值rt并移动到下个状态st+1。actor将环境的状态转换存储到经验回放池,然后小批量采样。critic会根据动作值函数进行评估,将评估结果反馈给当前评价网络,并计算评价网络梯度更新。另一方面,critic将评估结果传到actor中用于更新策略网络参数。最后更新actor和critic生成的目标网络。
目标网络的进化步骤如图2所示,主要包括网络编码、搜索策略和性能评估。搜索策略由actor网络负责,性能评估由critic网络负责。
(1)网络编码
采用计算图表达网络结构,并进一步将层、层的连接及层内的操作用编码表示。暂定网络最多35层;每层可能是卷积、批正则化、激活、池化、dropout、连接等操作中的一种;由于每层的类型不同,其操作、选项和连接不同。因此把每层表达为3个属性,连接和操作,因此105位的编码可以表示网络。操作用6个选项的编码表示,操作选项用9个选项的编码表示,连接用34个选项的编码表示。
(2)搜索策略
将颜色、纹理和轮廓子网络做为初始种群,开始按以下步骤迭代进化。
选择:从种群中随机选择k个个体,然后按性能对k个个体进行排序,并以概率p选择最佳个体,而次优个体的概率为p×(1-p)。
繁殖:每两个个体繁殖出一个新的后代。父母网络可以通过一个点或多点交叉进行组合。
变异:预定义一组突变运算符,包括更改操作、选项和连接。突变可能探索更多新颖的结构并确保种群的多样性。
更新:在种群中随机选择两个个体,将较差的个体从种群中剔除。
优化:建立目标函数的概率模型,然后使用该模型选择最优的超参数,最后对真实的目标函数评估所选的超参数。
(3)性能评估
使用critic评估网络来做准确率预测器,输入为网络结构的变长字符串描述,输出预测的验证精度。也正是有个这个利器,使得它里边提出方法即使用看起来并不复杂的启发式搜索,也能达到很好的效果。
Claims (4)
1.一种基于进化方法搜索烟、火检测网络架构的方法,包括actor和critic两部分。actor根据奖惩信息调节不同状态下采取各种动作的概率。首先用计算图表达网络结构,并进一步将层、层的连接及层内的操作用编码表示。然后将颜色、纹理和轮廓子网络做为初始种群,开始按选择、繁殖、变异、更新、优化步骤迭代进化。使用critic评估网络来做准确率预测器,输入为网络结构的变长字符串描述,输出预测的验证精度。这个方法探索烟、火检测的网络结构,同时采用进化算法限制探索空间,提高优化效率。
2.根据权利要求1,其所提到的采用计算图表达网络结构,并进一步将层、层的连接及层内的操作用编码表示;每层可能是卷积、批正则化、激活、池化、dropout、连接等操作中的一种;由于每层的类型不同,其操作、选项和连接不同,因此把每层表达为3个属性,连接和操作,因此105位的编码可以表示网络;操作用6个选项的编码表示,操作选项用9个选项的编码表示,连接用34个选项的编码表示。
3.根据权利要求1,将颜色、纹理和轮廓子网络做为初始种群,开始按以下步骤迭代进化。
选择:从种群中随机选择k个个体,然后按性能对k个个体进行排序,并以概率p选择最佳个体,而次优个体的概率为p×(1-p)。
繁殖:每两个个体繁殖出一个新的后代。父母网络可以通过一个点或多点交叉进行组合。
变异:预定义一组突变运算符,包括更改操作、选项和连接。突变可能探索更多新颖的结构并确保种群的多样性。
更新:在种群中随机选择两个个体,将较差的个体从种群中剔除。
优化:建立目标函数的概率模型,然后使用该模型选择最优的超参数,最后对真实的目标函数评估所选的超参数。
4.根据权利要求1,使用critic评估网络来做准确率预测器,输入为网络结构的变长字符串描述,输出预测的验证精度。也正是有个这个利器,使得它里边提出方法即使用看起来并不复杂的启发式搜索,也能达到很好的效果。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2021106652600 | 2021-06-16 | ||
CN202110665260 | 2021-06-16 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113743605A true CN113743605A (zh) | 2021-12-03 |
Family
ID=78734461
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111016458.2A Pending CN113743605A (zh) | 2021-06-16 | 2021-08-31 | 基于进化方法搜索烟、火检测网络架构的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113743605A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115471993A (zh) * | 2022-07-06 | 2022-12-13 | 江苏科技大学 | 基于imode分层进化算法的火警管理水平评估方法及*** |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020174079A1 (en) * | 1999-09-01 | 2002-11-21 | Keith E. Mathias | Method for improving neural network architectures using evolutionary algorithms |
CN107749067A (zh) * | 2017-09-13 | 2018-03-02 | 华侨大学 | 基于运动特性和卷积神经网络的火灾烟雾检测方法 |
US20180114116A1 (en) * | 2016-10-26 | 2018-04-26 | Sentient Technologies (Barbados) Limited | Cooperative evolution of deep neural network structures |
CN108334949A (zh) * | 2018-02-11 | 2018-07-27 | 浙江工业大学 | 一种优化深度卷积神经网络结构的快速进化方法 |
CN109068391A (zh) * | 2018-09-27 | 2018-12-21 | 青岛智能产业技术研究院 | 基于边缘计算和Actor-Critic算法的车联网通信优化算法 |
US20190080240A1 (en) * | 2017-09-08 | 2019-03-14 | SparkCognition, Inc. | Execution of a genetic algorithm with variable evolutionary weights of topological parameters for neural network generation and training |
CN110516573A (zh) * | 2019-08-19 | 2019-11-29 | 温州大学 | 结合颜色、纹理特征的两阶段烟雾识别卷积神经网络 |
CN110659721A (zh) * | 2019-08-02 | 2020-01-07 | 浙江省北大信息技术高等研究院 | 一种目标检测网络的构建方法和*** |
CN112116671A (zh) * | 2020-09-05 | 2020-12-22 | 温州大学 | 注意力机制降低烟、火监测计算量的方法及电子设备 |
CN112148008A (zh) * | 2020-09-18 | 2020-12-29 | 中国航空无线电电子研究所 | 一种基于深度强化学习的实时无人机路径预测方法 |
CN112465120A (zh) * | 2020-12-08 | 2021-03-09 | 上海悠络客电子科技股份有限公司 | 一种基于进化方法的快速注意力神经网络架构搜索方法 |
US20210110276A1 (en) * | 2019-10-15 | 2021-04-15 | Beijing Xiaomi Intelligent Technology Co., Ltd. | Search method, device and storage medium for neural network model structure |
CN112749644A (zh) * | 2020-12-30 | 2021-05-04 | 大连海事大学 | 一种基于改进可变形卷积的Faster RCNN火灾烟雾检测方法 |
CN112766179A (zh) * | 2021-01-22 | 2021-05-07 | 郑州轻工业大学 | 一种基于运动特征混合深度网络的火灾烟雾检测方法 |
CN115879315A (zh) * | 2022-12-29 | 2023-03-31 | 东南大学 | 基于对抗强化学习的人群紧急疏散机器人模型 |
-
2021
- 2021-08-31 CN CN202111016458.2A patent/CN113743605A/zh active Pending
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020174079A1 (en) * | 1999-09-01 | 2002-11-21 | Keith E. Mathias | Method for improving neural network architectures using evolutionary algorithms |
US20180114116A1 (en) * | 2016-10-26 | 2018-04-26 | Sentient Technologies (Barbados) Limited | Cooperative evolution of deep neural network structures |
US20190080240A1 (en) * | 2017-09-08 | 2019-03-14 | SparkCognition, Inc. | Execution of a genetic algorithm with variable evolutionary weights of topological parameters for neural network generation and training |
CN107749067A (zh) * | 2017-09-13 | 2018-03-02 | 华侨大学 | 基于运动特性和卷积神经网络的火灾烟雾检测方法 |
CN108334949A (zh) * | 2018-02-11 | 2018-07-27 | 浙江工业大学 | 一种优化深度卷积神经网络结构的快速进化方法 |
CN109068391A (zh) * | 2018-09-27 | 2018-12-21 | 青岛智能产业技术研究院 | 基于边缘计算和Actor-Critic算法的车联网通信优化算法 |
CN110659721A (zh) * | 2019-08-02 | 2020-01-07 | 浙江省北大信息技术高等研究院 | 一种目标检测网络的构建方法和*** |
CN110516573A (zh) * | 2019-08-19 | 2019-11-29 | 温州大学 | 结合颜色、纹理特征的两阶段烟雾识别卷积神经网络 |
US20210110276A1 (en) * | 2019-10-15 | 2021-04-15 | Beijing Xiaomi Intelligent Technology Co., Ltd. | Search method, device and storage medium for neural network model structure |
CN112116671A (zh) * | 2020-09-05 | 2020-12-22 | 温州大学 | 注意力机制降低烟、火监测计算量的方法及电子设备 |
CN112148008A (zh) * | 2020-09-18 | 2020-12-29 | 中国航空无线电电子研究所 | 一种基于深度强化学习的实时无人机路径预测方法 |
CN112465120A (zh) * | 2020-12-08 | 2021-03-09 | 上海悠络客电子科技股份有限公司 | 一种基于进化方法的快速注意力神经网络架构搜索方法 |
CN112749644A (zh) * | 2020-12-30 | 2021-05-04 | 大连海事大学 | 一种基于改进可变形卷积的Faster RCNN火灾烟雾检测方法 |
CN112766179A (zh) * | 2021-01-22 | 2021-05-07 | 郑州轻工业大学 | 一种基于运动特征混合深度网络的火灾烟雾检测方法 |
CN115879315A (zh) * | 2022-12-29 | 2023-03-31 | 东南大学 | 基于对抗强化学习的人群紧急疏散机器人模型 |
Non-Patent Citations (1)
Title |
---|
章鹏;刘全;钟珊;翟建伟;钱炜晟;: "增量式双自然策略梯度的行动者评论家算法", 通信学报, no. 04 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115471993A (zh) * | 2022-07-06 | 2022-12-13 | 江苏科技大学 | 基于imode分层进化算法的火警管理水平评估方法及*** |
CN115471993B (zh) * | 2022-07-06 | 2023-09-26 | 江苏科技大学 | 基于imode分层进化算法的火警管理水平评估方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111079561B (zh) | 一种基于虚拟训练的机器人智能抓取方法 | |
CN110598598A (zh) | 基于有限样本集的双流卷积神经网络人体行为识别方法 | |
CN110782015A (zh) | 神经网络的网络结构优化器的训练方法、装置及存储介质 | |
CN108334949A (zh) | 一种优化深度卷积神经网络结构的快速进化方法 | |
Bhanu et al. | Adaptive image segmentation using genetic and hybrid search methods | |
CN111652357B (zh) | 一种利用基于图的特定目标网络解决视频问答问题的方法及其*** | |
CN111429415B (zh) | 基于网络协同剪枝的产品表面缺陷高效检测模型构建方法 | |
CN106503654A (zh) | 一种基于深度稀疏自编码网络的人脸情感识别方法 | |
CN107862275A (zh) | 人体行为识别模型及其构建方法和人体行为识别方法 | |
CN110322445B (zh) | 基于最大化预测和标签间相关性损失函数的语义分割方法 | |
CN114373101A (zh) | 基于进化策略的神经网络架构搜索的图像分类方法 | |
CN108573246A (zh) | 一种基于深度学习的时序动作识别方法 | |
CN111753207B (zh) | 一种基于评论的神经图协同过滤方法 | |
CN115064020B (zh) | 基于数字孪生技术的智慧教学方法、***及存储介质 | |
CN112634019A (zh) | 基于细菌觅食算法优化灰色神经网络的违约概率预测方法 | |
CN116015967B (zh) | 基于改进鲸鱼算法优化delm的工业互联网入侵检测方法 | |
CN110889560A (zh) | 一种具有深度可解释性的快递序列预测的方法 | |
CN113888638A (zh) | 一种基于注意力机制的图神经网络行人轨迹预测方法 | |
CN113743605A (zh) | 基于进化方法搜索烟、火检测网络架构的方法 | |
CN115203550A (zh) | 一种增强邻居关系的社交推荐方法及*** | |
CN117743719B (zh) | 一种页面元素的识别方法 | |
CN111160327B (zh) | 一种基于轻量化卷积神经网络的表情识别方法 | |
CN112215346A (zh) | 一种类人通用人工智能的实现方法 | |
CN116311454A (zh) | 一种多线索关联学习的面部表情识别方法及*** | |
CN111523361A (zh) | 一种人体行为识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |