CN113627528A - 一种基于人眼视觉深度学习的国画所属画家自动识别方法 - Google Patents
一种基于人眼视觉深度学习的国画所属画家自动识别方法 Download PDFInfo
- Publication number
- CN113627528A CN113627528A CN202110917411.7A CN202110917411A CN113627528A CN 113627528 A CN113627528 A CN 113627528A CN 202110917411 A CN202110917411 A CN 202110917411A CN 113627528 A CN113627528 A CN 113627528A
- Authority
- CN
- China
- Prior art keywords
- chinese painting
- pixel value
- visual
- painter
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010422 painting Methods 0.000 title claims abstract description 122
- 230000000007 visual effect Effects 0.000 title claims abstract description 58
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000013135 deep learning Methods 0.000 title claims abstract description 11
- 238000012545 processing Methods 0.000 claims abstract description 51
- 230000000694 effects Effects 0.000 claims abstract description 38
- 238000012549 training Methods 0.000 claims abstract description 19
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 13
- 230000008447 perception Effects 0.000 claims abstract description 11
- 230000010365 information processing Effects 0.000 claims abstract description 6
- 239000000523 sample Substances 0.000 claims description 62
- 230000006870 function Effects 0.000 claims description 24
- 238000001914 filtration Methods 0.000 claims description 20
- 238000011176 pooling Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 11
- 230000004913 activation Effects 0.000 claims description 9
- 230000009466 transformation Effects 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 8
- 238000007781 pre-processing Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 6
- 230000035945 sensitivity Effects 0.000 claims description 6
- 239000012468 concentrated sample Substances 0.000 claims description 5
- 238000009877 rendering Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 2
- 230000007246 mechanism Effects 0.000 abstract description 2
- 239000000284 extract Substances 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 240000005373 Panax quinquefolius Species 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000005477 standard model Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/10—Image enhancement or restoration using non-spatial domain filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/90—Dynamic range modification of images or parts thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20024—Filtering details
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20048—Transform domain processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于人眼视觉深度学习的国画所属画家自动识别方法,涉及基于视觉处理机制的深度学习在艺术领域的应用,该方法对样本数据集中的每副国画样本进行视觉前端显著性处理提取得到视觉显著图后,基于每个像素点及其邻域像素点的像素值关系进行视觉后端感知信息处理得到有序风格效果图,以每副幅国画样本处理得到的有序风格效果图为输入、对应的画家为输出,利用样本数据集基于卷积神经网络进行模型训练得到画家识别模型,然后利用画家识别模型即可以识别得到待识别国画所属的画家,该方法充分考虑了人眼视觉的感知特性和观赏者的主观判断经验,相比于现有的各种识别方法来说,提高了自动识别的准确率,和观赏者判断的结果高度一致。
Description
技术领域
本发明涉及基于视觉处理机制的深度学习在艺术领域的应用,尤其是一种基于人眼视觉深度学习的国画所属画家自动识别方法。
背景技术
随着生活水平的提高,人们对精神生活的追求越来越高,其中对中国画的鉴赏需求也逐步提高。网络或者数字博物馆中出现了大量的数字中国画,但如何高效地利用、管理这些画作成为亟待解决的问题。因此,对中国画艺术风格及其作者进行自动分类识别的研究具有很大的实用价值。在中国画特征提取及分类这一领域,已有的相关研究。Li等设计了相关算法分类沈周、唐寅、张大千等画家的画作,但是不能全面地描述画作信息,且其对其他重要信息的忽略导致分类结果并不理想。Jiang等对工笔、写意2类中国画提取颜色特征和纹理特征,采用支持向量机(support vector machine,SVM)进行分类。陈俊杰等对山水和花鸟类中国画进行颜色、形状等方面的特征提取,并采用SVM进行分类。Sun等提出用蒙特卡罗凸包模型进行特征选择,并针对中国画作者分类。刘晓巍等通过图像颜色板熵、冗余度、有序度、复杂度等4个特征对不同的画派进行区分,但是该算法仅提取了颜色相关的特征,未考虑其他特征对分类的影响。王征等提出监督式异构稀疏特征选择算法进行特征筛选并对中国画作者分类。Sheng等提出了Fusion算法,以信息熵整合整体特征和局部特征的分类结果,并利用3层小波变换的方法提取纹理特征用于中国画分类。现有文献采用传统特征提取方法提取中国画的特征,其获取的特征较为单一和片面。此外,陆等人利用神经网络提取中国画特征,Tenenbaum等提出了嵌入式机器学习的特征识别方法,李玉芝等使用卷积神经网络(CNN)提取国画视觉特征,采用改进嵌入式学习算法对国画艺术家作品进行分类,张佳婧等采用了人工评估与回归分析策略。
目前国画的特征提取及自动识别仍旧存在如下问题:1)国画体征提取方法都是基于图像像素域内的各种数学建模算法,没有考虑观赏者的人眼感知特性和主观判断经验,使得各种方法的自动识别准确率不高,和观赏者判断的结果存在较大的差距;2)对国画图像质量要求较高,任何的噪声污染和人为的干预,都会使得现有方法的性能下降或者失效。
发明内容
本发明人针对上述问题及技术需求,提出了一种基于人眼视觉深度学习的国画所属画家自动识别方法,本发明的技术方案如下:
一种基于人眼视觉深度学习的国画所属画家自动识别方法,该方法包括:
构建样本数据集,样本数据集中包括属于若干个不同的画家的若干幅国画样本;
对样本数据集中的每副国画样本进行视觉前端显著性处理提取得到视觉显著图;
基于每个像素点及其邻域像素点的像素值关系对视觉显著图进行视觉后端感知信息处理得到有序风格效果图;
以每副幅国画样本处理得到的有序风格效果图为输入、对应的画家为输出,利用样本数据集基于卷积神经网络进行模型训练得到画家识别模型;
提取待识别国画的有序风格效果图并输入画家识别模型,输出识别得到的待识别国画所属的画家。
其进一步的技术方案为,样本数据集中的国画样本包括原始国画以及对原始国画做图像预处理后模拟得到的有损国画,图像预处理包括亮度增强、色彩渲染、对比度增强、高斯污染、随机亮度改变、锐度处理、图像旋转、图像翻转中的至少一种。
其进一步的技术方案为,对样本数据集中的每副国画样本进行视觉前端显著性处理提取得到视觉显著图,包括对于每副国画样本:
对国画样本进行基于视觉的阈值滤波处理;
对完成阈值滤波处理后的国画样本进行频域光强的对数变换;
利用SDSP提取算法对变换后的国画样本进行特征提取得到视觉显著图。
其进一步的技术方案为,对国画样本进行基于视觉的阈值滤波处理,包括:
根据视觉对比度敏感阈值CSF(1)、视觉中央凹函数τ(i,j)和视觉阈值δ对国画样本中任意坐标(i,j)处的像素点的像素值y(i,j)进行阈值滤波处理,得到阈值滤波处理后的像素值z(i,j)为:
其中,视觉对比度敏感阈值为:
CSF(1)=2.6[0.0192+λ·2-1·r·v·tan(0.50)]exp{-[λ·2-1·r·v·tan(0.50)]1.1};
其中,r为分辨率参数,v为视距参数,λ为第一调节参数,dt为第二调节参数,d(i,j)是国画样本中坐标(i,j)的像素点与样本图像中心之间的距离,d0是国画样本的样本图像中心到图像边缘的距离。
其进一步的技术方案为,对完成阈值滤波处理后的国画样本进行频域光强的对数变换,包括:
对于完成阈值滤波处理后的国画样本中任意坐标(i,j)处的像素点的像素值z(i,j),进行频域光强的对数变换后的结果为:
其中,函数F(·)表示进行频域正变换处理,F-1(·)表示进行频域逆变换处理,G(ω,θj)为log-Gabor滤波器。
其进一步的技术方案为,基于每个像素点及其邻域像素点的像素值关系对视觉显著图进行视觉后端感知信息处理得到有序风格效果图,包括:
计算坐标(i,j)处的像素点的像素值t(i,j)与其邻域像素点的像素值tk(i,j)之间的互信息;
基于像素值t(i,j)与各个邻域像素点的像素值之间的互信息,获得坐标(i,j)处的像素点在有序风格效果图中的像素值Q(i,j)。
其进一步的技术方案为,像素值t(i,j)与与其邻域像素点的像素值tk(i,j)之间的互信息为:
I[t(i,j),tk(i,j)]=logp[t(i,j)/tk(i.j)]-logp[t(i,j)];
其中,p[t(i,j)]为像素值t(i,j)的统计概率,p[t(i,j)/tk(i,j)]为像素值t(i,j)与邻域像素值tk(i,j)的统计条件概率,log表示对数运算。
其进一步的技术方案为,坐标(i,j)处的像素点在有序风格效果图中的像素值Q(i,j)为:
其中,T(i,j)为坐标(i,j)处的像素点的所有邻域像素点的像素值构成的邻域像素值集合,Cl是邻域像素值tl(i,j)对应的归一化系数且有ω(i,j)为高斯权重函数,M×N为T(i,j)的窗口尺寸,I[t(i,j),tl(i,j)]为像素值t(i,j)与邻域像素值tl(i,j)之间的互信息,tk(i,j)表示T(i,j)中的任意一个邻域像素点的像素值。
其进一步的技术方案为,在训练得到画家识别模型时:
按照对每副幅国画样本处理得到的有序风格效果图进行归一化处理,以每副幅国画样本的归一化处理后的有序风格效果图为输入、对应的画家为输出,利用样本数据集基于卷积神经网络进行模型训练得到画家识别模型,其中,Q(i,j)是有序风格效果图中的像素值。
其进一步的技术方案为,用于训练得到画家识别模型的卷积神经网络包括五个卷积模块和三层全连接层,每个卷积模块分别包括卷积层、激活函数和池化层,每个卷积模块中的激活函数均为ReLU,每层池化层的池化函数为最大池化,每个全连接层的激活函数均为ReLU;
输出识别得到的待识别国画所属的画家,包括:
输出待识别国画属于各个候选画家的预测概率,并将预测概率最大的候选画家作为待识别国画所属的画家,候选画家是样本数据集中的国画样本所属的各个画家。
本发明的有益技术效果是:
本申请公开了一种基于人眼视觉深度学习的国画所属画家自动识别方法,方法充分考虑了人眼视觉的感知特性和观赏者的主观判断经验,相比于现有的各种识别方法来说,大大提高了自动识别的准确率,和观赏者判断的结果高度一致。而且该方法在各种噪声污染和人为干预情况下仍旧保持较高的识别准确率。
附图说明
图1是本申请公开的国画所属画家自动识别方法的流程示意图。
图2是对一副国画样本进行视觉前端显著性处理后提取得到的视觉显著图。
图3是对图2所示的视觉显著图进行视觉后端感知信息处理得到有序风格效果图。
具体实施方式
下面结合附图对本发明的具体实施方式做进一步说明。
本申请公开了一种基于人眼视觉深度学习的国画所属画家自动识别方法,请参考图1所示的流程图,该方法包括如下步骤:
步骤1,构建样本数据集,样本数据集中包括属于若干个不同的画家的若干幅国画样本。本申请中的样本数据集中的国画样本包括原始国画以及对原始国画做图像预处理后模拟得到的有损国画,通过图像预处理可以模拟拟时代变迁、技术性修复以及观赏方式等因素对国画造成的影响。图像预处理包括亮度增强、色彩渲染、对比度增强、高斯污染、随机亮度改变、锐度处理、图像旋转、图像翻转中的至少一种,图像旋转处理包括任意角度的旋转,比较典型的包括顺/逆时针90°或180°或270°旋转,翻转包括左右反转和/或上下翻转。实际采取的图像预处理包括上述一种或多种处理手段,比如可以对原始国家进行逆时针90°旋转+上下翻转得到有损国画,其他组合方式可以以此类推。
原始国画的来源较多,比如本申请在一个实测实验中,从国家各级相关部门博物馆、雅昌艺术网、Flickr网络下载集中途径中获取原始国画并做相关处理,得到属于5位画家,每位画家包括原始国画以及有损国画600幅,构建形成共计包含3000幅国画样本的样本数据集。
步骤2,对样本数据集中的每副国画样本进行视觉前端显著性处理提取得到视觉显著图。包括:
(1)对国画样本进行基于视觉的阈值滤波处理,具体的,根据视觉对比度敏感阈值CSF(1)、视觉中央凹函数τ(i,j)和视觉阈值δ对国画样本中任意坐标(i,j)处的像素点的像素值y(i,j)进行阈值滤波处理,得到阈值滤波处理后的像素值z(i,j)为:
其中,视觉对比度敏感阈值为:
CSF(1)=2.6[0.0192+λ·2-1·r·v·tan(0.50)]exp{-[λ·2-1·r·v·tan(0.50)]1.1};
其中,r为分辨率参数,v为视距参数,根据主观测试条件,取r=96(pixels/inch),v=19.1(inch),pixels表示图像的单位为像素,inch表示长度单位为英寸。λ为第一调节参数。作为优选,取λ=0.228。
作为优选,取视觉阈值δ=6.0。
(2)对完成阈值滤波处理后的国画样本进行频域光强的对数变换,对于完成阈值滤波处理后的国画样本中任意坐标(i,j)处的像素点的像素值z(i,j),进行频域光强的对数变换后的结果为:
其中,函数F(·)表示进行频域正变换处理,F-1(·)表示进行频域逆变换处理,G(ω,θj)为log-Gabor滤波器。
步骤3,基于每个像素点及其邻域像素点的像素值关系对视觉显著图进行视觉后端感知信息处理得到有序风格效果图。包括:
(1)计算像素值t(i,j)与其邻域像素点tk(i,j)之间的互信息。具体的,像素值t(i,j)与与其邻域像素点的像素值tk(i,j)之间的互信息为:
I[t(i,j),tk(i,j)]=logp[t(i,j)/tk(i.j)]-logp[t(i,j)]。
其中,p[t(i,j)]为像素值t(i,j)的统计概率,p[t(i,j)/tk(i,j)]为像素值t(i,j)与邻域像素值tk(i,j)的统计条件概率,log表示对数运算。
(2)基于像素值t(i,j)与各个邻域像素点的像素值之间的互信息,获得坐标(i,j)处的像素点在有序风格效果图中的像素值Q(i,j)。具体的,坐标(i,j)处的像素点在所述有序风格效果图中的像素值Q(i,j)为:
其中,T(i,j)为坐标(i,j)处的像素点的所有邻域像素点的像素值构成的邻域像素值集合,Cl是邻域像素值tl(i,j)对应的归一化系数且有ω(i,j)为高斯权重函数,M×N为T(i,j)的窗口尺寸,I[t(i,j),tl(i,j)]为像素值t(i,j)与邻域像素值tl(i,j)之间的互信息,tk(i,j)表示T(i,j)中的任意一个邻域像素点的像素值,也即tk(i,j)∈T(i,j)。
作为优选,M×N=16×16。
比如,对一副国画样本进行视觉前端显著性处理提取得到视觉显著图如图2所示,继续进行视觉后端感知信息处理得到的有序风格效果图如图3所示。
步骤4,以每副幅国画样本处理得到的有序风格效果图为输入、对应的画家为输出,利用样本数据集基于卷积神经网络进行模型训练得到画家识别模型。
然后以每副幅国画样本的归一化处理后的有序风格效果图为输入、对应的画家为输出,利用样本数据集基于卷积神经网络进行模型训练得到画家识别模型。而在训练时,按照8:2的比例首先对样本数据集随机划分训练集和测试集,然后利用训练集进行模型训练、利用测试集进行模型测试,最终得到画家识别模型。
本申请中用于训练得到画家识别模型的卷积神经网络在VGG16标准模型基础上进行了修改,所采用的卷积神经网络包括五个卷积模块和三层全连接层,每个卷积模块分别包括卷积层、激活函数和池化层,每个卷积模块中的激活函数均为ReLU,每层池化层的池化函数为最大池化。本申请中,前两个卷积模块包括两个卷积层,后三个卷积模块包括三个卷积层。每个全连接层的激活函数均为ReLU。在一个实验中各层的网络参数如下:
作为优化,训练参数设置如下:优化器选取随机梯度下降SGD函数,损失函数选取为交叉熵Cross-Entropy,迭代次数为30次,每批输入图像数量为16,学习率为1e-5,动量为0.9。
步骤5,提取待识别国画的有序风格效果图并输入画家识别模型,输出识别得到的待识别国画所属的画家。
这里的待识别国画可以是原始国画或者有损国画,提取待识别国画的有序风格效果图的方法与上述模型训练的过程类似,若模型训练时以归一化处理后的有序风格效果图为输入,则这里同样需要与有序风格效果图进行归一化处理后输入。画家识别模型输出待识别国画属于各个候选画家的预测概率,并将预测概率最大的候选画家作为待识别国画所属的画家,候选画家是样本数据集中的国画样本所属的各个画家。
在没有噪声污染和人为干扰情况下分别利用现有各种方法对国画所属画家进行自动识别并统计准确率,在有噪声污染和人为干扰情况下利用本申请提供的方法对国画所属画家进行自动识别并统计准确率,对比统计结果如下:
由上述实验结果可知,本申请提供的方法即便在各种噪声污染和人为干扰的环境条件下仍然有较高的自动识别的准确率。
以上所述的仅是本申请的优选实施方式,本发明不限于以上实施例。可以理解,本领域技术人员在不脱离本发明的精神和构思的前提下直接导出或联想到的其他改进和变化,均应认为包含在本发明的保护范围之内。
Claims (10)
1.一种基于人眼视觉深度学习的国画所属画家自动识别方法,其特征在于,所述方法包括:
构建样本数据集,所述样本数据集中包括属于若干个不同的画家的若干幅国画样本;
对所述样本数据集中的每副国画样本进行视觉前端显著性处理提取得到视觉显著图;
基于每个像素点及其邻域像素点的像素值关系对所述视觉显著图进行视觉后端感知信息处理得到有序风格效果图;
以每副幅国画样本处理得到的有序风格效果图为输入、对应的画家为输出,利用所述样本数据集基于卷积神经网络进行模型训练得到画家识别模型;
提取待识别国画的有序风格效果图并输入所述画家识别模型,输出识别得到的所述待识别国画所属的画家。
2.根据权利要求1所述的方法,其特征在于,所述样本数据集中的国画样本包括原始国画以及对原始国画做图像预处理后模拟得到的有损国画,所述图像预处理包括亮度增强、色彩渲染、对比度增强、高斯污染、随机亮度改变、锐度处理、图像旋转、图像翻转中的至少一种。
3.根据权利要求1所述的方法,其特征在于,所述对所述样本数据集中的每副国画样本进行视觉前端显著性处理提取得到视觉显著图,包括对于每副国画样本:
对所述国画样本进行基于视觉的阈值滤波处理;
对完成阈值滤波处理后的国画样本进行频域光强的对数变换;
利用SDSP提取算法对变换后的国画样本进行特征提取得到所述视觉显著图。
4.根据权利要求3所述的方法,其特征在于,所述对所述国画样本进行基于视觉的阈值滤波处理,包括:
根据视觉对比度敏感阈值CSF(1)、视觉中央凹函数τ(i,j)和视觉阈值δ对所述国画样本中任意坐标(i,j)处的像素点的像素值y(i,j)进行阈值滤波处理,得到阈值滤波处理后的像素值z(i,j)为:
其中,视觉对比度敏感阈值为:
CSF(1)=2.6[0.0192+λ·2-1·r·v·tan(0.50)]exp{-[λ·2-1·r·v·tan(0.50)]1.1};
其中,r为分辨率参数,v为视距参数,λ为第一调节参数,dt为第二调节参数,d(i,j)是所述国画样本中坐标(i,j)的像素点与样本图像中心之间的距离,d0是所述国画样本的样本图像中心到图像边缘的距离。
6.根据权利要求1所述的方法,其特征在于,所述基于每个像素点及其邻域像素点的像素值关系对所述视觉显著图进行视觉后端感知信息处理得到有序风格效果图,包括:
计算坐标(i,j)处的像素点的像素值t(i,j)与其邻域像素点的像素值tk(i,j)之间的互信息;
基于像素值t(i,j)与各个邻域像素点的像素值之间的互信息,获得坐标(i,j)处的像素点在所述有序风格效果图中的像素值Q(i,j)。
7.根据权利要求6所述的方法,其特征在于,像素值t(i,j)与与其邻域像素点的像素值tk(i,j)之间的互信息为:
I[t(i,j),tk(i,j)]=logp[t(i,j)/tk(i.j)]-logp[t(i,j)];
其中,p[t(i,j)]为像素值t(i,j)的统计概率,p[t(i,j)/tk(i,j)]为像素值t(i,j)与邻域像素值tk(i,j)的统计条件概率,log表示对数运算。
10.根据权利要求1所述的方法,其特征在于,用于训练得到所述画家识别模型的卷积神经网络包括五个卷积模块和三层全连接层,每个卷积模块分别包括卷积层、激活函数和池化层,每个卷积模块中的激活函数均为ReLU,每层池化层的池化函数为最大池化,每个全连接层的激活函数均为ReLU;
所述输出识别得到的所述待识别国画所属的画家,包括:
输出所述待识别国画属于各个候选画家的预测概率,并将预测概率最大的候选画家作为所述待识别国画所属的画家,候选画家是样本数据集中的国画样本所属的各个画家。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110917411.7A CN113627528A (zh) | 2021-08-11 | 2021-08-11 | 一种基于人眼视觉深度学习的国画所属画家自动识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110917411.7A CN113627528A (zh) | 2021-08-11 | 2021-08-11 | 一种基于人眼视觉深度学习的国画所属画家自动识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113627528A true CN113627528A (zh) | 2021-11-09 |
Family
ID=78384282
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110917411.7A Pending CN113627528A (zh) | 2021-08-11 | 2021-08-11 | 一种基于人眼视觉深度学习的国画所属画家自动识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113627528A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015011185A1 (en) * | 2013-07-24 | 2015-01-29 | Telecom Italia S.P.A. | Keypoint identification |
CN109308697A (zh) * | 2018-09-18 | 2019-02-05 | 安徽工业大学 | 一种基于机器学习算法的树叶病害识别方法 |
US20200143194A1 (en) * | 2017-06-23 | 2020-05-07 | Huawei Technologies Co., Ltd. | Method and Apparatus for Detecting Salient Object in Image |
CN111325290A (zh) * | 2020-03-20 | 2020-06-23 | 西安邮电大学 | 一种基于多视融合多示例学习的国画图像分类方法 |
CN112434590A (zh) * | 2020-11-18 | 2021-03-02 | 中国人民解放军国防科技大学 | 一种基于小波变换的sar影像风条纹识别方法 |
-
2021
- 2021-08-11 CN CN202110917411.7A patent/CN113627528A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015011185A1 (en) * | 2013-07-24 | 2015-01-29 | Telecom Italia S.P.A. | Keypoint identification |
US20200143194A1 (en) * | 2017-06-23 | 2020-05-07 | Huawei Technologies Co., Ltd. | Method and Apparatus for Detecting Salient Object in Image |
CN109308697A (zh) * | 2018-09-18 | 2019-02-05 | 安徽工业大学 | 一种基于机器学习算法的树叶病害识别方法 |
CN111325290A (zh) * | 2020-03-20 | 2020-06-23 | 西安邮电大学 | 一种基于多视融合多示例学习的国画图像分类方法 |
CN112434590A (zh) * | 2020-11-18 | 2021-03-02 | 中国人民解放军国防科技大学 | 一种基于小波变换的sar影像风条纹识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108182441B (zh) | 平行多通道卷积神经网络、构建方法及图像特征提取方法 | |
CN108562589B (zh) | 一种对磁路材料表面缺陷进行检测的方法 | |
CN109584248B (zh) | 基于特征融合和稠密连接网络的红外面目标实例分割方法 | |
CN108960245B (zh) | 轮胎模具字符的检测与识别方法、装置、设备及存储介质 | |
CN106897673B (zh) | 一种基于retinex算法和卷积神经网络的行人再识别方法 | |
CN109754017B (zh) | 基于可分离的三维残差网络和迁移学习高光谱图像分类方法 | |
CN111553929A (zh) | 基于融合网络的手机屏幕缺陷分割方法、装置及设备 | |
US9449253B2 (en) | Learning painting styles for painterly rendering | |
CN111667455B (zh) | 一种刷具多种缺陷的ai检测方法 | |
CN109684922B (zh) | 一种基于卷积神经网络的多模型对成品菜的识别方法 | |
CN109002755B (zh) | 基于人脸图像的年龄估计模型构建方法及估计方法 | |
CN111539247B (zh) | 一种超光谱人脸识别方法、装置、电子设备及其存储介质 | |
CN111222519B (zh) | 一种层次化彩绘文物线稿提取模型构建、方法及装置 | |
CN111539246B (zh) | 一种跨光谱人脸识别方法、装置、电子设备及其存储介质 | |
CN108985337A (zh) | 一种基于图像深度学习的产品表面划痕检测方法 | |
CN110516533B (zh) | 一种基于深度度量的行人再辨识方法 | |
CN111652273B (zh) | 一种基于深度学习的rgb-d图像分类方法 | |
Pei et al. | Effects of image degradations to cnn-based image classification | |
CN109753996B (zh) | 基于三维轻量化深度网络的高光谱图像分类方法 | |
CN110490915A (zh) | 一种基于卷积受限玻尔兹曼机的点云配准方法 | |
CN112559791A (zh) | 一种基于深度学习的布匹分类检索方法 | |
CN111145145A (zh) | 一种基于MobileNets的图像表面缺陷检测方法 | |
CN110688966B (zh) | 语义指导的行人重识别方法 | |
CN116342536A (zh) | 基于轻量化模型的铝带材表面缺陷检测方法、***及设备 | |
CN115829942A (zh) | 基于非负性约束稀疏自编码器的电子电路缺陷检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |