CN116634150B - 基于频繁模式分类的帧间图像编码方法、装置及存储介质 - Google Patents
基于频繁模式分类的帧间图像编码方法、装置及存储介质 Download PDFInfo
- Publication number
- CN116634150B CN116634150B CN202310898183.2A CN202310898183A CN116634150B CN 116634150 B CN116634150 B CN 116634150B CN 202310898183 A CN202310898183 A CN 202310898183A CN 116634150 B CN116634150 B CN 116634150B
- Authority
- CN
- China
- Prior art keywords
- coding
- radial basis
- basis function
- frequent
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000006870 function Effects 0.000 claims abstract description 54
- 239000013598 vector Substances 0.000 claims abstract description 36
- 238000012216 screening Methods 0.000 claims abstract description 24
- 238000013528 artificial neural network Methods 0.000 claims abstract description 21
- 238000012549 training Methods 0.000 claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 11
- 238000005259 measurement Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 9
- 230000033001 locomotion Effects 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 description 9
- 238000005192 partition Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012887 quadratic function Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0499—Feedforward networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/109—Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于频繁模式分类的帧间图像编码方法、装置及存储介质,涉及图像处理技术领域,包括步骤:以编码划分相关参数为特征向量集进行项目集度量逐次增加下的频繁项目集筛选;以最终筛选出的满足最小支持度的频繁项目集为基础进行关联规则的生成;将关联规则作为特征扩展数据与对应参数学习帧作为输入数据对径向基神经网络进行编码划分模式训;基于训练后的径向基神经网络对参数学习帧对应画面组中的帧间图像进行编码划分模式的判定。本发明通过分析帧内编码帧不同编码划分相关参数不同聚类下的支持度关系,从而使得训练后的径向基神经网络能以更高效的处理方式进行编码划分模式判定。
Description
技术领域
本发明涉及图像处理技术领域,具体涉及一种基于频繁模式分类的帧间图像编码方法、装置及存储介质。
背景技术
现有的视频编码技术中,H.266(VVC)在提供更高压缩效率的同时,同时也带来了更高的计算复杂度。这是由于H.266采用了更为复杂的算法和技术,相比于H.265,H.266需要更多的算力资源和运存空间来执行编解码操作。这就导致在实际应用中,H.266的编码和解码速度可能很慢,因此它对硬件设备和***性能具有更高的需求。为了降低H.266的计算复杂度,目前提出了一些改进方案:(1)硬件加速:利用专用的硬件加速器(如GPU、FPGA等)来提高H.266的编解码速度。这样可以充分利用硬件的并行计算能力,加快编解码过程。(2)并行处理:利用并行处理技术,将编解码任务分解为多个子任务,并同时在多个处理单元上进行处理。这可以提高整体的编解码效率,缩短处理时间。(3)算法优化:通过改进编解码算法和技术,减少计算复杂度。例如,通过减少冗余计算、优化运算顺序、引入快速算法等方法来提高编解码效率。之前的方法没有很好地平衡好H.266编码质量、编码计算复杂度和编码效率的关系,因此,亟需一种新的编码方法以解决上述问题。
发明内容
为了更好的兼顾编码质量的同时降低编码复杂度、提高编码效率,本发明提出了一种基于频繁模式分类的帧间图像编码方法,包括步骤:
S1:提取各目标视频各画面组中的帧内编码帧作为参数学习帧;
S2:以编码划分相关参数为特征向量集进行项目集度量逐次增加下的频繁项目集筛选;
S3:以最终筛选出的满足最小支持度的频繁项目集为基础进行关联规则的生成;
S4:将关联规则作为特征扩展数据与对应参数学习帧作为输入数据对径向基神经网络进行编码划分模式训练;
S5:基于训练后的径向基神经网络对参数学习帧对应画面组中的帧间图像进行编码划分模式的判定。
进一步地,所述S2步骤中,特征向量集包括编码划分模式、率失真函数、预测残差、编码深度、纹理复杂度和运动矢量预测。
进一步地,所述S2步骤中,频繁项目集的筛选具体包括如下步骤:
A1:以单个特征向量为起始度量,获取各频繁单项集对应特征向量在参数学习帧进行编码划分时的支持度,并筛选出大于最小支持度的频繁单项集;
A2:度量加一,并在上一度量筛选结果的基础上进行当前度量满足最小支持度各频繁多项集的筛选;
A3:判断当前度量下是否存在满足最小支持度的频繁多项集筛选结果,若是,返回A2步骤,若否,以上一度量筛选出的各频繁多项集为最终筛选结果。
进一步地,所述S3步骤中,关联规则通过如下方式获取:
提取最终筛选出频繁项目集的所有真子集,以排列组合的方式生成关联规则。
进一步地,所述S4步骤中,输入数据包括特征向量集和特征扩展数据,径向基神经网络通过编码划分模式训练获得径向基函数的中心、径向基函数的方差,以及隐含层到输出层的权值。
进一步地,所述S4步骤中,径向基神经网络基于选择的径向基函数中心,将输入数据映射到高维特征空间,通过获取每个特征向量的活跃程度,并与特征扩展数据相比较实现模型的训练,进而获得径向基函数的中心、径向基函数的方差,以及隐含层到输出层的权值。
进一步地,所述S5步骤中,编码划分模式的判定表示为如下公式:
式中,r为欧式径向基函数,x为输入数据,为径向基函数隐含层中第i个节点的中心,/>为激活函数,/>为径向基函数的方差,/>为径向基神经网络输出层中第j个节点的编码划分模式判定结果,i为隐含层节点序号,h为隐含层节点总数,/>为隐含层第i个节点到输出层第j个节点的权值。
还包括一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现一种基于频繁模式分类的帧间图像编码方法的步骤。
还包括一种处理数据的装置,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的计算机程序,以实现一种基于频繁模式分类的帧间图像编码方法的步骤。
与现有技术相比,本发明至少含有以下有益效果:
本发明所述的一种基于频繁模式分类的帧间图像编码方法、装置及存储介质,利用同一图像组中各帧间图像具有相似编码划分模式选择趋势的特点,通过分析帧内编码帧不同编码划分相关参数不同聚类下的支持度关系,对径向基神经网络进行训练,从而使得训练后的网络能够通过分析输入数据与对应中心点的距离,从而实现高效准确的编码划分模式判定,而无需对所有特征向量进行参考计算,降低计算复杂度。
附图说明
图1为一种基于频繁模式分类的帧间图像编码方法的步骤图。
具体实施方式
以下是本发明的具体实施例并结合附图,对本发明的技术方案作进一步的描述,但本发明并不限于这些实施例。
实施例一
VVC依旧沿袭了传统的混合编码结构,相比HEVC,它扩充了编码块的结构划分方式,并在量化变换、预测编码、熵编码等多个模块增添了许多新的编码技术。在编码块结构方面,VVC采用四叉树嵌套多叉树(Quad-tree nested in Multi-Type tree,QTMT)的划分结构。VVC中CU共有六种划分方式:不划分(NS),四叉树划分(QT)、水平二叉树划分(BTH)、垂直二叉树划分(BTV)、水平三叉树划分(TTH)、垂直三叉树划分(TTV)。多类型树划分结构大大增加了VVC编码的计算复杂度,使得其编码效率反而有所下降,因此传统的VVC编码技术并不适用于实时处理的应用场景。为此,如图1所示,本发明提出了一种基于频繁模式分类的帧间图像编码方法,具体包括步骤:
S1:提取各目标视频各画面组中的帧内编码帧作为参数学习帧;
S2:以编码划分相关参数为特征向量集进行项目集度量逐次增加下的频繁项目集筛选;
S3:以最终筛选出的满足最小支持度的频繁项目集为基础进行关联规则的生成;
S4:将关联规则作为特征扩展数据与对应参数学习帧作为输入数据对径向基神经网络进行编码划分模式训练;
S5:基于训练后的径向基神经网络对参数学习帧对应画面组中的帧间图像进行编码划分模式的判定。
一般来说,决定CU编码划分的特征向量有率失真函数、预测残差、编码深度、纹理复杂度和运动矢量预测。本发明考虑到同一图像组中帧间图像之间的目标运动是连续的,因此帧间图像之间的画面大致相同,这也就导致了决定编码块相同节点处编码划分模式的特征向量具有极大的相似性。因此,本发提出了一种基于分析各特征向量以及编码划分模式判定之间的聚类分析方法,通过获取各特征向量以及特征向量之间聚合的频繁程度实现对帧间图像的编码划分模式判定。
同时,由于视频数据是由一组一组的画面组组成的,画面组中包含若干帧的帧间图像,而在这些帧间图像中,时序上排在第一帧的帧间图像(也即是帧内编码帧,I帧)往往具有全部的编码信息,简单的理解就是一帧画面的全部保留,无需参考其他图像便可独立进行解码。
结合上述,本发明提出将帧内编码帧用于频繁聚类下的编码划分模式分析判定。具体地,首先对目标视频当前画面组中的帧内编码帧进行特征向量的提取,具体包括率失真函数、预测残差、编码深度、纹理复杂度和运动矢量预测,以及相对应的编码划分模式。根据这些提取的特征向量,为了研究各特征向量之间不同的组合排列与编码划分模式的关系,我们用频繁项目集(以K表示项目集的度量,也即是长度)表示这些特征向量的组合(为满足后续的计算需求,这些特征向量需先进行归一化处理)。
在这里,为了保证所有的特征向量组合都能够被考虑到,先令K=1,也即是以单个特征向量为起始度量,形成多个频繁单项集,获取这些频繁单项集对应特征向量在参数学习帧进行编码划分时的支持度。支持度越高说明,该组合下的特征向量集对于编码划分模式的判定影响越大,因此,在保证充分分析的同时为了降低计算量,在这里还设置了最小支持度的限制,只有那些支持度大于最小支持度的频繁单项集才能进入下一度量的筛选。
而在完成了度量1下的频繁项目集筛选后,度量加一(也即是K=2),进行该度量最小支持度下的筛选,同时,也是从该度量开始,为了避免已经被剔除的频繁项目集再次进入筛选,造成计算量的浪费,在K=2以后,都是以K-1度量下的筛选结果进行当前度量K的频繁项目集筛选。
在度量增长的情况下重读上述操作,直到无法筛选出满足最小支持度的频繁项目集。将最终获得的频繁多项集全部取出,而后提取出这些频繁项目集的所有真子集,并以排列组合的形式生成所需要的关联规则,并对这些关联规则进行置信度以及提升度的计算,筛选出符合要求的关联则。
将关联规则作为特征扩展数据的一部分作为后续神经网络的输入。在这里,本发明选用径向基神经网络(RBFNN)进行分析编码划分模式的训练分析工具。径向基神经网络是一种以径向基函数(RBF)为激活函数的神经网络,由于RBF的存在,使得RBFNN相较于反向传播网络(BP)具有局部响应的特性,更加适用于这类多分类以及多输入的分析判定。RBFNN的网络结构包括输入层、隐含层和输出层。要实现通过RBFNN对帧间图像的编码划分模式判定,就需要先确定径向基函数的中心、径向基函数的方差,以及隐含层到输出层的权值。为此,我们以帧内编码帧中提取到的特征向量集,结合特征扩展数据作为神经网络的输入对RBFNN进行训练,并提取训练结果中最接近真实帧内编码帧编码划分模式时对应的径向基函数的中心、径向基函数的方差,以及隐含层到输出层的权值。
在普通的RBFNN中,其激活函数表示为如下公式:
式中,r为欧式径向基函数,x为输入数据,为径向基函数隐含层中第i个节点的中心。
而在本发明中,在上述基础上对激活函数进行了进一步改进,采用的是拟多二次函数:
式中,为激活函数,/>为径向基函数的方差。那么改进后RBFNN的输出函数则为:
式中,为径向基神经网络输出层中第j个节点的编码划分模式判定结果,i为隐含层节点序号,h为隐含层节点总数,/>为隐含层第i个节点到输出层第j个节点的权值。
这么改进的好处在于,由于提供了更明确的梯度方向和梯度幅值,从而可以加速神经网络的训练过程,减少训练时间和计算成本,帮助神经网络更快地收敛到全局最优解。
这样,再通过帧内编码帧对径向基神经网络进行训练后,就可以利用训练好的模型对同一画面组中的后续帧间图像进行编码划分模式的判定分析。
同时,本发明还包括一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现一种基于频繁模式分类的帧间图像编码方法的步骤。
还包括一种处理数据的装置,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的计算机程序,以实现一种基于频繁模式分类的帧间图像编码方法的步骤。
综上所述,本发明所述的一种基于频繁模式分类的帧间图像编码方法、装置及存储介质,利用同一图像组中各帧间图像具有相似编码划分模式选择趋势的特点,通过分析帧内编码帧不同编码划分相关参数不同聚类下的支持度关系,对径向基神经网络进行训练,从而使得训练后的网络能够通过分析输入数据与对应中心点的距离,从而实现高效准确的编码划分模式判定,而无需对所有特征向量进行参考计算,降低计算复杂度。
需要说明,本发明实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
另外,在本发明中如涉及“第一”、“第二”、“一”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“连接”、“固定”等应做广义理解,例如,“固定”可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
另外,本发明各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
Claims (8)
1.一种基于频繁模式分类的帧间图像编码方法,其特征在于,包括步骤:
S1:提取各目标视频各画面组中的帧内编码帧作为参数学习帧;
S2:以编码划分相关参数为特征向量集进行项目集度量逐次增加下的频繁项目集筛选;
S3:以最终筛选出的满足最小支持度的频繁项目集为基础进行关联规则的生成;
S4:将关联规则作为特征扩展数据与对应参数学习帧作为输入数据对径向基神经网络进行编码划分模式训练;
S5:基于训练后的径向基神经网络对参数学习帧对应画面组中的帧间图像进行编码划分模式的判定;
所述S2步骤中,频繁项目集的筛选具体包括如下步骤:
A1:以单个特征向量为起始度量,获取各频繁单项集对应特征向量在参数学习帧进行编码划分时的支持度,并筛选出大于最小支持度的频繁单项集;
A2:度量加一,并在上一度量筛选结果的基础上进行当前度量满足最小支持度各频繁多项集的筛选;
A3:判断当前度量下是否存在满足最小支持度的频繁多项集筛选结果,若是,返回A2步骤,若否,以上一度量筛选出的各频繁多项集为最终筛选结果。
2.如权利要求1所述的一种基于频繁模式分类的帧间图像编码方法,其特征在于,所述S2步骤中,特征向量集包括编码划分模式、率失真函数、预测残差、编码深度、纹理复杂度和运动矢量预测。
3.如权利要求1所述的一种基于频繁模式分类的帧间图像编码方法,其特征在于,所述S3步骤中,关联规则通过如下方式获取:
提取最终筛选出频繁项目集的所有真子集,以排列组合的方式生成关联规则。
4.如权利要求1所述的一种基于频繁模式分类的帧间图像编码方法,其特征在于,所述S4步骤中,输入数据包括特征向量集和特征扩展数据,径向基神经网络通过编码划分模式训练获得径向基函数的中心、径向基函数的方差,以及隐含层到输出层的权值。
5.如权利要求4所述的一种基于频繁模式分类的帧间图像编码方法,其特征在于,所述S4步骤中,径向基神经网络基于选择的径向基函数中心,将输入数据映射到高维特征空间,通过获取每个特征向量的活跃程度,并与特征扩展数据相比较实现模型的训练,进而获得径向基函数的中心、径向基函数的方差,以及隐含层到输出层的权值。
6.如权利要求4所述的一种基于频繁模式分类的帧间图像编码方法,其特征在于,所述S5步骤中,编码划分模式的判定表示为如下公式:
式中,r为欧式径向基函数,x为输入数据,为径向基函数隐含层中第i个节点的中心,为激活函数,/>为径向基函数的方差,/>为径向基神经网络输出层中第j个节点的编码划分模式判定结果,i为隐含层节点序号,h为隐含层节点总数,/>为隐含层第i个节点到输出层第j个节点的权值。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至6中任一项所述编码方法的步骤。
8.一种处理数据的装置,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的计算机程序,以实现权利要求1至6中任一项所述编码方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310898183.2A CN116634150B (zh) | 2023-07-21 | 2023-07-21 | 基于频繁模式分类的帧间图像编码方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310898183.2A CN116634150B (zh) | 2023-07-21 | 2023-07-21 | 基于频繁模式分类的帧间图像编码方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116634150A CN116634150A (zh) | 2023-08-22 |
CN116634150B true CN116634150B (zh) | 2023-12-12 |
Family
ID=87602905
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310898183.2A Active CN116634150B (zh) | 2023-07-21 | 2023-07-21 | 基于频繁模式分类的帧间图像编码方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116634150B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102111296A (zh) * | 2011-01-10 | 2011-06-29 | 浪潮通信信息***有限公司 | 基于最大频繁项集的通信告警关联规则挖掘方法 |
CN105160109A (zh) * | 2015-09-11 | 2015-12-16 | 东华大学 | 一种基于rbf神经网络的电机温升预测的方法 |
CN115623214A (zh) * | 2022-12-06 | 2023-01-17 | 宁波康达凯能医疗科技有限公司 | 一种基于集成学习的帧间图像编码方法 |
CN115695803A (zh) * | 2023-01-03 | 2023-02-03 | 宁波康达凯能医疗科技有限公司 | 一种基于极限学习机的帧间图像编码方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090016624A1 (en) * | 2007-07-12 | 2009-01-15 | Chih-Ta Star Sung | Method of graphics and image data compression |
-
2023
- 2023-07-21 CN CN202310898183.2A patent/CN116634150B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102111296A (zh) * | 2011-01-10 | 2011-06-29 | 浪潮通信信息***有限公司 | 基于最大频繁项集的通信告警关联规则挖掘方法 |
CN105160109A (zh) * | 2015-09-11 | 2015-12-16 | 东华大学 | 一种基于rbf神经网络的电机温升预测的方法 |
CN115623214A (zh) * | 2022-12-06 | 2023-01-17 | 宁波康达凯能医疗科技有限公司 | 一种基于集成学习的帧间图像编码方法 |
CN115695803A (zh) * | 2023-01-03 | 2023-02-03 | 宁波康达凯能医疗科技有限公司 | 一种基于极限学习机的帧间图像编码方法 |
Non-Patent Citations (2)
Title |
---|
Lossy Image Compression using Frequent Pattern Mining based Huffman Encoding;Subham Biswas;《 2017 14th IEEE India Council International Conference (INDICON)》;全文 * |
数据仓库与数据挖掘技术在高校招生决策中的应用研究;郭载勋;《中国优秀硕士学位论文全文数据库》;正文第40-70段 * |
Also Published As
Publication number | Publication date |
---|---|
CN116634150A (zh) | 2023-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106713935B (zh) | 一种基于贝叶斯决策的hevc块划分快速方法 | |
CN107071416B (zh) | 一种hevc帧内预测模式快速选择方法 | |
CN111462261B (zh) | 针对h.266/vvc的快速cu分区和帧内决策方法 | |
US8705611B2 (en) | Image prediction encoding device, image prediction encoding method, image prediction encoding program, image prediction decoding device, image prediction decoding method, and image prediction decoding program | |
Kuang et al. | Machine learning-based fast intra mode decision for HEVC screen content coding via decision trees | |
Wu et al. | HG-FCN: Hierarchical grid fully convolutional network for fast VVC intra coding | |
US11076168B2 (en) | Inter-prediction method and apparatus, and storage medium | |
CN106454349B (zh) | 一种基于h.265视频编码的运动估计块匹配方法 | |
CN111654698B (zh) | 一种针对h.266/vvc的快速cu分区决策方法 | |
US20220292723A1 (en) | Attribute information prediction method, encoder, decoder and storage medium | |
US20230023369A1 (en) | Video processing method, video processing apparatus, smart device, and storage medium | |
CN112291562A (zh) | 针对h.266/vvc的快速cu分区和帧内模式决策方法 | |
US10356403B2 (en) | Hierarchial video code block merging using depth-dependent threshold for block merger | |
CN112399177B (zh) | 一种视频编码方法、装置、计算机设备及存储介质 | |
CN116634150B (zh) | 基于频繁模式分类的帧间图像编码方法、装置及存储介质 | |
CN110149512A (zh) | 帧间预测加速方法、控制装置、电子装置、计算机存储介质及设备 | |
CN111950587A (zh) | 帧内编码块划分处理方法和硬件装置 | |
CN104618715B (zh) | 一种获取最小率失真代价的方法及装置 | |
CN110971896B (zh) | 一种h.265编码方法和装置 | |
CN105933718A (zh) | 一种编码单元的分割方法和装置 | |
CN112738529B (zh) | 帧间预测方法、装置、设备、存储介质以及程序产品 | |
Jillani et al. | Multi-view clustering for fast intra mode decision in HEVC | |
Mercat et al. | Machine learning based choice of characteristics for the one-shot determination of the HEVC intra coding tree | |
Deng et al. | Adaptive combination of linear predictors for lossless image compression | |
CN117939121A (zh) | 一种基于遗传算法的帧间图像编码单元划分方法与*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |