CN110312134B - 一种基于图像处理和机器学习的屏幕视频编码方法 - Google Patents

一种基于图像处理和机器学习的屏幕视频编码方法 Download PDF

Info

Publication number
CN110312134B
CN110312134B CN201910716492.7A CN201910716492A CN110312134B CN 110312134 B CN110312134 B CN 110312134B CN 201910716492 A CN201910716492 A CN 201910716492A CN 110312134 B CN110312134 B CN 110312134B
Authority
CN
China
Prior art keywords
image
coding
image frame
frame
screen content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910716492.7A
Other languages
English (en)
Other versions
CN110312134A (zh
Inventor
徐国伟
范娟婷
金星
彭斌
刘宇新
朱政
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Microframe Information Technology Co ltd
Original Assignee
Hangzhou Microframe Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Microframe Information Technology Co ltd filed Critical Hangzhou Microframe Information Technology Co ltd
Priority to CN201910716492.7A priority Critical patent/CN110312134B/zh
Publication of CN110312134A publication Critical patent/CN110312134A/zh
Application granted granted Critical
Publication of CN110312134B publication Critical patent/CN110312134B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了基于图像处理和机器学习的屏幕视频编码方法。所述方法包括以下步骤:首先对于每一个图像帧,首先利用场景转换帧作为关键帧,利用支持向量机或者深度神经网等机器学习的方法,对于关键帧首先做场景分类;之后根据分类后的场景确定是否为屏幕内容;确定为屏幕内容的图像帧,跳过通用编码方法,直接利用屏幕内容编码工具来实现编码,提升效率;进而利用粗分块实现图像特征提取,根据图像帧块特征,以及图像细颗粒特征,决策出该图像帧的视频内容编码工具选择以及相应工具的具体参数取值,从而在保证图像率失真性能接近最优的基础上,实现屏幕内容的高效编码。

Description

一种基于图像处理和机器学习的屏幕视频编码方法
技术领域
本发明涉及视频编解码技术领域,尤其涉及一种基于图像处理和机器学习的屏幕视频编码方法。
背景技术
视频屏幕内容图像是直接从各类设备(计算机,移动终端等)的图像显示单元捕获的。常见的屏幕内容有计算机图形和文本图像、自然视频与图形/文字混合的图像,以及计算机生成的动画图像等。视频屏幕内容在桌面协作、桌面共享、第二屏幕、云游戏等各种场景中普遍存在。
视频编码标准,包括MPEG/ITU-T国际组织标准HEVC(又名H.265),以及开放媒体联盟AOM打造的视频编码标准AV1中,均有关于屏幕内容的标准规定。
屏幕内容典型的视频编码工具包括:Intra-Block-Copy(简称IBC,帧内块拷贝),Palette(调色板模式)等。以上两个工具都是目前屏幕内容编码的主要工具。
屏幕内容编码的一般做法是针对每一个视频序列,或者每一个视频序列中的每一个图像帧,首先确定在传统视频编码的基础上,是否需要再采用视频屏幕内容的工具,在率失真决策中进而选取适合该图像帧,或者适合整个视频序列的最佳编码工具。
目前做法的局限性在于:
(1)针对视频序列或者图像帧,只决定在通用编码工具上是否再加入视频屏幕内容编码工具的评判;如果确定是,则加入屏幕内容工具的评判;但并没有具体确定针对目前的图像帧,是否应该采用具体的屏幕内容编码工具,比如是否应该采用IBC编码,亦或调色板模式编码;
(2)屏幕内容如上所述,涉及计算机桌面共享,或者在线教育白板共享,或者云游戏等多个不同场景;目前的屏幕内容没有具体考虑不同场景的视频内容编码优化策略。
发明内容
本发明提供了一种基于图像处理和机器学习的高效屏幕视频编码方法和***。本发明的核心思想在于首先对于每一个图像帧,首先利用场景转换帧作为关键帧,利用支持向量机或者深度神经网等机器学习的方法,对于关键帧首先做场景分类;之后根据分类后的场景确定是否为屏幕内容。确定为屏幕内容的图像帧,跳过通用编码方法,直接利用屏幕内容编码工具来实现编码,提升效率。
本发明提供的一种基于图像处理和机器学习的屏幕视频编码方法,包括以下步骤:
(1)对于每一个视频序列,利用场景转换帧作为关键帧;
(2)利用颜色指数直方图墒值作为后续步骤(3)中的图像帧参数,用于辅助决策图像帧是否为屏幕编码内容,具体包括以下步骤:
(2.1)图像帧中颜色指数直方图墒值的提取,具体包括:
(2.1.1)对于一个图像帧,根据视频分辨率做宏块分割:视频分辨率在720p及以上,宏块大小为128×128,视频分辨率在720p以下,宏块大小为64×64;
(2.1.2)对于每一个宏块(i,j),其中i为图像块行位置坐标,j为图像块列位置坐标,获取该图像块颜色指数的数目,用n(i,j)表示;
(2.1.3)获取该图像帧所有宏块颜色指数直方图,用h(k)表示,其中k=1,2,...,NxN,其中NxN为宏块的像素点总数目,h(k)为颜色指数为k、即n(i,j)=k的所有宏块的数目,满足
Figure BDA0002154978350000021
其中W,H为图像帧的宽度和高度,WxH为图像帧的像素点总数目,M为图像帧的宏块总数目;
(2.1.4)计算颜色指数直方图墒值:
Figure BDA0002154978350000022
其中
p(k)=h(k)/M,且有
Figure BDA0002154978350000023
(2.2)利用颜色指数直方图墒值辅助图像帧分类;具体地,在通用的图像帧分类的基础上,加入颜色指数直方图墒值Hcolor_indexes,以及h(k)或p(k)的统计数据做进一步的分类;
(3)利用支持向量机SVM或者神经网络CNN机器学习的方法,对于关键帧首先做场景分类,进一步根据分类结果决策该关键帧是否为屏幕内容;只针对关键帧进行上述决策,如果关键帧确定为屏幕内容,后续所有图像帧在下一关键帧之前,均确定为屏幕图像帧;其中,图像帧参数采用步骤(2)中颜色指数直方图墒值;
(4)屏幕内容图像帧与非屏幕内容图像帧,在编码方式决策时采用不同的编码途径:
(4.1)屏幕内容图像帧:利用机器学习,首先对屏幕图像帧做粗分块特征提取,进而利用神经网络筛选每一个宏块的编码模式,进而仅对筛选后的编码模式做率失真评测,具体包括:
(4.1.1)神经网络采用浅层网络结构:中间层为1~2层,每一层128个单元;
(4.1.2)基于视频分辨率的图像帧分块和特征提取:图像帧的分块,采用上述计算颜色指数直方图墒值中类似的方法,分辨率在720p及以上,宏块大小为128×128,分辨率在720p以下,宏块大小为64×64,进而利用图像处理方法对每一图像宏块提取图像特征,包括均值,方差,利用边缘检测获取边缘信息而获得的边缘像素点比例,块内色度直方图获取的墒值等特征;
(4.1.3)利用(4.1.1)中浅层神经网络,以(4.1.2)获取的宏块特征为神经网络输入,迅速决策和筛选编码工具;
(4.2)非屏幕内容图像帧:对于所有非屏幕内容图像帧,则对编码标准中对于屏幕图像帧有效的编码工具,全部跳过不予做率失真评估。
本发明通过首先利用场景转换帧作为关键帧,利用支持向量机或者深度神经网等机器学习的方法,对于关键帧首先做场景分类;之后根据分类后的场景确定是否为屏幕内容。确定为屏幕内容的图像帧,跳过通用编码方法,直接利用屏幕内容编码工具来实现编码,提升效率。进而利用粗分块实现图像特征提取,根据图像帧块特征,以及图像细颗粒特征,决策出该图像帧的视频内容编码工具选择以及相应工具的具体参数取值,从而在保证图像率失真性能接近最优的基础上,实现屏幕内容的高效编码。实验结果显示上述编码策略,可以大幅提升视频编码的效率,比如对于1080p,25fps的屏幕内容编码,编码速度可以在编码性能基本不变的情形下,提升50~70%。
附图说明
图1为本发明基于图像处理和机器学习的屏幕视频编码方法的流程图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
下面结合附图对本发明作更进一步的说明。
高效编码评估准则,是指在同样的编码工具复杂度要求下,编码器的率失真性能最高;或者在近似的率失真性能下,编码速度最快。
率失真理论是用信息论的基本观点和方法研究数据压缩问题的理论,又称限失真信源编码理论。率失真理论的基本问题可以归结如下:对于一个给定的信源分布与失真度量,在特定的码率下能达到的最小期望失真;或者为了满足一定的失真限制,最小描述码率可以是多少。
如图1所示,本发明的基于图像处理和机器学习的屏幕视频编码方法具体包括以下步骤:
(1)首先对于每一个视频序列,利用场景转换帧作为关键帧;
(2)本发明的一个创新贡献在于,在对关键帧首先做场景分类之前,利用颜色指数直方图墒值作为后面场景分类步骤中的图像帧参数,用于辅助决策图像帧是否为屏幕编码内容,具体包括以下步骤:
(2.1)图像帧中颜色指数直方图墒值的提取:
(2.1.1)对于一个图像帧,根据视频分辨率做宏块分割:视频分辨率在720p及以上,宏块大小为128×128,视频分辨率在720p以下,宏块大小为64×64;
(2.1.2)对于每一个宏块(i,j),其中i为图像块行位置坐标,j为图像块列位置坐标,获取该图像块颜色指数(color indexes)的数目,用n(i,j)表示,比如对于屏幕内容背景单色图像块,只有一种颜色指数,则n(i,j)=1;如果该宏块中的所有像素点的颜色指数均无重复取值,则n(i,j)=NxN,其中N×N为宏块的像素点总数目;
(2.1.3)获取该图像帧所有宏块颜色指数直方图,用h(k)表示,其中k=1,2,...,NxN,h(k)为颜色指数为k、即n(i,j)=k的所有宏块的数目,满足
Figure BDA0002154978350000051
其中W,H为图像帧的宽度和高度,W×H为图像帧的像素点总数目,M为图像帧的宏块总数目;
(2.1.4)计算颜色指数直方图墒值:
Figure BDA0002154978350000052
其中
p(k)=h(k)/M,且有
Figure BDA0002154978350000053
(2.2)利用颜色指数直方图墒值辅助图像帧分类;具体地,在通用的图像帧分类的基础上(比如图像帧可以分类为游戏视频、视频会议白板视频、影像视频、体育视频等),加入颜色指数直方图墒值Hcolor_indexes,以及h(k)或p(k)的统计数据(包括均值和方差)做进一步的分类,比如利用Hcolor_indexes,h(k)的均值,和h(k)的方差作为神经网络的输入,以决策该图像帧是否为屏幕内容。
(3)利用支持向量机(SVM)或者卷积神经网络(CNN)机器学习的方法,对于关键帧首先做场景分类,进一步根据分类结果决策该关键帧是否为屏幕内容;与传统屏幕内容分类不同的是,本专利方法只针对关键帧决策,若关键帧确定为屏幕内容后,后续所有图像帧在下一关键帧之前,均确定为屏幕图像帧;其中,图像帧参数采用步骤(2)中颜色指数直方图墒值。
(4)屏幕内容图像帧与非屏幕内容图像帧,在编码方式决策时采用不同的编码途径:
(4.1)屏幕内容图像帧:传统方法在率失真评估中,对每一个分块,会对编码标准中所有编码工具,包括屏幕内容编码工具和通用编码工具一一筛选,造成编码相对复杂,影响编码速度。本专利的创新点,是利用机器学习,首先对屏幕图像帧做粗分块特征提取,进而利用神经网络筛选每一个宏块的编码模式,进而仅对筛选后的编码模式做率失真评测,具体包括:
(4.1.1)神经网络采用浅层网络结构,计算简捷,训练易收敛:中间层为1~2层,每一层128个单元,这里没有采用深度神经网络;
(4.1.2)基于视频分辨率的图像帧分块和特征提取:这里图像帧的分块,可以采用上述计算颜色指数直方图墒值中类似的方法,分辨率在720p及以上,宏块大小为128×128,以下为64×64,进而利用图像处理方法对每一图像宏块提取图像特征,包括均值,方差,利用边缘检测获取边缘信息而获得的边缘像素点比例,块内色度直方图获取的墒值等特征;
(4.1.3)利用(4.1.1)中浅层神经网络,以(4.1.2)获取的宏块特征为神经网络输入,迅速决策和筛选编码工具:
对于通用编码工具是否在屏幕内容帧宏块中采用,作为初始决策,之后只在初始决策选中条件下的编码模式做进一步评估。比如最新视频编码标准AV1(由开放媒体联盟AOM组织在2018年6月推出),提供两种新的帧间仿射变换运动矢量编码工具:全局运动矢量(Global Motion)和扭曲运动矢量(Warped Motion),这两种工具对于编码效率提升比较有效,但评估计算繁复。由于屏幕内容为计算机生成图像,相对非屏幕内容帧,这两种工具使用频率相对较低。本专利方法则利用(4.1.1)中设计的浅层神经网络,网络输入为(4.1.2)中获取的图像块特征,网络输出为全局运动矢量/扭曲运动矢量两种模式的开关状态。只有神经网络输出状态为“开”时,才对相应的编码模式做进一步率失真评估。
(4.2)非屏幕内容图像帧:对于所有非屏幕内容图像帧,则对编码标准中对于屏幕图像帧有效的编码工具,包括调色板编码,帧内块运动矢量等编码工具等,全部跳过不予做率失真评估。
仿真实验结果显示上述编码策略,可以大幅提升视频编码的效率,比如对于1080p,25fps的屏幕内容编码,编码速度可以在编码性能基本不变的情形下,提升50~70%。
本申请可用于众多通用或专用的计算机***环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器***、基于微处理器的***、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何***或设备的分布式计算环境等等。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (2)

1.一种基于图像处理和机器学习的屏幕视频编码方法,其特征在于,包括以下步骤:
(1)对于每一个视频序列,利用场景转换帧作为关键帧;
(2)利用颜色指数直方图熵值作为后续步骤(3)中的图像帧参数,用于辅助决策图像帧是否为屏幕编码内容,具体包括以下步骤(2.1)-(2.2):
(2.1)图像帧中颜色指数直方图熵值的提取,具体包括以下步骤(2.1.1)-(2.1.4):
(2.1.1)对于一个图像帧,根据视频分辨率做宏块分割:视频分辨率在720p及以上,宏块大小为128×128,视频分辨率在720p以下,宏块大小为64×64;
(2.1.2)对于每一个宏块(i,j),其中i为图像块行位置坐标,j为图像块列位置坐标,获取该图像块颜色指数的数目,用n(i,j)表示;
(2.1.3)获取该图像帧所有宏块颜色指数直方图,用h(k)表示,其中k=1,2,...,NxN,其中N×N为宏块的像素点总数目,h(k)为颜色指数为k、即n(i,j)=k的所有宏块的数目,满足
Figure FDA0003035123980000011
其中W,H为图像帧的宽度和高度,W×H为图像帧的像素点总数目,M为图像帧的宏块总数目;
(2.1.4)计算颜色指数直方图熵值:
Figure FDA0003035123980000012
其中
p(k)=h(k)/M,且有
Figure FDA0003035123980000013
(2.2)利用颜色指数直方图熵值辅助图像帧分类;具体地,在通用的图像帧分类的基础上,加入颜色指数直方图熵值Hcolor_indexes,以及h(k)或p(k)的统计数据做进一步的分类;
(3)利用支持向量机SVM或者卷积神经网络CNN机器学习的方法,对于关键帧首先做场景分类,进一步根据分类结果决策该关键帧是否为屏幕内容;只针对关键帧进行上述决策,如果关键帧确定为屏幕内容,后续所有图像帧在下一关键帧之前,均确定为屏幕图像帧;其中,图像帧参数采用步骤(2)中颜色指数直方图熵值;
(4)屏幕内容图像帧与非屏幕内容图像帧,在编码方式决策时采用不同的编码途径,包括以下步骤(4.1)-(4.2):
(4.1)屏幕内容图像帧:利用机器学习,首先对屏幕图像帧做粗分块特征提取,进而利用神经网络筛选每一个宏块的编码模式,进而仅对筛选后的编码模式做率失真评测,具体包括以下步骤(4.1.1)-(4.1.3):
(4.1.1)神经网络采用浅层网络结构:中间层为1~2层,每一层128个单元;
(4.1.2)基于视频分辨率的图像帧分块和特征提取:图像帧的分块,采用上述计算颜色指数直方图熵值中的方法,分辨率在720p及以上,宏块大小为128×128,分辨率在720p以下,宏块大小为64×64,进而利用图像处理方法对每一图像宏块提取图像特征,所述图像特征包括:均值、方差、利用边缘检测获取边缘信息而获得的边缘像素点比例、块内色度直方图获取的熵值;
(4.1.3)利用(4.1.1)中浅层神经网络,以(4.1.2)获取的宏块特征为神经网络输入,迅速决策和筛选编码工具;其中,对于通用编码工具是否在屏幕内容帧宏块中采用,作为初始决策,之后只在初始决策选中条件下的编码模式做进一步评估;
(4.2)非屏幕内容图像帧:对于所有非屏幕内容图像帧,则对编码标准中对于屏幕图像帧有效的编码工具,全部跳过不予做率失真评估。
2.根据权利要求1所述的屏幕视频编码方法,其特征在于,所述步骤(2.2)中的h(k)或p(k)的统计数据包括均值和方差,利用Hcolor_indexes,h(k)的均值,和h(k)的方差作为神经网络的输入,以决策该图像帧是否为屏幕内容。
CN201910716492.7A 2019-08-06 2019-08-06 一种基于图像处理和机器学习的屏幕视频编码方法 Active CN110312134B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910716492.7A CN110312134B (zh) 2019-08-06 2019-08-06 一种基于图像处理和机器学习的屏幕视频编码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910716492.7A CN110312134B (zh) 2019-08-06 2019-08-06 一种基于图像处理和机器学习的屏幕视频编码方法

Publications (2)

Publication Number Publication Date
CN110312134A CN110312134A (zh) 2019-10-08
CN110312134B true CN110312134B (zh) 2021-06-15

Family

ID=68082995

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910716492.7A Active CN110312134B (zh) 2019-08-06 2019-08-06 一种基于图像处理和机器学习的屏幕视频编码方法

Country Status (1)

Country Link
CN (1) CN110312134B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111314701A (zh) * 2020-02-27 2020-06-19 北京字节跳动网络技术有限公司 视频处理方法及电子设备
CN111526363A (zh) * 2020-03-31 2020-08-11 北京字节跳动网络技术有限公司 编码的方法及装置、终端和存储介质
CN113949870A (zh) * 2021-09-09 2022-01-18 镕铭微电子(济南)有限公司 一种编码过程中的屏幕内容检测的方法及装置
CN116962696A (zh) * 2022-04-19 2023-10-27 华为技术有限公司 图像编码方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104539949A (zh) * 2014-12-12 2015-04-22 北方工业大学 Hevc屏幕编码中基于边缘方向的快速分块
CN107666612A (zh) * 2017-10-31 2018-02-06 中国科学技术大学 基于卷积神经网络的块内容分类方法
CN108495135A (zh) * 2018-03-14 2018-09-04 宁波大学 一种屏幕内容视频编码的快速编码方法
CN109040764A (zh) * 2018-09-03 2018-12-18 重庆邮电大学 一种基于决策树的hevc屏幕内容帧内快速编码算法
WO2019001094A1 (zh) * 2017-06-27 2019-01-03 杭州海康威视数字技术股份有限公司 一种视频编码方法、解码方法、装置及电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104539949A (zh) * 2014-12-12 2015-04-22 北方工业大学 Hevc屏幕编码中基于边缘方向的快速分块
WO2019001094A1 (zh) * 2017-06-27 2019-01-03 杭州海康威视数字技术股份有限公司 一种视频编码方法、解码方法、装置及电子设备
CN107666612A (zh) * 2017-10-31 2018-02-06 中国科学技术大学 基于卷积神经网络的块内容分类方法
CN108495135A (zh) * 2018-03-14 2018-09-04 宁波大学 一种屏幕内容视频编码的快速编码方法
CN109040764A (zh) * 2018-09-03 2018-12-18 重庆邮电大学 一种基于决策树的hevc屏幕内容帧内快速编码算法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种屏幕内容编码帧间模式快速选择算法;***;《光电子·激光》;20190131;第30卷(第1期);全文 *

Also Published As

Publication number Publication date
CN110312134A (zh) 2019-10-08

Similar Documents

Publication Publication Date Title
CN110312134B (zh) 一种基于图像处理和机器学习的屏幕视频编码方法
Lei et al. Fast intra prediction based on content property analysis for low complexity HEVC-based screen content coding
CN107277509B (zh) 一种基于屏幕内容的快速帧内预测方法
US8917764B2 (en) System and method for virtualization of ambient environments in live video streaming
CN106254871B (zh) 对图像内容的编码单元进行编码或解码的方法与装置
CN108495135B (zh) 一种屏幕内容视频编码的快速编码方法
CN106534846B (zh) 一种屏幕内容与自然内容划分及快速编码方法
JP4817821B2 (ja) 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
CN103886623A (zh) 一种图像压缩方法、设备及***
CN109379594B (zh) 视频编码压缩方法、装置、设备和介质
CN107071440B (zh) 使用先前帧残差的运动矢量预测
BR112017004490B1 (pt) Método para a construção de uma tabela de hash para correspondência de bloco baseada em hash, dispositivo de computação e meio de armazenamento legível por computador
CN109040764B (zh) 一种基于决策树的hevc屏幕内容帧内快速编码算法
CN104902279A (zh) 一种视频处理方法及装置
CN113068034B (zh) 视频编码方法及装置、编码器、设备、存储介质
CN111432210A (zh) 一种基于填充的点云属性压缩方法
CN110087075B (zh) 一种图像的编码方法、编码装置以及计算机存储介质
TW201524198A (zh) 螢幕視訊之預測編碼的方法與系統
CN109587491A (zh) 一种帧内预测方法、装置及存储介质
CN111445424A (zh) 图像处理和移动终端视频处理方法、装置、设备和介质
Hu et al. Fvc: An end-to-end framework towards deep video compression in feature space
CN110691246B (zh) 视频编码方法、装置及电子设备
Wang et al. UHD video coding: A light-weight learning-based fast super-block approach
CN115118964A (zh) 视频编码方法、装置、电子设备及计算机可读存储介质
Yuan et al. Object shape approximation and contour adaptive depth image coding for virtual view synthesis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant