CN101252691A - 一种多处理器并行实现高分辨率图像滤波的方法 - Google Patents
一种多处理器并行实现高分辨率图像滤波的方法 Download PDFInfo
- Publication number
- CN101252691A CN101252691A CN 200810065557 CN200810065557A CN101252691A CN 101252691 A CN101252691 A CN 101252691A CN 200810065557 CN200810065557 CN 200810065557 CN 200810065557 A CN200810065557 A CN 200810065557A CN 101252691 A CN101252691 A CN 101252691A
- Authority
- CN
- China
- Prior art keywords
- macro
- processor
- filtering
- block line
- filtration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
Abstract
本发明涉及一种多处理器并行实现高分辨率图像滤波的方法,该方法首先将图像宏块行的宏块按顺序分成与处理器个数相同的份数;然后进行滤波,前一颗处理器完成宏块行对应份的滤波后,下一颗处理器接着进行该宏块行下一份的滤波操作,而前一颗处理器进行下一个宏块行的对应份的滤波,依次类推,直至一帧滤波完成。本发明利用了高清晰度格式的视频数据量大的特点,将一个宏块行的数据分成与处理器个数相同的份,每一颗处理器负责计算不同行的像素滤波,而在此之前,前一次滤波已经使得上方、左侧数据可用,使得并行计算能得以顺利进行。该方法几乎使所有的处理器同时滤波计算,非常有效地利用了多片处理器的资源,提高了处理效率。
Description
技术领域
本发明属于图像信息压缩领域,具体涉及一种高分辨率图像编(或解)码滤波在多片处理器上并行实现的方法。
背景技术
MPEG-4 PART-10 AVC建议,即H.264标准,以其高出一筹的视频图像压缩效率和重建图像的质量,获得了业界的青睐。但H.264的高清晰度是以空间和时间复杂度为代价的,在同等视频编码条件下,H.264编码实现的所需要的耗时是H.263的3倍以上,并且H.264需要更大的内存空间来存储庞大的中间数据。因此,当用H264对高分辨率图像(如D1,720p,1080i)进行编码(或解码,不失一般性,下面统一用编码)的时候,现如今的单颗处理器如DSP,ARM,或FPGA都很难以支撑实时的编码,特别是在编解高清或全高清图像的时候,甚至需要2片以上的处理器来完成一路图像的编码。
当用两片或者两片以上(以下称为多片)的处理器对一路视频序列进行编码,就产生了一个问题,即怎样使多片处理器的能力发挥到最大。如果其中一颗处理器在运行的时候,其他的处理器在闲置,那么跟一片没有什么分别。但是多片处理器如果要同时运行,则必须得保证多片数据访问没有冲突。
H.264引入的环路滤波是一种能够自适应去块效应的一种新方法。H.264的环路滤波能有效地去除编码重建图像的块效应,是H.264的亮点之一。H.264环路滤波分为水平和垂直边界的滤波。在对当前宏块进行滤波的时候,需要用到上面宏块和左边宏块的数据,如图1所示。因此,在对当前宏块滤波的时候,必须对上面和左边的宏块的数据已经做了滤波,以使得其数据可用,由此造成了多片处理器并行计算的困难。一种的简单的可行办法是单片处理器完成整帧图像的处理,这样实现的效率无疑浪费了其他处理器的资源,因为在滤波处理完成之前,其他处理器不能进行其他任何的动作。另外一种方案是将亮度和色度分开由两片数字信号处理器(Digital Signal Processing,DSP)处理,但考虑到亮度的数据量是色度的一倍(图像格式是4:2:0),并且计算复杂度也几乎是色度的一倍,总的资源开销将近4∶1,因此这种方案也没有充分利用多片处理器的资源。
在如今的H.264解决方案中,基于DSP的方式是一种常用的选择,因DSP芯片的速率越来越高,集成的功能越来越强大,性能也日益增强大。
发明内容
本发明所要解决的问题是,提供一种多处理器并行实现高分辨率图像滤波的方法,该方法能够充分利用多片处理器的资源,使得多片处理器能并行地完成滤波过程,从而以较小的资源占用、较快的速度完成滤波。
本发明所述的一种多处理器并行实现高分辨率图像滤波的方法,包括以下步骤:
步骤一:将图像宏块行的宏块按顺序分成与处理器个数相同的份数;
步骤二:前一颗处理器完成宏块行对应部分的滤波后,下一颗处理器接着进行该宏块行下一部分的滤波操作,而前一颗处理器进行下一个宏块行的对应部分的滤波,依次类推,直至完成一帧滤波。
所述步骤二进一步包括以下步骤:
步骤A:第一颗处理器处理第一个宏块行的第一份滤波,此时,其他处理器闲置;
步骤B:第一颗处理器处理第二个宏块行的第一份滤波,与此同时,第二颗滤波器处理第一个宏块行的第二份滤波,其他滤波器闲置;
步骤C:以此类推,直到第一颗处理器处理与处理器个数同数个宏块行的第一份滤波,至此,处理器开始并行运行;
步骤D:第一颗处理器继续处理下一个宏块行的第一份滤波;其他处理器相应的处理对应宏块行的对应部分的滤波;依次类推,直至第一颗处理器处理最后一个宏块行的第一份滤波;
步骤E:第一颗处理器闲置,第二颗处理器处理最后一个宏块行的第二份滤波,依次类推,直至完成一帧滤波。
所述处理器处理完的重建写在片外存储器上。
所述步骤一中,若宏块行的宏块数不能被处理器数目整除,则余数部分的宏块分在最后一份中。
本发明利用了高清晰度格式的视频数据量大的特点,将一个宏块行的数据分成与处理器个数相同的份,每一颗处理器负责计算不同行的像素滤波,而在此之前,前一次滤波已经使得上方、左侧数据可用,使得并行计算能得以顺利进行。这样的处理过程几乎是所有的处理器同时滤波计算,非常有效地利用了多片处理器的资源,提高了处理效率。
附图说明
图1是H.264滤波边界示意图;
图2是本发明所述方法的流程图;
图3是本发明为四片DSP时的滤波示意图。
具体实施方式
下面结合图2和图3对本发明作进一步的详细描述。
本发明中,假设处理器的数目为N,并设图像的宏块行数为M,每行的宏块数为L。L能被N整除,也可以不能被N整除。L能被N整除的情况下,每份宏块数为[L/N]个;L不能被N整除的情况下,前N-1份每份中的宏块数为[L/N]个,而第N份的宏块数为L-(N-1)*[L/N]个。
本实施例以DSP为例,取N=4,分别为DSP_0、DSP_1、DSP_2和DSP_3;且L能被N整除,即分为4份:
第一步
DSP_0对第一宏块行的第一个1/4行滤波。滤波之后的重建数据写在片外存储器中(以下步骤完成后都存储在片外存储器)。此时,DSP_1,DSP_2,DSP_3闲置挂起。
第二步
DSP_1开始对第一宏块行的第二个1/4行像素滤波。与此同时,DSP_0对第二宏块行的前1/4行滤波,DSP_2、DSP3继续闲置。
第三步
DSP_2开始对第一宏块行的第三个1/4行滤波。与此同时,DSP_1则对第二宏块行的第二个1/4行滤波;而DSP_0则对第三宏块行的第一个1/4行滤波;DSP_3继续闲置。
第四步
DSP_3开始对第一宏块行的最后一个1/4行滤波。与此同时,DSP_2对第二宏块行的第三个1/4行滤波;DSP_1对第三宏块行的第二个1/4行滤波;DSP_0则对第四宏块行的第一个1/4行滤波。至此,4颗DSP开始并行计算。
第五步
类似步骤四的过程,所有的DSP对下一个宏块行的对应1/4行滤波,直到最后一个宏块行第k=M宏块行的第一个1/4行。
第六步
DSP_0闲置,其他处理器完成下一个宏块行的对应的1/4宏块行的滤波。
第七步
DSP_0,DSP_1闲置,DSP_2,DSP_3完成相应1/4宏块行的滤波。
第八步
DSP_0,DSP_1,DSP_2闲置,DSP_3完成最后一个宏块行即第M宏块行最后一个1/4行的滤波。至此,完成了整帧图像的滤波。
本发明以DSP实现为例进行说明,但不失一般性,本发明也适用于FPGA、ARM、ASIC等其他芯片。
Claims (4)
1、一种多处理器并行实现高分辨率图像滤波的方法,其特征在于,包括以下步骤:
步骤一:将图像宏块行的宏块按顺序分成与处理器个数相同的份数;
步骤二:前一颗处理器完成宏块行对应份的滤波后,下一颗处理器接着进行该宏块行下一份的滤波操作,而前一颗处理器进行下一个宏块行的对应份的滤波,依次类推,直至一帧滤波完成。
2、如权利要求1所述的多处理器并行实现高分辨率图像滤波的方法,其特征在于,步骤二进一步包括以下步骤:
步骤A:第一颗处理器完成第一个宏块行的第一份滤波,此时,其他处理器闲置;
步骤B:第一颗处理器完成第二个宏块行的第一份滤波,与此同时,第二颗滤波器完成第一个宏块行的第二份滤波,其他滤波器闲置;
步骤C:以此类推,直到第一颗处理器完成与处理器个数同数个宏块行的第一份滤波,处理器开始并行运行;
步骤D:第一颗处理器继续完成下一个宏块行的第一份滤波;其他处理器相应的完成对应宏块行的对应部分的滤波;依次类推,直至第一颗处理器完成最后一个宏块行的第一份滤波;
步骤E:第一颗处理器闲置,第二颗处理器完成最后一个宏块行的第二份滤波,依次类推,直至完成一帧滤波。
3、如权利要求1或2所述的多处理器并行实现高分辨率图像滤波的方法,其特征在于,所述处理器处理完的重建写在片外存储器上。
4、如权利要求1所述的多处理器并行实现高分辨率图像滤波的方法,其特征在于,步骤一中,若宏块行的宏块数不能被处理器数目整除,则余数部分的宏块分在最后一份中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200810065557 CN101252691B (zh) | 2008-03-12 | 2008-03-12 | 一种多处理器并行实现高分辨率图像滤波的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200810065557 CN101252691B (zh) | 2008-03-12 | 2008-03-12 | 一种多处理器并行实现高分辨率图像滤波的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101252691A true CN101252691A (zh) | 2008-08-27 |
CN101252691B CN101252691B (zh) | 2011-06-22 |
Family
ID=39955848
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200810065557 Expired - Fee Related CN101252691B (zh) | 2008-03-12 | 2008-03-12 | 一种多处理器并行实现高分辨率图像滤波的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101252691B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010145424A1 (zh) * | 2009-06-18 | 2010-12-23 | 中兴通讯股份有限公司 | 多核图像编码处理设备及其图像滤波方法 |
CN102281441B (zh) * | 2011-06-17 | 2017-05-24 | 中兴通讯股份有限公司 | 一种并行滤波的方法和装置 |
CN107392838A (zh) * | 2017-07-27 | 2017-11-24 | 郑州云海信息技术有限公司 | 基于OpenCL的WebP压缩并行加速方法及装置 |
CN107483948A (zh) * | 2017-09-18 | 2017-12-15 | 郑州云海信息技术有限公司 | 一种webp压缩处理中像素宏块处理方法 |
CN107613301A (zh) * | 2017-10-17 | 2018-01-19 | 郑州云海信息技术有限公司 | 一种图像处理方法及装置 |
CN107820091A (zh) * | 2017-11-23 | 2018-03-20 | 郑州云海信息技术有限公司 | 一种图片处理方法、***及一种图片处理设备 |
CN111447453A (zh) * | 2020-03-31 | 2020-07-24 | 西安万像电子科技有限公司 | 图像处理方法及装置 |
-
2008
- 2008-03-12 CN CN 200810065557 patent/CN101252691B/zh not_active Expired - Fee Related
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010145424A1 (zh) * | 2009-06-18 | 2010-12-23 | 中兴通讯股份有限公司 | 多核图像编码处理设备及其图像滤波方法 |
US8867606B2 (en) | 2009-06-18 | 2014-10-21 | Zte Corporation | Multi-core image encoding processing device and image filtering method thereof |
CN102281441B (zh) * | 2011-06-17 | 2017-05-24 | 中兴通讯股份有限公司 | 一种并行滤波的方法和装置 |
CN107392838A (zh) * | 2017-07-27 | 2017-11-24 | 郑州云海信息技术有限公司 | 基于OpenCL的WebP压缩并行加速方法及装置 |
CN107392838B (zh) * | 2017-07-27 | 2020-11-27 | 苏州浪潮智能科技有限公司 | 基于OpenCL的WebP压缩并行加速方法及装置 |
CN107483948A (zh) * | 2017-09-18 | 2017-12-15 | 郑州云海信息技术有限公司 | 一种webp压缩处理中像素宏块处理方法 |
CN107613301A (zh) * | 2017-10-17 | 2018-01-19 | 郑州云海信息技术有限公司 | 一种图像处理方法及装置 |
CN107613301B (zh) * | 2017-10-17 | 2020-05-26 | 苏州浪潮智能科技有限公司 | 一种图像处理方法及装置 |
CN107820091A (zh) * | 2017-11-23 | 2018-03-20 | 郑州云海信息技术有限公司 | 一种图片处理方法、***及一种图片处理设备 |
CN107820091B (zh) * | 2017-11-23 | 2020-05-26 | 苏州浪潮智能科技有限公司 | 一种图片处理方法、***及一种图片处理设备 |
CN111447453A (zh) * | 2020-03-31 | 2020-07-24 | 西安万像电子科技有限公司 | 图像处理方法及装置 |
CN111447453B (zh) * | 2020-03-31 | 2024-05-17 | 西安万像电子科技有限公司 | 图像处理方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN101252691B (zh) | 2011-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101252691B (zh) | 一种多处理器并行实现高分辨率图像滤波的方法 | |
US9247264B2 (en) | Method and system for parallel encoding of a video | |
CN107241598B (zh) | 一种针对多路h.264视频会议的GPU解码方法 | |
US8867606B2 (en) | Multi-core image encoding processing device and image filtering method thereof | |
CN110337002B (zh) | 一种在多核处理器平台上hevc多层次并行解码方法 | |
JP2010527194A (ja) | 動的運動ベクトル分析方法 | |
CN104704810A (zh) | 图像捕获加速器 | |
CN112468821B (zh) | 基于hevc核心模块的并行解码方法、装置及介质 | |
US20080298473A1 (en) | Methods for Parallel Deblocking of Macroblocks of a Compressed Media Frame | |
CN101115207B (zh) | 基于预测点间相关性的帧内预测实现的方法及装置 | |
CN104253998B (zh) | 一种适用于hevc标准的去方块效应滤波器的硬件片上存储方法 | |
CN100531392C (zh) | H.264去块效应滤波器的硬件实现方法 | |
CN101635849B (zh) | 一种环路滤波方法及环路滤波器 | |
US20050259744A1 (en) | Video deblocking memory utilization | |
CN101888554B (zh) | 并行流水运动补偿滤波器vlsi结构设计方法 | |
US20050259887A1 (en) | Video deblocking method and apparatus | |
CN101841722B (zh) | 滤波边界强度的检测装置的检测方法 | |
CN101304528B (zh) | 视频处理器视频数据与存储器存储空间的映射方法 | |
CN101605263B (zh) | 帧内预测的方法和装置 | |
CN101459839A (zh) | 去块效应滤波方法及实现该方法的装置 | |
CN110446043A (zh) | 一种基于多核平台的hevc细粒度并行编码方法 | |
CN102223538A (zh) | 一种并行滤波的方法和装置 | |
Jiang et al. | GPU-based intra decompression for 8K real-time AVS3 decoder | |
CN102281441B (zh) | 一种并行滤波的方法和装置 | |
CN111815502B (zh) | 基于WebP压缩算法的多图处理的FPGA加速方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110622 Termination date: 20170312 |