JP3401823B2 - 画像コーデック用プロセッサ - Google Patents

画像コーデック用プロセッサ

Info

Publication number
JP3401823B2
JP3401823B2 JP07476493A JP7476493A JP3401823B2 JP 3401823 B2 JP3401823 B2 JP 3401823B2 JP 07476493 A JP07476493 A JP 07476493A JP 7476493 A JP7476493 A JP 7476493A JP 3401823 B2 JP3401823 B2 JP 3401823B2
Authority
JP
Japan
Prior art keywords
data
image
processing
stage
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP07476493A
Other languages
English (en)
Other versions
JPH06290262A (ja
Inventor
英次 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP07476493A priority Critical patent/JP3401823B2/ja
Publication of JPH06290262A publication Critical patent/JPH06290262A/ja
Application granted granted Critical
Publication of JP3401823B2 publication Critical patent/JP3401823B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Advance Control (AREA)
  • Complex Calculations (AREA)
  • Image Processing (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば、数値計算、画
像処理、グラフィックス処理等に用いられる計算機シス
テムにおける中央処理装置(プロセッサ)に関するもの
であり、特に画像コーデックのようなビデオ信号処理に
好適な信号処理装置に関する。
【0002】
【従来の技術】まず、画像コーデック処理における画像
のマクロブロックおよびブロックの概念について述べ
る。ここでは、CCIR601フォーマットに基づく
(4:4:2)信号を例に挙げる。なお、本発明におけ
る画像コーデック処理とは、CCITT H.261勧
告やMPEG等の画像圧縮符号化/伸長復号化標準に代
表されるような(画像データ動き補償+離散コサイン変
換(DCT)処理)に基づくマクロブロックを処理単位
とする画像の符号化処理および復号化処理を意味する。
【0003】1画像フレームは、720x480画素の
大きさの輝度成分(Y成分)と、横方向にサブサンプリ
ングされた360x480画素の大きさの2種の色差成
分、つまり、第1の色差成分(Cr成分)および第2の
色差成分(Cr成分)からなる。この画像フレームを、
輝度成分については16x16画素の正方形(矩形)領
域に分割し、2種の色差成分についてはそれぞれ8x1
6画素の矩形領域に分割する。この輝度成分における1
6x16画素の正方形領域と、その領域に位置的に対応
する2種の色差成分における8x16画素の矩形領域と
を合わせてマクロブロックと呼ぶ。また、輝度成分、色
差成分にかかわらず、8x8画素の正方形領域をブロッ
クと呼ぶ。したがって、1マクロブロックは、図6に示
したように、輝度(Y)成分4ブロック、色差成分4ブ
ロック(Cr成分2ブロック、Cb成分2ブロック)の
計8ブロックからなる。
【0004】図7に示したように、マクロブロックを1
処理単位とする従来の画像コーデック用プロセッサ1
は、入力用データメモリ2、演算ユニット3、出力用デ
ータメモリ4で構成されており、画像コーデック処理対
象のマクロブロックを入力する「入力ステージ」、演算
ユニット3を用いて画像コーデック処理を行う「計算ス
テージ」、画像コーデック処理後のマクロブロックを出
力する「出力ステージ」の3ステージ構成でパイプライ
ン処理を行う。各ステージ間はそれぞれ、入力用データ
メモリ2、出力用データメモリ4と呼ぶダブルバッファ
構成(2個のメモリバンクを備えて処理単位毎に切り換
える構成)のデータメモリで結合されている。
【0005】以下、マクロブロックを1処理単位とする
従来の画像コーデック用プロセッサ1におけるパイプラ
イン処理を簡単に説明する。なお、以下に述べる係数k
は正の整数とする。 A.(2k)番目のマクロブロックが計算ステージにあ
る時 A1.入力ステージ (2k+1)番目のマクロブロックを図7に示した入力
用データメモリ2の第1のメモリバンク5(バンク0)
に書き込む。 A2.計算ステージ 入力用データメモリ2の第2のメモリバンク6(バンク
1)より2k番目のマクロブロックを取り込み、演算ユ
ニット3において画像コーデック処理を施した後、出力
用データメモリ4の第1のメモリバンク7(バンク0)
に書き込む。 A3.出力ステージ 出力用データメモリ4の第2のメモリバンク8(バンク
1)より(2k−1)番目の画像コーデック処理後のマ
クロブロックを出力する。
【0006】B.(2k+1)番目のマクロブロックが
計算ステージにある時 B1.入力ステージ (2k+2)番目のマクロブロックを入力用データメモ
リ2の第2のメモリバンク6(バンク1)に書き込む。 B2.計算ステージ 入力用データメモリ2の第1のメモリバンク5(バンク
0)より(2k+1)番目のマクロブロックを取り込
み、演算ユニット3において画像コーデック処理を施し
た後、出力用データメモリ4の第2のメモリバンク8
(バンク1)に書き込む。 B3.出力ステージ 出力用データメモリ4の第1のメモリバンク(バンク
0)より2k番目の画像コーデック処理後のマクロブロ
ックを出力する。
【0007】従来の画像コーデック用プロセッサは、上
記のように各ステージ間にダブルバッファ構成のデータ
メモリを設けているため、各ステージの動作周波数が異
なっていても問題ない。また、ステージ間におけるデー
タメモリへのアクセスの競合が発生しないので、各ステ
ージは完全に並列に動作可能である。
【0008】
【発明が解決しようとする課題】ところが、上述した画
像コーデック用プロセッサの構成では、演算ユニット3
を並列化して高速化を図ろうとすると、データメモリの
ポート数が増大し、演算ユニットとデータメモリとの間
の相互結合網が複雑化するという問題がある。例えば、
1個の演算ユニットのデータ入力数を2入力と仮定し、
4個の演算ユニットが4並列で動作するプロセッサを考
えた場合、4個全ての演算ユニットへマクロブロックの
任意のデータを毎クロックサイクル供給するためには、
入力用データメモリの1メモリバンクにつき8ポートの
マルチポートメモリが必要となる。また、演算ユニット
とデータメモリとの間の相互結合網についても、8個の
ポートの各々が演算ユニットの任意の入力端子へデータ
を供給する必要があるため、8x8のクロスバー網とい
う非常に複雑でハードウェア量の大きい相互結合網を構
成しなくてはならない。これは、マクロブロックのすべ
てのデータをデータメモリの1個のメモリバンクに格納
しているためである。
【0009】そこで、データメモリのポート数を増やす
ことなく演算ユニットを並列化するアプローチが考えら
れる。このアプローチにおいては、データメモリをマク
ロブロック内に存在するブロック対応に分割し、その各
々のデータメモリに対応して演算ユニットを設ける。さ
らに、すべての演算ユニットについて対応するデータメ
モリ以外のデータメモリとのデータ転送を禁止する。例
えば、図6に図解した(4:2:2)信号を考えると、
マクロブロックは8個のブロックからなるので、データ
メモリを8個に分割し、その各々のデータメモリに対応
して8個の演算ユニットを設ける。この構成を採った場
合、1個の演算ユニットのデータ入力数を2入力と仮定
すると、入力用データメモリの1メモリバンクにつき高
々2ポートのマルチポートメモリでよく、演算ユニット
とデータメモリとの間の相互結合網も簡単になる。
【0010】しかしながら、画像コーデック処理におい
ては、ブロック間にまたがってデータ依存関係が存在す
る要素処理が必要となる場合がある。つまり、ブロック
内のデータだけではなく、隣接ブロックのデータをも必
要とする要素処理が存在する。例として、符号化時にお
ける動きベクトル検出、および、MPEG2におけるフ
ィールド/フレーム適応形離散コサイン変換(DCT)
処理について順に説明する。
【0011】まず、画像データの動きベクトル検出につ
いて説明する。動きベクトル検出において、ブロックマ
ッチングの全探索アルゴリズムを採用した場合、マクロ
ブロックの輝度成分 y i,j (0≦i <16,0≦j<16) について、以下のような演算を行う。
【0012】
【数1】
【0013】なお、上式におけるci,j は、候補ブロッ
クのデータを意味する(動きベクトル検出処理の詳細に
ついては、本出願人が先に出願した、平成4年10月2
8日出願、「演算回路」特願平4−311163号の明
細書、及び、図面に説明されている)。上式1から判る
ように、マクロブロックの輝度成分(4個のブロック)
のデータ全てを用いて、1個の差分絶対値和を求めてい
る。したがって、動きベクトル検出処理は、ブロック間
にまたがってデータ依存関係が存在する要素処理であ
る。また、符号化時における種々のモード決定処理にお
いても、このようなブロック間にまたがるデータ依存関
係が存在する。
【0014】次に、MPEG2におけるフレーム/フィ
ールド適応形離散コサイン変換(DCT)処理について
説明する。MPEG2におけるフレーム/フィールド適
応形DCTでは、画像データの性質により、フレームD
CTとフィールドDCTを適応的に切り換える。この
際、図8に示すように、フレームDCTの場合は図6に
示すブロックの構成と同一であるが、図9に示すよう
に、フィールドDCTの場合はマクロブロックの縦方向
について交互にデータを抜き出してブロックを構成す
る。すなわち、フィールドDCTにおいては、図6にお
ける縦方向2個のブロック(例えば、ブロック0とブロ
ック1)にまたがるデータ依存関係が存在する。
【0015】上記のように、画像コーデック処理におい
ては、ブロック間にまたがってデータ依存関係が存在す
る要素処理があるため、データメモリをブロック対応に
分割し、演算ユニットをブロック対応に設けることが困
難であった。また、上述した従来の画像コーデック用プ
ロセッサの構成では、入力用と出力用に各々異なるデー
タメモリを用いているため、演算処理用のメモリバンク
が入力用と出力用の各々に独立して存在しており、デー
タメモリ容量が増大していた。1メモリバンクのメモリ
容量をmとすると、トータルで4mのメモリ容量が必要
となる。
【0016】
【課題を解決するための手段】上述した課題を解決する
ために、本発明では、画像コーデック処理でマクロブロ
ックを1処理単位として入力ステージ、計算ステージ、
出力ステージの3ステージ構成でパイプライン処理を行
うプロセッサにおいて、マクロブロックを構成する各ブ
ロック対応に設けられている要素プロセッサ内に、演算
ユニットおよびダブルバッファ構成のデータメモリを有
し、さらに、隣接する要素プロセッサの演算結果を加算
する回路を有し、また、隣接する要素プロセッサのデー
タメモリ間でデータ転送を可能とする回路を設ける。
【0017】したがって、本発明によれば、それぞれが
mxnの画像データで構成される複数のブロックからな
るマクロブロックを1処理単位として、複数のブロック
の画像データにまたがる信号処理と1つのブロック内の
画像データについての信号処理とを適応的に、単一の命
令ストリームで多重データストリーム制御処理する「単
一命令ストリーム・多重データストリーム:SIMD」
制御形画像コーデック用プロセッサにおいて、隣接要素
プロセッサ間データ転送路で接続されたそれぞれが隣接
する複数対の要素プロセッサが、前記マクロブロックに
対応して設けられ、これら複数の要素プロセッサに共通
に係数を提供する共通係数メモリが設けられ、前記複数
のブロックの画像データにまたがる信号処理を行う複数
対の要素プロセッサの出力にこれらの演算結果の加算を
行う共通の加算回路を設け、前記マクロブロック単位の
処理画像データが前記要素プロセッサに入力されること
を特徴とする画像コーデック用プロセッサが提供され
る。
【0018】好適には、前記要素プロセッサのそれぞれ
が、データ入力ステージ、計算ステージ、および、デー
タ出力ステージからなる3ステージをパイプライン処理
するように構成されている。特定的には、前記要素プロ
セッサのそれぞれが、前記データ入力ステージ、計算ス
テージ、および、データ出力ステージからなる3ステー
ジに対応した3個のバンクを有するI/Oバッファと、
少なくとも交互に動作可能な並列的に配設された2つの
バンクを有する第1のデータメモリと、少なくとも交互
に動作可能な並列的に配設された2つのバンクを有する
第2のデータメモリと、これらのI/Oバッファ、第1
および第2のデータメモリを相互接続する相互結合網
と、該相互結合網に接続された演算ユニットとを有す
る。
【0019】好適には、前記演算ユニットが、加算、減
算、各種論理演算、大小比較、差分絶対値演算およびバ
タフライ演算を行う2入力・2出力の拡張算術論理演算
処理ユニットと、前記係数メモリからの係数と、該拡張
算術論理演算処理ユニットの出力との乗算を行う乗算ユ
ニットと、該乗算結果を累積処理する累積ユニットとを
有する。さらに好適には、前記拡張算術論理演算処理ユ
ニットの後段にパイプラインレジスタと、前記乗算ユニ
ットの後段にパイプラインレジスタと、前記累積ユニッ
トの後段にパイプラインレジスタとが設けられ、前記デ
ータ入力ステージ、計算ステージ、および、データ出力
ステージからなる3ステージに対応したパイプライン処
理を行う。
【0020】特定的には、前記複数のブロックの画像デ
ータにまたがる信号処理が、フィールド画像信号処理で
あり、前記1つのブロック内の画像データについての信
号処理が、フレーム画像処理である。
【0021】
【0022】
【0023】さらに本発明によれば、画像コーデック処
理でマクロブロックを1処理単位として入力ステージ、
計算ステージ、出力ステージの3ステージ構成でパイプ
ライン処理を行う画像コーデック用プロセッサにおい
て、前記マクロブロックを構成する各ブロック対応に設
けられている要素プロセッサ内に、演算ユニットおよび
ダブルバッファ構成のデータメモリを有し、さらに、隣
接する要素プロセッサの演算結果を加算する回路を有
し、各ブロックにおける画像コーデック処理を複数の要
素プロセッサを用いて「単一命令ストリーム・多重デー
タストリーム:SIMD」制御により並列に行うことを
特徴とする画像コーデック用プロセッサが提供される。
【0024】また本発明によれば、画像コーデック処理
でマクロブロックを1処理単位として入力ステージ、計
算ステージ、出力ステージの3ステージ構成でパイプラ
イン処理を行う画像コーデック用プロセッサにおいて、
前記マクロブロックを構成する各ブロック対応に設けら
れている要素プロセッサ内に、演算ユニットおよびダブ
ルバッファ構成のデータメモリを有し、さらに、隣接す
る要素プロセッサの演算結果を加算する回路を有し、ま
た、隣接する要素プロセッサのデータメモリ間でデータ
転送を可能とし、各ブロックにおける画像コーデック処
理を複数の要素プロセッサを用いて「単一命令ストリー
ム・多重データストリーム:SIMD」制御により並列
に行うことを特徴とする画像コーデック用プロセッサが
提供される。
【0025】
【作用】マクロブロックを構成する各ブロック対応に設
けられている要素プロセッサ内に、演算ユニットおよび
ダブルバッファ構成のデータメモリを有し、さらに、隣
接する要素プロセッサの演算結果を加算する回路を有
し、また、隣接する要素プロセッサのデータメモリ間で
データ転送を可能とすることにより、各ブロックにおけ
る画像コーデック処理を複数の要素プロセッサを用い
て、「単一命令ストリーム・多重データストリーム:S
IMD」制御により並列に行うことができる。
【0026】加算回路は共通に1つ、係数メモリも共通
に1つ設けるだけでよい。
【0027】
【実施例】以下、図面を参照して、本発明の画像コーデ
ック用プロセッサの実施例について詳述する。本発明の
実施例における画像コーデック用プロセッサは、アリス
メティク(算術)論理演算処理ユニット(ALU)、乗
算器、累算器等からなる演算ユニットを複数有し、それ
らの演算ユニットが単一の命令流により複数のデータを
並列に処理する「単一命令ストリーム・多重データスト
リーム:SIMD(Single Instruction stream Multip
le Data stream)」方式のプロセッサに基づく。なお、
「単一命令ストリーム・多重データストリーム:SIM
D」制御については、Yamauchi,et al,
“Architecture andImplemen
tation of a Highly Parall
elSingle:Chip Video DSP“,
IEEE TRANSACTIONS AND SYS
TEMS FOR VIDEO TECHNOLOG
Y, VOL.2,JUNE 1992,pp.207
−220を参照されたい。
【0028】さらに、このプロセッサの演算ユニット
は、演算器をパイプライン接続することが可能であり、
パイプライン演算処理も行う。つまり、本発明の画像コ
ーデック用プロセッサは、図1に示したように、マクロ
ブロック入力端子21、マクロブロック出力端子22、
フレームメモリのマクロブロック入出力端子23、フレ
ームメモリのマクロブロック入力端子24を有し、さら
に、これらの端子に接続された入力用データバス31、
出力用データバス32、および、データバス33,34
をさらに有する。さらに画像コーデック用プロセッサ
は、これらのバス31〜34を介して相互に接続される
複数個、この例では8個の要素プロセッサ(PE)11
〜18と、4個の要素プロセッサ11〜14の結果を加
算する1つの加算回路41と、各要素プロセッサのブロ
ック入力端子81(図2)に係数を印加する1つの係数
メモリ51とを有する。上記要素プロセッサ11〜18
は、上記バス31〜34で相互に接続される他、隣接す
る要素プロセッサ、つまり、PE0とPE1、PE2と
PE3、PE4とPE5、PE6とPE7とが相互に接
続されている。
【0029】以下、本発明の1実施例における画像コー
デック用プロセッサについて、全体構成を説明した後、
演算ユニットおよびデータメモリのそれぞれの構成につ
いて説明する。 1.全体構成 図1は、本発明の1実施例としての画像コーデック用プ
ロセッサの全体構成図である。この画像コーデック用プ
ロセッサには、図6に示したマクロブロックの各ブロッ
ク対応に8個の要素プロセッサ11〜18(以下、一般
的に1k、但しk=1〜8と表すこともある)が設けら
れている。図2に要素プロセッサの内部構成を示す。k
番目の要素プロセッサは、演算ユニット6kと、入出力
(I/O)バッファ91、第1のフレームバッファ0
(92)、第2のフレームバッファ1(93)、およ
び、ワーキングバッファ94からなるデータメモリ7k
と、これらバッファ91〜94を接続する相互結合網9
5と、セレクタ111とを有している。
【0030】以下、本発明の画像コーデック用プロセッ
サの動作を説明する。まず、画像コーデックの処理対象
となるマクロブロックは、図1に示したマクロブロック
入力端子21から画像データが1データずつ入力され
る。この際、マクロブロックの各ブロックは、自ブロッ
ク番号と同一の要素プロセッサ番号が付けられたk番目
の要素プロセッサのデータメモリ7kに入力用データバ
ス31を介して格納される。つまり、ブロック0は第1
の要素プロセッサ11(PE0)のデータメモリ71
に、ブロック1は第2の要素プロセッサ12(PE1)
のデータメモリ72、以下、同様に、ブロック7は第8
の要素プロセッサ18(PE7)のデータメモリ78に
格納される。また同時に、画像データの動き補償を行う
際に必要となる過去のフレームや未来のフレームのマク
ロブロックも、上記の入力動作と同様に、データバス3
3,34を介してフレームメモリのマクロブロック入出
力端子23あるいは入力端子24からk番目の要素プロ
セッサのデータメモリ7kに格納される。この入力動作
は、マクロブロックの予測モード、例えば、前方向予測
や両方向予測により異なる。つまり、画像コーデック処
理の対象となるマクロブロックが画像データの動き補償
を行わない場合は、この入力動作は行わない。また、前
方向予測あるいは後方向予測の動き補償を行う場合は、
フレームメモリのマクロブロック入力端子24のみを使
用して、過去あるいは未来のいずれかのフレームのマク
ロブロックのみを入力する。また、両方向予測の動き補
償を行う場合は、フレームメモリのマクロブロック入出
力端子23およびフレームメモリのマクロブロック入力
端子24を2個とも使用して両方のフレームのマクロブ
ロックを入力する。
【0031】これらの入力動作と並行して、k番目の要
素プロセッサPEの演算ユニット6kでは、「単一命令
ストリーム・多重データストリーム:SIMD」制御に
より離散コサイン変換(DCT)や量子化といった画像
コーデックの要素処理が並列に実行されている。なお、
上述した文献に記載されているように、「単一命令スト
リーム・多重データストリーム:SIMD」制御とは、
単一の命令で、多重(複数)のデータの流れを制御する
方法である。また、すべての画像コーデックの要素処理
を「単一命令ストリーム・多重データストリーム:SI
MD」制御で行うので、図1に示した係数メモリ51を
全ての要素プロセッサ11〜18で共有しており、係数
メモリ51を各要素プロセッサ11〜18内に持たなく
てすむ。さらに、これらの入力動作および計算動作と並
行して、画像コーデック処理後のマクロブロックがマク
ロブロック出力端子22から1データずつ出力される。
この際、マクロブロックの各ブロックは、自ブロック番
号と同一の要素プロセッサ番号を持つ要素プロセッサの
データメモリ7kから出力用データバス32を介してマ
クロブロック出力端子22へ出力される。すなわち、ブ
ロック0は要素プロセッサ11(PE0)のデータメモ
リ71から、ブロック1は要素プロセッサ12(PE
1)のデータメモリ72から、以下、同様に、ブロック
7は要素プロセッサ18(PE7)のデータメモリ78
から出力用データバス32を介してマクロブロック出力
端子22へ出力される。
【0032】また同時に、画像コーデック処理後のマク
ロブロックが他のマクロブロックの画像データ動き補償
を行う際に必要となる場合、上記の出力動作と同様にデ
ータバス33を介してk番目の要素プロセッサのデータ
メモリ7kからフレームメモリのマクロブロック入出力
端子23に出力される。なお、この画像コーデック処理
では、フレームメモリのマクロブロック入出力端子23
においてマクロブロックの入力および出力を同時に行う
必要は生じない。
【0033】次に、図1における加算回路41について
説明する。上記「発明が解決しようとする課題」の項で
述べた画像データ動きベクトル検出やモード決定処理の
ようなブロック間データ依存関係は、各ブロック毎に求
めた演算結果をすべて加算できれば解決できる。例え
ば、画像データ動きベクトル検出で考えると、マクロブ
ロックの輝度成分(4個のブロック)の各ブロックにつ
いて差分絶対値和を求め、最後にそれら4個の差分絶対
値和を加算すればよい。このために、マクロブロックの
輝度成分を格納する4個の要素プロセッサ11〜14の
出力に加算回路41を設けた。この加算回路41は、4
個の演算結果がすべて加算できれば、どのような構成で
も構わない。加算結果は、制御回路のデータレジスタ
(図示省略)に書き込まれる。
【0034】最後に、図1における隣接する要素プロセ
ッサ間のデータ転送路42〜45について説明する。上
記「発明が解決しようとする課題」の項で述べたフィー
ルドDCT処理における縦方向2個のブロックにまたが
るデータ依存関係は、隣接する2つの要素プロセッサ、
たとえば、PE0とPE1との間で8x8ブロックの半
分の32個のデータを交換することで解決できる。この
ために、フィールドDCT/逆DCT(IDCT)処理
時に隣接する要素プロセッサのデータメモリとのデータ
の交換を可能とする転送路42〜45を設ける。フィー
ルドDCT/IDCT処理時には、予めこれらの転送路
42〜45を用いてブロックの半分のデータを交換して
おいてからDCT/IDCT処理を実行すればよい。
【0035】演算ユニットの構成 図3に本発明の1実施例による演算ユニットの内部構成
を示す。この演算ユニットは、第1のセレクタ131、
第2のセレクタ132、拡張AL(EALU)121、
2つのパイプラインレジスタ141,142、第3のセ
レクタ133、乗算器122、パイプラインレジスタ1
43、第4のセレクタ134、第5のセレクタ135、
シフト機能付累算器123、パイプラインレジスタ14
4、第6のセレクタ136、および、パイプラインメモ
リ124を有している。
【0036】拡張ALU121の構成 拡張ALU121は、正負反転器301、加算器30
2、減算器303、論理演算器304、正負判定器30
5、および、データセレクタ301、307が図示のご
とく接続されている。図3に示したデータセレクタ13
1の選択出力データがXとして印加され、データセレク
タ132の選択出力データがYとして印加されている。
論理演算器304は、否定、論理和、論理積、排他的論
理和などの論理演算を行う。正負反転器301は入力デ
ータXの極性を反転してデータセレクタ306に印加す
る。加算器302は、データセレクタ306から極性反
転されたデータ:−Xが出力されたときは入力データY
に極性反転したデータ:−Xを加算して、(Y−X)を
出力する。また、加算器302は、データセレクタ30
6から入力データXが出力されたときは、入力データY
と入力データXとの加算結果(Y+X)を出力する。減
算器303は、(X−Y)を計算する。論理演算器30
4は、データXとデータYとの論理演算を行う。正負判
定器305は入力されたデータの正負を判定する。
【0037】上述の拡張ALU121は、通常のALU
の機能である、加算、減算、論理演算の他に、大小比較
演算、差分絶対値演算、バタフライ演算を拡張機能とし
て備えている。以下、これらの機能を述べる。 (イ)加算 加算器302において、入力端子311,312に入力
されたデータXおよびYを加算する。この場合は入力デ
ータXが正負反転されずに加算器320に印加されるよ
うに、データセレクタ306を選択しておく。データセ
レクタ307から加算結果(X+Y)が出力される。こ
の加算結果Aは、出力端子313を介して図3に示した
パイプラインレジスタ141に印加される。 (ロ)減算 減算器303において、入力端子311,312に入力
されたデータXからYを減算する。この減算結果Bは、
出力端子314を介して図3に示したパイプラインレジ
スタ142に印加される。 (ハ)論理演算 論理演算器304において、入力端子311,312に
入力されたデータXおよびYの否定、論理和、論理積、
排他的論理和などの論理演算が行われ、データセレクタ
307および出力端子313を介して、パイプラインレ
ジスタ141に出力される。 (ニ)大小比較:min(X,Y)、max(X,Y) 入力端子311,312に入力されたデータXおよびY
について、正負反転器301、加算器302、減算器3
03、正負判定器305を用いて大小比較を行う。この
場合、データセレクタ306は正負反転器301で極性
反転したデータ(−X)が加算器302に入力されるよ
うに設定される。正負判定器305には、加算器302
から(Y−X)、減算器303から(X−Y)が入力さ
れ、正負判定器305は、 (a)最小値min(X,Y)として、 (Y−X)≧0のとき、X (X−Y)>0のとき、Y (b)最大値max(X,Y)として、 (Y−X)≧0のとき、Y (X−Y)>0のとき、X をデータセレクタ307および出力端子313を介して
出力する。ただし、最小値と最大値とは同時に出力でき
ない。 (ホ)差分絶対値演算:/X−Y/ 入力端子311,312に入力されたデータXおよびY
について、正負反転器301、加算器302、減算器3
03、および、正負判定器305を用いて差分絶対値演
算を行う。この場合、データセレクタ306は正負反転
器301で極性反転したデータ(−X)が加算器302
に入力されるように設定される。正負判定器305に
は、加算器302から(Y−X)、減算器303から
(X−Y)が入力され、正負判定器305は、 (Y−X)≧0のとき、(Y−X) (X−Y)>0のとき、(X−Y) をデータセレクタ307および出力端子313を介して
出力する。 (ヘ)バタフライ演算 入力端子311,312に入力されたデータXおよびY
について、加算器302、および、減算器303を用い
てバタフライ演算を行う。この場合、データセレクタ3
06は入力データXを加算器302に入力するように設
定される。データセレクタ307が出力端子313に加
算器302の加算結果(X+Y)を出力し、減算器30
3の減算結果(X−Y)が出力端子314に出力され
る。
【0038】次いで、図3に示した演算ユニットにおけ
るパイプライン処理の概要を図5を参照して述べる。簡
単な動作例として拡張ALU121が第1ステップ(ス
テージ)において加算動作を行い、乗算器122が第2
ステップにおいて乗算を行い、シフト機能付累算器12
3が第3ステップにおいて累算を行うとする。そして、
これら各ステップの動作は1クロックサイクル内に行わ
れるとする。拡張ALU121の後段にパイプラインレ
ジスタ141,142、乗算器122の後段にパイプラ
インレジスタ143、シフト機能付累算器123の後段
にパイプラインレジスタ144が設けられているから、
(k−2)クロックサイクルにおいて、拡張ALU12
1において加算を行い、その加算結果をパイプラインレ
ジスタ141に保存し、(k−1)クロックサイクルに
おいて、上記拡張ALU121における加算結果を保存
しているパイプラインレジスタ141を用いて乗算器1
22において乗算を行いパイプラインレジスタ143に
保存するとともに、拡張ALU121において新たな加
算を行いパイプラインレジスタ141に保存し、kクロ
ックサイクルにおいて、上記(k−1)クロックサイク
ルにおける乗算器122におけるパイプラインレジスタ
143に保存した乗算結果を用いてシフト機能付累算器
123において累積演算を行いパイプラインレジスタ1
44に保存し、(k−1)クロックサイクルにおける拡
張ALU121において加算したパイプラインレジスタ
141に保存されている加算結果について乗算器122
において乗算を行いパイプラインレジスタ143に保存
し、さらに拡張ALU121において新たな加算を行い
パイプラインレジスタ141に保存する。以下、同様に
同じクロックサイクルにおいて、加算、乗算、累積が同
時的に行われる。このように、演算ユニット内におい
て、加算、乗算、累積が順序をおって並列して行われ
る。
【0039】この演算ユニットは、本件出願人が本件出
願と同時提出の『処理適応型演算パイプラインの構成』
に示した演算ユニットと以下の点を除いては同一構成
で、やはり画像コーデックの要素処理に適した構成とな
っている。相違点は、本発明においては、演算ユニット
内にパイプラインメモリ124を設け、1個の8x8ブ
ロックの離散コサイン変換/離散逆コサイン変換(DC
T/IDCT)処理を1演算ユニットのみを用いて行う
構成としていることである。これにより、すべての画像
コーデックの要素処理を「単一命令ストリーム・多重デ
ータストリーム:SIMD」制御で実現できる。
【0040】本件出願の発明者の分析によれば、画像コ
ーデックにおいて、乗算を連続して行う要素処理あるい
は乗算結果の和を求める要素処理の頻度は小さいことが
判ったので、演算ユニット間の結合をなくし、演算ユニ
ット間の配線の減少を図った。本発明においては、全て
の画像コーデックの要素処理を「単一命令ストリーム・
多重データストリーム:SIMD」制御で実現できるた
め、図1に示すように、係数メモリ51は全ての要素プ
ロセッサで共有する構成とする。
【0041】データメモリの構成 図2に本発明の1実施例によるデータメモリの構成を示
す。データメモリは、入出力(I/O)バッファ91、
第1のフレームバッファ0(92)、第2のフレームバ
ッファ1(93)、ワーキングバッファ94、および、
相互結合網95からなる。以下、それぞれについて説明
する。 (a)I/Oバッファ91 I/Oバッファ91は、バンク0,1,2(101,1
02,103)と呼ぶ3個のメモリバンクに分割されて
おり、各々が最低限1個の8x8ブロックを格納できる
メモリ容量を有する。画像コーデック処理によってはさ
らに大きなメモリ容量を要する場合がある。このI/O
バッファ91は、「従来の技術」の項で述べた入力用デ
ータメモリおよぶ出力用データメモリを兼用することに
より、メモリバンクの数を1個減らしたものである。す
なわち、計算ステージにおけるデータ入力用および出力
用のバッファを1個にまとめている。
【0042】以下、I/Oバッファ91の動作を説明す
る。I/Oバッファ91においては、演算の処理単位で
あるマクロブロック毎に演算処理用のメモリバンク、入
力用のメモリバンクおよび出力用のメモリバンクを以下
のように切り替える。ここで、演算処理用のメモリバン
クは相互結合網95に接続され、入力用のメモリバンク
は入力用データバス31に接続され、出力用のメモリバ
ンクは出力用データバス32に接続される。
【0043】
【表1】 表1 1.3k番目のマクロブロックの処理時 演算処理用のメモリバンク :バンク0(101) 入力用のメモリバンク :バンク1(102) 出力用のメモリバンク :バンク2(103) 2.(3k+1)番目のマクロブロックの処理時 演算処理用のメモリバンク :バンク1(102) 入力用のメモリバンク :バンク2(103) 出力用のメモリバンク :バンク0(101) 3.(3k+1)番目のマクロブロックの処理時 演算処理用のメモリバンク :バンク2(103) 入力用のメモリバンク :バンク0(101) 出力用のメモリバンク :バンク1(102)
【0044】I/Oバッファ91が上記のように動作す
ることにより、入力ステージ、計算ステージ、出力ステ
ージの動作周波数が異なっていても問題ない。また、ス
テージ間におけるI/Oバッファ91へのアクセスの競
合が発生しないので、各ステージは完全に並列に動作可
能である。
【0045】(b)第1のフレームバッファ0(92)
および第2のフレームバッファ1(93) 第1のフレームバッファ0(92)および第2のフレー
ムバッファ1(93)は、各々がバンク0,1(10
4:105、106:107)と呼ぶ2個のメモリバン
クに分割されており、各々が最低限1個の8x8ブロッ
クを格納できるメモリ容量を有する。画像コーデック処
理によっては、さらに大きなメモリ容量を要する場合が
ある。第1のフレームバッファ0(92)および第2の
フレームバッファ1(93)は、画像データの動き補償
を行う際に必要となる過去のフレームや将来のフレーム
のマクロブロックを格納する。これらのマクロブロック
は、データバス33、34を介してフレームメモリのマ
クロブロック入出力端子23あるいはマクロブロック入
力端子24から入力される。この際、フレームバッファ
0(92)、フレームバッファ1(93)はダブルバッ
ファ構成となっているので、入力ステージと計算ステー
ジの動作周波数が異なっていても問題ない。
【0046】また、ステージ間におけるフレームバッフ
ァへのアクセスの競合が発生しないので、入力ステージ
と計算ステージは完全に並列に動作可能である。さら
に、第1のフレームバッファ0(92)は、画像コーデ
ック処理後のマクロブロックが他のマクロブロックの画
像データ動き補償を行う際に必要となる場合に、そのマ
クロブロックを格納する。さらに、データバス33を介
してフレームメモリのマクロブロック入出力端子23に
出力する。この際、第1のフレームバッファ0(92)
はダブルバッファ構成となっているので、計算ステージ
と出力ステージの動作周波数が異なっていても問題な
い。また、ステージ間におけるフレームバッファへのア
クセスの競合が発生しないので、計算ステージと出力ス
テージは完全に並列に動作可能である。
【0047】(c)ワーキングバッファ94 ワーキングバッファ94は、演算中間結果格納用バッフ
ァであり、最低限1個の8x8ブロックを格納できるメ
モリ容量を有する。画像コーデック処理によっては、ワ
ーキングバッファ94はさらに大きなメモリ容量を要す
る場合がある。
【0048】(d)相互結合網95 相互結合網95は、上記4種のバッファ、つまり、I/
Oバッファ91、第1のフレームバッファ0(92)、
第2のフレームバッファ1(93)およびワーキングバ
ッファ94と演算ユニット6kとを接続するネットワー
クである。相互結合網95としては、どのような構成で
もよいが、最低限、1クロックサイクル毎に2個のデー
タを任意のバッファ91〜94から演算ユニット6kに
供給可能とし、同時に1個のデータを演算ユニット6k
から任意のバッファ91〜94に格納可能とする。ま
た、最低限、1クロックサイクル毎に1個のデータを任
意のバッファ91〜94から演算ユニット6kに供給
し、同時に2個のデータを演算ユニット6kから任意の
バッファ91〜94に格納可能とする。なお、画像コー
デックの要素処理において、1クロックサイクル毎に、
第1のフレームバッファ0(92)および第2のフレー
ムバッファ1(93)の同一メモリバンク(バンク0,
1のいずれか)から2個のデータが供給されたり、第1
のフレームバッファ0(92)および第2のフレームバ
ッファ1(93)の同一メモリバンクへ2個のデータが
格納されることはない。したがって、第1のフレームバ
ッファ0(92)および第2のフレームバッファ1(9
3)のメモリバンクは、すべてシングルポート構成でよ
い。これに対し、I/Oバッファ91の各メモリバンク
およびワーキングバッファ94は、最低限2ポートのマ
ルチポート構成となる。
【0049】以上、本発明の1実施例としての画像コー
デック用プロセッサについて述べたが、本発明の実施に
際しては、上述した実施例に限定されず、上記同様の構
成および処理を行う他の構成にすることができる。
【0050】
【発明の効果】本発明によれば、隣接する要素プロセッ
サの演算結果を加算する回路を有し、隣接する要素プロ
セッサPEのデータメモリ間でデータ転送を可能とする
ことにより、画像コーデックのブロック間にデータ依存
関係が存在する処理が実現できる。これにより、ブロッ
ク対応にダブルバッファ方式のデータメモリを有する要
素プロセッサを設けることが可能となる。この結果、従
来よりもデータメモリのポート数、相互結合網を複雑化
することなく並列度をあげることででき、処理性能が向
上する。
【0051】また、本発明によれば、データメモリ内の
I/Oバッファにおいて、従来の構成では入力データメ
モリと出力用データメモリで別々に存在していた演算処
理用のメモリバンクが兼用できるので、3メモリバンク
分のデータメモリがあればよい。したがって、1メモリ
バンクのデータメモリ容量をmとすると、トータルで3
mのデータメモリ容量となり、従来の構成と比べてデー
タメモリ容量を3/4に削減できる。
【図面の簡単な説明】
【図1】本発明の実施例としての画像コーデック用プロ
セッサの構成図である。
【図2】図1に示した要素プロセッサの構成図である。
【図3】図1に示した演算ユニットの構成図である。
【図4】図3に示した拡張ALUの構成図である。
【図5】図3に示した演算ユニットにおけるパイプライ
ン処理を示すグラフである。
【図6】CCIR601フォーマットに基づく(4:
2:2)信号におけるマクロブロックおよびブロックの
概念を示す図である。
【図7】従来の画像コーデック用プロセッサの構成を示
す図である。
【図8】フレームDCT処理時のマクロブロック(輝度
成分のみ)を示す図である。
【図9】フィールドDCT処理時のマクロブロック(輝
度成分のみ)を示す図である。
【符号の説明】
1k(11〜18)・・本発明の実施例の要素プロセッ
サ(PE) 21・・マクロブロック入力端子 22・・マクロブロック出力端子 23・・フレームメモリのマクロブロック入出力端子 24・・フレームメモリのマクロブロック入力端子 31・・入力用データバス 32・・出力用データバス 33,34・・データバス 41・・加算回路 42〜45・・隣接要素プロセッサ間データ転送路 51・・係数メモリ 6k(61〜68)・・演算ユニット 7k(71〜78)・・データメモリ 81・・ブロック入力端子 82・・ブロック出力端子 83・・フレームメモリのブロック入出力端子 84・・フレームメモリのブロック入力端子 91・・I/Oバッファ 92・・第1のフレームバッファ0 93・・第2のフレームバッファ1 94・・ワーキングバッファ 95・・相互結合網 101・・I/Oバッファのバンク0 102・・I/Oバッファのバンク1 103・・I/Oバッファのバンク2 104・・フレームバッファ0のバンク0 105・・フレームバッファ0のバンク1 106・・フレームバッファ1のバンク0 107・・フレームバッファ1のバンク1 111・・データセレクタ 121・・拡張論理演算ユニット(EALU) 122・・乗算器 123・・シフト機能付き累算器 124・・パイプラインメモリ 131〜136・・データセレクタ 141〜144・・パイプラインレジスタ
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI G06T 9/00 G06T 9/00 H04N 7/30 H04N 7/133 Z (58)調査した分野(Int.Cl.7,DB名) G06T 1/20 G06F 17/16 G06F 17/10 G06F 15/16 JICSTファイル(JOIS)

Claims (14)

    (57)【特許請求の範囲】
  1. 【請求項1】それぞれがmxnの画像データで構成され
    る複数のブロックからなるマクロブロックを1処理単位
    として、複数のブロックの画像データにまたがる信号処
    理と1つのブロック内の画像データについての信号処理
    とを適応的に、単一の命令ストリームで多重データスト
    リーム制御処理する「単一命令ストリーム・多重データ
    ストリーム:SIMD」制御形画像コーデック用プロセ
    ッサにおいて、 隣接要素プロセッサ間データ転送路で接続されたそれぞ
    れが隣接する複数対の要素プロセッサが、前記マクロブ
    ロックに対応して設けられ、 これら複数の要素プロセッサに共通に係数を提供する共
    通係数メモリが設けられ、 前記複数のブロックの画像データにまたがる信号処理を
    行う複数対の要素プロセッサの出力にこれらの演算結果
    の加算を行う共通の加算回路を設け、 前記マクロブロック単位の処理画像データが前記要素プ
    ロセッサに入力されることを特徴とする画像コーデック
    用プロセッサ。
  2. 【請求項2】前記要素プロセッサのそれぞれが、データ
    入力ステージ、計算ステージ、および、データ出力ステ
    ージからなる3ステージをパイプライン処理するように
    構成されている、請求項1記載の画像コーデック用プロ
    セッサ。
  3. 【請求項3】前記要素プロセッサのそれぞれが、 前記データ入力ステージ、計算ステージ、および、デー
    タ出力ステージからなる3ステージに対応した3個のバ
    ンクを有するI/Oバッファと、 少なくとも交互に動作可能な並列的に配設された2つの
    バンクを有する第1のデータメモリと、 少なくとも交互に動作可能な並列的に配設された2つの
    バンクを有する第2のデータメモリと、 これらのI/Oバッファ、第1および第2のデータメモ
    リを相互接続する相互結合網と、 該相互結合網に接続された演算ユニットとを有する請求
    記載の画像コーデック用プロセッサ。
  4. 【請求項4】前記演算ユニットが、 加算、減算、各種論理演算、大小比較、差分絶対値演算
    およびバタフライ演算を行う2入力・2出力の拡張算術
    論理演算処理ユニットと、 前記係数メモリからの係数と、該拡張算術論理演算処理
    ユニットの出力との乗算を行う乗算ユニットと、 該乗算結果を累積処理する累積ユニットとを有する請求
    項3記載の画像コーデック用プロセッサ。
  5. 【請求項5】前記拡張算術論理演算処理ユニットの後段
    にパイプラインレジスタと、 前記乗算ユニットの後段にパイプラインレジスタと 前記累積ユニットの後段にパイプラインレジスタと が設けられ、 前記データ入力ステージ、計算ステージ、および、デー
    タ出力ステージからなる3ステージに対応したパイプラ
    イン処理を行う請求項4記載の画像コーデック用プロセ
    ッサ。
  6. 【請求項6】前記複数のブロックの画像データにまたが
    る信号処理が、フィールド画像信号処理であり、 前記1つのブロック内の画像データについての信号処理
    が、フレーム画像処理である請求項5記載の画像コーデ
    ック用プロセッサ。
  7. 【請求項7】画像コーデック処理としてマクロブロック
    を1処理単位として入力ステージ、計算ステージ、出力
    ステージの3ステージ構成でパイプライン処理を行う画
    像コーデック用プロセッサにおいて、 前記マクロブロックを構成する各ブロック対応に設けら
    れている要素プロセッサ内に、演算ユニットおよびダブ
    ルバッファ構成のデータメモリを有し、さらに、隣接す
    る要素プロセッサの演算結果を加算する回路を有し、各
    ブロックにおける画像コーデック処理を複数の要素プロ
    セッサを用いて「単一命令ストリーム・多重データスト
    リーム:SIMD」制御により並列に行うことを特徴と
    する画像コーデック用プロセッサ。
  8. 【請求項8】画像コーデック処理としてマクロブロック
    を1処理単位として入力ステージ、計算ステージ、出力
    ステージの3ステージ構成でパイプライン処理を行う画
    像コーデック用プロセッサにおいて、 前記マクロブロックを構成する各ブロック対応に設けら
    れている要素プロセッサ内に、演算ユニットおよびダブ
    ルバッファ構成のデータメモリを有し、さらに、隣接す
    る要素プロセッサの演算結果を加算する回路を有し、ま
    た、隣接する要素プロセッサのデータメモリ間でデータ
    転送を可能とし、各ブロックにおける画像コーデック処
    理を複数の要素プロセッサを用いて「単一命令ストリー
    ム・多重データストリーム:SIMD」制御により並列
    に行うことを特徴とする画像コーデック用プロセッサ。
  9. 【請求項9】請求項7または8記載の画像コーデック用
    プロセッサにおいて、 前記要素プロセッサのそれぞれが、 前記データ入力ステージ、計算ステージ、および、デー
    タ出力ステージからなる3ステージに対応した3個のバ
    ンクを有するI/Oバッファと、 少なくとも交互に動作可能な並列的に配設された2つの
    バンクを有する第1のデータメモリと、 少なくとも交互に動作可能な並列的に配設された2つの
    バンクを有する第2のデータメモリと、 これらのI/Oバッファ、第1および第2のデータメモ
    リを相互接続する相互結合網と、 該相互結合網に接続された演算ユニットとを有する画像
    コーデック用プロセッサ。
  10. 【請求項10】前記演算ユニットが、 加算、減算、各種論理演算、大小比較、差分絶対値演算
    およびバタフライ演算を行う2入力・2出力の拡張算術
    論理演算処理ユニットと、 前記係数メモリからの係数と、該拡張算術論理演算処理
    ユニットの出力との乗算を行う乗算ユニットと、 該乗算結果を累積処理する累積ユニットとを有する請求
    記載の画像コーデック用プロセッサ。
  11. 【請求項11】前記拡張算術論理演算処理ユニットの後
    段にパイプラインレジスタと、 前記乗算ユニットの後段にパイプラインレジスタと 前記累積ユニットの後段にパイプラインレジスタと が設けられ、 前記データ入力ステージ、計算ステージ、および、デー
    タ出力ステージからなる3ステージに対応したパイプラ
    イン処理を行う請求項10記載の画像コーデック用プロ
    セッサ。
  12. 【請求項12】前記画像コーデック用プロセッサが、そ
    れぞれがmxnの画像データで構成される複数のブロッ
    クからなるマクロブロックを1処理単位として、複数の
    ブロックの画像データにまたがる信号処理と1つのブロ
    ック内の画像データについての信号処理とを適応的に、
    単一の命令ストリームで多重データストリーム制御処理
    する「単一命令ストリーム・多重データストリーム:S
    IMD」制御を行う、請求項11記載の画像コーデック
    用プロセッサ。
  13. 【請求項13】前記複数のブロックの画像データにまた
    がる信号処理が、フィールド画像信号処理であり、 前記1つのブロック内の画像データについての信号処理
    が、フレーム画像処理である請求項12記載の画像コー
    デック用プロセッサ。
  14. 【請求項14】前記要素プロセッサの隣接する1対のも
    のが、隣接要素プロセッサ間データ転送路で接続され、
    前記マクロブロックに対応して設けられ、 これら複数の要素プロセッサに共通に係数を提供する共
    通係数メモリが設けられ、 前記複数のブロックの画像データにまたがる信号処理を
    行う複数対の要素プロセッサの出力にこれらの演算結果
    の加算を行う共通の加算回路を設け、 前記マクロブロック単位の処理画像データが前記要素プ
    ロセッサに入力される、請求項13記載の画像コーデッ
    ク用プロセッサ。
JP07476493A 1993-03-31 1993-03-31 画像コーデック用プロセッサ Expired - Fee Related JP3401823B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP07476493A JP3401823B2 (ja) 1993-03-31 1993-03-31 画像コーデック用プロセッサ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07476493A JP3401823B2 (ja) 1993-03-31 1993-03-31 画像コーデック用プロセッサ

Publications (2)

Publication Number Publication Date
JPH06290262A JPH06290262A (ja) 1994-10-18
JP3401823B2 true JP3401823B2 (ja) 2003-04-28

Family

ID=13556680

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07476493A Expired - Fee Related JP3401823B2 (ja) 1993-03-31 1993-03-31 画像コーデック用プロセッサ

Country Status (1)

Country Link
JP (1) JP3401823B2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100225690B1 (ko) * 1995-04-18 1999-10-15 모리시다 요이치 상관도 연산장치, 병렬상관도 연산장치 및 상관도연산방법
JPH08307868A (ja) * 1995-04-28 1996-11-22 Nec Corp 動画像復号装置
JPH11122506A (ja) * 1997-10-16 1999-04-30 Fujitsu Ltd 映像信号処理回路およびコンピュータシステム
JP4495873B2 (ja) * 2001-03-08 2010-07-07 株式会社リコー 画像処理装置
DE10206830B4 (de) 2002-02-18 2004-10-14 Systemonic Ag Verfahren und Anordnung zur Zusammenführung von Daten aus parallelen Datenpfaden
WO2005025230A1 (ja) * 2003-08-28 2005-03-17 Hitachi Ulsi Systems Co., Ltd. 画像処理装置
US8036274B2 (en) * 2005-08-12 2011-10-11 Microsoft Corporation SIMD lapped transform-based digital media encoding/decoding
JP4888306B2 (ja) * 2007-09-26 2012-02-29 ソニー株式会社 画像処理装置および画像処理方法
US8369638B2 (en) 2008-05-27 2013-02-05 Microsoft Corporation Reducing DC leakage in HD photo transform
US8447591B2 (en) 2008-05-30 2013-05-21 Microsoft Corporation Factorization of overlapping tranforms into two block transforms
US8275209B2 (en) 2008-10-10 2012-09-25 Microsoft Corporation Reduced DC gain mismatch and DC leakage in overlap transform processing
US9743091B2 (en) * 2012-12-17 2017-08-22 Lg Electronics Inc. Method for encoding/decoding image, and device using same

Also Published As

Publication number Publication date
JPH06290262A (ja) 1994-10-18

Similar Documents

Publication Publication Date Title
US5594679A (en) Adaptive video signal processing apparatus
US6052706A (en) Apparatus for performing fast multiplication
JP3401823B2 (ja) 画像コーデック用プロセッサ
US7574468B1 (en) Digital signal processor having inverse discrete cosine transform engine for video decoding and partitioned distributed arithmetic multiply/accumulate unit therefor
JPH04128982A (ja) プロセッサエレメント、プロセッシングユニット、プロセッサ、及びその演算処理方法
EP1108325A2 (en) Circuit and method for performing a two-dimensional transform during the processing of an image
US5793658A (en) Method and apparatus for viedo compression and decompression using high speed discrete cosine transform
US7756351B2 (en) Low power, high performance transform coprocessor for video compression
Asbun et al. Real-time error concealment in digital video streams using digital signal processors
KR0160324B1 (ko) 데이타 처리 장치
Furht Processor architectures for multimedia: a survey
JPH0879761A (ja) 動き予測装置および動きベクトルを計算する装置
JPH07121687A (ja) 画像コーデック用プロセッサおよびアクセスパターン変換方法
Furht Processor architectures for multimedia
Lai et al. VLSI implementation of the motion estimator with two-dimensional data-reuse
Husemann et al. New integrated architecture for H. 264 Transform and Quantization hardware implementation
JPH05268593A (ja) 差分絶対値和・差分自乗和並列演算装置
JP3004686B2 (ja) 符号化回路及び画像符号化装置
WO2005025230A1 (ja) 画像処理装置
Lee et al. Reconfigurable interpolation architecture for multistandard video decoding
Le et al. Computational RAM implementation of MPEG-2 for real-time encoding
KR100350943B1 (ko) 분포연산방식을 이용한 고속 dct 연산회로
Chang et al. An efficient design of H. 264 inter interpolator with bandwidth optimization
Bhaskaran et al. Multimedia enhancements for RISC processors
Faroqui et al. Impact of architecture extensions for media signal processing on data-path organization

Legal Events

Date Code Title Description
FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080229

Year of fee payment: 5

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090228

Year of fee payment: 6

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100228

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees