WO2006129518A1

WO2006129518A1 - メモリアクセス方法

Info

Publication number: WO2006129518A1
Application number: PCT/JP2006/310196
Authority: WO
Inventors: Akira Okamoto
Original assignee: Megachips Corporation
Priority date: 2005-05-30
Filing date: 2006-05-23
Publication date: 2006-12-07
Also published as: JPWO2006129518A1; US20100037013A1; JP5147102B2; US7979622B2

Abstract

　同一バンクへ連続してアクセスする際には前後のアクセス間に所定数のクロックサイクル以上の間隔を空けることが要求されるメモリを対象として、アクセス間の空き時間を解消してパフォーマンスを向上し得る、メモリアクセス方法を得る。　データ（Ｄ２1，Ｄ２2，Ｄ２3，Ｄ２4）が、それぞれ第０バンク（７０）、第１バンク（７１）、第２バンク（７２）、第３バンク（７３）に書き込まれる。異なるバンクへの連続アクセスであるため、互いに連続するデータ間には空き時間は発生しない。また、データ（Ｄ２1～Ｄ２4）のバースト長がいずれも８であるため、データ（Ｄ２1）の書き込みが開始されてからデータ（Ｄ２5）の書き込みが開始されるまでの間には、１５サイクル以上の１６サイクルの間隔が空いている。従って、データ（Ｄ２1）の書き込みが終了してからデータ（Ｄ２5）の書き込みが開始されるまでの間にも空き時間は発生しない。

Description

明細書

メモリアクセス方法

技術分野

[0001] 本発明は、メモリアクセス方法に関し、特に、トランスコーダ処理装置に用いられるメモリへのアクセス方法に関する。

背景技術

[0002] 画像符号ィ匕データを異なるビットレートに再符号ィ匕する従来のトランスコーダ処理装置が、下記特許文献 1に開示されている。図 20は、下記特許文献 1に示された従来のトランスコーダ処理装置の構成を示すブロック図である。図 20を参照して、復号器 201は、画像符号化データを復号し、その小ブロック単位の第 1の動きベクトルを抽出する機能手段を備える。変換処理部 203は、第 1の動きベクトルを縮小して第 3 の動きベクトルを算出する機能手段と、再符号化対象の小ブロックに含まれる第 3の動きベクトルと周囲の第 3の動きベクトルとのノルムの和が最小のものを第 2の動きべタトルとする機能手段と、その最小値を評価値とする機能手段と、該評価値が表す動きベクトルの精度が高いほど狭くした再探索範囲を小ブロック毎に決定し、評価値又は再探索範囲に応じて優先度を決定する機能手段とを備える。再探索処理部 204 は、該優先度の順に該優先度に対応した再探索範囲で再探索し再符号ィ匕時の動きベクトノレを求める。

[0003] 特許文献 1 :特開 2002— 344971号公報（要約書）

発明の開示

発明が解決しょうとする課題

[0004] し力しながら、上記特許文献 1に示された従来のトランスコーダ処理装置によると、復号器 201から出力された復号画像データを格納しておくためのメモリとして、例えば DDR (Double Data Rate)メモリのような、同一バンクへ連続してアクセスする際には前後のアクセス間に所定数のクロックサイクル以上の間隔を空けることが要求されるメモリが採用された場合の対策がとられて、な、と、う問題がある。

[0005] 本発明は力かる問題を解決するために成されたものであり、同一バンクへ連続してアクセスする際には前後のアクセス間に所定数のクロックサイクル以上の間隔を空けることが要求されるメモリを対象として、アクセス間の空き時間を解消してパフオーマンスを向上し得る、メモリアクセス方法を得ることを目的とする。

課題を解決するための手段

[0006] 第 1の発明に係るメモリアクセス方法は、第 1及び第 2のバンクを含む複数のバンクを有し、同一バンクへ連続してアクセスする際には前後のアクセス間に所定数のクロックサイクル以上の間隔を空けることが要求されるメモリを対象とした、メモリアクセス方法であって、前記メモリへ書き込むべき 2次元画像データは、一度のバースト転送によって転送可能なデータ量ごとに複数のデータ群に分割され、前記メモリへの前記 2次元画像データの書き込み動作は、同一バンクへの書き込みが連続しないよう、前記所定数のクロックサイクル内において、（a)前記複数のデータ群に含まれる第 1のデータ群を、前記第 1のバンクに書き込むステップと、（b)前記第 1のデータ群に連続する第 2のデータ群を、前記第 2のバンクに書き込むステップとを有することを特徴とする。

[0007] 第 2の発明に係るメモリアクセス方法は、第 1の発明に係るメモリアクセス方法において特に、前記第 1及び第 2のデータ群はそれぞれ、前記メモリ内に格納された前記 2次元画像データ内においては複数行に分割されて配置され、前記第 1のデータ群は奇数行に配置され、前記第 2のデータ群は偶数行に配置されることを特徴とする。

[0008] 第 3の発明に係るメモリアクセス方法は、第 1及び第 2のバンクを含む複数のバンクを有し、同一バンクへ連続してアクセスする際には前後のアクセス間に所定数のクロックサイクル以上の間隔を空けることが要求されるメモリを対象とした、メモリアクセス方法であって、前記メモリ内に格納されている 2次元画像データは、一度のバースト転送によって転送可能なデータ量ごとに複数のデータ群に分割されて前記メモリから読み出され、前記メモリからの前記 2次元画像データの読み出し動作は、同一バンク力もの読み出しが連続しないよう、前記所定数のクロックサイクル内において、（a)前記複数のデータ群に含まれる第 1のデータ群を、前記第 1のバンク力読み出すステップと、（b)前記第 1のデータ群に連続する第 2のデータ群を、前記第 2のバンクから読み出すステップとを有することを特徴とする。 [0009] 第 4の発明に係るメモリアクセス方法は、第 1又は第 3の発明に係るメモリアクセス方法において特に、前記 2次元画像データ内の着目ブロックの動きベクトルを抽出するために、前記着目ブロックの移動先と予想される参照ブロック内に含まれる複数のデータ群と、前記参照ブロックに隣接して規定される複数のブロック内に含まれる複数のデータ群とが、前記メモリから連続的に読み出されることを特徴とする。

[0010] 第 5の発明に係るメモリアクセス方法は、第 1又は第 3の発明に係るメモリアクセス方法において特に、前記第 1のバンクにアクセスしている途中に、前記第 1のバンクに対する他のアクセス要求が発生した場合において、前記第 2のバンクに対するァクセス要求も発生しているときには、前記他のアクセス要求に応じた前記第 1のバンクへのアクセスよりも、前記第 2のバンクへのアクセスが優先されることを特徴とする。

[0011] 第 6の発明に係るメモリアクセス方法は、第 1又は第 3の発明に係るメモリアクセス方法において特に、いずれも異なるバンクに対応する n個（n:前記複数のバンクの個数 )のデータ群が行方向に連続することによって構成されるデータ集合が、前記メモリ内に格納された前記 2次元画像データの各行内にぉ、て繰り返し配置されるように、前記 2次元画像データを構成するデータ群が前記メモリに書き込まれることを特徴とする。

発明の効果

[0012] 第 1の発明に係るメモリアクセス方法によれば、メモリへ 2次元画像データを書き込む際に第 1及び第 2のバンクを切り換えることにより、第 1及び第 2のデータ群を連続して書き込むことができる。その結果、前後のアクセス間に生じる空き時間を回避又は低減でき、パフォーマンスの向上を図ることができる。

[0013] 第 2の発明に係るメモリアクセス方法によれば、メモリから第 1のデータ群を読み出すことによって、 2次元画像データのうちの奇数行のデータのみを読み出すことができ、メモリから第 2のデータ群を読み出すことによって、 2次元画像データのうちの偶数行のデータのみを読み出すことができる。その結果、インタレース方式の画像を容易に読み出すことが可能となる。

[0014] 第 3の発明に係るメモリアクセス方法によれば、メモリから 2次元画像データを読み出す際に第 1及び第 2のバンクを切り換えることにより、第 1及び第 2のデータ群を連続して読み出すことができる。その結果、前後のアクセス間に生じる空き時間を回避又は低減でき、パフォーマンスの向上を図ることができる。

[0015] 第 4の発明に係るメモリアクセス方法によれば、バースト転送によって高速なデータ転送が可能なメモリを使用した場合に、多数のブロック内に含まれる多数のデータ群を 1回の動作で連続的に転送することにより、少数のデータ群を複数回に分けて転送する方法と比較すると、データ転送の効率を高めることができる。

[0016] 第 5の発明に係るメモリアクセス方法によれば、第 1のバンクに対する前後のァクセス間に生じる空き時間を有効に利用することができ、他のアクセス要求に応じた第 1 のバンクへのアクセスが完了した後に第 2のバンクへアクセスする場合と比較すると、全体として処理時間の短縮ィ匕を図ることができる。

[0017] 第 6の発明に係るメモリアクセス方法によれば、メモリ内に格納されている 2次元画像データを行方向へのスキャンによって読み出す場合、いずれも異なるバンクに対応する n個のデータ群が順番に読み出される。その結果、行方向へのスキャンを行う場合にも、前後のアクセス間に生じる空き時間を回避又は低減でき、パフォーマンスの向上を図ることができる。

[0018] この発明の目的、特徴、局面、および利点は、以下の詳細な説明と添付図面とによつて、より明白となる。

図面の簡単な説明

[0019] [図 1]本発明の実施の形態に係るトランスコーダ処理装置の構成を示すブロック図である。

[図 2]動き探索部における第 1の動きベクトル抽出処理を説明するための模式図である。

[図 3]動き探索部における第 1の動きベクトル抽出処理を説明するための模式図である。

[図 4]動き探索部における第 1の動きベクトル抽出処理を説明するための模式図である。

[図 5]動き探索部における第 2の動きベクトル抽出処理を説明するための模式図である。 [図 6]DDR2の読み出し特性を説明するためのタイミングチャートである。

[図 7]DDR2の書き込み特性を説明するためのタイミングチャートである。

[図 8]メモリへの復号データの書き込みシーケンスを説明するためのタイミングチヤ一トである。

[図 9]メモリへの復号データのマッピング方法を順に説明するための図である。

[図 10]メモリへの復号データのマッピング方法を順に説明するための図である。

[図 11]メモリへの復号データのマッピング方法を順に説明するための図である。

[図 12]メモリへの復号データのマッピング方法を順に説明するための図である。

[図 13]メモリへの復号データのマッピング方法を順に説明するための図である。

[図 14]メモリへの復号データのマッピング方法を順に説明するための図である。

[図 15]メモリへの復号データのマッピング方法を順に説明するための図である。

[図 16]メモリ内に格納されて、る 2次元画像データを示す図である。

[図 17]メモリからのデータの読み出しシーケンスを説明するためのタイミングチャートである。

[図 18]メモリ内に格納されている 2次元画像データの配置の変形例を示す図である。

[図 19]前後のアクセス間に空き時間が発生した場合の処理を説明するためのタイミングチャートである。

[図 20]従来のトランスコーダ処理装置の構成を示すブロック図である。

発明を実施するための最良の形態

[0020] 以下、本発明の実施の形態について、図面を用いて詳細に説明する。なお、異なる図面において同一の符号を付した要素は、同一又は相当する要素を示すものとする。

[0021] 図 1は、本発明の実施の形態に係るトランスコーダ処理装置の構成を示すブロック図である。本実施の形態に係るトランスコーダ処理装置では、一例として、 MPEG2 フォーマットで符号ィ匕された符号ィ匕データ力 H. 264フォーマットの符号ィ匕データに再符号化されるものとする。

[0022] トランスコーダ処理装置は、メモリ復号器 2、動き探索部 3、及び符号器 4を備えている。メモリ 1は、複数のバンクを有し、同一バンクへ連続してアクセスする際には前後のアクセス間に所定数のクロックサイクル (以下「サイクル」と略す)以上の間隔を空けることが要求されるメモリである。本実施の形態に係るトランスコーダ処理装置では、メモリ 1として、バス幅が 32ビットであり、バースト長が 8であり、 4個のバンク（第 0 ノンク 70、第 1バンク 71、第 2バンク 72、及び第 3バンク 73)を有する DDR2を想定している。バス幅が 32ビットで、バースト長が 8であるため、一度のバースト転送で 256 ( = 32 X 8)ビットのデータを転送することが可能である。また、メモリ 1の記憶領域の一部は、ノッファ領域 5, 6として割り当てられている。

[0023] MPEG2フォーマットで符号化された符号化データ D1のビットストリームは、バッファ領域 5に書き込まれる。本実施の形態に係るトランスコーダ処理装置では、符号ィ匕データ D1は、一例として、 8ビットの YUV420形式の画像データであるものとする。 8 ビットの YUV420形式の場合は、 1ピクセルあたりのデータ量は 12ビットとなる。なお、本実施の形態に係るトランスコーダ処理装置は、 8ビットの YUV420形式に限らず、他の任意の形式の画像データを処理することが可能である。

[0024] 復号器 2は、ノッファ領域 5から読み出した符号ィ匕データ D1のビットストリームを復号して、復号データ D2を出力する。復号データ D2はメモリ 1に書き込まれ、これにより、メモリ 1内に 2次元画像データが格納される。メモリ 1内に格納された 2次元画像データ、及びメモリ 1への復号データ D2の書き込みシーケンスについては、後に詳述する。また、復号器 2は、符号ィ匕データ D1内に含まれている動きベクトルに関する情報を抽出して、データ D3として動き探索部 3に入力する。

[0025] 動き探索部 3は、データ D3に基づき、メモリ 1内に格納されている 2次元画像データの中から、参照ブロックに関するデータ D4を読み出す。そして、ブロックマッチング法によって着目ブロックの動きベクトルを求め、データ D5として符号器 4に入力する。動き探索部 3における処理については、後に詳述する。

[0026] 符号器 4は、データ D5に基づいて、 H. 264フォーマットで再符号化された符号ィ匕データ D6を作成し、符号化データ D6のビットストリームをバッファ領域 6に書き込む。符号ィ匕データ D6のビットストリームは、ノッファ領域 6から読み出される。

[0027] なお、符号ィ匕データ D1のビットストリームは、ノッファ領域 5を介さずに復号器 2に直接入力されてもよいし、符号ィ匕データ D6のビットストリームは、バッファ領域 6を介さずに直接出力されてもょヽ。

[0028] <動き探索部 3における第 1の処理 >

図 2〜4は、動き探索部 3における第 1の動きベクトル抽出処理を説明するための模式図である。図 2を参照して、動き探索部 3は、第 nフレームの 2次元画像データ内における着目ブロック BLO (縦横各 16ピクセル)の位置と、復号器 2から入力された動きベクトル VOに関するデータ D3とに基づいて、第 n—lフレームの 2次元画像データ内において着目ブロック BLOの移動先と予想されるブロック BL1 (縦横各 16ピクセル )を割り出す。次に、動き探索部 3は、ブロック BL1を中心として、ブロック BL1よりも縦方向及び横方向にそれぞれ士 1ピクセル大き、サイズの参照ブロック BL2 (縦横各 1 8ピクセル）を規定する。そして、メモリ 1内に格納されている第 n—1フレームの 2次元画像データの中から、参照ブロック BL2に対応する部分のデータ D4を読み出す。メモリ 1からのデータ D4の読み出しシーケンスについては、後に詳述する。

[0029] 図 3を参照して、次に、動き探索部 3は、参照ブロック BL2内で着目ブロック BLOを順次移動させながら、各位置において類似度を判定し、参照ブロック BL2内で着目ブロック BLOに最も類似している箇所を求める。類似度の判定手法としては、周知のブロックマッチング法を用い、着目ブロック BLO内の各ピクセルと参照ブロック BL2内の各ピクセルとの画素値の差分を求め、差分の絶対値の総和によって類似度を判定する。ここでは、図 3に示した着目ブロック BLOの箇所 (参照ブロック BL2の左上隅）で、類似度が最も高力つたものとする。

[0030] 次に、動き探索部 3は、参照ブロック BL2の左上隅の着目ブロック BLOを中心として、その着目ブロック BLOよりも縦方向及び横方向にそれぞれ士 1ピクセル大きいサイズの参照ブロック BL3 (縦横各 18ピクセル)を規定する。そして、メモリ 1内に格納されている第 n—1フレームの 2次元画像データの中から、参照ブロック BL3に対応する部分のデータ D4を読み出す。そして、上記と同様に、ブロックマッチング法によって、参照ブロック BL3内で着目ブロック BLOに最も類似している箇所を求める。図 4には、参照ブロック BL3内で着目ブロック BLOに最も類似している箇所を、ブロック BL4 (縦横各 16ピクセル）として抜き出して示している。

[0031] 図 4を参照して、次に、動き探索部 3は、ブロック BL4を 4個の小ブロック BL4a〜4d (いずれも縦横各 8ピクセル）に区切り、その後、小ブロック BL4aを中心として、小ブロック BL4aよりも縦方向及び横方向にそれぞれ士 1ピクセル大きヽサイズの参照ブロック BL5 (縦横各 10ピクセル)を規定する。そして、メモリ 1内に格納されている第 n 1フレームの 2次元画像データの中から、参照ブロック BL5に対応する部分のデータ D4を読み出す。そして、上記と同様にブロックマッチング法によって類似判定を行うことにより、小ブロック BL4aに関する最適動きベクトルを求める。小ブロック BL4b〜 BL4dについても同様の処理を行い、小ブロック BL4b〜： BL4dに関する最適動きべタトルをそれぞれ求める。

[0032] <動き探索部 3における第 2の処理 >

図 5は、動き探索部 3における第 2の動きベクトル抽出処理を説明するための模式図である。まず、動き探索部 3は、第 nフレームの 2次元画像データ内における着目ブロック BLOの位置と、復号器 2から入力された動きベクトル VOに関するデータ D3とに基づいて、第 n— 1フレームの 2次元画像データ内において着目ブロック BLOの移動先と予想されるブロック BL1を割り出す。次に、動き探索部 3は、上下左右方向及び斜め方向でブロック BL1に隣接するブロック BLla〜BLlh (いずれも縦横各 16ピクセル)を規定する。これにより、ブロック BL1を中心とした、縦横各 48ピクセルの領域 RAが規定される。但し、領域 RAのサイズは縦横各 48ピクセルに限らず、ブロック BL la〜BLlhのサイズを変更することにより、任意のサイズに設定することが可能である

[0033] 次に、動き探索部 3は、メモリ 1内に格納されている第 n—1フレームの 2次元画像データの中から、領域 RAに対応する部分のデータ D4を連続的に読み出す。そして、領域 RA内で着目ブロック BLOを順次移動させながら、各位置においてブロックマツチング法によって類似度を判定することにより、領域 RA内で着目ブロック BLO〖こ最も類似している箇所を探索する。次に、図 4に示した処理と同様に、領域 RA内で着目ブロック BLOに最も類似しているブロックを 4個の小ブロックに区切り、各小ブロックに関する最適動きベクトルをそれぞれ求める。

[0034] < DDR2の読み出し特性及び書き込み特性 >

以下、図 1に示したメモリ 1として使用される DDR2の読み出し特性及び書き込み特性について説明する。図 6は、 DDR2の読み出し特性を説明するためのタイミングチヤートである。図 6では、この順に読み出すべきデータ D4 , D4力いずれも第 0バン

1 2

ク 70に書き込まれている場合を想定している。 DDR2では、例えば 12サイクルで同一バンク力ものデータの読み出しが可能である。つまり、図 6に示した例では、データ D4の読み出しがクロック COの立ち上がりから開始されているため、続くデータ D4の

1 2 読み出しは、クロック C12の立ち上がりから開始されることとなる。その結果、バースト長が 8であることを考慮すると、データ D4の読み出しが終了して力データ D4の読

1 2 み出しが開始されるまでの間に、例えば 8サイクルの空き時間が発生してしまう。

[0035] 図 7は、 DDR2の書き込み特性を説明するためのタイミングチャートである。図 7では、この順に書き込むべきデータ D2 , D2を、いずれも第 0バンク 70に書き込む場

1 2

合を想定している。 DDR2では、例えば 15サイクルで同一バンクへのデータの書き込みが可能である。つまり、図 7に示した例では、データ D2の書き込みがクロック CO

1

の立ち上がりから開始されているため、続くデータ D2の書き込みは、クロック C15の

2

立ち上がりから開始されることとなる。その結果、バースト長が 8であることを考慮すると、データ D2の書き込みが終了して力データ D2の書き込みが開始されるまでの

1 2

間に、例えば 11サイクルの空き時間が発生してしまう。

[0036] また、図 6, 7には示していないが、 DDR2では、同一バンクに対する読み出しァクセス及び書き込みアクセスをこの順に連続させる場合には、例えば 7サイクルの空き時間が発生してしまい、同一バンクに対する書き込みアクセス及び読み出しアクセスをこの順に連続させる場合には、例えば 12サイクルの空き時間が発生してしまう。

[0037] そこで、本実施の形態に係るトランスコーダ処理装置では、前後のアクセス間に空き時間が発生しないように、メモリ 1への復号データ D2の書き込みシーケンス、及びメモリ 1からのデータ D4の読み出しシーケンスを、以下のように規定する。

[0038] <メモリ 1への書き込みシーケンス >

まず、復号器 2からメモリ 1への復号データ D2の書き込みシーケンスについて説明する。図 8は、メモリ 1への復号データ D2の書き込みシーケンスを説明するためのタイミングチャートである。図 1, 8を参照して、本実施の形態に係るトランスコーダ処理装置では、この順に書き込むべきデータ D2 , D2 , D2 , D2 , D2 , · · ·力それぞれ第 0ノンク 70、第 1バンク 71、第 2バンク 72、第 3バンク 73、第 0ノンク 70、 · · ·に書き込まれる。異なるバンクへの連続アクセスであるため、データ D2とデータ D2との間

1 2

、データ D2とデータ D2との間、データ D2とデータ D2との間、及びデータ D2とデ

2 3 3 4 4 ータ D2との間には、いずれも空き時間は発生しない。また、データ D2 , D2はいず

5 1 5 れも第 0バンク 70へ書き込まれる力データ D2 〜D2のバースト長がいずれも 8であ

1 4

るため、データ D2の書き込みが開始されて力データ D2の書き込みが開始される

1 5

までの間には、 15サイクル以上の 16サイクルの間隔が空いている。従って、データ D 2の書き込みが終了して力もデータ D2の書き込みが開始されるまでの間にも、空き

1 5

時間は発生しない。

[0039] このように本実施の形態に係るトランスコーダ処理装置によれば、メモリ 1として DD R2を用いた場合であっても、復号器 2からメモリ 1へ復号データ D2を書き込む際に生じる空き時間を回避又は低減できるため、パフォーマンスの向上を図ることができる。

[0040] 図 9〜15は、メモリ 1への復号データ D2のマッピング方法を順に説明するための図である。ここでは図面の簡略化のため、 2行 X 3列の合計 6個のマクロブロック MB11 〜MB13, MB21〜MB23 (いずれも縦横各 16ピクセル）を代表的に示している。なお、一度のバースト転送で 256ビットのデータを転送可能であり、 1ピクセルあたりのデータ量は 12ビットであるため、一度のバースト転送で最大 21ピクセル分のデータを転送可能である。しかし、偶数個のピクセルのほうが扱いが容易であるため、本実施の形態に係るトランスコーダ処理装置では、一度のバースト転送で 20ピクセル分のデータが転送されるものとする。

[0041] 図 9を参照して、まず、第 0バンク 70に書き込まれる 20ピクセル分のデータ D2力

1

10ピクセル単位で 2つに分割されて、マクロブロック MB11の第 1行第 1〜10列と第 3 行第 1〜： L0列とに、それぞれ配置される。なお、各ピクセル内に付した数字は、そのピクセルのデータが書き込まれるバンクの番号を意味する。

[0042] 図 10を参照して、次に、第 1バンク 71に書き込まれる 20ピクセル分のデータ D2が

2

、同様に 10ピクセル単位で 2つに分割されて、マクロブロック MB11の第 2行第 1〜1 0列と第 4行第 1〜10列とに配置される。 [0043] バンクを切り換えながら下方向に向力つて書き込みが進行し、データ D2 , D2と同

1 2 様の処理がデータ D2〜D2についても繰り返されることにより、図 11に示すように、

3 8

マクロブロック MB 11の第 1〜 16行第 1〜 10列までの配置が完了する。

[0044] 図 12を参照して、第 2バンク 72に書き込まれる 20ピクセル分のデータ D2力同様

9 に 10ピクセル単位で 2つに分割されて、マクロブロック MB11の第 1行第 11〜16列と第 3行第 11〜16列とに、それぞれ配置される。なお、マクロブロック MB12〖こマスク処理を施すことによって、 X印を付した部分のデータ D2がマクロブロック MB12に

9

書き込まれることが防止される。

[0045] データ D2と同様の処理をデータ D2 〜D2 についても繰り返すことにより、図 13

9 10 16

に示すように、マクロブロック MB11の第 1〜16行第 11〜16列までの配置が完了する。つまり、マクロブロック MB11へのデータの書き込みが完了する。

[0046] 図 14を参照して、次に、データ D2〜D2 と同様の処理をデータ D2 〜D2 につ

9 16 17 24 いても繰り返すことにより、図 14に示すように、マクロブロック MB12の第 1〜16行第 1〜4列までの配置が完了する。なお、マクロブロック MB11にマスク処理を施すことによって、 X印を付した部分のデータ D2 〜D2 がマクロブロック MB11に書き込ま

17 24

れることが防止される。

[0047] その後は、上記と同様の処理が繰り返されることにより、マクロブロック MB12, MB 13, MB21, MB22, MB23の順で書き込みが進行し、図 15に示した 2次元画像データが得られる。

[0048] くメモリ 1からの読み出しシーケンス〉

次に、動き探索部 3によるメモリ 1からのデータ D4の読み出しシーケンスについて説明する。図 16は、メモリ 1内に格納されている 2次元画像データを示す図であり、図 1 5に示した 2次元画像データに対応する。以下、図 16中に一点鎖線で示した箇所に参照ブロック BL2が規定されたものと仮定する。また、以下では、動き探索部 3が第 1 の動きベクトル抽出処理（図 2〜4参照）を行う場合の読み出し動作について説明するが、第 2の動きべ外ル抽出処理 (図 5参照)を行う場合であっても、基本的な動作の内容は同様である。

[0049] まず、メモリブロック MB 12の第 9行第 5〜 14列及び第 11行第 5〜 14列に配置されている 20ピクセル分のデータ D4 1S 第 0バンク 70から読み出される。次に、メモリブ

1

ロック MB12の第 10行第 5〜14列及び第 12行第 5〜14列に配置されている 20ピクセル分のデータ D4 1S 第 1バンク 71から読み出される。同様に、バンクを切り換えな

2

力下方向に向力つて読み出しが進行することにより、データ D4 , D4 , D4 , · · · ,

3 4 5

D4 の順に読み出しが行われる。その後、列を切り換えて、データ D4 〜D4 がこ

10 11 20 の順に読み出され、さらに列を切り換えて、データ D4 〜D4 力この順に読み出され

21 30

る。

[0050] 図 17は、メモリ 1からのデータ D4の読み出しシーケンスを説明するためのタイミングチャートである。本実施の形態に係るトランスコーダ処理装置では、この順に読み出されるべきデータ D4 , D4 , D4 , D4 , D4 , · · ·力それぞれ第 0バンク 70、第 1バ

1 2 3 4 5

ンク 71、第 2バンク 72、第 3バンク 73、第 0バンク 70、 · · ·に書き込まれている。従つて、読み出しの際には異なるバンクへの連続アクセスとなるため、データ D4とデータ

1

D4との間、データ D4とデータ D4との間、データ D4とデータ D4との間、及びデ

2 2 3 3 4

ータ D4とデータ D4との間には、いずれも空き時間は発生しない。また、データ D4

4 5 1

， D4はいずれも第 0バンク 70から読み出される力データ D4〜D4のバースト長が

5 1 4 いずれも 8であるため、データ D4の読み出しが開始されて力データ D4の読み出

1 5 しが開始されるまでの間には、 12サイクル以上の 16サイクルの間隔が空いている。従って、データ D4の読み出しが終了して力データ D4の読み出しが開始されるま

1 5

での間にも、空き時間は発生しない。

[0051] このように本実施の形態に係るトランスコーダ処理装置によれば、メモリ 1として DD R2を用いた場合であっても、動き探索部 3がメモリ 1からデータ D4を読み出す際に生じる空き時間を回避又は低減できるため、パフォーマンスの向上を図ることができる。

[0052] なお、図 16を参照して、インタレース方式の参照ブロック BL2が必要な場合には、データ D4 , D4 , D4 , · · · , D4 の順に読み出しを行えばよい。例えばデータ D4

1 3 5 29 1 は、 10ピクセル単位で 2つに分割され、 10ピクセル分のデータが 2次元画像データの奇数行に配置されている。従って、データ D4を読み出すことによって奇数 2行分

1

のデータが自動的に読み出されるため、インタレース方式の参照ブロック BL2を容易に得ることができる。

[0053] また、データ D4〜D4 のうち図 16において砂地のハッチングを付した部分は、参

1 30

照ブロック BL2の外に配置されているため、本来ならば読み出しが不要なデータである。しかし、本実施の形態に係るトランスコーダ処理装置は、 20ピクセル分のデータ群を一単位としたバースト転送を想定して、るため、これらの不要なデータもメモリ 1 力読み出されて動き探索部 3に転送される。

[0054] 参照ブロック BL2のデータを読み出す場合と同様に、図 3に示した参照ブロック BL 3のデータをメモリ 1から読み出す場合にも、動き探索部 3への不要なデータの転送が行われる。従って、図 2〜4に示した方法によると、メモリ 1から動き探索部 3へ転送されるデータの全転送量のうち、不要なデータの転送量が占める割合が大きくなる。

[0055] 一方、図 5に示した方法によると、互いに隣接するブロック BL1, BLla〜BLlh同士の境界では不要なデータは発生せず、領域 RAの外周部分でしか不要なデータは発生しない。そのため、メモリ 1から動き探索部 3へ転送されるデータの全転送量のうち、不要なデータの転送量が占める割合は、図 2〜4に示した方法よりも少なくなる

[0056] また、 DDR2ではバースト転送によって高速なデータ転送が可能であるため、少量のデータを複数回に分けて転送する図 2〜4に示した方法よりも、多量のデータを 1 回で転送する図 5に示した方法のほうがデータ転送の効率が高い。

[0057] < 2次元画像データの配置の変形例 >

図 18は、メモリ 1内に格納されている 2次元画像データの配置の変形例を示す図である。図 15に示した例では、 2次元画像データ内の全領域において、奇数行が第 0 バンク 70及び第 2バンク 72に対応し、偶数行が第 1バンク 71及び第 3バンク 73に対応していた。これに対し、図 18に示した 2次元画像データでは、全列中の半分の列において、行の奇偶とバンク番号との対応関係が、図 15に示した 2次元画像データとは逆になつている。図 18に示した例によると、メモリブロック MB12, MB22の第 5〜1 6列、及びメモリブロック MB13, MB23の第 1〜8列においては、図 15に示した例とは逆に、奇数行が第 1バンク 71及び第 3バンク 73に対応し、偶数行が第 0バンク 70 及び第 2バンク 72に対応して、る。 [0058] その結果、図 18に示した 2次元画像データの例えば第 1行を参照すると、左端のピクセルを含む最初の 10列分が第 0バンク 70に対応し、次の 10列分が第 2バンク 72 に対応し、さらに次の 10列分が第 1バンク 71に対応し、さらに次の 10列分が第 3バンク 73に対応している。つまり、 1行内で連続する 40列分のデータ集合の中に、第 0バンク 70から第 3バンク 73までの全てのバンクに対応するデータが含まれて!/、る。そして、実際にはマクロブロックの個数は多数であるため、この 1行 X 40列分のデータ集合（つまり、全てのバンクに対応するデータを含むデータ集合）が、 2次元画像データの第 1行内において繰り返し配置されることになる。以上では 2次元画像データの第 1行を例にとり説明した力第 2行以降の全ての行についても同様である。

[0059] 図 18に示した 2次元画像データをラスタスキャンによって読み出す場合、例えば 2 次元画像データの第 1行を左端力右方向に走査する場合には、第 0バンク 70、第 2バンク 72、第 1バンク 71、第 3バンク 73、 · · ·の順にアクセスされる。つまり、 4個のバンクが順番にアクセスされて読み出しが行われる。そのため、図 17に示した例と同様に、ラスタスキャンを行う場合にも前後のアクセス間に空き時間は発生しない。従つて、図 18に示した 2次元画像データは、メモリ 1内に格納されている 2次元画像データをラスタスキャンしてディスプレイ（図示しな、）に表示する等の用途がある場合に、特に有効となる。

[0060] <空き時間が生じた場合の割り込み処理 >

図 19は、前後のアクセス間に空き時間が発生した場合の処理を説明するためのタイミングチャートである。ここでは、データ D2Wの書き込みのために第 0バンク 70へ

0

アクセスしている途中に、第 0バンク 70からデータ D4Rを読み出すためのアクセス要

0

求が発生した場合を想定している。上記の通り、 DDR2では、同一バンクに対する書き込みアクセス及び読み出しアクセスをこの順に連続させる場合には、 12サイクルの空き時間が発生してしまう。つまり、図 19に示した例では、データ D2Wの書き込み

0

力クロック COの立ち上がりから開始されているため、データ D4Rの読み出しは、クロ

0

ック C16の立ち上がりから開始されることとなる。

[0061] このような場合にお、て、データ D4Rを読み出すための第 0バンク 70へのアクセス

0

要求のほかに、他のバンクへのアクセス要求も発生している場合には、当該他のバンクへのアクセス要求を優先して処理する。例えば、データ D2Wの書き込みのために

1

第 1バンク 71へのアクセス要求が発生している場合には、図 19に示したように、第 0 バンク 70へのデータ D2Wの書き込みが終了した後、第 1バンク 71へのデータ D2W

0

の書き込みを行い、その後に、第 0バンク 70からのデータ D4Rの読み出しを行う。

1 0

[0062] これにより、空き時間を有効に利用することができ、データ D4Rを読み出した後に

0

データ D2Wを書き込む場合と比較すると、全体として処理時間の短縮化を図ること

1

ができる。

[0063] 以上では、同一バンクに対する書き込みアクセス及び読み出しアクセスをこの順に連続させる場合の空き時間の有効利用について説明したが、同一バンクに対する複数の書き込みアクセスを連続させる場合、同一バンクに対する複数の読み出しァクセスを連続させる場合、又は、同一バンクに対する読み出しアクセス及び書き込みァクセスをこの順に連続させる場合にっ、ても、上記と同様に他のバンクへのアクセス要求を優先して処理することによって、空き時間を有効利用することが可能である。

[0064] 以下、空き時間が発生した場合に優先して実行する処理内容及び優先順位について説明する。

[0065] 本実施の形態に係るトランスコーダ処理装置は、メモリ 1内に格納されている 2次元画像データを読み出して、ディスプレイ（図示しない）に画像を表示する機能を有している。画像を表示するために 2次元画像データを読み出す処理にはリアルタイム性が要求されるため、空き時間が発生した場合には、この処理 (表示のための 2次元画像データの読み出し処理)を最優先に実行する。つまり、表示のための 2次元画像データの読み出し処理の優先順位を 1番とする。

[0066] 動き探索部 3がメモリ 1から読み出す参照ブロック BL2, BL3 (図 3参照）や領域 RA

(図 5参照）のデータ D4は、データ量が多い。また、動き探索部 3が速やかに処理を進めるためには、メモリ 1から動き探索部 3へデータ D4を素早く転送する必要がある。そこで、空き時間が発生した場合には、データ D4の読み出し処理を、上記表示のための 2次元画像データの読み出し処理に次いで優先して実行する。つまり、データ D 4の読み出し処理の優先順位を 2番とする。

[0067] 図 1を参照して、符号化データ D1は MPEG2フォーマットで符号化されたデータであるため、データ量は少ない。また、メモリ 1に対する読み出しアクセスと書き込みァクセスとの切り換え回数は、なるべく抑える必要がある。そこで、空き時間が発生した場合には、バッファ領域 5からの符号化データ D1の読み出し処理を、上記データ D4の読み出し処理に次いで優先して実行する。つまり、符号化データ D1の読み出し処理の優先順位を 3番とする。

[0068] 同様に、符号ィ匕データ D6は H. 264フォーマットで符号ィ匕されたデータであるため、データ量は少ない。また、メモリ 1に対する読み出しアクセスと書き込みアクセスとの切り換え回数は、なるべく抑える必要がある。そこで、空き時間が発生した場合には、バッファ領域 6からの符号化データ D6の読み出し処理を、上記符号化データ D1の読み出し処理に次いで優先して実行する。つまり、符号化データ D6の読み出し処理の優先順位を 4番とする。

[0069] 復号器 2からメモリ 1に書き込まれる復号データ D2は、符号化データ D1が復号されたものであるため、データ量が多い。そこで、空き時間が発生した場合には、メモリ 1 への復号データ D2の書き込み処理を、上記符号化データ D6の読み出し処理に次いで優先して実行する。つまり、復号データ D2の書き込み処理の優先順位を 5番とする。

[0070] 上記の通り、符号化データ D1は MPEG2フォーマットで符号化されたデータであるため、データ量は少ない。そこで、空き時間が発生した場合には、ノッファ領域 5への符号化データ D1の書き込み処理を、上記データ D2の書き込み処理に次、で優先して実行する。つまり、符号ィ匕データ D1の書き込み処理の優先順位を 6番とする。

[0071] 同様に、符号ィ匕データ D6は H. 264フォーマットで符号ィ匕されたデータであるため、データ量は少ない。そこで、空き時間が発生した場合には、バッファ領域 6への符号化データ D6の書き込み処理を、上記符号化データ D1の書き込み処理に次ヽで優先して実行する。つまり、符号化データ D6の書き込み処理の優先順位を 7番とする。

[0072] なお、以上で説明した各処理の優先順位は一例であり、任意に変更することが可能である。

[0073] この発明は詳細に説明されたが、上記した説明は、すべての局面において、例示であって、この発明がそれに限定されるものではない。例示されていない無数の変形例力この発明の範囲力外れることなく想定され得るものと解される。

Claims

請求の範囲

[1] 第 1及び第 2のバンクを含む複数のバンク（70〜73)を有し、同一バンクへ連続してアクセスする際には前後のアクセス間に所定数のクロックサイクル以上の間隔を空けることが要求されるメモリ（1)を対象とした、メモリアクセス方法であって、

前記メモリへ書き込むべき 2次元画像データ（D2)は、一度のバースト転送によって転送可能なデータ量ごとに複数のデータ群に分割され、

前記メモリへの前記 2次元画像データの書き込み動作は、同一バンクへの書き込みが連続しな、よう、前記所定数のクロックサイクル内にぉ、て、

(a)前記複数のデータ群に含まれる第 1のデータ群 (D2 )を、前記第 1のバンクに

1

書き込むステップと、

(b)前記第 1のデータ群に連続する第 2のデータ群 (D2 )を、前記第 2のバンクに

2

書き込むステップと

を有する、メモリアクセス方法。

[2] 前記第 1及び第 2のデータ群はそれぞれ、前記メモリ内に格納された前記 2次元画像データ内においては複数行に分割されて配置され、

前記第 1のデータ群は奇数行に配置され、前記第 2のデータ群は偶数行に配置される、請求項 1に記載のメモリアクセス方法。

[3] 第 1及び第 2のバンクを含む複数のバンク（70〜73)を有し、同一バンクへ連続してアクセスする際には前後のアクセス間に所定数のクロックサイクル以上の間隔を空けることが要求されるメモリ（1)を対象とした、メモリアクセス方法であって、

前記メモリ内に格納されている 2次元画像データ (D4)は、一度のバースト転送によつて転送可能なデータ量ごとに複数のデータ群に分割されて前記メモリから読み出され、

前記メモリからの前記 2次元画像データの読み出し動作は、同一バンク力もの読み出しが連続しな、よう、前記所定数のクロックサイクル内にぉ、て、

(a)前記複数のデータ群に含まれる第 1のデータ群 (D4 )を、前記第 1のバンクから

1

読み出すステップと、

(b)前記第 1のデータ群に連続する第 2のデータ群 (D4 )を、前記第 2のバンクから読み出すステップと

を有する、メモリアクセス方法。

[4] 前記 2次元画像データ内の着目ブロック (BLO)の動きベクトルを抽出するために、前記着目ブロックの移動先と予想されるブロック（BL1)内に含まれる複数のデータ群と、前記ブロックに隣接して規定される複数のブロック (BLla〜BLlh)内に含まれる複数のデータ群とが、前記メモリから連続的に読み出される、請求項 1又は 3に記載のメモリアクセス方法。

[5] 前記第 1のバンクにアクセスして、る途中に、前記第 1のバンクに対する他のァクセス要求が発生した場合にぉ、て、前記第 2のバンクに対するアクセス要求も発生しているときには、前記他のアクセス要求に応じた前記第 1のバンクへのアクセスよりも、前記第 2のバンクへのアクセスが優先される、請求項 1又は 3に記載のメモリアクセス方法。

[6] いずれも異なるバンクに対応する n個（n:前記複数のバンクの個数)のデータ群が行方向に連続することによって構成されるデータ集合が、前記メモリ内に格納された前記 2次元画像データの各行内において繰り返し配置されるように、前記 2次元画像データを構成するデータ群が前記メモリに書き込まれる、請求項 1又は 3に記載のメモリアクセス方法。