JP2001290706A

JP2001290706A - Ｔｌｂキャッシュのためのプリフェッチ

Info

Publication number: JP2001290706A
Application number: JP2001100260A
Authority: JP
Inventors: Gerard Chauvel; ショベルジェラール; Serge Lassere; ラサールセルジュ; Inverno Dominique Benoit Jacques D; ベノワジャックダンベルノドミニク; Ferguson Edward; ファーガソンエドワード
Original assignee: Texas Instruments Inc
Current assignee: Texas Instruments Inc
Priority date: 2000-03-31
Filing date: 2001-03-30
Publication date: 2001-10-19
Also published as: EP1139222A1

Abstract

(57)【要約】【課題】マルチプロセッサ環境において保護メカニズ
ムおよびダイナミックメモリ管理をサポートするため
に、メモリ管理ユニットを提供する。【解決手段】デジタル信号プロセッサ（３０）または
他の処理装置で使用されるメモリ管理ユニット（４２）
に、プリフェッチコマンドに応答して仮想アドレスから
物理アドレスへの変換を実行する回路を設ける。プリフ
ェッチコマンドはダミーレジスタへの書き込みアクセス
を実行することによって開始される。プリフェッチコマ
ンドが検出されると、生成された仮想アドレスに関連す
る物理ベースアドレスがＴＬＢに現在存在するか否かを
確認するためにＴＬＢがチェックされる。存在しなけれ
ば、ウォーキングテーブルロジックは、変換結果を取得
するためにメインメモリ（３４）のテーブルルックアッ
プを実行する。ウォーキングテーブルロジックの動作
は、ＤＳＰコア（３６）による連続動作を妨げずに行わ
れる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は一般に電子回路、特
に計算装置に関するものである。

【０００２】

【発明が解決しようとする課題】計算志向タスクを実行
するために、多くの新しい電子装置においてデジタル信
号プロセッサ（ＤＳＰ）が利用される。ＤＳＰ、ＭＰＵ
（マイクロプロセッサユニット）および共有メモリを含
むマルチプロセッサ環境において、保護メカニズムとダ
イナミックメモリ管理をサポートするために、現在では
ＤＳＰはＭＰＵに含まれる機能に似た完全なメモリ管理
ユニット（ＭＭＵ）を持つ必要がある。装置によって
は、複数プロセッサの１つに動的にタスクをダウンロー
ドして、それにしたがってメモリを管理する必要があ
る。

【０００３】従って、ＤＳＰ上で実行中のタスクがマス
タープロセッサによって管理される共有メモリプールか
ら空きメモリを予約する場合、いくらかのＭＭＵハード
ウェアサポートをＤＳＰに統合する必要が生じる。

【０００４】ＤＳＰで実行されるタスクのタイプによっ
ては、信号が処理中であることに起因して特定のリアル
タイムの制約がしばしば伴う。例えば、ＤＳＰは一般的
にビデオ・オーディオ処理と音声認識がサポートされる
装置で使用される。イベントの発生を待っている間ＤＳ
Ｐの処理動作を中断しなければならないと、これらの機
能はかなり損なわれるであろう。ＭＭＵを付加すれば、
ある程度の非決定性挙動が導入される。現在のアクセス
に対応する情報がＴＬＢ（ｔｒａｎｓｌａｔｉｏｎｌ
ｏｏｋａｓｉｄｅｂｕｆｆｅｒ）キャッシュに存在し
ないとき（ＴＬＢミス）、情報はメインメモリ中のテー
ブルから検索する必要がある（「テーブルウォーキン
グ」ｔａｂｌｅｗａｌｋｉｎｇ）。この動作は数十〜
数百のマイクロプロセッササイクルを要する。ＭＭＵに
よるテーブルウォーキング中、コアの動作は停止され、
ＤＳＰの機能が低下あるいは変動する。

【０００５】したがって、ＤＳＰや他の処理装置用の予
測可能な（ｐｒｅｄｉｃｔａｂｌｅ）ＭＭＵ設計が必要
である。

【０００６】

【課題を解決するための手段】本発明によれば、多重プ
ロセッサ装置はメインメモリ、メインメモリに接続され
たマイクロプロセッサ、デジタル信号プロセッサを有す
る。デジタル信号プロセッサには、命令実行用プロセッ
サコアとメモリ管理ユニットを含む。メモリ管理ユニッ
トには、仮想ベースアドレスに関連するプリフェッチコ
マンドを検出するための回路と、プロセッサコアが命令
実行中にプリフェッチコマンドに応答してメインメモリ
から物理的ベースアドレスへの仮想ベースアドレス変換
を行うための回路とが含まれる。

【０００７】本発明は従来技術より優れた利点を提供す
る。仮想ベースアドレスのプリフェッチを可能にするこ
とにより、ＴＬＢミスによる待ち時間が排除または大幅
に減少する。メインメモリにおける物理アドレスのテー
ブルルックアップの実行中にＤＳＰコアが命令実行を継
続することができるので、プリフェッチ命令に起因する
待ち時間は最小限に抑えられる。本発明およびその特長
を更に理解するために、以下の記述では付図を参照す
る。

【０００８】

【発明の実施の形態】付図１〜図４にしたがって本発明
を詳細に説明する。なお、付図において同等部材には同
一参照符号が使用される。

【０００９】図１はマイクロプロセッサユニットで使用
されるような最新技術のＭＭＵ１０のブロック図であ
る。ＴＬＢ（ｔｒａｎｓｌａｔｉｏｎｌｏｏｋａｓｉ
ｄｅｂｕｆｆｅｒ）キャッシュ１２には、ＲＡＭ１６と
結合されるＣＡＭ１４が含まれる。ＲＡＭ１６は、ＴＬ
Ｂ１２にキャッシュされた仮想アドレスに関連する物理
アドレスを求めて上位アドレスビット（ベースアドレ
ス）をキャッシュする。ＲＡＭ１６の各物理ベースアド
レスについて、対応するＣＡＭアドレスにおける物理ベ
ースアドレスに関連する対応の仮想アドレスビットの上
位アドレスビットがＣＡＭ１２に格納される。したがっ
て、ＣＡＭ１４のアドレス“０１”に格納された仮想ベ
ースアドレスはＲＡＭ１６のアドレス“０１”における
物理ベースアドレスに対応する。

【００１０】マイクロプロセッサコアが仮想アドレスを
要求すると、ＣＡＭ１４に仮想ベースアドレスが格納さ
れているか否かを調べるためにＴＬＢキャッシュ１２が
チェックされる。格納されていれば（キャッシュヒッ
ト）、ＲＡＭ１６の対応位置から物理ベースアドレスが
検索される。物理ベースアドレスは、完全な物理アドレ
スを決定するために仮想アドレス（ページインデック
ス）の下位ビットと連結される。この物理アドレスはメ
モリ（以下、「メイン」メモリと呼ぶ）のアクセスに使
用される。ＲＡＭ１６には、物理ベースアドレスの他
に、各物理ベースアドレスのための保護ビット（ＡＰ）
も格納することができる。保護ビットは、対応するメモ
リページの使い方（例えば、書き込み禁止、実行のみ
等）を定義する。これらのビットはメモリアクセス中に
チェックされる。例えば、あるページが書き込み禁止に
されている場合にデータ書き込みでアクセスすると、Ｃ
ＰＵに例外が返され、アドレスステータスレジスタは、
対応する違反タイプ、この場合の書き込みアクセス許可
違反で更新される。また、アドレスはデバッグあるいは
リカバリのために違反アドレスレジスタに格納される。
同様に、実行のみと定義されたページは、データアクセ
ス時に違反を生成する。

【００１１】しかし、ＴＬＢキャッシュ１２は限られた
数の物理仮想ベースアドレスしか格納することができ
ず、一般に、その数は可能な仮想ベースアドレス数より
もはるかに少ない。したがって、コード実行時にマイク
ロプロセッサから要求される仮想アドレスがＴＬＢキャ
ッシュで見つからないことがある。これをキャッシュ
「ミス」と呼ぶ。ＴＬＢキャッシュミスが生じると、複
数のアクションが取られる。まず、マイクロプロセッサ
コアから要求される仮想アドレスに対応する物理ベース
アドレスは、ＷＴＬ（ウォーキングテーブルロジック）
２０がメインメモリに格納されているテーブルを参照し
て決定する。テーブルウォーキング過程中、Ｒｅａｄｙ
信号を無効にすることによって、プロセッサコアが待ち
状態に置かれる。

【００１２】図２は、図１のウォーキングテーブルロジ
ックに関連して、仮想ベースアドレスから物理ベースア
ドレスを導くためのウォーキングテーブル過程を例示し
ている。ウォーキングテーブルロジック法は当該技術分
野でよく知られていて、図２はその過程の基本を示して
いる。ウォーキングテーブルロジック２０のＴＴＢレジ
スタ２２は外部メモリ（図示せず）に格納された第１レ
ベルの記述子テーブルのベースを示すアドレスを保持す
る。処理コア１２からの仮想アドレスには数個のインデ
ックスフィールドが含まれ、それらの数および位置は仮
想アドレスに関連するページタイプによって異なる。仮
想アドレスからの変換テーブルベース（ＴＴＢレジス
タ）アドレスおよびｉｎｄｅｘ１は、第１レベルの記述
子テーブル内の位置を識別するために連結される。この
位置はウォーキングテーブルロジック２０にベースアド
レスおよび「Ｐビット」を与えるもので、「Ｐビット」
は、ベースアドレスが仮想アドレスに関連する物理的な
メモリ位置を指すのか、または低位レベルの記述子テー
ブルを指すかのかをウォーキングテーブルロジックに知
らせる。図２において、この位置はメインメモリ２４の
第２レベルの記述子テーブルへのベースアドレスを示し
ている。

【００１３】このベースアドレスは仮想アドレスからの
ｉｎｄｅｘ２と連結されて第２レベルの記述子テーブル
中の位置を指す。その位置はもう一つづつのベースアド
レスおよびＰビットを与える。図では、Ｐビットは、関
連ベースアドレスが第３レベルの記述子テーブル内の位
置を指すことを示している。したがって、ベースアドレ
スは仮想アドレスからのｉｎｄｅｘ３と連結され、第３
レベルの記述子テーブル内の位置を指す。この位置はベ
ースアドレスと関連Ｐビットを与え、ベースアドレスが
所望の物理アドレスに関連することを示す。また、位置
は物理アドレスに関連する許可ビットも含む。したがっ
て、ベースアドレスはメインメモリにアクセスするため
の仮想アドレスからのページインデックスと連結され
る。

【００１４】この例では所望物理アドレスのベースアド
レスを識別するのに３個の記述子テーブルを使用してい
るが、任意数のテーブルを使用することができる。物理
アドレスを決定するために使用されるテーブル数は、物
理アドレスに関連するページサイズによって変わる。

【００１５】物理アドレスを形成するために使用される
ベースアドレスと、許可ビットは、ＴＬＢキャッシュの
ＲＡＭ部分にロードされる前に、ウォーキングテーブル
ロジック５２のＷＴＴレジスタ２６に一時的に格納され
る。これは、許可ビット等の属性ビットが異なるレベル
のテーブルから検索される可能性があるからである。物
理ベースアドレスの先頭に要するすべての情報が常に最
後のテーブルに格納されるとは限らない。ＷＴＴレジス
タ２６は、仮想ベースアドレスをＣＡＭ１４にロードす
ると共に、関連物理ベースアドレスと、置換アドレス回
路（図示せず）で決定される位置における許可ビットと
をＲＡＭ１６にロードするために使用される。置換アド
レス回路はランダムあるいは巡回的に置換アドレスを生
成することができる。

【００１６】キャッシュミスの場合、何百サイクルかが
アドレス変換に費やされるかもしれない。一般に、これ
はシステム応答を遅くする。しかし、実時間処理が伴う
場合、例えばＤＳＰを使用する多くの装置においては、
メモリ管理ユニットの非決定性挙動によって装置の性能
が著しく低下することがある。

【００１７】当該技術分野では様々なＴＬＢおよびＷＴ
Ｌアーキテクチャが知られており、それらは上記と比較
してかなり異なるかもしれない。

【００１８】図３は、ＤＳＰ３０とマイクロプロセッサ
ユニット（ＭＰＵ）３２を使用する計算機装置２８の基
本的ブロック図を示す。他の装置、例えばコプロセッ
サ、追加のＤＳＰ、マイクロプロセッサユニット等も計
算機装置２８で使用することができる。メインメモリ３
４はバス３９を介してＤＳＰ３０およびＭＰＵ３２と接
続される。

【００１９】図３の基本図において、処理コア３６と、
ローカルメモリ４０に接続された複数のバス３８とがＤ
ＳＰ３０に含まれ、ローカルメモリは、例えばデータメ
モリ／キャッシュ、命令メモリ／キャッシュ、あるいは
一体化されたデータ・命令メモリ／キャッシュである。
メモリ管理ユニット（ＭＭＵ）４２はバス３８に接続さ
れ、そしてバス３９を介してメインメモリ３４およびＭ
ＰＵ３２に接続される。ＤＳＰ３０の動作はリアルタイ
ムのオペレーティングシステム４４で制御される。

【００２０】ＭＰＵはＭＰＵ４８および内部キャッシュ
メモリ５０に接続された処理コア４６を含む。ＭＰＵ３
２はオペレーティングシステム５２によって制御され
る。

【００２１】動作に関して、ＤＳＰ３０の処理コア３６
は任意に設計することができる。典型的には、ＤＳＰの
処理コアは高速乗算器アキュムレータ回路（通常ＭＡＣ
と呼ばれる）を特徴とする。ローカルメモリ４０には、
ＤＳＰ動作に使用されるデータおよび命令が格納され
る。図の実施例では、高速アクセスのための仮想アドレ
ッシング時にダイレクトデコーディングを利用して、プ
ロセッサコア３６によるローカルメモリへの直接アドレ
ッシングが可能である。このバス構造はローカルメモリ
４０に対してプログラムおよびデータ情報を効率的に読
み書きできるように設計されているが、他の様々なバス
構造も使用可能である。代替的に、ＭＭＵを介してロー
カルメモリ４０にアドレスすることも可能であるが、ロ
ーカルメモリアクセス速度が低下する。図３は単一のＭ
ＭＵ４２を示しているが、各バスに別々のハードウェア
を設ければ、アクセスのコンフリクトを避けて性能の向
上を図ることができる。

【００２２】ＭＭＵ４２は、メインメモリ３４にアクセ
スするためにＤＳＰ３０の処理コア３６による仮想アド
レシングの使用を可能にする。ＤＳＰは一般に、命令を
検索してオペランドを読み書きするために１命令サイク
ルごとに1回以上のアドレス計算を実行する１個以上の
アドレス生成ユニット（ＡＧＵ）を含む。

【００２３】仮想アドレシングを使用することにより、
ＤＳＰの能力が大幅に増加する。特に、ＤＳＰはタスク
によって保護された環境における独立タスクを処理する
ことができる。各タスクに直線的な（連続した）メモリ
スペースを割り当てることが可能であり、その場合、各
タスクがシステム内で処理されている唯一のタスクであ
るかのように見える。これは、ほとんどのソフトウェア
がサードパーティーによって書かれ、他のアプリケーシ
ョンのことを意識していないので、将来のシステムにお
いて重要になるだろう。

【００２４】図の実施例において、オペレーティングシ
ステム５４とＭＰＵ３２の組み合わせにより、各プロセ
ッサまたはＤＳＰ上で実行中の異なるプロセスを管理し
てそれらにメモリを動的に割り当てる統合メモリ管理シ
ステムが実現され、保護された直線的メモリスペースが
すべてのアプリケーション（プロセス）に与えられる。
外部共有メモリ３４における対応物理アドレスが非直線
的であるにもかかわらず、この統合メモリ管理ユニット
により、すべてのプロセスおよびすべてのプロセッサに
直線的メモリスペースが割り当てられる。また、統合メ
モリ管理システムは効率的でかつ周知の保護メカニズム
を提供する。

【００２５】図４はプリフェッチ機能付きのＭＭＵのブ
ロック図を示しており、これはマルチプロセッサシステ
ムにおいてＤＳＰや他のプロセッサと組み合わせて使用
することができる。この実施例では、すべてのＤＳＰバ
スが同じＴＬＢを共有可能であるが、代替実施例では複
数のＴＬＢを使用することができる。ＭＭＵ４２は、Ｃ
ＡＭ６２とそれに関連するＲＡＭ６４とを備えたＴＬＢ
６０を含む。ＣＡＭ６２にはマルチプレクサ６６を通し
て仮想ベースアドレスを供給することができる。マルチ
プレクサ６６は４つのソース、すなわち、（１）ＭＰＵ
データ（ＭＰＵ３２からの）、（２）ＤＳＰ３０からの
ＤＳＰデータ、（３）ＶＰＡ（仮想プログラムアドレ
ス）／ＶＤＡ（多重バスの仮想データアドレス）バス
（ＤＳＰコア３６からのプログラムおよびデータアドレ
ス）、（４）Ｐｒｅｆｅｔｃｈ＿ａｄｄｒｅｓｓレジス
タ８６からのＰｒｅｆｅｔｃｈ＿ａｄｄｒｅｓｓのうち
の１つを選択することができる。マルチプレクサ６６は
制御回路６８によって制御される。ＤＳＰ入出力スペー
スに、デコードと記しただ円（ｄｅｃｏｄｅｂｕｂｂ
ｌｅ）７０で表されるプリフェッチダミーレジスタが示
されている。マルチプレクサ７２を介してランダムまた
は巡回カウンタ、あるいはＭＰＵ３２から、ＣＡＭ６２
のエントリーを選択することができる。検索／書き込み
制御信号は、マルチプレクサ６６からのデータがマルチ
プレクサ７２からアドレスへの書き込みデータである
か、または対応する物理ベースアドレスをＴＬＢ６０で
保持するかどうか決定するためにルックアップで使用さ
れるデータであるかを表す。マルチプレクサ７４は、Ｍ
ＰＵ３２からのデータか、ＴＬＢ置換イベントにおいて
ＲＡＭ６４に書き込むためにウォーキングテーブルロジ
ック７８のＷＴＴレジスタ７６から送られたデータかを
選択する。

【００２６】ＤＳＰマスターの場合、ＤＳＰプログラム
をＴＬＢ内容にするために、ＤＳＰデータバスをマルチ
プレクサ（７４）を介してＲＡＭ６４に接続する必要が
ある。

【００２７】ウォーキングテーブルロジック７８には、
ＷＴＴレジスタの他に状態・制御レジスタ８０と、変換
テーブルの先頭アドレスを保持するＴＴＢ＿ＤＳＰレジ
スタ８２とが含まれる。状態・制御レジスタ８０はＷＴ
Ｌ＿ａｃｔｉｖｅビットを含む。ウォーキングテーブル
ロジック７８はＴＬＢ＿ｐｒｅｆｅｔｃｈ信号とＴＬＢ
＿ｍｉｓｓ制御信号を受け取り、Ｒｅａｄｙ制御信号を
出力する。マルチプレクサ８６はＴＬＢ＿ｍｉｓｓ信号
によって制御され、ウォーキングテーブルロジック７８
とＴＬＢ６０の一方から物理ベースアドレスを選択す
る。プリフェッチアドレスレジスタ８６はプリフェッチ
アドレスを格納する。

【００２８】動作中、仮想ベースアドレスおよび対応す
る物理ベースアドレスをＴＬＢ６０にロードするため
に、ＭＭＵ４２はＤＳＰコア３６をブロックすることな
くプリフェッチ動作を実行することができる。また、Ｄ
ＳＰは、置換カウンタを所望値に設定してビクティム
（ｖｉｃｔｉｍ）エントリーをプログラムすることによ
って、ＴＬＢ６０内の置換位置をモニターする。このよ
うに、コア動作をブロックすることなくプリフェッチ動
作を実行することにより、タスクに関連する他のリアル
タイム制約に影響しかねないＴＬＢミス関連の非決定性
レイテンシが避けられる。

【００２９】タスクがデータまたは命令へのアクセスを
必要とすることが予想され、そのデータまたは命令に対
応する領域は仮想ベースアドレスとＴＬＢ６０に格納さ
れた物理ベースアドレスとの間で対応する変換結果をも
たない場合、タスク途中の任意のところでプリフェッチ
コマンドを使用することが可能である。ＤＳＰコア３６
からのアクセス要求の前に（変換結果がまだＴＬＢに格
納されていなければ）、プリフェッチ命令によってＴＬ
Ｂ６０に変換結果が強制的に格納される。したがって、
タスクによるアクセス要求実行時にはＴＬＢ６０に変換
結果が存在し、潜在的なＴＬＢミスは避けられるだろ
う。

【００３０】図４に示される実施例では、ＤＳＰのＩ／
Ｏスペースにプリフェッチダミーレジスタが示される。
この入出力アドレスへの書き込みアクセスは制御回路６
８によって検出される。図の実施例では、書き込みアク
セスはプリフェッチ動作を開始するために制御回路６８
に接続されたＶＤＡバスを介して行われる。ダミーレジ
スタへの書き込みアクセスに応答して、ＴＬＢ＿ｐｒｅ
ｆｅｔｃｈ制御信号は制御回路６８によってイネーブル
にされる。同時に、プリフェッチ仮想ベースアドレスが
ＤＳＰデータバスに現れる。制御回路６８はマルチプレ
クサ６６を介してＤＳＰデータバスを選択してプリフェ
ッチ仮想ベースアドレスをＣＡＭ６２に送り、検索／書
き込み制御信号を検索に設定する。その結果、ＴＬＢ６
０は、プリフェッチ仮想ベースアドレスがＣＡＭ６２に
おいて現在有効であるか否かを単一サイクルの比較によ
って検出する。この検索でＣＡＭヒットが得られると、
プリフェッチを続ける必要がなくなり、ＤＳＰの実行が
継続される。

【００３１】プリフェッチ仮想ベースアドレスの検索に
よるＣＡＭミスの場合、ＴＬＢ＿ｐｒｅｆｅｔｃｈおよ
びＴＬＢ＿ｍｉｓｓ制御信号（ウォーキングテーブルロ
ジック７８のプリフェッチメカニズムを開始するために
は双方共にイネーブルでなければならない）に応答して
メインメモリ３４から対応する物理ベースアドレスをフ
ェッチするためにウォーキングテーブルロジック７８が
使用される。プリフェッチ仮想ベースアドレスの値はＰ
ｒｅｆｅｔｃｈ＿ａｄｄｒｅｓｓレジスタ８６に格納さ
れる。ＷＴＢアクティブビットは、次のプリフェッチま
たは通常のＴＬＢミス動作が現在のプリフェッチコマン
ドを妨害しないように設定される。プリフェッチ動作
中、ウォーキングテーブルロジック７８はＲｅａｄｙ信
号をディスエーブルにしないので、ＤＳＰはＴＬＢ動作
と平行して後続のプリフェッチ命令を実行し続ける。

【００３２】ウォーキングテーブルロジック７８がテー
ブルウォーキング動作を一旦完了して、Ｐｒｅｆｅｔｃ
ｈ＿ａｄｄｒｅｓｓレジスタ８６に格納された仮想ベー
スアドレスに対する変換を決定すると、対応する物理ベ
ースアドレスがＴＬＢ６０に格納され、ＷＴＬ＿ａｃｔ
ｉｖｅビットはディスエーブルになる。テーブルウォー
キング動作の結果をＴＬＢ６０に格納するための置換策
には、いくつかの形式がある。ＴＬＢ６０に存在するエ
ントリーをランダムに置換するランダム置換スキームは
一般に好ましくない。それは、前にプリフェッチされた
変換結果がそのアドレスへの実際のアクセス以前に次の
ＴＬＢプリフェッチあるいはＴＬＢミスによって置換さ
れてしまうからである。ＴＬＢ６０の非ロックアドレス
範囲での巡回（または、ＦＩＦＯ）置換策または、ＤＳ
Ｐコア３６から供給され、ＤＳＰアドレスのレジスタに
格納されたビクティムアドレスをもつプログラマブル置
換策。巡回モードでは、ＴＬＢ６０に新しい変換結果が
ロードされたときだけ、ビクティムカウンタはインクリ
メントする。

【００３３】一実施例では、プログラマブル巡回ランダ
ム置換策が提供される。ＤＳＰコア３６が次に置換され
るエントリーのＴＬＢアドレスを格納するビクティムカ
ウンタ（図示せず）に新しい値を書き込む度に、ビクテ
ィムカウンタは計数モードをランダムから巡回（ＦＩＦ
Ｏ）に変更し、ＴＬＢ上限に達するまでそれを続ける。
また、ステータス・制御レジスタ８０のステータスビッ
トによってビクティムカウンタモードをランダムまたは
巡回的にプログラムすることができる。テーブルウォー
キング動作から得られるアドレス値がＷＴＴレジスタに
ロードされた時にイネーブルになるＥｎｄ＿ｐｒｅｆｅ
ｔｃｈ制御信号に応答して、プリフェッチアドレス情報
はビクティムカウンタに格納されているアドレスにおけ
るＲＡＭ６４とＣＡＭ６２に格納される。

【００３４】ウォーキングテーブルロジック７８による
テーブルルックアップは１度に1回だけである。従っ
て、前のＴＬＢプリフェッチ動作が完了する前に次のプ
リフェッチ動作が始まると、前のプリフェッチ動作が終
わるまでＤＳＰ３０は（Ｒｅａｄｙ制御信号をディスエ
ーブルにすることによって）待たされる。代替として、
Ｐｒｅｆｅｔｃｈ＿ａｄｄｒｅｓｓレジスタ８６の代わ
りに、プリフェッチ要求をキューに入れるためにレジス
タファイルまたはＦＩＦＯレジスタを使用することが可
能であり、そうすれば、ウォーキングテーブルロジック
７８が受け取った順序で要求が処理される。

【００３５】同様に、メインメモリへのＤＳＰアクセス
時にＴＬＢミスがあると、ＤＳＰ３０は待ちになる。Ｔ
ＬＢミスが一旦ウォーキングテーブルロジック７８で処
理されれば、プリフェッチ動作は継続する。

【００３６】上述の２つの状況以外でも、ＤＳＰコア３
６はプリフェッチ動作実行中に命令の実行を続ける場合
がある。一般に、コード中の適切な位置にプリフェッチ
命令を置くことによって、このような状態は両方とも排
除または軽減することができる。ここに記述されるプリ
フェッチメカニズムによって、プリフェッチ中のタスク
実行を遅らせことなくＴＬＢミスは完全に回避され、ミ
スに関連する予測不能な待ち時間が排除される。

【００３７】通常、ＤＳＰは与えられた期間にシーケン
シャルタスクのデータを処理する。１つのタスクが終わ
ると、ＤＳＰはＭＰＵからの割込みあるいはメッセージ
によって発生する次のタスクに備える。したがって、プ
リフェッチレジスタ８６として使用されるキュー（例え
ば、レジスタファイルまたはＦＩＦＯレジスタ）は、次
のタスクに備えてＴＬＢを準備するための多重プリフェ
ッチコマンドを保持するのに適切な構造である。その他
の手法、例えばメモリアクセスのためにコードを先読み
することによってプリフェッチコマンドを実行する手法
も使用することができる。

【００３８】また、実施例では仮想アドレスを物理アド
レスに変換するためにＭＭＵ４２が設けられているが、
アドレス変換を行わないメモリ管理に使用することも可
能である。例えば、ＲＡＭ６４に保護ビットを格納し
て、コア３６から発生する物理アドレスからのアクセス
に応答して、その保護ビットをチェックすることができ
る。物理アドレスがＣＡＭ６２にキャッシュされていな
いとすれば、メモリアドレス変換に関して上述したよう
に、コア３６が命令実行を継続している間に、ウォーキ
ングテーブルロジック７８はＴＬＢ６０におけるミスを
避けるためにメインメモリ３４から保護ビットをプリフ
ェッチすることができる。

【００３９】明細書全般にわたって、様々なメモリ、バ
ス容量等について特定のアーキテクチャの特徴と詳細サ
イズを例示したが、特定のＤＳＰを実施するための設計
は多様である。例えば、このＴＬＢ設計はマイクロプロ
セッサ設計に使用される多数のうちの一つである。

【００４０】発明の詳細説明はいくつかの代表的実施例
について述べたものであるが、この記述から当業者は上
記実施例の様々な変形や代替実施例のヒントを得ること
ができよう。本発明は特許請求の範囲の規定されるすべ
ての変更、代替実施例を包含する。

【００４１】以上の説明に関して以下の項を開示する。（１）命令実行用プロセッサコアと、メモリ管理ユニッ
トとを有するプロセッサであって、前記メモリ管理ユニ
ットが、１セットのアドレスに関連する情報を格納する
キャッシュと、前記プロセッサコアからの指定アドレス
に関連するプリフェッチコマンドを検出する回路と、前
記プロセッサコアによる命令実行中に前記プリフェッチ
コマンドに応答して前記指定アドレスに関連する情報を
取得し、前記情報を前記キャッシュに格納するための回
路とを含む前記プロセッサ。（２）前記アドレスの変換結果を取得するための回路が
前記情報取得回路に含まれる第1項記載のプロセッサ。（３）前記プロセッサコアからの仮想アドレスを物理ア
ドレスに変換するための回路が前記変換取得回路に含ま
れる第２項記載のプロセッサ。（４）ウォーキングテーブルロジックが前記情報取得回
路に含まれる第１項記載のプロセッサ。（５）ＴＬＢ（ｔｒａｎｓｌａｔｉｏｎｌｏｋａｓｉ
ｄｅｂｕｆｆｅｒ）が前記キャッシュに含まれる第１
項記載のプロセッサ。（６）前記指定アドレスに関連する前記情報が前記キャ
ッシュに存在するか否を表す信号に応答して、前記情報
取得回路がイネーブルにされる第１項記載のプロセッ
サ。（７）所定アドレスへの書き込みアクセスを検出する回
路が前記検出回路に含まれる第１項記載のプロセッサ。（８）入出力アドレス空間における所定アドレスへの書
き込みアクセスを検出する回路が前記検出回路に含まれ
る第７項記載のプロセッサ。（９）前記キャッシュに前記指定アドレスを入れるため
の前記書き込みアクセスが検出された時に前記プロセッ
サコアからデータバスを選択するように前記検出回路に
よって制御されるマルチプレクサを有する第７項記載の
プロセッサ。（１０）前記指定アドレスを格納するレジスタが前記情
報取得回路に含まれる第１項記載のプロセッサ。（１１）前記情報取得回路が前の指定アドレスに対する
情報を現在取得中か否を表すステータスレジスタが前記
情報取得回路に含まれる第１項記載のプロセッサ。（１２）前記プロセッサコアをデジタル信号プロセッサ
コアとした第１項記載のプロセッサ。（１３）複数の仮想ベースアドレスを格納するキューが
前記レジスタに含まれる第１２項記載のプロセッサ。

【００４２】（１４）メインメモリと、前記メインメモ
リに接続されたマイクロプロセッサと、命令実行用プロ
セッサコアおよびメモリ管理ユニットを含むデジタル信
号プロセッサとを有するマルチプルプロセッサ装置であ
って、前記メモリ管理ユニットに、各アドレスに関連す
る情報を格納するキャッシュと、指定アドレスに関連す
るプリフェッチコマンドを検出する回路と、前記プロセ
ッサコアによる命令実行中に前記プリフェッチコマンド
に応答して前記メインメモリから前記指定アドレスに関
連する情報を取得し、前記指定アドレスに関連する前記
情報を前記キャッシュに格納する回路とが含まれる前記
マルチプルプロセッサ装置。（１５）前記指定アドレスを仮想アドレスとし、前記仮
想アドレスから物理アドレスへの変換を取得する回路が
前記情報取得回路に含まれる第１４項記載のマルチプル
プロセッサ装置。（１６）変換回路にウォーキングテーブルロジックが含
まれる第１５項記載のマルチプルプロセッサ装置。（１７）前記キャッシュにＴＬＢが含まれる第１４項記
載のマルチプルプロセッサ装置。（１８）前記指定アドレスに関連する前記情報が前記キ
ャッシュに存在するか否かを決定する回路が前記取得回
路に含まれる第１４項記載のマルチプルプロセッサ装
置。（１９）所定アドレスへの書き込みアクセスを検出する
回路が前記検出回路に含まれる第１４項記載のマルチプ
ルプロセッサ装置。（２０）入出力アドレス空間における所定アドレスへの
書き込みアクセスを検出する回路が前記検出回路に含ま
れる第１９項記載のマルチプルプロセッサ装置。（２１）前記仮想ベースアドレスを格納するレジスタが
前記取得回路に含まれる第１４項記載のマルチプルプロ
セッサ装置。（２２）複数の仮想ベースアドレスを格納するキューが
前記レジスタに含まれる第２１項記載のマルチプルプロ
セッサ装置。

【００４３】（２３）プロセッサ内におけるメモリ管理
方法であって、プロセッサコア内で命令を実行するステ
ップと、１セットのアドレスに関連する情報をキャッシ
ュに格納するステップと、前記プロセッサコアからの指
定アドレスに関連するプリフェッチコマンドを検出する
ステップと、前記プロセッサコアによる命令実行中に前
記プリフェッチコマンドに応答して前記指定アドレスに
関連する情報を取得し、前記指定アドレスに関連する前
記情報を前記キャッシュに格納するステップとを含む前
記方法。（２４）前記アドレスの変換を取得するステップが前記
情報取得ステップに含まれる第２３項記載の方法。（２５）前記プロセッサコアからの仮想アドレスを物理
アドレスに変換するステップが前記変換取得ステップに
含まれる第２４項記載の方法。（２６）ウォーキングテーブルロジックを用いた情報取
得ステップが前記情報取得ステップに含まれる第２３項
記載の方法。（２７）情報をＴＬＢに格納するステップが前記情報格
納ステップに含まれる第２３項記載の方法。（２８）前記指定アドレスに関連する前記情報が前記キ
ャッシュに存在するか否かを表す信号に応答して、前記
情報取得ステップを開始する第２３項記載の方法。（２９）所定アドレスへの書き込みアクセスを検出する
ステップが前記検出ステップに含まれる第２３項記載の
方法。（３０）入出力アドレス空間における所定アドレスへの
書き込みアクセスを検出するステップが前記検出ステッ
プに含まれる第２９項記載の方法。（３１）前記キャッシュに入れるための前記書き込みア
クセスが検出された時に前記プロセッサコアからのデー
タバスを選択するステップが前記指定アドレスに含まれ
る第２９項記載の方法。（３２）前の指定アドレスに関する情報を現在取得中で
あるか否かを表す状態情報を生成するステップが前記情
報取得ステップに含まれる第２３項記載の方法。

【００４４】（３３）デジタル信号プロセッサ（３０）
または他の処理装置で使用されるメモリ管理ユニット
（４２）に、プリフェッチコマンドに応答して仮想アド
レスから物理アドレスへの変換を実行する回路を設け
る。プリフェッチコマンドはダミーレジスタへの書き込
みアクセスを実行することによって開始される。プリフ
ェッチコマンドが検出されると、生成された仮想アドレ
スに関連する物理ベースアドレスがＴＬＢに現在存在す
るか否かを確認するためにＴＬＢがチェックされる。存
在しなければ、ウォーキングテーブルロジックは、変換
結果を取得するためにメインメモリ（３４）のテーブル
ルックアップを実行する。ウォーキングテーブルロジッ
クの動作は、ＤＳＰコア（３６）による連続動作を妨げ
ずに行われる。

【図面の簡単な説明】

【図１】マイクロプロセッサに使用される従来技術のＭ
ＭＵを示す図。

【図２】テーブルウォーキングによる物理アドレスのル
ックアップを示す図。

【図３】マルチプロセッサシステムのブロック図。

【図４】マルチプロセッサシステムにおいてＤＳＰまた
は他のプロセッサで使用されるＭＭＵを示す図。

【符号の説明】

１０ＭＭＵ１２ＴＬＢキャッシュ１４ＣＡＭ１６ＲＡＭ３０ＤＳＰ３２ＭＰＵ３４メインメモリ３９バス３６処理コア４０ローカルメモリ４２ＭＭＵ４６コア４８ＭＭＵ５０キャッシュ５４ＯＳ

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ０６Ｆ 12/08 ５１９Ｇ０６Ｆ 12/08 ５１９Ｚ５６１５６１ (72)発明者セルジュラサールフランス国フルジュ、リウディサンジャンドカンヌ、リュデュマルソー 278 (72)発明者ドミニクベノワジャックダンベルノフランス国ビヤヌーブルーベ、ジヌスティエール、シュマンデバス、47 (72)発明者エドワードファーガソンアメリカ合衆国テキサス、プラノ、クロストンドライブ 1544

Claims

【特許請求の範囲】

【請求項１】命令実行用プロセッサコアと、メモリ管
理ユニットとを有するプロセッサであって、前記メモリ
管理ユニットに、１セットのアドレスに関連する情報を格納するキャッシ
ュと、前記プロセッサコアからの指定アドレスに関連するプリ
フェッチコマンドを検出する回路と、前記プロセッサコアによる命令実行中に前記プリフェッ
チコマンドに応答して前記指定アドレスに関連する情報
を取得し、前記情報を前記キャッシュに格納するための
回路とが含まれる前記プロセッサ。
【請求項２】プロセッサ内におけるメモリ管理方法で
あって、プロセッサコア内で命令を実行するステップと、１セットのアドレスに関連する情報をキャッシュに格納
するステップと、前記プロセッサコアからの指定アドレスに関連するプリ
フェッチコマンドを検出するステップと、前記プロセッサコアによる命令実行中に前記プリフェッ
チコマンドに応答して前記指定アドレスに関連する情報
を取得し、前記指定アドレスに関連する前記情報を前記
キャッシュに格納するステップとを含む前記方法。