JP2002149424A

JP2002149424A - 共有コプロセッサ・リソースに対する複数の論理インタフェース

Info

Publication number: JP2002149424A
Application number: JP2001265792A
Authority: JP
Inventors: Gordon Taylor Davis; ゴードン・テイラー・デイビス; C Heads Marko; マルコ・シィ・ヘッズ; Rose Boyed Riwens; ロス・ボイド・リーベンス; Mark Anthony Rinaldi; マーク・アンソニー・リナルディ
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2000-09-06
Filing date: 2001-09-03
Publication date: 2002-05-24
Also published as: KR20020020186A; CN1342940A; TW581950B; US6829697B1; KR100422491B1; CN1188794C; SG100751A1

Abstract

(57)【要約】（修正有）【課題】ネットワーク・プロセッサにおいて、プロトコ
ル・プロセッサ・ユニット（ＰＰＵ）とコプロセッサと
の通信効率を上げる。【解決手段】組み込みプロセッサ複合体は複数のプロ
トコル・プロセッサ・ユニット（ＰＰＵ）を含む。各ユ
ニットに少なくとも１つの、好適には２つの個別に機能
するコア言語プロセッサ（ＣＬＰ）が含まれる。各ＣＬ
Ｐは、各ＰＰＵに用いられる複数の専用コプロセッサと
の論理コプロセッサ実行／データ・インタフェースを通
してデュアル・スレッドをサポートする。操作命令によ
り、ＰＰＵが待ち時間の長いイベントと短いイベントを
識別し、この識別をもとにスレッド実行の優先順位を制
御し切り替える。また操作命令により、指定された特定
のイベントの発生時または非発生時、特定のコプロセッ
サ・オペレーションの条件付き実行が可能になる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、ネットワーク・プ
ロセッサ・システムに関し、特に１つ以上のプロトコル
・プロセッサ・ユニット（ＰＰＵ）を含む組み込みプロ
セッサ複合体に関する。プロセッサ装置内でＰＰＵと複
数のコプロセッサを相互接続するインタフェースを通し
て、それらの間でデータや命令を転送するため、ＰＰＵ
とともに複数のコプロセッサが用いられる。

【０００２】

【従来の技術】ネットワーク・プロセッサのプログラミ
ング機能を実現し、これを制御するためプロトコル・プ
ロセッサ・ユニットが用いられていることは周知の通り
である。同様に、コンピュータ・システム処理複合体ア
ーキテクチャを設計する際に、ＰＰＵとともにコプロセ
ッサが用いられることも一般的になっている。リアルタ
イム処理を必要とする処理イベントの遅れは、システム
性能に直接影響を与える問題である。ＰＰＵによりタス
クを実行するのではなく、特定のコプロセッサにタスク
を割当てることによって、コンピュータ・システムの効
率と性能を上げることができる。ＰＰＵがコプロセッサ
と効率よく通信することが重要である。この通信を改良
し続けることが求められる。

【０００３】

【発明が解決しようとする課題】本発明の目的は、１つ
以上のコア言語プロセッサ（ＣＬＰ）を含み、各ＣＬＰ
が複数のスレッドを持ち、論理コプロセッサ・インタフ
ェースを通して特別タスク・コプロセッサに指示を与え
るプロトコル・プロセッサ・ユニット（ＰＰＵ）を使用
することである。

【０００４】本発明の他の目的は、共有コプロセッサ・
リソースにアクセスするため（プログラマから見て）複
数の論理コプロセッサ・インタフェースを使用すること
である。コプロセッサ・リソースは、ＰＰＵ内の複数の
処理スレッドにより共有されることがあり、複数のＰＰ
Ｕ間で１つのコプロセッサ・リソースが共有されること
もある。

【０００５】本発明の他の目的は、ＰＰＵとそのコプロ
セッサのインタフェース側で有効になる特定の操作に関
する。この操作の１つは、コプロセッサ命令を条件付き
で実行する機能である。これは特にカウンタ・コプロセ
ッサで有効であるが、一般には他のコプロセッサにも適
用できる。コプロセッサ・インタフェースは、特定のコ
プロセッサ・コマンドに関する予測応答時間に従って、
待ち時間の長いイベントと短いイベントを識別する機能
を持つ。この識別により、スレッドを実行する優先順位
が制御される。

【０００６】本発明の他の目的は、これまでのコプロセ
ッサ・インタフェースに比べてフレキシビリティと効率
が向上したコプロセッサ・インタフェースを提供するこ
とである。

【０００７】

【課題を解決するための手段】以上の目的は、他の目的
を含めて、以下に述べるようにして達成される。

【０００８】ネットワーク・プロセッサのプログラミン
グ機能を制御する組み込みプロセッサ複合体の動作につ
いて説明する。プロセッサ複合体は、複数のプロトコル
・プロセッサ・ユニット（ＰＰＵ）を含み、ＰＰＵはそ
れぞれ１つ以上のコア言語プロセッサ（ＣＬＰ）を含
む。ＣＬＰはそれぞれ複数のコード・スレッドを持つ。
各ＰＰＵが、ＰＰＵに対して特定のタスクを実行する上
で有用な複数のコプロセッサを利用する。複合体は、複
数の論理コプロセッサ・インタフェースを使用し、ＣＬ
Ｐとの共有コプロセッサ・リソースにアクセスする。Ｃ
ＬＰにより特定の動作命令が実行され、これによりコプ
ロセッサにコマンドが送られる。これらの命令の１態様
は、特定のコプロセッサ命令の条件付き実行を可能にす
ることである。命令は、特定のコプロセッサ・コマンド
に関する予測応答時間に従って、待ち時間の長いイベン
トと短いイベントを識別することができる。これにより
複合体は、処理されている待ち時間の長さとタイプに応
じて、制御をスレッドからスレッドへ切り替えることが
できる。

【０００９】

【発明の実施の形態】本発明については、ネットワーク
・プロセッサのプログラミング機能を提供し制御する埋
め込みプロセッサ複合体の文脈で説明する。複合体の実
施形態は通常、ハードウェア・アクセラレータと連携し
て高速パターン検索、データ操作、内部チップ管理機
能、フレーム解析、及びデータのプリフェッチをサポー
トする８つのメイン処理ユニットまたはプロトコル・プ
ロセッサ・ユニット（ＰＰＵ）を含む。各ＰＰＵはそれ
ぞれ構造コンポーネントを含み、構造コンポーネントは
２つのＣＬＰと、少なくとも１つ、好適には数個の専用
／共有コプロセッサ・ユニット、及びメイン処理ユニッ
トと各コプロセッサ・ユニットのインタフェースを含
む。

【００１０】各コプロセッサ・ユニットは、特定のネッ
トワーク・タスクを実行することができる。メイン処理
ユニットは、記憶プログラムの一連の命令を実行する。
コプロセッサ・ユニットはそれぞれ、該メイン処理ユニ
ットを担当し、メイン処理ユニットの制御下で特定のタ
スクを効率よく実行するようにされる。メイン処理ユニ
ットと各コプロセッサ・ユニットのインタフェースによ
り、次の機能のうち１つ以上が有効になる。各コプロセ
ッサ・ユニットの構成、各コプロセッサ・ユニットによ
り完了する特定のタスクの起動、各コプロセッサ・ユニ
ットに関するステータス情報へのアクセス、及び各コプ
ロセッサ・ユニットにより完了する特定のタスクに関す
る結果を返す手段の提供である。メイン処理ユニットと
コプロセッサ・ユニットはそれぞれ１つ以上の専用レジ
スタを含む。インタフェースは、専用レジスタを該メイ
ン処理ユニットとコプロセッサ・ユニットから共通アド
レス・マップにマップすることができる。

【００１１】各ＰＰＵはそれぞれ１つ以上のコア言語プ
ロセッサ（ＣＬＰ）及び数個の専用コプロセッサを含
む。ＰＰＵに複数のＣＬＰが含まれるとき、コプロセッ
サはＣＬＰ間で共有される。

【００１２】各ＣＬＰはそれぞれ１つの演算論理ユニッ
ト（ＡＬＵ）を含み、２つのコード・スレッドをサポー
トする（ＰＰＵ毎に合計４つのスレッド）。ＣＬＰとコ
プロセッサは、スカラ・レジスタとアレイ・レジスタを
含む専用レジスタの個別コピーを格納する。特定のコプ
ロセッサは、ＣＬＰからコプロセッサのアレイ・レジス
タやスカラ・レジスタへのコプロセッサ・コマンドの転
送を調整するＦＩＦＯバッファを含む。ＣＬＰは一度に
１つのスレッド・コマンドのみ実行する。プログラマか
ら見ると、各スレッドはそれぞれ自体のコプロセッサま
たはコプロセッサ・セットに見える。コプロセッサのほ
とんどは、専用機能を実行し、相互に並行して、またＣ
ＬＰとともに動作することができる。

【００１３】ＰＰＵの制御記憶は、通常、内部メモリと
外部メモリの両方により与えられる。例えば即時アクセ
スには内部ＳＲＡＭを、高速アクセスには外部ＺＢＴ
ＳＲＡＭを、大容量が求められる場合にはＤＤＲＳＤ
ＲＡＭを使用できる。

【００１４】図１に、ツリー検索エンジン１２、チェッ
クサム・コプロセッサ２０、ストリング・コピー・コプ
ロセッサ２２、エンキュー・コプロセッサ２４、データ
ストア・コプロセッサ２６、制御アクセス・バス・コプ
ロセッサ２８、カウンタ・コプロセッサ３０、及びポリ
シ・コプロセッサ３２を含む数個のコプロセッサとのデ
ータ・インタフェース１４と実行インタフェース１６を
維持するプロトコル・プロセッサ・ユニット（ＰＰＵ）
１０を示す。

【００１５】ＰＰＵは、コア言語プロセッサ（ＣＬＰ）
のペア３４及び３６を含む。各ＣＬＰに命令フェッチ・
デコード／実行ユニット、複数の専用レジスタ、汎用レ
ジスタ、及び２つのスレッドが含まれる。コプロセッサ
実行インタフェース（ＣＰＥＩ）アービタ４０は、２つ
のＣＬＰとコプロセッサ間で命令を調停する。コプロセ
ッサ・データ・インタフェース（ＣＰＤＩ）アービタ４
２は、コプロセッサとＣＬＰ３４及び３６間で通信の優
先順位を確認する。ＣＬＰの命令は全て命令メモリ（図
１には示していない）に保存される。

【００１６】ＣＬＰ＃１３４は、バス４６を通してハ
ードウェア・クラシファイア（classifier）からの通信
を受信する。ハードウェア・クラシファイアは、ディス
パッチャからの刺激を与え、新しいパケットの処理を開
始する。ＣＬＰは、命令メモリからのフェッチ命令をバ
ス４８を通して送り、新しいパケットを処理する。同様
にＣＬＰ３６は、バス５０を通してハードウェア・クラ
シファイアから分類結果を受信し、バス５２を通して命
令メモリ・インタフェースに要求を送る。命令メモリ・
インタフェースとハードウェア・クラシファイアはＰＰ
Ｕの外部にあり、図１には示していない。

【００１７】エンキュー・コプロセッサ２４はバス６０
を通して外部完了ユニット（図示せず）に命令を送る。
データストア・コプロセッサ２６は、データをバス６２
を通して入口データストア・インタフェースに、または
バス６４を通して出口データストア・インタフェースに
送る。制御データのフローは、バス６８を通して外部制
御アクセス・バス・アービタ（図示せず）により調停さ
れる。アクセスの調整は、書込まれているか読取られて
いるデータがバス７０を通して流れている間にＣＡＢア
ービタ６８上で行われる。データ・アクセスはバス７０
を通して入力または出力される。カウンタ・コプロセッ
サ３０とポリシ・コプロセッサ３２はそれぞれ、カウン
タ・マネージャとポリシ・マネージャへのアクセスを、
それぞれバス７２及び７４を通して提供する。

【００１８】図２に、本発明に従った２つのＣＬＰの他
の詳細を示す。各ＣＬＰはそれぞれ汎用レジスタ８０と
専用レジスタ８２を含む。これら専用レジスタは複数の
スカラ・レジスタ８４とアレイ・レジスタ８６を含む。
また命令フェッチ／デコード／実行の機能８８も含む。

【００１９】処理複合体は次のコンポーネントを含む。・複数のプロトコル・プロセッサ・ユニット。好適な実
施例では、サーバが８つのプロトコル・プロセッサ・ユ
ニット（ＰＰＵ）を使用する。各ＰＰＵに、複数（図で
は７つ）のコプロセッサを共有する１つ以上のＣＬＰが
含まれる。ＰＰＵは、フレームを転送し、テーブルを更
新し、ネットワーク処理ユニットを維持するためのコー
ドを実行する。

【００２０】ＣＬＰは、共通命令メモリに保存されたコ
ードを並行して実行する。各ＣＬＰはコアと３ステージ
のパイプライン、１６のＧＰＲ（汎用レジスタ）、及び
ＡＬＵ（演算論理ユニット）を含む。コプロセッサは操
作を互いに並行して、またＣＬＰと並行して実行するこ
とができる。コプロセッサは、ＣＬＰとインタフェース
を取る際、基本ＣＬＰ命令とレジスタ・モデルを拡張す
る。各コプロセッサのコマンドは新しいアセンブラ・ニ
ーモニックとして現れ、コプロセッサのレジスタは、Ｃ
ＬＰプログラマから見て新しいスカラ・レジスタ、及び
アレイ・レジスタとして現れる。アレイ・レジスタの一
部は共有メモリ・プール４４に位置する。コプロセッサ
はＣＬＰと非同期に実行可能である。これによりＣＬＰ
は、コプロセッサがコマンドを実行している間に命令の
処理を続けることができる。ＣＬＰは、待機命令により
コプロセッサのコマンド実行が完了するまで待機する。

【００２１】命令メモリ５６は通常、８つの組み込みＲ
ＡＭで構成される。これらは、初期化時にロードされ、
フレームを転送し、システムを管理するプログラム命令
を格納する。命令メモリは、データ転送タスク、管理ト
ラフィック、及び制御タスクのため１６Ｋの命令を保持
する。

【００２２】ディスパッチャ・ユニット。これはスレッ
ドの使用を管理し、新しいフレームをフェッチしアイド
ル・スレッドにディスパッチする。データ・フレーム
は、次に使用できるＰＰＵにディスパッチされる。これ
によりアップ／ダウン・ディスパッチャ・キュー（ｕｐ
−ＧＤＱ、ｕｐ−ＧＣＱ、ｄｎ−ＧＲＯ／１、ｄｎ−Ｇ
ＢＯ／１、及びｄｎ−ＧＣＱ）からフレーム・アドレス
のエンキューが解除される。エンキュー解除の後、ディ
スパッチャ・ユニットはアップ／ダウン・データストア
（ＤＳ）からフレーム・ヘッダの一部を読取り、これを
共有メモリ・プール４４に保存する。ＣＬＰがアイドル
になるとすぐ、ディスパッチャ・ユニットがコード命令
アドレス（ＣＩＡ）等の対応する制御情報をバス４６ま
たは５０を介してＣＬＰに渡す。ディスパッチャは別の
バス５８を使用してヘッダ情報を共有メモリ・プール４
４に送る。ディスパッチャはまたタイマと割込みを処理
するため、それらの機能の作業を利用できるスレッドに
ディスパッチする。

【００２３】ツリー検索メモリ（ＴＳＭ）アービタ１１
０。内部と外部に複数の共有メモリ位置があり、各ＣＬ
Ｐから利用できる。このメモリは共有されるので、アー
ビタはメモリ・アクセス制御に用いられる。ＴＳＭはコ
ードによって直接アクセスでき、例えばＴＳＭにルーテ
ィング・テーブルを保存するため使用できる。またＴＳ
Ｍは、ツリー検索時にＴＳＥ１２によりアクセスされ
る。

【００２４】完了ユニット（ＣＵ）。完了ユニットは２
つの機能を実行する。第１に、ＣＬＰとＵｐ／ＤｎＥ
ＤＳ（エンキュー、エンキュー解除、及びアイランドの
スケジュール（Schedule Island）のインタフェースを
取る。ＥＤＳはエンキュー操作を実行し、これによりフ
レーム・アドレスがＦＣＢＰａｇｅと呼ばれるパラメー
タとともに転送キュー、破棄キュー、またはディスパッ
チャ・キューにエンキューされる。ターゲットが転送キ
ューのとき、ハードウェアにより構成されるフロー制御
機構によって、フレームを転送キューにエンキューする
か、破棄キューにエンキューするか確認される。第２
に、完了ユニットはフレーム・シーケンスを保証する。
同じフローに属するフレームは複数のスレッドによって
処理される可能性があるので、それらのフレームがＵｐ
／Ｄｎ転送キューに正しい順序でエンキューされるよう
な予防措置が必要である。完了ユニットは、フレーム・
ディスパッチ時にハードウェア・クラシファイア５４に
より生成されるラベルを使用する。

【００２５】ハードウェア・クラシファイア。これはデ
ィスパッチ・ユニットとＰＰＵの間のデータ・パスに置
かれる。分類を行い、宛先スレッドに情報を提供する。
Ｕｐフレームの場合、ハードウェア・クラシファイア・
アシストがフレーム・フォーマットの周知のケースにつ
いて分類を行う。分類結果は、フレーム・ディスパッチ
の間、ＣＩＡ（コード命令アドレス）及び４つのＧＰＲ
（汎用レジスタ）の内容の形でＣＬＰに渡される。Ｄｎ
フレームの場合、ハードウェア・クラシファイア・アシ
ストが、フレーム・ヘッダに応じてＣＩＡを確認する。
ハードウェア・クラシファイア・アシストは、Ｕｐ及び
Ｄｎ両方のフレーム・ディスパッチでは、フレーム・シ
ーケンスを維持するため完了ユニットにより用いられる
ラベルを生成する。

【００２６】Ｕｐ／Ｄｎデータストア・インタフェース
とアービタ。各スレッドからデータストア・コプロセッ
サ２６を通してＵｐ／Ｄｎデータストアにアクセスする
ことができる。"他のデータ"を読取るときは読取りアク
セスができ、データプールの内容をデータストアに書戻
すときは書込みアクセスができる。複数のスレッドがあ
り、Ｕｐデータストアに一度にアクセスできるのは１ス
レッドのみ、Ｄｎデータストアに一度にアクセスできる
のも１スレッドのみなので、データストア毎に１つのア
ービタが必要である。

【００２７】制御アクセス・バス（ＣＡＢ）アービタと
ＷＥＢＷａｔｃｈインタフェース。ＣＡＢアービタはＣ
ＡＢへのアクセスをスレッド間で調停する。スレッドは
全て、ＣＡＢコプロセッサ２８を通してＣＡＢにアクセ
スすることができる。これによりプロセッサ・ユニット
にある全てのメモリ及びレジスタの機能にアクセスでき
る。またどのスレッドも、全ての構成領域を変更または
読取ることができる。ＣＡＢは、プロセッサ・ユニット
のメモリ・マップと考えることができる。

【００２８】ＣＡＢＷａｔｃｈインタフェースは、３つ
のチップＩ／Ｏを使用して、チップ外部からＣＡＢ全体
へのアクセスを提供する。

【００２９】デバッグ、割込み、シングル・ステップ制
御。ＣＡＢにより、ＧＣＨスレッドまたはＣＡＢＷａｔ
ｃｈが各スレッドを制御することができる。例えばＧＦ
ＨスレッドまたはＣＡＢＷａｔｃｈがＣＡＢを使用し
て、シングル・ステップ実行モードで選択されたスレッ
ドを実行することができる。

【００３０】コア言語プロセッサ（ＣＬＰ）：ネットワ
ーク・サーバは、そのアーキテクチャで数種類のＣＬＰ
を利用する。ＣＬＰの種類は、それぞれ特定の機能を処
理するようにプログラムされる。

【００３１】ＧＤＨは、汎用データ・ハンドラで、主に
フレームの転送に用いられる。通常、ＧＤＨはそれぞれ
専用制御プロセッサを持つ。制御プロセッサはそれぞ
れ、本発明に従って複数のコプロセッサを使用する。シ
ステムに必要なＣＬＰの数は一般に、パフォーマンス評
価により求められる。アーキテクチャと構造は完全にス
ケーラブルであり、シリコン領域によってのみ制限され
る。ＣＬＰの数が増えると、シリコン領域に含まれるア
ービタと命令メモリが大きくなる。

【００３２】管理セル・ハンドラ（ＧＣＨ）のハードウ
ェアはＧＤＨと同じであるが、管理フレームはＧＣＨに
よってのみ処理できる。ＧＣＨがデータ・フレームも処
理するようになっている場合はＷｅｂ（ＣＬＰ対応レジ
スタ）上でプログラミングできる（その場合ＧＤＨの役
割を担う）。ＧＣＨは、ツリーの挿入や削除を行うた
め、ＧＤＨハードウェア・アシストにはないハードウェ
アを含む。ＧＣＨは、管理セル関連コードの実行、エー
ジングのようなチップ、ツリー管理関連コードの実行、
及びＣＰや他のＧＣＨとの制御情報の交換に用いられ
る。そのような実行タスクがない場合、ＧＣＨはフレー
ム転送関連コードを実行し、その場合はＧＤＨと全く同
じように動作する。

【００３３】汎用プロセッサ・ハンドラ（ＧＰＨ）。こ
のプロセッサは、Power PCに接続されるハードウェア・
メールボックスにアクセスする。ＲＩＴ１／２にはPowe
r PCはないので、ＧＰＨはＧＤＨと全く同じように動作
する。

【００３４】汎用ツリー・ハンドラ（ＧＴＨ）には、ツ
リーの挿入、ツリーの削除、及びロープの管理を行うた
め、ＧＤＨ及びＧＣＨハードウェア・アシストにはない
ハードウェアがある。ＧＴＨは、ＧＰＱにツリー管理コ
マンドを含むフレームがないときデータ・フレームを処
理する。

【００３５】図２を参照する。ＣＬＰ＃１３４は、命
令フェッチ／デコード／実行ユニット８８、汎用レジス
タ８０、及びスカラ・レジスタ８４とアレイ・レジスタ
８６が含まれる専用レジスタ８２を含む。ＣＬＰ＃２
３６も同種のコンポーネントを含む。

【００３６】ＣＬＰ３４は、２つの命令を除いて、その
実行ユニット１０２内で命令を完全に実行する。２つの
例外は、図４の直接／間接コプロセッサ実行命令４１７
である。これら２つの命令は、接続されたコプロセッサ
のうち１つでコマンド処理を開始する。コプロセッサは
コマンドを互いに並行して実行でき、またＣＬＰ内の命
令処理と並行して実行できる。ＣＬＰ命令にコプロセッ
サがかかわるときは、コプロセッサ識別子と呼ばれ、操
作のため選択されたコプロセッサを示す０乃至１５の範
囲内の４ビットの数が指定される。

【００３７】共有メモリ・プール：４Ｋバイトの共有メモリ・プール４４は、コプロセッサ
の少なくとも一部に対するアレイ・レジスタを保持す
る。ＰＰＵで動作する全てのスレッドにより用いられ
る。各スレッドにより１Ｋバイトが用いられ、次の領域
に分けられる。ＦＣＢｐａｇｅ（エンキュー・コプロセ
ッサのアレイ・レジスタと見なされる）、データ・フェ
ッチ、スクラッチ・メモリ領域（ＣＬＰのアレイ・レジ
スタと見なされる）、及びシステム領域である。プール
はスレッド数に応じて、等しいセグメントに分けられて
いると見なすことができる。各セグメントでは、アドレ
ス・スペースがＣＬＰ及びアレイ・レジスタを必要とす
る各種コプロセッサのアレイ・レジスタに分けられる。
プールのアドレス・ラインのうち２つは、どのＣＬＰが
アクティブか、どのスレッドがアクティブかに応じて駆
動される。

【００３８】ＰＰＵコプロセッサ：コプロセッサはそれ
ぞれ専用ハードウェア・アシスト・エンジンであり、コ
アに組み込まれた場合は、大量の直列化コードを必要と
するような機能を実行する。コプロセッサはＣＬＰと並
列に動作し、ＩＰヘッダの変更、フロー制御アルゴリズ
ムに用いられるフロー情報の維持、ＣＡＢを介した内部
レジスタへのアクセス、フロー制御及び管理情報ブロッ
ク（ＭＩＢ）のカウントの維持（標準とプロプライエタ
リ）、転送されるフレームのエンキュー等、データの移
動に用いられる機能を提供する。プロセッサはそれぞ
れ、他に明記しない限り、ＰＰＵの各スレッドに対する
スカラ・レジスタとアレイのセットを維持する。

【００３９】再び図２を参照する。ＰＰＵ１０は２つの
コア言語プロセッサ３４、３６と接続された数個のコプ
ロセッサ１２、２０、２２、２４、２６、２８、３０及
び３２を含む。これらのコプロセッサは、高速パターン
検索、データ操作、内部チップ管理機能、フレーム解
析、及びデータ・フェッチ等、特定のネットワーク処理
タスクについてハードウェア・アクセラレーションを実
現する。

【００４０】以下、各種コプロセッサとその機能につい
て説明する。

【００４１】ツリー検索コプロセッサ：ツリー検索エン
ジン（ＴＳＥ）コプロセッサ１２には、コプロセッサ識
別子２が割当てられる。ＴＳＥは、ツリー管理とアービ
タ１１０を介したツリー検索メモリへの直接アクセスに
関するコマンドを持つ。ＬＰＭ（可変長の一致を必要と
する最長プレフィックス一致パターン）、ＦＭ（正確な
一致のある固定サイズ・パターン）、及びＳＭＴ（範囲
またはビット・マスク・セットを定義するパターンを伴
うソフトウェア管理ツリー）の検索を行うアルゴリズム
を持ち、フレームの転送、及び変更情報を取得する。コ
プロセッサ識別子１が割当てられるデータストア・コプ
ロセッサ２６は、フレーム・データの収集、変更、また
はネットワーク・プロセッサのフレーム・データ・メモ
リ１１２への導入に用いられる。本発明に有用なツリー
検索のアーキテクチャや動作の詳細については、米国特
許出願ドケット番号ＲＡＬ９９９０１３９、同ＲＡＬ９
９９０１４０、及びＲＡＬ９９９０１４１を参照された
い。

【００４２】チェックサム・コプロセッサ：従来のチェ
ックサム・コプロセッサ２０は、インターネット・チェ
ックサムを計算するため提供されるアルゴリズムを使用
してチェックサムを計算し検証する。その際、ハーフワ
ード・データに対してチェックサム操作を実行し、ハー
フワード・チェックサム結果を返す。次のコマンドを使
用できる。・チェックサム生成、及び・チェックサム確認

【００４３】コマンドの結果は累算スカラ・レジスタと
ステイク・スカラ・レジスタに置かれる。累算スカラ・
レジスタは、チェックサム計算の結果を格納し、ステイ
ク・スカラ・レジスタは、チェックサムに含まれる最後
のハーフワードに続くバイト位置を格納する。チェック
サム・コプロセッサのデータは共有メモリ・プールに置
かれる。

【００４４】コプロセッサに対するコマンドは次のオプ
ションを含む。１）ＩＰヘッダ：ＩＰヘッダが指示されたとき、レイヤ
３ヘッダの開始位置（つまりステイク）が渡される。ハ
ードウェアが、ヘッダ長フィールドからＩＰヘッダの長
さを確認し、この値を長さスカラ・レジスタにロードす
る。チェックサムを生成する際、現在のチェックサムを
格納したハーフワードの代わりに０の値が用いられる。２）データ・ブロック：共有メモリ・プールにあるデー
タは、データのブロックとして処理され、チェックサム
を生成または確認することができる。共有メモリ・プー
ルの開始位置及び長さが渡される。データのブロックを
確認する際、チェックサムは累算スカラ・レジスタに置
かれる。データのブロックをチェックする際、チェック
サムは累算レジスタに置かれている。

【００４５】エンキュー・コプロセッサ：エンキュー・
コプロセッサ２４は２つの機能を提供する。１）コードにより、ワーキングＦＣＢＰａｇｅと呼ば
れ、アップ／ダウンＦＣＢページを作成するため用いら
れる２５６ビット・レジスタ、ＦＣＢ（フレーム制御ブ
ロック）ページを作成することができる。レジスタは、
フレームをＥＤＳ（エンキュー、デキュー／スケジュー
リング）アップまたはＥＤＳダウンでエンキューするた
め必要な全てのパラメータを格納する。レジスタに格納
されるパラメータの例として、アップのＦＣＢアドレ
ス、ターゲット・パート番号、フレーム変更情報、及び
次ループＩＤ等がある。２）ＣＬＰと完了ユニット（ＣＵ）のインタフェースを
提供する。ＣＵはＣＬＰから独立して動作するが、ＣＬ
Ｐプロセッサ毎にＲｅａｄｙＦＣＢＰａｇｅというレ
ジスタを格納する。レジスタは、エンキューの後、ＣＵ
にコピーされ、その後、エンキューはエンキュー・プロ
セッサにより引き継がれる。その際、ＣＬＰが解放され
て次のフレームが処理される。ＥＱはそのレディ・ビッ
ト（？）を設定する。ただし、ＣＵのＲｅａｄｙＦＣ
ＢＰａｇｅが空でない場合、ＥＱは、ＥＱレジスタが空
になるまでＣＬＰからＣＵへの転送をブロックし、その
後転送を可能にする。エンキュー・コプロセッサは、ス
レッドと完了ユニットの間のインタフェース及び共有メ
モリ・プールに維持されるＦＣＢＰａｇｅの使用を管理
する。各スレッドに３つのＦＣＢＰａｇｅ位置があり、
フレームに関するエンキュー情報をそこに維持すること
ができる。ページのうち２つは、連続したエンキュー間
で２つのページをスワップすることによって、完了ユニ
ット・インタフェースに対するパフォーマンスを改良す
るため用いられる。スレッドに対して書かれるアセンブ
リ言語コードは、ハードウェアによって管理されるので
これら２つのページを区別しない。３番目のページは、
コードにより新しいフレームを作成できるようにするた
めスレッドにより用いられる。この例として、学習のた
めの管理トラフィック（guided traffic for learnin
g）の作成がある。これはＧＴＨスレッドにより実行さ
れるように再エンキューされる。

【００４６】ＣＬＰスレッドがエンキュー・コマンドを
発行すると、ＦＣＢＰａｇｅは使用中と指示される。他
の位置が使用できる場合は、エンキュー・コプロセッサ
からの応答を待たずに新しいフレームがスレッドにディ
スパッチされる。完了ユニットは、エンキュー・コプロ
セッサを通して共有メモリ・プールからＦＣＢＰａｇｅ
をフェッチし、これをＥＤＳ（エンキュー・コマンドに
より示される入口または出口）に提供する。これが起こ
るとＦＣＢＰａｇｅはフリーと指示される。両方のＦＣ
ＢＰａｇｅが使用中と指示された場合、第３のフレーム
は起動できない。

【００４７】エンキュー・コプロセッサでは次のコマン
ドがサポートされる。・エンキュー入口（ＥＮＱＵＰ）は、完了ユニットを介
して入口フロー制御／スケジューラにエンキューする。・エンキュー出口（ＥＮＱＤＮ）は、完了ユニットを介
して出口フロー制御／スケジューラにエンキューする。・エンキュー・クリア（ＥＮＱＣＬＲ）は、現在のＦＣ
ＢＰａｇｅをクリアする（全フィールドを０に設定す
る）。

【００４８】データストア・コプロセッサ：このコプロ
セッサ２６は次の機能を実行する。１）アップ・データストア及びダウン・データストアと
のインタフェースを取る。２）タイマ・イベントのディスパッチまたは割込みのと
き構成情報を受信する。３）フレームのチェックサムを計算する。このコプロセッサは通常、３２０バイトのデータ・バッ
ファ及びそれぞれ１２８ビットのワード８個のメモリを
含む。

【００４９】フレーム・データはデータストア・コプロ
セッサを通してアクセスされ、メディアから受信された
フレームを格納する入口データストアと、パケット・ル
ーティング・スイッチから受信され再アセンブルされた
フレームを格納する出口データストアとのインタフェー
スが取られる。また、タイマ・イベントのディスパッチ
や割込みのとき構成情報も受信される。

【００５０】データストア・コプロセッサは、共有メモ
リ・プールで定義されたアレイを使用する。アレイはデ
ータプールであり、８つのクォドワード及び２つのスク
ラッチ・アレイを保持でき、スクラッチ・アレイの１つ
は８つのクォドワード、もう１つは４つのクォドワード
を保持する。データストア・コプロセッサには、入口、
出口のデータストアとの間のアレイ内容の読取り、書込
みの制御に用いられる別のスカラ・レジスタが維持され
る。データストア・コプロセッサによりサポートされる
スレッド毎に、アレイとスカラ・レジスタの１セットが
定義されている。

【００５１】これら共有メモリ・プールのアレイは、デ
ータストア・コプロセッサの作業領域になる。データス
トアを直接読取りまたはそこに直接書込む代わりに、大
量のフレーム・データがデータストアからこれら共有メ
モリ・プールのアレイに読取られるか、または大量のデ
ータがこれらアレイからデータストアに書込まれる。転
送単位はクォドワードであり、クォドワードは１６バイ
トとして定義される。

【００５２】データストア・コプロセッサには次のコマ
ンドを使用できる。１）出口データストア書込み（ＷＲＤＮＤＳ）：ＣＬＰ
により出口データストアへの書込みができる。書込みは
クォドワード単位の倍数でのみ発生する。データはデー
タストア・コプロセッサのアレイのいずれか（データプ
ールまたはスクラッチ・アレイ）から取られる。２）出口データストア読取り（ＲＤＤＮＤＳ）：ＣＬＰ
により出口データストアからデータを読取り、データス
トア・コプロセッサのアレイの１つに入れることができ
る。読取りは、出口データストアに対して、クォドワー
ド単位の倍数でのみ発生する。３）入口データストア書込み（ＷＲＵＰＤＳ）：ＣＬＰ
により入口データストアへデータを書込むことができ
る。読取りは、入口データストアに対して、クォドワー
ド単位の倍数でのみ発生する。４）入口データストア読取り（ＲＤＵＰＤＳ）：ＣＬＰ
により入口データストアからデータを読取ることができ
る（クォドワード単位の倍数でのみ）。５）出口データストアからの他のフレーム・データの読
取り（ＲＤＭＯＲＥＤＮ）：出口データストアからのハ
ードウェア・アシスト読取り。ＲＤＭＯＲＥＤＮは、最
後の読取りが停止したところからフレームの読取りを続
け、データをデータプールに置く。データはデータプー
ルに移されるので、ハードウェアは、読取られているフ
レームの現在位置を管理し、次のツイン・バッファの位
置を確認するためツイン・バッファからリンク・ポイン
タをキャプチャする。このアドレスは、ツインが尽きて
次のツインが読取られるまで、後続のＲＤＭＯＲＥＤＮ
要求のためハードウェアにより用いられる。データプー
ルの内容はツインの内容のマップなので、データプール
内でフレーム・データがラップされる可能性がある。コ
ードによりデータプール内のデータの位置が管理され
る。６）入口データストアからの他のフレーム・データの読
取り（ＲＤＭＯＲＥＵＰ）：入口データストアからのハ
ードウェア・アシスト読取り。ＲＤＭＯＲＥＵＰは、最
後の読取りが停止したところからフレームの読取りを続
け、データをデータプールに置く。データはデータプー
ルに移されるので、ハードウェアは、読取られているフ
レームの現在位置を管理し、フレームの次のデータ・バ
ッファの位置を確認するためバッファ制御ブロック領域
に維持されたリンクをキャプチャする。このアドレス
は、データ・バッファが尽きて次のバッファが読取られ
るまで、後続のＲＤＭＯＲＥＵＰ要求のためハードウェ
アにより用いられる。コードによりデータプール内のフ
レームのデータの位置が管理される。７）リース・ツイン・バッファ（ＬＥＡＳＥＴＷＩ
Ｎ）：フリー・ツイン・バッファ（出口データストアで
新しいデータを作成するときに用いられる）のアドレス
を返す。

【００５３】制御アクセス・バス（ＣＡＢ）コプロセッ
サ：このコプロセッサ２８では、ネットワーク・プロセ
ッサが、ネットワーク・プロセッサ・システム全体で、
選択されたレジスタを制御することができる。システム
初期化等のために特定のレジスタを初期化でき、システ
ム診断やメンテナンスのため特定のレジスタを読取るこ
とができる。

【００５４】コプロセッサは、組み込みプロセッサ複合
体（ＥＰＣ）Ｗｅｂアービタとインタフェースを取る。
アービタはＣＬＰとＷｅｂウォッチ間の調停を行う。こ
れによりＣＬＰは全てＷｅｂ上で読取り、書込みができ
る。

【００５５】ＣＡＢコプロセッサは、ＣＬＰスレッドに
関してＣＡＢアービタと制御アクセス・バスにインタフ
ェースを与える。スレッドは、ＣＡＢのアドレス、デー
タ等、ＣＡＢアクセスのオペランドをロードする必要が
ある。その場合、ＣＡＢにアクセスするプロトコルは、
ＣＡＢインタフェース・コプロセッサにより処理され
る。ＣＡＢインタフェース・コプロセッサは次のコマン
ドを提供する。・ＣＡＢアクセス調停（ＷＥＢＡＲＢ）：ＣＡＢへのア
クセスを取得するためスレッドにより用いられる。アク
セスが取得されると、スレッドはＣＡＢを解放するまで
ＣＡＢの制御を維持する。・ＣＡＢ読取り／書込み（ＷＥＢＡＣＣＥＳＳ）：ＣＡ
Ｂ及びＣＡＢからアクセスできる接続されたレジスタと
の間でデータを移動する。ＰＰＵ内の送信元と宛先は汎
用レジスタ（ＧＰＲ）である。・ＣＡＢ優先使用（ＷＥＢＰＲＥＥＭＰＴ）：ＧＦＨス
レッドによってのみ用いられ、これによりＧＦＨは、１
回の読取り／書込みアクセスについて、ＣＡＢがすでに
他のスレッドに与えられている場合でもＣＡＢの制御を
取得する。

【００５６】チェックサム、データストア、エンキュ
ー、ＣＡＢの各コプロセッサのアーキテクチャ、動作に
関する他の詳細については、整理番号ＲＡＬ９９９００
８３の米国特許出願、"String Copy（StrCopy）Coproce
ssor"を参照されたい。

【００５７】ストリング・コピー・コプロセッサ２２は
ＣＬＰの機能を拡張し、データのブロックを移動する。
データは共有メモリ・プール内でのみ移動する。次のコ
マンドが使用できる。・ストリング・コピー（Strcopy）：このコマンドは、
アレイ間でデータの複数のバイトを移動するため用いら
れる。コマンドは、ソース・データ・ブロックとシンク
・データ・ブロックの開始バイト位置及び移動するバイ
ト数を渡す。

【００５８】カウンタ・コプロセッサ：カウンタ・コプ
ロセッサ３０は、全ＰＰＵ間で共有できるカウンタ・マ
ネージャ（図示せず）へのアクセスをバス７２を通して
提供する。コプロセッサは、全てのカウンタ・プログラ
ムとインタフェースを取り、カウンタの更新を行う。ス
カラ・レジスタとコプロセッサ実行インタフェース１６
間のＦＩＦＯバッファ７６で実装される。アレイ・レジ
スタとコプロセッサ・データ・インタフェース１４間に
第２ＦＩＦＯバッファ７８が置かれる。スレッドはそれ
ぞれ自体のカウンタ・コプロセッサを持っているかのよ
うに動作する。このコプロセッサには外部（ＰＰＵに対
して）アドレス／データ・バスが用いられる。これによ
り、外部バスを通してカウンタ・コプロセッサを使用す
るため２つ以上のＰＰＵが調停を行えるようにシステム
を実装することができる。

【００５９】スレッドは、カウンタ・コプロセッサを通
してカウンタの更新を要求し、カウンタ・マネージャが
操作を完了するのを待たずに処理を続けることができ
る。カウンタ・コプロセッサはその要求をカウンタ・マ
ネージャに通知し、カウンタ・アクセス・コマンドのオ
ペランドを処理のためカウンタ・マネージャに渡す。カ
ウンタ・コプロセッサには、ＰＰＵで動作する４つのス
レッドにより発行されたカウンタ・アクセス・コマンド
を入れる８ディープ・キューがある。カウンタ・コプロ
セッサは次のコマンドを提供する。

【００６０】カウンタ・アクセス（CtrAccess）は、カ
ウンタを増分するかまたはカウンタに値を追加する。コ
マンド・オペランドは、カウンタ識別子（カウンタ・メ
モリの形）、インデックスとオフセット、増分もしくは
追加コマンド、値フィールド、カウントの読取りもしく
は書込み、またはカウント値の読取りとクリアである。
スレッドは、カウンタ・コプロセッサ・キューが一杯で
なければ、コマンドの実行を待たない。

【００６１】カウンタ・コプロセッサとその動作につい
て詳しくは、整理番号ＲＡＬ９２０００００７８ＵＳ１
の米国特許出願、"Coprocessor for Managing Large Co
unter Arrays"を参照されたい。

【００６２】ポリシ・コプロセッサ：ポリシ・コプロセ
ッサ３２は、スレッドに関してポリシ・マネージャ（図
示せず）とのインタフェース７４を提供する。スカラ・
レジスタとコプロセッサ実行インタフェース１６間のＦ
ＩＦＯバッファ７６で実装される。アレイ・レジスタと
コプロセッサ・データ・インタフェース１４間には第２
ＦＩＦＯバッファ７８が置かれる。スレッドは、このイ
ンタフェースを通してフレームの"カラー"の更新を要求
する。フレームのカラーは、ネットワーク・プロセッサ
の構成可能なフロー制御機構の一部として用いられ、こ
の機構によりフレームに対する処理が決定される。スレ
ッドはポリシ・マネージャが、ポリシ・コプロセッサを
介して結果を返すまで待機する必要がある。ポリシ・マ
ネージャは、このフレームがメンバーであるフローにつ
いてポリシ制御ブロックにアクセスする。オペランドに
は、ポリシ制御ブロック・アドレス、パケット長、フレ
ームに現在割当てられているカラー等がある。返される
結果はフレームの新しいカラーである。

【００６３】ＣＬＰ３４、３６はそれぞれ、コプロセッ
サ実行インタフェース１６とコプロセッサ・データ・イ
ンタフェース１４の２つのインタフェースを通してコプ
ロセッサ１２、２０、２２、２４、２６、２８、３０及
び３２に接続される。これらのインタフェースの機能に
ついては図４で詳しく説明する。

【００６４】ＰＰＵ内のコプロセッサはそれぞれ、４ビ
ット・コプロセッサ識別子により識別される。各コプロ
セッサが最大２５６の専用レジスタをサポートする。コ
プロセッサ内の専用レジスタは、０乃至２５５の範囲の
８ビット・レジスタ番号により識別される。コプロセッ
サ番号（ＣＰ＃）とレジスタ番号の組み合わせにより、
ＰＰＵ内のレジスタが識別される。スカラ・レジスタと
アレイ・レジスタの２種類の専用レジスタがある。

【００６５】レジスタ番号０乃至２３９はスカラ・レジ
スタに予約されている。スカラ・レジスタは最小１ビッ
ト、最大３２ビットである。スカラ・レジスタのビット
には０乃至３１までの番号が振られ、０は右端またはＬ
ＳＢ（least significant bit）、３１は左端またはＭ
ＳＢ（most significant bit）である。３２ビット未満
の長さのスカラ・レジスタは右揃えされ、残りのビット
は非実装と見なされる。ＣＬＰが３２ビット未満の長さ
のスカラ・レジスタを読取るとき、非実装ビットの値は
ハードウェアに依存する。非実装ビットへの書込みは無
効である。

【００６６】レジスタ番号２４０乃至２５５はアレイ・
レジスタに予約されている。アレイ・レジスタは最小２
バイト、最大２５６バイトである。ＣＬＰはアレイ・レ
ジスタを読取るか書込み、共有メモリ・プール４４内で
一度に２バイト（ハーフワード）、一度に４バイト（ワ
ード）、または一度に１６バイト（クォドワード）パー
ティションをきる。

【００６７】汎用レジスタの使用方法は周知の通りであ
り、ここでは一般的なことについて述べる。プログラマ
から見た汎用レジスタは２通りある。汎用レジスタは、
０、２、４、．．．１４の集合から４ビット数で表され
る３２ビット・ラベルで示されるように、３２ビット・
レジスタと見なすこともできる。この意味でプログラマ
は８個の３２ビット汎用レジスタを扱う。またプログラ
マは汎用レジスタを、０、１、２、．．．１５の集合か
らの４ビット数として表される１６ビット・ラベルに従
って、１６ビット・レジスタとして扱うこともできる。
この意味でプログラマは１６個の１６ビット・レジスタ
を扱う。

【００６８】各コプロセッサに、ビジー信号フィールド
からの情報を格納するステータス・レジスタが含まれ
る。このレジスタは、所与のコプロセッサが利用できる
か、またはビジー状態かどうかをプログラマに示す。コ
プロセッサ完了コード・レジスタが図４のＯＫ／Ｋ．
Ｏ．フィールド４１５からの情報を格納する。従って、
プログラマは、所与のコプロセッサがビジーかまたは利
用できるか知る必要のある場合、この情報をコプロセッ
サのステータス・レジスタから取得することができる。
同様にコプロセッサ完了コード・レジスタが、コプロセ
ッサ・タスクの完了についてプログラマに情報を提供す
る。

【００６９】各ＣＬＰに次の１６ビット・プログラム・
レジスタが含まれる。プログラム・カウンタ・レジス
タ、プログラム・ステータス・レジスタ、リンク・レジ
スタ、及びキー長レジスタである。タイムスタンプ・レ
ジスタと乱数ジェネレータ・レジスタの２つの３２ビッ
ト・レジスタも追加される。前記レジスタそれぞれにス
カラ・レジスタ番号も与えられる。

【００７０】プログラマから見た汎用レジスタは２通り
考えられる。プログラマは汎用レジスタを３２ビット・
レジスタと見なすことができ、１６ビット・レジスタと
見なすこともできる。

【００７１】アレイ・レジスタは、アレイ・レジスタ番
号を通してプログラマに知られる。

【００７２】図４は、コプロセッサ実行インタフェース
１６とコプロセッサ・データ・インタフェース１４を通
してＣＬＰ３４をそのコプロセッサ４０１に接続するイ
ンタフェース信号を示す。個々のワイヤ接続数は、個々
の割当てアイテムの矢印の横にある番号ラベルに示して
ある。ここの説明では、選択コプロセッサ２０、２
２、．．．は、コプロセッサ識別子が、後述する操作に
応じて４１１、４２０、または４２９に現れるコプロセ
ッサ識別子に一致するコプロセッサを表す。

【００７３】ＣＬＰ３４は、実行インタフェース１６に
より、任意のコプロセッサ２０、２２、．．．上でコマ
ンドの実行を開始することができる。コプロセッサ番号
４１１は、コマンドのターゲットとして１６のコプロセ
ッサのうち１つを選択する。ＣＬＴにより開始フィール
ド４１０が論理"１"になると、コプロセッサ番号４１１
により示される選択コプロセッサ４５０が、６ビットＯ
ｐフィールド４１２により指定されたコマンドの実行を
開始する。Ｏｐ引数４１３は、４４ビットのデータで、
コプロセッサ４５０により処理されるようにコマンドと
ともに渡される。ビジー信号４１４は１６ビット・フィ
ールドで、各コプロセッサ４０１に１ビットであり、コ
プロセッサがコマンドを実行していてビジーか（ビット
＝１）または、そのコプロセッサがコマンドを実行して
いない（ビット＝０）ことを示す。これら１６ビットは
スカラ・レジスタに保存され、レジスタのビット０はコ
プロセッサ０に、ビット１はコプロセッサ１に、以下同
様に対応する。ＯＫ／Ｋ．Ｏ．フィールド４１５は１６
ビット・フィールドで、各コプロセッサ４０１に１ビッ
トである。これは１ビット戻り値コードであり、コマン
ドに依存する。例えば、コプロセッサ４０１に与えられ
たコマンドが失敗に終わったか、コマンドが成功したか
をＣＬＰ３４に示すためこれを使用できる。この情報は
ＣＬＰスカラ・レジスタ内に保存され、レジスタのビッ
ト０はコプロセッサ０に、ビット１はコプロセッサ１
に、以下同様に対応する。直接／間接フィールド４１７
は、コプロセッサ実行命令のどのフォーマットが実行さ
れているかを選択コプロセッサ４５０に示す。直接／間
接＝０のとき、直接フォーマットが実行されている。直
接／間接＝１のときは間接フォーマットが実行されてい
る。

【００７４】コプロセッサ・データ・インタフェース１
４は３つの信号グループを含む。書込みインタフェース
４１９、４２０、４２１、４２２、４２３、４２４は、
コプロセッサ内のスカラ・レジスタまたはアレイ・レジ
スタにデータを書込むときに関係する。読取りインタフ
ェース４２７、４２８、４２９、４３０、４３１、４３
２、４３３は、コプロセッサ内のスカラ・レジスタ８４
またはアレイ・レジスタ８６のいずれかの専用レジスタ
８２からデータを読取るときに関係する。第３のグルー
プ４２５、４２６、４２７は、スカラ・レジスタまたは
アレイ・レジスタの読取りと書込みの両方で用いられ
る。読取りインタフェースと書込みインタフェース両方
に対する複製機能は、レジスタからレジスタへデータを
移動するための同時読取り／書込みをサポートするよう
に働く。

【００７５】書込みインタフェースは、書込みフィール
ド４１９を使用して、コプロセッサ番号４２０により示
されるコプロセッサ４５０を選択する。書込みフィール
ド４１９は、ＣＬＰ３４が選択コプロセッサにデータを
書込もうとするときに１に設定される。コプロセッサ・
レジスタ識別子４２１は、ＣＬＰ３４が選択コプロセッ
サ内４５０に書込もうとすることをレジスタに示す。コ
プロセッサ・レジスタ識別子４２１は８ビット・フィー
ルドで、よって２５６のレジスタがサポートされる。０
乃至２３９の範囲のコプロセッサ・レジスタ識別子はス
カラ・レジスタへの書込みを示す。２４０乃至２５５の
範囲のコプロセッサ・レジスタ識別子はアレイ・レジス
タへの書込みを示す。アレイ・レジスタ書込みの場合、
オフセット・フィールド４２２は、アレイ・レジスタの
データ書込み操作の開始点を示す。このフィールドは８
ビットで、従ってアレイ内で２５６のアドレスをサポー
トする。データ出力フィールドは、コプロセッサ４５０
に書込まれるデータを入れる。これは１２８ビットの大
きさで、従って最大１２８ビットの情報を一度に書込む
ことができる。書込み有効フィールド４２４は、コプロ
セッサ４５０がデータの受信をいつ終了したかをＣＬＰ
３４に示す。これによりＣＬＰ３４は、コプロセッサ４
５０がデータを取る間、一時停止し、データを有効な状
態に保つことができる。

【００７６】読取りインタフェース１４は、書込みイン
タフェース１６と構造は似ているが、データはコプロセ
ッサから読取られる。読取りフィールド４２８は書込み
フィールド４１９に対応し、選択コプロセッサ４５０で
読取り操作がいつ実行されるか示すためＣＬＰ３４によ
り用いられる。コプロセッサ番号識別子フィールド４２
９は、どのコプロセッサ４５０が選択されているかを示
す。レジスタ番号フィールド４３０、オフセット・フィ
ールド４３１、及び読取り有効フィールド４３３は、書
込みインタフェースの４２１、４２２及び４２４に対応
する。データ入力フィールド４３２は、コプロセッサ４
５０からＣＬＰ３４へのデータを入れる。

【００７７】読取りまたは書込みの操作は、３つの長さ
のうちいずれか１つをとる。１６ビットが転送されるこ
とを示すハーフワード、３２ビットが転送されることを
示すワード、及び１２８ビットが転送されることを示す
クォドワードである。読取りデータ４３２と書込みデー
タ４２３は１２８ビット幅である。１２８ビット未満の
データ転送は右揃えされる。信号４２５及び４２６は、
データ転送サイズを示す。１６ビットの転送は４２５と
４２６が両方とも０で示され、３２ビットの転送は４２
５と４２６がそれぞれ１と０で示され、１２８ビットの
転送は４２５と４２６がそれぞれ０と１で示される。

【００７８】修飾フィールド４２７は、データ読取りま
たはデータ書込みの操作で用いられる。コプロセッサは
それぞれ、コプロセッサのハードウェア・デザイナによ
り定義された独自の方法でその意味を解釈する。これに
よりプログラマは、読取りまたは書込みの操作のときに
ハードウェアに対して情報ビットを追加指定することが
できる。データストア・コプロセッサは、パケット・バ
ッファのリンク・リストでパケット・バッファのリンク
・フィールドを省略することができる。

【００７９】コプロセッサでタスクを開始した後、ＣＬ
Ｐは、命令の実行を続けるか、またはコプロセッサでタ
スクが完了するまで実行を中断することができる。ＣＬ
Ｐが、コプロセッサ内のタスク実行と並行して命令の実
行を続ける場合、後の時点で、メイン・プロセッサ・ユ
ニットによるＷＡＩＴ命令の実行のため、１つ以上のコ
プロセッサでのタスク実行が完了するまで他の命令の実
行が中断する。ＷＡＩＴ命令は、形式によっては１つ以
上のコプロセッサ内でタスクが完了するまでＣＬＰ上の
実行を中断させる。その時点でＣＬＰは命令の実行をＷ
ＡＩＴ命令に続く命令から再開する。他の形では、ＷＡ
ＩＴ命令により、特定のコプロセッサ内でタスクが完了
するまでＣＬＰの実行が中断する。そのタスクが完了す
ると、ＣＬＰはコプロセッサからの１ビット戻りコード
を、ＷＡＩＴ命令からの１ビットとともに調べ、ＷＡＩ
Ｔ命令に続く命令から命令の実行を再開するか、実行を
プログラマにより指定された他の命令に分岐するか確認
する。

【００８０】コプロセッサ実行命令は、コプロセッサで
のコマンド処理を真似るため、図１のコプロセッサ実行
インタフェース１６の"開始"信号を１に設定する。図５
乃至８を参照する。コプロセッサ識別子５２０は、命令
フィールド５００から取得され、開始信号を介して選択
コプロセッサを示す。６ビット・コプロセッサ・コマン
ドは命令フィールド５０１から取得され、どのコマンド
の実行を開始するかを信号により選択コプロセッサに示
す。開始信号がアクティブにされ１になると、選択コプ
ロセッサはそのビジー信号をアクティブにし（１にす
る）、コマンドの実行を完了するまで１のままにしてお
く。コマンドの実行が完了すると、この信号を０にする
（非アクティブ化）。ＣＬＰは継続して１６ビットの信
号を読取り、それらをそのスカラ・レジスタに入れる。
コマンドの完了後、選択コプロセッサはこのステータス
をスカラ・レジスタに入れる。

【００８１】再び図５乃至図８を参照する。命令の非同
期実行フィールド５０２が０のとき、ＣＬＰはコマンド
の完了を示すため、そのビジー信号を無効化する。その
とき、ＣＬＰは命令のフェッチと実行を再開する。命令
の非同期実行フィールド５０２が１のとき、ＣＬＰは、
ビジー信号の状態にかかわらず命令のフェッチと実行を
続ける。

【００８２】選択コプロセッサでコマンド処理が開始さ
れると、ＣＬＰは４４ビットの他のコマンド対応情報を
信号によりコプロセッサに与える。この情報は、図５乃
至図８に示すように命令フォーマットに応じて４つの方
法のいずれかで引き出される。

【００８３】図５のコプロセッサ実行間接フォーマット
は、上位１２ビット５２３のコマンド情報を命令フィー
ルド５０４から取得する。下位３２ビットのコマンド情
報５２４は３２ビット汎用レジスタ５０５から取得され
る。選択レジスタは、値｛０、２、４、．．．１４｝に
制限された４ビット命令フィールド５０３により求めら
れる。こうしてそのレジスタから３２ビット・レジスタ
が選択される。ＣＬＰは信号を１に設定し、これが命令
の間接フォームであることを選択コプロセッサに示す。

【００８４】実行命令の条件付きコプロセッサ実行間接
フォーマットを図６に示す。ここで命令は、満足した特
定の条件をもとに図５と同じように実行される。条件を
満足しない場合、命令は実行されない。命令は、ＣＬＰ
のＡＬＵコードをもとに実行される。条件付き実行には
４ビットが使用され、その結果Ｏｐフィールドは２ビッ
トに短縮される。従って考えられる６４のコマンドのう
ち４つに対して条件付き実行が可能になる。他のコマン
ドは０と見なされる。よって長い待ち時間と短い待ち時
間をもとにした条件付き実行を実現することができる。
コプロセッサ命令の条件付き実行は特に、カウンタ・コ
プロセッサの動作と関連するときに有益である。

【００８５】図７のコプロセッサ実行直接フォーマット
は、下位１６ビット５２７のコマンド情報を命令フィー
ルド５０６から取得する。上位２８ビット５２６のコマ
ンド情報は０に設定される。ＣＬＰは信号を０に設定
し、これが命令の直接形式であることを選択コプロセッ
サに示す。

【００８６】条件付きコプロセッサ実行直接フォーマッ
トを、図７と同じように実行されるように構成された形
で図８に示す。図６と同様、条件付き実行では、４ビッ
トが使用され、その結果Ｏｐフィールドは２ビットに短
縮される。よって、考えられる６４のコマンドのうち４
つに対して条件付き実行が可能になる。

【００８７】図９は、コプロセッサ待機命令のフォーマ
ットを示す。ＣＬＰは、コプロセッサ・ステータス・レ
ジスタで、命令フィールド６００から取得された１６ビ
ット・マスクに対してビット単位でＡＮＤ演算を行う。
結果が０でない、つまり１つ以上のコプロセッサが現在
まだコマンドを実行している場合、ＣＬＰは命令のフェ
ッチと実行を中断する。ただし、前記ＡＮＤ演算の実行
は、結果が０になるまで継続する。

【００８８】図１０は、コプロセッサ待機／分岐フォー
マットを示す。コプロセッサ識別子フィールド６０１
は、コプロセッサ・ステータスの特定のビットがテスト
されることを示す。例えばフィールド６０１に１がある
とき、コプロセッサ・ステータス・レジスタのビット１
がテストされる。識別子フィールド６０１に１５がある
とき、コプロセッサ・ステータスのビット１５がテスト
される。テストされるビットの値が１で、対応するコプ
ロセッサがコマンドの実行をまだ完了していないことを
示す場合、ＣＬＰは命令のフェッチと実行を中断する。
ただし前記の演算はテスト・ビットの値が０、つまり対
応するコプロセッサがコマンドの実行を完了するまで継
続する。この時点で、命令のＯＫフィールド６０２の値
と、コプロセッサ識別子６０１により選択された、スカ
ラ・レジスタのコプロセッサ完了コードのビットの値に
応じて、２つの処理のうちいずれかが発生する。ＣＬＰ
は、下表に応じて、次のシーケンシャル命令のフェッチ
と実行を再開するか、または分岐して、命令フィールド
６０３により示される命令アドレスから命令のフェッチ
と実行を再開する。

【表１】６０２の値選択コプロセッサ選択コプロセッサ完了コード・ビットの値＝０完了コード・ビットの値＝１０分岐次の命令１次の命令分岐

【００８９】コプロセッサ・ユニットでタスクを開始す
るときの命令の実行については、米国特許出願第５４８
１０９号、"Coprocessor Structure and Method for a
Communications System Network Processor"を参照され
たい。

【００９０】本発明は、更に、各ＣＬＰの複数の命令実
行スレッド（それぞれ、処理中の別々のパケットに関係
する）それぞれの独立したプロセス及びデータ・アクセ
ス時の待ち時間の処理に関する。実行スレッドはそれぞ
れ独立したプロセスであり、スレッドがコプロセッサ・
ハードウェアにアクセスできるときに命令のシーケンス
を実行する。ツリー検索コプロセッサは、パイプライン
にされ、ツリー検索パイプラインで複数の実行スレッド
がそれぞれ同時に、ただし異なるフェーズで（オーバラ
ップして）アクセスすることができる。本発明は、好適
には、オーバヘッド０で複数の命令実行スレッドを採用
し、実行をスレッドからスレッドに切り替える。スレッ
ドはキューにされ、共有メモリに対するアクセスが高速
に配信される。スレッドをキューにすることで、長い待
ち時間のイベントに対して優先順位が最大のスレッドを
可能な限り速く得ることができる。

【００９１】前述のように、ＰＰＵはそれぞれ、実行ス
レッド毎に１つ、複数の命令プリフェッチ・バッファを
含む。これらのプリフェッチ・バッファにより、アクテ
ィブな実行スレッドにより命令の帯域幅が十分利用され
ていないインターバル時、アイドル中の実行スレッドの
ため命令のプリフェッチが可能になる。これにより、制
御が新しい実行スレッドに切り替わったとき、そのスレ
ッドの命令プリフェッチ・バッファが一杯になりやす
く、よって、実行に利用できる命令が足りないために新
しいスレッドがすぐ中断する可能性がなくなる。こうし
て、命令メモリに対するアクセス優先順位は、現在実行
中のスレッドが最大の優先順位になり、現在のスレッド
が中断したときに制御を取る立場にある実行スレッドが
第２の優先順位を与えられるように制御される。同様
に、実行キューの下端にある実行スレッドには、命令フ
ェッチ・アクセスで最後の優先順位が与えられる。

【００９２】待ち時間の長いイベントのため（ツリー検
索等）、アクティブなスレッドの実行が中断したとき、
次のスレッドにフル制御が与えられるか、または待ち時
間の短いイベント（ローカル・データ・ストレージでの
コプロセッサの操作もしくは命令フェッチ待ち時間）の
ため実行が中断したときは、一時的制御が次のスレッド
に与えられる。一時的制御が他のスレッドに与えられた
場合、制御は、ブロックが解除されるとすぐに元のスレ
ッドに返される。逆に他のスレッドにフル制御が与えら
れた場合、その他のスレッドは、ブロックされるまで制
御を保つ。これにより待ち時間の短いイベントでのサイ
クルの無駄が避けられるが、１次実行スレッドが待ち時
間の長いイベントに届くまでの時間は短くなる。他の場
合、複数の実行スレッドがほぼ同じ時間に待ち時間の長
いイベントに届く可能性があり、１つのスレッドのＰＰ
Ｕ実行を他のスレッドのツリー検索とオーバラップする
メリットは少なくなる。待ち時間をもとに制御を割当て
ることについて詳しくは、整理番号ＲＡＬ９２００００
００８の米国特許出願第５４２１８９号、"NetworkProc
essor with Multiple Instruction Threads"を参照され
たい。この割当てとスレッド実行制御の詳細は次のよう
になる。

【００９３】コンピュータの電源が初めて投入されたと
き、各ＣＬＰスレッドは初期化状態にある。パケットが
プロセッサにディスパッチされると、対応するスレッド
がレディ状態に変わり、その時点で実行サイクル要求を
開始する。

【００９４】アービタが、アービタの論理関数をもとに
ブール式に従って実行サイクルをスレッドに与える。サ
イクルが与えられた場合、スレッドはレディ状態から実
行状態に移る。実行状態のスレッドは、待ち時間イベン
トまたは処理されているパケットがエンキューされ、よ
ってそのパケットに対するコードの作業が終了したこと
が示されたため実行が中断するまで要求を出し続ける。
サイクルが与えられなくなると、これは他のスレッドが
制御を取ったことを示す。これは、アービタがサイクル
を与えない唯一の理由である。ただし、これら２つの状
態のいずれか（レディまたは実行）で、スレッドは、パ
ケット処理が終わりに達し、次のパケットがディスパッ
チのためキューに入るまで、新しい実行サイクルを要求
し続け、待ち時間イベントで一時停止する。システムは
そこで初期化状態に戻り、次のパケットを待機する。待
機状態は、待ち時間の長いイベントまたは短いイベント
を扱う。どのイベントが発生するかにかかわらず、プロ
セッサは中断し、アクティブなスレッドはデフォルトで
待機状態になる。スレッドはそこで、待ち時間イベント
が完了するまで実行サイクルの要求を停止する。

【００９５】スレッドを初期化状態からレディ状態に移
すのと同じディスパッチ操作により、スレッド番号がＦ
ＩＦＯバッファに入り、第１パケットがディスパッチさ
れるスレッドは、優先順位が最高のスレッドになる。後
のディスパッチ操作では、他のスレッド番号がＦＩＦＯ
に送られる。ＦＩＦＯの優先順位が最大のスレッド番号
は、待ち時間の長いイベントに出会うまでその位置にと
どまり、その後、スレッドはＦＩＦＯの始めに戻り、最
大優先順位から最小優先順位のスレッドに変わる。待ち
時間の短いイベントによってスレッドがＦＩＦＯバッフ
ァで優先順位を失うことはない。

【００９６】スレッドがパケットの処理を終了すると、
パケットは、出力ポートに転送するためエンキューさ
れ、スレッド番号がＦＩＦＯバッファから移される。

【００９７】新しいパケットは、ハイレベル・コントロ
ーラ（図示せず）からディスパッチされる。このコント
ローラはスレッドとプロセッサを選択して各パケットを
処理する。この決定により入力コマンドがＦＩＦＯバッ
ファに送られる。また入力が状態機械に送られ、初期化
状態からレディ状態に移行することが状態機械に指示さ
れる。外部コントローラからのそのコマンドとともに、
パケットのディスパッチ先であるスレッド番号もコント
ローラからＦＩＦＯに送る必要がある。

【００９８】基本的に、実行を中断させるイベントは現
在のプログラムの流れで短い割込みになるイベントと長
い割込みになるイベントの２種類ある。短い割込みは、
プログラムの流れが変わったため命令プリフェッチ・キ
ューを再び埋める必要のある分岐命令により発生するこ
とがある。或いはまた、プログラムはコプロセッサがプ
ロセッサのローカル・メモリでデータ関連タスクを実行
するのを待機している間に中断することがある。この例
は、チェックサム・コプロセッサが、変更されたヘッダ
・フィールドで新しいチェックサムを計算する場合であ
る。待ち時間が２５プロセッサ・サイクル未満のとき、
イベントは、短い割込みと見なされる。待ち時間の長い
イベントは通常、２５を超える待ち時間を伴い、通常は
５０プロセッサ・サイクル乃至１００プロセッサ・サイ
クルを超える。これらは全体のパフォーマンスに大きな
影響を与える。

【００９９】待ち時間の長いイベント、短いイベントを
確認する手段は他に多数ある。待ち時間の長さはプログ
ラマが制御でき、その場合ハードウェアやその構成は確
認の際の要素にはならない。一方、しきい値レジスタを
２５サイクルのしきい値で設定することもでき、その場
合、操作に必要になるサイクル数はハードウェアにより
確認され、その確認をもとに自動的な判断が行われる。

【０１００】コプロセッサ命令は、プロセッサが実行す
る命令の１タイプである。フィールドのビットの一部
は、どのコプロセッサが対象かを示す。１ビットによ
り、特定の命令が待ち時間の長いイベントまたは短いイ
ベントとして定義される。従って、プログラマは、同じ
アクセスを２つ定義することができる。１つは待ち時間
の長いイベントとして、もう１つは待ち時間の短いイベ
ントとして定義される。スレッド実行制御関数は、こう
した待ち時間の長いイベントの影響を最小にするために
設計されている。よって待ち時間の長いイベントによ
り、フル制御が別の実行スレッドに切り替わり、待ち時
間の短いイベントにより一時的にのみ他のスレッドへの
切り替えが起こる。

【０１０１】プロトコル・プロセッサ・ユニット（ＰＰ
Ｕ）とコア言語プロセッサの詳細は、当業者には周知の
通りであり、本発明の一部を構成しないが、それらは、
変更或いは実装することでネットワーク・プロセッサ・
システム全体のアーキテクチャの一部になっており、特
定の機能コプロセッサやシステムの他のコンポーネント
と連携する。本発明で有用な個々のコプロセッサのアー
キテクチャやプログラミングを含めた詳細は、本発明の
一部を構成するものと見なされない。

【０１０２】まとめとして、本発明の構成に関して以下
の事項を開示する。

【０１０３】（１）ネットワーク・プロセッサのプログ
ラミング機能を制御する組み込みプロセッサ複合体のオ
ペレーションであって、該プロセッサ複合体は、複数の
プロトコル・プロセッサ・ユニット（ＰＰＵ）を含み、
各ＰＰＵは少なくとも１つのコア言語プロセッサ（ＣＬ
Ｐ）を含み、各ＣＬＰは少なくとも２つのコード・スレ
ッドを持ち、各ＰＰＵはＰＰＵの特定のタスクを実行す
る上で有用な複数のコプロセッサ及び複数の論理コプロ
セッサ・インタフェースを利用し、各ＣＬＰと該コプロ
セッサ間のアクセスを実現する、オペレーション。（２）前記コプロセッサは、各ＣＬＰの複数のコード・
スレッドをサポートする専用コプロセッサを含む、前記
（１）記載のオペレーション。（３）前記コプロセッサは、ツリー検索コプロセッサ、
チェックサム・コプロセッサ、ストリングコピー・コプ
ロセッサ、エンキュー・コプロセッサ、データストア・
コプロセッサ、ＣＡＢコプロセッサ、カウンタ・コプロ
セッサ、及びポリシ・コプロセッサを含むグループから
選択される、前記（１）記載のオペレーション。（４）複数のスレッド間の優先順位を確認するためコプ
ロセッサ実行インタフェース・アービタを含む、前記
（３）記載のオペレーション。（５）データ・スレッド間の優先順位を確認するためコ
プロセッサ・データ・インタフェース・アービタを含
む、前記（３）記載のオペレーション。（６）各スレッドと少なくとも１つのコプロセッサ間に
ＦＩＦＯバッファを含む、前記（３）記載のオペレーシ
ョン。（７）前記ＦＩＦＯバッファは各スレッドと前記カウン
タ・コプロセッサの間にある、前記（６）記載のオペレ
ーション。（８）前記ＦＩＦＯバッファは各スレッドと前記ポリシ
・コプロセッサの間にある、前記（６）記載のオペレー
ション。（９）ネットワーク・プロセッサのプログラミング機能
を制御する組み込みプロセッサ複合体を含むネットワー
ク処理システムであって、該複合体は複数のプロトコル
・プロセッサ・ユニット（ＰＰＵ）を含み、各ＰＰＵ
は、それぞれ少なくとも２つのコード・スレッドを持つ
少なくとも１つのコア言語プロセッサ（ＣＬＰ）と、前
記システムの特定のタスクを実行する複数のコプロセッ
サ及び該コプロセッサのリソースにアクセスし各ＣＬＰ
と共有する複数のコプロセッサ・インタフェースと、を
含む、システム。（１０）前記コプロセッサ・インタフェースは、各ＣＬ
Ｐのコード・スレッドをサポートすることにのみ用いら
れる、前記（９）記載のネットワーク処理システム。（１１）前記コプロセッサは、ツリー検索コプロセッ
サ、チェックサム・コプロセッサ、ストリングコピー・
コプロセッサ、エンキュー・コプロセッサ、データスト
ア・コプロセッサ、ＣＡＢコプロセッサ、カウンタ・コ
プロセッサ、及びポリシ・コプロセッサを含むグループ
から選択される、前記（１０）記載のネットワーク処理
システム。（１２）各スレッドと前記コプロセッサのうち少なくと
も１つの間にＦＩＦＯバッファを含む、前記（１０）記
載のネットワーク処理システム。（１３）前記ＦＩＦＯバッファは各スレッドと前記カウ
ンタ・コプロセッサの間にある、前記（１２）記載のネ
ットワーク処理システム。（１４）前記ＦＩＦＯバッファは各スレッドと前記ポリ
シ・コプロセッサの間にある、前記（１２）記載のネッ
トワーク処理システム。（１５）前記ＣＬＰのスレッドにより実行される特定の
操作命令を含み、該実行の結果、コプロセッサ・オペレ
ーションを制御するコマンドが得られ、該コマンドは前
記ＣＬＰとコプロセッサ間のインタフェースを流れる、
前記（９）記載のネットワーク処理システム。（１６）前記命令は、特定のコプロセッサ・オペレーシ
ョンの条件付き実行を可能にするように働く、前記（１
５）記載のネットワーク処理システム。（１７）前記命令により、前記システムが、特定のコプ
ロセッサ・コマンドに応答してデータにアクセスするた
めの予測応答時間に従って、待ち時間の長いイベントと
待ち時間の短いイベントを識別し、アクティブなスレッ
ドの実行が待ち時間の長いイベントにより中断したとき
に他のスレッドにフル制御を与えるか、またはアクティ
ブなスレッドの実行が待ち時間の短いイベントにより中
断したときに他のスレッドに一時的制御を与える、前記
（１５）記載のネットワーク処理システム。（１８）複数のプロトコル・プロセッサ・ユニット（Ｐ
ＰＵ）を含む組み込みプロセッサ複合体内の命令の実行
を制御する方法であって、該プロトコル・プロセッサ・
ユニットはそれぞれ少なくとも１つのコア言語プロセッ
サ（ＣＬＰ）を含み、該ＣＬＰはそれぞれ少なくとも２
つのコード・スレッドを持ち、該方法は、該ＰＵに対す
る特定のタスクを実行するため、各ＰＰＵによる複数の
コプロセッサの使用、及び該コプロセッサと各ＣＬＰ間
のアクセスを提供する複数の論理コプロセッサ・インタ
フェースの使用を含む、方法。（１９）前記ＰＰＵの複数のコード・スレッドをサポー
トする専用コプロセッサの使用を含む、前記（１８）記
載の方法。（２０）前記コプロセッサの1つ以上は、ツリー検索コ
プロセッサ、チェックサム・コプロセッサ、ストリング
コピー・コプロセッサ、エンキュー・コプロセッサ、デ
ータストア・コプロセッサ、ＣＡＢコプロセッサ、カウ
ンタ・コプロセッサ、及びポリシ・コプロセッサを含む
グループから選択される、前記（１９）記載の方法。（２１）実行スレッド間の優先順位を確認するためコプ
ロセッサ実行インタフェース・アービタが用いられる、
前記（２０）記載の方法。（２２）データ・スレッド間の優先順位を確認するため
コプロセッサ・データ・インタフェース・アービタが用
いられる、前記（２０）記載の方法。（２３）各スレッドと前記コプロセッサのうち少なくと
も１つの間にＦＩＦＯバッファを提供するステップを含
む、前記（２０）記載の方法。（２４）前記ＦＩＦＯバッファは各スレッドと前記カウ
ンタ・コプロセッサの間にある、前記（２３）記載の方
法。（２５）前記ＦＩＦＯバッファは各スレッドと前記ポリ
シ・コプロセッサの間にある、前記（２３）記載の方
法。（２６）前記ＣＬＰにより実行される特定の操作命令を
提供するステップを含み、該実行の結果、コプロセッサ
・オペレーションを制御するコマンドが得られ、該コマ
ンドは前記ＣＬＰとコプロセッサの間のインタフェース
を流れる、前記（１８）記載の方法。（２７）前記操作命令により特定のコプロセッサ・オペ
レーションの条件付き実行が可能になる、前記（２６）
記載の方法。（２８）前記実行は直接的または間接的である、前記
（２７）記載の方法。（２９）前記システムが、特定のコプロセッサ・コマン
ドに関する予測応答時間に従って、待ち時間の長いイベ
ントと待ち時間の短いイベントを識別し、アクティブな
スレッドの実行が待ち時間の長いイベントにより中断し
たときに他のスレッドにフル制御を与えるか、またはア
クティブなスレッドの実行が待ち時間の短いイベントに
より中断したときに他のスレッドに一時的制御を与え
る、命令を提供するステップを含む、前記（１８）記載
の方法。

【図面の簡単な説明】

【図１】２つのコア言語プロセッサとコプロセッサを持
つプロトコル処理ユニットを示す図である。

【図２】２つのコア言語プロセッサとコプロセッサがイ
ンタフェースを取るプロトコル処理ユニットを示す図で
ある。

【図３】コア言語プロセッサと選択されたコプロセッサ
のインタフェースを示す図である。

【図４】コプロセッサ実行インタフェースとコア言語プ
ロセッサを複数のコプロセッサに接続するコプロセッサ
・データ・インタフェースを示す図である。

【図５】コプロセッサ実行命令フォーマットを示す図で
ある。

【図６】コプロセッサ実行命令フォーマットを示す図で
ある。

【図７】コプロセッサ実行命令フォーマットを示す図で
ある。

【図８】コプロセッサ実行命令フォーマットを示す図で
ある。

【図９】コプロセッサ待機命令フォーマットを示す図で
ある。

【図１０】コプロセッサ待機命令フォーマットを示す図
である。

【符号の説明】

１０プロトコル・プロセッサ・ユニット（ＰＰＵ）１２ツリー検索エンジン１４データ・インタフェース１６実行インタフェース２０チェックサム・コプロセッサ２２ストリング・コピー・コプロセッサ２４エンキュー・コプロセッサ２６データストア・コプロセッサ２８制御アクセス・バス・コプロセッサ３０カウンタ・コプロセッサ３２ポリシ・コプロセッサ３４、３６コア言語プロセッサ（ＣＬＰ）４０コプロセッサ実行インタフェース（ＣＰＥ）アー
ビタ４２コプロセッサ・データインタフェース（ＣＰＤ
Ｉ）アービタ４４共有メモリ・プール５６命令メモリ６８ＣＡＢアービタ７４インタフェース７６、７８ＦＩＦＯバッファ８０汎用レジスタ８２専用レジスタ８４スカラ・レジスタ８６アレイ・レジスタ８８命令フェッチ／デコード／実行ユニット１０２実行ユニット１１０ツリー検索メモリ（ＴＳＭ）アービタ１１２フレーム・データ・メモリ４０１、４５０コプロセッサ４１３Ｏｐ引数４１４ビジー信号４１９、４２０、４２１、４２２、４２３、４２４書
込みインタフェース４２１コプロセッサ・レジスタ識別子４２７、４２８、４２９、４３０、４３１、４３２、４
３３読取りインタフェース４５０選択コプロセッサ５０５３２ビット汎用レジスタ５２０コプロセッサ識別子５２３上位１２ビット５２４コマンド情報

───────────────────────────────────────────────────── フロントページの続き (72)発明者ゴードン・テイラー・デイビスアメリカ合衆国27514、ノース・カロライナ州チャペル・ヒル、フランクリン・リッジ 97603 (72)発明者マルコ・シィ・ヘッズアメリカ合衆国27612、ノース・カロライナ州ローリー、ナンバー 308、グランド・メナー・コート 4109 (72)発明者ロス・ボイド・リーベンスアメリカ合衆国27511、ノース・カロライナ州カーリー、ウィランダー・ドライブ 123 (72)発明者マーク・アンソニー・リナルディアメリカ合衆国27713、ノース・カロライナ州ダーハム、クイーンズバリー・サークル 1201 Ｆターム(参考） 5B013 DD03 5B098 AA10 GA04 GA05 GA07 GB09 GB14 GC03

Claims

【特許請求の範囲】

【請求項１】ネットワーク・プロセッサのプログラミン
グ機能を制御する組み込みプロセッサ複合体のオペレー
ションであって、該プロセッサ複合体は、複数のプロト
コル・プロセッサ・ユニット（ＰＰＵ）を含み、各ＰＰ
Ｕは少なくとも１つのコア言語プロセッサ（ＣＬＰ）を
含み、各ＣＬＰは少なくとも２つのコード・スレッドを
持ち、各ＰＰＵはＰＰＵの特定のタスクを実行する上で
有用な複数のコプロセッサ及び複数の論理コプロセッサ
・インタフェースを利用し、各ＣＬＰと該コプロセッサ
間のアクセスを実現する、オペレーション。
【請求項２】前記コプロセッサは、各ＣＬＰの複数のコ
ード・スレッドをサポートする専用コプロセッサを含
む、請求項１記載のオペレーション。
【請求項３】前記コプロセッサは、ツリー検索コプロセ
ッサ、チェックサム・コプロセッサ、ストリングコピー
・コプロセッサ、エンキュー・コプロセッサ、データス
トア・コプロセッサ、ＣＡＢコプロセッサ、カウンタ・
コプロセッサ、及びポリシ・コプロセッサを含むグルー
プから選択される、請求項１記載のオペレーション。
【請求項４】複数のスレッド間の優先順位を確認するた
めコプロセッサ実行インタフェース・アービタを含む、
請求項３記載のオペレーション。
【請求項５】データ・スレッド間の優先順位を確認する
ためコプロセッサ・データ・インタフェース・アービタ
を含む、請求項３記載のオペレーション。
【請求項６】各スレッドと少なくとも１つのコプロセッ
サ間にＦＩＦＯバッファを含む、請求項３記載のオペレ
ーション。
【請求項７】前記ＦＩＦＯバッファは各スレッドと前記
カウンタ・コプロセッサの間にある、請求項６記載のオ
ペレーション。
【請求項８】前記ＦＩＦＯバッファは各スレッドと前記
ポリシ・コプロセッサの間にある、請求項６記載のオペ
レーション。
【請求項９】ネットワーク・プロセッサのプログラミン
グ機能を制御する組み込みプロセッサ複合体を含むネッ
トワーク処理システムであって、該複合体は複数のプロ
トコル・プロセッサ・ユニット（ＰＰＵ）を含み、各Ｐ
ＰＵは、それぞれ少なくとも２つのコード・スレッドを持つ少な
くとも１つのコア言語プロセッサ（ＣＬＰ）と、前記システムの特定のタスクを実行する複数のコプロセ
ッサ及び該コプロセッサのリソースにアクセスし各ＣＬ
Ｐと共有する複数のコプロセッサ・インタフェースと、を含む、システム。
【請求項１０】前記コプロセッサ・インタフェースは、
各ＣＬＰのコード・スレッドをサポートすることにのみ
用いられる、請求項９記載のネットワーク処理システ
ム。
【請求項１１】前記コプロセッサは、ツリー検索コプロ
セッサ、チェックサム・コプロセッサ、ストリングコピ
ー・コプロセッサ、エンキュー・コプロセッサ、データ
ストア・コプロセッサ、ＣＡＢコプロセッサ、カウンタ
・コプロセッサ、及びポリシ・コプロセッサを含むグル
ープから選択される、請求項１０記載のネットワーク処
理システム。
【請求項１２】各スレッドと前記コプロセッサのうち少
なくとも１つの間にＦＩＦＯバッファを含む、請求項１
０記載のネットワーク処理システム。
【請求項１３】前記ＦＩＦＯバッファは各スレッドと前
記カウンタ・コプロセッサの間にある、請求項１２記載
のネットワーク処理システム。
【請求項１４】前記ＦＩＦＯバッファは各スレッドと前
記ポリシ・コプロセッサの間にある、請求項１２記載の
ネットワーク処理システム。
【請求項１５】前記ＣＬＰのスレッドにより実行される
特定の操作命令を含み、該実行の結果、コプロセッサ・
オペレーションを制御するコマンドが得られ、該コマン
ドは前記ＣＬＰとコプロセッサ間のインタフェースを流
れる、請求項９記載のネットワーク処理システム。
【請求項１６】前記命令は、特定のコプロセッサ・オペ
レーションの条件付き実行を可能にするように働く、請
求項１５記載のネットワーク処理システム。
【請求項１７】前記命令により、前記システムが、特定
のコプロセッサ・コマンドに応答してデータにアクセス
するための予測応答時間に従って、待ち時間の長いイベ
ントと待ち時間の短いイベントを識別し、アクティブな
スレッドの実行が待ち時間の長いイベントにより中断し
たときに他のスレッドにフル制御を与えるか、またはア
クティブなスレッドの実行が待ち時間の短いイベントに
より中断したときに他のスレッドに一時的制御を与え
る、請求項１５記載のネットワーク処理システム。
【請求項１８】複数のプロトコル・プロセッサ・ユニッ
ト（ＰＰＵ）を含む組み込みプロセッサ複合体内の命令
の実行を制御する方法であって、該プロトコル・プロセ
ッサ・ユニットはそれぞれ少なくとも１つのコア言語プ
ロセッサ（ＣＬＰ）を含み、該ＣＬＰはそれぞれ少なく
とも２つのコード・スレッドを持ち、該方法は、該ＰＰ
Ｕに対する特定のタスクを実行するため、各ＰＰＵによ
る複数のコプロセッサの使用、及び該コプロセッサと各
ＣＬＰ間のアクセスを提供する複数の論理コプロセッサ
・インタフェースの使用を含む、方法。
【請求項１９】前記ＰＰＵの複数のコード・スレッドを
サポートする専用コプロセッサの使用を含む、請求項１
８記載の方法。
【請求項２０】前記コプロセッサの1つ以上は、ツリー
検索コプロセッサ、チェックサム・コプロセッサ、スト
リングコピー・コプロセッサ、エンキュー・コプロセッ
サ、データストア・コプロセッサ、ＣＡＢコプロセッ
サ、カウンタ・コプロセッサ、及びポリシ・コプロセッ
サを含むグループから選択される、請求項１９記載の方
法。
【請求項２１】実行スレッド間の優先順位を確認するた
めコプロセッサ実行インタフェース・アービタが用いら
れる、請求項２０記載の方法。
【請求項２２】データ・スレッド間の優先順位を確認す
るためコプロセッサ・データ・インタフェース・アービ
タが用いられる、請求項２０記載の方法。
【請求項２３】各スレッドと前記コプロセッサのうち少
なくとも１つの間にＦＩＦＯバッファを提供するステッ
プを含む、請求項２０記載の方法。
【請求項２４】前記ＦＩＦＯバッファは各スレッドと前
記カウンタ・コプロセッサの間にある、請求項２３記載
の方法。
【請求項２５】前記ＦＩＦＯバッファは各スレッドと前
記ポリシ・コプロセッサの間にある、請求項２３記載の
方法。
【請求項２６】前記ＣＬＰにより実行される特定の操作
命令を提供するステップを含み、該実行の結果、コプロ
セッサ・オペレーションを制御するコマンドが得られ、
該コマンドは前記ＣＬＰとコプロセッサの間のインタフ
ェースを流れる、請求項１８記載の方法。
【請求項２７】前記操作命令により特定のコプロセッサ
・オペレーションの条件付き実行が可能になる、請求項
２６記載の方法。
【請求項２８】前記実行は直接的または間接的である、
請求項２７記載の方法。
【請求項２９】前記システムが、特定のコプロセッサ・
コマンドに関する予測応答時間に従って、待ち時間の長
いイベントと待ち時間の短いイベントを識別し、アクテ
ィブなスレッドの実行が待ち時間の長いイベントにより
中断したときに他のスレッドにフル制御を与えるか、ま
たはアクティブなスレッドの実行が待ち時間の短いイベ
ントにより中断したときに他のスレッドに一時的制御を
与える、命令を提供するステップを含む、請求項１８記
載の方法。