JP2001243070A

JP2001243070A - プロセッサ及び分岐予測方法並びにコンパイル方法

Info

Publication number: JP2001243070A
Application number: JP2000053820A
Authority: JP
Inventors: Shigehiro Asano; 滋博浅野; Yoshifumi Yoshikawa; 宜史吉川
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2000-02-29
Filing date: 2000-02-29
Publication date: 2001-09-07
Also published as: US20010037446A1; US6735681B2

Abstract

(57)【要約】（修正有）【課題】条件分岐命令の予測精度を向上させ、プロセ
ッサ性能を向上させることができるようにしたプロセッ
サを提供すること。【解決手段】プロセッサ内の次アドレス計算部１４に
おいて、ＳＥＬ０は命令キャッシュ１５の命令に付加さ
れているＰｒｅｄｅｃｏｄｅ０を参照し、それが予測不
可を示す値ならば飽和付きカウンタ部１５０からの分岐
予測を出力させ、予測可を示す値ならば命令キャッシュ
１５の命令に付加されているコンパイラによる分岐予測
Ｐｒｅｄｅｃｏｄｅ１を出力させる。ＳＥＬ１はＳＥＬ
０の出力が分岐成立を示す値ならば加算器１４６の出力
（分岐先アドレス）を選択し、分岐不成立ならば加算回
路１４５の出力（当該命令の次のアドレス）を選択す
る。予測に失敗しない限りこのＳＥＬ１の出力はＳＥＬ
２を介して次アドレス・レジスタ１４４に保持される。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、条件分岐命令の分
岐予測機能を持つプロセッサ及び該プロセッサにおける
分岐予測方法並びに該プロセッサで実行されるプログラ
ムを生成するためのコンパイル方法に関する。

【０００２】

【従来の技術】パイプライン方式を適用したプロセッサ
においては、プログラムの実行中に条件分岐命令の条件
が真となり分岐が実行されると、当該条件分岐命令の実
行に先行してパイプラインに入れていた命令が実行され
ないため、実際の分岐先の新たな命令をパイプラインに
詰める間、プロセッサは有効な動作をすることができ
ず、実行の効率が低下してしまう。これを「分岐ペナル
ティ」と呼んでいる。

【０００３】分岐ペナルティがどのように生じるかにつ
いて５段のパイプラインを持ったＲＩＳＣプロセッサを
例にとって説明する。一例として図６に示すような命令
列が実行される場合を考える。

【０００４】通常のＲＩＳＣプロセッサの５段パイプラ
インは、Ｆステージ（命令のフェッチ）、Ｄステージ（命令のデコード）、Ｅステージ（命令の実行）、Ｍステージ（メモリのアクセス）、Ｗステージ（レジスタファイルへの書き込み）、の各ステージで構成されている。

【０００５】このような５段パイプラインで図６に示す
ような命令列を実行した場合、各サイクルにおけるパイ
プラインの様子は図７のようになる。

【０００６】すなわち、あるサイクル（Ｎとする）にお
いて、図６に例示した命令列の“ＢＲＥＱＲ２，Ｒ
４，ＬＡＢＥＬ１”の命令がＥステージにおいて実行さ
れると、Ｒ２レジスタの値とＲ４レジスタの値とが一致
しているか（真か）、一致していないか（偽か）が判定
される。分岐条件が真であれば分岐成立となり、分岐条
件が偽となれば分岐不成立となる。

【０００７】また、このサイクルＮでは、上記ＢＲＥＱ
命令に後続する“ＬＷＲ８，（Ｒ９）”の命令がＤス
テージに、さらに後続する“ＡＮＤＲ１１，Ｒ８，Ｒ
７”の命令がＦステージにそれぞれ入っている。

【０００８】次に、サイクルＮ＋１においては、先のサ
イクルＮでＢＲＥＱの結果が偽となった場合には、パイ
プライン処理を続行すればよいが、図７に示すように、
ＢＲＥＱの結果が真となった場合には、先のサイクルＮ
でＤステージにあった“ＬＷＲ８，（Ｒ９）”の命令と
Ｆステージにあった“ＡＮＤＲ１１，Ｒ８，Ｒ７”の
命令をキャンセルし、あらためて分岐先の“ＯＲＲ１
１，Ｒ８，Ｒ７”の命令からフェッチを始めなければな
らない。すなわち、この例の場合には、ＢＲＥＱ命令の
後の２サイクル分は命令が実行されず、サイクルが無駄
に費やされてしまう。

【０００９】上記例では５段のパイプラインであった
が、プロセッサの周波数の向上に伴ってパイプラインの
段数は長くなっているので、パイプライン段数とともに
分岐ペナルティは大きくなる傾向にある。

【００１０】このような分岐ペナルティを緩和するため
の方法として、動的な分岐予測を用いるものがある。分
岐予測は過去の分岐条件の真偽から将来の分岐条件の真
偽を予測するもので、一般に過去の条件分岐で真が多け
れば、真と予測し、偽が多ければ、偽と予測する。過去
の条件分岐の傾向を分岐予測に反映させる仕組みは、飽
和付きカウンタで実現されるのが一般的である。例え
ば、２ビットの飽和付きカウンタでは、図８に示すよう
な状態遷移となる。

【００１１】図８の状態遷移図において、真と付された
矢印は条件分岐が真となったときの状態遷移を表し、偽
と付された矢印は条件分岐が偽となったときの状態遷移
を表している。条件分岐命令が実行されて真偽が判明す
るごとに、その真偽に従って、４つの状態、すなわちＳ
Ｎ（ＳｔｒｏｎｇｌｙＮｏｔＴａｋｅｎ）、ＷＮ
（ＷｅａｋｌｙＮｏｔＴａｋｅｎ）、ＷＴ（Ｗｅａ
ｋｌｙＴａｋｅｎ）、ＳＴ（ＳｔｒｏｎｇｌｙＴａ
ｋｅｎ）を遷移させる。そして、条件分岐命令の真偽を
予測する際には、飽和付きカウンタの状態がＷＴまたは
ＳＴにあれば条件分岐は真になると予測し、ＳＮまたは
ＷＮにあれば条件分岐は偽になると予測する。

【００１２】なお、このように条件分岐の真偽の結果に
基づいて分岐予測するモードをここでは「真偽モード
（Ｔａｋｅｎモード）」と呼ぶこととする。

【００１３】さて、このような飽和付きカウンタは、プ
ログラム中のすべての条件分岐命令に個別に対応してハ
ードウェアとして存在するのが理想的であるが、現実に
はコストの面から許容できないのが通常である。そこ
で、一般には飽和付きカウンタを一定量だけテーブルの
形で用意し、各条件分岐命令とそのテーブルのエントリ
とを、条件分岐命令のアドレスを入力とする固有のハッ
シュ関数を利用するなどして対応させている。しかし、
この方法を利用すると、ハードウェアの資源が有限で収
まる代わりに、該テーブルの同一エントリ（すなわち、
同一の飽和付きカウンタ）を利用する２つ以上の条件分
岐命令でコンフリクト（この場合、真になる確率の高い
条件分岐命令と偽になる確率の高い条件分岐命令とが同
一の飽和付きカウンタに割り当てられること）が生起し
得るという問題がある。

【００１４】このようなコンフリクトに対応する方法と
して、飽和付きカウンタの状態遷移に、コンパイラによ
る条件分岐予測を利用する「アグリー・モード（Ａｇｒ
ｅｅモード）」がある。

【００１５】Ａｇｒｅｅモードを利用する方法では、ま
ず、コンパイラがプログラムのコンパイル時に各々の条
件分岐命令の条件の真偽を予測し、予測結果に従って該
命令に追加するタグの値を設定することにより（もしく
は、条件分岐が真であると予測した命令と、偽であると
予測した命令の２種類を使い分けることにより）、プロ
セッサに対して各々の条件分岐命令の条件の真偽につい
ての予測結果を知らせるようにする。そして、Ａｇｒｅ
ｅモードの飽和付きカウンタは、条件分岐の真偽の結果
に基づいて状態を遷移させる前述のモードとは違って、
条件分岐の結果（真または偽）とコンパイラの予測（真
または偽）とが一致したか一致しなかったかによって、
その状態を遷移させるものである。例えば、２ビットの
飽和付きカウンタでは、図９に示すような状態遷移とな
る。

【００１６】図９の状態遷移図において、一致と付され
た矢印はコンパイラの予測と一致したときの状態遷移を
表し、不一致と付された矢印はコンパイラの予測と一致
しなかったときの状態遷移を表している。条件分岐命令
が実行されて真偽が確定し、コンパイラの予測との一致
／不一致が判明するごとに、その一致／不一致に従っ
て、４つの状態、すなわちＳＤ（ＳｔｒｏｎｇｌｙＤ
ｉｓａｇｒｅｅ）、ＷＤ（ＷｅａｋｌｙＤｉｓａｇｒ
ｅｅ）、ＷＡ（ＷｅａｋｌｙＡｇｒｅｅ）、ＳＡ（Ｓ
ｔｒｏｎｇｌｙＡｇｒｅｅ）を遷移させる。そして、
条件分岐命令の真偽を予測する際には、飽和付きカウン
タの状態がＷＡまたはＳＡにあれば条件分岐は「コンパ
イラの予測に一致する」、すなわちコンパイラが真と予
測すれば真に、コンパイラが偽と予測すれば偽になると
予測し、ＳＤまたはＷＤにあれば条件分岐は「コンパイ
ラの予測とは不一致になる」、すなわちコンパイラが真
と予測すれば偽に、コンパイラが偽と予測すれば真にな
ると予測する。

【００１７】このＡｇｒｅｅモードを用いれば、条件分
岐が真になる確率の高い条件分岐命令と、偽になる確率
の高い条件分岐命令とが同一の飽和付きカウンタ（もし
くは、飽和付きカウンタを構成するテーブルの同一エン
トリ）を使用しても、互いに打ち消し合うようなことが
ないので、実効的にエントリ数を増やしたのと同じ効果
が得られる。

【００１８】ところが、Ａｇｒｅｅモードの場合には、
コンパイラでは真偽を予測できない条件分岐命令につい
ては適当な方法で真または偽のいずれかを設定するの
で、そのような条件分岐命令が、飽和付きカウンタ（も
しくは、飽和付きカウンタを構成するテーブルのエント
リ）を汚染し、予測率を下げてしまうという問題点があ
る。

【００１９】一例として、図９に示すような、ある１つ
の飽和付きカウンタ（もしくは、飽和付きカウンタを構
成するテーブルのある１つのエントリ）を、あるプログ
ラム中の３つの条件分岐命令が共用する場合について考
える。この３つの条件分岐命令は、プログラムの実行時
に同じ出現頻度で現れ、それぞれ、次のような特性を持
っているとする。・条件分岐命令Ａ：コンパイラで真と予測され、実際に
は８０％の確率で真になる。・条件分岐命令Ｂ：コンパイラで偽と予測され、実際に
は８０％の確率で偽になる。・条件分岐命令Ｃ：コンパイラで予測できないので偽と
設定され、実際には７０％の確率で真になる。

【００２０】この場合に、図９に示した状態遷移におい
て、ある状態から一致に遷移する確率（Ｈとする）は、
次のようにして求めることができる。

【００２１】まず、状態遷移図の一致の矢印に遷移する
確率Ｈは、どの状態からでも同じである。また、状態遷
移図の不一致の矢印に遷移する確率（１−Ｈ）も、どの
状態からでも同じである。

【００２２】状態ＳＡへはＳＡ自身またはＷＡから遷移
するので、状態がＳＡにある確率は、状態がＳＡ自身に
ある確率（ＳＡ）に一致の確率Ｈを乗じたものと、状態
がＷＡにある確率（ＷＡ）に一致の確率Ｈを乗じたもの
との和で与えられ、ＳＡ×Ｈ＋ＷＡ×Ｈ＝ＳＡ …（１）となる。同様に、状態がＷＡにある確率（ＷＡ）はＳＡ
とＷＤから、ＳＡ×(1-H)＋ＷＤ×Ｈ＝ＷＡ …（２）状態がＷＤにある確率（ＷＤ）はＷＡとＳＤから、ＷＡ×(1-H)＋ＳＤ×Ｈ＝ＷＤ …（３）状態がＳＤにある確率（ＳＤ）はＷＤとＳＤから、ＷＤ×(1-H)＋ＳＤ×(1-H)＝ＳＤ …（４）となる。

【００２３】ここで、式（２）および式（１）より、ＷＡ＝ＳＡ×(1-H)／ＨＷＤ＝ＳＡ×（(1-H)−Ｈ×(1-H)）／（Ｈ×Ｈ）が得られる。

【００２４】次に、これらＷＡ，ＷＤを式（３）に代入
して、ＳＤ＝ＳＡ×（(1-H)−Ｈ×(1-H)−Ｈ×(1-H)×(1-H)）
／Ｈ×Ｈ×Ｈが得られる。

【００２５】一方、ＳＡ＋ＷＡ＋ＷＤ＋ＳＤ＝１であ
る。

【００２６】ここで、これらＷＡ，ＷＤ，ＳＤをＳＡ＋
ＷＡ＋ＷＤ＋ＳＤ＝１へ代入しＳＡについて解くと、ＳＡ＝Ｈ×Ｈ×Ｈ／（１−２×Ｈ＋２×Ｈ×Ｈ）が得られる。

【００２７】いま、確率Ｈは、条件分岐命令Ａが真と予
測して当たる確率０．８と、条件分岐命令Ｂが偽と予測
して当たる確率０．８と、条件分岐命令Ｃが偽と予測し
て当たる確率０．３との平均から、Ｈ＝（０．８＋０．
８＋０．３）／３＝０．６３３３３３であるので、上記
の計算によると、ＳＡ＝０．４７４３４３、ＷＡ＝０．
２７４６２、ＷＤ＝０．１５８９９、ＳＤ＝０．０９２
０４７と求まる。

【００２８】これにより、本例において、飽和付きカウ
ンタが「条件分岐の真偽はコンパイラによる予測に一致
（Ａｇｒｅｅ）する」と予測する確率（ＡＧとする）
は、ＡＧ＝ＳＡ＋ＷＡ＝０．７４８９６３となる。もち
ろん、コンパイラに不一致（Ｄｉｓａｇｒｅｅ）と予測
する確率は（１−ＡＧ）＝０．２５１０３７である。

【００２９】さて、ここで、この予測機構により条件分
岐命令の予測が一致する場合の確率を求める。予測が当
たる第１のケースは、飽和付きカウンタによる予測が
「コンパイラの指示と一致」であり、かつ、実際に条件
分岐がコンパイラの指示と一致したケースであり、この
ケースが発生する確率は、（０．８×ＡＧ＋０．８×ＡＧ＋Ｏ．３×ＡＧ）／３である。予測が当たる第２のケースは、飽和付きカウン
タによる予測が「コンパイラの指示と不一致」であり、
かつ、実際に条件分岐がコンパイラの指示と不一致にな
ったケースであり、このケースが発生するのは、（０．２×(1-AG)＋０．２×(1-AG)＋Ｏ．７×(1-AG)）
／３である。そして、上記の２つを加えると、上記例の場合
において予測が当たる確率は、０．５６６３９となる。

【００３０】この数値は分岐予測として働いてはいるが
あまりよい値ではない。この場合、コンパイラで予測が
できない条件分岐命令に飽和付きカウンタを割り当てて
しまったことに問題があり、例で示す条件分岐命令Ｃが
確率を下げている。

【００３１】

【発明が解決しようとする課題】従来の分岐予測方法で
は、同一の飽和付きカウンタに複数の条件分岐命令を割
り当てられた場合に、カウンタが汚染され、予測率が低
下することがある、という問題点があった。

【００３２】本発明は、上記事情を考慮してなされたも
ので、条件分岐命令の予測精度を向上させ、プロセッサ
性能を向上させることができるようにしたプロセッサ及
び分岐予測方法並びにコンパイル方法を提供することを
目的とする。

【００３３】

【課題を解決するための手段】本発明（請求項１）に係
るプロセッサは、同一の分岐先、同一の分岐条件を持つ
命令について、分岐予測に関して、分岐成立と予測され
た命令、分岐不成立と予測された命令および予測不可と
された命令の３種類の区別が設けられた命令セットを持
つことを特徴とする。本発明（請求項２）に係るプロセ
ッサは、与えられた命令が条件分岐命令である場合に、
該命令が、コンパイラにおいて分岐成立と予測された第
１種の条件分岐命令か、コンパイラにおいて分岐不成立
と予測された第２種の条件分岐命令か、コンパイラにお
いて予測不可とされた第３種の条件分岐命令かを識別す
る識別手段と、前記条件分岐命令に対して前記識別結果
に応じた分岐予測処理を行う分岐予測処理手段とを備え
たことを特徴とする。好ましくは、前記分岐予測処理手
段は、前記第１種または第２種と識別された条件分岐命
令と、前記第３種と識別された条件分岐命令とで、異な
る形態の分岐予測処理を行うようにしてもよい。好まし
くは、前記分岐予測処理手段は、前記第１種と識別され
た条件分岐命令については、コンパイラにおける予測に
従って分岐成立と予測して分岐予測処理を行い、前記第
２種と識別された条件分岐命令については、コンパイラ
における予測に従って分岐不成立と予測して分岐予測処
理を行い、前記第３種と識別された条件分岐命令につい
ては、条件分岐予測器を使用して分岐予測処理を行うよ
うにしてもよい。好ましくは、前記分岐予測処理手段
は、前記第１種または第２種と識別された条件分岐命令
について、アグリー・モードの条件分岐予測器を使用し
て分岐予測処理を行い、前記第３種と識別された条件分
岐命令について、真偽モードの条件分岐予測器を使用し
て分岐予測処理を行うようにしてもよい。好ましくは、
命令キャッシュ中で前記識別の対象となった条件分岐命
令に対する識別結果を示す情報を該条件分岐命令に付加
して記録する手段を更に備えるようにしてもよい。ま
た、本発明（請求項７）に係る分岐予測方法は、与えら
れた命令が条件分岐命令である場合に、該命令が、コン
パイラにおいて分岐成立と予測された第１種の条件分岐
命令か、コンパイラにおいて分岐不成立と予測された第
２種の条件分岐命令か、コンパイラにおいて予測不可と
された第３種の条件分岐命令かを識別し、前記条件分岐
命令に対して前記識別結果に応じた分岐予測処理を行う
ことを特徴とする。また、本発明（請求項８）は、与え
られたソースプログラムに基づいて対象とするプロセッ
サで実行可能なオブジェクトプログラムを生成するコン
パイル方法であって、前記ソースプログラムを解析して
中間コードを生成する第１のステップと、前記中間コー
ドを最適化し、コード生成して、オブジェクトプログラ
ムを生成する第２のステップとを有し、前記第２のステ
ップは、対象となった条件分岐命令が、分岐成立と予
測、分岐不成立と予測、予測不可の３種類のいずれに該
当するかを判定するステップと、この判定結果に対応す
る命令を生成するステップとを含むことを特徴とする。
好ましくは、前記第１のステップは、対象となった条件
分岐命令に、前記判定のための情報を付加するステップ
を含むようにしてもよい。

【００３４】なお、プロセッサに係る本発明は分岐予測
方法に係る発明としても成立し、分岐予測方法に係る本
発明はプロセッサに係る発明としても成立する。

【００３５】また、コンパイル方法に係る本発明はコン
パイラ（装置）に係る発明としても成立し、コンパイラ
（装置）に係る本発明はコンパイル方法に係る発明とし
ても成立する。

【００３６】また、コンパイル方法、コンパイラ（装
置）に係る本発明は、コンピュータに当該発明に相当す
る手順を実行させるための（あるいはコンピュータを当
該発明に相当する手段として機能させるための、あるい
はコンピュータに当該発明に相当する機能を実現させる
ための）プログラムを記録したコンピュータ読取り可能
な記録媒体としても成立する。

【００３７】本発明によれば、与えられた命令が条件分
岐命令である場合に、該命令が、コンパイラにおいて分
岐成立と予測された第１種の条件分岐命令か、コンパイ
ラにおいて分岐不成立と予測された第２種の条件分岐命
令か、コンパイラにおいて予測不可とされた第３種の条
件分岐命令かを識別し、前記条件分岐命令に対して前記
識別結果に応じた分岐予測処理を行うので（例えば、前
記分岐予測処理手段は、前記第１種または第２種と識別
された条件分岐命令と、前記第３種と識別された条件分
岐命令とで、異なる形態の分岐予測処理を行うので）、
例えば飽和付きカウンタの汚染などの不具合を回避する
ことができ、条件分岐命令の予測精度を向上させ、これ
によって、プロセッサの性能を向上させることができ
る。

【００３８】

【発明の実施の形態】以下、図面を参照しながら発明の
実施の形態を説明する。

【００３９】本実施形態では、プロセッサにおける条件
分岐予測の性能を向上させるために、コンパイラにおい
て、条件分岐命令の分岐条件について真または偽の予測
を行い、その予測結果を識別可能にするとともに、真偽
が予測できない（もしくは真偽を予測しないと判断し
た）条件分岐命令については、予測しなかったことを識
別可能にし、プロセッサにおいては、コンパイラが真偽
の予測をした条件分岐命令か、コンパイラが真偽の予測
をしなかった条件分岐命令かで、異なる扱いをするよう
にしている。

【００４０】この異なる扱いの仕方には種々の形態が考
えられる。例として４つの形態を示すと次のようにな
る。（１）コンパイラが真偽の予測をしなかった条件分岐命
令は、前述したＴａｋｅｎモードで条件分岐予測を行
う。コンパイラが真偽の予測をした条件分岐命令は、そ
のコンパイラの予測に従う。（２）コンパイラが真偽の予測をしなかった条件分岐命
令は、前述したＴａｋｅｎモードで条件分岐予測を行
う。コンパイラが真偽の予測をした条件分岐命令は、Ａ
ｇｒｅｅモードで条件分岐予測を行う。

【００４１】（３）コンパイラが真偽の予測をしなかっ
た条件分岐命令は、条件分岐予測を行わない（例えば常
に偽と予測して扱う）。コンパイラが真偽の予測をした
条件分岐命令は、そのコンパイラの予測に従う。（４）コンパイラが真偽の予測をしなかった条件分岐命
令は、条件分岐予測を行わない（例えば常に偽と予測し
て扱う）。コンパイラが真偽の予測をした条件分岐命令
は、Ａｇｒｅｅモードで条件分岐予測を行う。上記の他
にも種々の方法が考えられる。

【００４２】このようにすれば、従来のように「コンパ
イラが真偽の予測をしなかった条件分岐命令」が「コン
パイラが真偽の予測をした条件分岐命令についての予
測」を低下させる、という不具合を回避できるので、条
件分岐予測の性能を向上させることができる。

【００４３】以下では、上記の（１）の方法を例にとっ
て説明する。もちろん、それ以外の方法も同様に実施可
能である。

【００４４】同一機能を持つ条件分岐命令についてのコ
ンパイラによる予測処理結果すなわち予測可／分岐成
立、予測可／分岐不成立、予測不可の３種の識別の方法
には、種々の方法が考えられるが、例えば、（ａ）同一
機能の条件分岐命令として、予測可／分岐成立、予測可
／分岐不成立、予測不可に対応する３つの命令を用意
し、コンパイラが３種類の区別に従ってそれらを使い分
ける方法、（ｂ）命令に、予測可または予測不可を示す
第１のフィールドと、予測可の場合には分岐成立（真）
か分岐不成立（偽）かを示し、予測不可の場合にはｄｏ
ｎ’ｔｃａｒｅとなる第２のフィールドを付加するも
のとし、コンパイラによってこれらフィールドを設定す
る方法、などが考えられる。プロセッサでは、（ａ）の
場合には、命令をデコードもしくはプリデコードするこ
とにより、（ｂ）の場合には、上記フィールドを参照す
ることによって、予測可／分岐成立、予測可／分岐不成
立、予測不可の３種類の識別を行うことができる。

【００４５】ここで、上記の（１）の方法を用いた場合
に、先に上げた例と同様のプログラムについて予測が当
たる確率を求めると、次のようになる。

【００４６】なお、３つの条件分岐命令は、プログラム
の実行時に同じ出現頻度で現れ、前述と同じように、そ
れぞれ、次のような特性を持っているとする。・条件分岐命令Ａ：コンパイラで真と予測され、実際に
は８０％の確率で真になる。この場合、予測可／分岐成
立に対応する。・条件分岐命令Ｂ：コンパイラで偽と予測され、実際に
は８０％の確率で偽になる。この場合、予測可／分岐不
成立に対応する・条件分岐命令Ｃ：コンパイラで予測できず、実際には
７０％の確率で真になる。この場合には、予測不可に対
応する。

【００４７】まず、条件分岐命令Ａおよび条件分岐命令
Ｂは、コンパイラが予測できるので、飽和付きカウンタ
には反映しない（すなわち、コンパイラの予測に従
う）。従って、条件分岐命令Ａ，Ｂについて分岐予測が
当たる確率はいずれも０．８である。

【００４８】一方、条件分岐命令Ｃは飽和付きカウンタ
に反映されることになる。条件分岐命令Ｃは真の側に
０．７の確率で遷移し、偽の側には０．３の確率で遷移
するから、飽和付きカウンタの状態、ＳＴ，ＷＴ，Ｗ
Ｎ，ＳＮの各確率はそれぞれ前述のＳＡ，ＷＡ，ＷＤ，
ＳＤの場合と同様の計算で、ＳＴ＝0.7×0.7×0.7/(1-2×0.7+2×0.7×0.7)＝０．５
９１３７４ＷＴ＝ＳＴ×(1-0.7)/0.7＝０．２５３４４８ＷＮ＝ＷＴ×(1-0.7)/0.7＝０．１０８６２１ＳＮ＝ＷＮ×(1-0.7)/0.7＝０．０４６５５２が求められる。

【００４９】この方法において例に上げる分岐予測が当
たる確率は、 (0.8+0.8+(ST+WT)×0.7+(WN+SN)×(1-0.7))/3＝０．７
４５９７７となり、前述のように条件分岐命令Ａ，Ｂ，Ｃについて
同一エントリでＡｇｒｅｅモードを使用した場合の確率
（＝０．５６６３９）より高い確率で予測が当たるよう
になる。

【００５０】以下では、本実施形態についてより詳しく
説明する。

【００５１】まず、命令セットに関して説明する。

【００５２】上記のように本実施形態では、１つの条件
分岐命令について、次の３種類の区別がある。・コンパイラが条件分岐について予測不可とする・コンパイラが条件分岐を予測可能で、分岐成立と予測
する・コンパイラが条件分岐を予測可能で、分岐不成立と予
測するコンパイラにより、各条件分岐命令が上記の３種類のい
ずれに該当するかが判断され、対応する条件分岐命令が
生成される。

【００５３】上記の３種類を区別するには、例えば、・１つの条件分岐命令に対応するＯＰコードを３つ用意
する方法と、・ＯＰコードとは別に命令コード中に３種類を識別する
ためのフィールドを設ける方法とがある。

【００５４】前者のＯＰコードを３種類用意する方法で
は、例えば、ＢＲＺＲ１，Ｒ２，Ｌａｂｅｌ（レジス
タＲ１とレジスタＲ２の内容を比較し、それらが一致し
たならばＬａｂｅｌに分岐する命令）というような条件
分岐命令について、予測不能、予測可能／分岐成立、予
測可能／分岐不成立に対応して、ＢＲＺＵ（ＢＲＺＵｎ
ｐｒｅｄｉｃｔａｂｌｅ）、ＢＲＺＴ（ＢＲＺＴａｋ
ｅｎ）、ＢＲＺＮ（ＢＲＺＮｏｔＴａｋｅｎ）のＯ
Ｐコードを用意する。この方法は、コード効率がほとん
ど低下しないという利点がある。

【００５５】一方、後者の方法では、予測不能、予測可
能／分岐成立、予測可能／分岐不成立の３種類を識別す
るために２ビットのフィールドを命令コード中に設ける
ので、その分だけコード効率が低下するが、デコード時
間を短縮すること（もしくはこの３種類の識別のための
プリデコード時間を省くこと）ができる。

【００５６】以下では、前者のように同一条件分岐命令
について３種類のＯＰコードを設ける場合（すなわち、
コンパイラが予測不能、予測可能／分岐成立、予測可能
／分岐不成立の区別に従って３種類のＯＰコードを使い
分ける場合）を例にとって説明する。また、本実施形態
では、インストラクションキャッシュにこれらの命令が
フィルされる時点で、プリデコードを行い、予測不能、
予測可能／分岐成立、予測可能／分岐不成立の３種類を
識別するための識別情報を生成するものとする。なお、
詳しくは後述するように、本実施形態では、無条件分岐
命令も、分岐命令以外の命令も、条件分岐命令と同じ仕
組みで実行するため、無条件分岐命令については予測可
能／分岐成立を示す識別情報を用い、分岐命令以外の命
令については予測可能／分岐不成立を示す識別情報を用
いることになる。

【００５７】図１に、本実施形態のプロセッサの構成例
を示す。

【００５８】本実施形態では、５段のパイプライン、Ｆ（Ｆｅｔｃｈ）ステージ、Ｄ（Ｄｅｃｏｄｅ）ステージ、Ｅ（Ｅｘｅｃｕｔｅ）ステージ、Ｍ（Ｍｅｍｏｒｙ）ステージ、Ｗ（Ｗｒｉｔｅｂａｃｋ）ステージ、を持つＲＩＳＣプロセッサを例にとって説明する。

【００５９】図１に示されるように、本プロセッサ１
は、リフィル・プリデコード部（Ｒｅｆｉｌｌ＆Ｐｒｅ
ｄｅｃｏｄｅ）１１、デコード・レジスタファイルアク
セス部（Ｄｅｃｏｄｅ＆ＲｅｇｉｓｔｅｒＦｉｌｅ
Ａｃｃｅｓｓ）１２、実行部（Ｅｘｅｃｕｔｅ）１３、
次アドレス計算部（ＮｅｘｔＡｄｄｒｅｓｓ）１４、
インストラクションキャッシュ（Ｉｎｓｔｒｕｃｔｉｏ
ｎＣａｃｈｅ）１５、データキャッシュ（Ｄａｔａ
Ｃａｃｈｅ）１６を持つ。メモリ（Ｍｅｍｏｒｙ）３
は、プロセッサ１のリフィル・プリデコード部１１に接
続される。

【００６０】図１では、各ブロックをそれが関連するス
テージに対応させて示してある。

【００６１】なお、図１では、シングルプロセッサを例
にとって示しているが、もちろん、本プロセッサは、コ
ンパイル時にスタティックに資源を割り当て使用するＶ
ＬＩＷ（ＶｅｒｙＬｏｎｇＩｎｓｔｒｕｃｔｉｏｎ
Ｗｏｒｄ）プロセッサであっても、実行時に資源の割
り当てをダイナミックに行うスーパースカラプロセッサ
でもよい。

【００６２】本プロセッサの５段パイプラインの基本的
動作は次のようになる。

【００６３】Ｆステージでインストラクション・キャッ
シュ１５のアクセスが行われ、次にＤステージでデコー
ド・レジスタファイルアクセス部によりデコード（Ｄｅ
ｃｏｄｅ）およびレジスタファイル（Ｒｅｇｉｓｔｅｒ
Ｆｉｌｅ）のアクセスが行われる。

【００６４】Ｅステージでは、実行部１３により、レジ
スタファイルより読み出したデータに対して演算が行わ
れる。命令が条件分岐命令の場合には、分岐条件の真偽
が判定され、真ならば分岐先のアドレスが求められ、偽
ならば当該条件分岐命令の次の命令のアドレスが求めら
れる。

【００６５】Ｍステージでは、データ・キャッシュ１６
のアクセスが行われる。

【００６６】Ｗステージでは、データ・キャッシュ１６
のアクセスの結果または実行部１３による演算の結果が
レジスタファイルに書き込まれる。

【００６７】また、次アドレス計算部１４の処理手順の
概要は次のようになる。

【００６８】次アドレス計算部１４は、Ｆステージにお
いて、条件分岐命令がフェッチされたときに、次にフェ
ッチすべきアドレスを予測する。当該条件分岐命令の分
岐条件が成立するかまたは不成立となるかは、Ｅステー
ジで当該条件分岐命令が実行されて初めて判明する。次
アドレス計算部１４は、Ｍステージにおいて、当該条件
分岐命令の分岐条件の実行結果（真または偽）および予
測の成功／不成功（すなわち、実行結果と予測との一致
／不一致）に応じて、予測が外れた場合の実際の次アド
レス（真と予測して偽となった場合には“当該命令のア
ドレス＋１”、偽と予測して真となった場合には“分岐
先アドレス”）を設定し直す処理や、当該条件分岐命令
がコンパイラで予測不可とした条件分岐命令であった場
合の飽和付きカウンタの更新を行う。なお、本実施形態
では、「無条件分岐命令」と「分岐命令以外の命令」の
場合には、常に予測が当たるものとして処理をすること
になっている。

【００６９】さて、本実施形態では、条件分岐の予測の
ために次のような識別情報が用いられる。インストラク
ション・キャッシュ１５またはデータ・キャッシュ１６
がミスしたときは、リフィル／プリデコード部１１を用
いてメモリ３よりデータがインストラクション・キャッ
シュ１５またはデータ・キャッシュ１６へリフィル（Ｒ
ｅｆｉｌｌ）されるが、本実施形態では、インストラク
ション・キャッシュ１５にミスが起こった場合には、リ
フィルとともに、命令のオペコード部に対する分岐予測
のためのプリデコード（Ｐｒｅｄｅｃｏｄｅ）を行う。
プリデコードでは、各命令について、前述の３種類（予
測不能、予測可能／分岐成立、予測可能／分岐不成立）
を識別するための２ビットの識別情報を生成し、これを
該命令に付加する。

【００７０】この識別情報は、ｐｒｅｄｅｃｏｄｅ０と
ｐｒｅｄｅｃｏｄｅ１からなり、各ビットの意味は次の
通りである。・ｐｒｅｄｅｃｏｄｅ０：１はコンパイラが予測不
可とした場合を示し、０はコンパイラが予測可としたを
示す。・ｐｒｅｄｅｃｏｄｅ１：ｐｒｅｄｅｃｏｄｅ０＝
１である場合において、１はコンパイラが条件成立と予
測したことを示し、０はコンパイラが条件不成立と予測
したことを示す。

【００７１】この識別情報は、インストラクション・キ
ャッシュ１５中に命令と共に保存され、次アドレス計算
部１４に利用される。

【００７２】なお、本実施形態では、命令が無条件分岐
命令の場合には、ｐｒｅｄｅｃｏｄｅ０＝０、ｐｒｅｄ
ｅｃｏｄｅ１＝１とし、分岐命令以外の命令の場合に
は、ｐｒｅｄｅｃｏｄｅ０＝０、ｐｒｅｄｅｃｏｄｅ１
＝０として、同様に処理をするようにしている。この結
果、本実施形態では、識別情報は、図２のように設定さ
れる。なお、図２中、ＸはＤｏｎ’ｔＣａｒｅを示
す。

【００７３】次に、次アドレス計算部１４について詳細
に説明する。

【００７４】図３に、次アドレス計算部１４の構成例を
示す。

【００７５】図３に示されるように、この次アドレス計
算部１４は、第１のセレクタ（ＳＥＬ０）１４１、第２
のセレクタ（ＳＥＬ１）１４２、第３のセレクタ（ＳＥ
Ｌ２）１４３、次アドレス・レジスタ（ＮｅｘｔＡｄ
ｄｒｅｓｓＲＥＧ）１４４、加算回路１４５、加算器
（ＡＤＤＥＲ）１４６、飽和付きカウンタ部１５０、３
段のレジスタ（ＲＥＧ＿Ｄ，ＲＥＧ＿Ｅ，ＲＥＧ＿Ｍ）
１４７〜１４９、予測判定回路１５１を持つ。

【００７６】次アドレス・レジスタ１４４は、次にフェ
ッチする命令のアドレスを保持する。この次アドレス・
レジスタ１４４からインストラクション・キャッシュ１
５へ、フェッチすべき命令のアドレスが与えられる。

【００７７】加算器１４６は、インストラクション・キ
ャッシュ１５より命令中のブランチオフセットを供給
し、これを次アドレス・レジスタ１４４の内容に加算す
るためのものである。インストラクション・キャッシュ
１５のタイミングが厳しい場合は、加算器（ＡＤＤＥ
Ｒ）の代わりにブランチ・アドレス・キャッシュ（ＢＡ
Ｃ；ＢｒａｎｃｈＡｄｄｒｅｓｓＣａｃｈｅ）が使
われることもある。

【００７８】加算回路１４５は、次アドレス・レジスタ
１４４の内容に＋１を加算するためのものである。

【００７９】第１のセレクタ（ＳＥＬ０）は、インスト
ラクション・キャッシュ１５の命令に付加されているＰ
ｒｅｄｅｃｏｄｅ０を参照し、Ｐｒｅｄｅｃｏｄｅ０＝
１ならば、ハードウェアによる予測器すなわち飽和付き
カウンタ部１５０からの予測情報（真すなわち分岐成立
を示す情報（例えば、１）、または偽すなわち分岐不成
立を示す情報（例えば、０））を出力させ、Ｐｒｅｄｅ
ｃｏｄｅ０＝０ならば、インストラクション・キャッシ
ュ１５の命令に付加されているＰｒｅｄｅｃｏｄｅ１を
出力させる。すなわち、第１のセレクタ（ＳＥＬ０）か
らは、コンパイラで予測不可とされた条件分岐命令の場
合に、飽和付きカウンタ部１５０からの予測情報が出力
され、コンパイラで予測可／分岐成立とされた命令の場
合（または無条件分岐命令の場合）に、Ｐｒｅｄｅｃｏ
ｄｅ１＝１が出力され、コンパイラで予測可／分岐不成
立とされた命令の場合（または分岐命令以外の命令の場
合）に、Ｐｒｅｄｅｃｏｄｅ１＝０が出力される。

【００８０】この第１のセレクタ（ＳＥＬ０）の出力
が、第２のセレクタ（ＳＥＬ１）を切り替える。

【００８１】第２のセレクタ（ＳＥＬ１）は、第１のセ
レクタ（ＳＥＬ０）の出力が分岐成立を示す値（例え
ば、１）である場合には、次アドレス・レジスタ１４４
の値にブランチオフセットの値を加算する加算器１４６
の出力を選択し、第１のセレクタ（ＳＥＬ０）の出力が
分岐不成立を示す値（例えば、０）である場合には、次
アドレス・レジスタ１４４の値に＋１を加算する加算回
路１４５の出力を選択する。すなわち、第２のセレクタ
（ＳＥＬ１）からは、条件分岐が成立すると予測される
場合（または無条件分岐命令の場合）には分岐先アドレ
スが出力され、条件分岐が不成立と予測される場合（ま
たは分岐命令以外の命令の場合）には次のアドレスが出
力される。

【００８２】この第２のセレクタ（ＳＥＬ１）の出力
は、第３のセレクタ（ＳＥＬ２）への入力となる。な
お、予測に失敗しない限り、第３のセレクタ（ＳＥＬ
２）においては、この第２のセレクタ（ＳＥＬ１）の出
力が選択され、次アドレス・レジスタ１４４に保持され
ることになる。

【００８３】さて、第３のセレクタ（ＳＥＬ２）を切り
替えるのは、予測判定回路１５１の出力である。

【００８４】予測判定回路１５１は、各命令についての
予測（すなわち、第１のセレクタ（ＳＥＬ０）の出力）
を保持しておき、Ｍステージにおいて、Ｅステージで実
行された当該命令の条件分岐の結果（無条件分岐の場合
は分岐成立、分岐命令以外の命令の場合は分岐不成立と
して扱われる）を入力し、両者を比較し、予測と結果が
一致する場合には、予測成功を示す情報（例えば、１）
を出力し、予測と結果が不一致の場合には、予測不成功
を示す情報（例えば、０）を出力する。

【００８５】また、第３のセレクタ（ＳＥＬ２）へは、
Ｍステージにおいて、実行部１３から、Ｅステージで実
際に確定した当該命令の次に実行すべき命令のアドレ
ス、すなわち条件分岐命令が分岐成立となった場合に
は、分岐先アドレス、条件分岐命令が分岐不成立となっ
た場合には、当該命令の次のアドレスが与えられる（な
お、無条件分岐命令の場合には、分岐先アドレス、分岐
命令以外の命令の場合には、当該命令の次のアドレスが
与えられるようにして構わない；ただし、これらの場合
には常に予測成功として扱われることになる）。

【００８６】第３のセレクタ（ＳＥＬ２）は、予測判定
回路１５１の出力が予測成功を示す値である場合には、
第２のセレクタ（ＳＥＬ１）の出力を選択し、予測判定
回路１５１の出力が予測不成功を示す値である場合に
は、実行部１３から与えられた実際のアドレスを選択す
る。すなわち、条件分岐命令について予測が成功してい
る間（または無条件分岐や分岐命令以外の命令が実行さ
れている間）は、第２のセレクタ（ＳＥＬ１）の出力が
次アドレス・レジスタ１４４に保持されるが、予測不成
功が発生した場合には、実行部１３から与えられた実際
のアドレスが保持される。

【００８７】次に、予測を行うハードウェアの部分、す
なわち飽和付きカウンタ部の構成について詳細に説明す
る。

【００８８】図４に、飽和付きカウンタ部１５０の構成
例を示す。

【００８９】このＴａｋｅｎモードの飽和付きカウンタ
部１５０は、デコーダ１５０２、複数の飽和付きカウン
タ１５０１、デコーダ・セレクタ１５０３を含む。

【００９０】複数の飽和付きカウンタ１５０１は、条件
分岐命令の命令アドレスによりハッシュされる。ハッシ
ュ関数は、アドレスの下位を用いるなどの簡単なもので
よい。

【００９１】飽和付きカウンタ部１５０は、２ポートの
アドレスポート（デコーダ１５０２（書き込み時）、デ
コーダ・セレクタ１５０３（読み出し時））を持ってい
る。

【００９２】書き込み時（更新時）においては、ライト
・アドレス（Ｗｒｉｔｅａｄｄｒｅｓｓ）は、ＲＥＧ
＿Ｄ，ＲＥＧ＿Ｅ，ＲＥＧ＿Ｍの３段のレジスタ１４７
〜１４９により３サイクル遅れたアドレスが供給され
る。これは、飽和付きカウンタ１５１に書き込みが起こ
るのは、条件分岐の成立／不成立がわかるＥステージの
次のＭステージとしているためである。ライト・アドレ
スおよびＭステージからの条件分岐の成立または不成立
により飽和付きカウンタの一つに状態遷移の信号が送ら
れる。なお、本例では、飽和付きカウンタ１５１への書
き込みは、コンパイラが予測不可とした条件分岐命令に
ついてのみ、すなわちＰｒｅｄｅｃｏｄｅ０＝１のとき
のみ、行われる。Ｐｒｅｄｅｃｏｄｅ０の値は、例え
ば、ＲＥＧ＿Ｄ，ＲＥＧ＿Ｅ，ＲＥＧ＿Ｍの３段のレジ
スタ１４７〜１４９により３サイクル遅れて飽和付きカ
ウンタ部１５０へ供給される。

【００９３】読み出し時においては、リード・アドレス
（Ｒｅａｄａｄｄｒｅｓｓ）により、どの飽和付きカ
ウンタ１５０１が選択されるかが切り替えられる。そし
て、飽和付きカウンタの一つから、条件分岐の予測情報
が出力される。

【００９４】なお、ハッシュの方法として、説明のため
アドレスの下位のみを使用する方法を示したが、それ以
外にも様々な方法があり、いずれの方法を使用すること
も可能である。

【００９５】以上では、前述した（１）の方法を例にと
って説明したが、もちろん、それ以外の方法も同様に実
施可能である。

【００９６】（２）の方法の場合、例えば、コンパイラ
が予測可能とした条件分岐命令については、飽和付きカ
ウンタ部（Ａｇｒｅｅモードとする；予測判定回路の出
力をフィードバックする）からの出力が一致の場合に
は、コンパイラの予測結果を、不一致の場合には、コン
パイラの予測結果とは反対の予測を、第２のセレクタ
（ＳＥＬ１）に与えるように、図３の構成を修正すれば
よい（コンパイラの予測結果とは反対の予測は、例え
ば、１ビットの反転回路を用いて生成する）。なお、こ
の場合には、コンパイラに予測可能とされた条件分岐命
令についてはＡｇｒｅｅモードの飽和付きカウンタ部を
適用し、コンパイラに予測不可とされた条件分岐命令に
ついてはＴａｋｅｎモードの飽和付きカウンタ部を適用
し、無条件分岐命令と分岐命令以外の命令については飽
和付きカウンタ部を適用しないことから、各命令が、予
測可／分岐成立とされた条件分岐命令か、予測可／分岐
不成立とされた条件分岐命令か、予測不可とされた条件
分岐命令か、無条件分岐命令か、分岐命令以外の命令か
を区別する必要があるので、識別情報は３ビットとな
る。例えば、図２の例に新たにＰｒｅｄｅｃｏｄｅ２を
設け、Ｐｒｅｄｅｃｏｄｅ２＝０は条件分岐命令を示
し、Ｐｒｅｄｅｃｏｄｅ２＝１は条件分岐命令以外の命
令を示すようにしてもよい（なお、それ以外の識別情報
の構成も可能である）。

【００９７】（４）の方法の場合、例えば、コンパイラ
が予測可能とした条件分岐命令については、飽和付きカ
ウンタ部（Ａｇｒｅｅモードとする；予測判定回路の出
力をフィードバックする）からの出力を、第２のセレク
タ（ＳＥＬ１）に与え、コンパイラが真偽の予測をしな
かった条件分岐命令については、第２のセレクタ（ＳＥ
Ｌ１）に例えば分岐不成立を示す値を与えるように、図
３の構成を修正すればよい。

【００９８】また、以上では、１つの条件分岐命令に対
応するＯＰコードを３つ用意する場合について説明した
が、ＯＰコードとは別に命令コード中に３種類を識別す
るためのフィールドを設ける場合には、当該識別のため
のプリデコードは不要となり、このフィールドを参照も
しくはコピーするだけでよい。

【００９９】本実施形態によれば、条件分岐命令の予測
を従来方式より高い精度で行うことが可能となり、これ
によって、プロセッサの性能を向上させることができ
る。

【０１００】以下では、本実施形態におけるコンパイラ
について説明する。

【０１０１】ここでは、一般的なプログラムについて、
どのような場合に条件分岐命令を予測可能とし、どのよ
うな場合に条件分岐命令を予測不可とするかというヒュ
ーリスティックの一例を示す。

【０１０２】一般的なプログラムでは、後方（すなわ
ち、プログラムカウンタの小さい方）に対する条件分岐
命令は成立する確率が高いことが知られている。これ
は、例えばＣ言語プログラムのＦＯＲループのように、
ループは何回も実行されるという場合に後方への条件分
岐命令が使用されるからである。また、ｇｏｔｏ文のよ
うにＣ言語のプログラマがエラー処理以外では使わない
ような場合は条件分岐命令が成立しないと予測できる。
これら以外の前方への条件分岐命令は一般にコンパイラ
が実行前に予測を行うことは難しい。

【０１０３】以上をまとめると、ヒューリスティックの
一例として、後方への条件分岐命令は成立と予測するｇｏｔｏ文が条件の結果実行される場合は不成立と予
測する前方への条件分岐命令は予測不能とするが得られる。もちろん、他にも種々のヒューリスティッ
クが考えられる。

【０１０４】次に、以上説明した条件分岐命令にどの予
測を適用するべきか決定するヒューリスティックを採用
したコンパイラがどのような処理の流れを行うかについ
て説明する。

【０１０５】図５に、本実施形態のコンパイラの動作手
順（機能ブロック）の一例を示す。

【０１０６】本コンパイラは、一般的に、プロセッサの
アーキテクチャに依存しない中間言語を一旦生成し、こ
れをアーキテクチャと命令セットに最適化された形のコ
ードとして生成する。上で述べたような判定のヒューリ
スティックは、中間言語にだけ適用するのではなく、ソ
ースの解析結果も加味するのが望ましい。このために
は、ソースを解析した結果を中間言語に付加すればよ
い。例えば、上記ののエラー処理の場合の条件分岐命
令は、中間言語にその旨を示すタグ情報を付加すること
で対処する。

【０１０７】図５で示すように、コンパイラは、まず高
級言語で書かれたソースプログラム（ソースコード）２
０３を解析（例えば、字句解析・構文解析等）し、中間
言語１０４の形にする（２０１）。この段階で、上記の
のようなタグ情報を、中間言語２０４に付加する。次
に、中間言語２０４に対して最適化（例えば、フロー解
析、データ依存解析、命令スケジューリング（命令割り
当て）、レジスタ割り当て等）およびコード生成を行っ
て、アセンブリ言語によるプログラム（オブジェクトプ
ログラム）２０５を出力する（２０２）。この段階で、
上記のやのヒューリスティックに従っておよび上記
の解析の際に付加されたタグ情報に従って、コード生成
を行う。

【０１０８】例えば、第１オペランドで示されるレジス
タと第２オペランドで示されるレジスタの内容を比較
し、それらが一致したならば第３オペランドで示される
ラベルに分岐する条件分岐命令について、上記のが適
用されたならば、予測可能／分岐成立を示すＢＲＺＴを
生成し、上記のが適用されたならば、予測可能／分岐
不成立を示すＢＲＺＮを生成し、上記のが適用された
ならば、予測不能を示すＢＲＺＵを生成する。

【０１０９】また、ＯＰコードとは別に命令コード中に
３種類を識別するためのフィールドを設ける場合には、
例えば、上記のが適用されたならば、該フィールドに
予測可能／分岐成立を示す“１／０”を設定し、上記の
が適用されたならば、該フィールドに予測可能／分岐
不成立を示す“０／０”を設定し、上記のが適用され
たならば、該フィールドに予測不能を示す“Ｘ／１”を
設定する（図２参照）。なお、図３のような構成を用い
る場合には、無条件分岐命令に対して該フィールドに
“１／０”を設定し、分岐命令以外の命令に対して該フ
ィールドに“０／０”を設定するようにすると好まし
い。

【０１１０】なお、上記では、コンパイラが条件分岐命
令の３種の識別を行ったが、プログラマがアセンブラ言
語による明示的な指定を行うようにしてもよい。また、
両者を併用し、例えば、明示的な指定があればそれを優
先し、明示的な指定がなければ、コンパイラが判断する
ようにしてもよい。

【０１１１】これまでの説明はシングルスケーラプロセ
ッサを中心として行ったが、本発明はＶＬＩＷ方式ある
いはスーパースカラ方式にも適用可能である（これまで
説明した構成例を容易に拡張できることは明らかであ
る）。例えば、ＶＬＩＷ方式に本発明を適用する場合、
並列に実行される命令のうち条件分岐命令が１つしか実
行されないという場合には、本構成例がそのまま適用で
きる（条件分岐命令を実行するユニットを本構成例のよ
うにすればよい）。また、スーパースカラ方式でも、同
時に実行される複数の実行ユニットのうち分岐命令を実
行するユニットが一つであれば、本構成例がそのまま適
用できる（条件分岐命令を実行するユニットを本構成例
のようにすればよい）。これらの場合、コンパイラも本
実施形態で例示されたヒューリスティックをそのまま適
用して条件分岐命令を生成することが可能である。

【０１１２】なお、以上の各機能は、ソフトウェアとし
ても実現可能である。

【０１１３】また、本実施形態は、コンピュータに所定
の手段を実行させるための（あるいはコンピュータを所
定の手段として機能させるための、あるいはコンピュー
タに所定の機能を実現させるための）プログラムを記録
したコンピュータ読取り可能な記録媒体としても実施す
ることもできる。

【０１１４】本発明は、上述した実施の形態に限定され
るものではなく、その技術的範囲において種々変形して
実施することができる。

【０１１５】

【発明の効果】本発明によれば、与えられた命令が条件
分岐命令である場合に、該命令が、コンパイラにおいて
分岐成立と予測された第１種の条件分岐命令か、コンパ
イラにおいて分岐不成立と予測された第２種の条件分岐
命令か、コンパイラにおいて予測不可とされた第３種の
条件分岐命令かを識別し、前記条件分岐命令に対して前
記識別結果に応じた分岐予測処理を行うので（例えば、
前記分岐予測処理手段は、前記第１種または第２種と識
別された条件分岐命令と、前記第３種と識別された条件
分岐命令とで、異なる形態の分岐予測処理を行うの
で）、例えば飽和付きカウンタの汚染などの不具合を回
避することができ、条件分岐命令の予測精度を向上さ
せ、これによって、プロセッサの性能を向上させること
ができる。

【図面の簡単な説明】

【図１】本発明の一実施形態に係るプロセッサの構成例
を示す図

【図２】識別情報の一例を示す図

【図３】次アドレス計算部の構成例を示す図

【図４】飽和付きカウンタ部の構成例を示す図

【図５】同実施形態に係るコンパイラの動作手順の一例
を示す図

【図６】命令列の一例を示す図

【図７】図６の命令列を実行した場合における各サイク
ルにおけるパイプラインの様子を説明するための図

【図８】Ｔａｋｅｎモードの飽和付きカウンタについて
説明するための図

【図９】Ａｇｒｅｅモードの飽和付きカウンタについて
説明するための図

【符号の説明】

１…プロセッサ１１…リフィル・プリデコード部１２…デコード・レジスタファイルアクセス部１３…実行部１４…次アドレス計算部１４１〜１４３…セレクタ１４４…次アドレス・レジスタ１４５…加算回路１４６…加算器１５０…飽和付きカウンタ部１５０１…飽和付きカウンタ１５０２…デコーダ１５０３…デコーダ・セレクタ１４７〜１４９…レジスタ１５１…予測判定回路１５…インストラクションキャッシュ１６…データキャッシュ３…メモリ

Claims

【特許請求の範囲】

【請求項１】同一の分岐先、同一の分岐条件を持つ命令
について、分岐予測に関して、分岐成立と予測された命
令、分岐不成立と予測された命令および予測不可とされ
た命令の３種類の区別が設けられた命令セットを持つこ
とを特徴とするプロセッサ。
【請求項２】与えられた命令が条件分岐命令である場合
に、該命令が、コンパイラにおいて分岐成立と予測され
た第１種の条件分岐命令か、コンパイラにおいて分岐不
成立と予測された第２種の条件分岐命令か、コンパイラ
において予測不可とされた第３種の条件分岐命令かを識
別する識別手段と、前記条件分岐命令に対して前記識別結果に応じた分岐予
測処理を行う分岐予測処理手段とを備えたことを特徴と
するプロセッサ。
【請求項３】前記分岐予測処理手段は、前記第１種また
は第２種と識別された条件分岐命令と、前記第３種と識
別された条件分岐命令とで、異なる形態の分岐予測処理
を行うことを特徴とする請求項２に記載のプロセッサ。
【請求項４】前記分岐予測処理手段は、前記第１種と識
別された条件分岐命令については、コンパイラにおける
予測に従って分岐成立と予測して分岐予測処理を行い、
前記第２種と識別された条件分岐命令については、コン
パイラにおける予測に従って分岐不成立と予測して分岐
予測処理を行い、前記第３種と識別された条件分岐命令
については、条件分岐予測器を使用して分岐予測処理を
行うことを特徴とする請求項３に記載のプロセッサ。
【請求項５】前記分岐予測処理手段は、前記第１種また
は第２種と識別された条件分岐命令について、アグリー
・モードの条件分岐予測器を使用して分岐予測処理を行
い、前記第３種と識別された条件分岐命令について、真
偽モードの条件分岐予測器を使用して分岐予測処理を行
うことを特徴とする請求項３に記載のプロセッサ。
【請求項６】命令キャッシュ中で前記識別の対象となっ
た条件分岐命令に対する識別結果を示す情報を該条件分
岐命令に付加して記録する手段を更に備えたことを特徴
とする請求項１ないし５のいずれか１項に記載のプロセ
ッサ。
【請求項７】与えられた命令が条件分岐命令である場合
に、該命令が、コンパイラにおいて分岐成立と予測され
た第１種の条件分岐命令か、コンパイラにおいて分岐不
成立と予測された第２種の条件分岐命令か、コンパイラ
において予測不可とされた第３種の条件分岐命令かを識
別し、前記条件分岐命令に対して前記識別結果に応じた分岐予
測処理を行うことを特徴とする分岐予測方法。
【請求項８】与えられたソースプログラムに基づいて対
象とするプロセッサで実行可能なオブジェクトプログラ
ムを生成するコンパイル方法であって、前記ソースプログラムを解析して中間コードを生成する
第１のステップと、前記中間コードを最適化し、コード生成して、オブジェ
クトプログラムを生成する第２のステップとを有し、前記第２のステップは、対象となった条件分岐命令が、分岐成立と予測、分岐不
成立と予測、予測不可の３種類のいずれに該当するかを
判定するステップと、この判定結果に対応する命令を生成するステップとを含
むことを特徴とするコンパイル方法。
【請求項９】前記第１のステップは、対象となった条件
分岐命令に、前記判定のための情報を付加するステップ
を含むことを特徴とする請求項８に記載のコンパイル方
法。