JPH0877068A

JPH0877068A - マルチプロセッサシステム及びメモリアロケーション最適化方法

Info

Publication number: JPH0877068A
Application number: JP6212665A
Authority: JP
Inventors: Hideaki Hirayama; 秀昭平山
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1994-09-06
Filing date: 1994-09-06
Publication date: 1996-03-22

Abstract

(57)【要約】【目的】キャッシュの能力を活かしたメモリアロケーシ
ョンを可能にする。【構成】メモリ上のデータが所定のキャッシュライン単
位で操作されるマルチプロセッサシステムにおいて、原
始プログラムに対して実行可能な目的プログラムを作成
するための解析をプログラム解析部１１によって行なう
際に読み込みのみの対象となるデータを認識するデータ
認識手段１２と、自システムにおけるキャッシュライン
のサイズを認識するキャッシュサイズ認識手段１４と、
解析の結果に応じてコード生成部１３によってコード生
成を行なう際に、プログラムが同時にアクセスする複数
のデータが同時にメモリからキャッシュに格納されるよ
うに、読み込みのみのデータを読み込みのみのデータと
同時にアクセスされる読み書きデータが配置される同じ
キャッシュライン上に配置するデータ配置手段１５とを
具備して構成する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、キャッシュを持った複
数のプロセッサが接続されたマルチプロセッサシステム
及びメモリアロケーションの最適化方法に関する。

【０００２】

【従来の技術】近年、プロセッサの演算処理の高速化の
割合に比べると、メモリのアクセス処理の高速化の割合
は極めて低く、プロセッサの演算処理が速くなっても、
メモリに対するアクセス処理が速くならないため、シス
テム全体の性能が上がらないという問題があった。

【０００３】この問題を解決するために、キャッシュと
いう技術が存在する。キャッシュはプロセッサ内、ある
いはプロセッサの近くに配置した小容量の高速メモリ
で、プロセッサがアクセスするメモリ上のデータの高速
なバッファとしての役割を果たしている。

【０００４】また、一方でマルチプロセッサ技術が発展
し、キャッシュを持った多数のプロセッサが相互に接続
されるようになってきた。マルチプロセッサシステムに
おいては、多数のプロセッサが各々メモリのコピーをそ
のキャッシュに保持してしまうため、キャッシュ間のデ
ータの整合性をとる必要が出てくる。このデータの整合
性をとる技術がスヌープという機能である。

【０００５】スヌープ機能としては、様々な方式がある
が、何れの方式においても、例えばキャッシュをもつ複
数のプロセッサがメモリ上の共通するデータを順番に更
新すると、対象とするデータを各プロセッサのキャッシ
ュの間で順番に受け渡すことによって一貫性を保つ。

【０００６】しかし、多数のプロセッサの間でデータを
共有すると、キャッシュ間でのスヌープによりデータの
整合性をとるための操作（データの受け渡し）が増加し
てしまい、スヌープの操作によってプロセッサ間を接続
するバスが飽和してしまい、マルチプロセッサシステム
性能が向上しないという問題があった。

【０００７】

【発明が解決しようとする課題】このように従来のキャ
ッシュを持った複数のプロセッサが接続されたコンピュ
ータシステムにおいては、各プロセッサが持つキャッシ
ュのデータの整合性をとるために、バスのトラフィック
が増大し、マルチプロセッサシステム性能を低下させて
しまう場合があった。

【０００８】本発明は前記のような事情を考慮してなさ
れたもので、キャッシュの能力を活かしたマルチプロセ
ッサシステム及びメモリアロケーションの最適化方法を
提供することを目的とする。

【０００９】

【課題を解決するための手段】本発明は、キャッシュを
持った複数のプロセッサが接続されたマルチプロセッサ
システムであって、メモリ上のデータが所定のキャッシ
ュライン単位で操作されるマルチプロセッサシステムに
おいて、原始プログラムに対して実行可能な目的プログ
ラムを作成するための解析を行なう際に読み込みのみの
対象となるデータを認識するデータ認識手段と、自シス
テムにおけるキャッシュラインのサイズを認識するキャ
ッシュサイズ認識手段と、解析の結果に応じてコード生
成を行なう際に、前記データ認識手段及び前記キャッシ
ュサイズ認識手段による認識結果に基づいて、プログラ
ムが同時にアクセスする複数のデータが同時にメモリか
らキャッシュに格納されるように、読み込みのみのデー
タを前記読み込みのみのデータと同時にアクセスされる
読み書きデータが配置される同じキャッシュライン上に
配置するデータ配置手段とを具備したことを特徴とす
る。

【００１０】また、前記データ配置手段によってデータ
を配置する際に、前記読み込みのみのデータを配置すべ
きキャッシュラインが複数存在する場合に、前記読み込
みのみのデータを複数のキャッシュライン中にコピーし
て配置するコピーデータ配置手段をさらに具備したこと
を特徴とする。

【００１１】また本発明は、データ構造にロック変数を
付加し、データ構造にアクセスする場合にはロック変数
をセットしてからデータ構造にアクセスし、データ構造
へのアクセスが終わった後にロック変数をリセットする
ことにより、マルチプロセッサ間で共有するデータ構造
を排他制御するマルチプロセッサシステムにおいて、原
始プログラムに対して実行可能な目的プログラムを作成
するための解析を行なう際に、プログラム中で使用され
ているデータ構造を排他制御するロック変数を検索する
ためのロック変数検索手段と、前記ロック変数検索手段
によって検索されたロック変数によって保護されるデー
タ構造を検索するためのデータ構造検索手段と、解析結
果に応じてコード生成を行なう際に、前記ロック変数検
索手段及び前記データ構造検索手段による検索結果に基
づいて、１つのキャッシュライン中にロック変数によっ
て保護されたデータ構造を１個以下しかアロケーション
しないようにするデータ構造アロケーション手段とを具
備したことを特徴とする。

【００１２】また、キャッシュライン中のアロケーショ
ンされたデータ構造以外の部分に、前記データ構造を保
護するロックをセットしてからリセットするまでの間に
アクセスする読み込みのデータのコピーをアロケーショ
ンするコピーデータ配置手段をさらに具備したことを特
徴とする。

【００１３】また、原始プログラムに対して実行可能な
目的プログラムを作成するための解析を行なう際に入出
力処理のバッファを認識するバッファ確認手段と、解析
結果に応じてコード生成を行なう際に、前記バッファ認
識手段による認識結果に基づいて、入出力処理のバッフ
ァを１つのキャッシュライン中に１個以下しかアロケー
ションしないようにするアロケーション手段とを具備し
たことを特徴とする。

【００１４】

【作用】このような構成によれば、キャッシュを持った
複数のプロセッサが接続されたマルチプロセッサシステ
ムにおいて、そのキャッシュの能力を活かして性能を上
げることが可能となる。

【００１５】すなわち、読み込みのみのデータを、読み
込みのみのデータと同時にアクセスされる読み書きデー
タが配置されるのと同じキャッシュライン上に配置する
ことにより、一方のデータに対する処理を実行する際に
他方のデータもキャッシュに存在することになるので、
メモリからのデータ転送の必要回数が削減される。

【００１６】さらに、読み込みのみのデータを配置すべ
きキャッシュラインが複数存在する場合には、読み書き
データが配置されるキャッシュラインのそれぞれに読み
込みのみのデータをコピーして配置することにより、キ
ャッシュ間でのデータの受け渡し等の処理を低減させる
ことができる。

【００１７】また、マルチプロセッサ間で共有されるデ
ータ構造が排他制御される場合に、ロック変数によって
保護されたデータ構造を１つのキャッシュライン中に１
個以下しかアロケーションしないようにすることで、ロ
ック制御に伴って本来ロックの不要なデータ構造に対す
るアクセスができなくなってしまうことが回避される。

【００１８】

【実施例】以下、図面を参照して本発明の実施例を説明
する。図１は本発明の実施例に係わるコンピュータシス
テムの概略構成を示すブロック図である。図１に示すよ
うに、第１実施例におけるコンピュータシステムは、複
数のプロセッサ１ａ，１ｂ，…と、プロセッサ１ａ，１
ｂ，…に共有される共有メモリ２が、バス３によって接
続されたマルチプロセッサシステム構成となっている。

【００１９】本発明が対象とするマルチプロセッサシス
テムは、キャッシュメモリと、プロセッサや共有メモリ
２との間のデータ転送は、所定の単位毎、すなわちキャ
ッシュライン毎に行なう。

【００２０】プロセッサ１ａには、キャッシュ４ａ、最
適化手段５ａが設けられている。最適化手段５ａは、共
有メモリ２に格納された最適化プログラム（コンパイ
ラ）を、プロセッサ１ａ上で実行することによって機能
が実現される。なお、他のプロセッサ１ｂ，…にも、同
様にして、最適化手段５ｂ，…を設けて実行させること
ができる。

【００２１】最適化手段５ａは、図２に示すような機能
によって構成されている。図２に示すように、最適化手
段５ａは、プログラム解析部１１、データ認識手段１
２、コード生成部１３、キャッシュラインサイズ認識手
段１４、及びデータ配置手段１５によって構成されてい
る。

【００２２】プログラム解析部１１は、所定のプログラ
ム言語を用いて記述された原始プログラムに対して、コ
ンピュータで実行可能な目的プログラムを作成するため
の解析を行なうものである。プログラム解析部１１は、
原始プログラムに対する字句解析、構文解析、意味解析
等を実行する。

【００２３】データ認識手段１２は、プログラム解析部
１１によって解析された結果に基づいて、プログラム中
で使用されるデータのうち読み込みのみの対象となるデ
ータの存在を認識するものである。

【００２４】コード生成部１３は、プログラム解析部１
１における解析結果、及びデータ認識手段１２による認
識結果に応じて、目的プログラムとなるコードを生成す
るものである。

【００２５】キャッシュラインサイズ認識手段１４は、
プログラムが動作する自システムのキャッシュラインサ
イズを認識するものである。データ配置手段１５は、コ
ード生成部１３によって生成されるコードのうち、デー
タに関して共有メモリ２への配置を決定するものであ
る。データ配置手段１５は、データ認識手段１２によっ
て認識された読み込みのみの対象とするデータを、その
読み込みのみのデータと同時にアクセスされる読み書き
が行われるデータが配置されるキャッシュラインと同じ
キャッシュラインに配置する。これにより、同時にアク
セスされるデータが、同時に共有メモリ２からキャッシ
ュに持ってこられるようになる。

【００２６】図２に示す構成において、プログラム解析
部１１及びコード生成部１３は、コンパイラを構成す
る。さらに、コンパイラには、データ認識手段１２及び
データ配置手段１５による機能が付加されている。ま
た、キャッシュラインサイズ認識手段１４は、例えばコ
ンピュータシステムにおけるＯＳ（オペレーティングシ
ステム）の機能によって実現されるものとする。

【００２７】次に、第１実施例の動作について説明す
る。最適化手段５ａは、原始プログラムに対してコンパ
イルを行なう際、システムに実装されたキャッシュを有
効に利用できるように最適化を行なう。まず、プログラ
ム解析部１１は、図示せぬ記憶装置に格納されているコ
ンパイルの対象とする原始プログラムについて解析を行
なう。この際、データ認識手段１２は、読み込みのみに
使用されるデータを識別している。データ認識手段１２
によって認識されたデータは、データ配置手段１５によ
るデータ配置の際に考慮される。

【００２８】コード生成部１３は、プログラム解析部１
１による解析結果に基づいてコードを生成する。この
際、コード生成部１３は、キャッシュラインサイズ認識
手段１４により識別される自システムのキャッシュライ
ンサイズを考慮して、データに関するコード生成を行な
う。

【００２９】図３は本発明の第１実施例の最適化手段５
ａにおけるデータ配置手段１５の処理の流れを示すフロ
ーチャートである。データ配置手段１５は、コード生成
部１３によって生成されたデータに関するコードを、キ
ャッシュを有効に利用できるようにキャッシュラインを
考慮してデータを配置する。

【００３０】まず、データ配置手段１５は、読み書きデ
ータをキャッシュライン中に配置する（ステップＡ
１）。その後、データ配置手段１５は、ステップＡ１に
おいて配置が完了した読み書きデータの周辺（プログラ
ム実行過程の前後近く）でアクセスする読み込みのみの
データ（データ認識手段１２によって認識されたデー
タ）が存在するか否かを調べる（ステップＡ２）。

【００３１】ここで、対象とするデータが存在する場合
には、データ配置手段１５は、その読み込みのみのデー
タがまだ配置されているか否かを調べる（ステップＡ
３）。まだ配置されていない場合には、データ配置手段
１５は、その読み込みのみのデータを、ステップＡ１で
配置された読み書きデータ（現在対象としている読み込
みのみのデータの周辺にあるもの）と同じキャッシュラ
イン中に配置する（ステップＡ４）。

【００３２】なお、ステップＡ３において、既に読み込
みのみのデータが何れかのキャッシュラインに配置され
ていると判別された場合には、データ配置手段１５は、
その読み込みのみのデータの配置を行なわない。

【００３３】こうして、全ての読み書きデータについ
て、それぞれの周辺に読み込みのみのデータがあれば、
このデータを読み書きのデータと同じキャッシュライン
中に配置する。

【００３４】図４は共有メモリ２のキャッシュラインに
データが配置される様子を具体的に説明するための図で
ある。なお、図４（ａ）に示すプログラムは、便宜上、
原始プログラムの形式によって示している。

【００３５】図３（ａ）に示すプログラム中の関数１
は、まず「データＡを参照」して、続いて「データＢを
更新」するものである。ここでデータＡは読み込みのみ
に使用されるものとする。

【００３６】この場合、読み書きされるデータＢについ
ては、ステップＡ１において所定のキャッシュラインに
配置される。データＡは、ステップＡ２において、「デ
ータＢを更新」する処理の周辺に存在するものとして識
別され、ステップＡ４において、図３（ｂ）に示すよう
に、データＢが配置されたキャッシュラインの残りの部
分に配置される。

【００３７】データＡとデータＢを同じキャッシュライ
ン中に配置することにより、プログラムを実行した際
（図４（ａ）に示す処理）、「データＡを参照」した時
にデータＡが共有メモリ２からキャッシュに転送され
て、同時に同一のキャッシュライン中に配置されている
データＢもキャッシュに転送されて格納される。従っ
て、「データＢを更新」する処理を実行する際、キャッ
シュには既にデータＢが存在するので、共有メモリ２か
ら改めてデータを転送する必要がない。すなわち、キャ
ッシュを有効に利用することができる。

【００３８】次に、本発明の第２実施例について説明す
る。第２実施例においては、第１実施例と同様に図１に
示すコンピュータシステム上で、第２実施例による最適
化手段４０ａ，４０ｂ，…が設けられている。

【００３９】最適化手段４０ａは、図５に示すような機
能によって構成されている。図５に示すように、最適化
手段４０ａは、プログラム解析部４１、データ認識手段
４２、コード生成部４３、キャッシュラインサイズ認識
手段４４、データ配置手段４５、及びコピーデータ配置
手段４６によって構成されている。

【００４０】プログラム解析部４１は、所定のプログラ
ム言語を用いて記述された原始プログラムに対して、コ
ンピュータで実行可能な目的プログラムを作成するため
の解析を行なうものである。プログラム解析部４１は、
原始プログラムに対する字句解析、構文解析、意味解析
等を実行する。

【００４１】データ認識手段４２は、プログラム解析部
４１によって解析された結果に基づいて、プログラム中
で使用されるデータのうち読み込みのみの対象となるデ
ータの存在を認識するものである。

【００４２】コード生成部４３は、プログラム解析部４
１における解析結果、及びデータ認識手段４２による認
識結果に応じて、目的プログラムとなるコードを生成す
るものである。

【００４３】キャッシュラインサイズ認識手段４４は、
プログラムが動作する自システムのキャッシュラインサ
イズを認識するものである。データ配置手段４５は、コ
ード生成部４３によって生成されるコードのうち、デー
タに関して共有メモリ２への配置を決定するものであ
る。データ配置手段４５は、データ認識手段４２によっ
て認識された読み込みのみの対象とするデータを、その
読み込みのみのデータと同時にアクセスされる読み書き
が行われるデータが配置されるキャッシュラインと同じ
キャッシュラインに配置する。これにより、同時にアク
セスされるデータが、同時に共有メモリ２からキャッシ
ュに持ってこられるようになる。

【００４４】コピーデータ配置手段４６は、データ配置
手段４５によって、ある読み込みのみの対象となるデー
タが既に他のキャッシュラインに配置されている場合
に、その読み込みのみのデータのコピーを作成して、そ
のデータと同時にアクセスされる読み書きが行なわれる
データが配置された同じキャッシュライン中に配置され
るようにするものである。

【００４５】次に、第２実施例の動作について説明す
る。最適化手段４０ａは、原始プログラムに対してコン
パイルを行なう際、システムに実装されたキャッシュを
有効に利用できるように最適化を行なう。まず、プログ
ラム解析部４１は、図示せぬ記憶装置に格納されている
コンパイルの対象とする原始プログラムについて解析を
行なう。この際、データ認識手段４２は、読み込みのみ
に使用されるデータを識別している。データ認識手段４
２によって認識されたデータは、データ配置手段１５及
びコピーデータ配置手段４６によるデータ配置の際に考
慮される。

【００４６】コード生成部４３は、プログラム解析部４
１による解析結果に基づいてコードを生成する。この
際、コード生成部４３は、キャッシュラインサイズ認識
手段４４により識別された自システムのキャッシュライ
ンサイズを考慮して、データに関するコード生成を行な
う。

【００４７】図６は本発明の第２実施例の最適化手段４
０ａにおけるデータ配置手段４５及びコピーデータ配置
手段４６の処理の流れを示すフローチャートである。デ
ータ配置手段４５は、コード生成部４３によって生成さ
れたデータに関するコードを、キャッシュを有効に利用
できるようにキャッシュラインを考慮してデータを配置
する。

【００４８】まず、データ配置手段４５は、読み書きデ
ータをキャッシュライン中に配置する（ステップＢ）。
その後、データ配置手段４５は、ステップＢ１において
配置が完了した読み書きデータの周辺（プログラム実行
過程の前後近く）でアクセスする読み込みのみのデータ
（データ認識手段４２によって認識されたデータ）が存
在するか否かを調べる（ステップＢ２）。

【００４９】ここで、対象とするデータが存在する場合
には、データ配置手段４５は、その読み込みのみのデー
タが、他のキャッシュラインにまだ配置されているか否
かを調べる（ステップＢ３）。

【００５０】まだ配置されていない場合には、データ配
置手段４５は、その読み込みのみのデータを、ステップ
Ｂ１で配置された読み書きデータ（現在対象としている
読み込みのみのデータの周辺にあるもの）と同じキャッ
シュライン中に配置する（ステップＢ４）。

【００５１】なお、ステップＢ３において、既に読み込
みのみのデータが何れかのキャッシュラインに配置され
ていると判別された場合には、コピーデータ配置手段４
６は、その読み込みのみのデータのコピーを作成する
（ステップＢ５）。

【００５２】そして、コピーデータ配置手段４６は、コ
ピーによって作成したデータを、そのデータと同時にア
クセスされる読み書きが行なわれるデータが配置される
のと同じキャッシュライン中に配置する（ステップＢ
６）。

【００５３】図７は共有メモリ２のキャッシュラインに
データが配置される様子を具体的に説明するための図で
ある。なお、図７（ａ）に示すプログラムは、便宜上、
原始プログラムの形式によって示している。

【００５４】図７（ａ）に示すプログラム中の関数１
は、まず「データＡを参照」して、続いて「データＢを
更新」するもので、関数２は、まず「データＡを参照」
して、続いて「データＣを更新」するものである。ここ
でデータＡは読み込みのみに使用されるものとする。

【００５５】この場合、読み書きされるデータＢ及びデ
ータＣについては、ステップＢ１において、それぞれ所
定のキャッシュラインに配置される。関数１のデータＡ
は、ステップＢ２において、「データＢを更新」する処
理の周辺に存在するものとして識別され、ステップＢ４
において、図７（ｂ）に示すように、データＢが配置さ
れたキャッシュラインの残りの部分に配置される。

【００５６】さらに、ステップＢ３において、データＡ
が既に他のキャッシュラインに配置されていると判別さ
れるので、データＡのコピーを作成して、データＡと同
時にアクセスされる読み書きが行なわれるデータ、すな
わちデータＣが配置されたキャッシュラインの残りの部
分に配置する。

【００５７】データＡとデータＢを同じキャッシュライ
ン中に配置することにより、プログラムを実行した際
（図７（ａ）に示す関数１の処理）、「データＡを参
照」した時にデータＡが共有メモリ２からキャッシュに
転送されて、同時に同一のキャッシュライン中に配置さ
れているデータＢもキャッシュに転送されて格納され
る。また、関数２の処理でデータＡのコピーを参照した
時に、データＡのコピーと同一キャッシュライン中に配
置されているデータＣも、キャッシュに転送されて格納
される。従って、「データＣを更新」する処理を実行す
る際、キャッシュには既にデータＣが存在するので、共
有メモリ２から改めてデータを転送する必要がない。ま
た、読み込みのみのデータがコピーされて異なるキャッ
シュラインのそれぞれに配置されているので、データＢ
が配置されたキャッシュラインが、あるプロセッサのキ
ャッシュに存在しても、このデータを別のプロセッサの
キャッシュに転送する等の処理が不要となる。すなわ
ち、キャッシュを有効に利用することができる。

【００５８】次に、本発明の第３実施例について説明す
る。第３実施例においては、第１実施例と同様に図１に
示すコンピュータシステム上で、第３実施例による最適
化手段７０ａ，７０ｂ，…が設けられている。

【００５９】一般に、マルチプロセッサシステムでは、
共有メモリ２中の共用データの排他制御の方法としてロ
ック操作がある。ロック操作では、ある共有データに対
して共有メモリ２上にロック変数を用意し、共有データ
を処理する前にロック変数を確保し、共有データをアク
セスした後でロック変数をクリアする。

【００６０】プロセッサ上で実行されるプロセスは、ロ
ック変数を確保しようとする際に、既に他のプロセス
が、そのロック変数を確保している場合には、そのロッ
ク変数がクリアされるまで待ち状態となり、クリアされ
ると直ちにロック変数を確保する。こうして、複数のプ
ロセッサが同時に同じデータにアクセスして、データが
不整合になることを防いでいる。第３実施例におけるコ
ンピュータシステムは、このような排他制御を行なうも
のとする。

【００６１】最適化手段７０ａは、図７に示すような機
能によって構成されている。図７に示すように、最適化
手段７０ａは、プログラム解析部７１、ロック変数検索
手段７２、データ構造検索手段７３、コード生成部７
４、及びデータ構造アロケーション手段７５によって構
成されている。

【００６２】プログラム解析部７１は、所定のプログラ
ム言語を用いて記述された原始プログラムに対して、コ
ンピュータで実行可能な目的プログラムを作成するため
の解析を行なうものである。プログラム解析部７１は、
原始プログラムに対する字句解析、構文解析、意味解析
等を実行する。

【００６３】ロック変数検索手段７２は、プログラム解
析部７１によって解析された結果に基づいて、プログラ
ム中で使用されているロック変数を検索する。データ構
造検索手段７３は、プログラム解析部７１によって解析
されるプログラム中で、ロック変数検索手段７２によっ
て検索されたロック変数によって保護されるデータ構造
を検索するものである。

【００６４】コード生成部７４は、プログラム解析部７
１における解析結果に応じて、目的プログラムとなるコ
ードを生成するものである。データ構造アロケーション
手段７５は、プログラム解析部７１（ロック変数検索手
段７２、データ構造検索手段７３）で解析されたプログ
ラムをもとに、１つのキャッシュライン中に、ロック変
数で保護されたデータ構造が１個以下しか配置されない
ようにアロケーションを行なうものである。

【００６５】図８に示す構成において、プログラム解析
部７１及びコード生成部７４は、コンパイラを構成す
る。プログラム解析部７１には、さらにロック変数検索
手段７２及びデータ構造検索手段７３による機能が付加
されている。

【００６６】次に、第３実施例の動作について、図９に
示すフローチャートを参照しながら説明する。まず、プ
ログラム解析部７１は、コンパイルされる原始プログラ
ムについて解析を行なう。この際、ロック変数検索手段
７２は、プログラム中で使用されているロック変数を検
索する（ステップＣ１）。また、データ構造検索手段７
３は、ロック変数検索手段７２によって検索されたロッ
ク変数によって保護されるデータ構造を検索する（ステ
ップＣ２）。

【００６７】コード生成部７４は、プログラム解析部７
１による解析結果に基づいてコードを生成する。データ
構造アロケーション手段７５は、コード生成部７４によ
って生成されたデータに関するコードに対して、ステッ
プＣ２において検索されたデータ構造を、１つのキャッ
シュライン中にロック変数で保護されたデータ構造が１
個以下しか配置されないようにアロケーションを行なう
（ステップＣ３）。

【００６８】図１０は共有メモリ２のキャッシュライン
にデータが配置される様子を具体的に説明するための図
である。なお、図１０（ａ）に示すプログラムは、便宜
上、原始プログラムの形式によって示している。

【００６９】図１０（ａ）に示すプログラム中の関数１
は、まず「ロック変数Ａをロック」して、「データ構造
Ｂを更新」し、「ロック変数Ａをアンロック」する。続
いて「ロック変数Ｃをロック」して、「データ構造Ｄを
更新」し、「ロック変数Ｃをアンロック」するものであ
る。

【００７０】この場合、ステップＣ１においてロック変
数Ａ及びロック変数Ｃが検索され、ステップＣ２におい
て、異なるロック変数Ａ，Ｃでそれぞれ保護されたデー
タ構造Ｂ及びＤが検索される。データ構造アロケーショ
ン手段７５は、ステップＣ３において、図９（ｂ）に示
すように、データ構造Ｂ及びＤを各々異なるキャッシュ
ライン中に配置される。

【００７１】データ構造Ｂとデータ構造Ｄを異なるキャ
ッシュラインに強制的に配置することにより、一方のデ
ータ構造がロックされたために、他方のデータ構造も使
用できなくことがなくなり、各キャッシュラインに配置
されたデータ構造を有効に利用することができる。

【００７２】次に、本発明の第４実施例について説明す
る。第４実施例においては、第１実施例と同様に図１に
示すコンピュータシステム上で、第４実施例による最適
化手段１００ａ，１００ｂ，…が設けられている。第４
実施例におけるコンピュータシステムも、第３実施例と
同様な排他制御を行なうものとする。

【００７３】最適化手段１００ａは、図１１に示すよう
な機能によって構成されている。図１１に示すように、
最適化手段１００ａは、プログラム解析部１０１、ロッ
ク変数検索手段１０２、データ構造検索手段１０３、コ
ード生成部１０４、データ構造アロケーション手段１０
５、及びコピーデータ配置手段１０６によって構成され
ている。

【００７４】プログラム解析部１０１は、所定のプログ
ラム言語を用いて記述された原始プログラムに対して、
コンピュータで実行可能な目的プログラムを作成するた
めの解析を行なうものである。プログラム解析部１０１
は、原始プログラムに対する字句解析、構文解析、意味
解析等を実行する。

【００７５】ロック変数検索手段１０２は、プログラム
解析部１０１によって解析された結果に基づいて、プロ
グラム中で使用されているロック変数を検索する。デー
タ構造検索手段１０３は、プログラム解析部１０１によ
って解析されるプログラム中で、ロック変数検索手段１
０２によって検索されたロック変数によって保護される
データ構造を検索するものである。

【００７６】コード生成部１０４は、プログラム解析部
１０１における解析結果に応じて、目的プログラムとな
るコードを生成するものである。データ構造アロケーシ
ョン手段１０５は、プログラム解析部１０１（ロック変
数検索手段１０２、データ構造検索手段１０３）で解析
されたプログラムをもとに、１つのキャッシュライン中
に、ロック変数で保護されたデータ構造が１個以下しか
配置されないようにアロケーションを行なうものであ
る。また、データ構造アロケーション手段１０５は、キ
ャッシュライン中のデータ構造が配置された部分以外の
領域に、そのデータ構造を保護するロック変数を獲得し
てから解放するまでの間に参照されるデータを配置す
る。

【００７７】コピーデータ配置手段１０６は、データ構
造アロケーション手段１０５によって配置された、デー
タ構造を保護するロック変数を獲得してから解放するま
での間に参照されるデータが既に他のキャッシュライン
に配置されている場合に、そのデータが参照のみの対象
となる場合に限って、そのデータのコピーを配置するも
のである。

【００７８】図１１に示す構成において、プログラム解
析部１０１及びコード生成部１０４は、コンパイラを構
成する。プログラム解析部１０１には、さらにロック変
数検索手段１０２及びデータ構造検索手段１０３による
機能が付加され、コード生成部１０４には、さらにコピ
ーデータ配置手段１０６及びデータ構造アロケーション
手段１０５による機能が付加されている。１０２は、ロ
ック変数検索手段であり、プログラム中で使用されてい
るロック変数を検索する。１０４はロック変数によって
保護されたデータ構造を検索する手段である。本発明の
最適化コンパイラではプログラム解析部で解析されたプ
ログラムを基に、１つのキャッシュライン中に、ロック
で保護されたデータ構造が１個以下しか配置されないよ
うにする。そしてキャッシュライン中の、データ構造が
配置された部分以外の場所に、そのデータ構造を保護す
るロックを獲得してから解放するまでの間に参照するデ
ータを配置する。またもしそのデータが既に他のキャッ
シュライン中に配置されている場合には、そのデータが
参照のみの場合に限って、そのデータのコピーを配置す
る。

【００７９】次に、第４実施例の動作について、図１２
に示すフローチャートを参照しながら説明する。まず、
プログラム解析部１０１は、コンパイルされる原始プロ
グラムについて解析を行なう。この際、ロック変数検索
手段１０２は、プログラム中で使用されているロック変
数を検索する（ステップＤ１）。また、データ構造検索
手段１０３は、ロック変数検索手段１０２によって検索
されたロック変数によって保護されるデータ構造を検索
する（ステップＤ２）。

【００８０】コード生成部１０４は、プログラム解析部
１０１による解析結果に基づいてコードを生成する。デ
ータ構造アロケーション手段１０５は、コード生成部１
０４によって生成されたデータに関するコードに対し
て、ステップＤ２において検索されたデータ構造を、１
つのキャッシュライン中にロック変数で保護されたデー
タ構造が１個以下しか配置されないようにアロケーショ
ンを行なう（ステップＤ３）。

【００８１】その後、データ構造アロケーション手段１
０５は、ステップＤ３において配置が完了したデータ構
造について、そのデータ構造を保護するロック変数を獲
得してから解放するまでの間に参照するデータが存在す
るか否かを調べる（ステップＤ４）。

【００８２】ここで、対象とするデータが存在する場合
には、データ構造アロケーション手段１０５は、そのデ
ータがまだ他のキャッシュラインに配置されていないか
否かを調べる（ステップＤ５）。

【００８３】まだ配置されていない場合には、データ構
造アロケーション手段１０５は、そのデータを、ステッ
プＤ３で配置されたデータ構造が配置された部分以外の
領域に配置する（ステップＤ６）。

【００８４】なお、ステップＤ５において、既に対象と
するデータ（ロック中に参照されるデータ）が何れかの
キャッシュラインに配置されていると判別された場合に
は、コピーデータ配置手段１０６は、そのデータのコピ
ーを作成する（ステップＢ５）。

【００８５】そして、コピーデータ配置手段１０６は、
コピーによって作成したデータを、そのデータが参照の
みの場合に限って、データ構造が配置された同じキャッ
シュライン中に配置する（ステップＤ８）。

【００８６】図１３は共有メモリ２のキャッシュライン
にデータが配置される様子を具体的に説明するための図
である。なお、図１３（ａ）に示すプログラムは、便宜
上、原始プログラムの形式によって示している。

【００８７】図１３（ａ）に示すプログラム中の関数１
は、まず「ロック変数Ａ」をロックし、「データＢを参
照」し、「データ構造Ｃを更新」し、「ロック変数Ａを
アンロック」する。続いて「ロック変数Ｄをロック」し
て、「データＢを参照」し、「データ構造Ｅを更新」
し、「ロック変数Ｄをアンロック」するものである。

【００８８】この場合、ステップＤ３において異なるロ
ック変数Ａ及びＣでそれぞれ保護されたデータ構造Ｃ及
びＥは、各々異なるキャッシュライン中に配置される。
また、図１３（ｂ）に示すように、データ構造Ｃ及びＥ
を保護するロック変数Ａ及びＤを獲得してから解放する
までの間に参照される読み込みのみの対象となるデータ
Ｂを、データ構造Ｃが配置されているキャッシュライン
の残りの部分に配置し、またデータＢのコピーをデータ
構造Ｅが配置されているキャッシュラインの残りの部分
にそれぞれ配置する。

【００８９】データ構造Ｃとデータ構造Ｅを異なるキャ
ッシュラインに強制的に配置することにより、一方のデ
ータ構造がロックされたために、他方のデータ構造も使
用できなくことがなくなり、さらにデータ構造を保護す
るロック変数を獲得してから解放するまでの間に参照さ
れるデータも同じキャッシュラインに配置されることか
ら、データ構造をキャッシュに格納した際に、既に参照
されるデータがキャッシュ中に存在するので共有メモリ
２から改めてデータを転送する必要がない。さらに、デ
ータ構造がロックされたとしても、参照されるデータ自
身はデータ構造毎にキャッシュに存在しているので、参
照することができる。

【００９０】なお、前述した第１〜第４実施例において
は、データあるいはデータ構造をキャッシュラインに配
置する場合について説明したが、入出力処理用のバッフ
ァとして用いる領域についても同様にして配置すること
ができる。

【００９１】図１４はプログラム解析部及びコード生成
部から構成されるコンパイラによって行われるデータ配
置の様子を示す図である。図１４（ａ）に示すプログラ
ムは、「ｂｕｆｆｅｒ１」及び「ｂｕｆｆｅｒ２」を入
出力処理のバッファとして使用するものである。プログ
ラム解析部は、コンパイルの対象とするプログラムを解
析して、バッファの定義を検索し、コード生成部は、検
索された各バッファについて、図１４（ｂ）に示すよう
に、１つのキャッシュライン中に１個以下の入出力バッ
ファしか配置されないようにする。すなわち、あるキャ
ッシュラインを配置した後、キャッシュライン中に空き
の領域があっても他のキャッシュラインの配置を行わな
いようにする。

【００９２】入出力処理用のバッファを１つのキャッシ
ュライン中に１個以下しかアロケーションしないように
することにより、例えば異なるバッファを用いるたびに
キャッシュラインのデータがキャッシュメモリ間で転送
されるようなことが発生しない。

【００９３】

【発明の効果】以上詳述したように本発明によれば、そ
れぞれのプロセッサに対応してキャッシュが設けられた
マルチプロセッサシステムにおいて、キャッシュの能力
を活かして性能を上げることが可能となるものである。

【図面の簡単な説明】

【図１】本発明の一実施例に係わるコンピュータシステ
ムの概略構成を示すブロック図。

【図２】本発明の第１実施例における最適化手段の機能
構成を示すブロック図。

【図３】本発明の第１実施例の最適化手段５ａにおける
データ配置手段１５の処理の流れを示すフローチャー
ト。

【図４】本発明の第１実施例におけるキャッシュライン
にデータが配置される様子を具体的に説明するための
図。

【図５】本発明の第２実施例における最適化手段の機能
構成を示すブロック図。

【図６】本発明の第２実施例の最適化手段４０ａにおけ
るデータ配置手段４５及びコピーデータ配置手段４６の
処理の流れを示すフローチャート。

【図７】本発明の第２実施例におけるキャッシュライン
にデータが配置される様子を具体的に説明するための
図。

【図８】本発明の第３実施例における最適化手段の機能
構成を示すブロック図。

【図９】本発明の第３実施例の動作を説明するためのフ
ローチャート。

【図１０】本発明の第３実施例におけるキャッシュライ
ンにデータが配置される様子を具体的に説明するための
図。

【図１１】本発明の第４実施例における最適化手段の機
能構成を示すブロック図。

【図１２】本発明の第４実施例の動作を説明するための
フローチャート。

【図１３】本発明の第４実施例におけるキャッシュライ
ンにデータが配置される様子を具体的に説明するための
図。

【図１４】本発明における入出力処理用のバッファとし
て用いる領域がキャッシュラインに配置される様子を具
体的に説明するための図。

【符号の説明】

１１，４１，７１，１０１…プログラム解析部、１２，
４２…データ認識手段、１３，４３，７４，１０４…コ
ード生成部、１４，４４…キャッシュラインサイズ認識
手段、１５，４５…データ配置手段、４６，１０６…コ
ピーデータ配置手段、７２，，１０２…ロック変数検索
手段、７３，１０３…データ構造検索手段、７５，１０
５…データ構造アロケーション手段。

Claims

【特許請求の範囲】

【請求項１】キャッシュを持った複数のプロセッサが
接続されたマルチプロセッサシステムであって、メモリ
上のデータが所定のキャッシュライン単位で操作される
マルチプロセッサシステムにおいて、原始プログラムに対して実行可能な目的プログラムを作
成するための解析を行なう際に読み込みのみの対象とな
るデータを認識するデータ認識手段と、自システムにおけるキャッシュラインのサイズを認識す
るキャッシュサイズ認識手段と、解析の結果に応じてコード生成を行なう際に、前記デー
タ認識手段及び前記キャッシュサイズ認識手段による認
識結果に基づいて、プログラムが同時にアクセスする複
数のデータが同時にメモリからキャッシュに格納される
ように、読み込みのみのデータを前記読み込みのみのデ
ータと同時にアクセスされる読み書きデータが配置され
るのと同じキャッシュライン上に配置するデータ配置手
段と、を具備したことを特徴とするマルチプロセッサシステ
ム。
【請求項２】前記データ配置手段によってデータを配
置する際に、前記読み込みのみのデータを配置すべきキ
ャッシュラインが複数存在する場合に、前記読み込みの
みのデータを複数のキャッシュライン中にコピーして配
置するコピーデータ配置手段をさらに具備したことを特
徴とする請求項１記載のマルチプロセッサシステム。
【請求項３】データ構造にロック変数を付加し、デー
タ構造にアクセスする場合にはロック変数をセットして
からデータ構造にアクセスし、データ構造へのアクセス
が終わった後にロック変数をリセットすることにより、
マルチプロセッサ間で共有するデータ構造を排他制御す
るマルチプロセッサシステムにおいて、原始プログラムに対して実行可能な目的プログラムを作
成するための解析を行なう際に、プログラム中で使用さ
れているデータ構造を排他制御するロック変数を検索す
るためのロック変数検索手段と、前記ロック変数検索手段によって検索されたロック変数
によって保護されるデータ構造を検索するためのデータ
構造検索手段と、解析結果に応じてコード生成を行なう際に、前記ロック
変数検索手段及び前記データ構造検索手段による検索結
果に基づいて、１つのキャッシュライン中にロック変数
によって保護されたデータ構造を１個以下しかアロケー
ションしないようにするデータ構造アロケーション手段
と、を具備したことを特徴とするマルチプロセッサシステ
ム。
【請求項４】キャッシュライン中のアロケーションさ
れたデータ構造以外の部分に、前記データ構造を保護す
るロックをセットしてからリセットするまでの間にアク
セスする読み込みのみのデータのコピーをアロケーショ
ンするコピーデータ配置手段をさらに具備したことを特
徴とする請求項３記載のマルチプロセッサシステム。
【請求項５】キャッシュを持った複数のプロセッサが
接続されたマルチプロセッサシステムであって、メモリ
上のデータが所定のキャッシュライン単位で操作される
マルチプロセッサシステムにおいて、原始プログラムに対して実行可能な目的プログラムを作
成するための解析を行なう際に入出力処理のバッファを
認識するバッファ確認手段と、解析結果に応じてコード生成を行なう際に、前記バッフ
ァ認識手段による認識結果に基づいて、入出力処理のバ
ッファを１つのキャッシュライン中に１個以下しかアロ
ケーションしないようにするアロケーション手段と、を具備したことを特徴とするマルチプロセッサシステ
ム。
【請求項６】キャッシュを持った複数のプロセッサが
接続されたマルチプロセッサシステムであって、メモリ
上のデータが所定のキャッシュライン単位で操作される
マルチプロセッサシステムにおいて、原始プログラムに対して実行可能な目的プログラムを作
成するための解析を行なう際に読み込みのみの対象とな
るデータを認識し、自システムにおけるキャッシュラインのサイズを認識
し、解析の結果に応じてコード生成を行なう際に、認識され
たキャッシュラインのサイズに応じて、プログラムが同
時にアクセスする複数のデータが同時にメモリからキャ
ッシュに格納されるように、先に認識された読み込みの
みのデータを前記読み込みのみのデータと同時にアクセ
スされる読み書きデータが配置される同じキャッシュラ
イン上に配置することを特徴とするメモリアロケーショ
ン最適化方法。
【請求項７】読み込みのみのデータを前記読み込みの
みのデータと同時にアクセスされる読み書きデータが配
置されるのと同じキャッシュライン上に配置する場合
に、前記読み込みのみのデータを配置すべきキャッシュ
ラインが複数存在する場合には、前記読み込みのみのデ
ータを複数のキャッシュライン中にコピーして配置する
ことを特徴とする請求項６記載のメモリアロケーション
最適化方法。
【請求項８】データ構造にロック変数を付加し、デー
タ構造にアクセスする場合にはロック変数をセットして
からデータ構造にアクセスし、データ構造へのアクセス
が終わった後にロック変数をリセットすることにより、
マルチプロセッサ間で共有するデータ構造を排他制御す
るマルチプロセッサシステムにおいて、原始プログラムに対して実行可能な目的プログラムを作
成するための解析を行なう際に、プログラム中で使用さ
れているデータ構造を排他制御するロック変数を検索
し、検索されたロック変数によって保護されるデータ構造を
検索し、解析結果に応じてコード生成を行なう際に、検索された
ロック変数によって保護されたデータ構造を１つのキャ
ッシュライン中に１個以下しかアロケーションしないよ
うにすることを特徴とするメモリアロケーション最適化
方法。
【請求項９】キャッシュライン中のアロケーションさ
れたデータ構造以外の部分に、前記データ構造を保護す
るロックをセットしてからリセットするまでの間にアク
セスする読み込みのみのデータのコピーをアロケーショ
ンすることを特徴とする請求項８記載のメモリアロケー
ション最適化方法。
【請求項１０】キャッシュを持った複数のプロセッサ
が接続されたマルチプロセッサシステムであって、メモ
リ上のデータが所定のキャッシュライン単位で操作され
るマルチプロセッサシステムにおいて、原始プログラムに対して実行可能な目的プログラムを作
成するための解析を行なう際に入出力処理のバッファを
認識し、解析結果に応じてコード生成を行なう際に、認識された
入出力処理のバッファを１つのキャッシュライン中に１
個以下しかアロケーションしないようにすることを特徴
とするメモリアロケーション最適化方法。