JPH0773162A - 情報処理装置の性能モニタ - Google Patents

情報処理装置の性能モニタ

Info

Publication number
JPH0773162A
JPH0773162A JP5218480A JP21848093A JPH0773162A JP H0773162 A JPH0773162 A JP H0773162A JP 5218480 A JP5218480 A JP 5218480A JP 21848093 A JP21848093 A JP 21848093A JP H0773162 A JPH0773162 A JP H0773162A
Authority
JP
Japan
Prior art keywords
memory
cpu
sent
request
memory units
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5218480A
Other languages
English (en)
Inventor
Koji Kinoshita
耕二 木下
Hiroyuki Kasai
洋行 河西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
NEC Computertechno Ltd
Original Assignee
NEC Corp
NEC Computertechno Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, NEC Computertechno Ltd filed Critical NEC Corp
Priority to JP5218480A priority Critical patent/JPH0773162A/ja
Publication of JPH0773162A publication Critical patent/JPH0773162A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Complex Calculations (AREA)

Abstract

(57)【要約】 【目的】スーパーコンピュータ等で、プログラム作成者
の勘に負うところの大きかったメモリアクセス負荷の状
態を定量的に把握することを可能とし、プログラムのチ
ューンアップを容易にする。 【構成】CPU1からはメモリアクセス制御部2を介し
て、メモリユニット3−0〜3−3を同時にアクセスで
きる。メモリアクセス制御部2はCPU1からのメモリ
アクセス要求を解続し、アクセスするリクエストの種
別、アドレスに応じてメモリユニット3−0〜3−3の
いずれにリクエストを送出するかを判断する。メモリユ
ニット3−0〜3−3へのアクセスを計数するカウンタ
6−0〜6−3と、メモリユニット3−0〜3−3への
リクエスト信号を論理和した信号を計数するカウンタ5
を設け、これらすべてのカウンタはCPU1から参照で
きる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は情報処理装置の性能評
価,性能測定のための性能モニタに関する。
【0002】
【従来の技術】近年、配列計算を主たる処理対象とす
る、いわゆるベクトル計算機が多く使われ始めている。
ベクトル計算機を有効に使いこなすためには、その特徴
を熟知し、場合によってはベクトル計算機が最大性能を
発揮できるようにプログラムを書き換える必要がある。
その熟知すべき特徴の一つに、プログラムのメモリに対
する負荷が挙げられる。
【0003】特に、最近の傾向として高速化のために、
メモリを共有したマルチプロセッサ構成をとることが多
いが、このようなメモリ共有型のマルチプロセッサ構成
のシステムでは、メモリ競合により深刻な処理性能定価
を来すことがあることが知られている。この性能定価を
回避するには、十分なメモリスループットを確保するこ
とも一つの方法ではあるが、そのためには開発,製造共
に莫大な費用がかかり、価格性能比で必ずしも優位に立
てるとは限らない。
【0004】したがって、プログラムをメモリ競合が生
じにくいように変更することにより性能定価を避ける方
が実現する上有利となる。しかしながら、そのために
は、プログラムのどの部分でメモリ競合が生じ易いかを
プログラム作成者に知らしめる必要があるが、従来、こ
のような情報を知るしめる手段がなかった。
【0005】
【発明が解決しようとする課題】上述したように、従来
はプログラムのどの部分でメモリ競合が生じ易い情報を
プログラム作成者に知らしめる手段がなく、プログラム
作成者の勘に頼っていることが多いため、対応の費用で
処理性能の定価を回避することができないという問題点
がある。
【0006】
【課題を解決するための手段】本発明の性能モニタは、
同時に独立して動作可能な複数のメモリユニットから成
るメモリ装置と、1台以上の演算処理装置を具備する情
報処理装置の性能モニタであって、前記演算処理装置か
らの前記メモリ装置へのアクセス要求を、該当する前記
メモリユニットに送出するように制御するメモリアクセ
ス制御手段と、いずれかの前記メモリユニットに要求信
号が送出されると歩進する前記演算処理装置対応の計数
手段とを含むことを特徴とする。
【0007】
【実施例】本発明の第1の実施例を示す図1を参照する
と、本実施例はCPU1と、メモリアクセス制御部2
と、4つのメモリユニット3−0,3−1,3−2およ
び3−3と、オア回路4と、5つのカウンタ5,6−
0,6−1,6−2および6−3とから構成されてい
る。
【0008】CPU1は命令を解釈し実行する演算処理
装置であり、メモリを参照する命令を実行する場合およ
び命令をメモリからフェッチする場合に結線101を介
してメモリアクセス制御部2にメモリアクセス要求を送
出する。
【0009】メモリアクセス制御部2はCPU1からメ
モリアクセス要求を受取ると、CPU1からの要求アド
レスに対応したメモリユニット3−0〜3−3にそれぞ
れ結線102−0〜102−3を介して要求信号を送出
する。
【0010】CPU1からのメモリアクセス要求にはス
カラデータのアクセス要求とベクトルデータのアクセス
要求とがある。スカラデータのアクセス要求の場合に
は、CPU1から送られるてくるアドレスをそのまま用
いて、アクセスするメモリユニットを選択し、該当する
メモリユニットに要求信号およびアドレスを送出する。
【0011】一方、ベクトルデータのアクセス要求の場
合には、CPU1から供給される先頭アドレスと要素間
間隔をもとにしてメモリアクセス制御部2でベクトルデ
ータを構成している各要素のアドレスを生成し、生成さ
れたアドレスに対応するメモリユニットに対して要求信
号およびアドレスを送出する。もっとも、スカラデータ
の場合とベクトルデータの場合とを問わず、メモリに対
する書込みの場合には書込みデータも送出する。要求信
号は要素毎に送出され、要素間間隔により最大4要素同
時に送出される。
【0012】メモリユニット3−0〜3−3は、メモリ
アクセス制御部2からそれぞれ102−0〜102−3
を介して送られてくる指示に基いて動作する。CPU1
からみた番地付けは図3に示されるようにされており、
メモリアクセス制御装置2は、この番地付けを前提とし
てアクセスするメモリユニットを決定している。また、
図3から明らかなように、メモリ上連続したアドレスに
配置されたベクトルデータがアクセスされる場合は同時
に4要素アクセスできる。
【0013】結線102−1〜102−3を介してメモ
リユニット3−0〜3−3に送出される要求信号は、ま
たオア回路4にも供給され、オア回路4から結線103
を介してカウンタ5に入力し結線103が論理‘1’に
なるとカウンタ5は歩進される。すなわち、結線102
−0〜102−3のいずれかを介してメモリユニット3
−0〜3−3に要求信号が送出されたタイミングでカウ
ンタ5は歩進される。カウンタ5の値は結線104を介
してCPU1に供給され、CPU1がカウンタ5の値を
参照することができる。
【0014】結線102−0〜102−4はまた、それ
ぞれカウンタ6−0〜6−3にも供給され、カウンタ6
−0〜6−3はそれぞれ結線102−0〜102−3が
論理‘1’になった時歩進される。カウンタ6−0〜6
−3はそれぞれ結線105−0〜105−3を介してC
PU1に供給され、CPU1がカウンタ6−0〜6−3
の値を参照することができる。
【0015】CPU1は図示されない毎クロックサイク
ルに歩進されるタイマを内蔵しており、このタイマによ
って規定される一定時間でのカウンタ5および6−0〜
6−3の値を参照することにより、そのプログラムによ
るメモリ負荷を算定することができる。プログラム作成
者は、こうして得られたメモリ負荷を基にしてメモリ負
荷を減らすようにプログラムを検討することができる。
【0016】次に、図2は本発明の第2の実施例を示す
ブロック図である。本実施例は、2つのCPU11−0
および11−1と、メモリアクセス制御部12と、4つ
のメモリユニット13−0,13−1,13−2および
13−3と、オア回路14と、2つのアンド回路15−
0および15−1と、2つのカウンタ16−0および1
6−1とで構成される。
【0017】CPU11−0および11−1は第1の実
施例におけるCPU1と同等の機能を有する演算処理装
置であり、それぞれ結線201−0および201−1を
介してメモリアクセス制御部12にメモリアクセス要求
を送出する。
【0018】メモリアクセス制御部2は、CPU11−
0およひCPU11−1から送られてきたメモリアクセ
ス要求を調停して結線202−0〜202−3を介して
メモリユニット13−0〜13−3にそれぞれ要求信号
を送出する。メモリユニット13−0〜13−3は、第
1の実施例におけるメモリユニット3−0〜3−3と同
様に図3に示されるような番地付けがなされており、メ
モリアスケス制御部12は、この番地付けがCPU11
−0と11−1に共通であるとの前提としてアクセスす
るメモリユニットを決定する。
【0019】メモリアクセス制御部12は、CPU11
−0または1からのリクエストのいずれか一方を処理
し、同時にはメモリユニット13−0〜3に要求信号を
送出しない。要求信号送出元CPU番号は結線203−
0〜1を介して出力されそれぞれアンド回路15−0お
よび15−1に供給される。CPU11−0のアクセス
要求に対する要求信号が送出された時は203−0が論
理‘1’に、CPU11−1のアクセス要求に対する要
求信号が送出された時は203−1が論理‘1’にな
り、それぞれアンド回路15−0,15−1を活性化す
る。
【0020】結線202−0〜202−3を介してメモ
リユニット13−0〜13−3に供給される要求信号
は、第1の実施例と同様にしてオア回路14にも供給さ
れ、4つの信号の論理和がとられて結線204を介して
アンド回路15−0および15−1に供給される。アン
ド回路15−0および15−1はメモリユニットへの要
求信号の要求元CPU番号を示す203−0および20
3−1と、メモリユニット13−0〜13−3のいずれ
かにアクセス要求があったことを示す204の論理積を
とり、それぞれカウンタ16−0および16−1にそれ
ぞれ結線205−0および205−1を介して供給され
る。カウンタ16−0および16−1はそれぞれ205
−0および205−1が論理‘1’になると歩進される
カウンタで、それぞれCPU11−0およびCPU11
−1によるメモリアクセス要求によりメモリユニット1
3−0〜13−3に対して要求信号を送出した回数を示
している。
【0021】カウンタ16−0および16−1はそれぞ
れ結線206−0および206−1を介してCPU11
−0および11−1に供給され、CPU11−0および
11−1から16−0および16−1の値を参照するこ
とができる。CPU11−0および11−1は、図示さ
れない内蔵タイマと、カウンタ16−0および16−1
からそれぞれが実行しているプログラムのメモリ負荷を
算定することができる。
【0022】以上述べた2つの実施例は本発明の望まし
い例であり、本発明がこれらの実施例に限定されるもの
ではないことはいうまでもない。
【0023】
【発明の効果】以上説明したように、本発明はメモリに
対して、アクセス要求を送出する毎に計数する計数手段
を有することにより、プログラムのメモリ負荷状態を知
らしめることができ、プログラム修正に供することがで
き、結果としてベクトル計算機の性能を引出すことが可
能になる。
【図面の簡単な説明】
【図1】本発明の第1の実施例のブロック図である。
【図2】本発明の第2の実施例のブロック図である。
【図3】本発明におけるメモリの番地付けの一例を示す
図である。
【符号の説明】
1,11−0,11−1 CPU 2,12 メモリアクセス制御部 3−1〜3−3,13−0〜13−3 メモリユニッ
ト 4,14 オア回路 5,6−0〜6−3,16−0〜16−1 カウンタ 15 アンド回路。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 同時に独立して動作可能な複数のメモリ
    ユニットから成るメモリ装置と、1台以上の演算処理装
    置を具備する情報処理装置の性能モニタであって、 前記演算処理装置からの前記メモリ装置へのアクセス要
    求を、該当する前記メモリユニットに送出するように制
    御するメモリアクセス制御手段と、 いずれかの前記メモリユニットに要求信号が送出される
    と歩進する前記演算処理装置対応の計数手段とを含むこ
    とを特徴とする情報処理装置の性能モニタ。
  2. 【請求項2】 前記メモリユニットに要求信号が送出さ
    れると歩進する前記メモリユニット対応の計数手段を設
    けたことを特徴とする請求項1記載の情報処理装置の性
    能モニタ。
JP5218480A 1993-09-02 1993-09-02 情報処理装置の性能モニタ Pending JPH0773162A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5218480A JPH0773162A (ja) 1993-09-02 1993-09-02 情報処理装置の性能モニタ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5218480A JPH0773162A (ja) 1993-09-02 1993-09-02 情報処理装置の性能モニタ

Publications (1)

Publication Number Publication Date
JPH0773162A true JPH0773162A (ja) 1995-03-17

Family

ID=16720593

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5218480A Pending JPH0773162A (ja) 1993-09-02 1993-09-02 情報処理装置の性能モニタ

Country Status (1)

Country Link
JP (1) JPH0773162A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005339107A (ja) * 2004-05-26 2005-12-08 Nec Electronics Corp パフォーマンス・モニタ回路

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005339107A (ja) * 2004-05-26 2005-12-08 Nec Electronics Corp パフォーマンス・モニタ回路
JP4504737B2 (ja) * 2004-05-26 2010-07-14 ルネサスエレクトロニクス株式会社 パフォーマンス・モニタ回路

Similar Documents

Publication Publication Date Title
US5016167A (en) Resource contention deadlock detection and prevention
US5606520A (en) Address generator with controllable modulo power of two addressing capability
EP3896574B1 (en) System and method for computing
EP1196842B1 (en) Method and apparatus for combining a plurality of memory access transactions
WO1994003860A1 (en) Massively parallel computer including auxiliary vector processor
US5515516A (en) Initialization mechanism for symmetric arbitration agents
JPH0479026B2 (ja)
JP2831083B2 (ja) マルチプロセッサシステムおよび割り込み制御装置
US6954873B2 (en) Implementation of wait-states
JPH0773162A (ja) 情報処理装置の性能モニタ
JPH11163970A (ja) 装置内基盤制御システム
JP2670397B2 (ja) 競合最小化プロセッサおよびシステム・バス・システム
US6009482A (en) Method and apparatus for enabling cache streaming
WO2001025941A1 (en) Multiprocessor computer systems with command fifo buffer at each target device
JPH07508611A (ja) 統一された環境と分散されたシステム機能とを有する対称的マルチプロセシング・システム
JPS63310060A (ja) マルチプロセツサシステム
JPH0973429A (ja) コンピュータシステム及びバス間制御回路
JP3525771B2 (ja) バス・スヌープ制御回路
JPH1185673A (ja) 共有バスの制御方法とその装置
JPS6014435B2 (ja) 記憶装置
JP2876909B2 (ja) 割込みエミュレータ
JP3038257B2 (ja) 電子計算機
JP3449156B2 (ja) モジュール装置
JPH05324455A (ja) マルチプロセッサとメモリとのバス結合方式
Jackson An experimental multi-processor architecture for small business applications

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19990323