JPS62236050A

JPS62236050A - ジヨイン処理方式

Info

Publication number: JPS62236050A
Application number: JP61079673A
Authority: JP
Inventors: Shunichiro Nakamura; 俊一郎中村
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 1986-04-07
Filing date: 1986-04-07
Publication date: 1987-10-16

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕この発明は、情報処理の分野におけるリレーショナルデ
ータベースの分野に関するもので、特にその中のジョイ
ン演算の処理方式に関するものである。

〔従来の技術〕

まず、第６図乃至第８図を用いてリレーショナルデータ
ベースとそのジョイン演算を説明する。

第６図はジョイン処理を行う第１の表を示し、ある会社
が購入する部品とその部品のメーカコードの対応を示し
た一覧表（部品表）である。

また第７図は、ジョイン処理を行う第２の表を示し、メ
ーカコードに対応するメーカ名とそのメカの住所を示し
た一覧表（メーカ表）である。

これら第６図及び＠７図に示す第１．第２の表はリレー
ショナルデータベース（以下単にデータベースという）
中の１つの表（リレーシロン）として磁気ディスクに保
存され、データベースの検索等の要求があると、これら
の表が磁気ディスクからメモリ上に移されて処理が行わ
れるようになっている。

なお本発明とは直接関係ないため以下これらの表がすで
にメモリ上にあるとして以下話を進める。

また第６図の部品表２０において、たて方向の部品名、
メーカコードのことを“項目″、１Ｃ１０１型０３等の
横方向の一行のことをレコードと呼ぶことにする。

リレーショナルデータベースにおけるジョイン演算とは
２つの表をある項目で結び付けて新しい表を作り出すこ
とであり、例えば第６図の部品表と第７図のメーカ表を
それぞれのメーカコード項目を結合項目として結合する
のがジョイン演算であり、その結果が第８図のジョイン
結果表となる。

例えば部品表２０でＩＣ１０３型はメーカコード°０１
′であり、これをメーカ表１５からさがす１、　　　　
とメーカコード０１゛　はＡ社東京都であり、これを結
びつけたものが第８図のジョイン結果表２１の第１行目
になる。

なお、ジョイン演算は３つ以上の表を結合することもあ
るが分解して考えれば結局２つの表を結合することであ
る。

次に第９図に示すジａイン処理装置を用いて上記ジョイ
ン演算を説明する。

第９図は従来のジジイン処理装置の構成を示し、図にお
いて、２２はプロセッサ（以下ＣＰＵという）、２３は
共通記憶装置（以下メモリという）である。

ここにおいて、第６図の部品表と第７図に示すメーカ表
とをジョイン演算して第８図に示すジョイン結果表を作
り出す場合、まず部品表及びメーカ表をその結合項目で
あるメーカコードでソートする。この例の場合にはメー
カ表はすてにメーカコードでソートされているため、部
品表のみをソートして第１０図に示すソート済部品表２
４を作る。ソート済部品表２４ができれば、これとメー
カ表１５を上から順に見ていくことにより、容易に結合
操作が行え、第８図に示すジョイン結果表２１を求める
ことができる。以上のシタイン処理で最も時間を使うの
はソート処理であり、部品表２０のレコード数が多い場
合大量の時間を必要とする。

〔発明が解決しようとする問題点〕

このように従来のジゴイン処理方式は、部品表とメーカ
表のレコード数が数百程度の大きさになるとソート処理
に非常に時間がかかる問題点があった。

この発明は上記問題点を解決するためになされたもので
、特に一方の表が大きく、他方の表が小さい場合にソー
ト処理を行なわずに短い時間でシタイン処理の行なえる
方式を提供することを目的としている。

〔問題点を解決するための手段〕

このためこの発明は、ジョインを行う第１の表のデータ
を上記各ローカルメモリに分散して配置し、ジョインを
行う第２の表のデータを上記各ローカルメモリに重複し
て配置し、上記プロセッサが上記第１の表の部分レコー
ドと第２の表のレコドとをそれぞれ１対１に比較し、結
合条件がとれたペアを順次共通記憶装置の所定領域にス
トアしていくことにより、最終的に共通記憶装置上にシ
タイン処理された新しい表を作り出すようにしたことを
特徴とするものである。

〔作用〕

この発明においては、ジョインを行う第１の表は各ロー
カルメモリに分散して配置され、ジョインを行う築２の
表は各ローカルメモリに重複して配置される。

ここにプロセッサは、第１の表の部分レコードと第２の
表のレコードとをそれぞれ１：１に比較し、結合条件が
とれたベアを順次共通記憶装置の所定領域にストアして
いく。そして最終的に共通記憶装置上にジ町イン処理さ
れた新しい表を作り出す。

〔実施例〕

最初に本発明の適用されるシタイン処理を説明する。

シタイン処理では、大きな表例えば致方レコードからな
る表を取扱う場合がソート処理に時間を要する。しかし
ながら実際のジジイン処理では、片方の表は大きいがも
う一方の表は小さい（数十レコード）というケースがか
なり多く、この場合にはソート処理を行わないで、すな
わち例えばメーカ表が数レコードといったように小さけ
れば、部品表をソートするよりもメーカ表の全レコード
と部品表の全レコードとの比較を行った方が速い。

本発明はこの考えを利用したものである。

次に上記者えに基づいて本発明の一実施例を図面を参照
して説明する。

第１図はこの発明の一実施例であるジョイン処理方式を
示す構成図である。第１図において、■は共通記憶装置
（以下共通メモリという）、２は共通バス、３〜６はそ
れぞれ第１　ｃ　ｐ　ｕ、第２０ｐｕ、第３　ｃ　ｐ　
ｕ、第４ｃｐｕである。各ｃｐｕ３〜６はそれぞれ独立
したプロセッサである。７〜１０はそれぞれ第１０−カ
ルメモリ、第２０−カルメモリ、第３０−カルメモリ、
第４０−カル外メモリであり、それぞれ各ｃｐｕ３〜６のローカルメモ
リである。各ｃｐｕ３〜６が自分のローカルメモリ７〜
１０にアクセスするか、共通メモリーにアクセスするか
はメモリアドレスの範囲でｔ＆り分けられる。各ｃｐｕ
３〜６が実ｔテするプログラムは通常ローカルメモリに
入っている。

シロイン処理の実行が起動されると、まずジジインすべ
き２つの表の大きさが調べられる。片方の表のレコード
数が多く、もう一方の表のレコード数が少いと本発明の
ジョイン処理方式が起動される。以下にそのジョイン処
理方式を示す。

第２図は第６図の部品表２０をレコード数がほぼ４等分
になるように分けたものであり、それぞれ部分部品表１
１．１２．１３．１４である。これらの部分部品表は、
本発明とは直接関係がないため図示していない磁気ディ
スク装置等の外部入出力装置から、それぞれ各ローカル
メモリ７〜１０にロードされる。榔１岡井第７図のメー
カ表１５は丸ごと、各ローカルメモリ７〜１０に重複し
てロードされる。右茫宍許大きい表である部品表の部分
表と小さい表であるメーカ表の全体が各ローカルメモリ
７〜ＩＯにロードされると、各ｃｐｕ３〜６はシロイン
処理を開始する。

第４図は第１　ｃｐｕ３のシロイン処理を示したもので
ある。第１　ｃｐｕ３は第１０−カルメモリ７にロード
されているプログラムにより、第１０−カルメモリ７上
にある部分部品表１１とメーカ表１５に対しシロイン処
理を行う。即ち部分部品表１１のレコードを１つづり取
り出し、このメーカコード項目と、メーカ表１５のレコ
ードのメーカコード項目を順次比較する。一致した場合
には２つのレコードを結び付けてこれを共通メモリ１の
所定位置にストアしていく。例えば部分部品表１１の一
行目のレコードのメーカコードは“０３”であり、これ
をメーカ表１５のレコードと比較していくと、メーカ表
の３番目のレコードと一致する。

そこでこの２つのレコードを結び付け、ＩＣ１０１型Ｃ
社大阪府というレコードを作り、共通メモリ１上の部分
ジョイン結果表１６に入れていく。以上の操作を部分部
品表１１のすべてのレコードに対して行うことにより、
第４図に示す部分ジョイン結果表１６が得られる。以上
の処理は第２、第３．第４Ｃｐｕ４．５．６においても
同様に行われる。

第５図はそれぞれのＣｐｕが並行してジａイン処理を行
い、部分ジョイン結果表１６．１７゜１８．１９を共通
メモリ１にストアしていくことを示したものである。す
べてのｃｐｕが前記比較操作を終了するとジョイン処理
は終了する。即ち共通メモリ１上の４つの部分シロイン
結果表を集めたものが求める結果である。

さてここで、従来の方式と本発明による方式の処理時間
を比較する。従来の方式では、その処理時間はほとんど
大きい表のソート時間で決まる。

ソートアルゴリズムとしてクイックソートアルゴリズム
を使った場合、レコード数をＮとするとその平均比較回
数は１．３９ＮｌｏｌλＮであることが知られている。

これを時間と考えて、これと同じ時間単位を使うと本発
明で各Ｃｐｕが部分部品表のルコードとメーカ表のルコ
ードを比較し、もし一致したら共通メモリに部分ジ目イ
ン結果表をストアする平均時間は約“０．８゛　　と見
積られる。

本発明のジョイン処理の時間はほぼ各ｃｐｕが行う部分
ジョイン処理の時間に等しく、それは小さい表（メーカ
表）のレコード数をｎ、大きい表（部品表）のレコード
数をＮとすると千・ｎ・０．８となる。Ｎ＝２＝１６３
８４．ｎ＝２０とすると、１．３９Ｎ島λＮ＝１．３９ｘＮｘ１４＝４９．５Ｎ”
１−−ｎ　・０．８　＝　４　Ｎとなり本発明のジョイン処理方式の方が約５倍速いこと
がわかる。

なお本発明は、実施例で示したようなｃｐｕが４個の場
合に限らず、一般に複数のｃｐｕの場合について通用で
きることは明らかである。なお上記実施例では部分ジョ
イン結果表を共通メモリにストアすることになっている
が、例えばこれを共通ディスクにストアするようにして
もよい。又部、　　　　分部品表が大きすぎてローカル
メモリに全部入らない場合、ないしは各部分ジョイン結
果表が大きすぎて共通メモリに全部入らない場合には、
部分部品表を何回かに分けてローカルメモリに読み込む
ようにし、その都度実施例で示したものと同様の処理を
行い、この結果できた部分ジョイン結果表をその都度磁
気ディスクに書き込むということを繰り返すようにすれ
ばよい。

又本実施例では複数のｃｐｕと共通メモリを共通バスで
接続しているが、必ずしもバスで接続する必要はなく、
例えば各ｃｐｕを共通記憶装置にチャネルで結合するよ
うにしてもよい。又実施例では大きい表のレコードが小
さい表のレコードのどれか１つと結合する例を示したが
、大きい表のレコードが小さい表の複数のレコードと結
合する場合についても適用できることは明らかである。

又実施例ではリレーシフナルデータベースのジョイン演
算の場合を示したが、他の分野で同様の処理を行う場合
についても本発明が適用できることは明らかである。

〔発明の効果〕

以上のように、この発明によればジョインを行う第１の
表のデータを上記各ローカルメモリに分散して配置し、
ジョインを行う第２の表のデータを上記各ローカルメモ
リに重複して配置し、上記プロセッサが上記第１の表の
部分レコードと第２の表のレコードとをそれぞれ１対ｌ
に比軸し、結合条件がとれたベアを順次共通記憶装置の
所定領域にストアしていくことにより、最終的に共通記
憶装置上にジョイン処理された新しい表を作り出すよう
にしたので、各ｃｐｕがジコイン処理を分担して並列実
行することにより、ジョイン処理のための処理時間を大
幅に短縮するという優れた効果を奏するものである。

【図面の簡単な説明】

第１図はこの発明の一実施例であるジョイン処理方式を
示す構成図、第２図は部分部品表を示す図、第３図はロ
ーカルメモリの内容を示す図、第４図は第１　ｃｐｕの
部分ジョイン処理を示す図、第５図は各ｃｐｕのジョイ
ン処理を示す図、第６図は部品表を示す図、第７図はメ
ーカ表を示す図、第８図はジョイン結果表を示す図、第
９図は従来のジョイン処理方式を示す図、第１０図はソ
ート済部品表を示す図である。１は共通記憶装置、３は第１ｃｐｕ、４は第２ｃｐｕ、
５は第３ｃｐｕ、５は第４　Ｃｐ　ｕ、　７は第１０−
カルメモリ、８は第２０−カルメモリ、９は第３０−カ
ルメモリ、ｌＯは第４０−カルメモリ、１１〜１４は部
分部品表、１５はメーカ表、１６〜１９は部分ジョイン
結果表、２０は部品表。なお図中、同一符号は同一、又は相当部分を示す。代理人　　大　　岩　　増　　ｍ＜ほか２名）第７０第９図第８図創○図手続補正書（自発昭和　　年　　月　　日２、発明の名称ジツイン処理方式３、補正をする者代表者志岐守哉４、代理人ｉ、補正の対象発明の詳細な説明の欄。３、補正の内容＋１１明細書第４頁第６行目「共通記憶装置」とあ５の
を「記憶装置」と補正する。以上

Claims

【特許請求の範囲】各々ローカルメモリを持った複数個のプロセッサとこれ
ら複数個のプロセッサからアクセス可能な共通記憶装置
とを有し、２つの表をある項目で結び付けて新しい表を
作り出すジョイン処理方式において、ジョインを行う第１の表のデータを上記各ローカルメモ
リに分散して配置し、ジョインを行う第２の表のデータ
を上記各ローカルメモリに重複して配置し、上記プロセ
ッサが上記第１の表の部分レコードと第２の表のレコー
ドとをそれぞれ１対１に比較し、結合条件がとれたペア
を順次共通記憶装置の所定領域にストアしていくことに
より、最終的に共通記憶装置上にジョイン処理された新
しい表を作り出すようにしたことを特徴とするジョイン
処理方式。