JP4832952B2 - データベース解析システム及びデータベース解析方法及びプログラム - Google Patents
データベース解析システム及びデータベース解析方法及びプログラム Download PDFInfo
- Publication number
- JP4832952B2 JP4832952B2 JP2006131629A JP2006131629A JP4832952B2 JP 4832952 B2 JP4832952 B2 JP 4832952B2 JP 2006131629 A JP2006131629 A JP 2006131629A JP 2006131629 A JP2006131629 A JP 2006131629A JP 4832952 B2 JP4832952 B2 JP 4832952B2
- Authority
- JP
- Japan
- Prior art keywords
- database
- data item
- correlation
- common attribute
- attribute data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
具体的には、ユーザがテーブル情報を与える必要なく、よく使用される1つ以上のキー項目に関する情報を与えるだけで、データベースシステム統合のための同一項目候補を知ることができる機構を実現することを主な目的とする。
それぞれに複数のデータ項目が含まれる第1のデータベース及び第2のデータベースに対する解析を行うデータベース解析システムであって、
第1のデータベースに含まれる複数のデータ項目及び第2のデータベースに含まれる複数のデータ項目のうち第1のデータベース及び第2のデータベース間で項目属性が共通する一部のデータ項目を共通属性データ項目として示す共通属性データ項目情報を入力する共通属性データ項目情報入力部と、
共通属性データ項目情報入力部により入力された共通属性データ項目情報と第1のデータベースのアクセスログとを用いて、第1のデータベースの共通属性データ項目と第1のデータベースの共通属性データ項目以外のデータ項目の各々との相関関係を解析し、各データ項目の共通属性データ項目に対する相関値を示す第1の相関情報を生成する第1のデータベース相関解析部と、
共通属性データ項目情報入力部により入力された共通属性データ項目情報と第2のデータベースのアクセスログとを用いて、第2のデータベースの共通属性データ項目と第2のデータベースの共通属性データ項目以外のデータ項目の各々との相関関係を解析し、各データ項目の共通属性データ項目に対する相関値を示す第2の相関情報を生成する第2のデータベース相関解析部と、
第1の相関情報に示された各データ項目の共通属性データ項目に対する相関値と、第2の相関情報に示された各データ項目の共通属性データ項目に対する相関値とに基づき、第1のデータベースの共通属性データ項目以外のデータ項目及び第2のデータベースの共通属性データ項目以外のデータ項目から第1のデータベース及び第2のデータベース間で項目属性が共通するデータ項目の候補を共通属性データ項目候補として抽出する共通属性データ項目候補抽出部とを有することを特徴とする。
図1は、本実施の形態に係るデータベース解析システム100の構成例を示す図である。
図1において、本実施の形態に係るデータベース解析システム100は、A社システム1、B社システム2、及び同一項目候補抽出・表示システム14に大別することができる。
ユーザ付加情報8はA社システム1とB社システム2のそれぞれのデータベースシステムにおける共通項目を示す情報である。つまり、ユーザ付加情報8は、A社システムのデータベース(第1のデータベース)に含まれる複数のデータ項目及びB社システムのデータベース(第2のデータベース)に含まれる複数のデータ項目のうち両データベース間で項目属性が共通する一部の共通項目(共通属性データ項目)を示す情報であり、共通属性データ項目情報の例である。
そして、A社システム1、B社システム2ともに、ユーザ付加情報8を入力するためのユーザ付加情報入力部12(共通属性データ項目情報入力部)を備える。
アクセスログ3は、各システムにおける業務アプリケーション実行時のデータベースアクセスログである。A社システムのアクセスログ3は第1のデータベースのアクセスログの例であり、B社システムのアクセスログ3は第2のデータベースのアクセスログの例である。
アクセスログ処理部4はアクセスログ3から解析に必要な情報を抽出する処理部である。
解析用DB(データベース)5はアクセスログ処理部4にて生成された解析用データベース群である。
相関関係抽出部6は解析用DB5とユーザ付加情報8で指定された情報から相関関係を求める処理部である。
項目の相関情報7は相関関係抽出部6で得られた相関情報である。
本実施の形態において、アクセスログ処理部4、解析用DB5、相関関係抽出部6は、データベース相関解析部を構成し、A社システムのアクセスログ処理部4、解析用DB5、相関関係抽出部6は、第1のデータベース相関解析部を構成し、B社システムのアクセスログ処理部4、解析用DB5、相関関係抽出部6は、第2のデータベース相関解析部を構成する。
これら、アクセスログ処理部4、解析用DB5、相関関係抽出部6は、それぞれのシステムのデータベースにおけるデータ項目を示したデータ項目情報13と、ユーザ付加情報8と、それぞれのデータベースのアクセスログ3とを用いて、それぞれのデータベースにおける共通項目と共通項目以外のデータ項目の各々との相関関係を解析し、各データ項目の共通項目に対する相関値を示す相関情報7を生成する。
なお、A社システムの相関関係抽出部6により出力される相関情報7は第1の相関情報の例であり、B社システムの相関関係抽出部6により出力される相関情報7は第2の相関情報の例である。
同一項目候補抽出部9は、A社システムの相関情報7に示された各データ項目の共通項目に対する相関値と、B社システムの相関情報7に示された各データ項目の共通項目に対する相関値とに基づき、両データベース間で項目属性が共通する可能性の高い同一項目候補(共通属性データ項目候補)を抽出し、同一項目候補表示部11が表示する。同一項目候補抽出部9は、共通属性データ項目候補抽出部の例である。
最初に、A社システム1及びB社システム2の各々において、ユーザ付加情報入力部12が両社のデータベース間で項目属性が共通することが既知である共通項目が示されているユーザ付加情報8を入力する(S1601)。詳細は、後述するが、ユーザ付加情報8は、例えば、図3に示すように、既知の共通項目が示される。
次に、アクセスログ処理部4がアクセスログ3内のSQL文を解析する(S1602)(第1のデータベース相関解析ステップ)(第2のデータベース相関解析ステップ)。詳細は、後述するが、アクセスログ3は図2に示すように、それぞれのデータベースに対してアクセスした際のSQL文が記録されており、SQL文に含まれるデータ項目の出現回数等を解析する。
次に、相関関係抽出部6がアクセスログ処理部4の解析結果、ユーザ付加情報8等を用いて、それぞれのシステムのデータベースにおける共通項目とその他の項目との相関関係を項目ごとに解析し、各項目の共通項目に対する相関値を示す相関情報7を生成する(S1603)(第1のデータベース相関解析ステップ)(第2のデータベース相関解析ステップ)。以上のS1601〜S1603は、A社システム1、B社システム2の各々において実施される。
次に、同一項目候補抽出・表示システム14において、同一項目候補抽出部9が、A社システム1からの相関情報7及びB社システム2からの相関情報7の相関値から類似度値を算出し、算出した類似度値に従ってA社システムのデータベースとB社システムのデータベースとの間で項目属性が共通する可能性が高い同一項目候補を抽出し(S1604)(共通属性データ項目候補抽出ステップ)、同一項目候補表示部11が同一項目候補を表示する(S1605)。
これにより、複数のデータベース間で同一項目の可能性が高い同一候補項目を抽出してデータベース統合時の効率を向上させる。
図17において、データベース解析システム100、A社システム1、B社システム2、同一項目候補抽出・表示システム14は、プログラムを実行するCPU911(Central Processing Unit、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサともいう)を備えている。CPU911は、バス912を介して、例えば、ROM(Read Only Memory)913、RAM(Random Access Memory)914、通信ボード915、表示装置901、キーボード902、マウス903、磁気ディスク装置920と接続され、これらのハードウェアデバイスを制御する。更に、CPU911は、FDD904(Flexible Disk Drive)、コンパクトディスク装置905(CDD)、プリンタ装置906、スキャナ装置907と接続していてもよい。また、磁気ディスク装置920の代わりに、光ディスク装置、メモリカード読み書き装置などの記憶装置でもよい。
RAM914は、揮発性メモリの一例である。ROM913、FDD904、CDD905、磁気ディスク装置920の記憶媒体は、不揮発性メモリの一例である。これらは、記憶装置あるいは記憶部の一例である。
通信ボード915、キーボード902、スキャナ装置907、FDD904などは、入力部、入力装置の一例である。
また、通信ボード915、表示装置901、プリンタ装置906などは、出力部、出力装置の一例である。
磁気ディスク装置920には、オペレーティングシステム921(OS)、ウィンドウシステム922、プログラム群923、ファイル群924が記憶されている。プログラム群923のプログラムは、CPU911、オペレーティングシステム921、ウィンドウシステム922により実行される。
ファイル群924には、以下に述べる説明において、「〜の判定結果」、「〜の計算結果」、「〜の処理結果」、「〜の評価結果」等として説明している情報やデータや信号値や変数値やパラメータが、「〜ファイル」や「〜データベース」の各項目として記憶されている。「〜ファイル」や「〜データベース」は、ディスクやメモリなどの記録媒体に記憶される。ディスクやメモリになどの記憶媒体に記憶された情報やデータや信号値や変数値やパラメータは、読み書き回路を介してCPU911によりメインメモリやキャッシュメモリに読み出され、抽出・検索・参照・比較・演算・計算・処理・編集・出力・印刷・表示などのCPUの動作に用いられる。抽出・検索・参照・比較・演算・計算・処理・編集・出力・印刷・表示のCPUの動作の間、情報やデータや信号値や変数値やパラメータは、メインメモリ、レジスタ、キャッシュメモリ、バッファメモリ等に一時的に記憶される。
また、以下で説明するフローチャートの矢印の部分は主としてデータや信号の入出力を示し、データや信号値は、RAM914のメモリ、FDD904のフレキシブルディスク、CDD905のコンパクトディスク、磁気ディスク装置920の磁気ディスク、その他光ディスク、ミニディスク、DVD等の記録媒体に記録される。また、データや信号は、バス912や信号線やケーブルその他の伝送媒体によりオンライン伝送される。
まず、A社システム1とB社システム2のそれぞれにおいて、アクセスログ3を採取する。これは業務アプリケーションがデータベースシステムにアクセスしたSQL文を一定期間採取したものである。データベースシステムが提供する採取ツールや市販のツール、あるいはOSに付属のツールを使用するなど手段は問わない。
業務アプリケーションのアクセスログの例を図2に示す。
21はファイルフォーマットを表しており、22がアクセスログである。各行は、アクセスログの情報を識別するための行ID23と業務アプリケーションから使用されたSQL文の情報24から成り立っている。また、SQL文は抽出、削除、挿入、更新に関する命令を対象とする。
図3に示すように、A社データベース31とB社データベース32が存在する場合に、両社の共通項目情報を33のように意味とそれに対応するA社システムにおける項目名、B社システムにおける項目名を指定するものである。ユーザ付加情報8の指定方式については、GUI(Graphical User Interface)による入力やファイル指定など方式は問わない。
まず、S41〜S44の処理にて図5に示す項目情報テーブル50を作成する。
図5に示す解析用データベース50はアクセスログに存在する全ての項目情報について、項目ID51と項目名52を対応づけるもので、A社データベース31、B社データベース32のそれぞれに対して存在するものである。また、例えば33で指定したA.A1とB.B3、B.B1とC.C1のように同じ意味を表すものは複数の項目名と一つの項目IDを対応させる。
S41にてアクセスログを1行づつ読み込み、S42で、読み込んだアクセスログ情報に含まれる項目情報の全てについて項目情報テーブルに登録済であるかどうかを見て、登録されていない場合には、S43で、項目情報テーブルに登録する。このとき、ユーザ付加情報8に示された共通項目情報33を参照して情報を反映する。このような操作をファイルの最後の行まで繰り返す。S44でファイルの最後までチェックしたら、項目情報テーブル50は完成する。
続けてS45でファイルのカーソルを先頭行に戻し、S46〜S49で図6に示す解析用DB_I60及び図7に示す解析用DB_II70を作成する。
S48にて条件句以降即ちWHERE以降の文に対して、指定されている全ての項目名を取り出し、解析用DB_II70のフォーマットに従い、行ID23、DML種別61、項目情報72の情報を作成して、解析用DB_II70に追加する。項目情報72については、各項目IDについて対応する項目の指定があった場合にTrue、なかった場合にFalseを設定する。またWHEREの指定がない場合は、項目情報72の全ての項目IDについてFalseを設定する。例えば、図2の1行目では、WHEREの後にA2が示されており、これを反映させて、図7では、項目2がTrueとなっており、これ以外の項目はFalseとなっている。
ユーザ付加情報8で指定された情報33について、S81にて項目名一覧を整理する。
33の例をA社データベースについて整理すると、1番=A.A1、2番=A.A4、3番=B.B1、4番=C.C2となる。
1番目から4番目のデータについてS82からS85の処理を行う。例えば1番目であるA.A1に対して、S82では解析用DB_I60のデータを使用して、A.A1をターゲットとして、その他全ての項目IDを入力として、S83にて相関分析を行ってその結果をファイルに出力する。
S84にて解析対象を解析用DB_II70に切り替えたり、DML種別61に対する条件を指定するなど分析時の条件を変更し、S83にて相関分析を行い、相関結果をファイルに出力する。全ての条件に対して相関分析を行ったらS85にて結果をまとめて、例えば図9の表90のような形式でまとめる。このような処理をS81で整理した全ての項目について行い、項目の相関情報7としてファイル出力する。
図9において、相関情報7のA.A4の相関結果91、B.B1の相関結果92、C.C2の相関結果93は詳細は示していないが、A.A1の相関結果90と同様な構成となる。また、システムBの相関情報においても同様に、X.X5の相関結果95、Y.Y1の相関結果96、Z.Z3の相関結果97は、X.X1の相関結果94と同様な構成となる。
例えば相関結果表90と相関結果表94において、S84で3つの条件を指定したならば、ケース1からケース3のそれぞれのケースにおける相関係数の単純和を各項目について求めて、図10の102、104のような表にまとめる。また、それぞれのケースにおいて、2つの項目間で同時に相関があるとみなされた回数を集計したものを図10の103、105のような表にまとめる。
例えば相関結果90のケース1においては、A.A1に対してA.A2、A.A4、B.B2、B.B5、C.C2が同時に相関ありとみなされたため、A.A2とA.A4、A.A2とB.B2、A.A2とB.B5、A.A2とC.C2、A.A4とB.B2、A.A4とB.B5、A.A4とC.C2、B.B2とB.B5、B.B2とC.C2、B.B5とC.C2でそれぞれ1回づつカウントする。S84で3つの条件を指定した場合は最大値が3となる。相関結果表91〜93及び95〜97についても同様な計算を行い、106〜117のように求める。システムAについての結果が100、システムBについての結果が101である。
相関詳細情報の例を図11に示す。
118はA社システムの相関詳細情報の例であり、縦軸がA社データベース31の項目名からユーザ付加情報33で指定した項目を除いた各項目、横軸がユーザ付加情報33で指定した各項目になっており、図3の33の場合だと横軸に4項目となる。相関関係を調べた際に有効な情報が得られた場合は、相関詳細情報テーブル119のID番号が格納されている。相関詳細情報テーブル119は、図10の情報をまとめたものであり、識別するためのID番号と相関情報を調べた項目名、相関係数単純和、順位、回数、同時項目指定情報を含むものである。B社データベース32の各項目についても、同様に相関詳細情報118と相関詳細情報テーブル119を作成する。
この例を図12に示す。120がA社データベース31に関する相関結果点数化テーブル、121がB社データベース32に関する相関結果点数化テーブルの一例である。
1)図11のテーブル119について、同一「項目名」(例えばA.A1)について、相関係数単純和、順位、回数の偏差値をそれぞれ求める。図11の例では、ID=1〜ID=4の4行のデータ間において、ID=5〜ID=9の5行のデータ間において、ID=10〜ID=13の4行のデータ間において、ID=14〜ID=19の6行のデータ間において、それぞれ偏差値化する。順位については逆順(降順)に変換してから偏差値を求める。これでIDごとに3種の偏差値が得られる。
2)各IDにおいて3種の偏差値合計を求める。
3)「項目名」ごとに相関係数単純和の合計値「相関係数単純和_項目名」と全ての「相関係数単純和_項目名」の平均値を求める。
4)上記2)で求めた3種の偏差値(相関係数単純和、順位、回数)の合計値に上記3)で求めた「相関係数単純和_項目名」÷「相関係数単純和_項目名」をかけ合わせたものを端数処理して5点きざみの点数としたものを図12のテーブル120のような形式にまとめる。
なお、図12のテーブル120及びテーブル121は、点数化計算の結果のイメージを示すものであり、図11の数値から上記の計算を行った結果を示しているものではない。
例えば、図12のテーブル120及びテーブル121から類似度値を計算し、図12のテーブル123のように同一項目候補と類似値(得点)を示す。
1)図12のテーブル120、テーブル121の各列が共通項目情報33より同じ項目と判断できるため、そこに注目した処理を行う。テーブル120の各行(A社システムの各項目)について、各列の点数配分の割合(%)と順位を求める。点数のない列について順位は“−”(該当なし)とする。1つ以上の列に点数が入っている行について、以下の2)以降の処理を行う。全ての列に点数が入っていない行については、類似情報を得ることができないため、スキップして次の行の処理に移る。
2)テーブル121の行について、1つ以上の列に点数がある場合は、各列の点数配分の割合(%)と順位を上記1)と同様に求めて、テーブル120の行の情報と比較することで、システムAの該当項目とシステムBの該当項目の類似度を算出する。各列について順位が一致した場合に10点(“−”(該当なし)で一致した場合は0点)、割合が±5%以内で一致した場合に10点(0%で一致した場合は0点)、各列の点数が±5点以内で一致した場合に10点(“−”(該当なし)で一致した場合は5点、双方が150点以上の場合はさらに10点プラス)を追加する。
3)テーブル120の各行に対して、テーブル121の全ての行に対する上記2)の操作を行うことで、全ての組み合わせの類似度値を算出して、図12のテーブル123のようにまとめる。
なお、図12のテーブル123は、同一項目候補及び類似度値の表示イメージを示すものであり、テーブル120及びテーブル121数値から上記の計算を行った結果を示しているものではない。
より具体的には、相関解析部は、アクセスログに示されたデータベースへのSQL文に記述されているデータ項目を参照し、共通項目と同じSQL文に記述されている共通項目以外のデータ項目を解析して、共通項目と共通項目以外のデータ項目の各々との相関関係を解析する。
以上の実施の形態1では、相関分析を行う際に異なる条件を指定することで複数のケースでの相関分析結果を得ることができるようにしたものであるが、次に、相関分析結果から同一項目を算出する際に相関分析結果の情報の要素が選択できる実施の形態を示す。
図11の相関詳細情報テーブル119には、相関項目単純和、順位、回数、同時項目指定情報が含まれている。図13の要素指定テーブル130では、相関詳細情報テーブル119の横軸に示される相関分析結果の要素となる項目一覧に対する使用有無を指定するものとなっている。使用する項目に○、使用しない項目に×を指定する。
例えば、図13のように「相関単純総和」と「回数」を使用、「順位」と「同時項目指定情報」を使用しないと指定した場合には、図12に示す相関結果点数化テーブル作成時に段階において「相関単純総和」と「回数」の項目情報のみを使用して点数を算出する。
以上の実施の形態では、A社システム、B社システムと2つの異なるシステムの統合時のデータベースの同一項目候補を求めて表示するものであるが、表示方法について、同一項目一覧表示、A社システム形式に基づいた表示形式、B社システム形式に基づいた表示形式と切り替えることのできる実施の形態を示す。
140では、得点の高い順、即ち同一項目候補として可能性の高い順に表示しているものであり、同一項目候補としてのくらいの項目がどの程度の可能性で示されているかを知る場合に有効である。
テーブル141及びテーブル142では、各データベースシステムの形式に基づいて表示されていて、各データベースの項目仕様書などを参照しながら調査する際に、テーブル数や項目数が多い場合に、対応する項目を探す手間を必要とせずに調査・確認を行うことができる。
以上の実施の形態3では、A社システム、B社システムと2つの異なるシステムの統合時のデータベースの同一項目候補を求めて表示する場合に、同一項目一覧表示、A社システム形式に基づいた表示形式、B社システム形式に基づいた表示形式と切り替えて表示することを可能としたものであるが、それぞれの方式で表示する際に、一定得点以上のものをわかりやすく表示することのできる実施の形態を示す。
この他に別色表示にするなど別名表示方式にしたり、基準値を70点以上、50点以上と順次切り替えて表示することで同一項目候補の傾向を知ることも可能である。
Claims (12)
- それぞれに複数のデータ項目が含まれる第1のデータベース及び第2のデータベースに対する解析を行うデータベース解析システムであって、
第1のデータベースに含まれる複数のデータ項目及び第2のデータベースに含まれる複数のデータ項目のうち第1のデータベース及び第2のデータベース間で項目属性が共通する一部のデータ項目を共通属性データ項目として示す共通属性データ項目情報を入力する共通属性データ項目情報入力部と、
共通属性データ項目情報入力部により入力された共通属性データ項目情報と第1のデータベースのアクセスログとを用いて、第1のデータベースの共通属性データ項目と第1のデータベースの共通属性データ項目以外のデータ項目の各々との相関関係を解析し、各データ項目の共通属性データ項目に対する相関値を示す第1の相関情報を生成する第1のデータベース相関解析部と、
共通属性データ項目情報入力部により入力された共通属性データ項目情報と第2のデータベースのアクセスログとを用いて、第2のデータベースの共通属性データ項目と第2のデータベースの共通属性データ項目以外のデータ項目の各々との相関関係を解析し、各データ項目の共通属性データ項目に対する相関値を示す第2の相関情報を生成する第2のデータベース相関解析部と、
第1の相関情報に示された各データ項目の共通属性データ項目に対する相関値と、第2の相関情報に示された各データ項目の共通属性データ項目に対する相関値とに基づき、第1のデータベースの共通属性データ項目以外のデータ項目及び第2のデータベースの共通属性データ項目以外のデータ項目から第1のデータベース及び第2のデータベース間で項目属性が共通するデータ項目の候補を共通属性データ項目候補として抽出する共通属性データ項目候補抽出部とを有することを特徴とするデータベース解析システム。 - 前記第1データベース相関解析部は、
第1のデータベースのアクセスログに示された第1のデータベースへのアクセスに用いられたデータ項目を参照し、第1のデータベースの共通属性データ項目とともに第1のデータベースへのアクセスに用いられた第1のデータベースの共通属性データ項目以外のデータ項目を解析して、第1のデータベースの共通属性データ項目と第1のデータベースの共通属性データ項目以外のデータ項目の各々との相関関係を解析し、
前記第2データベース相関解析部は、
第2のデータベースのアクセスログに示された第2のデータベースへのアクセスに用いられたデータ項目を参照し、第2のデータベースの共通属性データ項目とともに第2のデータベースへのアクセスに用いられた第2のデータベースの共通属性データ項目以外のデータ項目を解析して、第2のデータベースの共通属性データ項目と第2のデータベースの共通属性データ項目以外のデータ項目の各々との相関関係を解析することを特徴とする請求項1に記載のデータベース解析システム。 - 前記第1データベース相関解析部は、
第1のデータベースのアクセスログに示された第1のデータベースへのSQL文に記述されているデータ項目を参照し、第1のデータベースの共通属性データ項目と同じSQL文に記述されている第1のデータベースの共通属性データ項目以外のデータ項目を解析して、第1のデータベースの共通属性データ項目と第1のデータベースの共通属性データ項目以外のデータ項目の各々との相関関係を解析し、
前記第2データベース相関解析部は、
第2のデータベースのアクセスログに示された第2のデータベースへのSQL文に記述されているデータ項目を参照し、第2のデータベースの共通属性データ項目と同じSQL文に記述されている第2のデータベースの共通属性データ項目以外のデータ項目を解析して、第2のデータベースの共通属性データ項目と第2のデータベースの共通属性データ項目以外のデータ項目の各々との相関関係を解析することを特徴とする請求項2に記載のデータベース解析システム。 - 前記第1のデータベース相関解析部は、
各データ項目の共通属性データ項目に対する相関値を複数算出し、算出した複数の相関値を示す第1の相関情報を生成し、
前記第2のデータベース相関解析部は、
各データ項目の共通属性データ項目に対する相関値を複数算出し、算出した複数の相関値を示す第2の相関情報を生成し、
前記共通属性データ項目候補抽出部は、
第1の相関情報に示された各データ項目の共通属性データ項目に対する複数の相関値と、第2の相関情報に示された各データ項目の共通属性データ項目に対する複数の相関値とに基づき、共通属性データ項目候補を抽出することを特徴とする請求項1の記載のデータベース解析システム。 - 前記データベース解析システムは、更に、
前記共通属性データ項目候補抽出部により抽出された共通属性データ項目候補を表示する表示部を有することを特徴とする請求項1に記載のデータベース解析システム。 - 前記共通属性データ項目候補抽出部は、
第1の相関情報に示された各データ項目の共通属性データ項目に対する相関値と、第2の相関情報に示された各データ項目の共通属性データ項目に対する相関値とに基づき、第1のデータベースの共通属性データ項目以外のデータ項目及び第2のデータベースの共通属性データ項目以外のデータ項目においてデータ項目間の類似度値を算出し、算出した類似度値に基づいて共通属性データ項目候補を抽出することを特徴とする請求項1に記載のデータベース解析システム。 - 前記データベース解析システムは、更に、
前記共通属性データ項目候補抽出部により抽出された共通属性データ項目候補と、前記共通属性データ項目候補抽出部により算出された共通属性データ項目候補の類似度値とを表示する表示部を有することを特徴とする請求項6に記載のデータベース解析システム。 - 前記データベース解析システムは、更に、
第1の相関情報及び第2の相関情報に示される複数の相関値のうち前記共通属性データ項目候補抽出部における共通属性データ項目候補の抽出に用いる相関値を指定する相関値指定情報を入力する相関値指定情報入力部を有し、
前記共通属性データ項目候補抽出部は、
第1の相関情報及び第2の相関情報に示される複数の相関値のうち相関値指定情報により指定された相関値に基づき、共通属性データ項目候補を抽出することを特徴とする請求項4の記載のデータベース解析システム。 - 前記表示部は、
第1のデータベースに合わせた表示形式及び第2のデータベースに合わせた表示形式のいずれかを選択して共通属性データ項目候補を表示することを特徴とする請求項5に記載のデータベース解析システム。 - 前記表示部は、
一定値以上の類似度値の共通属性データ項目候補を強調表示することを特徴とする請求項6に記載のデータベース解析システム。 - それぞれに複数のデータ項目が含まれる第1のデータベース及び第2のデータベースに対する解析を行うデータベース解析方法であって、
第1のデータベースに含まれる複数のデータ項目及び第2のデータベースに含まれる複数のデータ項目のうち第1のデータベース及び第2のデータベース間で項目属性が共通する一部のデータ項目を共通属性データ項目として示す共通属性データ項目情報を入力する共通属性データ項目情報入力ステップと、
共通属性データ項目情報入力ステップにより入力された共通属性データ項目情報と第1のデータベースのアクセスログとを用いて、第1のデータベースの共通属性データ項目と第1のデータベースの共通属性データ項目以外のデータ項目の各々との相関関係を解析し、各データ項目の共通属性データ項目に対する相関値を示す第1の相関情報を生成する第1のデータベース相関解析ステップと、
共通属性データ項目情報入力ステップにより入力された共通属性データ項目情報と第2のデータベースのアクセスログとを用いて、第2のデータベースの共通属性データ項目と第2のデータベースの共通属性データ項目以外のデータ項目の各々との相関関係を解析し、各データ項目の共通属性データ項目に対する相関値を示す第2の相関情報を生成する第2のデータベース相関解析ステップと、
第1の相関情報に示された各データ項目の共通属性データ項目に対する相関値と、第2の相関情報に示された各データ項目の共通属性データ項目に対する相関値とに基づき、第1のデータベースの共通属性データ項目以外のデータ項目及び第2のデータベースの共通属性データ項目以外のデータ項目から第1のデータベース及び第2のデータベース間で項目属性が共通するデータ項目の候補を共通属性データ項目候補として抽出する共通属性データ項目候補抽出ステップとを有することを特徴とするデータベース解析方法。 - それぞれに複数のデータ項目が含まれる第1のデータベース及び第2のデータベースに対する解析を行うコンピュータに、
第1のデータベースに含まれる複数のデータ項目及び第2のデータベースに含まれる複数のデータ項目のうち第1のデータベース及び第2のデータベース間で項目属性が共通する一部のデータ項目を共通属性データ項目として示す共通属性データ項目情報を入力する共通属性データ項目情報入力処理と、
共通属性データ項目情報入力処理により入力された共通属性データ項目情報と第1のデータベースのアクセスログとを用いて、第1のデータベースの共通属性データ項目と第1のデータベースの共通属性データ項目以外のデータ項目の各々との相関関係を解析し、各データ項目の共通属性データ項目に対する相関値を示す第1の相関情報を生成する第1のデータベース相関解析処理と、
共通属性データ項目情報入力処理により入力された共通属性データ項目情報と第2のデータベースのアクセスログとを用いて、第2のデータベースの共通属性データ項目と第2のデータベースの共通属性データ項目以外のデータ項目の各々との相関関係を解析し、各データ項目の共通属性データ項目に対する相関値を示す第2の相関情報を生成する第2のデータベース相関解析処理と、
第1の相関情報に示された各データ項目の共通属性データ項目に対する相関値と、第2の相関情報に示された各データ項目の共通属性データ項目に対する相関値とに基づき、第1のデータベースの共通属性データ項目以外のデータ項目及び第2のデータベースの共通属性データ項目以外のデータ項目から第1のデータベース及び第2のデータベース間で項目属性が共通するデータ項目の候補を共通属性データ項目候補として抽出する共通属性データ項目候補抽出処理とを実行させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006131629A JP4832952B2 (ja) | 2006-05-10 | 2006-05-10 | データベース解析システム及びデータベース解析方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006131629A JP4832952B2 (ja) | 2006-05-10 | 2006-05-10 | データベース解析システム及びデータベース解析方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007304796A JP2007304796A (ja) | 2007-11-22 |
JP4832952B2 true JP4832952B2 (ja) | 2011-12-07 |
Family
ID=38838675
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006131629A Active JP4832952B2 (ja) | 2006-05-10 | 2006-05-10 | データベース解析システム及びデータベース解析方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4832952B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4741689B2 (ja) * | 2009-03-11 | 2011-08-03 | 株式会社日立製作所 | データ処理方法、データ処理装置およびデータ処理プログラム |
JP5515784B2 (ja) | 2010-01-27 | 2014-06-11 | 富士通株式会社 | 類似度算出プログラムおよび類似度算出装置 |
JP5526900B2 (ja) | 2010-03-19 | 2014-06-18 | 富士通株式会社 | 管理装置、修正候補出力方法および修正候補出力プログラム |
JP5506527B2 (ja) * | 2010-04-26 | 2014-05-28 | 三菱電機株式会社 | 同義カラム検出装置及び同義カラム検出方法 |
JP2011248661A (ja) * | 2010-05-27 | 2011-12-08 | Sharp Corp | データベース制御装置、データベース制御方法、プログラム及び記録媒体 |
JP5848597B2 (ja) | 2011-12-21 | 2016-01-27 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | Cmdbを利用したソフトウェア構成値の最適化方法、装置、システムおよびプログラム |
JP6782219B2 (ja) * | 2017-11-29 | 2020-11-11 | 株式会社日立製作所 | データ活用支援装置、データ活用支援システム、及びデータ活用支援方法 |
KR102052694B1 (ko) * | 2017-12-11 | 2019-12-05 | 주식회사 핀인사이트 | 데이터 그룹의 결합을 통한 데이터 분석 방법, 장치 및 컴퓨터 판독가능 매체 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3558032B2 (ja) * | 2000-11-09 | 2004-08-25 | 日本電信電話株式会社 | 統合検索方法及び装置及び統合検索プログラムを格納した記憶媒体 |
JP2003271656A (ja) * | 2002-03-19 | 2003-09-26 | Fujitsu Ltd | 関係付候補生成装置,関係付候補生成方法,関係付システム,関係付候補生成プログラムおよび同プログラムを記録したコンピュータ読取可能な記録媒体 |
JP2004013403A (ja) * | 2002-06-05 | 2004-01-15 | Ntt Data Corp | 顧客属性判定サーバおよびプログラム |
JP4471736B2 (ja) * | 2004-06-01 | 2010-06-02 | 株式会社エヌ・ティ・ティ・データ | 類似症例検索システム及びプログラム |
-
2006
- 2006-05-10 JP JP2006131629A patent/JP4832952B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2007304796A (ja) | 2007-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4832952B2 (ja) | データベース解析システム及びデータベース解析方法及びプログラム | |
JP5316158B2 (ja) | 情報処理装置、全文検索方法、全文検索プログラム、及び記録媒体 | |
US8019761B2 (en) | Recording medium storing a design support program, design support method, and design support apparatus | |
JP4997966B2 (ja) | 対訳例文検索プログラム、対訳例文検索装置、および対訳例文検索方法 | |
US20040230570A1 (en) | Search processing method and apparatus | |
JP5315368B2 (ja) | 文書処理装置 | |
JPH1074210A (ja) | 文献検索支援方法及び装置およびこれを用いた文献検索サービス | |
JP5023176B2 (ja) | 特徴語抽出装置及びプログラム | |
EP1315103A1 (en) | File search method and apparatus, and index file creation method and device | |
JP4631795B2 (ja) | 情報検索支援システム、情報検索支援方法および情報検索支援プログラム | |
JP5398663B2 (ja) | データ処理装置及びデータ処理方法及びプログラム | |
JP2006323517A (ja) | テキスト分類装置およびプログラム | |
JP3784060B2 (ja) | データベース検索システム、その検索方法及びプログラム | |
JP2010272006A (ja) | 関係抽出装置、関係抽出方法、及びプログラム | |
KR20060114569A (ko) | 특허정보시스템의 작동방법 | |
JP2009199576A (ja) | 文書解析支援装置、文書解析支援方法、プログラム及び記録媒体 | |
KR20230003184A (ko) | 정보 검색 시스템 | |
JP4980604B2 (ja) | 文書検索装置、文書検索方法、文書検索プログラム及び記録媒体 | |
JP4446715B2 (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP4432475B2 (ja) | 文書検索装置、文書検索方法、プログラム | |
JP5971069B2 (ja) | 情報処理装置、タイトル抽出方法及びプログラム | |
JP2008262324A (ja) | 情報処理装置及び情報処理方法及びプログラム | |
JP4750674B2 (ja) | データ表示制御プログラム、データ表示制御方法およびデータ表示制御装置 | |
WO2024047997A1 (ja) | 文書分析装置、及び文書分析用プログラム | |
JP5417359B2 (ja) | 文書評価支援システム、及び文書評価支援方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090406 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110825 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110920 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110921 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4832952 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140930 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |