JP2008262324A - 情報処理装置及び情報処理方法及びプログラム - Google Patents

情報処理装置及び情報処理方法及びプログラム Download PDF

Info

Publication number
JP2008262324A
JP2008262324A JP2007103586A JP2007103586A JP2008262324A JP 2008262324 A JP2008262324 A JP 2008262324A JP 2007103586 A JP2007103586 A JP 2007103586A JP 2007103586 A JP2007103586 A JP 2007103586A JP 2008262324 A JP2008262324 A JP 2008262324A
Authority
JP
Japan
Prior art keywords
character string
item
information
extraction
extraction target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007103586A
Other languages
English (en)
Inventor
Kaori Chichibu
かおり 秩父
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2007103586A priority Critical patent/JP2008262324A/ja
Publication of JP2008262324A publication Critical patent/JP2008262324A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】クエリ定義情報と検索用データを二重持ちせずに二重持ちした場合と同等の性能でフリーキーワードでのクエリ定義情報の検索を可能とする。
【解決手段】設計部11がクエリ定義情報を生成し、分割部12がクエリ定義情報に含まれる文字列を抽出して文字列情報21とし、文字列を抽出した箇所に、文字列IDを文字列の代わりにセットし、文字列IDがセットされたクエリ定義情報を文字列以外のクエリ定義情報22とし、キーワード検索部15が、ユーザからクエリ定義情報の検索のための検索キーワード3を取得し、当該検索キーワード3に合致する文字列情報21を検索することで、フリーキーワードでのクエリ定義情報の検索が可能となる。マージ部13は、データの集計検索のために、文字列IDを文字列情報21中の対応する文字列で置換し、文字列以外のクエリ定義情報22と文字列情報21とマージしてクエリ定義情報を再現する。
【選択図】図1

Description

本発明は、データベースに蓄積されたデータに対する集計検索を行うための技術に関する。
企業が扱うデータは近年益々大量となり、そのデータを経営に活かすためには、データベースへの蓄積後のデータ分析が必須である。
データを多角的に瞬時に集計検索して、表やグラフなどに視覚化するシステムがOLAP(On−line Analytical Processing)であり、情報システム部門ではなく、分析結果を必要としている部門が直接システムを操作して分析を行うものである。
そのため、OLAPツールの利用者は、データベースの集計検索及び結果表示を行うための情報(ここでは、これをクエリ定義情報と呼ぶ)を作成する設計ユーザ(情報システム部門など)と、既に作成、保存されたクエリ定義情報を利用して集計検索結果を取得する検索ユーザに分かれる。
両ユーザとも作成、保存されたクエリ定義情報を利用する場合、一覧から目的のクエリ定義情報を探すことになるが、特に、Web環境で利用するOLAPツールの場合はクエリ定義情報がWebサーバ上に置かれることが多いため、ユーザが簡単にOSに付属の検索機能でさがすことはできない。
また、クエリ定義情報は、集計検索に必要な情報が格納されているため、通常の文書ファイルなどのように一般の検索機能を利用すると、余計なクエリ定義情報がピックアップされることもある。
そこで一般にOLAPツールでは、目的とするクエリ定義情報を一覧から見つけやすくするために、クエリ定義情報名にわかりやすい名前を付けられるように名前サイズ制限を緩くしたり、コメント付加機能を提供したりしている。
しかし、この方法は設計ユーザの技量、付加作業を必要とする。
例えば、特許文献1に開示の技術では、システムにおいて検索機能を提供するために、クエリ定義情報本文に対応する帳票データと、予め設定した管理データ文章構造情報に基づいて、帳票データから抽出した検索用管理データを対応付けてデータベースで管理、検索する帳票データ文書管理技術が提案されている。
また、例えば、特許文献2に開示の技術では、ユーザ端末への電子帳票提供システムで、グループやユーザごとに帳票を表示させるために、帳票ID、グループID、ユーザID、資料年月日、表示属性などが格納されたインデックスファイルを用いて帳票を検索する方法が提案されている。
特開2002−73637号公報 特開2002−109456号公報 請求項4
従来の、帳票と、帳票から抽出した検索用データを対応付けてデータベースで管理、検索する帳票データ文書管理技術は、検索用データを帳票とは別に二重持ちするため、管理が複雑となり、格納領域も増大するという課題があった。
帳票の属性をインデックスファイルに格納し検索に利用する方法は、属性によって検索ユーザに見せる帳票一覧の表示を制御することはできるが、インデックスファイルには決まりきった項目しか格納されていないため、ユーザがフリーキーワードで帳票一覧を検索することはできないという課題があった。
この発明は、上記のような課題を解決することを主な目的の一つとしており、クエリ定義情報と検索用データを二重持ちせずに二重持ちした場合と同等の性能でフリーキーワードでのクエリ定義情報の検索を可能とし、二重持ちしないことで管理を容易にすることを主な目的とする。
本発明に係る情報処理装置は、
複数の項目を有する項目情報の項目ごとに、抽出対象の文字列が少なくとも一部に含まれる抽出対象項目、及び抽出対象の文字列が含まれない非抽出対象項目のいずれであるかを判定する項目判定部と、
前記抽出対象項目と判定された項目における抽出対象の文字列を前記項目情報から抽出し、抽出した文字列を示す文字列情報を生成するとともに、文字列抽出後の項目情報の文字列抽出箇所に、抽出された文字列を表象する文字列識別子を設定し、文字列に代えて文字列識別子が設定された抽出後項目情報を生成する文字列抽出部とを有することを特徴とする。
本発明によれば、項目情報に含まれる文字列を示す文字列情報を、項目情報とは別に持つが、抽出後項目情報には、文字列の代わりに文字列識別子が設定されているので、情報の二重持ちにならず、このため、情報の管理が容易となり、ハードウェア資源をより有効に活用できる。
また、文字列情報を項目情報から独立させて管理するので、文字列情報を用いたフリーキーワード検索により項目情報を効率的に検索することができる。
実施の形態1.
図1は、本実施の形態に係るOLAPツール装置1(情報処理装置)の構成例を示す図である。
図1において、OLAPツール装置1は、データベース4に接続されている。
OLAPツール装置1において、設計部11は、データベース4のデータの分析方法を設計する。つまり、設計部11は、クエリ定義情報を設計(生成)する。
情報分類部17は、クエリ定義情報の各項目をクエリ定義情報のキーワード検索に用いる文字列を含む項目とそれ以外の項目に分類する。
分割部12は、情報分類部17による分類に基づき、クエリ定義情報を文字列情報21と文字列以外のクエリ定義情報22に分割し、所定の記憶装置(不図示)に記憶させる。分割部12は、項目判定部及び文字列抽出部の例である。
なお、分割部12により分割された後の文字列情報21と文字列以外のクエリ定義情報22は分割後クエリ定義情報2の要素となる。
マージ部13は、文字列情報21と文字列以外のクエリ定義情報22からクエリ定義情報を組み立てる(クエリ定義情報を再現する)。
一覧出力部14は、マージ部13により組み立てられたクエリ定義情報の一覧を生成し、表示装置(不図示)に出力して、クエリ定義情報の一覧を表示させる。
キーワード検索部15は、ユーザからクエリ定義情報を検索するための検索キーワード3を取得し、当該検索キーワード3に合致するクエリ定義情報を検索する。
集計検索部16は、クエリ定義情報を用いてデータベースのデータを集計検索し結果表示する。
なお、図1はOLAPツール装置1がスタンドアロンのコンピュータに存在する形態であるが、設計部11がLAN(Local Area Network)等のネットワークで接続された別のコンピュータ上に存在してもよい。
また分割後クエリ定義情報2についても、OLAPツール装置1と同じコンピュータ上に格納してもよいし、別のコンピュータ、ストレージに格納されていてもよい。
また、設計部11、情報分類部17及び分割部12は、クエリ定義情報を作成する設計ユーザ(情報システム部門など)が利用する機能であり、マージ部13、一覧出力部14、キーワード検索部15及び集計検索部16は、既に作成、保存されたクエリ定義情報を利用して集計検索結果を取得する検索ユーザが利用する機能である。
このため、例えば、図7に示すように、設計部11、情報分類部17及び分割部12を備えるOLAPツール装置(設計ユーザ用)100と、マージ部13、一覧出力部14、キーワード検索部15及び集計検索部16を備えるOLAPツール装置(検索ユーザ用)101という形に分けて、それぞれを別のコンピュータで構成し、各コンピュータをLAN等のネットワークで接続するようにしてもよい。
本実施の形態では、OLAPツール装置1は、クエリ定義情報と検索用データを二重持ちせずに二重持ちした場合と同等の性能でフリーキーワードでのクエリ定義情報の検索を可能とする。
具体的には、設計部11がクエリ定義情報を生成し、分割部12がクエリ定義情報に含まれる文字列を取り出して文字列情報21とするとともに、文字列を取り出した箇所に、文字列を表象する文字列IDを文字列の代わりにセットし、文字列IDがセットされたクエリ定義情報を文字列以外のクエリ定義情報22とする。
また、キーワード検索部15は、ユーザからクエリ定義情報を検索するための検索キーワード3を取得し、当該検索キーワード3に合致する文字列が含まれる文字列情報21を検索することで、フリーキーワードでのクエリ定義情報の検索が可能となる。
また、クエリ定義情報の一覧表示を行う際や、クエリ定義情報を用いてデータベース4に対する集計検索を行う際には、マージ部13が、文字列以外のクエリ定義情報22の文字列IDを文字列情報21中の対応する文字列で置換し、文字列以外のクエリ定義情報22と文字列情報21とマージしてクエリ定義情報を再現する。
集計検索部16は、再現されたクエリ定義情報を用いて、データベース4の集計検索を行い、集計検索結果を表示する。
クエリ定義情報は、例えば、図2(a)及び(b)に示す情報である。
クエリ定義情報は、識別子の行と項目を羅列した行により構成され、項目を羅列した行は識別子により項目数や行数が異なり、内容も異なる。例えば識別子が次元軸や集計データを意味する場合、項目を羅列した行は、図2(b)のようになる。図2(b)の1行目は列次元の項目を展開した例であり、2行目は集計データを展開した例である。
つまり、図2(a)は、クエリ定義情報の全体像を示す図であり、図2(b)は、図2(a)の内訳を示す図である。
図2(b)の各項目には、データベースからデータの集計検索及び集計検索結果の表示を行うために必要なデータが示されている。
図2(b)の例では、項目タイプ、データの表示名、データ型、データの長さ、データベースでの名前等が示される。
このように、クエリ定義情報には、データベースに対する集計検索を実施するための管理情報、参照情報、検索文、集計情報等が含まれる。
また、集計検索部16は、クエリ定義情報に含まれる検索文からSQL文を作成することができ、データベース4の集計検索を実行することができる。
更に、集計検索部16の実行結果である集計データと、クエリ定義情報内の表示用の項目とを用いて、集計検索結果を表やグラフで表示することができる。
なお、クエリ定義情報は、項目情報の例である。
また、図2(c)及び図2(d)は、分割部12による分割後のクエリ定義情報の例を示しており、図2(d)が文字列情報21の例を示し、図2(c)が文字列以外のクエリ定義情報22の例を示す。
つまり、クエリ定義情報は、分割部12により、図2(c)の文字列以外のクエリ定義情報22と、図2(d)の文字列情報21に分割されて保存される。
文字列情報21は、キーワード検索部15による検索キーワード3となり得る文字列が示される情報である。また、文字列以外のクエリ定義情報22は、クエリ定義情報から文字列情報21に示される文字列が抽出された後の情報である。
本実施の形態では、文字列以外のクエリ定義情報22では、図2(c)に示すように、文字列が抽出された文字列抽出箇所に、抽出された文字列を表象する文字列識別子(<str 0>等)が設定される。
なお、文字列以外のクエリ定義情報22は、抽出後項目情報の例である。
次に、本実施の形態に係るOLAPツール装置1の動作を説明する。
まずOLAPツール装置1の設計部11でクエリ定義情報を作成する流れを説明する。
OLAPツール装置1の設計部11をユーザが実行し、データベースのデータの分析方法を設計する。すなわち、図2(a)に示すようなクエリ定義情報を生成する。
設計された情報は情報分類部17により分類し一時的に記憶させる。
分類について、図3を用いて説明する。
図3は、設計部11でのクエリ定義情報の保持例を示す。
分割部12による分割前では、クエリ定義情報では、図3に示すように項目をフラグと共に記憶させる。なお、図3は、図2(a)のクエリ定義情報にフラグが設定されている例である。クエリ定義情報の各項目に対するフラグの設定、すなわち、各項目の分類は、情報分類部17が行う。
フラグ「0」が集計検索だけに必要な項目、フラグ「1」が結果表示に用いる表示項目、フラグ「2」が集計検索に必要だが検索キーワードになり得る文字列を含んだ項目である。
例えば、データベースの列のデータ型や長さは「0」、クエリ定義情報名、作成者名や管理者名、コメント、次元軸名、軸アイテム、集計データ名は「1」、SQL文は「2」に分類される。
この分類は、「0」がそのまま文字列以外のクエリ定義情報22として保存する項目、「1」が文字列情報21として保存する項目、「2」がデータ中から文字列情報21として保存する内容を切り出す項目であることを意味し、次のステップである分割処理で使われる。
設計部11は、複数種類のクエリ定義情報を設計するが、情報分類部17は、設計部11において設計されたクエリ定義情報の種類に対応させて、クエリ定義情報の各項目を分類する(フラグを設定する)。
情報分類部17は、クエリ定義情報の識別子に基づいて、クエリ定義情報の各項目を分類する(フラグを設定する)。
なお、クエリ定義情報の項目のうち、フラグ「0」が設定されている項目は非抽出対象項目の例であり、フラグ「1」が設定されている項目は第一の抽出対象項目の例であり、フラグ「2」が設定されている項目は第二の抽出対象項目の例である。
設計部11による設計及び情報分類部17による項目の分類が終了すると、分割部12が呼ばれる。
分割部12の分割処理については、図2〜4を用いて説明する。
図4は、分割部12における分割処理(項目判定ステップ、文字列抽出ステップ)のフローチャートである。
まず、分割部12は、情報分類部17で記憶されたクエリ定義情報を取り込む(S10)。
分割部12は、クエリ定義情報の最初の項目から順に各項目についてS11以降の処理を行う。
分割部12は、S11で各項目のフラグを判別する。
そして、S11において、フラグが「0」であれば何もせず次の項目の処理に移る(S18)。
S11で、フラグが「1」の場合は、分割部12は、項目に示される文字列が文字列情報21に存在するか確認する(S12)。これは、同じ文字列を重複して格納しないための処理である。
S12で、項目に示される文字列が文字列情報21に存在しなければ、当該項目の文字列を文字列情報21に格納する(S13)。
次に、文字列情報21内のインデックスを文字列IDとして文字列の抽出箇所にセットする(S14)。つまり、文字列抽出箇所に、抽出した文字列を表象する文字列ID(文字列識別子)を設定する。
例えば、図2(b)の二番目の項目「年」は、フラグが「1」であり、このため、文字列情報21に格納される(図2(d))。そして、文字列「年」が抽出された箇所に代わりに文字列ID<str 0>がセットされる(図2(c))。なお、分割部12は、文字列と文字列IDとを対応付けるテーブルを用意し、文字列IDをセットする度に、新たにセットした文字列IDとその文字列との対応付けを当該テーブルに記録するようにしてもよいし、文字列IDと文字列とを対応付けるポインタを設定してもよい。
そして、分割部12は、次の項目の処理に移る(S18)。
S12からS14までをまとめてS100と呼ぶこととする。
S11で、フラグが「2」の場合は、分割部12は、項目中にデータベースの列名やOLAPツールでの表示名(次元軸名や集計データ名など)が含まれるかを確認する(S15)。なお、分割部12は、“ ”でくくられた文字列は、データベースの列名又はOLAPツールでの表示名であると判断する。
例えば、図2(b)において、「EXTRACT(YEAR FROM “hiduke”)」の「hiduke」を抽出すべき文字列として識別する。
含まれていなければ、分割部12は、次の項目の処理に移る(S18)。
含まれている場合は、S100を実行する(S16)。
つまり、上述のように、重複して同じ文字列が格納されていなければ、処理中の項目に含まれている文字列を文字列情報21に格納し、文字列抽出箇所に、抽出した文字列を表象する文字列IDを設定する。上述の「EXTRACT(YEAR FROM “hiduke”)」の例では、文字列「hiduke」が記述されていた箇所に、代わりに文字列ID<str 1>がセットされる。
次に、分割部12は、データの先頭を指すポインタを進め(S17)、項目中にデータベースの列名等が含まれなくなったら、次の項目の処理に移る(S18)。
処理中の項目が最後の項目であれば、文字列が抽出された後のクエリ定義情報全体を文字列以外のクエリ定義情報22として保存する(S19)。
このようにして、文字列情報21と文字列以外のクエリ定義情報22が作成される。
その後、分割部12は、生成した文字列情報21と文字列以外のクエリ定義情報22を対応づけて記憶装置(不図示)に記憶させる。
以上のように、分割部12は、複数の項目を有するクエリ定義情報(項目情報)の項目ごとに、抽出対象の文字列が少なくとも一部に含まれる項目(抽出対象項目)、及び抽出対象の文字列が含まれない項目(非抽出対象項目)のいずれであるかを判定し、抽出対象項目と判定された項目における抽出対象の文字列をクエリ定義情報から抽出し、抽出した文字列を示す文字列情報21を生成するとともに、文字列抽出後のクエリ定義情報の文字列抽出箇所に、抽出された文字列を表象する文字列識別子を設定し、文字列に代えて文字列識別子が設定された文字列以外のクエリ定義情報22(抽出後項目情報)を生成する。
そして、分割部12は、抽出対象項目として、抽出対象の文字列から構成される第一の抽出対象項目(フラグ「1」の項目)、及び抽出対象の文字列が一部に含まれる第二の抽出対象項目(フラグ「2」の項目)を備える。
分割部12は、集計検索にのみ用いられる項目を非抽出対象項目とし、集計検索の結果の表示に用いる文字列から構成される項目を第一の抽出対象項目とし、集計検索に用いる項目であってクエリ定義情報のキーワード検索に使用可能なクエリ定義情報検索文字列が含まれる項目を第二の抽出対象項目とする。
そして、分割部12は、クエリ定義情報の項目ごとに、第一の抽出対象項目、第二の抽出対象項目、及び非抽出対象項目のいずれであるかを判定し、第一の抽出対象項目と判定された項目を構成する文字列をクエリ定義情報から抽出し、第二の抽出対象項目と判定された項目における抽出対象の文字列をクエリ定義情報から抽出して、文字列情報21を生成する。
次にOLAPツール装置1にユーザから各種操作選択をさせるためのクエリ定義情報一覧を表示する流れを説明する。まず、ユーザが一覧出力部14を実行する。
するとマージ部13が呼び出される。
マージ部13のマージ処理については、図5のフローチャートを用いて説明する。
マージ部13の呼び出し時には、どのクエリ定義情報の文字列情報21と文字列以外のクエリ定義情報22をマージするかを示す識別子が一覧出力部14からマージ部13に渡される。
マージ処理では、マージ部13は、この識別子に対応する文字列情報21及び文字列以外のクエリ定義情報22を記憶装置(不図示)から入力する(S30)。
次に、マージ部13は、入力内容に文字列IDが含まれるか確認し(S31)、含まれる間、クエリ定義情報の文字列情報21から文字列IDに対応する文字列を入力し、文字列IDを置き換える処理(S32)を繰り返す。
このようにして、必要部分の文字列情報21と文字列以外のクエリ定義情報22がマージされ、クエリ定義情報が再現される。
一覧出力部14ではマージ結果を基に、一覧を作成、表示させる。
なお、以上のマージ処理は、一覧出力においてクエリ定義情報の内容の詳細を表示する場合に必要となる処理であり、例えば、クエリ定義情報の名称を一覧表示するのみであれば、マージ処理を行わなくてもよい。
但し、データベース4に対する集計検索を行う際にはクエリ定義情報を再現する必要があるので、一覧出力時にマージ処理を行わない場合は、データベース4に対する集計検索の際に、後述するように、集計検索部16がマージ部13を呼び出し、マージ部13によるマージ処理を経てクエリ定義情報を再現する。
また、クエリ定義情報の一覧出力時に、検索キーワード3を入力させるための検索欄を、例えばGUI(Graphical User Interface)画面上に設ける。
ユーザから入力された検索キーワード3で、キーワード検索部15は文字列情報21を検索する。
このキーワード検索処理を図6で説明する。
図6はキーワード検索部15におけるキーワード検索処理のフローチャートである。
まず、キーワード検索部15は、クエリ定義情報の文字列情報21を入力する(S50)。
ユーザにより入力された検索キーワード3に合致する文字列が含まれる文字列情報21をサーチし(S51)、あれば、文字列情報21のファイル名を一覧出力部14に渡すバッファにセットする(S52)。
クエリ定義情報一覧としてサーチする対象の他のクエリ定義情報の文字列情報21があれば(S53)、続けて入力し(S50)、無ければ処理を終了する。
一覧出力部14はバッファの内容を基に、キーワード検索部15で抽出されたクエリ定義情報の一覧を表示させる。
最後にデータベースのデータを集計検索する流れを説明する。
ユーザにより一覧で集計検索を操作されると、集計検索部16が実行される。
このときもマージ部13が呼び出され、対象の文字列情報21と文字列以外のクエリ定義情報22がマージされ、クエリ定義情報が再現される。
そして、集計検索部16は、マージされたクエリ定義情報からSQL文を作成し、データベース4の集計検索を実行する。
実行結果である集計データと、クエリ定義情報から、集計検索結果を表やグラフで表示する。
以上のように、クエリ定義情報の検索に使用する文字列をクエリ定義情報とは別に持つが、クエリ定義情報の一部として機能させるようにしているので、情報を二重持ちしない。そのため、管理が容易となり、H/W資源をより有効に活用できる。
また、OLAPツール装置自体がクエリ定義情報の検索機能を持ち、ユーザがフリーキーワードで検索できるようにしているので、より効率的に分析対象のクエリ定義情報を見つけやすくなる。
このように、本実施の形態では、データベースに蓄積されたデータの集計検索及び結果表示を行うOLAPツールにおいて、OLAP処理情報を格納したファイルをクエリ定義情報と呼ぶこととした場合に、
クエリ定義情報を、集計検索だけに必要な部分、結果表示に必要な部分、及び集計検索に必要だが検索キーワードになり得る文字列を含んだ部分に分類し、
分類された情報を基に、キーワード検索に用いる文字列情報とそれ以外のクエリ定義情報に分割保存し、
分割された文字列情報とそれ以外のクエリ定義情報をマージして1つのクエリ定義情報として利用するクエリ定義情報格納方法について説明した。
また、本実施の形態では、データベースに蓄積されたデータの集計検索及び結果表示を行うOLAPツールにおいて、OLAP処理情報を格納したファイルをクエリ定義情報と呼ぶこととした場合に、
クエリ定義情報を、集計検索だけに必要な部分、結果表示に必要な部分、及び集計検索に必要だが検索キーワードになり得る文字列を含んだ部分に分類する情報分類手段と、
分類された情報を基に、キーワード検索に用いる文字列情報とそれ以外のクエリ定義情報に分割保存する分割手段と、
分割された文字列情報とそれ以外のクエリ定義情報を1つのクエリ定義情報に組み立てるマージ手段とを備えるクエリ定義情報格納装置について説明した。
最後に実施の形態1に示したOLAPツール装置1、100、101のハードウェア構成例について説明する。
図8は、実施の形態1に示すOLAPツール装置1、100、101のハードウェア資源の一例を示す図である。なお、図8の構成は、あくまでもOLAPツール装置1、100、101のハードウェア構成の一例を示すものであり、OLAPツール装置1、100、101のハードウェア構成は図8に記載の構成に限らず、他の構成であってもよい。
図8において、OLAPツール装置1、100、101は、プログラムを実行するCPU911(Central Processing Unit、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサともいう)を備えている。CPU911は、バス912を介して、例えば、ROM(Read Only Memory)913、RAM(Random Access Memory)914、通信ボード915、表示装置901、キーボード902、マウス903、磁気ディスク装置920と接続され、これらのハードウェアデバイスを制御する。更に、CPU911は、FDD904(Flexible Disk Drive)、コンパクトディスク装置905(CDD)、プリンタ装置906、スキャナ装置907と接続していてもよい。また、磁気ディスク装置920の代わりに、光ディスク装置、メモリカード読み書き装置などの記憶装置でもよい。
RAM914は、揮発性メモリの一例である。ROM913、FDD904、CDD905、磁気ディスク装置920の記憶媒体は、不揮発性メモリの一例である。これらは、記憶装置あるいは記憶部の一例である。
通信ボード915、キーボード902、スキャナ装置907、FDD904などは、入力部、入力装置の一例である。
また、通信ボード915、表示装置901、プリンタ装置906などは、出力部、出力装置の一例である。
通信ボード915は、ネットワークに接続可能である。例えば、通信ボード915は、LAN(ローカルエリアネットワーク)、インターネット、WAN(ワイドエリアネットワーク)などに接続されていても構わない。
磁気ディスク装置920には、オペレーティングシステム921(OS)、ウィンドウシステム922、プログラム群923、ファイル群924が記憶されている。プログラム群923のプログラムは、CPU911、オペレーティングシステム921、ウィンドウシステム922により実行される。
上記プログラム群923には、実施の形態1の説明において「〜部」、「〜手段」として説明している機能を実行するプログラムが記憶されている。プログラムは、CPU911により読み出され実行される。
ファイル群924には、実施の形態1の説明において、「〜の判断」、「〜の計算」、「〜の比較」、「〜の設定」、「〜の更新」、「〜の検索」、「〜の集計」、「〜の抽出」等として説明している処理の結果を示す情報やデータや信号値や変数値やパラメータが、「〜ファイル」や「〜データベース」の各項目として記憶されている。「〜ファイル」や「〜データベース」は、ディスクやメモリなどの記録媒体に記憶される。ディスクやメモリになどの記憶媒体に記憶された情報やデータや信号値や変数値やパラメータは、読み書き回路を介してCPU911によりメインメモリやキャッシュメモリに読み出され、抽出・検索・参照・比較・演算・計算・処理・編集・出力・印刷・表示などのCPUの動作に用いられる。抽出・検索・参照・比較・演算・計算・処理・編集・出力・印刷・表示のCPUの動作の間、情報やデータや信号値や変数値やパラメータは、メインメモリ、レジスタ、キャッシュメモリ、バッファメモリ等に一時的に記憶される。
また、実施の形態1で説明しているフローチャートの矢印の部分は主としてデータや信号の入出力を示し、データや信号値は、RAM914のメモリ、FDD904のフレキシブルディスク、CDD905のコンパクトディスク、磁気ディスク装置920の磁気ディスク、その他光ディスク、ミニディスク、DVD等の記録媒体に記録される。また、データや信号は、バス912や信号線やケーブルその他の伝送媒体によりオンライン伝送される。
また、実施の形態1の説明において「〜部」、「〜手段」として説明しているものは、「〜回路」、「〜装置」、「〜機器」、であってもよく、また、「〜ステップ」、「〜手順」、「〜処理」であってもよい。すなわち、「〜部」、「〜手段」として説明しているものは、ROM913に記憶されたファームウェアで実現されていても構わない。或いは、ソフトウェアのみ、或いは、素子・デバイス・基板・配線などのハードウェアのみ、或いは、ソフトウェアとハードウェアとの組み合わせ、さらには、ファームウェアとの組み合わせで実施されても構わない。ファームウェアとソフトウェアは、プログラムとして、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVD等の記録媒体に記憶される。プログラムはCPU911により読み出され、CPU911により実行される。すなわち、プログラムは、実施の形態1の「〜部」、「〜手段」としてコンピュータを機能させるものである。あるいは、実施の形態1の「〜部」、「〜手段」の手順や方法をコンピュータに実行させるものである。
このように、実施の形態1に示すOLAPツール装置1、100、101は、処理装置たるCPU、記憶装置たるメモリ、磁気ディスク等、入力装置たるキーボード、マウス、通信ボード等、出力装置たる表示装置、通信ボード等を備えるコンピュータであり、上記したように「〜部」、「〜手段」として示された機能をこれら処理装置、記憶装置、入力装置、出力装置を用いて実現するものである。
実施の形態1に係るOLAPツール装置の構成例を示す図。 実施の形態1に係るクエリ定義情報、文字列情報、文字列以外のクエリ定義情報の例を示す図。 実施の形態1に係る項目の分類例を示す図。 実施の形態1に係る分割処理の例を示すフローチャート図。 実施の形態1に係るマージ処理の例を示すフローチャート図。 実施の形態1に係るキーワード検索処理の例を示すフローチャート図。 実施の形態1に係るOLAPツール装置の構成例を示す図。 実施の形態1に係るOLAPツール装置のハードウェア構成例を示す図。
符号の説明
1 OLAPツール装置、2 分割後クエリ定義情報、3 検索キーワード、4 データベース、11 設計部、12 分割部、13 マージ部、14 一覧出力部、15 キーワード検索部、16 集計検索部、17 情報分類部、21 文字列情報、22 文字列以外のクエリ定義情報、100 OLAPツール装置(設計ユーザ用)、101 OLAPツール装置(検索ユーザ用)。

Claims (7)

  1. 複数の項目を有する項目情報の項目ごとに、抽出対象の文字列が少なくとも一部に含まれる抽出対象項目、及び抽出対象の文字列が含まれない非抽出対象項目のいずれであるかを判定する項目判定部と、
    前記抽出対象項目と判定された項目における抽出対象の文字列を前記項目情報から抽出し、抽出した文字列を示す文字列情報を生成するとともに、文字列抽出後の項目情報の文字列抽出箇所に、抽出された文字列を表象する文字列識別子を設定し、文字列に代えて文字列識別子が設定された抽出後項目情報を生成する文字列抽出部とを有することを特徴とする情報処理装置。
  2. 前記項目判定部は、
    前記抽出対象項目として、抽出対象の文字列から構成される第一の抽出対象項目、及び抽出対象の文字列が一部に含まれる第二の抽出対象項目を備え、
    前記項目情報の項目ごとに、前記第一の抽出対象項目、前記第二の抽出対象項目、及び前記非抽出対象項目のいずれであるかを判定し、
    前記文字列抽出部は、
    前記第一の抽出対象項目と判定された項目を構成する文字列を前記項目情報から抽出し、前記第二の抽出対象項目と判定された項目における抽出対象の文字列を前記項目情報から抽出して、前記文字列情報を生成することを特徴とする請求項1に記載の情報処理装置。
  3. 前記項目判定部は、
    前記項目情報として、データベースに対する集計検索に用いられるクエリ定義情報を対象とし、
    前記クエリ定義情報に含まれる項目のうち、集計検索にのみ用いられる項目を前記非抽出対象項目として判定し、集計検索の結果の表示に用いる文字列から構成される項目を前記第一の抽出対象項目として判定し、集計検索に用いる項目であってクエリ定義情報のキーワード検索に使用可能なクエリ定義情報検索文字列が含まれる項目を第二の抽出対象項目として判定し、
    前記文字列抽出部は、
    前記第一の抽出対象項目と判定された項目を構成する文字列を前記クエリ定義情報から抽出し、前記第二の抽出対象項目と判定された項目におけるクエリ定義情報検索文字列を前記クエリ定義情報から抽出して、前記文字列情報を生成することを特徴とする請求項2に記載の情報処理装置。
  4. 前記情報処理装置は、更に、
    前記文字列情報に示される文字列に対してキーワード検索を行って、特定のクエリ定義情報を検索するキーワード検索部を有することを特徴とする請求項3に記載の情報処理装置。
  5. 前記情報処理装置は、更に、
    前記抽出後項目情報に示される文字列識別子を前記文字列情報における対応する文字列で置換して、前記項目情報を再現するマージ部を有することを特徴とする請求項1に記載の情報処理装置。
  6. コンピュータが、複数の項目を有する項目情報の項目ごとに、抽出対象の文字列が少なくとも一部に含まれる抽出対象項目、及び抽出対象の文字列が含まれない非抽出対象項目のいずれであるかを判定する項目判定ステップと、
    コンピュータが、前記抽出対象項目と判定された項目における抽出対象の文字列を前記項目情報から抽出し、抽出した文字列を示す文字列情報を生成するとともに、文字列抽出後の項目情報の文字列抽出箇所に、抽出された文字列を表象する文字列識別子を設定し、文字列に代えて文字列識別子が設定された抽出後項目情報を生成する文字列抽出ステップとを有することを特徴とする情報処理方法。
  7. 複数の項目を有する項目情報の項目ごとに、抽出対象の文字列が少なくとも一部に含まれる抽出対象項目、及び抽出対象の文字列が含まれない非抽出対象項目のいずれであるかを判定する項目判定処理と、
    前記抽出対象項目と判定された項目における抽出対象の文字列を前記項目情報から抽出し、抽出した文字列を示す文字列情報を生成するとともに、文字列抽出後の項目情報の文字列抽出箇所に、抽出された文字列を表象する文字列識別子を設定し、文字列に代えて文字列識別子が設定された抽出後項目情報を生成する文字列抽出処理とをコンピュータに実行させることを特徴とするプログラム。
JP2007103586A 2007-04-11 2007-04-11 情報処理装置及び情報処理方法及びプログラム Pending JP2008262324A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007103586A JP2008262324A (ja) 2007-04-11 2007-04-11 情報処理装置及び情報処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007103586A JP2008262324A (ja) 2007-04-11 2007-04-11 情報処理装置及び情報処理方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2008262324A true JP2008262324A (ja) 2008-10-30

Family

ID=39984765

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007103586A Pending JP2008262324A (ja) 2007-04-11 2007-04-11 情報処理装置及び情報処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2008262324A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6432893B1 (ja) * 2017-10-04 2018-12-05 株式会社シマント データベース処理装置、グループマップファイル生産方法及びプログラム
CN113722480A (zh) * 2021-08-11 2021-11-30 安徽帕觅智能科技有限公司 一种日文联系人混合检索方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6432893B1 (ja) * 2017-10-04 2018-12-05 株式会社シマント データベース処理装置、グループマップファイル生産方法及びプログラム
WO2019069941A1 (ja) * 2017-10-04 2019-04-11 株式会社シマント データベース処理装置、グループマップファイル生産方法及び記録媒体
JP2019067304A (ja) * 2017-10-04 2019-04-25 株式会社シマント データベース処理装置、グループマップファイル生産方法及びプログラム
CN113722480A (zh) * 2021-08-11 2021-11-30 安徽帕觅智能科技有限公司 一种日文联系人混合检索方法

Similar Documents

Publication Publication Date Title
US11651149B1 (en) Event selection via graphical user interface control
US11531713B2 (en) Suggested field extraction
US20210209080A1 (en) Column-based contextual menu with form element to add commands to a search query
US10846316B2 (en) Distinct field name assignment in automatic field extraction
US11354308B2 (en) Visually distinct display format for data portions from events
US11698900B2 (en) Leveraging search query history in a search interface
US10061824B2 (en) Cell-based table manipulation of event data
US9922082B2 (en) Enforcing dependency between pipelines
US9922383B2 (en) Patent claims analysis system and method
US20160224643A1 (en) Extracting From Extracted Event Fields
US7606797B2 (en) Reverse value attribute extraction
US20110066619A1 (en) Automatically finding contextually related items of a task
US20090183115A1 (en) Document searching apparatus, document searching method, and computer-readable recording medium
JP2005115514A (ja) データベース検索システム及びその検索方法並びにプログラム
JP2011198111A (ja) 特徴語抽出装置及びプログラム
JP4832952B2 (ja) データベース解析システム及びデータベース解析方法及びプログラム
JP2008310514A (ja) ユーザ操作履歴取得表示装置、ユーザ操作履歴取得表示方法、ユーザ操作履歴取得表示プログラム及びそのプログラムを記録した記録媒体
JP2009098811A (ja) 文書分類装置およびプログラム
JP2010250439A (ja) 検索システム、データ生成方法、プログラムおよびプログラムを記録した記録媒体
JP2008262324A (ja) 情報処理装置及び情報処理方法及びプログラム
US11250084B2 (en) Method and system for generating content from search results rendered by a search engine
JP3711710B2 (ja) 情報検索収集システムおよび情報検索収集プログラムを記憶した記憶媒体
JP6753190B2 (ja) 文書検索装置及びプログラム
KR101020306B1 (ko) 검색서비스 제공방법 및 그 장치
TWI399652B (zh) 文書頁面中註解聚合及傳遞系統與方法