JP6782219B2 - データ活用支援装置、データ活用支援システム、及びデータ活用支援方法 - Google Patents

データ活用支援装置、データ活用支援システム、及びデータ活用支援方法 Download PDF

Info

Publication number
JP6782219B2
JP6782219B2 JP2017228890A JP2017228890A JP6782219B2 JP 6782219 B2 JP6782219 B2 JP 6782219B2 JP 2017228890 A JP2017228890 A JP 2017228890A JP 2017228890 A JP2017228890 A JP 2017228890A JP 6782219 B2 JP6782219 B2 JP 6782219B2
Authority
JP
Japan
Prior art keywords
data
database
access
metadata
accessed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017228890A
Other languages
English (en)
Other versions
JP2019101533A (ja
Inventor
渡辺 聡
聡 渡辺
敬太郎 上原
敬太郎 上原
近藤 伸和
伸和 近藤
淳平 大越
淳平 大越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2017228890A priority Critical patent/JP6782219B2/ja
Publication of JP2019101533A publication Critical patent/JP2019101533A/ja
Application granted granted Critical
Publication of JP6782219B2 publication Critical patent/JP6782219B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、複数のデータベースに管理されているデータの活用を支援するデータ活用支援装置等に関する。
近年、技術開発の加速を目的として、調査結果や研究成果などのデータベースを公開する取り組みが行われており、このような取り組みに関する技術が知られている(例えば、特許文献1参照)。例えば、材料開発の分野では、実験やシミュレーションによって得られた材料の特性に関するデータベースが公開されている。また、医療分野では、レセプト情報や健診等のデータベースを公開する取り組みが行われている。
これらの公開されたデータベースは、オープンデータと呼ばれる。オープンデータを活用することにより、従来、入手できなかったデータの入手が可能になり、技術開発が加速される効果が期待されている。
データベースに格納されたデータを管理する技術としてデータレイクが用いられるようになっている(例えば、特許文献2参照)。データレイクでは、データに対してメタデータを付与することが広く行われている。データに対して付与するメタデータの例としては、データの作成者、作成日時、データのファイル名などがある。データレイクでは、データに対して予めメタデータを付与しておくことにより、データの検索や利用を容易化する。例えば、椅子の画像が含まれる画像データに対して「椅子」というメタデータを付与しておくことが可能である。このようにメタデータを付与しておくことにより、多数の画像データの中から、椅子の画像が含まれるデータを容易に検索することが可能になる。
特開2014−14068号公報 特開2017−54487号公報
例えば、或る企業においては企業内にデーターベース(社内データベース)を備えている場合があるが、社内データベースのみではなく、オープンデータを利用することにより、技術開発が促進されることが考えられる。しかしながら、技術開発を促進できるか否かは、社内データベースとオープンデータとをどのように結び付けて利用するかという点が重要となる。したがって、社内データベースのデータと、オープンデータとの関連性や、オープンデータを介して結び付けられた社内データベースのデータ間の関連性を容易に把握できるようにすることが要請される。
また、オープンデータを利用する場合には、オープンデータのアクセス履歴が外部に流出してしまうことが問題となる場合がある。例えば、アクセス履歴が外部に流出すると、企業活動を企業の外部から推定可能となるおそれがある。
本発明は、上記事情に鑑みなされたものであり、その目的は、データベースのデータの関連性を容易且つ適切に把握できるようにする技術を提供することにある。
上記目的を達成するため、一観点に係るデータ活用支援装置は、複数のデータベースのデータの活用を支援するデータ活用支援装置であって、第一データベースに対するユーザによるアクセス履歴に基づいて、第一データベースのデータに関わる第一メタデータを生成する第一メタデータ生成部と、第二データベースに対するユーザによりアクセス履歴に基づいて、第二データベースのデータに関わる第二メタデータを生成する第二メタデータ生成部と、第一メタデータと第二メタデータとに基づいて、関連する第一データベースのデータと、第二データベースのデータとを対応付ける関連情報を生成する関連情報生成部と、関連情報に基づいて、第一データベースの所定のデータに関連する他のデータを特定し、所定のデータと前記関連する他のデータとの関連性に関する情報を出力させる関連情報出力処理部と、を備える。
本発明によれば、データベースのデータとの関連性を容易且つ適切に把握できるようにすることができる。
図1は、一実施形態に係るデータ活用支援システムの全体構成図である。 図2は、一実施形態に係る第一メタデータの構成図である。 図3は、一実施形態に係る利用者属性テーブルの構成図である。 図4は、一実施形態に係る第二メタデータの構成図である。 図5は、一実施形態に係るデータ関連テーブルの構成図である。 図6は、一実施形態に係るデータ来歴テーブルの構成図である。 図7は、一実施形態に係るダウンロードデータ管理テーブルの構成図である。 図8は、一実施形態に係るアクセスログの構成図である。 図9は、一実施形態に係るサーバのハードウェア構成図である。 図10は、一実施形態に係るプロキシサーバのハードウェア構成図である。 図11は、一実施形態に係るデータ管理処理のフローチャートである。 図12は、一実施形態に係る関連オブジェクト表示処理のフローチャートである。 図13は、一実施形態に係る問合せ要求を示す図である。 図14は、一実施形態に係る問合せ結果画面を示す図である。 図15は、一実施形態に係るデータ取得管理処理のフローチャートである。 図16は、一実施形態に係るダウンロードデータ生成処理のフローチャートである。
実施形態について、図面を参照して説明する。なお、以下に説明する実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態の中で説明されている諸要素及びその組み合わせの全てが発明の解決手段に必須であるとは限らない。
以下の説明では、「AAAテーブル」の表現にて情報を説明することがあるが、情報は、どのようなデータ構造で表現されていてもよい。すなわち、情報がデータ構造に依存しないことを示すために、「AAAテーブル」を「AAA情報」と呼ぶことができる。
図1は、一実施形態に係るデータ活用支援システムの全体構成図である。
データ活用支援システム10は、1以上の端末102と、プロキシサーバ104と、1以上の外部サイト110(110a、110b)と、データ活用支援装置の一例としてのサーバ112と、記憶装置の一例としてのストレージ装置129とを備える。端末102と、プロキシサーバ104と、サーバ112は、ネットワーク103を介して接続されている。プロキシサーバ104と、外部サイト110とは、ネットワーク109を介して接続されている。サーバ112と、ストレージ装置129とは、例えば、ケーブルを介して接続されている。
本実施形態では、端末102と、プロキシサーバ104と、サーバ112と、ストレージ装置129とは、或る企業内(社内)に配置されており、外部サイト110は、或る企業の外部に配置されている。本実施形態では、ネットワーク103は、例えば、LAN(Local Area Network)であり、ネットワーク109は、例えば、インターネット等のWAN(Wide Area Network)となっている。なお、ネットワーク103、及びネットワーク109の構成はこれに限られず、有線、無線を用いた任意のネットワークとしてもよい。
外部サイト110(110a、110b)は、各種データを蓄積するデータベース111(111a、111b)を有し、データベース111に対する検索、閲覧等の機能を提供する。ここで、データベース111は、第二データベース(外部データベース)に相当する。本実施形態では、外部サイト110のデータベース111は、利用できるユーザが限定されていないオープンデータベース(オープンデータ)となっている。
端末102は、或る企業の社員である利用者(ユーザ)101により、外部サイト110のデータベース111や、ストレージ装置129のデータベース130を利用する際に利用される装置である。端末102は、例えば、CPU,メモリ等を備えるPC(Personal Computer)により構成され、データベースに対するアクセス要求(例えば、検索キーワード等)の入力を受け付けて、他の装置に送信し、他の装置からのアクセス結果の情報等を受信し、図示しないディスプレイ等に表示等する。本実施形態では、端末102は、利用者101からデータの関連性の表示を要求する問合せ要求を受け付けて、サーバ112に送信し、サーバ112から問合せ要求に対応する結果(問合せ結果画面)を受信して、問合せ結果画面を表示出力する。
ストレージ装置129は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)等の非一時的記憶デバイス(不揮発性記憶デバイス)を備え、各種情報を記憶する。本実施形態では、ストレージ装置129は、社員である利用者101により利用可能なデータベース130(第一データベース:社内データベース)と、外部サイト110からダウンロードしたデータを管理するダウンロードデータベース131とを記憶する。
サーバ112は、データ管理機構116を備える。データ管理機構116は、第一メタデータ生成部113と、第一メタデータ114と、利用者属性テーブル115と、アクセスログ取得部117と、第二メタデータ生成部118と、第二メタデータ119と、問合せ受信部120と、問合せ結果出力部121と、問合せ結果生成部122と、関連情報生成部の一例としてのデータ関連情報生成部123と、データ関連テーブル124と、関連情報の一例としてのデータ来歴テーブル125と、ダウンロードデータ送信部の一例としてのダウンロードデータ検索部126と、ダウンロード処理部の一例としてのダウンロードデータ生成部127と、ダウンロードデータ管理テーブル128とを備える。ここで、関連情報出力制御部は、問合せ結果出力部121及び問合せ結果生成部122により構成される。
第一メタデータ生成部113は、端末102からのデータベース130に対するアクセス要求を受信し、アクセス要求に含まれる情報に基づいて、第一メタデータ114にアクセス要求に対応するエントリを追加する。
アクセスログ取得部117は、プロキシサーバ104からアクセスログ108を取得する。第二メタデータ生成部118は、アクセスログ取得部117が取得したアクセスログ108の内容に基づいて、第二メタデータ119にアクセスログ108の各ログ(エントリ)に対応するエントリを追加する。
プロキシサーバ104は、プロキシ処理機構150を有する。プロキシ処理機構105は、アクセスログ取得部106と、データ取得部107と、アクセスログ108とを備える。アクセスログ取得部106は、端末102による外部サイト110へのアクセス要求の内容を取得してアクセスログ108にアクセス要求に対応するエントリを追加する。データ取得部107は、端末102からのアクセス要求を受け付けて、該当するデータを端末102に送信する処理を実行する。アクセスログ108については後述する。
次に、サーバ112に記憶されているテーブル、データ等について説明する。
図2は、一実施形態に係る第一メタデータの構成図である。
第一メタデータ114は、端末102の利用者101によるデータベース130へのアクセスに関する情報をアクセス毎に対応するエントリとして管理する。第一メタデータ114のエントリは、アクセス日時401と、アクセス元IPアドレス402と、アクセス種別403と、オブジェクト名404と、変更元オブジェクト405とのフィールドを有する。
アクセス日時401には、データベース130のデータ(データオブジェクト:単にオブジェクトともいう)に対してアクセスした日時が格納される。アクセス元IPアドレス402には、データベース130にアクセスした端末102のIP(Internet Protocol)アドレスが格納される。アクセス種別403には、データベース130のオブジェクトに対するアクセスの種別が格納される。ここで、アクセスの種別としては、新たにオブジェクトを作成したことを示す「作成」と、オブジェクトを閲覧したことを示す「閲覧」と、オブジェクトを変更したことを示す「変更」等がある。オブジェクト名404には、アクセスしたデータベース130のオブジェクトの名前(オブジェクト名)が格納される。図2の例では、オブジェクト名は、オブジェクトの格納先を示す格納先情報と同じものとなっている。変更元オブジェクト405には、オブジェクトを変更した際の変更元となったオブジェクトのオブジェクト名が格納される。
図3は、一実施形態に係る利用者属性テーブルの構成図である。
利用者属性テーブル115は、端末102の利用者101の属性を管理するテーブルであり、利用者101ごとのエントリを格納する。利用者属性テーブル115のエントリは、IPアドレス501と、所属プロジェクト502と、ロール503とのフィールドを有する。IPアドレス501には、利用者101が利用する端末102に割り当てられているIPアドレスが格納される。所属プロジェクト502には、利用者101が所属するプロジェクトの名前が格納される。ロール503には、利用者101のロール(役割)が格納される。
図4は、一実施形態に係る第二メタデータの構成図である。
第二メタデータ119は、端末102の利用者による外部サイト110のデータベース111へのアクセスに関する情報をアクセス毎に対応するエントリとして管理する。第二メタデータ119のエントリは、アクセス日時701と、アクセス元IPアドレス702と、アクセス種別703と、検索条件704と、アクセスURL705と、データ格納先706とのフィールドを有する。
アクセス日時701には、データベース111のデータ(データオブジェクト:単にオブジェクトともいう)に対してアクセスした日時が格納される。アクセス元IPアドレス702には、データベース111にアクセスした端末102のIPアドレスが格納される。アクセス種別703には、データベース111のオブジェクトに対するアクセスの種別が格納される。ここで、アクセスの種別としては、データベース111に対する検索を行ったことを示す「検索」と、オブジェクトを閲覧したことを示す「閲覧」と、オブジェクトをダウンロードしたことを示す「ダウンロード」等がある。検索条件704には、データベース111に対するアクセスに対応する検索で使用した条件(検索条件)が格納される。本実施形態では、検索条件704に設定される条件は、第二メタデータ生成部118により、各データベース111に基づく表現形式の検索キーワード(例えば、アクセスするURLの記述中に存在)を、複数のデータベース111間で統一した表現形式に変換した検索条件が格納される。これにより、データベース111の違いによる表現形式の違いが吸収される。アクセスURL705には、アクセスしたデータのURL(Uniform Resource Locator)が格納される。データ格納先706には、データをダウンロードした際におけるデータの格納先を示す情報(格納先情報)が格納される。ここで、格納先情報は、例えば、端末102からのアクセス要求中から取得されたものである。
図5は、一実施形態に係るデータ関連テーブルの構成図である。
データ関連テーブル124は、データベース111のアクセスがあったオブジェクトと、そのオブジェクトへのアクセス後にアクセスが発生したデータベース130のオブジェクトとを対応させて管理するテーブルである。データ関連テーブル124のエントリは、第一データベースオブジェクト901と、第二データベースオブジェクト902と、時間的関連度903と、アクセス方法関連度904と、検索キーワード905とのフィールドを含む。
第一データベースオブジェクト901には、データベース130のオブジェクトの格納先情報が格納される。第二データベースオブジェクト902には、データベース111のオブジェクトの格納先情報が格納される。時間的関連度903には、エントリに対応するデータベース130のオブジェクトと、データベース111のオブジェクトとのアクセス時間に関する関連度が格納される。関連度としては、それらのアクセスの発生時間の間隔としてもよい。アクセス方法関連度904には、エントリに対応するデータベース130のオブジェクトと、データベース111のオブジェクトとのアクセス方法に関する関連度が格納される。アクセス方法に関する関連度とは、データベース111のオブジェクトに対するアクセスの種類が格納される。検索キーワード905には、データベース111に対するアクセスに対応する検索で使用した検索キーワードが格納される。
図6は、一実施形態に係るデータ来歴テーブルの構成図である。
データ来歴テーブル125は、データベース111とデータベース130のオブジェクトがどのように辿ってアクセスされたか、すなわち、データの来歴を管理するテーブルであり、例えば、データベース111のオブジェクトと、このオブジェクトのアクセスに影響したデータベース130のオブジェクトと、データベース111のオブジェクトに影響されたデータベース130のオブジェクトとの対応関係を管理するテーブルである。データ来歴テーブル125のエントリは、第一データベースオブジェクト1 1001と、第一データベースオブジェクト2 1002と、第二データベースオブジェクト1003と、時間的関連度1004と、アクセス方法関連度1005と、検索キーワード1006とのフィールドを含む。
第二データベースオブジェクト1003には、データベース111のオブジェクトの格納先情報(オブジェクト名ともいう)が格納される。第一データベースオブジェクト1 1001には、エントリの第二データベースオブジェクト1003に格納先情報が格納されているデータベース111のオブジェクトにアクセスする前にアクセスしていたデータベース130のオブジェクトの格納先情報(オブジェクト名ともいう)が格納される。第一データベースオブジェクト2 1002には、エントリの第二データベースオブジェクト1003に格納先情報が格納されているデータベース111のオブジェクトにアクセスした後にアクセスしたデータベース130のオブジェクトの格納先情報(オブジェクト名ともいう)が格納される。
時間的関連度1004には、エントリに対応するデータベース111のオブジェクト(第二データベースオブジェクト1003に格納先情報が格納されているオブジェクト)と、第一データベースオブジェクト2 1002のオブジェクトとのアクセス時間に関する関連度が格納される。関連度としては、それらのアクセスの発生時間の間隔としてもよい。アクセス方法関連度1005には、エントリに対応するデータベース130のオブジェクトと、第一データベースオブジェクト2 1002のオブジェクトとのアクセス方法に関する関連度が格納される。アクセス方法に関する関連度とは、データベース111のオブジェクトに対するアクセスの種類が格納される。アクセスの種類としては、例えば、オブジェクトの検索を行ったことを示す「検索」と、オブジェクトを閲覧したことを示す「閲覧」と、オブジェクトをダウンロードしたことを示す「ダウンロード」等がある。ここで、ダウンロード、閲覧、検索の順番に、エントリに対応するデータベース130のオブジェクトと、第一データベースオブジェクト2 1002のオブジェクトとの関連性が高いことを意味している。検索キーワード1006には、データベース111に対するアクセスに対応する検索で使用した検索キーワードが格納される。
図7は、一実施形態に係るダウンロードデータ管理テーブルの構成図である。
ダウンロードデータ管理テーブル128は、データベース111からストレージ装置129にダウンロードされたデータを管理するためのテーブルであり、データベース111からダウンロードされたオブジェクト毎のエントリが記憶されている。
ダウンロードデータ管理テーブル128のエントリは、第二データベースオブジェクト1401と、ダウンロードデータベースオブジェクト1402とのフィールドを含む。
第二データベースオブジェクト1401には、エントリに対応するデータベース111からダウンロードされたオブジェクトの格納先情報(オブジェクト名)が格納される。ダウンロードデータベースオブジェクト1402には、エントリに対応するデータベース111のオブジェクトのデータが格納されているダウンロードデータベース131のオブジェクトの格納先情報(オブジェクト名)が格納される。
図8は、一実施形態に係るアクセスログの構成図である。
アクセスログ108は、端末102から外部サイト110(データベース111のオブジェクト)へのアクセスの情報を管理するログである。アクセスログ108のエントリは、アクセス日時601と、アクセス元IPアドレス602と、アクセス先IPアドレス603と、アクセスURL604と、データ格納先605とのフィールドを有する。
アクセス日時601には、エントリに対応するデータベース111のオブジェクトに対してアクセスした日時が格納される。アクセス元IPアドレス602には、データベース111にアクセスした端末102のIPアドレスが格納される。アクセス先IPアドレス603には、アクセス先となる外部サイト110のデータベース111を管理するサーバのIPアドレスが格納される。アクセス先URL604には、アクセス先のデータのURLが格納される。データ格納先605には、データをダウンロードした際におけるデータの格納先情報が格納される。ここで、格納先情報は、例えば、端末102からのアクセス要求の中から取得することができる。
図9は、一実施形態に係るサーバのハードウェア構成図である。
サーバ112は、プロセッサの一例としてのCPU(Central Processing Unit)201と、メモリ203とを備える。CPU201と、メモリ203とは、バス202を介して接続されている。なお、サーバ112は、図示しない通信インターフェース等を備えている。
CPU201は、メモリ203に格納されているプログラムに従って各種処理を実行する。メモリ203は、例えば、RAM(RANDOM ACCESS MEMORY)であり、CPU201で実行されるプログラムや、必要な情報を記憶する。本実施形態では、メモリ203は、データ管理機構116を構成するために必要なプログラムやテーブル等の情報を記憶する。本実施形態では、データ管理機構116を構成する図1に示す各処理部は、メモリ203に格納されたプログラムをCPU201が実行することにより構成されている。
図10は、一実施形態に係るプロキシサーバのハードウェア構成図である。
プロキシサーバ104は、プロセッサの一例としてのCPU301と、メモリ303とを備える。CPU301と、メモリ303とは、バス302を介して接続されている。なお、プロキシサーバ104は、図示しない通信インターフェース等を備えている。
CPU301は、メモリ303に格納されているプログラムに従って各種処理を実行する。メモリ303は、例えば、RAMであり、CPU301で実行されるプログラムや、必要な情報を記憶する。本実施形態では、メモリ303は、プロキシ処理機構105を構成するために必要なプログラムやテーブル等の情報を記憶する。本実施形態では、プロキシ処理機構105を構成する図1に示す各処理部は、メモリ303に格納されたプログラムをCPU301が実行することにより構成されている。
次に、実施形態に係るデータ活用支援システムの処理動作について説明する。
まず、サーバ112のデータ関連情報生成部123によるデータ管理処理について説明する。
図11は、一実施形態に係るデータ管理処理のフローチャートである。
まず、データ関連情報生成部123は、第二メタデータ119から過去の所定期間内(例えば、1日)のデータ(エントリ)を時間順に1つ取り出す(ステップ801)。ここで、本処理の説明において、取り出したデータを対象メタデータという。
次いで、データ関連情報生成部123は、対象メタデータと、アクセス元IPアドレスが同じIPアドレスであり、且つ対象メタデータのアクセス日時よりもアクセス日時が後ろの第一メタデータ114のデータ(エントリ)があるか否かを判定する(ステップ802)。
この結果、対象メタデータと、アクセス元IPアドレスが同じIPアドレスであり、且つ対象メタデータのアクセス日時よりもアクセス日時が後ろの第一メタデータ114のエントリがない場合(ステップ802:No)には、データ関連情報生成部123は、処理をステップ808に進める。
一方、対象メタデータと、アクセス元IPアドレスが同じIPアドレスであり、且つ対象メタデータのアクセス日時よりもアクセス日時が後ろの第一メタデータ114のエントリがある場合(ステップ802:Yes)には、同一の端末102(利用者101)からアクセスされ、対象メタデータに対応するオブジェクトと、このエントリに対応するオブジェクトとの関連性が高いと考えられるので、データ関連情報生成部123は、このようなエントリを1つ取り出す(ステップ803)。ここで、本処理の説明において、取り出したエントリを後関連メタデータという。
次いで、データ関連情報生成部123は、後関連メタデータの内容に対応するエントリをデータ関連データ124に追加する(ステップ804)。
次いで、データ関連情報生成部123は、対象メタデータと、アクセス元IPアドレスが同じIPアドレスであり、且つ対象データのアクセス日時よりもアクセス日時が前の第一メタデータ114のデータ(エントリ)があるか否かを判定する(ステップ805)。
この結果、対象メタデータと、アクセス元IPアドレスが同じIPアドレスであり、且つ対象メタデータのアクセス日時よりもアクセス日時が前の第一メタデータ114のエントリがない場合(ステップ805:No)には、データ関連情報生成部123は、処理をステップ807に進める。
一方、対象メタデータと、アクセス元IPアドレスが同じIPアドレスであり、且つ対象メタデータのアクセス日時よりもアクセス日時が前の第一メタデータ114のエントリがある場合(ステップ805:Yes)には、対象メタデータに対応するオブジェクトと、このエントリ(前関連メタデータ)に対応するオブジェクトとの関連性が高いと考えられるので、データ関連情報生成部123は、データ来歴テーブル125に対象メタデータに対応するエントリを追加し(ステップ806)、処理をステップ807に進める。ステップ806では、具体的には、データ関連情報生成部123は、データ来歴テーブル125にエントリを追加し、そのエントリに対して、対象メタデータにおけるアクセスURL705の内容を第二データベースオブジェクト1003に格納し、対象メタデータにおけるアクセス種別703の内容をアクセス方法関連度1005に格納し、対象メタデータにおける検索条件704の値を検索キーワード1006に格納し、後関連メタデータのオブジェクト名404を第一データベースオブジェクト2 1002に格納し、前関連メタデータのオブジェクト名404を第一データベースオブジェクト1 1001に格納し、前関連メタデータのアクセス日時401の日時と対象メタデータのアクセス日時701の日時との時間差を時間的関連度1004に格納する。
ステップ807では、データ関連情報生成部123は、対象メタデータと、アクセス元IPアドレスが同じIPアドレスであり、且つ対象メタデータのアクセス日時よりもアクセス日時が後ろのすべての第一メタデータ114のエントリに対する処理を完了したか否かを判定し(ステップ807)、処理が完了していない場合(ステップ807:No)には、処理をステップ803に進める一方、処理が完了している場合(ステップ807:Yes)には、処理をステップ808に進める。
ステップ808では、データ関連情報生成部123は、過去の所定期間内の全てのデータ(エントリ)に対する処理を完了したか否かを判定し(ステップ808)、処理が完了していない場合(ステップ808:No)には、処理をステップ801に進める一方、処理が完了している場合(ステップ808:Yes)には、データ管理処理を終了する。
次に、サーバ112による関連オブジェクト表示処理について説明する。
図12は、一実施形態に係る関連オブジェクト表示処理のフローチャートである。図13は、一実施形態に係る問合せ要求を示す図である。図14は、一実施形態に係る問合せ結果画面を示す図である。
サーバ112の問合せ受信部120は、問合せ要求を端末102から受領したか否かを判定する(ステップ1601)。
この結果、問合せ要求を受領していない場合(ステップ1601:No)には、問合せ受信部120は、処理をステップ1601に進める一方、問合せ要求を受領している場合(ステップ1601:Yes)には、問合せ要求を受領したことを問合せ結果生成部122に通知する。ここで、問合せ要求には、図13に示すように、関連するオブジェクトの情報を表示させる対象とするオブジェクトの格納先情報(オブジェクト名)が含まれている。
問合せ要求の受領したことの通知を受けた問合せ結果生成部122は、問合せ要求に含まれるオブジェクトの格納先情報に基づいて、この格納先情報のオブジェクトにアクセスする前にアクセスしていたデータベース130のオブジェクト(前関連オブジェクト)の情報を取得する(ステップ1602)。具体的には、問合せ結果生成部122は、データ来歴テーブル125を参照し、問合せ要求に含まれるオブジェクトの格納先情報が第一データベースオブジェクト2 1002に格納されるエントリを特定し、このエントリの情報を取得する。
次いで、問合せ結果生成部122は、問合せ要求に含まれるオブジェクトの格納先情報に基づいて、この格納先情報のオブジェクトにアクセスした後にアクセスしたデータベース130のオブジェクト(後関連オブジェクト)の情報を取得する(ステップ1603)。具体的には、問合せ結果生成部122は、データ来歴テーブル125を参照し、問合せ要求に含まれるオブジェクトの格納先情報が第一データベースオブジェクト1 1001に格納されるエントリを特定し、このエントリの情報を取得する。
次いで、問合せ結果生成部122は、ステップ1602及びステップ1603で取得したエントリの情報に基づいて問合せ結果画面1200(図14参照)を生成し、問合せ結果出力部121により、問合せ要求の要求元の端末102に対して問合せ結果画面1200を表示させる(ステップ1604)。
ここで、問合せ結果画面1200には、図14に示すように、問合せ要求の対象のオブジェクト(対象オブジェクト)の格納先情報が表示される対象オブジェクト表示領域1201と、対象オブジェクトにアクセスする前にアクセスしていた前関連オブジェクトの格納先情報が表示される前関連オブジェクト表示領域1202と、対象オブジェクトにアクセスした後にアクセスした前関連オブジェクトの格納先情報が表示される後関連オブジェクト表示領域1203と、対象オブジェクトと前関連オブジェクトとのアクセスの間にアクセスされていたデータベース111のオブジェクト(前外部オブジェクト)の格納先情報を表示する前外部オブジェクト表示領域1204と、前外部オブジェクトにアクセスするために使用された検索キーワードを表示するキーワード表示領域1205と、対象オブジェクトと後関連オブジェクトとのアクセスの間にアクセスされていたデータベース111のオブジェクト(後外部オブジェクト)の格納先情報を表示する後外部オブジェクト表示領域1206と、後外部オブジェクトにアクセスするために使用された検索キーワードを表示するキーワード表示領域1207と、が表示される。
問合せ結果画面1200によると、対象オブジェクトの前に見ていたデータベース130のオブジェクトや、その間にアクセスしたデータベース111のオブジェクトや、使用した検索キーワードを容易かつ適切に確認することができる。このため、対象オブジェクトに至った経過を容易かつ適切に把握することができる。また、問合せ結果画面1200によると、対象オブジェクトの後に見たデータベース130のオブジェクトや、その間にアクセスしたデータベース111のオブジェクトや、使用した検索キーワードを容易かつ適切に確認することができる。このため、対象オブジェクトからどのような経過を辿ったかを容易かつ適切に把握することができる。
次に、プロキシサーバ104のデータ取得部107によるデータ取得管理処理について説明する。
図15は、一実施形態に係るデータ取得管理処理のフローチャートである。
プロキシサーバ104のデータ取得部107は、端末102からデータへのアクセス要求(リクエスト)を受信したか否かを判定する(ステップ1301)。この結果、アクセスのリクエストを受信していない場合(ステップ1301:No)には、データ取得部107は、処理をステップ1301に進める。
一方、アクセスのリクエストを受信した場合(ステップ1301:Yes)には、データ取得部107は、リクエスト対象のデータ(対象データ)がダウンロードデータベース131に格納されているか否かをダウンロードデータ検索部126に問合せる(ステップ1302)。この結果、問合せを受けたダウンロードデータ検索部126は、ダウンロードデータ管理テーブル128を参照して、対象データがダウンロードデータベース131に格納されているか否かを判定し、判定結果をデータ取得部107に返送することとなる。
次いで、データ取得部107は、ダウンロードデータ検索部126からの判定結果に基づいて、対象データがダウンロードデータベース131に格納されているか否かを判定する(ステップ1303)。
この結果、対象データがダウンロードデータベース131に格納されている場合(ステップ1303:Yes)には、データ取得部107は、サーバ112のダウンロードデータ検索部126を介してタウンロードデータベース131から対象データを取得し、リクエスト元の端末102に対象データを送信し(ステップ1304)、処理を終了する。
一方、対象データがダウンロードデータベース131に格納されていない場合(ステップ1303:No)には、データ取得部107は、外部サイト110に対して対象データのアクセスリクエストを送信することにより、データベース111から対象データを取得し、リクエスト元の端末102に対象データを送信し(ステップ1305)、処理を終了する。
上記したデータ取得管理処理によると、ダウンロードデータベース131にダウンロードしているデータに対してのアクセスのリクエストを外部サイト110に送信することがないので、外部サイト110に対して、アクセスするデータについての情報が知られてしまうことを適切に防止することができる。
次に、サーバ112のダウンロードデータ生成部127によるダウンロードデータ生成処理について説明する。
図16は、一実施形態に係るダウンロードデータ生成処理のフローチャートである。
ダウンロードデータ生成部127は、データ来歴テーブル125に基づいて、今後使用される可能性が高いオープンデータを推定する(ステップ1501)。
ここで、今後使用される可能性が高いデータとしては、例えば、検索キーワードとしての出現頻度が高いキーワードがあるデータとしてもよい。また、今後使用される可能性が高いデータとしては、1つの外部サイト110のデータベース111に対する検索キーワードに相当するキーワードにより検索される他の外部サイト110のデータベース111のデータとしてもよい。また、今後使用される可能性が高いデータとしては、実際にユーザによりダウンロードされたデータを検索した際における検索結果に含まれている他のデータとしてもよい。また、今後使用される可能性が高いか否かを判断するにあたっては、例えば、アクセス方法の関連度が高いものほど可能性が高いと判定してもよく、また、時間的関連度が高い(時間差が少ない)ほど可能性が高いと判定してもよい。また、今後使用される可能性が高いか否かは、閲覧頻度や、ダウンロードの頻度等に基づいて、判定してもよい。
次いで、ダウンロードデータ生成部127は、ステップ1501で推定した結果を用いて、第二データベース(データベース111)からダウンロードデータベース131にデータをダウンロードする(ステップ1502)。
次いで、ダウンロードデータ生成部127は、ダウンロードしたデータに対応するエントリをダウンロードデータ管理テーブル128に追加し(ステップ1503)、処理を終了する。
このダウンロードデータ生成処理によると、今後使用される可能性が高いデータをダウンロードデータベース131に予めダウンロードしておくようにするので、以降において端末102から該当するデータへのアクセスのリクエストがあった場合に、外部サイト110のデータベース111にアクセスすることなく、端末102に対して所望のデータを送信することができる。このため、外部サイト110に対して、アクセスするデータについての情報が知られてしまうことを適切に防止することができる。
なお、本発明は、上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で、適宜変形して実施することが可能である。
例えば、上記実施形態では、プロキシサーバ105から端末102のアクセスログを取得するようにしていたが、本発明はこれに限られず、例えば、端末102において外部サイト110に対するアクセスログを記憶しておくようにし、端末102からアクセスログを取得するようにしてもよい。
また、上記実施形態では、サーバ112とストレージ装置129とを別体としていたが、本発明はこれに限られず、ストレージ装置129の構成及び機能をサーバ112内に備えるようにしてもよい。
また、上記実施形態において、CPU(CPU201、301)が行っていた処理の一部又は全部を、専用のハードウェア回路で行うようにしてもよい。また、上記実施形態におけるプログラムは、プログラムソースからインストールされてよい。プログラムソースは、プログラム配布サーバ又は記憶メディア(例えば可搬型の不揮発性記憶メディア)であってもよい。
10…データ活用支援システム、102…端末、104…プロキシサーバ、110…外部サイト、111…データベース、112…サーバ、113…第一メタデータ生成部、114…第一メタデータ、118…第二メタデータ生成部、119…第二メタデータ、121…問合せ結果出力部、122…問合せ結果生成部、123…データ関連情報生成部、125…データ来歴テーブル、127…ダウンロードデータ生成部、129…ストレージ装置、130…データベース、131…ダウンロードデータベース、1200…問合せ結果画面。

Claims (9)

  1. 複数のデータベースのデータの活用を支援するデータ活用支援装置であって、
    第一データベースに対するユーザによるアクセス履歴に基づいて、前記第一データベースのデータに関わる第一メタデータを生成する第一メタデータ生成部と、
    第二データベースに対するユーザによりアクセス履歴に基づいて、前記第二データベースのデータに関わる第二メタデータを生成する第二メタデータ生成部と、
    前記第一メタデータと前記第二メタデータとに基づいて、関連する前記第一データベースのデータと、前記第二データベースのデータとを対応付ける関連情報を生成する関連情報生成部と、
    関連性に関する情報を出力させる対象となる前記第一データベースの所定のデータについての問合せ要求を受信する問合せ受信部と、
    前記関連情報に基づいて、前記第一データベースの前記所定のデータに関連する他のデータを特定し、前記所定のデータと前記関連する他のデータとの関連性に関する情報を出力させる関連情報出力処理部と、
    を備え、
    前記関連情報は、前記第一データベースのデータと、前記第一データベースのデータにアクセスする前にアクセスされた前記第二データベースのデータと、前記第一データベースのデータにアクセスした後にアクセスされた前記第二データベースのデータとを対応付ける情報を含み、
    前記関連情報出力処理部は、前記第一データベースの前記所定のデータの前にアクセスされた前記第二データベースのデータよりも前にアクセスされた前記第一データベースの第一データと、前記第一データベースの前記所定のデータの後にアクセスされた前記第二データベースのデータよりも後にアクセスされた前記第一データベースの第二データと、を前記所定のデータに関連するデータと特定し、前記第一データと前記第二データとを示す情報と、前記第一データと前記所定のデータとのアクセスの間にアクセスされた前記第二データベースのデータ及びこのデータを検索する際に用いた検索条件を示す情報と、前記所定のデータと前記第二データとのアクセスの間にアクセスされた前記第二データベースのデータ及びこのデータを検索する際に用いた検索条件を示す情報と、を含む画面を表示させる
    データ活用支援装置。
  2. 前記第一データベースは、利用可能なユーザが限定されたデータベースであり、
    前記第二データベースは、利用可能なユーザが限定されていないデータベースである
    請求項1に記載のデータ活用支援装置。
  3. 前記第二データベースは、複数存在し、
    前記第二メタデータは、複数の前記第二データベースに対するアクセス時の検索キーワードに対応する検索条件が含まれており、
    前記第二メタデータ生成部は、それぞれの前記第二データベースにおける前記検索キーワードを、前記複数の第二データベース間で統一された表現形式の検索条件に変換する
    請求項1又は請求項2に記載のデータ活用支援装置。
  4. 前記第二データベースに対するアクセス履歴を、ユーザの端末による前記第二データベースへのアクセスを中継するプロキシサーバから取得するアクセス履歴取得部をさらに有し、
    前記第二メタデータ生成部は、前記アクセス履歴取得部により取得されたアクセス履歴に基づいて前記第二メタデータを生成する
    請求項1から請求項のいずれか一項に記載のデータ活用支援装置。
  5. 前記関連情報に基づいて、前記第二データベースから使用可能性が高いデータをダウンロードして、所定の記憶装置に格納するダウンロード処理部と、
    前記ダウンロードされた前記データへのアクセス要求があった場合に、前記記憶装置から前記データを取り出して、アクセス要求元に送信するダウンロードデータ送信部と、をさらに備える
    請求項1から請求項のいずれか一項に記載のデータ活用支援装置。
  6. 前記第二データベースを複数備え、
    前記ダウンロード処理部は、一の前記第二データベースに対するアクセスで使用された検索条件に基づいて、他の前記第二データベースに対して検索を行って得られた検索結果に対応するデータをダウンロードして、前記記憶装置に格納する
    請求項記載のデータ活用支援装置。
  7. 第一データベースと、第二データベースと、前記第一データベース及び前記第二データベースのデータの活用を支援するデータ活用支援装置と、を備えるデータ活用システムであって、
    前記データ活用支援装置は、
    第一データベースに対するユーザによるアクセス履歴に基づいて、前記第一データベースのデータに関わる第一メタデータを生成する第一メタデータ生成部と、
    第二データベースに対するユーザによるアクセス履歴に基づいて、前記第二データベースのデータに関わる第二メタデータを生成する第二メタデータ生成部と、
    前記第一メタデータと前記第二メタデータとに基づいて、関連する前記第一データベースのデータと、前記第二データベースのデータとを対応付ける関連情報を生成する関連情報生成部と、
    関連性に関する情報を出力させる対象となる前記第一データベースの所定のデータについての問合せ要求を受信する問合せ受信部と、
    前記関連情報に基づいて、前記第一データベースの前記所定のデータに関連する他のデータを特定し、前記所定のデータと前記関連する他のデータとの関連性に関する情報を出力させる関連情報出力処理部と、
    を備え、
    前記関連情報は、前記第一データベースのデータと、前記第一データベースのデータにアクセスする前にアクセスされた前記第二データベースのデータと、前記第一データベースのデータにアクセスした後にアクセスされた前記第二データベースのデータとを対応付ける情報を含み、
    前記関連情報出力処理部は、前記第一データベースの前記所定のデータの前にアクセスされた前記第二データベースのデータよりも前にアクセスされた前記第一データベースの第一データと、前記第一データベースの前記所定のデータの後にアクセスされた前記第二データベースのデータよりも後にアクセスされた前記第一データベースの第二データと、を前記所定のデータに関連するデータと特定し、前記第一データと前記第二データとを示す情報と、前記第一データと前記所定のデータとのアクセスの間にアクセスされた前記第二データベースのデータ及びこのデータを検索する際に用いた検索条件を示す情報と、前記所定のデータと前記第二データとのアクセスの間にアクセスされた前記第二データベースのデータ及びこのデータを検索する際に用いた検索条件を示す情報と、を含む画面を表示させる
    データ活用支援システム。
  8. 前記データ活用支援システムは、
    更に、ユーザの端末からの第二データベースに対するアクセスを処理するプロキシサーバと、
    前記第二データベースの一部のデータを記憶する記憶装置と、を備え、
    前記プロキシサーバは、前記端末からのアクセス要求の対象となるデータが前記記憶装置に保存されているか否かを判定し、前記データが前記記憶装置に保存されている場合には、前記記憶装置から前記端末に前記データを返信するように制御する
    請求項に記載のデータ活用支援システム。
  9. 複数のデータベースのデータの活用を支援するデータ活用支援装置によるデータ活用支援方法であって、
    第一データベースに対するユーザによるアクセス履歴に基づいて、前記第一データベースのデータに関わる第一メタデータを生成し、
    第二データベースに対するユーザによりアクセス履歴に基づいて、前記第二データベースのデータに関わる第二メタデータを生成し、
    前記第一メタデータと前記第二メタデータとに基づいて、関連する前記第一データベースのデータと、前記第二データベースのデータとを対応付ける関連情報を生成し、
    関連性に関する情報を出力させる対象となる前記第一データベースの所定のデータについての問合せ要求を受信し、
    前記関連情報に基づいて、前記第一データベースの前記所定のデータに関連する他のデータを特定し、前記所定のデータと前記関連する他のデータとの関連性に関する情報を出力させ
    前記関連情報は、前記第一データベースのデータと、前記第一データベースのデータにアクセスする前にアクセスされた前記第二データベースのデータと、前記第一データベースのデータにアクセスした後にアクセスされた前記第二データベースのデータとを対応付ける情報を含み、
    前記第一データベースの前記所定のデータの前にアクセスされた前記第二データベースのデータよりも前にアクセスされた前記第一データベースの第一データと、前記第一データベースの前記所定のデータの後にアクセスされた前記第二データベースのデータよりも後にアクセスされた前記第一データベースの第二データと、を前記所定のデータに関連するデータと特定し、前記第一データと前記第二データとを示す情報と、前記第一データと前記所定のデータとのアクセスの間にアクセスされた前記第二データベースのデータ及びこのデータを検索する際に用いた検索条件を示す情報と、前記所定のデータと前記第二データとのアクセスの間にアクセスされた前記第二データベースのデータ及びこのデータを検索する際に用いた検索条件を示す情報と、を含む画面を表示させる
    データ活用支援方法。
JP2017228890A 2017-11-29 2017-11-29 データ活用支援装置、データ活用支援システム、及びデータ活用支援方法 Active JP6782219B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017228890A JP6782219B2 (ja) 2017-11-29 2017-11-29 データ活用支援装置、データ活用支援システム、及びデータ活用支援方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017228890A JP6782219B2 (ja) 2017-11-29 2017-11-29 データ活用支援装置、データ活用支援システム、及びデータ活用支援方法

Publications (2)

Publication Number Publication Date
JP2019101533A JP2019101533A (ja) 2019-06-24
JP6782219B2 true JP6782219B2 (ja) 2020-11-11

Family

ID=66973646

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017228890A Active JP6782219B2 (ja) 2017-11-29 2017-11-29 データ活用支援装置、データ活用支援システム、及びデータ活用支援方法

Country Status (1)

Country Link
JP (1) JP6782219B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115269277B (zh) * 2022-09-27 2022-12-27 山东恒辉软件有限公司 一种智慧实验室数据协同综合管理***

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005025665A (ja) * 2003-07-02 2005-01-27 Hitachi Kokusai Electric Inc 顧客アクセス情報通知システム
JP4832952B2 (ja) * 2006-05-10 2011-12-07 三菱電機株式会社 データベース解析システム及びデータベース解析方法及びプログラム
JP4838631B2 (ja) * 2006-05-17 2011-12-14 富士通株式会社 文書アクセス管理プログラム、文書アクセス管理装置および文書アクセス管理方法
JP5315182B2 (ja) * 2009-09-14 2013-10-16 エヌ・ティ・ティ・コムウェア株式会社 情報配信システムおよび情報配信方法
JP4537491B2 (ja) * 2009-09-16 2010-09-01 日立ソフトウエアエンジニアリング株式会社 データ検索システム及びデータ検索方法
JP5493845B2 (ja) * 2009-12-28 2014-05-14 富士通株式会社 検索支援プログラム、検索支援装置、及び検索支援方法
JP5234839B2 (ja) * 2010-06-08 2013-07-10 Necビッグローブ株式会社 コンテンツ管理装置、コンテンツ管理方法およびプログラム
JP2013196088A (ja) * 2012-03-16 2013-09-30 Mitsubishi Electric Corp データ連携装置
JP5781105B2 (ja) * 2013-02-18 2015-09-16 ビッグローブ株式会社 履歴管理システム、及び履歴管理方法
JP6720607B2 (ja) * 2016-03-18 2020-07-08 日本電気株式会社 履歴解析装置、履歴解析方法、履歴解析システム及びプログラム

Also Published As

Publication number Publication date
JP2019101533A (ja) 2019-06-24

Similar Documents

Publication Publication Date Title
JP6410280B2 (ja) ウェブサイト・アクセス方法、装置、およびウェブサイト・システム
US8856168B2 (en) Contextual application recommendations
JP6091579B2 (ja) ウェブページのネストしたフラグメントキャッシングを処理する方法および装置
JP4391943B2 (ja) 分散キャッシュ内でデータを保持するための方法、システム、およびプログラム
US20120290641A1 (en) File Storage Service System, File Management Device, File Management Method, ID Denotative NAS Server and File Reading Method
JP2008146412A (ja) ネットワーク管理システム、ネットワーク管理プログラムおよびネットワーク管理方法
US20110289055A1 (en) Linked Databases
JP2012530292A (ja) コンテンツメッシュ検索
US20220261451A1 (en) Method and system for creating and using persona in a content management system
US10242102B2 (en) Network crawling prioritization
JP2009037501A (ja) 情報検索装置、情報検索方法およびプログラム
US20120005185A1 (en) System and method for locating data feeds
KR101666064B1 (ko) 분산 파일 시스템에서 url정보를 이용한 데이터 관리 장치 및 그 방법
JP6782219B2 (ja) データ活用支援装置、データ活用支援システム、及びデータ活用支援方法
US20090234858A1 (en) Use Of A Single Service Application Instance For Multiple Data Center Subscribers
JP6242087B2 (ja) 文書管理サーバ、文書管理方法、コンピュータプログラム
JP5211180B2 (ja) データベース管理装置、データベース管理プログラム、データベース管理方法、データベース管理システム
JP5143917B2 (ja) キャッシュサーバ、キャッシュ管理方法およびキャッシュ管理プログラム
US11481378B1 (en) Method and system for servicing query requests using document-based metadata
JP2005242760A (ja) 情報検索支援方法並びにこの方法を使用した情報検索支援システムおよびサーバ
CN107609030B (zh) 一种图片管理方法和***
JP2007272444A (ja) コンテンツ管理装置、コンテンツ管理方法およびコンテンツ管理プログラム
US20140280083A1 (en) Event based object ranking in a dynamic system
JP2020095434A (ja) 通信装置、通信方法、および通信プログラム
JP2003150608A (ja) 情報端末装置及び自動巡回プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190422

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200319

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200331

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200424

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200929

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201019

R150 Certificate of patent or registration of utility model

Ref document number: 6782219

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150