JP7153500B2 - データ管理装置およびデータ推奨プログラム - Google Patents

データ管理装置およびデータ推奨プログラム Download PDF

Info

Publication number
JP7153500B2
JP7153500B2 JP2018149842A JP2018149842A JP7153500B2 JP 7153500 B2 JP7153500 B2 JP 7153500B2 JP 2018149842 A JP2018149842 A JP 2018149842A JP 2018149842 A JP2018149842 A JP 2018149842A JP 7153500 B2 JP7153500 B2 JP 7153500B2
Authority
JP
Japan
Prior art keywords
data
recommendation
feature
subscriber
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018149842A
Other languages
English (en)
Other versions
JP2020024645A (ja
Inventor
恵一 中津川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2018149842A priority Critical patent/JP7153500B2/ja
Publication of JP2020024645A publication Critical patent/JP2020024645A/ja
Application granted granted Critical
Publication of JP7153500B2 publication Critical patent/JP7153500B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、加入者に対してデータを推奨する装置およびプログラムに係わる。
近年、データを売買するサービスを提供するデータ流通市場が普及し始めている。データ流通市場の加入者は、自分が保有するデータを市場に提供することができる。また、加入者は、市場に提供されているデータを購入することができる。そして、データ流通市場を活性化するため、或いはデータ流通市場の利用を促進するために、加入者にとって有用なデータを推奨する機能が実用化されている。以下の記載では、加入者にデータを推奨する処理を「リコメンデーション」と呼ぶことがある。
データ流通市場においてデータを管理するデータ管理装置には、加入者から提供されたデータと共に、そのデータの属性を表すメタデータが登録される。メタデータは、データの出所および取得来歴などを表す。一例として、地域Xの温度を表す気候データのメタデータは、センサの種別、センサの設置場所、温度データを取得した時刻などを含む。
リコメンデーションは、メタデータのマッチングを利用して行われる。例えば、地域Xの温度を表す気候データを保有する加入者に対してリコメンデーションを行う際には、データ管理装置は、「地域Xの温度を表す気候データ」に対応するメタデータと類似するメタデータを検索する。そして、データ管理装置は、この検索により得られたメタデータに対応するデータを加入者に推奨する。この場合、例えば、「地域Xの湿度を表す気候データ」あるいは「地域X内のユーザ端末から取得される位置データ」などが加入者に推奨される。
なお、モバイルデバイスのユーザのためのリコメンデーションを生成する方法は、例えば、特許文献1に記載されている。また、特許文献2~3に関連技術が記載されている。
特開2013-058213号公報 特表2010-508592号公報 WO2013/136792
上述のように、従来技術においては、メタデータに基づいてリコメンデーションが行われることがある。しかし、メタデータに基づくリコメンデーションでは、加入者にとって利用価値の低いデータを推奨してしまうおそれがある。
本発明の1つの側面に係わる目的は、データ流通サービスの加入者に対して適切なリコメンデーションを行う装置または方法を提供することである。
本発明の1つの態様のデータ管理装置は、データおよび前記データの属性を表すメタデータを記憶する記憶部と、前記メタデータに基づいて、指定された第1のデータに関連する第2のデータを前記記憶部から抽出するデータ抽出部と、前記第2のデータの少なくとも一部に基づいて、前記第2のデータの特徴を表す特徴データを生成する特徴データ生成部と、前記特徴データに基づいて、前記第2のデータの推奨度を決定する推奨処理部と、前記第2のデータの推奨度を表す情報を含む推奨情報を出力する出力部と、を備える。
上述の態様によれば、データ流通サービスの加入者に対して適切なリコメンデーションを行うことができる。
データ管理装置の一例を示す図である。 推奨候補データを検索する手順の一例を示す図である。 特徴データを抽出する手順の一例を示す図である。 特徴データを抽出する手順の他の例を示す図である。 推奨情報の一例を示す図である。 推奨情報の他の例を示す図である。 データ管理装置の処理の一例を示すフローチャートである。 データ管理装置の処理の他の例を示すフローチャートである。 データ管理装置のハードウェア構成の一例を示す図である。 第2の実施形態に係わるデータ流通システムの一例を示す図である。 第2の実施形態におけるリコメンデーションシーケンスの一例を示す図である。
図1は、本発明の実施形態に係わるデータ管理装置の一例を示す。データ管理装置10は、図1に示すように、記憶部11、データ抽出部12、特徴データ生成部13、特徴データ変換部14、推奨処理部15、および出力部16を備える。そして、データ管理装置10は、データ流通市場において売買されるデータを管理し、加入者に対してデータの購入に係わるリコメンデーションを行う。なお、データ管理装置10は、図1に示していない他の機能または要素を備えていてもよい。
記憶部11は、加入者情報、データ、メタデータ、特徴データを記憶する。ただし、記憶部11は、図1に示していない他のデータ及び/又は情報を記憶してもよい。
加入者情報は、データ流通サービスに加入するユーザ(すなわち、加入者)に係わる情報を表す。加入者は、データ流通市場を介してデータを販売するユーザおよびデータ流通市場を介してデータを購入するユーザを含む。データは、加入者から提供される。図1に示す例では、データA~Nが記憶部1に記憶されている。メタデータは、対応するデータの属性を表す。即ち、メタデータA~Nは、それぞれデータA~Nの属性情報を表す。なお、メタデータは、データを提供する加入者によって作成されてもよいし、データ流通サービスの管理者によって作成されてもよいし、データ管理装置10により自動的に作成されるようにしてもよい。特徴データは、データの特徴を表す。なお、特徴データは、データ管理装置10がリコメンデーションを行うときに、データ抽出部12により抽出されたデータに対して特徴データ生成部13により生成される。
データ抽出部12は、データを購入することが期待される加入者に対して推奨すべきデータを記憶部11から抽出する。以下の記載では、データを購入することが期待される加入者を「対象加入者」と呼ぶことがある。また、対象加入者に対して推奨するデータの候補を「推奨候補データ(または、購入候補者)」と呼ぶことがある。
データ抽出部12は、加入者情報およびメタデータを参照して記憶部11から推奨候補データを抽出する。このとき、データ抽出部12は、特定の加入者に対して自律的にリコメンデーションを行ってもよいし、データ管理装置10の外部から与えられるトリガに応じてリコメンデーションを行ってもよい。例えば、データ管理装置10が自律的に加入者Xに対してリコメンデーションを行うときは、データ抽出部12は、メタデータおよび加入者Xの加入者情報に基づいて推奨候補データを抽出してもよい。加入者Yが過去にデータ流通市場にデータYを提供しているとき、或いは、加入者Yが過去にデータ流通市場からデータYを購入しているときは、データ抽出部12は、データYのメタデータおよび加入者Yの加入者情報に基づいて、加入者Yのための推奨候補データを抽出してもよい。加入者Zが購入したいデータの検索を行ったときは、データ抽出部12は、メタデータおよび加入者Zの加入者情報に加えて、加入者Zにより指定された検索条件に基づいて、加入者Zのための推奨候補データを抽出してもよい。
特徴データ生成部13は、データ抽出部12により抽出されたデータ(すなわち、推奨候補データ)の少なくとも一部に基づいて、その推奨候補データの特徴を表す特徴データを生成する。ここで、特徴データは、推奨候補データの数値または内容に基づいて生成される。そして、特徴データ生成部13により生成された特徴データは、記憶部11に記憶される。下記に特徴データの例を列挙する。
(1)基本統計量(平均値、分散、標準偏差、最小値、最大値、中央値、最頻値、範囲、合計など)
(2)データの分布(ヒストグラム)
(3)所定の範囲を超える外れ値およびその個数
(4)時間ごとのデータ数
(5)時系列データの場合、時系列解析により得られる特性(周期変化、トレンド変化、ランダム変化など)
(6)データ間の相関(時系列データの場合、所定の時間間隔でデータを分割して相関を算出してもよい)
(7)クラスタ数(例えば、クラスタリング手法の1つであるk-meansにおいては、最適クラスタ数の推定方法としてx-meansおよびエルボー法が公知である)
特徴データ変換部14は、特徴データ生成部13により生成された特徴データを、推奨候補データ中の数値を含まない特徴データに変換する。このとき、特徴データ変換部14は、特徴データ生成部13により生成された特徴データを、推奨候補データ中の数値情報を含むことなく推奨候補データの特徴を表す画像に変換してもよい。下記に特徴データ画像の例を列挙する。
(1)点グラフ
(2)線グラフ
(3)棒グラフ
(4)帯グラフ
(5)面グラフ
(6)レーダーチャート
(7)ヒストグラム
(8)箱ひげ図
(9)散布図
(10)ヒートマップ
なお、データ管理装置10は、特徴データ変換部14を備えていなくてもよい。
推奨処理部15は、特徴データ生成部13により生成された特徴データに基づいて、推奨候補データの推奨度を決定する。データ抽出部12により複数の推奨候補データが抽出されたときは、推奨処理部15は、各推奨候補データの推奨度を決定し、各推奨候補データに対して順位付けを行ってもよい。そして、推奨処理部15は、推奨候補データの推奨度を表す情報を含む推奨情報を作成する。推奨情報は、推奨度以外の情報を含んでいてもよい。
出力部16は、推奨処理部15により作成される推奨情報を出力する。このとき、出力部16は、推奨情報に加えて、特徴データ変換部14により得られる、推奨候補データ中の数値情報を含まない特徴データを出力してもよい。
なお、図1に示す例では、加入者から提供されたデータおよびそのメタデータは、データ管理装置10内に記憶されるが、本発明はこの構成に限定されるものではない。すなわち、加入者から提供されたデータおよびそのメタデータは、データ管理装置10の外部に接続される記憶装置に記憶されるようにしてもよい。
<第1の実施形態>
図2は、推奨候補データを検索する手順の一例を示す。この実施例では、加入者IDとして「S01」が割り当てられている加入者に対してリコメンデーションが行われるものとする。なお、以下の記載では、加入者IDとして「S01」が割り当てられている加入者を「加入者S01」と呼ぶことがある。
各加入者についての加入者情報は、上述したように、記憶部11に記憶されている。この実施例では、加入者情報は、加入者ID、加入者の名称、加入者の住所、加入者の業種およびジャンル、提供データ、購入データを表す。なお、提供データは、加入者が過去にデータ流通市場に提供したデータを表す。また、購入データは、加入者が過去にデータ流通市場から購入したデータを表す。この実施例では、加入者S01は、過去に、データ流通市場にデータを提供している。このデータには、データIDとして「D01」が付与されている。以下の記載では、加入者S01により提供されたデータを「データD01」と呼ぶことがある。
加入者S01により提供されたデータD01およびデータD01の属性を表すメタデータは、記憶部11に記憶されている。データD01は、この実施例では、FFショップにおける衣料品の販売データを表す。販売データは、POS(Point of Sale)システムにより収集されたPOSデータである。
データD01のメタデータは、この実施例では、データID、提供者、登録日、種別、取得機器、取得場所、データ項目を表す。提供者は、データD01を提供した加入者を表す。登録日は、データD01がデータ流通市場に登録された年月日(あるいは、データD01がデータ管理装置10の記憶部11に記憶された年月日)を表す。種別は、データD01の種別を表す。取得機器は、データD01を取得した機器を表す。取得場所は、データD01を取得した場所を表す。データ項目は、データD01を構成するデータ個目を表す。以下の記載では、データD01の属性を表すメタデータを「メタデータD01」と呼ぶことがある。なお、メタデータを構成する項目は、必ずしもすべてのデータに対して同じである必要はない。
データ管理装置10が加入者S01に対してリコメンデーションが行うときは、データ抽出部12は、加入者S01の加入者情報において提供データおよび購入データを取得する。この実施例では、加入者情報は、加入者S01が過去にデータD01を提供していることを表している。この場合、データ抽出部12は、データD01に関連するデータが加入者S01にとって有用であると判定する。よって、データ抽出部12は、記憶部11からデータD01の属性を表すメタデータ(すなわち、メタデータD01)を取得する。
ここで、データ抽出部12は、メタデータD01の種別を参照することにより、データD01が「衣料」および「販売記録」に係わることを認識する。また、データ抽出部12は、メタデータD01の取得場所を参照することにより、データD01が「有楽町」において取得されたことを認識する。
続いて、データ抽出部12は、メタデータD01に基づいてデータD01に関連するデータを検索するためのキーワードを決定する。この実施例では、「衣料」および「販売記録」に基づくキーワードとして「人」「顧客」および「プロモーション」が得られるものとする。また、「有楽町」に基づくキーワードとして「有楽町」が得られるものとする。なお、関連するデータを検索するためのキーワードは、例えば、予め作成されているデータベースまたはテーブルを参照することで得られる。この場合、データベースまたはテーブルは、記憶部11に記憶されていてもよいし、ネットワーク上のサーバに格納されていてもよい。
そして、データ抽出部12は、これらのキーワードを用いて記憶部11に記憶されているメタデータを検索する。この場合、例えば、「人or顧客orプロモーション」and「有楽町」で検索が行われる。この結果、この実施例では、「人」および「有楽町」を含むメタデータとして、図3に示すデータD02に対応するメタデータD02、および図4に示すデータD03に対応するメタデータD03が得られる。
メタデータD02は、データD02の属性情報を表す。メタデータD02によれば、データD02は、図3に示すように、以下の属性を有する。
(1)データD02は、2018年3月15日に加入者S02により提供された。
(2)データD02は、「人」および「位置情報」に係わる。
(3)データD02は、有楽町エリアにおいてモバイル端末により取得された。
(4)データD02は、各ユーザの年齢、性別、位置(GPS情報)、および位置情報が検出された日時を表す。
また、メタデータD03は、データD03の属性情報を表す。メタデータD03によれば、データD03は、図4に示すように、以下の属性を有する。
(1)データD03は、2018年2月15日に加入者S03により提供された。
(2)データD03は、「人」および「位置情報」に係わる。
(3)データD03は、有楽町エリアにおいてモバイル端末により取得された。
(4)データD03は、各ユーザの年齢、性別、位置(GPS情報)、および位置情報が検出された日時を表す。
このように、データ抽出部12は、加入者S01により提供されたデータD01の属性を表すメタデータD01に基づいて検索キーワードを決定し、これらのキーワードを含むメタデータを検索する。この結果、図3に示すメタデータD02および図4に示すメタデータD03が得られる。そして、データ抽出部12は、この検索結果に応じて、記憶部11から推奨候補データを抽出する。すなわち、推奨候補データとして、メタデータD02により表されるデータD02およびメタデータD03により表されるデータD03が抽出される。
次に、図3~図4を参照しながら、特徴データ生成部13の処理を説明する。特徴データ生成部13は、データ抽出部12により抽出された推奨候補データの特徴を表す特徴データを生成する。この実施例では、推奨候補データとして、図3に示すデータD02および図4に示すデータD03が抽出されている。そして、特徴データ生成部13は、データD02、D03について「人の年齢および性別に関する特徴」および「人の位置に関する特徴」を検出する。
特徴データ生成部13は、図3に示すように、データD02の「年齢」および「性別」についての数値情報に基づいて、各年代/各性別の人数をカウントして度数を集計する。例えば、下記の各年代/各性に属する人の数がカウントされる。
(1)20歳未満の女性
(2)20歳未満の男性
(3)20~29歳の女性
(4)20~29歳の男性
(5)30~39歳の女性
(6)30~39歳の男性
(7)40~49歳の女性
(8)40~49歳の男性
(9)50~59歳の女性
(10)50~59歳の男性
(11)60歳以上の女性
(12)60歳以上の男性
そして、特徴データ生成部13は、各度数(すなわち、各年代/各性別の人数)を合計人数で割算することにより、各年代/各性別について正規化された度数値を計算する。この結果、各年代/各性別の人数の分布を表すヒストグラムが生成される。加えて、特徴データ生成部13は、この分布の標準偏差を計算する。この実施例では、標準偏差は0.8である。
また、特徴データ生成部13は、対象エリアを複数のブロックに分割し、データD02の「位置」についての数値情報に基づいて、各ブロック内に位置する人数をカウントする。なお、各ユーザの位置がGPSの経度/緯度で表されている場合には、対象エリアは、経度および緯度に基づいて複数のブロックに分割される。そして、特徴データ生成部13は、各度数(すなわち、各ブロック内に位置する人の数)を合計人数で割算することにより、各ブロックについて正規化された度数値を計算する。この結果、各ブロック内に位置する人の数の分布を表すヒストグラムが生成される。加えて、特徴データ生成部13は、この分布の標準偏差を計算する。この実施例では、標準偏差は0.4である。
同様に、特徴データ生成部13は、図4に示すように、データD03について各年代/各性別の人数の分布を表すヒストグラムを作成し、その標準偏差を計算する。また、特徴データ生成部13は、データD03について各ブロック内に位置する人の数の分布を表すヒストグラムを作成し、その標準偏差を計算する。
このように、特徴データ生成部13は、推奨候補データ(データD02、D03)の特徴を表す特徴データを生成する。そうすると、特徴データ変換部14は、特徴データ生成部13により生成された特徴データを、推奨候補データ中の数値情報を含まない特徴データに変換する。このとき、特徴データ変換部14は、推奨候補データの数値情報を含まない画像を生成してもよい。例えば、特徴データとしてヒストグラムが生成されたときは、特徴データ変換部14は、そのヒストグラムから「値」を除去することにより、値が表示されないヒストグラムを作成する。具体的には、特徴データとして人の位置の分布を表すグラフが生成されたときは、そのグラフから緯度および経度の情報が除去される。この結果、「人の分布のばらつきの程度を認識できるが、人が集中している位置を特定できないグラフ」が得られる。
このように、特徴データ生成部13は、各推奨候補データ(データD02、D03)の特徴を表す特徴データを生成し、特徴データ変換部14は、推奨候補データ中の数値情報を含まない特徴データを作成する。そうすると、推奨処理部15は、特徴データ生成部13により生成された特徴データに基づいて、推奨候補データについての推奨情報を生成する。
推奨処理部15は、加入者S01により提供されたデータのメタデータに基づいて、加入者S01が興味を示しそうな「テーマ(または、データの使用目的、用途)」を推定する。例えば、推奨処理部15は、図2に示すメタデータD01を参照することにより、加入者S01が有楽町ビルにおいて衣料品を販売していると推定する。この場合、推奨処理部15は、加入者S01が有楽町エリアの人の分布に興味を示すであろう、と推定する。この実施例では、推奨処理部15は、加入者S01が下記のテーマに興味を示すと推定する。
(1)有楽町周辺の潜在顧客の分析
(2)有楽町ビル周辺の人通りの分析
続いて、推奨処理部15は、各テーマについて、推奨候補データの推奨度を決定する。例えば「有楽町周辺の潜在顧客の分析」においては、「年齢」および「性別」についての分布の偏りが小さいことが好ましい。したがって、推奨処理部15は、各年代/各性別についての度数の偏差値が0.1であるデータD03に対して高い推奨度を与え、その偏差値が0.8であるデータD02に対して低い推奨度を与える。
また、「有楽町ビル周辺の人通りの分析」においては、「位置」についての分布の偏りが小さいことが好ましい。したがって、推奨処理部15は、経度/緯度で表される各ブロックについての度数の偏差値が0.4であるデータD02に対して高い推奨度を与え、その偏差値が0.7であるデータD03に対して低い推奨度を与える。
このように、推奨処理部15は、加入者S01に係わる各テーマについて、推奨候補データの推奨度を決定する。そうすると、出力部16は、推奨候補データの推奨度を表す情報を含む推奨情報を出力する。すなわち、出力部16は、推奨処理部15により生成された推奨情報を加入者S01に提示する。
図5~図6は、推奨情報の実施例を示す。なお、出力部16は、図5~図6に示す推奨情報を加入者S01の端末に送信する。そうすると、加入者S01の端末に推奨情報が表示される。
図5に示す実施例では、推奨情報は「有楽町周辺の潜在顧客の分析」に適したデータを推奨している。具体的には、「有楽町周辺の潜在顧客の分析」を行うために最も適したデータとして「データD03」が推奨されている。加えて、データD03の特徴として「年代、性別の偏りが小さく、ターゲットの客層が広い場合に適しています。」とのコメントが付与されている。このコメントは、「有楽町周辺の潜在顧客の分析」においてデータD03の特徴データ(各年代/各性別の人数の分布)を分析することにより生成される。
「有楽町周辺の潜在顧客の分析」を行うために2番目に適したデータとして「データD02」が推奨されている。加えて、データD02の特徴として「若年層のデータが多く、ターゲットの客層が若年層の場合に適しています。」とのコメントが付与されている。このコメントは、「有楽町周辺の潜在顧客の分析」においてデータD02の特徴データ(各年代/各性別の人数の分布)を分析することにより生成される。
さらに、各推奨候補データD02、D03について、年齢および性別の分布を表すヒストグラムも付与されている。ただし、このヒストグラムのデータの数値は、特徴データ変換部14により除去されている。
図6に示す実施例では、推奨情報は「有楽町ビル周辺の人通りの分析」に適したデータを推奨している。具体的には、「有楽町ビル周辺の人通りの分析」を行うために最も適したデータとして「データD02」が推奨されている。加えて、データD02の特徴として「位置情報の偏りが小さく、人の流れや人通り量の分析などに適しています。」とのコメントが付与されている。このコメントは、「有楽町ビル周辺の人通りの分析」においてデータD02の特徴データ(各ブロック内に位置する人の数の分布)を分析することにより生成される。
「有楽町ビル周辺の人通りの分析」を行うために2番目に適したデータとして「データD03」が推奨されている。加えて、データD03の特徴として「位置情報の偏りが大きく、混雑や密集スポットの分析などに適しています。」とのコメントが付与されている。このコメントは、「有楽町ビル周辺の人通りの分析」においてデータD03の特徴データ(各ブロック内に位置する人の数の分布)を分析することにより生成される。
さらに、各推奨候補データD02、D03について、位置情報の分布を表すヒストグラムも付与されている。ただし、このヒストグラムのデータの数値は、特徴データ変換部14により除去されている。
図7は、データ管理装置10の処理の一例を示すフローチャートである。データ管理装置10は、加入者に対してデータの購入に係わるリコメンデーションを行う。
S1において、データ管理装置10は、加入者によるデータ検索を検出する。データ検索は、例えば、データ流通サービスを提供するサイトに検索条件が入力されたときに検出される。そして、データ管理装置10は、データ検索を受け付けると、そのデータ検索を行った加入者に対してS2~S9の推奨処理を実行する。以下の記載では、S1のデータ検索を行った加入者を「対象加入者」と呼ぶことがある。
なお、データ管理装置10は、データ流通サービスの加入者の中から自律的に対象加入者を選択し、その対象加入者に対してS2~S9の推奨処理を実行してもよい。或いは、データ管理装置10は、他のトリガに起因して推奨処理を開始してもよい。例えば、ある加入者がデータ流通市場にデータを提供したとき、或いは、ある加入者がデータ流通市場からデータを購入したときに、その加入者に対して推奨処理を実行してもよい。
S2において、データ抽出部12は、加入者情報を参照し、対象加入者の所有データを特定する。例えば、ある加入者の加入者情報において「提供データ」または「購入データ」として記録されているデータは、その加入者により所有されていると判定される。図2に示す例では、加入者S01の加入者情報に基づいて、加入者S01がデータD01を所有していると判定される。なお、対象加入者が複数のデータを所有しているときは、データ管理装置10は、各所有データに対してS3~S9の処理を実行する。
S3において、データ抽出部12は、対象加入者の所有データについてのメタデータを参照し、推奨候補データを抽出するための検索キーワードを決定する。図2に示す例では、メタデータD01が参照され、検索キーワード「人」「顧客」「プロモーション」「有楽町」が抽出されている。なお、データ抽出部12は、メタデータD01およびS1で受け付けたデータ検索の内容に基づいて検索キーワードを決定してもよい。
S4において、データ抽出部12は、S3で決定した検索キーワードを利用して、記憶部11に記憶されている全メタデータを検索し、対象加入者の所有データに関連する推奨候補データを抽出する。図3~図4に示す例では、推奨候補データとしてデータD02およびデータD03が抽出されている。なお、対象加入者の所有データは、推奨候補データから除外される。
S5において、特徴データ生成部13は、各推奨候補データの特徴データを生成する。特徴データは、各推奨候補データの数値情報および内容に基づいて生成される。図3~図4に示す例では、特徴データとして、ヒストグラム(または、分布図)が作成され、標準偏差が計算されている。
S6において、推奨処理部15は、特徴データに基づいて推奨候補データの推奨度を決定する。図3~図6に示す例では、データの偏り(すなわち、標準偏差)に基づいて、推奨候補データの推奨度が決定されている。このとき、対象加入者が興味を示しそうなテーマ(又は、目的、用途)毎に、推奨候補データの推奨度が決定されるようにしてもよい。そして、推奨処理部15は、推奨候補データの推奨度を表す情報を含む推奨情報を作成する。加えて、図5~図6に示す例では、特徴データを分析することにより、推奨情報として、推奨候補データに好適な用途を提案するコメントが生成されている。
S7において、特徴データ変換部14は、特徴データ生成部13により生成された特徴データを、推奨候補データ中の数値情報を含まない特徴データに変換する。この変換により、推奨候補データの概要を表すが、その詳細な内容までは表していない特徴データが作成される。
S8において、出力部15は、推奨候補データについての推奨情報および変換後の特徴データを対象加入者に提示する。このとき、推奨情報および特徴データは、対象加入者の端末に送信される。
S9において、データ管理装置10は、すべての所有データについてリコメンデーションが完了しているか否かを判定する。そして、リコメンデーションが実行されていない所有データが残っているときは、データ管理装置10の処理はS3に戻る。すなわち、対象加入者の各所有データに対してS3~S8の処理が実行される。
なお、図7に示すフローチャートにおいて、S3~S5の処理は、他の処理から独立して実行されるようしてもよい。すなわち、S3~S5の処理は、加入者からデータ管理装置10へのアクションを契機とせずに実行されるようにしてもよい。例えば、ある加入者がデータ流通市場にデータを提供したとき、或いは、ある加入者がデータ流通市場からデータを購入したときに、データ管理装置10は、その加入者に対してS3~S5の処理を実行して特徴データを作成しておいてもよい。また、データ管理装置10は、S6の前にS7を実行してもよい。
このように、第1の実施形態によれば、対象加入者の所有データに関連する推奨候補データの特徴を表す特徴データが生成される。そして、この特徴データを分析することにより推奨候補データの推奨度が決定され、対象加入者に提示される。したがって、対象加入者に対して精度の高いリコメンデーションが実現される。すなわち、対象加入者にとって有用なデータが推奨される。
図8は、データ管理装置の処理の他の例を示すフローチャートである。図8に示す方法では、図7に示すS2~S4の代わりに、S11~S12が実行される。
S11では、データ抽出部12は、対象加入者の加入者情報および対象加入者から入力された検索キーワードに基づいて、メタデータを検索するための検索キーワードを決定する。S12において、データ抽出部12は、記憶部11に記憶されている全メタデータを検索し、対象加入者に推奨すべき推奨候補データを抽出する。よって、図8に示す方法によれば、データを所有していない加入者に対してもリコメンデーションを行える。
図9は、データ管理装置10のハードウェア構成の一例を示す。ここで、データ管理装置10は、ソフトウェアプログラムを実行するコンピュータにより実現され得る。データ管理装置10を実現するコンピュータ100は、図9に示すように、プロセッサ101、主記憶装置102、入力装置103、出力装置104、補助記憶装置105、着脱可能記録媒体駆動装置106、ネットワークインタフェース107を備える。
プロセッサ101は、例えばCPU(Central Processing Unit)であり、補助記憶装置105または着脱可能記録媒体111に保持されているプログラムを主記憶装置102にロードして実行する。プロセッサ101により実行されるプログラムは、データ推奨プログラムを含む。データ推奨プログラムは、データ抽出部12、特徴データ生成部13、特徴データ変換部14、推奨処理部15による処理の手順を記述する。よって、プロセッサ101がデータ推奨プログラムを実行することにより、データ抽出部12、特徴データ生成部13、特徴データ変換部14、推奨処理部15の機能が実現される。なお、プロセッサ101は、複数のプロセッサエレメントにより構成されてもよい。
主記憶装置102は、プロセッサ101に記憶領域および作業領域を提供する。主記憶装置102は、例えば、半導体メモリにより実現される。
入力装置103は、ユーザにより入力される指示をプロセッサ101に与える。入力装置103は、例えば、キーボード、マウス等のポインティングデバイス、タッチパネル等により実現される。なお、ネットワークインタフェース107を介して指示および/またはデータがプロセッサ101に与えられるときは、コンピュータ100は入力装置103を備えていなくてもよい。
出力装置104は、プロセッサ101の処理結果を出力する。出力装置104は、例えば、表示装置、プリンタ、スピーカ等の音声出力装置により実現される。なお、プロセッサ101の処理結果がネットワークインタフェース107を介して出力されるときは、コンピュータ100は出力装置104を備えていなくてもよい。
補助記憶装置105は、オペレーティングシステム、アプリケーションプログラム(データ推奨プログラムを含む)を記憶する。また、補助記憶装置105は、プロセッサ101が使用するデータを記憶する。補助記憶装置105は、不揮発性の記憶装置で実現されることが好ましい。不揮発性の記憶装置は、EPROM(Erasable Programmable ROM)、HDD(Hard Disc Drive)などを含む。なお、補助記憶装置105は、コンピュータ100の外部に接続されてもよい。
着脱可能記録媒体駆動装置106は、着脱可能記録媒体111からアプリケーションプログラム(データ推奨プログラムを含む)およびデータを読み出してプロセッサ101に出力する。なお、着脱可能記録媒体111は、例えば、半導体メモリ、光学的作用により信号を入力/出力し得る記録媒体、磁気的作用により信号を入力/出力し得る記録媒体により実現される。
ネットワークインタフェース107は、ネットワークに信号を送信し、また、ネットワークから信号を受信する。ネットワークインタフェース107は、無線リンクを介してネットワークに接続してもよいし、有線リンクを介してネットワークに接続してもよい。ネットワークインタフェース107は、例えば、NIC(Network Interface Card)、無線LANカードにより実現される。なお、ネットワーク上のプログラムサーバによりデータ推奨プログラムが提供されるときは、コンピュータ100は、ネットワークインタフェース107を介してプログラムサーバからデータ推奨プログラムを取得してもよい。
<第2の実施形態>
図10は、本発明の第2の実施形態に係わるデータ流通システムの一例を示す。データ流通システム200は、図10に示すように、複数のデータ管理装置10(10a、10b)を備える。複数のデータ管理装置10は、この実施例では、広域ネットワーク30を介して接続されている。
各データ管理装置10には、加入者端末20が接続され得る。図10に示す例では、データ管理装置10aに加入者端末20a、20bが接続されており、データ管理装置10bに加入者端末20c、20dが接続されている。
データ管理装置10は、加入者からデータ流通市場に提供されるデータのメタデータを管理する。メタデータは、加入者により作成されてもよいし、データ管理装置10により作成されてもよい。図10に示す例では、データ管理装置10aは、加入者端末20bから提供されるデータD1のメタデータを取得する。データ管理装置10bは、加入者端末20c、20dからそれぞれ提供されるデータD2、D3のメタデータを取得する。
データ管理装置10a、10bは、メタデータを共有する。例えば、データ管理装置10aは、データD1のメタデータを取得すると、そのメタデータをデータ管理装置10bに通知する。同様に、データ管理装置10bは、データD2、D3のメタデータを取得すると、それらのメタデータをデータ管理装置10aに通知する。したがって、データ管理装置10a、10bは、同じメタデータ(D1、D2、D3...)を管理する。なお、メタデータは、データ管理装置10a、10b間でブロックチェーン技術を使用して転送および管理されるようにしてもよい。
データ流通市場において実際に売買されるデータは、各加入者端末20により保持される。すなわち、データ管理装置10は、各データのメタデータを保持するが、データ自体は保持しない。
上記構成のデータ流通システム200において、データ管理装置10は、加入者に対してリコメンデーションを行う。図11に示す例では、加入者端末20aのユーザに対してリコメンデーションが行われる。なお、データ管理装置10a、10bは、メタデータを共有している。
加入者端末20aのユーザに対するリコメンデーションは、この実施例では、加入者端末20aが接続されるデータ管理装置10aにより実行される。なお、データ管理装置10aは、加入者端末20aからデータ購入に係わる検索を受け付けたときに、図7または図8に示す推奨処理を開始してもよい。ただし、データ管理装置10aは、自発的に推奨処理を開始してもよい。
データ管理装置10aは、加入者端末20aのユーザのための推奨候補データを抽出する。このとき、例えば、図7に示すS2~S4の処理、または、図8に示すS11~S12の処理が実行される。そして、データ管理装置10aは、推奨候補データを取得する。この実施例では、推奨候補データが、加入者端末20cに保持されているデータD2であるものとする。また、データ管理装置10aは、データ流通市場に提供されているデータがそれぞれどの加入者端末に保持されているのかを認識しているものとする。
この場合、データ管理装置10aは、加入者端末20cに対してデータD2の送信を要求する。そうすると、加入者端末20cは、データD2をデータ管理装置10aに送信する。
データ管理装置10aは、データD2を解析することにより推奨情報を生成する。このとき、例えば、図7または図8に示すS5~S7の処理が実行される。そして、データ管理装置10aは、生成した推奨情報を加入者端末20aに送信する。
あるいは、データ管理装置10aは、データD2を解析することにより推奨情報を生成する処理を、データ管理装置10bへ依頼してもよい。この場合、この依頼を受けたデータ管理装置10bにおいて、例えば、図7または図8に示すS5~S7の処理が実行される。そして、データ管理装置10bは、生成した推奨情報をデータ管理装置10aへ通知し、データ管理装置10aは、データ管理装置10bから通知された推奨情報を加入者端末20aに送信するようにしてもよい。
加入者端末20aのユーザは、推奨情報により推奨されているデータD2を購入するときは、データ管理装置10aに対して購入リクエストを送信する。そうすると、データ管理装置10aは、購入リクエストに応じて加入者端末20aにデータD2を送信する。この後、データ管理装置10aは、セキュリティを確保するために、データ管理装置10a内の記憶装置からデータD2を削除してもよい。
このように、第2の実施形態では、加入者に対してリコメンデーションを行うデータ管理装置10は、データ流通市場において実際に売買されるデータを保持することなく、各データのメタデータを保持する。また、各データ管理装置10は、第1の実施形態と同様に、メタデータだけでなく、データの特徴を表す特徴データを利用してリコメンデーションを行う。よって、データ流通システム200は、セキュリティを確保しながら加入者に対して精度の高いリコメンデーションを行うことができる。
上述の実施例を含む実施形態に関し、さらに下記の付記を開示する。
(付記1)
データおよび前記データの属性を表すメタデータを記憶する記憶部と、
前記メタデータに基づいて、指定された第1のデータに関連する第2のデータを前記記憶部から抽出するデータ抽出部と、
前記第2のデータの少なくとも一部に基づいて、前記第2のデータの特徴を表す特徴データを生成する特徴データ生成部と、
前記特徴データに基づいて、前記第2のデータの推奨度を決定する推奨処理部と、
前記第2のデータの推奨度を表す情報を含む推奨情報を出力する出力部と、
を備えるデータ管理装置。
(付記2)
前記推奨処理部は、前記第2のデータの使用目的に基づいて前記特徴データを分析することにより、前記第2のデータの推奨度を決定する
ことを特徴とする付記1に記載のデータ管理装置。
(付記3)
前記推奨処理部は、前記データ抽出部が前記第2のデータを抽出するために使用したメタデータに基づいて、前記第2のデータの使用目的に係わるテーマを決定し、決定したテーマに基づいて前記特徴データを分析することにより、前記第2のデータの推奨度を決定する
ことを特徴とする付記2に記載のデータ管理装置。
(付記4)
前記推奨処理部は、前記特徴データを分析することにより、前記第2のデータの特徴についてのコメントを生成し、
前記出力部は、前記第2のデータの推奨度を表す情報および前記コメントを含む推奨情報を出力する
ことを特徴とする付記1に記載のデータ管理装置。
(付記5)
前記特徴データ生成部により生成された特徴データを、前記第2のデータ中の数値を含まない特徴データに変換する特徴データ変換部をさらに備え、
前記出力部は、前記特徴データ変換部により変換された特徴データを出力する
ことを特徴とする付記1に記載のデータ管理装置。
(付記6)
前記特徴データ変換部は、前記特徴データ生成部により生成された特徴データを、前記第2のデータ中の数値を含まない画像で表される特徴データに変換する
ことを特徴とする付記5に記載のデータ管理装置。
(付記7)
前記データ抽出部は、加入者からデータ検索を受け付けたときは、前記メタデータおよび前記データ検索の内容に基づいて前記第2のデータを抽出する
ことを特徴とする付記1に記載のデータ管理装置。
(付記8)
前記出力部は、前記第1のデータを所有する加入者に対して前記推奨情報を提示する
ことを特徴とする付記1に記載のデータ管理装置。
(付記9)
データを記憶する記憶部と、
加入者からデータ検索を受け付けたときに、前記データ検索の内容に基づいて前記記憶部から検索結果データを抽出するデータ抽出部と、
前記検索結果データの少なくとも一部に基づいて、前記検索結果データの特徴を表す特徴データを生成する特徴データ生成部と、
前記特徴データに基づいて、前記検索結果データの推奨度を決定する推奨処理部と、
前記検索結果データの推奨度を表す情報を含む推奨情報を前記加入者に提示する出力部と、
を備えるデータ管理装置。
(付記10)
記憶装置に記憶されているデータの属性を表すメタデータに基づいて、指定された第1のデータに関連する第2のデータを前記記憶部から抽出し、
前記第2のデータの少なくとも一部に基づいて、前記第2のデータの特徴を表す特徴データを生成し、
前記特徴データに基づいて、前記第2のデータの推奨度を決定し、
前記第2のデータの推奨度を表す情報を含む推奨情報を出力する、
処理をコンピュータに実行させるデータ推奨プログラム。
10(10a、10b) データ管理装置
11 記憶部
12 データ抽出部
13 特徴データ生成部
14 特徴データ変換部
15 推奨処理部
16 出力部
20(20a~20d) 加入者端末
101 プロセッサ

Claims (6)

  1. データおよび前記データの属性を表すメタデータを記憶する記憶部と、
    前記メタデータに基づいて、指定された第1のデータに関連する第2のデータを前記記憶部から抽出するデータ抽出部と、
    前記第2のデータの少なくとも一部に基づいて、前記第2のデータの特徴を表す特徴データを生成する特徴データ生成部と、
    前記特徴データに基づいて、前記第2のデータの推奨度を決定する推奨処理部と、
    前記特徴データを、前記第2のデータ中の数値を含まない特徴データに変換する特徴データ変換部と、
    前記第2のデータの推奨度を表す情報および前記特徴データ変換部により変換された特徴データを含む推奨情報を出力する出力部と、
    を備えるデータ管理装置。
  2. 前記推奨処理部は、前記第1のデータのメタデータに基づいて前記第1のデータに係わる加入者が興味を示しそうなテーマを推定し、推定したテーマに基づいて前記特徴データを分析することにより、前記第2のデータの推奨度を決定する
    ことを特徴とする請求項1に記載のデータ管理装置。
  3. 前記推奨処理部は、前記特徴データを分析することにより、前記第2のデータの特徴についてのコメントを生成し、
    前記出力部は、前記第2のデータの推奨度を表す情報、前記特徴データ変換部により変換された特徴データ、および前記コメントを含む推奨情報を出力する
    ことを特徴とする請求項1に記載のデータ管理装置。
  4. 前記データ抽出部は、加入者からデータ検索を受け付けたときは、前記メタデータおよび前記データ検索の内容に基づいて前記第2のデータを抽出する
    ことを特徴とする請求項1に記載のデータ管理装置。
  5. データを記憶する記憶部と、
    加入者からデータ検索を受け付けたときに、前記データ検索の内容に基づいて前記記憶部から検索結果データを抽出するデータ抽出部と、
    前記検索結果データの少なくとも一部に基づいて、前記検索結果データの特徴を表す特徴データを生成する特徴データ生成部と、
    前記特徴データに基づいて、前記検索結果データの推奨度を決定する推奨処理部と、
    前記特徴データを、前記検索結果データ中の数値を含まない特徴データに変換する特徴データ変換部と、
    前記検索結果データの推奨度を表す情報および前記特徴データ変換部により変換された特徴データを含む推奨情報を前記加入者に提示する出力部と、
    を備えるデータ管理装置。
  6. 記憶装置に記憶されているデータの属性を表すメタデータに基づいて、指定された第1のデータに関連する第2のデータを前記記憶装置から抽出し、
    前記第2のデータの少なくとも一部に基づいて、前記第2のデータの特徴を表す特徴データを生成し、
    前記特徴データに基づいて、前記第2のデータの推奨度を決定し、
    前記特徴データを、前記第2のデータ中の数値を含まない特徴データに変換し、
    前記第2のデータの推奨度を表す情報および前記第2のデータ中の数値を含まない状態に変換された特徴データを含む推奨情報を出力する、
    処理をコンピュータに実行させるデータ推奨プログラム。
JP2018149842A 2018-08-09 2018-08-09 データ管理装置およびデータ推奨プログラム Active JP7153500B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018149842A JP7153500B2 (ja) 2018-08-09 2018-08-09 データ管理装置およびデータ推奨プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018149842A JP7153500B2 (ja) 2018-08-09 2018-08-09 データ管理装置およびデータ推奨プログラム

Publications (2)

Publication Number Publication Date
JP2020024645A JP2020024645A (ja) 2020-02-13
JP7153500B2 true JP7153500B2 (ja) 2022-10-14

Family

ID=69618772

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018149842A Active JP7153500B2 (ja) 2018-08-09 2018-08-09 データ管理装置およびデータ推奨プログラム

Country Status (1)

Country Link
JP (1) JP7153500B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2022195652A1 (ja) * 2021-03-15 2022-09-22
US20230100716A1 (en) * 2021-09-30 2023-03-30 Bmc Software, Inc. Self-optimizing context-aware problem identification from information technology incident reports

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010055429A (ja) 2008-08-28 2010-03-11 Toshiba Corp コンテンツ表示装置及びコンテンツ表示方法
JP2010541092A (ja) 2007-10-08 2010-12-24 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ コンテンツ品目のコレクションと関連のメタデータ生成
JP2012048474A (ja) 2010-08-26 2012-03-08 Canon Inc 情報処理装置、情報処理方法、及びプログラム
JP2014092955A (ja) 2012-11-05 2014-05-19 Panasonic Corp 類似コンテンツ検索処理装置、類似コンテンツ検索処理方法、およびプログラム
JP2016058082A (ja) 2014-09-09 2016-04-21 富士通株式会社 公開データ源を選択する方法およびシステム
US20160364434A1 (en) 2015-06-12 2016-12-15 Ab Initio Technology Llc Data quality analysis
JP2017167748A (ja) 2016-03-15 2017-09-21 オムロン株式会社 データフロー制御装置およびデータフロー制御方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010541092A (ja) 2007-10-08 2010-12-24 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ コンテンツ品目のコレクションと関連のメタデータ生成
JP2010055429A (ja) 2008-08-28 2010-03-11 Toshiba Corp コンテンツ表示装置及びコンテンツ表示方法
JP2012048474A (ja) 2010-08-26 2012-03-08 Canon Inc 情報処理装置、情報処理方法、及びプログラム
JP2014092955A (ja) 2012-11-05 2014-05-19 Panasonic Corp 類似コンテンツ検索処理装置、類似コンテンツ検索処理方法、およびプログラム
JP2016058082A (ja) 2014-09-09 2016-04-21 富士通株式会社 公開データ源を選択する方法およびシステム
US20160364434A1 (en) 2015-06-12 2016-12-15 Ab Initio Technology Llc Data quality analysis
JP2017167748A (ja) 2016-03-15 2017-09-21 オムロン株式会社 データフロー制御装置およびデータフロー制御方法

Also Published As

Publication number Publication date
JP2020024645A (ja) 2020-02-13

Similar Documents

Publication Publication Date Title
KR101274388B1 (ko) 위치정보를 기반으로 한 지역정보 광고 방법과 상기 방법을수행하기 위한 시스템
JP6679451B2 (ja) 選択装置、選択方法および選択プログラム
KR102000076B1 (ko) 온라인 쇼핑몰 통합 관리 시스템에서의 온라인 판매채널을 추천하는 방법 및 그 서버
US20140258002A1 (en) Semantic model based targeted search advertising
JP2011096173A (ja) 情報提供システム、情報提供端末、情報提供サーバ、情報提供方法および情報提供プログラム
CN111125376B (zh) 知识图谱生成方法、装置、数据处理设备及存储介质
JP2016038822A (ja) 抽出装置、抽出方法及び抽出プログラム
KR102307517B1 (ko) 네트워크 기반 상품 추천 방법 및 장치
EP2518680A1 (en) Location based consumer profiling
JP7153500B2 (ja) データ管理装置およびデータ推奨プログラム
JP2016042213A (ja) 抽出装置、検索サーバ、情報処理装置、抽出システム、抽出方法及び抽出プログラム
KR20190097879A (ko) 마케팅 플랫폼 시스템과, 이를 이용한 소셜 네트워크 기반 광고 방법 및 컴퓨터 프로그램
CN113032668A (zh) 基于用户画像的产品推荐方法、装置、设备及存储介质
JP3009391B1 (ja) 情報サービス提供装置及び推奨情報抽出提示方法
JP6917348B2 (ja) 提供装置、提供方法、及び提供プログラム
JP5642228B2 (ja) 相関値算出システム、判定システム、相関値算出方法、判定方法及びコンピュータプログラム
JP2018185575A (ja) 提供装置、提供方法、及び提供プログラム
JP6679415B2 (ja) 選択装置、選択方法および選択プログラム
JP5329633B2 (ja) 情報収集システム、情報収集方法、およびプログラム
KR101503348B1 (ko) 사용자 이용행태를 이용한 모바일 광고방법 및 시스템
JP6030081B2 (ja) データ処理装置、データ処理方法及びデータ処理プログラム
JP2017076376A (ja) 算出装置、算出方法および算出プログラム
KR20210137264A (ko) 빅데이터 기반 온라인 쇼핑몰 ai 키워드 추천 시스템 및 방법
TWI499990B (zh) Method, device and system for improving the transmission speed of website data
JP6007300B1 (ja) 算出装置、算出方法および算出プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210513

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220318

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220412

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220530

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20220530

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220719

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220822

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220920

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221003

R150 Certificate of patent or registration of utility model

Ref document number: 7153500

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150